id: rewind-r3 title_zh: 从头 title_en: From the Top description_zh: 你背不出手机号的后四位,你的手指弹不了第三十七个音,你三岁的儿子叫你从头讲。不能跳不是缺陷,是代价,也是你还在的证据。 description_en: You can't recall the last four digits of your phone number without starting from the first. You can't play the thirty-seventh note without replaying from the beginning. The inability to skip is not a flaw. It is the cost, and the proof, of still being here. tags: cognition,memory,evolution,ai,embodiment date: 2026-02-15

我儿子三岁的时候让我讲故事。

每天晚上同一个故事。一只兔子去菜园偷萝卜。兔子跳过篱笆,踩到了南瓜藤,摔了一跤,爬起来,拔了三根萝卜,跑回家。他妈给他炖了一锅汤。

他听了大概两百遍。

有一天我赶时间,从兔子拔萝卜那里开始讲。

他不干。

他说:不对。从兔子出门开始。

我说:兔子出门了,跳过篱笆了,已经到菜园了。

他看着我。很严肃。三岁小孩的严肃。

他说:你没讲篱笆。

我从头来。


他是对的。不是因为他固执。是因为他的脑子不允许他从中间接。

你背手机号。十一位数字,用了八年。有人问你后四位。你说不出来。你得从前面开始念。138什么什么什么,一位一位过,过到第八位,后四位才从嘴巴里掉出来。

不是你没记住。是你记的方式不支持跳读。

字母表也一样。R前面是哪个字母。你不是直接知道的。你在脑子里唱:A-B-C-D-E-F-G……唱得飞快,快到你以为自己直接知道。你不是。你只是跑得快。


我小时候学过三年钢琴。

有一次弹车尔尼的练习曲,中间错了一个音。我想从错的地方接着弹。

弹不了。

手指悬在键上,不知道落哪。那个音不是单独存在的。它必须从前面所有的音里长出来。我的手指不记得"第三十七个音是什么"。它只记得"第三十六个音弹完之后,手往哪去"。

我从头来。

钢琴老师说:练得不够。

她说反了。练得太够了。手指已经把整首曲子长成了一条路。路上没有门牌号。你不能打车到第三十七号。你只能从起点出发,走过去。走到第三十六号,脚自动拐进第三十七号。


骑自行车也是。你不记得"平衡"是什么。你描述不出你的身体做了哪些微调。但你骑上去就会骑。

因为你的肌肉记住了一整段过程。第一次骑车时每一次摇晃、每一次踩踏、每一次重心偏移,全部存在一段连续的序列里。你的身体每次骑车,都在从头跑一遍这段序列。快到你感觉不到。但它在跑。

你受了伤,用一种新姿势骑。新的序列覆盖了旧的。但旧的那段还在底下。

理疗师让你改回来。你改不了。你不能跳到序列中间去替换一帧。你只能从头来。从最基本的动作开始,让身体重新走一遍。


有人问我后四位的那天,我站在办公室走廊里想了很久。

不是想手机号。是想为什么。

六亿年。从最早的神经系统出现到现在,进化有六亿年。六亿年的自然选择,你告诉我它造不出一个能跳着读的大脑?

我问过一个做计算神经科学的人。在纽约,一家咖啡馆。

我说:为什么大脑不能随机访问。

他搅咖啡。搅了很久。

他说:你想想一个电话号码在你脑子里是怎么存的。不是十一个神经元,每个存一位。是一大片神经元,它们之间的连接模式编码了这个号码。这个模式是有时序的。第一批放电,触发第二批。第二批触发第三批。你要提取这个号码,只能从第一批开始触发,让它一批一批走下去。

我说:所以不能跳。

他说:你跳到第三批,第三批不知道自己该放什么电。因为它的放电模式取决于第二批给它的输入。没有第二批,第三批是空的。


我说:那为什么进化不改掉它。

他说:你觉得从头走是一个缺陷。

我说:难道不是。

他喝了一口咖啡。

他说:你每次从头背电话号码的时候,你在做什么。你在重新走一遍那条路径。每走一遍,突触连接就强化一点。前六位你背了一万遍,铁了。后四位你每次都是顺着前六位滑过去的。如果你能直接跳到后四位,你跳了一万次,前六位一次都没走过。前六位就散了。

他说:从头走不是浪费。从头走是维护。

我想了一会儿。

我说:所以不能跳不是代价。

他说:不能跳就是代价。但这个代价换来的东西比跳更重要。


2005年,伦敦大学学院有人让被试躺在脑成像设备里回忆过去的事。她发现,人回忆一段经历的时候,海马体里的神经活动模式是按照时间顺序重新出现的。

不是一下子全亮。是从头开始,一段一段,按原来的先后顺序重新走一遍。

后来有人在老鼠身上做了更细的实验。老鼠跑完迷宫之后休息。休息的时候它脑子里的位置细胞重新放电,顺序和跑迷宫时一样。只是快了二十倍。

老鼠在从头走。只是走得更快。


2017年,Transformer出来了。大语言模型的基础架构。

它生成文字的方式叫自回归。一个字接一个字。生成第一个字,送回去,生成第二个字。前两个字送回去,生成第三个字。

它不能直接生成第一百个字。它必须先生成前九十九个。

很多人觉得这是工程上的妥协。说应该并行。说自回归太慢了。

但你背电话号码,一位一位。你唱字母歌,一个字母一个字母。你弹钢琴,一个音一个音。你的大脑也是自回归的。

语言模型不是在模仿人。它碰巧走到了同一种结构上。

也许不是碰巧。也许任何需要处理序列的系统,不管是蛋白质做的还是浮点数做的,最终都会走到同一个地方来。从头开始。一步一步。不能跳。


进化自己也不能跳。

你有五根手指。不是因为五根最好。是因为三亿五千万年前,最早爬上陆地的鱼的鳍骨分成了五个分支。那个分支模式写进了基因里。后面所有陆生脊椎动物都在沿着这个底子往下走。蜥蜴五根,青蛙五根,老鼠五根,你五根。

蝙蝠的翅膀是五根手指之间拉了一层膜。鲸鱼的鳍是五根手指缩短了融在一起。马的蹄子是五根手指只留了一根,其余四根退化成藏在皮肤下面的痕迹。但基因里的那个"五"还在。被覆盖了,被改写了,没有被拆掉。

进化不能跳到手指那一段代码中间把五改成六。它只能从胚胎发育的第一步开始做改变,让新的指令一步一步往后走,看最后长出什么来。

大部分时候长出来的东西活不过一天。

偶尔长出一只多一个趾头的猫。

但从五到六,不是改了一个数字。是从第一步重新走了一遍。


我儿子四岁的时候,故事变了。兔子的情节他加了很多东西。兔子跳过篱笆之后要跟一只蜗牛说话。蜗牛说了一句什么他记不清了,但他坚持要讲到那句话。

有一天他讲到蜗牛那里,卡住了。

他说:蜗牛说什么来着。

我说:我也不记得了。你跳过去吧。

他的脸皱起来。不是生气。是一种真实的困惑。

他说:跳过去兔子就不认识萝卜了。

我不知道他这句话是什么意思。也许他也不知道。但他说出来的时候我心里动了一下。

跳过去兔子就不认识萝卜了。

蜗牛说的那句话和萝卜之间没有逻辑关系。兔子不需要听蜗牛说话才能去拔萝卜。但在他的故事里,蜗牛的那句话是路上的一步。跳过那一步,后面的每一步都不再是原来的路。不是走不通。是走到的不是同一个地方。

他坐在那里想了很久。然后从头开始讲。从兔子出门开始。讲到蜗牛那里,停了一下,脸亮了。

他说:蜗牛说,下雨了。

对不对不重要。他找到了。从头走过去的时候他找到了。


那个做神经科学的人还跟我说过一件事。

他说:你知道为什么老人反复讲同一个故事吗。

我说:记性不好。

他说:不是。他在从头走。他在维护。那些正在松掉的连接,他重新走一遍就紧一点。年轻时候的脸,第一次见她的那个下午,她说的第一句话。他不从头走一遍,这些东西就散了。

他说:所以他讲。一遍一遍地讲。从头开始。每次都从头。

他说:有的时候会漏掉一段。有的时候会在同一个地方反复好几遍。但他不跳。他回到出错的地方,从头来。


我爷爷去世之前那半年,他每次见我都讲同一件事。

1968年他在工厂里被机器轧断了半根食指。他讲这件事的时候从那天早上开始讲。天气,吃了什么早饭,骑车去工厂的路上看见什么。讲到机器那里,他会停一下。每次都停一下。然后他说:我没感觉到疼。

这句话他讲过几十遍。每一遍都停在同一个地方。每一遍停完之后都说同一句话。

我妈说:你爷爷糊涂了。

我不觉得。

他的手指头没了半截。那截指头在1968年的某个上午留在了机器里。但他脑子里那段路还在。从那天早上的天气开始,经过早饭,经过骑车的路,到机器,到那个停顿,到"我没感觉到疼"。这条路他走了五十多年。每走一次,路就结实一点。

他不是在重复。他是在走路。

他停不下来。不是因为他忘了自己讲过。是因为他的脑子知道,不走这条路,这条路就没了。路没了,那天早上就没了。那天早上没了,那截指头就白丢了。


我最后一次听他讲这件事的时候,他已经讲不完整了。

他说:那天早上……天很冷……骑车……

然后他停了。不是停在机器那个地方。是停在更前面。停在骑车那里。

他的眼睛看着我,但我不确定他看见的是我。

他说:……路上有个坑。

这个细节他以前没讲过。

路上有个坑。也许那个坑一直在那条路上,他走了五十年,每次都经过,但不值得提。也许那个坑是新长出来的。他走得太慢了,慢到能注意到路面上的每一块石头。

他没有走到机器。那天他停在了坑那里。

我坐在他床边,等他继续。他没有继续。他的手放在被子上面,缺了半截的食指微微弯着。手上有老人斑。指甲发黄。

他睡着了。


我后来想,那个坑是真的吗。

1968年的路上真的有一个坑吗。他骑车去工厂的路上真的经过了一个坑吗。还是说,他从头走这条路走了太多遍,走到后来,路上长出了一些原来没有的东西。

记忆不是录像。每次回放都在改。你每次从头走,路径强化一点,但路径也偏移一点。你以为你在重复同一条路,你不是。你在那条路上踩出了新的脚印,踩塌了旧的路肩,踩出了一个原来没有的坑。

心理学管这叫记忆重建。你不是在取出一段记忆。你是在重新生成一段记忆。每次生成都基于上一次的版本,但不完全一样。

这跟自回归一模一样。模型生成第一个字,基于第一个字生成第二个字。但第一个字里有噪声。噪声传到第二个字。第二个字的噪声传到第三个字。到第一百个字的时候,你看到的文本还很通顺,但它已经不是从第一个字出发的唯一可能的路径了。它已经漂移了。

我爷爷讲了五十年那个故事。每一遍都从头走。每一遍都在维护那条路。但每一遍也在让那条路偏移一点点。走到最后,路上多了一个坑。那个坑也许是1968年的真实。也许是2020年的幻想。他自己也分不清了。


我儿子现在五岁了。兔子的故事他不讲了。换了新的故事。一个宇航员在月球上捡石头。

新故事有新的规矩。宇航员出发之前必须检查头盔。检查头盔之前必须吃早饭。吃早饭之前必须刷牙。

有一次我偷懒从检查头盔开始讲。

他看着我,等了两秒。

他说:他没刷牙。

我说:刷了。

他说:你没讲。没讲就是没刷。

我从头来。

他靠在枕头上,眼睛快闭了。我讲到宇航员刷牙的时候他已经快睡着了。但他在听。我知道他在听。因为我试过跳,他会醒过来。

他需要每一步都在。不是因为他在乎宇航员有没有刷牙。是因为他的脑子需要那条完整的路。路走完了,他才能安全落在月球上。路断了,他落不下去。


我爷爷走到了坑那里就走不动了。

我儿子每一步都要走。

他们中间隔了七十年。一个在路的尽头,一个在路的起点。一个路上的东西在散,在松,在长出原来没有的坑。一个路上的东西在生,在结,在长出新的故事。

两个方向。同一种走法。从头开始,一步一步,不跳。

那个做神经科学的人说的对。从头走是维护。但他没说完。从头走也是磨损。你走一遍,路强化一点,路也变形一点。维护和磨损是同一个动作。你不能只要其中一个。

我爷爷路上多出来的那个坑,是五十年的维护留下的磨损。

我儿子故事里蜗牛说的那句"下雨了",是三百遍重复里长出来的新枝。

这才是从头走的真实代价。是你走回去拿到的东西,和你上次放在那里的东西,已经不完全一样了。你以为你在维护。你也在改写。你以为你在重复。你也在创造。你分不清哪部分是原来的,哪部分是你走出来的。

模型也是。它自回归。它一个字一个字往下走。它不能跳。它每一个字都取决于前面所有的字。但前面那些字里的微小偏差会一步一步放大。到最后,它走到的地方可能是一片从来没人到过的旷野。它不知道自己是怎么到那里的。它只知道每一步都跟着上一步。


你的大脑也是。

你以为你记得1968年那天早上。你记得的是你上一次记得的版本。你上一次记得的是再上一次的版本。一层一层往回追,追到最初那个版本。但最初那个版本在第一次被回忆的时候就已经变了。

没有原版。只有你走过的路。

你走的每一遍都是真的。但没有一遍是准的。


昨天晚上我给儿子讲宇航员的故事。讲到月球上,他突然说:月球上有兔子。

我说:没有。

他说:有。以前那只。偷萝卜的那只。它跳到月球上了。

他在接。旧故事接到新故事里了。兔子跳过了篱笆,跳过了菜园,跳过了他三岁的房间,跳到了月球上。

我看着他。他快睡着了。嘴巴微微张着,呼吸慢下来了。

他的脑子里,一只兔子正站在月球上,旁边放着三根萝卜。这个画面是从两年前的故事里跑出来的。它经过了两年的从头讲、从头讲、从头讲,经过了几百遍的维护和磨损,经过了蜗牛的那句"下雨了",经过了宇航员的头盔和牙刷,最后落在了这里。

这条路是他自己走出来的。每一步都不能跳。

我把灯关了。