学习到底是快乐的，还是痛苦的? - @Thoughts Memo

问题描述

有人说学习是快乐的，有人说学习是痛苦的，那么，学习到底是快乐还是痛苦。为什么学习是快乐的，为什么学习是痛苦的。原理是什么。

学习需要有意识的努力，有意识的努力不是艰辛的，痛苦的吗。要学一些理论，需要长期的努力，这过程漫长又艰辛，怎么说学习是快乐的呢。如何将学习变为即时的快乐，有没有这种可能。

自主的学习是快乐的，被迫的学习是痛苦的。

评论区有很多读者反馈，文章太长，看不完。这没有关系，不用逼迫自己看完。想要在短时间内从头到尾线性地读完文章，是在学校被迫学习所遗留的坏习惯^[1]。这不是一篇阅读理解，所以追随你自己兴趣的脚步阅读即可。

下面这篇长文将系统地介绍学习乐趣的机制。

以下内容摘自《学习的乐趣》， @Thoughts Memo 汉化组译制。

1 教育的主要问题

阻碍教育的主要是一种传统的信念 —— 学习总是令人不快，如要学得更多，学习者应忍受^[2]这种不快。

太多教育工作者认为，学习是一种和工作一样，不得不做的苦差事。然而恰恰相反，本章中我要说明：

「好的学习」是天然令人快乐的（Good learning is inherently pleasurable），而且没有快乐，就不是好的学习。

「学习令人不快」这一谬误太盛行了，以至一些优秀的老师也认同痛苦是学习的一部分。

在本章中，我将指出学习的快乐是人类的本能，以及我们如何系统性地摧毁这一进化的馈赠^[3]，并最终牺牲人类的健康、学习、创造力和未来。

教育的主要问题也是社会的主要问题。如果学习的乐趣被破坏，生活的乐趣也就被大大地摧残。我们建立的教育系统，让数百万人过上了不幸福的一生。

你很可能对我的话持怀疑态度，因为「学习令人不快」这一谬误正是学校教育^[4]的毒副作用。因此，本章旨在说服你。而要破除这一谬误，就有必要了解新知识在大脑中编码的简单机制。

2 学习内驱力和熵

熵的概念可以帮助你理解，为什么大多数孩子在学校里学不到什么东西。

你可能还记得物理课上曾讲过熵是无序程度的度量（译者：不记得，是贵乎教我的），且热力学第二定律表明，孤立系统的熵永远不会减少。这是条迷人且令人终生难忘的物理定律。它具有广泛的适用性^[5]。

信息论中有一个熵的姊妹概念，叫做香农熵（Shannon entropy，信息熵）。它可以理解为一个信源所发送「信息」的平均值。例如，有一个信道不断地发送相同的字母（比如，一串 A：「AAAAAA……」），它就是完全可预测的，因此统计下来其携带的信息熵为零。监听这样一个信道无法让你学到任何东西。

克劳德·香农（Claude Shannon）于 1948 年提出了信息熵的概念。不久之后，科学家们开始对「一个信道的熵，是否可能强烈影响大脑对其价值的感知」做出假设。1957 年，迈尔（Leonard B.Meyer）推测音乐的熵决定了人们对其美的感知。他的结论是，较高的熵可能会导致主观上的紧张，这与富含意义的音乐片段相关（meaningful musical moments）。

迈尔后来改进了他的假说，以更好地建立对音乐一般信息感知的理解。但「音乐」既是信息，也不只是「信息」。这可以从一首歌因其娱乐性和趣味性而被回放数次的现象中看出，但「书籍」则很少出现这种反复多次阅读的情况。

音乐是一种普世信息。如果让你用旋钮调出一个无线电频道，你会很快避开嘈杂的只有静电噪声的频道，也不会对零熵的寂静频道感到太兴奋。然而，大多数人会对有规律的鼓点做出积极回应。只要不是在碎玻璃上敲击（我们天生不喜欢这个），我们就会认为，一个鼓点规律的广播频道比一个安静的频道更有趣。自然，这种有趣只会持续一段时间，直到鼓声本身变得乏味 —— 因为你已对其了如指掌。

如今，我们终于可以测试大脑对信息熵的响应了。神经成像显示，海马体前部对视觉流的熵有反应，腹侧纹状体上也有类似的发现。因此现在，我们可以肯定大脑对信息熵有响应。在快速观察环境以寻找学习机会时，熵感知器非常重要。这是奖励的前奏，而奖励是学习内驱力^[6]的基础。

3 信息检索中的前置知识

我们需要区分「信息」与「意义」，熵无法很好地度量后者。要度量意义，既需要度量信道，还必须考虑大脑本身的参与。脑内的前置知识在学习中至关重要。想象一下，你在收音机上寻找有趣的频道时，找到了一个新闻频道。如果该频道是泰语的，而不会说泰语的你肯定更偏好母语版的新闻。在信息层面上，两种语言的新闻信息熵可能是一样的，但前置知识会让你偏向母语频道。对你来说，泰语频道传递的只是声音流，而母语频道传递的是概念^[7]流。如果不了解信息接收者的知识储备，信息熵对我们而言就没有太多意义。我们无法确定信噪比。

每个听众都会有他或她自己特定的信息熵水平。对于大多数音乐爱好者来说，迪斯科或电子舞曲的规则节拍会比单一的鼓点节拍更有趣。这种类型的音乐平均信息量更高。更老练的听众会乐于接受多一点的切分音。然而，需要一定程度的预先学习才能听懂切分音。那些音乐知识较少的人可能会难以理解更复杂的节奏。如果节拍中的信息太多，或许就不再能够让人随着音乐跳舞。普通人可能很难体会 Wynton Marsalis 的天才之处。货架最上面摆放的爵士乐仅为一小部分受过高等教育的听众保留。对大多数人来说，随着复杂度的增加，音乐慢慢瓦解为电台的静电噪音。

4 大脑中的熵探测器

大脑不能有效地检测到达视网膜或鼓膜的信号的熵。就像显示器的像素一样，视网膜细胞并不知道它们显示的是什么。如果检测器，如海马体，要对熵作出响应，它必须对来自内嗅皮层的输入（即对海马体本身的输入）进行操作。这些输入将在高度处理之后呈现出信号。它可能会表示一个概念，而不是像素。从感官输入的高熵信号将在神经选择、补完和泛化^[8]过程的早期舍弃大部分噪声成分。舍弃多少信息由信噪比决定。噪音越大，舍弃越多。我们越聪明，这个过程就越有选择性，在该阶段舍弃的信息就越多。这很好。我们变得对细节视而不见。模式识别的作用类似于确定性函数，根据定义，它会导致熵下降。复杂的模式可能会变成简单的概念。这些概念将为检测器（例如海马体）提供实际的输入。

请注意，在实验中，为了证明海马对信号的熵的响应而制作的视觉流是高度符号化^[7]的。因此，这样的流在处理过程中被舍弃的信息要少得多。这种经过高度简化和概念化^[8]的消息被海马体扫描为意外性信息，并为整个学习内驱力^[6]系统提供指导。这就是为什么在这种情况下，海马体似乎对输入的熵有响应。

上述推理解释了为什么低熵和高熵的感官信号都可能不吸引人。高熵信号经过一定的处理，可能会失去全部噪声，成为低熵输入传递到海马体。于是，在感官信号方面，我们会观察到一种「最优熵」水平的幻觉。我们需要一个新的概念，学习熵，来帮助我们准确定义信号的吸引力。学习熵需要考虑信息在激活大脑的奖励中心之前所经历的高度加工。学习熵会在后文讨论。

5 处理信息的速度

研究者往往低估了大脑在扫描感官信息时的信息处理速度这一因素。

每一首音乐都有一个可接受的回放速度范围，在此范围内人们可以欣赏到音乐之美。加速播放可能会令人烦躁，音乐可能会变得难以解码，因为这超出了我们的处理能力。而慢速播放可能会使音乐很快失去吸引力。演讲或课堂讲课的情况也是相同的。相同的信息和相同的熵水平，对于不同人的信号吸引力可能差异巨大。总有一个最优传输速度，该速度取决于推动学习内驱力^[6]的所有其他因素，包括前置知识。因此，传输速度是高度个性化的。

我喜欢以 1.4 倍速听讲座。我以 1.3 倍速听较难懂的片段。但是，我从来不加速播放 Fareed Zakaria，而是细细品味这个节目的每一个细节。在课堂中听课的学生没有加速或减速按钮。即使是暂停按钮，就算有也很难按下，因为这可能会惹恼其他学生。

在学校，教师传授知识的速度往往超出学生的处理能力。这使得学生几乎什么也学不到，精神高度紧张。在高速列车的窗口，无暇欣赏风景^[9]。在麻省理工学院，他们称之为「用消防水管喝水」。

6 概率 vs. 知识

小概率事件携带的信息更多。平均信息决定熵。信息接收者的前置知识储备会影响对信道的信息熵的感知。

如果你碰巧在听电台新闻时，听到：「Janet Jackson 生了一个孩子」，你的关注程度将取决于事件发生的概率。如果你不知道 Janet Jackson 是谁，那么这是一个很有可能发生的事件。如果大约每天都有 35 万名女性生孩子，那这就算不上新闻，也不是什么新鲜或有趣的事情。在战争中，第一名士兵的死亡是新闻，但当死亡人数增加到数千人时，年轻的生命就变成了一个统计数字。

如果你碰巧认识 Janet Jackson 或喜欢她的音乐，那么分娩的概率就会急剧下降到「一生只有一次」的水平（对于 Janet 来说）。这会让你产生兴趣。然而，如果你回忆起 Janet 是某出古代情景喜剧中的一位美少女，那么她的分娩可能会被归到「不可能！」的类别。如果你意识到 Janet 已经 50 岁了，而且你知道更年期的概念，你可能会立马特别好奇她的情况。你的前置知识决定了你对这一信息的反应。信道本身没有最优熵水平，只有适合特定大脑的最优熵水平。此时，你可能已经明白，我们需要引入一个新的派生概念，我们在后文将之称为学习熵。学习熵定义了给定信道对给定大脑的吸引力。（注：学术共识更广泛的「语义信息论」里的术语是「模型熵」和「平均语义熵」，但它们与这里的「学习熵」的区别在于它们没有关心「吸引力」的部分）

如果你喜欢 Janet 式的八卦，那么充斥着类似八卦的频道会为你提供合适的意外水平。两者达到了「学习熵匹配」。如果你缺乏必要知识或者优先级不同，你就会失去兴趣。你的学习优先级还将决定你在特定领域的知识水平，以及你对任何特定信道及其信息熵的反应。

7 可预测性 vs. 意外性

概率和复杂性不是信息感知的唯二组成部分。我们似乎在可预测性和意外性之间寻找平衡点。我喜欢乡村爵士乐，在这类音乐中，音符切分得恰到好处的低音旋律线通常很容易预测，这让听众很轻松就能随着节奏摇摆。然而，乡村爵士乐如果不带点意外也就没什么意思了。复杂的爵士乐即兴演奏通过意外之处刺激负责检测意外的神经系统。此外，经过几十年的学习，我的大脑内部已经有了一个可产生响应的完整的信号数据库。或许我可以认出某个和声歌手的声音是我喜欢的。我的大脑已经做好了欣赏爵士乐的准备。

我喜欢 Ken Robinson 关于创造力的课程。在某种程度上，它们是高度可预测的。我完全同意 Robinson 的观点，所以你可以说 Robinson 助长了我的确认偏误。这很令人愉快。当人们同意我们的观点时，我们喜欢说「英雄所见略同」。但如果 Robinson 只是不断重复关于「学校如何扼杀创造力」的陈词滥调，他将失去吸引力。熵可以解释为意外的平均期望。Robinson 的讲授带来了很多令人愉快的意外。他可能会以与众不同、别出心裁的创造性方式描述同样的模型。因此，大脑接收新信息，产生泛化，并确认现有模型。在新的上下文中形成的泛化增加了知识的连贯性^[10]。这是对已知模型的信息补充，这可以使人非常愉快。

Robinson 的课程在可预测性和意外性之间找到了很好的平衡。

最令人愉快的信道将持续提供意外，证实现有的模型，并为之增加新的语义枝条，以便引入新的知识。意外地破坏现有模型可能一开始令人不愉快，但可能会导向令人非常愉快的思维进化。

打个比方，你可以把这想象成信道在修整你的知识树，并添加新的分支，就像一个陶工在他完美塑造的作品中添加新的黏土层^[11]。

8 探测信息量

人类的学习内驱力^[6]以探测信息量为基础。我们早就知道这一点了。人类学习和机器学习的所有模型都以不同的名称提及这个概念。Piaget 写道，在信息量的冲击下，认知图式陷入了失衡。Jeff Hawkins 在他的新皮质模型中谈到，学习和智力以奖励预测误差为基础。我喜欢讨论模型^[12]的细化（当新信息符合模型时）、矛盾（当新信息的引入导致模型需要更正时）和泛化^[8]（当遗忘^[13]和记忆优化^[14]从模型中雕刻出新的性质时）。

为了获得学习的奖励，新的意外的信息需要符合已有的知识（模型、模式、预测等）。为了获得奖励，脑神经需要处理输入的信息，并将之与已存于大脑中的信息进行比较。大脑中处理输入信息的主要处理器之一是海马体。它是大脑的信息交换板，能够将输入的信息与已有知识进行比较。

视觉信息流中熵的高低不一定是信道令人愉悦程度的可靠指标。所有流向海马体的信息都经过了高度处理。代表美丽海滩的像素流将转化为一系列的形状和纹理。紧接着，这些转化结果将成为棕榈树、沙滩和海洋的模型。这种高度压缩的简单信息将决定对信息输入的原始响应。

审视环境中的信息相当于搜寻食物的气味。气味是诱人的，但是只有真正的进食是确切的奖励。这解释了为什么视觉扫描中的熵本身不必具备奖励性，它只需要导向奖励。正如前文所述，海马体前部对熵作出响应，然而实验设计确保了其输入熵源于简单形状的组合，这在输入处理过程中不会丢失太多的信息。相比于信号熵，我们更应该关注信息比较器（比如海马体）的输入熵。重要的不是视网膜上的像素，而是将输入比较器的棕榈树的形状。对于比较器来说，视觉输入里由灰度或者静电噪音导致的高熵模式，与白色或静音这种低熵模式并无不同。它们在输入给海马体时都将具有相同的熵值：零。这就是为什么我要使用学习熵这一术语来精确表示信道的吸引力。

对信息熵作出反应的海马体前部因 Halle Berry 神经元的发现而闻名（参见更多）。通过将电极植入同意的癫痫患者体内，研究人员能够精确定位到在不同环境下对 Halle Berry 的图像做出一致反应的单个神经元。该神经元也会对 Halle Berry 的名字做出反应。同时，海马体后部对 Jennifer Aniston 的反应可能不太一致（可能暗示了前一层神经处理的痕迹）。

我们大多数人都不知道 Halle Berry 的气味，她的气味可能不够独特，不足以激活海马体中的 Halle Berry 神经元，然而，即使是气味信号也可以通过嗅球、嗅结节、梨状皮质和内嗅皮质中的少数几个突触快速到达那里（见图）。然而，如果一个人能听到 Halle 的声音，它可能会与嗅结节中的声音信号相遇，促进识别，最终激活海马体或更后方的新皮质中的 Halle 神经元。

图：嗅觉系统解剖。气味信号可以通过嗅球、嗅结节、梨状皮质和内嗅皮质中的少数几个突触快速到达海马体。（来源：维基百科）

这是不是意味着 Halle 永远存在于病人的海马体里？由于海马体与新记忆的形成有关，我们可能更倾向于认为 Halle 出现在海马体神经元中是识别的结果。她在病人心中的永久位置很可能位于大脑新皮质下游更远的地方。我们现在知道，在巩固记忆的过程中，知识印记从海马体转移到新皮质。我们也非常确定这个过程发生在睡眠中^[14]。我们正是应该在大脑新皮质中，寻找代表 Halle 或代表病人祖母的概念神经元。最后一种可能性产生了一种假想类型的神经元，被称为祖母细胞。

在猴子身上，研究人员可以辨认出视觉皮层中对面孔做出反应的祖母细胞。我们可能会发现，与 Halle 的图像接触时，那里的细胞会更持续地兴奋起来。然而，Halle 的概念可能仍然存于其他神经元中，在视觉皮层的细胞注意到 Halle 之后，才会与其他祖母细胞一起被激活。

另一种激活途径可能来自于在新闻中听到 Halle 的名字。内嗅皮层和海马体会协调整个识别过程，并最终点亮存在于新皮质的某处的 Halle 神经元。

为了使富含信息的信号产生奖励，必须能够检测到输入中的小概率事件，并通过关联将其编码为皮层中的新知识。在海马体前部对熵作出反应的地方，拓展双边丘脑-皮层网络的活动将受到惊讶因子的调节。我们将在那里寻找学习的乐趣之源。根据消息的类型不同，这个过程还可能涉及其他比较中心。人们还发现，杏仁体在检测到新颖的视觉信号时也可能会产生奖励。对奖励性的视觉刺激做出反应的杏仁体神经元同样也可能对新颖的视觉刺激做出反应。Rolls 推测这可能会通过杏仁体实现新颖性的奖励。

我们知道海马体与伏隔核（大脑的愉快中枢）直接相连。此连接可能用于两种情况：

1、对快乐的期待和

2、最后的奖励。

检测到高学习熵信号后，期待随之而来，并导致对高价值信息的主动追求。海马体检测到信息的同时，也将关联的学习信息发送到新大脑皮层，并把奖励信号发送到愉快中枢。那就是学习新东西的时刻！

9 「哇！」因子

1977 年夏天，SETI 研究者搜寻外星智慧生物时，发现了来自射手座的反常无线电信号。宇宙空间中，平时只有乏味的低水平噪音，这样的信号令人难以置信。低概率标志着高度惊讶。天文学家 Jerry Ehman 在打印出来的信号上圈出 6 个字母，并标上了「哇！」。（注：SETI 即 Search for ExtraTerrestrial Intelligence 的缩写。）

图：原始计算机打印输出的彩色扫描副本，拍摄于 1977 年哇！信号到来的几年之后。（来源：维基百科）

「哇！」是大脑对意外发现的反应。这一刻令人非常愉快。学习内驱力^[6]的唯一目的就是寻找环境中的「哇！」因子。它们是最有价值的知识金矿，它们补充了目前已知的：当前的现实模型。渐进阅读^[15]的乐趣来自于密集地涌入学生大脑的「哇！」的力量。

至此，我们历数了熵、意外（信息量）、可预测性和现有知识对学习的影响。在这个案例中，仅凭信号的概率并不能完全解释其威力，这要靠作为支撑的阐释（见：知识估值网络）。在做标记的那一刻，Ehman 就已感觉到其影响的深远。这是迄今为止最有力的证据，证明了人类智能以外的其他智能的存在。如果同样的信号代表了在海洋中探测到沙丁鱼，就不会有「哇！」的感叹，即使在北极也不行。

信道的可靠性很重要。如果错误率较高，学习内驱力可能会被削弱。当彭齐亚斯和威尔逊在 1964 年发现宇宙微波背景辐射时，没有人惊叹。困惑的研究人员继续从他们的无线电天线上清除鸽子粪便。在解释这种神秘的噪音时，人们会优先想到鸽子粪便。1978 年，彭齐亚斯和威尔逊因他们的发现获得了诺贝尔奖。

当科学家有新发现时，他可能会大叫「尤里卡！」，向空中挥拳。他大脑某处的神经网络产生了一个泛化^[8]，由此发出奖励信号。经过进一步传播，这会让一个老人像个孩子一样在实验室里跳来跳去。

同样的事情也会发生在小时候。在空荡荡的房间里，蹒跚学步的孩子会扫视环境，寻找五颜六色的物体、新玩具等低概率的成分。当蹒跚学步的孩子尝试把勺子丢下桌子时，她就像一个小科学家。不过，当大脑产生「所有掉落的勺子都会发出噪音」的泛化时，她也会得到奖励。她可能会以与快乐的科学家完全相同的方式庆祝，尽管年龄相差甚远。灿烂的笑容是第一个清晰的信号。

同样的快乐在由学习内驱力控制的所有形式的学习中都会发生，虽然程度相对低一些。不论我们了解的是关于一位名人还是一块岩石的化学成分，全都没有差别。事情有趣，是因为它们全都通过学习内驱力的机制奖励大脑。

创造的过程也会产生奖励。一个被认为有用的联想很有价值。能够解决难题的联想会更有意义。显然，奖励是有分级的。系统可以量化信息、关联或解决方案的概率：概率越低，奖励越高。

10 知识估值网络

10.1 知识估值

大脑处理所有粒度的知识碎片时，都会立即评估它们的相关性、连贯性^[10]和价值。我们立即知道信息是否可理解，是否有用^[5]。如果信息不一致、不连贯或不相关，我们通常也会立即察觉。

不同寻常、令人惊讶的知识有很高的价值，但是，从大脑的角度来看，概率并不是价值的最佳反映。有些低概率事件并不重要（例如，遥远行星系统中的小行星撞击），而另一些概率很高的事件则会改变一个人生活（例如，「你愿意嫁给我吗？」的答案）。

知识估值^[16]主要依赖知识对于实现个人目标的适用性^[5]。

10.2 情绪脑和理性脑

知识估值网络是基于知识的情绪估值与理性估值的估值系统。在文献中，它又被广泛地称为神经估值电路（neural valuation circuitry），它不一定只用于知识估值。

在估值网络中，情绪估值会把信息与负责饥饿、口渴、性欲等的原始大脑中枢的奖励联系起来。理性估值则以知识为基础。如何回答「最近的快餐店在哪里？」，就是一例纯粹的情绪估值。基于知识的估值会更加复杂，高度网络化，即依赖于次级估值网络。要回答「哪本书最适合我的考试？」，就得基于个人目标来估值，这些目标包括：通过考试进而获得学位进而影响就业前景，以及人生目标。情绪估值和理性估值在生理结构上是相互隔离的。情绪估值来自被类比为三重脑的较原始部分：爬行动物和古哺乳动物的结构。例如，特定刺激被丘脑处理后，可能会向杏仁体发送单独的信号以进行情绪估值，并向新皮质发送信号以进行理性估值。情绪脑在进化发生学上更古老。个性和教育决定了理性估值能否控制或推翻情绪估值。

10.3 快速思考中的决策树

知识估值网络是确定单个知识价值的记忆连接网络。如果将学习视为一种任务，那么估值网络将确定感知上的任务价值（参见：问题估值网络）。

用计算术语来说，知识估值网络可以比作决策树。目标和情绪决定了根节点的核心价值。知识之间的语义连接可以看作从目标到细节的细微价值传递。精心选择并巩固的知识所构成的组织良好的语义网络^[17]几毫秒之间就能做出专业决策。这就是卡尼曼（译注：《思考：快与慢》作者）所说的自动快速思考（如果对需要放慢速度解决的难题感兴趣，请参阅《如何解决任何问题？^[18]》）。作为决策或解决问题之基础的这种处理过程，也参与了知识估值。像许多专业决策一样，估值十分迅速，且几乎不需要刻意关注。简而言之，我们有时会在不完全能够解释原因的情况下确信一些事情。这个过程几乎不受我们自己控制，更不受学校老师的控制。为了高效学习，估值必须很高。

图：http://Xefer.com 是帮助理解作为网络的知识的工具。它依赖于维基百科页面之间的语义链接。

10.4 教育中的估值网络

大脑在多年的学习过程中建立了估值网络。通过睡眠中的优化^[14]和遗忘^[13]，估值网络经过打磨、抛光，为高效运行做好了准备。这使得估值捷径易于穿梭。正在挑选课本的学生，不再从整个人生的情境去看待这场考试。他更可能建立了如下捷径：「接下来的三个月，我只想通过地理考试」。

知识估值网络往往高度个人化，因人而异。例如，对于理性和感性的平衡点会有不同，不同目标之间的权衡也会有不同。罪犯会形成异于常人的估值网络，而一个立志为人类谋福祉的研究员，自然也有别致的估值网络。

估值网络的发展和个人秉性、人生履历、成长环境息息相关。童年的创伤或人格特征，如易冲动，更有可能培植出罪犯心态。童年的一些创伤事件可能会促进一意痴迷的估值网络的发展（参见：错误向量）。环境和可用的知识将决定激情、兴趣、目标和次级估值网络（参见：概念化^[8]）。

理想中，发展出健康的估值网络需要免受创伤和慢性压力的童年^[19]——没有太大压力影响情绪估值，多玩，在超大行为空间中大量自由学习^[20]。

所有促进大脑健康的策略也会使估值网络变得丰富、高效、高度个性化。这些要素将构成出色的学习内驱力的基础。所有教育工作者都认可这样的目标：想要帮助孩子们很好地把握他们的情感生活，逐步培养聪明、有创造力且知识渊博的大脑。

教育系统的主要问题是一刀切，让所有孩子如上了流水线一般获得相同知识，而几乎不关心有效学习的重要组成部分：学习内驱力^[6]。学习内驱力是一种完美计算方法^[21]，它把表征大脑中知识的语义网络^[17]的当前状态与来自知识估值网络的实时输入相匹配，这种输入主要来自对于环境中可用信息的响应。如果孩子坚持要看 YouTube 视频，那么他的大脑才是最大权威。所有干扰都将影响未来的独立性和创造力^[22]。

与其让一名授课老师花 45 分钟给一个孩子灌输一长串低估值的符号，且效同水过鸭背，还不如让他上上谷歌，只需花上 3-5 分钟就可以找到高估值且易于记忆的信息，终生不忘（反例请见：数码痴呆症的病态迷思）。如果孩子对此轻车熟路，那么他通过自学^[23]，获取知识的效率将提高一个数量级。这里的「提高一个数量级」，是我谨慎而保守的判断，我可不想被人说在夸大其词。我在这篇文章的其他地方举了一些具体对比的例子（比如一个月上完 13 年学或假期中学习速度加快 1600%）。

我称这种能力为知识金砖，Peter Thiel 称之为幂律：一套至臻完美的核心技能能带来乘方级的生产力提升。

在学习上下点功夫就可以给个人生活和整个地球带来翻天覆地的变化！

10.5 大脑中的知识估值

在解剖学中，对理解人类的思维至关重要的，是关于大脑的知识估值网络的实际实现的研究。这对预防抑郁和成瘾很有必要。知识估值是高效学习，创造力和解决问题的基础。

好的学习令人愉悦。食物、性或者毒品带来的快乐容易饱和，而愉快的学习则不会。我们可以轻易避免不愉快的学习。正是学习内驱力的存在，使我们天然可以做到这点。这就是学习对于人们快乐与否至关重要的原因。它可以实质性地为全社会的幸福感带来质的飞跃。

10.5.1 眶额皮质（OFC）

知识估值^[16]的网络性质表明了大脑皮质资源的使用状况。事实上，大多数研究人员似乎倾向于认为：整个估值系统可能以眶额皮质（OFC）为中心，越靠近其前部区域则抽象程度越高。关于单个子系统如何影响估值，已有很多模型和假设（如共同通货、共同尺度、躯体标记、按内容评价、多组分、认知-动机界面、平行评价、定位主义与建构主义模型等）。在共同通货模型中，来自所有子系统（享乐基底）的所有估值都被整合在一起，并提供「想要」或「喜欢」的最终信号。例如，（1）来自内侧 OFC（mOFC）的基于知识的估值可能会与（2）来自伏隔核（NA）的奖励预期以及（3）来自脑岛的食物估值信息结合起来，共同影响你选择下一顿饭去哪吃。

10.5.2 共同通货模型

OFC 是一个很棒的研究领域，因为人们感兴趣的很多主题汇集于此：毒瘾、快感缺失、习得性无助、强迫症等等。共同通货模型似乎表明，创造力爆发或学习内驱力^[6]爆发产生的快感，在神经化学和神经解剖学上与低剂量可卡因产生的快感相似。

所有的奖励是都会被转化为同一种奖励信号汇集到同一类神经元上，还是会分别保留它们的本源特征，这一点存在着激烈的争论。但我认为没必要纠结这一点，因为特异性由个体的概念图激活赋予，而共同通货则由单一输出产生的最终估值构成。在所有估值中，由于每个概念图激活都有其单一响应，因此我们需要收敛。一些 OFC 神经元似乎专门对高阶价值进行编码。

在知识估值^[16]和决策中，我们需要独断。冗余可以用于恢复估值系统，但必须服从概念神经元的决策。同时存在两个拍板定案的，并不现实，好比某人一边吃饭，一边拿叉子刺自己眼睛，极为荒谬。尽管理论上相互竞争的神经力量可能导致这种场景，但这通常是由于计算错误。

10.5.3 知识估值的涌现

可以通过各个概念图之间的交互来构建估值网络。例如，如果考试这个概念是根据工作前景这个概念^[24]来估值的，这两者就可以被共同激活：找工作这个概念的估值会给考试相关的概念图一个估值。概念图激活的程度与相关概念估值共同决定了最后的估值结果。在导向腹侧纹状体的路径中，髓鞘浓度会升高。这一点可能是学习内驱力^[6]可以通过学习来增强（或者被学校的强迫学习^[25]所压制）的原因之一。OFC 在决定估值的过程中扮演的角色，与海马体在建立长期记忆的过程中扮演的角色类似。这些在大脑皮层中高度关连的区域扮演了交换机的角色（将相关区域连接起来），而不是“媒人”的角色。相对地，已连接的概念图或概念中心会自行发展它们之间的快速连接线路（比如在睡眠中）。通过新的线路，高价值的概念可以直接影响愉快中枢而无需 OFC 的干预。这样一来，只需通过单独激活某些概念细胞（例如，与某人最喜欢的演员相关联的细胞），便可以直接产生令人愉悦的估值。

10.5.4 逆向学习的危害

在不良的学校状况中，我们可能会将无关的上下文（例如 SuperMemo 中问答卡片的颜色）与低估值相关联。在这种情况下，白色问答卡片的概念或者问答卡片和颜色的概念的共同激活，都属于强烈的负面输入，会抑制估值。从表面上看，这似乎是一个阻碍估值的中止信号（可能在 OFC 侧面）。在这样的情境中，概念之间仍然可能建立关联，仍有可能做到短期的提取，然而，较低的估值将阻止记忆的巩固（例如，通过阻止向长期皮层存储的转移）（参见：学校是如何阻止记忆巩固的）。在逆向学习中，也可能会发生奖励的再编码过程（例如，改变 SuperMemo 中的模板颜色）。我们知道，OFC 受损的动物的逆向学习能力会被削弱（Mishkin 1972），这一点佐证了最高估值网络的解剖学位置。如果我们继续否决估值信号，最后可能会导致网络^[26]之间的竞争。在我的假设中，这一点是学校诱发的习得性无助^[27]的起源。学校胁迫是一种永久的逆向学习形式，它会慢慢消磨网络的可塑性，导致在决策过程中评估奖励的能力受到长期的不利影响。从这个角度来看，人类的记忆可以被看作是擦写循环次数有限的 EPROM。如果把长期学习视为突触基底的积累——该基底会在随后的稳定化^[28]过程中被删减（这反过来会减少突触发生）——逆向学习可能会使该系统不再响应：在这个系统中，学习不再可能。

无休止的虚假奖励和轻微处分可能会使知识估值过程关闭，并损害在学校的长期学习。

10.5.5 目标 vs. 习惯

知识估值网络是良好的自由学习^[20]的核心。相比之下，被动学校教育^[4]将导致习得性无助^[27]。人们可能一开始自然而然主动追求某些目标，然而强迫教育会使人变得习惯被动（反过来，在追求目标中摸爬滚打，则会收获健康的习惯）。系统中估值较低（没怎么激活兴趣概念图）的部分会抑制知识估值网络的输出。如此，学习时，大脑自然兴致不高。一旦学习内驱力^[6]枯竭，好奇心消亡，生活就变成了干巴巴地执行一连串缺乏奖励的习惯（参见：学校带来的 50 个坏习惯^[29]）。

若学习无乐趣，则人类的存在会退化成一套沉闷无趣的习惯。

10.6 知识估值：贯穿你的一生

个人轶事：为什么使用轶事？

我的学校试图剥夺我生命中最美好的东西

关于估值网络的力量和教育系统的对峙，我自己的经历就是醒目的例子：

1985 年，我推导出了一个近似函数，用来计算使知识形成长期记忆所需的最佳复习间隔。这就是间隔重复^[30]的诞生。最初，该函数适用于纸笔版 SuperMemo。随后几个月内，我意识到这个系统非常强大。只要一台电脑，我就能让它功效翻倍。然而，我不认识任何可以根据我的数学计算编写学习软件的人。那个年代，波兰的整个程序员圈子里，要么是在大型主机上运行 Fortran 或 Cobol 的老古董，要么就是不断增加的业余爱好者们，他们主要摆弄微型计算机（如 ZX81、Commodore 64 或 ZX Spectrum）。于是，我决定亲力亲为。不过，我还没有掌握编程技能。作为一名计算机科学专业的学生，我选择向老师寻求帮助。然而，我们唯一的编程课程是 Datapoint 汇编语言。这些技能对于处理寄存器实现类似 11*11=121 的计算非常有用。这不是我想要的，我想学习一些对编写 SuperMemo 程序更有用的东西。我的学校一直要求我学习如何计算电子电路的电阻，或者符号积分。我的知识估值网络的输出很简单：编程技能将通往 SuperMemo 的诞生，而这将通往更快的学习（在所有领域，包括电子学或微积分）。我决心要学习编程，而我的学校决心阻止我（通过其他必修课使我不堪重负）。无奈之下，我报名入学了波兹南经济大学（University of Economics in Poznan），去学习那里的一门算法语言课程。该课程主要使用 Pascal。我不得不在学习平时的课业之余钻研 Pascal。那门课很不错，但我们学的都是理论，在纸面上完成。在当时（1986 年），整个波兰的大学里，个人电脑（PC）很罕见，大多数实际应用程序都运行在名为 Odra 的大型机上（1960 年波兰为苏联阵营所生产）。当我终于有了我的第一台计算机时：ZX Spectrum（1986 年 1 月 4 日），我终于可以真正开始学习在计算机上编程了。在我的电脑到来之前，我开始写我的第一个程序。我把它写在纸上！这是一个组织我日常活动的程序（有点类似 SuperMemo 中的 Plan）。不久之后，我也学会了 Pascal。首先，我必须降低学校的负面影响，减轻课业负担。我和我的电子电路老师达成了一项协议：我会为他做一些高通滤波计算，这将是一个提高我的 Pascal 技能的机会。这个程序花了好久才写完，极其浪费时间。这是一个糟糕学习的完美案例。我几乎不懂我自己写的程序是如何运作的。然而，这仍然比仅仅学习示意图的效果要好。就我的编程技能而言，那次学习很不错，我进步了很多。

我很难向不懂编程的人说明白，但学习大学课程和自己动手编程的知识估值的差异判若云泥。在我的同学深陷乏味的电子学和计量学讲座的折磨之时，我开始了自己的编程之旅。在学校，我什么也学不到。在 Pascal 业余课程中，我学到一点。然而，只有以激情和明确目标为后盾的实践知识至关紧要。到 1987 年 12 月，我的努力最终导向了 SuperMemo 的第一个版本的诞生，这彻底改变了我的人生进程。多亏了我的导师 Zbigniew Kierzowski 博士的开明，让我得以将我的硕士论文完全专注于研究 SuperMemo 这个主题。Kierzowski 教授，80 岁生日快乐！对于一个学生来说，有这么大程度的自主决定权是相当不寻常的，更不用说论文还是用英语写的（不到十年后，波兰议会试图将这种行为定为非法）。这关系到 1989 年的大规模行政和策略斗争。

我如今最主要的快乐源泉是 SuperMemo，但我经历的学校教育几乎毁灭了它。但这不是因为有人怀抱恶意。我的大多数大学老师都很了不起。罪魁祸首是学校这个系统迫使学生学习死板的规定课程。给予学生创造性表达的空间，才是教育最好的基础。

我的学校乐此不疲地阻挠我完成对我来说最重要的事，而这件事却是我职业生涯和未来一切的支撑。要是我更顺从一点，更传统一些，更容易屈从于社会压力，我就会成为一个「更好」的学生，在电子电路理论、微积分、计量学和抽象代数上投入更多时间。若果真如此，这篇文章就不会问世。这个网站也不会存在。

我现在的生活是任何研究性的或业界内的职位都换不来的。基于我坚固的知识估值网络，任何对我的否定都无法打倒我。

我们要设计的教育体系，是让每个孩子都能自由发展的教育体系

11 学习熵

有很多因素会影响大脑对信息与信道的感知和估值。在之前的章节中，我们注意到大脑不只对熵有反应。有很多因素会调节熵的影响或单个信息的信息量，包括：编码、传输速度、预处理（比如泛化、补全、辨认等等）、前置知识（包括估值、情感价值、信道可靠性等等）、最佳水平（受处理速度影响）等等。

这一过程十分复杂，需要引入更恰当的概念以涵盖这些微妙之处。我建议使用「学习熵」这一术语来描述特定场景下某个教育渠道或者信号对某个人的吸引力。

学习熵是由学习内驱力^[6]系统所决定的某个教育信号的吸引力。

有的课程很无聊，有的则让人目不转睛。学习熵从个人的角度描述各个课程的吸引力。

熵有精确的数学定义，但学习熵并非如此。其最佳衡量方式应该是，对经过分析的信号进行学习之后，个人的奖励系统所作出的反应。就像熵依赖于信息的概率一样，学习熵依赖于信息（图片、声音、语句等等）的奖励能力。其奖励能力与概率有关，但是具体估值主要依赖于知识估值网络。

好的学习是有奖励的。但也有糟糕的学习。存在解码失败惩罚^[31]：如果学生努力理解一条信息但失败了，他会受到惩罚。这会带来挫折感，这是厌恶学习的开始。如果学习熵低，奖励少，惩罚高，净结果可能是负的。如果我们将负面奖励信号算在内，学习熵实际上可能会是负值。一堂枯燥的讲座的学习熵可能是负的，导致学习内驱力被抑制。

知识估值较高，则学习熵也较高。这对于使人专注于知识的语义插入以实现长期记忆是必要的。学习熵提升学习内驱力，进而提升估值，估值反过来决定学习熵，构成强大的反馈循环。遗忘、习得性无助、衰老、受伤、脑力的可用性均会控制这个循环的强度。只要理性学习、良好生活，特别是要尊重自然创造力周期^[32]，这个循环可在学习内驱力较高的平衡状态下保持数十年。

12 信号时机 vs. 学习熵

学习流中单个信息的奖励水平决定了信号学习熵的高低。一个主题枯燥的讲座的学习熵较低。上网寻找解决特定问题所需的零星信息这种行为学习熵较高。

与基于平均值的香农熵不同，学习熵主要基于一种往绩平均值（trailing average）：近期的消息比之前的消息具有更高的权重。此外，学习熵根植于控制记忆巩固^[33]的规则，包括间隔效应^[34]。

只要有知识金砖填补了理解上的重大空白，一堂枯燥的讲座的学习熵就会瞬间提升。学习熵的增加与决定知识估值的记忆轨迹的稳定性^[35]的表达式成正比（包括知识估值网络中的下降曲线）。知识金砖的影响会逐渐减弱。那些可以为你带来快乐的发现累积起来，将决定任一时刻的学习熵水平（例如，在讲座期间的）。

上述内容表明，教育者可以影响学习熵，增强学习内驱力^[6]，提高长期学习效果。消极灌输知识的效果很糟糕。不必全部问题都提供答案，而应侧重于重要的抽象且普遍的问题。自我导向学习的自由探索是可以使人保持终身可持续的学习内驱力和终身学习的最佳模式。

所有形式的学校教育都会抑制学习内驱力。因此，许多成年人很难内化「学习熵在学习中的重要性」这一信息。然而，现代社会中，几乎每个人都会面临独自解决小的技术或健康问题的需要。有时问题可能很简单，比如对 Facebook 的选项设置进行小改动。越难找到一个问题的解决方法，找到答案的回报就越大。越难找到答案，搜寻和探索就越持久越广泛。每个人都应该熟悉这些感觉。然而，学习内驱力被抑制总是会导致收获的知识更少，自尊更低，所有的探索更早结束。换而言之，那些在学校或之后的生活中失去了创造内驱力的人，会更早放弃，甚至永远不去尝试。从这个意义上说，计算机、互联网、技术等带来的所有技术问题和小故障都有一些积极的副作用：刺激人们丧失的学习内驱力的最后一点残存，即使在最被动的人身上也是如此。唯一的必要条件是，这些探索需要以一定程度的成功结束。否则，可能会发生相反的情况：惩罚信号使人退出探索。

你可以快速回答关于你自己的学习内驱力的这个即时测验：如果你在生活中遇到一个小问题，你会去问人类专家还是谷歌？如果你的汽车失灵或电脑死机，或是你受伤了或肚子疼，你会怎么办呢？

13 学习熵和学习内驱力

学习熵奖励的影响会随着时间的推移呈指数下降，这个过程类似于遗忘^[13]。就像在间隔重复^[30]的复习中一样，新的奖励能把学习熵带回到更高的水平。就像在间隔效应^[34]中一样，同样的消息在间隔更长时，会更有价值。

在学习中，决定学习熵的奖励信号和决定记忆的巩固信号有一个很大的差别：一旦你学到了什么，在短时间内重复复习是没有用的。只要你完全记住了，就可以过一段时间再进行下一次复习。学习熵几乎没有上限。如果你喜欢一堂课，只要为之添加一些事实或表述的变换，你就可能更喜欢它。你一旦记住了什么，就不可能在短时间内再使用一些技巧去增强记忆。你可以使用助记术重组记忆并提高其持久度，但是一旦完全记住之后，保持长期记忆最好的做法是暂时不再用它，或是将之运用在不同的上下文中——这本质上是构建新的记忆，形成与原始单一记忆的冗余连接。

学习熵因缺乏奖励信号而衰竭。学习内驱力^[6]的消亡是一个遗忘问题（包括脑细胞丢失导致的遗忘）。

各个信息的奖励指数级下降和递减，学习熵随之累加。通过优化奖励信息的时机，我们可以提高学习熵，使学习成为与食物、性爱、毒品等奖励同等的最令人愉快的活动之一。如果你持怀疑态度，可以回忆一下：沉迷电子游戏的玩家可以忍饥挨饿玩一整晚游戏。电子游戏^[36]会劫持学习内驱力，将之与赌博的奖励相结合。赌博的奖励可能像学习熵一样，也受到类似的衰减/增强规则的支配。然而，它们还受到可变奖励^[37]的影响，这可能会导致上瘾。重要的是辨别学习的乐趣和有害的成瘾（见：学习成瘾）。

学习熵决定学习内驱力，但维持两者的规则不同。学习内驱力依赖于知识，因此将受制于间隔重复。因为知识以网络形式存在^[17]，故而谈论激励学习内驱力的最佳方式是没有意义的。为了最大化学习内驱力，我们应该进行终身学习，尊重自然创造力周期^[32]，并照顾大脑健康（即总体健康）。

14 最优信息传授

在学校教育中，我们可能设想课堂的学习熵都是最优水平，让学生能不停地赞叹喝彩，马不停蹄地记笔记。但更常见的情况是，课堂很无聊或是熵信号很高，但学习熵很低，甚至是负的。

既然最优学习熵与学生有关，老师怎么能做到向教室里的所有学生都最优地传授知识呢？这样全面地传授知识，有时几乎毫无可能，且至少也需要天才教师才能实现。大部分老师的课堂上，大部分学生不是无聊得昏昏欲睡，就是丝毫不懂抓耳挠腮。

只有少数幸运儿能通过听课学到大部分知识。对很少一部分有天分的孩子来说，老师的授课可能完全讲不出新东西，非常无聊。而对于其他孩子来说，授课内容则可能过于复杂，超出了他们的理解能力。这种情况下，他们如果勉强去理解，则可能遭受巨大的挫折。一堂关于弦论的课程，可能就跟随机打乱的一段中文一样难以理解。于是乎，听课不过是浪费时间。诺贝尔奖获得者 Carl Wieman 将课堂比作放血。

为了避免负学习熵带来的挫败感，学生们会无视授课内容，就像对待我之前提到的泰语频道一样。孩子们会忽略来自老师的“静电噪音”，转向其他更适合其学习熵水平的频道（例如，桌下手机上的 facebook）。即使他们的理解力很好，老师的授课也可能并不能对他们的现有知识作出补充。如果不能生成高质量高价值的泛化，授课内容将被认为是显而易见或无关紧要的。

即使低学习熵只是偶尔发生的情况，也会使学生不再关注授课内容。过一段时间，学生们就会发展出一套过滤系统，把老师变成一个承载零熵、零学习熵的无声广播频道。再怎么提高授课质量只是徒劳——老师已经消失了！

在课堂环境中，学生通常不能将注意力集中在更好的信号上。所有的学生都会收到同样的信号，他们可能会感到同样的无聊。相比之下，在谷歌上搜索好的关键词，大脑会在恰到好处的低概率信息流中应接不暇，这些信息像拼图一样适合当前的知识树^[38]。谷歌是一个非常便宜且高效的「哇！」生成器。

在渐进学习中，大脑的学习熵扫描仪将挑选那些最好的频道，对其进行优先级排序，并采用完美的时机来最大化语义连接和记忆巩固。于是乎，为什么「我非常高兴我永远再不会被迫坐在学校的课桌旁！」是很容易理解的。我太喜欢学习了！

上面所有的例子都说明了，在识别什么值得学习时，信号和大脑之间的相互作用是多么错综复杂。学习的奖励是衡量学习质量的最广为人知的指标。当学生们高兴时，我们就是在正确的道路上。当学校给学生带来痛苦时，我们整个社会就是失败的。

知识的互补性和连贯性^[10]的唯一可靠指标是学习内驱力^[6]系统的神经网络。这就是知识不能预先打包并强加给学生的原因。

结晶比喻^[38]解释了这一点。奖励系统的神经细节在学习的奖励这一节阐释。

15 扣人心弦的授课

我们热爱学习，但我们通常厌恶别人教我们。这些感觉与创造力相关，这或许可以这样解释：创造性的阐述对于作为理解基础的模式补全是必不可少的。

在学习中，我们决定调查的内容。学习熵严格依照大脑的状态和当前的记忆激活进行评估。在教学中，知识是批量传授的，与我们的想法无关。许多学生认为他们不喜欢学校的首要原因是枯燥的科目——而不是校园霸凌、压力或强制早起。无聊令人痛苦！点击这里阅读我写的关于自我导向学习和在校学习之间的天差地别。一切都与学习内驱力^[6]有关！

我很惊讶有那么多的资源被浪费在「寻找使孩子们在授课过程中保持兴趣的方法」的研究上。而很明显，上课只是一个糟糕的教育工具。眼神接触分析？参与性分析？努力量化激情？所有的孩子都天生具有学习内驱力，我们的首要任务应该是确保我们不会破坏这一动力。强行灌输知识^[39]是学习内驱力的主要破坏者。此外，还有许多社会经济学因素阻碍了很大一部分孩子，使之即使在最好的环境中也无法茁壮成长。有些孩子永远不会对学习产生热情。在大多数情况下，这不是他们的错。只有一小部分人受到残疾、健康和不太幸运的遗传禀赋的限制。学习内驱力随着年龄的增长呈指数下降，主要是由强制学校教育引起的。被动听讲极大地推进了这一过程。

当然，也有些授课奏效了。可汗学院^[40]充满了好例子。即使是没有幻灯片讲义的纯口头授课也能奏效。YouTube 上的 TED 演讲可以很有趣。它可以满足学习内驱力。慕课建立在这样一个原则上：一个摇滚明星教师比重复同样咒语的成千上万的普通教师要好得多。即使你只是一个被动的听众，你也能学到很多东西。不过，必须满足这样一些条件：你需要对这个主题抱有强烈的好奇心，或者你需要热爱演讲者，或者两者兼而有之。只有一种有效机制可以确保讲座有趣：你要自主选择它！这只是自我导向学习的又一必要条件。

除了自主选择之外，在听课时，你肯定需要一个暂停按钮，以防需要上厕所，或需要吃点东西安抚饥饿的胃。没有什么能像憋到要爆的膀胱那样有效地摧毁一堂课。最后但同样重要的是，大多数课程加一个 Netflix 的跳过片头功能都大有好处。

当然，最好用你自己的创造性思维或快速研究来增强听课的效果。暂停一分钟或一天，或许对学习效率至关重要。与一些心理医生的说法相反，创造性停顿和走神与 ADHD^[41] 无关，反而是很棒的学习的标志。

我使用两种方法渐进吸收授课内容。第一个方法是听讲和练习。练习能提高专注度。专注度高有助于减少停顿的需要，但是它也会减少学习的创造性。对于优先级最高的主题，我使用渐进视频，其中我可以多次暂停和继续播放。我甚至可以保留最重要的授课片段，以备将来复习。然而，渐进视频并不是最好的学习方法。它在速度和容量上无法与渐进阅读^[15]相媲美。有时，使用渐进阅读和阅读课堂讲义比听课本身更有价值。这一点在事实丰富的课程中尤为明显。

我主要根据我对讲授者的喜好来选择我的视频材料。在本文的情境中，我知道你一定会喜欢 Ken Robinson 的演讲！推荐去看：Robinson：学校扼杀了创造力！

16 学习的奖励

学习的乐趣或许是最令人满意的乐趣之一。与进食或做爱相反，学习的乐趣不会随着行为的结束而终止。学习的乐趣是可持续的，只有学习过程中涉及的网络过载时，这种乐趣才会缓慢减弱。而且，通过睡眠就可以将其恢复到基准线。已被证明，学习与海洛因或可卡因给人带来愉悦的机制相同。与进食或性爱不同，愉快的学习可以占据大部分的清醒时间。从这个意义上说，学习、创造、解决问题和生产力带给人的乐趣可能是斯多葛式享乐疗法的伟大工具。健康的人很容易满足对食物的需求，但人对学习的需求可能永远不会终结。学习内驱力^[6]取决于当前已有知识的状态，此状态可以通过学习行为本身进行改变。

所有情绪容易波动的人都应该考虑以学习作为疗法。

16.1 学习内驱力的奖励

我已经提到了几个例子，说明学习内驱力^[6]在大脑中产生奖励信号的方式。我们知道低概率信息可以带来奖励，产生新知识的泛化也是。一段有助于实现理解目标的信息有很高的价值。拼图中缺失的一块^[42]会带来极高的奖励。一旦理解了文章中晦涩难懂的关键词汇，整段长篇文本就会从错综复杂的句子变成清晰的推理。

通过泛化证实一个模型，或为一个更好的新模型构建基础，都让人感觉很棒。此外，所有与强烈的情绪相关联的模型证实都会令人狂喜：「我的团队是世界上最好的！」，或者「是的！我刚出生的孩子真的很健康！」，或者「是的！我知道努力工作会让我获得晋升！」。然而，在讨论学习内驱力时，我想过滤掉额外的情感层，因为它可能会使整个局面变得难以理解。我们需要记住：学习是愉快的，这与是否能从运用知识中获得回报无关。

产生新发现时的啊哈！、哇！或尤里卡！是学习中最纯粹的终极奖励。我们不需要别人的称赞或表扬作为进一步的奖励。在这里，知识本身就是奖励。

这种奖励的共同特征是：都会将新的高价值信息编码进记忆中。

学习内驱力的奖励来自已准备好进入长期记忆的高价值知识。

在我们对理解现实的探求中，大脑中存储的信息总量在增加，存储的知识的熵却在下降。凭借学习和建模，理解世界的复杂性会越来越省力。

16.2 学习内驱力的演变

科学家说，聪明的动物玩得更多。我要说，更有趣的是，玩得更多的物种更聪明。我推测学习内驱力^[6]可能是人类脑容量爆发增长的触发因素。这并不是说，鸟类或哺乳动物面临的环境变化需要更多的思考。这并不是说，如果大脑皮层面积不迅速扩张，人类就会突然面临灭绝。而是，可能正是学习内驱力的出现突然让代价高昂的脑细胞数量增加得到了更好的利用。在学习内驱力出现之前，增加脑容量只会让动物头部更重，还得供养这些额外的细胞。如果没有学习内驱力，这些额外的脑容量可能一直得不到利用，导致浪费性的萎缩。如果学校教育试图凌驾于学习内驱力之上，只会使得这种进化优势被废弃，进而使得整个社会更不聪明、更缺乏创造力。

如果画出人类进化的时间线上的脑容量大小的变化曲线，就会看到大约 200 万年前，曲线上有一段猛烈的上升。古人类学家倾向于将之归因于饮食的变化，如烹饪方式等，从而更好地为大脑提供了营养。

如果关于学习内驱力出现的假设是正确的，能人很有可能是突破的起点。这可能表明，从简单的鸟类和哺乳动物的程式性行为驱动转变为更复杂的陈述性学习驱动，最终使我们可以建立现实的抽象模型，这是人类智力的基础。还有推测认为，正是能人阶段，由大脑成长主导的童年（从断奶到平均 7 岁）开始出现。

学习内驱力的出现较晚，这表明它不是神经网络中出现的一个简单属性（参见：Biederman 模型）。否则，它可能很容易出现在鱼或更早的生物上。学习内驱力需要一套专门的神经结构，以便在检测到对陈述性知识的连贯结构的增量贡献时发送奖励信号。这种信号和内在结构在程序性学习和陈述性学习中可能有所不同。对于不同类别的感觉输入，它也可能有所不同。

16.3 程序性学习的奖励

早在 20 世纪 80 年代，我就推测可能存在进行程序性学习的大脑回路。在我的硕士论文中，出于无知，我使用了自创术语「随机学习」。我不知道早在 20 年前，也就是 1969 年，David Marr 已提出了符合我自己想法的小脑皮层理论模型。进入新千年以来，有大量数据可以证实该模型。

关于程序性学习的大脑回路的想法非常简单。想象一下你骑自行车的情形。你运用你的意识来学习骑上自行车所需的各个动作，然后持续踩踏板。然而，一旦你上路了，程序性学习系统会确保你能以最小的神经努力自动执行所有动作，无需有意识的监督或仅需对一组命令神经元进行最低限度的监督。程序性学习将决定你的运动程序。该程序性学习系统会对发送到你的运动系统的信号序列进行微小的随机调整（因此我将之命名为「随机学习」），可以将这些随机更改视为程序创意。每当你的自行车失去平衡时，错误检测网络将发送一个惩罚信号，以取消更改。该惩罚信号是运动程序的教学信号。

在睡眠期间，记忆将被重组，以消除有意识的输入，简化、优化，去除对技能几乎没有贡献的垃圾信号。每一次循环，都通过试错法来完善信号序列。每一次睡眠，都会使大脑皮层褶皱变得更光滑。骑自行车将变得令人愉悦。在从笨拙的有意识的骑手到自然而然的骑手的转变中，这种愉悦达到峰值。

类似地，随着在电脑上输入更多句子，你的打字错误会逐渐减少。你知道键盘上的「)」在哪里吗？「}」呢？你打字越流利，就越有可能忘记这些细节。拿掉对运动序列的有意识控制后，键盘上「)」位置的陈述性知识可能会被当作「垃圾」扔掉：你不再需要它了。

16.4 陈述性学习的奖励

陈述性学习内驱力^[6]的解释会稍微复杂一些。陈述式学习^[43]有一个明确的奖励。有些事情很有趣，找出真相令人愉悦。在神经层面，大脑将扫描输入和神经活动，寻找与当前记忆状态相匹配的最大限度提供新知识的高学习熵区域。任何有意义的低概率信息都会被认为更有吸引力。明亮的分形图案是美丽的。灰色的随机色块是乏味的。更复杂的视觉信号也是同样的情况。生机勃勃的森林是美丽的。同样的森林在冬天、旱灾时或在环境污染的影响下可能就没有吸引力。Steven Pinker 说，我们会被有活力的图像所吸引。我不同意这一点。我们会被吸引的范围要大得多。我们同样可能会被一座死火山或南极洲的冰冻景观所吸引。我们喜欢可以使用简单模型^[7]来表达复杂信息的环境、信号、消息或大脑活动。一幅美丽的海滩图片可以用几个简单的形状和纹理来表示。

信息熵与数据的可压缩性有关。信号处理过程从输入开始。视网膜对视觉输入信号进行 100 倍压缩。视觉皮层接收形状和关系的简单表示。海马体不定时地接收这些信息。这些信号最终可能会改变新皮层长期记忆存储中单个突触的状态。

学习内驱力的基础是寻找在神经网络中表示知识的有效途径。学习内驱力、睡眠中的记忆优化^[14]和遗忘^[13]对于最大化可压缩性、抽象程度、可应用性^[5]和性能是至关重要的。通过这些，大脑确保我们可以使用简单的表征去看一个复杂的世界。这是人类智力^[44]的核心。如果人工智能研究人员能够给机器人配备类似人类的学习内驱力，只要有充足的内存，它们的学习能力就可能是无穷无尽的。

16.5 学习中的奖励中枢

2014 年，研究人员报告称，在「高度好奇」的状态下，伏隔核的活动增加了。他们还证明了我们一直都知道的：这种状态改善了记忆表现。此外，提高的表现溢出到了附带学习，即本身不会引起好奇心的学习。这项研究被媒体广泛报道，却是以错误的解释：「好奇心促使大脑拥有更好的记忆力」。例如，《科学美国人》用了这样的标题：《神经影像学揭示了大脑的奖励和记忆路径如何引导探究知识的头脑》。这篇论文本身就暗示了「激发好奇心」的必要性。

由于奖励中枢会涉及到对快乐的预期，我们更应该将这项研究的结果视为证实学习内驱力与快乐相关的一个指标。正是学习内驱力使人学习。正是学习令人愉快。上述标题应该是《神经影像学证实有效的学习令人愉快》。换句话说，顺序不是「内驱力->享受->学习」，而是「内驱力->学习->享受」。

与其说需要「激发好奇心」，不如说需要「发展学习内驱力^[6]」。关键的不同之处在于，将刺激视为可能在课堂上使用的速效方法，而不是需要几个月甚至几年的长期过程。广告宣传可能会用廉价的花招来激发我们的好奇心，而毕生的热情则是永不满足永不消退的学习内驱力的准则，是不断学习的完美保证。

诚然，好奇心的状态会提高注意力，而这会改善整体的学习。然而，这永远不该被用作教学策略。只有当奖励来自对目标的学习，而不是来自围绕目标的学习时，学习的游戏化才有意义。许多儿童学习项目使用鲜艳的色彩、不寻常的声音或笑脸来吸引孩子的注意力，诱导其学习。然而，一旦成为习惯，这种形式或人工游戏化就不再有效。此外，附带知识也不会持久。任何利用好奇心去激发附带学习的努力，都是不具体且低效的。同样地，我们可能寄望药物干预，例如利他林，可以改善学习。相反，学习必须是它自己的奖励。

伏隔核和腹侧被盖区参与快乐、对快乐的预期和对信号的估值。来自知识估值网络的信号，在其动机和情感的反应中，都汇聚到这些领域。多巴胺与对快乐的预期有关。由于多巴胺与注意力有关，单是对快乐的预期就能改善学习，因为人们更好地关注了预期会带来快乐的信息来源。

如果你没被说服，想想当你的新闻频道耍花招激起你的兴趣后说「广告后马上回来」时，你有多讨厌他们。当他们用「突发新闻」毁了这一切时，你会更加恼火。期待也可能导致挫折感。只有真正的学习会提供奖励。从进化论的观点来看，只有真正的学习的奖励才有意义。我们不想仅仅因为动物看到食物就奖励它。

伏隔核中的嗡嗡声可能是愉悦的直接表达，也可能是在暗示追求愉悦的状态。归根结底，实际的解释对最终结论并不重要：无聊和不愉快是学习的敌人。

为了有效地学习，使新知识与现有知识相辅相成，我们需要遵循学习内驱力。简而言之，这意味着在教育中，学习的乐趣是值得追求的。我们永远不应该在不愉快的状态下学习（参见：合意困难）。痛苦的学习来自大脑使学生知道，在信息论意义上，新知识并不适用！它将被舍弃。快乐是一个很好的向导！

从上述的神经推理中，我们得出了一个显而易见的结论：有效学习的最好保证是让学生自主学习，跟随自己的激情。

17 Biederman 模型

17.1 阅读「阅读的乐趣」的乐趣

2006 年， Irving Biederman 和 Edward A. Vessel 发表了一篇论文，阅读这篇论文给了我令人难忘的乐趣。这篇文章本身向我解释了阅读的乐趣。在一篇题为《知觉的愉悦与大脑》的论文中，Biederman 假设，大脑结构中负责视觉感知的一系列梯度的阿片受体可能会使人在观看美好场景（如美丽的风景）时产生愉悦感。Biederman 的想法似乎解释了我多年以来一直知道的：学习是愉快的。我一直喜欢学习，然而，我从来没有真正从脑科学的角度理解过是什么构成了我的这份喜欢的基础。Biederman 的解释恰到好处，令我非常愉悦。它解释了一些困扰我很长时间的事情。在阅读时，我充分地自我分析。在阅读「阅读的乐趣」时，我试图「感受」阅读的启迪是如何提供这种乐趣的。阅读「阅读的乐趣」的乐趣变得令人难忘。

Biederman 和 Vessel 提出的观点有重大意义。因此，为了简单起见，我现将他们的观点命名为 Biederman 模型（按资历命名）。在视觉感知中，一连串神经元层负责视觉场景的更抽象的表示。比喻地说，它从像素和颜色开始，然后转移到边缘、纹理和表面，然后转移到物体，然后转移到面孔、地点和集合，然后转移到有意义的场景片段，在链条的末端，可能会激活一座「美丽的山峰」的表示，并以此被记住，只有少数细节越过了工作记忆的第一印象，被长久记住。数百万像素的照片变成了一个有意义的场景，只需几句话就可以表达出来，并被记住很多年，而这花费的神经成本却很小。

Biederman 模型使用了一项之前的发现（Michael E. Lewis 等人，1981）：沿着视觉感知通道存在一系列梯度的 mu-阿片受体。神经元承载的含义越多，它可能拥有的阿片受体就越多。我们知道鸦片类药物是有益的，而且会让人上瘾。Biederman 模型基于这样的假设，即这一系列梯度的阿片受体是人能感知到快乐的来源。

用于处理语音和音乐的是与之类似的分层系统。颞叶皮质参与处理声音的音调乃至旋律。对节奏的处理还涉及大脑的其他区域。很有可能，所有这些感知网络都遵循相似的原则。这是神经美学的研究课题。

17.2 阿片 vs. 多巴胺快感

不过，Biederman 模型有一个小问题。学习的乐趣可以有意识地分析出来。就我自己而言，阅读 Biederman 模型的乐趣可以分解并追溯到模型的各个组成部分。这一事实意味着快乐是与有意识的体验相结合的。对于神经科学来说，意识是出了名的难解之谜。我们对意识的大部分了解要么是推测，要么是基于艰难而昂贵的实验，在这些实验中，植入大脑的电极会引起一些反应，这些反应由受影响的个人在随后或同时报告。证据似乎集中在意识的综合模型上，在这种模型中，大脑中几个结构的激活被整合起来，并被感知为有意识的自我。按照这种思路，激活大脑皮层某处的 Halle Berry 神经元并不足以让 Halle 出现在一个人的意识当中。数以百万计的概念神经元可以同时被激活，而正在思考的大脑只能对感知到的现实的少数几个模型进行操作（参见：注意力）。要想使 Halle 出现在一个人的意识中，这种激活必须与意识感知的其他组成部分相结合，包括感知的奖励。

出于这些原因，大脑皮层神经元中的阿片受体不会对学习的最终奖励起到多大作用。一种阿片类拮抗剂，纳洛酮，会剥夺某些人部分听音乐的乐趣。然而，学习的阿片类愉悦应该会产生一种类似于首次使用微剂量海洛因或吗啡时的和缓的快乐。从这个意义上说，内吗啡素的释放和阿片受体的激活有助于学习的快乐。然而，这种快乐还不够具体，不足以让人惊叹「哇！」、「啊哈！」或者「尤里卡」（Biederman 称之为「恍然大悟式的理解」）。对于最终的学习奖励，必须有来自大脑的愉悦中枢的综合奖励体验。

17.3 联想的乐趣

发现的终极快乐来自于有意义的联想。这可以用理解 Biederman 模型本身的快乐来解释。在思考这个模型时，我们在脑海中激活了两个重要的概念：(1) 意义的梯度（源于对涉及视觉感知的神经结构的理解）和 (2) 愉悦的梯度（源于对视觉通道中阿片受体含量的观察）。一旦这两个概念出现在脑海中，就会出现类比的粘合：「梯度」的概念。这种粘合有助于产生这样的联想意义=快乐！这是一种令人愉悦的启迪。这正是我在阅读 Biederman 的论文时所感受到的。要产生这种惊叹，仅仅有更多的阿片受体与「愉悦的梯度」这一概念联系在一起是不够的，就算这比阿片受体与梯度的数学基础或它与「梯度」这个词的联系更多。仅仅有更多的阿片受体与「意义的梯度」这一新奇概念联系在一起是不够的，就算这比阿片受体与常用术语「意义」的联系更多。当「意义 + 快乐」这两个有价值的概念发生碰撞时，才会让人产生惊叹。

Biederman 注意到，受体的梯度深入到了联想区，包括旁海马皮质。我们可能还记得，正是在更下游的海马体，我们发现了 Halle Berry 神经元。为了说明阿片类的快乐和联想的快乐之间的区别，让我们想象一下在美丽的海滩上与 Halle 相遇的情景。当走在海滩上时，我们可能会体验到一股微妙的海洛因般的极乐微风，这来自于我们意识到所处环境非常美丽：「我所在的海滩感觉很棒」。一旦 Halle 出现在地平线上，视觉分析可能会提供另一股阿片类的快感，这来自这样的信号：「美丽的女士正在接近」。然后，视觉处理单元可能会把该女士识别为 Halle，这可能会激活 Halle 的皮层表示，这可能是富含阿片的。然而，只有 Halle 和「我的海滩」的终极联系才会引起重大发现，或许是返祖繁殖的梦想：「Halle 和我走在同一片沙滩上！」。这就是来自腹侧纹状体和伏隔核的奖励在「喜欢」这种情况中可能发挥作用的环节，而一点多巴胺可能会触发「想要」的行为程序。由于审查制度，这个「想要」的行为程序的细节已经从这篇文章中删掉了。然而，在高度发达的个体中，该程序的执行将不可避免地被来自其前额叶皮质的执行信号制止。简而言之，在大脑的愉悦中枢注射多巴胺可能会给大脑带来一些不雅的想法，而阿片肽的释放可能只会带来联想上的快乐。

学习的乐趣不一定要包括吸引人的异性代表。Halle 出现在我的例子中只是因为 Halle 神经元的发现。要想获得学习的乐趣，所需要的只是想法之间强大而高价值的联想，这种联想要可以激活大脑的愉悦中枢。每当我们学到新的东西时，快乐就会产生，当我们学到一些有价值的东西时，这种惊叹是最强烈的。发现 Biederman 模型的快乐来自于我的知识估值网络对学习的乐趣本身的高估值。高估值带来高回报，这会促进记忆（参见：多巴胺可能调节学习的可塑性）。

17.4 记忆对学习乐趣的影响

我还想补充 Biederman 关于脱敏的假设，即反复接触会导致获得的快感减少。Biederman 认为，孩子们喜欢重复性的电子游戏^[36]是因为赌博因素。然而，对于成年人，赌博的威力也并未减小。我假设孩子们更喜欢重复学习，是因为童年失忆症^[45]。一些重复的快乐可能来自有限的理解，另一些可以简单地通过加速遗忘来解释。理解能力差和健忘是成人大脑和儿童大脑的主要区别。

我们还应该注意到，复习时快乐的大幅下降不是由于竞争性学习，而是由于长期记忆巩固^[33]，这可能导致信号在系统中高效流动。竞争性学习在模式识别中可能很重要，但在联想学习中，高可提取性^[46]会削弱重复接触带来的快乐。

17.5 学习内驱力进化的阶段

当我假设在人类身上出现了强大的学习内驱力^[6]时，我脑海中想的是从知识到奖励中枢的直接渠道。这最终将是比 Biederman 模型所暗示的更高水平的学习内驱力。每次涉及受体时，进化都有一种简单而可喜的材料可用。受体梯度最初是在猕猴的大脑皮质中发现的。类似的机制可能关系到更简单的大脑，甚至是更原始的失去中枢控制的神经系统。我不知道蚂蚁在想什么，也不知道它有什么感受；但找到一个好的食物来源，肯定是某种蚂蚁乐趣的来源。由此我们可以得出结论，从演化史角度来说，学习的乐趣可能并不比神经系统本身年轻多少。然而，在演变的过程中，这种驱动力建立了新的功能和效率层。似乎只有哺乳动物和一些鸟类具备玩耍的创造力。这个进化过程的最终顶点可能就是人类的学习内驱力。自然，在某一时刻，这会应用在在思想机器中。了解学习内驱力的力量将对人类的生存至关重要：无论是在其对人工智能的需求方面，还是在使人工智能成为反对人类的威胁方面。

18 合意困难

「合意困难」这一概念可能会成为容忍在校学习不快的借口。在这里，我会解释为什么这个借口是不公正且危险的。

Robert Bjork 可能是学习理论方面最好的专家。如果他告诉你在学习中困难是值得的，你会如何想？事实上他是对的，这与「好的学习总是令人愉快」这一事实并不矛盾。合意困难是一群概念的集合体。在这些概念中，学习障碍会促使进一步学习。让我们结合学习的乐趣，逐一解决这些问题：

主动回忆：主动回忆的效果优于被动复习。主动回忆更难。这是一个合意困难。我们在学习中需要主动回忆，因为这是唯一可以在间隔重复中有效地重新巩固记忆印迹的过程。每当我们在实践中运用知识时，便是在主动回忆。这种运用是令人愉快的，因为它可以提高生产力，这是一种独立于学习之外的奖励。人类单纯地喜欢实现目标^[47]。如果复习是人为计划的，就像在 SuperMemo 中一样，它不会产生富有成效的行为，而且很容易失去吸引力。所有成功的 SuperMemo 用户都会把复习与他们的目标联系起来。他们将每一个条目和每一次重复都视为通向更美好未来的一步。然而，并不是所有的用户都有这样的想象力。这就是为什么 SuperMemo 效率惊人，却并没有使人类为之倾倒的原因。
间隔重复：记忆的可提取性更低时，记忆巩固更有效。这也可能导致回忆更困难。这是一个合意困难。与主动回忆一样，复习的奖励来自于知识的使用和生产力。在默认情况下，SuperMemo 中大多数复习能够被成功回忆。难度和快乐之间可能是存在某种联系。同样，只有一小部分用户会发现这个过程是令人愉快的。除他们之外的人通常不会坚持很久便会选择退出。我们告诉所有用户，要让 SuperMemo 变得有趣，否则它不会对你起作用！另见：知道的乐趣^[48]
渐进复习：SuperMemo 提倡按间隔分散学习。从记忆力和创造力的角度来看，在较长的时间把文章分解成各个小部分来阅读会更有效率。同样的道理也适用于看视频或听讲座。这会产生上下文回顾的问题，但这是次要的。不过，它也在创造性阐述方面带来了额外的好处。它还改进了记忆编码、泛化和长期记忆巩固。矛盾的是，这些额外的困难会产生额外的学习效率，使得渐进阅读成为最令人愉快的学习形式之一。
学习情境：在回忆提取时更改上下文是一种非常简单有效的合意困难。如果编码正确，提取就会成功，这样更有效，有价值。如果语境变化产生了泛化，优化了记忆编码，学习的有效性就会增加，学习的奖励也会增加。
解决问题：解决问题可以是非常愉快的。问题越难，找到解决方案的快乐就越大。解决问题涉及一个学习过程，因为解决问题需要中间步骤：把新知识存储在记忆中。所有这些步骤都是令人愉快的。如果学生在任务中挣扎，长时间没有进展，他就学不到任何东西，也得不到任何奖励。这只能说明这些任务太难了。如果学生没能解决问题，但还是通过中间步骤取得了进展，即使这些步骤没有通向最终的解决方案，他们在此期间也进行了一定的学习，得到了一定的奖励。同样，如果困难是合意的，它将带来奖励。如果不存在奖励，则表明困难是无法逾越的。这种情况下，困难没有意义也不值得追求。
从做中学：「从做中学」可能包括玩耍、创意、解决问题等。完成这些任务需要更多的时间，往往也可以带来更好的结果和更多的奖励。
延迟反馈：延迟反馈在某些情况下需要更多的时间来处理。简而言之，如果老师不告诉你你做得有多好，你可能会好奇一段时间。这其实有利于记忆。如果真是这样的话，最终的效果将是值得的。
收回帮助：我在「学校压制学习内驱力」^[39]中写了关于「收回帮助」的内容。没有得到答案的孩子可能会因此变得好奇。好奇心会增加了学习的奖励。在纠正错误的现实模型方面没有得到帮助的学生，会因为靠自己解决不一致而获得更高的奖励。
其他困难：可以改善学习的障碍是无穷无尽的，其中一些可能是因为荷尔蒙的本质，一些可能涉及激励力量。所有这些障碍的共同点似乎是某种形式的更深层次的处理、记忆巩固和改善注意力等等。促使更好学习的障碍也不可避免地要涉及到更好的奖励。

合意困难不会剥夺学习的乐趣。恰恰相反，它使学习更有效、更有趣。如果难度过高，令人不悦，那么困难就不再可取了。这个简单的等价来自于学习内驱力的奖励系统的机制。

请注意，由于合意困难而获得的有效学习的额外奖励不需要与高学习熵相对应。学习熵是信息通道的度量标准。例如，主动回忆与新颖性无关。它指的是记忆重新巩固。同样，解决问题的部分原因可能来自于实现与学习无关的目标的需要，或者是被获得新知识以外的生产力所激励。

还要注意的是，几乎所有上述合意困难都内在地交织在渐进学习的过程中。

19 对学习上瘾

19.1 生而成瘾

我们生来就热爱学习。在强制学校教育^[49]的那些年里这种热爱通常很快便会消失。我们对学习的热爱持续越久，对大脑、健康和人类的益处就越大。对学习的热爱与上瘾无关。上瘾的定义包括强制参与某项活动而产生的不良后果。

与益处相比，学习的负面副作用是微乎其微的。一定程度的求知欲，甚至冲动，可以进一步促进积极的影响。提高一个人的学习热情是可能的。好的学习是进一步学习的最好的助推器。

19.2 学习与赌博

学习和赌博所涉及的奖励系统之间有着密切的联系。赌博和学习新单词都会以类似的方式激活腹侧纹状体。这种与赌博的密切联系可能会混淆学习的概念。喜欢玩老虎机的赌徒并不能通过游戏学到多少东西。容易上瘾的电子游戏可能会更好一点，因为它很有教育意义。许多团队游戏成瘾者在校成绩没有明显的起色，但在游戏里却能说一口流利的英语。对体育新闻的上瘾也可能会涉及到一定程度的学习。比如我就是在非洲国家杯期间才了解到卡宾达的。对刷 Facebook 的上瘾也没有什么不同。它基于预期特定收益的可变奖励^[37]，当然，它也可能包含很大程度的学习。这种学习可能包括八卦、名人新闻、假新闻或实际有用的学习。甚至政治民调的更新也会导致上瘾。在希拉里·克林顿和唐纳德·特朗普之间的竞选较量中，民意调查的平衡足以产生悬念效应。对新民调的检查强迫症具备上瘾的全部特征。然而，这种上瘾可能会促使大量的学习发生。把赌博和学习分开有赖于学生自己。贪婪的学习是好事。上瘾带来的学习也可能是好事。然而，赌博本身给人类生存带来的价值微乎其微。因此，理解奖励多样性在预防成瘾中的作用至关重要。

19.3 学习与睡眠

强迫性学习可能会侵占睡眠时间，并可能导致失眠和 DSPS 的流行。拥有强大学习内驱力的富有创造力的头脑会经常熬夜学习到凌晨。在电灯被发明之前，这种对于睡眠模式的违反是困难的，甚至是不可能的。好消息是，学习内驱力会随着网络疲劳^[50]而衰落。我们学习的时间越长，记忆回路的饱和程度就越高。只有睡觉可以帮助缓解。因此，即使是最贪婪的学习者也会在某些时候变得昏昏欲睡并放弃学习。如果读者因为看小说而通宵，这可能是由于睡眠动力不足、学习减少，以及充满悬念的小说中典型的可变奖励增加的共同作用。

19.4 学习与运动

我听说过度学习会导致运动减少。那是很糟糕的。然而，我认为不好的学习更有可能产生这种效果。好的学习是愉悦的，会激发额外的能量。一个快乐的孩子不应该长时间坐在书前或电脑前，一定有想办法发泄能量。也许我们应该说，运动减少是学习成瘾的标志，而良好的学习有神经营养作用，可以爆发出额外的能量以供燃烧？

19.5 学习的限制

学习有成本，并且需要时间。因此学习应该是明智的。然而，好的学习几乎是一项稳赚不赔的长期投资。因此我们没有必要畏惧上瘾。相反，我们应该珍惜并推动学习内驱力，为快乐的终身学习做准备。

20 学习的不快

当我声称「所有的学习都是快乐的」时候，我听到了各种的声音，比如「我必须通过一场压力极大的考试，因为它会带给我很多终身受用的知识」。这些声音把「良好学习的乐趣」与「使学习成为恐惧的不快因素」混为一谈。这些可怕的因素可能涉及糟糕的老师、苛刻的家长、截止日期、压力、低质量的睡眠、烂教材、过多的学习量等等。

我听说，如果没有最后期限或学校强加的目标，学习将被电子游戏、小说、电视、业余爱好、运动等所取代。出于许多原因，这可能是对的。这些活动中的某些可能会给人带来学习之外的乐趣。然而，它们也有学习或锻炼方面的益处。一个全面发展的学生会自由地放慢学习进度，把时间分配给有趣的学习或是其他有趣的活动。「慢慢来」可能会带来更多的益处。

在学习的等式中，良好的学习不可能会产生不快乐。真正的罪魁祸首永远在别处。所有的负面因素都应该加以研究，并消除。

归根结底，即便与考试、证书、职责相关的不愉快必须存在，这种不愉快也应该由学生自愿强加给自己。

愉快的学习可能会被淹没在压力、坏人、学校、烂教材等共同造成的不愉快中。

21 学习和拖延

如果学习是最可持续的获取快乐的形式，那么为什么大半数学生会拖延呢？这几乎是全球人口的三分之一。

答案很简单也很重要：学生拖延是因为好的学习是一种乐趣，而坏的学习是一种折磨。大多数学校甚至大学布置的作业都与学习内驱力^[6]的需求相当不匹配。这样的学习实际上是低效且不快的。这些孩子经常在晚上玩电脑游戏，理由是他们需要让大脑得到休息。我怀疑他们的大脑在玩游戏时并没有得到休息。他们实际上是在做他们认为令人愉悦的工作。这种快乐很大程度上来自于学习新事物。不幸的是，游戏玩得好并不会在学校拿到更多的学分，因此无聊的学习和娱乐的正弦循环在第二天甚至是家庭作业的同一天便开始了。

一直以来，我对「那么多学生称自己懒惰」感到惊讶。实际上，他们可以在体力劳动或脑力劳动方面完成许多艰苦卓绝的壮举，只要它们是令人愉快的或为他们自己的目标服务的。即使是那些在 SuperMemo 中记住了数千条目的人，也经常给自己打出很低的责任心分数。学习的目标可能是模糊的，但即使它们是清晰明确的，输入和前置知识之间的不匹配也会导致严重的不快。如果学习熵较低，任务可能会很无聊。如果学习熵是负的，任务将会是令人厌恶的。

高目标估值和不良学习的奖励负值之间的斗争将导致拖延。拖延者经常地自称懒惰，即使他们并不懒。

如果你认为你是学习懒人，那么你需要重新评估手上的学习材料，以及学习方法论。即使是稍稍违反自然创造力周期，学习的乐趣也会被扼杀。

22 学习和抑郁

学习带来的快乐，不仅可持续，而且不会让人上瘾。甚至几乎没有副作用，只是需要花时间。此外，好的学习往往令人全神贯注，并能提高学习内驱力，来激发更多的学习。这意味着，用学习治疗抑郁，并非无稽之谈。

22.1 在学校学习

如果学习是快乐和奖励的源泉，为什么我们会在学龄儿童中看到抑郁泛滥？尽管学校是学习机构，但更有可能导致抑郁，而不是充当救赎。没有学习的自由，就很难有好的学习。为了让学习变得愉快，它需要由学习内驱力推动。它不能是强制性的或胁迫性的，它必须是自由的。

22.2 记忆对情绪的影响

自由学习很有趣，不过，学习能成为应对抑郁的良方，靠的不是乐趣。

记忆是一个可能引发或抑制抑郁的因素。记忆决定了输入信号在大脑中的传导方式。记忆决定了哪些概念与输入或神经激活有关。记忆决定了我们对汽车经过声音的反应。它可能会唤起我们对愉快假期的回忆，对埃隆·马斯克的灵感的回忆，或者是对一场导致所爱之人残废的车祸的回忆。

要让记忆对情绪产生重大影响，我们需要很多记忆。仅仅坐下来与心理治疗师会谈并了解一些关于大脑、生活或应对策略的关键事实并不够。使大脑步入健康的轨迹往往需要数月甚至数年的学习，在这个过程中我们建立起牢固的乐观或悲观的联想。我们需要数以千计的这样的联结来改变原有的平衡。然而，即使是多年的学习也可能很容易被病理或创伤所颠覆。神经激素可以立即改变大脑的工作模式。激素水平的改变会立即使一组可能对情绪产生负面影响的记忆占据优势地位。创伤将植入记忆，触发新的激活源，并覆盖其他的激活源。换句话说，如果大脑切换了正在运行的轨道，或者产生了一个新的激活源，那么好的记忆可能会变得毫无价值。几乎不可能用学习去缓和关系密切的人的死亡带来的痛苦。

一旦抑郁症发作，受影响的人将面临双重打击。不仅是好的记忆需要竭力抵御以维持乐观的联想。不好的记忆会开始在脑海中盘旋，加强它们自己的新轨迹，并占据上风。大脑对自己重新进行编程，使情绪的平衡朝着错误的方向倾斜。当这个过程变得失控时，我们可能就会面临临床抑郁症。更糟糕的是，抑郁症患者失去了对生活和对学习的热爱。

学习会打乱这个循环吗？这可能是非常困难的！尊重昼夜节律周期是恢复受扰的大脑的第一步。需要在昼夜节律周期，创造力峰值的窗口时间来尝试治疗性学习。学习需要多产、专注、有效和愉快。渐进阅读如果不是那么困难的话就好了。对于一个在该领域没有经验的抑郁症患者来说，SuperMemo 不是一剂良药。已经太迟了。试图在糟糕的心理状态下掌握渐进阅读只会让事情变得更糟。这可能会导致对渐进阅读的厌恶。

但如果可以学习，它将起到避难所的作用，这可能有助于抑制负面记忆，建立新的联系。从这时起，构建新知识卷须的过程就开始了。不过这个可以让我们的头脑对世界做出更乐观解释的过程是缓慢而艰苦的。在大多数严重的情况下，可能需要几个月或几年的艰苦工作，且结果无法保证。

最终的结论是，学习不是万能的，但它可以在治疗中发挥重要作用。最重要的是，通过丰富而有效的学习，我们可以提前几年避免患抑郁症的风险。学习必须在自由和尊重学习内驱力的条件下进行。简而言之，热爱学习是通向热爱生活的好方法。

22.3 抗抑郁药

我是医学上的勒德分子（即反对新技术的人）。为了身体的健康，我坚持「如果它没有坏，就不要修理它」的原则。我避免任何形式的药物干预。我相信身体自稳态^[50]的力量，而干预自稳态会带来危险。我用过最烈的药是咖啡和啤酒，甚至不用阿司匹林。滥用抗生素、止痛药、安眠药和抗抑郁药最让我沮丧。距离我上次服用抗生素已经有几十年了。时间已经长得足够我遗忘。如果有必要，我会在临终得病床上用一把抗生素。任何药物都需要合理的情况下才能使用，抗抑郁药也不例外。因为它们导致受体敏感度下降，一旦服用，就会使神经递质状况变得更糟。这通常意味着，服用该药物越多，就需要服用越多以免失效。不过，在严重的临床抑郁症病例中，药物可能会遏制情况失控的过程。它们可能会保护大脑免受自我伤害。因为一旦抑郁症患者开始失去脑细胞，康复之路就会变得漫长而坎坷。抗抑郁治疗如果有效的话，把学习当作治疗方式的最佳时机就是治疗开始的时候。只要大脑愿意继续，学习就可以启动那些微妙的知识卷须，而这些卷须会与现实挂钩，产生微量的学习内驱力。在理想的情况下，停药后，学习内驱力会存活下来，开启逆抑郁过程：学习的正反馈、创造力、良好的睡眠和良好的情绪。这并不容易，但极其重要。药物治疗可能是唯一能改变患者生活的方式，但它仅能作为改变病理现状的突破口。药物治疗不会使大脑处于比抑郁症状发生之前更好的状态。积极地努力才会持续改进现状。没有健康的学习内驱力，就无法建立起积极的记忆。

22.4 学习内驱力和乐观

蹒跚学步的孩子的学习内驱力似乎最旺盛。难怪健康的孩子天生乐观。乐观与学习内驱力之间存在关联。在神经化学的层面，快乐的心灵可能充当着学习内驱力的能量源。悲观则肯定会起到抑制或过滤的作用，阻止学习内驱力的表达。从这个意义上说，悲观的心态会掩盖学习内驱力。在抑郁时，学习内驱力可能会完全消失。难怪 Robert Sapolsky 博士称抑郁症是世界上最糟的疾病。

有一种共识认为学校是青少年（以及在后来的生活中）抑郁的主要成因。其机制尚不清楚，但习得性无助^[27]和抑制学习内驱力可能是致病的关键。

22.5 学习可以帮助你吗？

如果你正在读这篇文章，但不确定学习能不能帮到你，那就问问自己这个问题：你今天心情好吗？如前文所述，当你心情低迷并在寻找解决方案时，你的解答可能会更阴暗，你会觉得这篇文章不够令人安慰。不过记住激活能量的原则：你需要迈出一小步才能开始，去学习，然后你就可能会被一大堆有趣的东西所吸引。

如果你今天没心情学习量子力学，那就从琐碎的名人新闻或体育新闻开始吧。学习一点总比完全不学好！或者，如果琐事让你更加沮丧，那么可以读一读这篇 Susan Engel 写的关于学习和抑郁的有趣文章。

23 教育优化：全局还是局部？

把快乐当做教育的指路灯有风险吗？

23.1 “完美”的教育模型

经过漫长的学校教育，我们逐渐构建了一套幻想中的完美学习模型。在这个模型中，我们设置长期目标^[47]，遵循课标^[51]，掌握重要知识。最终我们获得大学学历，此时我们不仅扎实掌握了某一领域的专业知识，而且还具备了丰富的常识，足以在社会中正常生活。我们在学校系统待的时间越长，就越难跳脱出这个模型，用客观的目光对其加以审视。矛盾的是，对于那些在学校表现出色，并开始相信自己已经成功的人来说，验证这一模式反而是最困难的，这要归功于这种完美的学术学习模式。聪明人在学校遭受的痛苦较少，因此，他们对学校系统的问题考虑得较少。对于成功的学生，这套模型会深深烙印在他们的脑海里，驱使他们为子子孙孙指出相同的路线，让这套模型绵延不绝。

使用课标^[51]来塑造学生的知识，这样的模式是错误的！「完美学校」模式认为，孩子学习好都是学校系统和老师的功劳，然而学生才是一切知识背后的人。对于大批大批在学校不甚成功的学生，我们往往会责怪孩子或他们的父母；与此同时，一小部分成功的学生，会继续梦想自己的孩子会享有完美学校模型，并不断将这种模式推广到不幸的人身上。

23.2 基于学习内驱力的优化

与课标不同的是，学习内驱力^[6]背后的优化机制，是随着人类进化而不断完善的。人的学习内驱力，能让他掌握足够的知识，足以解决各种科学或工程的复杂问题。在强制学校教育到来之前，人类取得了各种突破，并开展了启蒙运动或工业革命。强制学校教育^[49]是为了帮助“未开化”的群众提升到新的高度，但随着强制教育不断发展，这种模式已无法启迪民智，而更多是压迫创意思维。从优化角度来看，这种模式陷入了死角。

23.3 设计孩子的心智

受过高等教育的聪明人经常说，教育太重要了，不能依赖于自学或盲目的学习内驱力来开展教育。显然，教育再重要不过了，我们应该全局地规划和设计教育，使用最高级的科学工具，依靠最顶尖的专家。在我深入思考教育系统之前，我专注于高效学习，也秉持着相同的理念。这是因为，默认听从专家意见是很自然的。

受过高等教育的人，经常会说这样的话：

儿童无长远规划能力，因此课标是很必要的
学习内驱力是局部优化，而我们需要的是全局规划教育
追随学生的兴趣必然招致灾难：他们最终都会沉浸在麻痹大脑的电子游戏^[36]中

然而，全局优化的教育不断设置越来越严苛的表现目标。全局优化想要把更多「必要」的知识装入学生的头脑中，全一直在使用同一种低效的学习工具。对数百万学生来说，结果是悲惨的。虽然斯大林对社会全局优化，使苏联实现了巨大成就，但是让西方世界提升到了新高度的，是市场经济简单的优化算法。参见：现代学校教育就像苏联经济^[52]

目前采用的教育优化，以知识测验作为学生表现的衡量标准，但这使得学生依靠死记硬背和短期记忆在较短的时间内取得更高的成绩。结果，它不断失去对学习内驱力的控制。国家之间的竞争也通过表现测试来衡量。我们不是针对实际的长期知识进行优化，而是针对学生头脑中的知识周转速度进行优化。其结果是，学生们不高兴，他们学到的知识，相对于投入的时间，以及实际的人类潜力来说，微不足道。

23.4 要依靠涌现

教育优化中可以运用涌现^[53]这一概念。依靠学习内驱力这一机制，知识会自我组织，不需要老师^[54]花什么功夫，也不需要孩子痛苦跋涉。自然的学习可能是很长时间的，但这种学习是令人愉快的。对于健康的孩子，只要是自己选择去学习，他们便不会介意整天学习。

有关基于学习内驱力的学习的局部优化，我们应该牢记两个重要事实：

不依靠学习内驱力，就没有好的学习。只要试图凌驾于学习内驱力之上，人类记忆便会强烈拒绝。
学习内驱力能够极度高效而长期地优化学习过程。几乎所有人类在 1850 年之前的成就，都是在学习内驱力的指导下完成的。

怀疑论者会注意到，自从引入强制学校教育以来，人类进步加快了。他可能是对的。然而，自从 40 亿年前第一批生命出现以来，我们就一直在加速进步（译者按：可参考「加速回归定律」）。我认为古腾堡和 Tim Berners-Lee 比可敬的 Johann Julius Hecker 对这种加速的贡献更大。

基于学习内驱力的局部优化是反直觉的。相信创世论的人，同样会认为自然选择机制是反直觉的。基于随机变异的局部进化优化，怎么能创造出人类这样的奇迹呢？如今，相信创世论的人越来越少，然而，绝大多数人不知道学习内驱力背后的机制是什么，而忽视学习内驱力的理由，正是普鲁士教育系统^[55]的主要问题。

23.5 树木生长比喻

不设时间限制，让人沉浸于知识丰富的环境之中，人的知识便能成长为庞大、全面且连贯的知识体^[10]，并不需要教育系统来干涉。所有自由、健康的人都是如此。这棵知识树的大小和质量可能取决于一个人的个性、兴趣和智力发展的起点。然而，教育的一个主要误区是，知识的有机增长会滋生大量偏见以及不了解的知识区域。据称，这样学习的人，相比接受学校教育，会有更多盲点。由于学习内驱力的计算能力，和涌现^[53]现象，事实恰好相反。我喜欢的一个解释学习内驱力力量的比喻，是树木的生长。

比喻。为什么使用比喻？^[56]

人类个人知识的自然生长，可以比作树的生长。树枝分生组织中的单个细胞，对细胞所在的这棵树，及其总体生长目标，都知之甚少。分生组织遵循简单的激素、生化或生物物理规则（如顶端优势）。这些简单规则引导植物向光生长，非常高效，于是树便有了漂亮的树冠。每棵树还可以与其他植物构成树冠层。对于树冠来说，重力得到了最优的处理。重新分配营养物质很容易。对光的吸收效果极佳。所有障碍物，例如其他树木、岩石或灯柱，都能轻松处理。植物根系同样遵循类似的机制，也能够有效生长。大脑中的生长在锥萌发新的神经连接时，也采用了一套简单的局部规则。

知识之树也遵循相似的原则工作。像树的叶子渴求光一样，根据学习内驱力机制，记忆之叶会渴望新发现，并朝着灵感的方向发芽。局部而言，学习内驱力似乎是简单而盲目的。但在全局范围内，这种机制让人成为知识渊博的个体，足以履行其社会义务。自学的大脑可以适应任何环境，可以实现所有可以想象到的人类目标。

正如树木需要水、二氧化碳、某些营养物质和光线一样，大脑也需要能量、丰富的知识输入和不受约束的自由。只要试图强制监管大脑，学习内驱力就会受到抑制，知识之树无法自行发芽生长。

还有一个比喻有助于解释建立连贯知识的过程中的涌现现象，即知识结晶比喻^[38]：

图：在完美的学校教育中，我们创造了完美的知识结晶。在大学，我们增加了额外的专业知识结晶。然而在现实中，学习看起来并不那么完美。对于大多数孩子来说，知识永远无法建立足够的连贯性，并且由于知识干扰^[57]（即快速遗忘）而分崩离析。因此，在真正的学校教育中，知识逐渐达到一定的数量，之后学生纵使怎么刻苦学习，在稳定性或连贯性上则几乎没有进步。相比之下，在自由学习中，知识的获取是混乱和不均衡的。但是，只要是基于学习内驱力，所获取的知识总量是非常庞大的。知识晶体相互碰撞，形成一致性和连贯性。这反过来又有助于稳定性和知识的进一步整合。到了大学时，就数量而言，自由学习者应该比普通学生知道的要多得多。自由知识有多种优势，也有多种弱点。然而，自由知识在连贯性方面更具优势；因此对于问题解决更有用

23.6 局部优化

由于学习内驱力的局部优化，人的能力与其环境和目标之间得到了完美匹配（参阅：学习内驱力的优化^[21]）。试图从全局层面优化学校教育抑制了学习内驱力，在将个人与他们的工作相匹配时遵从被压抑的学习内驱力，最终结果便是一个不愉快的社会，在这个社会中，大多数人渴望朝九晚五的舒适工作，而领导力、学习和责任都被委派给其他人。民主学校^[58]的情况则相反，这类学校依靠自学培养出自我决定、自我实现和自力更生的人，他们都准备好去接受他们所选择的兴趣领域的任何挑战。

在史蒂夫 · 乔布斯历史性的毕业典礼演讲中，他开玩笑说，在被诊断出癌症之前，他不知道胰腺是什么。显然，他盲目的学习内驱力，让他丰富的知识缺了一块。即使这是真的，我也绝不会用史蒂夫 · 乔布斯和他的毕生杰作，来换取几次失败的局部优化学习。他鼓舞人心的演讲的要点之一，就是跟随自己的学习内驱力。用他的话说，「成就大事的唯一途径，就是热爱自己所做的事」。数百年来，所有智者都在讲述这条真理。

23.7 全局优化有可能吗？

全局优化为所有输入寻找最优方案。学习的全局优化是在教育部门级别进行的，例如共同核心标准和标准化测试等工具。全局优化的基础的是一套有毛病的推理：我们可以塑造孩子的大脑。试图预测孩子未来的父母，也会进行全局优化。

我们能提前决定孩子的未来吗？如果让父母在全局范围内选择最优的未来，社会便会有满坑满谷的律师和医生，以及大量失意的大学辍学者。如果政府要插一点手，在孩子很小的时候最优地分配工作，我们最终会走向类似 1984 的结局。很少有孩子愿意在 6 岁时发现自己未来注定当簿记员或木匠。显然应该基于爱和激情选择工作，而不是政府命令。

那么，也许应该允许孩子在全局范围内进行优化？这也行不通，最终摇滚音乐家、专业电子游戏玩家和足球运动员会过剩。

这与通过学习内驱力进行的优化形成了对比，后者在几个世纪以来培育了人类最好的成就。

在通向全局最优的道路上，课标^[51]的目的似乎是中间最优？通过课标指导值得了解的知识似乎不错。如果孩子或老师对学习缺乏热情，他们可以参考课标。不过，如果学习内驱力已经在全速运转，为何要放慢速度？孩子有可能永远也学不到酒精的危害吗？不太可能。另一方面，我不知道什么课标会包含渐进阅读的教授。我可能有偏见，但我肯定会把这项技能放在死记硬背 Kawalec 或采迪尼战役（取自我自己的课标）的要求之前。如今，我很欣赏已故的 Julian Kawalec。然而，当 communist 当局强制要求我阅读他的小说，我便多了一条在学校受折磨的方法。你可能想知道 Kawalec 是谁。我很乐意告诉你，但维基百科上已经有一篇关于他的成就的文章了（只有波兰语版）。

如果你对照课标测试学生的知识，很容易发现他们仅仅掌握了课标这个全局优化计划的一小部分。不过他们通过自学获得了大量关于这个世界的其他知识。因此人们会形成「学校教育是好的」的错觉。如果课标不是义务的，教师有更多的改编空间，那么孩子学到知识量，以及知识的连贯性都会增加。连贯性和速度是自学的两个标志。在自学时，可能没那么多孩子会选择解二次方程，但他们会掌握更多他们认为重要的技能，解二次方程知识的缺失不足为道。那些计划以 STEM 为职业生涯的人，迟早会学到二次方程。其他的人则会回到当前的默认状态，即学习公式然后很快忘记它们。大多数人不知道如何解二次方程。很少有人知道二次方程的目的。课程中的方程式增加了痛苦和知识的成本，而这些知识本可以是大脑在快乐的状态下伺机有效获得的。

既然全局的长期优化不可能实现，课程标准这种中间手段只是稍微复杂一点的失败品。但这些手段仍然偏离了学习内驱力所决定的最优状态。

高效优化的唯一方法，是由学习内驱力确定发展轨迹，辅以一些温和推动，可以来自父母、导师、同龄人、陌生人、社交媒体、维基百科、谷歌等。优化教育必须遵循学习的基本规律^[59]（接下来说明）。

24 学习的基本规律

大多数人都知道学习可以是快乐的。然而，很少有人意识到这一事实对教育的未来^[60]有多么重要。

唯有神经科学中源源不断的宝贵发现才能帮助我们认识到学习乐趣的重要性。奖励过程从感知层面开始，通过联想学习，到创造力^[22]，乃至问题解决，直至实现目标的最终快乐。在每个中间阶段都有奖励智力活动进展的快乐信号。

我也迟迟不能理解快乐的力量。在 1991 年，我们曾保守地写道：「有一种确定的方法可以判断一个学生是否会在工作中取得成功。如果他在长期的学习过程中找到了乐趣，他肯定会做得非常好」（参见：SuperMemo 十诫^[61]）。今天，我们意识到快乐与神经网络中所有形式的学习联系得如此紧密，以至于它成为衡量学习进展的最佳标准之一。

这使我们得以阐述陈述性学习的基本规律：

没有快乐，就没有好的学习。

当然，这个规律需要被证明是准确的。好的陈述性学习会带来快乐。这一事实可能会被一些因素所掩盖，例如，一些好的学习会隐藏在大量的毒性学习之中。快乐本身并不是学习的保证。我们发现的事实可能令人忧心。一些陈述性学习可能发生在不愉快的条件下（例如在条件化恐惧下）。经典的条件反射常常伴随着疼痛。临床抑郁症会阻碍一个人骑自行车的倾向，但不会破坏骑自行车时发生的程序性学习。

陈述性学习的基本规律只是简单地说明了，获得满足学习内驱力的高质量知识将产生奖励信号。没有这个信号就表明缺乏学习。枯燥的事实可以不包含乐趣地进入短期的陈述性记忆，但如果没有学习的奖励，这些事实就不会依附于可靠的现实模型。这些事实很可能会被健康的遗忘系统快速地从记忆中消除。更糟糕的是，糟糕且持久的印记可能会入侵未来的人生^[62]！记忆中任何连贯的模型的出现，都不可避免会产生奖励信号。

如果你碰巧在把痛苦强加给自己，你需要重新考虑你的策略。你可能需要放慢脚步，或者回到基础，学习心智和睡眠科学的规则，管理你的压力^[19]，学习 20 条制卡规则^[63]，或者可能尝试一下渐进阅读。就算你不顾痛苦地坚持，你也得不到好的结果。格拉德威尔的一万小时法则也需要经过（学习的基本规律的）认证。没有一位小提琴演奏家是仅仅通过数千小时的练习之苦而脱颖而出的。就像学习一样，伟大的音乐是爱的产物。

另一方面，这个世界上的大多数学生受苦都不是自己的过错。糟糕的学习是他们的上级强加给他们的！

全世界的学生团结起来！你不再需要忍受学习的痛苦。如果你受苦，你有抗议的基本学生权利。如果你受苦，一定是哪里出错了！你可以停止学习！如果有人要求你学习，你却不喜欢，你可以反击，要求快乐的学习！这不是你精英享乐主义的弱者的心理要求。这是理性的要求。没有快乐就没有学习！你的受苦是浪费时间，浪费健康，浪费人类全球资源！见：教育解放宣言^[64]

图：学校就是这样摧毁了对学习的热爱。学习内驱力^[6]是孩子愿意去追求的一系列激情和兴趣。学校外驱力^[65]是学校系统设置的一套奖励和惩罚措施。学习内驱力帮助形成了简单的、助记的、连贯的^[10]、稳定的和适用的记忆，这是因为知识的质量决定了学习内驱力系统中的奖励程度。由于学校通过课程^[51]（而不是通过学习内驱力的神经机制）将知识序列化，学校外驱力导致了学生形成复杂且容易受到干扰^[57]的短期记忆。在学习内驱力和学校外驱力通路之间的竞争性抑制^[26]将导致神经连接的减弱。强大的学校外驱力会削弱学习内驱力，破坏学习的热情，并导致习得性无助^[27]。强大的学习内驱力会导致反抗^[66]，保护内在的激情，但也可能会让你在学校闯祸。在学习内驱力的影响下，记忆新的知识是非常有意义的，而且没有任何惩罚（根据学习内驱力的定义）。这将使学习内驱力茁壮成长，带来学习上的成功（和在学校）。相反，由学校外驱力的压力导致的知识质量低下将产生较弱的奖励信号，并可能产生强烈的不连贯性惩罚^[31]。这种惩罚将反馈产生对学校外驱力的反抗，这反过来又需要学校系统的进一步强制纠正，这又会进一步降低知识的质量。这些反馈循环可能会导致学习内驱力和学校外驱力的竞争，并最终压制一方而助长另一方。蓬勃发展的学习内驱力会助长反抗，从而增加对学校外驱力的防卫。同样，在学校增加的惩罚会助长习得性无助，削弱学习内驱力，导致对系统的服从。可悲的是，在大多数情况下，控制系统将定格在这两个极端的中间位置（见：老汤问题^[67]）。大多数孩子讨厌学校^[68]，失去了对学习的热爱，仍然服从于奴役。他们恢复的最好机会是大学的自由，或者更好的是，成年后的自由。见：在神经元水平上二元决策的竞争性反馈回路

版权说明：你可以在知识共享许可下重新发布这张图片，并注明 SuperMemo World，这里查看最新的版本

25 总结：学习的乐趣

人脑会自然了解环境中的「有趣信息」
学习和发现新事物给人以奖赏感
许多教育工作者认同这个危险的迷思：会引起不快的学习仍然可能有效
获取新知识时，意外十分重要
可预测性和意外性都可能增加信息渠道的吸引力
信息渠道的吸引力取决于前置知识
向大脑传递信息，必须考虑到大脑的前置知识。所以，传授知识（例如通过班级授课）很难适用于所有人
信息渠道的吸引力取决于传递速度和处理速度
学习中信息传授的速度和复杂度必须根据个人需求量身定做
对新的高价值联想记忆进行编码的同时，学习者也在向大脑的奖励中枢传递信号
学校教育中的信息渠道无法实现个性化，因此缺乏奖励
学习提供的快乐是独特而持续的，可能具有治疗效果
由于系统性原因，学校教育通常无法依照儿童的兴趣而开展
学校教育本质上匮乏奖励，这是学生普遍厌恶学校“学习”的主要原因。
破坏学习的乐趣，也就促成了不愉快的社会
陈述性学习的基本规律是：没有快乐，就没有学习！

参考

1. 学校让人沾染上的 100+ 恶习 ./559705516.html
2. 磨难就是荣耀？ ./253184005.html
3. 教育抵消进化 ./66279009.html
4. 被动的学校教育 ./359037513.html
5. 适用性 ./517317208.html
6. 学习内驱力 ./52990549.html
7. 抽象知识 ./270927894.html
8. 泛化与概念化 ./264989664.html
9. 学校教育的徒劳 ./353878177.html
10. 连贯性与一致性 ./264327134.html
11. 拼图游戏比喻 ./271646965.html
12. 模型 ./560324024.html
13. 遗忘 ./558542113.html
14. 睡眠中的记忆优化 ./266856783.html
15. 渐进阅读 https://www.yuque.com/supermemo/wiki/incremental_reading
16. 知识估值 ./560852624.html
17. 概念网络 ./266541480.html
18. 如何解决任何问题？ ./351779186.html
19. 抗压韧性 ./73207325.html
20. 自由学习 ./272543239.html
21. 学习内驱力的优化 ./357209357.html
22. 创造力 ./450093869.html
23. 自我导向/自定进度/自学 ./353404375.html
24. 概念 ./571218385.html
25. 学习中的强迫 ./351872034.html
26. 神经网络战争 ./359658715.html
27. 习得性无助 ./575245791.html
28. 稳定化 ./595158577.html
29. 学校让人沾染上的 100+ 恶习 ./559705516.html
30. 间隔重复 (spaced repetition) ./305651556.html
31. 解码失败惩罚 ./359921139.html
32. 自然创造力周期 ./68262875.html
33. 记忆的双组分模型 ./579476637.html
34. 间隔效应 ./279166945.html
35. 记忆稳定性 ./559298549.html
36. 电子游戏 ./479108151.html
37. 可变奖励 ./518129740.html
38. 知识结晶比喻 ./268536400.html
39. 学校对学习内驱力的影响 ./52990626.html
40. 专家对可汗学院一无所知 ./595868172.html
41. 将创造力与 ADHD 混淆 ./521885826.html
42. 拼图游戏比喻 ./271646965.html
43. 陈述性学习与程序性学习 ./360120302.html
44. 智力 ./492731786.html
45. 童年失忆症 ./72792752.html
46. 记忆可提取性 ./559819340.html
47. 设立目标可以改变你的生活 ./580273089.html
48. 知道的乐趣 ./587086992.html
49. 强制学校教育 ./351869026.html
50. 自稳态的睡眠倾向 ./532216678.html
51. 课标 ./469943493.html
52. 现代学校教育就像苏联经济 ./365716946.html
53. 涌现 ./349290940.html
54. 最佳推动区 ./67694020.html
55. 普鲁士教育模式 ./251148900.html
56. 我在文章中为什么要使用比喻？ ./583216628.html
57. 干扰 ./269974053.html
58. 民主学校/在家上学/非学校教育 ./369568521.html
59. 学习的基本规律 ./273225977.html
60. 教育改革 ./242815901.html
61. SuperMemo 十诫 https://www.yuque.com/supermemo/wiki/decalog
62. 毒性记忆 ./67390960.html
63. 20 条知识表述规则（20 周年版） ./269997143.html
64. 教育解放宣言 ./268258730.html
65. 学校外驱力 ./539022457.html
66. 反抗 ./514347163.html
67. 老汤比喻 ./306014650.html
68. 为什么孩子们讨厌学校？ ./70779863.html

← 返回目录