如何看待“学生和家长仅仅希望高中不要凌晨五点半就到校，多睡一个小时。就被指责为想搞快乐教育”这句话？ - @Thoughts Memo

问题描述

家长和学生们仅仅希望学校不要凌晨五点半就到校，六点半在让孩子们到校。多睡一个小时。

某些人：你想搞快乐教育，你是崇洋媚外。韩国日本放学早都是花重金上补习班，你有那个钱吗！

连应试教育都搞不明白的典型。

我都不知道我重复过多少遍了：你晚上睡得不够 = 你白天白学了！

要求满足人类最基本的生理睡眠需求，居然能被扣上「快乐教育」和「崇洋媚外」的帽子。这种指责与真正的教育毫无关联，它纯粹是一场东亚特供（日韩先行服）的、冷血的普鲁士教育模式^[1]服从性测试。

太长不看，先上省流版结论：

睡眠剥夺等于物理删除记忆：长期记忆的巩固主要发生在慢波睡眠和 REM 睡眠中。凌晨 5:30 强行唤醒，直接打断了大脑的记忆重组过程，盲目延长在校时间只会带来极高的遗忘率。
「快乐教育」是一个被恶意污名化的伪概念：指责者口中的「快乐教育」根本不存在。真正符合认知科学的路径是自由学习^[2]。违背生理规律的强制剥夺只会产生毒性记忆^[3]，最终让学生陷入习得性无助^[4]，丧失学习内驱力^[5]。而最高效的陈述性知识学习就是最快乐的学习。

睡眠的神经科学：凌晨 5:30 起床是对大脑的摧残

在青春期，青少年的生物钟会自然发生后移，更严重的会被称为睡眠相位后移综合征^[6]（DSPS）。对于一个高中生来说，早上 5:30 的闹钟，在生物学上等同于让一个 50 岁的成年人凌晨 3:30 起床。

此外，睡眠不足会直接导致你前一天的努力化为泡影。大脑在夜间需要通过闭环的神经回放来巩固记忆。如果你强行剥夺了这一个小时的睡眠，你的大脑就无法把在短期记忆整合入长期记忆。你多熬出的那一个小时学习时间，带来的只有认知负荷超载。

跟自然规律对着干，从来都没有好下场。

以下内容摘自 @Thoughts Memo 汉化组的译文《将教育与青少年的生物钟同步：「让青少年多睡会儿，推迟上学时间」》

昼夜节律系统、睡眠和青少年：学习、情绪与健康

像地球上的大多数生物一样，我们的生理和行为也呈现出 24 小时的节律。人体的每个细胞都具有细胞振荡器，这些振荡器需要彼此同步运行，并与外界的昼夜环境保持一致。这一过程是通过位于下丘脑视交叉上核（SCN）的主昼夜节律（24 小时）起搏器实现的。SCN 通过眼内的特化光感受器与环境光暗周期同步（Foster 和 Hankins 2007；Lockley 和 Foster 2012）。随后，SCN 协调整个昼夜节律网络的活动，以及包括警觉性与表现、激素分泌、核心体温、新陈代谢以及肺、肝、心等重要器官的不同节律在内的大多数 24 小时行为、代谢和生理节律（Hilton et al. 2001; Hastings、Reddy 和 Maywood 2003）。如果这种同步机制的任何环节被干扰，不同组织中的生物钟可能失去协调，导致 24 小时振荡网络内部出现不一致的状态（Foster et al. 2013）。

昼夜睡眠周期是最为熟悉的 24 小时周期，但它不仅仅依赖于 SCN 。实际上，睡眠是一个高度复杂的状态，源于多个大脑区域、神经递质通路和激素的相互作用，这些因素都不是仅仅与睡眠生成相关的。正因为如此，睡眠极易受到干扰。因此，大脑在发育过程中的一些微小变化，可能对睡眠产生重大影响，而异常的睡眠又会反过来影响健康。这正是当教育开始时间过早导致系统性、慢性且无法恢复的睡眠缺失时，睡眠异常产生的后果。

睡眠-清醒周期源于 SCN 起搏器所产生的昼夜节律（警觉性）与一种稳态睡眠周期之间的相互作用。后者随着清醒时间的增加而增加入睡的压力（困倦感），并随着睡眠时间的增加而消解这种压力。这些过程相互对立，旨在保持白天的持续清醒和夜间的持续睡眠。

它们的相互作用还产生了一个「保持清醒区」（WMZ），矛盾的是，这个区间通常出现在典型入睡时间之前的几个小时（Dijk 和 Czeisler 1995; Shekleton et al. 2013）。这是青少年睡眠困难的一个主要因素。傍晚时分，稳态驱动的困倦感通常过低，无法完全抵消昼夜节律驱动的警觉性，从而导致数小时内很难入睡。在青春期，昼夜节律时钟的时间推移较晚，导致睡眠开始的时相推迟，进而将保持清醒区推迟到更晚的时段。稳态睡眠调节也发生了变化，睡眠压力的积累变得更慢，这意味着需要更长的时间才能达到启动睡眠所需的临界阈值，这也使得入睡时间推迟。保持清醒区就是为什么我们（包括青少年）不能简单选择比平时更早入睡的原因，因为大脑在这个时间仍然在促进清醒。

这些生物学变化，特别是睡眠倾向的时间变化，是与教育开始时间冲突的根本原因；大脑不允许学生早睡，但教育时刻表仍要求青少年在其昼夜节律周期中过早醒来（或被唤醒），这系统性地限制了可用的睡眠时间，导致严重且长期的睡眠缺失。反过来，睡眠持续时间不足和长期睡眠剥夺等睡眠紊乱已被证实会对认知、情绪和身体健康的造成负面影响（Lockley et al. 2004）。最近的一项综述引用了多项研究，表明睡眠受限与免疫反应受损、新陈代谢紊乱、糖尿病、高血压、焦虑、抑郁和肥胖相关（Luyster et al. 2012）。这项综述的总体结论是，睡眠少于 6 小时可能是有害的。最近的一项精巧实验支持了这一结论，该实验显示每晚睡眠时间为 5.7 小时（与对照组的 8.5 小时相比）的一周时间对身体的负面影响，研究发现有 711 个基因因睡眠不足而上调或下调，并且昼夜节律基因表达的显著变化（Möller-Levet et al. 2013）。

青少年同样表现出睡眠持续时间不足和长期睡眠剥夺的影响。多项青少年研究发现，睡眠剥夺会导致沟通不畅、注意力下降、认知表现差、意外入睡、运动表现下降、冒险行为增加以及情绪模式变化，尤其是抑郁症（Millman 2005; Knutson et al. 2007; Hagenauer et al. 2009; Foster et al. 2013; de Souza 和 Hidalgo 2014)。这一现象并不令人惊讶，因为年龄较大的青少年在自由日和工作日之间的睡眠时长差异最大，而且他们的睡眠需求也比成年人更长。其他研究表明，睡眠持续时间不足对青少年的学习和学业表现产生广泛的负面影响（Curcio, Ferrara 和 De Gennaro 2006），包括成绩差和长期记忆编码差（Carskadon 2011）。这些研究反映了成人研究的总结，见表 1（Foster 和 Wulff 2005; Wulff et al. 2011）。

表 1. 严重睡眠中断的影响

认知反应	情绪反应	躯体反应
减少：	增加：	风险增加：
注意力	运动技能失误	代谢异常
表现	兴奋剂使用	II 型糖尿病
注意力	镇静剂使用	体重增加
记忆编码	喝酒/酗酒	心血管疾病
记忆巩固	疲劳	下丘脑-垂体-肾上腺（HPA）轴紊乱
多任务处理	易怒	免疫力下降
决策	情绪波动	嗜睡
创造力	焦虑	微睡眠
生产力	情绪低落	意外睡眠
社会化	沮丧/愤怒	身体疼痛和寒冷的感觉
沟通	冲动	高血压
同情心

还有其他研究表明，青少年睡眠持续时间不足对警觉性和表现的影响是显著的。例如，青少年驾驶员在早晨的车祸率达到高峰（Czeisler 2009），而这种现象在年长的驾驶员中并不常见，这说明在昼夜节律不利阶段醒来且缺乏足够睡眠的功能性影响。当肯塔基州的一个学区将上学时间推迟一小时后，学生报告称平均多睡了一小时，同时并未因此而晚睡。此举对涉及 17-18 岁驾驶员的校日交通事故率产生了显著影响：虽然全州范围内车祸率上升了 7.8%，但该学区的车祸率却下降了 16.5%（Danner 和 Phillips 2008）。类似的结果也在弗吉尼亚州得到验证（Vorona et al. 2011）。

从更广的角度来看，在现代社会，睡眠不足和睡眠剥夺已经成了「隐形流行病」。一项最近关于工作/教育时间表与生物时间差异的综述量化了不同年龄段的睡眠赤字程度（Foster et al. 2013）。在一项国际调查中（样本量约为 150,000），基于问卷的昼型-夜型评估显示，整个青春期夜型倾向迅速上升，这一趋势在女孩中出现得更早，与青春期的提前开始相吻合。这些变化在成年早期逐渐逆转（平均从 20.2 岁开始），届时昼型倾向再次增强，起床时间也开始提前（Roenneberg et al. 2004）。

从青春期开始，青少年的睡眠时长出现了显著下降（见图 1）。此前的一些研究报告通过将学期内整周的睡眠时长平均化，未区分工作日和周末，或报告夏季睡眠情况，掩盖了这一问题的严重性。有趣的是，当不再受教育活动干扰时，青少年工作日的睡眠时间可以与周末的睡眠时间一致（Hansen et al. 2005；Jenni, Achermann 和 Carskadon 2005）。这一睡眠时长下降的原因可以从教育/工作日与自由日的睡眠差异中看出。在青春期后期，这一差异在教育日达到了将近 3 个小时（见图 1）。这种规模的睡眠损失无法通过周末补回，正如简单的算术所示：每周工作日每天失去 3 小时的睡眠，意味着周末每晚需要额外补睡超过 15 小时，但这在生理上和现实中都是不可能实现的。

对睡眠和昼夜节律调节的理解不断进步，以及为了满足教育时间的要求而每天缺少两到三个小时睡眠所带来的负面后果，使我们对青少年行为有了新的认识。我们现在知道，促使青少年早晨赖床、晚上熬夜的是他们的生物钟，而不是懒惰。幸运的是，由教育时间导致的睡眠持续时间不足和睡眠剥夺问题可以通过将青少年的教育时间与其生物钟同步来解决。

其他教育考量

尽管解决早晨上课时间过早及由此导致的睡眠时长不足问题是使教育时间与青少年生物钟同步的关键，但从教育角度来看，还有其他相关问题需要关注。这里简要讨论其中四个方面：记忆与睡眠的关系、一天中不同时段的差异、个体差异与睡眠类型（早睡/晚睡），以及睡眠教育。

睡眠在长期记忆巩固中发挥着关键作用（Stickgold 2005；Diekelmann 和 Born 2010），而打断睡眠会妨碍长期记忆的形成（Stickgold, James 和 Hobson 2000）。在一项精巧的研究中，Walker 和 Stickgold（2010）证明了经过睡眠后，受试者所学的视觉辨别技能得到了巩固，而相同时长的清醒状态则没有这种效果。令人惊讶的是，他们还发现，睡眠后技能的表现实际上得到了提高，而没有任何额外的指导，而非睡眠组的表现则没有变化，这一现象也在其他物种中得到了验证（Menzel et al. 2001）。睡眠还能够促使问题的洞察（Wagner et al. 2004）。有趣的是，当一项记忆正在编码时，表明其在未来考试中使用的重要性似乎增加了该记忆在睡眠中被巩固的可能性（Wilhelm et al. 2011）。我们对睡眠中具体记忆功能和神经生物学过程的理解不断加深，但仍有许多问题需要进一步研究（Chauvette, Seigneur 和 Timofeev 2012；Grosmark et al. 2012）。

个体在睡眠/清醒模式上的差异是由生物学因素决定的。例如，较晚的昼夜节律周期或较慢的睡眠压力积累与消退，或两者共同作用，可能导致更偏向夜型行为（夜型倾向）。而较早的昼夜节律阶段和较快的睡眠压力积累与消退则可能导致更偏向晨型周期（晨型倾向）。这些昼型特征在成人中相对稳定，并受到遗传倾向和性别的影响（Toh et al. 2001；Roenneberg et al. 2004, 2007），女性由于昼夜节律周期较短，倾向于成为「晨型」类型（Duffy et al. 2011）。在青春期，学生自然会更晚醒来，并且在一天中的后期保持较高警觉性，作为一个群体，他们更有可能成为夜型倾向的个体。昼夜节律效应意味着注意力会随着一天中的时间发生变化，较晚的时间通常与夜型倾向和更好的注意力表现相关。Matchock 和 Mordkoff（2009）发现，在青春期后期，所有昼型的注意力得分在 08:00 时显著较低，而在 12:00、16:00 和 20:00 时则是两倍于早晨的得分。同样，青少年在一天晚些时候的测试表现更好（Hansen et al. 2005；Hahn et al. 2007；Carrell, Maghakian 和 West 2011）。这些效应对于教育工作者来说，容易在学校中进行探索。例如，在一项将上课时间推迟到 10:00 的研究中，13-14 岁的学生在 10:00 和 14:00 分别进行了单词配对测试，结果在较晚的测试时段表现更好（Kelley 和 Lockley 2013）（见图 2）。

图 2. 一天中不同时间测试得分百分比的变化。在 10:00 和 14:00，研究对象（n = 120）进行了单词配对测试。测试得分在 14:00 显著更高。T-test 重复测量，p < .01；效应量 Cohen's d = 0.32。所有数据均为平均值 ± 标准误差 (SEM)。

许多研究报告称，在衡量注意力、执行功能和记忆力等一系列认知任务的表现中，一天中的时间效应相似 (Goldstein et al., 2007; Schmidt et al., 2009; Haraszti et al., [2014])。Hahn et al. (2007) 的研究甚至表明，这些时间效应在青少年早期转变阶段就已经很重要。综合这些研究结果，调整教育任务的时间安排以适应青少年的睡眠/清醒模式和昼夜节律类型可能会带来显著的益处。这种调整不仅有助于优化认知功能的发挥，还可能促进学术表现的提升。

无论是基于生物因素还是社会因素定义的群体，针对特定人群的研究证据往往较少成为研究主题。在早期的教育体系中，处于最不利地位的群体是那些属于最晚起的人，因为他们的生物时间与教育时间存在最大的时间错位。这在研究中有所体现，青春期初期的小幅度表现差异，以及青春期结束时随着差距增大而出现的更大差异。西班牙的一项研究显示，12 至 16 岁的学生中，晚睡型学生的表现明显差于其他类型（Escribano et al. 2012）。在德国，与早起型学生相比，高中晚起型学生更多地使用与管理睡眠相关的兴奋剂和抑制剂，如咖啡、可乐、酒精和尼古丁（Preckel et al. 2013）。在巴登-符腾堡州，一项研究发现，晚起型学生的德国大学入学成绩（Abitur 分数）显著低于早起型学生（Randler 和 Frech 2006）。其他研究表明，晚起型青少年可能面临更高的健康和心理健康问题风险（Giannotti et al.2002Citation；Hsu et al. 2012）。这些发现与其他关于青少年群体的研究相一致，这些研究表明较短睡眠时长对神经行为表现的影响非常迅速（Möller-Levet et al. 2013），以及青少年期间心理健康问题临床诊断的高发病率（Wulff et al. 2011）。例如，在昼夜节律睡眠障碍（ICSD-II）中，延迟睡眠相型的发病率在美国青少年和年轻成年人（15 至 24 岁）中估计为 7% 至 16%，即超过 290 万例（Kelley, P. , and S. W. Lockley . 2013. “Synchronizing Education to Healthy Adolescent Brain Development: Sleep and Circadian Rhythms.” Paper presented at the annual meeting of the American Educational Research Association, San Francisco, April 27.）。

向学生、家庭和教师提供睡眠管理教育，以解决可能导致睡眠延迟或减少的社会因素，可以为改善青少年睡眠做出额外贡献。重要的是，睡眠教育应包含明确证据，表明家庭在睡眠调节方面的做法有助于减轻睡眠不足在抑郁和自杀想法中的作用（Gangwisch et al. 2010）。在短期内，提供关于全天候接触发光屏幕技术的信息至关重要，特别是富含蓝光波长的光线，它会提高警觉性并延迟睡眠开始，直到科技公司解决这一问题（Rüger et al. 2012）。良好的睡眠卫生习惯，以及对文化、社会和性别差异的生动认识，尤其是晚起晚睡模式的形成和影响，也是睡眠教育的重要组成部分。

拆穿「快乐教育」的污名化把戏

某些人非常喜欢用「快乐教育」这个词来恐吓家长，仿佛只要孩子不痛苦，就学不到东西。

这种「吃苦崇拜」是极其荒谬的。科学的学习方法从来都不以痛苦为指标。那些动辄叫嚣「学习必须痛苦」的人，只是在为学校低效、死板、反人类的管理方式洗地。

家长和学生要求的仅仅是「符合生理规律的健康作息」，这与「放纵不学」毫无关系。强行把这两者画等号，无非是某些教育既得利益者（或被深度规训的斯德哥尔摩综合征患者^[7]）试图维持其权力控制的诡辩。

以下内容摘自 @Thoughts Memo 汉化组的译文《学习的乐趣》

1 教育的主要问题

阻碍教育的主要是一种传统的信念 —— 学习总是令人不快，如要学得更多，学习者应忍受^[8]这种不快。

太多教育工作者认为，学习是一种和工作一样，不得不做的苦差事。然而恰恰相反，本章中我要说明：

「好的学习」是天然令人快乐的（Good learning is inherently pleasurable），而且没有快乐，就不是好的学习。

「学习令人不快」这一谬误太盛行了，以至一些优秀的老师也认同痛苦是学习的一部分。

在本章中，我将指出学习的快乐是人类的本能，以及我们如何系统性地摧毁这一进化的馈赠^[9]，并最终牺牲人类的健康、学习、创造力和未来。

教育的主要问题也是社会的主要问题。如果学习的乐趣被破坏，生活的乐趣也就被大大地摧残。我们建立的教育系统，让数百万人过上了不幸福的一生。

你很可能对我的话持怀疑态度，因为「学习令人不快」这一谬误正是学校教育^[10]的毒副作用。因此，本章旨在说服你。而要破除这一谬误，就有必要了解新知识在大脑中编码的简单机制。

2 学习内驱力和熵

熵的概念可以帮助你理解，为什么大多数孩子在学校里学不到什么东西。

你可能还记得物理课上曾讲过熵是无序程度的度量（译者：不记得，是贵乎教我的），且热力学第二定律表明，孤立系统的熵永远不会减少。这是条迷人且令人终生难忘的物理定律。它具有广泛的适用性^[11]。

信息论中有一个熵的姊妹概念，叫做香农熵（Shannon entropy，信息熵）。它可以理解为一个信源所发送「信息」的平均值。例如，有一个信道不断地发送相同的字母（比如，一串 A：「AAAAAA……」），它就是完全可预测的，因此统计下来其携带的信息熵为零。监听这样一个信道无法让你学到任何东西。

克劳德·香农（Claude Shannon）于 1948 年提出了信息熵的概念。不久之后，科学家们开始对「一个信道的熵，是否可能强烈影响大脑对其价值的感知」做出假设。1957 年，迈尔（Leonard B.Meyer）推测音乐的熵决定了人们对其美的感知。他的结论是，较高的熵可能会导致主观上的紧张，这与富含意义的音乐片段相关（meaningful musical moments）。

迈尔后来改进了他的假说，以更好地建立对音乐一般信息感知的理解。但「音乐」既是信息，也不只是「信息」。这可以从一首歌因其娱乐性和趣味性而被回放数次的现象中看出，但「书籍」则很少出现这种反复多次阅读的情况。

音乐是一种普世信息。如果让你用旋钮调出一个无线电频道，你会很快避开嘈杂的只有静电噪声的频道，也不会对零熵的寂静频道感到太兴奋。然而，大多数人会对有规律的鼓点做出积极回应。只要不是在碎玻璃上敲击（我们天生不喜欢这个），我们就会认为，一个鼓点规律的广播频道比一个安静的频道更有趣。自然，这种有趣只会持续一段时间，直到鼓声本身变得乏味 —— 因为你已对其了如指掌。

如今，我们终于可以测试大脑对信息熵的响应了。神经成像显示，海马体前部对视觉流的熵有反应，腹侧纹状体上也有类似的发现。因此现在，我们可以肯定大脑对信息熵有响应。在快速观察环境以寻找学习机会时，熵感知器非常重要。这是奖励的前奏，而奖励是学习内驱力^[12]的基础。

3 信息检索中的前置知识

我们需要区分「信息」与「意义」，熵无法很好地度量后者。要度量意义，既需要度量信道，还必须考虑大脑本身的参与。脑内的前置知识在学习中至关重要。想象一下，你在收音机上寻找有趣的频道时，找到了一个新闻频道。如果该频道是泰语的，而不会说泰语的你肯定更偏好母语版的新闻。在信息层面上，两种语言的新闻信息熵可能是一样的，但前置知识会让你偏向母语频道。对你来说，泰语频道传递的只是声音流，而母语频道传递的是概念^[13]流。如果不了解信息接收者的知识储备，信息熵对我们而言就没有太多意义。我们无法确定信噪比。

每个听众都会有他或她自己特定的信息熵水平。对于大多数音乐爱好者来说，迪斯科或电子舞曲的规则节拍会比单一的鼓点节拍更有趣。这种类型的音乐平均信息量更高。更老练的听众会乐于接受多一点的切分音。然而，需要一定程度的预先学习才能听懂切分音。那些音乐知识较少的人可能会难以理解更复杂的节奏。如果节拍中的信息太多，或许就不再能够让人随着音乐跳舞。普通人可能很难体会 Wynton Marsalis 的天才之处。货架最上面摆放的爵士乐仅为一小部分饱受音乐熏陶的听众保留。对大多数人来说，随着复杂度的增加，音乐慢慢坍塌为电台的静电噪音。

4 大脑中的熵探测器

大脑不能有效地检测到达视网膜或鼓膜的信号的熵。就像显示器的像素一样，视网膜细胞并不知道它们显示的是什么。如果检测器，如海马体，要对熵作出响应，它必须对来自内嗅皮层的输入（即对海马体本身的输入）进行操作。这些输入将在高度处理之后呈现出信号。它可能会表示一个概念，而不是像素。从感官输入的高熵信号将在神经选择、补完和泛化^[14]过程的早期舍弃大部分噪声成分。舍弃多少信息由信噪比决定。噪音越大，舍弃越多。我们越聪明，这个过程就越有选择性，在该阶段舍弃的信息就越多。这很好。我们变得对细节视而不见。模式识别的作用类似于确定性函数，根据定义，它会导致熵下降。复杂的模式可能会变成简单的概念。这些概念将为检测器（例如海马体）提供实际的输入。

请注意，在实验中，为了证明海马对信号的熵的响应而制作的视觉流是高度符号化^[13]的。因此，这样的流在处理过程中被舍弃的信息要少得多。这种经过高度简化和概念化^[14]的消息被海马体扫描为意外性信息，并为整个学习内驱力^[12]系统提供指导。这就是为什么在这种情况下，海马体似乎对输入的熵有响应。

上述推理解释了为什么低熵和高熵的感官信号都可能不吸引人。高熵信号经过一定的处理，可能会失去全部噪声，成为低熵输入传递到海马体。于是，在感官信号方面，我们会观察到一种「最优熵」水平的幻觉。我们需要一个新的概念，学习熵，来帮助我们准确定义信号的吸引力。学习熵需要考虑信息在激活大脑的奖励中心之前所经历的高度加工。学习熵会在后文讨论。

5 处理信息的速度

研究者往往低估了大脑在扫描感官信息时的信息处理速度这一因素。

每一首音乐都有一个可接受的回放速度范围，在此范围内人们可以欣赏到音乐之美。加速播放可能会令人烦躁，音乐可能会变得难以解码，因为这超出了我们的处理能力。而慢速播放可能会使音乐很快失去吸引力。演讲或课堂讲课的情况也是相同的。相同的信息和相同的熵水平，对于不同人的信号吸引力可能差异巨大。总有一个最优传输速度，该速度取决于推动学习内驱力^[12]的所有其他因素，包括前置知识。因此，传输速度是高度个性化的。

我喜欢以 1.4 倍速听讲座。我以 1.3 倍速听较难懂的片段。但是，我从来不加速播放 Fareed Zakaria，而是细细品味这个节目的每一个细节。在课堂中听课的学生没有加速或减速按钮。即使是暂停按钮，就算有也很难按下，因为这可能会惹恼其他学生。

在学校，教师传授知识的速度往往超出学生的处理能力。这使得学生几乎什么也学不到，精神高度紧张。在高速列车的窗口，无暇欣赏风景^[15]。在麻省理工学院，他们称之为「用消防水管喝水」。

6 概率 vs. 知识

小概率事件携带的信息更多。平均信息决定熵。信息接收者的前置知识储备会影响对信道的信息熵的感知。

如果你碰巧在听电台新闻时，听到：「Janet Jackson 生了一个孩子」，你的关注程度将取决于事件发生的概率。如果你不知道 Janet Jackson 是谁，那么这是一个很有可能发生的事件。如果大约每天都有 35 万名女性生孩子，那这就算不上新闻，也不是什么新鲜或有趣的事情。在战争中，第一名士兵的死亡是新闻，但当死亡人数增加到数千人时，年轻的生命就变成了一个统计数字。

如果你碰巧认识 Janet Jackson 或喜欢她的音乐，那么分娩的概率就会急剧下降到「一生只有一次」的水平（对于 Janet 来说）。这会让你产生兴趣。然而，如果你回忆起 Janet 是某出古代情景喜剧中的一位美少女，那么她的分娩可能会被归到「不可能！」的类别。如果你意识到 Janet 已经 50 岁了，而且你知道更年期的概念，你可能会立马特别好奇她的情况。你的前置知识决定了你对这一信息的反应。信道本身没有最优熵水平，只有适合特定大脑的最优熵水平。此时，你可能已经明白，我们需要引入一个新的派生概念，我们在后文将之称为学习熵。学习熵定义了给定信道对给定大脑的吸引力。（注：学术共识更广泛的「语义信息论」里的术语是「模型熵」和「平均语义熵」，但它们与这里的「学习熵」的区别在于它们没有关心「吸引力」的部分）

如果你喜欢 Janet 式的八卦，那么充斥着类似八卦的频道会为你提供合适的意外水平。两者达到了「学习熵匹配」。如果你缺乏必要知识或者优先级不同，你就会失去兴趣。你的学习优先级还将决定你在特定领域的知识水平，以及你对任何特定信道及其信息熵的反应。

7 可预测性 vs. 意外性

概率和复杂性不是信息感知的唯二组成部分。我们似乎在可预测性和意外性之间寻找平衡点。我喜欢乡村爵士乐，在这类音乐中，音符切分得恰到好处的低音旋律线通常很容易预测，这让听众很轻松就能随着节奏摇摆。然而，乡村爵士乐如果不带点意外也就没什么意思了。复杂的爵士乐即兴演奏通过意外之处刺激负责检测意外的神经系统。此外，经过几十年的学习，我的大脑内部已经有了一个可产生响应的完整的信号数据库。或许我可以认出某个和声歌手的声音是我喜欢的。我的大脑已经做好了欣赏爵士乐的准备。

我喜欢 Ken Robinson 关于创造力的课程。在某种程度上，它们是高度可预测的。我完全同意 Robinson 的观点，所以你可以说 Robinson 助长了我的确认偏误。这很令人愉快。当人们同意我们的观点时，我们喜欢说「英雄所见略同」。但如果 Robinson 只是不断重复关于「学校如何扼杀创造力」的陈词滥调，他将失去吸引力。熵可以解释为意外的平均期望。Robinson 的讲授带来了很多令人愉快的意外。他可能会以与众不同、别出心裁的创造性方式描述同样的模型。因此，大脑接收新信息，产生泛化，并确认现有模型。在新的上下文中形成的泛化增加了知识的连贯性^[16]。这是对已知模型的信息补充，这可以使人非常愉快。

Robinson 的课程在可预测性和意外性之间找到了很好的平衡。

最令人愉快的信道将持续提供意外，证实现有的模型，并为之增加新的语义枝条，以便引入新的知识。意外地破坏现有模型可能一开始令人不愉快，但可能会导向令人非常愉快的思维进化。

打个比方，你可以把这想象成信道在修整你的知识树，并添加新的分支，就像一个陶工在他完美塑造的作品中添加新的黏土层^[17]。

8 探测信息量

人类的学习内驱力^[12]以探测信息量为基础。我们早就知道这一点了。人类学习和机器学习的所有模型都以不同的名称提及这个概念。Piaget 写道，在信息量的冲击下，认知图式陷入了失衡。Jeff Hawkins 在他的新皮质模型中谈到，学习和智力以奖励预测误差为基础。我喜欢讨论模型^[18]的细化（当新信息符合模型时）、矛盾（当新信息的引入导致模型需要更正时）和泛化^[14]（当遗忘^[19]和记忆优化^[20]从模型中雕刻出新的性质时）。

为了获得学习的奖励，新的意外的信息需要符合已有的知识（模型、模式、预测等）。为了获得奖励，脑神经需要处理输入的信息，并将之与已存于大脑中的信息进行比较。大脑中处理输入信息的主要处理器之一是海马体。它是大脑的信息交换板，能够将输入的信息与已有知识进行比较。

视觉信息流中熵的高低不一定是信道令人愉悦程度的可靠指标。所有流向海马体的信息都经过了高度处理。代表美丽海滩的像素流将转化为一系列的形状和纹理。紧接着，这些转化结果将成为棕榈树、沙滩和海洋的模型。这种高度压缩的简单信息将决定对信息输入的原始响应。

审视环境中的信息相当于搜寻食物的气味。气味是诱人的，但是只有真正的进食是确切的奖励。这解释了为什么视觉扫描中的熵本身不必具备奖励性，它只需要导向奖励。正如前文所述，海马体前部对熵作出响应，然而实验设计确保了其输入熵源于简单形状的组合，这在输入处理过程中不会丢失太多的信息。相比于信号熵，我们更应该关注信息比较器（比如海马体）的输入熵。重要的不是视网膜上的像素，而是将输入比较器的棕榈树的形状。对于比较器来说，视觉输入里由灰度或者静电噪音导致的高熵模式，与白色或静音这种低熵模式并无不同。它们在输入给海马体时都将具有相同的熵值：零。这就是为什么我要使用学习熵这一术语来精确表示信道的吸引力。

对信息熵作出反应的海马体前部因 Halle Berry 神经元的发现而闻名（参见更多）。通过将电极植入同意的癫痫患者体内，研究人员能够精确定位到在不同环境下对 Halle Berry 的图像做出一致反应的单个神经元。该神经元也会对 Halle Berry 的名字做出反应。同时，海马体后部对 Jennifer Aniston 的反应可能不太一致（可能暗示了前一层神经处理的痕迹）。

我们大多数人都不知道 Halle Berry 的气味，她的气味可能不够独特，不足以激活海马体中的 Halle Berry 神经元，然而，即使是气味信号也可以通过嗅球、嗅结节、梨状皮质和内嗅皮质中的少数几个突触快速到达那里（见图）。然而，如果一个人能听到 Halle 的声音，它可能会与嗅结节中的声音信号相遇，促进识别，最终激活海马体或更后方的新皮质中的 Halle 神经元。

图：嗅觉系统解剖。气味信号可以通过嗅球、嗅结节、梨状皮质和内嗅皮质中的少数几个突触快速到达海马体。（来源：维基百科）

这是不是意味着 Halle 永远存在于病人的海马体里？由于海马体与新记忆的形成有关，我们可能更倾向于认为 Halle 出现在海马体神经元中是识别的结果。她在病人心中的永久位置很可能位于大脑新皮质下游更远的地方。我们现在知道，在巩固记忆的过程中，知识印记从海马体转移到新皮质。我们也非常确定这个过程发生在睡眠中^[20]。我们正是应该在大脑新皮质中，寻找代表 Halle 或代表病人祖母的概念神经元。最后一种可能性产生了一种假想类型的神经元，被称为祖母细胞。

在猴子身上，研究人员可以辨认出视觉皮层中对面孔做出反应的祖母细胞。我们可能会发现，与 Halle 的图像接触时，那里的细胞会更持续地兴奋起来。然而，Halle 的概念可能仍然存于其他神经元中，在视觉皮层的细胞注意到 Halle 之后，才会与其他祖母细胞一起被激活。

另一种激活途径可能来自于在新闻中听到 Halle 的名字。内嗅皮层和海马体会协调整个识别过程，并最终点亮存在于新皮质的某处的 Halle 神经元。

为了使富含信息的信号产生奖励，必须能够检测到输入中的小概率事件，并通过关联将其编码为皮层中的新知识。在海马体前部对熵作出反应的地方，拓展双边丘脑-皮层网络的活动将受到惊讶因子的调节。我们将在那里寻找学习的乐趣之源。根据消息的类型不同，这个过程还可能涉及其他比较中心。人们还发现，杏仁体在检测到新颖的视觉信号时也可能会产生奖励。对奖励性的视觉刺激做出反应的杏仁体神经元同样也可能对新颖的视觉刺激做出反应。Rolls 推测这可能会通过杏仁体实现新颖性的奖励。

我们知道海马体与伏隔核（大脑的愉快中枢）直接相连。此连接可能用于两种情况：

1、对快乐的期待和

2、最后的奖励。

检测到高学习熵信号后，期待随之而来，并导致对高价值信息的主动追求。海马体检测到信息的同时，也将关联的学习信息发送到新大脑皮层，并把奖励信号发送到愉快中枢。那就是学习新东西的时刻！

9 「哇！」因子

1977 年夏天，SETI 研究者搜寻外星智慧生物时，发现了来自射手座的反常无线电信号。宇宙空间中，平时只有乏味的低水平噪音，这样的信号令人难以置信。低概率标志着高度惊讶。天文学家 Jerry Ehman 在打印出来的信号上圈出 6 个字母，并标上了「哇！」。（注：SETI 即 Search for ExtraTerrestrial Intelligence 的缩写。）

图：原始计算机打印输出的彩色扫描副本，拍摄于 1977 年哇！信号到来的几年之后。（来源：维基百科）

「哇！」是大脑对意外发现的反应。这一刻令人非常愉快。学习内驱力^[12]的唯一目的就是寻找环境中的「哇！」因子。它们是最有价值的知识金矿，它们补充了目前已知的：当前的现实模型。渐进阅读^[21]的乐趣来自于密集地涌入学生大脑的「哇！」的力量。

至此，我们历数了熵、意外（信息量）、可预测性和现有知识对学习的影响。在这个案例中，仅凭信号的概率并不能完全解释其威力，这要靠作为支撑的阐释（见：知识估值网络）。在做标记的那一刻，Ehman 就已感觉到其影响的深远。这是迄今为止最有力的证据，证明了人类智能以外的其他智能的存在。如果同样的信号代表了在海洋中探测到沙丁鱼，就不会有「哇！」的感叹，即使在北极也不行。

信道的可靠性很重要。如果错误率较高，学习内驱力可能会被削弱。当彭齐亚斯和威尔逊在 1964 年发现宇宙微波背景辐射时，没有人惊叹。困惑的研究人员继续从他们的无线电天线上清除鸽子粪便。在解释这种神秘的噪音时，人们会优先想到鸽子粪便。1978 年，彭齐亚斯和威尔逊因他们的发现获得了诺贝尔奖。

当科学家有新发现时，他可能会大叫「尤里卡！」，向空中挥拳。他大脑某处的神经网络产生了一个泛化^[14]，由此发出奖励信号。经过进一步传播，这会让一个老人像个孩子一样在实验室里跳来跳去。

同样的事情也会发生在小时候。在空荡荡的房间里，蹒跚学步的孩子会扫视环境，寻找五颜六色的物体、新玩具等低概率的成分。当蹒跚学步的孩子尝试把勺子丢下桌子时，她就像一个小科学家。不过，当大脑产生「所有掉落的勺子都会发出噪音」的泛化时，她也会得到奖励。她可能会以与快乐的科学家完全相同的方式庆祝，尽管年龄相差甚远。灿烂的笑容是第一个清晰的信号。

同样的快乐在由学习内驱力控制的所有形式的学习中都会发生，虽然程度相对低一些。不论我们了解的是关于一位名人还是一块岩石的化学成分，全都没有差别。事情有趣，是因为它们全都通过学习内驱力的机制奖励大脑。

创造的过程也会产生奖励。一个被认为有用的联想很有价值。能够解决难题的联想会更有意义。显然，奖励是有分级的。系统可以量化信息、关联或解决方案的概率：概率越低，奖励越高。

10 知识估值网络

10.1 知识估值

大脑处理所有粒度的知识碎片时，都会立即评估它们的相关性、连贯性^[16]和价值。我们立即知道信息是否可理解，是否有用^[11]。如果信息不一致、不连贯或不相关，我们通常也会立即察觉。

不同寻常、令人惊讶的知识有很高的价值，但是，从大脑的角度来看，概率并不是价值的最佳反映。有些低概率事件并不重要（例如，遥远行星系统中的小行星撞击），而另一些概率很高的事件则会改变一个人生活（例如，「你愿意嫁给我吗？」的答案）。

知识估值^[22]主要依赖知识对于实现个人目标的适用性^[11]。

10.2 情绪脑和理性脑

知识估值网络是基于知识的情绪估值与理性估值的估值系统。在文献中，它又被广泛地称为神经估值电路（neural valuation circuitry），它不一定只用于知识估值。

在估值网络中，情绪估值会把信息与负责饥饿、口渴、性欲等的原始大脑中枢的奖励联系起来。理性估值则以知识为基础。如何回答「最近的快餐店在哪里？」，就是一例纯粹的情绪估值。基于知识的估值会更加复杂，高度网络化，即依赖于次级估值网络。要回答「哪本书最适合我的考试？」，就得基于个人目标来估值，这些目标包括：通过考试进而获得学位进而影响就业前景，以及人生目标。情绪估值和理性估值在生理结构上是相互隔离的。情绪估值来自被类比为三重脑的较原始部分：爬行动物和古哺乳动物的结构。例如，特定刺激被丘脑处理后，可能会向杏仁体发送单独的信号以进行情绪估值，并向新皮质发送信号以进行理性估值。情绪脑在进化发生学上更古老。个性和教育决定了理性估值能否控制或推翻情绪估值。

10.3 快速思考中的决策树

知识估值网络是确定单个知识价值的记忆连接网络。如果将学习视为一种任务，那么估值网络将确定感知上的任务价值（参见：问题估值网络）。

用计算术语来说，知识估值网络可以比作决策树。目标和情绪决定了根节点的核心价值。知识之间的语义连接可以看作从目标到细节的细微价值传递。精心选择并巩固的知识所构成的组织良好的语义网络^[23]几毫秒之间就能做出专业决策。这就是卡尼曼（译注：《思考：快与慢》作者）所说的自动快速思考（如果对需要放慢速度解决的难题感兴趣，请参阅《如何解决任何问题？^[24]》）。作为决策或解决问题之基础的这种处理过程，也参与了知识估值。像许多专业决策一样，估值十分迅速，且几乎不需要刻意关注。简而言之，我们有时会在不完全能够解释原因的情况下确信一些事情。这个过程几乎不受我们自己控制，更不受学校老师的控制。为了高效学习，估值必须很高。

图：http://Xefer.com 是帮助理解作为网络的知识的工具。它依赖于维基百科页面之间的语义链接。

10.4 教育中的估值网络

大脑在多年的学习过程中建立了估值网络。通过睡眠中的优化^[20]和遗忘^[19]，估值网络经过打磨、抛光，为高效运行做好了准备。这使得估值捷径易于穿梭。正在挑选课本的学生，不再从整个人生的情境去看待这场考试。他更可能建立了如下捷径：「接下来的三个月，我只想通过地理考试」。

知识估值网络往往高度个人化，因人而异。例如，对于理性和感性的平衡点会有不同，不同目标之间的权衡也会有不同。罪犯会形成异于常人的估值网络，而一个立志为人类谋福祉的研究员，自然也有别致的估值网络。

估值网络的发展和个人秉性、人生履历、成长环境息息相关。童年的创伤或人格特征，如易冲动，更有可能培植出罪犯心态。童年的一些创伤事件可能会促进一意痴迷的估值网络的发展（参见：错误向量）。环境和可用的知识将决定激情、兴趣、目标和次级估值网络（参见：概念化^[14]）。

理想中，发展出健康的估值网络需要免受创伤和慢性压力的童年^[25]——没有太大压力影响情绪估值，多玩，在超大行为空间中大量自由学习^[26]。

所有促进大脑健康的策略也会使估值网络变得丰富、高效、高度个性化。这些要素将构成出色的学习内驱力的基础。所有教育工作者都认可这样的目标：想要帮助孩子们很好地把握他们的情感生活，逐步培养聪明、有创造力且知识渊博的大脑。

教育系统的主要问题是一刀切，让所有孩子如上了流水线一般获得相同知识，而几乎不关心有效学习的重要组成部分：学习内驱力^[12]。学习内驱力是一种完美计算方法^[27]，它把表征大脑中知识的语义网络^[23]的当前状态与来自知识估值网络的实时输入相匹配，这种输入主要来自对于环境中可用信息的响应。如果孩子坚持要看 YouTube 视频，那么他的大脑才是最大权威。所有干扰都将影响未来的独立性和创造力^[28]。

与其让一名授课老师花 45 分钟给一个孩子灌输一长串低估值的符号，且效同水过鸭背，还不如让他上上谷歌，只需花上 3-5 分钟就可以找到高估值且易于记忆的信息，终生不忘（反例请见：数码痴呆症的病态迷思）。如果孩子对此轻车熟路，那么他通过自学^[29]，获取知识的效率将提高一个数量级。这里的「提高一个数量级」，是我谨慎而保守的判断，我可不想被人说在夸大其词。我在这篇文章的其他地方举了一些具体对比的例子（比如一个月上完 13 年学或假期中学习速度加快 1600%）。

我称这种能力为知识金砖，Peter Thiel 称之为幂律：一套至臻完美的核心技能能带来乘方级的生产力提升。

在学习上下点功夫就可以给个人生活和整个地球带来翻天覆地的变化！

10.5 大脑中的知识估值

在解剖学中，对理解人类的思维至关重要的，是关于大脑的知识估值网络的实际实现的研究。这对预防抑郁和成瘾很有必要。知识估值是高效学习，创造力和解决问题的基础。

好的学习令人愉悦。食物、性或者毒品带来的快乐容易饱和，而愉快的学习则不会。我们可以轻易避免不愉快的学习。正是学习内驱力的存在，使我们天然可以做到这点。这就是学习对于人们快乐与否至关重要的原因。它可以实质性地为全社会的幸福感带来质的飞跃。

10.5.1 眶额皮质（OFC）

知识估值^[22]的网络性质表明了大脑皮质资源的使用状况。事实上，大多数研究人员似乎倾向于认为：整个估值系统可能以眶额皮质（OFC）为中心，越靠近其前部区域则抽象程度越高。关于单个子系统如何影响估值，已有很多模型和假设（如共同通货、共同尺度、躯体标记、按内容评价、多组分、认知-动机界面、平行评价、定位主义与建构主义模型等）。在共同通货模型中，来自所有子系统（享乐基底）的所有估值都被整合在一起，并提供「想要」或「喜欢」的最终信号。例如，（1）来自内侧 OFC（mOFC）的基于知识的估值可能会与（2）来自伏隔核（NA）的奖励预期以及（3）来自脑岛的食物估值信息结合起来，共同影响你选择下一顿饭去哪吃。

10.5.2 共同通货模型

OFC 是一个很棒的研究领域，因为人们感兴趣的很多主题汇集于此：毒瘾、快感缺失、习得性无助、强迫症等等。共同通货模型似乎表明，创造力爆发或学习内驱力^[12]爆发产生的快感，在神经化学和神经解剖学上与低剂量可卡因产生的快感相似。

所有的奖励是都会被转化为同一种奖励信号汇集到同一类神经元上，还是会分别保留它们的本源特征，这一点存在着激烈的争论。但我认为没必要纠结这一点，因为特异性由个体的概念图激活赋予，而共同通货则由单一输出产生的最终估值构成。在所有估值中，由于每个概念图激活都有其单一响应，因此我们需要收敛。一些 OFC 神经元似乎专门对高阶价值进行编码。

在知识估值^[22]和决策中，我们需要独断。冗余可以用于恢复估值系统，但必须服从概念神经元的决策。同时存在两个拍板定案的，并不现实，好比某人一边吃饭，一边拿叉子刺自己眼睛，极为荒谬。尽管理论上相互竞争的神经力量可能导致这种场景，但这通常是由于计算错误。

10.5.3 知识估值的涌现

可以通过各个概念图之间的交互来构建估值网络。例如，如果考试这个概念是根据工作前景这个概念^[30]来估值的，这两者就可以被共同激活：找工作这个概念的估值会给考试相关的概念图一个估值。概念图激活的程度与相关概念估值共同决定了最后的估值结果。在导向腹侧纹状体的路径中，髓鞘浓度会升高。这一点可能是学习内驱力^[12]可以通过学习来增强（或者被学校的强迫学习^[31]所压制）的原因之一。OFC 在决定估值的过程中扮演的角色，与海马体在建立长期记忆的过程中扮演的角色类似。这些在大脑皮层中高度关连的区域扮演了交换机的角色（将相关区域连接起来），而不是“媒人”的角色。相对地，已连接的概念图或概念中心会自行发展它们之间的快速连接线路（比如在睡眠中）。通过新的线路，高价值的概念可以直接影响愉快中枢而无需 OFC 的干预。这样一来，只需通过单独激活某些概念细胞（例如，与某人最喜欢的演员相关联的细胞），便可以直接产生令人愉悦的估值。

10.5.4 逆向学习的危害

在不良的学校状况中，我们可能会将无关的上下文（例如 SuperMemo 中问答卡片的颜色）与低估值相关联。在这种情况下，白色问答卡片的概念或者问答卡片和颜色的概念的共同激活，都属于强烈的负面输入，会抑制估值。从表面上看，这似乎是一个阻碍估值的中止信号（可能在 OFC 侧面）。在这样的情境中，概念之间仍然可能建立关联，仍有可能做到短期的提取，然而，较低的估值将阻止记忆的巩固（例如，通过阻止向长期皮层存储的转移）（参见：学校是如何阻止记忆巩固的）。在逆向学习中，也可能会发生奖励的再编码过程（例如，改变 SuperMemo 中的模板颜色）。我们知道，OFC 受损的动物的逆向学习能力会被削弱（Mishkin 1972），这一点佐证了最高估值网络的解剖学位置。如果我们继续否决估值信号，最后可能会导致网络^[32]之间的竞争。在我的假设中，这一点是学校诱发的习得性无助^[33]的起源。学校胁迫是一种永久的逆向学习形式，它会慢慢消磨网络的可塑性，导致在决策过程中评估奖励的能力受到长期的不利影响。从这个角度来看，人类的记忆可以被看作是擦写循环次数有限的 EPROM。如果把长期学习视为突触基底的积累——该基底会在随后的稳定化^[34]过程中被删减（这反过来会减少突触发生）——逆向学习可能会使该系统不再响应：在这个系统中，学习不再可能。

无休止的虚假奖励和轻微处分可能会使知识估值过程关闭，并损害在学校的长期学习。

10.5.5 目标 vs. 习惯

知识估值网络是良好的自由学习^[26]的核心。相比之下，被动学校教育^[10]将导致习得性无助^[33]。人们可能一开始自然而然主动追求某些目标，然而强迫教育会使人变得习惯被动（反过来，在追求目标中摸爬滚打，则会收获健康的习惯）。系统中估值较低（没怎么激活兴趣概念图）的部分会抑制知识估值网络的输出。如此，学习时，大脑自然兴致不高。一旦学习内驱力^[12]枯竭，好奇心消亡，生活就变成了干巴巴地执行一连串缺乏奖励的习惯（参见：学校带来的 50 个坏习惯^[35]）。

若学习无乐趣，则人类的存在会退化成一套沉闷无趣的习惯。

10.6 知识估值：贯穿你的一生

个人轶事：为什么使用轶事？

我的学校试图剥夺我生命中最美好的东西

关于估值网络的力量和教育系统的对峙，我自己的经历就是醒目的例子：

1985 年，我推导出了一个近似函数，用来计算使知识形成长期记忆所需的最佳复习间隔。这就是间隔重复^[36]的诞生。最初，该函数适用于纸笔版 SuperMemo。随后几个月内，我意识到这个系统非常强大。只要一台电脑，我就能让它功效翻倍。然而，我不认识任何可以根据我的数学计算编写学习软件的人。那个年代，波兰的整个程序员圈子里，要么是在大型主机上运行 Fortran 或 Cobol 的老古董，要么就是不断增加的业余爱好者们，他们主要摆弄微型计算机（如 ZX81、Commodore 64 或 ZX Spectrum）。于是，我决定亲力亲为。不过，我还没有掌握编程技能。作为一名计算机科学专业的学生，我选择向老师寻求帮助。然而，我们唯一的编程课程是 Datapoint 汇编语言。这些技能对于处理寄存器实现类似 11*11=121 的计算非常有用。这不是我想要的，我想学习一些对编写 SuperMemo 程序更有用的东西。我的学校一直要求我学习如何计算电子电路的电阻，或者符号积分。我的知识估值网络的输出很简单：编程技能将通往 SuperMemo 的诞生，而这将通往更快的学习（在所有领域，包括电子学或微积分）。我决心要学习编程，而我的学校决心阻止我（通过其他必修课使我不堪重负）。无奈之下，我报名入学了波兹南经济大学（University of Economics in Poznan），去学习那里的一门算法语言课程。该课程主要使用 Pascal。我不得不在学习平时的课业之余钻研 Pascal。那门课很不错，但我们学的都是理论，在纸面上完成。在当时（1986 年），整个波兰的大学里，个人电脑（PC）很罕见，大多数实际应用程序都运行在名为 Odra 的大型机上（1960 年波兰为苏联阵营所生产）。当我终于有了我的第一台计算机时：ZX Spectrum（1986 年 1 月 4 日），我终于可以真正开始学习在计算机上编程了。在我的电脑到来之前，我开始写我的第一个程序。我把它写在纸上！这是一个组织我日常活动的程序（有点类似 SuperMemo 中的 Plan）。不久之后，我也学会了 Pascal。首先，我必须降低学校的负面影响，减轻课业负担。我和我的电子电路老师达成了一项协议：我会为他做一些高通滤波计算，这将是一个提高我的 Pascal 技能的机会。这个程序花了好久才写完，极其浪费时间。这是一个糟糕学习的完美案例。我几乎不懂我自己写的程序是如何运作的。然而，这仍然比仅仅学习示意图的效果要好。就我的编程技能而言，那次学习很不错，我进步了很多。

我很难向不懂编程的人说明白，但学习大学课程和自己动手编程的知识估值的差异判若云泥。在我的同学深陷乏味的电子学和计量学讲座的折磨之时，我开始了自己的编程之旅。在学校，我什么也学不到。在 Pascal 业余课程中，我学到一点。然而，只有以激情和明确目标为后盾的实践知识至关紧要。到 1987 年 12 月，我的努力最终导向了 SuperMemo 的第一个版本的诞生，这彻底改变了我的人生进程。多亏了我的导师 Zbigniew Kierzowski 博士的开明，让我得以将我的硕士论文完全专注于研究 SuperMemo 这个主题。Kierzowski 教授，80 岁生日快乐！对于一个学生来说，有这么大程度的自主决定权是相当不寻常的，更不用说论文还是用英语写的（不到十年后，波兰议会试图将这种行为定为非法）。这关系到 1989 年的大规模行政和策略斗争。

我如今最主要的快乐源泉是 SuperMemo，但我经历的学校教育几乎毁灭了它。但这不是因为有人怀抱恶意。我的大多数大学老师都很了不起。罪魁祸首是学校这个系统迫使学生学习死板的规定课程。给予学生创造性表达的空间，才是教育最好的基础。

我的学校乐此不疲地阻挠我完成对我来说最重要的事，而这件事却是我职业生涯和未来一切的支撑。要是我更顺从一点，更传统一些，更容易屈从于社会压力，我就会成为一个「更好」的学生，在电子电路理论、微积分、计量学和抽象代数上投入更多时间。若果真如此，这篇文章就不会问世。这个网站也不会存在。

我现在的生活是任何研究性的或业界内的职位都换不来的。基于我坚固的知识估值网络，任何对我的否定都无法打倒我。

我们要设计的教育体系，是让每个孩子都能自由发展的教育体系

11 学习熵

有很多因素会影响大脑对信息与信道的感知和估值。在之前的章节中，我们注意到大脑不只对熵有反应。有很多因素会调节熵的影响或单个信息的信息量，包括：编码、传输速度、预处理（比如泛化、补全、辨认等等）、前置知识（包括估值、情感价值、信道可靠性等等）、最佳水平（受处理速度影响）等等。

这一过程十分复杂，需要引入更恰当的概念以涵盖这些微妙之处。我建议使用「学习熵」这一术语来描述特定场景下某个教育渠道或者信号对某个人的吸引力。

学习熵是由学习内驱力^[12]系统所决定的某个教育信号的吸引力。

有的课程很无聊，有的则让人目不转睛。学习熵从个人的角度描述各个课程的吸引力。

熵有精确的数学定义，但学习熵并非如此。其最佳衡量方式应该是，对经过分析的信号进行学习之后，个人的奖励系统所作出的反应。就像熵依赖于信息的概率一样，学习熵依赖于信息（图片、声音、语句等等）的奖励能力。其奖励能力与概率有关，但是具体估值主要依赖于知识估值网络。

好的学习是有奖励的。但也有糟糕的学习。存在解码失败惩罚^[37]：如果学生努力理解一条信息但失败了，他会受到惩罚。这会带来挫折感，这是厌恶学习的开始。如果学习熵低，奖励少，惩罚高，净结果可能是负的。如果我们将负面奖励信号算在内，学习熵实际上可能会是负值。一堂枯燥的讲座的学习熵可能是负的，导致学习内驱力被抑制。

知识估值较高，则学习熵也较高。这对于使人专注于知识的语义插入以实现长期记忆是必要的。学习熵提升学习内驱力，进而提升估值，估值反过来决定学习熵，构成强大的反馈循环。遗忘、习得性无助、衰老、受伤、脑力的可用性均会控制这个循环的强度。只要理性学习、良好生活，特别是要尊重自然创造力周期^[38]，这个循环可在学习内驱力较高的平衡状态下保持数十年。

12 信号时机 vs. 学习熵

学习流中单个信息的奖励水平决定了信号学习熵的高低。一个主题枯燥的讲座的学习熵较低。上网寻找解决特定问题所需的零星信息这种行为学习熵较高。

与基于平均值的香农熵不同，学习熵主要基于一种往绩平均值（trailing average）：近期的消息比之前的消息具有更高的权重。此外，学习熵根植于控制记忆巩固^[39]的规则，包括间隔效应^[40]。

只要有知识金砖填补了理解上的重大空白，一堂枯燥的讲座的学习熵就会瞬间提升。学习熵的增加与决定知识估值的记忆轨迹的稳定性^[41]的表达式成正比（包括知识估值网络中的下降曲线）。知识金砖的影响会逐渐减弱。那些可以为你带来快乐的发现累积起来，将决定任一时刻的学习熵水平（例如，在讲座期间的）。

上述内容表明，教育者可以影响学习熵，增强学习内驱力^[12]，提高长期学习效果。消极灌输知识的效果很糟糕。不必全部问题都提供答案，而应侧重于重要的抽象且普遍的问题。自我导向学习的自由探索是可以使人保持终身可持续的学习内驱力和终身学习的最佳模式。

所有形式的学校教育都会抑制学习内驱力。因此，许多成年人很难内化「学习熵在学习中的重要性」这一信息。然而，现代社会中，几乎每个人都会面临独自解决小的技术或健康问题的需要。有时问题可能很简单，比如对 Facebook 的选项设置进行小改动。越难找到一个问题的解决方法，找到答案的回报就越大。越难找到答案，搜寻和探索就越持久越广泛。每个人都应该熟悉这些感觉。然而，学习内驱力被抑制总是会导致收获的知识更少，自尊更低，所有的探索更早结束。换而言之，那些在学校或之后的生活中失去了创造内驱力的人，会更早放弃，甚至永远不去尝试。从这个意义上说，计算机、互联网、技术等带来的所有技术问题和小故障都有一些积极的副作用：刺激人们丧失的学习内驱力的最后一点残存，即使在最被动的人身上也是如此。唯一的必要条件是，这些探索需要以一定程度的成功结束。否则，可能会发生相反的情况：惩罚信号使人退出探索。

你可以快速回答关于你自己的学习内驱力的这个即时测验：如果你在生活中遇到一个小问题，你会去问人类专家还是谷歌？如果你的汽车失灵或电脑死机，或是你受伤了或肚子疼，你会怎么办呢？

13 学习熵和学习内驱力

学习熵奖励的影响会随着时间的推移呈指数下降，这个过程类似于遗忘^[19]。就像在间隔重复^[36]的复习中一样，新的奖励能把学习熵带回到更高的水平。就像在间隔效应^[40]中一样，同样的消息在间隔更长时，会更有价值。

在学习中，决定学习熵的奖励信号和决定记忆的巩固信号有一个很大的差别：一旦你学到了什么，在短时间内重复复习是没有用的。只要你完全记住了，就可以过一段时间再进行下一次复习。学习熵几乎没有上限。如果你喜欢一堂课，只要为之添加一些事实或表述的变换，你就可能更喜欢它。你一旦记住了什么，就不可能在短时间内再使用一些技巧去增强记忆。你可以使用助记术重组记忆并提高其持久度，但是一旦完全记住之后，保持长期记忆最好的做法是暂时不再用它，或是将之运用在不同的上下文中——这本质上是构建新的记忆，形成与原始单一记忆的冗余连接。

学习熵因缺乏奖励信号而衰竭。学习内驱力^[12]的消亡是一个遗忘问题（包括脑细胞丢失导致的遗忘）。

各个信息的奖励指数级下降和递减，学习熵随之累加。通过优化奖励信息的时机，我们可以提高学习熵，使学习成为与食物、性爱、毒品等奖励同等的最令人愉快的活动之一。如果你持怀疑态度，可以回忆一下：沉迷电子游戏的玩家可以忍饥挨饿玩一整晚游戏。电子游戏^[42]会劫持学习内驱力，将之与赌博的奖励相结合。赌博的奖励可能像学习熵一样，也受到类似的衰减/增强规则的支配。然而，它们还受到可变奖励^[43]的影响，这可能会导致上瘾。重要的是辨别学习的乐趣和有害的成瘾（见：学习成瘾）。

学习熵决定学习内驱力，但维持两者的规则不同。学习内驱力依赖于知识，因此将受制于间隔重复。因为知识以网络形式存在^[23]，故而谈论激励学习内驱力的最佳方式是没有意义的。为了最大化学习内驱力，我们应该进行终身学习，尊重自然创造力周期^[38]，并照顾大脑健康（即总体健康）。

14 最优信息传授

在学校教育中，我们可能设想课堂的学习熵都是最优水平，让学生能不停地赞叹喝彩，马不停蹄地记笔记。但更常见的情况是，课堂很无聊或是熵信号很高，但学习熵很低，甚至是负的。

既然最优学习熵与学生有关，老师怎么能做到向教室里的所有学生都最优地传授知识呢？这样全面地传授知识，有时几乎毫无可能，且至少也需要天才教师才能实现。大部分老师的课堂上，大部分学生不是无聊得昏昏欲睡，就是丝毫不懂抓耳挠腮。

只有少数幸运儿能通过听课学到大部分知识。对很少一部分有天分的孩子来说，老师的授课可能完全讲不出新东西，非常无聊。而对于其他孩子来说，授课内容则可能过于复杂，超出了他们的理解能力。这种情况下，他们如果勉强去理解，则可能遭受巨大的挫折。一堂关于弦论的课程，可能就跟随机打乱的一段中文一样难以理解。于是乎，听课不过是浪费时间。诺贝尔奖获得者 Carl Wieman 将课堂比作放血。

为了避免负学习熵带来的挫败感，学生们会无视授课内容，就像对待我之前提到的泰语频道一样。孩子们会忽略来自老师的“静电噪音”，转向其他更适合其学习熵水平的频道（例如，桌下手机上的 facebook）。即使他们的理解力很好，老师的授课也可能并不能对他们的现有知识作出补充。如果不能生成高质量高价值的泛化，授课内容将被认为是显而易见或无关紧要的。

即使低学习熵只是偶尔发生的情况，也会使学生不再关注授课内容。过一段时间，学生们就会发展出一套过滤系统，把老师变成一个承载零熵、零学习熵的无声广播频道。再怎么提高授课质量只是徒劳——老师已经消失了！

在课堂环境中，学生通常不能将注意力集中在更好的信号上。所有的学生都会收到同样的信号，他们可能会感到同样的无聊。相比之下，在谷歌上搜索好的关键词，大脑会在恰到好处的低概率信息流中应接不暇，这些信息像拼图一样适合当前的知识树^[44]。谷歌是一个非常便宜且高效的「哇！」生成器。

在渐进学习中，大脑的学习熵扫描仪将挑选那些最好的频道，对其进行优先级排序，并采用完美的时机来最大化语义连接和记忆巩固。于是乎，为什么「我非常高兴我永远再不会被迫坐在学校的课桌旁！」是很容易理解的。我太喜欢学习了！

上面所有的例子都说明了，在识别什么值得学习时，信号和大脑之间的相互作用是多么错综复杂。学习的奖励是衡量学习质量的最广为人知的指标。当学生们高兴时，我们就是在正确的道路上。当学校给学生带来痛苦时，我们整个社会就是失败的。

知识的互补性和连贯性^[16]的唯一可靠指标是学习内驱力^[12]系统的神经网络。这就是知识不能预先打包并强加给学生的原因。

结晶比喻^[44]解释了这一点。奖励系统的神经细节在学习的奖励这一节阐释。

15 扣人心弦的授课

我们热爱学习，但我们通常厌恶别人教我们。这些感觉与创造力相关，这或许可以这样解释：创造性的阐述对于作为理解基础的模式补全是必不可少的。

在学习中，我们决定调查的内容。学习熵严格依照大脑的状态和当前的记忆激活进行评估。在教学中，知识是批量传授的，与我们的想法无关。许多学生认为他们不喜欢学校的首要原因是枯燥的科目——而不是校园霸凌、压力或强制早起。无聊令人痛苦！点击这里阅读我写的关于自我导向学习和在校学习之间的天差地别。一切都与学习内驱力^[12]有关！

我很惊讶有那么多的资源被浪费在「寻找使孩子们在授课过程中保持兴趣的方法」的研究上。而很明显，上课只是一个糟糕的教育工具。眼神接触分析？参与性分析？努力量化激情？所有的孩子都天生具有学习内驱力，我们的首要任务应该是确保我们不会破坏这一动力。强行灌输知识^[45]是学习内驱力的主要破坏者。此外，还有许多社会经济学因素阻碍了很大一部分孩子，使之即使在最好的环境中也无法茁壮成长。有些孩子永远不会对学习产生热情。在大多数情况下，这不是他们的错。只有一小部分人受到残疾、健康和不太幸运的遗传禀赋的限制。学习内驱力随着年龄的增长呈指数下降，主要是由强制学校教育引起的。被动听讲极大地推进了这一过程。

当然，也有些授课奏效了。可汗学院^[46]充满了好例子。即使是没有幻灯片讲义的纯口头授课也能奏效。YouTube 上的 TED 演讲可以很有趣。它可以满足学习内驱力。慕课建立在这样一个原则上：一个摇滚明星教师比重复同样咒语的成千上万的普通教师要好得多。即使你只是一个被动的听众，你也能学到很多东西。不过，必须满足这样一些条件：你需要对这个主题抱有强烈的好奇心，或者你需要热爱演讲者，或者两者兼而有之。只有一种有效机制可以确保讲座有趣：你要自主选择它！这只是自我导向学习的又一必要条件。

除了自主选择之外，在听课时，你肯定需要一个暂停按钮，以防需要上厕所，或需要吃点东西安抚饥饿的胃。没有什么能像憋到要爆的膀胱那样有效地摧毁一堂课。最后但同样重要的是，大多数课程加一个 Netflix 的跳过片头功能都大有好处。

当然，最好用你自己的创造性思维或快速研究来增强听课的效果。暂停一分钟或一天，或许对学习效率至关重要。与一些心理医生的说法相反，创造性停顿和走神与 ADHD^[47] 无关，反而是很棒的学习的标志。

我使用两种方法渐进吸收授课内容。第一个方法是听讲和练习。练习能提高专注度。专注度高有助于减少停顿的需要，但是它也会减少学习的创造性。对于优先级最高的主题，我使用渐进视频，其中我可以多次暂停和继续播放。我甚至可以保留最重要的授课片段，以备将来复习。然而，渐进视频并不是最好的学习方法。它在速度和容量上无法与渐进阅读^[21]相媲美。有时，使用渐进阅读和阅读课堂讲义比听课本身更有价值。这一点在事实丰富的课程中尤为明显。

我主要根据我对讲授者的喜好来选择我的视频材料。在本文的情境中，我知道你一定会喜欢 Ken Robinson 的演讲！推荐去看：Robinson：学校扼杀了创造力！

16 学习的奖励

学习的乐趣或许是最令人满意的乐趣之一。与进食或做爱相反，学习的乐趣不会随着行为的结束而终止。学习的乐趣是可持续的，只有学习过程中涉及的网络过载时，这种乐趣才会缓慢减弱。而且，通过睡眠就可以将其恢复到基准线。已被证明，学习与海洛因或可卡因给人带来愉悦的机制相同。与进食或性爱不同，愉快的学习可以占据大部分的清醒时间。从这个意义上说，学习、创造、解决问题和生产力带给人的乐趣可能是斯多葛式享乐疗法的伟大工具。健康的人很容易满足对食物的需求，但人对学习的需求可能永远不会终结。学习内驱力^[12]取决于当前已有知识的状态，此状态可以通过学习行为本身进行改变。

所有情绪容易波动的人都应该考虑以学习作为疗法。

16.1 学习内驱力的奖励

我已经提到了几个例子，说明学习内驱力^[12]在大脑中产生奖励信号的方式。我们知道低概率信息可以带来奖励，产生新知识的泛化也是。一段有助于实现理解目标的信息有很高的价值。拼图中缺失的一块^[48]会带来极高的奖励。一旦理解了文章中晦涩难懂的关键词汇，整段长篇文本就会从错综复杂的句子变成清晰的推理。

通过泛化证实一个模型，或为一个更好的新模型构建基础，都让人感觉很棒。此外，所有与强烈的情绪相关联的模型证实都会令人狂喜：「我的团队是世界上最好的！」，或者「是的！我刚出生的孩子真的很健康！」，或者「是的！我知道努力工作会让我获得晋升！」。然而，在讨论学习内驱力时，我想过滤掉额外的情感层，因为它可能会使整个局面变得难以理解。我们需要记住：学习是愉快的，这与是否能从运用知识中获得回报无关。

产生新发现时的啊哈！、哇！或尤里卡！是学习中最纯粹的终极奖励。我们不需要别人的称赞或表扬作为进一步的奖励。在这里，知识本身就是奖励。

这种奖励的共同特征是：都会将新的高价值信息编码进记忆中。

学习内驱力的奖励来自已准备好进入长期记忆的高价值知识。

在我们对理解现实的探求中，大脑中存储的信息总量在增加，存储的知识的熵却在下降。凭借学习和建模，理解世界的复杂性会越来越省力。

16.2 学习内驱力的演变

科学家说，聪明的动物玩得更多。我要说，更有趣的是，玩得更多的物种更聪明。我推测学习内驱力^[12]可能是人类脑容量爆发增长的触发因素。这并不是说，鸟类或哺乳动物面临的环境变化需要更多的思考。这并不是说，如果大脑皮层面积不迅速扩张，人类就会突然面临灭绝。而是，可能正是学习内驱力的出现突然让代价高昂的脑细胞数量增加得到了更好的利用。在学习内驱力出现之前，增加脑容量只会让动物头部更重，还得供养这些额外的细胞。如果没有学习内驱力，这些额外的脑容量可能一直得不到利用，导致浪费性的萎缩。如果学校教育试图凌驾于学习内驱力之上，只会使得这种进化优势被废弃，进而使得整个社会更不聪明、更缺乏创造力。

如果画出人类进化的时间线上的脑容量大小的变化曲线，就会看到大约 200 万年前，曲线上有一段猛烈的上升。古人类学家倾向于将之归因于饮食的变化，如烹饪方式等，从而更好地为大脑提供了营养。

如果关于学习内驱力出现的假设是正确的，能人很有可能是突破的起点。这可能表明，从简单的鸟类和哺乳动物的程式性行为驱动转变为更复杂的陈述性学习驱动，最终使我们可以建立现实的抽象模型，这是人类智力的基础。还有推测认为，正是能人阶段，由大脑成长主导的童年（从断奶到平均 7 岁）开始出现。

学习内驱力的出现较晚，这表明它不是神经网络中出现的一个简单属性（参见：Biederman 模型）。否则，它可能很容易出现在鱼或更早的生物上。学习内驱力需要一套专门的神经结构，以便在检测到对陈述性知识的连贯结构的增量贡献时发送奖励信号。这种信号和内在结构在程序性学习和陈述性学习中可能有所不同。对于不同类别的感觉输入，它也可能有所不同。

16.3 程序性学习的奖励

早在 20 世纪 80 年代，我就推测可能存在进行程序性学习的大脑回路。在我的硕士论文中，出于无知，我使用了自创术语「随机学习」。我不知道早在 20 年前，也就是 1969 年，David Marr 已提出了符合我自己想法的小脑皮层理论模型。进入新千年以来，有大量数据可以证实该模型。

关于程序性学习的大脑回路的想法非常简单。想象一下你骑自行车的情形。你运用你的意识来学习骑上自行车所需的各个动作，然后持续踩踏板。然而，一旦你上路了，程序性学习系统会确保你能以最小的神经努力自动执行所有动作，无需有意识的监督或仅需对一组命令神经元进行最低限度的监督。程序性学习将决定你的运动程序。该程序性学习系统会对发送到你的运动系统的信号序列进行微小的随机调整（因此我将之命名为「随机学习」），可以将这些随机更改视为程序创意。每当你的自行车失去平衡时，错误检测网络将发送一个惩罚信号，以取消更改。该惩罚信号是运动程序的教学信号。

在睡眠期间，记忆将被重组，以消除有意识的输入，简化、优化，去除对技能几乎没有贡献的垃圾信号。每一次循环，都通过试错法来完善信号序列。每一次睡眠，都会使大脑皮层褶皱变得更光滑。骑自行车将变得令人愉悦。在从笨拙的有意识的骑手到自然而然的骑手的转变中，这种愉悦达到峰值。

类似地，随着在电脑上输入更多句子，你的打字错误会逐渐减少。你知道键盘上的「)」在哪里吗？「}」呢？你打字越流利，就越有可能忘记这些细节。拿掉对运动序列的有意识控制后，键盘上「)」位置的陈述性知识可能会被当作「垃圾」扔掉：你不再需要它了。

16.4 陈述性学习的奖励

陈述性学习内驱力^[12]的解释会稍微复杂一些。陈述式学习^[49]有一个明确的奖励。有些事情很有趣，找出真相令人愉悦。在神经层面，大脑将扫描输入和神经活动，寻找与当前记忆状态相匹配的最大限度提供新知识的高学习熵区域。任何有意义的低概率信息都会被认为更有吸引力。明亮的分形图案是美丽的。灰色的随机色块是乏味的。更复杂的视觉信号也是同样的情况。生机勃勃的森林是美丽的。同样的森林在冬天、旱灾时或在环境污染的影响下可能就没有吸引力。Steven Pinker 说，我们会被有活力的图像所吸引。我不同意这一点。我们会被吸引的范围要大得多。我们同样可能会被一座死火山或南极洲的冰冻景观所吸引。我们喜欢可以使用简单模型^[13]来表达复杂信息的环境、信号、消息或大脑活动。一幅美丽的海滩图片可以用几个简单的形状和纹理来表示。

信息熵与数据的可压缩性有关。信号处理过程从输入开始。视网膜对视觉输入信号进行 100 倍压缩。视觉皮层接收形状和关系的简单表示。海马体不定时地接收这些信息。这些信号最终可能会改变新皮层长期记忆存储中单个突触的状态。

学习内驱力的基础是寻找在神经网络中表示知识的有效途径。学习内驱力、睡眠中的记忆优化^[20]和遗忘^[19]对于最大化可压缩性、抽象程度、可应用性^[11]和性能是至关重要的。通过这些，大脑确保我们可以使用简单的表征去看一个复杂的世界。这是人类智力^[50]的核心。如果人工智能研究人员能够给机器人配备类似人类的学习内驱力，只要有充足的内存，它们的学习能力就可能是无穷无尽的。

16.5 学习中的奖励中枢

2014 年，研究人员报告称，在「高度好奇」的状态下，伏隔核的活动增加了。他们还证明了我们一直都知道的：这种状态改善了记忆表现。此外，提高的表现溢出到了附带学习，即本身不会引起好奇心的学习。这项研究被媒体广泛报道，却是以错误的解释：「好奇心促使大脑拥有更好的记忆力」。例如，《科学美国人》用了这样的标题：《神经影像学揭示了大脑的奖励和记忆路径如何引导探究知识的头脑》。这篇论文本身就暗示了「激发好奇心」的必要性。

由于奖励中枢会涉及到对快乐的预期，我们更应该将这项研究的结果视为证实学习内驱力与快乐相关的一个指标。正是学习内驱力使人学习。正是学习令人愉快。上述标题应该是《神经影像学证实有效的学习令人愉快》。换句话说，顺序不是「内驱力->享受->学习」，而是「内驱力->学习->享受」。

与其说需要「激发好奇心」，不如说需要「发展学习内驱力^[12]」。关键的不同之处在于，将刺激视为可能在课堂上使用的速效方法，而不是需要几个月甚至几年的长期过程。广告宣传可能会用廉价的花招来激发我们的好奇心，而毕生的热情则是永不满足永不消退的学习内驱力的准则，是不断学习的完美保证。

诚然，好奇心的状态会提高注意力，而这会改善整体的学习。然而，这永远不该被用作教学策略。只有当奖励来自对目标的学习，而不是来自围绕目标的学习时，学习的游戏化才有意义。许多儿童学习项目使用鲜艳的色彩、不寻常的声音或笑脸来吸引孩子的注意力，诱导其学习。然而，一旦成为习惯，这种形式或人工游戏化就不再有效。此外，附带知识也不会持久。任何利用好奇心去激发附带学习的努力，都是不具体且低效的。同样地，我们可能寄望药物干预，例如利他林，可以改善学习。相反，学习必须是它自己的奖励。

伏隔核和腹侧被盖区参与快乐、对快乐的预期和对信号的估值。来自知识估值网络的信号，在其动机和情感的反应中，都汇聚到这些领域。多巴胺与对快乐的预期有关。由于多巴胺与注意力有关，单是对快乐的预期就能改善学习，因为人们更好地关注了预期会带来快乐的信息来源。

如果你没被说服，想想当你的新闻频道耍花招激起你的兴趣后说「广告后马上回来」时，你有多讨厌他们。当他们用「突发新闻」毁了这一切时，你会更加恼火。期待也可能导致挫折感。只有真正的学习会提供奖励。从进化论的观点来看，只有真正的学习的奖励才有意义。我们不想仅仅因为动物看到食物就奖励它。

伏隔核中的嗡嗡声可能是愉悦的直接表达，也可能是在暗示追求愉悦的状态。归根结底，实际的解释对最终结论并不重要：无聊和不愉快是学习的敌人。

为了有效地学习，使新知识与现有知识相辅相成，我们需要遵循学习内驱力。简而言之，这意味着在教育中，学习的乐趣是值得追求的。我们永远不应该在不愉快的状态下学习（参见：合意困难）。痛苦的学习来自大脑使学生知道，在信息论意义上，新知识并不适用！它将被舍弃。快乐是一个很好的向导！

从上述的神经推理中，我们得出了一个显而易见的结论：有效学习的最好保证是让学生自主学习，跟随自己的激情。

17 Biederman 模型

17.1 阅读「阅读的乐趣」的乐趣

2006 年， Irving Biederman 和 Edward A. Vessel 发表了一篇论文，阅读这篇论文给了我令人难忘的乐趣。这篇文章本身向我解释了阅读的乐趣。在一篇题为《知觉的愉悦与大脑》的论文中，Biederman 假设，大脑结构中负责视觉感知的一系列梯度的阿片受体可能会使人在观看美好场景（如美丽的风景）时产生愉悦感。Biederman 的想法似乎解释了我多年以来一直知道的：学习是愉快的。我一直喜欢学习，然而，我从来没有真正从脑科学的角度理解过是什么构成了我的这份喜欢的基础。Biederman 的解释恰到好处，令我非常愉悦。它解释了一些困扰我很长时间的事情。在阅读时，我充分地自我分析。在阅读「阅读的乐趣」时，我试图「感受」阅读的启迪是如何提供这种乐趣的。阅读「阅读的乐趣」的乐趣变得令人难忘。

Biederman 和 Vessel 提出的观点有重大意义。因此，为了简单起见，我现将他们的观点命名为 Biederman 模型（按资历命名）。在视觉感知中，一连串神经元层负责视觉场景的更抽象的表示。比喻地说，它从像素和颜色开始，然后转移到边缘、纹理和表面，然后转移到物体，然后转移到面孔、地点和集合，然后转移到有意义的场景片段，在链条的末端，可能会激活一座「美丽的山峰」的表示，并以此被记住，只有少数细节越过了工作记忆的第一印象，被长久记住。数百万像素的照片变成了一个有意义的场景，只需几句话就可以表达出来，并被记住很多年，而这花费的神经成本却很小。

Biederman 模型使用了一项之前的发现（Michael E. Lewis 等人，1981）：沿着视觉感知通道存在一系列梯度的 mu-阿片受体。神经元承载的含义越多，它可能拥有的阿片受体就越多。我们知道鸦片类药物是有益的，而且会让人上瘾。Biederman 模型基于这样的假设，即这一系列梯度的阿片受体是人能感知到快乐的来源。

用于处理语音和音乐的是与之类似的分层系统。颞叶皮质参与处理声音的音调乃至旋律。对节奏的处理还涉及大脑的其他区域。很有可能，所有这些感知网络都遵循相似的原则。这是神经美学的研究课题。

17.2 阿片 vs. 多巴胺快感

不过，Biederman 模型有一个小问题。学习的乐趣可以有意识地分析出来。就我自己而言，阅读 Biederman 模型的乐趣可以分解并追溯到模型的各个组成部分。这一事实意味着快乐是与有意识的体验相结合的。对于神经科学来说，意识是出了名的难解之谜。我们对意识的大部分了解要么是推测，要么是基于艰难而昂贵的实验，在这些实验中，植入大脑的电极会引起一些反应，这些反应由受影响的个人在随后或同时报告。证据似乎集中在意识的综合模型上，在这种模型中，大脑中几个结构的激活被整合起来，并被感知为有意识的自我。按照这种思路，激活大脑皮层某处的 Halle Berry 神经元并不足以让 Halle 出现在一个人的意识当中。数以百万计的概念神经元可以同时被激活，而正在思考的大脑只能对感知到的现实的少数几个模型进行操作（参见：注意力）。要想使 Halle 出现在一个人的意识中，这种激活必须与意识感知的其他组成部分相结合，包括感知的奖励。

出于这些原因，大脑皮层神经元中的阿片受体不会对学习的最终奖励起到多大作用。一种阿片类拮抗剂，纳洛酮，会剥夺某些人部分听音乐的乐趣。然而，学习的阿片类愉悦应该会产生一种类似于首次使用微剂量海洛因或吗啡时的和缓的快乐。从这个意义上说，内吗啡素的释放和阿片受体的激活有助于学习的快乐。然而，这种快乐还不够具体，不足以让人惊叹「哇！」、「啊哈！」或者「尤里卡」（Biederman 称之为「恍然大悟式的理解」）。对于最终的学习奖励，必须有来自大脑的愉悦中枢的综合奖励体验。

17.3 联想的乐趣

发现的终极快乐来自于有意义的联想。这可以用理解 Biederman 模型本身的快乐来解释。在思考这个模型时，我们在脑海中激活了两个重要的概念：(1) 意义的梯度（源于对涉及视觉感知的神经结构的理解）和 (2) 愉悦的梯度（源于对视觉通道中阿片受体含量的观察）。一旦这两个概念出现在脑海中，就会出现类比的粘合：「梯度」的概念。这种粘合有助于产生这样的联想意义=快乐！这是一种令人愉悦的启迪。这正是我在阅读 Biederman 的论文时所感受到的。要产生这种惊叹，仅仅有更多的阿片受体与「愉悦的梯度」这一概念联系在一起是不够的，就算这比阿片受体与梯度的数学基础或它与「梯度」这个词的联系更多。仅仅有更多的阿片受体与「意义的梯度」这一新奇概念联系在一起是不够的，就算这比阿片受体与常用术语「意义」的联系更多。当「意义 + 快乐」这两个有价值的概念发生碰撞时，才会让人产生惊叹。

Biederman 注意到，受体的梯度深入到了联想区，包括旁海马皮质。我们可能还记得，正是在更下游的海马体，我们发现了 Halle Berry 神经元。为了说明阿片类的快乐和联想的快乐之间的区别，让我们想象一下在美丽的海滩上与 Halle 相遇的情景。当走在海滩上时，我们可能会体验到一股微妙的海洛因般的极乐微风，这来自于我们意识到所处环境非常美丽：「我所在的海滩感觉很棒」。一旦 Halle 出现在地平线上，视觉分析可能会提供另一股阿片类的快感，这来自这样的信号：「美丽的女士正在接近」。然后，视觉处理单元可能会把该女士识别为 Halle，这可能会激活 Halle 的皮层表示，这可能是富含阿片的。然而，只有 Halle 和「我的海滩」的终极联系才会引起重大发现，或许是返祖繁殖的梦想：「Halle 和我走在同一片沙滩上！」。这就是来自腹侧纹状体和伏隔核的奖励在「喜欢」这种情况中可能发挥作用的环节，而一点多巴胺可能会触发「想要」的行为程序。由于审查制度，这个「想要」的行为程序的细节已经从这篇文章中删掉了。然而，在高度发达的个体中，该程序的执行将不可避免地被来自其前额叶皮质的执行信号制止。简而言之，在大脑的愉悦中枢注射多巴胺可能会给大脑带来一些不雅的想法，而阿片肽的释放可能只会带来联想上的快乐。

学习的乐趣不一定要包括吸引人的异性代表。Halle 出现在我的例子中只是因为 Halle 神经元的发现。要想获得学习的乐趣，所需要的只是想法之间强大而高价值的联想，这种联想要可以激活大脑的愉悦中枢。每当我们学到新的东西时，快乐就会产生，当我们学到一些有价值的东西时，这种惊叹是最强烈的。发现 Biederman 模型的快乐来自于我的知识估值网络对学习的乐趣本身的高估值。高估值带来高回报，这会促进记忆（参见：多巴胺可能调节学习的可塑性）。

17.4 记忆对学习乐趣的影响

我还想补充 Biederman 关于脱敏的假设，即反复接触会导致获得的快感减少。Biederman 认为，孩子们喜欢重复性的电子游戏^[42]是因为赌博因素。然而，对于成年人，赌博的威力也并未减小。我假设孩子们更喜欢重复学习，是因为童年失忆症^[51]。一些重复的快乐可能来自有限的理解，另一些可以简单地通过加速遗忘来解释。理解能力差和健忘是成人大脑和儿童大脑的主要区别。

我们还应该注意到，复习时快乐的大幅下降不是由于竞争性学习，而是由于长期记忆巩固^[39]，这可能导致信号在系统中高效流动。竞争性学习在模式识别中可能很重要，但在联想学习中，高可提取性^[52]会削弱重复接触带来的快乐。

17.5 学习内驱力进化的阶段

当我假设在人类身上出现了强大的学习内驱力^[12]时，我脑海中想的是从知识到奖励中枢的直接渠道。这最终将是比 Biederman 模型所暗示的更高水平的学习内驱力。每次涉及受体时，进化都有一种简单而可喜的材料可用。受体梯度最初是在猕猴的大脑皮质中发现的。类似的机制可能关系到更简单的大脑，甚至是更原始的失去中枢控制的神经系统。我不知道蚂蚁在想什么，也不知道它有什么感受；但找到一个好的食物来源，肯定是某种蚂蚁乐趣的来源。由此我们可以得出结论，从演化史角度来说，学习的乐趣可能并不比神经系统本身年轻多少。然而，在演变的过程中，这种驱动力建立了新的功能和效率层。似乎只有哺乳动物和一些鸟类具备玩耍的创造力。这个进化过程的最终顶点可能就是人类的学习内驱力。自然，在某一时刻，这会应用在在思想机器中。了解学习内驱力的力量将对人类的生存至关重要：无论是在其对人工智能的需求方面，还是在使人工智能成为反对人类的威胁方面。

18 合意困难

「合意困难」这一概念可能会成为容忍在校学习不快的借口。在这里，我会解释为什么这个借口是不公正且危险的。

Robert Bjork 可能是学习理论方面最好的专家。如果他告诉你在学习中困难是值得的，你会如何想？事实上他是对的，这与「好的学习总是令人愉快」这一事实并不矛盾。合意困难是一群概念的集合体。在这些概念中，学习障碍会促使进一步学习。让我们结合学习的乐趣，逐一解决这些问题：

主动回忆：主动回忆的效果优于被动复习。主动回忆更难。这是一个合意困难。我们在学习中需要主动回忆，因为这是唯一可以在间隔重复中有效地重新巩固记忆印迹的过程。每当我们在实践中运用知识时，便是在主动回忆。这种运用是令人愉快的，因为它可以提高生产力，这是一种独立于学习之外的奖励。人类单纯地喜欢实现目标^[53]。如果复习是人为计划的，就像在 SuperMemo 中一样，它不会产生富有成效的行为，而且很容易失去吸引力。所有成功的 SuperMemo 用户都会把复习与他们的目标联系起来。他们将每一个条目和每一次重复都视为通向更美好未来的一步。然而，并不是所有的用户都有这样的想象力。这就是为什么 SuperMemo 效率惊人，却并没有使人类为之倾倒的原因。
间隔重复：记忆的可提取性更低时，记忆巩固更有效。这也可能导致回忆更困难。这是一个合意困难。与主动回忆一样，复习的奖励来自于知识的使用和生产力。在默认情况下，SuperMemo 中大多数复习能够被成功回忆。难度和快乐之间可能是存在某种联系。同样，只有一小部分用户会发现这个过程是令人愉快的。除他们之外的人通常不会坚持很久便会选择退出。我们告诉所有用户，要让 SuperMemo 变得有趣，否则它不会对你起作用！另见：知道的乐趣^[54]
渐进复习：SuperMemo 提倡按间隔分散学习。从记忆力和创造力的角度来看，在较长的时间把文章分解成各个小部分来阅读会更有效率。同样的道理也适用于看视频或听讲座。这会产生上下文回顾的问题，但这是次要的。不过，它也在创造性阐述方面带来了额外的好处。它还改进了记忆编码、泛化和长期记忆巩固。矛盾的是，这些额外的困难会产生额外的学习效率，使得渐进阅读成为最令人愉快的学习形式之一。
学习情境：在回忆提取时更改上下文是一种非常简单有效的合意困难。如果编码正确，提取就会成功，这样更有效，有价值。如果语境变化产生了泛化，优化了记忆编码，学习的有效性就会增加，学习的奖励也会增加。
解决问题：解决问题可以是非常愉快的。问题越难，找到解决方案的快乐就越大。解决问题涉及一个学习过程，因为解决问题需要中间步骤：把新知识存储在记忆中。所有这些步骤都是令人愉快的。如果学生在任务中挣扎，长时间没有进展，他就学不到任何东西，也得不到任何奖励。这只能说明这些任务太难了。如果学生没能解决问题，但还是通过中间步骤取得了进展，即使这些步骤没有通向最终的解决方案，他们在此期间也进行了一定的学习，得到了一定的奖励。同样，如果困难是合意的，它将带来奖励。如果不存在奖励，则表明困难是无法逾越的。这种情况下，困难没有意义也不值得追求。
从做中学：「从做中学」可能包括玩耍、创意、解决问题等。完成这些任务需要更多的时间，往往也可以带来更好的结果和更多的奖励。
延迟反馈：延迟反馈在某些情况下需要更多的时间来处理。简而言之，如果老师不告诉你你做得有多好，你可能会好奇一段时间。这其实有利于记忆。如果真是这样的话，最终的效果将是值得的。
收回帮助：我在「学校压制学习内驱力」^[45]中写了关于「收回帮助」的内容。没有得到答案的孩子可能会因此变得好奇。好奇心会增加了学习的奖励。在纠正错误的现实模型方面没有得到帮助的学生，会因为靠自己解决不一致而获得更高的奖励。
其他困难：可以改善学习的障碍是无穷无尽的，其中一些可能是因为荷尔蒙的本质，一些可能涉及激励力量。所有这些障碍的共同点似乎是某种形式的更深层次的处理、记忆巩固和改善注意力等等。促使更好学习的障碍也不可避免地要涉及到更好的奖励。

合意困难不会剥夺学习的乐趣。恰恰相反，它使学习更有效、更有趣。如果难度过高，令人不悦，那么困难就不再可取了。这个简单的等价来自于学习内驱力的奖励系统的机制。

请注意，由于合意困难而获得的有效学习的额外奖励不需要与高学习熵相对应。学习熵是信息通道的度量标准。例如，主动回忆与新颖性无关。它指的是记忆重新巩固。同样，解决问题的部分原因可能来自于实现与学习无关的目标的需要，或者是被获得新知识以外的生产力所激励。

还要注意的是，几乎所有上述合意困难都内在地交织在渐进学习的过程中。

19 对学习上瘾

19.1 生而成瘾

我们生来就热爱学习。在强制学校教育^[55]的那些年里这种热爱通常很快便会消失。我们对学习的热爱持续越久，对大脑、健康和人类的益处就越大。对学习的热爱与上瘾无关。上瘾的定义包括强制参与某项活动而产生的不良后果。

与益处相比，学习的负面副作用是微乎其微的。一定程度的求知欲，甚至冲动，可以进一步促进积极的影响。提高一个人的学习热情是可能的。好的学习是进一步学习的最好的助推器。

19.2 学习与赌博

学习和赌博所涉及的奖励系统之间有着密切的联系。赌博和学习新单词都会以类似的方式激活腹侧纹状体。这种与赌博的密切联系可能会混淆学习的概念。喜欢玩老虎机的赌徒并不能通过游戏学到多少东西。容易上瘾的电子游戏可能会更好一点，因为它很有教育意义。许多团队游戏成瘾者在校成绩没有明显的起色，但在游戏里却能说一口流利的英语。对体育新闻的上瘾也可能会涉及到一定程度的学习。比如我就是在非洲国家杯期间才了解到卡宾达的。对刷 Facebook 的上瘾也没有什么不同。它基于预期特定收益的可变奖励^[43]，当然，它也可能包含很大程度的学习。这种学习可能包括八卦、名人新闻、假新闻或实际有用的学习。甚至政治民调的更新也会导致上瘾。在希拉里·克林顿和唐纳德·特朗普之间的竞选较量中，民意调查的平衡足以产生悬念效应。对新民调的检查强迫症具备上瘾的全部特征。然而，这种上瘾可能会促使大量的学习发生。把赌博和学习分开有赖于学生自己。贪婪的学习是好事。上瘾带来的学习也可能是好事。然而，赌博本身给人类生存带来的价值微乎其微。因此，理解奖励多样性在预防成瘾中的作用至关重要。

19.3 学习与睡眠

强迫性学习可能会侵占睡眠时间，并可能导致失眠和 DSPS 的流行。拥有强大学习内驱力的富有创造力的头脑会经常熬夜学习到凌晨。在电灯被发明之前，这种对于睡眠模式的违反是困难的，甚至是不可能的。好消息是，学习内驱力会随着网络疲劳^[56]而衰落。我们学习的时间越长，记忆回路的饱和程度就越高。只有睡觉可以帮助缓解。因此，即使是最贪婪的学习者也会在某些时候变得昏昏欲睡并放弃学习。如果读者因为看小说而通宵，这可能是由于睡眠动力不足、学习减少，以及充满悬念的小说中典型的可变奖励增加的共同作用。

19.4 学习与运动

我听说过度学习会导致运动减少。那是很糟糕的。然而，我认为不好的学习更有可能产生这种效果。好的学习是愉悦的，会激发额外的能量。一个快乐的孩子不应该长时间坐在书前或电脑前，一定有想办法发泄能量。也许我们应该说，运动减少是学习成瘾的标志，而良好的学习有神经营养作用，可以爆发出额外的能量以供燃烧？

19.5 学习的限制

学习有成本，并且需要时间。因此学习应该是明智的。然而，好的学习几乎是一项稳赚不赔的长期投资。因此我们没有必要畏惧上瘾。相反，我们应该珍惜并推动学习内驱力，为快乐的终身学习做准备。

20 学习的不快

当我声称「所有的学习都是快乐的」时候，我听到了各种的声音，比如「我必须通过一场压力极大的考试，因为它会带给我很多终身受用的知识」。这些声音把「良好学习的乐趣」与「使学习成为恐惧的不快因素」混为一谈。这些可怕的因素可能涉及糟糕的老师、苛刻的家长、截止日期、压力、低质量的睡眠、烂教材、过多的学习量等等。

我听说，如果没有最后期限或学校强加的目标，学习将被电子游戏、小说、电视、业余爱好、运动等所取代。出于许多原因，这可能是对的。这些活动中的某些可能会给人带来学习之外的乐趣。然而，它们也有学习或锻炼方面的益处。一个全面发展的学生会自由地放慢学习进度，把时间分配给有趣的学习或是其他有趣的活动。「慢慢来」可能会带来更多的益处。

在学习的等式中，良好的学习不可能会产生不快乐。真正的罪魁祸首永远在别处。所有的负面因素都应该加以研究，并消除。

归根结底，即便与考试、证书、职责相关的不愉快必须存在，这种不愉快也应该由学生自愿强加给自己。

愉快的学习可能会被淹没在压力、坏人、学校、烂教材等共同造成的不愉快中。

当所有人都被迫凌晨 5:30 起床时，凌晨 5:30 就成了新的及格线。如果明天规定凌晨 4:30 起床能多拿几分，这群人依然会毫不犹豫地把闹钟提前。在这场无限内耗的零和博弈中，真正被消耗殆尽的，是年轻一代的视力、脊柱、心理健康，以及他们本可用于探索世界、发展创造力的宝贵时间。

面对这种荒谬的指责，我只能说：祝愿那些宣扬凌晨 5 点半起床、觉得吃苦就是美德的好心人，余生每一天都能享受这种剥夺睡眠的福报。（笑

以上回答初稿由 gemini-3.1-pro-preview 根据汉化组的 1903 篇回答生成^[57]

参考

1. 普鲁士教育模式 ./251148900.html
2. 自由学习 ./272543239.html
3. 9 毒性记忆 ./67390960.html
4. 习得性无助 ./575245791.html
5. 学习内驱力 ./52990549.html
6. 22 睡眠相位后移综合征 ./1951939573891438395.html
7. 学校教育的美化 ./362170750.html
8. 磨难就是荣耀？ ./253184005.html
9. 教育抵消进化 ./66279009.html
10. 被动的学校教育 ./359037513.html
11. 适用性 ./517317208.html
12. 学习内驱力 ./52990549.html
13. 抽象知识 ./270927894.html
14. 泛化与概念化 ./264989664.html
15. 学校教育的徒劳 ./353878177.html
16. 连贯性与一致性 ./264327134.html
17. 拼图游戏比喻 ./271646965.html
18. 模型 ./560324024.html
19. 遗忘 ./558542113.html
20. 睡眠中的记忆优化 ./266856783.html
21. 渐进阅读 https://www.yuque.com/supermemo/wiki/incremental_reading
22. 知识估值 ./560852624.html
23. 概念网络 ./266541480.html
24. 如何解决任何问题？ ./351779186.html
25. 抗压韧性 ./73207325.html
26. 自由学习 ./272543239.html
27. 学习内驱力的优化 ./357209357.html
28. 创造力 ./450093869.html
29. 自我导向/自定进度/自学 ./353404375.html
30. 概念 ./571218385.html
31. 学习中的强迫 ./351872034.html
32. 神经网络战争 ./359658715.html
33. 习得性无助 ./575245791.html
34. 稳定化 ./595158577.html
35. 学校让人沾染上的 100+ 恶习 ./559705516.html
36. 间隔重复 (spaced repetition) ./305651556.html
37. 解码失败惩罚 ./359921139.html
38. 自然创造力周期 ./68262875.html
39. 记忆的双组分模型 ./579476637.html
40. 间隔效应 ./279166945.html
41. 记忆稳定性 ./559298549.html
42. 电子游戏 ./479108151.html
43. 可变奖励 ./518129740.html
44. 知识结晶比喻 ./268536400.html
45. 学校对学习内驱力的影响 ./52990626.html
46. 专家对可汗学院一无所知 ./595868172.html
47. 将创造力与 ADHD 混淆 ./521885826.html
48. 拼图游戏比喻 ./271646965.html
49. 陈述性学习与程序性学习 ./360120302.html
50. 智力 ./492731786.html
51. 童年失忆症 ./72792752.html
52. 记忆可提取性 ./559819340.html
53. 设立目标可以改变你的生活 ./580273089.html
54. 知道的乐趣 ./587086992.html
55. 强制学校教育 ./351869026.html
56. 自稳态的睡眠倾向 ./532216678.html
57. 我爬取了 Thoughts Memo 和 Jarrett Ye 共 1903 篇回答 ./1981333174593294847.html

← 返回目录