← 返回目录


6 学习内驱力和奖励(6.1-6.10)

学校≠教育≠技能;文凭溢价=80%信号传递+20%人力资本

76 👍 / 14 💬

原文:6.1 The main problem in education


6.1 教育中的主要问题

关于教育的主要问题是认为学习可能会引起不快,而且应该忍受[1]这种不快从而学的更多。

有无数的教育者认为学校应该像工作一样:它令人不快,但它只是需要去做。在这一章中,我将解释相反的才是对的:

好的学习本身就是快乐的,没有快乐就没有好的学习。

不快的错误观念如此普遍,以至于即使是对学习乐趣有广泛了解的好老师也认为,学生在学校有一定程度的不快是不可避免的。

在这一章中,我展示了学习的快乐与大脑息息相关,以及我们如何以人类的健康、学习、创造力以及最终的未来为代价,系统地摧毁这种进化的天赋[2]

教育的主要问题也是社会的主要问题之一。我们破坏了学习的乐趣,也就大大破坏了生活的乐趣。我们建立了一个教育系统,让数百万人过上不幸福的生活。

你可能对我的话持怀疑态度,因为不愉快的学习的错误观念是学校教育的一个强有力的副作用。因此,本章试图说服你。消除这个错误观念所需要的只是理解大脑中编码新知识的简单机制。

6.2 学习内驱力和熵

熵的概念有助于理解为什么大多数孩子在学校没有学到多少。

你们可能从物理课回忆起熵是无序的度量,热力学第二定律表明孤立系统的熵永远不会减小。这是一种形象的物理定律,我们会终生铭记。这是普遍适用的

信息论中有一个姊妹概念叫香农熵。它可以理解为由一个来源发送的信息的平均值。例如,假设一个渠道连续不断地将一串相同的字母传送到无穷远处(例如,一串 A :「AAA……」)中。这是完全可以预测的,并且熵为零。我们不会从这样的渠道学习。

Claude Shannon 在1948年提出了信息熵的概念。不久之后,科学家们开始假设信息渠道的熵是否会对大脑感知渠道价值的方式产生强大影响。1957年,Meyer 假设音乐的熵决定了人们对音乐之美的感知。他的结论是,较高的熵可能会导致主观紧张,这与更有意思的音乐片段有关。

Meyer 的思想后来被改进,以更好地理解对音乐和普通信息的感知。音乐不仅仅是信息。这通过一个现象来看是很显然的,因为一首歌被多次回放可以令人愉快好多次。但是书籍很少出现这种情况。

音乐是一种普遍的信息。如果你被允许选择一个无线频道,你会很快从嘈杂的静电干扰中调谐出来,你也不会对零熵的静音太兴奋。但是,大多数人会对有规律的鼓声做出积极的反应。只要它没有被敲打在碎玻璃上(这是我们天生不喜欢的),我们就会发现一个有固定鼓点的广播频道比无声的更有趣。这自然只会持续一段时间,直到鼓点本身变得无聊和太容易预测。

今天,我们终于可以测试大脑对信息熵的反应了。神经影像显示前海马对视觉信息熵有反应腹侧纹状体也有类似的发现。因此,我们现在可以肯定大脑对信息熵有反应。熵感受器在扫描环境寻找学习机会时非常重要。这是奖励的前奏,而奖励是学习内驱力[3]的基础。

6.3 信息搜寻中的预备知识

我们需要区分信息和意义。熵不是衡量后者的一个好指标。意义的度量除了度量信息渠道之外,还必须涉及到大脑本身。预备知识在学习中是必不可少的。想象一下,当你在收音机上搜索一个有趣的频道时,你会发现一个新闻服务。如果服务是用泰语提供的,而你不会说泰语,那么你会更喜欢用英语提供的服务。就信息而言,两个新闻频道可能有相同的熵,但是你的预备知识会让你选择英语频道。泰国频道传递声音流,而英语频道传递概念[4]流。如果不了解接受者的知识,信息熵就无法告诉我们什么。我们无法确定信噪比。

每个听者都有自己偏好的信息熵水平。对于大多数音乐爱好者来说,迪斯科或电子乐的常规节拍要比单独的鼓声有趣一些。这种类型的音乐承载着更高的平均信息量。对于一个更老练的听众来说,有一点切分音是将更受欢迎的。然而,切分音需要一定程度的预先学习。那些对音乐了解较少的人可能会被增加的节奏复杂性弄糊涂。如果节拍中有太多的信息,就不可能随着音乐起舞。对于一般人来说,Wynton Marsalis 的天才可能很难被察觉。顶级爵士音乐只为一小部分受过高等教育的听众准备,就像大多数人一样,随着复杂性的增加,音乐慢慢向无线电杂音的方向衰变。

6.4 大脑中的熵检测器

大脑无法有效检测撞击视网膜或耳膜的信号的熵。就像显示器上的像素一样,视网膜细胞也不知道它们传达了什么。如果检测器,如海马体,要根据熵而响应,它必须对来自内嗅皮层的输入(即海马体本身的输入)进行操作。这些输入将在高度处理后显示信号。它可能会呈现一个概念,而不是像素。感觉输入端的高熵信号将在神经选择、完善和泛化[5]过程的早期失去大部分噪声成分。信噪比将决定丢失多少信息。噪音越大,损失越大。我们越聪明,这个处理过程就越有选择性,在那个阶段会丢失越多信息。这很好。我们对细节视而不见。模式识别就像一个确定性函数,根据定义,它会导致熵的下降。复杂的模式可能会变成简单的概念。这些概念将为检测器提供实际输入,例如海马体。

请注意,实验中产生的视觉流证明海马体对信号熵的反应具有高度象征性[4]。因此,视觉流在处理过程中丢失的信息会少得多。这一高度简化和概念化[5]的信息将会被扫描为意外,并为整个学习内驱力系统提供指引。这就是为什么在这种情况下,海马体似乎对输入熵有反应。

上面的推理解释了为什么低熵和高熵的感觉信号都是无趣的。经过一定程度的处理后,高熵信号可能会失去所有噪声,并向海马体传递低熵输入。然后,我们观察感官输入时「最佳熵」水平的错觉。我们需要一个新的概念,学习熵,来帮助我们准确地判断信号的吸引力。学习熵需要考虑信息的高度处理,然后才能激活大脑中的奖励中枢。本文稍后将讨论学习熵[6]

6.5 信息处理速度

感官信息扫描中一个被低估的因素是大脑中信息处理的速度。

对于每一首音乐,都有一个可以接受的播放速度范围,在其范围内我们可以欣赏音乐之美。高速播放可能会很烦人,而且音乐可能变得难以解码,因为高速超出了我们的处理能力。同一首音乐如果放慢了速度,很快就会失去吸引力。演讲或课堂讲授也是如此。对于相同的信息和相同的熵水平,我们可以实现完全不同的信号吸引力水平。总是有一个最佳的传授速度,该速度取决于影响学习内驱力[3]的所有其他因素,包括预备知识。因此,传授速度是高度个性化的。

我喜欢以 1.4 倍的速度听讲座。我用 1.3 倍来听更有挑战性的片段。虽然我从来没有加快 Fareed Zakaria 的速度,但是我享受这个节目中的每一条信息。课堂上的学生没有加速或减速按钮。即使是暂停按钮,如果有的话,也很难去点击,因为这可能会惹恼其他学生。

在学校里,传授的速度常常超过学生的处理能力。这导致了微不足道的学习和强大的压力。没有时间欣赏高速列车窗外的风景。在麻省理工学院,他们称之为「用消防水管喝水」。

6.6 概率与知识

低概率事件携带更多信息。平均信息决定熵。预备知识决定了对信息通道的熵的感知。

如果你碰巧收听了广播新闻,并且听到「Janet Jackson 逊生了一个孩子」,你的兴趣程度将取决于事件发生的概率。如果你不知道 Janet Jackson 是谁,这是一个高概率事件。如果每天约有35万名女性分娩,这已经不是新闻,也不是新鲜事或有趣的事。一名士兵在战争中的第一次死亡将成为新闻,但是当死亡人数增加到成千上万时,年轻的生命将只是一个统计数字。

如果你碰巧认识 Janet Jackson 或者喜欢她的音乐,那么生孩子的概率会急剧下降到「一生一次」的水平(对 Janet 来说)。这会让你变得有兴趣。然而,如果你记得 Janet 是古代情景喜剧中的一个漂亮女孩,她生孩子可能会被归为「不可能!」。如果你意识到 Janet 50 岁了,并且你知道更年期,你可能会立刻对她的情况产生病态的好奇。你预备知识决定了你对信息的反应。信道没有最佳熵水平,只有最适合特定大脑的熵水平。在这一点上,你可能会看到,我们需要引入一个新的衍生概念,我们在之后将称之为学习熵。学习熵将决定一个特定的通道对一个特定的大脑的吸引力。

如果你喜欢 Janet 式的八卦,那么这个八卦频道会给你带来恰到好处的意外。它将提供学习匹配。如果你缺乏相关知识或者你的优先级不同,你就会对它置之不理。你的学习重点也将决定你在特定领域的知识水平,以及你对任何特定渠道及其信息熵的反应。

6.7 可预见性和意外

概率和复杂性不是信息感知的唯一组成部分。我们似乎在寻找可预测性和意外之间的平衡。我喜欢乡土爵士乐。在这种类型的音乐中,低音部通常是高度可预测的,伴着最佳的切分音数量。这使得身体运动与节奏同步变得容易。然而,如果没有意外,乡土爵士乐就不会有意思。在这里,复杂的爵士乐即兴表演会刺激负责检测「意外」的神经系统。此外,经过几十年的学习,我的大脑有一个完整的信号数据库。可能有一个我认识并喜欢的伴唱歌手的声音。我的大脑已经准备好迎接乡土爵士乐了。

我喜欢 Ken Robinson 关于创造力的讲座。在某种程度上,它们是高度可预测的。我完全同意 Robinson,所以你可以说 Robinson 助长了我的证实性偏见。这很愉快。当人们与我们观点一致时,我们喜欢说「英雄所见略同」。但是,如果 Robinson 继续重复同样陈腔滥调,讲述学校如何扼杀创造力,他将失去吸引力。熵可以解释为平均预期意外。Robinson 的讲授带来了很多意外。他可能会以不同的、不同寻常的创造性方式描绘相同的模型。因此,大脑接收新的信息,产生泛化,并确认现有的模型。从新的语境中得出的泛化可以增强知识的连贯性[7]。在基于已知模型的消息中,这是一种非常令人愉快的补充。

Robinson 的讲座在可预测性和意外之间找到了很好的平衡。

最令人愉快的信息渠道将不断提供意外,证实现有的模型,并在新的语义分支中武装它们,在这些分支上可以建立新的知识。一个破坏现有模型的意外起初可能并不令人愉快,但可能会导致一场非常令人愉快的思维革命。

打个比方,你可以想象这是一个信息渠道,修剪你的知识之树,并添加新的分支,就像一个陶工在他完美塑造的作品上添加新的粘土层[8]一样。

6.8 检测意外

人类的学习内驱力[3]是基于对意外的检测。我们已经知道这一点很久了。人类和机器学习模型都以不同的名称涉及到这个概念。Piaget 写过,图式在意外的影响下陷入失调。Jeff_Hawki 在他的新大脑皮层模型中谈到了基于学习和智力的预测错误。我喜欢谈论模型,以及它们的细化(当新数据适合模型时),或者矛盾(当新数据需要改变模型时)。

为了获得学习的奖励,一个新的令人意外的信息需要与预先存在的知识(模型、图式、预测等等)相容。为了获得奖励,神经处理是必要的。关于输入的信息需要被处理,并与存储在大脑中的信息进行比较。大脑输入信息的主要处理器之一是海马体。大脑的信息交换台能够将输入与先前的知识进行比较。

视觉流的熵的测量不一定是信息通道令人快乐的能力的可靠指标。流向海马体的所有信息都经过高度处理。代表美丽海滩的像素流将被加工成一系列形状和纹理。反过来,这些模型将依次模拟棕榈树、沙子和大海。这种高度压缩的简单信息将决定对信息输入的最初响应。

扫描环境中的信息如同扫描食物的气味。气味很诱人,但只有实际去吃才是真正的回报。这就是熵扫描不需要回报的原因。它所需要做的就是获得奖励。如前所述,前海马对熵有反应,然而实验设计确保熵是指输入过程中不会丢失太多信息的简单形状的组合。与其说是信号熵,不如说是信息比较器(如海马)的输入熵。重要的不是视网膜像素,而是比较器输入上表示的手掌形状。对于比较器来说,灰度或静态噪声的高熵模式与白度或静音没有区别。它们在输入时都会带来相同的熵:零。这就是为什么我用「学习熵[6]」这个词来准确地描述信息渠道的吸引力。

响应信号熵的前海马体因发现 Halle Berry 神经元而闻名(参见更多)。研究人员将电极植入一名同意接受治疗的癫痫患者体内,发现在不同情境下,单个神经元对 Halle Berry 图像的反应是一致的。同样的神经元也会对 Halle Berry 的名字做出反应。与此同时,后海马体对 Jennifer Aniston 的反应可能不那么一致(这可能是前一层神经处理的迹象)。

我们大多数人都不知道 Halle Berry 的气味如何,她的气味可能不足以激活海马体中的 Halle Berry 神经元,然而,即使是气味信号也可以通过嗅球、嗅结节、松果体皮层和内嗅皮层中的几个突触快速到达那里(见下图)。然而,如果一个人能听到 Halle 的声音,声音信号可能会在嗅结节中出现,加强识别,并导致海马或更下方的新皮层中 Halle 神经元的激活。



:嗅觉系统解剖学。嗅觉信号可以通过嗅球、嗅结节、小齿轮状皮层和鼻内皮层的几个突触快速到达海马体。(来源:维基百科)

这是否意味着 Halle 会永久地存在于患者的海马体中?由于海马体与新记忆的形成有关,我们可能会认为 Halle 出现在海马神经元中是识别的结果。她在病人心中的永久位置可能位于新皮层的更深一层。我们现在知道,在记忆巩固的过程中,知识印记从海马体转移到新皮层。我们也非常肯定这个过程是在睡眠中发生的。正是在新皮层,我们应该寻找代表 Halle 或某人祖母的概念神经元。最后一种可能性产生了一种假设的神经元类型,称为祖母神经元

在猴子身上,研究人员可以识别出视觉皮层中对面孔做出反应的祖母神经元。在那里,我们可能会发现在看到 Halle 的图像时神经元会更加稳定地激活。然而,Halle 的概念可能仍然存在于其他地方,并在注意到 Halle 时被视觉皮层细胞激活。

另一个激活途径可能是从新闻上听到 Halle 的名字。整个识别过程将由内嗅皮层和海马体协调进行,而最终的 Halle 神经元将在新皮层的某处激活。

要让富含信息的信号产生奖励,必须有一个低概率事件在输入时被检测到,并通过联想将其编码为大脑皮层中的新知识。当前海马对熵做出反应时,广泛的双侧丘脑皮层网络的活动会受到意外因素的调节。在那里,我们将寻找学习快乐的根源。根据消息的类型,还可能涉及其他比较器中枢。人们还发现,当检测到新的视觉信号时,杏仁体可能会产生奖励。对奖励视觉刺激做出反应的杏仁体神经元也可能对新的视觉刺激做出反应。Rolls 假设,这可能通过杏仁体来实现对新奇事物的奖励。

我们知道海马体直接与伏隔核(大脑快乐中枢)相连。此连接适用于两种情况:

  1. 对快乐的预期;
  2. 最终的奖励。

在预期检测到一个高学习熵[6]信号后,就会产生对高价值信息的积极追求。海马体检测到一条信息后,可能会同时将相关的学习信息发送到大脑皮层,并向快乐中枢发送奖励信号。这将意味着学习新东西的时刻!

6.9 「哇」因子

1977 年夏天,在寻找外星智能的时候,SETI 的研究人员发现了一个来自射手座的不寻常的无线电信号。在宇宙空间微弱的低水平噪声中,信号是极不可能出现的。低概率标志着高意外。天文学家 Jerry Ehman 在打印输出上圈出6个与信号相对应的字母,并在旁边写上了「Wow!」(哇!)。



:一张彩色电脑打印出来的原始拷贝扫描件,拍摄于1977年哇!信号。(来源:维基百科)

「Wow!」 是大脑对突然发现的反应。这一刻非常愉快。学习内驱力[3]的全部目的是在环境中寻找「哇」因子。这些是最有价值的知识,补充了目前已知的:当前的现实模型。渐进阅读的乐趣来自流入学生大脑的涌动的「哇」的力量。

到目前为止,我们已经看到熵、意外、可预测性和预备知识对学习的影响。在这种情况下,只有信号的概率并不能完全解释它的力量。它的解释在本文的后面(参见:知识评估网络)。Ehman 在写这篇文章的时候,能够感觉到它所蕴含的巨大意义。这是迄今为止,也是从那时起,证明除了人类文明以外,还有其他文明存在的最有力的证据。如果相同的信号出现在检测海洋中的沙丁鱼,就不会有「哇!」。即使在北极也不会有。

信息渠道的可靠性很重要。如果错误率高,学习内驱力[3]可能会减弱。当 Penzias 和 Wilson 在 1964 年发现宇宙微波背景辐射时,并没有「哇!」。困惑的研究人员继续从他们的无线电天线上移除鸽子粪便。解释神秘噪音时,他们优先考虑了鸽子粪的原因。1978 年,Penzias 和 Wilson 因为他们的发现获得了诺贝尔奖。

当一个科学家有了一个发现,他可能会惊呼「尤里卡!」和手舞足蹈。他大脑中某个地方的神经网络产生了一种泛化[5],结果发出了奖励信号。这进一步传播,让一个老人像孩子一样在实验室里跳跃。

人生早期也是如此。一个在空房间里蹒跚学步的孩子会寻找环境中的低概率成分,比如彩色物体、新玩具等等。当一个蹒跚学步的孩子用勺子从桌子上掉下来做实验时,她就像一个小科学家。然而,当大脑做出「所有落下的勺子都会发出声音」的泛化[5]时,她也会得到奖励。她可能会以和快乐的科学家完全一样的方式庆祝,与年龄无关。一个大大的微笑是第一个明确的信号。

在由学习内驱力[3]控制的各种形式的学习中,同样的快乐在较小程度上也会发生。不管我们是否了解名人或岩石的化学成分。事情很有趣,因为它们通过学习内驱力机制奖励大脑。

一个创造性的过程也会产生奖励。一个被认为有用的联想是有回报的。一个能解决难题的联想更有价值。显然,奖励是有等级的。该系统可以量化信息、联想或解决方案的概率。概率越低,奖励越高。

6.10 知识评估网络

6.10.1 知识评估

大脑处理过的所有知识片段都会立即评估其相关性、连贯性[7]和价值。我们能立即知道这些信息是否可以理解的和有用的。当它们前后矛盾不连贯[7]或不相关时,我们也常常会立即注意到。

不寻常和令人惊讶的知识非常有价值,然而,从大脑的角度来看,概率并非价值的最佳反映。有极不可能发生的低重要性事件(例如,小行星撞击遥远的行星系统),也有很可能的发生改变一个人生活的事件(例如,「你愿意嫁给我吗?」)。

6.10.2 感性脑和理性脑

知识评估网络是一个基于感性评估和理性评估相结合的评估系统。感性评估将把信息与原始大脑中枢负责饥饿、口渴、性冲动等的奖励联系起来。理性估值将以知识为基础。纯粹感性评估的一个例子是对「最近的快餐店在哪里?」的回答。基于知识的评估可能更加复杂和高度网络化,也就是说,依赖于一个次级评估网络。对「哪本书最适合我的考试?」的回答通过一个人的目标来评估,包括通过考试,获得影响工作前景的学位,并为终生目标做出贡献。感性和理性的评估在解剖学上是分开的。感性评估来自于被比喻为三位一体大脑中更古老的部分:爬行动物和古哺乳动物结构。例如,丘脑处理的特定刺激可能会向杏仁体发送单独的信号进行感性评估,向新皮层发送单独的信号进行理性评估。感性化的大脑在基因上更古老。个性和教育决定了理性评估是否能控制或超越感性评估。

6.10.3 快速思考中的决策树

知识评估网络是决定单个知识块价值的记忆关系网络。如果将学习解释为一项任务,评估网络将决定感知到的任务价值

用计算机的术语,知识评估网络可以比作决策树。目标和情感决定了树根的核心价值。知识片段之间的语义联系可以被解释为从目标到细节的部分价值转移。精心整合和精心选择的知识的组织良好的语义网络需要几毫秒才能做出专家决策。这就是卡尼曼所说的自动快速思考(如果你对需要缓慢解决问题的棘手问题感兴趣,请参见如何解决任何问题?[9])中。同样的过程,作为决策或解决问题的基础,参与知识评估。像许多专家的决定一样,评估速度很快,而且通常是在意识参与度很低的情况下进行的。简而言之,我们有时很快知道一些事情,却无法完全解释原因。这个过程几乎不受我们自己的控制,更不用说学校老师的控制了。为了有效学习,估值必须很高。



: xefer是一种工具,有助于将知识理解为网络。它依赖维基百科文章之间的语义链接。试试看

6.10.4 教育中的评估网络

大脑在几年到几十年的学习过程中建立了一个评估网络。通过睡眠中的优化和遗忘,网络被打磨和抛光,以实现高效运行。这使得采取估值捷径变得容易。一个学生在选择一本书时,可能不再把考试放在他整个人生的大背景中去考虑。他可能已经找到了一条捷径:「在接下来的3个月里,我只想通过地质学」。

知识评估网络是高度专业化的,个体间的差异很大。理性和感性之间的平衡会有所不同。目标之间的平衡会有所不同。评估网络在罪犯的思维中会有不同的形状,在怀有以人类利益为基础的崇高目标的研究人员的思维中也会有不同的形状。

网络的发展将取决于个性、人生经历和环境。一些性格特征,例如脾气暴躁,可能会助长犯罪心理的形成。生命早期的一些创伤性事件可能助长基于单一想法的有偏见的网络的发展。环境和现有知识将决定激情、兴趣、目标和网络次级评估。

发展健康的评估网络的理想途径是一个远离创伤和长期压力的童年[10],没有外部压力影响感性评估,有大量的娱乐活动,在广阔的行为空间自由学习[11]

所有促进大脑健康发展的策略也将促进饱满、高度个性化和高效的评估网络。这些都将成为学习内驱力[3]的基础。所有教育工作者都同意,我们希望帮助孩子更好地掌控他们的情感生活,培养聪明、有创造力和知识渊博的大脑。

教育系统的主要问题是一种千篇一律的方法,在这种方法中,所有的孩子都以流水线的方式接受相同的知识,而很少考虑有效学习的关键组成部分:学习内驱力[3]。学习内驱力是一种完美的计算系统,它能将「大脑中代表知识的语义网络的当前状态」与「知识评估网络响应环境中可用信息而产生的当前输入」相匹配。如果这个孩子坚持要看 YouTube 上的视频,那么他自己的大脑就是最好的权威。所有干涉都会影响未来的独立性和创造性。

虽然讲课老师可能会花 45 分钟给孩子灌输一长串符号,这些符号会产生低估值和可忽略不计的记忆,但是同一个孩子可以在 3 - 5 分钟内访问谷歌,识别出具有高价值的信息,并且容易编码终身保留。对于在这一过程中受过良好训练的孩子来说,在自学过程中获得知识的效率可能会提高一个数量级。当我说「数量级」时,我只是谦虚和保守。我不想遭到夸张的指责。我在本文其他地方列举了几个具体比较的例子(例如一个月内学习学校13年所教的知识,或者在假期学习速度加快1600 % )。

在我谈到知识的金块时,Peter Thiel 谈到了幂律:经过磨练的一小部分核心技能可以带来指数级回报。

对学习的小投资可以给个人生活和整个地球带来巨大的变化

6.10.5 影响生命过程的知识评估

我的学校试图阻止我一生中最好的事情

我有我自己鲜明的例子来说明评估网络在对抗教育系统方面的力量:

1985 年,我算出了发展长期记忆所需的知识复习最佳间隔的近似函数。这是就是 SuperMemo 的诞生。最初,这个函数是用笔和纸来实现的。几个月后,我意识到这个系统非常强大。我知道我可以用电脑把它的力量翻倍。然而,我不知道有谁能根据我的函数来编写学习软件。那时候,波兰的所有程序员是要么是在大型机上写 Fortran 或 Cobol 的老家伙,要么是在使用 ZX 81、Commodore 64 或 ZX Spectrum 等微型计算机的越来越多的业余爱好者。我决定自己写这个程序。但是我没有编程技能。我是计算机科学的学生,我向老师寻求帮助。然而,我们唯一的编程课程是 Datapoint 汇编语言。这些技能对于玩玩寄存器得出 11 * 11 = 121非常有用。但我想学习一些对 SuperMemo 编程有用的东西。我的学校一直要求我学习计算电路的电阻,或者学习符号积分。我的知识评估网络产生了一个简单的输出:编程技能——> SuperMemo ——>更快的学习(在所有领域,包括电子或微积分)。我决心学习编程。我的学校决心阻止我(通过要求选修其他必修课程)。无奈之下,我报名了经济大学,该大学开设了算法语言课程。这门课程的重点是 Pascal。我不得不在做平时的功课的同时,在额外的时间里学习 Pascal。那门课程不错,但我们都在学习理论。纸上谈兵。当时(1986 年)波兰大学里的个人电脑很少,大多数实用的应用都在名为 Odra 的大型机上运行(从 1960 年开始,为在波兰的苏联集团生产)。当我终于得到了我的第一台电脑:ZX Spectrum(1986 年 1 月 4 日),我终于可以开始学习编程语言了。在电脑到来之前,我开始写我的第一个程序!在纸上。这是一个组织我一天的计划(类似 SuperMemo 中的计划)。不久之后,我也学会了 Pascal。首先,我必须减少学校的不良影响,减轻课业负担。我和我的电路老师达成了协议。我会为他做一些高通滤波计算,这将是提高我 Pascal 技能的机会。这个程序花了很多小时来写,简直是浪费时间。这是糟糕学习的完美例子。我几乎不明白我自己的程序是如何工作的。然而,这仍然比仅仅学习图解要好。就编程而言,那段学习很好,我的技能提高了很多。

对那些不懂编程的人来说,很难用语言表达出来,但是大学课程和自己编程之间的知识价值差异相当于李子和木星之间的大小差异。当我的同学们在电子学和计量学方面苦于无聊的讲座时,我已经可创业了。我在学校什么也学不到。我可以在 Pascal 的课外课程中学到一点。然而,只有激情和明确目标支持的实用知识才是重要的。到了 1987 年 12 月,我的努力达到了顶峰,写下了第一版 SuperMemo,这彻底改变了我的人生历程。我的导师 Zbigniew Kierzowski 博士的开明态度让我把我的硕士论文全部奉献给 SuperMemo 这个主题。80 岁生日快乐,Kierzkowski 教授 !对于一个学生来说,在这个尺度上做出自己的决定,然后再加上论文是用英语写的,这是非常不寻常的。这一事实在今天并不罕见,但它涉及到1989年的一场大规模行政和战术斗争。

我的学校差点毁了 SuperMemo,它是我现在快乐的主要来源。这里没有恶意。我的大部分大学老师都是了不起的人。但学校是一个系统,旨在通过严格的课程来挤压学生,而不是给他们创造表达的空间,然而创造表达的空间是教育的最好的基础。

我的学校积极地试图阻止我完成我整个职业生涯和未来最重要的事情如果我更听话,更顺从,更善于忍受社会压力,我会成为一名「更好」的学生,在电路学、微积分、计量学和抽象代数的理论上投入更多时间。其结果是,这篇文章永远不会被写出来。这个网站也将不存在。

我不会用我现在的生活去换取任何研究或行业上的其他职业。通过产生基于强大的知识估值网络的抵抗,我挺过了否认我的攻击。

我们需要设计一个教育系统,让孩子们不需要为发展权利而斗争。

上一章:5 学校教育对学习内驱力的影响

下一章:6 学习内驱力和奖励(6.11-6.16)


参考

1. 磨难就是荣耀? ./253184005.html
2. 教育抵消进化 ./66279009.html
3. 学习内驱力 ./52990549.html
4. 抽象知识 ./270927894.html
5. 泛化 ./264989664.html
6. 学习熵 ./64572381.html
7. 连贯性 ./264327134.html
8. 拼图游戏比喻 ./271646965.html
9. 如何解决任何问题? ./351779186.html
10. 压力适应力 ./73207325.html
11. 自由学习 ./272543239.html

专栏:学校教育问题


← 返回目录