现在,一些 Orbit 实验正在进行中,我上个月的大部分时间里都在重新挖掘《量子国度》的数据。我发现一个令我惊讶的问题:「几乎所有人,在几乎所有时间,记得几乎所有内容。」
感情驱动的优化
记忆能有多不费力?
在极限情况下,我们可以想象自动记住我们感知到的一切。我们可能并不想要这样——像 Shereshevsky 这样的怪才经常报告他们完美记忆的诅咒般的症状。也许我们会满足于像移动肌肉一样轻松地记住或忘记一些东西。这样的世界会是怎样的呢?肯定的是,学校将不再是我们所知的那样,那么工作场所和工作室呢?人际关系呢?Borges、姜峰楠、Wachowskis 和其他伟大的科幻作家都已经描绘了这些影响,但我也对平凡的事物感兴趣:工作场所协作的互动方式的变化;突然显现的巧合和矛盾。
(当然,不费力只是许多有用视角之一!一个相反的视角指出,也许费力才是你想从你与记忆的互动中得到的东西。你希望不断质疑你认为你「知道」的事情;你希望一切都保持熔融状态,以便你能形成新的联系,以新的方式看待事物;等等......)
即使有如今的系统,记忆也远非毫不费力。我们能做到什么程度呢?通常的方法是将其作为一个优化问题来处理,但我发现,将不费力视作一种感觉是很有意义的。强大的技术感觉像是身体的延伸。边界消失了;意图和行动之间的距离缩小了。然而,如果你在铅笔上绑上一个砖块,它就不再感觉像你手的一部分。同样地,和朋友们热烈讨论时,学习似乎不费吹灰之力,但在无聊的自习室里,同样的想法可能需要你付出超出你能承受的努力。
这个视角给了我们一种不同的方式来思考如何「优化」思想工具。哪些类型的互动会产生分离感、尽职感和厌烦感?
在任何一种计算机化的学习系统中(包括间隔重复系统),无聊的一个可靠来源是感觉太容易的材料。这种材料并不是好的那种不费力气的材料。翻阅这些材料的感觉几乎就像在软件安装程序中快速运行许可协议提示。「是的,是的,我知道,我知道。」我不需要真正思考;我没有真正参与;我不喜欢被要求。有时,问题在于我实际上并不关心这些材料,在这种情况下,我真的应该删除它(也许是模糊不清地[1])。不过,很多时候,我确实关心这些材料。如果它在那一刻感觉不那么微不足道,我就会更认真地参与。
这个观察引出了学习技术中的一个经典问题:正确估计学生的知识状态,以优化学习计划。不同的是,如果我们坚持使用基于感觉的视角,我们就不会把优化本身看作是要解决的问题。我们的核心目标是实现一种毫不费力的感觉。模型优化是实现这种感觉的一种有效手段。但也有其他的手段。你无法在没有记住许多复杂规则的情况下玩《见证者(The Witress)》,但当你与环境互动时,你会自然地记住这些规则:记忆本身并不是需要努力的部分。
量子国度过度轻松的努力
在进行了这一崇高的忏悔之后,让我们把注意力转向一个不寻常的记忆增强系统的表现:《量子国度》。
请注意:这是对《量子国度》数据的非正式讨论。该分析是初步的,不应该在其他工作中引用或摘录。我这里是在开门造车[2]。
一方面,《量子国度》实现了它的承诺,帮助人们记住他们读过的内容。在第五次重复之后,大多数读者已经能够在超过一个月的时间间隔内回忆起 95% 以上的问题。这相当了不起。根据我过去阅读教科书的经验,一个月后能记住一小部分细节就很幸运了。
另一种看待这个问题的方式是「维护成本」。为了在第一年维持第一篇论文的 112 个问题,中位数读者进行了 567 次复习,消耗了约 1.5 小时。读者报告说,阅读第一篇文章需要 2-4 个小时,所以我们可以将第一年的复习看作是这些读者选择为了永久记住那篇文章所有的关键细节而支付的约 50% 的额外时间成本。我预计第二年的时间成本大约是一半,但我们还没有这方面的数据。
我想,问题在于,《量子国度》的效果「太好」了。几乎所有人,在几乎所有时间,记得几乎所有内容。
我们要讨论的麻烦始于我所说的「维持」阶段。对于一个特定的读者和问题,历史通常可以分两个阶段:最初的「学习」阶段(通常很短),在这个阶段中,读者对材料的吸收足以让他们在不同的时段记住它;接着是「维持」阶段(更长),在这个阶段中,重复主要用于对抗遗忘的侵蚀。你可以通过说人们在第一次成功重复后过渡到维护阶段,来非常好地近似这个划分。
在第一次成功重复某个问题后——也就是他们进入「维持阶段」后——中位数的读者在随后的重复中回答正确率为 95%。事实上,在所有第一年的问题历史中,82% 的问题在那之后都没有遗忘(这确实符合从 p=0.95 的二项分布给出的第一年重复次数的期望)。
这有点抽象。具体地说:在他们第一次成功的重复之后,中位数的读者在接下来的一年里,在第一篇文章的 112 个问题的 448 次复习中只忘记了 15 次。
整整一年的勤奋复习,只有 15 次遗忘!433 次成功的回忆!这里的问题并非完全是效率问题。在与读者的交谈中,很多人愿意(而且已经)支付 50% 的时间成本来彻底内化这些材料。问题并不在于 448 次复习太多,或者花费的时间太长。问题在于,复习你已经非常了解的材料感觉很无聊,就像浪费时间一样。而这大多是人们正在做的事情。
但实际上,遗忘的情况比我说的还要偏斜。如果这 15 次遗忘是从所有问题中等概率抽取的,那可能感觉还不算太糟:任何一个问题都可能是你今天遗忘的问题!但事实是,所有长期遗忘中的一半来自 12% 的问题。从情感上讲,这些问题会产生「哦,不,又是那个问题......」。相比之下,中位数问题在「维持阶段」的第一年里,每十个读者只会遗忘一次。对于 95% 的问题,中位数的读者在维持阶段的第一年里从未忘记过。因此,大多数复习可能感到乏味且没必要。
我们可能会担心,也许对中位数的读者来说一切都很好,但许多能力较弱的读者却在挣扎。毕竟,他们的遗忘在问题中高度符合幂律分布。但读者的分布并不那么明显。在第一年的维持阶段中,我们的第 25 百分位的读者在 483 次重复中忘记了 35 次。第 10 百分位的读者在 516 次重复中忘记了 59 次。而且,这些遗忘集中在相对较小的问题池中。即使是对相对较不成功的读者而言,绝大多数的问题也没有出现遗忘。
当遗忘确实发生时,通常情况并不那么糟糕。一种看待这个问题的方式是,询问连续多次忘记的问题有多频繁,以至于读者无法在他们之前能够跨越的间隔内回忆起一张卡片。这几乎从未发生:在大约 2% 的第一年读者/问题历史记录中会出现。因此,我们的「实证保留」进度指标是一个相当好的指标。一旦你证明了一个特定的保留间隔,只要你继续复习,你就非常不可能失去它。如果确实发生了遗忘,那么它「倒退」到读者无法记住五天的概率只有 7%。这里提醒一下,《量子国度》在一个问题被遗忘时,大致会将复习间隔减半。鉴于这些数据,Anki 在每次遗忘时将间隔重置为零的默认行为在我们的情况下似乎特别不合适。
这里的意思是,我们也许应该更激进地拉长复习安排。是的,这将使体验更高效;但我真正关心的是,这可能会使体验不那么乏味。
这个复习安排到底应该是什么?许多论文建议为这些复习安排建立动态且复杂的模型,也许我将在某个时候实现一个。理想的复习安排应该在避免枯燥乏味与其他重要的感觉变量进行权衡:与材料的联系,重复忘记同一事物的挫败感,复习时机的可预测性。就低垂的果实而言,简单的启发式方法能走多远令人惊讶。例如,当读者在阅读文章时和在第一次复习环节上都成功地回答了一个问题时,接下来一年中,96% 的历史记录中没有出现遗忘。可能可以安全地大幅度地拉长它们的间隔。
仅通过关注过于简单的问题,我们可以很容易地想象,把维持第一年所需的重复次数减半,甚至更多。如果我们这样做,第一年的复习次数就会从 567 次减少到 343 次,减少了 40%。第一年保持记忆的边际时间成本将从 50% 下降到 30%。
我呈现的数据对反事实并没有太多的说法。如果间隔是现在的两倍,我们会看到更多的遗忘,还是会看到混乱的局面?我一直在沿着这些思路进行对照实验,它们产生了非常有趣且令人困惑结果......这将不得不等待另一个时间。
助记媒介的复习安排与现有的 SRS 模式相比
几乎所有围绕间隔重复系统的工作——包括学术和商业——都集中在定义上:语言学习者的词汇、医学生的术语、历史课的人物和事件,等等。这类知识往往是相当随意、缺少联系的,因此我怀疑它被遗忘得更快。
《量子国度》的复习安排相当激进。我们从五天的时间间隔开始,每次重复都会增长 2-3 倍。默认情况下,Anki 从一天的时间间隔开始,增长 1.8 倍。然而,我们仍然看到很少有遗忘。我不认为问题出在 Anki 的疯狂保守上。我认为这是因为概念性的知识,在一个叙述性的弧线中被引入,并与先前的知识彻底相连,与词汇的记忆动态非常不同。助记媒介的复习安排可能应该与传统的间隔重复系统的复习安排有很大的不同。
SuperMemo 用「卡片复杂度」建立了类似于我所描述的效果的模型,但由于每个用户都建立自己的数据库,它必须从几个点的样本中估计每张卡片的复杂度。助记媒介的共享问题创造了一个有趣的机会:卡片的复杂度可以通过汇总许多先前用户的尝试来估计,而通过比较他们在文章中的表现和先前学生的表现,可以估计一个新用户对材料的现有熟练程度。这种类型的方法已被用于安排西班牙语词汇练习的模型中,我对探索它在更多概念性题目上的表现很感兴趣。助记文章(与词汇表不同)面临的一个显著挑战是,这些问题高度相互依赖。复习一个问题使读者更有可能回答其他各种相关问题。因此,我可能需要将像我所描述的模型与深度知识追踪这样的模型结合起来,后者可以解释卡片间的相互作用。
我还不确定我想在这种优化上走多深。在这个领域有很多机会可以探索,而我的时间又是如此之少!事实上,有许多简单的杠杆可以让人感觉不费力,而不涉及实际减少重复的次数。例如,当我们将复习「分批」进行,使相邻几天的小型复习环节合并为一个完整的环节时,复习环节的读者感到复习的负担大大减轻。
在未来的一篇文章中,我将探讨多个实验是如何努力测量《量子国度》上任何明显的遗忘时间的。直到下一次,感谢你们的支持。
Thoughts Memo 汉化组译制
感谢主要译者 GPT-4、校对 Jarrett Ye
原文:Too easy to be effortless | Patreon 上的 Andy Matuschak
作者:Andy Matuschak
参考
1. 「跳过」:指数补偿的延迟机制和模糊收件箱 ./566834806.html2. 开门造车 ./457529308.html