原文: Andy Matuschak and Michael Nielsen, How can we develop transformative tools for thought? October 2019
译者: @叶峻峣 @Shom @Mass Point (排名不分先后)
译者按
作者 Andy Matuschak 是软件工程师、设计师、研究员,目前致力于拓展人们思考和行动的技术。他曾在 Apple 帮助构建 iOS,并在可汗学院领导研发。
作者 Michael Nielsen 是量子物理学家、科学作家、编程研究者,现供职于 Y Combinator Research 。他在 Nature 等期刊发表过多篇高引论文,他写作的量子力学和深度学习教材也广受欢迎。
两位作者都对间隔重复系统在知识传授方面的应用抱有极大的期望和信心。
这篇长文对基于抽认卡的间隔重复系统指出了新的方向:将系统嵌入到富含知识的文本中,让记忆成为读者的一种选择,而非偶然。
翻译水平十分有限,欢迎指出错误。
和原文一样,本文以 CC BY 4.0 协议发布
附注:觉得文章太长的朋友,可以先拉到底部看总结。[^1] 表示注释,请善用页面内搜索来查看注释内容。
谈起关于计算机起源的那些神话,常会提到被称为「黄金年代」的上世纪 60 年代与 70 年代。在那段时间里,许多高瞻远瞩的开拓者都在追求同一个梦想,即通过计算机发展强大的思想工具,也就是能增强人类智力的工具[^1]。这些开拓者中的一位,Alan Kay,在阐述个人电脑的潜力时,总结了他们对这个梦想的乐观愿景:「它(计算机)将会改变整个文明的思想模式」[^2]。
这无疑是个振奋人心的梦想,也促成了许多伟大发明,如现代交互式图形界面、视窗界面、文字处理软件等。但是回顾过去,我们还是不免感到失望,因为计算机还是没有像语言和文字这些更早的思想工具那样,给整个文明的思想模式带来了变革性的影响。当今,科技界常常提及这些开拓性的梦想,但口惠而实不至。怀旧唏嘘之外,对于创造变革性的新思想工具这一愿景,没有任何坚定追求者。
现在,是时候继续为这一愿景努力奋斗了。在这篇文章中,我们描述了一些想法,以助力开发变革性的新思想工具。在文章的第一部分,我们描述了一套我们开发的实验性的系统原型,一种用于增强记忆的助记媒介。这个项目还在进行中,因此这些文字相当于项目快照,以来详细介绍一些令人鼓舞的进展,个中的许多机遇和挑战。在文章的第二部分,我们扩展了讨论的范围。我们对其他几个原型系统进行了概述,还讨论了这样一个问题:为什么业界不愿意花力气开发变革性思想工具?
在文章的开头我们提到了一些开拓者的名字,实际上这样的开拓者还有很多,如 Ivan Sutherland、Seymour Papert、Vannevar Bush……在网络上对这些先贤都有着很高的评价。当然,他们都配得上这些评价,但是这种崇敬可能会演变成对往昔的过度尊崇,进而认为昨日巨擘满堂,现在今人了了。是,这些大师确实取得了惊艳的成就,甚至可以说他们的工作模式是现代工业界和学术界的技术专家都没有能力继承的。但是他们也会犯错,而且对那些现代的重大想法一无所知。因此,贯穿文章两个部分的一大主题是找出更多有用想法,他们可能不为人知或仅仅停留在理论层面。从这个主题也衍生出一个信念,也就是现在还是有许多非凡的机遇。
解释一下「思想工具」这个名字:「工具」这个词是经过审慎选择的。在这里,「工具」有一定的特指。Alan Kay 曾经说过[^3],(相比于开发思想工具)一个更有力的目标是开发一个新的思想媒介。比如说,Adobe Illustrator 这样的媒介,在本质上不同于其所包含的任何单个工具。这样的媒介创造了一个强大的沉浸式环境,有利于孕育新的想法,离开此地则断不能有。大概,基本部件和动作组合起来构成的媒介,在思想表达上有整体大于部分之和的效果。仔细地选型构建,思想媒介就会扩大人类思想的疆界。
不过,自从 Iverson[^4]在 20 世纪 50 年代和 60 年代在文章中提出此词以来,「思想工具」一词已经被广泛使用。因此,我们也会尽可能使用「思想工具」一词,当然我们有时也会扩大其外延,偶尔在合适的时候用「媒介」这个词。
让我们回到开头的那句话,「改变整个文明的思维模式 」。听起来很荒唐,像是科技味的卜辞。不过,这种改变在人类历史上已经上演多次:语言、文字的发展,以及其他强大的「思想工具」。而且,无论如何,计算机在过去 60 年里确实影响了人类文明的思维模式,并且未来可期。本文便试图在此贡献一份力,来帮助理解这些变化是如何发生的,以及还有什么仍可能发生。
音乐家兼喜剧演员 Martin Mull 说过,「用文字描述音乐就像用舞蹈描述建筑」。同样地,对于描述思想工具,书写也存在先天不足。因为全新思想工具的成功,全然在于开拓思想疆界的能力大大超越现存工具,就比如超越写作这一工具。新工具的变革性越强,与旧有工具开拓思想疆界能力的差距也越大。而其反作用就是,差距越大,这种新工具就越难用书写表达清楚。但是文字有引导读者的作用,这也是我们写这篇文章的原因。写作是确定杠杆点的一种方式,可能会有助于新思想工具的开发。所以让我们继续吧。
第一部分:记忆系统
助记媒介介绍
量子力学和量子计算是常人眼中最艰涩难懂的学科。主流媒体经常由此来逗笑(或者恐吓)读者,引用一些著名物理学家的名言,比如「任何认为自己已经理解了量子力学的人都没有理解量子力学」。
什么因素让这些科目变得如此困难?其实对于有学科背景的人来说,许多背后的思路单拎出来都不是很复杂。但是这些想法往往是以压倒性的数量同时出现的,随之而来的还有狂风骤雨般陌生的概念和符号。人们必须飞快地接二连三学习量子比特、Bra-ket 符号、Hadamard 门、受控否闸以及更多抽象而陌生的符号。他们正在吸收一种全新的语言。即使他们一开始能跟上,但他们无法熟练掌握全部这些想法,因而不能理解后续的想法。这让人不知所措,最终感到沮丧。
出于实验目的,我们开发了「量子国度」这个网站,旨在探索一种解释量子计算和量子力学的新方法。表面上看,量子国度和那些介绍这些主题的传统文章没什么两样——有文字,有说明,有方程。下面是一个内容摘录:
不过这和那些传统文章还是有很大区别的。「量子国度」实际上是一种新的助记媒介的原型。在我们的设想中,使用了助记媒介,用户能不费吹灰之力地记住他们读过的内容。听上去似乎不可能实现,但其依据是认知科学家已经对人类存储长期记忆的机制有了相当多的了解,实际上并非遥不可及。认知科学家们所了解的事实基本上可以提炼成一个可操作的清单:按照里面的步骤,你可以记住任何你想要记的东西。
不幸的是,现有媒介对这些步骤的支持很差。[^5]有没有可能设计一种新媒介,能够主动协助记忆? 也就是说,媒介中内建了记忆的关键步骤,而且做起来非常轻松。如果能够实现,那么我们眼中随机而充满不确定性的记忆,在助记媒介中将是可以选择的事情。当然,就其本身而言,这不会使学习量子力学和量子计算等学科变得简单——学习这些学科需要的远不止是记忆。但这种媒介将有助于解决一个核心障碍:全新概念和陌生符号多到令人窒息。
事实上,有许多基于重新组织文本媒介的方法可以达到这一点。在展示我们的原型之前,请停顿片刻,思考以下问题:如何设计媒介,以便人们记忆所读内容?有哪些互动可以轻松愉快地帮助人们巩固记忆?以及,更一般地说:有没有办法能让人们的记忆效率翻上两倍甚至十倍? 这是否会对他们的效率产生长期的影响?
让我们简要概括一下「量子国度」的用户体验。在写这篇文章的时候,该网站包含三篇助记文章(即助记媒介的一个特定实体)。我们将重点关注第一篇,《写给好奇者的量子计算引论》。在这篇文章中我们嵌入了 112 个关于文本的问题。用户被要求注册一个账号,并在阅读过程中回答他们是否记得这些问题的答案。下面是一个用户回答其中三个问题时的互动情况。
值得注意的是这种互动发生在文章本身的文本中。下面是一个放大视图,你可以看到这些问题是如何被文本上下包围的:
这个包含了一对问题和答案的界面叫做卡片。
当然,为了要形成长期记忆,用户仅进行一次回忆测试是不够的。所以在第一次阅读文章的几天后,用户会收到一封电子邮件,要求他们登录以进入复习环节。在复习环节中,他们会再次接受测试,测试方式和之前类似。然后,通过未来几天和几周的反复复习,这些答案的长期记忆将会得到巩固。
到目前为止,这看起来不过是一篇集成了老式抽认卡的文章。但请注意卡片底部标注的间隔:
高亮出来的时间间隔是距离下一次此问题测试用户的时间。问题开始出现时的时间间隔是「文中」, 意味着用户在阅读文章的同时就会被测试。如果用户记住了问题的答案,这个时间间隔会上升到五天。随后间隔时间会在每次正确回答后继续增加,从五天到两周,然后是一个月,以此类推。仅需完成五次成功的复习,间隔时间就达到了四个月。如果用户在某个时候不记得了,时间间隔就会下降一级,例如从两周变成五天。
这套方法利用了一个人类记忆的基本事实:用同一个问题反复测试后,对答案的记忆会越来越牢固[^6],而且可能会留存更长时间。这种指数式间隔安排方式看上去没什么了不起,但这却是革命性的,这意味着只需相对较少的复习次数就能让用户记住这些内容好几年。由于一个问题一般只需要几秒钟复习,这意味着用户只需花几分钟的时间就能实现长期记忆。相比之下,传统的抽认卡则需要几个小时的复习才能达到同样的持久性,指数式间隔安排的效率显然要高得多。
原型助记媒介的早期影响
尽管「量子国度」尚处于早期阶段,但我们已经能看到一些助记媒介产生的影响。下图是助记文章中每个用户回答的实证留存与每个问题的复习次数的散点图:
这张图需要稍微解释一下。图中纵轴的卡片「实证留存天数」是指正确回答该问题与上一次回答该问题之间的最长时间。具体来说,考虑一下横轴上的数字 6。在这一点上的用户都已经复习了文章中所有的 112 张卡片 6 次。纵轴显示的是所有卡片的实证留存天数,每个蓝点代表一个复习了 6 次的用户。
因此,举例来说,经过 6 次复习,大多数用户的总实证留存天数达到了 6000 天左右。也就是说,平均一下,文章中的每个问题都保留了 54 天。直观来看这个效果很好——如果你只是和大多数人一样,那么在读过一些东西之后的几个月,你只能留有一个模糊的记忆。相比之下,这些用户以较低的时间成本(详见下文),在 112 个细节性问题上实现了近两个月的实证留存。
此外,你可以看到保留天数随着卡片的复习次数呈指数上升。在第一次复习后,平均每张卡,用户通常都有超过 2 天的实证留存天数[^7]。但复习了 6 次之后,这个数字就上升到了 54 天。把所有卡片复习六次大约共需要 85 分钟,考虑到阅读这篇文章需要 4 个小时左右的时间,这就表明只需不到 50% 的时间投入可以把文章中几乎所有的重要细节记住几个月甚至几年。
这就是间隔重复的最大也是最反直觉的优势:持续的努力可以获得指数级的回报。平均来说,在复习中每多花一分钟的时间,就会有越来越多的好处。这与生活中的大多数情况形成了鲜明对比,因为生活中我们往往会面临边际递减效应。比如通常情况下,即使你多花 50% 的时间在阅读上,你也不能指望能得到超过 50% 额外收益,甚至可能更少。但是通过助记媒介,当你多花 50% 的时间,你可能会得到10倍的收益。当然,这些数字不是精确的,但它确实传达了一种关键理念:获得巨大的非线性回报。这就是一种媒介质量的变化。
这种延迟回报让助记媒介在多个方面都不寻常。另一个不寻常的地方是,大多数社交软件使用短期交互的模式(short-term engagement models),用一种类似条件反射的策略来驱使用户。Twitter、Facebook、Instagram 和许多其他流行的社交软件都是这样做的。而助记媒介在某些方面更像冥想,是前面提到的那些产品的反面,因为助记媒介违反了许多硅谷的传统智慧——在这里好处是延迟的,而且很难有任何即时的获得感。事实上,对于助记媒介而言,延迟越大,受益越多。
这些是初步结果,需要更多的研究。人们自然会想,如果我们采用更激进的复习间隔,比如将复习的初始间隔时间设定为两个月会发生什么? 如果用户能够把记忆可靠地保留到那个时间点,那么曲线的起点就会很高,我们就看不到指数增长的趋势了。还有许多类似的问题需要研究以更好地了解用户的记忆是怎么回事。
用户的早期反馈使我们谨慎乐观地认为助记媒介对他们很有用。2019 年 5 月,本文的一位作者在 Twitter 上发布了一则推文,解释了量子传送的技术细节。一位量子国度的用户回复了该推文,称:
到目前我只学完了量子国度上的第一个课程,但我惊奇的发现读着其中的证明,我跟得住,能知道其中每个部分的含义。这几乎就像黑客帝国里的 Neo 对 Morpheus 说「I know quantum computing」[^8]。
另一位在量子计算领域有着丰富经验的用户这样写到:
我是量子信息/计算方面的博士,在读这篇文章之前我已经知晓文章中的所有内容,但通过做给定的间隔重复抽认卡,我获得了额外的感悟,这大大提升了我对材料的理解。每个正在阅读这篇文章的人,都应该去量子国度注册并尝试一下间隔重复记忆法。
另一位刚接触量子计算的用户告诉我们,「量子国度是他所能想象的介绍这门学科的最佳方式」。当我们问到他如何学以致用时,他说,当他公司的一位来宾举办关于量子计算的技术研讨会时,他原本预计会在大约 10 分钟后会不知所云。然而:
哇,我实际上能跟上他,大概 40 到 45 分钟左右,因为这些矩阵看上去都很熟悉…(这种媒介的特点决定了)你会一遍又一遍地遇到这些概念…这种媒介提供了一种抽象层面上的高效互动。
网站分析显示,有源源不断的人按照我们预期的方式持续稳定地完成复习周期。原型发布 6 个月后,195 名用户对文章中至少 80% 的卡片都有整整一个月的实证留存天数,有力地证明了这一过程的有效性[^9]。我们还没有一个比较好的模型来说明这些人到底学到了什么,但很可能相比从传统的文章,甚至是传统的课堂上,他们学到了更多的东西。
当然,这样的积极反馈和结果应该谨慎对待。助记媒介还处于早期阶段,有许多不足之处,并且在许多方面需要改进(很快会有更多的改进)。然而,令人鼓舞的是,已经一些用户发现这种媒介非常有用,并建议我们进一步开发和测试这种媒介。至少,这种助记媒介似乎真的能帮助人们记忆。此外,如上所述,它的有效性更是指数级增长:人们学习得越久,学习中每一分钟的收获越多。
在另一个非正式的实验中,我们试图弄清楚当用户没有复习卡片时,对他们的记忆有多大影响。为了做到这一点,我们特意对其中 8 张卡片进行了短暂(两周)的延迟复习。也就是说,一些用户在初次阅读时会复习这 8 张卡片,然后在至少两周内不会再复习。其他用户则继续正常地复习这 8 张卡片。通过比较这两组人,我们可以估计复习卡片对用户的记忆所产生的影响。
发生了什么?对于那些复习被推迟的用户来说,准确率从 91% (初次阅读时)下降到 87% (两周后)。似乎下降的不多,但别忘了,这些用户还在正常复习其他卡片。这些卡片的内容难免会与这 8 张卡片有所重叠,因此也可能提高他们的记忆表现。仅是推迟部分卡片的复习,这种效应是很难避免的,但全部推迟的话,对用户体验的影响就太大了。对于那些正常复习卡片的用户,准确率从 89% 提高到了 96%。总结一下就是:用户不复习卡片的话,准确率就会下降 4%;如果他们按时复习卡片的话,准确率会提高 7%[^10]。
看待这个非正式实验的数据的另一种方式是看哪些用户的记忆表现得到了改善或没有变化,而哪些用户的表现变得更糟。事实上,所有按时复习卡片的用户(100%)的记忆表现都保持不变或有所提高。相比之下,40% 的被推迟复习的用户的记忆表现出现了下降,另外 60% 则维持不变。
这组数据虽少,结果却很乐观。当然,我们只做了两周的实验,希望能在长周期实验中看到更明显的效果。并且,就像上面说的那样,遗忘会被有内容重叠的卡片冲淡。但无论如何,这个不正式的实验还是表明了助记媒介确实在帮助人们进行记忆,并为更全面的实验指明了方向。
虽然这些初期结果看上去有希望,但还是有人会不屑一顾:这不就是嵌入了抽认卡的文章吗? 从某种程度上说,这也对。要是这么说,维基百科不过是人人可编辑的网页;Twitter 不过是一种分享短文字的方式;Facebook 不过是向朋友分享文字和图片的方式。实际上,写作本身也不过是把一些符号按一定顺序排列到纸上。这种媒介貌似简单,但意义深远。正如我们将看到的,助记媒介有许多令人惊讶的特性。事实证明,抽认卡被大大低估了。而且在发展助记媒介方面,有可能比先前的浅显发展得更深入。
在我们深入研究助记媒介之前,让我们提一下写文章过程中的一个挑战,即如何在适合安利的那种乐观和适合评估的那种独立的怀疑态度之间取得一个适当的平衡。一方面,要是连我们都不为助记媒介背后的那些想法感到兴奋并保持乐观,那我们就不可能开发出这种助记媒介。所以为了更好地介绍这种助记媒介,我们需要把你,也就是读者,带到这种思维里。但是在这样做之后,我们又需要退一步,批判性地去思考一些问题,比如:这种媒介真的有效吗? 它对人到底有什么影响? 能帮助人们 10 倍速地去记忆? 甚至是 100 倍速?或者,反过来想,是否有一些障碍,说明出这是无可救药的坏主意,或者充其量只是一个平庸的想法?无论如何,记忆在认知中到底起着多么重要的作用? 到目前为止,我们已经关注了支持这种媒介的乐观想法,以及为什么人们会考虑这样设计这一媒介。但是在接下来的部分中,我们将逐渐从乐观中抽身,在一个更加批判性的框架中思考。
扩展记忆系统的使用范围:还可以用于哪些类型的理解?
「量子国度」是记忆系统的一个例子。记忆系统就是一个旨在帮助用户轻松地将他们所学的知识巩固到长期记忆中的系统。记忆系统的悠久历史可以追溯到古代,当时的演说家 Cicero 和修辞家 Quintilian 描述了一些可以用来记忆长篇文章的记忆技巧。
回到现代,人们开发了很多记忆系统。比较著名的几个是 Anki、SuperMemo、Quizlet[^11]、多邻国和 Memrise。和量子国度类似,这些系统都采用了对每个问题逐渐延长复习间隔的方法。这种系统有时也被称为间隔重复记忆系统(或 SRM 系统)。这些系统的有效性的解释,和我们前面对「量子国度」的解释差不多:每次复习遇到的某些概念会巩固我们的记忆。
SRM 系统在语言学习中的应用最为广泛。比如多邻国宣称他们有 2500 万的月活。而关于成效如何的报道却各执一词。一些认真的用户对他们在多邻国上取得的成果非常满意, 但其他人认为效果有限。当然,多邻国自己肯定吹捧说研究表明该系统十分成功。在我们看来,多邻国和其他类似的系统应该可以在一个正式的语言学习计划中起到一定程度(也只能是一定程度)的作用。
除了语言学习之外的那些记忆系统怎么样呢?Quizlet 是一个有着 5000 万月活 的流行软件。它在课堂上得到了广泛使用,特别是用来记忆简单的陈述性知识——美国总统名单,国家首都……Anki 和 SuperMemo 似乎也常用于记忆简单的陈述性知识,但它们的活跃用户群要比 Quizlet 小得多。[^12]
开发「量子国度」的一个动机,便是证明记忆系统的用武之地不仅限于简单的陈述性知识,如词汇表和各国首都等。事实上,记忆系统对掌握抽象的,概念性的知识也有极大的帮助,也恰恰是学习量子力学和量子计算等科目所需要的。其做法便是依照很多精细的策略来构建卡片,从而灌输对抽象的,概念性知识的理解。不过更重要的,在描述文本中嵌入了间隔重复卡片,这样的学习才成为可能。这种嵌入使得情景和理解以独特的方式构建起来,是其他记忆系统中难以实现的。
其他人也研究出了把记忆系统用于抽象的概念性知识的方法。最突出的是或许当属 SuperMemo 的创造者 Piotr Wozniak。他写了很多文章来介绍了他使用记忆系统的巧妙方法[^13]。其他一些记忆系统的专家级用户也发明了类似的策略。然而,应用这些策略需要相当的技巧。在实践中,这种技巧上的障碍意味着这些策略只能是少数人的专属。
相比之下,在「量子国度」中,一位既精通文章主题又能熟练运用上述策略的专家直接写好了卡片。因此,对于使用记忆系统来进行抽象的,概念性的学习,「量子国度」提供了一种可扩展性更好的方法。在某种意义上,「量子国度」的目的是拓展用户能够理解的主题范围。在这一点上,它所希望达成的愿景与之前所有的记忆系统都很不同。
更广泛地说,我们认为记忆系统的探索空间远比我们以前意识到要丰富得多。现有的系统几乎都还没有触及到可能性的表面。我们习惯于「量子国度」看作是一个记忆研究实验室. 也就是说,这个系统既可以用来更好地理解记忆的工作原理,也可以用来开发新类型的记忆系统。我们想要回答这样的问题:
- 除了像过去那样用来记忆简单的,陈述性的知识,记忆系统还可以有哪些新的应用方式?
- 通过记忆系统形成的理解能有多深?哪些方法能帮助用户尽可能地加深理解?
- 我们能在多大程度上提高人类的记忆能力?达成的难度有多大?又有什么好处和坏处?
- 是否有一天,大多数人都会把定期的记忆练习作为他们日常生活中的一部分?我们能不能让记忆成为一种选择?我们有没有可能在某种意义上彻底解决记忆的问题?
在接下来的几节中,我们将勾勒出我们对如何开发记忆系统的一些思考。我们将看到,记忆系统只是一个更大的图景中的一个小部分。严肃地去开发记忆系统不仅可能促成一种或多种变革性思想工具的产生,我们相信它还将教会我们许多关于开发这种工具的一般性问题。
改进助记媒介:编写更好的卡片
编写助记文章时,卡片内容很容易被随意处理。毕竟,卡片只是一个问题配上一个答案——包含一些文字,也还可能包含一张图片。所以,编写这些内容应该不太难?
虽然很容易这么想,但这是错误的。事实上,卡片是助记媒介的基石,而编写卡片则应当认为是一种没有正确答案的技能。卡片如果写得不好,助记媒介的效果就会很差;写得很好,助记媒介的效果也会很好。通过培养编写卡片的技能,我们就有机会扩展这种媒介的可能性。
为了帮助理解,可以将卡片类比散文中的句子。对于初学写作的人来说,句子很容易被随意处置。但是在 Nabokov 这样的大作家手中,句子却可以发展成一种精湛的艺术形式。那怎样才能获得编写卡片的高超技巧?
在着手之前很难意识到编写卡片也是一门学问。本文的一位作者曾经写过两篇长达 17000 字和 6000 字的文章[^14]来重点阐述怎样写出好卡片。但他在起笔时也很难想象,文章的主题会变成这个;只有在回顾时才发现要写出好卡片也有那么多门道。事实证明,要回答「如何写出好卡片」这个问题需要认真思考。难怪这是一个内涵丰富的开放式问题!
说了这么多,让我们来具体看看要如何编写好卡片。虽然下面的具体例子比较平淡,但是对于改善助记媒介中的深刻问题,能够建立初步印象。首先是在「量子国度」中编写卡片的三个原则。请注意,除此之外还有很多原则——《增强长期记忆[1]》在构建卡片的有用原则上展开了更详细的讨论。
- 绝大多数问题和答案都应该是原子化的: 本文一位作者,在开始其记忆实践时,试图记忆「在文件系统中创建链接」的 Unix 命令。为此,他在他的记忆系统中输入了以下问题:「如何创建一个从链接名到文件名的软链接?」,其答案是「ln -s filename linkname」。这个问题看起来不错,但他就是记不住答案。为了解决这个问题,他把这张卡片重构为两张更加原子化的卡片。第一张卡片:「创建一个软链接的基本命令和选项是什么?」(答:「ln -s」)。第二张卡片:「当创建一个软链接时,linkname 和 filename 按什么顺序排列?」(答:「filename linkname」)。分成更原子化的卡片后,一个他总是答错的问题就变成了两个他总是答对的问题。看来,更加原子化的问题更能聚焦于遗忘的知识,由此对于改善记忆更有效果。原来的卡片怎么办?起初,他把它删除了。但他最终又把这张卡片加了回去,问题和答案都没变,因为这张卡有助于整合更原子化的卡片中获得的理解。
- 确保助记文章中的前几个问题是简单的:这有助于许多用户意识到他们在阅读时没有足够专注:[^15] 这是我们发布第一篇「量子国度」文章时发现的。我们预计用户可能搞不懂陌生的界面,所以我们故意把文章中的前几个问题弄得像「2+2=?」那样简单,认为这样他们就可以把注意力放在界面上。令我们惊讶的是,用户在这些问题上的表现很差,比他们在后面更难的问题上的表现还差。我们目前的假设是,当用户未能正确回答前几个问题时,就像敲响了警钟。这些问题简单到让用户发现他们在阅读时并没有全神贯注,所以后来就更小心了。
- 避免使用孤岛卡片: 孤岛卡片是与其他内容没有密切联系的卡片。为了说明问题,假设你正在学习非洲地理,并写了一个问题:「摩洛哥在非洲有争议的领土是什么?」(答:「西撒哈拉」)。如果你对西撒哈拉或摩洛哥一无所知,也不知道为什么会有争端,那么这个问题就是与其他东西脱节的孤岛。理想情况下,问题和答案组成的卡片应该彼此紧密连接,一切都以惊人的方式交织在一起
我们最终希望能提炼出一套实用的操作原则和习惯用法,以帮助编写出好的卡片,以及更广泛地说,好的助记文章。期待这样一套原则与习惯用法能够起到《风格要素》的作用(或一些类似的写作指导书),并能帮助其他人掌握高质量助记文章的写作。
当我们在上面首次描述「量子国度」时,我们用了一个简单的间隔重复模型来解释它:记忆的巩固强度增加,因而复习的间隔延长。这是一个很有帮助的简单模型,但有可能造成误解,以为这个系统的所有环节不过如此。事实上,助记媒介若要起到效果,还需要其他很多方法与间隔重复协同作用。我们刚才描述的三个方法——问题和答案的原子性、使前几个问题简单、避免孤岛卡片——只是助记媒介中使用的几十个重要方法中的三个。我们不会在这里列举所有这些其他的想法——这篇文章不是做这件事的。但我们想强调这一点,因为人们普遍有简单化的思维方式,认为「好的记忆系统=间隔重复」。这思维方式是错误且非常无益的。
事实上,这样的想法部分解释了为什么间隔重复记忆系统对个人来说经常失效。常有人说:「哦,我觉得间隔重复听起来不错,我试过 Anki……,但它们不好用」。稍微深入了解就会发现,他们使用记忆系统的方式是必然失败的。他们写的问题总是很糟糕,并不关心所学的学科,或者犯一些其他错误。他们有点像一类人:觉得「学吉他挺好啊」,拿起吉他弹了半个小时,然后放下她,说自己弹得很糟糕,因而吉他也很糟糕。当然,真正的情况是,弹奏吉他和使用记忆系统都是需要花时间逐渐习得的技能。但是,说到这里,我们还是想在媒介中就尽可能提供帮助。理想情况下,即使是新手也能从这样的助记媒介中获得巨大的好处。这意味着记忆媒介中还要融入更多想法,不仅是间隔重复。
本文的一位作者以前曾断言[^16],在间隔重复记忆系统中,用户需要自己编写卡片。这个断言并没有严格证明,只是用户经常反映在使用他人编写的卡片时不满意,效果不好。原因似乎是,编写卡片本身就是一种重要的辅助理解行为,并有助于将材料刻入记忆。用户要是使用他人编写的卡片,就失去了这些好处。
「量子国度」违反了这一原则,因为编写卡片的不是用户。我们开始开发「量子国度」时很是担心这点。然而,用户的初步反馈表明效果还挺不错。一个可能的解释是,如上所述,编写优质卡片是一项难以掌握的技能,因此用户虽然没有自己编写卡片,但若使用的卡片质量高于用户自制卡片,也能弥补这一缺点。在未来,用户自编卡片必要性这个问题,值得深入研究,既要更严谨地论证说明它,又要探寻如何获得主动编写卡片的好处。
在上面我们讨论了构建好的问答卡片的三个原则。当然,也可以对卡片本身的性质进行更多的结构性修改。这里有三个问题,指出一些试验方向:
- 我们如何确保用户不只是学习问题的表面特征?「量子国度」中的一个问题是:「谁在使用量子计算机模拟量子场理论方面取得了进展?」,答案是:「John Preskill 和他的合作者」。这是整篇文章中唯一一个以「谁」开头的问题,许多用户很快就学会了识别「谁......」,然后鹦鹉学舌般地说出了答案,而对问题本身没有多加考虑。这是记忆系统中一个常见的失败模式,对于理解是致命的。我们按计划即将试验一种对策,即以多种表述呈现问题,这些表述形式不同但本质相同。因此,用户第一次看到的问题是「谁取得了的进展?」(诸如此类的问题);但第二次看到的问题是以填空的方式呈现:「___和他的合作者在使用量子计算机模拟量子场理论方面取得了进展」。 这样用多种不同表述呈现问题,从而让用户必须始终深入领会问题的含义,而不是其外观。最终,我们希望开发一套技术,及时识别出这种只学习表面特征的模式,并对其进行补救。
- 用户忘记问题的答案的话,如何最好地帮助他们? 假设有个用户作答「谁是美国的第二任总统?」,不记得答案了。他可能当成是 Thomas Jefferson 了 ,因而发现是 John Adams 时非常惊讶。在一个典型的间隔重复记忆系统中,这种情况的解决策略是缩短再次复习该问题的时间间隔。但是,更有效的办法可能是跟进相关问题,帮助用户理解背景信息。例如:「谁是 George Washington 的副总统?」(答:「John Adams」)。或许可以有一连串的后续问题,从而让第一个问题的答案更好地编码进记忆中。
- 如何在助记媒介中对故事进行编码? 人们常常发现某些想法在故事形式中最有说服力。这里有一个简短而有趣的例子:在 iPhone 的早期,Steve Jobs 极力反对开发应用程序商店!相反,它是由苹果公司的另一位高管 Scott Forstall 倡导的。这样的故事具有陈述性事实所不具备的力量。抽象地知道,即使是新技术背后的远见卓识者也常常看不到它们的许多用途,这是一回事。听到 Steve Jobs 与 Scott Forstall 争论,反对乔布斯所发明的技术在今天的主要用途,则是另一回事。助记媒介可以用来帮助人们内化这些故事吗?这样做可能会违反原子性原则,因为好的故事很少是原子性的(虽然这个特殊的例子很接近)。尽管如此,如果这些故事能够有效地在卡片上编码,那么这些故事的好处似乎很值得违反原子性原则。
再问几十个类似的问题和想法很容易。助记媒介的形式不应一成不变,应该成为鼓励实验和持续改进的平台。
思考如何改进助记媒介时,一个有用的比喻是把助记文章看作是一篇传统文章伴随着「映像文章」——所有卡片中编码的知识。用户可以轻松地选择记住他们所希望的那篇反映文章的内容。当然,这种反思是不完美的。但是,通过制定良好的卡片编写策略,我们可以使反映文章几乎忠实地反映出所有重要的观点,也就是读者最想保留的观点。
我们在上面说过,使用「好的记忆系统 = 间隔重复」的简单化模式是一个错误。事实上,虽然间隔重复是介绍「量子国度」的一个有用的方法,但我们当然不应该把助记媒介放进现有的 SRM 系统的范式里。相反,最好是回到第一原则,并提出这样的问题:什么会使「量子国度」成为一个好的记忆系统?除了间隔重复之外,是否还有其他关于记忆的强有力的原则,我们可以将其纳入系统?
事实上,有一些关于记忆的想法与间隔重复非常不同,但具有相当的力量。其中一个想法是精细编码。粗略的说,这是一个想法,即我们对一个概念的联想越丰富,我们就越能记住它。因此,我们可以通过丰富的联系网络来改善我们的记忆。
从某种意义上说,这是一个显而易见的想法,与日常经验很吻合。例如,这也是在我们已经是专家的领域里学习新的事实要容易得多的部分原因——我们很快就会对我们现有的知识形成联系。但是,仅仅因为这个想法是显而易见的,这并不意味着它得到了现有媒介形式的特别支持。有很多低垂的果实,我们可以在助记媒介里面积极支持。事实上,上面的一些建议已经隐含了精心编码的理念——像「避免孤岛卡片」这样的原则就是基于此。这里还有三条建议是建立在精细编码之上的:
- 以多种形式提供问题和答案: 1971 年,心理学家 Allan Paivio 提出了双重编码理论,即主张语言和非语言信息分别储存在长期记忆中。帕维奥和其他人研究了图片优势效应,证明图片和文字在一起的记忆往往比单独的文字要好很多。这表明,例如,「谁是 George Washington 的副总统?」这个问题如果伴随着 Washington 的图片,或者如果答案(John Adams)伴随着 Adams 的图片,可能会有更高的回忆率。对于记忆系统来说,双重编码理论和图片优势效应提出了许多问题和想法。以多种形式呈现问题和答案的好处有多大?也许甚至用多种图片,或用音频或视频(也许用不同性别、不同口音的多个发言人……),或用计算机代码?也许以一种需要某种形式的互动的形式?而在每一种情况下:什么是最有效的?
- 改变背景: 1978 年,心理学家 Steven Smith 、 Arthur Glenberg 和 Robert Bjork [^17] 报告了几个研究地点对人类记忆影响的实验。在其中一个实验中,他们发现在两个不同的地方学习材料,而不是在同一个地方学习两次,可以使后来的回忆提高 40%。这是一个更广泛的实验模式的一部分,显示不同的复习环境会促进记忆。我们可以使用记忆系统来支持以下事情:改变复习的地点;改变复习的时间;改变复习时的背景声音,或者没有背景声音。在每一种情况下,都有实验表明对回忆有影响。不一定清楚这些结果有多强大,或有多大的可重复性——可能有些(或全部)是其他影响的结果,在最初的实验中没有被控制。不过,似乎还是值得建立系统来测试和(如果可能的话)改进这些结果。
- 卡片之间是如何互动的?理想的知识网络结构是什么? 这是一组非常复杂且有些微妙的问题。让我们举一个简单的例子来说明这个想法。我们在助记媒介中分别展示了一张张卡片,好像它们是彼此独立的实体。但卡片之间是有联系的。假设你有这些卡片:「谁是 George Washington 的副总统?」(答:「 John Adams 」,并附有Adams的照片);「 John Adams 长什么样子?」(答: Adams 的照片);也许还有一个问题涉及亚当斯和华盛顿在某个关键时刻的素描;等等。现在,这套卡片构成了一个相互关联的卡片网络。而你可以使用像「量子国度」这样的记忆系统来学习这个网络。如果你抽掉一张卡片,人们表现出的回忆率会发生什么变化?是否有关键卡片?是否有特别有效的网络结构?有没有卡片之间的一类关系特别有效?最重要的是:对于寻找这个系统中最深层、最强大的知识表达方式,我们是否有找出一般的原则?
现在很明显,我们所开发的助记媒介原型是一个更大冰山的一角。更重要的是,我们在这里提出的建议和问题也仅仅是一个开始,让你感受可能性。
记忆术很好,可以更好
当我们与人讨论记忆系统时,许多人立即回应说我们应该研究记忆技巧。这种构建记忆系统的方法与 Quantum Country、Duolingo、Anki以及我们讨论过的其他系统非常不同。你也许对学校里的简单记忆技巧很熟悉。一种常见的形式是把彩虹的颜色记成 Roy G. Biv (red, orange, yellow, green……)。或者用歌曲[^18]来记住元素周期表。
一个更复杂的变体是可视化技巧,如位置法。假设你想记住你的购物清单。为了使用位置法,你可以想象自己在某个熟悉的地方——比如说,你童年的家。然后你想象自己从一个房间走到另一个房间,在每个房间的显眼位置放上把购物清单中的一项东西。当你去购物时,要想回忆清单,便想象自己走过房子——你的所谓「记忆宫殿」——并看着每个房间里的物品。
如果你从未使用过记忆宫殿,这听起来似乎不可能奏效。但是,这种技巧的效果,对于练习不多的新手来说都十分惊人。下功夫发展这些技巧的专家更可以做一些惊人之举,比如记住一副洗好的扑克牌的顺序,或者数百个数字的列表。这种技巧基于人们无比强大的视觉和空间记忆,以改善其他类型的记忆[^19]。
鉴于这一切,我们经常听到,记忆技巧是一种比间隔重复等方法更有前景的记忆方法,这也许并不奇怪。
我们也对这种记忆技巧充满热情。但了解它们的局限性也同样重要。能迅速记住一副扑克牌的人看着很威风,但不要被他们迷惑住。
首先要注意记忆技巧可应用的内容范围。在实践中,这些内容往往非常特化。例如,对于记忆数字列表和扑克牌,记忆术专家的方法都会有所不同。这些方法必须分别掌握——对于这两种非常特殊的记忆来说,投入的时间成本未免过大。此外,记忆技巧往往更适用于具体的物体,而不是抽象的概念性知识——比如说,你很难将《凡尔赛条约》的主要内容储存在你的记忆宫殿中。当然想做也是可以的——记忆术专家已经开发出了巧妙的技巧,将抽象的概念性知识转化为可以储存在记忆宫殿的具体对象。但是,一般来说,间隔重复的优势在于,它所能应用的知识范围,比任何一种记忆术都更加广泛。
第二个注意事项与精细编码有关。正如你可能已经意识到的那样,记忆技巧是精心编码的一个例子,它将我们想要记住的东西(例如,我们的购物清单)与对我们已经有意义的东西(例如,我们的记忆宫殿)联系起来。相比之下,当专家学习他们领域的新信息时,他们不会人为地将其与记忆宫殿联系起来。相反,他们会找到与他们已经知道的东西有意义的联系。这些连接本身就是有用的专业知识;他们正在建立一个密集的理解网络。这是一种更深入、更理想的专业知识,是与学科本身相关的连接,而不是人为构建的记忆技巧。
所有这些都使我们看起来对记忆技巧持否定态度。事实上,我们很热心,而且到目前为止,在助记媒介中肯定没有充分使用它们。我们在这里所写的只是为了缓和我们有时遇到的过度热情。有些人甚至告诉我们,记忆技巧使记忆成为一个已解决的问题。这根本是错误的。但是在了解了它们的局限性之后,它们是一个强大的工具。对于那些具有任意的、临时的结构的知识来说,这一点尤其正确。例如,很难记住彩虹的颜色,因为这些颜色与其他东西没有明显的联系,除非你碰巧因为其他原因记住了可见光的光谱!这使得像 Roy G. Biv 这样的记忆法非常有帮助。因此,记忆技巧应该被认为是一种有用的工具,用于建立强大的记忆系统,特别是当与间隔重复等理念相结合时。
记忆到底有多重要?
当被告知有助记媒介时,人们往往分为两类。一类人对这个想法很着迷,并想尝试一下。第二类人则持怀疑态度,甚至是排斥。以漫画的形式,他们说:「我为什么要关心记忆?我想要更深层次的理解!我难道就不能在互联网上查查资料吗?我想要创造力!我想要概念性的理解!我想知道如何解决重要的问题!只有痴迷于细节、枯燥乏味的人才会专注于死记硬背。」
这些反对意见,值得我们认真思考。为了开发最好的记忆系统,我们需要理解并解决潜在的担忧。在某种程度上,这意味着要深入挖掘,找出这些担忧中错误的或肤浅的部分。这也意味着要尽可能清晰地提炼出这些担忧中的真理。做到这两点将有助于我们改进和超越目前的原型助记媒介。
对这种反对意见的一个回应是生活经验的论证。过去,本文的一位作者(MN)经常帮助学生学习技术科目,如量子力学。他注意到,人们常常认为自己在深奥、复杂的问题上卡壳。但是,正如这篇文章的引言中所提出的,真正的情况往往是他们在基本的符号和术语上遇到的困难。当你对每三个单词或符号都不清楚时,就很难理解量子力学。对每一句话都疲于应付。
这就像他们试图用法语创作一首美丽的十四行诗,但只知道 200 个法语单词。他们很沮丧,认为麻烦在于难以找到一个好的主题、引人注目的情感和形象,等等。但实际上,问题在于他们只有 200 个单词可以用来创作。
当时,MN 有点自以为是地认为,如果人们只专注于记住基础知识,而少担心那些「困难的 」高层次问题,他们会发现高层次问题会自己解决的。他没有意识到,这也适用于他。当他开始使用记忆系统 Anki 来阅读新领域的论文时,他发现 Anki 使学习这些学科的基础知识变得非常容易,这几乎让他感到不安。这让他开始怀疑,在学习新领域的过程中,记忆是否经常是一种约束性的制约因素[^20]。
对助记媒介的一个特别常见的负面反应是,人们不想记住「不重要的细节」,而只是在寻找「一个广泛的、概念性的理解」。很难理解这种说法。直截了当地说,这种人似乎是在自欺欺人,把享受的感觉和任何一种持久的理解混为一谈。
想象一下,如果遇到一个人告诉你,他们对如何说法语有「广泛的概念性理解」,但事实证明,他们不知道「bonjour」、「au revoir 」或「tres bien 」的意思。你会觉得他们自称对法语有广泛的概念性理解是很搞笑的。如果你想在任何真正意义上理解一个主题,你需要知道基本原理的细节。更重要的是,这意味着不仅仅是在阅读后立即了解它们。这意味着长期内化它们[^21]。
一个更好的模型是,概念的掌握实际上是由对细节的掌握促成的。一位「量子国度」的用户告诉我们,她发现阅读的体验出乎意料地轻松,因为她「不再需要担心」她是否会记住内容。她只是相信媒介本身会确保她记得。她报告说,她反而能够把更多的时间花在概念性问题上。
当人们用「你为什么要关注那些无聊的记忆材料?」来回应助记媒介时,他们没有抓住重点。通过在很大程度上将记忆问题自动化,助记媒介使人们更容易将更多的时间集中在学习的其他部分,如概念问题。
反对间隔重复系统的另一个常见论点是,最好是依靠自然重复。例如,如果你正在学习一门编程语言,这种说法认为,你不应该记住该语言的每一个细节。相反,当你在实际项目中使用该语言时,你会自然而然地重复使用,并最终将语言中最重要的部分记入记忆。
这里面有一些重要的部分真理。把你所学的东西作为你创造性项目的一部分是很好的。事实上,一个理想的记忆系统可能有助于这种情况的发生,在你工作时提示你,而不是在一个基于卡片的人工环境中。此外,记忆系统的一个常见失败模式是,人们试图记住他们不太可能有任何用途的东西。例如,一个人背了很多他们打算在一个小项目中使用的编程语言的细节,这是不可取的(但令人惊讶的是,这很常见)。或者记住一些细节,「以备不时之需」。这些模式是错误的。
但上一段的真理也有局限性。如果你正在学习法语,但不认识任何讲法语的人,那么等待「自然机会」说话是行不通的。而且,即使你有(或创造)说话的机会,最好也能加快度过尴尬的、不舒服的早期阶段,这些阶段对使用语言形成了很大的障碍。
正是在这个阶段,记忆系统大放异彩。它们可以让人们加速度过学习一个科目的尴尬的早期阶段。理想情况下,它们会支持和促成创造性项目的工作。要使这一工作顺利进行,需要对任何特定的人应该记忆的内容进行良好的启发式分析;对一个人来说,适合记忆的内容可能对另一个人来说是不好的。在记忆系统的设计中,解决这种启发式方法是一个持续的挑战。
(顺便提一下,有很多人说他们对间隔重复记忆系统感到「厌恶」,或者用一些类似的强烈字眼。他们的论点通常是:据说间隔重复系统有助于记忆;如果这是真的,我必须使用这些系统;但我讨厌使用这些系统。他们的反应是否认论证的第一步。当然,错误在其他地方:绝对没有理由任何人「应该」使用这种系统,即使它们对记忆有帮助。讨厌使用它们的人应该简单地选择不这样做。使用记忆系统并不是一种道德上的要求!)
关于记忆与掌握的关系,已经有了大量的研究。这些研究中的大部分都是详细的、针对具体环境的。但是在更广泛的结论层面上,有一个特别有趣的系列研究是由 Herbert Simon 和他的合作者在 1970 年代完成的。他们研究了国际象棋选手,并发现[^22]当国际象棋高手看国际象棋的局面时,他们不会从单个棋子的角度来看,这里有车,那里有兵。相反,在多年的对局和分析中,棋手们学会了识别 25,000 到 100,000 种棋子的模式。这些更复杂的「组块」是棋子的组合,棋手认为它们是一个整体,并且能够在比单个棋子更高的抽象水平上进行推理。至少在某种程度上,正是认识和推理这些棋子的能力使他们的棋艺比新手好得多。此外,尽管西蒙是在国际象棋的背景下做的这项工作,但随后的研究在其他专业领域也发现了类似的结果[^23]。虽然需要进一步研究,但似乎是有道理的,助记媒介可以帮助加速获得这些组块的内容,从而获得掌握。
那么,这一切是否意味着我们是死记硬背的粉丝,就像普通学校里那种强迫的记忆?
当然不是。我们相信,许多人不喜欢死记硬背,这导致他们普遍不喜欢记忆,并因此低估了记忆在认知中的作用。事实上,记忆是认知的一个核心部分。但正确的回应不是大量沉闷的死记硬背。相反,要用好的工具和好的判断来记住真正重要的东西。
我们已经确定了对记忆系统的批评在某些方面是错误的或错过了重点。但是,这些批评在哪些方面是有见地的呢?记忆系统的缺点是什么?我们应该在哪些方面对它们保持警惕?
我们已经隐约提到了这一思路的几个要点。思考一些问题,比如需要避免孤岛问题。或者确保用户不只是学习问题的表面特征。这些都是记忆系统可能失败的方式,如果使用不当的话。这里还有几个关于记忆系统的关键问题。
- 记忆系统并不容易决定要记忆什么:最明显的是,我们遇到很多人把记忆系统用于选择不当的目的。下面的内容出乎意料地接近于我们俩多次谈话的记录:
「我不喜欢[记忆系统]。我试图记住非洲的国家,这很无聊。」 「你为什么想记住非洲的国家?」 [茫然的疑惑表情。]
取笑这种事情很容易。但我们都在自己的记忆实践中做过类似的事情。甚至一些「量子国度」的用户似乎也是出于某种错位的责任感而走过场。「记忆什么会有好处」这个问题是最基本的,而回答好这个问题也不是无关紧要的。
- 助记媒介对人们的认知有什么真正的影响?它是如何改变人们的行为的?一位著名的拳击手应该说过,每个人都有一个计划,直到他们被打脸。经常使用记忆系统的用户有时会报告,虽然他们在接受系统测试时能记住答案,但这并不意味着他们在真正需要时能想起这些答案。可能会有一种「哦,我知道这个 」的、停留在舌尖上的感觉,但不是真正的回忆,更不是一个人最终想要的有效行动的流利能力。此外,用户甚至可能没有意识到使用他们所学的东西的机会。更广泛地说:记忆本身不是一个最终目标。它被嵌入到一个更大的背景中:如创造性地解决问题,寻找问题,以及在这个世界上采取行动的所有许多方式。我们怀疑记忆系统的影响会有很大的不同,取决于它们的设计。它们可能被用作人们依赖的拐杖。或者它们可能被用来大大地使人们能够发展他们认知的其他部分。我们还没有很好地理解如何确保它们是助推器,而不是拐杖。但在文章的后面,我们将描述一些其他的思想工具,当它们与记忆系统整合时,可能会更好地使这种过渡到更有效的行动。
如何发明印度-阿拉伯数字?
让我们简单地脱离一下记忆系统。想象一下,你是一个生活在古罗马的设计师,为数学设计公司工作。有一天,一个客户来了,表达了对罗马数字进行改进的愿望。当然,这不是向你描述他们问题的字面意思——更有可能是一个收税员想更有效地报税,并且有一些模糊的概念,认为数学设计公司可能能够提供帮助。但对你这个有经验的设计师来说,改进后的数字系统可能就是他们所需要的。
你应该如何回应这一要求?从我们的现代观点来看,我们知道有一个更好的数字系统是可能的,那就是印度-阿拉伯数字。事实上,印度-阿拉伯数字是思想工具史上的一个巨大飞跃。作为一个设计者,你能实现这一飞跃吗?从罗马数字开始,需要哪些创造性的步骤来发明印度-阿拉伯数字?是否有一种创造性的做法,在这种做法中可能会出现这种步骤?
要明确的是:这是一个有点虚幻的思想实验。事实上,印度-阿拉伯数字所需的许多想法早在巴比伦人、希腊人和其他文化中就已存在。它们在算盘和类似的设备中也是初现端倪。因此,我们不是在问一个字面上的历史问题。相反,这是一个旨在激发思考的问题:什么设计过程能让你从罗马数字到印度-阿拉伯数字?
我们不能肯定地知道这个问题的答案。但值得指出的是,印度-阿拉伯数字不仅仅是一个非凡的设计。它们也是一个非凡的数学洞察力。如果你只知道罗马数字,它们涉及许多不显眼的想法。也许最引人注目的是,一个数字的含义实际上是变化的,这取决于它在一个数字中的位置。同样引人注目的是,考虑到当我们将数字 72 和 83 相加时,我们在某些时候可能会使用 2+3=5;同样,当我们将 27 和 38 相加时,我们也会使用 2+3=5,尽管事实上 2 和 3 在第二个和中的含义与第一个和完全不同。在现代用户界面术语中,尽管数字的含义在两种情况下有很大不同,但它们具有相同的承受力。我们认为这是理所当然的,但这种行为的相似性是数字系统的深层事实的结果:换元性、关联性和分布性[^24]。所有这些特性(以及更多的特性)都表明设计和数学的见解是不可分割地纠缠在一起的:在某种意义上,数学的见解就是设计的见解,反之亦然。
事实上,我们可以说,任何能够从罗马数字开始发明印度-阿拉伯数字的人,都将是有史以来最伟大的数学天才之一,也是有史以来最伟大的设计天才之一。他们必须在这两个领域都有超强的能力,能够利用不断发展的数字系统,不仅改进自己的数学思想,而且对数学有原创性的、世界级的见解;还能利用这些数学见解来改进他们不断发展的数字系统,从而形成一个洞察力的循环。
如果我们与传统的现代设计实践相比,这就相当令人清醒了。在一个典型的实践中,你会采访领域专家(在这里是指数学家),并阅读任何相关文献。你会与现有系统的用户交谈,并分析严肃的行为,包括个人和规模。简而言之,你要做的就是设计界人士所说的沉浸在目标领域中。
这是一个强大的实践。在最好的情况下,它可以使系统出现,否则就无法想象。如果应用于罗马数字(在假想的古罗马,而不是今天[^25]),这种做法可能会大大改善它们。但它不会提供任何接近印度-阿拉伯数字所需的数学洞察力水平。
我们关于印度-阿拉伯数字和数学的故事是虚构的。但它表达了一个普遍的真理:最强大的思想工具表达了对潜在主题的深刻见解。就记忆系统而言,这意味着它们不仅仅是「应用认知科学」,是用现代设计方法将认知科学的现有观点拼贴在一起。相反,它们将表达对记忆的深刻的原创性见解,这些见解是世界上其他任何人都不曾有过的。一个真正伟大的记忆系统将是最高等级的认知科学。
从这次讨论中,我们得到了一个警告和一个愿望。
警告是这样的:传统的科技行业产品实践不会产生足够深刻的主题洞察力来创造变革性的思想工具。事实上,这正是科技行业在思想工具方面进展甚微的部分原因。这听起来像是对传统产品实践的批评,但事实并非如此。这种做法在其目的上已经取得了惊人的成功:创造伟大的企业。但这也是 Alan Kay 所称的流行文化,而不是研究文化。为了建立变革性的思想工具,我们需要超越这种流行文化。
这个愿望是针对任何认真制造变革性思想工具的团队的。这是为了创造一种文化,将现代产品实践的最佳部分与(非常不同的)现代研究文化的最佳部分相结合。你需要一个贯穿始终的循环来运作,通过这个循环,对被试的深刻的、原创的见解反馈来改变和完善这个系统,而系统的改变会导致对被试的深刻的、原创的见解。
请注意,我们不是在做一个常见的论点,即制造新的工具可以为工具制造商带来新的主题见解,反之亦然。这是对的,但比我们说的要弱得多。相反,制造新的工具可以为整个人类带来新的主题见解(即重要的原创性研究见解),反之亦然,而这最好是一个快速转动的循环,以开发最具变革性的工具。
做到这一点是一场文化斗争。 在环路一侧拥有专业知识的人往往难以感知(更不用说理解和参与)环路另一侧的工作性质。你有研究人员,在他们的领域里很出色,但他们认为制造本质上是微不足道的,「只是一个实现的问题」。还有一些制造者根本不理解研究,他们认为研究只是一个相当缓慢和不正常的(而且不赚钱的)制造过程。在硅谷,这种情况是真实的。在那里,经常会遇到一些有成就的技术制造者,他们在读了 Richard Hamming 和 Richard Feynman 的一些故事后,认为他们对研究的理解足够深刻,可以「创造新的贝尔实验室」。通常他们都是 Dunning-Krugeritis 的受害者,他们如此无知,甚至没有意识到自己的无知。
当然,我们在「量子国度」还有很长的路要走。它还没有产生关于记忆和认知的足够深入的想法;它还不是世界上最重要的记忆实验室之一。作为一个产品,它还处于最初的阶段;我们的迭代速度还不够快,从系统中的学习速度也不够快。 但这是一个愿望,也是我们认为开发变革性思想工具所必需的。
第二部分:更广泛地探索思想工具
我们已经比较深入地研究了助记媒介,来展现思想工具发展的初期历程,以及从中引发的一些思考。在本文的第二部分,我们将拓宽视野,简述其他思想工具的理念,并讨论一些延伸问题,其中思想工具发展的停滞是一个焦点。
助记视频
2014 年,数字艺术家 Eric Wernquist 发布了一条令人惊奇的短视频,题为「流浪者」。该视频以第一人称视角带领观众领略探索太阳系的感受。
超震撼CG动画短片《Wanderers》「基于美国宇航局(NASA)现有的太空照片与地图数据,运用CG特效真实重现太阳系中的场景」_哔哩哔哩_bilibili在旁白(Carl Sagan 担任)频频称奇,屡屡惊叹时,作者对探索价值的执着渐渐让观众感同身受。观众开始感受到,在这颗星球的周围,有重重谜团林立,有壮丽美景锦簇。视频的音乐则带以略显伤感的怀旧风格开头,似乎在纪念勇于探索的人类先祖,随后变调,描绘我们和未来的人,继续未竟的探索,大胆向前,挑战危机,拥抱激情。
对比这条视频以及由 Carl Sagan 撰写的脚本,很有意思。文字很美,但读这段文字有一种缥缈之感,更像一场脑力游戏,传达的情绪不是很直观。
我们有一个朋友,Grant Sanderson,他在他的 YouTube 频道 3Blue1Brown 上制作很多令人惊讶的数学视频。下面是我们最喜欢的一个视频,其中他利用代数拓扑学的思想,简单证明了几何学中一个较新的研究结果。听起来令人生畏,但这段视频不仅优美,而且容易理解,已经被观看了 120 多万次。
【官方双语】用莫比乌斯带巧解内接矩形问题:拓扑学的用处_哔哩哔哩_bilibili观看这条视频,和观看上文的《流浪者》一样都是触及人心的情感体验。很显然,视频中主讲者热爱数学,而观众无不感同身受。观看时,观众往往反复感叹「啊哈!」,因为隐藏的联系被挖掘出来,他们收获了令人惊喜的洞见。视频中,数学的优美,数学蕴藏的非凡想法,数学潜藏的有趣谜团尽数展现,同时观众又感到做数学并不神秘,所有人都能理解数学,甚至参与其中。
这种对知识主题的情感联系很容易被忽视或是被低估,然而它是所有有效学习和有效行动的基础。要建立这种情感联系,视频比文字更容易。
然而,这种情感联系也有其反面。我们经常听到有人认为 Sanderson 的视频在「教数学」。但在一次与他的谈话中,他告诉我们,他认为只有一小部分的人看完视频后能获得不算粗略的数学知识。恐怕这基本是正确的,高影响力的视频通常无法影响人们细致的智力思维。但是,这些视频的非凡价值在于它们创造的情感联系。
有没有可能创造一种媒介,集视频和文本的优良特点于一身?
具体地说,是否有可能创造如下如一种媒介?它像视频一样,富有情感潜力——可以表达敬畏、奥妙、惊喜、美感的潜力,而它创造的情感联系有细致的知识作为基础。这些知识包含丰富细节,讲述他们也是普通文本,甚至是助记媒介的目的。
我们相信这是可能的,我们计划开发一种「助记视频」,既提供视频中的情感联系,又提供助记文章中的丰富细节。
创造这样媒介很有挑战性。许多慕课平台已经做了一些尝试。典型的方法是在真人出镜讲解的无聊视频中穿插少量测试题[^26]。下图描述了慕课平台 Coursera 如何使用这种方法:
其他慕课在细节上有所不同。但其整体的情感体验可以总结为:
这些视频中,可能有一些高质量的部分在情感上引人入胜,虽说他们也很难像最优秀的视频那样充分发挥情感潜力,构建情感联系,比如 Grant Sanderson 等人的视频。但整体情感体验毫不连贯,令人敬而远之。那么,有没有可能创造一种融合情感与知识的媒介,提供统一而精心打造的情感与智力体验?最理想化的话,是否能创造如下的体验?
在慕课平台中,问题通常脱离了上下文,显得很枯燥。但是在助记视频中,叙述者会解释所研究的问题为何重要,为什么用户看完视频会受益,这些内容都融入在整体叙述中。做得好的话——比如配有合适的音乐,语调适当地急促或调皮——它将让观者感到迫切相关。同时可以调整视频播放器,以便用户直接回答问题,作为间隔重复体验的一部分。如此改造便能让在情感充沛的主要叙述和情感中性的问题之间的过渡会柔和得多。
下面我们简述一种实现上述效果的方法[^27],展现了叙述者如何在整体叙述中适时提问而不显唐突:
助记视频的节奏很可能与助记文章大不相同,尤其是问题的频率和密度会比助记媒介低。与此同时,有必要测试不同的节拍和节奏,以平衡情感和智力体验。情感充沛的视频通常也有比较平静的时刻;他们之所以能有效激发情感,一部分是因为有这些低情感强度的时刻作对比。想一想,一部好的动作电影或惊悚片也有些平淡片段。内容一直都是高情感强度的话,观众的情感反馈也会减弱。设计助记视频时,可以让其中的问题充当低情感强度的节拍。
当然,上面只是简略描述了一种设计助记视频的方法。理想情况下,还应该有一个间隔重复的部分,也许用文字而不是视频来提问。在我们看来,这种方法大有可为,但需要大量开发工作并充分测试。特别地,我们要做详细的、逐秒的用户体验测试,以了解用户的情感和智力体验,并进行修正,直到我们有自信认为目标用户得到了他们需要的体验。理想情况下,我们也会给出几个非常不同的设计,并努力了解每种方法会如何影响用户的情感和智力体验。
此处讨论的上位主题是软件是否认真对待用户情感。历史上,很多思想工具软件要么忽略了情感,要么把它当作次要问题。相反,这些工作都专心于让用户习得新技能,让用户「学到」什么。他们似乎是为一个没有情感的木头人设计,全然不顾满足情感联系这一更高阶的需求。用户们是不是没兴趣?害怕?充满敌意?焦虑?还是他们从内而外地感到激动,感到美学享受,甚至感到目标被延伸,自我得到发展?
相比之下,电影、音乐和(通常)电子游戏等媒介是认真对待情感的。这类媒介的设计者往往对用户的情绪反馈进行了十分精巧的建模,小到对用户情感逐秒变化的丰富理解,大到对用户整体情感历程的深入考虑。在思想工具的开发中使用这种方法是可行的,也是可取的。
与此同时,仅有积极的情感体验是不够的。为了让思想工具激发持久力量,在使用工具后,用户需要切实掌握更多知识,提升决策与行动能力。因此,思想工具的情感和智力体验必须同样认真对待。为了探究这两者的处理方式,助记视频便能派上用场。用爱因斯坦的话说,没有情感联系充实的丰富知识是平淡无趣的;没有丰富知识依托的情感联系是转瞬即逝的。
为什么现在思想工具的发展停滞了?
既然思想工具威力巨大,那为什么他们的发展停滞了?为什么思想工具没有形成一个重要行业?
正如导言所指出的,在应用计算机提升人类认知上,夸夸其谈而不付诸实践是常态。比如说,乔布斯将计算机比作「思想的自行车」的比喻,总是挂在很多技术专家的嘴边。但也只是挂在嘴边。计算机对跟提升人类认知的应用十分局限,不少计算机领域的先驱者对此深深失望。如 Douglas Engelbart 批评道「我们被困在一条危险而令人失望的羊肠小道上」。2006 年,当被问及他的愿景实现了多少时,Engelbart 打趣道「大约 2.8%」。Alan Kay 在演讲中断言,「真正的计算机革命还没有发生」,并在一次采访中把现代网络描述为「重新发明漏气轮胎......至少像 Engelbart 一样搞点新东西。」
我们认为,今天的许多技术领袖发自内心崇敬 Engelbart、Kay 和他们的同事。许多人甚至觉得计算机作为改善人类思维的工具有着巨大的潜力。但他们看不出开发新的思想工具该怎么撑起一家公司。没有商业机会,发展就会停滞不前。
什么因素让建立公司开发思想工具那么难?为了回答这个问题,想一想 Adobe 公司,这家算是少数认真开发新思想工具[^28]的大公司。它把钱投入到开发新的媒介[^29]上——如 Illustrator,Photoshop……对于设计师和艺术家来说,这些媒介是了不起的思想工具。
对 Adobe 来说,不幸的是,这些媒介的开发成本极高,而且很难阻止其他公司低成本复制这些想法或开发出近乎同等的产品。例如 Sketch 已经蚕食了 Adobe 的不少市场份额。它就是复制了 Adobe 几个产品的许多优质功能,其中 Illustrator 最突出。而 Figma 又在蚕食 Sketch 和 Illustrator 的市场份额。Sketch 和 Figma 完全不需要花大价钱研发也能开疆扩土。这是他们相对于 Adobe 的一大优势。
Marc Andreessen 观察到[^30]:
纯粹凭产品建立的护城河在[硅]谷真的很罕见,因为硅谷里优秀的工程师太多了......然后还有跨越式发展的问题。其他团队有机会从你的工作中学习,然后开发更好的东西。
换句话说,许多思想工具是公共物品。它们最初的开发成本往往很高,但其他人复制和改进它们很容易,他们相当于免费享受了初创者的投入。这种复制和改进,在社会层面上可能是有益的,但对那些最初投入的公司来说却是坏事。因此,这种思想工具遭遇了许多公共产品的命运:相对于它们所提供的好处,我们的社会对它们的集体投资不足[^31]。
早些时候,我们认为现代设计方法,在应对生产真正的思想变革工具的挑战上远远不够格。从表面上看,这个过程层面的论点似乎与我们刚才的公共物品论点非常不同。事实上,过程层面的解释是公共物品解释的一个结果:公司不使用必要的过程,因为这样做对他们没有什么价值。相比之下,在「更困难」的技术行业——例如芯片设计——公司做深入研究的动力更足。在这些行业中,其他公司要复制或获取这些研究的价值是相当困难的。
与电子游戏对比,这很有启发性。游戏公司开发了许多非常创新的界面创意。这也许令人惊讶,因为你会认为这种界面创意也会受到公共物品问题的影响:游戏设计师需要投入巨大的精力来开发这些界面创意,而这些创意往往会立即被其他公司复制(和改进),而成本忽略不计。在这个意义上,这些创意是公共物品,能够丰富电子游戏的生态系统。
但是,电子游戏公司和 Adobe 等公司之间有很大的区别。许多电子游戏挣钱主要靠前几个月的销售。因此,其他公司的确可以复制或翻版这些包含新想法的游戏,他们也这样做了,但这对原本游戏销售影响不大,因为克隆版发售时,原游戏的大部分钱已经赚回来了[^32]。虽然这种抄袭对被抄袭的公司来说无疑是令人恼火的,但对他们来说,进行前期投资仍然是值得的。
从结果上看,游戏界中,聪明而崭新界面创意可以成为有区分度的功能,能够成为游戏的重要市场优势。同样,它们甚至可以助游戏成为经典——想想看,从《太空入侵者》到《狼人杀 3D》再到《纪念碑谷》等游戏中的许多原创(在当时)创意。因此,许多公司并没有缩手,而是对新界面创意的开发慷慨投资,尽管它们最终能被自由取用。通过这种方式,电子游戏行业在很大程度上解决了公共物品属性的难题。
相比之下,像 Adobe 这样的公司赖以为生的是产品销售,以及被产品长期锁定的用户。他们说服人们——实际上是整个组织——长期使用他们的产品。学校提供「Photoshop 专家」或「Illustrator 专家」的培训课程来发放令人引以为豪的头衔。公司将其设计部门指定为「Adobe 商店」。因此,尽管 Adobe 确实在开发聪明的新界面创意投资(对他们来说,与视频游戏公司不同,这真正意味着思考的工具),但这对他们的竞争优势来说并不那么核心,因此投资也会减少,相对于将其作为核心优势的假设情况。然而即便如此,Adobe 公司在开发思想工具方面所做的工作也许和任何公司一样多,甚至更多。
电子游戏行业在公共物品难题上取得的进展是令人鼓舞,但对于思想工具是否有相应的破局之法?不幸的是,对于思想工具,游戏界赚眼球,捞快钱的收入模式并不奏效。我们需要让人们确实掌握最好的新思想工具,发展精湛的技能,而不是花几十个小时(像大多数游戏那样)达到还不错的水平,之后另寻新欢。
对于公共物品问题,另一个看似合理的解决方案是专利,也就是让发明者暂时垄断一项发明的使用权。许多软件公司,包括 Adobe,也都构建了庞大的专利库。然而,当前的专利制度并不足以解决这个问题。2017 年,Adobe 公司负责知识产权和诉讼的副总裁 Dana Rao 发布了一份呼吁,要求大刀阔斧地改革专利制度。他说:
[专利]制度已经崩溃......为什么?因为专利暴发户打造的专利淘金热......他们看重的不是专利背后的创新,而是专利要求的含糊其辞,以及在对原告友好的法庭上行使这些要求的可能......这些用意险恶的专利的材料从何而来?软件的出现......一些专利只是一些想法,却能获得广泛却常常不合法的权利要求,而热衷于专利暴发户们非常乐意利用这一优势。
Adobe 与许多其他软件公司的共同点是,他们的大部分专利都是防御性的:他们把一些想法申请专利,以便专利恶霸无法通过类似的相互起诉他们。这样与理想情况大相径庭。创新型公司很容易受到专利恶霸的攻击,这些恶霸有庞大的专利库,其中专利的权利要求广泛而模糊,也没有多少细节,不费吹灰之力。但是,一旦创新型公司投入更多来实现一个非常不错的新创意,其他公司总能复制该创新的核心,对其进行合适改变,以合理地规避任何专利侵权。专利制度没有保护应该保护的东西。
从单个公司的角度跳转到从整个社会的角度来看,我们不仅希望激励发明,还希望创意能以合理的速度进入公共领域。想一想基本的思想工具,比如文字和数字系统。显然,这些工具在整个社会中传播,不受知识产权问题的约束,是一件好事。更广泛地说,许多思想工具使用得越广泛,对社会越有价值。当然,现代专利制度在这方面有许多问题广为人知,因而无法较好地平衡私人利益和公共利益。假如专利制度设计得好,它很可能有利于解决公共物品问题,但实际的专利制度似乎很不适合这个问题。
有没有可能完全避免公共物品问题呢?这里有三类思想工具,它们可以做到:
- 诸如谷歌这样的搜索引擎是思想工具。他们避免了公共物品问题,因为他们的价值在于他们的品牌,以及难以复制且资本密集的后端(包括他们的数据中心、专有算法、广告网络和分销),而不是他们的界面创意。
- 像 Twitter 这样的服务可以被认为是一种集体思考的工具。虽然界面很容易被复制,但由于网络效应,公司却很难被复制。
- 新颖的硬件设备(例如,用于 VR,或 Wii 遥控器,或用于新乐器)可以作为新的思想工具的基础。虽然硬件可以被复制,但它往往比复制软件要昂贵得多。而且不仅如此,这类公司的优势往往在于分销、营销,以及与为该平台生产产品的供应商的关系。
虽然这些建议都避免了公共物品问题,但它们并没有直接解决公共物品问题。而许多有前途的思想工具发展方向——包括助记媒介和助记视频等创意——都具有较强的公共物品属性。在这种情况下有可能解决公共物品问题吗?在我们看来,两个最有希望的方法是:
- 慈善资金支持。计算机动画和动画电影领域便采用了这种方法。几十年来对计算机动画的公开研究孕育了大量强大的、(在许多情况下)公开的创意。这反过来又帮助皮克斯和梦工厂等公司做好了准备,这些公司进一步发展了许多创意,并将其扩大规模。
- Adobe 和类似公司使用的模式,其中新的思想工具是公司运营的核心部分,但不是其竞争壁垒的核心。竞争壁垒可能是依靠着培训、营销、文档支持等建立起来的。
质疑我们的基本前提
到目前为止,有三个重要的前提是我们认为理所当然的。首先,是断言我们仍处于早期阶段,还有许多变革性的思想工具尚待发现。第二是断言思想工具的开发停滞不前,即现在开展没有很多有趣的工作。第三——可以说是元前提——是断言这种工作是值得做的,这与当前偏好于人工通用智能,脑机接口等相关想法的思潮有关。在本节中,我们将讨论这些前提。
如果最好的思想工具已经被发现了呢?
换句话说,也许 20 世纪 60 年代和 70 年代是一个不可复制的黄金时代,而未来所能期待的是逐渐的渐进式的改进,间或有些有重大突破,但频率会越来越低?
有一套看似合理的逻辑来支持这个看法。科技是巨大的产业,资金充足,有许多人投身其中,他们头脑聪明、抱负远大、才华横溢。如果存在值得发现的重大想法,人们早就会这样做了?下列事实更是支持了这个想法,就个人而言,我们遇到了许多才华横溢的人,他们对思考的工具很着迷,而且持续研究,然而他们似乎步履缓慢。
但是,虽然这套逻辑看起来很有吸引力,它却有误导性。真正的难题——像发明印度-阿拉伯数字系统这样的问题——仅靠善意愿望和兴趣使然是不够的。缺失的一块关键拼图是足够强力而有进步性的创意。在每个学科发展的源头,也就是其学科原初阶段——少数非凡的人——像 Ivan Sutherland、Doug Engelbart、Alan Kay 和 Bret Victor 这样的人——可能能够取得进展。但他们的工作有强烈的个人特点,很难让其他人掌握,或发展壮大成为社区。这还不是一门真正的学科。我们需要的是发展一个强大的实践传统,一套明确而强大的核心理念,使后来者能够迅速吸收,并开始发展自己的实践。思想工具还没有达到这个阶段。但我们相信,我们也不是那么遥远。
虽然这个论点是有帮助的背景,但它并没有解决核心问题:它并不意味着有很多新的变革性的思想工具正等待我们去发现。再说一遍:也许最重要的思想工具已经被发现了?
我们无法预测未来,所以不可能肯定地回答这个问题。但在我们看来,人类只是还没有真正努力过。一旦有一小群的人动力十足,并且刻苦努力——如 PARC、SRI 等先锋实验室和其他受 DARPA 启发的早期成果,以及 Dynamicland 等现代实验室——他们将进展飞速。这些努力,相对于人类在研究上的总体投入十分渺小,但成就又如此巨大,是非常令人鼓舞的,并指示着我们再接再厉,扩大规模,敢于想象。
这不正是科技行业的职责吗?不是有很多思想工具正在进展吗?
具体一些,不是已经有很多富有想象力的、坚定的、资金充足的人在从事这项工作吗?科技在深大程度上不就是开发新的思想工具吗?
这个问题有部分要归结于术语的混淆。显然,许多科技公司为解决特定的问题开发了特殊用途的工具。但是,尽管这些工具可能有其价值,它们肯定不是我们所讨论的广义上的「思想工具」——不像语言或写作,或者 Illustrator。
尽管如此,还是有一些科技公司确实在开发思想工具。我们已经讨论了一些公司部分或完全避免了公共物品问题的例子,这些工具包括:Illustrator、Google Search、Twitter、Slack、Google Docs、程序员工具[^33]……所有这些确实都是重要的思想工具。
但考虑到我们最基本的思想工具——语言、写作、音乐……这些都是公共物品。没有人拥有语言;在语言被拥有的程度上(商标等),它实际上可能限制了语言的效用。这些工具都是关于引入基本的新的心理表征和心理操作。这些并不为任何公司所拥有,它们是人类拥有的模式。
这个论点使得许多最基本和强大的思想工具似乎有可能遭受公共物品问题。而这意味着科技公司把重点放在其他地方;意味着许多富有想象力和雄心勃勃的人决定把重点放在其他地方;意味着我们还没有发展出在该领域开展工作所需的强大实践,结果该领域仍然处于前学科阶段。最终的结果是,这意味着最基本和强大的思想工具供应不足。
为什么不在人工通用智能(AGI)或脑机接口(BCI)方面下工夫呢?
我们经常被问到:为什么你们不研究 AGI 或 BCI,而要研究思想工具?这些不是更重要而激动人心吗?特别是对于 AGI,许多所需的技能似乎是相关的。
它们当然是重要而激动人心的主题。更重要的是,目前 AGI 和 BCI 正在风口上(而且资金支持更充足)。作为读者,你可能会翻白眼,认为我们立场有些先入为主:如果我们不赞成思想工具的工作,我们就不会写这篇文章。但我们在决定人生重心时,是经过再三琢磨才选择了思想工具的。我们中的一个人在把重心落在思想工具之前,也写了一本关于人工智能的书;这不是一个轻率的决定,而且不时还需要再次权衡。事实上,鉴于目前对 AGI 和 BCI 的热潮,从事思想工具研究的人经常有一个小声音在他们的头脑中说:「嘿,你不应该在去研究那些东西吗?」风潮很会引诱人。
一个明显的区别是,AGI 和 BCI 需要解决的问题相对具体、明确。相比之下,思想工具方面的工作则没有那么明确的定义。基本上不能指出明确的、长期的目标,而是只有长期的愿景和追求,甚至只是一种动机。这项工作实际上是对一个开放性问题的探索:我们如何开发一些工具,以激发人类更多想法?
从文化上讲,科技发展是由工程式、目标驱动的思维方式所主导的。有一个非常具体的目标,设置 KPI、评估 OKR 和管理交付产品就容易得多。因此,科技文化更喜爱 AGI 和 BCI 这两个方向的现状,也许并不令人惊讶。
但从历史上看,人类巨大的突破并不依靠目标驱动来实现。语言的创造——原初的思想工具——也许是人类历史上的最重要事件。尽管围绕语言起源的争论十分激烈,也没有定论,但它似乎极不可能是目标驱动下的产物。语言的发展是史前时期的某个季度 OKR?想想就很引人发笑。这样怎么设定目标?再发明一个新的不规则动词的配额?这是不可想象的!
同样,发明其他思想工具的——写作、印刷术……——也跻身于我们有史以来最伟大的突破。而且,据我们所知,所有这些发明都主要在开放式的探索下自然涌现,而不是在目标驱动下完成。即使是计算机本身也是在探索中产生的,然而这种探索对于今天的技术从业者会是可笑的投机,定义十分模糊。没人有会坐下来想着「我需要发明计算机」;这样的想法没有任何可供参考的框架。相反,像艾伦·图灵和 Alonzo Church 这样的先驱者得到发明时,正在围绕逻辑、数学、可证明性探索基本的问题,基于这些探索,计算机的概念出现了,虽然已经时隔多年;它是一个被发现的概念,而非一个目标。基本的、开放性的问题似乎至少和目标一样是突破的源泉,无论多么雄心勃勃。在硅谷的目标驱动文化中,这一点很难想象或说服他人接受。事实上,我们自己也感受到了目标驱动文化的吸引力。但是,根据经验进行的开放式探索也可以同样,甚至更成功。
「新的思想工具会是什么样的?」这是我们经常听到的一个问题。然而,根据定义,我们说不出来。正如我们前面所指出的,如果我们仅靠文字描述就能传达工具的使用经验,那么这些工具将是失败的;它们没能改变一个人的思维,甚至是他们的意识。具体来说:要理解助记媒介,你必须在很长一段时间内高强度地使用它。即使如此,你也可能没有意识到这种效果;我们曾经采访过一些思想工具使用者,他们显然没有意识到他们对所读文章中的材料有令人难以置信的记忆水平。意识哲学中最著名的论文之一题为「做一只蝙蝠是什么感觉?」每个思想工具都提出了一个类似的问题,如果不沉浸在这个工具中,几乎不可能回答,就像「作为一个语言使用者是什么样子的?作为音乐家呢?」等等。
在我们看来,思想工具的工作在未来几十年将比 AGI 和 BCI 的工作更重要。而且,考虑到 AGI 和 BCI 的工作目前是多么时髦和资金充足,似乎几乎可以肯定,从回报的角度看,思想工具的工作提供了巨大的利益。
那么长期的情况呢?在这方面,情况不太清楚。这三个领域似乎很可能会合并,或者至少是彼此紧密联系在一起。我们中的一人与 Shan Carter 同样认为,人工智能最有前景的应用之一是发现新的思想工具[^34]
BCI 似乎可能更与思想工具密切相关。BCI 有时被描述为辅助长期记忆使用记忆芯片,或增加短期工作记忆的某种方式。这样的想法很可能变得很重要。但 BCI 似乎也有可能被用于实现新的心理操作、新的心理表征和新的思维能力;简而言之,与开发非 BCI 思想工具所涉及的内容相同。也许我们会开发出直接想象自己在 4、5 或更多维度上的能力;或穿越黎曼流形;或拥有多个注意力的能力。这些都是关于改变思维的借口,允许的基本抽象和操作。因此,今天关于思想工具的工作将直接影响我们在未来使用 BCI 的方式,这似乎是合理的。
可执行的书
写作的技巧是创造一种背景,让其他人可以在其中思考。
—— 埃德温-施洛斯伯格
计算机科学家 Peter Norvig 写了一篇互动文章,讨论社会中的财富分配问题。Norvig 的文章载体为 Jupyter notebook,其中有许多想法通过运行 Python 代码表达。这段代码设置了一个由代理人组成的群体,以及他们初始的财富分布。代理人随机地(和重复地)成对相遇,并进行简单的经济交易。更具体地说:考虑一个简单的交易模型,交易就是当两个人相遇时,将他们的共同财富集中起来,然后在他们两个人之间随机分配。这个模型只是为了给你一个要点——当然,更复杂的交易模型是可能的。这篇 notebook 模拟了财富的分配是如何随时间演化的。
Norvig 的文章之所以优美,部分原因在于仅用几行 Python 代码,Norvig 就能展示一些关于财富不平等的令人惊讶的结果。例如,他的结果表明,经济中财富的初始分配并不怎么影响财富的长期分配。相反,是交易的性质决定了财富的长期分配。这至少可能违反了一些使用者的直觉。另一个例子是,他的结果表明,限制代理人只与他们在地理上接近的人进行交易,对财富的最终分配没有什么影响。
像这样的结果将挑战一些用户的直觉。但这些挑战不是基于容易被忽视的抽象论述,使用者可以直接把玩 Norvig 的模型。假设有人不喜欢财富的初始分配不影响长期财富不平等的观点。文章促使他们是找到反例,一种确实影响长期不平等的财富初始分配。他们可以很容易地进行实验,只需对 Python 代码的一行或几行进行简单的修改,以找到初始分配确实有影响的实例。无论结果如何,他们都会对这个问题建立更好的理解[^35]。
要是 Norvig 的文章内容以更传统的静态形式呈现呢?对于一个读者来说,要扩展或质疑这些结果,就需要完全掌握这些材料,并具有高水平的数学能力。但在 Notebook 的形式中,读者更容易进行实验。有脚手架辅助他们的探索,只需小修小改就能看到结果,甚至回答一些诺维格没有预料到的问题。这种有辅助的探索是建立他们自己的理解的一种方式,甚至有可能推动知识的前沿。
Norvig 的文章是已经创建的成千上万(甚至数百万) Jupyter notebook 中的一个。当然,大多数这样的 notebook 都写得很草率,很糟糕。但是,在像 Norvig 这样优秀的作家兼思想家手中,notebook 可以成为非凡的思想环境,对于个人和合作都是如此。我们很想把它们当成不过是文章和代码的混合体。但实际上,它们是一种新的媒体形式,蕴藏的可能性与文章或者代码大相径庭,并且非常有机会走得更远。在本节中,我们将探讨这些机会[^36]。
我们把 Norvig 的文章称作「互动文章」。更具体的术语是很有用的,可以把它与其他互动形式区分开来,比如助记媒介。在这篇文章中,我们将使用「可执行的书」这个术语[^37]。我们不会在这里精确定义;定义不是重点。相反,重点是试图更好地理解这样结合代码和文章的媒体形式有何潜力。
开发思想工具必须与创作严肃内容齐头并进。对权威内容的渴望
Seymour Papert 是 Logo 编程语言的主要创造者之一,他对 Logo 有一个非凡的愿望。Logo 有时被描述为一种「儿童编程语言」,而人们有时认为 Papert 主要对帮助儿童学习编程感兴趣。但这并不是 Papert 的主要意图。相反,Papert 想创造沉浸式的环境——可以叫「数学乐园」——以让儿童沉浸在数学思想中。从本质上讲,去数学乐园甚至可以让孩子学习微分几何。
这是一个美丽的愿望,Logo 包含了许多引人注目的想法。但据我们所知,没有一个专业的微分几何学家(或更普遍的,数学家)在工作中认真使用 Logo 作为工具。仔细想来,这似乎令人不安。如果 Logo 真正地表达了微分几何的思想,为什么微分几何学家不使用它?你开始想知道:是不是 Logo 遗漏了微分几何的重要思想,甚至可能是微分几何的最重要思想?毕竟 Papert 本人虽然受过数学训练,但他并不是功成名就的微分几何学家。他该怎么知道 Logo 应该包括什么呢?当然,大多数对 Logo 感兴趣的人也没有资格做出这种判断。
对此有一个标准的反驳,我们在 Logo 社区中也听到过。那就是谈论不同思想环境的「下限」和「上限」。在这种说法中,Logo 的下限很低(意味着任何人都可以使用它),上限也很低(所以它不太适合专业人士想要做的那种高级工作)。
起初这听起来很有道理。但仔细一想,这很难让人理解。Logo 的创造者怎么知道掌握 Logo 有助于以后理解真正的(原谅我们!)微分几何?成功的标准是什么?本文的一位作者(MN)在与微分几何密切相关的黎曼几何领域做了几年的研究。虽然 Logo 使用起来很愉快,也包含了很多有趣的想法,但 MN 却很难看出学习 Logo 对学习微分几何有什么帮助。
在 Norvig 的经济学论文的末尾,有一个简短的后记,解释了他是如何写这篇文章的。在写这篇文章前不久,他听说了利用 Jupyter Notebook 讨论的各种经济模型,他想探讨这些模型的几个问题。在与一些同事讨论后,他们决定各自独立地攻克这些问题,并比较撰写的 notebook。虽然 Norvig 的文章在某种意义上是「教育性的」,但 Norvig 的意图是探索一些他自己真正好奇的问题。教育意义不过是副产品。
因此,你看到一个世界级的研究科学家,他想探索一系列的问题。他使用 Jupyter 作为媒介来展开这些探索,然后与世界分享他的结果。他的分享形式是他人可以当成基石来扩展他的思考的。
有很多关于思想工具的产品都自称为玩具或「教育」环境。他们就像真正的作家不使用的写作工具,真正的数学家不使用的数学工具,如此等等。即使这些工具的创造者有良好的意图,我们也很难不对这种模式产生怀疑。我们很容易陷入一种货物崇拜的模式[^译 1],做一些看似(比如说)数学的工作,但实际上却避免深入这个学科的要害。创作者本是为了研究某个学科而构建工具,他们却从来不针对这些学科完成重要的原创性工作。他们怎么能知道工具需要包括什么呢?
具体来说:假设你想为 X 学科(比如 X=微分几何)建立工具。除非你深入地参与到该学科的实践中,否则要建立好的工具是非常困难的。这就像没有实际做任何木工工作,却试图建造新的木工工具。这也许是像 Mathematica 这样的工具能派上用场的部分原因——主要设计者 Stephen Wolfram 对数学和物理学有真正的研究兴趣。当然,并不是 Mathematica 的所有部分都同样有用;有些部分感觉像是玩具,而且看起来这些部分很可能是没有被公司内部认真使用。
这里有一个一般原则:好的思想工具大多是在对严肃问题进行原创工作时产生的副产品。他们往往要么是由从事这项工作的人创造的,要么是由与他们的工作关系密切的人创造的,这些人是真正买办[^38]。此外,这些问题本身对于问题解决者来说通常具有强烈个人兴趣。他们不是为了薪水而解决问题,他们是急切地想知道答案。
很多人问,我们的第一篇助记文章为什么是关于量子计算的。如果我们选择一个更容易的主题,我们可以吸引更多的观众。但我们也希望文章是真情实感的(authentic),是我们想解决的问题。我们中的一个人(MN)做了很多关于量子计算的原创研究工作。这篇文章反映他的所思所想。事实上,这篇文章的框架就在回答 MN 个人想要回答的问题:如果人类发现了外星人,他们会不会有电脑,如果有,他们会有什么类型的电脑?这也许听起来像一个生搬硬造的问题,但它是相当严肃的,而且最终十分深刻,答案也不简单:写这篇文章帮助 MN 大大改善了他对这个问题的理解。
虽然这么说,回答这个问题并不是创作这篇文章的主要目的:制作助记媒介才是。对于未来的思想工具研发来说,在我们自己真正想回答的问题上更加努力是有价值的。这是一种确保诚实的方式,确保你制作的不只是浮夸的玩具,而能对解决备受关注的真实问题的确有用。
严肃媒介中有经典媒体的概念。我们指的是扩大媒介范围的实例,并为该媒介的创作者确立广为人知的新标准。例如,《公民凯恩》、《教父》和《2001》都扩大了电影的范围,并启发了后来的电影制作人。这在新媒体中也是如此。像 Grant Sanderson 这样的 YouTubers 创造了经典的视频:他们扩大了常人认为视频能实现的范围。而类似《费曼物理学讲座》的著作对教科书来说也是如此。了解每一个经典媒体,人们都能感受到创作者全身心投入其中。在费曼的许多讲座中,很明显,不仅仅是在教育:他传达了一个人一生都痴迷于世界运作之道,会有何等造化。这是令人激动的,而且它扩展了形式。
人们对 Jupyter notebook 没有大胆想象,我们对此感到失望,在经典媒体的意义上。他们推动这个媒介发展不够努力; Jupyter notebook 中的「公民凯恩」仍不存在。事实上,我们几乎没有超过卢米埃尔兄弟。像 Norvig 的笔记本这样的例子还不错,但如果作为该媒介的主要代表来评估,似乎是令人失望的。
为了造就经典,一个有趣的项目可以是对于最新的 IPCC 气候评估报告,开发一个可执行的版本(也许先做一小部分)。你会有一个活生生的气候模型——实际上是许多相互关联的模型——供人们探索,而不是一个充满断言和参考的报告。如果它足够好,人们会用它来教课;如果它真的很好,他们不仅会用它来教课,它也许可以成为许多气候科学家的创造性工作环境。
在这个方向上的一个有希望的探索是《经典力学的结构和解释》,这本美丽的可执行的书一步步了讲授经典力学。其中,许多经典力学的定理并不只是以静态地表达在页面上,而是活生生的,是用户可以修改的代码。这些定理变成了 API,可以真正应用于其他对象,并被串联起来。它使用了比 Jupyter 更强大的底层模型,开发了一种新的符号语言作为本书的一部分。它有很多缺陷——比如,该书不能在浏览器中实时运行,使得用户很难进行实验。而且,虽然这本书写得很好,但作者对经典力学的理解,并不像其他一些书的作者那样深刻。但它还是一则鼓舞人心的唤醒,预示着可能发生的事情。它暗示了当作者将可执行的书用于严肃的目的,并追求创作经典媒体时,可能会出现什么。
通过倒置的写作结构建立更强的情感联系
设想一个作者在写一本关于量子力学的畅销书。这样的作者可以随心所欲:他们可以用各式惊奇的现象作为书的开头,比如黑洞蒸发、量子传送、量子波动在早期宇宙中的作用等。或者,如果他们愿意,他们可以从人类所知的一些最深奥的谜团开始:量子力学和引力之间的关系,或者量子测量问题。非凡的现象和美丽的奥秘唾手可得。这些内容很能打动人心,估计对大多数人都如此。因此,要吸引读者,让他们集中注意,并让他们有所感触,是相对容易的。
相比之下,想象一本关于量子力学的典型技术读物。它不太可能从黑洞蒸发或量子传送开始——如果它这样做了,它的讨论将是敷衍的。相反,它的开头非常枯燥,充斥着技术的细枝末节。复数。波函数。许多不同类型的微分方程,以及解法。赫米特和单元运算符。以此类推,一块一块地慢慢建立起解决量子力学问题所需的所有部件。这本书可能要写几十页甚至几百页,才会开始与激动人心的问题联系起来,而这些问题也是量子力学流行描述的必需品。
没有什么好的技术写作经验的人经常抱怨这种干燥的、自下而上的方法。他们会抱怨说,作者应该更多使用有趣的材料,并减少使用技术符号和术语。但是,即便是有能力的作家试图遵循这个道路,无一例外地效果很差。
有个问题是,一个人可以天天读把黑洞蒸发、量子传送等类比的文字。而读到最后,这些文字一般……没有展现什么理解。类比和启发式推理就是不能深入。它们可能很有娱乐性,并营造一些理解的错觉。但这些推理无法迁移;它不能应用于其他现象,至少在没有大量警告的情况下,而读者无法理解或应用这些警告。因此,优秀的技术作家大多从第一性原理出发,偶尔会离题到学科的宏观层面来打动人心。而这意味着要从大量细致的技术细节开始。
将传统的技术书与可执行书籍所带来的可能性进行对比是非常惊人的。你可以想象,在一本可执行的书中,比如说,量子传送,就在第一页开始。你会提供一个界面——也许导入了一个库——让用户立即传送量子系统。他们可以实验量子传送协议的不同部分,直接开始说明它的最引人注目的思想。用户不一定能理解所有正在发生的事情。但他们会开始内化一个关于传送意义的准确图景。随着时间的推移,在闲暇的时候,作者可以阐述一些先前看似比较枯燥的细节。只是到那时,读者会早就掌握这些细节,它们就不会那么枯燥了[^39]。
换句话说,一本可执行的书的开头,完全可以是用户已经关心的、可以轻松感同身受的、觉得有动力的材料。例如,你可以从探索传送或大爆炸开始。但这样的开头不会有大众科学的缺点,即模糊和不精确。相反,界面将被充分描述。而且,只要稍加注意,这个界面可以被扩展,应用于不断扩大的环境中。这种理解是可以转移的。即使是只理解了材料的一小部分的用户也可以开始上手调整,在游戏和探索中建立起理解。人们通常认为这种方法会导致玩具式的理解;相反,我们认为,如果有足够好的脚手架设计,它可以孕育深度理解[^40]。如果开发得足够深入,这样的环境甚至可以用来探索新的研究思路。据我们所知,这类项目从未被认真执行过。但尝试一下会很有趣。
摘要和结论
我们已经涵盖了很多内容,但提炼出主要的收获还是有帮助的,诸如一般原则、问题、信念和愿望。让我们从记忆系统开始,特别地,助记媒介:
- 记忆系统使记忆成为一种选择,而不是偶然的事件:这改变了我们与所学内容的关系,减少了担忧,并释放了注意力,使之集中于其他类型的学习,包括概念性的、解决问题的和创造性的。
- 记忆系统正处于起步阶段:有可能将人类的有效记忆提高一个数量级,甚至超过现有记忆系统的作用;而助记媒介等系统可能有助于扩大用户完全可以理解的主题范围。
- 精湛使用助记媒介会是什么样子?说助记媒介「只是」抽认卡大概也对。但正确的结论不是说它因此是微不足道的;而是说抽认卡被大大低估了。在写作「量子国度」时,我们崇敬地对待卡片的编写;理想情况下,作者会像纳博科夫对待书写句子一样认真对待书写卡片。当然,我们没有达到这个水平,但这个愿望扩大了媒介的范围。精湛甚至经典地使用助记媒介会是什么样子?
- 记忆系统可以用来建立真正的概念性理解,而不仅仅是学习事实:在「量子国度」中,我们部分通过对追求写作优秀卡片来实现这一目标,部分通过逐渐建立起背景和理解的叙述与间隔重复的嵌合体。
- 记忆宫殿等记忆术很好,但对于建立真正的概念性理解不够灵活:这种记忆术非常局限,而且人造联系痕迹过重,而不是许多概念性知识中存在的内在联系。然而,记忆技巧对于小成本记忆结构不明确的知识是很有用的。
- 记忆比人们想象的要重要得多:它几乎在认知的每个部分都起着作用,包括解决问题、创造性工作和元认知。反过来说,记忆系统本身就需要内嵌进入其他类型的工具——阅读的工具、解决问题的工具、创造的工具、注意力管理的工具。这就是说,我们还不知道记忆系统想要成为什么。要重申的是:记忆系统正处于起步阶段。
助记媒介仅仅是一个思想工具原型。我们还讨论了其他几个想法,比如助记视频和可执行的书。以下是一些关键的收获:
- 什么样的做法能够创造像印度-阿拉伯数字变革性的思想工具?现代设计方法和科技行业的产品开发在哪些方面存在不足?要想成功需要一个洞察力-制造循环全速运转,将深度研究文化的精华和硅谷产品文化的精华结合起来。
- 思考的工具是(大部分)公共物品,因此供应不足: 即便如此,有一些密切相关的生产模式已经成功了(游戏业、Adobe、AutoDesk、Pixar)。这些模式应该被研究,在可能的情况下被模仿,并作为灵感来寻找更多这样的模式。
- 认真对待情感:历史上,思想工具产品主要专注于在认知方面;许多产品都像是木头人设计。但它应该像最好的音乐家、电影导演和视频游戏设计师一样认真对待情感。助记视频是这种探索的一个有希望的载体,可能将深层的情感联系与助记媒介所渴望的详细的智力掌握相结合。
- 思考的工具必须与深入的、原创性的工作同步发展:许多关于思考工具的产品都在玩具问题和玩具环境上打转。这在原型设计时是有用的,但要想成功,这些工具最终必须被用来完成严肃的、原创的创造性工作。这是基本试金石,检验这些工具是否真正有效,或者仅仅是在讲一个好故事。理想情况下,对于任何这样的工具,都会有大量的经典之作来扩展这个形式,并进入其他创作者的意识中。
让我们回到文章开头的那个问题:如何建立变革性的思想工具?当然,我们甚至还没有精确地定义这种变革性工具是什么!但它们会以相对较低的成本改变实践而产生变革性结果——非线性的回报和思维的质变。这与通常的情况相反,即实践中的小变化导致结果的小变化。
历史上,人类已经发明了许多这样的变革性的思想工具。写作和音乐是古老的例子;在现代,像 Photoshop 和 AutoCAD 这样的工具也符合条件。虽然现在还很早,但我们相信助记媒介前景可期。它需要沿着我们所描述的路线进一步发展,并可能需要更多强大的想法。但我们相信,人类有可能即将拥有一个传播甚广的记忆实践,从根本上改变我们的思维方式。
更广泛地说,我们希望这篇文章中的原则将有助于支持创造更多变革性的思想工具。从历史上看,大多数思想工具的发明都是由受启发的个人和团体为自身定制的。但我们相信,在未来,会有一个成体系的社区经常进行这样的发明。
鸣谢
这篇文章是基于与许多人的谈话。特别感谢 David Albert、Shan Carter、May-Li Khoe、Robert Ochshorn、Grant Sanderson、Caitlin Sikora,以及 Bret Victor。还要感谢 Nicky Case 对文章草稿的反馈。这项工作得到了我们 Patreons 的支持。AM 的工作部分由 Emergent Ventures 的资助支持。MN 的工作得到了 YC Research 的支持。
引用
在学术背景下的署名,请将这项工作引用为:
Andy Matuschak 和 Michael Nielsen,「我们如何开发变革性的思想工具?」,https://numinous.productions/ttft,旧金山(2019)。
作者按字母顺序排列。
许可证
本作品采用知识共享署名4.0国际许可证授权。这意味着你可以自由地复制、分享和建立该作品,只要你适当地注明其来源。请点击以下许可证链接了解详情。
注释
[^1]: 比如 Douglas Engelbart,增强人类的智力:一个概念性框架 (1962)
[^2]: Alan Kay, 用户界面:一个个人观点 (1989)
[^3]: 同样,在 Alan Kay, 用户界面:一个个人观点 (1989),以及其他地方
[^4]: 在 Iverson 的图灵奖获奖演讲 作为思想工具的记号 (1979) 中可以找到一个说明。 顺便说一下,Iverson 这里描述的实际上是一种思考媒介 APL 语言,而不是狭义的工具。
[^5]: 关于这个问题的更多讨论,见 Andy Matuschak, 为什么书本不起作用[2] (2019).
[^6]: 关于这种效应的文章太多了,可以从 Gwern Branwen, 高效学习的间隔重复[3]开始读。
[^7]: 特别细心的读者可能会觉得这里的叙述和前面有点冲突——明明我们才说过,第一次复习的间隔是 5 天。是这样的,我们最近重新安排了复习间隔,所以第一次复习变成了 5 天之后。但量子国度早期的复习间隔比较保守,这就是造成差异的原因。
[^8]: 在电影《黑客帝国》中,其中一个角色(Neo)使用电脑快速地将功夫上传到他的脑海中。当他完成上传后睁开眼睛,对另一个角色(Morpheus)说:「I know Kung Fu」.
[^9]: 我们还没有尝试去扩大规模,但那样做应该会很有趣。
[^10]: 这里是细节:有 16 个用户照常复习,另外 25 个用户被延迟复习。95% 的置信区间是:91±4%, 87±5%, 89±5%, 96±3%, 假设每个变量都是二项,独立以及独立同分布的。后一个假设是近似的,因为我们期望一些与用户和与问题相关的影响。还要注意,这个实验是在早期版本的量子国度中完成的,在早起版本中,复习间隔为一天,三天,一周和两周。
[^11]: 严格来说,基础版的 Quizlet 并不支持间隔重复,只有付费版的 Quizlet 才支持间隔重复。除此之外, Quizlet 和其他的记忆系统别无二致。
[^12]: 不过,这些系统在一些小圈子里得到了广泛的应用。比如,医学生里使用 Anki 的人数正在与日俱增。
[^13]: 事实上,Wozniak 和 Sebastian Leitner 都是间隔重复记忆系统的重要开拓者。Wozniak 的许多思考都可以在非凡的 SuperMemopedia 上找到。
[^14]: Michael Nielsen, 增强长期记忆[1] (2018),以及 Michael Nielsen, 使用间隔重复系统看透一个数学证明[4] (2019)。
[^15]: 2019 年 12 月 9 日添加的注释:这一说法似乎是基于我们的数据分析中的一个错误,现在被收回。出于历史原因,我们保留了这段文字,但我们不再相信这一说法。
[^16]: Michael Nielsen, 增强长期记忆[1] (2018).
[^17]: Steven M. Smith, Arthur Glenberg, and Robert A. Bjork, 环境背景和人类记忆 (1978).
[^18]: 在 Joshua Foer 的《与爱因斯坦月球漫步》(2012) 一书中,可以找到对这种技巧的愉快的扩展介绍。
[^19]: 少数人不具备精神之眼,因此不能在精神上进行视觉化。这种情况被称为心盲症。本文的一位作者在 Twitter 上问,是否有心盲症患者尝试过使用位置法,如果有,对他们来说效果如何。答复是非常不同的(和引人注目的),但大多数人说这种记忆技巧对他们不起作用。这值得进一步研究。
[^20]: 见这里和这里了解更多关于使用 Anki 学习新领域的情况。最后四段改编自增强长期记忆[1] (2018)。
[^21]: 最后两段改编自我们即将发表的助记文章:Andy Matuschak and Michael Nielsen,量子传送如何运作 (2019)。
[^22]: 例如,见 William G. Chase 和 Herbert A. Simon, 国际象棋中的感知 (1973)。Adrian D. de Groot 在相关领域的早期工作很有吸引力,并在他的《国际象棋中的思考与选择》一书中进行了总结(1965)。
[^23]: 我们见过许多数学家和物理学家,他们说他们进入数学或物理学的一个原因是他们讨厌许多学科中常见的死记硬背,而更喜欢那些有可能从头开始推导出一切的学科。但在交谈中,人们很快就会发现,他们已经记住了他们学科中大量的概念、联系和事实。令人着迷的是,这些人对记忆在他们自己的思维中所扮演的核心角色如此视而不见。
[^24]: 同样的现象也发生在传统的小学乘法和除法的算法中。本文的一位作者写了一篇简短的发现小说,更详细地讨论了一个假想的设计者可能得出这些想法的方式。
[^25]: 当然,一个设计者如果与巴比伦数学方面的专家交谈,很可能会遇到其中的一些想法。我们将忽略这一点,因为这取决于一个奇怪的现象,即之前关于数字系统的许多优秀想法在罗马文化中已经被取代。
[^26]: 这些图片摘自天文学:探索时间和空间。
[^27]: 叙述者的脚本改编自宇宙(1984),第 4 集。
[^28]: 另一家认真对待思想工具的大公司则是 AutoDesk。他们的境遇有很相像的地方。
[^29]: 媒介的原文是 medium, 其通常复数为 media, 但作者在此使用了 mediums, 并与媒体义的 media 做了区分:「媒介的复数当然是指媒体。然而,在这种情况下,媒体通常意味着许多新的内容。这不是我们的意思;我们将为这个有点不寻常的含义保留不寻常的复数。」
[^30]: 在 Elad Gil 的《高增长手册》(2018)中。
[^31]: 当然,像 Sketch 和 Figma 这样的公司复制源自 Illustrator 的功能确实需要花钱,而且他们也对其有些改进。所以,我们将其定性为公共物品只是近似的说法。
[^32]: 不过复制仍然是游戏业界的老大难问题,特别是技术简单的游戏。比如合成数字的解谜游戏 Threes,其开发者花了一年多的时间制作游戏,其中大部分时间花在想出创新而漂亮的界面创意上。然而做成的游戏本身很简单,结果在短短几天内,复制版和山寨就鱼贯而出。其中一个山寨游戏是 2048,它还引发了一小波热潮,远远比 Threes 更成功。在另一个极端,一些游戏公司竭力延长其游戏的创收期,复刻游戏、推出长时间在线版等手段无所不用其极。这对于资本密集型的 3A 级游戏尤其常见,如《侠盗猎车手》系列。在这种情况下,商业模式较少依赖聪明的新想法,而更多地依赖改进美工(来再版)、网络效应(用于网络版)和品牌效应。
[^33]: 程序员工具是一个洞察力——通过制造循环运作得相当好的例子。避免公共物品问题是由一系列复杂的因素促成的,其中包括这样一个事实:在这种情况下,许多高技能的研究人员同时也是有成就的制造者,生产公共物品(研究人员)是他们的工作,或者是一种愉快的爱好。在较小的程度上,艺术和音乐界也是如此。
[^34]: Shan Carter 和 Michael Nielsen,使用人工智能来增强人类智能 (2017)。
[^35]: 当然,有足够动机的推理者会忽略任何他们不喜欢的结论。
[^36]: 当然,像 Jupyter 这样的系统可以追溯到几十年前。在 Knuth 的识字编程概念中,在 Mathematica notebook 中,在 PARC 的学习研究小组中,在 PLATO 系统(以及更广泛的计算机辅助教学)中,都有一些先例,仅举几例。在下面的讨论中,我们强调了在许多这些先前的系统中似乎被低估的机会。
[^37]: 当然,这是一个占位的术语。「可执行的文章」在许多方面会更自然,尽管不幸的是,在目前的语境中,这个词也许更自然地被解释为「网页」。
[^译 1]: 参考货物崇拜编程,不明就里地、仪式性地使用代码或程序架构
[^38]: Eric von Hippel 的《创新的民主化》(2005)一书中提出了一个相关的论点,该书指出了许多看似商业化的产品开发在很大程度上或相当程度上是基于用户的创新。
[^39]: Rachel Thomas 也提出了类似的论点,提供良好的深度学习教育 (2016)。
[^40]: 这方面的大师是电子游戏设计师。例如,Dan Cook, Building a Princess Saving App (2008),以及 Jonathan Blow 和 Marc ten Bosch, Designing to Reveal the Nature of the Universe (2011)。
参考
1. 量子物理学家是如何使用 Anki 的? https://zhuanlan.zhihu.com/p/651317222. 为什么书本不起作用? ./390507468.html
3. 高效学习的间隔重复 ./420105707.html
4. 如何用Anki学数学? https://zhuanlan.zhihu.com/p/359350968