教育工作者的十二条核心指南
原文:A Dozen Essential Guidelines for Educators (##) - Alfie Kohn
作者:Alfie Kohn
发表于 2013 年 10 月 29 日
要创造孩子们理应拥有的理想学校,我们可能不需要为每种情况都制定具体的政策和做法。相反,这些政策和做法应该自然而然地从我们共同制定的一些核心原则中衍生出来。以下是这些原则的示例清单,旨在引发教育工作者、家长和(别忘了)学生之间的深入讨论:
-
学习应该围绕问题、项目和(学生的)疑问组织——而不是围绕事实清单、技能列表或割裂的学科进行。
-
思考本身是混沌的过程;深度思考更是如此。因此,我们要警惕那些过于具体和条理化的规定性标准和预期结果。
-
我们在学校所做一切的首要评判标准应该是:这将如何影响孩子们对学习主题的兴趣(以及他们对学习的整体热情)?
-
如果学生「不专注于任务」,问题可能出在任务本身,而不是孩子身上。
-
在优秀的课堂上,老师听的比说的多,学生说的比听的多。杰出的老师舌头上经常有牙印。
-
孩子们通过亲自做决定来学习如何做出正确决定,而不是通过被动遵循指示。
-
当我们不确定如何解决课程、教学方法或课堂冲突相关的问题时,最佳回应通常是询问孩子们的意见。
-
我们越是专注于孩子们的「行为」,就越容易忽视孩子们本身——以及他们行为背后的需求、动机和原因。
-
如果学生因为做某事(例如阅读、解决问题、表现友善)而受到奖励或表扬,他们很可能会失去对这些行为本身的兴趣。
-
学生越是关注自己在学校的表现如何,他们就越不关心自己在学校里做什么。
-
所有的学习都可以评估,但最重要的学习往往很难用数字衡量——如果我们试图将其简化为数字,学习质量可能会下降。
-
标准化测试评估的是最不重要的能力。这些测试主要用于使一些不太有效的教学方法看似成功。
标准化考试的「标准」同样值得警惕
原文:Beware of the Standards, Not Just the Tests (**) - Alfie Kohn
Alfie Kohn 著
2001 年 9 月 26 日
不少知名教育家终于开始对标准化考试表示疑虑——特别是那些以选择题为主的常模参照(norm-referenced)考试;特别是那些高风险的考试(读作利诱和威胁);特别是有联邦政令要求,所有州必须对所有 3-8 年级学生每年开展的测试。尽管越来越多意见领袖意识到,对测试过分狂热着实危害不浅,很少人会对标准化运动表示反对。
学习优先联盟(Learning First Alliance)是一些前沿教育团体的联盟,他们不久之前对考试表达了担忧,但他们是看到民众对考试反对愈演愈烈,进而担心州级的教育标准会被废除,才发表了这一观点。教育周刊(Education Week)的 2001 版年度报告《质量是关键》同样表示担忧,称考试「盖过了标准」,而「没有充分反映」教育标准。有很多重要会议取名为「教育标准:从理论到实践」,和「标准能在教室活下来吗」(没有会议会叫「教室能在标准下活下去吗」或者「教育标准:从屈服到反抗」)。
关于教育标准,有一系列书籍打破了成见,包括 Susan Ohanian 所著的《一刀切不完》(One size fits few)和 Deborah Meier 的《标准能拯救公共教育吗?》。Nel Noddings, Elliots Eisner, James Beane 等一系列知名教育学者,在 Phi Delta Kappan 期刊上,默默表示了警告。除此之外,教育领域似乎达成共识,认为批判考试是允许的,而批判标准则不然。的确,人们会告诫考试反对者,不要混淆考试和标准,好像这两者毫无关联一样。我的观点是,考试和标准有千丝万缕的联系——理论上,考试是标准的履行机制。不仅如此,标准跟考试一样问题重重。
当然,我们应该澄清什么标准是有问题的。教育标准有一个广为接受的区别,与我们讨论相关,那就是结果和内容的区别。结果标准制定了学生表现应该有多好。这种标准在最通用的意义上(我们支持高标准)无可厚非,但也派不上多少用场。具体执行后,结果标准就变成了标准考试的分数线,这就很危险了。很大程度上,结果标准是混淆了难与好,我在之前的文章已经讨论过,在此不赘述了。
相比之下,内容标准是指定老师应该教授什么内容。与其宣称所有标准都十恶不赦,或者认同所有标准,我认为,我们应该根据以下四个方向,来评判特定的标准或框架:
**1. 有多具体?**政策制定者会有很多理由去设定详细的必修课程。他们可能打心底不信任教育者:不少人试图编写不依赖老师水平的培养方案,他们前赴后继,然而收效甚微,而目前的标准化运动只是这个执念的最新体现。此外,他们也可能单纯认为,标准越具体就是越好。实际上,虽然顾客跟服务员详细解释应该怎么做汉堡是有道理的,但宣布所有学生将要学习三角形的周长(以及其他非常具体的话题)并不是最好的,不如提供泛用的指导,帮助学生习得数学家的思考方式。
后者那种标准,如果有实际指导支持,能够帮助学生审慎推理,清晰表达,并乐在其中。然而如果给老师列出长长的必教事实技能清单,则会起到反作用。因此,约翰逊总统任期内的美国教育专员 Harold Howe II,在有人询问国家教育标准时(以及是否应该采取这种标准),将其一生的智慧总结成五个字:「越模糊越好」。
他的这种审慎也应该应用在州级标准上。一方面,思考是繁乱的过程,而深度思考则更加繁乱。另一方面,标准文书则是秩序的代名词。记住这种差别后,你就不会惊讶于真实教室里的这些文书会造成多大伤害了。
有大量研究表明,学生积极计划自己的学习过程,是非常重要的,比如学生提出问题,设立项目等等。但随着教育标准越全面越详细,越来越多的学生(甚至老师)无法主导学习过程,被排除在外,而教学也愈发沦为匆匆讲完大量材料的填鸭。所以,达到这些标准之后,教学反而变蠢了。Howard Gardner 睿智地察觉到,「理解最大的敌人是『教学进度』」。
有人坚持认为,这些事实和技能的清单,并没有规定教师应该如何教授学生;标准应该没有预设教学方法。但这种看法就是胡说八道。如果教学的目标是覆盖材料(而不是揭盖新想法),那么应采用的教学方法也就不言自明了。一些课程框架将教育看作事实的堆砌,由此一些教学技术也就会备受偏好,比如重复的灌输和练习。当然,这种教学方式的背后也有让学生备考的动机,但遵从特定标准的动机同样不可小觑。
有些人真诚相信,若要教得好,就应该遵守什么人制定的某个年级学生必知必会的知识清单,把这些知识教完。但问题不仅在于我和你怎么看这套模式;问题在于这套模式为何能几近垄断美国公立学校的教学。实际上,某一颇带商榷的特定教育哲学,被州级标准推崇,并成为州政府的法律。
2. 有多能被量化? 目前对问责的狂热,非常强调过于具体且非常容易量化的命令。不仅是考试被捆绑到标准上了;这些标准是根据他们的可测试性选出来的。「具体、可衡量的标准」这种短语不仅执迷于卓越,而且执迷于行为主义。说这种话最多的是公司职员和政治家,而不是前沿教育理论领袖,或者认知科学家,从中便可见一二。
我们在讨论这样一种观点,即学习或生活的方方面面,只要不能化作一个数字,其价值就是存疑的。相比之下,能以数字呈现的内容就是科学的,令人安心的;如果数字越来越大,那么我们肯定有所进步。内在动机和智力探索等概念,对于一些人来说难以捉摸,而成绩跟销售业绩与选票一样,能够被计算并制成图表,用来定义成功与失败。
可惜的是,有意义的学习并不沿着单一维度开展,我们也无法精确判断进步。莱斯大学的 Linda McNeil 观察到:「可衡量的结果可能是学习最不紧要的成果。」(这句话应该用 36 号 Helvetica 体打印出来,裱框后钉在这个国家每个学校管理员办公室的墙上)。将学校中的动态描述为某个指标在增长或下降的做法,不仅过度简化,更无法准确描述事情全貌;这种做法是破坏性的,因为它会破坏学校中的动态,使其越来越糟。
考虑 Sandra Stotsky 是马萨诸塞州的教育副专员,她曾评论道:「探索这个词不能放进标准里,因为探索无法被评估」。这个判断当然是错的,因为衡量学生探索质量的办法有很多——除非「评估」这一词被等同于标准化测试了。但让我们暂且假设 Stotsky 女士是对的。假如我们必须作出抉择,是看重课堂中的探索,还是看着衡量和指标呢?大部分深思熟虑的教育家会毫无疑虑地选择前者。显然,衡量文章中分号用了多少次,比衡量学生在论文中探索想法有多深入,是更简单的。因此,侧重于选择可以量化的标准,会让教学变得更平庸。
3. 有多整齐划一?「标准化这个词」听得太多后,我们对第一个词似乎产生了免疫。我们多大程度上相让学生接受标准化教育?在去年秋天的一个国家级会议上,一个顾问满意地宣称,多亏了基于标准的改革,「根据我的经历,这是历史上首次,同一年级的人,在同一学科上,或者在高中教课的老师,感觉到有责任对齐同一目标。」她甚至都觉得没有必要为这一目标辩解,可见现在对一刀切的教育有多接受了。
问题又一次不仅在考试出题上,而且在标准的一致性上。想要保证低收入社区的学生不接受二流教育,这是个值得赞扬的动机。想要保证一个州的学生接受相同的教育,把他们当作互相等同的知识接收者,这就是两码事了。更有问题的做法是分年级的标准。这里,标准制定者不仅认为:「我们希望学生八年级的时候能掌握这些东西。」,而在认为:「我们希望他们在五年级把这个列表上所有东西都学了,在六年级把那个列表上所有东西都学了」,诸如此类。死板地控制教学时机和内容,迫使所有学生以相同节奏学习知识,不仅对学习有负面影响,最终便会导向无谓的失败。
**4. 指南还是命令?**有些标准以指南的形式给出(「看看这样对教学的思考方式能否让你更好教学」),有些标准则以命令的形式给出(「不教这个的话等着瞧」)。几乎所有州都走了后面一条路。他们想要的不仅是控制老师,而且要剥夺校区制定自己课程计划的悠久权利。在美国教育历史上,没有什么学校改革,比现在这套以标准为名开展的运动,更加不民主了。
高风险考试是霸凌的完美体现,这种考试使用粗暴的奖惩手段让人们提升分数。一所教室墙上张贴的讽刺标语反映了其中的逻辑:「打到士气旺」。但如果将标准作为要求执行,标准本身也反映了政策制定者所要施加于教育者和学生的,而非与他们共同合作的。我在此提名一个广泛使用而令人毛骨悚然的奥威尔式用语:「对齐」——我们怎么让老师将他们的教学与州际标准「对齐」?相当多的人,包括一些对高风险考试的批判者,很随意地接受了这种说法,尽管这种说法诉诸于赤裸的权利。「对齐」不在于提升;它在于服从。
作为命令的标准同样反映一种对教育者的羞辱性看法——需要有权威人士告诉他们教书需要教什么(以及怎么教),否则他们就不懂怎么教。尽管的确有很多老师需要帮助,但没人不会抵制州政府去微操他们的课堂教学。有些人会尽其所能去忽视标准,而有人会愤懑地服从。无论如何,控制之下标准的实现是很糟糕的(说起来这也不是件坏事)。其他人,包括我们一些最优秀的教育者,则皱鼻蹙眉,拂袖而去,找个其他的出路去。
基于这四个标准,学科小组(比如数学和英语教师理事会)推广的标准,比州政府颁布的标准,效果要好得多。这当然不意味我们对前者标准的反对都失效了,也不意味着所有州际标准都很差,比如将明尼苏达州的学习档案,和弗吉尼亚州的学习标准比较一下,就可以知道了。(附加:两年后,我作为例子选择这两个州就非常讽刺了,因为新选上的明尼苏达共和党州长任命了新的教育专员,一位基督教保守派,之前就职于……弗吉尼亚州。)
然而,有一股巨大的压力,正催促人们实行这种我认为最糟糕的标准。Chester E. Fnn 和他的同事想让州政府明确「孩子在英语课上应该读那些书,在历史课上应该学什么人物,什么事件,诸如此类」。任何其他的标准都只是「假把式」。支持标准的群体,比如 Achieve 公司(一群公司人员和政治家),会给那些标准不够具体、可量化、统一、或者不必修的州政府打低分。
国家来复枪协会可以出具报告,给那些不够支持拥枪的立法者打低分,而这种报告和那些评价的差别在于,所有人知道这些分数反映的观点是某个实体的,而且是有争议的。相比之下,有人给州政府打低分,认为他们给本地学校董事会太多自治权,或者他们的标准不够符合行为主义学家的标准,他们却要求我们将这种分数认同为客观评估。(可以认为那些年度评估拿到 A 的州政府都应该打 F,或者反过来——或者州政府应该让这种小组给他们评估这些标准和测试策略,然后完全按小组推荐的反过来做)
重要脚注:有些人使用与州级标准不相关的现成考试——比如在加利福尼亚州开展这种考试。从心理测量学的角度来说,这种做法没有道理。而从教学角度来说,比起不符合标准的测试,符合标准的测试恰恰是更糟的。不符合标准的考试很蠢,因为它很不高效,而符合标准的考试是危险的,而这正是因为它是高效的……高效地履行一个可疑的目标。不仅政治家,而且有些测量学专家会忘记,做好一件事不等于做一件有价值的事。如果标准和考试高度契合,创建了一种自上而下,整齐划一,密不透风,「『事实』堆砌」式的学校教育——那么这时候我们就真遇到问题了。
这些测试无疑是最为严峻而又直接的对优质教学的威胁,因此让教育者和学生摆脱这一枷锁,应当成为我们最为优先的任务。但我们不应该将我们的批判局限于考试,毕竟考试背后还耸立着一种更广泛、更错误的教学和学校改革方针。
有些人不同意我的观点,或者比我更喜欢这些标准,我并不烦恼。实际上我很欢迎这些挑战。但是我很烦恼的是这样的讨论太少了,提问题的人很稀有,而很多人根本不质疑按标准教学,就开始讨论怎么按标准教学了。
混淆更难和更好
原文:Confusing Harder With Better (**) - Alfie Kohn
美国《教育周刊》(Education Week)
1999 年 9 月 15 日
作者:Alfie Kohn
永远不要低估朗朗上口的标语口号和非黑即白谬误的威力。当一位政客自称是「法治」或「强军」的坚定拥趸时,你可能会反驳说事情没那么简单。但当你开始解释理由时,你就已经被贴上了对犯罪软弱或不愿保卫「我们的生活方式」的标签。
在政治中,注重细节的人历来处于劣势,因为舆论导向早已失控。然而,在当今有关教育的公众讨论中,同样的问题也空前地凸显出来。如今的教育议题被过度简化为「问责」和「提高标准」。不仅政府官员,就连商界人士和许多记者,也在将可选择的方案简化为两种:要么你支持「更高的标准」,或者是满足于更低的标准。选一个吧。
如今,只要是以「提高标准」的名义,无论多么不合理,几乎可以对学生和学校做任何事。因此,好不夸张地说,我们的国家正面临着一个教育危机:课堂正在被剥离思辨的元素,学校沦为应试教育的集中营,许多学生——以及最优秀的教育工作者们——正被迫离开。
问题的症结之一在于,所谓提升标准的种种努力,实质上无非是想方设法提高标准化考试成绩。而这些考试大多采用标准答案(norm-referenced)、多项选择题(multiple-choice)等有缺陷的形式。学校越是专注于刷分,学生获得真正有意义的学习机会就越少。因此,高分往往是恰恰意味着教育标准的下降——这一悖论却鲜为教育政策的制定者和评论者所理解。
问题更加严重的是,许多学校仍在沿用把学生视为被动容器的传统教学模式,机械地向学生灌输知识和技能。所谓「回归基础」——其实是一个不恰当的用词,因为大多数美国学校从未放弃过它——倒不如说它根本就已经过时,而且从未真正奏效过。现代认知科学只是更系统地解释了为什么这种方法一直不尽人意。眼看学生埋头苦读课本,死记硬背知识点,被动接受知识,机械地训练单一技能,你就会意识到,根深蒂固的传统教学模式恰恰是阻碍教育卓越的最大障碍。无能狂怒地呼吁「问责」往往只会加剧这一问题。
在更严格的标准运动所涉及的教育方法论(pedagogy)和评估方式背后,隐藏着一个鲜为人知、却很少被深入分析的假设——许多人认为,当今学校教育的最大问题在于对学生要求过于宽松。据称,教材、考试和教学都「低龄化」了。像提高标准(或者门槛)之类的比喻,其潜台词就是越难越好。
对此作为回应,首先要指出,作业和考试可能犯两种错误:要么太简单,要么太难。如果说前者不足以充分发掘学生的潜力,那么后者会让他们觉得自己很笨,进而导致他们感到格格不入,对涉及的科目失去兴趣,有时还会出现不良行为(对许多学生而言,被视为积习难改,通常比被视为先天无能要更好受些)。任何人都可以向学生提出容易得可笑或难得过分的问题。Jerome Bruner 观察到,「诀窍是找到那些学生能够解答、且能带来新认识的中等难度的问题。」简而言之,最高难度不等于最佳难度。
但我们不妨再深入探讨一下。也许问题不在于更难是否总是更好,而在于为什么我们如此关注难度本身。
约翰·杜威(John Dewey)提醒我们,学生所做之事的价值「在于它能激发多少更深入的思考,而不在于它带来多少更大的压力。」如果你要列出教育中重要的因素——也就是说,用来判断学生是否能从他们正在做的事情中受益的标准——任务的难度级别只是众多因素中的一个,几乎可以肯定不是最重要的。仅以课业的难易程度来评判学校,就如同仅凭高难度音符的数量来评判一部歌剧。换句话说,它忽略了大部分重要的事情。
从这一认识出发,我们可以得出这样的结论:如果家庭作业或考试只是由事实回忆题组成,那么无论是 25 道难题还是 10 道简单题,其实并没有太大的区别。同理,教材也并非因为面向更高年级,就自动成为更合适的教学工具。一些家长愤怒地抱怨孩子觉得学习乏味,不费吹灰之力就能完成习题。但他们真正该抱怨的,是老师过度依赖习题这一事实本身。同样,有些老师鄙视那些灌输式教学的同事,坚持认为(往往带着自我夸耀的语气)在他们的课堂上,学生必须埋头苦干!但是后者未必比前者好,而且两者合在一起构成了一个非黑即白谬误。我们必须关注整个教学方法,以及学习的基本理论,而不是仅仅纠结于作业的难度,或学生需要付出多大努力这类问题。
「回归基础」的课程设置之所以与崇尚勤奋的教育理念完美契合,原因之一就在于它制造了不必要的勤奋。如果学习阅读的任务是解码一串音素,而不是理解有趣的故事,那么阅读的学习过程必然更加艰难;死记硬背大量科学术语,比亲自动手设计实验来掌握科学概念,显然要更加耗费心力。若学生被迫脱离语境去学习各种事实,脱离意义去学习各种技能,那么他们很容易笃信一种认为苦难本身就是价值的观念。诚然,学习需要持之以恒的专注和努力。但是,严谨的学习和繁重的学习之间存在着至关重要的区别。
其他的词语也同样模棱两可。我们是否真的希望学生在标榜「卓越」的学校里接受更多「挑战」,以满足「更高期望」?这完全取决于这些词的具体含义。如果它们指的是更加丰富、更加深入、更加吸引人的课程,鼓励学生积极思考,主动整合不同观点,勇于探讨有争议的问题,那我一定会全力支持。但如果这些词语不过是用来要求学生记住更多州首府的名字,或者逼迫学生提高考试成绩(研究表明这种做法往往会降低学习质量),那所谓「严格」、「挑战」等等,是否值得提倡就很难说了。
如果说一些家长和教师忽视了这些差异,那么在「更严格的标准」的推行者那里,这些差异就被系统性地忽略了。我所在的州最近就推出了一项考试,要求学生必须通过才能获得高中文凭。这项考试要求学生掌握大量的事实知识,于是政策制定者可以自豪地宣称,他们已经提高了教育标准。在有的州,相当一部分学生没能通过新的能力测试,那里的教育官员次年的对策就是把考试难度进一步提高。科罗拉多州的教育专员对这种决策背后的逻辑做了一番阐释:「除非考试结果很糟糕」,他宣称,「否则你很难说这场考试真的起到了什么作用。低分已成为优秀试题的代名词。」这就是「更严格标准」运动所基于的逻辑。
然而,到底有多少成年人能够通过这些考试呢?又有多少高中教师能在自己的教学领域之外掌握考试所需的海量知识?更不用说那些大学教授、企业高管或州议员了,他们当中能有几个人可以从容地写出一篇有关玛雅农业实践或地壳板块运动的文章?我们应当采纳 (Deborah) Meier 的命令:不应期望任何学生达到连社会上的成功人士也无法企及的学业要求。
(本着同样的精神,我提出了 Meier 命令的 Kohn 推论:所有信誓旦旦地呼吁「提高标准」、「在 21 世纪取得世界一流学业表现」的人,不仅应该自己参加这些考试,还必须同意在报纸上公布成绩。)
除了我们当中有多少人能达到这些标准之外,还有一个同样具有挑衅性的问题是:究竟有多少人真正需要掌握这些知识——不仅仅是基于工作要求,更要看这是否体现了我们心目中「受过良好教育」的真正内涵?这些事实和技能反映了我们推崇的价值观吗?反映了学校教育的真谛和人生的意义吗?强加给学生的标准往往不仅不合理,而且无关紧要。学生被迫学习的内容,以及学习的方式本身,都完全脱离现实。由此产生的考试——不管对学生还是老师——不仅难得可笑,而且完全是荒唐可笑。
亨利·戴维·梭罗(Henry David Thoreau)曾说过:「仅仅忙碌是不够的。问题是,我们在忙什么?」如果学生记住的都是转瞬即忘的事实,把所有时间都用来刷题以应付标准化考试,我们或许真的「抬高」了标准,但这只会令人更加痛心。这样一来,学校的确是变难了,但绝对没有变好。
停止滥用表扬
原文:Five Reasons to Stop Saying "Good Job!" (**) - Alfie Kohn
作者:Alfie Kohn
*注:这篇文章的删节版发表在 2000 年 5 月的《父母》(Parents)杂志上,标题为《沉迷于赞美》。想要更详细地了解这里讨论的问题,以及相关研究的完整引用列表,请参阅《奖励的惩罚》和《无条件的养育》。
请单击这里阅读这篇文章的西班牙语版本。
当你在操场闲逛,在学校参观,或者在孩子的生日聚会上时,肯定会反复听到这句话:「干得好!」即使是很小的婴儿也会因为拍手而受到表扬(「拍得好!」)。我们中的许多人对孩子脱口而出的夸奖几乎变成了一种口头禅。
许多书籍和文章都建议我们不要依赖打屁股和禁足(「禁止拥有娱乐时间」)去教育孩子,有时甚至会要求我们重新考虑用贴纸或食物去贿赂孩子。对这些所谓「正强化」的反对声音寥寥。
不要误解:本文在此的重点不是质疑「支持和鼓励孩子」的重要性,以及「爱他们、拥抱他们、帮助他们自我感觉良好」的必要性。但是,表扬则完全是另一回事。下面是原因。
**1. 操纵孩子。**假设你通过口头奖励来让两岁孩子吃东西而不洒出来的习惯得到强化,或者让五岁孩子清理她的艺术用品的习惯得到强化,谁从中受益?有没有可能:告诉孩子他们做得很好,与其说是为了他们的情感需求,不如说是为了我们的方便?
北爱荷华大学教育学教授 Rheta DeVries 将这称为「糖衣控制」。就像有形的奖励——或者,就此而言,惩罚——这是一种对孩子做某事的行为,这种方式让他们服从我们的愿望。这样做可能在产生这种结果方面是有效的(至少在一段时间内),但这样做与与孩子做某事的行为截然不同——例如,通过让孩子参与讨论「如何使课堂(或家庭)顺利运转」,或者「其他人如何受到我们所做的或未做的事情的影响」。后一种方法不仅更有礼貌,而且更有可能帮助孩子成为有思想的人。
表扬能在短期内起作用的原因是:小孩子渴望得到我们的认可。但我们有责任不为了自己的方便来滥用表扬。一句「干得好!」会让我们的生活更轻松,这就是利用孩子依赖性的一个例子。孩子们也可能会觉得自己被操纵了,即使他们不能很好地解释原因。
2. 造成孩子「对表扬上瘾」。当然,并不是所有表扬都是控制孩子的伎俩。有时候我们表扬孩子只是因为我们真的为他们所做的感到高兴。然而,即便如此,这样做也值得三思。表扬可能会促进孩子对我们的依赖,而不是建立自尊。我们越是说:「我喜欢你做 XX 的方式」或「做 XX 做得好」,孩子们就越依赖于我们的评价和决策,而不去学习以形成自己的判断。这导致他们根据「我们喜欢什么」去衡量自己的价值。
佛罗里达大学的研究员 Mary Budd Rowe 发现,受到老师大力表扬的学生在回答问题时会更犹豫,更倾向于用疑问的语气回答问题(「嗯,七个?」)。一旦成年人不同意他们的观点,他们往往就会放弃自己提出的想法。他们不太能坚持完成困难的任务,也不太能与其他学生分享自己的想法。
简而言之,「干得好!」这句话并不能让孩子安心;这最终会让他们有更少的安全感。这甚至可能造成一个恶性循环,我们表扬得越多,孩子似乎就越需要表扬,所以我们就表扬得更多。可悲的是,其中一些孩子长大成人后,仍然需要别人拍拍他们的头,告诉他们所做的是否正确。这当然不是我们希望我们的孩子所成为的那种人。
**3. 夺走孩子的快乐。**不谈及孩子对表扬上瘾的问题,孩子也应该为自己所达到的成就和学到的新知识感到高兴,并且想什么时候高兴就什么时候高兴。然而在每次我们说「干得好!」的时候,我们正在吩咐孩子该如何去感受。
有时候我们的评估指导是合适且必要的——尤其是对蹒跚学步的婴儿和学龄前儿童。但是,持续不断地对孩子的发展评价好坏是没有益处的。不幸的是,我们可能没有意识到「干得好!」和「干得不好!」一样是一种评价。积极的评价,其最显著的特征,不在于它是积极的,而在于它是一种评价。人们,包括孩子,都不喜欢被评价。
我珍惜我女儿尝试新事物或者精益求精的时刻。但我试着不去下意识地说:「干得好!」因为我不想夺走她的快乐。我想要她和我分享她的快乐,而不是我来决定她是否能够感到快乐。我希望她欢呼:「我做到了!」(她经常这样),而不是不确定地问我:「我做得好吗?」
**4. 丧失兴趣。**孩子可能会因为我们持续观看和表扬他「画得好!」而坚持画下去。但是,身为国家早期儿童教育权威之一的 Lilian Katz 却警告说:「一旦父母对孩子的注意力转移,许多孩子就不会再碰这些活动了。」事实上,一项令人印象深刻的科学研究表明,我们对人们做某事给予的奖励越多,他们就越容易为获得奖励而对想做的事情丧失兴趣。孩子们现在的重心没有放在画画,阅读,思考,创造上——而是得到奖励,无论是冰淇淋,贴纸,或是一句「干得好!」
多伦多大学的 Joan Grusec 的一项研究结论使人不安:那些经常因表现慷慨而受到表扬的孩子,在日常生活中往往比其他孩子稍微小气一些。每次他们听到「真大方!」或「我为你的乐于助人感到骄傲!」后,他们对分享或帮助他人就变得不那么感兴趣了。因为慷慨本身不再被视为有价值的东西,而是被视为得到成年人赞扬的手段。
表扬能激励孩子吗?当然能。表扬会激励孩子去得到表扬,而这往往牺牲了他们对自己所做事情的热衷。
** 5. 成绩下降**。相比影响孩子实际的成就,用一句「干得好!」破坏孩子的独立、快乐和兴趣还不算那么糟糕。研究人员发现,在一项需求创造力的任务中表现出色而受到表扬的孩子往往在下一项任务中表现不佳——甚至不如一开始没有受到表扬的孩子。
为什么会这样呢?原因一:表扬给「继续保持优秀」带来了压力,进而阻碍了把任务做好。原因二:他们对自己所做事情的兴趣可能已经下降。原因三:一旦他们开始考虑如何持续获得这些表扬,他们就不太可能冒险——而冒险是创造力的先决条件。
说的更广一点,表扬别人「干得好!」其实是一种心理学上的技巧,这种技巧将人类生活简化为可以观察和评价好坏的行为。不幸的是,这忽略了隐藏在行为背后的思想、情绪和价值观。例如,一个孩子和朋友分享零食可能是为了获得表扬,也可能是为了确保朋友能有足够的食物。而对孩子分享行为的表扬忽视了另一个动机。表扬实际上助长了不好的动机,使孩子未来更有可能为了寻求表扬而做事。
一旦你开始发现表扬是什么——以及它的作用——这些来自成年人持续的小小评价声就和指甲抓黑板发出的小小声音一样讨厌,你就会开始声援孩子们,对他们的老师和家长说(用同样甜言蜜语的语气):「表扬得好!」,来让他们尝尝自己给予孩子们的甜头。
表扬别人并不是一个容易改掉的习惯。一开始,停止表扬可能看起来很奇怪,这会让你觉得你自己冷漠和不应该,但转念一想我们就能明白这表明了我们表扬更可能是因为我们想要表扬别人,而不是因为孩子想要被表扬。如果这是真的,我们就该反思一下我们在做什么了。
孩子们真正需要的是无条件的支持和无条件的爱。这不仅与表扬不同,而且和表扬正好相反。得到一句「干得好!」是有条件的,而无条件的支持和爱意味着我们跳过了表扬的循环,不再要求孩子们做让我们高兴的事情,从而真正给予他们关注、承认和认可。
你会注意到,这与一些人提出的批评有很大不同,这些人批评我们太轻易的给了孩子太多的认可。他们建议我们在表扬方面更严格,并要求孩子「自己去挣得」。但真正的问题并不是现在的孩子们期望他们所做的一切都能得到表扬,而是我们倾向于走捷径,用奖励来操纵孩子,而不是让他们明白自己所需的技能和良好的价值观,并帮助他们培养这两方面。
那么,表扬的另一种选择是什么?这要视情况而定,但无论我们决定说什么,都必须基于对孩子真正的爱,而不是对他们所做事情的爱。当有了无条件的支持时,我们没有必要再去表扬;当没有无条件的支持时,表扬也无济于事。
把「表扬积极行为」作为一种「阻止不良行为」的方式不太可能是长期有效的。即使它起作用了,我们也不能说孩子现在本就是「表现良好」的;更准确地说是因为表扬使他表现良好。另一种选择是和孩子一起努力,找出表现不良的原因。重新考虑自己的要求,而不是仅仅寻找一种方法让孩子们服从。(不要通过说「干得好!」让一个四岁的孩子在漫长的班级会议或家庭晚餐期间安静地坐着,也许我们应该问问自己期望孩子这样做是否合理。)
我们还需要让孩子参与决策的过程。如果孩子正在做的一些事情打扰到了别人,就坐在她身边问她:「你认为我们能做些什么来解决这个问题?」,这可能比贿赂或威胁更有效。这样做还可以帮助孩子学习如何解决问题,并让她明白自己的想法和感受是重要的。当然,这个过程需要时间、才能、关怀和勇气。当孩子以我们认为合适的方式做事时,简简单单甩下一句「干得好!」不需要以上任何投入,这有助于解释为什么「表扬」策略比「合作」策略更受欢迎。
当孩子们做了一些令人印象深刻的事情时,我们能说什么呢?有三种可能的回应:
-
**什么也别说。**有些人坚持认为,好的行为必须被「强化」,因为他们想当然的认为,好的行为是偶然发生的。如果孩子从根本上说是邪恶的,那么就必须人为的给他们一个的理由让他们变好(也就是,获得口头奖励)。但如果这种性本恶论是没有根据的——很多研究都表明确实如此——那么表扬可能就没有必要了。
-
**把你看到的说出来。**一个简单的,没有评价的语句(「你今天是自己穿的鞋」或者只是「你做到了」)告诉孩子你注意到了,也会让她为自己所做的事情感到自豪。在其他情况下,更详细的描述可能更有意义。如果你的孩子画了一幅画,你可以提供反馈——而不是评判——描述关于你所看到的:「这座山很大!」「天哪,你今天用了好多紫色啊!」
如果孩子做了一些关心别人或慷慨的事情,你可以轻轻地让他注意到他的行为对别人的影响:「看看 Abigail !你给了她一些零食之后,她现在似乎很高兴。」这与表扬完全不同,这里的重点是你对她分享的感受。
- 少说,多问。 问题比描述更好。与其告诉他你对这幅画的某个地方印象深刻,不如问问他最喜欢这幅画的哪个地方。「这幅画最难画的部分是什么?」或者「你怎么画出大小合适的脚?」很可能会激发他对绘画的兴趣。说「干得好!」,正如我们之前所看到的,可能会产生相反的效果。
这并不意味着所有的赞扬,所有的感谢,所有高兴的表达都是有害的。我们需要考虑我们说话的动机(真诚地表达热情比想要操纵孩子未来的行为要好)以及这样做的实际效果。我们的反应到底是帮助了孩子感受到对自己生活的掌控感,还是让他们不断向我们寻求认可?我们的反应是在帮助她对正在做的事情更兴奋,还是把这件事变成只为表扬而去做的事情?
这不是为了让我们背诵表扬之外的新台词,而是让我们牢记教育孩子的长期目标,并让我们注意说话的影响。坏消息是:正强化的使用效果并不是那么积极。好消息是:你现在不必再为了鼓励而去评价孩子。
进步主义教育
原文:Progressive Education (#) - Alfie Kohn
为何难以超越,也难以界定
作者:Alfie Kohn
发表于 INDEPENDENT SCHOOL
2008 年春
考虑到进步主义教育向来以反对因循守旧、拒绝千篇一律而闻名,这种教育难以用一个固定的定义来描述也不足为奇。任何两位自诩认同这一教育传统的人,对其的看法很可能大相径庭,最起码在哪些特点最为关键的问题上存在分歧。
事实上,如果你与足够多的进步主义教育者交谈,就会开始注意到某些悖论:一些人关注每个学生的独特需求,另一些人则强调学习者社区的重要性;一些人将学习描述为一个过程,更像一段旅程而非终点,而一些人则认为学习任务应该带来可以分享的真实成果。[1]
进步主义教育是什么
尽管进步主义教育在实践中存在种种差异,但大多数人在一些基本理念上达成了共识,由此构成了一个并不太明确的核心理念。我们有理由把它称为一种「传统」。有趣的是,与进步主义教育相对的所谓「传统」教育,实际上并没有太多资格被冠以「传统」之名——因为它形成和发展的时间并不长。正如马萨诸塞大学罗威尔分校的吉姆·内林指出的,「进步主义学校传承了一种源远流长、值得骄傲的教育传统,包括动手实践、混龄教学、师徒制等,可以追溯到几个世纪之前」;而我们通常所说的传统学校教育,「在很大程度上不过是一些过时的教育政策演变而来的陈规陋习」。[2](不过,为避免混淆,本文还是采用约定俗成的提法。)
当然,现实并非泾渭分明。我从未见过一所完全不受进步主义教育理念影响的学校——即便是那种课堂讲授照本宣科、统一校服、一排排桌椅钉在地上的学校。同样,我也从未见过一所在各个方面都彻底实行进步主义教育的学校。但是,我们仍然可以根据学校在多大程度上践行了以下价值,来判断它是否属于进步主义学校:
关注孩子的全面发展:进步主义教育者致力于帮助孩子不仅成长为优秀的学习者,更成为品德高尚的好公民。在他们看来,教育不应局限于学业成绩,更应关注孩子在多个方面的全面发展,而不仅仅是语言和数学能力。
社区:学习不是独立个体各自为战的孤立过程。孩子们应该在一个充满关爱的集体中彼此学习、共同进步,在学业和品德方面互帮互助。集体归属感和合作意识至关重要,因此,我们必须避免采用可能破坏团结、引发内部竞争的教学方式。
合作:进步主义学校的一大特点是推崇「一起合作」而非「管教施令」的教学模式。与其用奖惩手段要求学生服从指令,不如更多鼓励他们通过沟通合作来解决问题。同时,我们应该透过表象,深入了解学生行为背后的真正动机、价值观和原因,而不只是关注表面现象。
社会正义:学生的社区意识和责任感不应局限于课堂之内。事实上,我们应该帮助和引导学生不断拓展关怀的视野,从自我出发,逐步涵盖朋友、族群,乃至超越国界。学校不仅要让学生了解多元文化,更要给他们提供将之付诸行动的机会,鼓励他们通过实际行动致力于促进多样性,改善他人的生活。
内在动机:进步主义教育者在考量教育政策和措施时,首先想到的往往是:「这对激发学生的学习兴趣,对维持他们持续阅读、思考和探究的热情,有何影响?」这个看似简单的标准,可以帮助判定学生应该进行什么样的学习任务。因此,如果教育者真心希望培养学生的长远发展,而非提升一时的学习技能,就很难认同传统的作业、考试、打分等做法。
深度理解:正如哲学家 Alfred North Whitehead 早已说过:「一个只是博学多闻的人,乃是上天最为无用的讨厌鬼。」诚然,知识和技能至关重要,但只有置于特定语境和目标中才有意义。这正是进步教育往往围绕问题、项目和疑问来组织教学的原因,而不是拘泥于割裂的知识点清单、技能训练和单一学科。此类教学通常采用跨学科形式,很少考察死记硬背的能力,也绝不会把「刁钻」等同于「卓越」。考核目的不仅仅是给学生设置障碍——何况难度大未必就意味着效果好——而是引导他们对重要问题进行深入思考,帮助他们从本质上由内而外地理解各种思想观点。
主动学习:在进步主义学校中,学生全程参与课程设计、问题构建、答案探寻(和创造)、思考各种可能性,并评估自身和教师的教学成效,可谓是不可或缺的关键角色。学生积极投入学习的每个环节,与专家们的普遍共识不谋而合:学习是一个主动建构知识的过程,而非被动地吸收信息或训练技能。
认真对待孩子:正如 John Dewey 曾指出的那样,在传统教育模式中,「重心在儿童之外」:儿童被期望去适应学校既定的规章制度和课程安排。相比之下,进步主义教育者则更关注儿童的想法,尤其重视他们之间的差异。(每个学生都是独一无二的个体,采用「一刀切」的政策、期望和作业不仅会适得其反,而且也是一种不尊重。)课程设置不仅要考虑兴趣,而是要基于每一个孩子的兴趣。当然,教师心中会有总体的主题框架和教学目标,但他们不会简单地为了学生设计课程,而是邀请学生一起参与设计,欢迎教学过程中出现意料之外的新方向。因此,同一所学校里,两位四年级教师的课程内容可能会有很大不同;同一位教师,今年的教学内容也会与去年有所差异。单纯依靠成人预设的复杂主题单元是不够的。进步主义教育者明白,在制定课程的同时,也要让学生参与确定学习成果和评估标准。
我在此列举的一些特点,或许会让秉持传统教育理念的教师感到不以为然,甚至不安。但其中一些做法,却可能让他们觉得似曾相识,或者甚至与他们自己曾经表达过的观点不谋而合。然而,进步主义教育工作者并非仅仅停留在口头上「赞同」「热爱学习」或「培养社区意识」等理念,而是愿意将这些价值观落实到行动中,哪怕这需要彻底改变某些传统。比如,如果学生明显把家庭作业视为必须尽快完成的任务,进步教育者可能会彻底取消作业;他们会反对那些有悖社区团结意识的做法,如设置尖子班和举行颁奖典礼。总之,进步主义学校以扎实的研究和经验为依据,坚持自己的核心价值理念,并身体力行。
进步主义教育不是什么
对进步主义教育的误解,通常表现为两种情况:要么对其定义过于狭隘,低估了这种教育变革的重要意义;要么故意夸大其辞、丑化其形象,借此否定整个教育理念。我们不妨逐一进行分析。
无疑,来自悉心教导、尊重学生的老师的因材施教至关重要。但仅凭这一点,还不足以使一所学校称得上进步。这种想当然的设想不仅会淡化进步主义的本质内涵,对传统教育者也不够公允——他们中的大多数人并非无情的填鸭式教书匠,也不是手持戒尺、一味严苛的教条主义者。事实上,将教育视为向孩子灌输知识碎片的过程——运用练习题、课堂讲授、小测验、家庭作业、评分等方式来实现这一目标——与真正关心每位学生成长,这两者完全可以兼容并蓄。拥有负责友善、了解每名学生的师资,学校可以为此而自豪,但却不能仅凭此就宣称是进步主义学校。
此外,传统学校的重心也并非总在记忆日期和背诵定义;有时,他们同样致力于帮助学生领会思想的精髓。正如一位科学教师所指出的,「对善于思考的传统主义者而言,所谓思考,就是理解、整合、运用知识的体现」。然而,学生在此类课堂中的任务却是去「领会教师已经如何整合运用了这些观点……并[重构]教师的思路」[3]。换言之,尽管一些传统课堂中也在讨论有意思的概念,但进步式教育的显著特点在于,学生必须自主建构自己对观点的理解。
还有一个错误源于对「进步主义」一词的狭隘定义,我花了一些时间才意识到:在文化上进步的学校,其教育理念和方法未必进步。一个机构可能浸透着左翼政治和多元价值观,致力于多样性、和平、拯救地球等崇高目标,但在教学模式上仍然出人意料地传统。我们甚至可以设想,老套的填鸭式教学也能被用来灌输宽容,乃至激进的政治理念。[4]
更有甚者,一些人倾向于将进步主义教育描绘成一种感性的、散漫的、不着边际的、毫无约束的教学实践,仿佛它不过是嬉皮士理想主义或卢梭浪漫主义的残余。在这种对进步教育的漫画式刻画中,孩子们可以肆意妄为,想学什么就学什么,觉得有趣的就学,觉得无趣的就不学;而学习则似乎可以在教师慈爱的目光和微笑中自动发生。受限于篇幅,我无法在此一一列举这类错误表述,也无法充分解释它们为何如此荒谬绝伦。但请相信我:确实有人基于一种与进步教育风马牛不相及的想象,对这一教育理念嗤之以鼻。
为什么进步主义教育有道理
对绝大多数人而言,选择或提供进步主义教育的根本原因,在于他们所坚守的核心价值观:正如 Joseph Featherstone 所言,那是一种「对民主的坚定信念」;一种认为满足孩子的需求应该优先于培养未来雇员的理念;一种渴望培养好奇心、创造力、同情心、质疑精神等美德的意愿。
值得庆幸的是,进步主义教育最初可能源于价值追求(对个人如此,从历史发展的角度看,对教育本身亦然),但现已得到了可靠数据的有力支持。大量令人印象深刻的研究表明,当学生有更多时间去思考观点,而非死记硬背事实、机械练习技能时,当学生有机会参与指导自己的学习时,他们不仅更有可能乐在其中,而且收获更丰、学得更好。由此可见,进步主义教育不仅更有吸引力,还更有成效。
20 世纪 90 年代末,我系统回顾了几十年来的教育研究:涉及从学前到高中各教育阶段,覆盖阅读、写作、数学、科学等学科教学,广泛涵盖「开放式课堂」、「学生中心」教育以及建构主义学习理论指导下的教学研究,还考察了民主课堂、混龄教学、教师轮岗、合作学习,以及包括废除分数在内的真实评估等教育创新。各领域的研究结果一致有力地支持进步主义教育。换言之,无论个人价值观如何,单从教学实效的角度,进步主义教育就值得推崇。如果教育目标更加远大——能够长久保留所学知识,真正理解知识并迁移应用于新问题,乃至激发持续学习的热情——进步主义教育的相对优势就更加显著了。[5]反观传统教育中的标准化考试、家庭作业、奖惩制度、竞争机制等做法,都缺乏数据支持其价值,这进一步凸显了进步主义教育的优越性。[6]
自从我发表上述研究综述以来,越来越多的实证研究支持了我的观点。几项更新的研究再次证实,传统的学前学术教学对儿童的发展是适得其反的。[7] 小学和中学阶段,如果学生主要通过「高度自主的探究项目」来学习,他们在科学表现上的进步会更为显著。相比之下,填写习题、死读教科书等老一套的学习方式似乎作用甚微。[8] 另一项研究发现,「探究式」学习相比传统模式,对底层家庭和少数族裔学生的帮助更大。[9] 支持这一论点的研究俯拾皆是。实际上,我无意中还发现一些被遗漏的早期研究,比如一个长达五年之久、横跨 11000 名 8 到 16 岁儿童的大型跟踪调查。研究表明,读进步主义学校的学生作弊倾向远低于普通学校学生,哪怕扣除了年龄、智商和家庭背景等变量的影响,这个结论仍然鲜明。[10]
为什么进步主义教育如此稀有
尽管所有学校都可以被划分在一个从完全进步到完全传统的连续区间上,或者更确切地说,处于反映这些教学模式不同特征的多个维度之中。但我们通常可以通过实地考察一所学校,对该校是否以进步主义教学为主导,得出较为明确的判断。据此我们也可以得出结论:在美国,名副其实的进步主义学校数量少之又少,在单个班级层面更是凤毛麟角。进步主义教学在高年级尤其稀缺,即便在低年级也并不常见。[11](诚然,多数进步主义学校是独立办学,但大部分独立学校并非进步主义学校。)
进步主义教学如此稀罕,虽然令我们中一些人感到沮丧,但对整个教育讨论而言意义重大。如果进步主义教学在实际中相当少见,那么将美国教育存在的种种问题(不管是真实的还是臆测的)归咎于此,就缺乏说服力。事实上,这一现状恰好反证了另一种观点:如果学生学习效果不尽如人意,很可能恰恰是因为传统教育理念和做法在美国学校根深蒂固、难以撼动。
然而,我们仍然面临一个问题:如果进步主义教育如此卓越,为何时至今日,它仍是一种例外,而非常规做法?对于这个问题,我经常请听讲座的人深入思考,他们给出的答案可谓见仁见智,但都很有见地。首先,他们认为,进步主义教育不仅为大众所陌生,实践起来也更加困难,要做好更是难上加难。它对学生提出了更高的要求,一开始可能会让那些已经掌握了在传统课堂中游刃有余的学生感到不适应——这些学生往往按照传统标准取得了不错的成绩,却很少有真正动脑思考的时候。其次,进步主义教学对教师的要求也更高。如果教师希望学生能够「领悟生物学或文学的精髓」,而非「机械地记忆青蛙的解剖结构或句子的语法结构」,就必须对所教学科有透彻的理解。[12] 但进步主义教师还需要精通教学法,因为单靠学科知识(如科学或英语专业),并不足以引导学生进行有效学习。有人认为,任何掌握了足够数学知识的人都能教好数学,这种观点是建立在「学习是被动吸收的过程」这一认知之上的,而认知科学已经明确驳斥了这一观点。
进步主义教师需要学会接纳不确定性。他们不仅要摒弃一味追寻「标准答案」的做法,还要让学生积极投入到追寻知识意义的过程中。这意味着教师要敢于放弃部分控制权,赋予学生一定的自主权,这不仅需要勇气,还需要智慧。然而,具备这些特质的教师似乎并不多见。近十年前,我在接受本刊采访时曾带着些许懊悔地回顾自己的高中教学经历:「我曾为自己是一位幽默风趣、博学睿智、极富魅力的教师而自豪。但我花了很多年才意识到,[我的]课堂以教师为中心,而非以学生为中心;重点在『教』,而非在『学』。」[13] 进步主义教育理念带给我们的启示越多,我们就越发需要重新审视什么是好老师。这个过程难免会引起一些人的不快,包括我们自己。
谈到「触怒他人」这个话题,我们常想到,进步主义教育之所以举步维艰,正是因为它所处的大环境。进步主义教育在某些方面天生具有颠覆性,而掌权者往往不喜欢被颠覆。正如 Vito Perrone 所言:「进步主义的价值观——包括怀疑、质疑、挑战、开放和寻求其他可能性——长期以来一直难以被美国社会所接纳。它们未能主导学校教育,这并不意外。」[14]
我们面临着提高标准化考试成绩的压力,而进步主义教育只是偶尔、无意中才能达成这一目标——这不仅是因为提高考试成绩并非其宗旨,更因为此类考试衡量的往往是最无关紧要的内容。(正是认识到这一点,进步主义学校从未考虑将标准化考试作为招生依据。)然而,更隐蔽的是,我们还面临着将教育实践整体标准化的压力。思考本就是一个杂乱的过程,深度思考更是如此。这一现实与对秩序的需求难以调和——在学校里,课程需要在各年级间精心衔接并提前周密规划,在整个社会中,人们都期待井然有序。
此外(正如我的读者们总是指出的那样),有些父母从未被邀请去重新审视自己对教育的固有观念。他们可能会被错误的事物所吸引,被传统教育的种种标志所安抚——等级分数、单词默写、厚重的课本、掌控课堂的权威老师,而缺少这些反而会感到不适。即使孩子显然不开心,父母或许也认为这就是生活的常态。他们的立场似乎不是希望让下一代获得比我们更好的教育,而是:「听着,这些苦我都吃过了,我的孩子也必须吃这些苦。」他们大概信奉「李斯特林漱口水式」的教育理念。这个理念源自一则著名的广告,它试图用这样的逻辑来销售漱口水:味道越恶心,说明效果越好。当然,与之相对的观点便是,任何有吸引力的东西都可能是无效的。如果孩子有幸在一间以学生自主设计、基于项目探究为特色的教室里学习,家长可能会质疑:「她真的学到东西了吗?练习题在哪里?」于是老师迫于压力,只好把教学弄得更糟糕。
所有进步主义学校都在不断经受着各种阻力的考验。或许有人要求恢复某种形式的分数评定;或许是为「天资聪颖」家庭的孩子提供特殊培训;又或是发起一个竞技性的体育项目(仿佛美国孩子在课外还嫌输赢不够多);再或是惩治那个欺负我家孩子的「坏学生」;抑或推行一两项标准化测试(「只是想看看孩子们的学习状况」)。但最主要的,是让孩子们为将来做好准备——即便这种准备实际上是在以糟糕的方式教导他们,让他们去适应日后将要面对的劣质教学。
这些并未完全道尽进步主义教育不普及的原因。不过,前文关于进步主义教育优点的论述也不够全面,由此可见,努力让进步主义教育更加普及一些,是很值得去追求的事业。或许我们还无法在短时间内、譬如在本学年结束前,就各个层面彻底改革整所学校,甚至一个班级。但只要我们能取得一些进步,就很可能惠及学生。而给学生最好的教育,正是我们当初选择从教的初衷。
旁注:
12 个问题:探问进步主义学校
进步主义教育者可能会在某天早上醒来,突然意识到一个令人不安的事实:由于受到传统教育理念的潜移默化,自己的学校正在不知不觉中向传统教育妥协,渐渐偏离了创办者的初衷。这正是我所说的,进步主义教育者不可避免会经历的潜在危机。以下几个尖锐的问题,旨在唤起集体反思,或许还能推动改革行动。
-
我们的学校是否真正致力于进步主义教育?还是说仅仅满足于营造一种表面上政治正确、文化多元的「进步」氛围?
-
我们是否坚定不移地追求进步主义教育的愿景?还是说因为担心失去潜在生源而在办学理念上妥协,试图面面俱到迎合所有人?(比如宣传:「我们既提供关爱的环境,又保证严苛的大学预科教育。」)
-
高年级学生接受的教育是否与低年级学生一样进步?还是说会让参观者觉得高年级学生仿佛在就读另一所学校?
-
我们的教学是否围绕问题、项目和怀疑展开?大部分课程是否真正做到了跨学科融合?还是说仍然将文学与社会研究割裂开来——甚至将语文课上的阅读和拼写分开教授?我们是否过分强调技能训练(如算术、词汇),而忽视了这些技能应该服务于理解和表达思想这一根本目的?
-
学生在多大程度上参与课程设计?我们是否真正做到了以学习者为中心?还是说将课程内容作为既定事实呈现给学生?学生是否有机会参与其他方面的决策,如教室布置、课堂管理、评估方式等?教师是否仍在以某些微妙的方式控制着学生,使得课堂环境不如理想中那样民主?
-
我们的评估方式是否与进步主义的愿景一致?还是说仍在使用复杂的评估标准和变相的等级制度(如「超出预期」、「正在达到预期」等)来评价学生?学生是否像在许多传统学校那样,过分关注自己的表现评级,以至于无法全身心投入到学习活动本身?
-
学校管理者是否真正尊重教师的专业性和自主权?还是说存在一种自上而下的管控模式,与我们期望教师对待学生的方式背道而驰?反过来说,是否有可能因为过分尊重教师的「不被干涉」而导致某些领域的教学实践偏离了进步教育的本质?
-
我们的教育者是否像终身学习者一样,始终保持质疑和探索的精神?还是说有时会固守传统,仅仅以「这就是我们学校一贯的做法」为由来为某些做法辩护?学校是否鼓励教师互相听课,并定期为他们创造探讨教学方法的机会?
-
学校是否在始终强调合作精神,还是说仍然残留某些对抗性的做法?学生在做决定时,是倾向于达成共识,还是简单地采用投票方式?在体育课甚至普通课堂上,是否还在大量使用竞争性的比赛?大多数学习活动是以结伴或小组形式进行,还是默认让学生独自完成任务?
-
学校是否只在确实需要延伸和深化课堂教学时才布置家庭作业?还是说像传统学校一样例行布置作业?如果有作业,其设计初衷是基于行为主义的「强化学习」理念,还是真正旨在深化学生对知识的理解和参与度?在作业相关决策中,学生能发挥多大的作用?
-
在制定课程、教学和日程安排时,我们是否始终考虑「这将如何影响孩子对学习和当前话题的兴趣?」这一关键问题?还是说,过分强调「正确答案」和「严格要求」,反而削弱了一些学生对学习的好奇心和热情?
-
学校在非学术领域(如社交、行为等方面)是否也同样秉持进步和协作的理念?还是说仍然存在基于「后果」的管控方式,过分强调秩序和服从,而忽视了培养学生的道德推理能力、社交技能和民主素养?
附注
-
Reggio Emilia 的早期儿童教育法和 Foxfire 的教育传统都体现了后一种观点。
-
James H. Nehring, “Progressive vs. Traditional: Reframing an Old Debate,” Education Week, February 1, 2006, p. 32.
-
Mark Windschitl, “Why We Can’t Talk to One Another About Science Education Reform,” Phi Delta Kappan, January 2006, p. 352.
-
在我撰写本文期间,一位我认识的中学生恰巧向我提到她正在上的一门课。这门课一方面对美帝国主义进行了严厉批评,另一方面又采用了基于事实的测验,并在成绩单上表扬学生「行为端正」和「专注任务」。
-
参见 Alfie Kohn, The Schools Our Children Deserve: Moving Beyond Traditional Classrooms and “Tougher Standards” (Boston: Houghton Mifflin, 1999), esp. Appendix A.
-
我已在不同的著作中分别探讨了这些问题。具体可参考以下几本书中引用的资料:《反对标准化考试的理由》 (Portsmouth, NH: Heinemann, 2000),《家庭作业的迷思》 (Cambridge, MA: Da Capo Press, 2006),《超越纪律》 rev. ed. (Alexandria, VA: ASCD, 2006),以及《无需竞争:反对竞争的论据》 (Boston: Houghton Mifflin, 1986/1992)。此外,还有其他研究质疑了从校服到明确语法教学等具体做法的益处。
-
参见《幼儿教育:反对直接教学学术技能的依据》一文,特别是其附录部分。
-
Harold Wenglinsky, “Facts or Critical Thinking Skills?”, Educational Leadership, September 2004, p. 33.
-
Olaf Jorgenson and Rick Vanosdall, “The Death of Science?” Phi Delta Kappan, April 2002, p. 604. 总结了 Michael Klentschy, Leslie Garrison 和 Olga Ameral 对四年学生成绩数据的综述
-
Character Education Inquiry, Studies in the Nature of Character. Volume 1: Studies in Deceit (New York: Macmillan, 1928), Book 2, p. 184.
-
教育历史学家 Larry Cuban 的研究揭示了一个长期存在的现象:自 20 世纪初以来,以教师为中心的教学方式一直主导着美国课堂。他审阅了近 7,000 份课堂记录和众多研究结果,发现这种教学模式始终盛行(How Teachers Taught: Constancy and Change in American Classrooms, 1890-1980 [New York: Longman, 1984])。著名教育研究者 John Goodlad 在其经典著作 A Place Called School 之后,于 1999 年再次探讨了这个问题。他得出结论:「尽管进步教育理念备受瞩目,甚至引发了诸多批评,但它们仅在少数地方得到实践……大多数教师仍然固守他们学生时代经历过的传统教学方式」(“Flow, Eros, and Ethos in Educational Renewal,” Phi Delta Kappan, April 1999, p. 573)。近期研究进一步佐证了这一观点。2007 年对全美 1,000 多所学校的一、三、五年级教室的大规模调查显示:「学生 91.2% 的时间都在进行全班授课或独立作业」,「五年级学生接受的基础技能训练是问题解决和推理训练的 5 倍;在一、三年级,这个比例更是高达 10:1」(Robert C. Pianta et al., “Opportunities to Learn in America’s Elementary Classrooms,” Science, vol. 315, March 30, 2007, p. 1795)。同期,华盛顿州 669 个教室的研究发现,「只有约 17% 的课堂采用了较为深入的建构主义教学法」(Martin L. Abbott and Jeffrey T. Fouts, “Constructivist Teaching and Student Achievement,” Washington School Research Center, Technical Report #5, February 2003, p. 1)。欲了解更多相关证据,请参阅 Kohn, Schools, pp. 5-9.
-
David K. Cohen and Carol A. Barnes, “Conclusion: A New Pedagogy for Policy?” in Teaching for Understanding, ed. by David K. Cohen et al. (San Francisco: Jossey-Bass, 1993), p. 245. 多位著名教育思想家,如 John Dewey、Lawrence Cremin 和 Linda Darling-Hammond,都注意到这一观点与进步教育运动长期以来难以真正确立自身地位的现象密切相关。
-
Kitty Thuermer, “In Defense of the Progressive School: An Interview with Alfie Kohn,” Independent School, Fall 1999, p. 96. In their book Methods That Matter (York, ME: Stenhouse, 1998), Harvey Daniels 和 Marilyn Bizar 更是一针见血地指出:「如果教师内心深处不渴望成为焦点,他们可能一开始就不会选择教师这个职业。『真正传授知识』的欲望可能比行政懦弱和教科书公司的收买联合起来,更严重地阻碍了以学生为中心的教育创新」(第 12 页)。
-
Vito Perrone, “Why Do We Need a Pedagogy of Understanding?” in Teaching for Understanding, ed. by Martha Stone Wiske (San Francisco: Jossey-Bass, 1998), p. 23.
关于家庭作业存在的反思
原文:Rethinking Homework - Alfie Kohn
作者:Alfie Kohn
[如需更详细地了解此处讨论的问题——包括相关研究的全面引文清单,和对成功变革努力的讨论——请参阅作业谬论。]
学生在学校度过了大半天,回到家后还要做额外的家庭作业。静下心来想一想,这很奇怪。但更奇怪的是,很少有人静下心来思考为什么。
考虑到另外三个事实,家庭作业变得更奇怪了:
1. 家庭作业的负面影响众所周知。 比如让学生沮丧、疲惫、没有时间参加其他活动,以及可能丧失学习兴趣。许多家长会感叹家庭作业影响了他们与孩子的关系;他们也可能不喜欢逼孩子完成作业,但也担心他们可能会被别人指指点点,或是因为他们对作业不够上心,或者太过上心。
2. 作业的积极作用大多是虚幻的。 为了准备一本关于这个主题的书,我花了很多时间检查相关研究。研究结果令人震惊。首先,完全没有证据表明在小学或初中布置家庭作业对学业有任何益处。事实上,对于低年级学生来说,是否布置家庭作业(或布置多少家庭作业)与学习成绩之间甚至没有任何相关性 。在高中阶段,相关性很弱,而且在采用更复杂的统计方法后,相关性往往会消失。同时,也没有任何研究证实家庭作业能培养孩子的性格,或教给孩子良好的学习习惯。
3. 尽管作业毫无价值,但学生的作业还是越来越多 在过去的 25 年中,负担最重的是最年幼的儿童。对他们来说,证明作业积极影响的证据非常有限,甚至可以说根本不存在。
大多数老师时不时会决定,放学后应该继续某个课题,因为这样的作业很可能会带来有意义的学习,值得占用家庭时间——实际并非如此。在大多数学校,家庭作业并不只在适当和重要的时候才布置。恰恰相反,他们的出发点似乎是:「我们已经定好,孩子们每晚(或每周几次)都得做点什么。具体布置什么任务,以后再说。」
我从全国各地无数的人那里听到了家庭作业带来的沮丧感。看着孩子们书包里的作业如洪水般汹涌而出,家长们能让教师理解,这些作业的弊远大于利。而那些长期以来对家庭作业的价值心存疑虑的老师,则被家长施压。因为家长错误地认为课后作业少意味着老师对学生成绩不够重视。这些家长似乎认为,只要他们的孩子每天晚上有很多事情要做,不管是什么,那就一定有学习。
家长和老师需要的是能挑战传统智慧的行政人员的支持。他们需要的是能提出质疑的校长,质疑那些被当做论据的口号:家庭作业能连接学校和家庭(说的好像没有其它更有建设性的方式来建立这种联系似的!),或者是家庭作业能「强化」学生在课堂上所学的知识(这个词表示重复死记硬背的行为,而不是理解能力的发展),又或者是家庭作业培养了学生的自律能力和责任感(这种说法完全没有证据)。
最重要的是,校长需要帮助老师们认识到,在评估有关家庭作业(或其他政策)的决策时,最重要的标准是这些决策对学生的学习态度可能产生的影响。教育学教授 Harvey Daniels 表示:「家庭作业大多数时候只会让孩子们远离学习。」让我们面对现实吧:大多数孩子都对家庭作业感到厌烦,或者最多把它当作一项必须应付的任务。因此,即使家庭作业确实能带来其他好处,也需要权衡这些好处与其对孩子的学习热情所产生的负面影响。
那么,一位深谋远虑的校长应该怎么做呢?
1. 自学,并与老师、家长和教育局的行政人员分享你所学到的知识。确保你真正理解研究的结论——缩减或取消家庭作业,并不会在学业或生活技能方面让孩子吃亏。决策应当建立在实事求是而非迷信俗语之上。
**2. 重新思考标准的「作业政策」。**老师被要求每天布置一定数量的家庭作业,或每周都布置作业(例如,每周二、周四布置 x 分钟的数学作业),这实际上是承认家庭作业并不是基于某个具体课程的需要,更不是根据每个学生的具体需求和时间安排。这样的政策为了追求可预测性而牺牲了深思熟虑的教学,不仅对学生有害,而且当这些政策由上级强制实施时,也伤害了老师。
**3. 减少数量——但不要止步于此。**很多家长对孩子们花在家庭作业上的时间感到不满,这是可以理解的。至少,确保老师安排的作业量不超过学区的参考标准,并且不要一直低估学生完成作业所需的时间。(正如一位母亲和我说:「如果只有最快的孩子能在 20 分钟内完成,那么宣称这是 20 分钟的作业量就是欺诈。」)然后,努力减少作业的数量,不论是否符合这些参考标准和期望,让家庭而不是学校决定学生晚上的时间安排。
然而,问题并不仅仅在于作业的数量。坦白说,有些作业,哪怕只花五分钟,对学生来说也是浪费时间。太多的一年级学生被迫从杂志里剪下以特定字母开头的单词。太多的五年级学生必须在图纸上给一长串的因数对涂色。太多的八年级学生每晚都要翻阅那些枯燥、内容过剩、由委员会编写的教科书,一章接一章地读。应该鼓励老师们思考,任何一项家庭作业是否真的能帮助学生深入思考重要问题。每份作业的背后,究竟有着怎样的教学哲学,怎样的学习理念?它是假设孩子们是意义的创造者——还是空容器?它是把学习视为一个主动还是被动的过程?是让学生与思想搏斗,还是盲目遵循指示?
**4. 改变默认状态。**仅仅减少作业数量或提高作业质量是不够的。我们应该改变学校对学生根深蒂固的期望。只有当某项作业真正对大多数学生有益时时,才要求他们把学校作业带回家。否则,他们应有自由决定如何支配课后时间。底线是:除非真正必要,否则不布置作业。当然,这颠覆了当前的默认状态——无论家庭作业的内容如何,都认为它是必要的——这种观点根本站不住脚。
5. 听取学生的意见。了解学生对家庭作业的看法,并征求他们的建议——比如可以发放匿名问卷。很多成年人不加探询,就假定家庭作业对学习有益,却从未真正了解学生自己的体验!学生真的认为家庭作业有用吗?有用或没用的理由是什么?哪种类型的作业更好?家庭作业如何影响他们的学习欲望?作业对他们的生活和家庭还有哪些影响?
**6. 建议老师只布置自己设计的作业。**在大多数情况下,学生只应该做老师设计的作业,而不是事先制作好的、一成不变的习题,或从教科书上复印的通用习题。此外,给全班学生布置相同的作业几乎没有意义,因为它不太可能对大多数人都有益。做这种作业,对于已经理解概念的学生来说,是在浪费时间,而对于还不理解的学生来说,则会慢慢失去信心。没有哪份完美的作业能激发每一个学生的学习兴趣,因为没有什么标准能够适应所有人。在真正需要布置作业时候,教师应根据学生的不同兴趣和能力设计多份作业。但是,与其给每个人布置相同的作业,不如不给任何人布置作业。
**7. 让作业成为学生参与决策的机会。**评估课堂质量的一个方法,是看学生在与自己学习有关的决策中的参与度。最优秀的教师都知道,学生是通过做决策来学会如何做出正确的决策,而不是仅仅遵循指示。学生对他们要学什么、在什么情况下学,以及如何(何时)评价他们的学习、教室如何布置、如何解决冲突等等,都应该有发言权。
教育的普遍规律,在家庭作业上同样适用。至少有两位研究人员发现,(根据不同的标准定义的)最出色的教师更倾向于让学生参与决定作业的内容,而不是直接告诉他们在家里要做什么。家长看到孩子的家庭作业后,第一个合理的问题应该是:「孩子们在决定如何完成、何时完成,以及是否真的需要在家完成这项作业上,有多少发言权?」
就家庭作业是否有益(以及为何有益)的讨论本身就很有意义。如果观点多样,如何处理大家意见不一的情况——是投票表决?还是继续讨论直到达成共识?或是寻求一个折中方案?——这个过程既能培养社交技能,也能促进智力成长。正是因为教师选择了提问而不是吩咐,成长才得以发生。如果你认为孩子们总是对家庭作业说不——或对任何需要努力的事情说不,那些经常与学生商量的老师们会对这种观点摇头否定。他们会告诉你,这是不对的。当学生感到被尊重,当他们觉得作业值得做时,他们多数都会热爱挑战。
反之,如果学生对家庭作业嗤之以鼻,或想方设法逃避作业,一般是因为他们的作业太多了,或因为作业布置得漫不经心、连篇累牍,或者仅仅是因为他们对作业没有发言权。即使是高质量的作业,如果学生感觉自己是「被动接受」,而不是「参与其中」,其益处也是有限的。
**8. 帮助老师摆脱打分制。**你的教师团队可能需要你的支持、鼓励和实际操作建议,以帮助他们摒弃作业检查或打分的老套路——其目的是强迫学生服从;转而采用新模式,鼓励学生之间相互解释和探讨自己的学习——他们对所读的书有什么喜欢和不喜欢的地方,他们有什么困难,他们想到了什么新问题。正如杰出的教育家 Martin Haberman 所见,最佳课堂上的家庭作业「不是为了检查——而是为了分享」。倘若学生们觉得,对于那些不会被搜集或记录的作业投入时间毫无意义,那么这并非是要我们设置奖惩制度、制造不信任的理由;这其实是在告诫我们,问题在于作业本身。
**9. 实验。**请那些不愿意重新思考长期以来对传统作业的依赖的老师试一试,看看在某一周或某一课程单元中,如果不布置作业会发生什么。当然,任何信奉家庭作业有益论的人,都应该愿意通过实验——暂停布置作业,来检验这一假设。暂停布置作业对学生的学习成果、学习兴趣、情绪状态以及课堂气氛有什么影响?学校同样可以试行一项新政策,比如我提议的改变默认状态,在全面实施之前,不妨先行试水。
校长们的日子总是在一次又一次的突发事件中度过;他们要处理种种抱怨,抚慰那些受了伤的自尊心,协商出各种解决方案,力求让所有人都心满意足,并且尽可能让火车(或者说,公交车)按时发车。身处这样的岗位,面对可能动摇现状的新举措,往往很难抵挡住逃避的诱惑。特别是在当前这个「提高标准」和「更高要求」等说辞被用来为各种从愚蠢到不当再到吓人的实践辩护的时代,要有相当的胆量和决心来处理像家庭作业这样的问题。但无疑,校长的根本职责是为孩子们做正确的事,保护他们不受那些有害的规定和实践的伤害,这些东西之所以流传至今,不是因为它们有价值,而只是因为它们是传统。
对于那些为了做出合理之事,愿意打破常规的人来说,开启关于家庭作业的讨论,无疑是个绝佳的开始。
相关资料
大量文章和书籍声称家庭作业是有益的——或者认为家庭作业理所应当,不加质疑,只是机械地提供一些布置作业的技巧,或是教父母如何促使孩子完成作业。这里有一些资料,它们对这个话题上的传统观念提出了质疑,旨在激发有意义的思考和对话。
Barber, Bill. “Homework Does Not Belong on the Agenda for Educational Reform.” Educational Leadership , May 1986: 55-57.
Bennett, Sara, and Nancy Kalish. The Case Against Homework: How Homework Is Hurting Our Children and What We Can Do About It (New York: Crown, 2006).
Buell, John. Closing the Book on Homework: Enhancing Public Education and Freeing Family Time. (Philadelphia: Temple University Press, 2004).
Dudley-Marling, Curt. “How School Troubles Come Home: The Impact of Homework on Families of Struggling Learners.” Current Issues in Education [On-line] 6, 4 (2003).
Hinchey, Patricia. “Rethinking Homework.” MASCD [Missouri Association for Supervision and Curriculum Development] Fall Journal, December 1995: 13-17.
Kohn, Alfie. The Homework Myth: Why Our Kids Get Too Much of a Bad Thing (Cambridge, MA: Da Capo Press, 2006).
Kralovec, Etta, and John Buell. The End of Homework: How Homework Disrupts Families, Overburdens Children, and Limits Learning (Boston: Beacon Press, 2000).
Samway, Katharine. “’And You Run and You Run to Catch Up with the Sun, But It’s Sinking.’” Language Arts 63 (1986): 352-57.
Vatterott, Cathy. “There’s Something Wrong With Homework.” Principal, January-February 2003: 64.
Waldman, Ayelet. “Homework Hell.” Salon.com. October 22, 2005.
标准化考试及其受害者
原文:Standardized Testing and Its Victims (**) - Alfie Kohn
作者:Alfie Kohn
标准化考试正在肆意膨胀、变异,几近要吞噬整个学校,就像那些老式恐怖电影中的怪兽一样。(当然,在《深夜秀》里,从来没有人会坚称那些怪兽实际上是在帮助我们,让受害者更加「有责任感」。)但让我们暂时搁置比喻乃至观点,来回顾这个话题下一些不争的事实。
事实 1:我们的孩子接受考试的频率,史无前例,举世无双。虽然先前几代美国学生都要经历考试,但考试从未如此频繁,也从未在学校教育中扮演如此重要的角色。从国际视角来看,当前的情况也实属罕见:很少有国家让高中以下的孩子接受标准化考试,或者对任何年龄的学生使用选择题考试。
事实 2:在比较学校或地区的考试成绩时,绝大多数的分数差异都可以由非教学因素解释。对 1992 年全国教育进展评估的数学成绩的研究发现,四个变量(居家父母人数,父母教育背景,社区类型,贫困率)的组合可以解释足足 89% 的州际分数差异。据我所知,所有对州级考试的类似分析都得出了相似的结果,其数字只有微小差异,因考虑的社会经济学变量而变化。
事实 3:标准参照考试本就不是用来衡量学习或教学质量的。斯坦福、大都会和加利福尼亚成绩测验(SAT,MAT 和 CAT),和爱荷华州基本技能考试以及全面基本技能考试(ITBS 和 CTBS),从设计上只会让大约一半的考生能答对大部分题目。这些考试的主要目标是排名,而不是评估;是区分学生和学校的成绩,而不是衡量他们的水平。
事实 4:标准化考试成绩衡量的是肤浅思考的水平。一项发表于《教育心理学杂志》的研究,将小学生的学习划分为「积极学习」和「肤浅学习」。「积极学习」的小学生,会在阅读时问自己问题,并联系过去学习的知识;而「肤浅学习」的小学生会抄写答案,不断猜测,并跳过困难的部分。结果发现,采取肤浅学习方法的学生,更可能在 CTBS 和 MAT 中取得高分。对于中学生(衡量其 CTBS 成绩)和高中生(衡量另一个 SAT 成绩,大学入学考试)的研究也得出了类似的发现。当然,有很多学生能够深入思考并在考试取得高分——也有很多学生既不深入思考,分数也很低。但作为一种规律,标准化考试结果似乎与肤浅的学习方法有正相关性。
事实 5:几乎所有的专家都反对对 8 或 9 岁以下儿童进行标准化考试。我这里使用「几乎」是不想把话说得太满,但实际上,我还没有找到一位在早期儿童教育领域的知名学者,支持对年幼儿童进行此类考试。
事实 6:几乎所有相关的专家和组织,都谴责根据单一考试结果作出重要决策的做法,比如毕业或升职。国家研究委员会的立场如此,大多数其他专业组织(如美国教育研究协会和美国心理学协会),通常支持考试的美国教师联合会,甚至创制和销售这些考试的公司的立场也都如此。然而,目前超过半数的州正进行着这样的高风险考试,或计划在不久后引入。
事实 7:花在让学生准备标准化考试的时间、精力和金钱,必然是从他处挪用而来的。全国各地的学校正在削减甚至取消艺术课程、年轻学生的课间休息、高中生的选修课、班级会议(以及其他旨在促进社会和道德学习的活动)、时事讨论(因为这些内容不会出现在考试中)、低年级的文学教学(如果考试仅集中在理解技能上),以及整个学科比如科学(如果考试只包含语文和数学)。如果有人怀疑学校牺牲了多少多重要的内容以追逐高分,他近来肯定没走进学校看过。
事实 8: 越来越多的教育者在离开教育行业,因为在「问责」和「高标准严要求」的名义下,学校经受了不少变化。我没有确切的数据,但我有足够的轶事证据支持,将其定为事实——有管理人员、教师和教育者、全国各地的观察者作证,也有几份州际调查支持,这些调查考量了教师对考试的失望程度。师范生开始对成为老师考量再三,这份职业中成绩为先,而他们被迫要让学生拿到高分。同样,正如《纽约时报》在 2000 年 9 月 3 日的头版报道中所述,「越来越多的学校失去了方向。他们的优秀教师在步入老年,而在提升分数的压力以及其他种种需求之下,本已非常困难的教师一职越发难以受人欣赏。」很现任,很多离开教育行业或者认真考虑这点的人,并不是平庸之辈怕被问责。他们其实可以算作非常优秀的教育者,只是在现在的大环境下难以开展高质量教学,并因此而倍感受挫。
面对这些难以解释的事实,标准化考试的捍卫者常常如此辩解:即使郊区学校的教育质量的确因为考试而下降了,但市区学校从一开始就非常糟糕。至少在那里,高风险的考试最终使标准提高了。
让我们假设这个论点的出发点是好的,而非是为了其他理由而辩护标准化与考试的决策。此外,我们当即可以认定,多年以来低收入少数族裔学生得到的教育服务非常糟糕。问题在于标准化考试这个解药其实比问题还糟糕——不仅是因为前面提到的八点事实,这些事实对城区学生的考试仍然是适用的。正如明尼苏达州的民主党参议员 Paul Wellstone 在去年春天的一次演讲中所说:「让学生对考试成绩负责,这句口号特别适合写成大字报,政治家还会说他们不会容忍失败,特别有益他们的形象。但这句口号是个空洞的承诺。高风险考试远远称不上改善了教育,反而是公正、准确、质量和平等的重大退步。」原因如下。
-
**这些考试可能存在偏见。**几十年来一直有批评者控诉许多标准化考试并不公平,因为来自优越背景的孩子,更可能具备这些考试所需的知识和技能。这种歧视效应在规范参照考试中尤其明显,因为这种测试需要保证分数有区分度,因此有些试题会涉及在校外习得的知识。正如 W. James Popham 所述,这为家境富裕、受教育程度高的学生提供了巨大的优势。依赖这种有偏见的考试来「缩小贫富差距」,可真是讽刺。
-
**谁最能花钱获得更好的考试辅导呢?**随着风险增加,人们会穷极所能寻找一切帮助,一些从这种急切心情获利的公司也逐渐涌现,他们销售考试辅导材料并提供服务,最近的一些公司更是瞄准了州级考试来设计产品。自然,富裕的家庭、学校和地区能负担这类产品,而且买得起最好的一档,因此,这种考试的不公也愈发凸显。此外,即便更穷的学校凑出钱买了这些材料,他们也无法采购一些他们真正需要的书籍和教育材料了。
-
**最贫困的人群接受的教学质量最差。**相比衡量真正的理解,标准化考试偏向衡量学生突击掌握的事实和技能,包括考试技巧本身。而少数族裔占比更高的学校,喜欢开展更多测试,并在教学中强调考试(已有数据证实),因此这些学校的教学质量也就更差。这些学校使用了一种高风险的策略,让学校更执迷于测试,并因此他们也愈发依赖直接教学和大量模拟测试。「面向技能的教学,大部分少数族裔的孩子都要经历这样的教学,这种教学方式往往让学生统一达到低水平的能力,并扼杀他们的学术潜力。」罗格斯大学的非裔美国教授 Dorothy Strickland 如此说道。
再次强调,无可否认,许多为少数族裔贫困儿童服务的学校从一开始就是二流的。然而,现在,一些在芝加哥、休斯敦、巴尔的摩等地的学校可以说已经变成了三流。受考试压力所迫,这些学校开始系统性采取低水平的刷题练习式教学,为此学区往往会购买一揽子课程。因此,当有人强调要对少数族裔儿童有「更高的期待」时,我们可能会回答,「对做什么有更高的期待?在糟糕的考试中正确完成更多题目,还是设立吸引人的项目来促进思考深度?」对于「更严格的标准」「问责」和类似口号推动的运动,只要依赖标准化考试作为成就的主要衡量,那么这些口号在意义上就降低了期望。穷孩子被命令做越多练习题(以提高他们的测试分数),他们就越落后于富裕孩子,因为有人会教富孩子怎么理解知识。如果刷题确实提高了分数,正确的回应不是庆祝,而是愤怒:考试结果得到改善,可能是牺牲了真正学习。
- **真正缺乏的并不是标准。**任何认真关心解决美国教育不平等问题的人,自然会想要调查可用资源的差异。有一个很好的论点是,最公平的分配策略——这在一些国家只是常识——是不仅为各学校和各地区提供相同拨款,而且为面临最多挑战的学生群体提供更多拨款。有些州的确这样做了,但绝不是所有州,而且,即使这些州的确倾斜了拨款,他们往往只会提供短期补助(根本无法补足多年的拨款缺口),并且指定这些钱要用于考试准备而不是高质量的教学。更糟的是,高风险考试系统,可能给那些已经成功的人提供更多的钱(例如,以奖金形式给予优异分数者),给那些最需要的人提供更少的钱。
很多公职人员以及类似想法的记者和观察者,很擅长对资源问题轻描淡写,并作出这样一个假定,即只要我们坚定要求「提升标准」,穷孩子和少数族裔孩子缺少教育资源的问题,便能迎刃而解。他们的言外之意就是,老师和学生本可以做得更好,但只是因为某些原因而没这么做,只需要诱骗威胁他们,他们便能提升(实际上,这是所有激励系统的潜在假设)。政策制定者的焦点已经转移到结果上的标准,而不是机会上的标准。
更糟糕的是,对于社区环境阻碍孩子成才的重要性,一些高风险考试的支持者不仅全盘忽略,而且嗤之以鼻。有人会向他们解释,孩子成绩不理想的原因有种族主义、贫穷、对罪犯的恐惧、教师的低薪、设施不充分、语言障碍等等,而他们都将其驳斥为「借口」。这不仅天真幼稚,而且冷血无情。像其他淡化结构性约束的观点一样,这种观点都会助益于有幸不必经历这些苦难的人。
- **那些所谓受帮助的人将被逐出系统。**一旦在教育工作者身上应用奖惩机制,那些给成绩较低的学生群体授课的人,最有可能被打上失败的烙印,并可能会辞职。少数族裔和低收入学生受到教师提高分数的不断压力的影响不成比例。但是当高风险被应用到学生时,我们很清楚哪些人最有可能因为没有通过毕业考试而无法获得学位,或者哪些人会预期到这种结果并决定辍学。如果各州坚持这种做法,让学生的命运取决于一次考试,那么未来几年可能的结果将是无比灾难性的。除非我们采取行动阻止这一切,否则我们将面临教育性种族清洗,毫不夸张。
让我们善意地假设,这个完全可预见的后果中的族群一面是无心之举。然而很难否认,即使考试不是基于常规参考,高风险考试的目的还是给学生排序。不熟悉相关心理研究(和现实)的人可能会坚称,提高标准会「激励」更多的学生成功。但请完成以下思维实验:假设一个州的几乎所有学生都达到了标准并通过了考试。大部分政治家、商人和专家对此会作何反应?他们会承认我们的公立学校很棒,还是会把这个结果作为标准过低,考试过于简单的首要证据?正如 Deborah Meier 等人所观察到的,从定义上来说,每个人都能达到的标准就不再是「高标准」了。
考试只是这个游戏的手段。在这个游戏里,很多孩子根本不可能是赢家,其中有很多是有色族裔。用这些孩子来辩护这样自上而下、高压手段、公司风格、考试驱动的学校改革,可以说是胆大包天。若要认真促进教育平等,我们要减少跟踪,让拨款更平等,让教学更精细化(而非采取过度编排的直接指导模式)。显然标准化测试处处是毛病,而它对那些最需要帮助的孩子伤害最深。
标准化考试
原文:Standardized Testing: Separating Wheat Children from Chaff Children - Alfie Kohn
区分优等生与劣等生
摘自 《课间休息去哪了,为什么我们的孩子在幼儿园里挣扎?》的序言,Susan Ohanian 著(纽约:McGraw-Hill,2002 年)
Alfie Kohn 著
制定政策的人,与承受政策后果的人,这两类人之间的鸿沟,天差地别。有人燕居于奥林匹斯山之颠,发号施令,文过饰非;而有人则匍匐地面,体会着花言巧语背后的具体现实。这种鸿沟体现在立法者和单身妈妈之间。立法者随意在预算项目上划掉一笔,或许因减小政府规模而面带微笑,而那位苦苦挣扎的单身妈妈得知今年冬天取暖油的开支将没有补贴。这种鸿沟体现在功勋卓著的将领和年轻的军人之间。那胸前勋章累累的男人在地图上插上一根针,或许嘟囔着需要推回敌人的防线,而那位前线苦战的年轻人突然被狙击子弹击中肝脏。
这种鸿沟也体现在大人物和厌恶学校的九岁孩子之间。大人物虔诚地督促我们,要让教育系统能够担起责任;而九岁孩子的生活被测验填满,而不是项目和谜题。在九重之上,有人热烈讲述需要实现世界一流标准。在俗世人间,小孩子默默啜泣,大孩子无法毕业,只因某项考试未达标;而优秀的老师找不到工作,只能流连于招聘广告之旁。
「高标准严要求」运动背后的逻辑充满猫腻,而标准化测试也在衡量最不主要的动力,这两点有很多可以谈。我提供了一些论点和论据,只要有人愿意看看那些道貌岸然的花言巧语,或者研究一下考试的设计思路和应用场景。我的文件柜里塞满了引人注目的论据和令人震惊的数据。
但这也有存在主义观点的一席之地。尽管存在主义遭到广泛误解,但它源自这样一个事实:我们每个人都是经验的中心,是在世界中感知、行动和反思的人。它反抗那些镇压你或否认你的主体性,将你抽象简化的系统和惯例,将你化作群众一员、一条科学数据、或某种苍白无力的超验实在。
曾经,存在主义者对抗着黑格尔的本质论或柏拉图的形式论。如今,他们——也就是我们——被号召起来对抗那些只会把孩子们划分成各种档次的人,正如英国国家英语教师协会的前主任 Robert Hogan 所言,「除非他们按十分位数分布」。是的,深入理解问题实践的智力架构,收集反对它们的案例的数据,这非常重要。但当我们听闻这股考试狂潮的规模时,我们不应忽视我们自然而然的第一反应:「我们是不是疯了?我们到底让他们对我们的孩子做了什么?」这同样重要。
几百年前,康德告诉我们,从道德角度讲,有一件事我们不能做,那就是把人当作达成某个目的的手段,当作工具或者仪器。我已经有一段时间没读他的作品了,但我不记得他为那些特别矮小、不吃蔬菜的人设立过例外。因此,我们不能在问责的祭坛上牺牲孩子,把他们当作大规模高风险试验的小白鼠,而忽视它所带来的实实在在的伤害。
大约一年前,Deborah Meier 和我在一次晚餐中,试图在结账前弄清楚「更严格标准」运动的本质。在那晚,我们偶然发现了一个非常黑暗的可能性,或许以一种思考实验的方式表述更为恰当。假设来年你们州的大多数学生都能达标,顺利通过考试,你猜那些政客、商人、报纸的评论员会有什么反应?他们会摇头赞叹,由衷地说,「真是太棒了,这些教师真有一手」吗?当然,这种可能性近乎荒谬。每次我提出这个假设,听众们总会告诉我,如果所有学生都成功了,那只会被立即理解为考试太简单了。
那么,这意味着什么呢?正如 Meier 所指出的,不可避免的是,「高标准」这个词组在定义上就是指不是每个人都能达到的标准。如果每个人都能达到,那就被视为标准太低的明证——然后标准就会被提高——直到创造出失败者。尽管其公关言辞掩饰得天花乱坠,但整个标准和问责运动并不是关于帮助所有孩子成为更好的学习者。它并没有致力于让每个孩子都不掉队。恰恰相反:它是一个精细的分类装置,将麦穗和糠秕分开。至于糠秕会怎样,就别问了。
用首字母大写的抽象概念,如卓越(Excellence)或更高期望(Higher Expectations),来为这个无情的事业辩护,结果让人反感。然而,当让大量孩子不及格,或者强迫他们辍学,或者将整个学校变成大型应试教育工厂,被包装成是为了贫困和少数族裔学生——那些实际上最受高风险考试影响的人——的最大利益时,人们便会对这种令人作呕的矛盾,标准主义者赤裸裸的奥威尔式厚颜无耻感到惊愕。
当然,他们常常能够提升考试平均分。通过剥夺孩子们的课间休息,取消音乐和艺术课程,减少课堂会议和实事讨论,减少自由阅读书籍的时间,压缩实地考察和跨学科项目以及高质量选修课的时间,花足够的时间教授考试技巧,你的确能让分数上去。但那结果,最多也只能说是空洞无物。当一个学校或学区报告今年的考试成绩比去年好时,了解情况的父母和其他观察者的反应是:「那又怎样?」(因为更高的考试成绩并不一定反映出更高质量的教学和学习)——甚至是:「呃噢。」(因为更高的考试成绩可能表明更低质量的教学和学习)。
一旦你意识到这些考试并不能可靠地体现学习质量,那么还有什么理由让孩子们——通常是非洲裔和拉丁裔孩子们——接受那些枯燥乏味、摧毁精神、严格规定的教学程序?而这些计划主要目的,不就是为了提升考试成绩吗?如果你只能以这种计划可以提高在根本就有瑕疵的考试中的成绩为借口,你实际上并没有给出真正有说服力的理由。移除了人为的支持,像是「所有人成功」、「开放法庭」、「阅读精通」和其他预设的,主要为了让孩子们能得出正确答案的项目(往往并无法理解为何这样做),只会因其自身的笨拙和无效而垮台。
但是,想要移除这些支持,我们必须提出持久的、包含数据和经验的批判。并非要听起来像传道书,有时候需要进行研究,有时候需要讲述故事,我们需要热血沸腾的愤怒,也需要冷静的分析。同样,我们可以采取各种策略,从温和的向编辑投稿,到坚决的公民抗命。北美的每一位父母,只要对标准化考试能否准确反映他或她的孩子的能力和潜力有所质疑,或者对这种考试热潮带来的教育后果感到担忧,都应当意识到,没有任何理由让他们的孩子在考试那几天去学校。这就是民权运动留给我们的永恒教训:坏的做法或不公正的法律只能在我们默许和配合下继续存在。只要我们教育和动员起我们的邻居,拒绝默许并拒绝参与对所有孩子的这种行为,我们就能恢复学校的理性,顺便说一句,还能让孩子们重新享受课间休息。
反分数论
原文:The Case Against Grades (##) - Alfie Kohn
Alfie Kohn 著
[本文对已出版的同名文章略微添加了一些内容。]
「我没有忘记我的作品被第一次附上打分标准的那个瞬间……忽然间所有的快乐都消失不见了。我是为了分数而写作——我不是为了我自己而探索。我想找回这种快乐。我能找回这种快乐吗?」
— 学生 Claire(于 Olson,2006 年)
关于评估学业表现的资料写得太多了,足以塞满一整个图书馆。但如果你稍微想一想,学业评估其实就是简简单单的两个步骤。我们需要收集学生表现的信息,将这些信息分享给与学生和家长(或许附带上我们的评价)。收集并报告足矣。
你会说魔鬼藏在细节里?可能是这样吧,但我认为过于关注实际过程中的细节会让我们失去大局观——至少,有两条根据最佳理论、实践和研究所得出的结论,会被你忽略:「收集信息不需要考试,分享这些信息不需要分数。」实际上,如果摆脱了这两个蒙昧时代的遗物,学生会好得多。
为什么考试对于检测学生的学习成果(至少是比较重要的学习成果)不是很有用,认真的教育者会做什么,这两个问题要等到日后再回答。在这里,我们的任务是聚焦于第二种做法,使用字母和数字来总结学生的表现,而不考虑得出这些结论的方法。
打分的影响
我们今天会听到对于打分的批评,实际上,它们大多数早在四十到八十年前就已经被有力而优美地叙述了出来(Crooks, 1933; De Zouche, 1945; Kirschenbaum, Simon, & Napier, 1971; Linder, 1940; Marshall, 1968),这些早期的文章读起来令人大开眼界。他们提醒我们,我们所做的事情存在一些问题,这一点已经清楚很久了,以及我们虽然意识到了这一点,却几乎没有进步。
在二十世纪八十和九十年代,教育心理学家系统地研究了分数的影响,像我在别处提到过的(Kohn, 1999a, 1999b, 1999c),如果比较一下被要求专注于分数和没有被要求专注于分数的小学生、中学生和大学生,结果就会支持三个强有力的结论:
-
**分数会削弱学生的兴趣,无论他们学的是什么。**研究证明「分数倾向」和「学习倾向」呈现负相关,并且,就我知道的而言,所有关于分数对内在动机的影响的研究都证明这种影响是负面的。
-
**分数会让学生偏向于选择最容易完成的任务。**如果学生知道了自己的所作所为会影响分数,他们会避免一切不必要的智力风险。为了得到更好的分数,他们会选择更短的书来读,做项目也会选择熟悉的话题——这不是因为他们「缺乏动力」,而是因为他们足够理性。是那些成年人为他们设定了取得高分的目标,传递出了学业成功比掌握知识更重要的信号,而他们只是回应这些成年人而已。
-
**分数会降低学生的思考质量。**他们可能会把书草草翻一遍以掌握「他们需要知道的」。他们不会想「我们能确定这地方是正确的吗?」之类的问题,而是会问:「考试会考吗?」有个实验让学生理解一段社会学研究材料的主要含义。研究者告诉一组学生他们要接受考试,而告诉另一组学生他们不会被打分。接受考试的学生对材料大意的理解更糟糕。一周后考察他们能背出多少内容,被打分的一组记住的知识点也更少(Grolnick 和 Ryan,1987 年)。
最近几十年里,关于打分各方面影响的研究进展较慢,但现有研究都证实了之前的发现。比如,分数导向的环境中作弊现象较严重(Anderman 和 Murdock,2007 年);即使是对于优秀学生,分数(无论是否附带评语)都会引发恐惧感(Pulfrey 等,2011 年);在医学学校中不公布分数(而选择通过/不通过的模式)收效甚佳,而弊处不明显(White 和 Fantone,2010 年)。更重要的是,没有任何最近的研究得出与之前「三大结果」相悖的结论,所以这些结论仍然成立。
为什么打分存在本质问题
有位学徒问大师,他要修炼多少年才能悟道。「十年」,大师说。但学生接着问,如果自己非常努力呢?「二十年」,大师说。学生很诧异,并接着问如果他非常非常努力,比静修处所有学生都努力,那需要多少年。「那样的话要三十年」,大师说。他解释道:「如果你拿一只眼睛拿来关注你离达成目标有多近,那么你只剩一只眼睛专注于任务了。」
为了理解为何研究者得出了这些关于分数的结论,我们需要将目光从教育评估技术转向更广泛的心理学和教学领域,这样我们便能看出打分背后有一系列错误的假设。
动机:尽管在接受几年传统学校教育之后,很多学生可以认为是分数驱动的,但动机的本质非常重要。外在动机,比如取得高分的渴望,不仅与内在动机非常不同,更会破坏内在动机,破坏为学习而学习的渴望(Kohn,1999a)。很多评估方面的专家认为只有一种动机——而他们推荐的做法只是粉饰雕琢后的的奖惩系统,这种系统会让学生追逐分数,而减少对学习本身的兴趣。如果对我们来说,培养学习的渴望是首要目标的话,那么打分这种做法存在本质问题。
成就:有两位教育心理学家指出,「对评估的过度重视会阻碍学生对卓越的追求」(Maehe 和 Midgley,1996,第七页)。这一令人不安的结论,即使不考虑评估本身的质量仍然成立,但尤其适用于在使用分数系统进行评估时。这两人的调查,以及很多其他研究者,如 Carol Dweck,Carole Ames,Ruth Butler, John Nicholis(Kohn 199b),都支持这一结论。简而言之:越引导学生重视他们的表现要有多好,他们就对自己实际上正在做什么越不上心。
因此,评估必须谨慎且节制,以免学生过于顾虑表现(他们在某事上的表现有多好,或更糟糕地,他们相比其他人的表现)而不再关注学习本身。即便是用意良好的老师,也可能会让他的一屋子学生过于关注自己的阅读技巧,而忽略故事本身。评估咨询师担心的是分数可能没有真实地反映学生的表现;教育心理学家担心的是分数让学生过于关注他们的表现。
量化:有人可能会问我,测量学生学习质量(或者老师教学的质量)难道不重要吗?对此,我会请他们重新思考他们选择的动词。「评估」教与学的质量当然有价值,但「衡量」教与学,用数字来表示质量,往往是并不必要,甚至是不可能的。的确「可量化的结果可能是学习最不重要的结果」(McNeil,1986,p. xviii)——这一结论,对于当今沾染公司习性,对数据高度执迷的「学校改革」,是令人耳目一新的反击。
用具体的度量来讨论教室中的活动,乃至儿童脑中的思考是否在前进或后退,不仅是过度简化,无法抓住现实特征的做法,更是充满破坏性的,因为这一度量会破坏现实中的活动。如果我们过于关注可以用数字描述的东西,比如作文中有多少语法错误,或者孩子记住了多少种数学算法,学生的思考能力会被大幅破坏。这正是我们试图把学习框进四个或五个(鬼知道有多少个)百分制标准的结果。
课标:Howard Gardner(1991 年,254 页)写道,「纵使我们有最优质的评估手段,如果相配套的课标质量无法匹配,那么评估手段也毫无作用。」评估领域的一些人对评估和课标的相关性很坦率,他们会帮助你根据目标和课标调整评估手段。结果是老师们变得很擅长衡量学生是否掌握一组特定的知识和技能,这些知识和技能的价值究竟可不可靠,从来没有人对此产生疑问。这就像 Elliot Eisner (2001 年,370 页)所说的,「如果某项知识不值得教,那么它也不值得好好地教。」我们也可以再加上一句,「不值得好好评估」。
比如说,如果用作品集替代分数,而非根据作品集产出分数,那么这会是更有建设性的做法。作品集提供了一种方法,深思熟虑地收集各种大量有意义的学习例子,帮助学生们复习。但如果「教学时时刻刻都按照工作表来,以致所有作品集都一个模样,那还有什么用?」(Neill 等人,1995 年,第四页)。相反,有时候更深思熟虑的教学方式——比如通过研讨会教学写作——和某些令人沮丧的标准化评估手段之间,存在十分大的鸿沟(Wilson,2006 年)。
改良打分:徒劳无功?
「我一直在提倡基于标准的打分方法,这也是非常重要的运动,但只有在一些优秀的教育者教导我之后,我才意识到如果我希望我的评估是基于真实反馈的,那么我应该直接放弃打分这种做法。」
——新泽西中学教师 Json Bedell(2010 年)
「面向学习的评估」(以及「形成性评估」)等概念相关的内容令我非常不安:其中推荐的做法过于矫揉造作而机械化;数据收集的必要性凌驾于儿童自己的地位之上,也凌驾于帮助他们对自己所做的事情产生热情之上。尽管如此,如果不过分频繁和张扬,面向学习的评估还是有可能的。然而如果是「面向学习的打分」,用 1960 年代的口号来说,就是像是为了和平而轰炸。对学生和其努力打分并排名本质上会适得其反。
如果我是对的——更为重要地,如果我之前提到的所有研究被认真对待——那么去除打分是促进深度思考,提升思考动力的必要不充分条件。我们有必要在这个观点上多思考片刻,因为各方势力都在试图兜售提升打分技术的方案,而没有真正处理打分本身的问题。
-
把打分中的数字或字母换成标签(「超越期望」「符合期望」之类)是不够的。如果你把学生分成了四类或五类,你仍然在给他们打分。指标通常是包含数字和标签的,这只是我们要对此抱有怀疑的原因之一。(Wilson,2006 年;Kohn,2006 年)。
-
提前把对学生的期望告诉他们是不够的。「如果把学校当成考试,而非是思维丛林中的一次探险」,而老师「提前列明学生为了取得高分要完成的事」,那么老师可能觉得这是比较公平的做法。「[然而]这样的教育在更广泛的意义上是不公平的,因为这种教育让学生擅长通过其他人设置的考试,而没有增强他们与同伴合作时设置自我目标的能力。」(Nicholls 和 Hazzard,1993 年,77 页)。
-
更高效地发布分数,比如说发在网上,是不够的。已故的 Gerald Bracey 曾评论道,「有很多飞速发展的技术,能让我们在纳秒之间完成很多事,但这些事我们本就不应该做。」(引用自 Mathews,2006 年)。实际上,在网上发布分数是巨大的退步,因为这种做法让分数更加显眼,增强了分数对学习的破坏性影响。
-
附加叙述性报告是不够的。「如果分数和评论一同发布,评论是为了证实分数而存在的。」(Wilson 2009 年,60 页)。但如果「只有评论,接受者会阅读评论。」高中英语教师 Jim Drier 说到。此外,根据研究,即便附加了报告,分数对创造力的破坏性并没有减少(甚至可能更多)。只有没有分数的情况下,叙述才会有用。
-
使用「基于标准的」打分是不够的。这一词语有很多暗示,比如更一致的打分,或使用了更精细的公式来决定分数;分数含义更具体;或者给更多任务或技能打分。最好的情况下,这些方案没有解决打分的本质问题;最坏的情况下,它们加剧了这一本质问题。除了数据越多越好这一简单化前提,我们发现与昔日行为主义者共享的爱好,即学习可以也应该被分解成一个个组分来分别评估。过于频繁的获取数据,助长了以学习为代价的对表现不成比例的关注,而这正是研究者发现的非常有害的情况。
「基于标准」一词,有时候仅仅指的是打分是根据一系列目标制定的。这时候我们的首要反应则应该是思考这些目标的价值(以及制定这些目标时学生的参与程度)。如果分数是依据国家的标准制定的,那么我们就很有必要担忧了,因为这些标准往往过于具体,与年龄不相称,从定义上来说是标准化的(Kohn,2001 年)。根据我的经验,对于遥不可及的官方制定的一系列目标,或者用这些目标作为他们学生思想的评估手段,最好的老师是有所顾虑的。
最后,「基于标准」一词有时候跟基准考试(criterion-based testing)一词所指类似。基准考试指的是避免根据曲线来给学生打分。(尽管有些老师不会明面上按曲线给分,但他们认为分数应该是接近正态分布的,只有一小部分学生能拿到 A。但这一分布并不是自然的,也并不是老师「严谨」的表现。这是失败的符号——教学的失败,考试的失败,对学生智力施加影响的失败[Milton, Pollio & Eison,1986 年])。相比故意让高分非常稀少,让学生互相竞争的系统,基准考试无疑是一大进步。但我们虽然去除了洋葱最外面一层皮(竞争),但我们要暴露出内在的危害:外在动机,数字打分,以学习为代价的成就。
如果我们的初衷是做更频繁的考试,获取更多数据,或者提升打分的一致性,那么我们会选用相应的方案。然而,如果我们的初衷并不是打分,而是为了让学生深刻理解知识,或者是从文字和数字中获得乐趣,或者是做自己学习的主人,那么我们的做法可能会大不一样。我们会认为打分系统是一台冒烟呲油,轰隆作响的巨大机器,时刻需要修复和新零件。我们要做的是拔掉电源线。
去除分数,或至少淡化分数
「不管你喜不喜欢,打分已成定局」这种话,任何有责任感的教育家,都不会将其作为不作为的借口。约定俗成的做法是否对学生最有利,这是我们关心的问题。如果不符合学生的利益,我们必须要努力消除这种做法,与此同时也要努力减轻其影响。
给出叙述式评估或开展教师与家长的会议,以此替换数字或字母分数,也就是用书面或谈话形式给出的学生进展的定性总结,这种做法并不是乌托邦式的幻想。很多公立私立的小学中学,乃至高中,都已经采取这种做法并取得了成功。(Kohn,1999c)。重要的不仅是明白为何有学校采取这种做法,而且要调查为什么他们摒弃了分数,他们怎么做到的(提示:这一过程可能是渐进式的),以及他们取得了什么好处。
对于这样重大的方针转向,或者说任何重大转向,自然会有人反对,然而只要教师向学生和家长展示相关研究,解答他们的疑虑,并邀请他们一同构建其他的评估方式,摒弃分数的做法不仅是现实的,而且是相对于现状的巨大改善。有时候只有终结了打分,我们才能意识到打分的危害有多大。
我知道你们在担心什么,但我可以肯定地说,这些去分数化高中的毕业生,是能被大型公立大学和高门槛的私立大学接收的——相比平均分(GPA),这些高中提供的叙事性评估报告,以及对培养方案的详细描述(配合推荐信,论文,采访等内容)为大学申请者描绘了更加全面的画像。此外,这些学校指出,相比传统学校为分数焦头烂额的学生,他们的学生在学习上更有动力,也更擅长、更适合大学生活。
无论如何,申请大学并不是小学和中学摒弃分数的阻碍,因为大学并不关心学生在高中之前的所作所为。对低龄段儿童施加分数的鼓吹者,由此会使用我称之为 BGUTI 的论点:「最好早点适应(Better Get Used To It)」(Kohn,2005 年)。他们的观点是,我们应该尽早把这些不愉快而又不必要的事加在孩子身上,以便让他们适应之后这些会加在他们身上的事。这一辩解太过荒谬,但教育政策的制定中仍有其一席之地。
即便管理者还没准备好放弃传统成绩单,教师也可以两步走来「无害化分数」,让他们教的学生学得更好。首先,停止在作业上写字母或数字分数,而只提供定性的反馈。每学期发成绩单已经很差劲了,然而研究者发现,如果每天都对学生在校的行为打分,伤害会更大(对于学习兴趣,对挑战的意愿,以及思考质量)。只要把分数换成真实的评估,老师就能避免不少伤害。不仅如此,就跟我们之前所说的一样,没有数字分数后,任何反馈都会更加有用。
第二,尽管老师可能需要上交最终分数,但并没有人要求分数必须只由老师给出。所以,老师可以让学生一同参与评价,或是互相商讨(老师有最终决定权),或是让学生给自己打分。如果有人觉得这种做法有风险,这可能是他们意识到这会让教室的环境更加民主,让老师必须构建合适的教学方法和培养方案,使得学生真心参与其中,而非让老师胁迫他们按安排行事。实际上,对这一提议的负面看法(「这不现实!」)恰好说明了分数更多是控制学生的手段,而非报告学生表现的必要方法,或者有任何建设性。
我最近和几位停止给学生打分的初高中老师谈了谈。其中,Jeff Robbins 已经在新泽西教授八年级科学 15 年,他坦白:「还是打分更容易点」,因为打分比提供有意义的评估快多了。但这一效率背后是巨大的代价。他注意到孩子们压力很大,而且倾向于避免智力上的挑战。他们会选择更容易的作业以保证他们得 A 。
一开始 Robbins 宣布,学生可以重新提交所有项目或考试,以获得更高的分数。可惜的是,这种做法并没有解决根本问题,他最终意识到,他必须完全停止打分。现在,他为他的所有学生(125 名)撰写评论,「围绕他们的表现,和他们需要改善的地方」,并在他的记分册上写下简短的笔记。每学期末,他会花一周的时间找每位学生谈话:「因为在教育系统的原始设计下,孩子无法得到这种反馈」——他会问孩子学了什么,如何学到的。「只有在谈话末尾,他会问什么样的分数最能反映孩子的学习,而他们会一同得出结论。」就像我这些年来交流过的很多老师一样,Robbins 说他几乎总是接纳学生的打分提议,因为他们基本上和他打的分是一样的。
Jim Drier 是伊利诺州 Mundelein 高中的英语老师,他教了 90 名学生,其能力分布从「挂科边缘到大学预修水平」。他很高兴地发现,给学生的作业写简短的评论「并不会花太长时间」——这是「对他们努力的反馈,以及对他们如何改进的一些建议」。但他从不「对学生的作业打分。分数驱使孩子做的事,对于教育者而言是非常心痛的。」:与教师争辩,跟家长争斗,考试作业作弊,为考试死记硬背,再忘得一干二净。「这不是我成为教师的初衷」。
没有了分数后,「我觉得我和学生的关系改善了很多」,Drier 说。「他们的写作水平提升得很快,知识也记得更牢了。很多学生告诉我,他们对学校的态度也改变了。」他本以为家长会有所抵触,但他说三年后只有一个家长反对停止打分,而他在给那位家长寄信写明缘由后,家长的态度也有所缓和。现在有两名他的同事也加入了摒弃分数的行列。
Drier 根据学生书面提交的自我评估给出最终分数,而这一评估则基于学生对他们作品集中的作品的评价。他与四分之三的学生每学期简单见面两次,以评估他们的表现,此外如果必要的话(虽然不常发生),他会和他们讨论他们自己提供的分数是否合理。有人问过他,没有字母和数字的记分册他该怎么办,Drier 则说:「如果我跟学生共处了 18 周,我会很清楚他们的写作和推理能力。」
对于这些放弃打分的老师以及其他老师来说,真实评估的一大关键要素,是让学生有机会设计评估机制,并思考其意义——无论是每个学生自己,还是整个班集体。注意这与另一种常见的自我评估方式有所不同,在那种方式里,学生只是根据老师设定的(或者法律要求的)目标衡量自己的进度,而他们必须依据打分指标,为自己的学习进展给出粗略的数字分数。
从这些老师的交流中可以找出不少共通之处,当然也有存在差异的做法。来自加拿大阿尔伯塔省红鹿城的教育家 Joe Bower (无日期)收集了一些例子。比如说,有一些老师会衡量学生的表现(当然是定性的),但其他人认为只提供反馈是更有建设性的做法,也就是只提供信息。对后者而言,「分数的另一种方案是描述」,「描述的起点应该是白纸一张,而不是用一种引导和同质化描述的形式」(Marshall 1968 年,131, 143 页)。
老师也提供了同事和管理层乃至学生自己对摒弃打分的回应。John Spencer (2010 年)是一名阿里桑那州的中学老师,他坦白道:「很多优秀学生一开始非常愤怒。他们认为摒弃打分是不公平的。他们认为上学是工作,而同学是竞争者……随着时间推移,他们的反应有所变化,他们平静下来了。他们分数上的压力消失了,因此他们也学得更多了。」
根据研究,学生对分数的关注倾向,并不是学生内在的偏好或是什么学习风格的反映;这只是学生终年被牵着为分数劳碌的反映。在一项研究中(Butler,1992 年),研究者鼓励一些学生去思考他们在一项创意性任务上表现如何,而只要另一些人发挥自己的想象力。之后,每个学生被带到一个房间里,里面是其他人根据相同指示绘制的作品,此外也有让他们算出「创意分」的一些指示。当然,那些被指示要思考自己表现的孩子,现在想要知道的是他们相比同龄人干得怎么样。那么能够沉浸于任务之中的孩子,则对其他人到底做了什么更感兴趣。
分数没办法让孩子为现实世界做好准备——除非有人喜欢学习和思考质量无足轻重的世界。分数也并不是学校教育的必要组分,正如体罚和长时间听写一样。尽管如此,在这样一个定量比定性更重要,符合(他人的)标准比探索想法更重要,任何「严谨」的事物会自动获得价值的时代,为孩子做正确的事是需要勇气的。
参考文献
Anderman, E.M., & Murdock, T.B., eds. (2007). Psychology of academic cheating. Burlington, MA: Elsevier Academic Press.
Bedell, J. (2010, July). Blog post.
Bower, J. (2010, March 28). Blog post.
Bower, J. (n.d.). Blog post. [Grading moratorium list]
Butler, R. (1988). Enhancing and undermining intrinsic motivation: The effects of task-involving and ego-involving evaluation on interest and performance. *British Journal of Educational Psychology, 58,*1-14.
Crooks, A.D. (1933). Marks and marking systems: A digest. Journal of Educational Research, 27(4), 259-72.
De Zouche, D. (1945). “The wound is mortal”: Marks, honors, unsound activities. The Clearing House, 19(6), 339-44.
Eisner, E.W. (2001, Jan.). What does it mean to say a school is doing well? Phi Delta Kappan, pp. 367-72.
Gardner, H. (1991). The unschooled mind: How children think and how schools should teach. New York: Basic Books.
Grolnick, W.S., & Ryan, R.M. (1987). Autonomy in children’s learning: An experimental and individual difference investigation. Journal of Personality and Social Psychology, 52, 890-98.
Kirschenbaum, H., Simon, S.B., & Napier, R.W. (1971). Wad-ja-get?: The grading game in American education. New York: Hart.
Kohn, A. (1999a). Punished by rewards: The trouble with gold stars, incentive plans, A’s, praise, and other bribes. Rev. ed. Boston: Houghton Mifflin.
Kohn, A. (1999b). The schools our children deserve: Moving beyond traditional classrooms and “tougher standards.” Boston: Houghton Mifflin.
Kohn, A. (1999c, March). From degrading to de-grading. High School Magazine, pp. 38-43.
Kohn, A. (2001, Sept. 26). Beware of the standards, not just the tests. Education Week, pp. 52, 38.
Kohn, A. (2005, Sept. 7). Getting hit on the head lessons. Education Week, pp. 52, 46-47.
Kohn, A. (2006, March). The trouble with rubrics. Language Arts, pp. 12-15.
Linder, I.H. (1940, July). Is there a substitute for teachers’ grades? School Board Journal, pp. 25, 26, 79.
Maehr, M.L., & Midgley, C. (1996). Transforming school cultures. Boulder, CO: Westview.
Marshall, M.S. (1968). Teaching without grades. Corvallis, OR: Oregon State University Press.
Matthews, J. (2006, Nov. 14). Just whose idea was all this testing? Washington Post.
McNeil, L. M. (1986). Contradictions of control: School structure and school knowledge. New York: Routledge & Kegan Paul.
Milton, O., Pollio, H. R., & Eison, J. A. (1986). Making sense of college grades. San Francisco: Jossey-Bass.
Neill, M., Bursh, P., Schaeffer, B., Thall, C., Yohe, M., & Zappardino, P. (1995). Implementing performance assessments: A guide to classroom, school, and system reform. Cambridge, MA: FairTest.
Nicholls, J. G., & Hazzard, S. P. (1993). Education as adventure: Lessons from the second grade. New York: Teachers College Press.
Olson, K. (2006, Nov. 8). The wounds of schooling. Education Week, pp. 28-29.
Pulfrey, C., Buch, C., & Butera, F. (2011). Why grades engender performance-avoidance goals: The mediating role of autonomous motivation. Journal of Educational Psychology, 103, 683-700.
Spencer, J. (2010, July). Blog post.
White, C.B., & Fantone, J.C. (2010). Pass-fail grading: Laying the foundation for self-regulated learning. Advances in Health Science Education, 15, 469-77.
Wilson, M. (2006). Rethinking rubrics in writing assessment. Portsmouth, NH: Heinemann.
Wilson, M. (2009, Nov). Responsive writing assessment. Educational Leadership, pp. 58-62.
反对「更严格标准」的理由
原文:The Case Against "Tougher Standards" - Alfie Kohn
作者:Alfie Kohn
人们在谈论教育「标准」时,常常赋予其不同的含义。有时,他们指的是指导教学的原则,意味着我们应该改变教学的本质——可以说是一种横向转变。(比如 1989 年美国数学教师协会提出的标准,就旨在从记忆孤立的事实和步骤,转向理解概念和解决问题。)
相比之下,当你听到有人提出我们需要「提高标准」时,这其实指的是一种纵向转变,即要求学生学习更多、做更多、表现更好。这可能会引起混淆,因为关于标准的讨论有时仅限于这两种含义之一,有时又在它们之间来回摆动,甚至有时隐含地利用一种含义来支持另一种含义。我们这里主要关注的是第二种情况;我们并不是说不应该有指导方针来规范课堂活动,或者我们目前的方法不需要改变。(只要看一眼传统课堂上那种「大堆事实」的教学模式,就不难理解制定新标准——进行横向转变的必要性。)
对于纵向转变这一理念,至少从抽象层面来看,似乎难以反驳。我们不都殷切期望学校能有上乘的办学质量,学生的各方面才能都有出类拔萃的表现吗?这自然无可非议。然而,当前关于「更严格标准」的呼声背后,其实暗含了对学校应扮演的角色、失败的本质和原因,以及学生学习方式等方面的种种假设。这也就不难理解,许多人(尤其是教育工作者)开始对当今占据主导地位的学校变革模式产生与日俱增的忧虑。
从家长到总统,说话的风格都开始像那些脾气暴躁、缺乏见地的脱口秀主持人。结果就是:在「提高标准」或「加强问责」的冠冕堂皇的名义下,什么样的举措都可以在学生和学校身上肆意妄为,无论这些做法背后的考量有多么贫乏。这让人想起,面对高犯罪率,一些政客常常搬出严厉打击、全部关押、加强法制的态度。这种姿态虽然迎合了大众的口味,但它基于对问题的夸大、对原因的误解,以及过于简化的解决方案,最后往往带来了更严重的损害。
教育领域也面临着同样的情况,人们要求「更严格标准」。早在 1959 年,John Holt 就写道,「学校追求所谓的高标准,结果孩子们忙于应付,无暇思考。」如今,在这一系列问题上,民主党和共和党几乎难分伯仲——只有少数了解儿童学习方式的人与那些一无所知的人之间存在分歧。教育委员会和州立法机构的争论,基本上仅限于以下两方面的对立:一方是「更严格标准」的支持者(包括几乎所有的企业集团、总统、州长和美国教师联合会的领导层,以及大多数撰写教育报道的记者);另一方是极右翼分子,他们对联邦政府参与的任何事物都持怀疑态度,因此反对国家标准或测试(他们也倾向于支持更严格的标准,只是坚持由地方来控制)。这就是关于这个主题的公众辩论的主要范围。至于学生自己的声音和新标准对他们学习的影响,却几乎被完全忽视。
其结果是,从加州到纽约,从密歇根到得克萨斯,从弗吉尼亚到科罗拉多,每个地方都在经历同样的情况:那种能够帮助学生从内在深入理解概念、维持求知兴趣的教学方式,正受到严重冲击。这里有个故事,能代表无数类似的情况:
不久前,在威斯康星州,一位深受学生喜爱的中学老师,在一次社区会议上说,他「曾经」是个优秀的老师。他这样说的时候,全场都静了下来。在这些日子里,他解释说,他做的只是发放教科书,考查学生背诵的内容。原因很简单:他和同事们正面临越来越大的压力,需要提高学生的考试成绩。曾经的他,课堂上充满了创新和热情的探索,但现在,在准备标准化考试的大环境下,这种方式已经难以为继。
推行「更严格标准」的人取得了胜利,但学生们却输了。
五大致命缺陷
「更严格标准」运动在五个方面存在致命缺陷。
-
**它误解了动机。**大多数关于标准的讨论假设学生应该始终专注于提高自己的表现。这种对结果的一味关注过于简化了问题。「成绩就是一切」的假设忽视了大量心理学研究,这些研究表明,关注「自己做得好不好」和「关注自己在做什么」有着本质的区别。更重要的是,过分关注表现往往会削弱学习兴趣、降低学习质量,并打击接受挑战的欲望。(想了解更多,请看《过分强调成绩的代价》)
-
它误解了教学法。「更严格的标准」的支持者大力提倡回归基础教育,更普遍地说,他们倾向于将学生视为被动接受者,试图将所谓的「基本技能」或「核心知识」强行灌输给学生。特别是,各州的教育标准文件通常包含冗长的具体知识点和技能清单,要求所有特定年级的学生都必须掌握。这种教育模式甚至不能称作过时,因为它从未真正有效过。现代认知科学更系统地说明了为什么这种方法总是行不通。(有更多详情,请参阅《标准化考试的「标准」同样值得警惕》)
-
**它误解了评估。**在实践中,「卓越」、「更高标准」和「提高标准」往往等同于标准化考试的分数,而这些考试中有许多是多项选择题、常模参照(译注:就是赋分制)的测试,存在诸多缺陷。事实上,当今很多关于教育的讨论仅仅停留在「考试分数太低,必须提高分数」这一肤浅的层面。所有这些测试的局限性和问题都是对依赖这些测试的学校改革方案的严重指控。(更多详情,参见《标准化测试及其受害者》和其他文章。)
-
它误解了学校改革。「更严格标准」的支持者倾向于通过详细规定必须教授和学习的内容来强制推动改革——也就是说,通过强制执行一种特定类型的教育。我们有充分的理由认为,仅仅通过要求教师和学生改变做事方式并不能改变学校教育。所谓的「问责制」到头来不过是一种咒语,让不在教室里的人更严格地控制课堂活动——这对学习的影响就像绞索对呼吸的影响一样。
-
**它误解了改进的本质。**贯穿所有这些想法的是一个关于「严格」和「挑战」的隐含假设——即越难越好。在抱怨教育「愚钝化」和强烈呼吁「提高标准」的背后,潜藏着这样一种还原论的(而且实际上相当愚蠢的)观点,认为可以用难度这一单一标准来评判考试、教材和教师。与之相近的是另一种观点:如果某件事效果不佳——比如要求学生做价值可疑的家庭作业——那么坚持做更多同样的事情就一定能解决问题。正如 Harvey Daniels 所说的那样,当今解决学校问题的主流理念实际上就是说:「我们正在做的事情没有问题,我们只需要做得更努力、更持久、更有力、更响亮、更严厉,就能建设一个更好的国家。」(更多详情,参见《混淆「更难」与「更好」》)
这五个问题在《我们孩子应得的学校》一书中有更详细的探讨。其中任何一个问题都足以对「更严格标准」的呼吁提出严肃质疑。这些问题共同揭示了一个如此巨大的威胁,以至于对于负责任的教育工作者和家长而言,唯一合理的问题是:我们如何才能最有效地改变教育的方向。
*****谈谈「不让一个孩子掉队」
...我们不能再将对《不让一个孩子掉队》法案的不满局限于实施或经费等次要问题上。有太多人误以为,只要他们自己的学校被认定为取得了足够进展,或者只要联邦政府在资助这种对地方自治的侵犯时更为慷慨,就没有什么好反对的。我们必须摒弃那种「立法的本意是好的,都怪执行歪了」的说辞。事实并非如此。我们认同的只是推行该法案时一些冠冕堂皇的宣传口号,如「追求卓越」「实现公平」等。《不让一个孩子掉队》绝非迈向正确方向的一步,而是一部破坏性极强、居心叵测的法律。任何真心致力于改善公立教育(或关心那些长期遭受忽视和压迫的群体利益)的人,都不应与之有半点瓜葛。
最终,我们必须做出决定:我们是顺从地扮演分配给我们的角色,帮助惩罚孩子和教师,还是选择不同的道路。每一次在职培训、每一篇文章、每一份来自中央办公室的备忘录,都好似在提供一本屈从的指南,使我们逐步迈向错误的方向,直至最终我们可能完全放弃公共教育。我们的责任不在于急忙遵从这些规定,而在于找出最有效的抵抗方式。
摘自《今日考试,明日私有化》2004 年 4 月
「《不让一个孩子掉队法案》加剧了种族间的差异,这在我 40 年的教育立法经验中是前所未见的。...它带来的所谓进步并非真正的学习进步,而仅仅是测试成绩的提升。这也是为什么这些所谓的进步不会持续的原因。」
——Jonathan Kozol,2007 年
过度强调成绩的代价
原文:The Costs of Overemphasizing Achievement (**) - Alfie Kohn
《学校管理员》1999 年 11 月刊
作者:Alfie Kohn
唯有非凡的教育才关注学习本身;多数教育只关注分数:而对年轻人而言,二者几乎完全相反。
— Marilyn French
I. 常识告诉我们,我们应该先明确教育目标,再定期检视实现目标的成效。因此,评估的角色本应是教与学过程中谦恭的助手。不幸的是,今天的教育界的常识短缺,因为评估已经主导了整个教育过程。更糟糕的是,如今最常见的评估形式的目的和设计——无论课堂内外——常常导致灾难性的后果。
一部分问题在于我们回避真正该问的问题,不愿顺着数据的脉络深入探究。相反,我们只在细枝末节上做文章,微调教育评估技术,却对更大的问题视而不见。以打分为例,当前的讨论多半集中在多久公布一次成绩,或某个成绩等级的门槛划在哪里(比如什么样的表现算 B)。一些教育者开始过度关注得 A 的学生是否太多。
然而,从另一个角度来看,真正的问题并不是分数通胀——而是分数本身,因为它从根本上破坏了学习的意义。真正令人愤慨的不是太多学生得 A,而是太多学生被灌输了一种观念:上学的目的就是为了得 A。具体来说,研究表明,传统的字母或数字评分制度往往会导致三个后果。
第一,学生会逐渐对学习内容失去兴趣。他们考取好成绩的动机越强烈,探索思想的动力就越弱。第二,学生会尽可能回避具有挑战性的任务。在他们看来,难度更大的作业无疑会阻碍获得高分。第三,学生思维的质量令人堪忧。大量研究表明,传统的打分方式会削弱学生的创造力,甚至损害他们对知识的长期记忆。
这些结论所依据的数据,只要用心就能找到。至于废除分数制度面临的实际困难——包括如何让家长理解此举对孩子的益处——对于任何决心完成这项改革的人来说都是可以解决的。然而,在行动之前,我们必须认真反思一个根本问题:评估学生的初衷究竟是什么?
如果我们的根本目的是收集能够提高学习质量的信息,那么传统的成绩单显然不如更加仿真的模型。不幸的是,评估有时会受到完全不同目标的驱动——例如,激励学生(把分数当作胡萝卜和大棒来强迫他们更加努力)或对学生进行排名(目的不是帮助每个人学习,而是区分谁比谁更优秀)。无论是哪种情况,这样的评估项目从一开始就注定要失败,原因并不在于我们尚未找到正确的评估方法,而在于我们的评估目标本身就存在根本性的错误。
学校不仅通过考试成绩(最令人不齿的例子就是按照某种分布打分),还借助标准化考试对学生进行分类。所谓的常模参照测试,如爱荷华州基本技能综合测试,其目的并非评估教学效果和学习质量,而是通过人为拉开学生分数差距来实现排名。这类考试不仅采用相对指标呈现结果(而不是根据固定标准评估每个人做得如何),而且试题的选择也是为了排名。如果大部分学生都能答对某道题,出题者很可能会将其剔除,至于学生是否应该掌握这一知识点并不重要。因此,正如评估专家 W. James Popham 所言,用 ITBS 这样的测试衡量教育质量,无异于「用汤匙测量温度」。
标准化测试还存在其他弊端:(a)考试内容往往脱离课堂实际,由远离学校的机构命题和评分,(b)题型以选择题为主(因此学生无法自主作答或解释思路),(c)有时间限制(因此更重视思考速度而非思考质量),以及(d)一考定终身,给学生带来巨大压力。
这些特征无一例外都与真正有意义的评估背道而驰。恰恰相反,它们对教学产生了极为强大而深远的负面影响。教师们感到越来越大的压力,不得不从真正的学习时间中分出宝贵的时间,去准备学生应付这些糟糕的考试。当然,这些压力有些源自州政府的要求。然而,层层加码的学区管理者常常会火上浇油,增加更多的测试,而这些测试有时恰恰是参考价值最低的(因为它们都是根据常模而非学习目标来设计的),也是破坏性最大的(因为教师最终不得不设计出一种低智化的、应试型的课程)。当然,这一切都打着提高标准和加强问责的幌子,但正如任何优秀教师都会告诉你的,其实际结果就是将智力活动挤出课堂。
事实上,研究人员也能证实这一点。在科罗拉多州开展的一项研究中,一些四年级教师被要求教授同一项任务。大约一半的教师被告知,在他们完成教学后,他们的学生必须「达到标准」,在测试中取得好成绩。另一组教师,被分配了相同的任务,只是被要求「帮助孩子们学习」。最后,所有学生都参加了测试。结果显示:相比之下,在过分强调达标的班级里,学生掌握这项任务的程度并不理想。
为什么会出现这种情况?一方面,当教师感受到取得成绩的压力时,他们往往也会反过来给学生施加压力。这正是在纽约开展的一项后续研究所发现的情况。教师的控制欲增强,几乎剥夺了学生自主学习的任何机会。由于人们在感到被控制时很少能发挥出最佳水平,科罗拉多实验的发现就不出乎意料了:教师越是关注测试结果和「提高标准」,学生的实际表现反而越差——更不用说他们的学习热情可能会逐渐消退。
II. 如果认真对待上述这些关于分数和测试的担忧,其影响显然将是巨大的。然而,即使这样的批评也没有触及当前评估方法的根本问题。深层的问题涉及一个基本区别,而这个区别在过去二十年里一直是教育心理学领域一些工作的核心。这就是关注你做得有多好与关注你正在做什么之间的区别。
认真考虑这样的一所学校,它不断强调表现、结果、成绩和成功!一个已经接受了这种观念的学生,可能会发现自己很难全身心投入创作诗歌,或尝试制作能用的望远镜。他可能过于关注结果,以至于无法真正投入到产生这些结果的活动中去。当然,关注结果和专注过程这两种取向并不矛盾,但在实践中,它们给人的感受是不同的,导致截然不同的行为方式。即使我们不知道一个学生在某项任务上的实际表现如何,或者她应该有多聪明,仅仅知道她是被引导更关注学习的层次还是成绩的高低,我们就可以对她有很多了解。
难道学生的学习效率不重要吗?当然很重要。我们有必要定期与学生一起总结讨论,评估他们(和我们)的教学成效如何。但如果过度关注结果,反而会适得其反,得到并不理想的结果。有证据表明,过度痴迷标准和成绩很可能导致五个令人不安的后果:
1. 学生开始将学习视为一项苦差事。 当学生不断被要求关注自身的学习成绩时,他们对学习的态度首先受到影响。他们可能会开始将任务本身——故事、科学项目和数学问题——视为必须完成的任务,是应该用于拿到更高分数的材料,而不是他们兴致盎然、热衷探索的材料。一心只想成为顶尖学生的人或许会坚持学习,但一旦考试成绩成了主要目的,他们对学习内容本身的兴趣和探索知识的热情往往就会消退。
这一现象与心理学家的一个发现有关:个人的内在动机和外在动机往往是负相关的。人们为了获得奖励去做某事的频率越高,就越有可能对这件事本身失去兴趣。因此,当学生被告知要为了应付考试而了解某些内容——或者更广泛地说,他们即将做的事情将计入成绩——他们可能会感觉这项任务(或书籍、想法)本身变得乏味无趣,这并不令人惊讶。
**2. 学生试图避免有挑战性的任务。**如果学习的重点是追求成功而非拓展思维、探索新知,那么学生偏好选择最容易的任务是完全合乎逻辑的。毕竟,这将最大化成功的概率——或者至少最小化失败的概率。
许多研究人员已经验证了这个假设。在典型的实验中,孩子们被告知他们将要接受一项任务。其中一些孩子被告知他们的表现将受到评估,而另一些孩子则被鼓励将此视为学习的机会,而非追求好成绩。然后,每个学生可以选择他们想要尝试的任务难度。结果总是一致的:那些被告知这是「一个学习机会」的孩子,比那些被引导去想自己的表现将会如何的孩子更愿意挑战自己。
我们可以方便地假设那些走捷径的孩子只是出自懒惰,因为这样的话问题就出在孩子身上,似乎只需要修正孩子即可。但也许他们只是太过理性,已经适应了一个注重结果而非鼓励探索的环境。当学校系统使用传统的评分系统——或者更糟糕的是,当他们增加荣誉榜和其他激励措施来增强成绩的重要性——它们无意中打击了学生挖掘自身潜力的积极性。讽刺的是,学校管理者和改革者们苦苦抱怨现在的孩子们只想走捷径,但他们自己却营造了一种过度注重成绩和结果的氛围,这必然会导致他们所抱怨的结果。
**3. 学生往往缺乏深入思考。**一些学生的目标是学习新技能,探索世界,理解他们在做什么。当他们拿起一本书时,他们思考的是他们在读什么,而不是他们读得有多好。看似矛盾,但那些将成功置之度外的学生反而更容易取得成功。他们能够更深入地加工信息,反复审视自己没弄懂的地方,将当下所学与他们早先学到的知识联系起来,并运用多种策略去领会新接触到的想法。诸多实证研究都证实了这一点。
相比之下,那些在引导下一心只想得出正确答案或考高分的学生,思考往往流于表面。这里我们可以注意一下关于这个问题的数十项研究之一,它考察了知识迁移的能力——也就是说,将学到的东西运用到新任务或问题中去。在研究中,在一组八年级学生即将开始为期一周的科学课单元之前,研究者评估了每个学生是注重理解还是追求成功。单元结束时的知识迁移能力测试显示,不管之前的考试成绩如何,注重成功的学生的表现都不如注重理解的学生。
**4. 学生面对失败时可能会一蹶不振。**任谁都难免偶尔失误,而从错误中汲取教训、逐步改进,正是高效学习的关键。因此,培养学生积极应对挫折、从失败中迅速恢复的良好心态和应变能力至关重要。通常来说,将学习本身视为目标的学生往往能做到这一点:他们把失误看作宝贵的经验,冷静分析问题所在,并想方设法加以解决。
然而,对于那些相信(通常是因为他们被明确告知)重点是获得优异成绩——甚至是超越他人的孩子来说,情况则大不相同。他们在一帆风顺时似乎游刃有余,但一旦遇到挫折便会心理失衡,仿佛丧失了信心和斗志。在他们眼中,哪怕是偶尔的失误,也足以抹杀此前取得的所有成绩。当学习的重点不在于探索未知、而在于证明自己有多优秀时,任何不尽如人意的表现都可能令他们无法接受。
想想那些考了 92 分而非平时的 100 就焦虑万分的学生吧。我们往往将此归咎于他们个人,认为是他们太过严苛,给自己施加了过大的压力。但是,「我正在做什么」与「我做得有多好」之间的区别可以为我们提供一个新的视角,来理解这里发生的事情。学生在面对挫折(哪怕只是相对的挫折)时信心尽失,根本原因很可能在于对高分数、好成绩的系统性要求。
关键点不在于多少分才算不及格(如 92 分与 40 分之间的差距)。真正重要的是学生感受到的不许失败的压力,这种压力对优秀和有天赋的学生影响尤其有害。因此,安慰学生「92 分已经很高」或「相信你下次会表现得更好」不仅没有抓住问题的本质,反而加剧了问题的严重性——因为这再次凸显出学校教育的重点不是鼓励探索思想,而是力争成为第一。
**5. 学生们更重视能力而非努力。**当一名学生在测验中得到满分时,我们通常会作何反应?大多数老师和家长会视之为值得庆祝的好消息。然而,那些想的更多的人却未必会感到高兴。首先,他们会担心教学采用了「填鸭」方法,以及使用传统测验所反映出的评估方法。即便是成绩优异的学生,这样的教学也无法真正让他们受益。
然而,即便采用了更加完善的评估方式,有洞察力的观察者仍会意识到,相较于分数本身,学生对自己为何取得该分数的看法可能更为重要。不妨让我们来探究一下,一名学生可能会如何解释自己在考试中的优异表现。第一种可能是努力:她全力以赴,埋头苦读,竭尽所能地掌握知识。第二种可能是能力:如果你问她如何得到满分,她可能会回答(或暗想):「啊,大概是因为我够聪明吧。」还有一种答案是运气:她觉得自己猜对了答案或者状态正佳。最后,她可能将结果归因于题目难度——在本例中,考试较为简单。(值得注意的是,同样这四个理由也可以被另一个在同一测验中只得 23 分的学生用来解释:我没有尽力;我太笨了;运气不济;或者考题太难。)
在以上四种对表现出色(或糟糕)的解释中,你更倾向于哪一种?你希望学生用哪种理由来诠释自己在校的表现?几乎所有人都会选择努力。孩子们将好成绩归功于考前的刻苦准备,这对他们的未来无疑是一个好兆头。同样,那些将低分归咎于考前准备不足的学生,往往也会意识到失败是可以在下一次避免的。由此可见问题的关键所在:当学生在引导下关注自身在校的表现时,他们通常倾向于用自己的聪明才智,而非付出的努力来解释成绩。
研究表明,对于这些问题——我做得怎么样?我的成绩够高吗?我的答案正确吗?——关注表现的学生倾向于从自身能力的角度来解答。教育心理学家Carol Dweck及其同事曾对学习成绩优异的学生进行研究,结果发现,老师越是强调考高分、不出错、跟上他人进度,学生遇到挫折时就越容易将原因归咎于能力不足等他们认为超出自己控制的因素。当学生不断地被引导思考他们的表现如何时,他们往往会从自身能力寻找原因,而不是反思自己是否付出了足够的努力。
研究还发现,相比那些将成绩归因于努力的学生,认为成绩取决于智力的青少年在学习时思考得更浅、更马虎。同样,将失败归因于能力不足的小学生阅读能力也普遍较差。此外,习惯于被称赞「聪明」的孩子一旦遇到学习挫折,成绩会明显下滑,而这种情况在其他孩子身上则不会发生。
综上所述,人们对智力以及成功与失败原因的信念至关重要。其影响往往超过学生的自信程度、实际能力或上周考试的成绩。如果我们像那些「更严格标准」的提倡者一样,只盯着及格线,只关注考试成绩和分数,我们最终会忽视学生对结果的理解方式。如果我们让孩子过度思考如何提高成绩,到头来他们可能会以最不具建设性的方式来看待考试结果。
如果这番话听起来或许有些激进,那是因为它确实如此——激进一词源自拉丁语,本意是指「根本的」。确实,前沿研究确实提出了一些根本性的问题,包括测试本身的弊端可能并不局限于内容。真正的危害在于过度关注考试结果。即使是最公正、精心设计、「真实反映」学生知识水平的评估,如果过分强调学生的表现,从心理学的角度来看,同样值得担忧,这会导致学生(和他们的老师)更关注考试结果而忽视学习过程本身。正如密歇根大学的 Martin Maehr 和 Carol Midgley 所总结道:「过分强调评估实际上会削弱人们对卓越的追求。」无论评估质量如何,这一点都适用。而劣质的测试只会加剧这种危害。
在学生求学的大部分时间里,尤其是低年级学生,当然也包括高年级学生,他们都应该能够自由地思考、写作和探索,而无需顾虑自己的水平高低。只有偶尔,老师才需要引导他们关注自己取得了怎样的学习进展,以及如何才能进一步提升。在这种情况下,评估学生的学习状况完全可以,而且应该在不借助传统分数和标准化考试的情况下进行。但大多数时候,学生应该沉浸在学习中。
如果您希望更加深入地探讨专注于表现(成绩)和学习过程之间的差异,以及相关的研究参考文献,请阅读 The Schools Our Children Deserve 一书的第二章。
为什么「自律」被我们过度神话了?
关于内在控制的(令人不安的)理论与实践
原文:Why Self-Discipline Is Overrated(#) - Alfie Kohn
作者:Alfie Kohn
阅读本文的西班牙语版本,请点击这里
阅读本文的法语版本,请点击这里。
要获取关于这个主题更详细和更新的讨论,请参阅 The Myth of the Spoiled Child. 一书的第 7 章。
如果说存在一种人格特质,它的益处同时受到传统与进步教育家的广泛认可,那很可能就是自律。几乎每个人都希望学生能够克服自身非建设性的冲动,抵制诱惑,去完成应该完成的任务。的确,那些讨厌提及自尊心,且抱怨当今时代标准宽松的人热烈地推崇自律。即使是那些自称进步的人也认同,对儿童进行纪律教育(无论是为了矫正他们的行为还是为了让他们专注学习)远不如让儿童进行自我约束来得可取。对于教师,甚至对于任何处于相对权威地位的人来说,如何能够让受其权威约束的人自发做其应该做的事,是非常具有吸引力的。唯一的问题是:如何最优地实现这一点。
自律(self-discipline)可以定义为:调动一个人的意志力去完成一些被普遍视为有益的事情,而自控(self-control)是用同样的意志力来防止自己做被视为不合适的事情,或延迟满足。在实践中,这两者经常作为自我调节的同一机制中的两个方面,所以我将这两个词交替使用。在已出版的书籍、学术文章或互联网站点的索引中搜索它们,你会马上发现,很难找到任何关于其价值的负面评价,或深刻的质疑。
虽然我承认,能够坚持不懈地完成有价值的任务是件好事—而且有的学生似乎缺少这一能力—但我还是要说,这一观念其实在三个根本方面上有问题。深究自律的本质,就能发现其对人动机和性格的误解,对人性的自相矛盾的假设,以及对课堂与社会结构的令人不安的影响。我们可以将这些分别归为心理学(psychological)、哲学(philosophical)和政治学(political)问题。当下的所谓的自律中普遍存在着这样的问题,尤其是在我们的学校里。
I. 心理学问题:关键差异
如果我们仅仅将学生当做工具来培养,让他们完成所有被分配的任务,服从所有规则,那么自律将无疑是一个有用的特质。但如果我们将他们当做一个健全的人来培养——例如,我们希望我们的学生在心理上保持健康——那么自律并不优于其他特质。甚至在某些情境下,自律可能会起到反作用。
几十年前,著名的研究心理学家 Jack Block 曾用「自我控制」水平——也就是冲动和感受被表达或抑制的程度,来对人进行分类。那些自控不足的人冲动且容易分心;而那些自控过度的人则具有强迫症倾向且总是闷闷不乐。事实是,教育工作者普遍对前者更感烦恼,且更有可能将其定义为问题儿童,但这并不意味着后者就不存在问题。Block 警告说,我们不应该支持「用全面、普遍、僵化的自控来代替无节制的冲动」。问题不仅仅在于自我控制并非总是好的;还在于自控缺失并不总是坏事,因为它可能「为自发、灵活的行为,温暖人心的社交活动,开放性的体验和创新性认识提供基础」。那么,我们的社会对「自控精神普遍给予赞扬」,即使它有时「令人不适且破坏生活体验」的这一事实,又说明了什么呢?「1」
本毋庸置疑的是,走向其中任何一个极端都是不明智的,然而一些拥护自律的研究人员却明确拒绝承认过度自律对健康的损害。[2] 除他们外,还有许多公开出版的读物,公然无视这一基本原理。这些读物通常充斥着不负责任的论断,比如「促进自律是所有学校的重要目标」或「教导学生学会自律,应是所有教师的追求」。[3]
这些论断与一些科学研究背道而驰:研究表明「在某些情况下,自律有其好处……但在另一些情况下却可能是有害的」[4] 。研究不仅显示了「冲动的后果并非总是负面的」,[5] 还指出过度的自我控制往往意味着更加被动与乏味的感情生活[6]——甚至在某些情况下会导致更严重的心理问题。[7] 「自控者往往对各种药物敬而远之,但他们的自我调节能力却总是弱于那些并不严格自律、可能轻度使用药物之人。同时,一种过度自控的风尚正将越来越多年轻女性(而非年轻男性)置于抑郁的风险中」。[8] 不仅如此,过分强调自控也是厌食症的一个关键特征。[9]
想象一下有这样一个学生,她总是一接到作业就开始工作。这看起来可能是一种令人钦佩的自律表现,毕竟她本可以做其它她更喜欢的事,但实际上,这可能只是源于她对未完成的事情所感到的极度不安。她想——或者更准确地说,需要——把作业做完以避免焦虑。(事实上,当我们需要自律才能完成一项任务时,便意味着这一任务难以开发我们的智力。毕竟,学习效果并不取决于学生做了什么任务,而更多的取决于他们如何看待,如何理解他们所做的事情。[10] 如果不认同这点,那就是倒退到了早已被学者们所摒弃的,粗糙的行为主义之中)。
总的来说,自律并不总是健康的象征,反而可能是一个人脆弱的标志。这可能反映了一种恐惧,一种对于被外界力量或自己的欲望所淹没的恐惧,其必须通过持续的努力来抑制。实际上,困扰他们的正是失去掌控感的恐惧。在他的经典作品**《神经质的风格》**(Neurotic Styles)中,David Shapiro 描绘了一个人是如何扮演「自己的监督者,对自己发出命令、指示、提醒、警告和劝告,不仅关于什么应该做、什么不应该做,还包括什么应该想、感受、思考」[11]。一个安全、健康的人应该是有趣的、灵活的,对于新奇体验和自我发现持开放态度,并能够从过程中获得满足,而非总是专注于结果。与之相比,一个极端自律的学生,可能仅仅将阅读与解题视为获得好成绩的手段。在 Shapiro 的描绘中,这样的人「对任何缺乏目的、仅仅是为了享受活动过程的活动感到不适,难以认识到,离开了持续的目标感和努力,生活也可以是令人满意的」。[12]
这一分析引出了几个有趣的悖论。其一是,虽然自律是自我意志的体现,是一种自由选择,但从心理学角度来看,许多自律的人实际上根本不自由。与其说他们自律,不如说他们不允许自己不自律。而对于延迟满足也是如此,正如一位研究者所指出的那样:那些能够延迟满足的人「并不是在自我控制上做得『更好』,而是在某种意义上,他们似乎无法避免这样做。」[13]
第二个悖论是,卓越的自律可能蕴含着自我毁灭的种子:一种被心理学家称为「去抑制」(disinhibition)的爆发性失控。处于一个不健康的极端(即使它不总是被认为不健康)的人们可能突然发现自己处于另一个极端:一直以来遵守规则的学生突然以令人震惊的方式行事;一直虔诚禁酒的人突然开始放纵地狂饮;一直以来禁欲的人突然发生鲁莽又危险的性行为。[14] 此外,竭力地尝试抑制潜在的不良行为也可能会产生其他负面影响。通过大量对压抑行为的研究,我们发现其导致的结果通常包括「负面情绪(不适或痛苦)[和] 认知干扰(包括心猿意马和对于被禁止行为的侵略性、强迫性思维)」。[15]
简而言之,如果某个学生非常自律,或善于延迟满足(因为延迟满足者「往往过度控制和不必要的抑制自我」[16]),或即使在处处受挫时也坚持完成某项任务,我们也不应该感到庆幸。虽然最后一种行为通常被浪漫化为坚韧或 「勇气」,但其实际上反映的可能是一种 「钻牛角尖」,它源于一种不健康的、往往适得其反的需求,即:即使在明显没有意义的情况下也要继续做某事[17]。
当然,并不是每一个自律的孩子都是以一种令人担忧的方式来自律。那么,是什么成就了健康和适度的自律呢?或许是节制,但不刻板,Block 称之为「适应性回应的多样性」(adaptively responsive variability)。[18] 重要的是,拥有选择何时应该坚持下去、控制自己的能力 —— 而不是在简单地在每种情况下都倾向于这样做。与自律或自控本身相比,孩子们将能够从这种能力中受益匪浅。但这样的理念与现今教育、文化领域中对于自律的无条件推崇大相径庭。
越来越清楚的是,自律的问题不仅在于自律的程度,还在于其种类。从动机心理学家 Edward Deci 和 Richard Ryan 的工作中,我们能找到一些极有意义的思考角度。首先,他们希望我们重新考虑一下,当我们在谈论「动机」的时候,我们到底在谈论些什么。我们总以为「动机」是某人已拥有的定量的事物。我们希望学生们拥有更多的动机,所以才尝试去通过那些萝卜加大棒的方式「激励」他们。
事实上,动机有着不同的类型,而其属于何种类型比其强烈程度更为重要。内在(intrinsic)动机指的是出于对事物本身的兴趣去做某事——例如,为了感受故事本身而去阅读。而外在(extrinsic)动机往往存在于并不关注事物本身的情况下。例如一个人可能是为了获得奖品或他人的认可而阅读。这两种动机不仅只有名字之别——它们甚至往往是反向相关的。大量研究表明,你越是希望通过奖励让人们做某事,他们对于那件事失去兴趣的可能性就越大。研究者发现,为乐于助人、慷慨大方的孩子提供「积极反馈」,最终会削弱这些品质,而鼓励学生提高成绩会导致他们对学习失去兴趣。 [19]
即便在没有外在诱因的情况下,孩子们也会做一些并不吸引人的事情。这时我们可以说,他们已经内化了做这些事的决心。这里我们又回到了自律的概念上(强调「自我」)。事实上,这正是许多教育工作者所期望的:即使没有人拿着萝卜与大棒站在他们身边,我们也希望孩子们能够变得充实忙碌起来。我们希望他们在无人看管时也能负责任地行事。
Deci 和 Ryan 的工作还未到此为止。在证明了存在不同类型的动机(这些动机并非同样可取)之后,他们继续提出也存在不同种类的「内化」(同理)。这是我们很少考虑到的可能性;所有能够区分内在动机和外在动机的教育者都认为,我们应该帮助孩子们内化良好的价值观。但这种内化的本质究竟是什么呢?一方面,规则或标准可以被完全吞下,或者说是「内化」,进而从内部控制着孩子们:「这时孩子们去做一件事往往是因为他们觉得『应该』去做它们,或者说不这样做可能会引发焦虑、内疚与自卑。」另一方面,内化可以以在更加深层的维度上实现,使得孩子们「自愿地或自发地」去做一件事。它已经完全融入了一个人的价值观。
因此,学生学习的原因可能是她觉得自己必须学习(如果不这样做,她就会觉得自己很糟糕),也可能是她了解这样做的好处,即使这并不总是令人愉悦,她也想坚持下去。[20] 事实证明,这一基本区别与学术成就、体魄、爱情、慷慨气量、政治参与度和宗教信仰都有关系--每种情况下的研究都表明,后一种动机将带来比前一种动机更好的结果。 [21] 尤其是在教育方面,教师应该通过尽量减少 「外部强加的评价、目标、奖励和压力 」以及积极支持学生的自主抉择来促进其生成更加正面的动机。[22]
这告诉我们,内在动机并不总是理想的。如果孩子们感到被控制,即便是自我控制,他们也可能会感到矛盾、不快乐,而且不太可能在他们正在做的任何事情上取得成功(至少在感受意义的层面上)。尽责的学生可能正遭受心理分析家 Karen Horney 所描述的「责任心的过分统治」——到了他们不再知道自己真正想要什么,也不知道自己到底是谁的地步。对于那些把自己现在的生活抵押给未来的青年人来说也是如此:他们寒窗苦读,锲而不舍,压力山大。高中只是为了上大学做准备,而大学则是为了收集下一步所需的各种证书。任何事物本身都没有任何价值,或者说能够提供任何满足感。这些学生可能熟练于应试,排名,以及延迟满足,但他们提醒着我们,自律是一把双刃剑。
II. 哲学问题:深层信念
鉴于以上种种理由,我们有必要反思:为什么我们如此迷信自律和自控呢?答案可能涉及到渗透到我们文化中的基本价值观。或者说让我们换个问题:如果需要自律才能让自己做有价值的事情,那么无法做到自律的儿童与一般人又过着怎样的生活呢?
且看保守派报纸专栏作家 David Brooks 最近对此的反思:
在林肯的时代,走向成熟意味着征服自我。人类被认为生而有罪,受黑暗的欲望和魔鬼的诱惑所驱使。走向成人就是要战胜它们。你可以阅读 19 世纪和 20 世纪初的学生毕业致辞,演讲者大都在致辞中谈到了内心的野兽,以及为了战胜心中野兽所需的钢铁意志。学校里的读物强调着自律,其整个性格塑造模式都是以赎罪为中心的。[23]
Brooks 的观点是正确的,但有一点需要格外注意:强调自律不仅仅是历史遗留问题。如今,虽然那些赎罪的口号不再折磨你我,但只需在网上浏览几分钟,我们就会发现,这一概念在当代美国依然生机勃勃——在谷歌上有着三百万次点击。(它也是品格教育运动(character education movement)的一个关键要素。[24])基于生而有罪的假设,人们选择以自律作为赎罪的福音,但 Brooks 却对此提出了令人不安的提醒。因为我们的爱好被视为不值得的,我们的欲望被认为是可耻的,我们才想要努力克服它们。按这一逻辑来讲,人类的生活就是一个扼杀与超越自我的持续斗争。道德就是心灵战胜肉体,理性战胜欲望,意志战胜欲望。[25]
有趣的是,许多世俗机构和自由派个体,他们会强烈反对「孩子们是需要被驯服的、以自我为中心的小野兽」的观点,然而,他们却青睐一个在本质上相同的理念.。有些人特别强调拒绝老式的强迫和惩罚,转而支持更温和的方法。[26] 但是,如果他们仍然致力于确保孩子们内化我们的价值观——实际上就是在每个孩子内心设下律令——那么他们就应该承认,这不仅与「帮助他们发展自己的价值观」背道而驰,而且与「帮助他们独立思考」的目标南辕北辙。内在的控制在本质上并不比外在的控制更人道,他们的心理效果并没有太大的不同。
除了对人性的看法,对自律的执着还反映了他们潜意识中对哲学保守主义的支持,这种保守主义经常抱怨我们的社会——或年轻人——忘记了努力工作的价值、责任的重要性、承担个人责任的必要性等等。(别忘了,几个世纪以来,老一辈人一直在谴责年轻人的懒惰和「现代」。[27])而且,这种谴责通常伴随着一种规训的视角,这种视角支持自我否定,并讽刺地否定自我探索与自尊。
语言学家和社会批评家 George Lakoff 在其引人入胜的著作《道德政治》(Moral Politics)中指出,自律在保守主义者的世界观中扮演着至关重要的角色。[28] 自律意味着对权威的服从[29],因而其也是世俗成功所必需的。缺乏自律将被视为自我放纵,甚至是道德败坏的表现。因此,只要一个孩子得到了他们未曾赢得的东西,包括我们的赞许,只要缺乏竞争(哪怕是与他人实现双赢),只要孩子们得到了过多的帮助或滋养,那么我们就会被视作是在「放纵」、「过分溺爱」,没有让孩子准备好面对现实世界。有趣的是,这种保守主义并不只出现在脱口秀或共和党大会上的演讲。它还出现于部分研究人员的工作中,这些研究人员不仅研究自律,还极力强调其重要性。[30]
当然,关于道德和人性的根本性问题难以在一篇文章中得到解决。何况我们中一些人的出发点也与其他人截然不同。但是,对于那些张口闭口都是自律的教育工作者来说,探索一下这一概念的哲学基础,并在其让我们感到不安时反思一下这个概念,也是有意义的。
III. 政治问题:实际影响
当我们想要了解在一个特定环境中——比如说,一个教室里——发生了什么时,通常的做法是研究其行动方针、行为准则和组织结构。但不幸的是,我们中的许多人都倾向于忽视整个系统的运作方式,而将大部分问题归因到个人性格上——社会心理学家将这种现象称为「基本归因错误」。[31] 因而,我们倾向于认为自控力只是一个人可能拥有的一种特征,尽管将其视为 「一种情境概念,而非个人特质 」可能更为准确,因为 「一个人在不同的情境中会表现出不同程度的自控力」。 而延迟满足也是如此。[32]
过分关注个体而非环境不仅会阻碍我们对于自律的理解,还会在社会实践中带来负面影响。具体来说,我们越是指责人们缺乏自律,越是在努力帮助他们培养控制冲动的能力,就越不可能去质疑那些影响他们的结构性因素(如政治、经济或教育因素)。如果我们假设人们只需要通过个人努力就能成功,那么我们就没有理由去争取社会变革。因此,对自律的过分强调不仅在哲学前提上是保守的,而且在政治上产生的后果也是偏向保守的。
在我们的社会中,这样的例子比比皆是。如果消费者债台高筑,而我们仅仅把问题归结为缺乏自控力,就会转移人们的注意力,使人们不再关注信贷业「为了让我们自小就依赖借钱」而做出的努力。[33] 再将目光投向 20 世纪 50 年代发起的「保持美国美丽」(Keep America Beautiful)运动,这一敦促我们停止乱扔垃圾的运动——最后被发现是由美国罐头公司等企业资助的,其目的是将环境破坏归咎于个人,进而阻止了关于是谁从一次性商品及其包装的生产中获利的问题探讨。[34]
再让我们的话题回到坐在教室里的学生们。如果问题是:「我们应该如何教导他们:回答问题之前应该举手并安静等待,而非将答案吼出来」,那就忽视了:「为什么是老师在这里提出大部分问题,并单方面决定谁可以发言,以及何时发言?」。如果问题是:「教导孩子们自律的最佳方式是什么,以便他们完成作业?」,那就忽视了:「这些感觉像是工作的作业,[35] 真的值得去做吗?它们是否真的促进了深入思考和对学习的热情,还是仅仅为了死记硬背和机械练习?」换句话说,把缺乏自律认定为问题根源,就等于是努力让孩子去顺应现状,而这种现状是未经审视的、难以改变的。此外,这还在每个孩子心中都培养了「一个心中的监察员」,这可能不利于他或她的成长,却为创造「一个自我控制的——而不仅仅是外力控制的——公民,或是劳动力」提供了极大的便利。[36]
当然,并非每一个反对意见或证据,都适用于每一个自律的应用场景。但这提示我们:有必要更加仔细地审视自律这一概念,及其在我们学校中的应用方式。除了其哲学基础和政治影响外,我们还有理由对任何可能导致过度控制的事物持怀疑态度。一些为成年人所满意的敬业学生,实际上可能是焦虑不安、为外物所役使的,他们的动力来自于不断的对于自我肯定的需求,而非类似好奇心的东西。换句话说,他们正在成为「工作狂」(workaholics)一般的学徒。
[补充报道]
关于棉花糖和性别差异:
再论自律实验
四十年前,在斯坦福大学沃尔特·米歇尔(Walter Mischel)的实验室里,一群学龄前儿童被单独留在一个房间里。他们被告知:可以随时按铃叫来实验员,从而拿到一小份奖励(比如一块棉花糖)。但如果他们能耐心等到实验员自己回来,就能得到更大的奖励(两块棉花糖)。广为流传的实验结果是:那些能够耐心等待的孩子,在大约十年后的认知和社交技能评估中表现得更好,他们的学业能力测试(SAT)成绩也更高。正如保守派评论员所讲的那样,道理很简单:我们应该少关注那些对提高教育质量或减少贫困的「结构性改革」,而应更多地看重个人所拥有的特质——特别是自控力这一优良传统。
但这些研究的真实情况要复杂得多。首先,正如 Mischel 所承认的,实验的因果关系并不明确,延迟满足的能力可能并不是十年后发现的那些令人印象深刻的品质的直接原因;二者的同时出现更可能是同一种家庭环境的结果。
其次,Mischel 最感兴趣的并非:孩子们是否能够等来更丰厚的奖励——顺带一提,大多数孩子都能[39]——以及能够等待的孩子是否比那些不能够等待的孩子在生活中表现得更好,而是:孩子们是如何让自己安心等待的,以及哪些方法对其更有帮助。结果显示,当孩子们被玩具分散注意力时,他们能够等待的时间更长。最有效的并非「自我压抑和坚定的决心」,而是在等待时做一些愉快的事情,这样做根本就不需要自控力![40]
第三,在预测结果方面,具体情况——即每个实验的设计——比某个孩子的个性更关键。[41] 这与从这些研究中通常得出的结论完全相反,后者认为自控力是个人性格的体现,而我们应该去培养这种性格。
第四,虽然 Mischel 确实考察了个人特征,但他主要关注的是「认知能力」——也就是关于如何思考(或者说停止思考)那些诱惑的策略,以及这些思维策略与后续所展现的能力间的关联。实际上,这些能力与延迟满足本身并无关系,而只与在无干扰时自我转移注意力的能力相关。[42] 而这种能力又与传统意义上的智力(intelligence)有显著的相关性。[43]
最后,大部分引用该实验的人只是简单的假设,选择延迟满足、获得更大的回报要比不延迟满足、获得较小的回报更好。但这真的总是正确的吗? Mischel 本人就不这么认为。他和他的同事写道:「决定是否延迟满足,部分取决于个人对特定情况的价值观和期望。因此,在特定情况下,延迟满足可能是,也可能不是一个明智的选择。」[44]
如果说对 Mischel 研究的保守评价主要是由于其他人对其进行了(错误)解读,那么最近的一项研究则不然,研究者自己就热衷于将成绩不佳归咎于「无法自律」。Angela Duckworth 和 Martin Seligman 在 2005 年和 2006 年发表的实验报告引起了广泛关注(见《教育周刊》(Education Week)、《纽约时报》(New York Times)等),他们声称自律是预测学业是否成功的关键要素,而这一特质也解释了为什么样本中的女生比男生更容易取得学业成功。[45]
又一次的,当你细究时,这一结论的可疑之处就便慢慢浮现出来。首先,这项研究中的所有孩子都是一所精英磁石学校(elite magnet school)的八年级学生,这所学校的入学竞争激烈,因此尚不清楚这些发现能否推广到其他人群。另外,对自律的评估大多是通过学生们对自己的描述,或是他们的老师和父母对他们的评价,而非基于他们的实际行为。唯一对于实际行为的测试——让他们选择今天拿一美元还是一周后拿两美元——与其他衡量标准的相关性很弱,并且性别差异最小。
最能说明问题的是,自律的唯一有益效果是获得更高的成绩。例如,那些表示自己会先完成作业再做自己喜欢的事情的学生,将更有可能从老师那获得A级评价。假设我们发现,对老师说的每件事都点头微笑的学生获得了更高的成绩。这是否意味着我们应该教孩子们更多地点头和微笑,或者这是否应该让我们质疑「成绩作为一个单独评价指标」的重要性?又或者,假设发现「成年人的自律」与「主管的高评价」相关联。我们不得不得出结论,那些总是做老板想要的事情的员工,无论这些事情是否合情合理,都会从老板那里获得好评。但是这又如何呢?
我们已经论述,成绩作为一个评价标准,其可靠性与有效性都很低,而且被引导专注于成绩的学生往往对知识本身兴趣较低,更有可能以肤浅的方式思考(保留信息的时间较短),并倾向于选择尽可能简单的任务。[46] 此外,有一些证据表明,平均而言,成绩高的学生过于循规蹈矩,并不富有创造力。[47] 因此,更自律的学生获得更好的成绩,仅仅是那些不了解其荒诞之处的人的一厢情愿罢了。如果我说,在我们的文化中,女孩被社会教育要控制冲动,听话,这样她们就能够更好地吸收课程知识,获得高分。这真的是一件好事吗?
附注
-
Jack Block, Personality as an Affect-Processing System: Toward an Integrative Theory (Mahway, NJ: Erlbaum, 2002), pp. 195, 8-9. 或正如另一位心理学家所说:「一个人的缺乏自控,可能成为另一个人积极改变的动力。」(Laura A. King, “Who Is Regulating What and Why?”, Psychological Inquiry, vol. 7, 1996, p. 58)。
-
Christopher Peterson 和 Martin Seligman 在其著作 Character Strengths and Virtues(Oxford University Press, 2004)的第 515 页中写道:「我们相信,过度自控并无真正的不利之处。」June Tangney、Roy Baumeister 和 Angie Luzio Boone 也同样宣称:「自控力是有益的,且是以线性方式适应环境的。我们并没有发现任何证据表明存在心理问题与强自控力相关」(「强自控力意味着良好的适应性、较少的病理现象、更好的成绩和人际成功」,Journal of Personality,第 72 卷,2004 年,第 296 页)。这一结论是根据一组针对大学生的问卷得出的,最后发现其要么是虚假的,要么是曲解了的。首先,Tangney 及其同控制事发现自控与负面情绪之间存在反向关系,这一事实支持了他们的观点。然而,其他研究却发现,自控与积极情绪之间也存在反向关系。(例如,Darya L. Zabelina et al., “The Psychological Tradeoffs of Self-Control,” Personality and Individual Differences, vol. 43, 2007: 463-73.)即使高度自控的人并不总是不快乐,他们也不总是快乐;他们的情感生活总体上倾向于平淡。其次,Tangney 及其同事使用的自控问卷“包括反映适当控制和缺少控制的条目,但没有反映过度控制的。因此,该量表的相关性并未表明与高控制水平相关的不良后果”(Tera D. Letzring et al., “Ego-control and Ego-resiliency,” Journal of Research in Personality, vol. 39, 2005, p. 3)。换句话说,他们对自控的良好评价几乎是由研究设计预先决定的。在他们文章的最后,Tangney 等人承认,一些人可能会严格的过度控制自己,但作者们随即试图将这一问题定义为不存在:“这样过度控制的人可以说是缺乏控制自我的能力。”(第 314 页)。
-
第一句出自 Joseph F. Rogus, “Promoting Self-Discipline: A Comprehensive Approach,” Theory Into Practice, vol. 24, 1985, p. 271。第二句摘自伊利诺伊大学厄巴纳-香槟分校的课程、技术与教育改革项目网页 http://wik.ed.uiuc.edu/index.php/Self-Discipline。Rogus 的文章发表在该杂志的一期特刊上,该特刊专门讨论自律问题。尽管该期刊汇集了众多教育理论家的贡献,包括一些具有鲜明人文主义倾向的理论家,但其中没有人质疑自律的重要性。
-
Letzring et al., p. 3.
-
Scott J. Dickman, “Functional and Dysfunctional Impulsivity,” Journal of Personality and Social Psychology, vol. 58, 1990, p. 95.
-
Zabelina et al.
-
Daniel A. Weinberger and Gary E. Schwartz, “Distress and Restraint as Superordinate Dimensions of Self-Reported Adjustment,” Journal of Personality, vol. 58, 1990: 381-417.
-
David C. Funder, “On the Pros and Cons of Delay of Gratification,” Psychological Inquiry, vol. 9, 1998, p. 211. 他所提及的研究分别是 Jonathan Shedler and Jack Block, “Adolescent Drug Use and Psychological Health,” American Psychologist, vol. 45, 1990: 612-30 和 Jack H. Block, Per E. Gjerde, and Jeanne H. Block, “Personality Antecedents of Depressive Tendencies in 18-year-olds,” Journal of Personality and Social Psychology, vol. 60, 1991: 726-38.
-
例如,可参阅 Christine Halse, Anne Honey, and Desiree Boughtwood, “The Paradox of Virtue: (Re)thinking Deviance, Anorexia, and Schooling,” Gender and Education, vol. 19, 2007: 219–235.
-
这或许可以解释为什么数据普遍显示布置家庭作业(大多数学生都厌恶的家庭作业)对学业没有任何益处,尤其是在小学和初中。(参见 Alfie Kohn,《家庭作业的谬误》 [Cambridge, MA: Da Capo Press, 2006],以及 2006 年 9 月出版的 Kappan 上根据该书撰写的文章。值得注意的是,大多数人都认为学生会从他们迫不及待要完成的作业中获益,他们的态度似乎和目标与结果无关。
-
David Shapiro, Neurotic Styles (New York: Basic, 1965), p. 34.
-
同上, p. 44.
-
Funder, p. 211.
-
关于「一些过度受控的人格偶尔会表现出抑制」,见 Block,第 187 页。
-
Janet Polivy, “The Effects of Behavioral Inhibition,” Psychological Inquiry, vol. 9, 1998, p. 183. 她补充:「这并不意味着一个人永远都不应该抑制自己的自然反应,比如让人想要伤害他人的愤怒,或者令人犯烟瘾的香烟」(同上)。相反,这意味着在每种情况下都应该权衡抑制的利弊,这是一种温和的立场,与我们社会那普遍倡导全面自律的倾向形成鲜明对比。
-
Funder, p. 211. 所谓「棉花糖」实验(参见补充报道)的执行者 Walter Mischel 这样说道:无法延迟满足可能是一个问题,但是「另一个极端——过度延迟满足——也有其代价,并且可能是不利的……在任何特定的选择中,是否应该延迟满足或「锻炼意志」往往并不是显而易见的」(“From Good Intentions to Willpower,” in The Psychology of Action: Linking Cognition and Motivation to Behavior, ed. by Peter M. Gollwitzer and John A. Bargh [New York: Guilford, 1996], p. 198)。
-
参见 King, op. cit.; and Alina Tugend, “Winners Never Quit? Well, Yes, They Do,” New York Times, August 16, 2008, p. B5,对心理学家 Angela Duckworth 及其同事对「毅力」的毫无保留的支持提出了质疑。Angela Duckworth 和她的同事提出:「作为教育者和父母,我们不仅应该鼓励孩子努力工作,更应该鼓励他们绝不放弃」她们在报告中指出,坚持不懈的毅力有助于在拼字比赛中表现取得更好的成绩(Angela L. Duckworth et al., “Grit: Perseverance and Passion for Long-Term Goals,” Journal of Personality and Social Psychology, vol. 92, 2007; quotation on p. 1100)。但是,这种统计上的关联大多指出了这些结果测量的局限性,以及毅力本身的局限性。「毅力 」这一概念忽略了动机因素(即人们为什么而坚持不懈),从而将对任务的真正热情与急于证明自己的能力、无法适时改变方向等混为一谈。
-
Block, p. 130.
-
例如,参见我的书 《奖励的惩罚》, rev. ed. (Boston: Houghton Mifflin, 1999); 以及 Edward L. Deci et al., “A Meta-Analytic Review of Experiments Examining the Effects of Extrinsic Rewards on Intrinsic Motivation,” Psychological Bulletin, vol. 125, 1999: 627-68.
-
Richard M. Ryan, Scott Rigby, and Kristi King 在 Journal of Personality and Social Psychology, vol. 65, 1993, p. 587. Ryan, Deci, Robert J. Vallerand, James P. Connell, Richard Koestner, Luc Pelletier 等人在许多其他论文中对这一基本区分进行了阐释和完善。最近,这一观点被用来回应 Roy Baumeister 的说法,即自控能力「像肌肉一样」,需要能量并且容易耗尽——如果你抵抗了一种诱惑,至少在暂时得,你抵抗其他诱惑的能力会减弱。这一理论的问题在于,它未能区分「自我调节(即自主调节)」和「自我控制(即受控调节)」。尽管后者确实可能导致「自我耗竭」(ego depletion),但前者实际上「维持或增强了活力」(Richard M. Ryan and Edward L. Deci, “From Ego Depletion to Vitality,” Social and Personality Psychology Compass, vol. 2, 2008, pp. 709, 711)。
-
可应要求提供参考资料。
-
例如,参见 Richard M. Ryan, James P. Connell, and Edward L. Deci, “A Motivational Analysis of Self-determination and Self-regulation in Education,” in Research on Motivation in Education, vol. 2, ed. by Carole Ames and Russell Ames (Orlando, FL: Academic Press, 1985); 和 Richard M. Ryan and Jerome Stiller, “The Social Contexts of Internalization: Parent and Teacher Influences on Autonomy, Motivation, and Learning,” Advances in Motivation and Achievement, vol. 7, 1991: 115-49. 引文摘自后者, p. 143.
-
David Brooks, “The Art of Growing Up,” New York Times, June 6, 2008, p. A23.
-
参见 Alfie Kohn, “How Not to Teach Values: A Critical Look at Character Education,” Phi Delta Kappan, February 1997: 429-39.
-
一位教育者在为自律的必要性辩护时,引用了「我们的自私天性可能会把我们引向『相互战争的状态』」——仿佛 Thomas Hobbes 对人类的悲观看法被普遍接受似的。随后,他惊人地声称「社会阶级差异似乎主要是延迟满足能力的函数」,并建议我们「将较低社会阶层与可能提供自律榜样的中产阶级联系起来」(Louis Goldman, “Mind, Character, and the Deferral of Gratification,” Educational Forum, vol. 60, 1996, pp. 136, 137, 139)。请注意,这篇文章发表于 1996 年,而不是 1896 年。
-
无论内化或自律在多大程度上是被需要的,这种更温和的方法——特别是支持儿童的自主性和尽量减少成人的控制——一直被证明是更有效的。(我在《无条件养育》[New York: Atria, 2005]中总结了一些对其的论述,集中在第 3 章。)具有讽刺意味的是,许多为自我控制的价值辩护的传统主义者同时也在提倡一种更为专制的教育方式。总而言之,我在这里的核心观点是,我们需要重新考虑的是目标,而不仅仅是方法。
-
「几十年来,甚至几个世纪以来,老一代人一直抱怨年轻一代缺乏自制力。老一辈的维京人抱怨年轻一代越来越软弱,不再像过去那样尽心尽力地奸淫掳掠」(C. Peter Herman, “Thoughts of a Veteran of Self-Regulation Failure,” Psychological Inquiry, vol. 7, 1996, p. 46)。例如,下面这段文字被广泛认为是古希腊诗人 Hesiod 所作:「当我年轻的时候,我们被教导要谨慎并尊重长辈,但现在的年轻人却极其[不尊重]和不克制」。同样,1894 年,在哈佛大学引入字母等级制后不久,分数的膨胀也遭到了谴责,这是所谓的标准降低的另一种表现形式。
-
George Lakoff, Moral Politics: How Liberals and Conservatives Think, 2nd ed. (Chicago: University of Chicago Press, 2002).
-
关于服从与自控之间的关系的讨论,见 Block, esp. pp. 195-96.
-
我想到了 Roy Baumeister 和他的合作者 June Tangney,以及 Martin Seligman 和 Angela Duckworth,还有犯罪学家 Michael R. Gottfredson 和 Travis Hirschi,他们认为犯罪仅仅是因为罪犯缺乏自控力。(关于对这一理论的批判,请参见 Gilbert Geis 的论文以及 Out of Control: Assessing the General Theory of Crime, edited by Erich Goode [Stanford, CA: Stanford University Press, 2008] 一书中的章节。)
-
我曾在一篇关于学术造假的文章中讨论过 「基本归因错误」,学术造假通常被认为是一种道德败坏的反映(通常被归因于缺乏自控能力),尽管研究人员发现作弊是对某些教育环境的一种可预见的反应。见 “Who’s Cheating Whom?”, Phi Delta Kappan, October 2007: 89-97.
-
Per-Olof H. Wikström and Kyle Treiber, “The Role of Self-Control in Crime Causation,” European Journal of Criminology, vol. 4, 2007, pp. 243, 251. 关于延迟满足的内容,见 Walter Mischel et al., “Cognitive and Attentional Mechanisms in Delay of Gratification,” Journal of Personality and Social Psychology, vol. 21, 1972: 204-18.
-
例如,见 CBS News, “Meet ‘Generation Plastic,’” May 17, 2007, available at www.cbsnews.com/stories/2007/05/17/eveningnews/main2821916.shtml.
-
参见 Heather Rogers, Gone Tomorrow: The Hidden Life of Garbage (New York: New Press, 2005). [**附录 2020:**另一个例子:「『个人碳足迹』的概念是由 英国石油公司在 2005 年的一次耗资超过 1 亿美元的媒体宣传活动中推广的。研究表明,这次宣传活动将气候变化的责任从公司转移到了个人消费者身上。」参见 Meehan Crist, “What the Pandemic Means for Climate Change,” New York Times, March 29, 2020, p. 4-SR.]
-
见 Alfie Kohn, “Students Don’t ‘Work,’ They Learn: Our Use of Workplace Metaphors May Compromise the Essence of Schooling,” Education Week, September 3, 1997: 60, 43.
-
Samuel Bowles and Herbert Gintis, Schooling in Capitalist America (New York: Basic, 1976), p. 39. 或许不应感到惊讶的是,保守派的《National Review》发表了一篇强烈支持家庭作业的文章,理由是它教导了「个人责任感和自律」。家庭作业是在为生活做准备(John D. Gartner, “Training for Life,” January 22, 2001)。但究竟是生活的哪一方面呢?显然,重点不是培养孩子做出有意义的决策,或成为民主社会的一员,或学会批判性思考。相反,其所提倡的是让孩子学会服从命令的课程。
-
例如,见 David Brooks, “Marshmallows and Public Policy,” New York Times, May 7, 2006, p. A13.
-
Mischel, p. 212.
-
在延迟满足的研究中,至少是在那些旨在通过等待以获得更大奖励的研究中,有一个 「惊人一致的发现」,那就是 「大多数儿童和青少年都能够做到延迟满足」。在其中一次实验中,「104 名受试者中有 83 人选择了延迟满足」(David C. Funder and Jack Block, “The Role of Ego-Control, Ego-Resiliency, and IQ in Delay of Gratification in Adolescence,” Journal of Personality and Social Psychology, vol. 57, 1989, p. 1048)。这说明,要么是那些对当代年轻人的享乐主义的抱怨夸大其词,要么是这些关于自我控制的研究的实验环境都太过理想化,以至于其所有的研究结果与现实世界都产生了脱节。
-
Mischel, p. 209.
-
同上,p. 212. 另见 Walter Mischel, Yuichi Shoda, and Philip K. Peake, “The Nature of Adolescent Competencies Predicted by Preschool Delay of Gratification,” Journal of Personality and Social Psychology, vol. 54, 1988, p. 694.
-
Mischel, p. 211.
-
同上, p. 214. 考虑到其他作家都将自律和智力视为截然不同的两个特征,这一发现颇为有趣。(参见下文注释 45 中第一篇文章的标题。)
-
Yuichi Shoda, Walter Mischel, and Philip K. Peake, “Predicting Adolescent Cognitive and Self-Regulatory Competencies from Preschool Delay of Gratification,” Developmental Psychology, vol. 26, 1990, p. 985. 他们补充道,忍受诱惑以待延迟满足的能力本身难能可贵,但这当然不等于认同自我控制本身是有益的。
-
Angela L. Duckworth and Martin E. P. Seligman, “Self-Discipline Outdoes IQ in Predicting Academic Performance of Adolescents,” Psychological Science, vol. 16, 2005: 939-44; 以及 Angela Lee Duckworth and Martin E. P. Seligman, “Self-Discipline Gives Girls the Edge,” Journal of Educational Psychology, vol. 98, 2006: 198-208.
-
我在 《奖励的惩罚》 (Boston: Houghton Mifflin, 1993) 和 The Schools Our Children Deserve (Boston: Houghton Mifflin, 1999) 中收集了有关成绩的证据。
-
考虑到 Duckworth 和 Seligman 为证明自律可以预测学业表现(即高分)所引用的一项研究。该研究发现,细节与学术游戏规则对学习成绩的影响,与智力和天分一样密切。成绩优秀的学生「对思想或文化、审美追求并不特别感兴趣。此外,他们也不特别宽容或富有同情心;不过他们确实显得稳重稳定、务实、任务导向,并且与社会规则和惯例和谐相处。最后,相比于一般学生,这些优秀的学生显得有些古板和缺乏创意」(Robert Hogan and Daniel S. Weiss, “Personality Correlates of Superior Academic Achievement,” Journal of Counseling Psychology, vol. 21, 1974, p. 148)。
为什么最好的老师不安排考试
原文:Why the Best Teachers Don't Give Tests (##) - Alfie Kohn
作者:Alfie Kohn
坦白说,许多教育工作者自相矛盾的态度令我不解。一方面,他们强烈反对标准化考试;另一方面,他们却对与考试如出一辙的做法听之任之。
首先,请看那些与考试挂钩课程标准——巨细靡遗、事无巨细地规定教学内容的条目清单。这些标准无一例外地体现了标准化考试的特点:自上而下的控制,「一刀切」的做法。然而,从「问责制」教育改革伊始,到如今盖茨基金会力推覆盖全美的共同核心标准,许多人对统一的课程标准(乃至将教育标准化的整个理念)不置一词,却对推行这些标准的考试皱起眉头。[1]
第二个例子:精心设计、用以评判学生成绩的评分标准是另一种形式的标准化评估,但它很少被认为是标准化评估。这种方法旨在将写作等复杂事物分解成各个部分,以便老师,有时还有学生本人,能够对每个部分进行评分。其合理性的前提是不管谁来评分,面对同一份卷子,都得出相同的分数。评分标准的诞生源于量化的要求和简化的冲动,Maja Wilson 认为,量化和简化带来的后果之一是「评分标准的标准化导致了学生的模板化」。[2]然而,令人惊讶的是,许多对标准化考试深恶痛绝的老师,却对这种悄然而至的标准化熟视无睹。一些人坚称,只要使用一个优质的评分标准,就不存在问题,尽管大量事实证明并非如此。
不过,我最想说的是第三个例子:当老师对学生进行测试(test)时,每个班级的测试细节都不尽相同,这意味着这些评估从根本上讲就不是标准化的,不能用来比较不同学校或不同州的学生。但它们依然是测试,因此不可避免地有局限性,并同时局限了学生。
就像面对评分标准(和分数)一样,许多人的第一反应就是,我们只需要更好的考试,或者只需要修改实施考试的方式(例如,允许学生重考)。不可否认,有些考试确实比其他考试更烂。多选题测试作为评估方式存在独特的缺陷,其原因与多选题标准化测试如出一辙: 试题刻意设置陷阱,引诱理解相关概念的学生选错答案,同时也剥夺了学生自主作答乃至解释答案的机会。尽管多选题考试可以灵活命题,但正如印第安纳大学的考试设计专家 Roger Farr 最终得出的结论一样,「任何多选题都无法让学生展示他们能用所学知识做些什么」。
我们也不得不承认,在给学生考试的种种缘由中,有些理由比其他理由更值得商榷。利用考试来发现哪些学生需要帮助——或者,让一些思虑更周全的老师审视自己教学中可能存在的问题,与利用考试来要求学生集中注意力、完成作业,这两者之间是有区别的。在后一种情况下,考试被用作迫使学生去做他们不感兴趣的事情的手段。对于一些老师而言,与其解决教学内容或方式中可能存在的缺陷(比如在决定学习内容时忽视了学生的参与),不如只提醒学生考试即将来临——甚至为了更明目张胆地行使权力,搞突击测试——就能让学生乖乖听话。
不管考试是如何设计的,或者出题人的动机如何,有一点是明确的:这些评估工具往往更侧重于衡量塞入学生短期记忆的零散知识点的数量,而非评估他们对知识的真正理解。[3] 考试,包括那些涉及论文的考试,都是传统教学模式的一部分。在这种教学模式中,知识(通过讲课和教科书)传递给学生,以便学生日后根据指令再吐出来反刍。让人感到不解的是,一些老师声称自己采用以学生为中心的教学法,提倡积极、互动的学习方式,但在评估学生时,却仍然高度依赖考试这一单一手段。(有些人甚至混淆了「评估」和「考试」的概念,在他们看来,评估就等同于考试,没有其他可能性。)
虽然有些试题可能需要学生运用解决问题的技能,但考试本身只是一种脱离实际的纸笔测验,只能衡量学生记忆了多少知识,以及他们应试的技能有多高。正因如此,一个头脑灵活的学生可能会在考试中得分很低。当考试由 Pearson 或 ETS 这样的机构命题时,大多数老师可以毫不犹豫地指出班上有哪几个学生符合这种情况。然而,他们可能没有意识到,同样的问题也存在于他们自己出题的考试中。
然而,考试不仅只评估最无关紧要的智力能力,还可能扭曲学生的学习目标和方式。你越是把注意力集中在为了应付考试必须掌握的知识上,你就越难以沉浸于故事情节之中,或者全身心地投入项目设计和实验探索之中。而且,如果考试过于频繁,哪怕只是常常提及,都足以窒碍学生的求知热情。应试学习与纯粹为了求知而学习有着本质的区别。[4]
多年前,芝加哥大学的著名教育家 Philip Jackson 采访了 50 名公认杰出的老师。他发现,这些老师普遍不重视考试,有些甚至有意识地尽量减少考试。[5] 我认为,这主要有两个原因。首先,优秀的教育工作者深知考试并非特别有效的评估方式。其次,这些老师在教学生涯中都意识到,他们不需要考试。设计精妙的课堂和课程能帮助老师全面深入地了解学生对知识的领悟。当学生投入到富有意义的主动学习中时(例如开展长时间跨学科的项目),老师通过观察和倾听学生在计划与实施项目过程中的表现,可以持续获得并积极解读源源不断的信息,了解每个学生能够做什么,在哪些方面需要帮助。在学习过程结束后,再给学生额外安排一场考试就显得有些多余了。我们甚至可以断言,老师越倾向于用考试来衡量学生的进步,就越能说明教学中存在某些问题——可能是老师对学生的非正式观察和了解还不够深入,可能是教学任务设计的质量有待提高,也可能是整个学习模式有待改进。例如,如果老师偏爱直接教学法,那么他们可能很难真正洞察学生内心的想法。这自然会导致他们得出结论,认为「有必要」通过考试来评估学生表现。[6]
Assessment (评估)一词的字面意思是「坐在一旁」,这正是我们最富有洞见的教育者所提倡的做法。Yetta Goodman 创造了「kidwatching」这个复合词,用来表示与每个孩子一起阅读,以评估他或她的能力。Marilyn Burns 坚信,与学生面对面交流,比起考试更能帮助我们深入了解他们对数学的理解程度——因为误解的原因是千奇百怪的。当然,这里的前提是我们真正关注的是孩子对知识的理解能力,而不仅仅是他们的语音意识水平或应用算法的能力。一个人的教育目标越没志气,就越有可能满足于仅靠考试来评估学生——同样,也就越倾向于将 testing(考试)」和 assessing(评估)这两个词混为一谈。
可靠的评估形式比比皆是:作品集(portfolios)、毕业设计(culminating projects)、表现评估(performance assessments),以及已故的 Ted Sizer 提出的「精通的展示(exhibitions of mastery)」:让学生有机会展示他们的精通程度,并非按要求回忆事实,而是通过实际行动:设计并进行一个实验(并解释实验结果),用外语制作一份餐厅菜单,把一个故事改编成短剧。换句话说,如果想在学习后而非学习中进行评估,考试仍然不是必需品,也不见得特别有用。考试不必用于「终结性」评估,更不必用于 「形成性」评估。
我们中的许多人反对标准化测试,不仅出于考试的有害用途,还因为考试是强加于人的。更令人不安的是,我们自己出的考试也可能造成伤害。幸好,我们有比考试好得多的选择。
附注
-
请参阅我 2001 年 9 月 26 日发表在《教育周刊》上的文章《标准化考试的「标准」同样值得警惕》。在加拿大,这种现象尤为普遍。加拿大的教育体系是完全分权的,每个省都控制着自己的政策。尽管各省之间的考试数量有很大差异,但所有省份都有非常具体的分年级课程,每位老师必须照此执行。即使在一些公开反对考试的省份,人们也鲜有对这种高度控制和老师自主权被削弱提出异议。
-
Maja Wilson, Rethinking Rubrics in Writing Assessment (Heinemann, 2006), p. 39.
-
近来,一系列引起大众媒体高度关注的研究表明,频繁测试(包括自测)比其他学习形式更为有效。但这些研究的评估标准几乎都局限于在后续测试中能正确回忆事实的数量。这些实验非但没有为传统评估提供有力证据,实际上还揭示了研究人员和记者常用的「学习」和「成绩」等词汇,往往只意味着成功地、大概也是暂时地记住事实的过程。这篇文章深入剖析了其中一项研究。
-
最近,我在 Twitter 上指出,对考试的预期会分散学生的注意力,使他们无法专注于思考。结果这条推文被转发 400 多次。如此高的转发量令我怀疑自己的观点是否被误解了。我随后澄清,所有测试都会产生这种影响,而非仅限于标准化测试。转发量随即下降了 90%。
-
Philip W. Jackson, Life in Classrooms (Teachers College Press, 1968/1990).
-
Frank Smith 曾写道:「如果一名老师不通过考试就无法判断学生是否真的学到了东西,那他就不该继续在课堂上任教。」我明白他想表达的意思,但觉得说得有点苛刻。老师需要相应的帮助,以学会在不借助考试的情况下评估学生。他们需要得到支持和鼓励,才能摒弃那些多数同行仍在使用、管理者、家长和学生自己也普遍期待的做法。何况,在评估学生的学习成效时,障碍往往不在老师个人,而在于学校的结构性问题,比如班级人数过多、课时太短等。对此,我们应该群策群力,致力于改变这些有问题的政策,而非继续依赖考试。
认知学徒制
原文:Cognitive apprenticeship (andymatuschak.org)
这个概念在 80 年代末由 Allan Collins、John Seely Brown 和 Susan Newman 提出的。他们受到情境学习的启发,提议将学徒制的技巧应用到认知领域(如数学、阅读、写作),来解决迁移学习的问题,并帮助学生掌握实际操作中的默会知识。
他们提出了三个核心要素:
-
示范(观察大师执行某个目标任务,理想情况下是在外化他们的思考过程时)
-
认知脚手架(学生尝试执行任务,逐渐撤掉多余的帮助)
-
辅导(随着学生逐渐独立,大师会观察并给予指导和反馈)
在诸如数学之类的认知领域,很多「行动」都发生在内部。这与传统的学徒制领域,如裁缝或制鞋不同,因此需要进行适当调整,比如明确地分析流程、进行反思讨论等——这些做法也体现了《反思型从业者》 - Donald Schön中的观点。
与 Lave 和 Wenger 提出的情境学习不同,这些作者认为学徒制应该在教育环境中进行,而不是真实的实践共同体中。事实上,为了促进迁移学习,他们建议我们应该有意地将知识抽象并脱离具体情境,这样更容易将其应用到不同的环境中。
这些论文中有一个我特别喜欢的概念,那就是「抽象回放」。教师和学生都可以制作抽象回放,用来进行有趣的比较讨论。这是试图(人为?)示范并创建一个专家实践微型文化的一部分。
{抽象回放}:{回顾行动,旨在聚焦关键的决策或行为}
在实际应用中,我并不太相信大多数以认知学徒制为灵感的教学设计案例。不过,Schoenfeld 在 1983 年和 1985 年的研究是个例外,他有意地模拟解决一些他本人也不确定如何解决的难题,并示范了一些好的数学问题解决思路(我在做什么,为什么要这么做,这样做有什么帮助)。
这个术语到了 90 年代末基本上已经从学术文献中消失了,不过我发现很多相关的思想被融入到了美国数学教师协会的数学讨论实践中。原本作者们想把这些理念应用到智能辅导系统里,但这看起来难度很大。
抛锚式教学是一个与之相关的同期概念。它与情境学习中的社会学理念关系不大,更多的是将教师定位为引导者而非示范者。
问题
- 到底是什么失败了?为什么教学设计师现在几乎不提这个了?
问:认知学徒制的三大核心要素是什么?
答:示范、脚手架、辅导
参考文献
Collins, A., Brown, J. S., & Newman, S. E. (1987). Cognitive apprenticeship: Teaching the crafts of reading, writing, and mathematics. Xerox Palo Alto Research Center.
Collins, A., Brown, J. S., & Holum, A. (1991). Cognitive apprenticeship: Making thinking visible. American Educator, 15(3), 6–11. http://www.psy.lmu.de/isls-naples/intro/all-webinars/collins/cognitive-apprenticeship.pdf
Kirschner, P. A., & Hendrick, C. (2020). “Cognitive Apprenticeship” Revisited. American Educator, 44(3), 37. https://eric.ed.gov/?id=EJ1272730
认知脚手架
原文:Cognitive scaffolding (andymatuschak.org)
思考或者实践的内容很新,或者很有挑战性时,构想出哪怕最小的一步也是十分困难的,而这常导致失败。在这种情况下,最好引入一个搭有认知脚手架的环境,从而卸下部分认知负荷,使事情得以继续下去。随着行动者能力提升,脚手架可以由他自己或是由他的环境逐步移除。脚手架是临时性的,所以它是增强认知的机制的一个子集。
脚手架通常是特意制作的。有时候也能找到天然的脚手架:比如一系列越来越深的潮池也许是学习游泳的绝佳自然环境。
自创的脚手架可能是静态的,也可能是动态的。书籍通常包括静态的支架,如叙事(叙事充当认知脚手架)或约束(约束充当认知脚手架)。静态的参与性环境(如工作手册或 DIY 杂志)也可能包括精心设计的一系列活动(细粒度任务列表充当认知脚手架)。
动态的脚手架更为强大,因为这些脚手架主观能动,并能回应学习者。优秀的教师在课堂上创设的学习环境,便具备高度动态的认知脚手架支持——这种支持有时几乎是润物细无声的,只是略微调整对话的走向,就能提供明显的支持,又能随着学习者成长缓缓撤走。
一种常见的动态脚手架就是能随着行为者行动不断调整的静态脚手架。在这一点上,动态脚手架是静态脚手架的超集。
一个特别重要的动态支架类型是元认知支持。在媒体形式中,游戏在支持元认知方面特别有效。参见元认知支持充当认知脚手架和元认知支持需要动态的,参与性的环境。
概念抓手,来自亚历山大
原文:Concept handles, after Alexander (andymatuschak.org)
「概念抓手」是令人难忘的名词短语,代表一个内涵复杂(通常是抽象的)的主题。比如「囚徒困境」、「奥弗顿之窗」、「信仰的信仰 」等等。在我自己的写作中,例子包括赋能环境,情景体验,等等。「概念抓手」是自己的一个概念抓手,由 Scott Alexander 创造的。
成功的概念抓手让模糊的想法更清晰。很多人对这些想法有些大概的理解,但没办法指明,更不要说讨论了。给这种模糊的概念起一个清晰、响亮的名字,能够开启了更多对话与思想的可能。Per Alexander:
我不大可能会发现那种没人想到过的全新社会现象。但是有很多事情人们都有模糊不清的想法,他们不能完全用语言表达出来。但将这些想法转变为他们可以掌握的、并能与他人讨论的、水晶般清晰的想法是一件大事。
如果你发现了一些有趣的东西,并非常简短地把它塞进别人的脑子里,不要浪费这个机会!给它一个漂亮的概念抓手,让他们记住它,并能用它来解决其他问题。
可以把概念抓手想成「概念的 API」。在这个意义上,概念抓手便能联系起我的想法:常青笔记的标题就像 API。
问:举一个概念抓手的例子?
答:(囚徒困境,情景体验,等等。)
问:从网络化智能的角度解释为什么概念抓手很重要?
答:人们得以围绕以往模糊不清的想法协调讨论。
参考文献
https://slatestarcodex.com/2016/02/20/writing-advice/
刻意练习,来自 Ericsson
原文:Deliberate practice, after Ericsson (andymatuschak.org)
::TODO in inbox::
「刻意练习」(Ericsson et al, 1993)描述如下:
-
需要大量努力,高积极性的活动…
-
…以提高表现为具体目标
-
… 为目标精心设计(并持续更新)
-
刻意练习不总是令人愉悦;它在提高表现上有用,但本质上却非激励。
-
因为刻意练习需要高强度的努力,学生每日只能练习一定的时间,并且需要定期彻底地恢复精力。
-
(反馈)对学生而言是清晰的:他们必须能够看见自己的进步。
-
刻意练习提升能力:「刻意训练基本上意味着培养或者提升最近习得的技能,方法是专注在这些技能的特定方面上并且专门去改进它们;一段时间之后,循序渐进的进步最终会带来专家级的表现。」(Eticsson and Pool,2016,p.100)
参考文献
Ericsson, K. A., Krampe, R. T., & Tesch-Römer, C. (1993). The role of deliberate practice in the acquisition of expert performance. Psychological Review, 100(3), 363. Ericsson et al - The Role of Deliberate Practice in the Acquisition of Expert Performance
Ericsson, A., & Pool, R. (2016). Peak: Secrets from the New Science of Expertise (1 edition). Eamon Dolan/Houghton Mifflin Harcourt. Peak - Ericsson and Pool
Bjork :「上帝啊,这个困难正合我意」—— 合意困难
原文:Desirable difficulties, after Bjork (andymatuschak.org)
培训中如果刻意引入困难,效果往往更加显著。
下列实验是 Robert A. Bjork(1994年) 所举的例子,来说明合意困难提升长期表现:
-
将性质不同的任务混合在一起,而不是按任务类型给任务分组
-
改变任务的参数
-
改变学习课程的环境背景
-
创造「环境干扰」,提高所需注意力:比如让一些提供的资源在组织结构上有所不同
-
减少反馈频率(例如,每隔 N 次实验提供一次汇总的反馈,或者逐渐降低反馈的频率)。
这些措施有相同的意图,即降低训练时的表现,但提升长期结果。此类效果有悖于一般思路,因此设计学习活动时很难采取这些措施,因为学习者会感觉学习效果变差了。比如 (还是 Bjork, 1994):
随着时间的推移,这样的调节过程让教练转向提高正确率的操作——从而使受训者轻松不少。当然,这样做会使教练远离上一节所总结的那些合意困难。
更糟糕的是存在制度性障碍的可能性:对教练的评价可能是基于当下(而非长期)的表现的;或者他们根本没有机会观察到长期的表现。
除了这种短期的悖论,学生可能会主动避免「合意困难」,因为他们认为自己的记忆/理解比实际情况要强。Bjork 认为,「培训经常是非最佳的,因为在实际工作中,学习者会遇到很多变体情况,很多延迟,很多不确定性,而训练无法考虑到这些挑战。」(参见迁移学习)。
问:增加难度对训练任务的表现有什么反直觉的影响?
答:基本上训练中表现会变差,但是长期看来表现更优秀
问:为什么学习者可能认为在练习过程中引入困难后,他们学习效果会变差?
答:增加困难往往会损害练习期间的表现(但同时提高长期表现)。
问:为什么现有制度不鼓励教练员在练习中加入合意困难?
答:对他们的评估可能是基于学生的短期表现。
问:为什么教练通常无法意识到在训练中增加困难的长期作用?
答:因为训练时间太短,从而无法意识到更困难的练习可能带来的改进。另外,他们可能从未看到他们的学生在现实世界中的表现。
参考文献
Bjork, R. A. (1994). Memory and Metamemory Considerations in the Training of Human Beings. In J. Metcalfe & A. Shimamura (Eds.), Metacognition: Knowing about Knowing (pp. 185–205). MIT Press.
反向链接
-
- 采用提取练习后,尽管学生在练习过程中的成功率降低了,但相比单纯通过重复阅读学习材料,练习得到的长期记忆更加持久 (Roediger, 2006)。相关文章:合意困难(术语来自 Bjork)。
-
- 每复习一次,稳定性随之而增加,因此每次复习之后,可提取性下降得更慢(见间隔效应)。当可提取性较低时,提取似乎会更多地增加稳定性:也就是说,较难获得的记忆通过提取得到更多强化(另见 Bjork 提出的合意困难)。Supermemo 试图用指数曲线来描述这种关系,但 Supermemo 使用的模型太过复杂,我不得不对其持怀疑态度。
-
- 相关的:合意困难,来自 Bjork
-
- 8:49:在写合意困难,来自 Bjork
-
- 作者希望找到依据,用以区分三个可能加以运用的框架:合意困难,来自 Bjork,适合迁移的加工,和「事实知识的基础」(即顺序主义的布卢姆分类学)。
-
[[Kang, S. H. K., McDermott, K. B., & Roediger, H. L. (2007). Test format and corrective feedback modify the effect of testing on long-term retention. European Journal of Cognitive Psychology, 19(4–5), 528–558. https://doi.org/10.1080/09541440601056620]]
* 也许最佳的学习形式与提取的努力有关(合意困难,来自 Bjork)?简答题所涉及的额外努力是提高记忆表现的原因吗?数据似乎表明了这种解释,因为通过简答题的学习在任何一种事后测试中都能产生最可靠的保留。
-
[[Roediger, H. L., & Karpicke, J. D. (2006). The Power of Testing Memory: Basic Research and Implications for Educational Practice. Perspectives on Psychological Science, 1(3), 181–210. https://doi.org/10.1111/j.1745-6916.2006.00012.x]]
* 各种实验表明,增加提取的努力能够增强知识的后续存留;这表明提取过程本身在测试效应中起作用。另见合意困难,来自 Bjork。
-
[[Slamecka, N. J., & Graf, P. (1978). The generation effect: Delineation of a phenomenon. Journal of Experimental Psychology: Human Learning & Memory, 4(6), 592–604. https://doi.org/10.1037/0278-7393.4.6.592]]
* 在讨论中,作者指出,这种好处不能仅仅归因于加工深度的论据(例如合意困难,来自 Bjork),因为韵律规则表现出的效果并不比其他复杂得多的规则差。
排遣行为
原文:Displacement activity (andymatuschak.org)
排遣行为,顾名思义,是人类(和动物)的一种自我安慰活动。当他们被打了鸡血,驱使自己去执行多种行为时,或者当他们不能、不确定如何做事时,他们可能会表现出这种行为。这种行为也与压力和焦虑有关。
例如,在不知怎么选的时候人会挠头;再比如,人面临某些烧脑的工作时会感到焦虑,并且一边焦虑、一边刷微博或者回复紧急邮件:另请参阅用别人的想法填满闲暇时间是一种文化习惯,人们更喜欢行动而不是思考。而动物在类似情况下,往往会进行梳理、整理羽毛或搔抓。
问:动物在什么情况下会表现出排遣行为?
答:当感到压力或者焦虑时;当感到无法确定地着手做某事,或者对它内耗时。
问:知识工作者的排遣行为会是怎样的?
答:做很多紧急但不重要的任务,而不是高度不确定但重要的 TODO。
教育游戏
原文:Educational game (andymatuschak.org)
教育游戏是创制体验,借助参与式环境传达知识或价值观,一般通过情感与审美动力来驱动行为,而非通过外显的学习目标。核心设计机制:教育游戏试图通过情景体验进行教学。
精细编码
原文:Elaborative encoding (andymatuschak.org)
「精细编码」描述了将知识与现有记忆或经历建立联系的过程。一般认为,建立这样的联系有助于回忆,特别是与十分独特或有情感连接的目标建立联系时。
精细编码最常用于助记法:记忆数字时,将数字与名人、地点、气味等事物建立联系。
一些间隔重复记忆系统的用户会特意写出卡片,以促进精细编码。Karpicke 和 Smith 的实验(2012)表明,与只进行提取练习相比,这样做的好处并不大。相关文章: 提取练习似乎是一种比精细编码更有效的学习活动。
参考文献
//doi.org/10.1016/j.jml.2012.02.004
反向链接
-
- 强迫自己在笔记之间添加大量链接,我们便能打开视野,围绕眼下关心的问题,考虑还有些概念能与其关联。添加链接的行为施加了一种压力,促使我们仔细思考各个概念如何联系彼此(见理解概念需与其尽力较量和常青笔记应该面向概念),同时也实现了精细编码,使我们更深入地内化这些想法。
-
- 总体而言,与只基于精细编码的练习相比,测试效应似乎还能带来更持久的记忆 (Karpicke and Smith, 2012),并改善学习表现 (Karpicke and Blunt, 2011)。
-
- 当一张卡片不能用上这种启发式方法时,它通常是在编码作者特定的解释、框架、例子、措辞等。这通常很有帮助,特别是作为一种精细编码或培养情感兴趣的一种方式。但它也可能产生偏狭的理解。在使用共享卡片或助记媒介的情况下,这种卡片会产生令人沮丧的假阴性,因为它们要求读者学习卡片作者如何呈现材料:助记媒介的读者有时会因作者的用词而感到受阻。
-
- 这部分内容是关于精细编码。
-
[[Karpicke, J. D., & Smith, M. A. (2012). Separate mnemonic effects of retrieval practice and elaborative encoding. Journal of Memory and Language, 67(1), 17–29.
https://doi.org/10.1016/j.jml.2012.02.004]]
* *测试效应是由精细编码产生的吗?当你在间隔重复记忆系统中复习卡片时,你给自己一个机会,根据你当前的上下文和复习过程中产生的不同想法形成新的联系。
赋能环境
原文:Enabling environment (andymatuschak.org)
赋能环境极大地扩展了其参与者的能力,使他们能够做他们认为有意义和重要的事情。
表面上学校应追求这一目的,但教育计划往往会自我颠覆,很大程度上是因为赋能环境的活动直接服务于本身有意义的目的。一般来说,赋能环境着重为成长和行动创造机会,而不是培养技能。
许多其他社会机构代表着强大的赋能环境。运转良好的公司往往是赋能环境的典范。在这些组织中,新员工可能会觉得自己的个人能力远远超过以前,即使他已有多年的从业经验。同样,Y Combinator 也是赋能环境。
伟大的软件环境是赋能环境。Photoshop 扩大了专家的艺术表达范围,并为新手解锁了曾经是阳春白雪的照片增强技术。软件开发工具使青少年能够制作游戏,并以零边际成本将其分发给数百万人。相比之下,大多数游戏都不是赋能环境,以及教育游戏是注定失败的创造赋能环境的方法。
书籍和视频很少能实现赋能环境:大众媒介通常不善于帮助人们将想法转化为实践。
一批联系紧密的常青笔记可以为作者提供赋能环境:常青笔记有助于积累洞见。(参见常青笔记充当知识工作的基本单位)
设计赋能环境
赋能环境一般都是自创的,但是强大的赋能环境通常作为副产品产生于在追求其自身内在意义的项目时。自创环境极大程度受作者的动机塑造;这往往意味着强大的赋能环境注重专业级用例。
设计赋能环境的挑战:
设计这些环境的一些机制 ::TODO 扩展为笔记:::
-
设计一些表征,从而扩大参与者现有专业知识/努力的行动范围;例如:
-
Photoshop 的内容感知的调整大小工具
- 飞机/医院的检查清单
-
-
设计扩大参与者能力上限的表征;例如:
-
阿拉伯数字
-
非线性视频编辑
-
-
设计包含现有表征的表达范围的表征,但对努力/专业知识的要求较低/不同;例如:
-
Figma 的矢量网络 bezier 工具与 Photoshop 的钢笔工具
-
Rust 和 Objective-C 中的自动保留计数与手动保留计数
-
-
设计包含现有表述范围的表述,但努力/专业技能的提升曲线更平滑;例如:
-
SICP
-
Minecraft 的 3D 编辑器与先前存在的体素编辑器的比较
-
(这里的许多现有环境,如 SICP 和大多数可执行的笔记本 (译者注:如 Jupyter, Pluto),与被赋能的行动发生的地方相互影响很弱,这大大限制了它们的力量)
-
(这里有动态的认知脚手架、情景体验放大了叙述的力量和其他一些 Primer 设计元素的机会)
-
情景体验
原文:Enacted experience (andymatuschak.org)
情景体验是在活动中,那些让参与者觉得发自自我,而实际却非如此的体验 —— 实际上,它主要是作者意图的特定表达。这个机制很强大,因为情景体验可以创造出服务于作者目标的强烈个人联系。
(注:我对「情景」一词的用法与 Bruner 不同:Jerome Bruner 与「情境」)
例子和反例
Y Combinator 中许多元素都是情境体验:精心安排的晚餐、时间表、压力等元素结合起来,产生了预期的体验。精明的专业人员经常在会议中创造情景体验:他们构建议程和框架的方式,使与会者不可避免地得出设计者预期中的信念或结论,但每个人都觉得是他们自己独立思考的结果。
好的电子游戏是结构化的,因此站在游戏的任何时刻,玩家会感到当下的体验由自己一点一滴往前的的行为所创造;而往后的体验,又来自自己当下行动的制订 —— 他们会代入这些状态。这种感觉会出现在任何参与式环境中,但在游戏中,狗策划可以对玩家将体验到的情景进行强有力的控制。
像 Jenova Chen、Frank Lantz 和 Jonathan Blow 这样的游戏设计师,创造了专门用来摆弄玩家的 “小提琴”,即这样一个环境,玩家在其中按下按钮,直观地感觉自己带来了每一个 moment,但按钮会经过精心设计,玩家的行动创造的感觉,通常完全来自设计师所预设的反馈。在好的游戏中,玩家会觉得他们已经达到了创造的体验,即使他们不是真正的主导者。这给了游戏设计师独特的表达机会:游戏是一种行动的审美媒介。
对于媒体形式来说,这是一个不寻常的属性。在电影和书籍中,观众/读者在任何特定的时刻都会觉得是作者创造了那个时刻。如果作品做得非常巧妙,观众/读者可能会觉得是人物或他们的环境创造了那个时刻。但观众/读者肯定不会觉得是他们的行为创造了这一时刻。
最接近的非游戏媒体类似物可能是沉浸式戏剧,但参与往往过于被动,无法创造这种效果。
软件环境是参与性的,用户通常认为他们在这些系统中获得一些体验,但这些体验通常不是设计者意图的受控表达。所以,软件环境很少产生情景体验。
要素
-
从定义上讲,任何产生情景体验的环境都必须是参与性环境。
许多情景体验使用元认知脚手架(元认知支持作为认知脚手架)来引导参与者走向所需的体验,但并非所有的体验都是如此。弹奏乐谱和执行食谱都可能是不需要脚手架的情景体验。
挑战
前景
常青笔记
写下常青笔记并加以组织,意在时过境迁,世事辗转之中,这些笔记仍能演化改良,发挥功用,最终聚沙成塔。如此考虑笔记实属不寻常:大多数人记的笔记多是短效的. 写常青笔记,与其说是写笔记,不如说是高效发展洞察力:「更好地记笔记」不是重点;「更好地思考」才是。常青笔记写得好则会颇富价值:常青笔记是知识工作的基本单位。
写出经得住长久研磨改善的笔记,实属不易。下面这些原则可能有所帮助:
常青笔记这一概念在很大程度上是由尼克拉斯-卢曼的 Zettelkasten 笔记演变而来,尼克拉斯-卢曼认为, 在他 70 本书的写作过程中,Zettelkasten 就像一个独立的智力伙伴。参见常青笔记写作和 Zettelkasten 的异同
实现常青笔记
参见:
参考文献
Ahrens, S. (2017). 《如何做聪明的笔记。促进写作、学习和思考的简单技巧--面向学生、学者和非虚拟类书籍的作者》。
许多学生和学术写作者对待做笔记,就像一些古早的船东一样。他们处理想法和发现的办法,乍一看非常有道理:读到有趣的句子,就在句子下面划线。想发表什么意见,就写在空白处。突然冒出什么想法,就写在笔记本上,如果有篇文章看起来挺重要,就花点心思做做摘录。然而如此处理之后,各个地方都散落着大量笔记。那么写作就非常依赖大脑来记住笔记是什么时候,在哪里写下来的。
Luhmann, N. (1992). 与卡片盒的沟通。In A. Kieserling (Ed.), & M. Kuehn (Trans.), Universität als Milieu:Kleine Schriften (pp. 53-61). 检索自 http://luhmann.surge.sh/communicating-with-slip-boxes
可执行的策略
原文:Executable strategy (andymatuschak.org)
在创造性的工作以及生活中,许多目标似乎不可预测又难以实现,非常依赖希望和运气:养成习惯,健身塑形,著书立说,做研究项目等等(见知识工作的核心实践往往是临时性的)
打扫厨房则并非如此。清理收件箱甚至也非如此(收件箱维护的分流策略(如「收件箱归零」)往往不够稳健)。对于许多普普通通的目标,你有可执行的策略来实现它们,这些策略以可预测、可管理的方式来可靠地实现目标。它们是元认知支持(元认知支持充当认知脚手架)。
为了构建可执行的策略,我们必须将任务分解成一项项活动,保证:
-
你能肯定这些活动完成得越多,距离完成目标越近
-
每项活动所花费的气力可以预测
-
每项活动都感觉切实可行
-
选择和计划一项活动很轻松
一种常见的办法是设立每天工作一定时间的目标。要想成功运用这种策略,便需要你清楚,这些时间如何能毫无阻碍地逐步积累,实现期望的目标。仅仅在某个项目上花费一定数量的时间,是(对于成功)相当弱的约束:很容易全神贯注工作很久,然而颗粒无收。
另一个常见的选择是将创意产出分而治之。如果你想写文章,你的目标便可能是每天写上一定字数;如果你在设计界面,你的目标则可能是每天设计一个这个界面的元素。但是,这些步骤所需要的精力很难预知,而且它们常常让人觉得无从下手。如果你因为对自己的一个想法感到困惑而在写作中卡壳,那么你就不可能为你的稿子写出 500 字。你需要花更多时间思考这个想法。在手稿上实现这点比较困难。相比之下,参见常青笔记写作是知识工作的基本单位。
一些可执行策略
生成效应
原文:Generation effect (andymatuschak.org)
「生成效应」是指,比起主动阅读或材料展示,人们能更好地记住自己生成的东西。
例如,效应的命名者 Slamecka 和 Graf(1978)研究表明,人们自己生成关联对(如:押韵:wave / c??e)时,比单纯阅读关联对(如:押韵:wave / cave)的记忆表现更好。
有时会很容易把这种效应与测试效应混淆:在让学生从记忆中提取答案时(如在自由回忆测试中),回忆质量会有一部分取决于答案的生成过程。但 Karpicke 和 Zaromb(2010)的实验表明,这两种影响是不同的,而且在一定程度上可能是彼此独立的。通过尝试生成目标来学习的人,最终比通过尝试回忆来学习的人回忆质量更差。
Karpicke 和 Zaromb(2010)指出,一些(我还没有读过的)参考文献表明,在更难的自由回忆任务中,这种影响可能是极小的(与 Slamecka 的第四和第五个实验相反,这些实验确实只显示了很小的影响):
因此,阅读与生成的列表在自由回忆方面往往没有差异,事实上,有时阅读比生成更有优势(例如 Nairne et al., 1991; Schmidt & Cherry, 1989)。在一个单纯的生成项目列表中发生的记忆增强进程,不足以抵消进程乱序带来的副作用,也不足以在自由回忆中产生超越阅读内容列表的优势。
参考文献
//doi.org/10.1016/j.jml.2009.11.010
Delineation of a phenomenon. Journal of Experimental Psychology
反向链接
-
- 一般来说,测试效应在生成式测试(简答题、作文)中比在判别式测试(多选题 / 判断题)中更明显 (例如 Kang et al, 2007)。这可能是由于生成效应。
-
- 一些机器评分系统会将他们的卡片变成多选题以规避输入成本。但这将生成任务转变成了辨别任务——对记忆编码的效果大打折扣;见生成效应
-
[[Kang, S. H. K., McDermott, K. B., & Roediger, H. L. (2007). Test format and corrective feedback modify the effect of testing on long-term retention. European Journal of Cognitive Psychology, 19(4–5), 528–558. https://doi.org/10.1080/09541440601056620]]* 与生成效应的关系:
-
[[Karpicke, J. D., & Zaromb, F. M. (2010). Retrieval mode distinguishes the testing effect from the generation effect. Journal of Memory and Language, 62(3), 227–239. https://doi.org/10.1016/j.jml.2009.11.010]]* 测试效应和生成效应是同一回事吗?它们经常被等同起来,事实上,我在自己的笔记中也曾将它们等同起来。本文描述了一系列的实验,试图证明有不同的基本机制在驱动这两种现象,而且提取练习对记忆的影响比生成更大。
-
[[Slamecka, N. J., & Graf, P. (1978). The generation effect: Delineation of a phenomenon. Journal of Experimental Psychology: Human Learning & Memory, 4(6), 592–604. https://doi.org/10.1037/0278-7393.4.6.592]]* 第一篇论文通过一些实验排除干扰因素,证实了生成效应的存在。
实践出洞见
原文:Insight through making (andymatuschak.org)
(见《我们如何才能开发出变革性的思想工具?》;小节“如何发明印度-阿拉伯数字?”中的中心讨论)
-
强大的系统能传达对系统内在主题的深刻洞见
- 工作室设计方式无法创造最强大的思想工具:发明印度-阿拉伯数字需要设计天才和数学天才
-
在某些情况下,使用特定的技能集、特定的流程来创建系统的过程实际上会增值出在这些主题上额外的洞见,进而反哺系统的改进,循环往复。这就是「实践出洞见」的闭环。
- 但为了实现这点需要对主题知识相当精通。
孤立地研究理论很难察觉到一些理论方面的洞见。但如果在系统中实现这些理论,通过观察系统的行为,就能通过新的角度观察理论,从而扩大潜在见解的空间。最好的情况下,这些理论方面的洞见能够发展你所能构建的系统,而这些系统中浮现的洞见又能完善你的理论,这样便形成了良性循环。
但是,要实现这个周期的两个「部分」,就需要在系统创造和主题知识方面都有专业知识;发明印度-阿拉伯数字需要设计天才和数学天才。
大多数设计者要么专注于发展理论见解,要么专注于建立系统,而对这个周期的另一半没有实质性的努力。学者们构建的玩具系统,通常不会为他们的想法创建有意义的上下文(学术界制作的软件界面通常不适合面向更大受众)。设计师和工程师经常专注于构建系统,但他们对于系统内在理论的理解不够深入。
这两种类型的实践者经常是为了开发系统而开发系统——而不是为了解决切身相关且很有动力解决的问题:工具制造者通常与实际的使用情景脱节。从这样的系统中得出的见解通常相当薄弱:有效的系统设计需要从真刀真枪的情境中汲取洞见
这种洞察力在思想工具的开发中尤为重要
更多关于如何实践出洞见的笔记:
参考资料
Matuschak, A., & Nielsen, M. (2019 0). How can we develop transformative tools for thought? https://numinous.productions/ttft
助记媒介
原文:Mnemonic medium (andymatuschak.org)
「助记媒介*」会在线性叙述的文章中嵌入了间隔重复记忆系统。在过去,尽管间隔重复记忆系统让记忆成为一种选择,但上手此类系统却困难重重。「助记媒介」是为了解决其中很多问题而设计的。(*译注:「助记媒介」是 Andy 推广的一系列实验性质、内嵌 SRS 卡片的介质,如文章 )
它在量子国度中首次被使用。我正致力研发 Orbit,来大幅扩展其应用范围。(见更多助记媒介的实质性例子)
-
关键设计特性:
-
影响
-
假设/问题
-
衍生范围/规模:
-
非记忆影响:
-
不同类型的理解
-
通向熟练使用:
-
对作者的益处:
-
优化:
-
-
未来的方向
-
挑战
-
......被终端用户采用:
-
......对于设计者来说:
-
...对于作者而言:
-
其他实现
参与式环境
原文:Participatory environment (andymatuschak.org)
一些环境的核心活动从根本上说是主动的;大部分的体验是通过参与者投入精力创造出来的。我将其称为参与性环境。
参与式环境可能是有意创制的,也可能不是。媒体环境几乎都是有意创制的,但许多社会和自然环境却不是。在创制的参与式环境中的部分体验可能是一种情景体验。
参与式环境对参与者来说往往更加愉悦,也许是因为它们诱发了“心流”理论;请看 Daniel Zalewski 在《纽约客》上对 Ian McEwan 的简介中对心流的描述(通过 Chris Hecker ;强调是我标注的):
在过去的两个小时里,他一直沉浸在梦境中,抛弃了一切时间的意识,抛弃了生命中其他一切意识,甚至忘记了自己的存在。他进入了一个纯粹的现在,没有过去的负担,也没有未来的顾虑。现在回头再看,当时从未觉得,但其实是一种幸福的感觉。有点像性爱,让他感觉自己身在别处,只是没有性来得愉悦,当然更不是感官上的体验。这种状态带给他一种满足,是他在任何被动的娱乐中都不曾体会过的。就连读书、看电影,甚至音乐都不能给他带来这种享受。……这种超然似乎需要一个充满挑战的环境,要求一个人在较长时间内全神贯注并发挥高超的技术,充满压力、麻烦,甚至是危险。他感到感到平静,心境开阔,充满了存在的充实感。这是一种空灵的净洁,深刻而沉默的愉悦感。
例子和反例
游戏基本上总是会建立参与式环境。如 Lantz (2019)所说,「游戏是行动的美化媒介」。但在 Twitch 上看别人玩游戏往往不能参与式环境。
书籍和电影通常不会建立参与式环境。这些媒体创造的环境的核心活动,对于大多数参与者来说,通常是被动接受的。但也存在反例:Make 杂志;《右脑绘画(Drawing on the Right Side of the Brai)》;健身视频等。
晚餐聚会和攀岩墙(天然的或人造的)都是参与式环境。地铁座位则一般不是。
大多数软件界面都建立了参与式环境。一类常见的反例是媒体播放器:VLC、Pandora、Kindle 等。这种软件只是展示媒体,而软件本身并没有建立参与式环境。
尽管志向可嘉,大多数探索式材料和可执行的书并没有建立参与式环境。参与者的默认行为是滚动和阅读。
免责声明/声明
这个术语与教育学、认知科学和社会学中的现有概念有很大的重叠,比如「主动学习环境」、「具身体验」和「情景认知」等等,但我想超越这些学科环境,摆脱这些术语的包袱,所以我有意建立一个新的术语。
参考文献
与 Frank Lantz 的对话, 2019-05-07
Shirky, C. (2008, April 23). Gin, Television, and Social Surplus. Web 2.0 Conference.
四岁孩子都知道:如果媒介是为你准备,但你没有参与其中,那就不值得你观看。
…
从现在开始,我就这样告诉他们:我们在寻找鼠标。我们四处寻找那些读者、观众、患者或者市民,他们有的被锁在创造和分享之外,有的享受着消极的或被禁锢的经验,我们发出叩问:「如果能开凿出一点点认知盈余,加以利用,我们会让事情变得更好吗?」我敢打赌答案是肯定的,或者换句话说,如果我们给彼此参与的机会,对彼此的尝试做出奖励的话,答案将是肯定的。
可编程注意力
原文:Programmable attention (andymatuschak.org)
间隔重复记忆系统的复习环节不只是帮助你记住事情:它在数百个微小的任务中长期协调你的重复注意力,这些任务太多,无法用手管理。像这样的系统是一种可编程的注意力的形式。你一直在使用更简单的可编程注意力的形式:带有打盹和闹钟功能的收件箱;提醒你事情的机器人;Twitter 是一种可编程注意力。这些系统的核心属性是什么?它们的潜在范围是什么?
这样的系统通常侧重于发展生产力,但我相信它们可以用来支持创造性的工作——阅读、思考、表达、解决问题。
对于更多借助间隔重复实现的应用:间隔重复系统可用于对注意力进行编程
这个词颇有深意,但也带有异化和机械主义的味道,实属不幸。我想我最终还是要找到另一种说法。
参考文献
与 Igor Dvorkin 的通信,2020-05-12
教练是花钱请人对你的注意力进行编程
未来阴影,出自 Michael Nielsen
原文:Shadows of the future, after Michael Nielsen (andymatuschak.org)
现如今,有很多创新性的研究和艺术资助计划,提供奖学金和资助。关键问题是,这些项目结束后并没有一个可行的后续资金支持机制。如果资助期限较短,比如两年,那么资助接受者可能不会全身心地投入到新思路中。心里总觉得,他们得留有后路,以适应传统的资助模式。这种顾虑,Michael Nielsen 称之为「未来阴影」。
为了避开这些阴影,Donald Braben 承诺进行长期的资助(我记得是十年)。他的观点是,如果一个想法能成功,那么在这段时间内,对主流机构来说,这个想法至少会显得有点成效。虽然我不认为这完全解决了问题,因为有很多发现需要好几十年才被认可,或者在十年内完成但需要很多年才得到重视。当然,这种做法多少有些帮助。
在我自己的工作中,这个问题特别棘手:因为我处于一个相对独特的资助情况,很难找到合作伙伴。这种情况也没法轻易复制。虽然我可能能为别人找点临时的资金,但他们都得面对「未来阴影」。说实话,即使在 Patreon 这个平台上干了两年半,我依然感觉未来充满不确定性。这段时间根本不足以让我觉得长期收入是稳妥的,特别是这还是个新事物。
当然,像我这种与科技界有些交集的人,确实没那么多后顾之忧。我总能找到份高薪工作。对我而言,真正的威胁是「不得不做自己不感兴趣的事」,或者就是「不得不从事非自主性的工作」,而不是「你将面临财务崩溃」或「你不得不重新开始职业生涯」,这些更多是自然科学家才会面对的压力。
问:举一个「未来阴影」的例子。
答:一位想要支持新科学研究的资助者,试图让人们加入一个非常规的机构,但只能承诺三年的拨款。受资者因为没有长期的出路,不敢全心全意投入到这个新模式中,他们不得不在旧体制里留后路。
参考文献
在 2021-08-22 的对话中,Ben Reinhardt 首次向我介绍了这个概念。
间隔重复记忆系统
原文:Spaced repetition memory system (andymatuschak.org)
间隔重复记忆系统结合了测试效应]和间隔效应,能够用于高效地记忆成千上万的事实型材料(间隔重复记忆系统非常高效)。有些人还将它们用于更广泛的任务(见下文)。间隔重复记忆系统让我们对记忆有了选择权,但不要以为它只能用来机械记忆:间隔重复记忆系统可用于加深概念理解。
第一个成熟的系统是 Supermemo,由 Piotr Wozniak 创造。Supermemo使用并推广了「间隔重复」这一术语;在它之前,文献使用的术语五花八门(通常指的是间隔效应更具体的方面)。
-
相关的系统和可能性:
-
记忆系统的特性:
-
采用间隔重复系统的障碍
-
对常见反对意见的回应
-
SRS 只与事实型材料的死记硬背有关:「学校学习」
-
现有的 SRS 并不是只能用于简单的陈述性知识,间隔重复记忆系统可用于发展概念性理解
-
(注意:要写出用于概念理解的卡片是很难的!)
-
如果你足够关心一个材料,是可以「自然」地记住它的,「边做边学」是更好的方式。SRS 只适用于那些由于你不够关心所以记不住的材料。
-
外部记忆辅助工具已经足够了
-
助记技巧使 SRS 没有必要
-
通过 SRS 学到的知识不能迁移
-
SRS 真正有价值的是亲自制作卡片的过程
- 也许吧!亲自写间隔重复记忆卡片有多重要?
-
参考资料
Branwen, G. (2009). Spaced Repetition for Efficient Learning. Retrieved December 16, 2019, from https://www.gwern.net/Spaced-repetition
Who invented the name: spaced repetition? - supermemo.guru
反向链接
-
- 「助记媒介*」会在线性叙述的文章中嵌入间隔重复记忆系统。在过去,尽管间隔重复记忆系统让我们对记忆有了选择权,但上手此类系统却困难重重。「助记媒介」是为了解决其中很多问题而设计的。(*译注:「助记媒介」是 Andy 推广的一系列实验性质、内嵌 SRS 卡片的介质,如文章 )
-
- 间隔重复记忆系统让我们对记忆有了选择权,但自动规划记忆的价值,更在于它动态地安排和选择要复习的内容。从某种意义上说,间隔重复记忆系统的功效来自于它规划注意力的能力(可规划的注意力)。不如把它想成「大脑的{cron}」(注:cron 是类 Unix 操作系统下的定期任务管理系统。)
-
- 间隔重复记忆系统的算法利用了这一点来实现高效的学习系统。
-
- 间隔重复记忆系统实现了这一点:当你发现某个信息有用时,投入一点点精力,就能确保这条信息在此以后都可以随时回想起来。随着时间推移,你的间隔重复图书馆便积累了成千上万的问题,(我强烈认为)这些知识可能使你以后更容易成为一个有效的知识工作者。
-
- Gary Bernhardt 的 Execute Program 提供了关于编程工具的交互式课程。这些课程将文字与在线编程练习交织在一起。类似于助记媒介,该网站集成了一个间隔重复记忆系统,可以随着时间的推移重复课程的任务。
-
- 使用间隔重复记忆系统,你可以在每天投入短短的几分钟,就能记住成千上万的问题的答案。看上去很不直观,但正是间隔效应中的指数效果发挥作用:在间隔重复中,增加一点点精力投入,就会产生指数级的回报,。
-
- Quizlet 是一款商业化的间隔重复记忆系统。
-
- 一些间隔重复记忆系统的用户会特意写出用来促进精细编码的卡片。Karpicke 和 Smith 的实验(2012)表明,与单纯的提取练习相比,这样做不会带来太多的好处。相关文章: 提取练习似乎是一种比精细编码更有效的学习活动。
-
- 使用间隔重复记忆系统的一个迷人的结果是,它们使记忆成为一种选择。一旦你采用了一种记忆实践,如果你想记住某件事,你可以简单地使它发生:写一个关于它的问题。在接下来的几个星期里,你会把它持久地编码到长期记忆中,而这只需要花你累计几分钟的时间:间隔重复记忆系统非常高效。因此,这些系统不仅让记忆成为一种选择,而且也让这种选择的风险非常低:间隔重复系统中选择去记忆某项内容是一个如此轻松的行为。
-
- 人们把抽认卡看作是学生时代才会做的琐事,所以他们不太重视编写抽认卡。但是,为间隔重复记忆系统编写好卡片是非常困难的。比如说,好卡片需要:
-
- 间隔重复记忆系统的复习环节不只是帮助你记住事情:它会反复地安排数百个微小的任务,用它们来协调你的注意力,这些任务太多,无法手工管理。像这样的系统就是可编程的注意力的一种。你一直在使用更简单的可编程注意力的形式:带有稍后处理和特别提醒功能的收件箱;提醒你事情的机器人;Twitter 是一种可编程注意力。这些系统的核心属性是什么?它们的潜在范围是什么?
-
- 像 Anki 这样的间隔重复记忆系统主要是为了帮助人们记忆大量的陈述性知识,比如词汇。但这类系统的机制也可以用来创建相对非传统的卡片,从而促进应用、综合和创造。
-
- 由 Piotr Wozniak 原创的间隔重复记忆系统。包括对各种相关个人信息管理系统的支持,如渐进阅读。
-
- 使用间隔重复记忆系统的过程中,你会写笔记来记录你所学习、观察和思考的内容。不幸的是,现有的间隔重复系统不适合常青笔记。记忆系统对于记住所写内容并持续琢磨很有帮助,但对于基于想法进一步思考并无太大功效。常青笔记系统有助于逐步完善想法,但对于记住这些笔记并持续琢磨没有太大用处(除了常青笔记的维护近似于间隔重复的效果之外)。因此,你陷入了一个困局,要么在两个不同的系统中混乱地重复劳动,要么放弃其中某一个系统的好处。
-
Execute Program 的单元在你成功复习其前置条件后才能解锁
- Execute Program 的学生不能立即访问一门课程中的所有单元。课程的大部分单元一开始都是「锁定」状态。这些单元依赖于课程中的其他单元:只有{那些在课程中没有依赖关系的单元}在一开始就是解锁的。单元仅在{它们的所有依赖项不仅已阅读,而且最近也已复习(通过嵌入式间隔重复记忆系统机制)}的时候解锁。
-
- 本笔记收集了关于如何将知识编码到间隔重复记忆系统卡片中的想法,既支持对事实的记忆,也促进更丰富的间隔重复记忆系统可用于加深概念理解](https://notes.andymatuschak.org/z6UZP7P4sRNgRKSvNj7tMV5uW6dDhwwbdZCy9))。
-
- 我在笔记中嵌入了间隔重复记忆系统:助记媒介可以扩展到个人笔记。这大大改变了笔记的媒介 —— 但它的机制我还没有充分理解。
-
- 间隔重复记忆系统显然可以用来记忆简单事实:名称、定义、数字常数等。记忆系统的绝大多数使用者似乎只将其用于这一目的。但是,间隔重复并不仅限于对记忆简单事实有用。如果你自己写卡片,它还可以用来深入理解复杂的材料(亲自间隔重复记忆卡片有多重要?)。这种面向概念的卡片可能会从联系、影响、原因、后果出发问问题。这些更广泛的想法乍一看根本不是可以记忆的事实,但其实是的。使用间隔重复系统,不仅能让你记住这些概念性的想法,还能让你琢磨更高层次的关系,从而与话题保持联系,更深刻地内化材料。(相关笔记:助记媒介使读者长期与材料保持联系)
-
- 尽管像 Anki 这样的间隔重复记忆系统的主要目的是用来记忆陈述性知识,但这种抽认卡模式其实大有可为。
-
- 在实际使用中,作为间隔重复记忆系统的一部分,通常必须引入项目复杂性的第三个参数,因为就我们的大脑而言,SR 项目实际上并不是原子的。
-
间隔重复记忆系统可以使人更快地度过科目学习中不愉快的早期阶段
- 对于使用间隔重复记忆系统工作,一个常见的负面反应是:「我更愿意直接上手实践:我就会自然而然地记住重要的东西」(赋能环境着重于创造成长和行动的机会,而不是技能培养)但是当你刚开始学习新主题时,你可能一步也迈不开:至少在一段时间内,完成有意义的活动所需的术语与概念,对你来说数量太多,记忆也太不牢固,(相关:在赋能环境中的新手往往不能做被赋能的事情。在这种情况下,间隔重复记忆系统可以帮助你加速,度过这个尴尬的、不愉快的阶段,直到你与材料能产生一段有意义的体验(相关笔记:赋能环境的活动直接服务于一个内在的有意义的目的)。
-
- 你可以用间隔重复记忆系统来记忆文章中的片段,但你也可以用这个系统来把这个习惯「安装」在你的头脑中。下面一些样例问题可供尝试:
-
- 如果有一个“操作系统层级”的间隔重复记忆系统会怎么样?如果卡片设计得更像文件夹里的文件,在整个系统中都可读可写,而非像 Anki 或其他现存工具的卡片,存储在 App 的袖珍天地里?
-
- 一家已停业的初创公司,试图将间隔重复记忆系统作为一项服务出售给公司,用于培训目的。首席执行官是 {Brian Tobal}。
-
- 许多研究人员都在试图制造一个更高效的间隔重复记忆系统,但我认为,优化的关键是复习环节及其内容的情感联系——反之,要坚决地减少引起叹气的元素。这些系统,如果任由它们的自然倾向发展,就会自然而然地腐化,产生尽职尽责的复习环节,而这些环节感觉与你关心的任何事情脱节。
-
- 他们已经逐渐引入了间隔重复记忆系统的一些功能。在每日重点内容的阅读过程中,你可以顺利地将吸引你的内容「升级」为填空题,甚至是自定义问答卡片。这是一个巧妙的策略,用于引导刚接触间隔重复的人:如果你完全是被动的,这种策略只会产出(轻微的)价值,但随着用户加大投入,伴随着渐进的用功,用户能从中获得更多的收益。
-
- 同样地,间隔重复记忆系统中的复习环节可以帮助读者记住一本书中的材料,但它们也会促使读者随着时间推移重新琢磨这些材料。这在实践上很有用,因为在阅读这段内容几周后,许多读者会发现新的关联。但也许这也促进了身份的改变:你不只是一个只读过一次某篇文章的人,你是一个「那个主题的学者」,因为你的学习绵延更久。
-
- RemNote 是网页端的笔记系统,强调结构化的知识模型,对于将笔记整合进间隔重复系统提供了高质量的操作方法。参见:助记媒介的范畴可以扩展到个人笔记
-
- 对间隔重复记忆系统功效的一个挑战是,有时用户通过「模式匹配」浅层次地记忆问题的答案,而不是通过更深入地整合知识或实际思考问题。但是间隔重复记忆卡片应确保复习者必须从记忆中提取出答案。
-
- 写好间隔重复记忆卡片很难,但助记媒介通过提供作者编写的卡片,能够消除采用间隔重复记忆系统的这一障碍,使读者不用自己写卡片就能记忆材料。
-
- 间隔重复记忆系统上的每日练习应该有至关重要、息息相关的感觉。然而使用者要是一段时间内没有添加新卡片,每天的复习环节就似乎停滞在过去、与眼下所思所想无法关联。新用户经常滑入这样的陷阱。他们刚开始使用时热情高涨,一股脑加了许多新卡片,然而几个月过后,他们还在复习那些卡片,就感觉无聊了。
-
- 间隔重复记忆系统的采用和日常体验面临的一个挑战是,你将把几乎所有的复习时间都花在您觉得难以记住的材料上。容易记住的材料会迅速加速到几个月的时间间隔,所以与以几天或几周为间隔的卡片相比,你只需在这上面花费很少的时间。你对整个集合的预期准确率可能是 95+%,但在给定的复习环节中,你的准确率可能会低得多。
-
- 一旦理解了间隔重复记忆系统使记忆成为一种选择和学习越来越复杂的想法可能相当于形成更大的有效组块,那么通过下载别人的间隔重复记忆系统牌组来吞噬新知识是非常诱人的。但是,假设你之前从未学习过相关知识,你阅读教科书中关于细胞生物学的章节要比你背诵别人的牌组好得:你必须先学再记。此外,单独的间隔重复记忆卡片是一种糟糕的交流媒介;你仍然需要教科书的叙述
-
- 在间隔重复记忆系统中通常可以找到各种「重试」机制。通常这些工作方式是,如果你答错问题,几分钟后,或者在课程结束时,它会再次出现。换句话说,这个项目被临时分配了一个很短的时间间隔,在它被成功记住之后,它会得到一个新的「遗忘后」间隔,通常更长。
-
- 间隔重复记忆系统非常高效,但是前期收效不显。因此,一个新用户在入门间隔重复记忆系统时需要更多的努力......而绝好的学习结果却是延迟出现的。最初,它似乎并不比学校内使用的简单闪卡系统更优,而且它的长期好处很难以察觉 —— 尽管间隔重复让小的努力增量产生指数回报,但这样的事物在生活中十分罕见(使得人们不能立即辨识出来),而且人们对指数的直觉很差。
-
- 抽认卡,就像那些间隔重复记忆系统一样,得到了一个罪有应得的坏名声,部分原因是它们让人们想起了死记硬背的学校学习。人们记得被强迫去记住孤立的事实,如不同类别的云的名称——他们记得在没有建立任何持久理解的情况下,鹦鹉学舌地回答这些问题。部分问题在于教育计划经常颠覆自己:你可能并不真正关心学习那些材料。但撇开这个问题不谈,这些孤立的练习特别脆弱,因为它们所培养的知识只能在一个背景下使用,与更广泛的概念框架和理解脱节:丰富的理解是关于连接。
-
- 我怀疑这是人们通常将技能发展到平台期然后止步不前的一个关键原因,特别是为什么运动员和音乐家比知识工作者更严格地追求基本技能的精湛性。如果你从来没有听说过间隔重复记忆系统,那么很可能没有明显的证据表明记忆可以成为一个可以解决的问题。如果你从未听说过常青笔记,那么知识工作者通常没有随着时间推移形成想法的具体方法可能并不明显。
-
- 所以,间隔重复记忆系统只有克服这道阻碍,让用户一用就有效果,才能被用户接受。但大多数记忆系统做不到:他们都是空盒子,用户需要自己去装满卡片。可是写好间隔重复记忆卡片很困难, 所以用户刚开始使用记忆系统时,自己做的卡片必然数量又少质量又不高,却只能用这些卡片去复习。更糟的是,间隔重复记忆系统的好处是慢慢显现的。难怪大众会反感。
-
间隔重复记忆系统让记忆更加自动化,从而有助于更深入的琢磨思考
- 深入理解需要详细的基础知识。那么,看待间隔重复记忆系统的作用的一个角度是,它们有效地将学习中基础但需要死记硬背的知识自动化,以便你可以专注于更有趣、有意义或概念性的知识。
-
- 在间隔重复记忆系统中,控制系统的关键输入是:用户是否正确记住了卡片?有些系统是自我评分的:用户指出他们是否记得。其他人则要求用户输入答案,然后系统会计算用户是否正确。
-
- 如果你刚学会一种煮豌豆的新方法,你可以为间隔重复记忆系统写一张卡片,比如:「问:如何用真空低温烹饪法煮豌豆?」「答: 18m @ 70℃」。但我发现回答这样的问题通常很费劲,我经常会忘记答案。涉及多个独立概念的设问似乎会被这个问题绊住。
-
- 查看这一点为我们提供了一种强有力的方式来解释「优化」间隔重复记忆系统的目标:在最初的几次重复之后,一旦一个项目被正确回答了几次,你只是试图以尽可能低的成本维护该记忆。
-
- 与间隔重复记忆卡片通常应聚焦于一个原子化单元相关但又有区别,一般来说,最好保持间隔重复记忆系统卡片简洁。
-
基于命令行的交互式间隔重复记忆系统,侧重于编程练习,由 Larry Sanger 创建。这个项目给用户的任务比传统的上下文如 Supermemo 或 Anki 要大一些;你需要编写程序以解决特定问题。
-
- 该课程不可能有更典型的间隔重复记忆系统卡片:
-
- 在为间隔重复记忆系统编写卡片时,很容易不小心写出一个问题,其正确答案除了你意指的那个之外,还有其他的可能。你必须包含足够的上下文,使合理的替代答案明显错误,同时又不能包含太多的上下文,以至于违反了简洁性(间隔重复记忆卡片应该简洁)或鼓励模式匹配(编写间隔重复记忆卡片应避免浅层次的「模式匹配」)。
-
-间隔重复记忆系统经常遇到的一个问题是,人们太过逐字地学习问题的文本,并对其表面特征做出回应,而不是真正考虑其内容:编写间隔重复记忆卡片应避免浅层次的「模式匹配」。也许更好的做法是安排在复习过程中显示各种形式的问题文本,无论是作者创建的还是机器生成的(语言模型可能会为间隔重复卡片生成有用的问题变体)
-
- 一款流行的开源间隔重复记忆系统。主要开发者是比利时光子学家 {Peter Bienstman}。
-
- 没有实际使用过间隔重复记忆系统的人,常常将其认作一种工具,是在「想记住什么的时候」才应用的。但这种想法对于理解高效记忆系统来说就差之千里了。如果人们没有增强功能,刻意记忆信息是相当费力的。所以人们并不经常记东西。只有一些至关重要的细节才记忆,因为它们的价值抵得上记忆的高成本。
-
- 一款流行的开源间隔重复记忆系统。
-Execute Program‘s Prompt’s Prompt既可用作应用程序提示,也可用作Recall prompts
-Mememonic medium’s Basic]提示符类型是典型的Spaced Repeat Memory systemStyle:高度原子化,严格测试您的内存]中的原子调用提示符。相比之下,Execute Program’s Basic Prompt type是-或者至少看起来像--应用程序提示符(参见助记介质可以帮助读者应用他们通过简单应用程序prompts).学到的内容
-
-由于这些题型的经验有很大的重叠性,记忆提示设计问题的解决方案应该主要应用于简单应用提示的设计问题。这表明,在间隔重复存储器system.]的现有审查环境中,可以呈现简单的应用提示,而几乎不需要进行调整
详细说明:[专门为学习国际象棋走法而设计的空格重复记忆system]。它与教学材料相结合,交替使用散文+通过测验进行视觉解释,类似于执行程序的课程如何针对读者interaction.展开他们的散文
-
-典型的间隔重复记忆system]做两件事:它缩短到下一次演示的间隔,并且(通常)它要求学生在同一会话中重试提示(Srs重试mechanism).
-
- 间隔重复记忆系统的核心机制让行动的关键步骤少一些决策和毅力。假设你想研究细胞代谢的分子途径。如果没有 SRS,你需要制定计划,比如「我在每个周二晚上学习细胞生物学」,之后记住这个计划,并下定决心反复执行。但是如果你有使用 SRS 的习惯,你便可写些卡片放进卡片库,并确信你能逐步看到这些卡片。
-
- 在为间隔重复记忆系统添加卡片时,通常会犯一个错误,那就是把卡片写在一个看似有趣的细节上,但却与你正在思考的其他事情脱节。间隔重复记忆卡片应关联和联系概念——而且最好让它们与你经常思考的想法相关联和联系。
-
- 间隔重复记忆系统已经有许多实现。为什么还要再投入更多的精力呢?我在这里做的一些笔记,收集了我用来实现系统的方法中的一些主要差别,有助于我更好面对更高阶的挑战。
-
- 间隔重复记忆系统的复习环节是否能算作刻意练习 (术语来自 Anders Ericsson)?
-
-如果Spaced Repeat Memory system]的“练习环节”可以完全切除,而不是构建一个人的真实环境,以便“练习”通过日常行动自然发生,会怎么样?例如:推特是一种可编程的attention;长青笔记维护近似于间隔的repetition.相关:围绕间隔重复记忆系统的主流文化是无意义的goals.
-我目前的研究探索记忆系统-建立在认知心理学强大思想基础上的环境,使“持久记忆”变成原始动作。关于存储系统的先前工作(例如间隔重复记忆(Spaced Repeat Memory system))主要专注于显式记忆简单的事实,如国家首都和关键日期。但是以内存为中心的原语可以增加更复杂、更有意义的任务。我感兴趣的是它们如何有助于丰富和增强日常生活的活动-阅读、写作、对话和艺术。例如,我相信我们可以创建记忆系统,使我们更容易学习抽象的概念性知识(间隔重复记忆系统可用于开发概念性understanding).我相信这些系统可以帮助人们将关键的洞察力和影响力内在化,从而加速创造性的工作。
-
- 写好间隔重复记忆卡片很难,但有一个心理模型很有用。当你为间隔重复记忆系统做一张卡片时,你在给未来的自己设置重复性的任务。卡片设计就是任务设计。
-
- Duolingo 是一款带有间隔重复记忆系统组件的语言学习应用程序。
-
- 尽管间隔重复记忆系统中的笔记,与常青笔记一样都是原子化的(常青笔记应该是原子化的),但这些卡片在很多方面过于原子化(传统间隔重复记忆卡片是原子化的)。这种形式不鼓励渐进式的综合和提炼。
-
- 现有的间隔重复记忆系统文化对经常无意义的记忆的固执使得这种失败模式特别常见:间隔重复系统的主流文化圈热衷无意义的目标.
-
- 交互是界面设计的成本中心,所以机器评分的间隔重复记忆系统加重了用户的负担。如果要求用户打字输入答案,那就很容易在每项任务上花费 2-4 倍的时间。
-
- 「对或错」间隔重复记忆系统卡片是一个有吸引力的麻烦。基本上,可能你读到的许多简单语句都是在说 「X 是真的」。把这句话变成问题的一个明显的简单方法是问 「X 是真的吗?」但是这些问题并不十分有用:间隔重复记忆卡片应确保复习者必须从记忆中提取出答案
-在Execute计划的评审中错过答案不会惩罚学生,除非他们“给予up”
-Execute Program’sSpaced Repeat Memory systemPrompt是机器分级的,所以如果读者在响应中犯了语义不重要的打字错误,系统会将提示标记为错误。这些错误否定可能相当恼人,特别是因为执行程序的课程只有在您成功地查看了它们的prerequisites.之后才会解锁在SQL课程中,假阴性率足够高,以至于在2020年初,系统进行了改变,不正确的回答不再“算作”失败,只要学生最终得出正确的答案。读者可以想试多少次就试多少次,下一次评论的间隔仍会根据SRS曲线增加。无论用户性能如何,后续课程都会解锁。
-Spaced Repeat Memory system]中的模型和评估的一个大问题是,您试图估计一个连续值(回忆的概率,或随着时间推移每个memory)的两个组件模型的可检索性),但您得到的只是这些稀疏的一位二项式样本:记住的,或不记得的。如果读者记不住,他们的可检索性可能是10%,也可能是90%。
-
- 那些在间隔重复记忆系统中的卡片是一个无序的、无结构的集合。每一张卡片都被有意地细粒化和原子化,因为这似乎是有效记忆的最佳方式。但是,结构的缺失导致我们只见树叶,不见森林。
-
- 在间隔重复记忆系统的复习环节中,如果我因为记错了一个函数的名字而在 SQL 表达式中打错了字,那就不好了,我可能应该再复习一遍。但是,如果我因为手指打滑而打错了字,我仍然自认为是「正确的」。在机器评分的系统中,假阴性是非常令人恼火的。当然,假阴性也是低效的,因为卡片会更快地重新出现。但激怒用户才是更严重的问题。
-
-典型的间隔重复记忆system]表示与正面/背面抽认卡分开的完形填空删除,但有趣的是,您可以将典型抽认卡视为完形填空删除的特例。
-
- 「即兴创作五声小调的旋律。」许多有价值的间隔重复记忆系统卡片在不同程度上基本上是不可机器评分的——特别是在间隔重复记忆系统可用于促进应用、综合和创造中描述的那些自主评分系统将更容易适应这些更具实验性的问题。
-
- 有趣的是,我的想法是间隔重复记忆系统在所有这三种模式下都起作用。
-
- 你可以在间隔重复记忆系统中实现这些,但调度可能都是错误的。
-
- 我昨天与 Giacomo Randazzo就间隔重复记忆系统中的建模和日程安排进行了愉快的交谈。我从中了解到的主要信息:
-
- 8:18:开始在间隔重复记忆系统中记录采用障碍,摆弄小提琴图
-
[[Kang, S. H. K., McDermott, K. B., & Roediger, H. L. (2007). Test format and corrective feedback modify the effect of testing on long-term retention. European Journal of Cognitive Psychology, 19(4–5), 528–558. https://doi.org/10.1080/09541440601056620]]
* 我将只总结第二个实验,因为它与我正在做的那种间隔重复记忆系统设计更相关。通过简答式练习的学生提高了他们的记忆力,相对于控制条件和学生简单地阅读正确答案的条件而言是最大的。练习简答题的学生在多项选择题后测中的表现好于那些通过多项选择题练习的学生 (d=0.41),但在简答题后测中并没有显著优于多项选择题的练习者。
-
[[Karpicke, J. D., & Smith, M. A. (2012). Separate mnemonic effects of retrieval practice and elaborative encoding. Journal of Memory and Language, 67(1), 17–29. https://doi.org/10.1016/j.jml.2012.02.004]]
* 测试效应是由精细编码产生的?当你在间隔重复记忆系统中查看卡片时,你给自己提供了一个机会,可以根据你当前的上下文和你在复习环节期间的不同想法来形成新的联系。
-
[[Nioche, A., Murena, P.-A., de la Torre-Ortiz, C., & Oulasvirta, A. (2021). Improving Artificial Teachers by Considering How People Learn and Forget. 26th International Conference on Intelligent User Interfaces, 445–453. https://doi.org/10.1145/3397481.3450696]]
本文试图通过结合基于模型的学生记忆状态估计器(每个学生,每个项目)和一个更全面的考虑学生时间限制和考试日期的计划模型,为Spaced Repeat Memory system]产生一个更好的调度器。
-
- 一个旨在集成到课堂环境中的间隔重复记忆系统。它的题目是从老师布置的作业和小测验中抽取的。自 2021-03-17 起处于私人测试版。
-
- 尽管外形尺寸大致是抽认卡,但它并不想成为间隔重复记忆系统。它更像是一篇不同寻常的互动文章。我确实发现它与交互是界面设计的成本中心非常冲突:我想知道是否有可能创建一个更流畅的交互,也许部分灵感来自于 Execute Program 中的快速交互(参见 Execute Program 的课程根据读者的互动展开他们的散文)。
-
- 以语言学习为中心间隔重复记忆旨在让您在浏览时自然地吸收词汇。其核心机制是您可以突出显示一些外语文本,查看翻译,然后将该文本及其翻译添加为 SRS 卡片。
间隔效应
如果学习材料的时间错开来,比起花同样的时间一晚上死记硬背,材料会记得更牢。
换句话说,接连的记忆强化可以让遗忘曲线更平,因此可以让复习间隔拉得越来越长。如果间隔时间安排得当,曲线可以被压到一个极平的角度。(译者注:遗忘得越快,遗忘曲线就随时间下坠得越厉害,抬平这个曲线就代表不容易遗忘)
间隔重复记忆系统的算法利用了这一点来实现高效的学习系统。
最优间隔
复习之间的时间间隔不应该无限制地拉长,否则复习时材料更难回忆起来,进而削弱了对记忆的强化作用。最优的 ISI 取决于「保留间隔」(RI, retention interval )—— 最后一次学习和学习之后第一次测试的间隔时间。
Mozer 和 Lindsey (2016) 利用各种实证数据,推导出个人学习存在幂律关系:
最优 ISI = 0.097 * RI ^ 0.812
画成曲线形状如下:
在我看来,它大致就是线性的。他们的数据集中所有的 RI 都没超过一年 ,所以这个函数在这个范围之外都不可靠。
另外,这个函数不太能拟合 Cepeda 等人 2008 年论文的数据:
例如,他们发现 RI=35 时,OISI~=5,但幂律拟合算出的是 OISI=1.8,从经验上讲,这个OISI在该研究中表现得更差。
收集的经验证据
Kornel (2009),在一个涉及 GRE 词汇的实验中:
综合这三个实验,90% 的参与者在间隔条件下比集中条件下学到的更多,而只有 6% 的参与者正好相反。
解释间隔效应的可能理论
-
「编码的可变性」:练习有间隔后改变了情景,记忆编码受这些情景影响,也更加丰富而多样
-
与集中学习相比,间隔不那么需要全神贯注,耗费精力更少。
-
较难提取的记忆经回忆得到更多强化,这可能通过记忆的双组分模型来加强学习
-
「预测效用」:如果一条信息通常在很短的间隔内被提取,你的大脑就会认为这个间隔过后就不再需要它了;提取间隔较长,所需实践也变长。
问:在间隔效应研究中,什么术语指代两次复习环节之间的时间?
答:环节间间隔 (ISI)
问:ISI 在间隔效应文献中代表什么?
答:环节间间隔。
问:在间隔效应研究中,什么术语指最后一次学习环节和测试之间的时间?
答:保留时间间隔(RI)
问:区分间隔效应研究中的「环节间间隔」和「保留间隔」。
答:前者指的是学习环节之间的时间,后者指的是最后一次学习环节和测试之间的时间。
问:间隔效应的相关文献中,「间隔函数」指什么?
答:回忆准确率与间隔时间的函数关系
问:间隔函数的形状特征是什么?
答:一个小山丘:最初的准确性相对较快增加,随后缓慢下降。
问:相对于间隔效应,「最优 ISI」指的是什么?
答:间隔函数的峰值点:能产生最高回忆准确率的 ISI。
问:很大程度上,「最优ISI」 取决于什么间隔指标?
答:保留时间间隔(Cepeda 等人,2006;通过 Mozer 等人,2009)
问:「编码变异理论」对「间隔效应」的核心主张是什么?
答:间隔能产生更优质的回忆,因为它用更多样的「心理情景*」来编码「记忆痕迹*」( memory trace ),这样与回忆背景重合的可能性更大。(注:「心理情景」指记忆时你的情绪、环境、反应等上下文;「记忆痕迹」是一个花里胡哨的术语,你可以自己查一下)
问:为什么在更广泛的心理情景下留下记忆痕迹后,回忆会更加牢靠?
答:编码特异性原则
问:在编码变异理论中,为什么不无限制地增加 ISI 来最大限度提升背景变异性?
答:随着 ISI 的增加,提取愈发不准确,因为每个学习背景之间相同成分更少。
问:预测效用理论对间隔效应的核心主张是什么?
答:大脑依据记忆被访问的规律来判断记忆还需要留存多长时间;学习之间间隔长,则留存时间更长。
参考文献
Branwen, G. (2009). 高效学习的间隔重复。2019 年 12 月 16 日检索,来自 https://www.gwern.net/Spaced-repetition
Kornell, N. (2009). Optimising learning using flashcards: Spacing is more effective than cramming. Applied Cognitive Psychology, 23(9), 1297–1317. https://doi.org/10.1002/acp.1537
反向链接
-
间隔重复记忆系统
- 间隔重复记忆系统结合了测试效应和间隔效应,能够高效记忆成千上万条事实(间隔重复记忆系统非常高效)。有些人还将这套系统用于更大范围的任务(见下文)。间隔重复记忆系统使记忆成为一种选择,但它们不仅能用于背诵事实。间隔重复记忆系统可用于发展概念性理解。
-
间隔重复记忆系统是非常高效的
- 使用间隔重复记忆系统,你可以在每天投入短短的几分钟,就能记住成千上万的问题的答案。看上去很不直观,但正是间隔效应中的指数效果发挥作用:间隔重复产生指数级的回报,而投入精力只需要增加一点点。
-
记忆的双组分模型
- 稳定性随着每次复习而增加,因此,可提取性随着每次重复而下降得更慢(见间隔效应)。当可提取性较低时,提取似乎会更多地增加稳定性:也就是说,较难获得的记忆通过提取得到强化更多(另见 Bjork 提出的理想困难)。Supermemo 试图用指数曲线来描述这种关系,但 Supermemo 使用的模型非常复杂,我有些怀疑。
-
赫尔曼-艾宾浩斯
- 发现了间隔效应,是实验心理学的创始人之一,实验心理学也是认知心理学出现之前主导的方法论;更多请参见A Contribution to Experimental Psychology (H. A. Ruger & C. E. Bussenius, Trans. ) 。(原作发表于1885年)。
-
大众传媒大多缺乏一个超过一天的自创时间维度
- 书籍往往需要几周或几个月的时间来阅读。但书籍几乎从来没有有作者制定的时间线,像电影或戏剧那样。作者一般不安排读者在哪天、哪周、哪月怎么读书,相比之下,电影制作人会精心编排每一分钟的内容。然而很多想法需要时间来沉淀:间隔效应。不仅如此,只有在很多地方都遇到这些想法并加以琢磨,这些想法的真实含义才会变得清晰。
-
概念性知识的「最优间隔」的安排节奏可能更慢
-
「重试干预」使《量子国度》的早期准确率大幅提高
-
助记媒介中简单的应用卡片可以和回忆卡片以一样的方式呈现
- 这两种卡片都受益于间隔效应(尽管时间安排有所不同)。
-
Nate Kornell
- 是威廉姆斯学院的认知心理学教授,Robert A. Bjork的学生。围绕间隔效应和测试效应进行了大量研究。
-
§认真对待知识工作(Stripe 上的融合讲座,2019-12-12)
-
笔记类型命名法
-
助记媒介实现了对被遗忘卡片的重试机制
- 有趣的是,间隔效应表明,这种快速重试不太可能像简单地在下一次复习环节上重新呈现卡片那样有效。但我的直觉(以及我们越来越多的证据)表明,重试干预确实有帮助。我还没有读到任何关于间隔效应的文献,这些文献根据最初的反应成功率来区分表现 (再次,尽管我希望这样的研究确实存在)。
-
助记媒介的功效在不同的平台-知识-风格主题中是如何变化的?
-
提取强度下降可能是记忆干扰的函数,而不是时间的函数
- 间隔效应通常表述成「记忆随着时间的推移而消退,所以我们应该研究它何时消退」。但这种随时间推移的衰退可能不是随时间推移自然发生的,而更应归因于干扰——学习其他材料的结果。
-
2021-02-28 - 2021-03-06
- 间隔效应是存在的,但很难观察清楚。
-
2021-03-07 - 2021-03-13
-
2019-12-16
- 9:12:写了间隔效应和间隔重复记忆系统效率极高
-
A Contribution to Experimental Psychology (H. A. Ruger & C. E. Bussenius, Trans. ) 。(原作 1885 年出版)
- 在这一章的结尾,他提出了一个关于间隔练习和集中练习的关键观察。在第六章中,他发现一个用 68 次重所习得的 12 音节串,需要在第二天重复 7 次才能重新记起。但在这个实验中,他发现在三天内重复 38 次,在第四天也产生了同样的结果。7 次重复后重新记起。这是一个非常令人兴奋的结果,它表明时间安排不同,耗费的力气差异非常大(即间隔效应)。
-
筹备 2020 年 FOO 营会谈(Foo 营是由出版商 O'Reilly Media 主办的年度黑客活动。)
-
对量子国度的分析
-量子国度没有显著的间隔效应。
-
Marr 的水平分析
-
A Multiscale Context Model of Memory. In Y. Bengio, D. Schuurmans, J. Lafferty, C. K. I. Williams, & A. Culotta (Eds.), Advances in Neural Information Processing Systems 22 (pp. 1321-1329).
-
[[Roediger, H. L., & Karpicke, J. D. (2006).The Power of Testing Memory: Basic Research and Implications for Educational Practice. Perspectives on Psychological Science, 1(3), 181-210. https://doi.org/10.1111/j.1745-6916.2006.00012.x]]* 关于间隔效应:
-
[[Rohrer, D., Dedrick, R. F., Hartwig, M. K., & Cheung, C.-N. (2020). A randomized controlled trial of interleaved mathematics practice. Journal of Educational Psychology, 112(1), 40–52. https://doi.org/10.1037/edu0000367]]* 交错练习是间隔效应和测试效应的天然温床:
测试效应
如果你努力回忆某个细节,那么行为的本身会强化对细节的记忆。在学习上这么做时,被称作「提取练习」。
实验证明,即使在没有提供正确答案的情况下,甚至在给予应试者「开卷」以寻找正确答案的情况下,也会产生这种效应。这种效应已经在许多领域和许多年龄段上得到了证明。
这表明测试的作用明显不同。在典型的课堂上,教师和学生都认为学习是发生在讲课过程中,或在阅读材料时。测试是用来评估学习的。但事实上,测试本身就是学习过程中的一个重要部分。
与其他学习活动对比
尽管学生在练习过程中的成功率较低,但提取练习比单纯通过重复阅读学习材料能带来更持久的长期记忆 (Roediger, 2006)。相关文章:合意困难(术语来自 Bjork)。
总体而言,单与基于精细编码的练习相比,测试效应似乎还能带来更持久的记忆 (Karpicke and Smith, 2012),并改善学习表现 (Karpicke and Blunt, 2011)。
格式
一般来说,测试效应在生成式测试(简答题、作文)中比在判别式测试(多选题 / 判断题)中更明显 (例如 Kang et al, 2007)。这可能是由于生成效应。
参考文献
综述
Branwen, G. (2009). 高效学习的间隔重复。2019 年 12 月 16 日检索,来自 https://www.gwern.net/Spaced-repetition
评论
Roediger, H. L., & Karpicke, J. D. (2018). Reflections on the Resurgence of Interest in the Testing Effect. Perspectives on Psychological Science, 13(2), 236–241. https://doi.org/10.1177/1745691617718873
一手研究
//doi.org/10.1080/09541440601056620
//doi.org/10.1126/science.1199327
//doi.org/10.1016/j.jml.2012.02.004
反向链接
-
间隔重复记忆系统
- 间隔重复记忆系统结合了测试效应和间隔效应,能够高效地记忆成千上万事实类的知识(间隔重复记忆系统非常高效)。有些人还扩展了它的用途(见下文)。间隔重复记忆系统使记忆成为一种选择,但它们不只仅用于背诵事实:间隔重复记忆系统可用于发展概念性理解。
-
间隔重复记忆系统可用于发展概念性理解
- 值得注意的是,间隔重复的认知心理学基础(测试效应)已被证明适用于概念性知识和陈述性知识(见Karpicke和Blunt,2011)。
-
生成效应
- 这种效应有时被等同于测试效应:当学生被要求从记忆中提取答案时(如在自由回忆测试中),对回忆质量的影响可部分归因于生成答案的过程。但 Karpicke 和 Zaromb(2010) 的实验表明,这两种影响是不同的,而且在一定程度上可能是彼此独立的。通过尝试生成目标来学习的人,最终比通过尝试回忆来学习的人回忆质量更差。
-
常青笔记的维护近似于间隔重复
-
提取练习
- 学习活动旨在产生测试效应的学习活动。
-
Nate Kornell
- 威廉姆斯学院的认知心理学教授,Robert A. Bjork 的学生。他围绕间隔效应和测试效应进行了大量研究。
-
间隔重复记忆卡片应确保复习者必须从记忆中提取出答案
-
§认真对待知识工作(Stripe 融合讲座,2019-12-12)
-
Jeffrey Karpicke
- 实验认知心理学家,经常研究测试效应。曾与 Henry L. Roediger 合作。
-
2020-11-03
-
2020-11-01 - 2020-11-07
-
2019-12-16
- 8:42:写了间隔重复记忆系统让记忆成为一种选择和测试效应
-
[[Karpicke, J. D., & Blunt, J. R. (2011). 提取练习产生的学习效果比用概念图进行的精细学习要好。Science, 331(6018), 772-775. https://doi.org/10.1126/science.1199327]]* 实验比较了概念图(调用精细编码)与提取练习(调用测试效应)对记忆的影响。与 Karpicke 和 Smith(2012) 一样,本文也对提取练习的效果是否似乎是由于精细编码,或者是否有其他过程发生感兴趣。
-
[[Karpicke, J. D., & Smith, M. A. (2012). 提取练习和精细编码的单独记忆效果。Journal of Memory and Language, 67(1), 17-29. https://doi.org/10.1016/j.jml.2012.02.004]]* 测试效应是由精细编码产生的吗?当你在间隔重复记忆系统中复习卡片时,你给自己一个机会,根据你当前的背景和复习过程中的不同想法形成新的联系。
-
[[Karpicke, J. D., & Zaromb, F. M. (2010). 提取模式区分了测试效应和生成效应。Journal of Memory and Language, 62(3), 227-239. https://doi.org/10.1016/j.jml.2009.11.010]]* 测试效应和生成效应是同一回事吗?它们经常被等同起来,事实上,我在自己的笔记中也曾将它们等同起来。本文描述了一系列的实验,试图证明有不同的基本机制在驱动这两种现象,而且提取练习对记忆的影响比生成更大。
-
筹备 2020 年 FOO 营会谈
-
[[Roediger, H. L., & Karpicke, J. D. (2006). 测试记忆的力量:基础研究和对教育实践的影响。Perspectives on Psychological Science, 1(3), 181-210. https://doi.org/10.1111/j.1745-6916.2006.00012.x]]* 关于测试效应的详尽综述论文。这篇论文涵盖了在实验室环境和更实际的课堂环境中对测试的实验历史,并回顾了作者的一些最新研究。Henry L. Roediger
-
[[Rohrer, D., Dedrick, R. F., Hartwig, M. K., & Cheung, C.-N.(2020). 穿插式数学练习的随机对照试验。https://doi.org/10.1037/edu0000367]]* 穿插练习为间隔效应和测试效应创造了一个自然环境:
穿越时间的文本
原文:Timeful text (andymatuschak.org)
大众传媒大多缺乏超过一天的创制时间维度。这个维度对于创作很是强大,值得探索,例如指导冥想的应用程序是自然地随时间分散开来。
我们可以把具有创制时间维度的文本称为穿越时间的文本。
参考文献
迁移学习
原文:Transfer learning (andymatuschak.org)
关于一个活跃的兴趣领域,见:提取练习和迁移学习。
参考文献
- Reder, L., & Klatzky, R. L. (1994). Transfer: Training for performance. In D. Druckman & R. A. Bjork (Eds.), Learning, Remembering, Believing: Enhancing Human Performance (pp. 25–56). National Academies Press. https://doi.org/10.17226/2303
准备读:
-
Barnett, S. M., & Ceci, S. J. (2002). When and where do we apply what we learn? A taxonomy for far transfer. Psychological Bulletin, 128(4), 612–637. https://doi.org/10.1037/0033-2909.128.4.612
-
Gick, M. L., & Holyoak, K. J. (1987). The Cognitive Basis of Knowledge Transfer. In Transfer of Learning (pp. 9–46). Elsevier. https://doi.org/10.1016/B978-0-12-188950-0.50008-4
太过执迷「专注」反而不利于创造性工作
原文:A rigid fixation on “focus” can harm creative work (andymatuschak.org)
生产力文化着迷于「深度工作」、专注等等。但是对于创造性工作来说,一定程度的偶然性和自发性是非常重要的。
有时候,向意想不到的输入敞开心扉可以带来好处——你会产生本不会有的想法。
在其他时候,注意那些分散自己注意力的心理冲动是有帮助的,因为它们可能表明你有微妙的潜意识直觉ーー可能是有用的探索方向。或者它们可以帮助你理解,你实际上对当前的项目或其中的一些元素并不感兴趣。
而且,根据经验来说,一整天高度专注于困难的创意性工作,几乎是不可能的!每天花几个小时以上的时间做一些困难创造性的工作是很困难的
相关笔记:在创造性工作中利用探索启发式的动力
参考文献
https://twitter.com/michael_nielsen/status/1411701234768171010?s=20
「专注」这种状态有些奇怪。我以前觉得分心会很糟糕。对于某些机械但是必要的工作,一鼓作气干完是最好的。但是对于一些需要丰富联想的创造性工作,半专注状态可能也有好处。
强大的愿景是伟大创造性作品的先决条件
原文:A strong vision enables great creative work (andymatuschak.org)
在追求开放的创造性工作时,你无法通过制定分步计划来实现你的目标。以任务为中心的生产力策略无济于事:最难的地方是想清楚该做什么。由于这些挑战,你很容易失去动机和方向。然而,强大的(写下来的)愿景可以提供指导,鼓舞动机。
伟大的愿景应能激发兴趣,让人兴致高涨,但其基础是你实现这一愿景的关键方法。你实现愿景的方法中有一些有力想法,这是你应该理解的,此外,你还应该指导你需要在哪些方面改进自我。
引用 Michael Nielsen 的《有效研究的原则》,有效的愿景提供了「关于{一个人想要实现什么},{为什么想要实现它},以及{如何实现它}的{清晰的想法}。」
如果不清楚这些要点,很容易陷入开展排遣行为的误区:任务完成许多,但并没有做成一件有意义的事情。但是,足够清晰且能激发兴趣的愿景提供了一股动力,让我们拒绝快速收效的小利,而选择缓慢艰苦(但更有意义)的活动。
这种愿景是一份有生命力的文件,需要不断修订和重新解释。愿景并不意味着限制未来的行动,而是激励未来的行动。另外:计划本身不算什么,计划过程才是关键
参考文献
高效人士对他们想要实现的目标有一个愿景。理想情况下,这种愿景既包括长期价值观和目标,也包括短期目标。好的愿景可以回答诸如此类的问题:我想成为什么样的研究者?我对哪些研究领域感兴趣?我将如何掌握研究这些领域的能力?为什么这些领域很有趣?我将如何继续成长,扩大我的视野?我将采取哪些短期步骤来实现这些目标?我将如何平衡长期目标与我所处的短期现实?
Nielsen, M. A. (2003, September 8). Extreme thinking. Tough Learning, Brisbane, Australia.
保持这种独立性的关键,是发展出长期愿景,这种愿景能激发兴趣并且内化于心,于是人便能而拒绝短视行为,这种行为短期收效显著,但长期可能有损害。
附加问题能够提高学习者对相关但未直接测试的内容的理解
原文:Adjunct questions improve comprehension of related but untested content (andymatuschak.org)
除了测试效应外,在阅读文本时回答问题(附加问题)促进了更好的整体吸收,包括文本中未经测试的材料。
这可能主要是因为它增加了阅读时的注意力和专注度:Rothkopf 在 1966 年的研究中发现,仅仅通过告诉学生「缓慢且细致地阅读」,就能提高他们对未测试问题的理解。但 Hamaker 在 1986 年的回顾研究中强调,这种效应更多地集中在与测试内容相关但并未被直接测试的材料上,而不是那些完全无关的内容。在某些条件下(例如对高阶问题的回答,或在没有时间限制的情况下),对无关材料的影响很小。这与助记媒介的影响形成了有趣的对比:助记媒介可能会促使读者更缓慢、更专心地阅读。
对于相关但未被测试的材料,这种效应既可以向后影响(例如,使读者对刚读过的相关内容进行更深入的加工,这可以被看作是一种广义的测试效应),也可以向前影响(比如,激发相关的前置知识,这是预测试效应的一种表现)。
参考文献
-
Hamaker, C. (1986). The Effects of Adjunct Questions on Prose Learning. Review of Educational Research, 56(2), 212–242. https://doi.org/10.3102/00346543056002212
附加问题
原文:Adjunct questions (andymatuschak.org)
在阅读过程中插入的问题。可以在阅读材料的前后提出。例如,在阅读材料之后提出这些问题,可以加强对特定信息的记忆,这就是所谓的测试效应。不仅如此,这些问题还有一个更广泛的作用:附加问题能够提高学习者对相关但未直接测试的内容的理解。而且似乎存在预测试效应。
相关笔记:
参考文献
-
综述
-
Hamaker, C. (1986). The Effects of Adjunct Questions on Prose Learning. Review of Educational Research, 56(2), 212–242. https://doi.org/10.3102/00346543056002212
使用笔记在内容中建立联想的优缺点
原文:使用笔记在内容中建立联想的优缺点(andymatuschak.org)
当发现正在阅读网页可能与我们硬盘里某些PDF有联系时,我们没有办法直接为他们建立关联,但可以通过建立笔记来连接这两个资源。
这与memex解决方案(Bush , 1945)不同,后者设想了任何种类的文件--你的或别人的--之间的直接联系。
写笔记是好的,因为它迫使你独立思考,然而它有点费心思,因为常青笔记应该以概念为导向。因此,为了写笔记,我们必须提取两者之间的概念联系,为其命名,并以某种可能引出未来联系的方式安排它。
当进行写你所读,以求内化时,我们有两层笔记:在我们的参考图书馆里有关于阅读本身的轻量级笔记,然后在我们的笔记档案里有更高保真度的常青笔记。支持并维护这两层关于联想保真度的笔记也可能会很有价值,方法是:在材料之间进行轻量级的联想,逐渐将有价值的观察“编码”成持久的笔记。
参考文献
Bush, Vannevar. “As We May Think.” Atlantic Monthly, July 1945.
Alexander——地球大小般巨大果壳中的保守哲学
原文:Alexander - Reactionary Philosophy In An Enormous, Planet-Sized Nutshell (andymatuschak.org)
https://slatestarcodex.com/2013/03/03/reactionary-philosophy-in-an-enormous-planet-sized-nutshell/
Scott Alexander 试图通过对保守主义观点的意识形态的图灵测试。另见反保守 FAQ,同载于 Slate Star Codex。 以下是我对该总结的总结(注:基本不是我的观点):
现代社会压制对进步观点的批评
我们怎么知道我们生活在最好的社会中?从历史上看,罗马公民认为他们是文明的顶峰。我们应该始终寻求改进。
这就是全权主义国家如此糟糕的部分原因:你不能批评斯大林主义的俄罗斯,因此它无法被改进。但也许现代社会也有类似的机制。如果你试图批评一个社群做出的任何左倾举动,你可能会造排斥和解雇。然而不是每一个动作都是 100% 正确的,所以这应该引起人们的一些关注。
许多进步与其说归功于社会变革,不如说归因于技术
Scott 的举例:
-
20 世纪初英国的犯罪率不到今天水平的 1/10。
-
在过去的半个世纪里,美国的暴力犯罪率一直在下降
-
一个世纪前的哈佛入学考试要困难得多
-
历史上的美国总统会说多种语言
- (行吧,但现代美国总统必须更深入地了解许多更复杂的全球问题……)
尽管有巨大的技术进步和弗林效应,但情况确实如此。
文化因素在解释人口群体不同成果时被低估了
压迫是对少数族群较差表现的进步主义(「外部主义」)解释:白人没有取得更好的成果,并不是因为其文化或主体之类的内在事物,更是因为他们残酷地利用了他人。另一种解释(「文化主义」)是,该结果是不同社会的不同规范、做法、信仰等导致的。
在 20 世纪后期,美国的黑人与白人之间的收入差距并没有明显缩小,尽管那段时期的压迫大大减少。与此同时,在同一时期,(所有种族的)妇女遭受的压迫减少了,她们有意义性地缩小了与男子的收入差距。
Scott 指出,一些种族(例如犹太人和中国人)经历了实质性的压迫,但他们的表现似乎并没有以同样的方式受到损害,该变化不能用他们受压迫程度的变化来解释。
外部主义的另一个问题是,在全球范围内,各种人口统计数据的结果根据其原生文化高度相关,尽管不同国家在国际上对这些群体的待遇相当不同。
而一些群体间的差异不能轻易地用压迫来解释。例如,年收入 6 万美元的华裔家庭的入学率显著高于年收入 6 万美元的非裔家庭。
另一方面,文化因素可以解释为什么一些少数族群如此成功(即使受到压迫)以及为什么这些规律在国际人群中存在。
将同化妖魔化会阻止成功模因在不同文化间传播
美国历史早期的许多移民群体(爱尔兰人、意大利人、犹太人)受到诋毁,但现已完全与美国社会同化,其所历经的表现与大多数人口统计数据大致相同。保守派辩称,由于抵制「文化帝国主义」的进展性推动(如应允许西班牙裔学生在学校说西班牙语;应颂扬和鼓励黑人文化独立存在等),而其他少数族群并没有发生这种情况。 但如果多数文化包含产生更好结果的信仰和实践,反同化将阻止少数文化接受这些模因。
移民稀释了占据主导地位的模因组
如果文化主义者的解释是正确的,它意味着一个拥有成功模因集的社会只能容忍来自模因集不太成功的社会的有限数量的移民,以主体文化的实践最终也会消失。
帝国主义居然取得了更好的成果?
今天,在后殖民化时代,被殖民的非洲国家几乎在所有方面都比从未被殖民过的埃塞俄比亚更安全、更幸福。相较于中东其他大部分地区,以色列也同样如此。当然,还不清楚这种反事实的现象会如何发展,但似乎殖民化确实转移了一些成功的模因。当代的类比物可能看起来更像国际投资(中国正在非洲广泛开展,显然产生了积极影响),但美国进步人士反对这种参与,理由是其代表了新殖民主义。
全权主义和自由之间的山谷比任何一方都糟糕
巴勒斯坦显然更愿意独立。但以色列不会让其发生。所以不幸的是,他们生活在一个受压迫但却不是全权主义的境地中,他们要为自己的命运负责,但却受到不可能的约束。Scott 评价这种独立的缺场,他们最好只是作为以色列领土的一部分被吞并,然而这并不可能,因为进步主义已将强烈抗议此种吞并行为作为一种文化规范。
与此相关的是,监狱群岛状态也属于这个山谷中。挪威给予囚犯很大的自由。而我们则不太可能如此。保守派认为,即使是相当轻的体罚,也比我们目前的中间状态更具威慑力,因为这种情况既不是有效的威慑,也不是有效的康复计划(但代价高昂,对社会有害)。但由于进步主义的存在,体罚(比如说,鞭刑 50 下)是不可能的。
另外还有,关于战争:
广岛核爆造成大约 15 万人死亡。越南战争则造成约 300 万人死亡。后者还具有更大范围的非死亡影响,从人们被强暴,折磨和挨饿到成千上万的人最终患有 PTSD,无数人的生活被打乱。如果核爆河内是越南战争的一个替代方案,那将是个极好的选择。
进步主义的性别角色似乎让女性更不快乐
在 50 年代,女性的幸福感高于男性;今天则倒转过来了。有家务分工的进步婚姻更有可能以离婚告终;双职工的婚姻也是如此。后者可能是双职工家庭的问题,而不是性别固有的问题:传统婚姻是为了确保有人可以全职照顾家庭。反动主义者认为,女权主义者迫使媒体将英勇的女性描述为工作者,而不是家庭主妇,所以我们最终得到了这个更恶劣的结果。
进步主义对抗社会团结
我在许多群体中听到过这样一种说法: 「多样性是团结我们的纽带」。这很美好并且令人难忘,但还有其他一些团体,单一就是他们的力量,而且他们似乎更团结。
我们的文化致力于颠覆自身,指出自身有多糟糕,而其他文化有多好。这与维多利亚时代英国的「天佑女王」式的情感形成了鲜明对比。
进步主义反对沙皇
进步主义主张个体自由和自主权,这意味着人们最终会根据自己的动机来行事。但有时你需要一个「非激励性的激励者」——例如,以独断的方式修复医疗保健系统,结束企业福利,堵塞税收漏洞等等。 而进步主义则反对这种形式的沙皇。而在一个民主国家,社会总是会随着时间的推移而变得更加进步,因为进步主义是大众的诉求。所以我们最终没有人有威信解开这个死结。
应用卡的答案不应该从记忆中得出
助记媒介可以通过简单的应用卡帮助读者应用他们所学的知识中描述的任务促使读者使用他们所学的知识来得出答案。如果读者只是记住答案,这些卡片就没有实现自身的目的:他们变成了回忆卡。对此,我们的简单解法是应用卡在重复时应发生变化。
问:为什么助记媒介的应用卡的答案不应该从记忆中提取?
答:读者应该灵活运用他们所学的知识来产生答案,而不是从记忆中提取答案。
原文:Answers to application prompts shouldn’t be drawn from memory (andymatuschak.org)
反向营销
原文:Anti-marketing (andymatuschak.org)
在公开演讲时,研究人员和企业家都倾向于对他们的工作做出最美好的描述。这往往会导致夸大其词(报喜不报忧),并导致与他人的关系变得不那么个人化,更像是交易关系。一个有趣的解药是积极实践「反向营销」:公开关注一个人的项目中最不美好的部分——哪里困惑不解,哪里倍感挫败,哪里无法成功。
如果你把反向营销作为目标,那么有趣的挑战就会变成一件积极的事情:成为公众谈话的素材,而不是被扫地出门的东西。至少在大多数时候,你应该专注于你的项目的最大挑战,而不是什么进展顺利。我猜想这也会与你的观众建立一种更深、更真实的关系(参见敞开车库门工作)
这个术语是由 Michael Nielsen 在 2019 年 11 月创造的(据我所知!)。
问:把公开对话的重点放在个人项目中最不乐观的因素上,对此 Michael 的术语是什么?
答:反向营销。
应用程序无法很好地记录滚动条的历史位置
原文:Applications don’t reliably maintain scroll positions (andymatuschak.org)
具有长可滚动区域的界面(例如长文本,消息历史)会让人感到麻烦和不可靠,部分原因是应用开发人员没把记录阅读位置当作应用的重要组成部分。
如果用户收藏一条消息,或者打开了按条件搜索,这通常是一个持续型行为;取消操作之后数据可能会丢失。相比之下,界面中的常见操作都会丢失滚动位置。
这里的一个关键点是,虽然滚动行为通常通过一个共同的系统级组件来实现,但滚动位置的语义解析在应用程序状态却是由界面决定的。例如,同一个视窗可能用于显示多个不同的话题聊天记录。在某些情况下,保留并恢复最近浏览的聊天记录的滚动位置更合理;在其他情况下,为每个聊天记录独立保留滚动位置更合理。因此,保留这种状态不能通常在其本应所在的层上进行。
相关笔记:
问:为什么应用程序不能可靠地保留界面视图的滚动位置?
答:开发人员并不认为滚动位置是界面状态的重要组成部分。
问:记录滚动位置的应用程序状态有哪些难点?
答:(例如,通常 UI 框架想要成为“模型”,视窗标识的语义解释有微妙的变化,等等)
参考文献
推特用户 Omar Rizwan:「我对滚动条害怕又反感(例如,向上滚动很长时间以查看聊天记录),因为我知道应用程序开发人员并不认真对待它们。比如我会在中途点击另一个聊天,之后又回到我曾向上滚动的聊天,然后发现原来的滚动位置已经丢失了。」
创制环境极大程度受作者的动机塑造
原文:Authored environments are significantly colored by authors’ motivations (andymatuschak.org)
创制环境中,活动也许本身具有一些表层目标,但作者的动机会影响这些目标,并赋予其一些特征。当作者、参与者和活动的目标一致,作者能够创造出强效的环境;当他们相互抵触时,环境就无法变得融贯起来。
例如,有一些非虚拟作品的出发点,是调动读者对某个主题的积极性,使读者有激情去深入学习。如果作者由衷喜爱这一主题,以至于不吐不快,则其作品的行文水平也随之水涨船高。相比之下,若是出于义务而撰写一本教科书,对内容本身并无兴趣,那么写出的文章也无从传达热情,有辱其使命。
Haskell 据称是和 Python 一样的,可用于生产的企业级编程语言。能想到的「真正」编程时所需的功能,这门语言都有。然而 Haskell 开发者的主要动机是这门语言的理论特性,这一点可以从各种细节中窥见。尽管 Haskell 在其他方面发力良多,它主要还是在辅助研究者更有效地思考 Haskell 所践行的编程语言理论,是这一方面的赋能环境;对于编写软件的人则并不如此。Smalltalk 与其类似。
孢子被包装成动作/冒险游戏,在游戏中你可以创造自己的生命体,然后征服银河系。但我感觉,孢子的创造者的主要动机是研究模拟和程序式生成的机制。游戏的这些部分很饱满,很吸引人,但「主要」的游玩环节感觉是后来添上的一笔。
Michael Nielsen 指出,阿波罗计划的目的是让进入太空优先于其他任何事项(参见强大的赋能环境通常是作为追求自身内在意义的项目的副产品而产生的。这也是一个创制环境:它的管理者通过设计一些流程和营造一种氛围来促成这一愿景。当然还有官僚主义:通过设定进入太空的目标,官僚主义是否变得不那么具有阻碍性?
参考文献
Email with Michael Nielsen, 2019/08/23. Re: Transcending the Primer
Email with Michael Nielsen, 2019/09/02. Re: ❲FYI❳ Some notes on enabling environments / anti-educationalism
Maxis Emeryville. (2008). Spore.
作者可能会从纸质书销售中赚取更多收入(在也销售电子书的同时)
原文:Authors may make more from print sales (when also selling ebooks) (andymatuschak.org)
我不确定这是否正确,但是有趣的是,我认识的那些同时出版纸质版和 EPUB 版的作者,他们从前者的销售中赚得更多。大概这是一个数量的问题,而不是版税结构或类似的东西:电子阅读的流行程度远远落后于所有的书籍阅读。
反向链接可以用来隐式定义知识管理系统中的节点
原文:Backlinks can be used to implicitly define nodes in knowledge management systems (andymatuschak.org)
显示节点反向链接的系统,使得一种新式行为成为可能:为定义新节点,也可以从其外延(extensionally)(而非其内涵(intensionally))出发,在其他节点建立指向这个节点的链接——这个节点甚至可以没有任何内容。(外延,一个想法或(语言)表达的外延由它所适用于的事物构成;)
在 Conor White-Sullivan 使用 Roam Research 时的行为中,我第一次注意到这一点。他在整个系统中的几个笔记里都提及了我们的对话(临时性的每日日志、功能列表等)。他每次都把某些名词短语(例如我的名字)写成了链接。这些节点本身没有内容,但随着他在几天内都这样行事,这些节点开始在他的系统中形成了以反向链接为载体的隐式定义。
实现这种效果需要上下文反向链接:单纯的反向链接列表对于隐式定义节点不够有效。能查看反向链接的上下文是有必要的,因为需要理解暗指的内容。
我发现这种隐式定义对艺术术语和各种专有名词特别有用。
我也在我的烹饪笔记中试验这种技术;例如卷心菜这则笔记(但不幸的是,这则笔记在我的公共笔记中不会显示反向链接,因为它们来自我的私人周记)。
背光显示器限制计算机只能在室内使用
原文:Backlit displays limit computers to interiors (andymatuschak.org)
生活在加利福尼亚,欢乐多又多。如果能有更多的户外工作时间就更好了,但电脑的背光显示器在这种情况下是行不通的。
我不需要一个完整的工作站。如果我可以在外面做哪怕是简单的任务,比如阅读和书写文件,都能让我很兴奋。当然,人们可以使用实体文件,但这对计算机支持的思考不适用。
电子墨水显示屏是一个令人兴奋的替代方案,但它们还没有被用来认真解决这个问题。即使只考虑作为一种阅读设备,Kindle 的表现也很糟糕;见:在电脑上阅读文本是不愉快的。reMarkable 是一个有希望的尝试(但很不幸,它的缺陷相当大)。
Dasung Paperlike HD 是一个很有前途的方向:只需将电子墨水显示器连接到电脑上。还有几款电子墨水安卓平板电脑(特别是来自 Boox 的),但我担心这些软件栈*仍然相当原始。(*译注:软件栈(Software Stack),是指为了实现某种完整功能解决方案(例如某款产品或服务)所需的一套软件子系统或组件。)
「更好地记笔记」这个描述太过流于表面;核心在于「更好地思考」
原文:“Better note-taking” misses the point; what matters is “better thinking” (andymatuschak.org)
很多人都在写文章提出方案尝试解决笔记写作实践通常是无效的这一问题。这些文章中的绝大部分都着眼于一个短视的、「生活黑客」式的框架上,聚焦于这些类似的问题:「我应该如何组织我的笔记?」,「我应该使用什么样的笔记本?」,「我怎样才能更容易提取我所读的片段到笔记?」等等。
对这些问题的回答无法令人满意,因为问题的重点不在这里。我们的目标不是做笔记——目标是有效地思考。更好的问题是 「什么做法可以帮助我长期可靠地发展洞察力?」,「我怎样才能有效地引导我的注意力?」等等。这就是常青笔记作为知识工作的基本单位的框架,它是有意义的:常青笔记有助于洞察力的积累。
就技术而言,重要的不是「计算机支持的笔记」,而是「计算机支持的思考」。
我们容易把注意力集中在「做笔记」上,因为它是一个虚无缥缈的实践中的可见部分:如果你看到一个有洞察力的人在他们的笔记本上写东西,你可能会想,如果你得到一个合适的笔记本并把它整理好,你也会变得有洞察力。当然,做笔记是有可实操的。它相对容易,而且感觉像在做正事,即使它是无用的(写笔记的做法提供了弱反馈)。所以它是一个令人上瘾的麻烦。
参考文献
Matuschak, A. (2019, December). Taking knowledge work seriously. Presented at the Stripe Convergence, San Francisco.
与迈克尔-尼尔森的对话,2019-12-16
计算机支持的思考
头脑风暴往往可以替代缺位的见解积累系统
原文:Brainstorming may often substitute for missing insight accretion systems (andymatuschak.org)
与其他人一同头脑风暴,可以创造出流动的社交情境以便交流想法,但当我们独自进行头脑风暴时,我们也创造出一片广阔的空间,来募集我们已经「几乎知道」的东西。头脑风暴能得出的想法主要受限于我们在这个空间里的事先思考和构思(见卓越洞见从既往的所思所想中涌现)。
头脑风暴中,人的思维方式是生成性、非批判性的,这种思维方式可能会带来出乎意料的结果,但头脑风暴也常常用于将脑中有关某个话题的所有想法全部倾吐出来,集中在一起。需要头脑风暴来集中想法的做法,也可能表明我们没有按照知识工作应能聚沙成塔的想法设计知识系统。得益于常青笔记和稠密的关联结构(见常青笔记之间应该建立大量链接),我们得以持续收集和提炼各种想法。常青笔记有助于积累洞见,所以头脑风暴便不太必要了,因为这些见解已经在日常工作中涌现出来,并接连不断地被记录下来。
参考文献
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
由于很少人教授或讨论记笔记的正确方法,几乎所有的写作指南都建议从头脑风暴开始,也就不足为奇了。如果你一路上没有写作,大脑的确是唯一可以依赖的去处。就其本身而言,头脑风暴不够好:既不客观也不可靠——在学术或非虚构写作中,这两个方面相当重要。推广从头脑风暴开始的做法更令人惊讶,因为头脑风暴不是大多数想法的起源。预想着通过头脑风暴从脑子中搜罗出的东西,本来也不在脑子里。
谈到记笔记,许多学生和学术写作者的想法与早期的船主一样。他们以立竿见影的方式处理他们的想法和发现:如果读到有趣的句子,就在下面划线。如果想做点评,就在空白处写下来。如果想到一个点子,就记到笔记本上,如果一篇文章看起来足够重要,就努力写一篇摘录。这样做会让你在很多不同的地方留下很多不同的笔记。那么,这在很大程度上就意味着需要靠大脑来记住这些笔记是在何时何地写下的。然后,必须从这些笔记中独立地构思一个文本,这就解释了为什么这么多人在事后根据这种先入为主的想法,借助头脑风暴来安排资源。
桥注紧密地联系两个相邻的术语
原文:Bridge notes narrowly relate two adjacent terms (andymatuschak.org)
假设另一个人对一个与你自己的想法相似的想法进行了深入思考,他们的结论似乎大多相似。你们对该理论的各种属性都有自己的术语。你很想把对方的术语归入自己的术语,但你的概念和他们的概念之间可能存在着微妙的差异,在这个过程中它会丢失。你可以直接使用对方的术语,但有时当被固定在先前的术语上时,很难进入新的方向,因为这些术语可能带有许多内涵。然而,你也不想不断地参考两套术语。
有个解决方案是创建一条笔记,将你的专业术语与类似的联系起来。这在理论之间建立了「桥梁」,描述了你们术语间的异同。用不同的主干笔记维护各自的术语体系——而桥注只是为了联系两者。比如说:常青笔记和卡片盒笔记法的异同。
这样的笔记让我想起了关系型数据库多对多连接表中的记录。
参考文献
与伊戈尔-德沃尔金的对话, 2020-05-11
Butler, A. (2010). 相较于重复学习,重复测试的迁移学习效果更好. Journal of Experimental Psychology. Learning, Memory, and Cognition, 36, 1118–1133.
论文调查了提取练习和迁移学习。其包含了几项迁移程度逐步提高的实验。
受试者是 WUSTL 的心理学本科生。他们阅读 Wikipedia 上的通识短文。实验 1b 和 2 要求受试者在同一主题内下做出推论。实验 3 要求受试者依所读的内容对不同的主题做推论。这些实验结果表明在概念性和事实性问题上,相比重复学习,提取练习的迁移效果更好,这与逐字复述型问题条件下的实验结果相似。
实验 1a 和 1b 也通过改变问题文本探索了「间隔重复记忆系统用不同的问题文本会有更好的表现吗?」这一问题,但发现结果没有差异。
这项研究的一个关键限制是:学生们被「明确告知在期末测试中与他们先前学习的知识有关」,因此他们不需要去辨认信息对远迁移任务的适用性,他们只需重新回想与之有关的信息。(感谢 Martin Bernstorff 指出这一点)。
问:高阶实验设置?
答:心理学本科生阅读短文,重复学习或重复测试,再于一周后考试。
问:主要发现是?
答:在近迁移和远迁移中,相对于重复学习,提取练习可以提高学习者面对迁移类问题的表现,其幅度与逐字复述型问题相近。
问:关于「间隔重复记忆系统用不同的问题文本会有更好的表现吗?」这一问题的发现?
答:结果:无差异。
问:关键限制对提取练习和迁移学习的影响?
答:学生们被明确告知在期末测试中与他们先前学习的知识有关联,所以他们不需要去辨认它的适用性。
COGS 101B - 第 19 课 - 长期记忆 - 编码、提取、巩固
原文:COGS 101B - Lecture 19 - Long-term Memory - Encoding, retrieval, consolidation (andymatuschak.org)
问:Bower 和 Winzenz (1970) 如何证明形成视觉图像后,记忆提取效果更好?
答:在配对联想任务的学习阶段,他们要求一些受试者想象单词之间相互作用;这些人的回忆率几乎是其他人的三倍。
问:Slamecka 和 Graf (1978) 如何证明生成效应的存在?
答:在配对联想任务的学习阶段,他们要求一些受试者补全配对联想中的词干;他们的回忆能力略好于仅仅阅读了词对的学生。[[slam
问:Bower 等人 (1969) 如何证明学习有组织的信息,学习者提取能力会增强?
答:他们给学习者一些按树形结构组织起来的矿物名称清单,一些矿物名称清单的组织形式反映了其真实的命名法则,另一些则随机安排成树的。使用前者组织的学习者,对矿物名称的回忆效果有 70-100% 的提升
{自我参照效应}:当{信息与自己相关}时,回忆效果增强
问:Rogers 等人 (1977) 是如何证明自我参照效应的?
答:他们请人们回答有关词语的问题,其中一个问题是「这个词能描述你吗?」问这个问题后,单词的回忆率是中性任务的 2-6 倍。
{编码特异性原则}:当{提取上下文与编码上下文匹配}时,信息更容易回忆起来。这个原则也称为{上下文相关记忆}。(例如 Godden 和 Baddeley,1975)
问:Godden 和 Baddeley (1975) 如何说明上下文相关记忆的存在?
答:让人们在水下或陆地上学习和参加测试。学习和测试条件匹配时,人们表现比不匹配时提升 35-50%
{状态相关记忆}:与特定{内部状态}依赖的信息(例如 Eich 和 Metcalfe,1989)
问:Eich 和 Metcalfe (1989) 如何说明状态依赖记忆的存在?
答:对人们进行一些操作,让他们开心或者悲伤,之后让他们学习,接受测试。学习和测试心情匹配时,人们的记忆表现比不匹配时提升 50%-100%.
巩固
{记忆巩固}:{将脆弱的新记忆转化}为{更具抗干扰性}的状态的过程
问:Muller 和 Pilzecker (1900) 是如何证明存在记忆巩固过程的?
答:使用了两个列表测试回忆效果,其中一个列表的内容格子是紧挨着的,另一个有 6 米的间距,之后对第一个列表进行了测试。当有间距时,受试者回忆效果增加到 ~2 倍。
{长时程增强}:重复活动导致{突触强化} (Bliss 和 Lomo,1973)
{系统巩固}(学习上):应对特定活动而发生长期的{神经回路重组}
问:与系统巩固相比,突触整合的时间尺度更短/更长
答:更短
问:有哪两种主要的记忆巩固方式?
答:突触巩固和系统巩固
在记忆巩固的{标准}模型中,{海马体}会进行{重新激活}:{重演与一条记忆相关的活动}来{刺激皮层中的连接}。
问:在记忆巩固的标准模型和多迹模型中,海马体的作用有什么不同?
答:在标准模型中,海马体一开始会参与来刺激链接的形成,但后来就不参与了。在多迹模型中,即使记忆是陈旧的,海马体也会参与情节记忆。
问:在记忆巩固的多迹模型中,当记忆是什么类型时,随着时间的推移,海马体仍然参与记忆的提取?
答:情节型
::to continue: COGS 101B - 学习、记忆和注意 - LE A00 - 课程播客 - UC SAN Diego::
##参考资料
Bower, G., Clark, M., Lesgold, A., & Winzenz, D. (1969). Hierarchical Retrieval Schemes in Recall of Categorized Word Lists. Journal of Verbal Learning and Verbal Behavior, 8, 323–343. https://doi.org/10.1016/S0022-5371(69)80124-6
Bower, G. H., & Winzenz, D. (1970). Comparison of associative learning strategies. Psychonomic Science, 20(2), 119–120. https://doi.org/10.3758/BF03335632
Eich, E., & Metcalfe, J. (1989). Mood dependent memory for internal versus external events. Journal of Experimental Psychology: Learning, Memory, and Cognition, 15(3), 443.
Godden, D. R., & Baddeley, A. D. (1975). Context-dependent memory in two natural environments: On land and underwater. British Journal of Psychology, 66(3), 325–331.
Morris, C. D., Bransford, J. D., & Franks, J. J. (1977). Levels of processing versus transfer appropriate processing. Journal of Verbal Learning and Verbal Behavior, 16(5), 519–533. https://doi.org/10.1016/S0022-5371(77)80016-9
Rogers, T. B., Kuiper, N. A., & Kirker, W. S. (1977). Self-reference and the encoding of personal information. Journal of Personality and Social Psychology, 35(9), 677.
Slamecka, N. J., & Graf, P. (1978). The generation effect: Delineation of a phenomenon. Journal of Experimental Psychology: Human Learning & Memory, 4(6), 592–604. https://doi.org/10.1037/0278-7393.4.6.592
人类作为信息处理机时的 “信道容量”
原文:Channel capacity of humans as information processors (andymatuschak.org)
要探究一个人信息处理能力的极限,一个方式是询问他能从观察到的刺激中,重现出多少信息。在这个框架下,我们可以利用信息论提供的工具,将观察者作为一个通讯信道来建模。 zhèi 个示意图 (Pollack, 1953, p. 422) 描绘了这个模型:
理想的信道可以重现你给定的任何输入。而实际的信道,多数(包括人类)的复现会掺杂错误,并且随着输入中的信息增多而增多。这个行为通常是渐进发生的:一个信道会完美地传输它的输入,直到超过了一定的阈值。过了这个阈值 —— 即我们所称为**{信道容量(channel capacity)}** ——,输入输出的相关性随之下降,而传输的总 bit 数保持不变
对人类 绝对判断域 的实验可以用来建模人类的信道模型。Miller (1956)回顾了历史经验数据,认为对于无维度的刺激,人类的信道容量大约为 {2.6} bits
例如这里 Miller 给出的一张图 (1956, p. 83), 使用了 Pollack (1952, 1953) 关于人类对音高绝对判断的实验数据,并用信息论的方法进行了重构。
问:如果知道一个受试者的绝对判断域(对于单项、单维量级),你如何获得他们的通道容量?
答:通道容量=log_2(绝对判断的跨度)
问:为什么绝对标度的跨度,与人的信道容量有log2的关系?
答:通道容量以比特表示。如果绝对标度的跨度是 8 个类别,你需要log2_(8) bits 来表示每个状态。
参考文献
Miller, G. A. (1956). The magical number seven, plus or minus two: Some limits on our capacity for processing information. Psychological Review, 63(2), 81–97. https://doi.org/10.1037/h0043158 Miller - The magical number seven, plus or minus two
Pollack, I. (1952). The Information of Elementary Auditory Displays. The Journal of the Acoustical Society of America, 24(6), 745–749. https://doi.org/10.1121/1.1906969
Pollack, I. (1953). Assimilation of Sequentially Encoded Information. The American Journal of Psychology, 66(3), 421–435. JSTOR. https://doi.org/10.2307/1418237
闭合开环
原文:Close open loops (andymatuschak.org)
未完成的任务、未记录的观察、未写的回复...... —— 这些待办在我们脑海中盘旋,仿佛我们在反复排练,以确保它们不被遗忘。为了摆脱这种唠叨并创造一个「水流般的思维」(使用艾伦的术语,2015 年),需要建立一些系统,以可靠地方式来关闭这些开放的循环。
例如:如果一个待办事项具有可操作性,这意味着:(艾伦,2015):
-
你应该能够在任何地方记录一项任务
-
你定期从这个清单中清空任务
-
你定期委托、重构或删除那些你无法确定优先次序的任务
综合看来,这些特性确保了当你记录一个任务时,**你可以停下一直想它。**光有全面的记录方法是不够的,正如大多数待办系统所证明的那样,如果你不定期检查任务列表,并对徘徊不前的任务做决策(删除或重新规划),那连自己都不相信它们会被继续跟进。
参考文献
Allen, D. (2015). Getting Things Done: The Art of Stress-Free Productivity.
填空卡可用于创建典型的 N 面卡片
原文:Cloze deletions can be used to create typical N-sided flashcards (andymatuschak.org)
典型的间隔重复记忆系统会将填空卡和问答卡用不同的方式展示,但有趣的是,您可以将典型抽认卡(问答卡)视为填空卡的特例。
也就是说,可以用填空卡来构造问答卡,把回答的内容挖空即可。
我正在本人的实践中利用这种观察,见助记媒介的个人实现; Log:个人助记媒介 。例子如下图:
认知主义
原文:Cognitivism (andymatuschak.org)
认知主义是一种用来理解人类心智的理论框架,其将心智视为一个信息处理器,按照特定算法处理心理表征。这是认知心理学的理论基础。
认知主义源于认知革命。认知主义者认为,虽然强化可以影响心理表征,但不能直接决定行为。我们是通过构建理论和设定预期来做决策和推理的,而不仅仅是依赖过去经验的简单关联。
认知主义对行为主义数据的解读
-
学习与表现的区别:并不是所有学到的内容都能立即体现在行为上(艾宾浩斯的研究数据便证明了这一点)。
- 这意味着,即使知识没有在行为上表现出来,大脑中仍可以形成知识的内部表征。
-
期望假设:行为取决于个人对情境的期望,而不仅是对强化的反应。
- 例如,在 1969 年 Estes 的一个实验中,他让大学生预测不同卡片的价值,尽管实验设置使他们从未因选择理论上回报最高的卡片而得到奖励,学生们通常还是会选择这类卡片。
-
假设和规则学习:人们不仅仅通过强化学习规则,还通过评估假设学习规则。
-
例如,在 1971 年 Levine 的一项研究中,他要求学生学习关于几何形状的规则,并发现学生更容易学习复杂的规则,无论简单的规则被强化了多少次。
-
行为主义在这方面遇到难题,因为按照简单规则,学生本应形成简单的配对关联。
-
他认为,这是因为学生形成并检验了关于这些复杂规则的假设(而不是简单规则)。
-
工具制造者和工具使用者之间的合作最好通过一系列不同的项目进行迭代
工具制造者和工具使用者之间的深度合作可能会支持「实践出洞见」,但对于工具使用者而言,一个实际难题是难以在创意项目的延误和中断中保持情感联系。双方在工具使用者将他们的工具应用于重要的创意项目中时,虽然能对工具创意有所了解,但每个项目对迭代的空间都是有限的。
为了理解这一点,想象一下工具使用者已经写了一本书的初稿。那份草稿带来的教训促使对双方的工具创意进行新的迭代。尽管工具使用者可能对这些探索非常感兴趣,但他可能对使用新版本的工具完全重写这本书不太感兴趣。工具可以有所发展——尤其是在起草过程的早期——但很快就会碰到创意极限。
如果每个创意项目中涉及的工具在项目过程中只能有限地发展,那么每个项目的工具前沿实质上是由项目开始时工具的状态所决定的。这个挑战表明,合作双方通过一系列创意项目来发展他们的创意可能是最佳选择。
系列中的项目大小带来的张力也是一个问题。较小的项目将支持工具更戏剧性的迭代——如果你愿意,可以说是更高的「学习率」。但小项目可能不足以发展工具创意(有效的系统设计需要从真刀真枪的使用情境汲取洞见)。理想情况下,我想,这对合作伙伴会追求他们能做的最小、但又足够严肃的项目。
遗憾的是:独立研究者很难找到全职合作伙伴。
工具制造者和工具使用者之间的合作取决于建立有效的工具创意「军火库」
工具制造者和工具使用者之间的深度合作可能会支持「实践出洞见」。由于工具使用者在这些合作中主导了严肃的使用,他们通常会是启动双方创意项目的一方。最初的构想通常是半私密的摸索结果。双方分工的自然趋势会使工具使用者的摸索集中在创意项目本身,而非工具中未解决的问题。当工具使用者摸索可能成为新创意项目的创意时,他们大多会使用那些已经「触手可及」的工具。
因此,如果双方希望通过一个严肃的创意项目探索工具空间中的创意,那么在工具使用者构思下一个项目时,这个创意必须已经具体且可获取。双方必须主动开发一个军火库(包含初步和成熟的工具想法),以武装工具使用者的探索。
军火库中的工具创意不必是功能性软件。它们只需足够坚实,能够支撑——工具使用者能够理解它们,以便在新兴的创意项目中进行摸索。例如,当 Michael 开始开发《量子国度》时,软件只是一个初步草图:重要的是他足够理解这个创意的形状,能够想象出一个强有力地实现它的书。在草拟书籍时,暂时在文本中简单写下「问题:一个量子比特的向量空间有多少维?」是可以的。助记媒介背后的核心**创意*已经「在军火库中」。
军火库对双方关系和分工的影响很大。工具制造者并没有构想创意项目,所以如果他发现一个有前途的创意,他必须推动其发展到足以「进入军火库」的程度,这样它才能激发未来的创意项目。另一方面,工具使用者大多不开发工具创意,所以如果他被某个工具创意吸引,但这个创意还不够成熟,无法「进入军火库」,他应该能够依靠工具制造者推动这个创意的发展,直到它准备好进入军火库。
在这两种情况下,双方都必须在没有确信这些创意一定会被未来项目使用的情况下,为军火库发展创意。进入军火库只是一个必要条件(但远不足够)用于一个严肃的创意项目。
「军火库」概念在重复合作的情境下特别有用,尤其是在不同项目之间(即工具制造者和工具使用者之间的合作最好通过一系列不同的项目进行迭代)。
收集材料的作用在感觉上被夸大了
原文:Collecting material feels more useful than it usually is (andymatuschak.org)
积累浏览器标签、保存 PDF 和制作书签感觉像是进步,但我们系统地高估了这些行为的价值。理解概念需与其尽力较量;从粗粗看过一遍的 PDF 文件中是获得不了多少理解的。
我们收集材料是因为收集材料很容易,而且可以平息焦虑,相信目前再读的东西还有机会找到。但实际上,这么做反而是弄巧成拙,因为「不想弄丢」一些次要材料,结果越积越多,让重要材料埋没其中。这种观念与知识工作应该聚沙成塔与有所反差。
这是破解「收藏家谬论」 的第一步:意识到拥有一篇文本对于增加知识徒劳无功。
相反,我们应该围绕所读内容写笔记,以求深刻内化文本,因为常青笔记有助于积累阅读成果。为了有效引导自己(对比写笔记的反馈很弱),对于收集的材料,应该以较短的迭代周期处理,而不任其长久堆积。
参考文献
因为「知道过某事」与「知晓某事」是不一样的。仅仅知道一件事太过肤浅,因为知道只是说明你能够确定某事是存在的,仅此而已。归根结底,这种虚假的知识阻碍了我们通往真正卓越的道路。我们只有将其他人的内容、信息、想法和思想融入我们自己的知识库,我们才算真正学到什么东西。如果我们不学习,我们就不会改变自己,所以仅仅是把东西归档,并不能有所进步。
就像复印是自我奖励和上瘾一样,我认为,当我们把网页加入书签并把书签分类到文件夹或标签类别中时,我们也陷入了同样的虚假舒适的陷阱。**给网页做书签是令人满意的,因为我们摆脱了对失去获取信息的恐惧。**我在另一篇文章中有详细介绍。
这是破解「收藏家谬论」 的第一步:意识到拥有一篇文本对于增加知识徒劳无功。我们必须在文本上面下功夫。仅仅阅读文本是不够的:我们还必须写笔记,以创造可持续的真正知识。
特别是当我们开始研究新事物时,Eco 建议,复制文本后立即阅读并标注重点。如果我们训练自己尽快处理复制的文本,我们就能把握自己能处理多少东西。
研究、阅读和知识吸收上,短周期优于长周期。从研究到知识吸收的每一个完整周期,我们都会对该主题了解更多。当我们知道得越多,我们的决策就越明智,因此我们的研究就越有效率。另一方面,如果我们把一大堆材料带回家阅读和处理,一旦我们完成了这堆材料中的一部分,其中一些材料就会变成无用的。
上下文反向链接
原文:Contextual backlinks (andymatuschak.org)
上下文的反向链接不仅显示来自另一处的参考资料,而且显示围绕该参考资料的具体上下文——例如,一本书的页面或参考段落。
相关笔记:优先使用细粒度的关联
连续滚动式的电子阅读扰乱了物体恒存性,令人不适
原文:Continuous-scroll digital reading uncomfortably disrupts object permanence (andymatuschak.org)
在网络上阅读长篇大论的文章令人痛苦,因为这些文章需要不断地滚动屏幕。我总是把电子书阅读器设置为翻页,而不是连续滚动。其中一个关键的原因是:连续滚动的交互似乎扰乱了物体恒存性。(译注:object permanence,是指一个人对于物体即使在视线之外也依然存在的认识。这里可以理解为,由于网页的连续滚动,我们很难定位文本的具体位置,容易迷失在文本中。)
当我阅读一本实体书时,如果我发现自己迷路了,我可以往回翻几页,同时用手指按住当前的阅读位置。LiquidText 的解决方案可能在往后翻阅以了解书的结构时已经足够了,但在往回翻阅时帮助不大,因为我在这个操作中还使用了页面的离散物理布局:例如,我可能依稀记得要找的句子在右侧页面的底部。
如果要普及网络出版,我们就需要一些替代方案,以取代连续滚动浏览冗长且无法区分的文本块。
相关笔记:应用程序无法可靠地保持滚动位置
Vandendorpe(2009)提出了类似的论点(P123-124):
正如我们所看到的,纸莎草卷没有提供任何标记以方便读者阅读。它被设计成从左到右展开,只能通过从头到尾地阅读它的文本列。因此,读者应该跟随文本的线索,就像他们跟随演讲或对话的线索一样。与现代书籍不同的是,自法典出现以来,在文本的表格化基础上逐渐产生了大量的标记,而纸莎草纸提供的线索很少,无法让读者有效管理他们的阅读活动。当代读者突然面对一本以纸莎草纸卷形式出现的熟悉的书,不会认识它。他们很难找到文本的某一章节,因为没有目录;很难找到某一章,因为没有标题;很难找到某段引文,因为没有页码;很难找到某位作者的参考文献,因为没有索引;很难确定学术著作的来源,因为没有书目。而且,由于没有段落或页码,读者也很难找到他们之前阅读的地方。
参考文献
Vandendorpe, C. (2009). From Papyrus to Hypertext: Toward the Universal Digital Library. University of Illinois Press.
与他人交流时,我们往往只强调对某个想法最为了解的部分
与他人讨论一个正在形成的想法时,有一种反直觉的风险。最清晰、最熟悉的部分是你最容易传达的,也是你的对话伙伴最容易理解的。通常,这些概念已经有些主流,甚至是陈词滥调;别人可能已经对这个概念有很多现成的想法,并倾向于逐步解释它。
然而,如果你正在做一些原创的事情,最有趣的元素往往是,别人——包括你自己!——最不了解的部分。特别是在初期,你可能无法非常清楚地表达你所追求的新元素。它可能只是一个不寻常的副词选择,或一个看似无害的限定词。总之:由于别人的回答往往强调最主流的元素,而忽略了你最不了解的元素,交流往往会把你拉回主流。这是一种关于想法的「均值回归」。
当然,最优秀的同事和合作者会主动避免这个陷阱!我最喜欢的 Michael Nielsen 行为之一是,如果他听到我谈论一些看起来相当平庸的想法,他会故意挑动我努力突破常见解释的部分。
这个想法源于 2018 年初与 Bret Victor 的一次对话。当时他刚从一个重点研究实验室回来,那里他介绍并讨论了他的一些工作。我问他这些交流是否有用,他沮丧地回答说,他觉得自己需要一个星期的时间,去一间小木屋里独处,以便开始重新聆听自己的想法。当时这个回答让我很困惑,但很快我在与可汗学院研究围绕的对话中体验到了这个挑战,并理解了他(我想!)的意思。
在写作时创建推测性大纲
原文:Create speculative outlines while you write (andymatuschak.org)
每写一条新笔记时,把它添加到你正在维护的一个或多个大纲中,有必要的话也可以创建新的大纲。非常完整的写作项目会自然从中涌现。
通常情况下,当我们开启一个写作项目时,我们会先列大纲。这迫使我们从一张空白页开始。相比之下,如果我们每天都写新的笔记,并留意它们之间的联系,这些笔记可以积累成潜在的写作项目。当感觉大纲「成熟 」时,我们就可以收获,把它变成手稿,这个过程不像从空白页开始写作那样需要付出巨大的努力才能启动。
将已经写好的笔记加入到大纲中是相对容易的:只要比对一下笔记,然后问自己:把哪一个排在前面?(Pirsig)
此外,从一份空白的大纲出发去写作,需要我们预先想好主题和思考的角度。我们可以使用笔记来避免先入为主的结论。
参考文献
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
敞开心扉寻求洞见的第一步,也是最重要的一步,就是将我们发现论点和想法的工作方式从自上而下变为自下而上。
史蒂芬·约翰逊(Steven Johnson)写了一本关于科学界和一般人如何提出真正新想法的书,并称其为“慢直觉”。作为利用这种直觉的前提条件,他强调了实验空间的重要性,在那里,各种想法可以自由交融(Johnson,2011)。思想开放的研究人员所在的实验室就可以成为这样一个空间,就像知识分子和艺术家在老巴黎的咖啡馆里自由地讨论思想一样。此外,卡片盒也是这样一个空间,在那里,各种想法可以自由交融,从而诞生新的想法。
「如果某件事暂时停滞不前,我就将它放置一边,转头去做别的事情。」有人问他在被项目卡住时还会做什么,卢曼回答道,「嗯,写其他的书。我总是齐头推进不同的稿件。这样同时推进不同项目,我从来不会遇到心理障碍。」
如何写书——甚至不用努力(那么多)• Zettelkasten 方法
当我创建一个 Zettel 时,我会在文件夹中寻找一个可以利用这个 Zettel 的大纲。如果没有找到适合的大纲,我就会新建一个。
现在,我只是不断地在没有任何具体意图的情况下阅读文本和创造 Zettels,就可以看到文章、书籍和其他写作项目的自然涌现。
我提到的关于写作的书就是这样出现的。我在写一本关于营养学的书,所以我决定研究如何写书和常规写作。 我将每一个笔记转换成 Zettel 的同时都将之添加到了大纲中合适的位置。一段时间后,我对该主题的阅读需求得到了满足。当我看着大纲时,我意识到我的笔记已经可以成书了。我用 Zettels 的内容替换了 ID。如你所见。一份手稿已经准备好了。
Pirsig, R. M. (1991). Lila: an inquiry into morals. New York: Bantam Books.
他所要做的不是问:「这个宇宙的本质从哪里开始?」——一个实际上无法回答的问题。他所要做的是看着两条笔记,然后问自己:「哪条应该放在前面?」这个问题就很简单了,他总是能得出一个结论的。接着他便看向第三条笔记,将之与第一条笔记进行比较,再问一次:「哪条应该放在前面?」如果新笔记应该在第一条笔记之后,那就再与第二条进行比较。然后他就有了一个三条笔记构成的组织。面对一条又一条的笔记,他不断地重复着这个过程。
创建超链接到我的参考档案
原文:Creating hyperlinks to my reference archive (andymatuschak.org)
在我的参考档案中,应该很容易建立持久的、可供人类阅读的资源链接。
例如,当提到一篇论文时,最好能链接到 PDF——可能是链接到一个特定的页面。我可以使用一个 file://
的 URL,但这带来了几个问题:
-
文件储存位置可能会变化
-
我无法链接到一个特定的页码
-
URL 可能不具有可读性
-
这在 iOS 上肯定无法运行
如果能链接到一个自定义的协议(如 ammref://
),那就更好了,它可以
-
重定向引用到具体文件
- 如果需要的话,可以直接运行具体文件
-
避免将我捆绑在任何文件系统结构或阅读器应用程序上
-
支持可读的 URLs;例如
ammref://Hattie/1994/VisibleLearning#p57
这是很可行的。这将意味着:
-
制作一个简单的脚本,搜索有关联的参考资料
-
制作一个给出一个参考的 URL 的脚本
-
使得 Alfred 的工作流能够运行后者
参考文献
我希望能够在我的 Markdown 笔记中链接到 PDF 的任何一页,我知道我可以通过在浏览器中的 file://URL 的末尾添加 #35 来做到这一点,例如。但是我使用 Skim,在浏览器中阅读 PDF 是不可取的。此外,URL 最终会变得超长,而且有一些丑陋的转义符,如 %20 代表空格,这似乎没有必要,因为我所有的 PDF 都是用 BibDesk 精心组织的。所以我设置了一个小的 AppleScript,它将解析一个以 sk:// 开始的自定义 URL,以获取 BibDesk 的引用键和页面索引,然后找出我想从 BibDesk 获取的 PDF,并在 Skim 中打开该 PDF,以获取正确的页面索引。
URN 在设计这个系统时可能也会有用:Uniform Resource Name - Wikipedia
用别人的想法填满闲暇时间是一种文化习惯
原文:Culturally default behaviors fill spare time with others’ ideas (andymatuschak.org)
自然界讨厌真空,而当代文化则讨厌寂静。当我有闲暇时间时,文化上的「默认」做法似乎是填满它——通过阅读或聆听(书籍、文章、播客)、与人友好交谈或执行任务。这些活动当然可能令人放松和愉悦,但它们往往会累积起来,以至于我们可能会轻易地度过数天甚至数周的时间,而没有花一个连续的小时去深入思考自己的想法。收件箱里总是有更多的东西(阅读、电子邮件、浏览器标签页、待办事项清单)。
有些会议软件有显示每个参与者发言时间的计量器,显示每个人消耗了多少「发言时间」。你可以想象将这个概念扩展到思考和心理言语。洞察力当然需要输入,所以你不想永远把自己关在封闭的空间里。但是,如果他人的声音持续占据比自己更多的心理「发言时间」,你怎么能远离那些千篇一律的创意道路呢?倾听自己的想法很难。
即使在名义上是创意型知识工作岗位,这种情况似乎也成为了默认现象。另请参阅:排遣行为,人们更喜欢行动而不是思考。
一个有用的解药:变得无聊。
2010 年,我就这一主题写了一篇的短篇博客,尽管当时我对此理解还不太深刻:Square Signals : An Anesthetic Default
Deresiewicz, W. (2010, March 1). Solitude and Leadership. The American Scholar.:
这里是关于 Facebook、Twitter 甚至《纽约时报》的另一个问题。当你让自己接触这些东西,尤其是像现在这样不断地接触——不论老人还是年轻人——你会不断地让自己受到其他人思想的轰炸。你让自己沉浸在传统智慧中。在别人的现实里,而不是为自己。你在制造一种喧嚣,让自己无法听到自己的声音,无论你在思考自己还是其他事物。这就是爱默生所说的「一个想要激发并引领他人的人,必须避免与他人的灵魂同行,在他们平庸且陈腐的观点的桎梏下生活、呼吸、阅读和写作。」
每日工作日志
原文:Daily working log (andymatuschak.org)
每一天,我都以当天的日期为标题开始写笔记;例如:2020-03-12。这则笔记记录了一天中的零星事件:思考、划痕工作等。这是一个有意的倾倒场,一个释放阀,以便总是有「一个地方可以放那个东西」。
在笔记类型分类法中,这是保真度最低的一层,设计上是短暂的。但是,当这些想法看起来有可能是有头绪的时候,它们就会被提取到我的写作收件箱中(为短暂和不完整的笔记准备的写作收件箱)。有时我会用日常工作日志作为一个起草空间,我可以将部分内容粗略地提取到常青笔记。
对我来说,重要的部分是:
因为日常工作日志也是一个动态的笔记,所以它也可以作为上下文反向链接的一个有用的存根:反向链接可以用来隐含地定义知识管理系统中的节点。
工具制造者和工具使用者之间的深度合作可能会支持实践出洞见
实践出洞见的一个关键主张是有效的系统设计需要从严肃的使用环境中获得洞察力。但是优秀的工具制造者往往不是优秀的工具使用者,反之亦然,所以为了实践出洞见而创造强有力的环境很难。研究思想工具的团体需要足够的能力来建立足以用于严肃工作的原型。一种方法是将工具制造者与工具使用者紧密配对。理想情况下,他们都深深地沉浸在对方的工作中,也许到了他们可以在对方的领域产生(糟糕的)独到见解的地步。
此外,这种方法也让两个人都能专注于自己的领域,避免切换状态的成本:专注的软件开发和专注的学术研究互相排斥。
更多关于这些合作的笔记:
参考文献
与一人兼顾用户-工具制作者相比,工具制作者-用户的两人组合有几个优点。首先,用户不会被工具实现的问题分散注意力,可以将注意力集中在所要研究的问题上。这种对最终问题的关注有助于构建工具。其次,为了实现这类工具,工具制作者需要处理相当复杂的数据表示和操作,而计算机科学家的专业技术知识是非常有用的。例如,GRIP-71 为用户提供了两个级别的专用虚拟计算机,一个用于分子操作,另一个用于抽象的三维几何学。第三,每次用户使用工具,工具制作者能充当观察者,以确定用户真正的目标层次,并确定如何让这些目标实现起来更容易。
Brooks, F. P., Jr. (1994). The Computer Scientist as Toolsmith II ACM Allen Newell Award Lecture. SIGGRAPH.
为了提高合作者的水平,研究另一个学科的问题,对我这个计算机科学家有什么帮助?有许多方面:
我们因而能聚焦于关键问题,而不只是课后练习或者小儿科的问题。
它使我们对成功和失败保持诚实,这样我们就不会轻易欺骗自己。
我们因而能直面完整问题,而不只是简单的,或数学理论能完美解决的地方。例如,计算几何中,我们不能避开三重共线点或者四重共面点的情况,不能掩耳盗铃,假装病态条件不存在。
直面完整问题,迫使我们学习更多知识,甚至往往要进军至从未踏足过的疆域,发展计算机科学最前沿。
除此之外,你已进入领军者的疆域,其中有揭秘蛋白质原理、设计出潜水艇,实现纳米制造的先驱。如今,你要向无尽疆界更进一步,实为乐也。
深度研究需要比技术行业具备更慢的节奏
原文:Deep research requires a slower pace than tech industry work (andymatuschak.org)
任何在工业界从业过一段时间的人都会习惯它的文化——流程、规范、价值观和默会知识。当然,其中很多都是非常有价值的,但这些理念也代表着约束。技术文化和研究文化之间会存在一些重要的障碍。特别是,技术文化的校准节奏要快得多。如果研究人员在面对问题时无法掌控自己的节奏,可能会因为缺乏耐心而过早地放弃。
硅谷的技术人员面对的「大项目」,可能要投入一到两年的时间;而研究人员面对的「大项目」,可能会持续十年。对于公司从业者来说,跟困难问题死磕的时间落往往在十几小时的范围;而研究人员需要能坚持数百个小时。这并不是因为技术人员普遍懒惰:事实上在工业界里花几百个小时来思考一个问题通常不是个好主意。但是,比起工业界的习惯,在基础问题上取得进展往往需要具备更多的耐心,投入更多的思考时间。所以技术人员可能很难沉住气研究基础问题,直到能够取得进展。
就我个人而言,来自技术行业的我注意到,对于许多研究问题,我常常会严重错估其进展速度。当我觉得我已经对一个问题苦思冥想了很久的时候,其实才花费了几十个小时而已。这算不了什么!这种心态不仅会使我错过我探求的结果,还会顺带把我逼疯。对我来说,一个重要的愿望就是让自己在慢节奏时感到更自在。
一项相关的特殊案例:不合适的时间压力往往会毁掉创造性工作
刻意练习不一定非得令人不愉快
原文:Deliberate practice doesn’t have to be unenjoyable (andymatuschak.org)
Ericsson 的刻意练习的典型特征之一是,其本质上不是令人愉快的,而且通常比其他相关活动要无趣一些。当他写这番话时,他通常是在做一个描述性主张ーー描述这种专家级练习的特点ーー而不是一个规范性主张。但他认为,这种不愉快是刻意练习的自然结果,因为 a) 刻意练习必然是困难/费力的;以及 b)其主要目的是提高表现。
我认为他这种主张无论从描述上还是从规范上来说都是错误的。
在 1993 年的一项研究中,Ericsson 展示了一些证据,这些证据来自于对小提琴手的日记研究。单独练习的乐趣评分是 7.2 分,虽然比随意弹奏(8.3 分)低,但和独奏(7.3 分)差不多,还比学习音乐理论(6.1 分)或总体平均分(6.5 分)要高。
Hyllegard 和 Yamamoto 在 2005 年的研究综述中发现,「只有 4% 的刻意练习活动在乐趣或愉悦度上得分较低」。(他们认为这些研究的方法论可能都有问题,但我对他们的这种猜测并不太买账。)
对运动员来说,刻意练习可能伴随着身体痛苦,这可能让人厌恶。但音乐人呢?是不是因为刻意练习的任务重复、缺乏音乐性,才显得无趣?理论上,只要我们为特定的练习目标设计出既有趣又有挑战性的任务,这总是可行的,对吧?
我每天通过弹奏一些挑战自己能力极限的新曲目来练习视奏。这个过程不仅非常愉快——毕竟我在演奏音乐!而且一点也不重复。所有刻意练习活动都能这样吗?例如,如果我想专练减七和弦的琶音,你可以给我一系列包含这种技巧的不同乐曲。你甚至可以安排我先从忧郁的广板段落开始,最终过渡到快速的诙谐曲片段。大致来说,这是小跨度任务阶梯充当认知脚手架。请注意,这与典型的工作和表现环境不符合刻意练习的要求矛盾。
我觉得刻意练习常常让人感到不愉快,部分原因是它并不像是实践的合法参与,用情境学习的话来说,它更像是一种为了合法参与的脱离实际、缺乏情境的准备。但我认为,刻意练习很多时候都可以(或许通常、甚至总是)以一种真实的方式重新构建。我的视奏练习就是一个例子。单独练习音阶可能感觉不到这一点,但在曲目中练习音阶就能体会到了。
参考文献
Hyllegard, R., & Yamamoto, M. (2005). Testing Assumptions of Deliberate Practice Theory, Relevance, Effort, and Inherent Enjoyment of Practice on a Novel Task. Perceptual and Motor Skills, 101(1), 283–294. https://doi.org/10.2466/pms.101.1.283-294
我的 Twitter 讨论串: https://x.com/andy_matuschak/status/1778542381551530128
《去学校化社会》——伊万·伊利奇
原文:Deschooling Society - Ivan Illich (andymatuschak.org)
伊万·伊利奇在 1971 年发表了对制度化的犀利批评,这种批评不仅针对学习本身,还针对整个社会及其价值观。
他的论点简要概述如下:学习——本是个体自然而然会追求的,来源于他们的物理和社会环境——现已被学校教育所替代和垄断。学校教育不仅要求个体在人造的、权威的环境中度过大部分时间,学习别人设定的课题,还使他们成为维护一种规定社会秩序的听话工具。在这种秩序中,只有经权威认证的知识才被视为正当,人们总被驱使去不断追求更多。伊利奇提出,应该回归到一个更自然、去中心化的学习环境,在这里,人们可以在真实的环境中,通过与同伴及社区中的「大师」学习,去探索自己真正关心的事物。他的提案并不仅仅是简单的「回归」,他还建议通过社会和技术系统来更有效地协调这些学习网络,赋予人们追求自己所珍视的自主权。他希望这种「去学校化」不仅能改变学习的方式,还能彻底转变整个社会,用人性化的互助网络替代现代社会中耗尽一切的系统化。
精选语录
我们必须把目前对于种种新的教育渠道的探索转变为对与之完全不同的制度的探索, 即::探索能增加每个人的学习机会的各种教育网络,使得人生时时刻刻都可以进行学习、分享及关怀。
我们在生产与消费这两个层面都卷入了学校教育。我们盲目地相信,我们能够且应当进行有效学习;与此同时,我们也能使他人进行有效学习。在试图摒弃学校这一概念时,我们将会感受到来自自身的阻力。这同我们在试图拒绝无限消费、拒绝所谓为了他人好而可操控他人这一广为认同的推断时,感受到的来自我们自身的阻力如出一辙。在学校教育的过程中,任何人都无法完全避免对他人的剥夺。
请注意,约翰·杜威也被广泛视为一位改革者,他的观点与伊利奇形成了鲜明的对比:
杜威对社会中被安抚的群体有着深刻的描述。他希望我们「能让每所学校都变成一个充满活力的小社区,这里的活动应该反映更广泛社会的生活,并且要充满艺术、历史和科学的气息。」
伊利奇和杜威都认为应该在社区中进行学习,采用全面发展的方法。但杜威想要创造出一种孤立的「小天地」,在那里模拟真实的社会生活。而伊利奇则希望重构社会结构,让学习在真实环境中自然发生。
现存的种种教育制度是为教师的目标服务的。我们需要的是这样一些关系结构,这些关系结构将使每一个人都能通过学习与帮助他人学习来界定他自己。
学校是基于以下假设来设计的:人生万事皆存秘密;人的生活质量高低取决于是否知晓人生秘密;唯有经过按部就班的连续过程,才能掌握人生秘密;唯有教师才能正确揭示人生秘密。
建立新的教育制度的计划……一定不能起始于「某些人应当学习什么」的问题, 而应起始于「学习者为了学习想要接触什么样的人和事」的问题。
问题
-
我的研究,就像教育本身一样,主要集中在支持技能和内容知识的学习上。但伊利奇指出「需要对多种技能进行探索性、创造性运用的教育 … 无法依靠操练来进行。」那么,一个能支持这种「教育」的赋能环境应该是什么样的呢?(另见间隔重复和创造力)
-
我经常遇到这样一群人,他们不喜欢传统的「书本学习」,更倾向于通过动手实践,例如参与项目。(人们更喜欢行动而不是思考)伊利奇写到「大部分的学并不是教的产物,而是不受束缚地参与到富有意义的情境之中的结果」。那么,在什么情况下,什么方式更为必要或有用呢?仅仅参与是否足够呢?
-
相关的:伊利奇写到「对于已被许多人掌握的那些技能的学习来说,技能演示者是我们所需要且能够获取的唯一的人力资源。」这种方式虽然慢且不完美,但似乎适用于默会知识。那么,在什么情况下,什么方式更为必要?
-
一个推论:在伊利奇的理论体系中,学习工具和系统的设计者的作用是什么(如果有的话)?虽然「教育技术专家」是专制的,但他的四种网络模型表明,他认为发明在这里发挥了作用。
-
-
我对所谓的「真正的成人学习」很感兴趣,即人们学习对他们真正重要的事情所需的知识和技能。这种追求与伊利奇所批评的「继续教育」有何不同?
- 一个区别在于,「继续教育」认同教育者垄断的合法性权威,以及消费主义的观念,即他们所颁发的证书本身就很有价值;而「真正的成人学习」则不依附于任何特定机构,它是由内在的、有意义的目的驱动的。
-
如何果断地将看待赋能的视角从追求效率和可靠性上移开?伊利奇写到:「正在兴起的反主流文化重申 … 人们自己选择的与他人相识所产生的意外收获,比凭借专业化教学获得的文凭来证明的素质更重要。」
电子批注过于形式化
原文:Digital annotation is too formal (andymatuschak.org)
电子批注的数据结构太过精确:批注用精准的文本区间来表示。但我在书上写写画画的时候,我往往是泛泛指向一片区域,而不是精确的范围。我心里往往甚至完全没有想一个确定范围。偏要确定范围反而容易误导别人(视觉上也会分散注意力)。
所有这些行为在实体世界中都是非常自然的,可以在书页上贴纸、划痕、或者卷起边角。但是在数字世界里,我们被迫承受界面的形式主义暴政。
这样僵硬的结构也不利于不同文本的评述。对话中将两则文本相互对比时,援引两处精确的文本选区来表达观点的情况非常少见。往往需要在广泛的层面上讨论论点,以「整篇文章」作为支撑。你会用一句引言来描述文章的观点,但你其实在指代文章,而不是这则引言。
数字笔记系统专注于笔记个体的展示和操作,常忽略笔记之间内在连接所产生的意义
如果我用实体卡写常青笔记,那我会很自然把它们排开在桌上。相关的笔记可以放到同一个小的群组或卡堆里。笔记之间有顺序关系的话,「后继」可以排放「前驱」的右侧。当我在写一个新的笔记时,所有写过的其他笔记也会在视野中一览无余,物理上和新的相邻。这是一种周边视觉。
而数字化的笔记系统想打造的写作环境,更针对单笔记的创作体验。核心操作和显示围绕「你打开的笔记」,而不是更高层的笔记结构。在这个系统中,我通常不能同时浏览刚写完的一个笔记,更不用说排看最近四个了。数字笔记系统大多不怎么支持多窗口,即使有名义上的支持,要把它们排出实体卡片上,那种自然的空间关系也很尴尬。与其说这是「周边视觉」,不如说是隔靴搔痒。
反链是一种弱「外围视觉」—— 有用,但一般只让当前页面跳转,而不是一种能在页与页之间,有效进行意义发掘的手段。带上下文的反链会有用:你至少可以在这样的列表中同时看到许多笔记段。但是,即使你理解他们之间的结构,在这些反链中游览时,你会失去对象的「客体永久性*」。相关内容:在关联型笔记系统中,很难导航到未经链接的「邻居」(*译注:原文 object permanence,我们明白就算在某些情况下客体无法被看见、触摸或者感知到,它们也依然是存在的。)
如果我在一段时间后读到一个笔记,我有一种不安的感觉,即它是我看不到的某个「整体」的一部分。常青笔记应该是原子性的中的做法不利于这种情况。如果我是用实体笔记工作,我会把一堆笔记拉到我的桌子上,然后把它们排列起来。把这些笔记摆来摆去,可以帮助我理清结构。这种方式没有真正等价的数字版。
这让我想起了 Mac OS 早期版本中的「空间」版 Finder,它里面的每个文件夹,都会被打开到一个新窗口中,而且这些窗口的位置和大小会在不同会话中保持不变。如果文件夹点开在某个地方,那它会总会被放那儿。所以你可以建立一个点对点的排列永远不变。
自主思考
原文:Do your own thinking (andymatuschak.org)
当心:任由他人想法和图式(schema)支配自己的思考,非常容易。
阅读时的默认模式是由作者替你思考。据叔本华所言:
当我们阅读时,是别人替我们思考:我们只是重现他的心理过程。......因此,在阅读中,我们在很大程度上免受思考的劳累。......由此可见,如果人读了很多书,甚至几乎整天都在读书,却在读书之间,通过不加思索的消遣来恢复精神,他就会逐渐失去自主思考的能力——就像总是骑马的人最终会忘记如何走路一样。可是许多学者就是这样:他们把自己读傻了。因为他们一有空闲就去阅读,这样甚至比持续的体力劳动更让人精神麻痹,因为在后者中我们还可以思考自己的想法。但是,就像受挤压的弹簧,由于外物持续施加压力,最终会失去弹性一样,我们也会因为他人思想的持续施力,而失去思考的能力。
从认识论的角度来看,阅读中思考的缺位很糟糕,而且尤其不利于得出新的创见。如果你依赖别人的思维,你怎么能想出以前从未想过的想法?
据康德所言:
启蒙就是人类从自我造成的不成熟状态中解脱出来。不成熟是指缺少他人的教导就没有能力运用自己的理智。这种不成熟状态之所以是自我造成的,其原因不在于缺少理智,而在于没有他人的教导就缺乏运用自己理智的决心和勇气。Sapere Aude! 要勇于认知!
一个关键的解药:围绕所读内容写笔记,以求深刻内化文本
参考文献
Kant, I. (1996). An answer to the question: What is enlightenment? In A. Wood (Ed.), & M. J. Gregor (Trans.), Practical philosophy (pp. 11–22). https://doi.org/10.1017/CBO9780511813306.005 (Original work published 1784)
Schopenhauer, A. (2015). On reading and books. In C. Janaway (Ed.), & A. Del Caro (Trans.), Parerga and Paralipomena: Short Philosophical Essays (Vol. 2). https://doi.org/10.1017/CBO9781139016889 (Original work published 1851)
停止依赖信息来源,相信你自己的思考力 • Zettelkasten 方法
我曾认为,信息包含于文本之中,而我要让信息易于获取。
Ralph Waldo Emerson, “Self-Reliance” (via Nielsen, M. A. (2003, September 8). Extreme thinking. Tough Learning, Brisbane, Australia.):
{置身于尘世中,附和世人的观点}很容易;{离群独处之时,按照自己的意志生活}也不难;而伟人却是{身处喧嚣}还能{完全保留}{自己独居时的自立精神}的那些人。
Edwards, P. N. (2005). How to Read a Book.
不要等着作者来敲打你的脑袋。而是刚开始读书就对这本书不断提出假设(「这本书的主要观点是......」)和问题(「作者怎么知道......?」)。
对这些假设写上几笔,很有用。你一边阅读,就一边试着确认你的假设,并回答你的问题。书读完了就回顾一下写的东西。
教育环境通常不涉及原创思想
原文:Educational environments usually don’t involve original thought (andymatuschak.org)
教育环境通常由已知结果的活动组成,涉及一组已知的概念或想法。学生被期望在学习中为他们自己重现或推导出这些概念。但即使是在「探索式学习」环境和解释性文科课程中,活动通常也不是为了促进原创思维而设计的。
如果教育环境的抱负是让学生能够追求独立的、对个人有意义的智力活动,那么这种言论是自相矛盾的。我们怎么能期望通过从不要求学生的原创思想的活动来培养学生的原创思想呢? 事实上,这些活动往往会阻碍学生的原创思想。
这似乎是使用情景体验进行教学的一个主要限制。
教育计划往往会自我颠覆(此处的 obj 是那种目标的意思,所以用计划代替了)
原文:Educational objectives often subvert themselves (andymatuschak.org)
一些「教育」活动具有内在意义的目的,但在大多数教育环境中,主要关注的是使他人/自己学会一些东西,而这种目的一般不具有内在意义(与赋能环境的活动直接服务于内在意义的目的相反)。
对学习成果的执着,本质上是对某种「效果」的追求,这种效果是由一个深层因素驱动的:该材料本质的、有意义的目的。教师却试图把内因晾在一边,直接传授效果,学生便对教师产生依赖——其不仅是专业知识的来源,也是学习目的的来源。在这样的关系中,教师扮演的角色,便由他的上级地位来界定。这往往表现为(无意的)居高临下的态度。
内驱调节的学习是自我实现的;外驱调节的学习是自我否定的。学生们感觉到了这种否定,而回应方式经常是摆脱或缩小他们的智力责任感(逃避*)。这两种行为都放大了教师和学生之间的不对称性,这反过来又放大了教师所传达的(有意或无意的)优越感。
深刻的理解需要强烈的个人联系(也是其结果)。而在老师和学生之间,居高临下和外部依赖的关系中,不可能产生这样的联系。通常情况下,教师/材料作者本人与材料没有这样的联系,这使得居高临下的情况更加严重(见作者的环境被作者的动机严重影响)。按 Per Bret 的说法:
我难以想象,许多设计师会衷心地被从一数到十或加法所吸引。因此,关于这些主题的材料编写的意图,既不是直接赋能,也不是为了分享对概念的热爱,而是出于「我知道这个概念,而你不知道这个概念,我觉得你需要知道我所知道的」的立场。因此「老师」和「学生」之间出现了不平衡与不对称。而这种不对称往往表现为居高临下。
相关文章:
参考文献
Email with Bret Victor, 2015/03/19. Re: Toys with weight-bearing educative properties
Email with Michael Nielsen, 2019/08/23. Re: Transcending the Primer
当然,从某种意义上说,我相当迷恋「为人赋能」这样的目标......但我也非常质疑这样的目标。我认为 > 99.9% 的情况下,它们最终都让人们觉得自己高人一等。摆脱这种失败模式的唯一可持续的方法,据我所知,是把主体目标变成本身就很重要的东西。
例如,如果你执行阿波罗计划,你肯定会给人们赋能。但这对登月来说是次要的。
有效的深度工作不仅取决于时间,还取决于强度
原文:Effective deep work depends on both time and intensity (andymatuschak.org)
对于许多人来说,拨出完整的四个小时来专注工作非常困难,而其间不查看邮件跟社交媒体更是难上加难。虽说很难,但还是能做到的,只要走一套机械化流程:规划时间;关闭 WiFi;屏蔽网站等等。问题在于这还不够。不走神太难了——不是指那种充满创造力的白日梦,而是零零散散,无聊发呆的走神。
实际上,一次几小时全神贯注,来解决一个问题,着实困难,但这种能力亦不可或缺。坐到桌子前,清理明显干扰,仅达最低要求。高强度工作一小时,产出要远高于兴致索然地工作五小时,哪怕五小时中没有一般意义上的分心。
在创造性工作中执着于产出往往弄巧成拙,衡量投入是替代方案。可以从衡量花在问题上的时间开始(比如,见笔记番茄工作法);衡量全心全意工作,毫不走神的时间则更优;但真正重要的是类似「时间乘以强度」的度量,这也是 Cal Newport 在 Deep Work 一书中表达的看法。
有效的系统设计需要从真刀真枪的使用情境汲取洞见
原文:Effective system design requires insights drawn from serious contexts of use (andymatuschak.org)
粗制而成的原型很不错:由此能开展粗糙的迭代和快速评估。但是,许多重要的洞见,只有依托于真刀真枪的创造性问题才能够涌现,这些问题与原型系统本身无关。这是实践出洞见提出的一个关键主张。
听起来像是标准做法:系统当然需要经过评估!但大多数系统设计者并不认真对待「真刀真枪」:工具制作者通常缺乏与真刀真枪的使用环境的联系。
理论寓于系统之中。观察系统与现实相互作用,可以从中获得见解,对后续完善理论有所帮助。这些见解的成色,与系统的使用场景息息相关。如果系统没有经过真刀真枪的使用,得到的见解,也就是单纯坐而论道者能够想到的,不建造系统也可以实现。
皮克斯是很好的例子。这家动画公司创造了真刀真枪的使用环境,反过来又推动了系统设计:皮克斯的电影和技术发展是啮合紧密的飞轮。
常见挑战:
相关理论:
参考文献
Matuschak, A., & Nielsen, M. (2019). How can we develop transformative tools for thought? Retrieved December 2, 2019, from https://numinous.productions/ttft
具体来说:假设你想为 X 学科(比如 X=微分几何)建立工具。没有深入研习这门学科,是难以创造优质工具的。这就像没有沾过木头就像创作木工工具一样。Mathematica 这样的工具趁手好用的原因也在于此——Stephen Wolfram 这一主要设计者,对数学和物理这两门学科抱有由衷的研究兴趣,具备制作优质工具的先决条件。当然,也有些 Mathematica 部件不如人意:这些部件简直像玩具一样,估计 Wolfram 公司内部也没有怎么认真使用过。
Brooks, F. P., Jr. (1994). The Computer Scientist as Toolsmith II ACM Allen Newell Award Lecture. SIGGRAPH.
我们因而能聚焦于关键问题,而不只是课后练习或者小儿科问题。
我们因而能对成败开诚布公,而不轻易愚弄自己。
我们因而能直面完整问题,而不只是简单的,或数学理论完美解决的地方。例如,计算几何中,我们不能避开三重共线点或者四重共面点的情况,不能掩耳盗铃假装病态条件不存在。
直面完整问题,迫使我们学习更多知识,甚至往往要进军至从未踏足过的疆域,发展计算机科学最前沿。
除此之外,你实则已迫近领军者之列,其中有揭秘蛋白质原理、设计出潜水艇,实现纳米制造的先驱。如今,你要与他们挥手作别,向无尽疆界更进一步,实为乐也。
软件研究者想写出令人肃然起敬的学术论文,便力求想出适于推广的高层次想法,并为此建造系统。但是我们认为,在推广上用力过度,实际上不利于系统扩大规模,运行持久。为了创造生而不息,受众自然聚集的软件,必须从具体处入手。
在 2009 年,我们创造了 Python Tutor 网站,目标非常具体:为学生和导师(比如我们自己)提供一种方便的方式,逐步浏览 Python 代码并查看变量的值。
高效复习安排与过关式课程序列相冲突
原文:Efficient review scheduling is in tension with gated course sequences (andymatuschak.org)
想象这样的书或者课程,只有上次课程的内容经过学生练习,并进入其长期记忆了,才能获取接下来的课程。 (比如 Execute Program 的课程只有等到你成功复习前置内容才解锁)。然而很多情况下,最佳的首次复习间隔似乎非常长——很多周甚至很多个月(量子国度的用户遗忘大部分卡片的速度非常缓慢))。若要高效地安排复习(比如要延迟很长时间才复习),用户就要等很久才能读到下一小节,这对读者可能是负担。
问:为什么复习课程的最佳安排可能会给过关式课程序列带来麻烦?
答:在许多情况下,最理想的初始 ISI 可能是几周或更长时间;读者可能不想被关那么长时间。
电子书的受欢迎程度远低于纸质书
原文:E-reading popularity sharply trails all book-reading (andymatuschak.org)
在 2018 年的 Pew 调查中,多数受访者仅阅读纸质书。大约有四分之三的受访者在过去一年里读过至少一本书,但只有四分之一的人在过去一年里读过电子书。这一趋势基本持平,甚至有所下滑。不过,有声书的受欢迎度却在上升。
可能的原因:在电脑上阅读文本令人不快。
参考文献
Pew Research Center. (2019). 2019 survey on book reading formats. Retrieved from https://www.pewresearch.org/wp-content/uploads/2019/09/FT_19.09.25_BookReadingFormats_Methodology_To
任何事情都比你预想的要花更长时间
原文:Everything takes longer than you think it will (andymatuschak.org)
……所以,Andy,选择项目和确定项目规模时必须更加慎重。
这一点在多方面都有所体现,并带来了不少挑战。
一个挑战是,因为我的项目周期很长,我常常在两难之间:是深入挖掘项目的某个方面(这往往会让我感到沮丧,因为其他所有事情似乎都停滞不前),还是试图同时推进多个方面,结果却显得力不从心。
问:Ken Kocienda 提出了哪种解决方法,来应对在创意项目中无法同时实现深度和广度而感到的挫败感?
答:「关键问题是:为了推动项目进展,现在我能做的最重要的事情是什么?就去做那件事。不用担心其他暂时停滞不前的部分。如果你持续回答这个问题,最终,它们的时机也会到来。」https://twitter.com/kocienda/status/1422043864970326020
我喜欢 Joe Edelman 的一个类似提议:「今天我最想自豪地面对的是什么?」
问:David Holz 引用研究导师的话说:「项目耗时要么 ??? 要么 ???。」
答:三个月/十年(2023-08-13)
可执行的写作策略
原文:Executable strategy for writing (andymatuschak.org)
年轻的作者,会从全新的白纸开始他们的写作,脑海里只有一个粗略轮廓。这样的开端,需要大量的能量激活大脑,付出大量的努力在认知上:没有任何外在之物可怙可峙,你必须在自己的脑海里摆弄所有文章片段的雏形。
相比之下,如果你已经围绕一个主题写了很多面向概念的常青笔记,借此创作,过程会更像「编辑」,而不是「写作」。你可以对笔记标题洗牌,得到一个大纲,再为缺失部分找来材料写笔记,并将它们编辑组合为一个完整的叙事。事实上,因为你可以在写作时创建推测性的大纲,你可能会发现第一步的大纲也已经完成了。而且每篇笔记本身写起来并不难:常青笔记实现顺畅而渐进的写作(「渐进写作」)。
你的任务不再是「给第一章写一份大纲」,而是类似「找到和主题可能相关的笔记」。每一步做起来都容易,这是可执行的策略(见可执行策略)。但要注意——不要让这个策略「毒害」第一步的笔记写作过程:默认为自己写笔记,不考虑读者。
我在此描述两种方法:一种是非定向版本 —— 你写作的项目从日常工作中有机地涌现;另一种是定向版本,即你有具体的写作目标。
非定向版本:
-
阅读思考时,持续地写下经久可用的笔记。(常青笔记写作是知识工作的基本单位)
-
每次你添加笔记时,将其链接到一个大纲中,必要时创建一个大纲(在写作时创建推测性大纲)。
-
最终,你会对其中某个大纲感兴趣,兴奋地想要充实它(让思想和信念有机地涌现)
-
写下新的笔记,以填补大纲中缺失的部分。
-
将所有的笔记文本拼接起来,得到初始手稿
-
重写这篇手稿。
定向版本:
-
回顾与你的主题有关的笔记(并多做一两步——笔记应该让你吃惊)
-
写大纲
-
将现有的笔记附在大纲的每一点上;根据需要写新的笔记。
-
将所有的笔记文本串联起来,得到一份最初的手稿。
-
重写它。
这种方法还有一个好处:常青笔记降低了编辑手稿的情绪痛处。
参考文献
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
准备片段帮助你轻松进入写作 • Zettelkasten 方法
为了清楚地了解你的研究是否足以支持你的文本结构,下一步是将你的 Zettelkasten 中的笔记分配给你大纲中的各点。当大纲中某个点,似乎因为缺乏足够的笔记支持,而显得无足轻重时,你可以继续你的研究,把重点放在缺少的部分上。一旦你确信你已经准备充分,可以开始了,你就按照大纲把笔记的内容串起来。这样你就完成了第一稿。以上就是从计划到大纲再到手稿的全部过程。然后,你开始重写,组织材料,并开始使文本连贯。
如果 Zettelkasten 足够充沛,撰写便没有什么神奇之处。为了编写初稿,你要把选定的笔记内容放在大纲的适当位置,把肉放在你的文本骨架的骨头上。这就是 Zettelkasten 如何帮助你完成你的初稿。
很少有电子阅读环境支持旁注
原文:Few digital reading environments support marginal notes (andymatuschak.org)
在阅读实体书时,自然会在空白处,在相关段落旁边涂鸦。或者在相关位置贴上一张便条。但处于各种原因,电子阅读环境几乎从不支持这种互动。注释被隐藏在一些便条的图标下,或者在一个 「笔记本」中,以平面列表的形式显示,被折叠,与内容脱节。
LiquidText 和MarginNote是我想到的唯二例外。请注意,它们都不支持EPUB!所有的桌面 EPUB 阅读器都很糟糕 Google Docs 已经建立了一个还不错的用户体验;我很希望其他人哪怕向它靠拢一下也好。
Hypothes.is提供了一个聊胜于无的解决方案,通过其侧边栏的边缘标记的方式提供了一些空间化的索引。但是注释本身是以一个平面列表的形式呈现的;边缘标记只是相当于一个快捷方式。你仍然不能像Ted Nelson在1972年描述的那样,滚动浏览一个文件并在阅读旁注(!)。
请注意,位置不需要那么精确。它只是在大体的附近。电子批注过于形式化。
「寻找乐趣」
原文:“Find the fun” (andymatuschak.org)
在游戏设计中最核心的任务就是「寻找乐趣」。所有的原则、框架和流程,都是为了实现这一目标而服务的。这个说法我是第一次从 Daniel Cook 那里听到的。
这个核心事实明确指出了教育游戏对于创造赋能环境而言是注定失败的方法的核心原因之一。另见游戏中的技能培养服从于其他有内在意义的目的。
「乐趣」是通过行动来体现的;见游戏是行动的审美媒介。
参考文献
Frank Lantz, 2019-05-07 video chat
Frank Lantz 将这一概念形容为「让它起舞」。
在创造性工作中执着于产出往往适得其反
原文:Fixation on outcome in creative work is often self-defeating (andymatuschak.org)
创造性工作需要开放、互动、松弛、富足感。执着于产出往往会制造稀缺心态。
相关笔记:
参考文献
正在收集的一些相关资料:
-
面向理解的研究 - Kanjun Qiu(真正的研究是专注于你想要回答的问题,对「产出新颖洞见」的执着则让人偏离真正的研究)
-
别努力尝试,直接试一试(出自 Soares) (fixation on outcome makes failure much more salient)
-
辞去你的工作 - Wolf Tivy(「仅仅沿着已知的价值路径,你无法找到真正有趣的新奇事物。」)
Jess Miller 的成为一名魔术师 – Autotranslucence
如果你只盯着想要的结果,就会局限于现有的策略,而这些策略很可能并不奏效(否则你早就成功了,也就不需要使用这些策略了)。
你是否注意到,目标具有一种无懈可击而不容置疑的地位?你想跑超级马拉松吗?人们会赞许你的决心。你想投入竞选?大家都会支持你。想卖掉自己的房子,住进面包车?酷,本质主义正在流行。没人会去质疑你的目标是对是错。
David Whyte, Consolations, “Ambition”
野心往往使我们忽略了创造性对话的基本本质,同时为我们提供了一个虚假目标的掩护,这个目标由于过度描述、过度熟悉或理解过深而失去了真实性。......每件忠于自身的事物都有其独特的秘密语言,以及一个内在的、对外界隐藏的、令人惊讶的意向性,即便是那些看似推动一切的人也未必能完全理解。......我们可能将野心的焦点放在未来世界的某个角落,但最终它只能向我们展示那些我们已经变得熟悉的梦想。......
无论我们的劳动自认为多么重要,我们都只是{尚未想象到的世界的养料}。野心能带我们走向地平线,但不可能越过它——那条线永远在我们控制之外。然而,召唤是我们的身体、工作、智慧和想象之间的对话,是{一个新世界,其本身就是我们探寻的领域}。一个真正的使命总会包含{我们在努力充实生活的过程中必然会遇到的失败}。一个真正的使命总能{将野心和失败转化为对他人的同情和理解}。
野心需要意志力和不断的能量来维持我们认为的方向;但一个严肃使命的召唤要求我们不断关注{围绕我们的未知引力场,从中汲取能量},就像从可能性本身的氛围中呼吸一样。一个人的终身事业不是一系列我们可以平静踏上的台阶,而更像是在海上航行,没有路径,只有方向,在{与元素对话}中前行。回头看,我们留下的尾迹只是水面上短暂的、闪烁的痕迹。
野心对于刚刚开始探索世界的年轻人来说是自然的第一步,他们必须经历其本质的虚假,才能了解其背后的更大真理。但如果坚持太久,尤其是在长者身上,它总会失去惊喜,让那些曾经成功的人回到第二个童年,并使曾经成功的人变成可怜之人。
Lovely paean to process orientation in Frederick, M. (2007). 101 things I learned in architecture school. MIT Press.
来自 Navin Kabra 的这个话题的激烈 Twitter 讨论.
专注的软件开发工作是自我否定的
原文:Focused software development work is self-abnegating (andymatuschak.org)
当我沉浸到软件开发中,日常处于心流状态时,我的思维会缩小到一种隧道视野,完全固定在软件系统和它们的问题上。这是设计中的一个典型问题(Cooper, 2004):工程师通常会成为糟糕的设计师,因为他们专注于他们的软件和代码逻辑里的各种边际条件,而不是整体设计上要解决的实际人类问题。对于研究来说,这实际上也是一个困扰(深度软件开发的心理状态和深度研究思维是相互排斥的)。虽然进入了心流,但我发现这种效果在个人层面上越来越令人不快。当我处于这种状态时,我感到自我意识在萎缩、变得缺乏反思、创造性的想法不再出现、感到写作困难等等。
我不太清楚该如何处理这个问题。我可以通过每天在工程上花费更少的时间来避免这种影响,但这样就很难形成动力(软件开发和研究思维之间的转换成本很高)。当工程是我的主要工作时,这并没有真正困扰我。因此,也许严肃的工程工作最好留给那些不介意这种影响的人。
David Chapman 暗示这可能部分是因为:
我想在常规的编程中——可能对我们俩来说,所有的编程都是常规的——一个人没有添加任何自己的东西,只是弄清楚把 API 粘在一起的繁琐要求,这都是以他人的 API 为中心的。而在创造性的工作中,即使你沉浸在其中,也有一种感觉,即至少材料是通过你产生来的,而不是从 IDE/服务器/API 文档「那里」来的。并且我有一种感觉,即使上述材料是很普通的那种代码——所以「我」并没有创造它——但由于它是通过我产生出来的,所以即使我不是有意的,它也将会以一种我的方式变得独有。
参考文献
Cooper, A. (2004). The Inmates Are Running the Asylum: Why High Tech Products Drive Us Crazy and How to Restore the Sanity (1st Edition). Sams - Pearson Education.
《人生只有四千周》Oliver Burkeman
原文:Four Thousand Weeks - Oliver Burkeman (andymatuschak.org)
这本书精彩地指出了「生产力文化」的种种问题。其中的几个要点包括:
-
大部分提升生产力的书籍(比如《搞定》,Getting Things Done,GTD)都基于这样一个假设:你可能完成所有想做的事情——你真的能「赶上进度」或「掌控一切」——只需要一个更好的系统。但实际上,这是不可能的。你永远不可能做完你感觉「在清单上」的所有事情。有了这种心态,你就永远不会对自己所完成的感到满足。
-
有限性对于意义是重要的。比如,婚姻之所以珍贵,很大程度上是因为它意味着你不再寻求其他伴侣。你已经完成它了;你已经做出了选择;它是有限的。
-
对于时间,「先留给自己」。
-
限制同时推进的工作数量。任何事情都比你预想的要花更长时间,而且频繁转换注意力既耗费时间又消耗精力。
- 一个有趣的具体练习:列出你最重要的 25 个优先事项;专注于前 5 个,并承诺不去尝试其他 20 个,因为它们会分散你对最重要事项的注意力。
-
今天不是彩排;有很多经历;无常的变体:「等我把工作搞定、帮候选人胜选、找到理想伴侣、解决心理问题之后,我就能放松下来,我的真正生活才开始。」
-
在工作之外的不专注,会损害工作时的注意力的变体:「当你从在脸书上不知不觉虚度的一小时中回过神来,你可能以为浪费的只是那个小时。但实际上,损害不止于此……它系统性地扭曲了我们对世界的认知。它影响了我们对重要事物的感知。」
-
个人生产力的痴迷是以自我为中心的。这种痴迷专注于控制个人的生活、时间和注意力。但这些只有在我们共同努力、协作时才有意义。如果你能为自己安排一个始终如一的周末,但却与此同时别人正在工作,那也不算真正的胜利。
-
非强迫的生产力的共鸣,但有所区别。这本书不太关注于寻找方法,让人在意义丰富的工作中愉快投入。它更多是帮助你意识到,你对生产力感知到的需求并不能解决你的问题或使你感到满足。
问:有关巴菲特、飞行员和管理优先级的故事是怎样的?
答:列出你最重要的 25 个优先事项;专注于前 5 个,并承诺不去尝试其他 20 个,因为它们会分散你对最重要事项的注意力。
问:「因果灾难」是指什么?
答:「这个概念指出,我们所花时间的真正价值始终且只能通过结果来判断。」
问:什么是「即时慷慨」?
答:当你心中涌现出慷慨的念头时(例如想要表扬别人或给朋友发一条温暖的信息),应该立刻采取行动,不要犹豫。
游戏是参与式的
原文:Games effectively develop players’ skills (andymatuschak.org)
游戏是一种参与式环境;这就是它区别于在同一台电视机上播放的电视和电影之处。以及支持学习的参与式环境。
游戏是脚手架
游戏设计者精心部署认知脚手架,以确保玩家获得享受和掌握游戏所需的技能。
细粒度的任务进展作为认知脚手架:在 时空幻境(Braid) 中,各层次被仔细排序和组织,以(无言地)逐步介绍概念。完成一个级别通常需要玩家证明他理解了一些东西,所以在游戏中取得进步就等于开始理解新事物。
约束作为认知脚手架:在见证者(Witness)中,很快就清楚了,唯一的互动元素是那些看起来像连接到一条线的圆圈,而唯一可能的互动是画出一条线。
元认知支持作为认知脚手架:因为游戏是动态媒介,所以它们也能够为元认知提供动态支持。特别是,游戏帮助玩家评估他们正在发展的技能和游戏帮助玩家制定和调整计划。
游戏充满了情景体验
游戏是一种情景体验,所以在 Braid 这样的游戏中(不像在幼稚的教育游戏中),玩家感觉不到他们正在被「教导」。在情感上,他们的体验是他们正在构建自己的理解,这可能是非常令人满意的。另请参阅情景体验可以创造出与作者目标的强烈个人联系。
游戏能有效地培养玩家的技能
原文:Games effectively develop players’ skills (andymatuschak.org)
游戏设计师是世界上最好的老师之一。他们创造了可靠地教授复杂技能的环境——通常不需要语言。与大多数教育体验不同,人们喜欢这种体验。
但是,「教育游戏」设计者们要注意:游戏中的技能发展服从于其他有内在意义的目的
游戏是参与式的
游戏是一种参与式环境;这就是它区别于在同一台电视机上播放的电视和电影之处。以及支持学习的参与式环境。
游戏是脚手架
游戏设计者精心部署认知脚手架,以确保玩家获得享受和掌握游戏所需的技能。
细粒度的任务进展作为认知脚手架:在 时空幻境(Braid) 中,各层次被仔细排序和组织,以(无言地)逐步介绍概念。完成一个级别通常需要玩家证明他理解了一些东西,所以在游戏中取得进步就等于开始理解新事物。
约束作为认知脚手架:在见证者(Witness)中,很快就清楚了,唯一的互动元素是那些看起来像连接到一条线的圆圈,而唯一可能的互动是画出一条线。
元认知支持作为认知脚手架:因为游戏是动态媒介,所以它们也能够为元认知提供动态支持。特别是,游戏帮助玩家评估他们正在发展的技能和游戏帮助玩家制定和调整计划。
游戏充满了情景体验
游戏是一种情景体验,所以在 Braid 这样的游戏中(不像在幼稚的教育游戏中),玩家感觉不到他们正在被「教导」。在情感上,他们的体验是他们正在构建自己的理解,这可能是非常令人满意的。另请参阅情景体验可以创造出与作者目标的强烈个人联系。
游戏帮助玩家评估他们养成的技能
原文:Games help players evaluate their developing skills (andymatuschak.org)
你不必猜测你是否在《见证者(Witness)》中解开了一个谜题,游戏会告诉你。你不必猜测你的射击是否瞄准了,视觉和听觉反馈会告诉你。
有时候,环境会以更隐蔽的方式传达这种反馈。例如,你可能觉得你的跑步和跳跃能力很强,但两个跳台之间精心布置的间隙可能很快就会证明你还没有完全掌握好时机。
前一个例子中那些显式的调整是由游戏设计师精心布置的,也可以说,整个游戏环境的设计就是为了在玩家心理模型中揭示差距。玩家做出行动,有一些心理预期,游戏呈现真正的结果,给玩家机会发现自己的认知错误。好游戏会确保玩家不会偶然地误以为他们的模型是正确的。
游戏帮助玩家制定和调整计划
原文:Games help players make and adapt plans (andymatuschak.org)
在游戏中移动时,你通常不需要思考你是否准备要移动到其他地方,或者你应该移动到哪里:游戏会让你知道(可能在不知不觉中)。
有时,会有一组序列,秩序井然,必须按顺序解决。很轻松就能做出计划;见小跨度任务阶梯作为认知脚手架。
更微妙的是,你有时候会发现 Boss 战取决于你的弓箭技能。地牢的出口都被封住了,所以没有其他地方可去。所以你得出来一个显而易见的结论:你要提升弓箭技能,直到你能打败 Boss。在另一个不同的游戏中,你可能发现你有时会错过弓箭,但总有一条前进的路,至少当下如此。所以你不需要努力提高你的箭术,除非你特别想这么做。
即使是开放世界游戏,游戏设计师也会用利用周遭事物进行暗示,或是用情感设计,来确保至少有至少有一个目的比较显眼,并且设计地恰到好处。如果你选择的挑战方向远非你力所能及,游戏便会明确告诉你「你应该调整计划」,与此同时,另一扇窗也会马上为你打开。
总之,所有这些都意味着玩家可以专注于行动,而不是试图搞清楚他们下一步应该做什么。这与大多数解释型媒体使参与者运行他们自己的反馈循环截然相反。
变得无聊
原文:Get bored (andymatuschak.org)
用活动填补空闲时间诱人至极:阅读书籍,执行任务,网络冲浪,即时聊天。用别人的想法填补空闲时间是文化上默认的行为;为了给自己腾出空间,我必须适应“空虚”的时间。我发现我经常在能变得好奇之前不得不先变得无聊。
所以我的忠告是:当你觉得无聊时,保持这种感觉,而不是立即伸手去看书或做其他活动。
相关笔记:拘泥于「专注」会损害创造性工作
变得好奇
原文:Get curious (andymatuschak.org)
一个忠告。当我发现我迷失于微小的细节,专注于执行而不是思考迷人且宏观的问题,我会试着提醒自己「变得好奇」。在做了这么多年的技术专家之后,我的默认模式是专注于「任务」、「做事」、「实现」。这当然对有意义的智力创造工作是必须的,但这也无疑是不足的。对行为过于专注会挤占诞生洞见的开放心态。听见自己的想法很难。
例如,当我在写如何表述清单类知识的间隔重复卡片时,我注意到我的思维相当迟钝,为了做而做。这项工作毫无生气。我意识到我正在写的内容中有大量开放问题,所以我将工作从原先的「流利地写下我对这个主题的了解」模式切换到「尝试回答:从认知角度来说,如何学习清单类知识?这种类型的知识应该 如何 在间隔重复中呈现?」我经历了一次抛硬币式的切换,并瞬间感到这项工作变得充满活力:我十分好奇这些问题的答案,并且加深了我对这个主题的理解。
相关笔记:
学校教给我们的那种死记硬背的科学过程——从一个问题开始,产生假设,用实验测试,得出结论——是一个很好的工具,但它没有抓住最重要的元素:{真的想知道问题的答案}!
变得好玩
原文:Get playful (andymatuschak.org)
这是一个与变得好奇密切相关的忠告,不过他更适合于做出行动的时刻。
不要担心做得「对不对」,不要担心要「花多长时间」,不要担心能否「解决」问题或是否「重要」。享受你感觉到的与问题的互动和冲动就好了。依冲动行事;看看会发生什么;再遵循新的冲动。躁起来!
例子
当我想到这一点时,很难不想到像 Jacob Collier 这样的人(见这个访谈)。他似乎过着一种不断玩耍的音乐探索生活。我觉得把他当做榜样很有帮助。
《如何阅读一本书》 - Adler and van Doren
原文:How to Read a Book - Adler and van Doren (andymatuschak.org)
该书的第二版,与 van Doren 合著,发表于 {1972} 年。
第一章:阅读的活力与艺术
问:作者用了什么棒球比喻来解释阅读其实也是很主动的?
答:作者比作投手,读者比作捕手,书就是那个棒球。接球也是一种相当主动的行为!
作者提出一个非常有趣的观点:阅读一本书时,通常有两种可能性。包括:
-
你完全懂作者在说什么,那这本书传达了信息,但没有增进你的理解。换句话说,你和作者的大脑都是从同一个模子里出来的,这本书只是传达了你们相遇之前的共同理解;或者
-
你有些地方没看懂,就得下功夫慢慢消化这本书,增进你的理解。
「我们可以大致将阅读的艺术定义如下:{这是一个凭借着头脑运作,除了玩味读物中的一些字句之外,不假任何外助,以一己之力来提升自我的过程。}」
问:作者如何分辨为获得信息而阅读与为增进理解而阅读?
答:前者就像翻阅报纸或热门书籍,易懂不费劲,虽能增长见识,但不会让人费解。而后者需要读一些比我们水平「更高」的内容,这样的阅读会让我们暂时感到困惑,但只有通过这种困惑,才能获得更深层次的理解。
问:要想通过阅读获得深刻理解,需要哪两个先决条件?
答:读者一开始时在理解上不对等,但读者能够(至少部分地)克服它。
「如果你只是获取了新的信息,那不过是死记硬背罢了。… 只有在你不仅知道{作者在说什么},还明白{他为什么这么说以及他的真正意图}时,你才算是有所启发。」
问:这本书主要是帮助人们为了 ??? 而阅读?与单纯为了 ??? 或 ??? 而阅读有何不同?
答:……为了理解而阅读,与为了获取信息或娱乐而阅读形成鲜明对比。
作者提出了一个有趣的类比,把探索式学习称为「无外援的探索」,与指导式学习(「有外援的探索」)形成对比。他们说,理解两者差异的一种方式是思考探索的材料:
{无外援的探索}是{「阅读」自然或世界}的艺术,正如{有外援的探索}(指导、或被教导)是{阅读书籍或从对话中学习}的艺术。
作者声称,因为{为了理解而阅读是有助的探索},所以它需要{做研究(即「无外援」的探索)同样需要的技能:观察、记忆、想象、分析、反思}。
「许多人以为,虽然诗人{在写诗时必须动用他的想象力},但他们{在阅读时却不需要用到想象力}。」
问:作者在阅读和听讲之间提出了什么关键的对比?
答:阅读就像是向一个不在场的老师学习——你不能向他们提问;你必须自己找到答案。
问:从书本中学习,在自然中进行无外援的探索,在何种意义上是相似的?
答:「当你向它提问时,它只有在你自己进行思考和分析时才会给你答案。」
第二章:阅读的层次
问:阅读分为哪四个层次?
答:基础、检视、分析、主题
问:为什么作者把阅读的层次称作「层次」,而不是「类型」?
答:因为它们是递进的,而「类型」通常是彼此独立的。
问:什么是「基础阅读」?
答:基础的识字能力:能认出页面上的每个单词。
问:检视阅读的目的是什么?
答:在(通常较短的)限定时间内,尽可能多地从一本书中获取信息,而不是为了全面理解这本书。
问:哪些发问突出了检视阅读的特点?
答:这本书的主题是什么?它的结构如何?它包含哪些部分?
问:分析阅读的目标与检视阅读有何不同?
答:「如果说检视阅读是在时间有限时可以做到的最佳阅读,那么分析阅读则是在时间不限时可以达到的最佳阅读。」
问:什么时候不需要进行分析阅读?
答:当你的目标仅仅是为了获取信息或娱乐时;分析阅读的目的是为了深入理解。
第四章:检视阅读
问:检视阅读的前提条件有哪些?
答:你必须能够流畅阅读文本,而不用一直查单词或被复杂的句子结构难住;你应该能够理解大部分句子的大意。
问:检视阅读有哪两个子层次?
答:「系统略读」和「粗浅阅读」。
系统略读
问:系统略读的主要目标是什么?
答:在有限的时间里,判断这本书是否值得深入阅读。
问:系统略读之后,除了判断你是否想继续阅读这本书,还应该了解什么?
答:了解作者的主要观点,以及「他写的是哪种类型的书」(我注意到我对这个表述的含义不太确定)。
问:如何开始系统略读?
答:先读书名页和序言,寻找有关书籍领域、目的、视角的线索。你能把它归为某个类别吗?
问:在进行系统略读时,阅读完书名页和序言后应做什么?
答:研究目录,以了解书的结构。
问:系统略读时,在研究完目录之后,下一步应该怎么做?
答:查看索引,了解书中涉及的主题范围和引用的作品;挑几段看似关键的部分阅读,试图找到文中的关键所在。
问:系统略读时,在查看索引之后,接下来应该做什么?
答:阅读书籍护封上的出版商推荐语:通常会有精彩的概述。
问:系统略读时,在阅读护封简介之后,下一步该做什么?
答:查阅书中的重点章节,特别是它们的开头和结尾部分。
问:系统略读时,在浏览重点章节之后,接下来该做什么?
答:翻看书籍,随意阅读几段或几页,寻找主要论点的迹象。阅读最后的两三页。
系统略读的六个步骤包括:{阅读书名页和序言};{研究目录};{浏览索引};{阅读简介};{查阅关键章节};{随意翻阅}。
在进行系统略读时,「把自己想象成{寻找书籍整体主题或核心思想线索的侦探}」。
粗浅阅读
问:作者所指的「粗浅阅读」(即检视阅读的第二部分)是什么?
答:不要停下来查资料或深思,通读整本书,以获得对整体的感觉。
问:「粗浅阅读」一本难懂的书时,应遵循哪个基本原则?
答:在阅读过程中,遇到不懂的地方不要停下来查找或深思。
问:为什么初次阅读难懂的书时,不应停下来思考不懂的内容?
答:如果你在初次阅读时就尝试弄懂这些细节,往往会失败,并且可能会忽略整体内容。第二次阅读时你会更容易弄懂它们。
速读
问:作者如何重新定义「速读」的目标?
答:目标不只是能读得快,还要能用不同的速度来阅读——要知道什么时候用什么样的速度是恰当的。
速读的一个「更好的公式」是:「在阅读一本书的时候,{慢不该慢到不值得,快不该快到有损于满足与理解}。」
问:为什么速读课程无法帮助你理解一本难懂的书?
答:因为这些课程大多关注基础阅读和生理方面的问题(比如停止默读);而理解一本难书的难点,在于智力层面上如何处理这本书。
第五章:如何成为一名要求严格的读者
问:是什么让「秉烛夜读者」保持清醒?
答:有没有真正在阅读他们手中的那本书,让他们有所不同。
问:主动阅读的核心建议是什么?
答:边读边提问,然后尝试在阅读过程中找到答案。
问:针对任何书籍需要提出的四个主要问题是哪些?
答:整体来说,这本书讲了什么?主要的观点、断言、论点是什么?这本书的内容(部分或全部)真实吗?它的意义何在?
问:如果一本书给你提供了信息,你必须追问的是?
答:这些信息的重要性。为何作者认为知道这些信息很重要?
问:如果一本书不仅提供了信息,还给你带来了启迪,你必须追问的是?
答:还隐含或暗示了什么,寻找更多启迪。
问:一个要求低的读者有何特点?
答:他们不会提出问题——也就得不到答案。
问:为什么仅仅知道「这四个问题」是不够的?
答:你必须养成习惯,在阅读时提问并准确、精确地回答这些问题的。
问:人们对好书打瞌睡,并非因为他们 ???,而是因为他们 ???。
答:并非因为他们不愿付出努力,而是因为他们不知道如何努力。
问:作者建议读者如何标记作者在论证中提出的一连串观点?
答:在页边标上编号。
问:作者所指的「概念笔记」是什么?
答:对于作者的概念性主张的真实性和重要性提出自己的回答,并描述这些主张如何改变了你自己的观念。
问:作者所指的「结构笔记」是什么?
答:你对这些问题的回答:「这是一本什么样的书?」「它整体上谈了什么?」「书的结构是怎样的?」此时你并没有真正了解书的实质。
问:作者所指的「辩证笔记」是什么?
答:对「讨论情境」的观察——这场讨论是由许多作者所共同参与的,而且他们可能根本没有觉察自己的参与。
问:作者称检视阅读时做的笔记为什么?
答:结构笔记。
问:作者称分析阅读时做的笔记为什么?
答:概念笔记
问:在任何领域,艺术家或工匠与一般人有何关键区别?
答:他们习惯了按照该领域的规则行事。(即他们不仅仅是知道这些规则)
第六章:对书籍分类
问:分析阅读的第一条规则是什么?
答:根据类型和主题对书籍分类。
问:理论性书籍和实用性书籍的区别是什么?
答:「理论性书籍教你知道某件事情是什么样的。实用性书籍教你如何去做你想做的事情。」
问:作者如何区分历史书、科学书和哲学书?
答:历史书讲述特定时空的故事;其他类型则关注普遍法则。科学书强调超出日常经验范围的观察和思想;哲学书则让读者通过自身经验来支持论证。
第七章:透视一本书
问:分析阅读的第二条规则是什么?
答:尽可能简明扼要地阐述整本书的主题或要点。
问:分析阅读的第三条规则是什么?
答:勾勒出书中各个部分及其与整体的关系。
问:(解释分析阅读的第二和第三条规则)「如果你只知道它是 ???,你就还没真正把握住一个复杂的整体。你还需要了解 ???」
答:它怎样呈现整体;它怎样呈现多元体(一个有组织的多元体!)
问:分析阅读的第四条规则是什么?
答:明确作者试图回答的问题。
问:给一些作者可能会问的理论性问题的例子。
答:比如,X 存在吗?X 是什么类型的东西?它的原因是什么?它的目的是什么?它的后果是什么?它有哪些特性?
问:给一些作者可能会问的实用性问题的例子。
答:比如,应该做什么?怎么去做?做 X 还是做 Y 更好?在什么情况下做?
问:分析阅读第一阶段的目的是什么?
答:弄清楚一本书讲的是什么,它的结构如何。
第八章:与作者达成共识
问:与作者「达成共识」是什么意思?(coming to term,直译就是确定术语)
答:使用相同的词语并赋予相同的含义。
「一个{术语}就是{用法非常明确的词}。」
问:「术语」和「词语」有什么区别?
答:词语可能有多种含义;「术语」则是指作者明确意图的、含义单一的符号。
问:分析阅读的第五条规则是什么?
答:1) 找出书中的关键词汇;2) 达成共识。
问:分析阅读第二阶段的目的是什么?
答:解读书的内容或信息(通过分析阅读的第 5 至第 8 条规则)。
问:分析阅读的第 5 至第 8 条规则都包含哪两个部分?
答:第一步是处理书本页面上的语言,第二步是深入理解这些语言背后的思想。
问:为什么作者认为如果不主动阅读,就无法与作者达成共识?
答:你通常不会注意到哪些词语特别重要——那些作者以特别的方式使用的词汇。
问:为了「达成共识」,建议怎样做笔记?
答:做一个术语表——列出书中的重要词汇/短语及其含义(即术语)的双列列表。这种对应关系可能是多对多的!
第九章:判断作者的主旨
问:在商业中,人们通常先抛出提案(proposition,也有主旨的意思),再达成共识;在阅读时,为何常常反其道而行之?
答:因为读者通常需要先理解作者用词的含义(达成共识),才能准确把握作者的主旨。
问:分析阅读的两个阶段在哪里交汇?
答:在主旨和论述的层次相交汇(在第一阶段,你通过将书分解成不同部分自上而下;在第二阶段,你通过观察主旨和术语如何组成论述自下而上)。
问:分析阅读的第六条规则是什么?
答:1) 标出书中最重要的句子;2) 找出这些句子所包含的主旨。
问:分析阅读的第七条规则是什么?
答:通过串联句子来找出或构建书中的基本论点。
问:如何找到书中最重要的句子?
答:找那些需要更多努力来理解的句子;找那些表达论述主要依据的句子;找那些为重要术语奠定基础的句子。
问:判断是否理解句中主旨的「最佳测试」是什么?
答:用自己的话重新表达它——最好是用完全不同的词汇(即「做一次翻译」)。
问:理解句中主旨的「另一种测试方法」(非「最佳测试」)是什么?
答:给出一个实例或作一个说明,最好基于个人经历。
「除非你能展示某些与主旨相关的,实际或可能的事实,否则你只是在{玩弄文字},而非理解思想或知识。」
「{咬文嚼字}」:作者用以形容{在不理解词语含义的情况下玩弄文字的行为}的术语。
问:分析阅读的第八条规则是什么?
答:找出作者的解答。
第十章:公正地评判一本书
弗朗西斯·培根对读者的忠告是:「阅读不是为了反驳或驳斥,也不是为了轻信和盲从,更不是为了找话题聊天,而应是为了{斟酌与考虑}。」
问:作者提到的「受教」是什么意思?
答:投入、批判、像同行一样行事。
问:作者提到,读者不仅要有回应,还要负责,这是什么意思?
答:负责意味着你需要有自己的主见,而不只是被动接受作者的主张。
问:「修辞技巧」对于读者意味着什么?
答:知道当别人想要说服我们时,我们该如何应对。
问:分析阅读的第九条规则是什么?
答:在评判前先理解。
问:分析阅读的第十条规则是什么?
答:在你不同意时,避免无理的辩驳和争论。
问:除非……否则分歧仅是「徒劳的争执」。
答:你怀抱着解决问题的真诚希望。
问:如何区分知识的陈述与观点的表达?
答:「知识由那些能够被辩护的观点组成」(即通过证据和理由支撑的观点);我们相信我们能够说服他人。
问:分析阅读的第十一条规则是什么?
答:将观点分歧视为可解决的问题,并给出你的理由。
第十一章:赞同或反对作者
问:在何种意义上,「我没理解」能构成一种批评性的评论?
答:如果有证据表明这本书结构混乱、术语使用模棱两可等,就会使论证无法评价。
问:进行分歧讨论的「三个条件」是什么?
答:1) 承认自己的情绪;2) 陈述自己的假设;3) 力求保持公正。
问:批评的四种类型是什么?
答:1) 知识不足;2) 知识错误;3) 不合逻辑;4) 分析不完整。
卡片笔记写作法 - Ahrens
原文:How to Take Smart Notes - Ahrens (andymatuschak.org)
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
一本关于§笔记写作系统实践的核心书籍。Sönke 主要关注的是卡片盒笔记系统对学术写作过程的好处。这里的一个核心观点是,创造性的写作可以变得相对封闭和可操作;通过一系列步骤,凭借紧密连接的笔记系统,它极易执行,类似 GTD 风格。
关于关联的建议…
关键词应该是稀疏的,并经过严格地精选。它们主要是作为一个「跳板」:笔记之间的联系将成为主要的导航手段。索引参考 vs. 标签、标签是一种无效的关联结构
- c) 确保你以后能够找到这个笔记,要么从你的索引中链接到它,要么在一篇已经被链接到索引的笔记中做链接,来作为一个讨论或者话题的入口。
- 在卡片盒笔记系统中,关键词可以像标签一样轻松地添加到笔记中,然后显示在索引中。关键词要谨慎选择,宁缺毋滥。卢曼会在索引中的关键词旁边添加一个或两个(很少是更多)笔记的编号(Schmidt 2013, 171)。
- 因为卡片盒不应该被用作档案,只从中取出我们放进去的东西;而是应该作为一个系统来思考,笔记之间的互相链接比从索引到单个笔记的链接重要得多。
- 人们选择关键词的方式清楚地显示了他们是像档案员还是像作家那样思考。他们是否想知道把笔记存放在哪里,亦或如何检索它?档案员会问,哪个关键词是最合适的?作家则问:在什么情况下,就算我忘了一个笔记,我也能偶然发现它?这是一个关键的区别。
我们应该提防自动链接。最好选择明确的关联,而非推荐的关联
- 即使 Zettelkasten 在这里也提出了建议,例如基于联合文献的参考,但做好交叉参考是一个认真严肃的问题和思想发展的关键部分。
关于构建笔记档案的建议
在未来,你可能会考虑「X 对 Y 的影响」,而不是某本关于该主题的某本书籍。通过使用常青笔记应以概念为导向,你可以建立一个组织结构,这个组织结构体现的是:你想在未来的何种背景下看到这些想法。
- 许多学生和学术作者在做笔记时的想法与早期的船主一样。他们凭直觉处理他们的想法和发现:如果他们读到一个有趣的句子,他们就在下面划线;如果他们想做评论,他们就把它写在空白处;如果他们有一个想法,他们就把它写在笔记本上;如果一篇文章看起来足够重要,他们就会努力写一篇摘录。这种方法会让你在很多不同的地方留下不同的笔记。那么这就意味着,写作在很大程度上依赖你的大脑来记住这些笔记是在什么地方和什么时候写下的。然后,文本必须独立于零散的笔记进行概念化,这就解释了为什么那么多人诉诸于头脑风暴,但是在事后又得根据原来的想法安排资源。
- 在旧系统中,问题是:我在哪个主题下存储这个笔记?在新系统中,问题是:我想在哪种情况下再次看到它?
- 如果你需要一个额外的步骤来理解或掌握一个想法,短暂的文字笔记是有意义的,但它们不会在写作过程的之后阶段帮助你,因为当你需要它来证明一个论点时,划线的句子绝不会自己出现。
项目笔记的重要之处似乎在于它们与永久笔记分开。
- 项目笔记,只与一个特定的项目有关。它们被保存在一个特定的项目文件夹中,在项目结束后可以被丢弃或归档。
不需要详尽地处理每一个主题:只需写下似乎可能帮助你思考你当下聚焦的主题的内容。
- 因为卡片盒的目的不是要成为一本百科全书,而是一个思考的工具,所以我们不需要担心完整性。我们不需要为了弥补笔记序列中的空白而写下任何东西。我们只写下有助于我们自己的思考的内容。
相较于记忆系统
抽认卡需要详细阐述,并嵌入上下文中。
- 抽认卡上的信息既没有详细阐述,也没有嵌入到某种形式的上下文中。每张卡片都是孤立的,而不是与理论框架的网络、我们的经验或我们的心理模型体系相连。
常青笔记的维持近似于间隔重复,但它在一个更自然的情境下。
- 我们学习某样东西时,不仅要把它与前置知识联系起来,并试图理解其更广泛的含义(阐述),而且还要在不同的时间(间隔)和不同的背景下(变化)试图提取它,理想情况是在机会的帮助下(背景干扰)和故意的努力下(提取)。笔记盒不仅让我们有机会接触有保证的学习方式,而且,我们一用它,我们就完全按照它推荐的方法进行学习。
记忆的局限性
- 选择是我们的精神之船的骨架。在这种情况下,记忆的作用是显而易见的。如果我们记住了所有的东西,那么在大多数情况下,我们就会像什么都不记得一样糟糕。我们回忆一个时间段所花的时间和原来流逝的时间一样长,同时思考永远不会有进展。(William James 1890, 680)。
笔记帮助你准确思考
在阅读中记笔记是检测理解的好方法:要是不理解,就总结不出来。并且,进一步将现在的笔记联系并整合进之前的笔记中,理解效果会更好。写作促使人们更加深入地理解
- 如果我们这时想糊弄自己,写的笔记语焉不详,那么紧接着,当我们要把文献笔记改成永久笔记时,并把它们与其他笔记联系起来时,问题就来了。
记笔记,并将其整理到卡片盒中,只不过是为了理解某件事情背后蕴含着的更广泛的意义。卡片盒迫使我们提出许多阐述性的问题:它意味着什么?它与某事有什么联系?它与某事有什么区别?它与什么相似?
- 康德在《什么是启蒙》中谈到:「不成熟状态就是不经别人的引导,就对运用自己的理智无能为力。当其原因不在于缺乏理智,而在于不经别人的引导就缺乏勇气与决心去加以运用时,那么这种不成熟状态就是自己所加之于自己的了。Sapere aude!要有勇气运用你自己的理智!这就是启蒙运动的口号。」(康德 1784,何兆武译)
- 但在写卡片盒第一篇笔记时,我问自己的第一个问题是:「这对我自己的研究和利用卡片盒思考问题有什么帮助?这是另一种发问方式:为什么我写下的这些内容会引起我的兴趣?」
卡片盒笔记系统在认识论上说一不二,更有可能发现相反的事实常青笔记是发展大胆想法的安全场所 写作促使人们更加深入地理解
- 敞开心扉寻求洞见的第一步,也是最重要的一步,就是将我们发现论点和想法的工作方式从自上而下变为自下而上。
我们很难看到文本中「没有」说的东西。通过将个人阅读理解与先前的笔记结合起来,我们自然会遇到作者可能没有遇到难点。写作促使人们更加深入地理解
- 有经验的学术读者通常是带着问题去阅读文本,并试图结合其他可能有用的方法;而没有经验的读者则倾向于采用文本中已有问题和论证的框架,并将其作为既定的内容。优秀的读者能做的是发现某种方法的局限性,看到文本中没有提到的东西。
人们不当地忽略了记笔记的问题
大多数人都不擅长写笔记,而且由于间接和延迟的反馈,他们往往不自知。笔记写作实践通常是无效的
- 人们不重视笔记写作的另一个原因是,即使笔记写得不好,也不会立即得到任何负面的反馈。
写笔记似乎会花大量时间,但那是与理想状态相比,而不记笔记的阅读往往浪费全部时间。常青笔记有助于积累阅读成果
- 虽然写下想法像是绕了远路,得花费额外时间; 但不记笔记才是真正的无效功,因为我们读到大多数东西都会被忘掉。
笔记有助产生创造性洞见
人们专注于写书和论文,但这远远不够:他们需要将关于这个主题的大量仔细思考综合起来。
- 通常是在在少数特殊的境况需要写作,比如写一部长篇小说、一本专著、一篇文章,或者是对于学生,论文和需要交的内容。
- 每一项知识性的努力都是从已有的观念开始的。之后这些观念在进一步的探究过程中转化,并能成为后续努力的起点。这基本上就是伽达默尔(Hans-Georg Gadamer)所说的解释学循环(Gadamer 2004)。
头脑风暴是辅助...
- 由于很少人教授或讨论记笔记的正确方法,几乎所有的写作指南都建议从头脑风暴开始,也就不足为奇了。如果你过去从不写作,你确实只能依赖大脑。就其本身而言,头脑风暴不够好:既不客观也不可靠——在学术或非虚构写作中,这两个方面相当重要。推广从头脑风暴开始的做法更令人惊讶,因为头脑风暴不是大多数想法的起源。预想着通过头脑风暴从脑子中搜罗出的东西,本来也不是你的大脑想出的。它们的来源在大脑之外。
- 谈到记笔记,许多学生和学术写作者的想法与早期的船主一样。他们以立竿见影的方式处理他们的想法和发现:如果读到有趣的句子,就在下面划线。如果想做点评,就在空白处写下来。如果想到一个点子,就记到笔记本上,如果一篇文章看起来足够重要,就努力写一篇摘录。这样做会让你在很多不同的地方留下很多不同的笔记。那么,写作就意味着在很大程度上依靠你的大脑来记住这些笔记是在何时何地写下的。然后,文本必须独立于零散的笔记进行概念化,这就解释了为什么那么多人诉诸于头脑风暴,但是在事后又得根据原来的想法安排资源。
笔记档案是一个安全的地方,可以让不成熟想法逐步完善。
- 史蒂芬·约翰逊(Steven Johnson)有本书颇富洞见,这本书描述了科研工作者和普通人得到新想法的过程,并将其称为「慢直觉」。他强调,实验空间对此不可或缺。这种空间使得各种想法可以自由交融(Johnson 2011),因而是慢直觉得以运转的先决条件。人人思路开阔的实验室便可以提供实验空间,过去巴黎的咖啡馆也可以,在那里知识分子和艺术家能自由地讨论各种想法。我认为卡片盒同样是实验空间,因为卡片盒也能实现各种想法的自由交融,并从中孕育出新颖见解。
写作时的精神状态
记笔记的做法可以把写作变成一个可预测、可操作的过程(「从丰富开始」)。此即可执行的写作策略
- 要想写出一篇好的论文,你只需重写一份好的草稿;要想写出一份好的草稿,你只需要把一系列的笔记变成一篇连续的文本。由于一系列的笔记只是你已有笔记的重新排列,你真正要做的就是在你阅读时拿着笔。
- 只有当工作记忆中没有其他东西萦绕不去而占用宝贵的精神资源,我们才能体验到艾伦所说的「心如止水」——在这种状态下,我们可以专注于眼前的工作,而不会被其他的想法分心。
- 因为每个任务的结果得到记录,它们之间可能存在的联系因而变得清晰可见,我们便可以很容易地随时接着上次停下的地方继续工作,而不必一直把它记在心里。
- 如此这般,我们不再需要记住还有什么事情没完成,也可以从上次停止的位置继续完成这项任务。这也正是通过写作思考的优势之一,即把所有事情置于思绪之外。
卡片盒笔记系统(Zettelkasten)能降低改稿的情绪负担。对某一特定作品来说,低价值的材料可以转变为永久笔记,在未来提供价值。或者说,如果「写作」始于笔记档案,那么删除手稿材料也无妨,因为它在其他地方还存在着。常青笔记工作流能降低改稿的情绪负担
- 最困难的任务之一是严格删除论证中没有作用的东西 ——「对心头肉开刀」。42当你把有问题的段落移到另一个文件中,并告诉自己以后可能会用到它们,这就变得容易多了。
笔记是一种关注「投入而非产出」的方式,它不仅仅关乎时间。可执行的写作策略 常青笔记写作是知识工作的基本单位
无压上手
- 他不仅强调他从不强迫自己去做不喜欢的事情,他甚至说:「我只做容易的事,我只在立马知道如何去做的时候写作。如果我有片刻的动摇,就会把这件事放在一边,做别的事情。」(Luhmann et al., 1987, 154f.) 4
- 「如果某件事暂时停滞不前,我就将它放置一边,转头去做别的事情。」有人问他在被项目卡住时还会做什么,卢曼回答道,「嗯,写其他的书。我总是齐头推进不同的稿件。这样同时推进不同项目,我从来不会遇到心理障碍。」
- 这部分是由于前面提到的蔡加尼克效应(Zeigarnik 1927),即我们的大脑倾向于在一项任务完成之前一直占据注意力。如果我们看到了终点线,我们往往会加速,正如每个跑过马拉松的人都知道的那样。
试金石:写作是头等大事。所有活动都应通向写作。
- 专注于写作,好像其他的都不重要,并不意味着其他事情就敷衍了事,相反,专注写作一定会让你做事方法有所该关注。当你参加讲座、讨论或研讨会时,有明确、具体的目的,你就会更加投入、更有的放矢。
未分类
-
抽象是分析和比较概念、进行类比和组织思想的关键,这在涉及跨学科工作时尤其如此(Goldstone and Wilensky 2008)。能够抽象和组织想法,同样只是等式的一面。如果没有一个能将抽象思维化为输出的平台,我们将会一无所获。而具体标准化的笔记,迫使我们将信息综合,把想法结合多个背景,并以创造性的方式进行比较和组合,同时保留信息的真正内涵。
-
我们不需要担心什么该被记下,因为我们已经回答了这个问题——每天都回答很多次。每当我们读到一些东西时,就会做出决定,什么值得写下来,什么不值得。
-
正是开始时的决定——把写作作为整个智力工作的中心和终点,彻底改变了寻找话题的作用。现在与其说是寻找写作的主题,不如说是在研究通过写作产生的问题。
-
这就是为什么我们需要对它进行阐述。阐述只不过是以一种有意义的方式将信息与其他信息联系起来。阐述的第一步是对某一信息进行足够的思考,以便我们能够写下它。第二步是思考它对其他上下文意味着什么。
如何在阅读时整理所得
原文:How to collect observations while reading (andymatuschak.org)
写你所读,以求内化很重要,但在阅读和写作精细打磨的笔记之间来回切换会让人分神。所以,在阅读时应当轻巧地收集见解。你可以把它们存放在为临时性而不完整的笔记建立的写作收件箱中,从而关闭开环,便于后续处理(见如何将阅读标注加工成常青笔记)。
注释——即使是含有你自己的文字的内联旁注——也没有什么信息价值。它们是原子化的,彼此之间没有联系,更无法聚沙成塔;它们非常浓缩,基本上没有经过编辑。没关系:把注释看作是提醒,对你说着「嘿,看看这段话」,有只言片语充当上下文,以唤起你对这段话的记忆。
你反正都要写能持久经用的笔记,所以注释只要有足够信息能重现阅读时刻的心理情境即可。但这一方式是不可持续的,因为长此以往,你每次想要回想你对这本书的体验,就要面对一大堆钩子,个个都要「追溯」。
在处理这些观察结果时,你希望能高屋建瓴,将相似想法汇集成簇,所以通过可操作的方式来收集注释是很有帮助的。
具体来说,我正在尝试的方法包括:
-
实体书:
-
在一张 A7 纸上写下几个字(方便在外出时抓住灵感的口袋笔记本)
-
在感兴趣的段落旁边空白处画个点或画条线,并折上页角。
-
-
网络文章:
-
将所有有趣的摘录复制粘贴到写作收件箱里的单条工作笔记中。
-
或者,使用 Bear 摘录器搭配标记工具。
-
-
电子书和 PDF:
-
使用应用内的荧光笔
-
在收件箱中把所有标记的重点导出到工作笔记中,将其汇集成丛
::TODO::
-
我发现数字解决方案相当不令人满意:在这些解决方案中,浏览一个又一个注释很慢,而且很麻烦。
参考文献
https://zettelkasten.de/posts/making-proper-marks-in-books
文本激发了一个想法,而灵感的源泉就流淌在文本之中。
https://zettelkasten.de/posts/create-zettel-from-reading-notes
在阅读时在我的 Mac 上做笔记对我来说是行不通的。我在打字时的状态,与我在阅读印刷品时的状态差别太大。来回走动需要费力地转换心理准备。首先,我一段时间后便会感到疲惫。其次,这种切换破坏了专注:我无法正确地跟随文本。这就是为什么我在纸上做笔记,并在页边上用小 * 标记我想参考的段落。
人类的信道容量随着刺激维度的增加而增加
原文:Human channel capacity increases with stimulus dimensionality (andymatuschak.org)
对于单维刺激,人作为信息处理器时的信道容量只有几个比特,但在日常生活中,我们似乎经常产生比这更复杂的刺激。对这种差异的一个解释是,人类的信道容量随着刺激的{维度}而{增加}。
例如,Miller 对来自 Hake 和 Garner(1951 年)以及 Coonan 和 Klemmer(与 Miller 的未发表的通信)的数据分析(1956 年,第 85-87 页)表明,人类对直线上的点的通道容量在 {3.2 和 3.9 比特(在 10-15 类的分类任务中)}之间,而 Klemmer 和 Frick(1953 年)的数据表明,人类对矩阵中的点的信道容量约为 {4.6 比特(在约 24 类的分类任务中)}。
Miller 的图(1956 年,第 88 页)总结了来自独立变化的维度的数据:
通道容量不会随着维数的增加而线性增加。事实上,随着维度的增加,只要{需要判断区分的类别的数量大于维度},任何单个变量的渠道容量都会可靠地{减少}。(Miller, 1956, p. 89),。(Erikson, 1955, p. 327-329)
即使在所增加的维度不是独立的情况下,这种效应似乎也持续存在,例如,当同时将大小、亮度和色调与单一变量相关联时,通道容量为 4.1 比特,而任何孤立的属性为 2.7 比特(Eriksen, 1955, as aggregated by Miller, 1956, p. 88)。
Miller 猜想(1956 年,第 91 页),这种效应在 10 维左右收敛,但当时并没有证据。Halford 等人(1998 年)回顾了中间的证据,认为该效应的极限更接近于 {4}。
参考文献
Eriksen, C. W., & Hake, H. W. (1955). Absolute judgments as a function of stimulus range and number of stimulus and response categories. Journal of Experimental Psychology, 49(5), 323–332. https://doi.org/10.1037/h0044211
Hake, H. W., & Garner, W. R. (1951). The effect of presenting various numbers of discrete steps on scale reading accuracy. Journal of Experimental Psychology, 42(5), 358–366. https://doi.org/10.1037/h0055485
Halford, G. S., Wilson, W. H., & Phillips, S. (1998). Processing capacity defined by relational complexity: Implications for comparative, developmental, and cognitive psychology. Behavioral and Brain Sciences, 21(6), 803–831. https://doi.org/10.1017/S0140525X98001769
Klemmer, E. T., & Frick, F. C. (1953). Assimilation of information from dot and matrix patterns. Journal of Experimental Psychology, 45(1), 15–19. https://doi.org/10.1037/h0060868
Miller, G. A. (1956). The magical number seven, plus or minus two: Some limits on our capacity for processing information. Psychological Review, 63(2), 81–97. https://doi.org/10.1037/h0043158 Miller - The magical number seven, plus or minus two
不当的时间压力往往会毁掉创造性工作
原文:Inappropriate time pressures often harm creative work (andymatuschak.org)
约束往往会带来创造力,但是,当约束的性质与手头的工作完全不兼容时,就另当别论了。比如,当你在设计过程中迷失方向,用「疯狂八格(Crazy Eights)」法或许有用:把一张纸折成八块,每块里用一分钟草拟一个构思。这样不错!如果项目进展顺利,设个时间表能帮你做出更明智的取舍,把事情做到「够好就行」,有时甚至能提高你的专注度。但若你正在赶一个大型创意项目的截止日期,发现自己的状态和截止时间简直是水火不容,那这压力就不会帮你集中注意力了,反而会让你有挫败感(产生稀缺心态),甚至还会让成品更加糟糕。
这其实是在创造性工作中执着于产出往往适得其反的一个具体例子。另一个也相关的笔记:深度研究需要比技术行业具备更慢的节奏。
统计书的故事
这是我个人经历里的一个真实案例。当时我正忙于制作一个新设计的大型演示视频。我曾自设目标,要在月底前搞定这个视频。周一刚开始,我就粗略地规划了一下怎样才能达成这个目标。看似勉强可行,但得确保整周的每一件事都得完美执行。
到了那最后一周的周二早上,我在一个统计学的教科书上遇到了难题。原先准备用于视频的那些部分跟剧本不搭界,我得用后面的章节。于是,我翻到了后面的章节,开始寻找能适用的内容。这时倒霉事开始了。因为赶时间,我其实没有仔细阅读那本书,只是在盲目地找能填补空缺的东西。没给自己留出足够的时间去深入理解,结果啥都对不上号。越是急,越是看不懂下一节。当时我并没意识到问题出在哪——我以为只需继续找就行了。在浪费了近 90 分钟却没有任何实质性进展后,我终于意识到需要停下来,真正去阅读这本教材。这么做后,30 分钟内我就找到了所需的内容。
所以,这个故事最初的寓意大概是:好吧,慢下来,用对的方法,否则你会浪费更多时间乱打一气。但我觉得更重要的寓意是,我在那整个时期都感到压力重重,不快乐——即便是我决定仔细阅读的时候也是如此!这是因为,我那时仍想着要在逼近的截止日期前完成所有事情。我脑袋中的计时员主导着我的情绪。在这样的心态下,任何小挫折都变成了大问题——一个需要解决的难题,而非激发好奇心的契机,而且很难变得好玩。这样的状态不仅令人不悦,也难以进入我希望的工作节奏。
了中午,我出去散了个步,还是对早上的工作感到紧张。然后,我突然意识到我的不愉快完全是自找的,完全没必要,就笑了出来。我对自己说:「其实,推迟到下周发布这个演示也无妨,这明摆着就是早晚要发生的事。」说完,一切紧张感立刻烟消云散。富足感。更有意思的是:如果不给自己设置严格的时间压力,我完成的工作量几乎一样多!可能会稍微少一点,有时候我会陷入我本可以在明确的期限下避免的「兔子洞」。但在没有时间压力的情况下,我更容易发现重要的洞见。对我来说,洞见的密度,而不是产出的密度,才是最重要的工作指标。
问:回想一下你在临近期限时试图改编统计学教材的经历,午后散步时有何感悟?
答:...(如有需要,请看笔记)
索引参考 vs. 标签
原文:Indexed references vs. tags (andymatuschak.org)
标签在当代信息系统中很常见,但标签是一种无效的关联结构。一个更有效的历史先例是出版业中的索引。
索引并不力求记录包含某一特定术语的所有相关页面;相反,它只记录少数几个最重要的页面在第几页。相比之下,带有特定标签的页面列表往往变得相当臃肿。
索引也可以包括其他编辑备注。例如,一个条目可能会注明「另见:......」
索引条目和复杂的标签系统都可以是分层的。
在卡片盒笔记系统中
卢曼把他的索引卡严密地整理起来。这里索引主要是作为跳板使用:笔记间的关联更为重要。
参考文献
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
在卡片盒笔记系统中,关键词可以像标签一样很容易地被添加到笔记中,然后显示在索引中。它们应该被小心翼翼地选择,而且要稀少。卢曼会在索引中的关键词旁边添加一个或两个(很少添加更多)笔记的编号(Schmidt 2013, 171)。
因为它不应该被用作归档——归档的话我们只是把我们放进去的东西拿出来——而是作为一个系统来思考,笔记之间的引用比从索引到单个笔记的引用重要得多。
只有针对于我所使用的对象和在笔记中提到的标签才是有价值的:为了在远距离上采取精确的行动,我需要一把狙击步枪而不是霰弹枪。
当你在你的档案库中搜索一个主题(topic)就像猎枪把子弹射进树林,于是开始希望能收获过会放在餐桌上的食物。我需要一把狙击步枪,夜视镜,和红外线卫星图片,就像我在反恐精英中作弊一样。(顺便说一下,我从来没有做过。)那里有一些偷偷摸摸的、珍贵的游戏。
实践出洞见时,建议摸石头过河而不是先画蓝图
原文:Insight through making prefers bricolage to big design up front (andymatuschak.org)
如果系统意在拓宽自身所依赖的理论的边界,开发这种系统时,根据实践出洞见,应当理论和系统开发齐头并进,从而能在两者的交汇处发现新的进展。有效的系统设计需要从真刀真枪的使用情境汲取洞见:必须在新系统中不断实现新的理论想法,并在一些真刀真枪的使用情景下观察这些想法的影响。
这些反馈环路很短,因此合适的做法是摸石头过河(bricolage),而不是前期画大蓝图。但关键是,你必须努力垒出具体的一块块「石头」:很容易像醉汉一样漫无方向。
我怀疑这便是 Ted Nelson 的系统没有取得预想成功的部分原因:他和他的同事无休止地做着前期设计,却从来没有把他们的想法应用起来,运用他们的系统书写文本,或者完成他们的工作。
参考文献
我估计是尽一切所能实现构想的人……实现想法让想法成为现实,让我雀跃万分……一旦想法成为现实,它会开始讲自己的故事。
—Dan Ingalls, as quoted in Nielsen, M. (2018). Augmenting Long-term Memory. http://augmentingcognition.com/ltm.html
交互是界面设计中的成本中心
原文:Interaction is a cost center in interface design (andymatuschak.org)
界面设计者通常对设计「有吸引力的交互」感兴趣,但交互本来就是是强加给用户的负担——是需要避免的负担。如果我正在使用界面来分析数据,零互动是最理想的状态。我阅读一屏幕的信息,注意到一个模式,然后回答我的问题。任何过滤框、导航按钮和清洗器都是额外的成本。
当然,无论如何深思熟虑地呈现,在没有互动的情况下,都有太多的信息无法理解。在这些情况下,谨慎地使用互动性,可以过滤可能性空间,进而得到益处,但必须始终仔细地平衡这种益处所带来的割裂感。
(2006 年)Bret Victor 还观察到:
交互除了可能极其浪费时间,还有更严重的问题:
用户必须已经知道她想要什么,才能要求得到它。如果软件能利用历史信息和环境做推断,便能为用户提供相关的信息,而用户甚至不知道自己需要这些信息,纯粹的交互式软件迫使用户做出先手。
用户必须知道如何问。也就是说,她必须学会操纵一台机器。在软件可用性社区中,Donald Norman 关于确定用户的「心理模型」的概念已经广为流传,直至现在,被认为是一个核心的设计挑战。然而,Norman 是在机械设备的背景下描述这个概念的。它只适用于某些软件,那些软件实际上隐性令用户建立模型。一个低交互的、非机械性的信息图形可以使用户和设计者免于在心理模型上的挣扎。
导航意味着状态。可以导航的软件会使用户迷路。导航越多,陷进去的角落就越多。可操纵的状态越多,进入「坏模式」的方式就越多。状态是人们害怕计算机的主要原因——有状态的东西可以被破坏。(注:一本书保持的唯一状态是它打开了哪一页,这就是为什么「迷失在一本书里」描述了一种愉悦的体验!)。
参考文献
Victor, B. (2006, March 15). Magic Ink: Information Software and the Graphical Interface. http://worrydream.com/MagicInk/
内驱调节的学习是自我实现的;外驱调节的学习是自我否定的。
我们很少为了学习而学习,即使它有时候看起来像这样。学习中的各种行为表现,通常会受来自学习者内部或者外部的因素所调控。
走出教育机构,「学习」通常只是追求内在意义的路上,一个工具性的目标。隐性的学习目标也可能作为真实的好奇心或审美本能的结果而出现。这些「煽动者」都来自学习者的内在本能,它们作为掌舵手极为有益,因为:学习活动会顺应个人内在追求、好奇心或审美经验的转变。学习活动表达了这些个人的内驱力,并受到它们的调控。一旦内驱力停止,学习就会停止;而感受到学习的正反馈,将反过来激发、塑造这些个人内驱力。这就是自我实现的行为。
相比之下,另一些学习行为主要是由外部力量驱动的。「机器学习将成为我所在领域的一件大事,所以我想我应该学习一下。」「作为一个所谓的知识分子,我觉得我应该了解柏拉图的论点。」「我听到很多人都在谈论这本书;我想我应该读一读!」当义务感停止时,学习就会停止。无论是奖励还是痛苦,这些活动都将智力的主动性委弃给外部力量。这是自我否定的行为。
这就是为什么赋能环境的活动直接服务于内在意义的目的的一个原因。
另见教育计划往往会自我颠覆。
一天中很难进行超过几小时的高强度创造性工作
原文:It’s hard to do difficult creative work for more than a few hours a day (andymatuschak.org)
我发现,当我从事困难的创造性项目时,通常每天有效工作的时间不会超过四到五小时,大多数时候甚至只有三小时。相比之下,当我编程或做其他相对机械的工作时,效率下降通常发生在八到九小时之后。如果工作内容有所变化或非常明确,工作时间可能还会更长。
经过几小时的高强度创造性工作后,继续工作的每个小时通常都会变得更加困难。我会发现自己难以保持专注,注意力开始涣散,兴趣减弱(这可能会导致持久的负面影响!)。
这种出乎意料的时间限制在作家中很常见,他们通常会在早晨集中精力写作,然后用剩下的时间做其他任务或放松。不过,这并非总是如此:有些人对创造性工作有非凡的精力
许多创意工作者报告说每天只进行几小时的核心工作,他们往往通过{在周末工作}来增加有效工作时间。
相关笔记:
参考文献
Ericsson et al - The Role of Deliberate Practice in the Acquisition of Expert Performance
几乎所有作家都会每天早上安排三到四小时写作,剩下的时间则用来散步、写信、打盹和做其他不那么费力的事情(Cowley, 1959; Plimpton, 1977)。
一旦你了解了真正工作的形态,就需要知道每天要花多少时间在这上面。你不能简单地每时每刻都在工作,因为很多工作类型都有一个临界点,超过这个点,结果的质量就会开始下降。
这个限度因人而异,也因工作类型而不同。我做过几种不同的工作,每种工作的限度都不一样。对于较难的写作或编程,我的限度是每天大约五小时。而当我经营一家初创公司时,我可以一直工作。至少在我做的那三年里是这样,如果再持续更久,我可能需要偶尔休假。
https://twitter.com/michael_nielsen/status/1411700590661472260?s=20
Mason Curry 有一本书,讲述了非常成功的作家和艺术家的日常工作习惯。令人惊讶的是,这些习惯非常相似——他们大多数每天实际工作的时间大约是四小时,通常是在早上,当然也有不少例外。
一些相关参考资料可以在什么是晨间写作效应? · Gwern.net中找到。
失业(二) - 如何自救 | Applied Divinity Studies
接受每天最多只能工作四小时的事实,并确保你每天都真正达到这个限度。
效率被严重高估了;偷懒被严重低估了。定期安排的休息日、休假、假期、休息、无目的的散步和放松时间,对于任何类型的高效表现都是必不可少的。最好的职业道德需要{良好的休息道德}。
The Technium:我希望我早点知道的 103 条建议
倾听自己的想法很难
原文:It’s hard to hear yourself think (andymatuschak.org)
一些相关的笔记:
助益审慎思考与开放思维的不完全清单
-
在早晨默认关闭 Wi-Fi
-
在我的日程安排中保持一致性
-
提醒自己我的生产力的关键是,我需要在早上完成高度专注的创造活动,记录/跟踪是否发生这种情况。
-
清晨第一件事是冥想
-
简单、熟悉的背景音乐
-
大量长距离散步,一般不听有声读物或播客
-
我的笔记主要包含我自己的文字(文献笔记是次要并分离的)
-
每周、每月、每季、每年的反思和规划工作
-
当我工作时,Forest.app(专注森林)在我的手机上运行。
-
我的手机上没有安装推特、邮箱等软件
-
Focus.app 从早上 7 点到下午 5 点运行,阻止邮件、Twitter 时间线、分散注意力的网站,等等。
- 我不确定这是不是一个好的做法:拘泥于「专注」会损害创造性工作。工作时间块在晚上结束,所以我倾向于在那时做我的漫游,但我不知道这是否太僵硬。
-
通常在晚上或感觉精力不足时分批回复邮件
-
通常每天最多在下午五点接受一次会议,以保持白天日程完全开放
Deresiewicz, W. (2010, March 1). Solitude and Leadership. The American Scholar.
我自己发现,我的第一个想法从来不是我最好的想法。我的第一个想法总是别人的;它一般是我已经听说过的关于这个主题的某些东西,往往是些传统的智慧。只有通过集中精力,坚持挖掘疑问,耐心等待,调动我全部的头脑,我才能得出一个原创的想法。通过给我的大脑一个机会来进行联想,它才会建立联系并给我一个惊喜。而且,即使这个想法结果并没有变得特别好,我也需要时间去思考,去犯错误并认识到它们,去产生错误的开始并纠正它们,去超越我的冲动,去打败我「宣布工作完成」并转到做下一件事的欲望。
多产的作家兼特拉普派僧侣 Thomas Merton 在哥伦比亚大学读书期间发现,这种情况曾发生在他身上。在晚年,他写道:「真正的内在自我必须就像沉在海底的宝石一样被抽出来,从混乱、模糊中解脱,从沉浸在平凡、不起眼、琐碎、肮髒、转瞬即逝中解救出来。」
深厚欲望就像在地表深处形成的钻石,更接近地球的核心。深厚欲望不受我们生活中不断变化的环境影响。另一方面,浅薄欲望则具有高度模仿性、传染性,而且往往很肤浅。
卓越洞见从既往的所思所想中涌现
原文:Leaps of insight emerge from prior thought (andymatuschak.org)
他人的神来之笔,你看到的只是最终成果,却看不到多少想法在灵光闪现之前被弃之不用。这某种程度上,是因为我们感觉自己的顿悟从来不是靠努力去顺其自然得到的 —— 然而他们的这些灵感却是这样的!
卓越洞见的诞生,有赖于在相应主题上,你积累了足够思考。有时候,这种积累完全发生在我们的潜意识中(就像 May-Li 所说的,我们的「潜意识中的燃烧室」),认识到这点,有助于我们设计外部认知系统,将日常胡思乱想聚沙成塔(见知识工作应该聚沙成塔)。
这个概念的一个实际含义:常青笔记作为知识工作的基本单位。
参考文献
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
通常是在在少数特殊的境况需要写作,比如写一部长篇小说、一本专著、一篇文章,或者是对于学生,论文和需要交的内容。
每一项知识性的努力都是从已有的预想的,然后在进一步的探究过程中转化,以此作为后续努力的起点。这基本上就是汉斯·乔治·加达默尔(Hans-Georg Gadamer)所说的解释学循环(Gadamer,2004)。
但最重要的是,如果没有一个永久性的想法库,你将无法发展任何主要甚至长期的想法,因为你把自己禁锢在了某一项目周期内,或者把自己禁锢在了有限的记忆容量里——卓越的想法需要的远不止这些。
你脑海中能用于头脑风暴的东西通常并非发源于此,相反,它们来自外部,来自于阅读、讨论和他人的意见,来自于与写作相关并通过写作得到提升的一切。
先学再记
原文:Learn before you memorize (andymatuschak.org)
Piotr Wozniak - 有效学习 - 表述知识的二十条规则有条经典建议:间隔重复最好用来帮助你强化你已经理解的东西。把它看作是一种「维持状态」的方法——在你运用练习技巧之前,你必须处于足够好的状态。
从机制上讲,我认为这是真的,因为助记媒介的卡片依赖于调用外部经验(从叙述中,从现实世界的经验中)。你所复习的卡片并没有完全「覆盖」主题——不足以从它们中重新学习——但是当你复习每张卡片时,你也强化了(不太强烈的)其他 「附近」的信息,这些信息共同覆盖了更多的主题。但是,只有当你在复习前对该主题有足够的了解,形成良好的知识联系时,才有可能做到这一点。如果没有这些前提,你只是在孤立地强化你正在复习的细节。
一般来说,单独的记忆卡片无论如何都不能很好地交流:单独的间隔重复记忆卡片都是一种糟糕的交流媒介。
学习需要元认知技能
要去成功的学习某些新东西,必须评估自身的理解,监测可能出现的困惑和前后矛盾,由此计划下一步行动,并协调地执行。一般这种过程被称为「元认知」,不过我更倾向于将其细分。
教室或者专业环境中,会有名专家将该类任务演示给学习者(元认知支持充当认知脚手架),但是当学习者独自学习的时候,他们可能会感到这些元认知活动很费力或者难以实现。不幸的是,大多数解释型媒体使参与者运行他们自己的反馈循环。
讲座能让我们窥见专家的思考方式
原文:Lectures can offer a glimpse of what it’s like to think like an expert (andymatuschak.org)
尽管讲座在传递信息这一传统目标上往往效果不佳,但它在传递更深层的东西上却极为有效,比如价值观和规范、复杂的思维模型、特定的文化。通过观察领域专家解决问题的过程,学生有机会看到隐性知识的展示,甚至可能暂时改变他们的思考模式,使之接近专家的水平。
Per Rota:
我们在课堂上真正学到的,往往是那些我们在学习时还未意识到的知识。讲课的人体现了逻辑本身。他的停顿、犹豫、强调,偶尔透露的情感,以及其他许多非言语行为,比任何书面材料都能更好地教会我们逻辑思维。我们学会了在他讲话时与他的思维保持一致,就像跟着健身教练的动作一样。Church 的课程永久地提高了我们推理的严谨性。
这是对讲座在何种意义上是有效的?这一问题的回答之一。
参考文献
Rota, G.-C. (1989). Fine Hall in its golden era: Remembrances of Princeton in the early fifties. In R. Askey (Ed.), A Century of Mathematics in America (Vol. 2). American Mathematical Society.
Church 给人的印象,既像熊猫又像大猫头鹰。他说话慢条斯理,仿佛在朗读书本,语速平稳,发音清晰,仿佛一台说话机器。一旦被打断,他会停下来,长时间地沉默以恢复思路。他从不随便说话,因为这些不应包含在严谨的逻辑中。例如,他不会简单地说「现在在下雨。」这种说法,单独拿出来看,毫无意义。(实际上是否下雨并不重要,重要的是逻辑的连贯性。)他会说:「鉴于现在正在下雨,这一事实我可以通过望窗外确认,我必须推迟去拿索街的行程。」…
每次讲座前,他都有一个十分钟的仪式,要把黑板擦得一尘不染。我们试过在他到来前帮忙擦黑板,想为他省力,但这毫无用处。这个仪式是可或缺的;这通常还需要用水、肥皂和刷子,之后又得静默等待十分钟,直到黑板完全干燥。也许他是在擦黑板时准备讲课内容的,但我觉得不是这样。他的讲座几乎不需要什么准备,完全是对他过去二十年写下的打字稿的复述,这些稿件可以在芬恩大厅图书馆的楼上找到。…
有时候,课上他说的一句话会与楼上图书馆的文本有出入,他会提前提醒我们这种口头和书面的差异。为了讲得更准确,他除了偶尔会插入一些有趣的旁白,比如说「我现在要打断一下,做个元数学的评论」,其他时候说的每句话都会认真地写在黑板上。他的字迹清晰,像小学老师的那种大号英式字体,标点和段落也一应俱全。有时他会不小心漏写一个字母。最开始我们会指出这些小错误,但很快我们就学聪明了,因为这样做会让他略感慌张,于是我们选择了沉默。有一次,他需要用到一个之前已证明的定理的变体,只是换了个符号。他沉默了一会儿,然后转向我们说:「我本可以直接说『同理可证』,但我还是重新证明一遍比较好。」
有人可能会问,既然课堂上讲的内容和书上一模一样,为什么还要去听讲?这种看法显然过于简化了课堂上发生的事情。我们在课堂上真正学到的,往往是那些我们在学习时还未意识到的知识。讲课的人体现了逻辑本身。他的停顿、犹豫、强调,偶尔透露的情感,以及其他许多非言语行为,比任何书面材料都能更好地教会我们逻辑思维。我们学会了在他讲话时与他的思维保持一致,就像跟着健身教练的动作一样。Church 的课程永久地提高了我们推理的严谨性。
(via https://twitter.com/michael_nielsen/status/834278805971668992?s=12)
文献笔记是次要的和分离的
原文:Literature notes are secondary and separate (andymatuschak.org)
根据常青笔记应面向概念的说法,特定参考文献的笔记既要简短,又要与笔记档案明确分开,它们仅仅是为了帮助你写出持久笔记而存在。
文献笔记通常是对阅读时收集的观察结果的轻量级综述(见如何在阅读时整理所得)。我们可以为以后的文献查询保留一个快速的工作总结、缓存这些观察结果,但是文献大部分的价值已经被我们的持久笔记吸收了(见如何将阅读标注处理成常青笔记)。具体的参考文献注释主要是为了链接到那些持久笔记中(如果我们有自动的通用反向链接,文献笔记是否有必要?)。
有一个重要的哲学原因,我们应该把这些文献笔记与我们的持久笔记分开。整理好的持久笔记是你自主思考的地方:你把别人的想法解释成你自己的知识结构。我们应该很少去直接引用原文,持久笔记应该要有意地用你自己的话来重述。相比之下,文献笔记往往主要是记录原作者的想法,它们倾向于倚重直接引用的原文。即使我们附带上了一些自己的解释,也是在作者的本体和主张系统的上下文里解释。听清自己的想法很难,所以我们应该把我们自己的思考空间与这些更直接地表现他人思想的空间明确分开。
参考文献
Ahrens, Sönke. How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers, 2017.
你需要采取某种形式的文献笔记来捕捉你对文本的理解,这样你在做卡片盒笔记的时候手边就会有一些可用的素材,但不要把记录文献笔记本身变成一个项目。文献笔记应该要很简短,而且存在目的仅是为了帮助写卡片盒笔记。其他的记录要么有助于达到这个目的,要么就是分散注意力。
如果你需要额外步骤来理解或掌握想法,那么转瞬即逝的文献笔记是有意义的。但在写作过程的后期阶段,它们帮不到你,因为在论点的发展过程中,当你需要划线的句子时,它永远不会出现。
Luhmann, N. (1992). Communicating with Slip Boxes. In A. Kieserling (Ed.), & M. Kuehn (Trans.), Universität als Milieu: Kleine Schriften (pp. 53–61). Retrieved from http://luhmann.surge.sh/communicating-with-slip-boxes
我手边总是有一张纸条,在正面记下对某些页面的想法,在背面我会写下书目细节。读完这本书后,我会翻阅我的笔记,并思考这些笔记可能与纸条盒中已经写好的笔记有什么关联。这意味着,我在阅读时总是注意到卡片盒中可能存在的联系。
电子阅读很难维持多个阅读位置
原文:Maintaining multiple reading positions is difficult when reading digitally (andymatuschak.org)
阅读实体书时(特别是在检视阅读过程中),熟练读者能自然地在书的多个章节同时维持多个阅读位置。例如,「堆叠」操作(保持当前位置的同时参考其他段落),「狗耳」操作(积累一组要关注的地方;见 Askwall),或平行阅读操作(比较几个段落)。在电子阅读器上,这些操作很难做到丝滑流畅。
由于屏幕通常比实体书大,人们可能会通过打开多个窗口以实现上述操作,但平行阅读在电子阅读中大多是不可能的。即使在桌面操作系统上,大多数电子阅读应用程序甚至不允许你打开第二个窗口查看同一个文件。这种限制因在电子阅读中,糟糕的性能会破坏非线性阅读中描述的问题而加剧。
作为替代,人们可能会使用书签或其他系统内置结构来管理阅读位置。但电子阅读器的书签——如果有的话——总是太笨重。
LiquidText 是一个例外:它使用多点触控来创建特定阅读位置的书签,还提供了一个画布,以供用户积累越来越持久的引用。
亚马逊 Kindle 支持简单的单向导航堆栈,可用于有限的几种跳转操作:如跳转到脚注或目录中的某个地方。这很有帮助,但只适用于一小部分情况。
参考文献
Askwall, S. (1985). Computer supported reading vs reading text on paper: A comparison of two reading situations. International Journal of Man-Machine Studies, 22(4), 425–439. https://doi.org/10.1016/S0020-7373(85)80048-1
许多杰出的思想家需要借助书写来思考
原文:Many eminent thinkers need a writing surface to think (andymatuschak.org)
我了解的很多高效能人士,无论古今,似乎都必须借助书写才能严肃思考。书写也许能够扩展人的工作记忆广度, 或者说动手书写的行为,就会对思考有所帮助。
例如, Charles Weiner 在一次采访中说道,「Richard Feyman 曾提及(1973),对他而言,书写不单只是记录大脑中的想法」:
Weiner:(指 Feynman 发表的论文)所以这是对日常工作的记录。
Feynman:我其实是在纸上完成这些工作的。
Weiner : 是的,所以书写不单是对你工作的记录,书写就是工作本身。
Feynman:对的,我是这样做的——就是在这些草稿纸上。
Weiner:好的,虽说工作已经在你的大脑里完成了,但你还要有纸质记录。
Feynman:不,这不单单是记录,这就是工作。我在纸上完成工作,而这就是那张纸。能理解吗?
Grothendieck(2007)是一位 20 世纪伟大的数学家,他无法不借助书写来思考:
他在即兴创作,他写得很快,笔迹十分优雅。他说不书写他就无法思考。我自己觉得,闭上眼睛思考,或者躺下来思考,是更加方便的。但他不能这样思考,所以必须拿起一张纸写,他开始写了。他写下 X → S ,描了很多次,结果字符和尖头变得很粗很粗,他很享受观察这些笔记的过程。
参考文献
Feynman, R. (1973, February 4). Interview by C. Weiner. Niels Bohr Library & Archives, American Institute of Physics. https://www.aip.org/history-programs/niels-bohr-library/oral-histories/5020-5
Illusie, L. (2007, January 30). Reminiscences of Grothendieck and his School (S. Bloch & V. Drinfled, Interviewers) Personal communication.
Correspondence with Stephen Malina, 2020-05-05. Re: Question about a question
许多人认为记忆对深刻的创造性工作不重要
原文:Many people view memory as unimportant to deep creative work (andymatuschak.org)
当告诉别人间隔重复记忆系统让记忆成为一种选择时,人们往往反应相当消极:「背诵知识有什么意义?死知识才不是关键。我想要得到概念性的理解、创造力、艺术性,诸如此类!」
对此的一个回应是指出事实上间隔重复记忆系统可以用来发展概念理解。但记忆知识没有价值的说法也必须认真对待。在此我有些回应:
参考文献
Matuschak, A., & Nielsen, M. (2019, October 0). How can we develop transformative tools for thought? https://numinous.productions/ttft (see section “How important is memory anyway?”)
普及具有新颖认知支持的文字媒体需要普及电子阅读
不幸的是,在电脑上阅读文本令人不快。或许这也部分解释了为什么电子阅读的流行程度远远落后于所有实体书阅读。
在创作方面也存在挑战:
大众媒介通常不善于帮助人们落实想法
原文:Mass mediums are typically bad at helping people translate ideas to practice (andymatuschak.org)
书籍、录像和其他典型大众媒体本身并不是参与性环境,脱离了其自身提供的语境,它们一般都不能很好地促进外部性参与。也就是说,它们通常不能创造一个赋能环境。
阅读信息媒介的经验,与将其付诸实践的经验,两者之间存在重大脱节。这种脱节部分上是时间层面的问题:想要利用材料,你需要花费的时间应超过仅仅阅读(大众媒体大多缺乏超过一天的自创时间维度)。但情境问题也是一方面。
MOOC试图解决这个问题,但基本上失败了。这值得我们更多地反思一下原因。
一个潜在的解决方案是情景体验作为一种大众媒介具有难以置信的潜力。可能也有其他方案。
参考文献
Elizier Yudkowsky 为《理性:从人工智能到僵尸》所作的序言:https://www.lesswrong.com/rationality/preface
我写作中的第一个最大错误是——我没有意识到「弄清楚如何实践而不是知道理论」是学习这种有价值的思维方式的最大问题。我不知道到实践是重点,关于它我只能说「呀」和「嘿」。
问:Elizier Yudkowsky 认为他在 Less Wrong 的博客犯的最大错误是什么?
答:专注于理论而不是实践。
大众媒介大多缺乏超过一天的创制时间维度
原文:Mass mediums mostly lack an authored time dimension beyond a day (andymatuschak.org)
电影制作人、作曲家和剧作家,这类创作者会为他们的作品精心创制时间维度。停顿之所以饱含深意、冲突之所以慢热,渐速音之所以急促,是因为观众随着时间推移而逐步体验如此。这些媒介表达的体验在几个小时之内逐步发展——但几天、几个月、几年呢?文化机构经常在这些时间尺度上创制体验(例如多年的宗教成长仪式),但大众媒体很少这样做。这道限制是很不幸的:大众媒介赋予作者巨大的影响力。(参见情景体验很难分发)
这个前景就是我所说的穿越时间的文本。
书籍时间维度较长,但这一维度通常未经特意创制
读一本书往往要花上几周或几个月的时间。但书籍几乎从来没有像电影或戏剧那样有创制的时间维度。不像导演可以安排电影的特定内容在何时被观看,花在读书上的几天,几周,几月,通常不由作者安排。吸收大量想法需要时间:先不论间隔效应的影响,一个想法只有在不同场景下都琢磨过,其真正含义才能变得明晰。
考虑一下现实中的专家-学徒关系。专家可以引入一个想法,之后在接下来的几周内,观察这一想法在学徒脑海中如何生根发芽。其间专家也许会把这个想法换些方法再提及几次,以调整学徒的思考进展。这样学徒有了足够的时间充分吸收这个想法,之后专家就可以介绍这个想法产生的影响,此时介绍便是效果最佳的。这不仅仅是关于大多数解释性媒体让参与者运作自己的反馈循环中描述的问题:专家正是策划了学徒在时间上的体验。
相比之下,如果图书作者想介绍一个想法以及这个想法的一些微妙的结果,这些论点只能分隔在安插在书脊上的书页之间。偶尔,作者会写下「在......之前不要读这一章」这样的注释,但这种方法显然是相当受限的。
群组 MOOCs 引入了较长的时间维度,但这一维度基本上也是未经创制的
一些 MOOC 在特定的时间开始,把学生分成若干组,每组一起完成教学大纲。如果课程包括协作学习的内容,共享的时间表可能会有意义地影响学生的体验。但是,就我所见,MOOC 的设计者并没有仔细创制体验在几周或几个月内展开的过程:他们召集了一群人,然后让他们在一段时间内一起做一些事情,这些事跟时间维度基本无关。
MOOC 的教学材料通常会随着时间的推移而「解锁」,但材料和这样的时间安排之间没有有意义的互动。一般来说,这种做法好比一位作者写了一本完整的书,但出版商后来决定将其连载,在用户方便的时候给他们邮寄一个章节。当然,时间上是有体验的,但缺乏作者的意图。这样的安排留下了很多隐患。
阿罗冥想课程是以大众媒体的形式写成的,有长达多月的创制时间维度
相比之下,考虑仁波切和 David Chapman 的阿罗冥想课程。这是由 18 封以上的电子邮件组成的序列,在你注册后每周自动发送一封。但这些邮件不像 MOOC 材料那样:过去几周的内容被精心编织在每封信中并呈螺旋式上升,在几周后回到早期的想法作为复习。他们有意为概念留下空间,以便在几周后再返回。他们依靠读者日益增长的信任,例如,任何在 3 个月后仍在阅读的人都必须拥有这种信任。这一系列的电子邮件,虽然简单,但相对于书本来说,感觉比 MOOCs 相对于传统课程的演变要深刻的多。
游戏通常有一个较长的创制时间维度
一些值得反复游玩的游戏明确设计了秒、分、小时、日和月以上的时间轴。像宝石迷阵这样的休闲游戏确保新玩家能立即体验到成功。玩家的游戏「水平」会在数小时内发展到质变,而游戏将这种进步感持续带给玩家,让他们每天开启游戏。他们会在罕见的收藏品、元游戏和进阶目标上做文章,以维持将来几个月的游戏体验。
同样地,像《魔兽世界》这样的 MOOG 精心编排了玩家的动机和环境,在长达数月的时间里,为玩家营造了视野不断开阔的感觉。游戏的设计不在于提升小时数,而在于每周之间,游戏体验的特色如何变化。
一些单人叙事游戏需要 50-100 小时才能完成,但这些游戏更像电影:其游戏体验的设计,并没有考虑到玩家游玩时会经历数周数日的时间。
游戏在这方面是不寻常的:动态媒介通常缺乏创制时间维度。
振奋人心的是:助记媒介可调整为将创制经验逐步展开的形式
通过减轻工作记忆的负担,记忆增强有望让复杂主题的学习更容易
复杂的概念可能很难学习,部分原因是工作记忆容纳不下其组分。既然间隔重复记忆系统使记忆成为一种选择,那么记忆增强就可能是个值得关注的解决方案。
相关笔记:
-
从更关注情绪的角度思考这一想法:间隔重复记忆系统可以缩短科目学习中不愉快的早期阶段
-
关于深度专业知识的相关主张:深刻的理解要求细致掌握基础知识
-
可能存在的一种底层机制:学习越来越复杂的概念可能相当于形成更大的有效组块
-
认知负荷理论对这些更难学习的情境做出了更一般性的预测,不仅仅考虑了记忆限制
-
另一个可能的机制:前测效应
参考文献
Matuschak, A., & Nielsen, M. (2019). How can we develop transformative tools for thought? Retrieved December 2, 2019, from https://numinous.productions/ttft
什么因素让这些科目变得如此困难?其实对于有学科背景的人来说,许多背后的思路单拎出来都不是很复杂。但是这些想法往往是以压倒性的数量同时出现的,随之而来的还有狂风骤雨般陌生的概念和符号。人们必须飞快地接二连三学习量子比特、Bra-ket 符号、Hadamard 门、受控否闸以及更多抽象而陌生的符号。他们正在吸收一种全新的语言。即使他们一开始能跟上,但他们无法熟练掌握全部这些想法,因而不能理解后续的想法。这让人不知所措,最终感到沮丧。
- 工作记忆容量小的学生身上的提取练习效果(两天后,带反馈)略微更大。
专注的软件开发和专注的学术研究互相排斥
思想工具中的实践出洞见需要开发新的软件界面来表达领域理论,然后研究这些界面和它们的使用,以改进你的理论。在实践中,要在一个重要的软件开发项目中深入思考理论非常困难。而且,当一个人每天花很多时间在思考和写作上时,也很难建立起软件开发的动力。更糟的是:软件开发和研究思维之间的切换成本很高。
2020 年 3 月,我为助记媒介写了一份研究问题清单,然后着手开发 Orbit。现在写到 2020 年 10 月,我还没有在这些研究问题中取得任何有意义的进展。在某些时候,我需要执行一个「强制切换」,重新思考这些问题,到那时,我将很难为 Orbit 开发任何重要的新功能。
2019 年 6 月和 7 月,在设计和实现量子国度用户旅程项目时,我也在与类似的挑战斗争。然后在 2019 年 12 月和 2020 年初与 Michael 一起研究理论时,我在媒介上几乎没有任何进展。
这就是为什么合作可能更有意义的另一个原因:工具制造者和工具使用者之间的深度合作可能会支持「实践出洞见」。
一个相关的问题:专注的软件开发工作是自我否定的。
元认知支持需要动态的、参与性的环境
原文:Metacognitive supports require dynamic, participatory environments (andymatuschak.org)
元认知本质上是动态的,所以设计提供元认知支持的环境时,这个环境必须具备动态的行为,并在环境的参与者琢磨材料时给出相应的反应。
动态但非参与性的环境(如大多数「探索性」环境)没有任何行为和反应。
参与性但非动态的环境(如《制造(Make)》杂志)不能根据参与者的行动而调整其信息或行为。
这也是大多数解释型媒体让参与者运作自己的反馈回路的一个原因:大多数解释型媒体是静态的。
静态媒体有时试图提供元认知支持,提出固定的元认知「程序」供参与者「执行」,比如「如果你不熟悉 XOR 在这种情况下的使用,请查阅第 240 页」。这些举措显然效果有限;参与者为此仍然需要折腾一番。
在创造性工作中利用探索启发式的动力
原文:Momentum as explore-exploit heuristic in creative work (andymatuschak.org)
在我的创意工作中,我总是面临这样的抉择:是追逐新的好奇心、草拟新点子,还是坚持推进我现有的「主要项目」?找到一个合适的判断方法一直让我头疼。如果过分追求广泛的创造力,就没有任何事物能得到足够深入的关注以致于能够成熟。但如果我只专注于主要项目,我会感到创造力受到抑制,思路也会变得过于狭窄。
至少对我来说,要迅速在这些模式之间切换是很困难的。特别是深入模式,它在频繁切换上下文时尤其受影响:如果我每周抽出几天进行开放式探索,我主要工作的进展就会骤然减缓。
到目前为止,我找到的最佳方法是顺应动力潮汐来指导自己。当我的主要项目进展顺利时,我会全神贯注。但动力自然会有起伏——比如,当项目的某个部分完成时,我就会想要改变大脑中加载的一大堆上下文。这些时刻正是钻入兔子洞或启动支线项目的好机会。
我喜欢这个方法的地方在于,它在不采取零和思维的情况下解决了内心的矛盾。过去,我的「创造性扩展」冲动与「专注勤奋」冲动在情感上是难以调和的,因为它们似乎都在争夺同一资源;对一个的妥协似乎就意味着对另一个的损害。但如果我把「专注勤奋」的目标从「产出成熟作品」转变为「培育和保护动力」,这种冲突就大都消失了。每个方面都明白,动力有其自然的潮涨潮落。它们不需要相互干扰。
参考文献
摩尔教学法
原文:Moore method (andymatuschak.org)
这是数学家 Robert Lee Moore 采用的一种探究式学习方法。通常,学生不允许查阅与主题相关的文本[1];相反,他们被提供最基础的公理和定义,并要求自行找出一系列可能会在讲座中出现的定理的证明。课堂上没有传统的讲解,而是要求学生在集体课堂上证明他们被分配的定理。学生要独立完成工作,并在课堂上轮流证明定理,只有在一个学生无法完成证明时才会换人。[2]
摩尔用一句话概括了他的教学原则,这也是探究式学习的一个典型观点:「最少被灌输的学生,学得最好。」
我觉得这种方法很可能会激发出一种强烈的自我解释效应。与此相关的,还有相互指导法。像所有探究式学习方法一样,我预计基础较差的学生会感到很吃力。
这个教学法让我想起了 Constance Kamii 的《年幼儿童重新发明算术》,但更强调个人的主观能动性和对探究的热情。以 McLaughlin(2008 年)为例:
关于这种改良版摩尔教学法的诸多要点,可归纳为:它强调、赞美、鼓励并试图锤炼一种内部控制点。
对于 McLoughlin 而言,这种方法的一大用意就是鼓励学生亲自动手做数学——不仅仅是写定理的证明(这些通常会在教科书中给出),还在于让他们真正地在数学领域里做出原创性的工作:赋能环境的重点是创造成长和行动的机会,而不是技能培养。
[1] Chalice(1995 年)和 Cohen(1982 年)报告说,有时会放宽这个要求。
[2] Cohen(1982 年)会让大学生两三人一组进行合作。
参考文献
-
Chalice, D. R. (1995). How to Teach a Class by the Modified Moore Method. The American Mathematical Monthly, 102(4), 317–321. https://doi.org/10.1080/00029890.1995.11990577
-
Cohen, D. W. (1982). A Modified Moore Method for Teaching Undergraduate Mathematics. The American Mathematical Monthly, 89(7), 473–490. https://doi.org/10.1080/00029890.1982.11995481
-
Good, C. (2006). Teaching by the Moore Method. MSOR Connections, 6(2). https://doi.org/10.11120/msor.2006.06020011
-
McLoughlin, M. (2008). Inquiry Based Learning: A Modified Moore Method Approach To Encourage Student Research. 11th Annual Legacy of Robert Lee Moore Conference, Austin, TX.
大多数为交流设计的动态表示形式并不具备很强的赋能作用
原文:Most dynamic representations developed for communication aren’t very enabling (andymatuschak.org)
在可探索的解释中,互动图表和嵌入的小型沙盒模拟可能有助于作者传达观点,但它们很少能作为读者独立思考的工具。这些元素的主要目的是帮助读者更有效地理解作者的意图。
作者常常口头上提倡开放式探索和问题解决。一个常见的说法是在文章结尾给读者一个沙盒。然而,这很少能带来有趣的结果。因为这些环境主要是为了帮助作者传达观点,而不是作为一个通用的工具来帮助读者(或作者)在该领域思考问题。(参见强大的赋能环境通常是追求自身内在意义的项目的副产品和创制环境极大程度受作者的动机塑造)
我认为这就是为什么尽管已经有很多可探索的解释和类似媒体,但它们并没有真正为读者创建一个赋能环境 。这些内容很吸引人,通常比普通文章更有趣,动态元素也常常让人更容易理解作者的观点,但读完文章后,读者并没有把这个动态环境装在口袋里带走。
像 PhET’s 这样的「小程序」(Applets)似乎能解决这个问题,但它们陷入了一个更深的困境:要么太浅显,无法进行深入思考;要么太复杂,没有叙述就无法传达任何信息。(参见叙述式可探索内容:三种心智模型了解更多相关内容)
具体例子
《地球:入门》(Earth: A Primer)在很多方面都很出色,但也有它的问题。它的地质模拟设计得既有趣又便于交流,但并不是为了研究地质问题。所以,虽然好玩,但仅此而已。
Mathematica 笔记本和其他可执行的书则走了不同的路。这些环境主要是为了研究复杂问题而设计的,交流只是次要目的。这一点很明显!
Cantor 是另一个反例。这些数字方块的设计思路是「沙盒优先」,旨在促进对数量的开放式探索。所以,当它们作为互动图形嵌入到文章中时,需要添加额外的功能(比如记录互动、语音解说等),才能用于交流。
参考文献
关于这个话题的连环推:https://twitter.com/andy_matuschak/status/1305264246331039744
Farrar, S., Khoe, M.-L., & Matuschak, A. (2017, August 31). Numbers at play: Dynamic toys make the invisible visible. Retrieved December 31, 2019, from https://early.khanacademy.org/cantor/
Gingold, C. (2015). Earth: A Primer. Retrieved from https://www.earthprimer.com
Matuschak, A. (2018, October 27). Narrated explorables: Three mental models. Retrieved December 31, 2019, from https://medium.com/khan-academy-early-product-development/narrated-explorables-three-mental-models-e16e0d80e4c1
与 Michael Nielsen 的对话,2019-11-05
大多数解释型媒体使参与者运行他们自己的反馈循环
原文:Most explanatory media make participants run their own feedback loops (andymatuschak.org)
学习需要元认知。当读者从文本中学习新东西时,他必须不断询问自己:我理解了吗? 我可以问自己什么问题来检查我的理解?我是不是应该重读一遍文章?我是不是应该看看参考了解背景?诸如此类。
换句话说,读者必须运行自己的反馈回路。当读者专注于具有挑战性的表层的材料时,他们可能无法有效地进行这种元认知;反之,在评估、计划和执行控制上花费太多的精力可能会使他们难以处理困难的表层的材料。
在视频格式中,情况可能稍微糟糕。在书籍中,读者对节奏有完全的掌控,但视频有默认的节奏,而观众必须主动去逆反这一节奏。
对于为什么会这样,我的理论是这样的:元认知支持需要动态的、参与性的环境。
参考文献
Matuschak, A. (2019). Why books don’t work. Retrieved from https://andymatuschak.org/books
大多数解释型媒体对参与者提出了沉重的元认知要求
原文:Most explanatory media place heavy metacognitive demands on participants (andymatuschak.org)
学习需要元认知。当读者从文本中学习新东西时,他必须不断询问自己:我理解了吗? 我可以问自己什么问题来检查我的理解?我是不是应该重读一遍文章?我是不是应该看看参考了解背景?等等
换句话说,读者必须运行自己的反馈回路。当读者专注于具有挑战性的表层的材料时,他们可能无法有效地进行这种元认知;反之,在评估、计划和执行控制上花费太多的精力可能会使他们难以处理困难的表层的材料。
在视频格式中,情况可能稍微糟糕。在书籍中,读者对节奏有完全的掌控,但视频有默认的节奏,而观众必须主动去逆反这一节奏。
对于为什么会这样,我的理论是:元认知支持需要动态的、参与性的环境。
参考文献
Matuschak, A. (2019). Why books don’t work. Retrieved from https://andymatuschak.org/books
多数人的阅读成效不大
原文:Most people read ineffectively (andymatuschak.org)
-
知识工作应能聚沙成塔,但阅读的时候,绝大多数成果都不能积累下来
-
人们似乎忘记了他们所读的大部分内容,而且他们大多没有注意到这一点
-
常青笔记有助于积累阅读成果,但大多数人没有做常青笔记的习惯
-
即使对于做常青笔记的人来说,笔记写作实践大多是无效的
-
-
-
熟练的阅读一般都是非线性的,但大多数人的阅读过程是线性的
参考文献
Matuschak, A. (2019 0). Why books don’t work. https://andymatuschak.org/books
大多数人只写临时的笔记
原文:Most people take only transient notes (andymatuschak.org)
与常青笔记相比,大多数人把笔记当作贮藏容器或思想草稿。这类笔记写起来很方便,但这样写笔记写一年,最终只能得到一大堆互不相干的笔记。这些笔记不能聚沙成塔:更像是燃料,写完就丢,只为帮助作者处理他们当时的情形。
临时笔记是有价值的便笺纸,可以暂时支持工作记忆,但是知识工作应能聚沙成塔,所以我们应该把它们看作是在输入「凌乱思考」,并从中获得启发,写出「有序思考」笔记(Khoe)。
这就是笔记写作实践通常是无效的的原因之一。
参考文献
Khoe, M.-L. (2016, December 21). Messy thought, neat thought. Retrieved September 17, 2019, from Khan Academy Early Product Development website: https://klr.tumblr.com/post/154784481858/messy-thought-neat-thought
大多数人把笔记当作一个存放想法、给想法打草稿的容器
原文:Most people use notes as a bucket for storage or scratch thoughts (andymatuschak.org)
很多人为不忘记某个想法,一次对话,一项任务,或者,便将其记在印象笔记之类的地方。至于其目的?可能是:「这样就不会忘记」。也许「写下来有助于记忆。」
这样的观点中,笔记是为了闭合开环,而不是为了积累洞察。实在的思考发生在笔记之外;笔记只是参考系统,里面储存了可能有帮助的信息,或是一次性写就的杂乱想法(Khoe)。
这些都不是常青笔记。大部分「面向存储」的笔记之后很难派上用场(大多数人只写临时的笔记)。更重要的是,这样的思考方式下,人们意识不到笔记写作可能是思考创意 本身([常青笔记是知识工作的基本单位](https://notes.andymatuschak.org/z3SjnvsB5aR2ddsycyXofbYR7fCxo7RmKW2be))。
参考文献
Khoe, M.-L. (2016, December 21). Messy thought, neat thought. Retrieved September 17, 2019, from Khan Academy Early Product Development website: https://klr.tumblr.com/post/154784481858/messy-thought-neat-thought
我的日程安排
原文:My daily routine (andymatuschak.org)
自从我在 2019 年初开始在家独立工作以来,我发现有一个日程安排来指导我是非常有帮助的。当我的日子不顺利的时候,往往是因为早上有什么事情让我脱轨,而我从来没有真正回到正轨。对我的生产力来说,最重要的是我是否完成了一个深度聚焦的早晨创作区。
自 2019 年年中以来,这一直是我的晨间日程:
-
上桌之前
-
醒来(6:30 左右)
-
自重锻炼
-
淋浴
-
遛狗、训狗和喂狗
-
冥想
-
煮一小杯咖啡(10g / 150mL)
-
-
上午第一节 (~7:30 – 10)
在每天的这个时间点之前,我不会让自己使用互联网。它分散了我的注意力,但更重要的是,我发现让我的脑子里充满别人的声音会加剧很难听到自己的想法。
在周末,我通常在这一点上不再坚持常规。在工作日,我的活动从这里开始就不太一致,但时间结构是有规律的:
-
第二个上午的工作区(~10 – 中午)
- 我在 11:30 左右在我的办公桌上吃午餐。通常是乳蛋饼。
-
中午休息:与 Shabu (我的宠物狗)去狗狗公园或一起长时间散步(~中午 – 1点)
-
第三个工作区块(~1 – 4)
- 这往往是我非常注重执行的工作区块。我发现我的创意焦点在上午比较敏锐,而在下午我主要是想把任务完成。
-
傍晚:
-
4 点左右,我将与合作者见面或做行政工作。这时我通常会很疲惫。
-
如果我有会议,它们通常在 5 点开始,而且通常是散步会议。我很少在 4 点之前参加会议。
-
-
晚上:
-
我每个周末晚上都会在 6 点左右做晚餐。
- 我尝试每周至少有一个晚上请朋友来吃饭。
-
之后,通常是阅读、钢琴练习和与 Sara 在一起的时间,直到 10 点睡觉。
-
我的晨间写作
原文:My morning writing practice (andymatuschak.org)
我的日常惯例中,前置活动完成后,我就开始当天第一项严肃创意工作:两个小时的写作、修改常青笔记。这通常是我一天中最有挑战的工作,所以我喜欢挑我思绪清晰,足够专注的时候做完成件事。写常青笔记不是传统意义上的「记笔记」——写下别人的想法,或记录发生的事情,其目的是完善想法。(即大多数人把笔记当作存放想法、给想法打草稿的容器,对比 常青的笔记写作有助于积累洞察力)
我通常先开启写作收件箱(为临时和不完整的笔记准备的写作收件箱),翻阅收件箱中的提示和不完整的笔记。如果有什么内容激发了我的想法,我便就此起草常青笔记。书写笔记的跨度可能不止一天:我可能把笔记大大充实一番,直到我筋疲力尽,便将笔记存在收件箱里,改天再完成。
如果收件箱东西较少,我会拿出便笺(用口袋便笺将外出时的收获捕捉到写作收件箱),用其中内容填满收件箱。我不会强制把便笺内容全都填进去:如果便笺里什么提示都没意思,我就把最无聊的卡片归档,然后开始下一步。
在处理完写作收件箱后,我会专注于各项主要创作项目,并问自己这样的问题:
-
这个项目的未知信息中什么信息最重要?
-
有哪些新想法令我兴奋?
-
这个项目中,我所知道的最有趣的事情是什么?
对于这些卡片,我会在我每日工作日志里打草稿,把十几条单行笔记凑出一个无序清单。这样清空头脑后,我围绕其中似乎有意思的部分着手写作。这时候,我通常在给自己挖坑,结果用光了剩余时间。如果来不及的那些看起来挺有意义,我就添加到写作收件箱中,好在以后处理。
如果这些提问感觉没有成果,我会利用这段时间围绕所读内容写笔记,以求深刻内化文本。我通常会积压一些我已经读过但还没有写过的书籍和文章相关的常青笔记。如果连续几天的提问都不觉得有成果,那就说明我需要略施改变:我的信息输入不够丰富多彩,或者我没有给自己营造合适的创作空间,或者我可能需要重新评估我的项目。我的写作收件箱应该总是感觉像一个丰收的宝库。
我每隔 35 分钟就休息 5 分钟,站起来活动一下,但即使有这些休息时间,我通常也无法持续处理常青笔记超过两个小时。有时我可以在一天的晚些时候再处理一次。
Nielsen, M. A. (2004). 有效研究的原则(第 0404 则技术笔记)昆士兰大学
来源: Michael Nielsen 在研究量子计算时,为自己写了这则关于有效研究实践的笔记。
-
自我发展(非常类似于《原子习惯》,当然是比原子习惯提前几年):
-
对于你对自己行为的期望,以及你想要形成的习惯,具备清晰的认识
-
根据这个认识,设定小而可衡量的目标
-
评估和反思
-
-
成为问题创造者
-
培养识别重要事物的敏感度
- 是什么造就了伟大的科学领域?是什么让一些领域衰败没落?某个领域目前最重要的进展是什么?哪些被吹捧一时的想法最终没有成功,为什么?
-
亚里士多德:「我们就是{我们一再重复的行为},因此,{卓越}{不是行为,而是习惯}。」
问:(高效人士)是什么让麦当劳具备优势?
答:他们关注一些小事,这些事是其他人声称自己关心,却只有他们真正去做的。
问:对 Michael 来说,什么实践是「个人效能的核心」?(想想麦当劳)
答:一以贯之地做好基本功。
问:Michael Nielsen 认为什么社交互动能够培养自律?
答:对他人负责。
问:根据 Michael Nielsen 的建议,有哪三种方法有助于提高对他人的责任感?
答:担任导师,与同事合作,建立导师关系。
问:Michael Nielsen 认为,哪种特殊的诚实对自律非常重要?
答:对自己诚实,了解自己。
问:Michael Nielsen 如何看待创造性研究与自我发展之间的关系?
答:最好将创造性研究看作自我发展的延伸 ,尤其是完善的阅读计划的延伸。
问:对于研究人员来说,自我发展的重点是……
答:科研优势。
问:在规划科研优势的发展时,应寻找什么样的能力组合?
答:能给你相对优势的独特组合。
问:为什么 Michael Nielsen 认为大多数人做不了伟大的研究?(发展)
答:人们不愿花费精力来系统地发展所需技能。
问:在进行新领域的学习时,应如何分配阅读时间?
答:专注于深入阅读最重要的论文,而不是略读最重要的前几百篇。
问:若要改变环境以促进自我发展,应将社会压力调整到什么状态?
答:让它们对你作为研究者有利,而非不利。
问:请例举三个调整社会压力以使其对你有利的方法。
答:例如开展系列研讨会,开辟讨论区,建立休息室,组织小型研讨会,组织阅读小组。
问:如何培养对重要事物的敏感度?
答:提出关于重要科学特征的问题。
问:请例举几个关于重要科学领域的特征的问题。
答:例如,某些领域蓬勃发展,而其他领域衰败没落,这背后的原因是什么?最有用的大一统观念是什么样的?在你研究的领域中,目前最重要的进展是什么,以及为什么?为什么一些看似有前途的想法未能实现?
问:你应该力求哪种类型的产出?
答:基于你对重要工作的理解,产出尽可能高水平的成果。
问:Deutsch 和 Feynman 是如何创立量子计算领域的?
答:通过提出正确的问题:「如果存在量子计算机,这种计算机会有什么能力?会比经典计算机更快吗?」
问:为什么混乱无序的研究领域可能是机会?
答:你可能会发现大一统/化繁为简的概念。
Michael Nielsen:「在研究中,几乎没有什么比建立{前进的动力}更重要。」
问:花时间为自己的研究设定明确的目标,这样有助于应对「研究中的大部分时间都在……」的问题。
答:……迷茫之中。
问:如何增强推进研究的动力?
答:确立一个目标,即使这目标是错的!只要你定期反思并重新考虑这些目标即可。
重要的是你在朝着能解决{重要问题}的方向努力。
笔记应该让你吃惊
原文:Notes should surprise you (andymatuschak.org)
如果阅读和写笔记不能带来惊喜,那还有什么意义?
如果我们只是想记住一些东西,我们有间隔重复。如果我们只是想在某个局部环境中彻底理解某个特定的想法,我们就不会费心去维持一个长期的笔记系统。
这就是为什么我们有密集的链接网络(常青笔记之间应该建立大量链接):这样,搜索可以帮助我们看到意外的联系。
这就是为什么我们遵循常青笔记应面向概念:这样,当写到一个看似新鲜的想法时,我们会偶然发现我们已经写过的东西(也许是出乎意料的)。
参考文献
Luhmann, N. (1992). Communicating with Slip Boxes. In A. Kieserling (Ed.), & M. Kuehn (Trans.), Universität als Milieu: Kleine Schriften (pp. 53–61). 检索自 http://luhmann.surge.sh/communicating-with-slip-boxes
沟通的一个最基本的前提是,伙伴之间可以互相给对方惊喜。只有这样,信息才能在彼此之间产生。
用 Zettelkasten 扩展你的思维和记忆 • Zettelkasten 方法
如果你在你的 Zettelkasten 中查找某些东西,你需要得到意想不到的结果,以便形成新的想法。 正如我在关于这个主题的介绍性文章中指出的那样,惊喜是这里的关键因素。 笔记之间的链接使这成为可能,因为你可以通过跟踪连接和探索笔记网络的一部分来产生新的想法。 与明显的联系相比,非明显的联系通常比显而易见的联系更有益于创造性思维,因为它们会产生更大的惊喜。 当你的大脑继续处理那些显而易见的事情时,你的 Zettelkasten 却向你展示了那些奇怪的事情。 当你面对意想不到的事情时,它会激发你的想象力,让你大吃一惊。
同时,它也为连接多年来的想法提供了机会,这反过来会产生惊喜的时刻。 这最终会让你发现不可预见的联系,让你跳出思维定势。
笔记写作实践大多是无效的
原文:Note-writing practices are generally ineffective (andymatuschak.org)
部分原因是笔记写作实践提供的反馈很弱,人们甚至没有注意到他们的笔记写作实践是多么的无效。他们发展了一些基本的笔记写作技巧,并大多停留在那里(人们通常把技能发展到一个平台期,然后就停下来)。专家的表现没有得到很好的定义,所以人们表现不佳的情况并不明显(改善的显著性推动了技能的发展)。所有这些对其他核心知识工作技能来说也是如此:知识工作的核心实践往往是临时性的。
许多关于试图改善这些实践的文章都被误导了:「更好地记笔记」没抓到重点;重要的是「更好地思考」
相比之下:常青笔记写作是知识工作的基本单位
笔记写作的反馈不足
原文:Note-writing practices provide weak feedback (andymatuschak.org)
笔记写作实践通常是无效的,其中一个原因可能是由于笔记系统一般提供的反馈不足。
开始进行间隔重复练习的人每天都会得到强反馈:如果他写了一个糟糕的问题,这个问题便会立刻且此后长期地困扰着他;他会感觉到(在某种程度上)自己对某一主题的记忆保留率的增长。
相比之下,笔记写作的反馈非常迟缓:通常,当你写了一个笔记,你可能在几周内都不会去看它。这样的反馈也模棱两可:如果一个笔记能(或不能)帮助你提炼出一些深刻见解,它通常都不会特别明显。
一般来说,人们并不清楚一个笔记应该是什么样子,所以也就不清楚某个笔记是否符合这个标准。
常青笔记提供了更紧密和更强的反馈回路,这是因为你在不断地修改和参考过去的笔记。如果之前的笔记难以修改,你也会更容易注意到。使用可执行的写作策略也会对一个人的笔记系统产生更强的反馈。
参考文献
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
人们不重视笔记写作的另一个原因是,即使笔记写得不好,也不会立即得到任何负面的反馈。
新颖的用户界面创意是公共物品
原文:Novel user interface ideas are public goods (andymatuschak.org)
思想工具的核心洞见,往往要耗费颇多才能得出,但是复制起来却成本低廉,这是思想工具的核心挑战。例如,Adobe 公司在 Photoshop 和 Illustrator 平台上发展了无数的交互和隐喻,然而 Sketch 和 Figma 能轻松复制这些功能并加以改进,而不用支付多年以来的研发费用。Apple 公司用了很多年开发了现代多点触控交互界面;Google 公司在一年内就复制了该功能,而在随后的诉讼中几乎毫发无损。新颖的交互界面创新可以算作是公共物品:无法将他人排除在外(排他性),对手只需要相对很少的成本便能复制这一创新。令人高兴的是(对社会来说),这样的想法是非竞争性的(竞争性),甚至是反竞争性的。
但是竞争者们对创意的侵吞挫伤了创意的产生。由于任何人都可以白嫖交互研发初始投资,所以对于公司来说,很难有充足理由在这个领域投入研发费用。
Adobe 公司确实决定要捍卫他们的权利,但不是因为用户界面的创意问题。他们建立了谨慎的市场锁定战略。所以,他们在开发新界面想法上投入的钱,远少于在销售和培训上投入的钱,这也能理解了。
参考文献
Matuschak, A., & Nielsen, M. (2019, October). How can we develop transformative tools for thought? https://numinous.productions/ttft
Orbit - 价值观
原文:Orbit - Values (andymatuschak.org)
我对 Orbit 的价值观目标进行了初步分析:
真诚、热忱、好奇心 —— 而不是:义务、工具主义、劳苦
Orbit 帮助你加深与你最在意之物的关系。这些活动主要是认知上的,但你与材料的关系是情感上的。这是为你可以谈一晚上的想法和想象。Orbit 是为那些赋予你生命意义的东西而设的。
Orbit 不在于让你吃掉西兰花。它不适合你认为你「应该」参与的事情,那些需要你唤起意志力的事情。它的基调不是「教育」。Orbit 的结果是学习,但其目标不是学习:而是能够做一些在这个世界上给你带来意义的事情。
无为,不费吹灰之力,「相信过程」—— 而不是:收件箱,图表,旋钮
向 Orbit 添加内容就像打理园子一样。你种下种子,相信它会茁壮成长,开花结果。你并不关心卡片展示时机和展示频率等细节。你大可放心:安排的时间基本上是合理的;你能逐步把添加的所有内容都内化;卡片的间隔会慢慢变长,如同移动到更远的轨道一样,而新卡片的展示机会也是恰如其分的。你的 Orbit 不会有「要溢出来」的感觉。
你的日常 Orbit 练习,就像你的日常冥想练习一样。没有「完成」一说,没有进度的图表一往无前。如同冥想练习一样,你对某一次练习的具体结果并不关心,也不该关心。但你终究会来参加练习,顺应气息,最终你的视野更加清晰。
Orbit 不是一个需要梳妆打扮的收件箱。Orbit 不是一个带着三位数字的红袖章。你不用「拨入」你的 Orbit 卡片。你不用执着地追踪任何一张卡片的「进展」(不过你确实能感受到一些更宽泛的「进展」弧线)。
用功、认真、主动 —— 而不是:自满、被动、敬畏
一方面,冥想是轻松的,但在另一方面,冥想是用功的。你每天参加练习并遵循指示,相信这些活动将帮助你变得更加明智,尽管你并不了解背后的确切机制。但这并不意味着冥想很「轻松」!如果你不认真投入,15 分钟转瞬即逝,而你却没有清楚地觉察到一次呼吸。
类似地,Orbit 也同样既轻松又用功。你出席每日的复习,没有特定的期待或要求,但你要全神贯注于你在那里发现的东西。Orbit 本质上是严肃者的工具。它是深入、清晰的理解;它是对那些仅仅想让你记住思考一些东西的老方法的不满。
作者通过提供卡片来塑造使用 Orbit 的体验,但 Orbit 终究是一个靠你自己运用的工具。Orbit 期待并回报你自己的主动性——通过你撰写自己的卡片,重组给你的卡片,抛弃你不关心的卡片,按照你的价值观塑造系统。
另一种视角:「个性」
参照:最小可行个性 - AVC
-
你如何改变客户的生活?(帮助他们加深与他们最在意之物的联系)
-
你想代表什么?(意义、好奇、用功、仪式)
-
你厌恶什么?(义务、折磨、增长、自满)
原创思想需要独处
原文:Original thought requires solitude (andymatuschak.org)
Grothendieck, 《独处的重要性》,经由 Michael Nielsen:
在那些关键的岁月里,我学会了如何独处。但即使是这样的表述也无法真正表达我的意思。从字面上讲,我根本没有学会独自思考,原因很简单,自我童年以来,这种能力就从未被遗忘过。这是我们从出生起就具备的一种基本能力。然而,在 1945-1948 这三年与世隔绝的工作期间,我依靠自己的资源,遵循我自己自发发明的准则,使我对自己从事数学的能力充满了信心。这是一种谦逊而持久的自信,并不拘泥于任何共识或过时的法则。我的意思是:我用自己的方式去探索我渴望学习的事物,而不是依赖公开或默认的,来自更大或更小范围内一个群体的共识观念,不管这个群体是出于其他任何原因被视为权威,还是发现自己其实属于其中。以往,无论是在中学还是在大学,这种无声的共识告诉我,在使用像「体积」这样的词时,我们不必费心它真正的含义是什么,因为它「显而易见」、「众所周知」、「毫无问题」等等。但只有在这种「超越」的姿态中,我们才能做自己,而非共识的棋子,才能跳出别人划定的僵化圈子——正是在独处的行为中,我们才会发现真正的创造力,从而其他的一切都顺理成章。
从那时起,我有幸在数学领域受到欢迎,结识了很多人,无论是我的「前辈」还是我的同龄人中,他们都比我更出色、更有「天赋」。我钦佩他们像玩耍一样轻松地掌握新的想法,仿佛在摇篮里时就熟悉它们——而我却觉得自己笨拙,甚至有些愚蠢,在艰难的道路上痛苦地徘徊着,就像一头笨牛,面对着堆积如山却必须学习(据说如此)的东西,那些我觉得自己无法理解实质或者无法贯彻的东西。确实,在我身上很少能看出那种能在著名竞赛中获胜,或凭借一己之力掌握最棘手课题的优秀学生的特点。
事实上,我认为比我更出色的这些同志中,大多数已经成为了杰出的数学家。然而从三十或三十五年的角度来看,我可以说他们对我们这个时代的数学的影响并不深远。他们所做的一切,往往是在一个已经为他们铺垫好的背景下完成的美好事物,而他们并没有意愿去打破这个框架。在不自觉中,他们仍然是那些无形而专制的圈子的囚徒,这些圈子在特定时代限定了某个特定环境的边界。要打破这些束缚,他们需要重新在自己身上发现那与生俱来的能力,就像我的能力一样:独处的能力。
Deresiewicz, W. (2010, March 1). Solitude and Leadership. The American Scholar.:
但在我看来,独处是领导力的本质。领导者终究处于一种非常孤独,甚至非常寂寞的地位。无论你征求多少人的意见,最终还是你自己要做出艰难的决策。在这样的时刻,你真正拥有的只有自己。
Susan Sontag (As Consciousness Is Harnessed to Flesh: Journals and Notebooks, 1964-1980; 7/19/77)
一个人越孤独写出来的东西越好,见解越独特。
问:Grothendieck 说他并没有真正学会独处,这是什么意思?
答:他认为这是一种与生俱来的基本能力,而对于某些人来说,随着时间的推移,这种能力逐渐被遗忘。
问:Grothendieck 为何认为独处如此重要?
答:为了「超越」整个社会共识所知的、值得追问的、应该追求的事物,独处是必要的。
问:Grothendieck 从他那些天赋异禀的年轻同龄人中观察到了什么警示?
答:几十年后,他们已经成为了专业人士,但他们的工作并没有十分深刻,因为他们仍然受制于别人为他们设定的背景。
电子阅读时,并排阅读基本上不可能
原文:Parallel reading is mostly impossible in digital reading (andymatuschak.org)
据我所知,没有 PDF 或 EPUB 阅读器,允许读者一次查看同一本书的多篇不相邻的页面。如果你要查看手头章节对应的那部分参考书目,你需要来回翻动页面。我只知道 LiquidText 是常见阅读软件中的唯一例外。
物理剪切和粘贴是并行的,并会存在不严格的中间状态,然而电子的复制粘贴也并非如此,于是问题更严重了。
相关笔记:电子阅读很难保持多个阅读位置
参与式环境支持学习
原文:Participatory environments support learning (andymatuschak.org)
理解概念需与其尽力较量。为了支持这种努力,我们可以创建一个参与式环境,让活动自然地引发深入的参与。比如,一个艺术夏令营可能会包括很多绘画和绘图活动,这些活动能让学员在色彩理论上投入大量精力。
相比之下,像书籍这样的非参与式环境,通常是被动的。大多数读者不会投入太多努力,因此他们也难以深入理解内容。
参考文献
Matuschak, A. (2019). Why books don’t work. Retrieved from https://andymatuschak.org/books
人们经常难以回忆起文本的细节,原因在于他们起初就根本没有加工文本
人们似乎忘记了他们所读的大部分内容,而且他们大多没有注意到这一点,但这并不仅仅是长期记忆衰退的过程。根据我的个人经验和与学生的互动,我发现,有些细节之所以被忘记,是因为它们起初就没有被真正加工过。读者的眼睛可能只是扫过了某个句子或段落,而其中的想法根本就没有被感知到,或者由于注意力不足,其中的想法从未真正被深入加工。有时候,问题在于读者并没有理解句子的含义,但他们没有意识到这一点,也没有深入探究;无论是哪种情况,这个想法都不会被记住。这里的问题并不在于无法在一天或一周后回忆起这些想法;而是在于这些想法在十秒钟后就无法被回忆起——它们甚至没有进入记忆。
"gue sit amet vitae eros. Integer tristique, justo quis dapibus mollis, dolor lacus vestibulum lectus, vel molestie nunc libero sit amet pur"
根据《如何阅读一本书》 - Adler and van Doren所述,存在一种被称为「基础阅读」的问题:读者往往无法具体描述「文本说了什么」(对比:文本的含义是什么,或文本为何这样说)。
当然,分开来说,人们通常难以记忆细节,原因在于他们未能理解那些细节——他们不清楚文字的真正含义,这就大大增加了记忆的难度,尤其是当回忆任务需要哪怕是最轻微的迁移学习。
参见 2023-03-31 Patreon letter - 记忆系统与解题练习,其中我分享了对一名学生的观察。
附加问题能够提高学习者对相关但未直接测试的内容的理解。这一现象的部分原因是,这些问题使得读者更加集中注意力。另见助记媒介可能会促使读者更缓慢、更专心地阅读。
参考文献
-
Pressley, M., Ghatala, E. S., Pirie, J., & Woloshyn, V. E. (1990). Being really, really certain you know the main idea doesn’t mean you do. National Reading Conference Yearbook, 39, 249–256.
不是很明显的关联:
-
Chen, S., Fang, Y., Shi, G., Sabatini, J., Greenberg, D., Frijters, J., & Graesser, A. C. (2021). Automated Disengagement Tracking Within an Intelligent Tutoring System. Frontiers in Artificial Intelligence, 3, 595627. https://doi.org/10.3389/frai.2020.595627
- 通过检测人们在阅读过程中的投入程度,研究发现他们在阅读理解和记忆测试中的表现与他们的投入度密切相关。这表明,当读者投入度较低时,他们在这些测试中的表现也往往不佳。
人们更喜欢行动而不是思考
原文:People prefer doing to thinking (andymatuschak.org)
这个短语来自于 Timothy Wilson 及其同事的一篇论文,描述了一系列研究,参与者被要求在一个空荡荡的房间里静坐思考 15 分钟。在其中一项研究中,房间里放了一个他们可以用来给自己电击的设备,结果近一半的人都选择了给自己电击——尽管他们此前回答说他们愿意花钱免遭电击!
相关笔记:
问:有什么生动的实验能证明人们更喜欢行动而不是思考?
答:Wilson 等人要求人们静坐思考 15 分钟,并给了他们一个可以用来给自己电击的设备,尽管之前他们表示愿意花钱免遭电击,但很多人还是选择了给自己电击!
参考文献
Wilson, T. D., Reinhard, D. A., Westgate, E. C., Gilbert, D. T., Ellerbeck, N., Hahn, C., Brown, C. L., & Shaked, A. (2014). Just think: The challenges of the disengaged mind. Science (New York, N.Y.), 345(6192), 75–77. https://doi.org/10.1126/science.1250830
人们在学校经受过死记硬背,因由这些负面经历而低估记忆的重要性
实现深刻理解要求细致掌握基础知识,但许多人认为记忆对深刻的创造性工作不重要。在许多情况下,似乎是学校里无意义的死记硬背导致了这一不幸的结果:那些经验不愉快,也感觉没有用,所以推而广之,记忆一定是不愉快而又无用的。但是,如果为支持由衷的好奇或者有意义的追求而去记忆,记忆既可以是有益的,而又是赋能的。
与此相关的是,这些经验让人们认为记忆是负担,所以他们对记忆在哪里有用的感觉是相当受限的。但是间隔重复系统中选择去记忆某项内容的行为有如轻松的手势。
参见教育的目标往往会自我颠覆,以了解本说明的反教育者角度。
问:许多人从在学校死记硬背的负面经验中,得出了什么错误的推广?
答:记忆一定是不愉快且不重要的。
问:为什么学生时期的经历往往会导致人们普遍厌恶记忆?
答:学校里的死记硬背往往既令人不快又毫无意义。
参考文献
Matuschak, A., & Nielsen, M. (2019, October 0). How can we develop transformative tools for thought? https://numinous.productions/ttft
那么,这一切是否意味着我们是死记硬背的粉丝,就像普通学校里那种强迫的记忆?当然不是。我们相信,许多人不喜欢死记硬背,使得他们普遍不喜欢记忆,并因此低估了记忆在认知中的作用。事实上,记忆是认知的一大核心部分。但正确的举措,不是大量枯燥的死记硬背。相反,要搭配良工巧思记住真正重要的东西。
对笔记写作大谈特谈的人很少有严肃的使用场景
许多博主和「生活专家」的全职工作就是建议应该如何组织日记,或者应该如何最有效地写你所读,以求内化。我们之所以认真对待这样的建议,是因为这些做法已经帮助作者实现了有意义的创造性工作。「更好的记笔记」错过了要点;重要的是「更好的思考」
但大多数对笔记写作大谈特谈的人在他们自己的领域并非成就累累,不管这些领域是什么。事实上,大多数这样的作者并没有将他们的笔记应用于一些外生的创造性问题:他们的主要创造性工作是撰写关于生产力的文章。这些作者提供了记笔记的建议,以帮助科学家和高管应对工作中的挑战,但孕育这些建议的环境与这些挑战毫无关联。这里有两个相关的问题:有效的系统设计需要从严肃的使用场景中获得洞见,以及强大的赋能环境通常是追求自身意义的项目的副产品。
相比之下,卢曼几乎没有介绍过他的 Zettelkasten:他专注研究,成果丰硕,只有在他职业生涯接近尾声时,发表了几篇描述他笔记系统的短篇文章。
我不是很常遇到这个问题,但我确实会整周只谈写笔记而对严肃追求放手不管。这则笔记在提醒我小心这件事。相关笔记:我所认识的高效阅读者和思想家在阅读时不做笔记。
揭发内部腐败
原文:Pitching out corrupts within (andymatuschak.org)
如果你试图回答一个有趣的问题,你可能无法为自己写一份完整的路线图。你可以勘察情况,并尽可能地降低风险,但没有半路上遇到的机会,突发的灵光一闪,你到达不了目的地。因此,非常重要的是,你要睁大眼睛,避免自欺欺人:你的突破点,可能就藏在那个你想要一带而过的异常数据点之中。
既然你在和自己交谈时需要非常坦诚,那么你最好在和别人谈论你的工作时也要非常坦诚。我认为,说出那些有失公允的自吹自擂来营销自己的人,都是闭着眼睛说瞎话的。相比之下,如果你「开门造车」,开诚布公地讨论你正在努力应对的挑战(又称反向营销),你就会创造反馈循环,奖励怀疑和诚实的态度。你让诚信成为你身份的一部分,而不是试图将它与你的营销信息隔绝开来。
参考文献
与 Michael Nielsen 的对话, 2019-11-27
标题取自:
Tufte, E. R. (2006). The cognitive style of PowerPoint: Pitching out corrupts within. Cheshire, Conn.: Graphics Press.
计划本身不算什么,计划过程才是关键
原文:Plans are worthless, but planning is everything (andymatuschak.org)
这个看似自相矛盾的短语解释了很多事情。我一次又一次地发现,自己不得不放弃一些长期规划任务的结果。但即便如此,我也觉得,这比只是简单地即兴发挥要好得多。具体而言,规划无非就是事先考虑接下来要处理的事情所涉及的各个方面,这也许会让我按照自己的节奏去思考变得更为容易一些。目前,现有对人类认知中的「组块」的解释非常松散。
这句话被认为是出自于{艾森豪斯威尔},但这句话很可能是他对于丘吉尔早年的一句话的改编:「最好的将军是那些不受计划束缚并达成计划结果的人。」艾森豪威尔本人却认为,这句话出自一位无名的士兵之口。
平台知识帮助非从业者放大好点子
原文:Platform knowledge helps non-practitioners amplify good ideas (andymatuschak.org)
也许只有 10 万到 100 万人会在气候技术方面从事重要工作。但媒体对这一话题的影响并不局限于这些人。其他不专注于这个领域,但对这个话题感兴趣的读者,可以在作为社会「想法网络」的节点的时候使用这些知识。
在更好的理解下,他们将能区分好想法和坏想法,他们会相应地放大或削弱这些想法。这在气候变化、长寿、脑机接口等有很多假内行和无效的空想家的领域中特别有用。
只有当前置想法设法通过「想法网络」传播并到达相关节点时,新的洞见才会产生。即使是非专家和非从业者也可以在其中发挥作用。如果他们放大了无稽之谈,就会使专家的想法更难在专家之间偶然传播,因为两个专家之间最有力的交流途径可能变成非专家。
参考资料
-
Simler, K. (2019, May 13). Going Critical. Retrieved December 29, 2019, from https://meltingasphalt.com/interactive/going-critical
番茄工作法
原文:Pomodoro technique (andymatuschak.org)
根据我自己的实践:
-
2022 年 1 月换回工作 25 分钟,休息 5 分钟的番茄钟,作为项目——在早上完成工作;关注更长的连续时间块(6 小时而不是 4 小时,没有长休息时间)和在更难的任务上基于更高质量的深度关注,而不是试图优化效率
-
换到工作 40 分钟,休息 5 分钟(注:称为 45 分钟番茄钟) 2021-07-12
-
所以早上要做 6 个 45 分钟的番茄钟
-
工作 8 小时就是 12 个番茄钟
- 总共 55 分钟休息时间,分成 12 份
-
-
换到工作 35 分钟,休息 5 分钟 2020-01-22
-
今早目标是 7 个 40 分钟番茄钟
-
工作 8 小时就快 14 个番茄钟了
- 总共 65 分钟休息时间,分成 14 份
-
标准的番茄钟休息程序并不像你看起来那样(相对)低效
25/5 的分割看起来似乎效率很低。你牺牲了总工作时间的 17% 来做一些微小的休息,太小了,不能做任何严肃的事情!这感觉像是一个糟糕的主意,直到你意识到如果你不间断性地休息,你会在分心、时间黑洞、注意力不集中等事上浪费更多的时间。
尽管如此,目前还远不清楚 25/5 的比例是否正确。在 4 小时的工作时间内...
-
25/5 番茄钟包含 40 分钟的休息(83% 的时间工作)
-
35/5 番茄钟包含 30 分钟的休息(87% 的时间工作)
-
55/5 番茄钟包含 20 分钟的休息(92% 的时间工作)
真让人意外,这些差异居然这么小。据我的经验,55/5 比 25/5 难得多(并且可靠性大大降低),特别是当我接下来要做的事情还不是那么明确的时候。然而,在这个更为困难的模式下工作,我只能额外得到 20 分钟的有效工作时间。要想达到同样的效果,简单地在 25/5 方案中多加一个「番茄钟」会容易得多(更重要的是,它更可靠)。换句话说,如果我想要大约 3 小时 40 分钟的专注工作时间,我宁愿选择一个更可靠、要求较低的 4 小时 30 分钟的工作时间段,而不是一个不太可靠、要求更高的 4 小时工作时间段。
实际操作中,情况比这要复杂得多,因为休息时间本身也有损耗。有时候,休息过后我需要几分钟才能重新进入状态。如果我在休息时禁止自己进行任何与工作无关的认知活动(如回复琐碎信息、浏览新闻或社交媒体、解决无关问题等),这种情况会得到一定程度的缓解。有时候休息时间安排得很不合时宜,我可能会在思考的过程中被迫中断。这到底有多大影响,我也不确定。有时,如果一个时间段快结束了,而剩下的任务很难,我甚至不会开始做这个困难的任务,因为我知道我会被打断。番茄工作法明确地建议——你应该计划下一步要做的事情。这个建议有时确实有帮助。然而,你并不希望被打断的太过频繁。延长工作时间段能让这种情况变得更少。
拉远视角看:「理想」状态呢?假设我在接下来的四个小时里清楚地知道该做什么,这在编程项目中很常见,那么最佳的休息安排可能是:两小时后休息五分钟,每隔 30 分钟进行 30 秒的坐姿伸展和眼部休息。如果在四个小时内我完全不活动,我的身体会感到极度不适。因此,对我而言,实际上最佳的效率约为 97%(并非 100%)。在理想情况下,我会根据任务的性质动态调整休息时间分配:在编程时使用较长的工作时间段,而在进行高难度的创造性工作时使用较短的时间段。但要可靠地做到这一点确实有难度。
因此,在一定程度上,我认为相较于过分纠结番茄工作法的休息时间,通过以下方式更容易提高「效率」:
-
更积极地管理日程,确保连续的工作时间
-
更加谨慎地选择优质的下一步行动
-
更可靠地避免进行工作前的心理噪音(见倾听自己的想法很难)
-
通过社交压力制造工作强度(合作、指导、成果交付等)
除非任务特别多样或非常简单,一般来说,从第七个番茄钟开始,我会觉得越来越吃力;到了第九、第十个,基本上是强撑着,注意力也跟不上。任务切换耗费心力,所以最好将大块的工作一气呵成。但如果有五六个小时,还是分两块任务来做更好。实际操作起来,这确实让我头疼。第一块任务做完后,「注意力残留」很多,很难在没有充分休息的情况下进入第二个任务。所以,很多时候,第二块任务要么就没完成,要么做得很差。
相关笔记:
在电子阅读中,糟糕的性能会破坏非线性阅读
原文:Poor performance disrupts nonlinear reading in digital reading (andymatuschak.org)
熟练的阅读通常是非线性的,但电子阅读体验往往仅仅因为加载缓慢而使快速浏览和快速参考更加痛苦。当向前或向后翻动几页时,就会出现卡顿或白屏,这种环境促使读者的阅读效率降低。
更糟的是:因为进行电子阅读时,很难保持多个阅读位置,人们必须经常进行许多连续「翻页」操作,才能在相关段落之间移动。如果你在阅读一本实体书,你会把手指放在一个位置上,然后把中间的几页作为一个块来翻,但是电子阅读器必须承受延迟,而这种延迟通常会随着每一页的翻动而累积。
强大的创新往往侧重于创造全新范式,而非解决当前情境中的问题
施乐 Alto 并非要解决现有办公室的问题,而是力图创造全新情境,既有其优势,也有其困难。同样,我们不能靠解决 Motorola ROKR 的问题来发明 iPhone:iPhone 是全新的事物,是发明,不是回应竞品或者迭代改良。
从技术推广到其他领域,这一观察同样适用于某些政治制度(民主)、经济制度(加密货币)、精神制度(佐臣)等。
参考文献
Victor, B. (2019, December 12). Presentation at Stripe Convergence.
优先建立信息间的联系来分类,而非使用层级式分类法
原文:Prefer associative ontologies to hierarchical taxonomies (andymatuschak.org)
让结构自然、有机地从创作中涌现吧。如果一开始就预定了创作结构,你就会过早地限制可能涌现而出的东西,并人为压缩想法和想法之间的微妙关系。
从我们的文件系统、组织结构和图书馆上看,层级分类是世界的自然结构。然而项目通常不止属于一处,且互相关联的项目,却常常归类到不同的层级之下。
更糟的是,如果预先明确划分类别,这些类别之间的边界必然是模糊的。不是所有事情都能精准地归类。也许一旦积累足够多的新想法,新的类别又冒出来了......只是你看不到它的新形状,因为一切都已经被分类了。此时,进一步的分类需要拆现有的结构。
最好是让关联的想法所形成的网络逐渐涌现,不加任何标签:让思想和信念有机地涌现。一旦你能看到形状,那么你就可以思考它的特征了。这就是为什么常青笔记是发展大胆想法的安全场所的原因之一。
但要注意:标签是一种无效的关联结构。
本建议有一个副作用是:在关联型笔记系统中,很难导航到未经链接的「邻居」。
参考文献
Bush, Vannevar. “As We May Think.” Atlantic Monthly, July 1945.
我们不善查阅各种记录,这现象主要归咎于索引系统的刻意人造性。无论何种类型的数据,都要按字母顺序或数字顺序进行归档,而为查阅信息(能找到的话),则要深入层层子类步步寻踪。若无副本,信息只能在唯一一处被找到;不仅如此,找到一条信息后,就要先回到出发点再进入系统,走一条新路径查询下一条信息。人类思维不是这样运转的,而需依靠联想。脑细胞里存储的,是精微复杂的网络,由思绪轨迹编织而成,描述了想法之间的关联。根据这些关联,拿到一条信息,人类思维就能转瞬间联想到到另一条相关信息。
主题靠拢在一起形成的「群簇」会自发涌现,尤其是围绕着它们的关键字或标签。 由此产生的归档结果更契合你的思维方式,因为它是顺应你的兴趣而发展的。 而且,事物被贴上了特别对你有意义的标签,而不是对别人。归档是一项很个人的信息管理,所以必须个性化,而且更浓厚的个人风格则能锦上添花。
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
传统笔记系统中,主要问题是某条笔记要存放在哪个主题下;而卢曼卡片盒笔记系统中,主要问题则是在哪种情景下想再见到某条笔记。
优先选择明确的关联,而不是推断的关联
原文:Prefer explicit associations to inferred associations (andymatuschak.org)
在建立「笔记互链」的个人知识库时(例如常青笔记之间应该建立大量链接),关联是否一定要全部手动建立? DEVONthink 这样的工具,会使用机器学习推荐「相关」的笔记;而浏览网页时,浏览历史(单个标签里的时间线也可能为其提供背景)也可以反映内容间的关联。除此之外,或许光靠搜索,也能帮助我们顺藤摸瓜查找相关概念?
像这些(自动化的)工具确实有助于构建关联,可以作为寻找互联的参考,但构建关联的工作不应该全部交给这些工具。
第一:对内容相互关系的思考,是做自己的思考的一部分。这样迫使你深入体会新材料。
第二:紧密组织后的互链,信息量更高 —— 你不希望自己的笔记关联一大堆没用的内容,阅读时要在一屏幕的链接里挑拣半天(译注:跟进了百度似的)。你写的条目,应能让读者很快地看出自己要进哪些链接,而不是点进一个又退出来。这样的笔记需要你记住知识库里所有的条目到底谈了什么。
第三:你使用的术语会随着时间演变,所以基于关键词的链接长期看来不起作用。
参考文献
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
尽管 Zettelkasten 软件或许也能给出建议,比如根据关联的文献引用,但做好交叉引用是一个需要认真思考的问题,也是思想发展的关键部分。
在 Zettelkasten 中,我们可以很容易地将关键词添加到笔记上,像添加标签一样,之后在索引中就会显示出关键词。卢曼会在索引中的关键词旁边加上一条或两条(很少再多添加)笔记卡片的编号(Schmidt,2013)。
为什么要手动设置链接,而不是仅依靠检索 - Zettelkasten 方法
今天的你不可能像 6 年前那样写笔记,而且你会使用不同的术语。
每一次全文检索都会出现大量的 Zettel 笔记,所有笔记看似是平等的,而且联系方式也似乎一样,其实不然,完全不一样。所以你必须通过依靠记忆力来区分有用和无用的笔记,或者每次都要翻阅所有的笔记。
优先使用细粒度的关联
原文:Prefer fine-grained associations (andymatuschak.org)
信息系统中,材料之间的链接(例如常青笔记之间应该建立大量链接)可以是细粒度的(如文章中一句话中的引用),也可以是粗粒度的(如「另请参阅」小节)。
一般来说,创建细粒度关联会更好。例如你在读论文,比起在杂乱的相关论文列表中翻找有用内容,X 论文与 N 段落有关这一信息更有用。
双向链接尤其如此,否则很难知道这里的「反向」关系为何合理。
优先使用经过标注的关联
原文:Prefer labeled associations (andymatuschak.org)
在信息系统中连接节点的边(例如,常青笔记之间应该建立大量链接)本身应以某种方式标注,以展现关联的背景。仅仅说「X 与 Y 有关」通常是不够的:最好说「X 在 Z 的背景下更详细地介绍了 Y。」
额外的背景将是你记住或评估链接材料的引子,这将帮助你有效地浏览知识图谱,回溯你之前的思考过程。
笔记标题建议使用完整的句子,避免模糊主张
原文:Prefer note titles with complete phrases to sharpen claims (andymatuschak.org)
在常青笔记的写作过程中,我发现使用完整的句子作为笔记标题,有助于笔记保持面向概念(常青笔记应面向概念)。例如:教育的目标往往会自我颠覆,常青笔记实现顺畅而渐进的写作(「渐进写作」).
这些笔记标题通常是陈述句或者祈使句,明确地表达主张。主张明确的标题驱使我在笔记的主体部分充分围绕标题进行分析,以支持标题提出的主张。如果我写了一则笔记,但是却很难用精准的标题总结它,那么这通常表明我的想法不清晰,或者这则笔记涉及多个主题(违背了常青笔记应该是原子化的的原则)。在这两种情况下,解决办法都是将想法分解,然后先写自己最理解的部分。
问题也是很好的笔记标题,因为这个位置能驱使我提出触及笔记的核心的问题。有些问题确实是历久弥新的(杰出才能在多大程度上是可遗传的?);而其他问题笔记则更偏向于短期的启发式卡片(助记媒介如何助力非专业知识的学习? )。第二类问题的目标是摆脱问号,将其重构为以陈述句/祈使句为标题的笔记。
这一策略的几个常见例外:
开始写笔记时,我通常不知道标题会是什么。标题往往涌现在笔记正文的写作过程中。当一则笔记使我联想到一个清晰而强有力的标题时,这表明说明我开始理解这则笔记了。相关文章:常青笔记的标题就像 API
笔记标题建议正面表述,以促进说理系统化
原文:Prefer positive note titles to promote systematic theory (andymatuschak.org)
在写常青笔记时,很容易写出类似「X 不好」或「Y 不行」的笔记。更可取的做法,则是让笔记标题正面地表达事物属性或要求。
仔细想来,主旨含有否定意味的笔记,通常包含一个描述性的理论,说明为什么缺失/缺憾的属性是重要的。把内隐的说理摆在明面上,更易于在更系统的上下文下审视主张,进一步阐释也不在话下。
比如说:
-
元认知支持需要动态的、参与性的环境,而不是「被动环境不能提供良好的元认知支持」
-
用手机来收集和分流,而不是(通常)用来阅读,而不是「不要用手机阅读」
过早的扩大规模会阻碍系统的迭代
原文:Premature scaling can stunt system iteration (andymatuschak.org)
特别是在硅谷,当一个人有了一个原型或一点运作良好的模糊念头时,就面临将其扩大的诱惑:让它为更多的人和更多的用例工作,把它变成一个平台,让业绩折线图向右上角奔跑,等等。这个剧本显然威力巨大,但它的部署应该有谨慎的时机,因为它往往会让整个系统的概念架构冻结在早期。
为什么
你要花时间建设通用的基础设施。需要仔细设计接口,写文档和测试,并且确保系统能处理负载。这些工作和做实验是对立的,不仅因为要占用时间:这套系统会更加固化。
一旦用户和用例增加,做出改变或者进行大胆的实验就变得很困难。你要保证现有的功能不被破坏,否则需要小心地沟通并管理变化。
这些不同的用户每天都要消耗大量的时间:在一个小的原型中,1% 的人出现的故障不会带来真正的问题,但当你有 10 万个用户时,它就会成为高度优先的问题。
一旦这个剧本成为主要目标,你的动机就会改变:你的目标自然会变成使业绩图表上升,而不是回答关于你的系统的基本问题。
关于保持小规模
扩大规模的一个巨大的好处是,实践出洞见的过程能得到更多的反馈。诚然,有效的系统设计需要从真刀真枪的使用情境汲取洞见,但是创造小规模的真刀真枪的使用环境是可能的,你同样能将其用于回答关于你的系统的许多核心问题。事实上:技术专家经常本能地扩大他们的系统,以增加他们从严肃用户那里得到有力反馈的机会,但这是一个相当随机的方法。你可以通过精心组织你的原型设计过程来实现这一目标。这最终可能会更好,因为实践出洞见时,建议摸石头过河而不是先画蓝图
当然,最终你会需要对系统进行归纳,以回答某些问题,但至少在研究成果方面,最好是使规模遵循这些问题所表达的需要。在这个意义上,它是一个工具性的目的,而不是一个终极目的。
程序教学
原文:Programmed instruction (andymatuschak.org)
伙计,我发现这些文献实在令人不快。想不到它们在 60 年代竟然这么火。
-
它们坚持一种线性的教学方式,这与熟练的阅读一般都是非线性的相悖;这种方式很难做到随意查找复习内容 (Pressey, 1963)
-
它们过于碎片化,以至于很难看到整体。(传统的间隔重复记忆卡片是原子化的 vs. 间隔重复卡片通常是原子化的,而助记媒介为其赋予结构)
- Pressey (1963):「应当鼓励使用一种『附加的自动教学』,这种教学方式能够保留、利用并加强有意义的结构,自动教学的作用在于阐明和扩展这种意义。」
-
这些问题主要关注浅层理解——由于其模式以及对减少错误的强调,这是必然的。
- Pressey (1962):「编程这类教学的人不会巧妙地引导学生的反应,使他们在不知不觉中学习;相反,他应该提出一系列生动的挑战,每个挑战通过自动教学得到解决,以此逐步加深理解。」
-
这些问题往往显得居高临下,却又束手束脚,让人感觉像是在「猜教师心里的密码」
但我知道,比如 Little Schemer/Lisper 这样的书非常受欢迎,显然这些文本几十年前也大受欢迎。我在推特上问过,人们分享说他们喜欢其中的反馈,这样他们就不太可能完全迷失方向。
历史
程序教学发生了什么?
在某种意义上,它被吸收到更复杂的(不再是线性的)基于计算机的模型中,比如智能辅导系统。
Rutherford(2003)在评论 Benjamin(1988)时说:「他认为,文化惯性、对技术的抵制,或者『纯粹是对变革的过时抵抗』(第 711 页)导致了机器未能蓬勃发展。他还指出,一般来说,那些似乎否定了师生关系的教育技术(包括教学机器)都未能成功——而师生关系一直被视为学习过程中不可或缺的成分。」关于这一点,也可以参考 Dan Meyer 对 GPT-4 在教育中的评论;例如,《很明显这些数学学生对从AI聊天机器人导师那里学习不感兴趣》:「我可以尽可能简单而明确地说,当 K-12 学生在教室里与其他人类一起学习数学时,大多数学生不希望与电脑对话。他们希望与其他人类交流。他们不希望电脑夸奖他们或认为他们聪明成功。他们希望他们投入社交资本的人类夸奖他们,并认为他们聪明成功。」
Rutherford 还指出,程序教学中根深蒂固的行为主义倾向可能从一开始就注定了它的失败:这些教学程序的目的并非真正意义上的「教学」,而是通过操作性条件反射来「塑造复杂的行为模式」。
此外「一位 Harper’s Magazine 的作者(他本人也是程序化教材的开发者)报告称,一些批评者认为程序化教学提供的学习方式实际上只对教材编写者有帮助。」(这与学习别人的间隔重复记忆卡片通常是无效的不谋而合。)
Benjamin 和 Rutherford 的分析中有一个共同主题,那就是 60 年代的文化氛围对程序教学的衰落起了重要作用——当时人们已经开始担忧社会疏离、自由丧失和技术官僚主义等问题。
Pressey (1963) 指出程序教学的根本问题在于它可能因噎废食:传统的散文和语言实际上是很有价值的!
对于已经掌握阅读学习技能的学习者而言,传统的文本材料通过段落、章节和篇章来组织和构建内容。它通过标题和目录清晰地展示这种结构,并通过索引、页眉和页码使所有内容易于查找。因此,学习者有多种工具来帮助他们发展和构建理解。需要时,他们可以轻松地在材料中来回翻阅,跳过已知内容,根据后续需要返回查看,有选择地复习。作为呈现学习材料的方式,普通教科书可能不是最佳选择。然而,教学机器上的成千上万个框架或串联在程序化教材中的内容似乎是最糟糕的方式。...与其努力改进他们的程序,程序编写者不如广泛思考如何最好地呈现学习材料。我们大胆推测,最佳方式可能更接近于传统文本,而不是他们的程序。
阅读 Pressey 的评论格外引人入胜,因为他被认为是自动化教学机器最初概念的提出者,这一概念后来由 B. F. Skinner 进一步发展和推广。简而言之,Pressey 主张从行为主义向认知主义转变。
关键在于,这种方法可能实际上并未产生预期效果。Pressey (1962) 在第 32 页列举了一系列实验结果为零的研究(即与简单阅读转化为陈述句的问题和答案相比没有显著差异)。考虑到测试效应的存在,这一结果令人惊讶,但它可能反映了这种模式对阅读过程造成的严重损害。
B. F. Skinner (1984) 认为,问题可能在于糟糕的写作(这让我联想到写好间隔重复记忆卡片很难)。但他接着指出,这是因为人们有「对人类行为持根深蒂固的观点」,而他认为这些观点是错误的。他还补充道(不出所料),「认知心理学正在造成更多麻烦」。
参考文献
Rutherford, A. (2003). B F Skinner’s technology of behavior in American life: From consumer culture to counterculture. Journal of the History of the Behavioral Sciences, 39, 1–23. https://doi.org/10.1002/jhbs.10090
Benjamin, L. T. (1988). A History of Teaching Machines. American Psychologist.
Pressey, S. L. (1962). Basic unresolved teaching‐machine problems. Theory Into Practice, 1(1), 30–37. https://doi.org/10.1080/00405846209541773
Pressey, S. L. (1963). Teaching machine (and learning theory) crisis. Journal of Applied Psychology, 47(1), 1–6. https://doi.org/10.1037/h0047740
Skinner, B. F. (1984). The Shame of American Education. American Psychologist.
用散文格式编写的关于源材料的卡片缺乏上下文
原文:Prompts written in prose notes about source material lack context (andymatuschak.org)
在我的个人助记媒介实现中,我注意到,使用散文格式编写的卡片可以避免一些 SRS 创作界面所特有的短视。但是,有个常见的情况,当我为正在阅读的书籍撰写许多卡片时,这些散文卡片仍然因脱离了它们的源上下文而受到影响。
由于它们与原始资料没有联系在一起,我更难评估是否「涵盖」了我打算表达的内容。修改那些模糊或未抓住正确角度的卡片也变得更加困难。
如果我为一本书写很多卡片,它们将形成一个庞大的、视觉上无法区分的文本文件。这在视觉上和实践中都非常难以浏览!所以,我通常会用副标题分隔概念性部分……但仍然如此。我发现,最容易的方法是根据卡片在文本中对应的「位置」来思考卡片,但是将卡片嵌入到散文中会丢失这种空间关系。
另请参见我的笔记,在阅读网络内容时,在行内编写间隔重复卡片的界面,以了解可能性和替代方案。
编写卡片有助于阅读理解
原文:Prompt-writing supports reading comprehension (andymatuschak.org)
如果对文本写出详尽的记忆卡片,我的阅读理解通常更加可靠。这个过程让我进入一种主动的视界,我会留意任何看起来重要的内容;我基本不会忽略关键细节,而且,为了将这些细节转化为提取任务(指转换为 SRS 卡片),我通常需要以某种自底而上的方式来理解它们。
编写卡片实际上是一种自我解释的行为。深入而有意义的编写卡片通常有助于更深层次地加工文本内容。它通常包括构建过程,比如当卡片中包含文本中没有直接表述的推理时。它也可能涉及到整合过程,例如当卡片把文本的不同部分联系起来,或者将文本内容与先前的知识相连时。此外,编写卡片还可以纠正错误:你可能会发现自己在某些部分感到困惑,或者发现自己对某个概念理解不够,无法将其清晰表达。
有时候,我不知道怎么写这些卡片。学习写优质的卡片如同学习写优质的文章:你都需要摸索出一整套应对各种细分情况的策略。但我还没有(或者说尚未)找到针对某些特定材料编写记忆卡片的策略。举个例子,此书讲解解集的首选形式(Preferred Form)时,首先展示了一个抽象的符号表示,然后通过多个对比鲜明的例子来深化讲解,目的是让读者理解这种解集形式为何如此设计,以及它在实践中的作用。用这种抽象符号做一些基础卡片还算简单,但要针对这些例子展示的微妙之处,以及选择这种形式的多重原因去编写卡片就难多了。如果我真的全身心投入并充分发挥创意,一般还是能找到解决办法的。但这经常会让我觉得很累,所以我就走马观花地往下读,有时甚至不自觉地就这么选择了。在这种情况下,编写卡片并没有真正验明我的阅读理解。(当然,这也意味着这些细节不会得到强化——后面再细说。)
**卡片带来的义务感。**我当然想把作者说的话都搞懂,但我不一定想不停地复习作者说的每一句话。当我大量依赖记忆卡片来加强理解,我经常会感觉被「卡片的密度」压得喘不过气。有时我发现很多细节我并不怎么在乎,或者这些细节在后面的综合卡片中已经得到了强化。当然,我可以把多余的卡片删掉,但每删一个都有点成本。而且,写那么多「不必要的」卡片比直接读出来给自己听要麻烦多了。这其中有一部分努力让我对内容有了更深刻的理解,但很多时候感觉像是白费劲。
**肤浅的卡片,粗浅的理解。**当文章给出一个关键定义时,仅用文中的定义稍作改写就能快速写出一张卡片,这样看似很简单。但这就是问题所在,因为很容易在没有真正理解的前提下做改写(McNamara, D. (2004). SERT: Self-explanation reading training. Discourse Processes, 38(1), 1–30)。一般来说,仅仅是简单改写文本的效果不是最佳。要写出有效的卡片,往往需要深挖并拓展。有人可能会对我说:「那就把卡片写得更好一点嘛!」当然,但我要指出,这种方法并没有引导我做正确的事。很容易在不经意间写出肤浅的卡片,要避免这种情况,我不仅需要保持高度自省 —— 这在学新东西时很难 —— 还需要在写卡片上多下工夫,但「值不值」这么做,我并不总能确定。
**代价过于高昂。**即便你掌握了方法,写好间隔重复的记忆卡片很难。我个人觉得这个过程非常耗费精力,远比进行传统的自我解释要累得多。
《量子国度》的读者能可靠地记住嵌入的卡片
2019 年末的复习时间表
关于 2019 年下半年的数据,见经过五次复习,大多数《量子国度》对至少 95% 的卡片达到了至少 1 个月的展示记忆保持
2019 年初的复习时间表
这些数据来自于那些在第一次复习环节前,在文中回答了 QCVC 中 80% 以上卡片的读者。
经过 6 次复习(使用较早的、比较保守的 SRS 时间表),2019 年上半年的用户在每张卡片上平均能保持 54 天的记忆。
到了 2019 年下半年,中位数的读者在第 9 次复习时,在 95% 以上的卡片中展示了两周的记忆保持。(来源)这些用户在每张卡片上经过 3 次复习后,平均记忆保持时间约为 24 天。目前我们还没有关于更多复习次数的数据。
但这是否仅是一种幸存者偏差?这些读者本来就会形成这样的记忆吗?或者这是一种选择效应——这些读者是不是已经对这些内容形成了详细的记忆?助记媒介的复习环节对读者的保留有什么因果性影响?
《辞去你的工作》Wolf Tivy
原文:Quit Your Job - Wolf Tivy (andymatuschak.org)
作者:Wolf Tivy,发表于 Palladium Magazine https://palladiummag.com/2022/01/06/quit-your-job/
总结
-
对你和世界最有意义的道路,是无法事先规划好的;你得通过追求有趣的新奇事物来揭开它们的面纱,在此前没有人知道哪条路会通向成功或失败。
-
「即使是不错的工作,也会束缚你对可能性的感知」;换句话说,你在工作中无法有效地追求有趣的新奇事物。你需要自由、无拘无束的时间。
-
事实上,社会依赖于这样生活的人——很多重要的想法都是由此产生的。
-
-
辞职的目的并不是为了纵情享乐;而是为了发现并尊重你的使命感,认真对待你自己的想法,只按照你自己而非他人的价值前进。
- 你可能可以在工作中做到这一点,只要重新定义你的工作,把它看作是「你神圣的宇宙使命」。当然,这只有在你认为这份工作真的很重要时才可能实现。
-
许多人把辞职看作是为自己工作——比如「我要全职做我的辅导副业」这样具体的事情。这可能更有趣,但这并不是这里所倡导的「辞去你的工作」。目的是追求开阔的空间,摆脱义务和「应该」的束缚,培养自己的冲动。
-
辞职后,你会感受到(来自自己和他人的)压力,要求你「开始干点什么」或者「要变得成功」。但这些冲动往往会让你误入歧途,因为你还没机会真正培养自己的价值观。它们只是别人对目标的看法。你需要做的是「艰苦的闲暇」——随性地追求自己的好奇心,而不是为了达到别人的「成功」标准——去培养你自己的。
-
(对过程重于结果的呼应)
-
-
人们常以为辞职是超级富豪的特权,但其实能做到这一步的人比我们想的多。
-
很多人之所以不敢辞职,是因为他们自己对自己的想法也不够自信(这通常是对的!)。在充满工作的生活里,这些冲动无法成长。你必须给它们一个展现的机会:「你的好想法来自于{多年的艰苦闲暇}。」
-
你可能看不到可持续的道路,但如果你在做一些美好的事情,就会有力量涌现出来支持你。
-
就算没有,你的生活也会因此变得更加精彩。
-
-
「闲暇」并不意味着轻松。一旦你找到值得追逐的机会,你就需要通过奋斗和投入去追逐它。
问:如果你有能力辞职,在何种意义上这是你的社会责任?
答:进步依赖于追求有趣的新奇事物所带来的洞察力;工作往往会限制这种追求的自由。
摘录
在解决生活这样复杂的问题时,最佳的搜索策略不是追求单一的、同质化的目标,而是去探索那些有趣的新奇事物。搜索空间过于复杂、充满未知,线性的追逐目标是行不通的。…仅仅沿着已知的价值路径,你无法找到那些别人没做过、你从未见过的、有趣的新奇事物,或者是那些让你感到好奇和怀疑的小线索。但真正的宝藏往往就藏在这些地方。…要得到最大的回报和最有趣的体验,你必须以开放的心态,追求那些单纯有趣的新奇事物。
让自己脱离舒适区,经受多年的艰苦闲暇,去寻找那些真正值得你投入生命的激励人心的目标,以及实现这些目标所需要的技能和秘密知识。只有在自由地追随明智的直觉数月后,你才能在那些奇异且毫无道理的好奇心中找到它们。
生活在信念的飞跃中达到其适当的形式,并在大胆的奋斗尝试中达到最高的发展。你会远离已知存在的舒适,在荒野中发现的好奇心和灵感中找到它。
所以,辞去你的工作,成为你想在世界上看到的那种勇敢、有抱负的精英。在未经探索的边界上,凭直觉生活,大胆尝试,靠你对必做之事的直觉决定生存或灭亡。你只有在大胆尝试中才能完成你的宇宙使命,赢得荣耀。
推特讨论
有时候,人们问我在哪工作,我会半开玩笑地说自己是「野生」的。虽然这只是个玩笑,但也有我的真心话在里面。每当我全心全意追求自己感兴趣的事情,忽略那些要求我产出具体成果的冲动,总能碰到一些好事。这篇文章对此的描述就非常到位:https://palladiummag.com/2022/01/06/quit-your-job/
文章的核心论证是,对你和世界最有意义的道路,是无法事先规划好的;你得通过追求有趣的新奇事物来揭开它们的面纱,在此前没有人知道哪条路会通向成功或失败。不过,通常情况下,工作会让这变得不可能。
「辞掉你的工作」(无论字面意义上还是比喻意义上)的目的并不是为了纵情享乐,而是为了发现并尊重一个更深层次、更个人化的使命感,认真对待你自己的想法,只按照你自己而非他人的价值前进。
那些辞职的人经常会感受到压力,要求自己「开始干点什么」,或者「要变得成功」。但这些压力其实都是别人对目标的默认看法。你还没来得及培养出自己的目标。要做到这一点,你需要花时间去真正地、非功利地和自己的冲动相处。
许多人把辞职看作是为自己工作:「我要全职做我的教练事业了!」这可能更有趣,但这并不是真正意义上的辞职。真正的目标是追求开阔的空间,摆脱义务和「应该」的束缚,培养自己的冲动。
辞职去做一件明确的事,其更深层的问题在于,你被局限在你目前的世界里能想到的路径上。这些路径都是在工作环境下形成的,最有意义的道路可能根本不在这个范围里。
这跟 @ufotransluscence 的《成为魔术师》有异曲同工之妙,他在文章里讲述的是成为一个不可能的自己,甚至像外星人那样的自己。你之前的经历和方法,不一定能带你走向更远的地方。https://autotranslucence.wordpress.com/2018/03/30/becoming-a-magician/
Wolf 的一个观点是,踏出既定职业道路需要很大的特权。但很多——可能是大多数——能够踏出这一步的人,都错把这当成了童话,认为这只适用于「别人」。
我不太确定这点有多准确。显然,即便是很多相对富裕的人也面临着巨大的实际困难,这一点我从以下推特的回复中学到了不少。但这种看法也不完全是错的。我自己就需要很多鼓励才敢冒这个险。https://twitter.com/andy_matuschak/status/1486870216260808707
总之,Wolf 正确地指出,人们不辞职的一个常见原因是他们对自己的想法缺乏信心,这通常是对的。他们的直觉似乎很弱,因为很多时候确实是这样。你需要给自己机会让这些直觉成长:「好想法来自于长期的艰苦闲暇。」
这使我对最近兴起的小额资助项目(比如 Emergent Ventures)更加乐观。「你资助我三到十二个月……之后呢?」如果只从启动明确项目的角度评价,这似乎有些不靠谱。但对于培养高度个人化的直觉来说,可能非常有前景。
阅读理解问题令人不快
原文:Reading comprehension questions are unpleasant (andymatuschak.org)
阅读理解是一个普遍问题:人们经常难以回忆起文本的细节,原因在于他们起初就根本没有加工文本。附加问题作为一种解决方案被提出(参见附加问题能够提高学习者对相关但未直接测试的内容的理解)。但我发现,当文本中包含了基础答阅读理解问题时,我通常会感到非常厌烦。
这些问题往往缺乏新意,与材料中吸引人的内容几乎没有关联。它们常常显得有些居高临下,让我感觉像是在尝试「猜出老师想要的答案」,这与 Issa Rice 提出的专家回答启发式截然相反。总的来说,这些问题让我感觉就像是在做家庭作业。
不幸的是,当遇到与我未能充分理解的内容相关的问题时,这种感觉尤为明显。这些问题对我来说似乎毫无意义。我能感觉到它们在要求我给出某种特定的答案,但我无法确定具体需要回答什么(因为我之前并未真正理解过需要的信息)。因此,这些问题就像让我盲目地追寻一样,我不得不翻来覆去地检查章节,试图找到与问题中词汇相匹配的段落。然后我才意识到,我原来根本没有真正理解过那部分内容,虽然我可能最终弄清楚了问题的意图……但这是一种不优雅的达成方式。
以下是出自《认知》 - Reisberg第二章的一个典型例子:
自我测试
- 大脑的结构成像和功能成像有哪些区别?各自使用了哪些技术?
- 结合使用不同方法研究大脑有什么益处?
- 所谓的「功能定位」是指什么?
特别是第二个问题,它让人联想到 Issa Rice 提出的专家反应启发法失败的情况。虽然这种情况本身或许可以被接受,但问题在于,我觉得这本书期待的是一个「标准答案」。而其他问题则显得非常无聊,缺乏吸引力。
间隔重复记忆系统的复习环节有时也会显得单调无趣,但我对待这些问题的态度稍有不同:我是在「进行记忆复习」的背景下来看待它们的——也就是说,「我在确保自己能记住这些内容。」我的感觉大致是,这种复习不一定要有趣,它更多是关于回忆和提取的过程(大多数时候)。
相关的一个观点可以在将助记媒介应用于非技术性文章的经验教训中找到,例如有人评论说:「这让我想起了学校的家庭作业」;「回答这些卡片就像在做一件非常冷漠、乏味的事情。」我感觉,这些印象特别与助记媒介卡片穿插在阅读过程中有关。
一些相关形式并不令人不快
有一件让我感到困惑的事情是,我完全不介意在 Execute Program 中的 REPL(Read-Eval-Print Loop,读取-求值-输出循环)卡片。实际上,这种交互非常吸引人、有趣并且令人愉快。如果我对某些内容理解不够,我会重读相邻的文本。我也不反感 Execute Program 的课程根据读者的交互展开他们的散文。相比之下,我对 Mathigon 和 Brilliant 的类似做法感到有些不快,我认为这是因为它们的信息「块」或内容单元比较大。
同样,我也不反感在教科书中完成习题集。事实上,当这些习题集编得好时,我甚至会享受解答它们。我很欣赏它们对加深我的理解所起的作用。在电子游戏中进行类似的任务时,除了那些过于缓慢和缺乏创意的教程,我通常也不会感到厌烦。
在我参加的芝加哥大学基础课程项目中,我并不介意在讨论过程中回答一些实际上等同于阅读理解问题的提问。正如我在 2023-06-30 Patreon letter - 《阅读理解和记忆系统》中所说:
我认为区别主要在于社交环境。一个我尊重的、真实的人正在问这个问题;他们会真正地与我的答案互动;其他学生可能会在我的回答上展开讨论,或者给出有趣的个人想法;讲师会把我们的答案与后续的问题联系起来,等等。这也部分关于我活动的构架或安排方式。我选择参加了这场关于书籍的讨论,所以这就是我要做的。我正在「讨论」,而不是「做无聊的阅读理解题」。
Mathigon
正在看图论课程。
这里有一个让人感觉居高临下的问题:「我们每天都被无数的连接和网络所环绕:道路和铁路轨道、电话线、互联网、电子电路乃至分子键。甚至在朋友和家庭之间也存在社交网络。你能想到其他的例子吗?」
在我还没学习到「顶点」和「边」这些专业术语之前,我就被要求回答它们。如果不给出正确答案,我就不能继续学习。这种做法令人反感,因为我对答案早已心知肚明。与之相比,被要求找出图形或顶点的阶和度就显得更加合理,这更像是「真正的」练习,也更贴近 Execute Program 中 REPL 的风格。
这种教学方式让我强烈联想到程序教学法,特别是当我被告知「由一串顶点组成的图称为圈」,紧接着又被问到:「所有的圈都有……?」(相同数量的边和顶点)。我并不喜欢这样的方式。这个结论虽然听起来有道理,但却没有任何证明,也没有要求我们去验证。这让我感觉好像是在试图猜出老师想要的答案。
「柯尼斯堡的桥」一节有个很棒的关于桥梁的交互练习。
我讨厌那个狐狸机器人的反应。
这就像是猜测和检查:
首先,我们需要把城市地图转换成由边和顶点组成的图。图中的每个岛屿或陆地区域由 ??? 表示,而每座连接两个区域的桥梁则由相应的 ??? 表示。
我发现自己对「桥梁」小节的最终结论只理解了一半,但是通过这些问题,我并没有意识到自己的理解不足。
这个交互体验非常出色:
[Screen Recording 2023-07-04 at 11.41.37 AM.mov](https://notes.andymatuschak.org/Screen Recording 2023-07-04 at 11.41.37 AM.mov)
这个问题设计得很好:两组大小分别为 x 和 y 的二部图通常被表示为 Kx,y。它有 ??? 条边。
同样,这些允许我操纵图形并自己判断它是否为平面图的交互工具也很吸引人:
至于在美国地图上进行着色的活动,实在是过于单调乏味。
似乎每当段落中出现数字时,你必须试着改变它们才能继续前进。这种设计同样令人不悦。
总的来说,那些鼓励我运用文本中解释的内容或进行有趣推理的问题,通常让我感觉很好。这种感觉在有相关操作工具辅助时尤为明显。然而,那些仅仅要求我重复段落内容或试图猜测文本未来走向(类似程序教学法的风格)的问题,则让我感到厌烦。
Brilliant
正在看 Practice Scientific Thinking | Brilliant
齿轮:我为什么要回答这个问题?
Brilliant 提供了问题的解释,这对于那些觉得问题有点难以理解的人来说是个不错的特点。
总体来看,这些问题似乎不如 Mathigon 的问题那么成功。但它们的形式更为随意,也不那么精确。
有时回答问题的感觉就像在试图猜出老师心中的答案:
「复习和反思」环节很少真正涉及到这两个方面。
我发现滚动阅读时的体验不是很舒适,我的视线不知道该聚焦在哪里。
在 Practice Hypothesis Testing | Brilliant 课程中,有一个问题要求我使用笔和纸来解答,但我并不想这样做。它给我造成了一种「阻碍感」。
总体上,我觉得 Brilliant 的问题通常不足以确保充分理解和掌握。与 Mathigon 相比,它们的要求不那么严格,所以即便设计得不太好,也不会那么让人反感。
阅读理解问题可以发现文本基础的漏洞
原文:Reading comprehension questions can uncover textbase holes (andymatuschak.org)
我有些尴尬地发现(2023-09-11),当我要求大语言模型生成阅读理解问题,以此来帮我评估我针对《线性代数》- Hefferon某一章节所构建的文本基础(参见构建-整合模型)时,有几个问题揭示出了文本中我完全未曾理解的部分。尽管我已经努力仔细阅读。
阅读理解问题令人不快,这些也不例外。关于这次我注意到的问题,我在这里加了一些笔记:
不幸的是,当遇到与我未能充分理解的内容相关的问题时,这种感觉尤为明显。这些问题对我来说似乎毫无意义。我能感觉到它们在要求我给出某种特定的答案,但我无法确定具体需要回答什么(因为我之前并未真正理解过需要的信息)。因此,这些问题就像让我盲目地追寻一样,我不得不翻来覆去地检查章节,试图找到与问题中词汇相匹配的段落。然后我才意识到,我原来根本没有真正理解过那部分内容,虽然我可能最终弄清楚了问题的意图……但这是一种不优雅的达成方式。
有趣的是,这里的机制是间接的:当阅读理解问题暴露出我理解上的失败时,我通常并不完全明白这个问题到底在问什么。但这种困惑引导我重新阅读,寻找可能有帮助的信息,这个过程最终帮助我弥补了理解上的空缺。
我假设阅读理解问题同样能揭示出我在情境模型(参见构建-整合模型)中的漏洞,尽管我对此没有太多直接体验。对我而言,通过需要推理(即迁移学习)的复杂任务来发现这些漏洞更为常见。当我无法完成这些任务,而我的文本基础又看起来很扎实时,要确定情境模型的具体崩溃点似乎颇有难度。
另见,在助记媒介的背景下:助记媒介中穿插的卡片有时会不太愉快地揭示出阅读理解上的疏漏。
阅读理解
原文:Reading comprehension (andymatuschak.org)
我最感兴趣的是成年人的阅读理解,尤其是难懂的解释文本。一些笔记:
-
人们经常难以回忆起文本的细节,原因在于他们起初就根本没有加工文本
- (见 2023-06-30, 2023-08-01, 2023-08-31 patron letters)
-
干预措施
-
-
精细口头复述 (heavier on elaboration)
-
McNamara, D. (2004). SERT: Self-explanation reading training. Discourse Processes, 38(1), 1–30
-
研究就像理解 - Kanjun Qiu
原文:Research as Understanding - Kanjun Qiu (andymatuschak.org)
总结:刚入门的研究者,常常会误以为研究是一种截然不同的活动,专注于「产出新发现」,比如通过使用科学方法。但是,去理解一些从来没人弄明白过的东西,和你试图解答别人已经回答过的问题时的那种深入理解,其实差不多。在这两种情况下,你都是因为迫切想要回答一个问题而试图深入理解;在没有人能告诉你答案时,你就在「研究」了,但其基本原理并没有太大不同。而「新发现」只是这个理解过程的副产品,而已。
我们天生好奇;我们已经知道如何学习,如何注意到某些事情不合理。我们提出问题,并解决答案。某个时刻,我们会提出没有人知道答案的问题。那时,我们就开始研究了。
非常相关的笔记:
问:Kanjun Qiu 在做研究时发现了哪种自我毁灭的信念?
答:以为研究就得「尝试做出新发现」,觉得这和她之前经历过的其他类型的理解完全不同。
问:Kanjun Qiu 认为研究和「做出新发现」之间是什么关系?
答:新发现其实是深入理解某件事时的副产物。你无法靠刻意追求新发现来真正得到它。
问:Kanjun Qiu 曾在「尝试做出新发现」上犯了什么通病?
答:把注意力放在了过程的副产品上,而不是过程本身。
问:把研究看作是理解过程,对于那些尝试做研究的人来说意味着什么?
答:「研究」只是我们对理解过程中挖掘已有答案之外的问题的部分所贴的标签。它并不是什么陌生的东西。
提取练习和迁移学习
原文:Retrieval practice and transfer learning (andymatuschak.org)
最简单的测试效应实例发生在学生对着他们之后会被测试的(即相同的)卡片进行测试的时候。所以:假设你记住了关于一个主题的一千张卡片,我们真正关心的不仅仅是你回答这些具体问题的能力,毕竟你早就见过它们了,而更重要的是这种练习使你对该主题的可用理解产生了怎样的影响。你实际上能用它做什么?如果我问你一个涉及你所练习的知识的开放式问题,你能不能调动这些知识——即迁移学习。
实验证据
-
Meta-analytic review and synthesis. Psychological Bulletin, 144(7), 710–756
- 这个关于提取练习的迁移效应的元分析发现,相对于非练习干预,总体平均迁移效应为 d=0.4,特别是受练习期间的反应一致性、初始准确性和精细提取调节。
-
- 用改编的维基百科段落进行的小型实验表明,相对于重新学习,提取练习可以提高学习者面对迁移类问题的表现,其幅度与逐字问题相近。
-
A Systematic Review of Applied Research in Schools and Classrooms. Educational Psychology Review.
- 在这个关于提取练习的更广泛的系统性的综述中,作者指出:「与逐字或重复问题的实验相比,改写问题的实验的效应通常较小。」这个效应看起来很小,也许是 d~0.1-0.2。
-
- 在某些条件下,学生进行事实问题的练习,并被要求回答高阶测试问题。这些学生的表现与那些完全不进行提取练习的学生几乎没有区别。
准备阅读
-
Agarwal, P. K., Bain, P. M., & Chamberlain, R. W. (2012). The value of applied research: Retrieval practice improves classroom learning and recommendations from a teacher, a principal, and a scientist. *Educa- tional Psychology Review, 24,*437– 448. http://dx.doi.org/10.1007/ s10648-012-9210-2
-
Johnson, C. I., & Mayer, R. E. (2009). A testing effect with multimedia learning. Journal of Educational Psychology, 101(3), 621–629. https://doi.org/10.1037/a0015183
-
McDaniel, M. A., Howard, D. C., & Einstein, G. O. (2009). The Read-Recite-Review Study Strategy: Effective and Portable. Psychological Science, 20(4), 516–522. https://doi.org/10.1111/j.1467-9280.2009.02325.x
-
McDaniel, M. A., Thomas, R. C., Agarwal, P. K., McDermott, K. B., & Roediger, H. L. (2013). Quizzing in middle-school science: Successful transfer performance on classroom exams. *Applied Cognitive Psychol- ogy, 27,*360–372. http://dx.doi.org/10.1002/acp.2914
-
Agarwal, P. K. (2019). Retrieval practice and Bloom’s taxonomy: do students need fact knowledge before higher order learning? Journal of Educational Psychology, 111, 2 189–209.
-
Butler, A. C., Black-Maier, A. C., Raley, N. D., & Marsh, E. J. (2017). Retrieving and applying knowledge to different examples promotes transfer of learning. *Journal of Experimental Psychology: Applied, 23,*433–446. http://dx.doi.org/10.1037/xap0000142
-
Carpenter, S. K. (2012). Testing enhances the transfer of learning. *Current Directions in Psychological Science, 21,*279–283. http://dx.doi.org/10 .1177/0963721412452728
-
Rohrer, D., Taylor, K., & Sholar, B. (2010). Tests enhance the transfer of learning. *Journal of Experimental Psychology: Learning, Memory, and Cognition, 36,*233–239. http://dx.doi.org/10.1037/a0017678
-
van Eersel, G. G., Verkoeijen, P. P., Povilenaite, M., & Rikers, R. (2016). The testing effect and far transfer: The role of exposure to key infor- mation. Frontiers in Psychology, 7, 1977. http://dx.doi.org/10.3389/ fpsyg.2016.01977
-
Balch, W. R. (1998). Practice versus review exams and final exam performance. Teaching of Psychology, 25, 181–185. http://dx.doi.org/10 .1207/s15328023top2503_3
-
Bjork, E. L., Little, J. L., & Storm, B. C. (2014). Multiple-choice testing as a desirable difficulty in the classroom. Journal of Applied Research in Memory & Cognition, 3, 165–170. http://dx.doi.org/10.1016/j.jarmac .2014.03.002
-
McConnell, M. M., St-Onge, C., & Young, M. E. (2015). The benefits of testing for learning on later performance. Advances in Health Sciences Education, 20, 305–320. http://dx.doi.org/10.1007/s10459-014-9529-1
-
McDaniel, M. A., Anderson, J. L., Derbish, M. H., & Morrisette, N. (2007). Testing the testing effect in the classroom. European Journal of Cognitive Psychology, 19, 494 –513. http://dx.doi.org/10.1080/ 09541440701326154
-
McDaniel, M. A., Wildman, K. M., & Anderson, J. L. (2012). Using quizzes to enhance summative-assessment performance in a web-based class: An experimental study. Journal of Applied Research in Memory & Cognition, 1, 18–26. http://dx.doi.org/10.1016/j.jarmac.2011.10.001
提取练习似乎是一种比精细编码更有效的学习活动
制作概念图或提出自己的问题似乎是了解一个领域的好方法,但至少对于基础知识而言,提取练习似乎是更有效的学习活动:
SRS 重试机制
原文:SRS retry mechanism (andymatuschak.org)
在间隔重复记忆系统中,通常有各种各样的「重试」机制。通常情况下,这些机制的工作方式是,如果你答不上来一个问题,几分钟后,或在复习结束时,它将再次呈现。换句话说,这张卡片被暂时分配一个很短的间隔,在成功记住之后,它就会得到新的「遗忘后」间隔,通常会更长。
在助记媒介中
从 2019 年底开始,《量子国度》实现了以下行为;Orbit 一直都在实施这一行为。如果你在阅读文章时忘记了问题的答案,该问题会在文章的下一个复习区重新出现(除非是最后一个复习区,在这种情况下,一旦你回答了当前复习区的所有问题,它就会重新出现)。如果你在复习阶段忘记了问题的答案,它将在复习阶段结束时重新出现。
到目前为止的研究结果:重试干预使量子国度的早期准确率大幅提高。
这个功能大致受到 Anki 的「学习」队列启发。如果我忘记了一张卡片的答案,然后提前结束复习(即在再次复习该卡片之前),我觉得对它的记忆会变得不那么可靠。提取练习文献中可能存在实证数据。我还没有查阅相关文献,也没有在我的背景阅读中偶然发现它。
有趣的是,间隔效应表明,这种快速重试可能不如在下一个复习会话中重新呈现卡片那样有效。但我的直觉(以及我们越来越多的证据)表明,重试干预确实有帮助。在我读过的有关间隔效应的文献中,没有一篇根据最初的反应成功率来区分表现(尽管我认为应该已经有这样的研究了)。
关于助记媒介中这种机制的笔记:
对进步的直观感知驱动技能发展
原文:Salience of improvement drives skill development (andymatuschak.org)
谁都知道高超的钢琴演奏听起来怎样。当一个业余爱好者演奏时,他自然会将自己与听到的录音比较——也许还会对这二者的差距感到相当痛苦!相比之下,人们做复杂决定时,他们通常对自己业余选手的身份缺乏自觉。军官接受的训练要求他们能做出战略性决断,但这种战略性对一个小生意人来说并不特别重要。决策,作为一种抽象的技能,不会出现在「技能举重」菜单上。
我怀疑这就是为什么人们通常将技能发展到一个高原,然后停止,特别是为什么运动员和音乐家比知识工作者更严格地追求基本技能的精湛性的一个关键原因。如果你从来没有听说过间隔重复记忆系统,记忆能否成为一个可以解决的问题,可能并不是很明显。如果你没有听说过常青笔记,那么知识工作者对于逐步完善想法往往没有具体方法可能也不明显。
自我解释
原文:Self-explanation (andymatuschak.org)
学生对学习材料自行生成的总结和解释。
这种自我生成的内容似乎能够促进学习(自我解释效应),原因在于它需要监控理解的过程,并且涉及到构建书中未直接提及的推论。当自我解释能够与已有的知识相连结,或者与书中较远的部分建立联系时,效果似乎更佳,而不仅仅是对文本内容的简单改述或局部联系。
针对自我解释的干预措施在提升文本基础理解方面带来的好处相对一致,而在情境模型方面的影响则不那么明显(参见理解 - Kintsch)。领域知识较少的学生似乎从中获益更大。但在这方面的结论还尚不明确:McNamara, D. (2004). SERT: Self-explanation reading training. Discourse Processes, 38(1), 1–30 发现自我解释对推理问题和高领域知识的学生影响不大,而 McNamara, D. S., O’Reilly, T. P., Best, R. M., & Ozuru, Y. (2006). Improving Adolescent Students’ Reading Comprehension with iSTART. Journal of Educational Computing Research, 34(2), 147–171 则发现,自我解释训练只对熟练的阅读者在推理问题上的表现有所提升。
相关笔记:精细口头复述 (heavier on elaboration)
参考文献
-
起源
-
干预措施
-
McNamara, D. (2004). SERT: Self-explanation reading training. Discourse Processes, 38(1), 1–30
-
间接相关:
-
- (学生为文章撰写总结;为他们的总结提供反馈,然后学生根据反馈修改)
情境学习 - Lave and Wenger
原文:Situated Learning - Lave and Wenger (andymatuschak.org)
Lave, J., & Wenger, E. (1991). Situated learning: Legitimate peripheral participation. Cambridge University Press.
这是情境学习领域的经典著作。
论文的核心观点,简而言之:学习不应仅仅被理解为个体「获得知识」的过程,更应该看作学习者在实践共同体中参与度逐渐增加、身份逐步转变的过程,而这个共同体也会因他们的加入而发生改变。作者批评了那种脱离实际情境、抽象化的学习方式,他们坚持认为知识本质上是与我们在特定历史文化背景下的共同活动紧密相关的,具有情境性和社会性。他们特别强调「合法的边缘性参与」这一概念,认为这是理解学习的一个重要视角。这一理念突出了新手如何在共同体中逐步从边缘到核心地参与活动,通过与其他成员的互动协商意义,不断发展和最终转变自我身份及整个共同体。
通过一系列案例研究,他们在自己的理论与简单的学徒制之间的做出了清晰的划分:
-
学习有时候不需要显式的教学过程
-
学习更多是通过参与实践文化,而不是通过有针对性的「技能学习」
-
即便是作为共同体边缘成员,也能通过观察榜样和资深成员,学习到共同体的价值观、习惯和方式
-
师徒关系不必是正式的
-
新手可以向多位经验丰富的共同体成员学习,而不仅限于一个「大师」
-
学习不只在生产活动中发生
-
如果没有足够的合法性和边缘性,技能的掌握不一定会发生
-
学习者的动力很大程度上来自于能更深入地参与共同体,这本质上是一种身份的转变。
作者提出的一个我特别赞同的建议是,我们应该构建一种学习型课程(一个专门为开拓新实践而设的实践场域,完全从学习者的视角出发)这与传统的教学型课程(以教师为中心的知识传授资源)形成鲜明对比。
{学习型课程}:{一个专门为开拓新实践而设的实践场域,完全从学习者的视角出发}
有些观点对抽象知识的局限性批评过头了,几乎完全否定了认知主义的实证基础(我对 Anderson, J. R., Reder, L. M., & Simon, H. A. (1996). Situated Learning and Education. Educational Researcher, 25(4), 5–11 一文中的批评表示赞同)但我认为,这种视角非常有力,特别是在考虑到激励、意义和身份认同时;我认为,认知主义者对这些问题的关注远远不够。(见内驱调节的学习是自我实现的;外驱调节的学习是自我否定的)
在批评显式教学作为一种系统化、去个性化社会的工具的同时,这种观点与社会批判理论有很多相通之处,这一点在伊凡·伊里奇的《非学校化社会》中也有所体现。
与赋能环境重在推动所赋能的事不谋而合:
因此,提炼出谈论实践和在实践中谈论之间的差异是必要的。谈论本身就包括在实践中谈论(例如,交流正在进行的活动过程中必需的信息)和谈论实践(例如,故事、共同体知识)。在共享的实践内部,谈论的这两种形式都发挥着特定的作用:一方面,是从事、「聚焦」、转移注意力、促进协调等等;另一方面,是支持公共形态的记忆和反思,以及暗示成员身份等。(类似地,一旦谈论实践成为其自身实践的一个部分,它就同时包括两种类型的谈话,然而实践与谈论实践通常在某些方面被隔离开来)。那么,对新手来说,目的并非是从谈论中学习,以此来替代合法的边缘性参与,而是去学会谈论,以此作为合法的边缘性参与的关键。
问题
- 这是一段很好的雄辩:「参与的概念消解了智力活动与身体活动之间、沉思与投入之间、抽象与经验之间的对立:人、行动和世界是与所有的思考、言说、识知和学习中紧密结合的。」但这真的成立吗?适用于哪些领域?比如说,在抽象代数这个领域,这个观点真的管用吗?
一些关键摘录
对「内化」这一概念的精彩批评,我发现自己常用它来替代「记忆」和「理解」:
传统的解释将学习视作一个过程,学习者通过这一过程内化知识,无论知识是被「发现」的,还是由他人「传递」的,或者是在与他人的「交互中体验」到的。这种对内化的关注并没有遗忘学习者、世界以及二者之间未被揭示的关系的本性;但它只能反映与这些问题有关的意义深远的假设。该观点在内在和外在之间采用了鲜明的「二分法」,表明知识大部分是属于脑的并把个体看作毋庸置疑的分析单位。此外,作为内化的学习还很容易被解释为毫无疑问的吸收既定知识的过程,被看成一个传递和同化的问题。
作为社会实践的一个方面,学习包括的是完整的人;这不仅暗示着与特定活动的关系,还暗示着与社会共同体的关系——即意味着要变成一个充分的参与者、一个成员、一种类型的人。在这种观点中,学习只是部分地、经常还是附带地,暗示变得有能力进人新的活动,有能力履行新任务和发挥新功能,有能力掌握新的理解。活动、任务、功能以及理解力是不能孤立存在的;它们是更为广泛的关系体系的一部分,在这些关系中它们有着各自的意义。这些关系体系产生于社会共同体,并在其中得到再生产和发展,这些社会共同体部分地是人们的关系体系。人受限于同时也限制着这些关系。就这些关系体系所允许的可能性而言,学习意味着成为另一个人。忽略了学习的这个方面就会忽略学习包括身份建构这个事实。
学校教育的问题,从其最基本的层次上,并不是教学的问题。这些问题首先与成人共同体自身再生产的方式有关,与在这样的共同体中新手能否找到一定的空间有关,还与在新手和共同体的政治文化生活之间是否能够建立起一定的关系有关。
这些类别(「抽象」与「具体」)既不以知识的不同形式存在于世界中,也并不反映实践者的知识形式的一些假定等级、而是起源于由于隔离而产生的新实践的本质。这种意义上的「抽象性」,其根源在于脱离了一种具体的文化实践。(第 104 页)
问:作者如何反驳「抽象与具体」的二分法?
答:抽象并不是知识本身的特性,而是因为与真实操作活动脱节而产生的结果。换句话说,当这些理念扎根于实际操作时,它们就跟「具体」的理念一样实在。
在学徒制的经验性研究中,像「内部奖励」这样的概念很狹隘地把注意力放在作为所学活动任务的知识和技能上。这样的知识当然是重要的、但是参与的价值对共同体和学习者来说,更深层次的意义在于「成为」共同体中的一员。
当不断加深参与的过程不是学习的基本动机时,这通常是因为「说教式的管教者」承担了激勋新手的责任。在这种情况下,关注的焦点从实践中的共同参与转移到改造人的活动中。
…
第二,如果没有包含新手所参与的活动的文化身份,没有为学习提供的成熟实践领域,那么,交换价值就会取代不断加深的参与的使用价值。学习的商品化在学习成果的使用价值和交换价值之间造成了一个基本矛盾,这一矛盾在学习知识和学习为了评价而展示知识之间的冲突中表现无遗。普通学校和职业学校中的考试(在学徒制学习的情境中是没有必要的),可能是建立知识交换价值之途径的最普遍、最突出的范例。那么,应试就成了一种新的、以提升学习的交换价值为目的的寄生活动,而这一切与学习的使用价值无关。
游戏中的技能培养服从于其他有内在意义的目的
游戏能有效地培养玩家的技能,但这并不是游戏体验的重点:这些技能对于有内在意义的目的——审美、社交、叙事等——是附带的。真正的目的是审美的,而不是实用的:游戏是审美的行动媒介。而审美观通常由“寻找乐趣”引导。
技能培养是实现这些目的的一种手段:我想学习如何飞行,因为它很美。技能培养也是这些目的的自然副产品:我变得更擅长飞行,因为环境中有我难以到达的平台。
教育游戏的设计者忽略了这一点,而将技能培养本身作为首要目的。有时玩家会表现出一些名义上的目的(「打破高分!」),但这只是一层一戳即破的梦幻泡影;这显然不是设计师的首要考虑因素。这些游戏颠覆了它们自己的目标:教育游戏对于创造赋能环境是注定失败的方法。
参考文献
Bret Victor 的电子邮件,2015/03/19。回复:具有负重教育功能的玩具
我认为你的想法绝对是正确的,用「负重」的概念来思考活动。但我认为,过度关注「我们是否在教授这些概念,孩子们是否在学习这些概念」会导致居高临下的设计,既不有趣,也没有教育意义。
也许相反,在设计活动时,概念承载着重量,但专注于使活动本身对设计师和玩家来说有趣和快乐。问问自己:「我自己喜欢玩这个吗?」并相信玩家,通过花几个小时接触这些概念,会获得熟悉,然后是流利,然后是理解,这很难明确地设计出来。
发展技能需要挑战稳态
原文:Skill development requires challenging homeostasis
为了让肌肉更强壮,你必须要挑战身体的稳态机制,超越稳态一般所能补偿的范围,直到身体增强肌肉力量来重新建立稳态。我们的神经结构似乎有类似的应对机制,会调整网络之间的连接,使得经常使用的连接路线更畅通 (Barnes and Finnerty, 2010)。
因此,如果你有志于发展一项技能,你便需要挑战这种稳态。超越目前的舒适区,进入「新常态」后,身体便会有所回应,让新的状态易于接受。此时,「新常态」将成为新的稳态点,所以为了继续成长,你便要再接再厉,砥砺前行。见目的明确的练习,术语来自 Ericsson和 Pool。
停止挑战稳态后是否会退步?
{Woollett 等人} ({2009}) 发现,退休的伦敦出租车司机在导航任务上{比全职的伦敦出租车司机表现差,但相比对照组的司机表现更好}。
参考文献
Barnes, S. J., & Finnerty, G. T. (2010). 感官体验和大脑皮质重塑. The Neuroscientist, 16(2), 186-198. https://doi.org/10.1177/1073858409343961
Ericsson, A., & Pool, R. (2016). 尖峰:来自关于专业的新科学的秘密 (第 1 版)Eamon Dolan/Houghton Mifflin Harcourt。Peak - Ericsson and Pool
熟练的阅读通常是非线性的
原文:Skillful reading is generally non-linear (andymatuschak.org)
书籍的结构几乎总是高度线性的,书籍这一媒介本身的形式也鼓励读者线性地阅读文本。但掌握阅读技巧的读者很少以线性方式阅读——他们要么带着目的阅读,寻找书中能帮他们解决问题的内容;要么在第一次阅读时理解这本书的结构(见检视阅读);或者从索引开始,只关注其中最重要的段落。
McCutcheon(2015)有一个有趣的反面观点:
古代作者将卷轴的线性特点作为文本解释中的一个维度(译者注:古代的西方解释学即是解释神话、圣经、法典等的技艺之学)。他们在卷轴上写就的诗集没有明确的线索来串连一首首诗歌,但是卷轴的特点迫使读者对内容变化做出解释,因为他们必须以线性方式来阅读诗集。
参考文献
Edwards, P. N. (2005). How to Read a Book.
阅读这类书籍的目的是获得信息。此时干脆利落地找出事由主因才是主要目标。因此,除非你被困在监狱里无事可做,否则千万不要从头到尾读非虚构类书籍。
为获取信息而阅读时,你更应该始终跳在前面,跳来跳去,并使用一切可用的策略来发现,然后是理解,最后是记住作者要表达的内容。这样便能在最短的时间里从书中汲取最多的营养。
McCutcheon, R. W. (2015). Silent Reading in Antiquity and the Future History of the Book. Book History, 18(1), 1–32. https://doi.org/10.1353/bh.2015.0011
软件界面经常将破坏性操作作为最终决定,而不是视情况而定的选择
收件箱需要可靠的清空流程才有效,而通常这需要积极地放弃较低优先级的项目。一些例子:
-
将低优先级的电子邮件归档,以保持收件箱的可读性
-
丢弃掉队的待办事项
-
关闭一厢情愿的浏览器标签,以保持浏览器界面的可管理性
-
删掉你的下载文件夹里的那些长期未读的 PDF 文件
这些行动都让人感到沉重,因为它们是破坏性的。当然,如果你关闭标签,你总是可以在以后重新打开它,但你总是害怕如果你关闭它,那你就再也看不到它了。
这种破坏性的行动往往不符合我们的实际意思。我们的意思往往是:如果我在下周有一个轻松的日子(即如果流入率很低),或者如果我在接下来的几个晚上有时间(即如果我暂时增加流出率),我会打开来看看......否则我就不会了。我现在打开的其他标签要重要得多。
同样,如果你正在修改一篇文章,你可能会纠结于一个有趣的段落,但它其实并不属于那里。删除段落会给人一种破坏性的感觉,如果你把它移到一个「墓地」区域,你就不相信你会再看到它。
典型的软件系统是过于正式的。它们坚持最终性,尽管它们的用户通常是以相对的偏好来思考的,这取决于环境。另一方面,明确重申「优先权」和「背景」的系统通常过于繁琐,无法使用。我们需要一个更好的「核心动词」。一个可能的解决方案的例子:间隔重复可以降低破坏性的收件箱维护操作的风险。
参考文献
Matuschak, A. (2019, December). Taking knowledge work seriously. Presented at the Stripe Convergence, San Francisco.
一些“教育”活动的目标有其内在意义
原文:Some “educational” activities have intrinsically meaningful purposes (andymatuschak.org)
绝大多数教育活动主要聚焦于学习结果,这种聚焦违逆了这些活动本身的目的(教育计划往往会自我颠覆,相比之下,赋能环境中的活动直接服务于有内在意义的目的)。
但并非所有名义上的教育环境都有这种问题。例如,与主治医生一起查房的医学生,虽然支付了学费,也学到了很多东西,但是,「查房的主要目的是照顾患者」。即使他们的主治医师在做一些他们称之为「教学」的事情——提出问题并给出背景理论等,但所谓这种教学的主要目的,依然是提供优质的患者护理,不仅在主治医生询问问题的时候,还有之后医学生逐渐承担更多责任的时候。
已有的「教育」活动,很难对其加以修改,以服务于另一个内在有意义的目标。文化价值观和框架将其锁定,难以挣脱。
一些创新洞察依赖于长期记忆
原文:Some kinds of creative insight depend on long-term memory (andymatuschak.org)
如果一次创造性的飞跃需要你发现某个刺激中不同寻常的联系、巧合或矛盾,仅靠查找所需信息往往是不够的。关键的创新洞察往往在于你意识到应该查找特定内容。这通常只有在你的长期记忆中已经储存了相关的要素,并且这些要素编码得足够灵活,你才能够从眼前的刺激跳转到那个过往的想法。
参考文献
https://twitter.com/sashachapin/status/1281417199568080896
机械记忆实际上能增强创造力,更多人应该在更多领域花更多时间进行机械记忆
考虑到创造力很大程度上是对素材的重新组合和利用,因此拥有更多的知识素材确实有助于创新
认为记忆大量信息会妨碍「批判性思维」是一种明显的误解,这种观点在很多方面都是错误的
Nielsen, M. (2018). Augmenting Long-term Memory. http://augmentingcognition.com/ltm.html
我没有搞清楚怎么将创造性工作时的笔记和 Anki 集成起来。我没法用 Anki 代替笔记,太慢了,而且很多东西并不适合占用我的长期记忆。另一方面,Anki 重要条目也会带来诸多好处 —— 对记忆的流畅读取是很多创意想法的基础。
我相信,联想思维的速度对于创造性工作很重要。– John Littlewood
实践中,我会凭直觉非系统化地将一些东西作为笔记,另一些作为 Anki 问题,还有一些两者都做。总体上效果不错,但是我觉得如果能应用一些更系统化的思考和试验会更好。部分原因是归根结底我根本没有很好的笔记系统。如果这个问题解决了,我猜整个事情会变得更好。不过,就目前而言,这种方法还算凑合。
Klein - Seeing What Others Don’t (2013)
有些成果只有在非常高的工作强度下才能实现
原文:Some outcomes are only achievable when working with very high intensity (andymatuschak.org)
我有个想得不太透彻的想法,就是对于项目而言,短时间高强度的工作方式,不等同于时间拉长,压力更小的工作方式。如果苹果公司在每个 iOS 版本上花两年的时间而不是一年,最终产物会截然不同,并且有些方面会改进,有些方面则更差。
Rob Ochshorn 指出,建筑专业的学生会等到项目截止的前一晚才开始设计。不是他们拖延或犯懒:等待的过程让他们有充分的时间来思考、画草图。将要截止前时间所剩无几,他们不能再费时间斟酌概念,而能专注于执行。这也许与过早扩大系统规模有碍于系统迭代有关。
我在苹果公司任职时发现,对于打磨质量的问题,如果要按流程归档后提交到 Radar 系统*,这个问题永远不会得到解决。项目管理部要拍板发布时间点,而此时问题往往依然存在,但之后又要编写新功能(就没空解决这个问题)。这样的问题最好「当即」解决。这样工作强度会增大。Chris Beiser 总结为:「无关紧要,现在做好」。(*译注: Radar 系统是苹果公司的内部 Bug 管理系统)
隐约有点关系:有效的深度工作取决于时间和强度
问:建筑学专业的学生会等到项目截止的前一晚才开始设计。根据 Rob Ochshorn,什么因素可以解释这个现象?
答:他们在「迟绑定(late binding)」,在付诸实物设计前花更多时间来斟酌概念。
绝对判断广度
原文:Span of absolute judgment (andymatuschak.org)
人们难以准确识别单维刺激物的绝对数量。例如,假设我在只有 0 和 100 标签的数线上标记一个点。然后我让你估计这个标记点对应的数字。你的答案与真实位置相差多少?
换一种说法,你能可靠地区分多少个类别?如果我可以选择 0-100 中的任何一个数字,你可能不会预计得那么准确,但如果我只能选择 20、40、60 和 80,你的答案可能会完全相关。我们可以慢慢增加可能的选择数量,找到人们不能可靠地区分任何额外类别的界限。我们还可以对其他刺激重复同样的实验,比如声音的响度或音调,或者盐水的浓度,或者颜色的色调。
{ Miller }(1956 年)称这个阈值为绝对判断广度,他的文献回顾表明,这个阈值在{ 七 }左右,在不同的刺激类型中变化很小,令人惊讶。
这个数量很重要,因为它代表了人类信息处理的基本限制:人类作为信息处理者的通道能力
问:Miller 的绝对判断广度描述了哪些类型的刺激?
答:一维量级
问:绝对判断广度变化的大致数量级是什么?
答:10^0
问:为说明某人对某刺激的绝对判断广度,可以做什么实验,举个例子。
问:人类只能可靠地将一个刺激(如盐水浓度)区分为大约 7 个不同的单维量级。Miller(1956)把这个极限称为什么?
问:绝对判断广度
参考文献
Miller , G. A. (1956). The magical number seven, plus or minus two: Some limits on our capacity for processing information. Psychological Review, 63(2), 81–97. https://doi.org/10.1037/h0043158 Miller - The magical number seven, plus or minus two
软件开发和研究思维之间的转换成本很高
原文:Switching costs are high between software development and research thinking (andymatuschak.org)
深度软件开发和深度研究思考的思维状态是相互排斥的。更糟的是:至少在我的经验中,在这两种思维状态之间切换的成本相当高。我尝试将一天甚至一周划分为「建造」和「思考」时间,但并不是很成功。这使得「摸石头过河」特别困难,反之实践出洞见时,建议摸石头过河而不是先画蓝图。
标签是无效的关联结构
原文:Tags are an ineffective association structure (andymatuschak.org)
标签是将性质不同的项目联系起来的简单方法,但用以描述关系的话,信息量就太低了。
所有标记上特定标签的卡片,都显示为是相关的......但很难看出是怎样的关系。这些卡片只是混乱无序的列表。
其中一些卡片比其他卡片与特定标签的主题更相关,所以我们应该优先选择明确的关联,而不是推断的关联。
其中一些卡片只有几个句子是和标签有关的,但该标签却与整体卡片相关联。我们应该倾向于使用细粒度的关联。与此相关的是,标签往往相当模糊或宽泛。更好的方法是更精确地链接到关联想法。
而且有时候,如果能标注一点上下文,描述「为什么」某个卡片是和标记上的标签有关的,就更好了。我们应该倾向于有标记的关联。
教材的习题集并不善于检测阅读理解问题
原文:Textbook problem sets aren’t great reading comprehension checks (andymatuschak.org)
虽然习题集能够帮助你评价自己对材料解释的理解程度,但它们在发现和改善阅读理解方面的问题时,效果并不理想。
我学习《线性代数》- Hefferon时发现的一些要点:
-
糟糕的失败模式。有时我感到被问题卡住,但当时会不确定这种卡住,是因为没利用好知识,还是遗漏了正文里关键的点。由于一般情况下,如果理解上没问题,那么缺的只是硬啃的努力。所以我就会想,是不是我得再加把劲。结果,我就在问题上乱搞一气不得其法。这样做毫无建设性,因为我根本就缺少某个关键信息。麻烦在于,自己处于什么情况往往我是不清楚的。要弥补理解的缺口,一般最有效的方法就是重新看一遍文中的某个解释。但就算有答案手册在旁边,我也不清楚应该注意哪一部分。在这种情况下,我只能整个章节重新翻阅,看能不能找到可能有用的点。这种失败的模式,大概是个普遍问题,因此用习题来检查理解程度并不总是那么准确。
-
覆盖的有偏性:在读完一个章节后,你通常能学到某条定理成立的事实,为何成立,以及为什么它有意义。习题主要强调应用、分析和综合,所以它们通常考察的是你是否理解了某条定理成立,而对其他方面则关注较少。以线性系统为例,书里讲述了线性系统的解,可以由一个特定解配上一组与之相关的齐次系统的解的线性组合来表示。章节大部分内容都在证明这个定理和它的一些派生含义。但没有一个习题检查了我是否理解了证明,对这个定理解释性的部分也仅仅触及皮毛。后来我自测看能不能解释这个证明,才意识到我没理解一个关键步骤,尽管我成功地完成了习题集。
- 有人可能会说,这仅是教材的一个不足——习题集应该全方位地考察你对该章节所有内容的理解。但我想,习题天然就该偏向于检查对一类内容的理解,而不考虑另一类,这是它的内禀属性。如果强行违背这天然的粒度,最后产生的东西可能就不再是我们通常说的习题了。
-
哪些题目覆盖新的点?哪些是重复?有的题外观上看起来差不多,内里别出心裁,做起来感到对学过的内容不同角度出击。但有时候,相似的题目只是为了多练几遍,提高娴熟度。有时我觉得没必要再解一道线性方程组:我感觉自己已经炉火纯青了!但有的题目其实有点细微的差异,检查的是新的理解点。所以,我没有放过任何一道小题,但其中许多我都觉得没有必要。换个说法:这些重复的练习应该「分散」到未来几周里,以促进长期记忆。而我并不想推迟对理解的检验。
-
**答对了,但没领会精髓。**有几次,题目就是这么设计的,按照书里讲的某个规律一步到位就能解出来。我虽然解出了答案,但却没抓住问题的核心。要察觉到这一点,光对答案是不够的,还得重新推敲一下解题步骤,看看跟自己有什么不同,特别是在关键的地方。
最好的阅读方式是高度语境化的
原文:The best way to read is highly contextual (andymatuschak.org)
一本书应该如何阅读,在很大程度上取决于这本书、读者和背景。你读的有些文本基本上只是为了娱乐;有些文本你会跳过,只挑重点(熟练的阅读通常是非线性的);有些文本你会想深入地内化(例如写你所读,以求内化)。这种差异有些是由作品本身导致的,但大部分取决于你读书时的动机和感受。
正如 Adler 和 van Doren 所言:「每本书的阅读速度不应慢于它所值得的速度,也不应超过能让你理解、带给你满足感的速度。」(第 43 页)我发现这在实践中非常难做到!这需要积极的监督和自我控制,根据我当时的注意力和理解力来调整速度。
数字化阅读体验往往不能让人认识到这种灵活性,反而强化了线性、完成主义阅读的隐性预设。
参考文献
Adler, M., & van Doren, C. (1972). How to Read a Book. Simon & Schuster, Inc.
认知革命
{二十世纪中叶},许多学者指出了行为主义的局限性:行为依赖于{不可观测到的内在现象},如{记忆和信念}等。行为主义者认为{这些现象是主观的},而不将其纳入实验中。
心理学家开始研究这些内在现象。他们使用了先验方法和借鉴自计算机科学的思想,最终发展出认知心理学,并奠定了认知主义的理论框架。
促成认知革命的关键因素
{Edward Tolman} 1948 年进行的大鼠实验证明了{知识}在行为中的作用。他{让大鼠探索迷宫数天},之后{在迷宫中放置食物}来进行测试。他观察到{大鼠能够立即找到迷宫中的食物},说明大鼠已经习得了「{认知地图}」。然而行为主义理论认为,学习是{行为变化},因而难以解释这种现象。
B. F. Skinner 的著作《言语行为》(1957年) 主张语言可以通过{操作性条件反射}学习。{Noam Chomsky} 发表了一篇尖锐的批判,指出{孩童生成言语时,有些言语是孩子从未听过,或者从未因此而受奖赏过的}。
Frederic Bartlett 的实验表明,人们通过他称为「图式」的心理框架来解释他们的经历。
计算机技术激荡起新的一波心理学理论,不少都应用了信息处理的隐喻:如缓冲区、门、事件处理等等。
答:它解决了一个重要的悖论:理解行为必须去理解内在现象,然而内在现象无法直接观测到。
我的生产力的关键是,我需要在早上完成高度专注的创造活动
关于提高工作效率的建议有很多。很多人写了不少博客,来描述他们如何通过特殊日志和笔记系统来优化工作,你可能要花几个月的时间阅读这些博客。我花了大量时间来计算和优化我每天的日程安排,试图挤出多一点工作时间。毫无疑问,这些方法都是有用的,对于某些类型的工作,它们可能是最重要的。但我的经验告诉我,真正决定我是否度过了「好工作日」的因素只有一个。如果我早上能坐在桌前连续工作四小时,并设法「沉浸」于某个创意项目,高度集中,思考清晰,我这一天在创意上就是有不错成效的。如果我思绪分散,从未专注于任何特定问题,那么无论我如何「优化」我一天的剩余时间,这一天在创意上就很难取得多少进展。
首先要解决的问题是始终空出早晨日程,确保我有连续的 4-5 小时的工作时间。这(对我来说)很容易做到。当然,下一个明显的障碍是:在我的电脑上屏蔽分散注意力的东西。「生产力黑客」经常谈论这个办法,也确实有帮助,只要不要过于死板。此外,写作练习有助于我明确项目及其目标,这样当我坐在桌子前时,我能对接下来的安排有更清晰的看法。
然而,我仍然发现很多时候,我会坐在桌子前工作 4 个小时,但从未真正投入到任何特定的创意工作中。这并不是因为我查看推特或电子邮件,犯了这样明显的错误。只是因为我会在各种问题之间跳来跳去,从未全身心投入到任何一个问题,或者我会发现自己解决了一些容易着手但实际上并不重要的问题,或者我的思绪会游离。或者我会感到迟钝。这是个问题,因为有效的深度工作不仅取决于时间,还取决于强度。
冥想确实有帮助:创意工作中的迟钝和分心,可能与冥想中的类似现象有相同原因。关键似乎在于持续审查自己的思考状态。这同样有助于变得好奇和变得好玩。我观察到,部分原因在于缺乏练习。我很多年都在从事极其任务导向的工作。而不断投身于更具挑战性的创意工作的过程,某种意义上是适应迷茫,并在迷茫中取得进展的过程。深度研究需要比技术行业具备更慢的节奏
相关笔记:倾听自己的想法很难。
我所认识的高效阅读者和思想家在阅读时不做笔记
原文:The most effective readers and thinkers I know don’t take notes when reading (andymatuschak.org)
他们当中有些人阅读时做的事很简单——在后页记下一些关键的参考资料,或者偶尔在边角上写东西——但他们都没有一套持续坚持的阅读习惯,如写你所读,以求内化中描述的做法。他们并不是把这些习惯内化于心,行云流水,所以毫无痕迹:他们只是不干这些事情。
不过他们都是专家级的阅读者,各有各的做法。他们阅读有目的;他们会交流所读的内容;他们会把收获用在创意项目中。所以他们比其他阅读者更加高效是有原因的。
事实上,与此相反的说法似乎是正确的:大多数狂热于记笔记的人似乎实际上是相当低效的思考者。由此看来,写你所读,以求内化也许很重要,但还是值得商榷。我怀疑这里的关键问题是「更好地记笔记」这个描述太过流于表面;核心在于「更好地思考」;这类人只关注「更好地记笔记」。对笔记写作大谈特谈的人很少有严肃的使用场景。
虽然如此:许多杰出的思想家需要借助书写界面来思考。
参考文献
复习环节能为卡片写作提供多少反馈?
原文:To what extent do review sessions offer prompt-writing feedback?
写好间隔重复记忆卡片很难,但在此之上,意识到编写好卡片很难这件事,对许多新手也是挑战,因为根本没有足够的反馈机制。
了解制作好卡片的要素之后,复习时若能专心致志、勤于思考,在复习环节中还是可以获得一些反馈的——不过改正卡片所需的知识就不一定能得到了。
Cedric Chin 谈到(2020-11-05):
我第一次在 Orbit 上复习时,你说过的卡片的错误写法突然都出现在我的脑海中。我基本上需要删掉我的大部分卡片然后重做。
卓越的能力在多大程度上是可以遗传的?
原文:To what extent is exceptional ability heritable? (andymatuschak.org)
先天后天?
这个主题往往是相当政治化的——很难找到关于这个问题的公正的文章。我们大多只能体现松散的指标,但要注意被测量的东西和被声称的东西之间的区别。例如,Ericsson 等人(1993 年,第 364-365 页)提出了能力测试和专业知识之间的种种无关联性,但这与证明遗传性完全不一样。
-
超常能力可能与人格特质相关(这在一定程度上是可以遗传的)
-
身体素质,如身高和肌肉密度,是可以遗传的,所以卓越的运动能力至少是可以部分遗传的。
-
能力上的微小遗传差异可能导致儿童时期自然表现更好,这可能导致更多练习,形成良性循环(Ericsson 等人认为,1993 年;Coyle 的核心论文,2009 年)。
Ericsson 等人认为(1993 年,第 365 页):卓越的表现不具有普遍性——获得的知识和技能对专业知识很重要——卓越的能力不具有遗传性。我认为这不成立,因为可遗传的特质可以帮助人们更有效地获得不可转移的技能。
相关笔记:成长性思维
问:对于「天赋不能用遗传性状来解释」的一般看法,有哪一类重要的例外情况?
答:体育:身高、肌肉纤维类型分布和其他高度相关的性状是可遗传的。
问:能力上微小的可遗传变异如何被放大为成人专业知识上的巨大差异?
答:由于某些可遗传的特质,一个孩子可能在没有训练的情况下表现得更好,这可能会导向更多练习,因此更加专业。
参考文献
Coyle, D. (2009). The Talent Code. Bantam Books.
Ericsson, K. A., Krampe, R. T., & Tesch-Römer, C. (1993). The role of deliberate practice in the acquisition of expert performance. Psychological Review, 100(3), 363. Ericsson et al - The Role of Deliberate Practice in the Acquisition of Expert Performance
超验叙事
原文:Transcendental narrative (andymatuschak.org)
传奇、惯例、价值观——这些超验叙事构架了我们的生活,并赋予它意义。这种叙事告诉我们做什么才是有价值的,人与人之间应当如何相处(译者注:如:爱你的邻人)。这种东西通常源于宗教,不过却也可以在世俗生活中发现,如:
-
植根于「精神」性的东西:冥想、瑜伽、占星术
-
来源于政治:马克思主义、客观主义、觉醒主义
-
来源于哲学社会科学:斯多葛主义、浪漫主义、海德格尔和朋友
-
来源于科学哲学:David Deutsch、Carl Sagan、Steven Pinker、Bret Victor
这是由尼尔·波兹曼(译注:《娱乐至死》的作者)在教育的终结中首创的术语。
相关笔记:活着的意义
参考文献
https://github.com/mnielsen/tpft/blob/master/big_picture.md
放眼于历史,几乎所有文化都会有一种主导性的超验叙事。它在我们文化中的体现,往往是新教职业伦理的遗留,比如:你若是在学校取得好成绩,便能在一流大学中学习,而后取得一份收入丰厚、备受尊重的工作,为社会奉献自己的力量。畅想这种叙事会被如何取代,令人兴趣盎然。Paul Graham 曾试图在一定程度上取代这种叙事。《指南》在某些方面试图灌输它。由于 Nell 自己并没有这种东西,所以它确实对 Nell 有很大的影响。换一种更准确的说法,它打开了通往许多意义的大门。这引发了我的一个想法:我们有没有可能共同去构建一个更强大的超验叙事?
当我们还只有几十万年历史时,便建造了石阵、水钟。
后来,有人锻造了一个铁弹簧。
发条从此启动。
地球在我们的想象中被画上网格线。
大教堂就像寻找灵魂的机器;入眠之人的梦境交织着钟楼的钟声。
你看;所以我们一直在前往这个应许之地——乌有之乡——但它是真的。
表象是我们的天性:我们生来就在表象,只有我们创造了地图。
如果我们的弱点是把日历上鲜艳血腥的颜色与真实的天气联系起来,把地图上的羊皮纸领土与我们面前的土地联系起来——那根本不算弱点。
我们一直在前往这个应许之地——乌有之乡——但它是真的。
— William Gibson ,摘自《记忆宫殿》,纪录片《这些领土没有地图》的结尾。
(via 2020-04-16 email from Amir Ebrahimi: Memory Palace)
嵌入功能受数据模型的可组合性限制
原文:Transclusion is limited by the data model’s composability
维基百科上可以将一篇文章的小节嵌入到另一篇文章中。Xanadu 支持将任意文本块嵌入到文档中。Roamresearch 中则支持将大纲笔记的一部分嵌入到其他笔记中。嵌入功能的表达能力在很大程度上取决于可嵌入对象的可组合性。
在上面的所有示例中,所要嵌入的对象不是都能随意组合的!随意找段文本,它不一定在其他地方都能可用:好的散文依赖于线索、叙事和上下文。文本嵌入几乎总是不连贯的。我担心,大多数系统设计者对这种方法感到兴奋,只是喜欢这种技术可能性,而不是着眼于嵌入功能助益写作或者沟通。
Figma 的「组件」是一个有趣的例子,展现了什么时候嵌入功能可以派上用场。视觉元素通常可以重用于多种不同的情景,特别是部分参数化的视觉元素。
问:举一个嵌入功能行得通的例子?
答:Figma 设计组件
问:为什么文本嵌入经常会产生不连贯的文本?
答:随意拿出一段句子、段落或文本选段,放在其他上下文中,一般都读不通。它们不是可重用的文本块,而高度依赖于前面的行文。
迁移恰当加工
原文:Transfer-appropriate processing (andymatuschak.org)
{迁移恰当加工}:当{提取涉及的加工类型与编码涉及的加工类型匹配}时,信息回忆得更好(e.g. Morris et al, 1977)
-
A Systematic Review of Applied Research in Schools and Classrooms. Educational Psychology Review.
的研究发现,当提取练习的模式(多项选择,简答题)与测试的模式匹配时,提取练习的效果最大——不匹配的模式可能会使效应量减半。
- 但话说回来:谁在乎呢?考试不是最重要的,真正的能力才是最重要的。那么,如果我们在真实设定下查看迁移学习的结果,我们是否能发现在提取练习中加入异质的模式有更好的结果?这些更好的结果是否抵得上多项选择的经验/作者成本?例如:见自主评分的间隔重复记忆系统比机器评分的系统更有效率
-
实验 1 发现在延迟事实测验中,高阶问题的提取练习与重新学习条件下的提取练习没有区别;在延迟高阶测验中,事实问题的提取练习也是如此。
-
总而言之,初始的提取练习增强了最终测试表现,但仅当初始测验类型(事实或高阶)与最终测试类型(分别为事实或高阶)匹配时。
-
其他两个实验与这一发现大致一致。
-
问:Morris 等人(1977)是如何证明迁移恰当加工的?
答:编码任务包括语义分析或押韵测试;识别任务要么涉及,要么不涉及押韵。编码任务和识别任务类型匹配时,表现最好。
问:迁移恰当加工的反直觉发现是什么(Morris 等人,1977)?
问:当识别任务也涉及押韵时,押韵(即低加工深度)的习得任务比语义习得任务表现得更好。
典型的工作和表现环境不符合刻意练习的要求
原文:Typical work and performance environments don’t constitute deliberate practice (andymatuschak.org)
有效的刻意练习,来自 Ericsson为学生提供重点重复的机会。在一场棒球赛中,一名击球手可能只有十几次挥棒的机会,而与专业教练合作的击球手每天可能遇到数百次投球。更好的是:这些投球可能都是为了利用特定的弱点而设计的(Ericsson 等人,1993 年,第 368 页)。
由于发展技能需要挑战稳态,在刻意练习中,失败一定很常见。但典型的工作和表现环境很少能容忍高失败率。钢琴家无法通过安排更多的独奏会来练习指法:他很快就会被逐出巡回演出。
参考文献
Ericsson, K. A., Krampe, R. T., & Tesch-Römer, C. (1993). The role of deliberate practice in the acquisition of expert performance. Psychological Review, 100(3), 363. Ericsson et al - The Role of Deliberate Practice in the Acquisition of Expert Performance
2022-03-31 Patreon update - Implicit practice - a sight reading parable
理解概念需与其尽力较量
原文:Understanding requires effortful engagement (andymatuschak.org)
如果你想真正理解一个 idea,你必须与之斗争。
你不能只是读一些东西,听一节课,或在谈话中听一个概念。你得想:这在哪里适用,在哪里不适用?其含义是什么?假设是什么?这里代表的是谁的观点?这否定了什么?
正如斯蒂芬 · 考斯林特别指出的那样,
第一条格言是「思考清楚」。其关键思想非常简单:你越是把事情想清楚,越是注意你正在做的事情,你就越可能记住它。
这个概念是 #e/建构主义 的一个核心思想,这也回答了为什么传授主义不起作用。
还有叔本华:
我们读书时,是别人在代替我们思想,我们只不过重复他的思想活动的过程而已。......读书越多,留存在脑中的东西越少,两者适成反比,读书多,他的脑海就像一块密密麻麻、重重叠叠、涂抹再涂抹的黑板一样。读书而不加以思考,决不会有心得,即使稍有印象,也浅薄而不生根,大抵在不久后又会淡忘丧失。以人的身体而论,我们所吃的东西只有五十分之一能被吸收,其余的东西,则因呼吸、蒸发等等作用而消耗掉。精神方面的营养亦同。
Grant Sanderson (2019-11-28):
你需要与想法进行眼神交流。
参考文献
Kosslyn, S. M. (2017). The Science of Learning: Mechanisms and Principles. In S. M. Kosslyn & B. Nelson (Eds.), Building the Intentional University: Minerva and the Future of Higher Education (1 edition, pp. 149–164). Cambridge, MA: The MIT Press.
Schopenhauer, A. (2015). On reading and books. In C. Janaway (Ed.), & A. Del Caro (Trans.), Parerga and Paralipomena: Short Philosophical Essays (Vol. 2). https://doi.org/10.1017/CBO9781139016889 (Original work published 1851)
在工作之外的不专注,会损害工作时的注意力
原文:Unskillful attention outside of work hours harms attention during work hours (andymatuschak.org)
我们通常会在工作日里努力集中精神,然后下班后就放松。毕竟你已经疲惫不堪,那么刷刷推特又会有什么害处呢?这似乎能帮助你休息和放松。
但根据我的经验,这其实并不正确。保持专注是一种生活状态。要进入和退出这种状态都很难。Newport 指出,如果在工作之外的时间里不注意维持专注,可能会「训练」我们的大脑去寻求即时满足,而不是深度思考。这与冥想中的全天候「娴熟思考」理念是一致的,不仅限于冥想时。
我的一个具体体会是:如果我在番茄工作法的 5 分钟休息时间里上网,会让我感觉每个番茄钟都重制了我的专注深度。但如果我避免认知切换(只是简单伸伸腿、喝点水等),那么专注深度会延续到下一个番茄钟继续积累。
参考文献
Craig Mod, Offscreen Magazine interview:
如果我一醒来就碰手机,我就已经失去了好几个小时。并不是因为我要在社交媒体上刷上几个小时,而是因为我的思维已经被扰乱,变得不再平静,而要重新切换回深思熟虑的状态可能需要整个上午的时间。换句话说,我的大脑中上瘾的那部分接管了控制权,破坏了我进行沉思的能力。我失去了投入到写作、编程或图像世界中的那种优雅。
Newport, C. (2016). Deep Work: Rules for Focused Success in a Distracted World. New York: Grand Central Publishing.
Pirsig, R. (1979). Zen and the art of motorcycle maintenance: an inquiry into values. Morrow.
有些人或许会问,「如果我避开这些陷阱,那么是否就表示万无一失了呢?」
答案当然是否定的,你仍然没有克服所有的问题。你必须要活得很正当,这样才容易避开这些陷阱,看到真正的事实。你想知道怎样画一张完美的画吗?很简单,你先让自己变得完美,然后再顺其自然地画出来,这就是所有专家的方式。画画和修理摩托车一样,都同你生活的其他方面密切相关。如果一周当中有六天你都很懒散,不去照顾你的摩托车,那么有什么方法能够使你在第七天突然变得敏锐起来呢?一切都是密切相关的。
但是如果你六天当中都很懒散,而第七天尽量变得警惕起来,那么很可能下个星期就不会像这个星期这样懒散了。我指出这些陷阱的目的,最主要的就是提供一个人活得正当的秘诀。
所以你要面对的真正的循环是你自己。看起来「在外」的机器和看起来「在内」的人并不是分离的,它们会一起亲近良质或者远离良质。
p. 332
问:如果我在使用番茄工作法时,在 5 分钟的休息时间里上网,会有什么后果?
答:会让我感觉每个番茄钟都重制了我的专注深度。但如果我避免认知切换(只是简单伸伸腿、喝点水等),那么专注深度会延续到下一个番茄钟继续积累。
使用笔记来避免先入为主的结论
原文:Use notes to avoid preconceived conclusions (andymatuschak.org)
在编辑手稿时,人们往往一开始脑中已经有了一个结论(或至少是一个角度),然后我们的写作或研究就着眼于支持这个想法。如果我们不够谨慎,那么这些先入为主的观念就会扭曲我们的思维。但是,如果我们一开始就从应该是原子化的常青笔记写起,我们就可以让结论和主题从我们的周密思考中自然涌现出来。
参考文献
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
从我们精心选定一个假设的那一刻起,大脑就会自动进入搜索模式,检索与假设相关的数据支持,这既不是好的学习方法,也不是好的研究方法。
许多学习指南都建议人们先选定好的假设或主题再开始写作,这种线性的过程是让确认偏见横行的万全之策。首先,基本上你在开始研究前就已经预设了立场,把你当下的理解定为结论而非起点,这导致之后的研究过程中你的认知都具有片面性。然后,你会在完成任务(寻找支持预设论点的论据)与产生洞见之间人为地引发利益冲突,将任何偏离预设计划的事物当作对项目成功的阻碍。这里有一个很好的经验法则:如果你的洞见对学术或写作的成功构成了威胁,那么你的做法就错了。
用手机来收集和分流,而不是(通常)用来阅读
原文:Use phones to collect and triage, not (usually) to read (andymatuschak.org)
因为围绕所读内容写笔记,以求深刻内化文本很重要,我们应该警惕手机阅读:这时候的心态和条件都不适合写作!
这可能很危险,因为在手机上阅读文章会让人感觉在做事,但知识工作应能聚沙成塔,而手机上的阅读大多不会。它大多只是为了娱乐。
在不得已时,我可以用我的在外出时为写作收件箱捕获的袖珍便笺在阅读手机时做笔记,但这需要一个平稳、水平的台面:否则我就需要一只手拿手机,一只手拿便笺,一只手拿笔。(*译注:人没有三只手,所以做不到。)
当我觉得很想在手机上详尽的阅读一些东西时,我应该通过使用为有潜在价值的参考引用建立一个阅读收件箱来闭合开环。这样就可以将之加入我的待办队列,然后继续前进。
参考文献
-
在阅读网页和 RSS 时记笔记 • Zettelkasten 方法
在 iPhone 上完整地阅读一篇文章是一种令人愉悦的消遣,但这并不是扩展我的知识的有效途径。因此,我会问自己:我想读些东西只是为了“教育娱乐”自己,还是以后需要用它来工作? 这个问题的答案决定了我是要阅读这篇文章还是只是略读和存档。
在我的手机上,我准备原料——也就是网页和动态资讯——以使之在我的知识管理系统中成为一个实际的东西。这就是阅读清单的作用。虽然我不能以合理的方式为我的档案做笔记,但我仍然可以决定我想为哪些文章做笔记。在这方面,我的 iPhone 相当于一个过滤网页和资讯的设备。
《模仿欲望》Luke Burgis
原文:Wanting - Luke Burgis (andymatuschak.org)
这本书浅显地介绍了 René Girard 的模仿理论。核心观点是,几乎所有人的行为都受到模仿循环的驱动,受到我们周围的那些榜样驱动。那些榜样可能是「名人」(如费曼、马斯克)或我们的同辈(同事、朋友、邻居)。
这种盲目的模仿往往让人无助地感到失去了独立选择的能力。比如,在苹果公司,我看到人们对理想生活方式的看法是由他们的同事定义的,在不经意间,他们互相竞争,拥有越来越奢华的爱好和玩具。这种负面的模仿循环在同辈之间尤为常见;当榜样是名人时,人们不会感到直接威胁,因为他们遥不可及。
然而,当有人模仿一种非竞争性的人际交往方式时,比如想要了解他人、培养他人、同情他人、帮助他人等,就有可能形成积极的循环。「这些领导者扩展了每个人的欲望宇宙,帮助他们去探索。」
书中还提到一个我认为被忽视但非常有价值的观点:我们应该担心社交媒体,不是因为它分散了我们的注意力或散播虚假信息——而是因为它歪曲了我们对欲望的感知。
危险的是无法认清榜样的本质。如果我们没有认清榜样,很容易和榜样陷入不健康的关係。他们会开始对我们造成过大的影响。我们常常对榜样产生异常的依恋却浑然不知。在许多情况下,榜样就是个人的祕密偶像。
你可能至少会关注几个对你的模仿欲望来说是不健康的榜样。那可能是相识的朋友,又或者是之前的同事,又或者只是某个你在社交媒体上关注的人物,甚至可能是你之前的同学,多年来你一直关注著他的职涯发展。你总想知道他们在做什么。你在乎他们的想法。你在乎他们想要什么。
与他们在你身上施加的力量保持距离是很重要的。取关他们,不要再去打听他们的消息。如果你之前每天都要去看他们的动态,那现在起至少要坚持一周不看。如果你以前每周看一次,那就改为至少一个月才看一次。
你是否注意到,目标具有一种无懈可击而不容置疑的地位?你想跑超级马拉松吗?人们会赞许你的决心。你想投入竞选?大家都会支持你。想卖掉自己的房子,住进面包车?酷,本质主义正在流行。没人会去质疑你的目标是对是错。
多产的作家兼特拉普派僧侣 Thomas Merton 在哥伦比亚大学读书期间发现,这种情况曾发生在他身上。在晚年,他写道:「真正的内在自我必须就像沉在海底的宝石一样被抽出来,从混乱、模糊中解脱,从沉浸在平凡、不起眼、琐碎、肮髒、转瞬即逝中解救出来。」
深厚欲望就像在地表深处形成的钻石,更接近地球的核心。深厚欲望不受我们生活中不断变化的环境影响。另一方面,浅薄欲望则具有高度模仿性、传染性,而且往往很肤浅。
我相信工作的目的不仅仅是为了创造更多,而是为了变得更多。工作的价值不能单就工作本身客观的产出做为衡量;它必须将实际工作者的主观转变列入考量。
Rabbi Jonathan Sacks 写道:{精神}就是「{当我们向比自己更伟大的事物敞开心扉时所发生的一切。}」
问:Burgis 用哪个面试题来探寻人们的深层欲望?
答:告诉我一个你做得很出色且给你带来满足感的事情。(「实现故事」)
开门造车
原文:Work with the garage door up (andymatuschak.org)
我最喜欢的创意人士的交流方式之一,是 「开门造车」,这是对 Robin Sloan 的一段话的改编(如下)。这与大多发布完成工作公告的推特账户相反:它是将星期六截屏;它像是讲述你在洗澡时思考的问题;它是「大声」思考你的项目行不通的方式。这就是 Twitch 上的很多内容。我想看看创作过程。我想看你修剪朝鲜蓟。我想看你选择调色板。反向营销。
我个人喜欢这样的交流,但我猜想这种方式还带来更多更专注,更有意思的关注者。这种效果可能与在小众的、有个人意义的项目上工作会带来更奇怪、更偶然的收获有关。这样也避免了报喜不报忧中描述的问题。
参考文献
我希望创办实体企业能更容易些;我希望这条路没有那么崎岖难行,特别是在旧金山大湾区这样的地方;因为我认为这是一件极妙的事。其妙处之一,便是为公共空间注入活力。它们无一不在坦陈一句简单而意味深长的宣言:我在这,在工作着。
在我们北边有一个玻璃科学仪器吹制工作室;我走人行道经常路过此地。这家工作室坐落此处,借由他们面对街道的漂亮招牌,正日日履行着一项小小的公共服务,宣告着:我们在这里,在工作着。
在 Murray 街媒体实验室所处的轻工业建筑群中,有一个木工车间,车间的经营者总会把门撑开。就这么简单。我每天骑车经过这扇门,往里面一瞥,他的所有工具,和为了某个委托准备的高高堆起的木板便一览无余,我不胜欢欣。我在这里,在工作着。
社交媒体的部分问题在于,没有什么东西能匹敌科学玻璃吹制者的招牌,或木工的敞开着的门,或 Dafna 和 Jesse 的三明治板。在互联网上,你不说话:就会消失。而由此推知:在互联网上,你只能注意到那些嘴巴一刻不停的人。
如果你能戴上神奇的互联网护目镜,使你能够看穿这种汹涌的选择偏见,而能公平、正确地看待现实的各种组分——那么,就来爱莫利维尔和西伯克利走走吧。这便是互联网的样貌!推特上所有的喧嚣,正如一家小小奇葩咖啡馆的人声鼎沸——在所有人安静工作的巨大城市里,这个馆子不过是沧海一粟。
有趣的是,在某种程度上,Robin 在这个愿景中正在寻找周边视野。
工作记忆容量一般与项目复杂性无关
原文:Working memory span is mostly independent of item complexity (andymatuschak.org)
字母的数量是阿拉伯数字的两倍以上,所以你可能认为,我们能记住的数字串,长度是字母串的两倍。但事实上,典型的工作记忆容量大约是{六}个字母和{七}个数字(例如,Crannell和Parrish,1957)。
参考文献
Crannell, C. W., & Parrish, J. M. (1957). A Comparison of Immediate Memory Span for Digits, Letters, and Words. The Journal of Psychology, 44(2), 319–327. https://doi.org/10.1080/00223980.1957.9713089
Miller, G. A. (1956). The magical number seven, plus or minus two: some limits on our capacity for processing information. Psychological Review, 63(2), 81–97. https://doi.org/10.1037/h0043158 Miller - The magical number seven, plus or minus two
写你所读,以求内化
原文:Write about what you read to internalize texts deeply (andymatuschak.org)
如果你想深刻内化你所读的内容,我所知的最好方法就是围绕它们写点什么:
-
因为
-
具体到写作上,写作迫使人们更敏锐地理解
-
-
否则你就不会自主思考
对于理解深刻来说,仅仅在书本上划出重点或写上旁注是不够的:没有太多的压力去综合、联系,或去探究事物的核心。而且随着时间的推移,随着你读得越多,这些内容也不会逐步积累。而在阅读时写下常青笔记则与之不同。
但当然,这种阅读方式有时候并没有意义:很多时候,你并不是真的想把深入内化文本,而且它也不一定值得耗费心力:最好的阅读方式是高度语境化的。
另外值得注意的一点是:我所认识的高效阅读者和思想家在阅读时不做笔记。但至少就我个人经验而言,我自己是需要更多的支持,来有效地体会我所阅读的内容的。
方法
我们的大方针是交替地循环:
-
把看起来有趣的段落和阅读时出现的想法收集起来:如何在阅读时收集观察
-
加工将这些段落和思想群,写出经久耐用的笔记:如何将阅读标注加工成常青笔记
参考文献
Luhmann, N. (1992). Communicating with Slip Boxes. In A. Kieserling (Ed.), & M. Kuehn (Trans.), Universität als Milieu: Kleine Schriften (pp. 53–61). Retrieved from http://luhmann.surge.sh/communicating-with-slip-boxes
不写作就不可能思考,至少不能复杂地、网络化(anschlußfähig)地思考。
Levy, N. (2013). Neuroethics and the Extended Mind. In J. Illes & B. J. Sahakian (Eds.), Oxford Handbook of Neuroethics (pp. 285–294). Oxford University Press.
纸质笔记,或电脑屏幕上的笔记......并没有使当代物理学或其他种类的智力行为容易,而是使之可能。
默认不考虑读者,只为自己写笔记
原文:Write notes for yourself by default, disregarding audience (andymatuschak.org)
如果你想公开一些作品,常青笔记可以作为一部分写作策略(可执行的写作策略)。因此,把笔记照着可发表的形式去写,无疑会「节省时间」。但这可能意味着,你必须提供所有必要的背景,来帮助读者理解(对你来说很无聊的)你的想法:或自我审查、或添加大量的修饰语、或在表达清晰度上花上很多精力。如果作为自我思考的过程,这些做法中的许多都有点用处 —— 例如,更清晰的写作通常需要更清晰的思考 —— 但我感到写作中的时间、精力开销会大大增加,往往会达到形成「阻塞」的程度。
更具体一点,当我明确地面向作品发布而笔记写作时,上文的情况表现为我常见的失败模式。我经常试图同时完成这两项工作。也就是说,我可能在写原子式的笔记(常青笔记应该是原子化的),但我试图把它们写得像是一篇长文章或作品中的章节。或者甚至只是:我试着在写东西时讲明所有的背景,并力图使行文清晰,让外人明白我在说什么。然后,我常常发现我什么都写不出来。最好是在我能写出东西的水平上进行写作,然后用它来撬动自己的进步。(常青笔记实现顺畅而渐进的写作(「渐进写作」))
当我在写一个很了解的主题时,我可以同时为自己和读者写笔记。但这有时会让我产生错觉,以为我可以一直这样做!为了避免这种错觉,我决定「默认」只为自己写笔记,只在必要时明确地「切换到」为读者写笔记。
问:在为公开写作而写常青笔记时,我经常犯什么坏习惯?
答:我会在写第一版笔记时,就尝试(部分地)进行公开写作。
问:为什么当我试图把常青笔记写成供他人阅读的可发表文章时,我经常发现自己被卡住?
答:当一个主题本身就很难提炼时,考虑读者所产生的额外认知负荷会让我无从下手。
写作促使人们更加深入地理解
写作是促使你思考的好方法:如果你不深入理解,就很难总结出什么。通过尝试解释一个想法,你将自然而然地尝试多种框架,充实它的边界,并看到新的联系。这是为什么常青笔记有助于积累洞见和为什么应该写你所读,以求内化的一部分原因。
在写作时与先前的笔记建立联系、进行整合的额外步骤(即创建常青笔记)让这种效应更加有力,尤其是当常青笔记应面向概念之后。因为你不得不去理解怎样将给定的想法与其他想法联系起来。并且当你将新想法与旧想法进行对比时,你能看到新想法中没有被提到的点。
这种实践是一种粗略的元认知支持:元认知支持充当认知脚手架。
即使是非散文写作,这一观察结果似乎也是正确的:许多杰出的思想家需要借助书写界面来思考
参考文献
Kant, I. (1996). An answer to the question: What is enlightenment? In A. Wood (Ed.), & M. J. Gregor (Trans.), Practical philosophy (pp. 11–22). https://doi.org/10.1017/CBO9780511813306.005 (Original work published 1784)
启蒙就是人从他咎由自取的受监护状态走出。受监护状态就是没有他人的指导就不能使用自己的理智的状态。如果这种受监护状态的原因不在于缺乏理智,而在于缺乏无须他人指导而使用自己的理智的决心和勇气,则它就是咎由自取的。因此,Sapere aude 要敢于认识!
Don DeLillo,关于他为什么成为作家(通过 Michael Nielsen):
我有个想法但不是很确信。或许我想要学习如何思考。写作是一种全神贯注的思考形式。我不知道我在某个主题上的想法,即使是今天,直到我坐到桌前并尝试把它们写出来。或许我想要找到更多严谨的思考方式。我们现在讨论的是我最早的写作,以及语言的力量,它可以对抗青春期后期的沉溺,可以用简练的方式来明确事物,明确杂乱无章的经历。别忘了写作很方便。它只需最简单的工具。一个年轻的写者认为,在一张不到一便士的纸上写下单词和句子,他可以更清楚地将自己置于世界之中。一页纸上的文字,就足以帮助他将自己与周围的力量、街道、人群、压力和感受分离开来。他学会思考这些事情,把他自己的句子变成新的认知。我当时有多少这样的感觉?也许只是一种暗示,一种本能。写作主要是一种不可名状的冲动,这种冲动部分是由我当时正在阅读的作者所推动的。
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
如果一时自欺欺人地写下一些难以理解的文字,那么在下一步将自己的文献笔记变成永久笔记,并与其他笔记联系起来的时候,就会遇到障碍。
记笔记,并将其整理到卡片盒中,只不过是为了理解某件事情背后蕴含着的更广泛的意义。卡片盒迫使我们提出许多阐述性的问题:它意味着什么?它与某事有什么联系?它与某事有什么区别?它与什么相似?
有经验的学术读者通常是带着问题去阅读文本,并试图结合其他可能有用的方法;而没有经验的读者则倾向于采用文本中已有问题和论证的框架,并将其作为既定的内容。优秀的读者能做的是发现某种方法的局限性,看到文本中没有提到的东西。
记笔记,并将其整理到卡片盒中,只不过是为了理解某件事情背后蕴含着的更广泛的意义。卡片盒迫使我们提出许多阐述性的问题:它意味着什么?它与某事有什么联系?它与某事有什么区别?它与什么相似?
原文:Writing forces sharper understanding (andymatuschak.org)
Y Combinator
原文:Y Combinator (andymatuschak.org)
Y Combinator 是一家创业孵化器,它不仅提供资金支持,还为参与者打造了一个有助于他们快速成长的结构化环境。这里的活动多着眼于传授一整套精炼的实践和价值观:比如,通过与成功的前创始人吃饭交流,几乎像讲故事一样传递文化知识;一系列权威的书籍和演讲也起到同样的作用;紧凑的演示日(Demo Day)安排要求创始人按特定方式行动;而办公时间则提供面对面的指导,强调相同的原则。
Y Combinator 是一个赋能环境:创业者们经常感叹,他们突然能做更多事情——而这不仅仅是因为资金的支持。虽然从某种程度上说,它像是一所学校,但关键的区别在于,创业者的所有活动都围绕着他们热衷的创业项目展开,而不是仅仅学习一些抽象的技能,这些技能未来可能用来实现某些有深度的目标(赋能环境中的活动直接服务于有内在意义的目的)。
Y Combinator 同时也是一种情景体验。创业者们通过参与晚餐、达成里程碑、听取讲座和参加办公时间,逐渐内化了一套特定的实践和价值观。在演示日等活动中,他们经常会体验到一系列特定的情绪。这些体验并不显得是外界「强加」的;很多时候,创业者们感觉这些都是自己引发的,尽管在 Y Combinator 这样的环境之外,他们可能根本接触不到这些体验(情景体验可以引导人们积极参与到赋能环境中)。这些活动并不被定义为「练习」,而是被看作是行动(赋能环境的重点是创造成长和行动的机会,而不是技能培养)。
Y Combinator 还开设了「创业学校」,这是一个简化版的远程学习项目。我认为,它虽然没有提供完全一致的情景体验,但如果能做到,其影响力将非常巨大( 情景体验作为一种大众媒介具有难以置信的潜力)。
Ye, J., Su, J., & Cao, Y. (2022). A Stochastic Shortest Path Algorithm for Optimizing Spaced Repetition Scheduling. Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, 4381–4390
有关优化间隔重复系统的调度算法。来自 Jarrett Ye,一位赞助者。
我觉得这篇论文里最吸引我的是他们用「半衰期」来描述间隔重复记忆系统卡片的状态。但问题是,你没法直接量出一张卡片的半衰期。你只能做一次观察,因为每次练习都会改变接下来的半衰期。同一个项目的半衰期序列当然是相互关联的,但这仍然相当棘手。
他们的方法是根据用户群体的初次回忆率将项目分为不同「难度组」。然后,他们可以使用汇总的用户组为后续事件拟合半衰期参数。可以想象,就像项目反应理论那样,为每位用户再加一个「能力」/「熟悉度」参数。
然后,作者引入了一个马尔可夫时序模型,用于描述给定反应的半衰期和难度的转移方程组。这个方法已经被做成了 Anki 插件:GitHub - open-spaced-repetition/fsrs4anki: A modern Anki custom scheduling based on free spaced repetition scheduler algorithm
卡片盒笔记系统
原文:Zettelkasten (andymatuschak.org)
20 世纪的德国社会学家尼克拉斯·卢曼(Niklas Luhmann)成功地出版了 70 本书。他将自己的成就主要归功于他的 Zettelkasten,或叫做「卡片盒」。这是个不寻常的系统,通过在数以千计的原子纸条上慢慢迭代,在很长一段时间内发展思想,所有这些纸条都密集地相互联系在一起。随着时间的推移,它不断演化,以至于卢曼认为它是研究中的一个独立的思想伙伴,能够与他进行对话并激发出真正令他惊讶的想法。
虽然卢曼是最经常被提到与这个概念有关的人,但这一概念显然早已存在:
起初,Zettelkasten 只是个普通传统,经过 Conrad Gessner(1516-1565)的改良和 Johann Jacob Moser(1701–1785)的描述后,逐渐形成了今天的样子。这个德文名词翻译过来就是「卡片盒」。一般而言,这是一种经过精挑细选的原子笔记集合,收集在纸条或索引卡上。
Arno Schmidt,一位现代主义的德国作家,广泛使用这种方法,并出版了一本名为 Zettels Traum(《滑动的梦》)的书,将学术评论(以 Zettel 式的风格)与主要叙事插在一起。(视频,文章)
另见:常青笔记和 Zettelkasten 卡片盒笔记法的异同点
参考文献
Luhmann, N. (1992). Communicating with Slip Boxes. In A. Kieserling (Ed.), & M. Kuehn (Trans.), Universität als Milieu: Kleine Schriften (pp. 53–61). Retrieved from http://luhmann.surge.sh/communicating-with-slip-boxes
人类认知中的「组块」
原文:“Chunks” in human cognition
在考虑人类的信息处理能力时,工作记忆大小与记忆内容复杂性基本无关,因此我们必须区分正在处理的记忆内容的数量(一个「组块」,由工作记忆大小限制)和每块记忆内容的复杂性(各自由绝对判断跨度限制)。
米勒写道 (1956 年,第 92 页):
我已经习惯了区分比特信息和组块信息。那么我可以说,对于绝对判断来说,信息的比特数是恒定的,而对于瞬时记忆来说,信息的组块数是恒定的。
重要的是:人类信道容量随着每组块比特的增加而增加和重新编码可以增加组块的大小。
特别是在更复杂的重新编码方案中,组块可以表示相当抽象的属性:例如,音乐家在即兴创作时考虑「张力」,或者国际象棋选手考虑「力量线」。
参考文献
Miller, G. A. (1956). 神奇的数字 7 ± 2:我们处理信息能力的一些限制。Psychological Review, 63(2), 81-97. https://doi.org/10.1037/h0043158 Miller - The magical number seven, plus or minus two
专业需要建立复杂精细的组块重编码架构
原文:Expertise requires building sophisticated chunk recoding schemes (andymatuschak.org)
在许多领域,专家之所以成为专家,大部分是因为发展出更为精细复杂的「心理表征」(Mental representations, after Ericsson and Pool), 这等价于增加了他/ 她们的心理组块的大小(人类认知的“组块”)。这提升了他们的信息处理容量(人类的信道容量随着每块的比特的增加而增加)。这通过实践发生: 良好的实践可以编码出更有效的块状重新编码方案
是什么让专家有别于常人?是精神表征的质量和数量。
(Ericsson and Pool, 2016, p. 62, not well-cited)
例如,Simon and Gilmartin (1973) 推动的模型指出,国际象棋大师,已经编码出以万计算的组块。 (相同例子可见于 Chase and Simon - Perception in chess)
知识工作往往需要解决搜索问题,Ericsson 和 Pool 认为,专家的搜索能力来源于更加复杂的组块架构 (2016, p. 70-72),这并是一个非常强的论点,但由于人类的渠道容量随着每块比特的增加而增加,它或许可以解释高效的「剔除」和「反馈-吸收」能力。
参考文献
Simon, H. A., & Gilmartin, K. (1973). A simulation of memory for chess positions. Cognitive Psychology, 5(1), 29–46. https://doi.org/10.1016/0010-0285(73)90024-8
Ericsson, A., & Pool, R. (2016). Peak: Secrets from the New Science of Expertise (1 edition). Eamon Dolan/Houghton Mifflin Harcourt. Peak - Ericsson and Pool
好的练习包含更有效的组块重新编码方案
原文:Good practice encodes more effective chunk recoding schemes (andymatuschak.org)
专业水准需要建立复杂的组块重编码方案,而有效练习可以实现(例如有目标的练习,借鉴于 Ericsson 和 Pool。
这个过程似乎是自动的,主要是专家们通常不会想「我需要建立更好的组块」。其实,顶着能力极限学习本身,便是通过编码出更大的组块来进步——至少在某些方面。
Ericsson 和 Pool(2016)详细讨论了这一主张,但对其机制没有提供什么证据或解释。
识别和记忆有意义的模式的能力来自于国际象棋选手发展能力的方式…也就是花大量时间研究大师的棋局,你深入分析一个局面,预测下一步棋,如果你错了,就回头看看错在哪里。研究表明,用于这种分析的时间——而不是用于和他人下棋的时间——是预测棋手能力最重要的指标。(第 56 页)
刻意练习在于不断发展出更高效的心理表征(第 59 页)
......最成功的四分卫,通常是那些在回放室花最多时间观察和分析的人......"(第 64 页)
参考文献
Ericsson, A., & Pool, R. (2016). Peak: Secrets from the New Science of Expertise (1 edition). Eamon Dolan/Houghton Mifflin Harcourt. Peak - Ericsson and Pool
人类的信道容量随着每个组块的比特量的增加而增加
原文:Human channel capacity increases with bits-per-chunk (andymatuschak.org)
如果把人类作为信息处理器,那在人作为信息处理器时的信道容量的问题上,一个常见的变通方法,是进行一系列更小的观察,而不是做单个、复杂、绝对的判断。这仅在你头脑 hold 得住如此一序列的东西时有效,所以它受限于你的记忆工作记忆的容量界限,好消息是,工作记忆与单元复杂度无关。所以你可以通过在每个组块中,增加可察觉 bit 数,来提升你的「有效信道容量」(认知中的「组块」)。
在这个描述 Pollack(1953)数据的图中,信道容量随着每组块比特量的增加而几近线性扩展(Miller, 1956, p.92)。
这种效果仍然受到绝对判断的容量界限的限制,所以要把每个数据块的比特量扩大到 5 以上,就要把数据块变成多维的(人类的信道容量随激活维度增长)。
问:元素序列中,元素 bits 数变化时,人的信道容量如何变化?
答:它大致呈线性增长。
问:工作记忆的容量界限不受绝对判断的容量界限的影响,这点为什么很重要?
答:它表明,我们可以通增加记忆单元的「组块」大小,往工作记忆中保存更多信息。
参考文献
Miller, G. A. (1956). The magical number seven, plus or minus two: Some limits on our capacity for processing information. Psychological Review, 63(2), 81–97. https://doi.org/10.1037/h0043158 Miller - The magical number seven, plus or minus two
Pollack, I. (1953). Assimilation of Sequentially Encoded Information. The American Journal of Psychology, 66(3), 421–435. JSTOR. https://doi.org/10.2307/1418237
重新编码可以提升组块大小
原文:Recoding can increase chunk size (andymatuschak.org)
人类的信道容量与组块比特容量正相关。但我们不需要依赖对人脑刺激的「内在」组块大小。我们可以通过重新编码来增加刺激的有效组块大小——也就是说,精神上重组刺激的信息,得到组块描述更宏观的模式。这些块状模式也被称为心理表征,取自 Ericsson 和 Pool.
例如,为记忆一串二进制数字,可以将其三位一组转换成八进制来记忆(例如,010=2,101=5,诸如此类),这样记忆容量大约能增加两倍(Miller, 1956)。Chase 和 Ericsson(1982) 使用这类技术将一个学生的数字广度提高到 80 位,具体做法是将数字重新分层编码为 4 位十进制的组块。
重新编码很重要,因为它不仅能帮助我们记住有用的信息,而且可能是处理各种复杂材料的关键步骤(具体而言,专业水准需要建立复杂的组块重新编码方案)。钢琴演奏者最初按单个音符阅读乐谱(C、E、G——啊,是 C 和弦!),但后来能将看到弦音符的整体形状而识别为一个和弦(啊,一个 C 大调三和弦)。单个单个读音符是不可能视读颇有难度的音乐的。
这些模式(例如大三和弦的形状)一旦被储存在长期记忆中,就只能作为「组块」使用。
Chase and Simon - Perception in chess记录的实验数据表明,国际象棋大师的组块更大(可能还有层级组块机制)。
相关笔记:复杂的概念可能很难学习,部分原因是工作记忆容纳不下其组分
参考文献
Chase, W. G., & Ericsson, K. A. (1982). Skill and Working Memory. In G. H. Bower (Ed.), Psychology of Learning and Motivation (Vol. 16, pp. 1–58). Academic Press. https://doi.org/10.1016/S0079-7421(08)60546-0
Miller, G. A. (1956). The magical number seven, plus or minus two: Some limits on our capacity for processing information. Psychological Review, 63(2), 81–97. https://doi.org/10.1037/h0043158 Miller - The magical number seven, plus or minus two
约束作为认知脚手架
原文:Constraints as cognitive scaffolding (andymatuschak.org)
如果用户刚接触 Photoshop ,眼前就是功能密密麻麻的完整界面,他可能连第一步做什么都不知道。但如果他从「欢迎」工作区开始,里面大部分面板和工具都被隐藏起来,那就更加容易下手了。之后随着他注意自己需要什么,或者对什么感到好奇,按需展示各部分界面即可。
类似的,解释概念时,如果能约束其应用场景,那么问题解释起来更简单,对新手理解也更有帮助。比如说,解释如何制作醋油调味汁的时候,先说明一种油跟一种醋的搭配比较好。
游戏中的玩家开局时只拥有一小部分能力,或者当前环境下根本不会遇到一些挑战。这样游戏一开始才更容易上手。
约束是构建小跨度任务台阶的一种方式(参见将小跨度任务阶梯作为认知脚手架),但其用途还有很多。比如说,一位有追求的摄影师,可能会花一整年专门研究不同快门速度的摄影,其余孔径、焦距、ISO 等参数都固定不变。
相关:限制常常催生创造力
小跨度任务阶梯充当认知脚手架
原文:Fine-grained task progressions as cognitive scaffolding (andymatuschak.org)
刚开始学习新技能、新概念,要能将其分析拆解,从而能着手完成第一步。然而拆解本身就是困难的任务,并且常常会干扰学习知识本身。如果新概念对你来说太过陌生,你甚至不知道从何拆起。
专家设计的小跨度任务阶梯,可以帮我我们建立认知脚手架。举个例子,如果你想学习 Processing 编程,专家会建议你找到一份会说「你好,Bob!」的程序,将其复制下来,略加修改,让它转而输出你的名字。之后他会拿出三个程序供你复制组合:比如说让文字动起来越过屏幕,用不同颜色重复打印一条消息几次,诸如此类……
游戏设计师尤其擅长这件事(Cook,2007年)。Witness 是个很好的例子:该游戏有一系列谜题,每道题都会揭示一点点新元素。之后的题目会逐步将这些技能组合起来,最终玩家便能灵巧地应对不少游戏机制。
约束也是构建这样阶梯的方式(约束充当认知脚手架)。
参考文献
Cook, D. (2007, July 19). The Chemistry of Game Design. Gamasutra. Retrieved from https://www.gamasutra.com/view/feature/129948/thechemistryofgamedesign.php
Thekla, Inc. (2016). The Witness. Berkeley, CA.
元认知支持作为认知脚手架
原文:Metacognitive supports as cognitive scaffolding (andymatuschak.org)
学习需要元认知技能,不过环境可以减轻学习者的元认知负担。
在课堂中,教师会大量监控、评估、计划、控制学生的执行。当然,他们有时候做得太多了,但是在很多情况下,这可以让学生把注意力放在手头的材料上。
在量子国度中,我们穿插的复习环节会帮助读者注意到他们是否掌握材料,并在他们的记忆扎实时给他们一种轻松的感觉。该环境还相应地计划和执行后续的记忆练习。
游戏在这方面做得特别好:
文本的叙述作为认知脚手架
原文:Narrative as cognitive scaffolding (andymatuschak.org)
一个好的叙述将一个复杂话题的关键组成要素结构化和序列化*(译注:指将复杂概念以流式方式文字化或言语化),将参与者的注意力集中在想法的有限子集上,这样他们就能轻松地跟随作者的步伐。这就形成了认知脚手架。一篇参考文献在没有叙述脚手架的情况下也可以提供同样的信息,对于专家来说,这可能是一个更有效的话题总结,但对于一个新手来说,存在的认知鸿沟,让其难以理解文章的内容
随着叙述的进行,新手难以捕捉到的内容之间的关联,被清晰地提炼出来,同时提醒阅读者利用此前的材料。这些帮助阅读者聚焦于颗粒,且兼顾全局。随着时间的推移,他们自行建立起联系,超越作者阐述的联系。
叙事通过提供解释、可能的影响和与作者的联系来促进情感交流。随着时间的推移,阅读者会建立他们自己对该主题的情感,但为其提供脚手架也是有帮助的。
另见:情景体验增强了叙述的力量
设计新的赋能环境,可以看作是在打造一所超级大学(University++)
原文:Designing new enabling environments can be framed as designing a University++ (andymatuschak.org)
历史上,大学就是赋能环境的有效典例(在某些方面有一些显著的局限性):
-
最优秀的大学通常把重心放在教授的研究上,而非教学上(强大的赋能环境通常是追求自身内在意义的项目的副产品;强大的赋能环境注重专业用例)。
-
顶尖大学的学生不仅仅是学习知识,他们实际上能推动自己学科领域的进步(赋能环境重在推动所赋能的事)
-
大学通过仪式、文化、结构化的时间表、头衔和空间布局来(虽然效果有限)营造一种情景体验,这表明情景体验可以引导人们积极参与到赋能环境中。
像 Y Combinator 这样的现代赋能环境已经在一定程度上取代了大学的某些功能。专门设计这样的新型赋能环境,我们可以考虑以下几个目标:
-
增加参与者(包括专家)进行原创研究的机会
-
比大学更好地连接意义(超验叙事(宏大叙事);赋能环境中的活动直接服务于有内在意义的目的)
-
更有效地帮助新手上手(对赋能环境不熟悉的人往往不能完成环境所赋能的事情)
-
提高扩展的效率(情景体验作为一种大众媒介具有难以置信的潜力)
在线开放课程(MOOCs)在这方面的尝试失败了。因此,我们可以从一个相关的角度思考:「在线开放课程究竟想要变成什么样子?」
另见 Primer++ 被嵌入到一个领域中,通过情景体验来引导学习者参与
参考文献
https://github.com/mnielsen/tpft/blob/master/big_picture.md
教育游戏对于创造赋能环境是注定失败的方法
原文:Educational games are a doomed approach to creating enabling environments (andymatuschak.org)
因为游戏能有效地培养玩家的技能,人们便展开想象,做出可用的、能用于「教授」特定技能的教育游戏,是可能的。然而,由于几个结构性原因,这往往做不到:
教育游戏开发者通常看不到,从经验上看,游戏设计的核心是「寻找乐趣」。游戏中的技能发展服从于其他内在的有意义的目的,而大多数游戏不是赋能环境,这并不意外:赋能环境的活动直接服务于内在有意义的目的;学习目标本身通常没有内在的意义,也并不有趣。若是被强加给玩家的话更是如此。更一般地说,由于这个原因和其他一些原因,教育计划往往会自我颠覆。
教育游戏开发者经常想:我的动机将是「帮助孩子们成功」,但孩子们的动机则是「玩有趣的游戏」。这样也是行不通的:自创环境极大程度受作者的动机塑造。
避免这个陷阱是可能的,但必须不要试图制作「教育游戏」。强大的赋能环境通常是作为追求自身内在意义的项目的副产品出现的 如 Bret 所言:
设计 活动时,要让概念扎实有重量,但设计者和玩家都能感觉活动是有趣而快乐。问问自己:「我自己喜欢玩这个吗?」。要能相信玩家在花了数个小时与这些概念亲手「打交道」后,会逐渐熟悉它们,进而能流畅使用,以至形成自己的理解。这样的过程是难以刻意设计的。
另一个限制:强大的赋能环境注重专业级用例。教育游戏开发者通常专注于设计表征来为新手服务,但由此一来,玩家所习得的概念,与专家使用的概念难以契合(例如《模拟城市》),同时这些表征的能力上界过低。
参考文献
Email with Bret Victor, 2015/03/19. Re: Toys with weight-bearing educative properties
赋能环境中的活动直接服务于有内在意义的目的
在设计赋能环境时,注意力很容易集中在环境所意图发展或增强的技能或理解上。这种做法通常会辜负原本的目标。赋能环境要想成功,环境中的活动必须直接服务于那些技能或理解的目的。(见强大的赋能环境通常是作为项目追求其自身内在意义的目的的副产品出现的,赋能环境着重于环境所赋能的事)
内驱调节的学习是自我实现的;外驱调节的学习是自我否定的。如果缺少具有内在意义的目的,这些活动将主要由学习者以外的外部力量来激励和调节。
深刻的理解需要强烈的个人联系(也是其结果)。如果没有一个内在的有意义的目的,这种联系是不可能的。
仅仅是作者有一些创造活动的内在意义的动机是不够的,仅仅是参与者发现活动有内在意义也是不够的。创制活动必须对作者和参与者都有内在意义的目的。理想情况下,这些目的是一致的:创制环境极大程度受作者的动机塑造。
例如,Mathematica 可能包含认知脚手架,但 Mathematica 中的活动主要围绕做数学和科学展开。游戏能有效地培养玩家的技能,但游戏中的技能培养服从于其他有内在意义的目的。
教育环境最终可能渴望有内在意义的目的,如供养你的家庭或加入专业社区。这些高层次的目的往往不能转化为环境中的实际经验。一些「教育」活动具有内在意义的目的,但在大多数情况下,它们的活动主要是关于培养技能,而培养技能很少具有内在意义(赋能环境着重为成长和行动创造机会,而不是培养技能)。详情请见:教育计划往往会自我颠覆。
参考文献
Email with Michael Nielsen, 2019/08/23. Re: Transcending the Primer
当然,从某种意义上说,我对「赋能他人」这样的目标相当迷恋......但我也对这样的目标非常怀疑。我认为 > 99.9% 的情况下,它会以单方面的施舍告终。我所知道的唯一能持续摆脱这种失败模式的方法是把主要目标变成别的东西,变成内在的重要东西。
例如,如果你执行阿波罗计划,你肯定会使人受益。但这对于登月来说是次要的。如果你创造了 Mathematica,你肯定会使人们受益。但是,这对于做一流的数学/理论物理学来说是次要的。...
赋能环境的重点是创造成长和行动的机会,而不是技能培养
卓越的研究所不会执着于给它的研究生灌输大量专业知识和技能。 它通过为个人成长提供大量机会,并在上述成长的基础上强调为行动的机会缔造纽带。这对于建立有效的赋能环境来说大体上是正确的。
不得不说的是,像这样的环境并不会为了成长而促进成长。Y Combinator 的创始人主要致力于缔造一家成功的公司,而不是实现个人成长(赋能环境中的活动直接服务于有内在意义的目的)。并且到了环境创造个人成长的地步,与其关注「练习」,不如强调所有事情的终极目标(例如让新公司风生水起)。
这启发给我们以新的眼光审视现存的媒介。例如,书籍很少侧重于为个人成长或行动提供机会:它们通常是在一个抽象的背景下传达知识。这引出了一个扣人心弦的启示:
那么,撰写「书籍」,其主要关于给人们创造成长机会,和在该成长的基础上通向行动机会的纽带,这意味着什么?
参考文献
与迈克尔·尼尔森的对话,2019-12-10
赋能环境重在推动所赋能的事
原文:Enabling environments focus on doing what’s enabled (andymatuschak.org)
在强大的公司或 Minecraft 之类优秀的赋能环境中开展的活动,基本上正是这些环境所赋能的事情。
相比之下,大多数书籍(甚至是可执行的书籍)并不涉及做它们所讲的事情。这些环境的活动是关于主题的——阅读有关篮球的内容,而不是打篮球。他们与行动相距甚远,因此难以为置身书籍环境的阅读者赋能。
强大的赋能环境通常作为项目追求其自身内在意义的目的的副产品出现和赋能环境侧重于创造成长和行动的机会,而不是提升技能中描述了更高层次的观察,上文便是自然的副产品。
对行动的关注使环境作者保持诚实。这样迫使作者把重点放在能够有意义地促成行动的要素上。这使活动围绕着本质上有意义的目的(赋能环境的活动直接服务于内在的有意义的目的),而不是更抽象的目标。
完成所赋能内容的活动,一般会比关于什么的活动创造更多的个人联系。这种联系很重要:深刻的理解需要强烈的个人联系(也是其结果)。
社会赋能环境让参与者有机会基于彼此的想法继续发展。进而让他们接触更多。如果社会活动只是关于被赋能的东西,这种效果便很有限。与同事的午餐讨论可能很有用处,但如果你发现他的想法很吸引人,你可能会发现与该同事的合作更有利。
这里的一个挑战是,[赋能环境中的新手往往不能做环境所赋能的事情](https://notes.andymatuschak.org/z3XsSKarN8i3pV4WjPiJ7pVGG6akRVQvU7ngK)。事实上,这也一定程度上成为阻碍新手成长的因素。一旦新手能够在某种程度上参与,那么环境就可以整合强大的动态脚手架来使他们进一步发展(见元认知支持需要动态、参与性的环境)。例如,教练可以建议哪种练习可以最好地帮助运动员在某一天实现他的目标(元认知支持充当认知脚手架)。在我的世界单人游戏中,为了提升玩家的建筑技能,越复杂的材料,越需要足够的技巧才能找到。
大多数游戏都不是赋能环境
原文:Most games aren’t enabling environments (andymatuschak.org)
游戏能有效地培养玩家的技能,所以人们很容易把好游戏看作一种赋能环境,但它们很少「释放或显著扩展玩家的能力,去做他们认为有意义和重要的事情。」大多数游戏的主要目的是创造一种审美或情感体验。这种体验可能非常强大(这就是技能培养很有效的原因:游戏中的技能发展服从于其他有内在意义的目的),但它通常不会扩展玩家的能力去做他们认为有意义和重要的事情。相关笔记:教育游戏对于创造赋能环境是注定失败的方法。
反例
《我的世界》是一个有趣的反例:单人游戏体验包含大量的认知脚手架,随后在「创造」模式中实现了意义无穷的行动。很多人用这种模式来进行严肃的创造性表达。如果这些人用 Blender 或 Maya 的话,他们中的许多人永远不会做出任何东西。
大型多人在线游戏的结构化社交环境可以使人们建立人际联系并形成社区。许多游戏甚至可以为离群或内向的人做到这一点。
对赋能环境不熟悉的人往往不能完成环境所赋能的事情
原文:Novices in enabling environments often can’t do what’s enabled (andymatuschak.org)
刚进入赋能环境的新手,可能无法立即做到环境所赋能的事情。对此,常见的解决方案是较为不直接的引导:指导手册、入门课程、背景阅读等等。有了这些支持,新手总归能完成环境所赋能的事情,但这并不是最理想的做法:赋能环境着重于环境所赋能的事。
为了让新手能更早融入赋能环境,我们可以对其设计加以改进(例如,使用认知脚手架)。有一种强大的设计方法:设赋体验可以让人逐步深入参与赋能环境。
强大的赋能环境注重专业用例
原文:Powerful enabling environments focus on expert use (andymatuschak.org)
赋能环境可以帮助人们做新的事情,所以我们总是向往设计出一个能够帮助新手进入某个知识领域的环境。这可以借鉴这个领域的日常活动的简化版本来设计。但这种方法通常是相当有限的。强大的赋能环境通常作为副产品在追求其自身内在意义的项目时产生。这些目的通常是由赋能专家们最佳确定的。从这一角度来看,环境也包括一些结构,这些结构可以帮助新手在追求过程中与专家保持相同的目的。
当环境专注于促成一个活动的简化版本时,其目标往往变成了技能培养本身。这往往会颠覆它自己的目的(见 教育计划往往会自我颠覆 )。为解决某个领域的重要问题而设计的环境几乎会自动规避这个陷阱。
如何表述是设计赋能环境的最重要的部分之一 ::TODO write note:: 。专门为某项活动的简化版本设计的表述常不会促成专业级别的练习。这意味着这些表述的力量是有限的。更糟的是:它们往往与专家使用的表达不一致。但是,为专家设计的表述往往可以为新手服务。当学徒在真实的实践环境中培养他们的技能时,他们会使用简化过的表述。但由于这些表述是在专家实践的背景下构思的,它们往往与专家的表述一致,所以二者之间可以平滑地完成过渡。(参见大多数为交流而开发的动态表现都不是很赋能)
例子和反例
研究实验室可以是强大的赋能环境。它们具备完备的结构去辅助初级学者发展:阅读小组、座谈会、写作研讨会等等。如果结构运作良好,将会有助于实验室产出更优质的研究成果,而不只是单纯为了培养技能。许多这样的活动(如座谈会)实际上对有经验的学者来说可能更为重要。它们是为了这个目的而设立的,甚至增加了额外的结构,使相关的初级教师更容易参与进来。对每个人来说,参与活动等价于参与这个学科。这些活动将伴随它们的参与者共同成长。
有了 Mathematica,高中生也能处理简单的实验数据,并将其可视化。但更重要的是,Mathematica 可以帮助职业科学家更有效地完成工作。专门为学生设计的工具,可能就无法帮助专家更好地做科学;面向专家设计的工具,也能帮助学生更好地做科学——接触前沿的知识。
模拟城市很有趣——起码技能培养不是它的主要目的——但它的表述从根源上编码了许多假设,因此它们不能顺利地演化为专业的表述。如果你的目的是专业的城市规划,《模拟城市》不会对你有什么帮助。
同样地,Logo 使儿童能够获得微分几何的思想。这是很好的!但专业的几何学家似乎并不觉得 Logo 的表征与他们的研究有关。因此,孩子们只能说是在有限的意义上做微分几何,因为做数学是为了提出和回答独创问题,而这个环境似乎对这一点没有什么帮助。首先 Papert 对帮助微分几何学家不感兴趣,他也不一定有这样的专业知识,但想象一下围绕强大的计算表征为几何学家设计的另一个 Logo 是很有意思的。
参考文献
Email with Michael Nielsen, 2019/08/23. Re: Transcending the Primer
如果你创造了 Mathematica,你肯定会使人们受益。但是,这对于做一流的数学/理论物理学来说是次要的。
Email with Michael Nielsen, 2019/09/03. Re: ❲FYI❳ Some notes on enabling environments / anti-educationalism
Alan Kay 为每个孩子一台笔记本电脑计划撰写的关于模拟城市的看法 | Don Hopkins
思想的可扩展性和非可扩展性是很有趣的。《Rocky’s Boots》仍然是有史以来最好的游戏之一,它提供了深刻的学习经验。这一点延伸到《Robot Odyssey》上并不奏效,因为逻辑和电线编程的规模不够大——每项努力的收益急剧下降。
强大的赋能环境通常是追求自身内在意义的项目的副产品
阿波罗计划是一个非常强大的赋能环境,但它并不伴生于一个专门为科学家提供大量个人成长的好机会而产生的项目。相反,它是为了把人送上月球(还有,额,从苏联人手中「拯救世界」)。赋能环境是这一深具意义的努力的副产品。
同样,当皮克斯创造其革命性的动画工具时,许多团队已经在计算机图形方面工作了多年,但皮克斯的系统出现在对讲故事的梦想的狂热追求中。皮克斯的电影和技术发展就像耦合的飞轮。
大教堂!大学研究实验室!Mathematica!它们都遵循这个模式。
实际上,这样的情境提供了有深刻意义的反馈:有效的系统设计需要从真刀真枪的情境中汲取洞见。它们也避免了创制环境极大程度受作者的动机塑造中所描述的问题。但也许最重要的是,这些项目还提供了强烈的个人联系,使伟大的工作成为可能。
衍生例子:
是否有可能反其道而行之?启动一个以追求内在意义为目的的项目,是为了收获在这种情况下出现的赋能环境?这并不清楚。最有可能的失败模式是,所产生的项目不会真正创造所需的强烈的个人联系。但这正是我们在 Ladder 中所尝试的。
根据 Seymour Papert. (2005). You Can’t Think About Thinking Without Thinking About Thinking About Something. Contemporary Issues in Technology and Teacher Education, 5(3), 366–367.:你不能在真空中、在抽象的意义上教儿童「逻辑思维」(译者按:无语义学习);同样,你也不能凭空在抽象的意义上制造「思想工具」,你只能为了思考特定事物去制造一个工具;同样地,你必须理解有关特定事物的逻辑思维。
参考文献
https://github.com/mnielsen/tpft/blob/master/big_picture.md
最强大的工具不是被单独开发出来的。相反,它们是作为项目的一部分出现的,是为了其自身的内在原因而完成的。想想彩色玻璃窗的艺术,它是为大教堂的上帝服务而开发的。或者想想皮克斯为故事服务的电脑动画的发展。这些更大的目标引导着工具的发展,确保它们能被认真使用。这听起来像是一句陈词滥调,但却经常被违反。数学或艺术或等的 「工具」往往是由那些本身并不深入该领域的人开发的。除非他们做了极其深入的用户研究,有效地与严肃的用户合作,否则他们很难建立任何其他「看似合理」的玩具。
为此,我们将开发一系列雄心勃勃的媒体项目。这些项目本身将——事实上,必须!——具有内在的价值。但它们也将作为发展思想工具的载体。
Bret Victor’s 2021-06-14 reply to my email about research-context fit
DNA 折纸术(译注:合成生物学极客们的“最爱”)是一个强大的新兴工具;它不是来自以工具制造为中心的领域,而是 Paul Rothemund 发明了它,作为实现制造自组装计算机目的的一种手段。扫描隧道显微镜并不是出自显微镜领域,而是 Heinrich Rohrer 想帮助他的同事制造 Josephson 结创造一个更好的光谱仪。
(另见 Shawn Douglas 关于 DNA 折纸术的内容)
引用 Alan Kay 在同一封邮件中的说法:
::我不认为你可以从「文本」或「编程」开始并走得很远::. 我认为有一些重要的、大的、你想做得更好的东西总是更好的——最终这提供了需要发明的各种媒体(包括「语言」)的线索,以帮助。这就是人们所错过的。McCarthy 并不是想发明 Lisp,他是想创造方法来做一个「建议接受者」。Doug 并不是想做超文本,他是想把人类的努力协同起来做好。
教育游戏试图通过情景体验进行教学
原文:Educational games try to teach through enacted experiences (andymatuschak.org)
从概念上讲,教育游戏设计者试图使用的核心机制是情景体验。他们试图设计游戏活动,使得在游戏环境中,参与能产生一种理解的体验。至少从本能上来说,这种迂回的教学设计方法的潜在动机是情景体验可以创造出与作者目标的强烈个人联系。换句话说,他们希望「让孩子爱上学习!」
大多数游戏都采用了这种机制(游戏能有效地培养玩家的技能),但在教育游戏类型之外,游戏中的技能发展服从于其他有内在意义的目的。
教育游戏中的体验很少让人感觉到身临其境。「老师」通常下手太重;玩家感觉像是身陷别人迷宫里的无助老鼠。情景体验需要参与者置身的因果关系。
即使这些体验确实被感受到了(例如,也许在「俄勒冈小道」中),但玩家的能力并没有得到增强:教育游戏对于创造赋能环境是注定失败的方法。但他们可能会引发玩家对某一领域的热情,或开始灌输价值观——情景体验可以引导人们积极参与到赋能环境中的一种较弱形式。
情景体验增强了叙述的力量
原文:Enacted experiences amplify the power of narrative (andymatuschak.org)
叙述很强大。叙述能引人投入情感,助人理解(叙述充当认知脚手架)。若让叙述成为情景体验,其力量会进一步增强,因为情景体验可以创造出与作者目标的强烈个人联系。
例如,在《传送门》和《生化奇兵》中,游戏环境,角色出场,各种交互中贯彻着一条令人难忘的叙述线。相比《最终幻想》,其故事在很大程度上与游玩体验分离,更像一部电影,这两部游戏的叙述感觉是作为玩家行动的结果而出现的。
情景体验很难创作
原文:Enacted experiences are hard to author (andymatuschak.org)
剧作家、小说家和演讲者可以借助已有的形式简化他们的创作。他们在解决问题或评估作品时,能够运用以往的模式、工具和方法。但相比之下,如果你打算设计一种全新的情景体验,基本上是在无人之境中开辟道路。
当然,也有一些例外:游戏设计师在设计审美的情景体验时,已经形成了一套模式;而在组织设计中,也形成了通过情景体验来塑造团队文化和实践的模式。
这两个领域的实践背后可能存在一些共通的技术和流程,这些技术和流程有望发展成为创设情景体验的通用方法。这种可能性非常激动人心,因为情景体验可以引导人们积极参与到赋能环境中。
情景体验可以引导人们积极参与到赋能环境中
原文:Enacted experiences can bootstrap active participation in enabling environments (andymatuschak.org)
赋能环境着重于环境所赋能的事,但赋能环境中的新手往往不能做被赋能的事情。精心设计的情景体验能让参与者立即体验做环境所赋能的事。
例如,假设一家软件公司拥有特殊的测试基础设施,使其工程师能够自信地完成重大更改。现在经理要向新入职的工程师介绍这一设施,他便可以让新人实现一项新功能,其中需要他修改经过充分测试的旧有代码。这位工程师会注意到这些代码都提及了测试框架,因此他也会如法炮制,添加上新代码并使用测试框架。在代码审查环节,他也许会和审查者讨论这些测试,会很有价值。测试基础设施让工程师能够自信地实现这项功能。因此,他未来测试新功能也会非常顺利。
假设经理没有这么干。其他人要求工程师拓展一项功能,这项功能先前并没有使用测试基础设施。这位工程师可能想不到要用到这个框架。在代码审查环节,别人可能指出他需要使用这一框架,并发给他介绍文档,但阅读文档这一活动与他的目标是相关的,而非就是他的目标。因此他不会非常用心。他打算直接开干,但是他负责的模块并没有使用这一框架的例子,所以他会觉得集成这一框架很困难。
遗憾的是,情景体验很难创作且情景体验很难满足所有人的胃口。不过,情景体验作为一种大众媒介具有难以置信的潜力。我认为这是像《启蒙琼林》这样的媒体的主要前景:《启蒙琼林》++被嵌入到一个领域中,通过情景体验来引导参与。
情景体验可以创造出个人与作者意图的强烈联系
原文:Enacted experiences can create intense personal connection to authored targets (andymatuschak.org)
情景体验的创造者,可以诱导出一种个人和创制体验之间的强烈联系。一个重要的结论是:情景体验增强了叙述的效果。
以游戏《旅程》为例,玩家只可以朝山顶一路前行。他们行经的各种环境都经过精心设计,大多数玩家会因此走完一段情感深厚的「英雄之旅」,最终达到重生和神圣升华的高潮。这不是一种被动体验:每一步都是玩家与角色共同完成的,因此角色的升华让人感同身受。
伟大的电影和书籍当然也能触动人心,但那种感觉远不如游戏来得强烈。我虽然能感同身受,但并没有真正成为故事里的角色。一切都是注定好的,我无法改变任何事情。(*译者:接媚眼也需要审美,而游戏谁都行。)
社交环境也能让人建立强烈的个人联系,但这通常不是特定的创制体验。
同样,软件环境可以建立强烈的个人联系,但它们通常不是特定的创制体验。Snapchat 的「连胜」(类似 QQ 的聊天火花)功能却是一个例外。
参考文献
Thatgamecompany, Inc. (2012). Journey. Retrieved from http://thatgamecompany.com/journey/
情景体验成为大众媒体时蕴藏极大潜力
原文:Enacted experiences have incredible potential as a mass medium (andymatuschak.org)
我相信有可能创造出一种情景体验,其主要目的是交流思想、价值观和实践——类似于完成一本书的「工作」。这是一个强有力的主张,因为情景体验可以创造出与作者目标的强烈个人联系,并且情景体验可以引导人们积极参与到赋能环境中。
途径:
-
现在,学徒制和其他社会机构(如 YC)也这样做,但这些都不是大众媒体的形式(情景体验很难满足所有人的胃口)
-
电子游戏是大众媒体,但它们几乎只被用来传达审美体验,而不是作为赋能环境的一部分
-
冥想 App 是不错的参考:引导式冥想 App 在大众媒体中提供情景体验
我认为这是 The Primer++ 的核心思想之一。
这似乎与交互是界面设计中的成本中心有本质上的矛盾。
情景体验需要由参与者的行动控制
原文:Enacted experiences require blocking on participant action (andymatuschak.org)
意外对创造情景体验而言非常重要。
游戏的「默认状态」是由玩家行动中断的。除非玩家采取行动,否则故事、战斗、建造等等活动都不会继续。游戏可能偶尔「接管」局面并在玩家不输入的情况下展开叙述,但时间不能太久,不然会扰乱玩家的情景体验。
考虑一下《钻石时代》(Diamond Age)中这段令人难忘的文字:
然后她意识到,这本书已经很久没有开口了。「下一步会发生什么?」她说到。《少龄淑女绘本入门指南》什么也没说。「Nell 寻找了一条安全的下山途径,」Nell 写道。她的视点开始移动。一片积雪映入眼帘。「不,等等!」她说,「 Nell 往水瓶里塞了一些干净的雪。」(第 308 页)
随着章节展开,《指南》给予 Nell 越来越多控制权。从故事的这一点开始,除非真正的 Nell 指引指南 Nell ,否则指南 Nell 不会采取行动。
沉浸式剧场的观众经常感受不到他们在主导整个过程。我怀疑其中一个原因是这个特性。
参考文献
Stephenson, N. (2003). The Diamond Age: Or, a Young Lady’s Illustrated Primer (Reprint edition). Spectra.
情景体验需要参与者置身的因果关系
原文:Enacted experiences require participant-situated cause and effect (andymatuschak.org)
为了创造情景体验,参与者的行动和随后的体验之间,必须建立内在的情感联系。这种联系并不需要是玩家主动造成的。关键在于,参与者要能直观得感受到,他们的行动实现了体验的某些重要部分——至少在他们不细想时能这么想。
大部分游戏在其游戏体验中都能保持这样的感觉。有时体验中穿插着玩家无法掌控的剧情场景,这样也没问题。只要玩家认为剧情场景前后的事件都由他而起,那么剧情场景也能融进整体上的主宰因果感(一定程度上)。
这个要求是智能辅导系统很少创造出情景体验的一个关键原因。一个 ITS 可能是参与性环境,但因果反应是在系统中,而不是在学生身上。学生的感觉是,他们正在被一个自动机灌输无尽的任务流。他们有一些模糊的概念,认为他们对这些任务的反应决定了接下来的任务,但因果关系发生在系统的黑匣子里,而不是作为他们制定的机制的一部分。
同样地,如果读者回答教科书中的问题,并完成其中活动,便构成了情景体验,但从内心里来说,这种经验通常感觉像「按作者说的做」。我想这是因为创制背景(书)和情景环境(实验室的一场实验、一个商业项目等)之间差距很大。
相关地,虽然不完全相同:情景体验需要阻断参与者的行动。
对话若涵盖多个讨论者的常青笔记则可能会促进协作意义构建
常青笔记可以提高谈话的信息带宽,但是当多个人写了与一个讨论主题相关的常青笔记时,在「对比想法」的时候就会有一些特别有趣的事情发生。讨论者可以不再依靠口头上的粗略对比,而是可以通过逐字逐句的形式一一对照。且每个人对笔记的处理方式都会有所不通,因此不必追求做到 1:1 的对应。这点我所有想要表达的:对于同一个问题,不同的人从从不同的角度理解它,各自关注的含义也不尽相同,最终,他们用不同的内容将其架构出。
有了上述推理,我的直觉是实际生活中应该接入这样的系统,但协作式知识管理系统往往会衰落
因此这些只是纸上谈兵:我并没有多次经历在常青笔记中逐字对照观点的讨论模式,因此我还不算真正的理解了它们。
参考文献
与 Ben Reinhardt 的对话,2020-03-15
- Ben 可爱地称这种概念为「Zettelconversation」。
常青笔记的标题就像 API
原文:Evergreen note titles are like APIs (andymatuschak.org)
常青笔记划分合理,命名恰当的话,得到的标题就是对笔记内容的抽象。由此一来,整篇笔记讨论的概念可以用这个抓手来引用(见概念抓手,由 Alexander 提出)。实际上,标题寥寥数语便能勾勒出笔记内容轮廓:每天都在笔记中构筑概念并改进笔记的「API」,将大量笔记提炼抽象为单则笔记的能力,也会更上一层楼(例如,作为大众媒介,情景体验具有难以置信的潜力,作为知识工作基本单位的常青笔记写作)。
一些有效的笔记「API 设计」技巧:关注点分离(常青笔记应该是原子化的),精准标题(笔记标题建议使用成分完整的短语来突出主张),和正面阐述(笔记标题建议用正面阐述来促进理论系统化)。
相关笔记:有根据的主张,Qian 等人提出
参考文献
与迈克尔-尼尔森的对话,2019-12-16
常青笔记是发展大胆想法的安全场所
原文:Evergreen notes are a safe place to develop wild ideas (andymatuschak.org)
人一旦隐约冒出了个新想法,很容易开始蠢蠢欲动,想立即写下这个想法,并将其就地完善。但是写不下来才是常事,因为有实际困难和感情障碍的因素:这个想法可能还不够坚实,不足以直接处理。空空白纸可能会让人心生畏惧;想法中的主张似乎还是比较模糊。
不如逐步孕育这个大胆想法,任其逐步发展。具体而言,就是渐进地书写一些常青笔记,其中每则笔记都描述这个想法的某个侧面。所有笔记的范围则是具体确凿的:只描述一个原子概念即可 (常青笔记应该是原子化的, 常青笔记应面向概念)。
一开始甚至不需要将这个想法与任何先前思路关联上。但随着时间的推移,你可以逐步将其与其他或新或旧的概念连接起来。另见:间隔重复对于逐步完善灵光一闪可能有用。
你可以在写作的同时创建推测性的大纲,将这些碎片串联起来,随着时间的推移而聚沙成塔,形成更连贯的整体。(笔记应该让你吃惊和知识工作应能聚沙成塔)。
相比之下:头脑风暴往往可以替代缺位的见解积累系统
参考文献
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
史蒂芬·约翰逊(Steven Johnson)有本书颇富洞见,这本书描述了科研工作者和普通人得到新想法的过程,并将其称为「慢直觉」。他强调,实验空间对此不可或缺。这种空间使得各种想法可以自由交融(Johnson,2011),因而是慢直觉得以运转的先决条件。人人思路开阔的实验室便可以提供实验空间,旧巴黎里的咖啡馆也可以,在那里知识分子和艺术家能自由地讨论各种想法。我认为卡片盒同样是实验空间,因为卡片盒也能实现各种想法的自由交融,并从中孕育出新颖见解。
每一项知识性的努力都是从已有的观念开始的。之后这些观念在进一步的探究过程中转化,并能成为后续努力的起点。这基本上就是汉斯·乔治·加达默尔(Hans-Georg Gadamer)所说的解释学循环(Gadamer,2004)。
Pirsig, R. M. (1991). Lila: An inquiry into morals. New York: Bantam Books.
他没有预先判断新想法是否合适,也没有试图将他们有序排放,而是仅仅让它们流入脑海。因此,这些新想法有时冒得如此之快,他的记录速度甚至都跟不上了。当前问题,以及一整套形而上学的思辨,其内容丰沛之极,思想之流已然化作一场山洪。思绪片段不断向各个方向延展,因此他读得越多,需要看的东西就越多。这就像文丘里效应,无穷无尽地把各种想法吸纳过来。他发现有无数的东西要读,有无数的线索要跟......太多......太多......穷尽凡人一生也无法将其清晰梳理。他业已身陷其中。(译注:文丘里效应,高速流动的气体附近压强减少,从而产生吸附作用)
常青笔记可以提高谈话的信息带宽
原文:Evergreen notes can increase conversational bandwidth (andymatuschak.org)
如果谈话时提起了某个话题,而你恰好对此洞见颇深,那么谈话这一媒介的约束便很让人恼火:在谈话中间传达细节丰富而较长篇幅的想法是很难的。如果你发表过关于这个话题的文章或书籍,将这些材料分享给对方,以便其后续阅读总是可取的。但发表作品的门槛挺高。你可能积累了很多颇有思考的知识,但还没有将其记录下来,编纂成可供发布的文章。常青笔记正好能填补这个空缺。常青笔记不像文章一样具备叙事结构和流畅行文,但每篇常青笔记再经过足够打磨,完全能单独成篇,并后续不断完善。分享这样的常青笔记能够增加谈话的信息带宽。
在谈话这样的情境中,常青笔记在某些方面比完善的出版物更有用。常青笔记应该是原子化的,所以常青笔记很短,而且主题非常明确。事实上,常青笔记通常短得可以在谈话中间即刻阅读。阅读传统出版物花的时间太长了,所以只能充当后续的参考材料。常青笔记的内容则可以实时推动谈话进展。
我发现在 Twitter 上常青笔记特别有用。在 Twitter 上回答微妙的问题往往有点抓狂,但给出常青笔记链接,并附上一行总结,往往效果不错。有时笔记标题作为总结足矣。
一旦涉及到多人的笔记,这种效果尤为显著:对话若涵盖多个讨论者的常青笔记则可能会促进协作意义构建。
常青笔记工作流能降低改稿的情绪负担
原文:Evergreen notes lower the emotional stakes in editing manuscripts (andymatuschak.org)
在写作中往往要「忍痛割爱」,你挥笔成章的一腔心血似乎付诸东流。割爱后往往会造成不闭合的行为环(见关闭开放性循环):你想要确保这些想法不会遗失,能最终发表在某处,所以你现在要找个地方记住这块内容(或者在合适的地方记录下来),这样以后你写其他稿件时,你就能想起来并把它用上。(译注:此处的开环指的是你没写完的想法,因为没能妥善处理,而成为心病)
但如果使用基于笔记的可执行的写作策略,那么大部分工作都可以在写常青笔记的过程中完成。即使一份材料对某一特定作品来说不重要,也可以把它变成持久的笔记,和其他笔记组成网络(常青笔记应该有密集的链接),这有助于未来的洞见(见常青笔记的写作有助于洞见的积累)。或者,如果这个想法需要进一步完善,它可以添加到写作收件箱中(为短暂的和不完整的笔记提供写作收件箱)。
这个比较具体的事例可以佐证一个更广泛的观察:通过释放阀可以让非线性思维的想法在输出时更加线性。
事实上,如果你采用 「非指向」 的可执行写作策略(此时你的文字大多来自于先前存在的笔记中),那么大部分文字甚至不是针对该手稿而写就的。这时候纵使从手稿中删除一些文字,还有关系吗?
相关笔记:软件界面经常将破坏性操作作为最终决定,而不是视情况而定的选择
参考文献
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
最困难的任务之一是严格删除论证中没有作用的东西 ——「对心头肉开刀」。42当你把有问题的段落移到另一个文件中,并告诉自己以后可能会用到它们,这就变得容易多了。
常青笔记实现顺畅而渐进的写作(「渐进写作」)
常青笔记是原子性的(常青笔记应该是原子化的),并含有大量链接(常青笔记之间应该建立大量链接),因此中止或者继续写作常青笔记都非常轻松。这有助于关闭开环。
这些笔记麻雀虽小五脏俱全,如同定期检查点。每篇笔记只需要几分钟的时间即可写就,但是因为这些笔记是常青笔记,每篇笔记都是可依赖的坚实砖石——笔记完备地表达了自身描述的概念(常青笔记应面向概念)。当然,我们日后还会对笔记内容逐渐迭代完善,但每次迭代时,笔记仍将是一个基本完整、自成一体的单元。
相比之下,当我们处理一份正在编写的长篇手稿时,我们要同时应付许多想法,这些想法完成度各不相同。这份文本在各个部分的完备程度都千差万别。同时文本很长,很容易迷失自己的位置,或者在继续工作时忘记其他相关点的位置。每天开始工作和结束工作都像是繁重的任务,都大量依赖工作记忆。
参考文献
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
因为每个任务的结果得到记录,它们之间可能存在的联系因而变得清晰可见,我们便可以很容易地随时接着上次停下的地方继续工作,而不必一直把它记在心里。
如此这般,我们不再需要记住还有什么事情没完成,也可以从上次停止的位置继续完成这项任务。这也正是通过写作思考的优势之一,即把所有事情置于思绪之外。
只有当工作记忆中没有任何其他东西萦绕不去而占用宝贵的精神资源,我们才能体验到艾伦所说的「心灵若水」——在这种状态下,我们可以专注于眼前的工作,而不会被其他想法分散注意力。
Wozniak, P. (2018, June 9). Incremental writing. Retrieved December 30, 2019, from https://supermemo.guru/wiki/Incremental_writing
常青笔记应该是原子化的
原文:Evergreen notes should be atomic (andymatuschak.org)
笔记最好只讲一件事——但要尽量描述得全面完整。
这样一来,不同话题与上下文之间就更容易建立联系。对于包罗万象的笔记,若只对笔记中的一个概念有了新想法,这个想法就难以察觉,此外指向该笔记的链接会所指不清;如果笔记过于零散,笔记间的链接网络也落得支离破碎,一些联系因此不甚明晰。常青笔记之间应该建立大量链接
写笔记没有试金石或者唯一正解,只有各种权衡。
常青笔记原子化与软件工程中的 「关注点分离」原则如出一辙。「关注点分离」原则认为,软件的模块应该只「关注」一件事,以便日后复用。但同样地,如果模块切分得太细碎,内聚不足的问题便会浮现。从这个角度看,常青笔记标题就像 API。
参考文献
从阅读笔记中创建 Zettel 笔记 • Zettelkasten 方法
我将这条原则的深层原则称为原子性原则:把同类事物放在同一个 Zettel 里,而 Zettel 之间做到关注点分离。例如,我可能在一个 Zettel 中列出很多假设当作综述。如对于严格决定论 的综述。有个与严格决定论相关的论证和相应结论则保存在另一个 Zettel 中。严格决定论下的道德责任就是一个很好的例子。这样我便能复用这篇论证,却不需要接受另一个 Zettel 中的假设,因为论证本身是足够通用的。原子化笔记促进笔记复用,而 Zettel 网络中的链接也大大增加。
常青笔记应面向概念
原文:Evergreen notes should be concept-oriented (andymatuschak.org)
划分常青笔记 最好以概念为标准,而不是按作者、书籍、事件、项目、主题等。这样随着时间的推移,而笔记不断更新、链接,你会逐步发现不同书籍和领域之间的联系(常青笔记之间应该建立大量链接)。
做笔记最直接的方法是为每本书、项目或研究课题开辟新笔记。每篇笔记都涵盖了许多概念,因此若某个概念以后再次出现,你可能很难找到你曾写过的内容:你必须记住哪些书或项目涉及此话题(相比之下:常青笔记应该是原子化的)。
你如果读到另一本书,其中讨论了相同概念,你会在那本书上写新笔记。这种方法是无法聚沙成塔的(有悖于知识工作应能聚沙成塔)。你对这个概念的新想法,并没有与旧想法结合起来,形成更坚实的整体:关于这个概念,你只有一盘散沙般的一堆笔记,每条笔记深藏于更大的文件中,甚至指代这个概念的术语都不统一。
这不仅仅是积累的问题。这种方法中,没有动力驱使你把围绕这个概念的新旧想法融会贯通。新旧想法之间难道没有张力吗?难道对概念的有力提炼,不只在将其同时考虑时出现吗?理解需要努力参与
如果我们读了两本主题完全相同的书,我们可能很容易将这两本书的笔记链接在一起。但是,新奇的联系往往会出现在意想不到的地方。在按概念整理笔记时,你可能会在不同书籍中出现的观点之间建立出乎意料的联系。你以前可能从来没有意识到这些书能联系起来——事实上,它们可能确实没有过联系,除了你发现的这一点。
按概念组织的话,记笔记会有点困难,但这种困难不无好处:写新笔记时,必须找到新笔记在整体中的位置,因此便会探索之前织就的笔记网络,于是就有机会寻访意料之外的地方。
随着时间的推移,笔记会聚沙成塔,并能以越来越复杂的方式组合起来(常青笔记的标题就像 API),新颖洞见油然而生(常青笔记有助于积累洞见)。
参考文献
用 Zettelkasten 扩展你的思维和记忆 • Zettelkasten 方法
如果你已经把两篇文章拆分了,Zettelkasten 会帮助你把两篇文章联系起来,找出相似点和对立点。 因此,你将能够提炼出一大堆文本,并随着时间的推移找到新东西。
跟踪连接和探索部分笔记网络之后,你会冒出新颖想法。 与显然的联系相比,不明显的联系通常更有益于创造性思考,因为它们会引起更大的惊喜。
分析文本时,由于文本是网状的整体,便要将其分解成几个部分,并且记录各部分的联系
Luhmann, N. (1992). Communicating with Slip Boxes. In A. Kieserling (Ed.), & M. Kuehn (Trans.), Universität als Milieu: Kleine Schriften (pp. 53–61). Retrieved from http://luhmann.surge.sh/communicating-with-slip-boxes
我们可以尝试在「艺术」、「展览」、「拥挤」(相互作用)、「大众」、「自由」、「教育」等一般概念下概括巴黎、佛罗伦萨和纽约的体验,以便看看卡片盒如何反应。通常情况下,如果问题的表述使得性质迥异的事物联系起来,这样的问题更有成效。
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
在旧系统中,问题是:我该把这条笔记放在哪个主题下?在新系统中,问题是:我想在哪种情况下再次看到它?
如果你需要额外步骤来理解或掌握想法,那么转瞬即逝的文献笔记是有意义的。但在写作过程的后期阶段,它们帮不到你,因为在论点的发展过程中,当你需要划线的句子时,它永远不会出现。
谈到记笔记,许多学生和学术写作者的想法与早期的船主一样。他们以立竿见影的方式处理他们的想法和发现:如果读到有趣的句子,就在下面划线。如果想做点评,就在空白处写下来。如果想到一个点子,就记到笔记本上,如果一篇文章看起来足够重要,就努力写一篇摘录。这样做会让你在很多不同的地方留下很多不同的笔记。那么,写作就意味着在很大程度上依靠你的大脑来记住这些笔记是在何时何地写下的。然后,必须从这些笔记中独立地构思一个文本,这就解释了为什么这么多人在事后根据这种先入为主的想法,借助头脑风暴来安排资源。
常青笔记之间应该建立大量链接
原文:Evergreen notes should be densely linked (andymatuschak.org)
强迫自己在笔记之间添加大量链接,我们便能打开视野,围绕眼下关心的问题,考虑还有些概念能与其关联。添加链接的行为施加了一股压力,促使我们仔细思考各个概念如何彼此联系(见理解概念需与其尽力较量和常青笔记应该面向概念),同时也实现了精细编码,能更深入地内化这些想法。
为建立合适的链接,我们需要阅读先前的笔记,这样也有机地实现了对写就笔记的间歇性回顾(常青笔记维护近似于间隔重复)。由此便会得出意料之外的发现(笔记应该让你吃惊)。
而通过记录这些联系,我们也记录了我们得出结论的过程,可能日后对我们(或我们的同事)派上用场。我们应该尽可能倾向于建立细粒度的关联。相比之下,标签是无效的关联结构。
翻阅笔记间,这些链接结成了一条条小径,以供思想空间里漫步遨游。我们忍不住就想按照层级浏览,但链接超越了一切领域和主题。优先选择关联分类法,而非层级分类法
卢曼实际上认为,...
这种结构(链接)让可能的关联具象化,相比之下,实际上记录了什么反而是次要的了。
你不一定要链接到你已经写过的笔记:在知识管理系统中,反向链接可以用来隐式定义节点。一感觉有必要就停下来写新笔记是很磨人的;链接到只有标题的页面则毫无拘束。(参见常青笔记实现顺畅而渐进的写作(「渐进写作」))。
捕捉到的链接不仅能持续提供价值,它们还可以帮助你在起草时引导你的注意力:非线性思维的释放阀可能支持改善线性输出。
参考文献
Luhmann, N. (1992). Communicating with Slip Boxes. In A. Kieserling (Ed.), & M. Kuehn (Trans.), Universität als Milieu: Kleine Schriften (pp. 53–61). Retrieved from http://luhmann.surge.sh/communicating-with-slip-boxes
**2. 链接的可能性。**因为所有的卡片都有固定的数字编号,你可以添加尽可能多的引用(译者注:指链接其他卡片笔记)。核心的概念可以有许多链接,这些链接显示了我们可以在哪些上下文中记录了与它们相关的材料。通过链接,我们可以在不需要太多工作或纸张的情况下,解决多重存储的问题。使用这种技术,我们把一个新的卡片笔记放在哪里就不那么重要了。如果有几种可能放置的位置,我们可以按自己的意愿选择一个,只需通过链接或引用来记录联系就好了。通常情况下,我们正在工作的上下文都会暗示了与其他笔记多种多样的链接,特别是当卡片索引已经很庞大的时候。在这种情况下,重要的是要捕捉到这些链接,但同时也要马上在被链接到的笔记中记录下反向链接。在这个过程中,我们卡片盒中的内容变得更加丰富了。
在任何情况下,我们写笔记或进行查询的过程中,如果能成功激活卡片盒内部的链接网络,与卡片盒的交流就会更加有成效。记忆并不是逐点存取的总和,而是利用内部关系,并且只有在降低自身复杂性的情况下才会有效。这样一来,当你想要检索的时候,我们可以获得比大脑当时所能想到的更多的信息。最重要的是,这些信息比以往以笔记形式存储的信息更多,卡片盒提供了从未计划过的,从未预想过的信息组合的可能性。
例如,我们可以问为什么博物馆总是门可罗雀,而另一方面,莫奈、毕加索或美第奇的画展又人山人海,太过拥挤。卡片盒在「偏爱有时间限制的东西 」的角度下接受了这个问题。当然,(卡片盒)内部已经存在的联系是有选择性的,正如这个例子要证明的那样。这些联系并非显然,因为我们必须跨越笔记者和卡片盒本身之间的边界。
这种结构(链接)让可能的关联具象化,相比之下,实际上记录了什么反而是次要的了。
常青笔记写作是知识工作的基本单位
原文:Evergreen note-writing as fundamental unit of knowledge work (andymatuschak.org)
如果非要为知识工作者找一个主要标志,我所知的最好指标,可能是每天所写的常青笔记的数量。写笔记可以是高超的技能,但是大多数人把笔记当作一个存放想法、给想法打草稿的容器而笔记写作实践通常是无效的 。
-
写笔记有助于写下的文本积累:这些笔记是可执行的写作策略的燃料,特别是如果你在写作时创建推测性大纲。
注意事项:「更好地记笔记」这个描述太过流于表面;核心在于「更好地思考」
参考文献
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
如果写作是探索性研究和一般性研究的媒介,并且除了做研究,不必学别的,那么就没有什么比写作更重要了。
专注于写作,好像其他的都不重要,并不意味着其他事情就敷衍了事,相反,专注写作一定会让你做事方法有所该关注。当你参加讲座、讨论或研讨会时,有明确、具体的目的,你就会更加投入、更有的放矢。
即使你永远不会去写草稿,写作第一的策略也会提高阅读、思考和其他方面的技能。
常青笔记有助于积累洞见
原文:Evergreen note-writing helps insight accumulate (andymatuschak.org)
创造性工作中的许多日常思考就是丢失了,就像潮水中的沙堡。短暂性在低保真思考中实际上是有用的,但在许多情况下它只是偶然性。严肃的思考应该以常青笔记的形式进行,以便于积累。
卓越洞见从之前的所思所想中涌现。那么,这种思考在哪里发生?它可能在你的脑子里,或者在你笔记本上一系列转瞬即逝的草图中,但是知识工作应能聚沙成塔,而上述机制都损耗巨大。
考虑一下你本来有望实现的一些假设性的洞察力飞跃。为了实现这一飞跃,你通常需要同时发展许多独立的、部分成型的想法,直到它们在灵感的闪现中突然融合在一起。如果你需要同时迭代多个作品,你可能会很难把它们都记在脑子里。
相比之下,由于常青笔记应该是原子化的,它们的范围足够小,你可以在半个小时内开始并完成一个笔记(见常青笔记实现顺畅而渐进的写作(「渐进写作」))。尽管如此,你写的每一个笔记都代表了你对这个特定想法的思考增量,每一个笔记都丰富了愈加宽阔的链接网络(常青笔记之间应该建立大量链接)。因为这些是常青笔记,你现在有一个明确的立足点,可以在这个具体的想法上进行迭代。
你所写的笔记将与你所读的材料相互作用(常青笔记有助于积累阅读成果),并将形成新稿件的基础(可执行的写作策略)。
而如果你不能就你的想法写出哪怕是一个原子笔记,间隔重复对于逐步完善灵光一闪可能有用。
相关笔记:「更好地记笔记」这个描述太过流于表面;核心在于「更好地思考」
参考文献
Luhmann, N. (1992). Communicating with Slip Boxes. In A. Kieserling (Ed.), & M. Kuehn (Trans.), Universität als Milieu: Kleine Schriften (pp. 53–61). Retrieved from http://luhmann.surge.sh/communicating-with-slip-boxes
当然,独立性预设最低程度的复杂性。卡片盒需要持续使用数年时间才能达到突破点。在此之前,它仅仅是一个容器,以便我们获取存入的内容。但这种情况会随着卡片盒的规模和复杂性的增加而改变。一方面,提出问题的方法和场合越来越多,卡片盒将成为一种通用工具。
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
常青笔记有助于积累阅读成果
原文:Evergreen note-writing helps reading efforts accumulate (andymatuschak.org)
围绕所读内容写笔记,以求深刻内化文本很重要,但不要仅仅描述你所读的具体书籍写了什么,你可以(也应该)写下你的笔记,让你的阅读所得在彼此之间,在你自己的想法之间相互作用,从而逐步聚沙成塔(见常青笔记有助于洞察力的积累,知识工作应能聚沙成塔)。
这也是我们写常青笔记的原因:如此一来,如果我们遇到一本书,其中讨论了我们已经写过的概念,我们就会被逼着把新的想法与我们先前的概念结合起来。当然,我们在阅读时通常会这样做,但我们仅限于调用容易出错的记忆,找出可能与此相关的作品。外化的笔记系统大大消除了这种限制。
这就是为什么常青笔记应面向概念的部分原因:这样,我们的笔记结构就会促使我们注意到不同文本——以及我们自己作品中的观点之间的关系(见常青笔记之间应该建立大量链接,笔记应让你吃惊)。
你写的笔记也会打下新的手稿的基础(可执行的写作策略)。
这是常青笔记写作是知识工作的基本单位的原因之一。
如何将阅读标注处理成常青笔记
原文:How to process reading annotations into evergreen notes (andymatuschak.org)
重要的是写你所读,以求内化。在阅读过程中,你已经标记了那些看起来相关的段落,并且你已经简单记下了你的想法(如何在阅读时收集观察结果)。现在,我们会把所有这些都处理成长久化的笔记。
首先:到底应该写什么笔记?我们要写的常青笔记应面向概念,那么我们面向的关键概念是什么?你需要先退一步,看到整体上一个概念结构的图。要做到这点,你可以把草稿聚成「簇*」,并观察一簇一簇的草稿间萌生的概念结构。或者,你可以勾勒出一幅思维导图或可视化的大纲。你所观察到的结构不必与阅读材料的结构相匹配:只要对你自己有意义就可以(自主思考)。(*译注:原文 cluster,指想法聚类而成的群集)
一旦对这些概念图景有了些了解,你就可以开始你迭代性的笔记写作了。这里我总结了 Christian Tietze 的流程,也是我目前正在使用、适应的:
- 泛写笔记
写一条宽泛的笔记 ,它概括草稿簇中的一个「大想法」。
- 如果有多个「大概念」,那这样宽泛的笔记就多写几条,以保证常青笔记应该是原子化的。
-
精写笔记:遍览草稿簇中的单独卡片,写下更细化的想法,捕捉簇中的原子观点。
-
连接:
在现有笔记中,搜索与新笔记相关的部分。必要时进行链接、合并和修改,以代表你对这些想法的新的、综合的见解。
-
修改:回到宽泛笔记中,在不混淆重点的前提下,根据你在写详细笔记时学到的东西和展开的细节来改进你的总结。删除不必要的详细说明;如有必要,基于这次更新过程中的收获,更新其他的宽泛笔记。
-
重复上述过程
参考文献
从阅读笔记中创建 Zettel 笔记 • Zettelkasten 方法
其次,我发现一个簇的内涵如果牵扯太多前置内容,以至于不能单独拿出来,那它本身便可能是一个总结性的结论,它可能基于很多假设,或是基于一个需要解释的复杂模型。对此,我会先准备好这个结论,然后分支出一些记录细节的笔记(副枝),去捕捉所有必要的想法、观点。这个场景需要链接功能:细节笔记会指回概念簇,而概念簇会提及那些写了细节的笔记。
簇的分类不是按书的大纲来的。例如一本书的索引就是一种簇,它汇集参考文献,无关目录或思想流。类似的方法对于术语定义也很有用:收集文本中的用例和定义本身,以便清楚地了解术语的含义。簇可以是基于主题的,就像书的索引一样。
这就是我所说的「与内容正交*」:它们不依附于页面和章节的继承关系。相反,它们围绕着你认为合适的任何目的本身形成概念簇。(译注:此处指簇的维度与内容互相独立、互不影响。线性的笔记必须依赖上下文,让鸭鸭头疼,但簇里面可能归纳的是某个主题方面的内容,因此与内容无关)
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
确保你以后能够找到这个笔记:你可以把它链接到索引中,或者链接到你的讨论或主题的入口笔记(确保该入口笔记已链接到索引中)。
常青笔记和 Zettelkasten 卡片系统的异同点
原文:Similarities and differences between evergreen note-writing and Zettelkasten (andymatuschak.org)
我写常青笔记很大程度上是受 Niklas Luhmann 的 Zettelkasten 卡片系统以及其当代支持者的启发。但我使用「常青笔记」这个不同的术语而非 Zettelkasten 一词, 不仅是因为两者有一些截然不同的地方,而且也想在这方面脱离 Zettelkasten 的文化语境(因为有一些先验的价值倾向),给自己一点探索相关想法的空间。
关键的相似之处:
-
面向概念(常青笔记应面向概念)
-
原子化(常青笔记应该是原子化的)
-
对联系的强调(常青笔记之间应该建立大量链接)
-
怦然相遇之妙(笔记应该让你吃惊)
-
看重自我想法的生发及其成长,而不仅仅是积累、总结他人的想法(常青笔记是发展大胆想法的安全场所,自我思考,而非庸常之书
- 强调使用自己的话,即使在描述别人的观点时也是如此(围绕所读内容写笔记,以求深刻内化文本)
关键的不同之处:
-
常青笔记包含的一些方法围绕笔记写作建立,笔记写作的存在扩大了它的适用范围:
-
这是一种可以捕捉比 Zettel 更为碎片,并随后对其逐步修改的方法:为临时和不完整的笔记而设的写作信箱
-
这是一种少见的的收件箱管理方法:间隔重复可以降低破坏性收件箱维护操作的风险
-这是一种可以随着时间的推移,系统回顾问题以及原始笔记的方法:间隔重复对于逐步完善灵光一闪可能有用
- 具体的日常实践:我的晨间写作
-
-
更抽象地讲,常青笔记使用的是更广泛的笔记类型分类法,它描述了一种层级结构以及方法,用于捕捉极早期的想法记为笔记,并将聚簇的笔记* 渐进发展为一种层次递增的「表示」。相比之下,Zettels 主要是为了表示处于「中间」层的概念。(*译注:原文为 cluster —— 笔记写多了以后,好多关系较「近」的笔记形成聚类,一簇一簇的)
- 我的系统中,标题是非常重要的索引。而 Zettel 通常是用数字标识符;尽管现代的 Zetteler 可能会给自己的笔记起标题,但显然不是以「创造 API」的方式:常青笔记的标题就像 API
-
上下文反向链接 大大改变了「链接」的性质,允许其中「涌现」的产生,如反向链接可以用来隐含地定义知识管理系统中的节点
-
我在笔记中嵌入了间隔重复记忆系统:助记媒介可以扩展到个人笔记。这大大改变了媒介 —— 尽管是以一种我尚未充分理解的机制。
-
我的笔记是可以公开查阅的,我把它们融入了公开的对话。我尚未理解这种做法有什么影响,但肯定大幅改变了我与笔记的关系,并引发了富有价值的讨论。可以从一些很有意思的网络化智能角度考虑这种做法。我不知道哪些足够有名的 Zettelkasten 是公开的而且作者还在持续使用的。卢曼的 Zettelkasten 业已存档,但卢曼的做法代表另一种关系——他没有在对话中使用 Zettel,并利用这种互动为其写作提供新知。
还有最后一个,呃 …… 比较尖锐的区别:我自己系统的主要目的,是在个人的核心创意项目中发展想法。当代 Zetteler 的笔记目的,似乎主要是对他人的想法写笔记。如果是用来记录自己的想法的,那么这些想法多半关于兴趣爱好,而不触及核心创意工作。他们的这些做法都涉嫌触及到对笔记写作大谈特谈的人很少有严肃的使用场景中的问题。我不知道具体如何改变的,但我的使用场景在很大程度上塑造了笔记写作的实践。
为有潜在价值的参考引用建立一个阅读收件箱
原文:A reading inbox to capture possibly-useful references (andymatuschak.org)
浏览器标签逐渐堆积的,PDF 文件夹不断激增,这一切真让人焦虑。为了避免这一点,重要的是要有一个程序,来自动化地保存阅读中那些有潜在价值的参考材料。
一旦捕获材料,收集箱中每个项目要么:
-
删除(最后看起来不值得详细阅读)
-
被认真阅读(即围绕所读内容写笔记,以求深刻内化文本)
-
被浅读,并在参考书库中存档
-
(也许)添加到其他一些清单中,如「待烹调的食谱」
重点在于,这不是一个「也许有一天会读」的清单。它不会无限期地积累,因为那样的话,它就不是一个可靠的方法来闭合开环。
因此,在构建一个阅读收件箱时,重要的考虑因素是:
-
书籍、文章、网页的零阻力捕获(以轻松地关闭该循环)
-
零阻力地查看收件箱项目对应的阅读量
-
零阻力地跨类型列举(译注:作为清单或者引用)
-
收件箱应鼓励删除滞留的项目(例如,当一个项目被多次跳过时,应该很明显。)
有趣的是,现有的「稍后阅读」或参考管理系统都不符合这些标准。它们通常是按内容类型划分的,而且没有一个系统鼓励删除徘徊的项目。另见:谨防自动导入阅读收件箱。
阅读收件箱是我在使用智能手机时遇到的事情的一个重要泄压阀(见用手机收集和分流,而不是(通常)阅读)。
相关:渐进阅读
参考文献
在阅读网页和 RSS 时记笔记 • Zettelkasten 方法
收件箱是保存我们想要或需要注意的物品的地方。很多东西永远不会进入收件箱;我们可以隔绝外界噪音。
发现有些进入阅读清单的东西毫无用处,就把他们扔掉。把文章列入阅读清单上,只是做了小小的承诺:我们承诺以后会去看看,但是如果文章不能经受批判性的审视,我们就不必遵守承诺。
为临时性的和不完整的笔记设置写作收件箱
原文:A writing inbox for transient and incomplete notes (andymatuschak.org)
即使你想要写出常青笔记,其中大部分也是从临时的笔记开始的。所以你应该能零阻力地捕获想法(关闭开环),然后可靠地将它们逐步完善,写成常青笔记(知识工作应能聚沙成塔)。这意味着两个重要的机制:
-
一个能快速捕获临时笔记的方法,将它们与常青笔记本身明确隔离;以及
-
一个笔记暂存处,存放你想进一步完善笔记。并且应有一套流程实践,能可靠地清空它(收件箱需要可靠的清空流程才有效)
为此,我使用了一个「写作收件箱」。好多想法的种子、工作日志中的摘录、读书笔记、单行卡片等,都从这个队列开始的。在我的晨间写作中,我会查看这个收件箱中的笔记,并花时间深入任何触动我想法的东西。多数日子里,我的写作时间主要会这么使用。
我写作收件箱中的许多笔记会写成常青笔记,但不是所有笔记都适合(或可能)这么做。如果某个笔记看到几次,却仍不够有趣,最好是归档或删除它。(这里有一个挑战:收件箱维护的分流策略(如「收件箱归零」)往往不容易使用)
当我在电脑前时,我把笔记直接捕获到我的写作收件箱中。我同样也会设立在外出时为写作收件箱捕获的袖珍便笺来投喂临时笔记。
参考文献
Zettelkasten 的构建模块 • Zettelkasten 方法
谨防自动导入阅读收件箱
原文:Beware automatic import into the reading inbox (andymatuschak.org)
我们很容易把 RSS 订阅、电子邮件简讯等与自己的阅读收件箱混为一谈,但它们应该被明确分开。(见为有潜在价值的参考引用建立一个阅读收件箱)
收件箱需要可靠的清空流程才有效。这意味“清空”非常重要——所有添加的内容要么被阅读,要么被删除。因此,如果你觉得一篇参考文献有意思,可以把它添加到列表中,并相信自己以后会回顾。确保该属性的一个有效方法是自己添加所有东西。
自动导入文章时,你会在阅读时看到很多与你不直接相关的内容。这些不相关的材料与那些你因为有强烈的情感联系而特意添加的内容混合在一起,冲淡了后者。
自动导入文章时,阅读收件箱可能间歇地长得令人生畏。这使你不愿意打开它,从而让收件箱不那么可靠。
自动导入文章时,梳理收件箱的成本就会变得更加高昂。为了决定是删除还是仔细阅读某篇文章,你必须首先了解它们是什么。相比之下,如果你手动添加一篇文章,你通常已经大体上了解文章讲了什么,比如了解表明文章价值的上下文。而在评估要阅读的文章和实际阅读它们之间来回切换会损耗阅读动力。
如果你手动添加内容,你会对自己造成反向压力:你会大概意识到你的收件箱变得多大——因此在添加一些价值可疑的东西之前,你会三思而行。
参考文献
在阅读网页和 RSS 时记笔记 • Zettelkasten 方法
网络上充满了噪音,我订阅的这部分网站也是如此。仅能靠自己找到有用的信号。这意味着我必须决定我想知道什么,以及什么是可以忽略的。
收件箱需要可靠的清空流程才有效
原文:Inboxes only work if you trust how they’re drained (andymatuschak.org)
可靠的收件箱是强大的,因为它让我们关闭开环并专注于工作本身,而无须注意元工作。
但有个故事似乎循环往复地出现:
-
你设立了新的待办事项清单。局势一片大好!
-
你添加新的待办事项,把完成的勾掉。一天天过去了。
-
有件事需要处理。把这件事添加到待办事项清单之前,你犹豫了一番:这件事可能会迷失在待办列表中找不到,而你必须把这件事办完。
-
因此,你为这件特别的待办事项写了张便条,没放在待办事项清单里。
-
便条越来越多。现在你又有了一个待办事项清单!
-
重复上述过程。
只有足够可靠的收件箱才能让我们关闭开环——也就是说,往收件箱里面添加任务后,能够相信这些任务在其中停留合理的一段时间即能得到「处理」。「处理」是模糊的:你只需要觉得这些任务的处置大致反映了你的真实偏好即可。如果收件箱中 90%的任务都放弃了,但那 10%才是你真正关心的,那么这样的收件箱系统是值得信赖的;如果收件箱中 90% 的任务最终完成了,但那没有完成的 10% 却是你真正关心的,那么这样的收件箱系统不值一提。
在高效的收件箱中,保持这种信心可能很容易,因为完成率自然超过收集率。但大多数知识工作者的收件箱并不是这样的。这两个速率时常流变,这就造成了瓶颈。并非每项任务都需要处理,但很容易对处理能力过于乐观,所以任务逐渐积压。
有时我们可以降低收集率;例如小心自动导入阅读收件箱。通常完成率还必须提高,但很难;例如,见维护收件箱的分流策略(如 Inbox Zero)往往太过脆弱。
参考文献
Matuschak, A. (2019, December). Taking knowledge work seriously. Presented at the Stripe Convergence, San Francisco.
不应该设置多处收件箱
原文:Inboxes shouldn’t be split into multiple places (andymatuschak.org)
收件箱需要可靠的清空流程才有效,但做到这点很难。如果对应单一概念的收件箱(如「要读的东西」),在实体上却分散在许多不同的地方,可靠地清空收件箱更是难上加难。
可靠的收件箱要求流出率>=流入率,但如果一个收件箱分布在许多地方,就很难看到和管理这些速率(例如,通过放弃或推迟项目)。
一个解决方案可能是创建虚拟收件箱,为该概念收件箱的项目所在的几个「地方」提供一个统一的界面;见我的阅读收件箱实现。
我的阅读收件箱实践
原文:My implementation of a reading inbox (andymatuschak.org)
本笔记描述了我是如何在我的系统里实践为有潜在价值的参考引用建立一个阅读收件箱的。
阅读有多种口味,不同的工具适合捕捉和阅读不同类型的媒体,但我会同时「清空」这个收件箱内的所有类型的项目。而由于不应该设置多处收件箱,所以我创建了一个「虚拟」收件箱,为所有类型的项目构建出一个统一操作的抽象层。
网页
数据库是由 Pocket 管理的。我可以通过桌面和手机上的浏览器扩展来添加网页。
我选择 Pocket 是因为它是免费的,有像样点的 API、不错的扩展,而且可以用作书签管理器。
我通过归档网页来整理它们;我通过将它们扔入回收站来销毁它们。
PDFs
我把它们保存在 ~/Documents/Archive/Inbox
。我有一个 Alfred 工作流程,将当前在预览中打开的 PDF 复制/移动到这个文件夹。
我在 Skim 中阅读 PDF,因为它支持链接到特定位置和可导出注释。
我把 PDF 文件移到 ~/Documents/Archive
,然后把它们添加到 Zotero。我想丢弃它们时就将他们移入回收站。
电子书
我把它们保存在 ~/Documents/Archive/Inbox
。
我用 Clearview 阅读电子书,但我很讨厌它(参见所有桌面 EPUB 阅读器都很糟糕)。
电子书也一样,我通过将它们转移到 ~/Documents/Archive
并将其添加到 Zotero 来存档。我想丢弃它们时就将他们移入回收站。
实体书
我把代表书的 .bib 保存到 ~/Documents/Archive/Inbox
。我创建了一个快捷方式来使其快速完成。
我通过将电子书移到 ~/Documents/Archive
来归档,然后运行 file_epub.sh
,根据它们的元数据重命名。然后我从 Inbox
文件夹的 .bib
中删除它们的条目。
外出时方便抓住灵感的口袋便笺
原文:Pocket memo pad to capture into writing inbox while out (andymatuschak.org)
我用一个带孔的 A7 便笺(Maruman Mnemosyne N193A)来记录我外出时的临时笔记。谈话中获得的灵感、行走时的想法等等,都会记录于此处。我通常会附上一些背景,以帮助我以后确定方向:一个日期、一个地点、一个人,等等。
便笺并不是这些笔记的最终归宿:它实际上是一个收件箱,把信息提供给为临时性而不完整的笔记建立写作收件箱。在我的晨间写作练习中,我断断续续地处理便笺上的笔记,把它们发展成常青笔记,把它们转移到我的写作收件箱中,或者把它们丢弃。
我在转移时会一边处理一边撕下纸张,所以我总是知道笔记本的状态:任何还保留在笔记本上的非空白的页面都是需要处理的。
每个想法都有自己的页面。这有助于我处理它们(常青笔记应该是原子化的):一个好的谈话可能会产生半打便笺页,但每一个可能都需要非常不同的心理背景来处理。
我使用这本便笺来帮助我写你所读,以求内化。在阅读一本书时,我会把我发现的有趣的东西记录在便笺上。和以前一样,每个想法都写上一页,我还会标注页码和日期。
便笺很容易放在我的口袋里,塑料封面相当耐用,所以我一直都带着一个,还有一支笔。
采购
-
https://www.amazon.com/gp/product/B00T9CHYZO/ref=ppx_yo_dt_b_asin_title_o01_s00?ie=UTF8&psc=1(22.99 美元 / 10 个,使用 Prime 免运费)
-
Maruman Mnemosyne N193A Memo Pad - Twin Ring - Modified A7 - 5 mm Rule | JetPens ($2.10 / ea, costly shipping)
它们有 50 张,所以每张要 4.5 美分,一点也不便宜!一本非常有趣的书可能要花 2 美元来处理。我想这应该还好。
我使用的是 Uni-ball Signo UM-151,价格约为 1 美元。这支笔感觉性价比很高,它的笔帽很可靠,很耐用,而且着墨的动作很均匀。
参考文献
从阅读笔记中创建 Zettel 笔记 • Zettelkasten 方法
所以我总是随身携带一个小巧的 A7 可撕式便笺和一支 0.5 毫米的自动铅笔(柔软的 2B)。这是我真正无处不在的记录设备。当我不在家的时候,我也用它来做阅读笔记。
收件箱维护的分流策略(如「收件箱归零」)往往不够稳健
收件箱需要可靠的清空流程才有效,而收件箱归零是确保流程发挥作用的一种方法。它通过积极提高流出率来,降低项目排队等候处理的时间(理论上为一天)。
在 Getting Things Done (GTD) 中,大卫-艾伦建议,你可以通过策略性延后、委托或放弃任务来提高代办队列的流出率。「收件箱归零」是 Merlin Mann 对这个建议的一个实现。它通过每天归零整个收件箱的方式,来确保队列的流出率得到充分提高。这个方法简单粗暴,但确实能保证流出率恒大于流入。
挑战
你必须对收件箱中每一个项目做处理,判断去留。成本上既巨大,也没有支付意义(除非收件箱比较小)
明确地点「推迟任务」会带来不必要的情绪压力:只有在流入恒大于流出的情况下,「收件箱归零」才是必要的。如果流入率是波动的,时常低于流入率,你仍然可以在合理的时间范围内处理所有的事情,而不需要每日都归零。
明确地点「放弃」很难,因为软件界面经常将破坏性操作作为最终决定,而不是视情况而定的选择。
而考虑方法的落地,「收件箱归零」通常会导致对推迟麻木:我们太容易把一个任务一次又一次地推掉。艾伦建议,人们应该定期进行自我反思性的审查,重新考虑那些被反复推迟的任务,但这些审查需要做更多的决定。长期使用可能很难坚持。
最后,以这种方式处理收件箱时,会有压力鼓励你简单地多做这些任务,这可能不是你真正想要的。
机会
一个更理想的机制将确保等待时间保持在可容忍的范围内,但周期不一定非得是 1 天。我们还必须考虑要做的决定的数量。我宁愿做更少的决定,但容忍更长的平均等待时间。
一个可能的实例:间隔重复可以降低破坏性收件箱维护操作的风险。
参考文献
Allen, D. (2015). Getting Things Done: The Art of Stress-Free Productivity.
43 Folders Series: Inbox Zero | 43 Folders
Matuschak, A. (2019, December). Taking knowledge work seriously. Presented at the Stripe Convergence, San Francisco.
相比知识工作者,运动员和音乐家会更为严格精细地打磨基本技能
顶级运动员热衷于打磨基础技能——任何体育运动都适用的技能,比如新兵做的敏捷训练。顶级音乐家也是如此:例如郎朗已专业弹奏钢琴 30 年,但现在仍然在练习音阶。他们不仅仅是在机械训练:他们会仔细研究演奏视频,和教练合作,有针对性地加强这些基础技能。
相比之下,知识工作很少涉及刻意练习。阅读(人们似乎会忘记大部分读过的内容,而且他们也基本意识不到)、记笔记(记笔记通常收效甚微)、逐步完善想法(知识工作者通常没有逐步完善想法的具体策略)对于知识工作者是基本技能,但他们竟然并不会认真练习这些技能。知识工作的核心实践往往是临场发挥的。我觉得这种现象的成因,是人们难以觉察到这些技能的进步:容易觉察的进步推动技能发展。
知识工作者像运动员一样热衷追求基础技能的提升,这种说法的意味是什么?
-
本·富兰克林练习写作的方法,是找一篇他认为有说服力的文章,用自己的话重写一遍,途中不看原文。完成之后,他会比较原文和自己文章在语言上有何不同。 (本杰明·富兰克林自传,第 17 页)
-
Susan Sontag 7/5/72 (As Consciousness Is Harnessed to Flesh: Journals and Notebooks, 1964-1980)
正如运动员一样,作家也需要每日「训练」。为了保持「状态」,我今天要做什么?
- 2022 年 3 月 7 日在 Believer 与 Pat Metheny 的采访,发布在 Subtle Maneuvers (译注:Subtle maneuvers 是面向创意人士的简报):
Metheny 对待音乐虔诚尽瘁。他不相信天分,而更看中自律与努力。他以每天练习八小时吉他闻名。他总在巡演,每年举行超过三百次演出。每次演出他都要花四小时准备:他不与人对话,故意不加思考地练习,甚至拒绝一切进食。演出结束后,他会针对演出写上十页笔记,分析批判声音、音乐、环境。他从不饮酒,未尝嗑药,只为专心投入音乐。
参考文献
我首先在申请 Emergent Ventures 拨款时问了本文核心问题(「对于知识工作者来说,……意味着什么?」)?
Matuschak, A. (2019, December). Taking knowledge work seriously. Presented at the Stripe Convergence, San Francisco.
知识工作的核心实践往往是临场发挥的
原文:Core practices in knowledge work are often ad-hoc (andymatuschak.org)
知识工作者的日常工作通常涉及复杂、不明确的任务,比如了解一个新行业的基础知识,或者写一份关于战略考量的备忘录。即使这些责任是他们工作的核心,知识工作者处理这些任务的方法也往往是临时的——基于过去的经验、本能、格言和突发奇想,临场发挥出来的。这些做法与可执行策略相反。
这种工作方式高度依赖于实践者和环境,因此知识工作者很难共享和构建关于这些实践的知识。
没有一致的立足点,知识型员工很难评估和发展与这些核心任务相关的表现。相比知识工作者,运动员和音乐家会更为严格精细地打磨基本技能
因为没有系统地考虑这些过程,知识工作者通常不会组织这些任务的输出,以便随着时间的推移积累成更有价值的东西(与此相反,知识工作应能聚沙成塔)。
知识工作中常常需要解决搜索问题
原文:Knowledge work often requires solving search problems (andymatuschak.org)
无论是设计软件界面,编写摄动人心的引言,还是诊断问题与不足——各种各样的知识工作都依赖于循环往复地想出可能,做出取舍,根据观察或者反馈继续搜索。
就我个人的设计和工程经验而言,专家擅长的是在正确的「领域」编制出合适的办法,快速舍弃不太能奏效的办法,并根据观察或反馈更新他们搜索方针。这里有一个可能的解释:专业水准需要建立复杂的组块重编码方案。
知识工作很少涉及刻意练习
原文:Knowledge work rarely involves deliberate practice (andymatuschak.org)
相比知识工作者,运动员和音乐家会更为严格精细地打磨基本技能。一个可能的原因是,运动员/音乐家会进行刻意练习(由 Ericsson 提出)——即专注于打磨技能的活动。
知识工作者的确会屡屡遇到成长机会,比如开始新工作,需要扩展已有技能。但知识工作者的日常活动主要是完成工作,而非补足短处。这就好比足球运动员从不举重和跑步,只靠比赛锻炼身体。典型的工作和表现环境不符合刻意练习的要求。
Ericsson 认为知识工作无法刻意练习,因为缺乏客观标准(所以反馈不足),知识工作的技能定义不清,这一领域也没有发现打磨技能的方法。我觉得这些说法还有待商榷,考虑到常青笔记写作是知识工作的基本单位,间隔重复系统让记忆成为一种选择。但就目前来说,要改善沟通技巧,并没有像举重那样直接明了的练习。
这种推理和赋能环境重在推动所赋能的事 / 赋能环境的重点是创造成长和行动的机会,而不是技能培养之间存在显著的张力。这些文章似乎在说一流网球/钢琴学校不是赋能环境…这几乎肯定是错的。这与我们如何将思想工具置于有内在意义的背景中?之间也存在潜在张力。
参见 § 严肃研究知识工作(Stripe 融合讨论,2019-12-12)
参考文献
Ericsson, A., & Pool, R. (2016). Peak: Secrets from the New Science of Expertise (1 edition). Eamon Dolan/Houghton Mifflin Harcourt. Peak - Ericsson and Pool
许多人没有足够的时间来自我成长。如果你在第一篇论文的水平上停止成长,你将不太可能解决任何重大问题。更现实地说,自我成长对于大多数人是偶然发生的,是当他们在“跑步机”上试图解决问题、产出论文或者在教学中发生的事情。虽然这样的人会成长,但这种临场发挥的方式不太可能让他们解决最重要的问题。
知识工作应能聚沙成塔
原文:Knowledge work should accrete (andymatuschak.org)
知识工作中很多活动似乎十分短效,其产出在活动完成后大多弃置一旁。
面对一篇很难回复的邮件,你可能突然想起,这封邮件和你最近萦绕心头的一件事可以挂上钩。你也许花了一个小时仔细地写了篇回信,其中记录了你最近的思绪……然后,这些思考的结晶就躺在「已发送」的文件夹里,或许在你和你的同事脑中留下了短暂的印象。你花费的心血只不过能微妙地影响了你和你同事的思考。
同样,大多数人只写临时的笔记,尽管通过有效的实践,这些临时笔记打下了重要基础;见常青笔记是知识工作的基本单位。
我们应该竭力设计这样的实践体系,基于我们点滴积累的努力而赢取复利。
间隔重复记忆系统为记忆实现了这一点:当你发现信息有用时,可以投入一点点精力,便能确保这条信息对你而言随时可用。随着时间推移,间隔重复图书馆便积累了成千上万的问题,(我强烈认为)这些知识可能使你以后更容易成为一个有效的知识工作者。
Hamming 生动地说明了这一点:
可以看到,大多数伟大的科学家都有澎湃的干劲。我在贝尔实验室与 John Tukey 共事了十年。他便是干劲很足的人。我加入实验室约三四年后,有一天我发现 John Tukey 其实年龄竟比我小一点。John 是个天才,而我显然不是。我怒气攻心,冲进 Bode 的办公室说:「跟我差不多大的人怎么能像 John Tukey 那样知道这么多?」他靠在椅子上,把双手放在脑后,微微一笑,说道:「Hamming,如果你像他那样努力工作那么多年,你的知识也会多到让你惊讶的。」我羞愧至极,简直是马上溜出了办公室!
Bode 的意思是:「知识和生产力就像复利。」如果两个人的能力大致相同,而其中一个人的工作量比另一个人多 10%,那么前者的产量将是后者的两倍多。知道的越多,学的越多;学的越多,能做的越多;能做的越多,机会越多——这很像复利。我不想给你一个利率,但这是一个非常高的利率。如果两个人拥有完全相同的能力,那么一个日复一日多花一个小时思考的人在一生中的工作效率将会大大提高。我把 Bode 的话放在心上;几年来,我花了更多的时间努力工作,并发现,事实上我可以完成更多的工作。
参考文献
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
但最重要的是,如果没有一个永久性的思想库,你将无法在较长的时间内形成任何重大的想法,因为你要么被限制在单个项目的长度上,要么被限制在你的记忆容量上。杰出的想法需要的远不止这些。
2019/08/13 与安娜-加特的对话:
在 Twitter 上,你无法建立任何东西。
Matuschak, A. (2019, December). Taking knowledge work seriously. Presented at the Stripe Convergence, San Francisco.
Hamming, R. W. (1997). The art of doing science and engineering: learning to learn. Gordon and Breach.
知识工作
原文:Knowledge work (andymatuschak.org)
1962 年,Fritz Machlup 提出「知识产业」的概念,将其作为美国经济的重要指标。之后,Peter Drucker 于 1969 年将这些活动描述为「知识工作」。::或可能在 1966 年的《卓有成效的管理者》一书中——需要检查::
马克卢普在 1962 年指出,美国 29% 的 GDP 是由「知识产业」贡献的。
参考文献
Drucker, P. F. (1970). The age of discontinuity: Guidelines to our changing society. London, England: William Heineman Ltd.
Machlup, F. (1962). The production and distribution of knowledge in the United States. Princeton, NJ: Princeton University Press.
知识工作者对于逐步完善想法往往没有具体方法
人们期待专业知识工作者能够创新——即产生有价值的、原创性的见解。如果他们有了一个想法的轮廓,他们具体是怎么花时间逐步完善这个想法的?每个步骤是什么样的?想法从何而来?
我的直觉是,大部分知识工作者凭直觉来完善想法,这个过程中会使用隐式的方法,但这些方法没有目标指导,并总是寄希望于真知灼见也许最终会浮现。他们通常会临时性开发一些方法,之后就不再费力去改进这些方法(人们通常把技能发展到一个平台期,然后就停下来)。我怀疑这主要是因为这不是一个明显的可改进的技能(提高的显著性推动技能发展)。
一个可能的解决方案:常青笔记有助于积累洞见。
管理学从企业和管理者角度出发考虑知识工作,而不是个人角度
非常不确定——这只是我粗略、相当不确定的感觉;我还没有做足够的深入阅读来验证
在 20 世纪之前,管理学关注的是工业经济所面临的挑战。它解决的问题诸如通过跟踪每个工人在每个任务上所花费的时间来生产更多的产品,从而提升效率。工人是可互换和非专业化的,因此它强调解决问题的层面在公司和管理者层面上。
当经济产出转向知识工作时,这个领域的关注点仍然集中在管理者和公司,因为个体工作者一向都不重要。这可能是知识工作的核心实践往往是临场发挥的,并且我们不知道如何衡量知识工作者的生产力的原因之一。
我们不知道如何衡量知识工作者的生产力
原文:We don’t know how to measure knowledge worker productivity (andymatuschak.org)
对于衡量知识工作,我们不能像衡量工人的生产力一样,用零件的产出数量作为评判。我们的确可以衡量结果这一滞后指标,比如 OKR,但这跟工作本身是两回事。
参考文献
Drucker, P. F. (1999). Knowledge-Worker Productivity: The Biggest Challenge. California Management Review, 41(2), 17.
对知识工作者生产力的研究才刚刚起步。2000 年时对于知识工作者生产力的研究,其发展程度基本相当于 1900 年一个世纪以前,对于体力工作者生产力的研究。
Matuschak, A. (2019, December). Taking knowledge work seriously. Presented at the Stripe Convergence, San Francisco.
在 2020 年大力推广助记媒介尚且为时过早
原文:Aggressively scaling the mnemonic medium in 2020 is premature (andymatuschak.org)
助记媒介对读者记忆的效果 非常喜人,让人忍不住想要赶紧推广开来。然而,过早扩大规模会阻碍系统迭代一文中描述的论点表明,必须谨慎地把握平台化和通用化的时机。
2020 年,对于更通用的助记媒介的需求很大,但快速扩大规模潜藏着很多危险。
我们有把握地认为,我们不知道媒介应该向什么方向发展。例如,我们最近才发现助记媒介可以通过简单的应用卡片帮助读者应用他们所学的知识。这些实验说明,未来有可能会对助记媒介进行巨大的调整。此外,助记媒介可调整为将创制经验逐步展开的形式,而我们对于这点的探索才刚刚起步。
另外,助记媒介还不够好。例如,的确助记文章能让读者详细记忆其中内容,成本是增加 35-50% 的阅读时间开销,但我们的小实验表明,助记媒介还有很多地方努努力就能改进。
我正在开发 Orbit,但我并不打算快速大规模地推广它。相反,我正在筑牢基础,试图在 Orbit 设计一些抽象,这些抽象不应阻碍实验与调整。我们要让一小群作者先试用 Orbit,这点很重要:他们的使用经验,对于了解作者角度的助记媒介很有帮助。
企业内的学习或许会是开发助记媒介的合适情境
原文:Corporate learning might make a good context for developing the mnemonic medium (andymatuschak.org)
加入一家公司时,新人往往渴望尽快发挥作用。但是在那之前,他们通常需要掌握大量的基础知识。例如,Stripe 的新雇员必须迅速学习大量的公司术语(公司内部使用)和行业特定的细节(仅限于公司的业务)才能有效开展工作。如果他们是开发人员,他们还需要学习公司内部的基础设施的各种细节。这可能会成为开发助记媒介的有趣情境:助记媒介应针对真正需要流利掌握知识的情景而开发。
另一个角度可以是,不仅关注入职这一情境下的具体问题,还关注需要掌握大量信息的具体角色,这可能会随着时间的推移而变化——例如,销售代表学习一份战术手册。
这里存在的挑战是,正式的企业学习系统通常都是令人反感的怪物——只要想想「合规培训」就知道了。围绕着这些东西,甚至形成了一个可怕的企业「产业」: 企业学习和发展。这是 Hickory Training 一直在追逐(但未能成功)的东西,也是 Sana Labs 正在追逐的东西。在我看来,为了安抚买家(请注意,买家不是用户!),他们为这个概念框架做出了极大的牺牲。
这里的关键在于找到一个大到足以使这种措施看起来令人信服,但又不至于太过庞大的公司。我的直觉是,重新定义这种互动,使之成为以员工为中心的赋能工具,而不是由雇主强制施加的一系列任务。这是一种通过引入员工真正认为有用并主动采用的「基层」工具来「扰乱」学习与发展领域的做法。这听起来......很困难。这关系到解决以下问题:助记媒介应该让读者对他们收集的卡片进行控制。
助记媒介对读者记忆的影响
原文:Effects of the mnemonic medium on reader memory (andymatuschak.org)
-
助记媒介如何高效地提供可靠的保留?
-
这些结果在多大程度上具有普遍性?
我希望能够讲述的故事:
-
如果你完成了复习环节,你会可靠地记住你所读的内容。
-
……如果没有这些复习环节,你只会记住非常少的内容。
-
……这些复习环节不会花费你太多时间。
-
……而且这种效果可以推广到很多领域。
在量子国度内,我们对第 1 点有充分证据,对第 3 点有部分证据,对第 2 点的证据正在逐渐显现。我们还没有第 4 点的证据。
但也请看:助记媒介对读者的宏观影响是什么?
《量子国度》用户行为
-
截至 2020 年第 1 季度,已有几百名用户证明 QCVC 有 1 个月以上的保留。
读者的看法
-
「我只做了你的第一个量子国度课程(到目前为止),但我觉得课程很棒,我可以查看证明并理解它,明白所有的东西。这几乎就像《黑客帝国》中的尼奥对莫菲斯说:『我知道量子计算』」来源
-
「我想,完成复习环节实现了它的承诺。它给了我信心:我将记住这些材料,而且能够毫不费力地兼顾各个知识。虽然我之前已经有一点量子计算的经验,但我还是从这些文章中受益良多。进展很顺利,我巩固了之前掌握不牢、有太多模糊点的知识。我非常感谢这个助记文章实验的存在。」— Dmitry Urbanovich Re: 来自量子国度的问候!
-
「与其他学习方式不同,我不再担心以后会忘记所学的东西。因为我知道总会有人在正确的时间点提醒我复习重点知识。这不仅仅是一种感觉。根据复习的结果,我想我确实已经可靠地记住了大部分的内容。」— Kevin
在未来学到的,因为我知道有一个人将永远
提醒我在恰当的时间点复习关键部分。而且它
不仅仅是一种感觉。根据复习结果,我认为我
已经可靠地记住了其中的大部分内容。"- Kevin
嵌入卡片模板可以主动辅助助记媒介读者编写卡片
原文:Embedded prompt templates may actively scaffold prompt-writing for mnemonic medium readers
助记媒介可能通过提供作者创作的卡片来辅助卡片编写,但有时由读者亲自写卡片特别重要——例如卡片内容主要是在个人层面上影响读者,而非智力层面,间隔重复可能是培养或改变习惯的有用工具。这时候作者若能够帮助读者写出他们自己的卡片,那将会怎么样呢?也许他们可以提供一套卡片模板给读者自己使用,卡片模板贯穿于阅读体验中,就像这幅草图一样:
要实现好这个机制,就必须解决助记媒介如何适应读者的不同背景和目标?的问题。这个问题挺令人烦躁。
也许应该把文字输入交互提取出来,放在卡片的「上方」,这样就可以从一个回答中产生几个卡片;例如,「我在尝试做日常练习时感到什么摩擦?」和 「为了使做日常练习更容易,我可以尝试什么(新)事情?」,两个模板的空白处都填上所选择的习惯。
这种机制的一个变种可以是多面卡片 (卡片像折纸一样展开?):「此时此刻,你本能地想让什么习惯更可靠?」/「当你试图做这个习惯时,你感到有什么摩擦?」/「你如何缓解这些摩擦或使这个习惯做起来更容易?」对于这种类型的多面卡片,可能没有必要进行输入交互:后面的提示可以简单地与前面的提示对话。
一个相关的可能性:反思卡片可以记录和积累长期的反馈
参考文献
与泰勒-罗加尔斯基的对话, 2020-05-10
助记媒介如何能适应不同的背景和目标的读者?
原文:How might the mnemonic medium adapt to readers’ differing backgrounds and goals? (andymatuschak.org)
量子国度假定你会回答所有问题。对于专注于平台知识的介绍性文本来说,这是合理的假设:绝大多数读者要么已经知道所有的材料,要么需要学习基本上所有的内容(助记媒介对于平台类知识特别有价值)。但这一假设在许多其他情况下都行不通。助记媒介的未来迭代版本,需要更加灵活:助记媒介应该允许读者控制收集的卡片。
例如,如果你在写一本很厚的教科书,读者通常不会读完整本书——他们会专注于特定的主题。媒介需要能应对只对特定章节或小节有兴趣的情况。
而且读者背景会互不相同;有些人不需要所有的卡片。如果我们快进到记忆练习变得普遍的未来,读者将经常遇到「重复」卡片。因此,媒介必须能应对读者跳过、丢弃或重组卡片,即使这些卡片被认为对其他人「默认有用」。
在说服性写作和非正式讨论中,卡片的作用会有很大不同。在这些文体的文章中,默认为读者收集卡片而不是舍弃卡片的做法更加合理。此时的卡片更类似旁注——为感兴趣的人所用。
可能的解决方案
-
在默认添加所有选择的情景中,卡片应具有「跳过」或「不是现在」操作。这种机制可以潜在地利用间隔重复机制:该卡片可能会在几周后的复习环节中再次出现。如果你再次「跳过」,它可能会消失几个月。这适应了对具有潜在破坏性的「删除」或「禁用」操作的需要,但不会使其成为高风险的决定:间隔重复可以降低对收件箱进行维护中破坏性操作风险
-
在默认舍弃所有卡片的情景中,卡片可能更像旁注。此时「散开」卡片(而不是「堆叠」它们)可能会更好,这样读者就可以看到所有卡片,并选择看起来相关的一两张卡片。在这里传达默认行为的不同之处将非常棘手。
量子国度中读者回答所有卡片这一假设在不同方面的体现
-
进度机制以「完成百分比」为主,且分母是一篇文章中卡片的总数。
-
如果你不回答一篇文章中的所有问题,进度就会完全受阻:如果没有把文章中所有新卡片都复习完,你就不能进入后续的复习阶段。
-
若要实现小节层面卡片选择的灵活性,目前的机制只需简单改动即可,但为了能处理挑选和选择,需要更大的变动
-
-
当你回答一篇文章中的问题时,它会被添加到你的集合中,事后无法删除或跳过它。
助记媒介如何在平台类知识之外的体裁中赋能读者?
助记媒介对于平台知识特别有价值,但我们怀疑它是否能够帮助读者更深入地联系到其他体裁的材料,例如:
-
议论文
-
非正式讨论
-
参考资料
-
Max Roser, 2020-06-15,指出,在某些方面,OWiD* 更像是一个增强的电子表格,而不是增强的散文。(*译注:Our World in Data,由牛津大学的学者们建立,旨在以数据的方式,让我们更全面,更精确的了解这个世界)
-
Cell Biology by the Numbers 以一种有趣的方式介于两者之间……它也像一个增强的电子表格,但说明文使其更加充实,类似于助记媒介卡片依赖于调用外部经验(来自叙事,来自现实世界的经验)
-
-
学术论文
到目前为止,工作中遇到的一些挑战:将助记媒介应用于非技术性文章的经验教训
这些体裁和平台知识之间的主要区别包括用户差异的显著增加ーー无论是在动机/目的方面,还是在预备知识方面。我预计这要求媒介更加灵活。助记媒介如何适应读者不同的背景和目标?
我猜想,关键方法是少用这种媒介建立详细的记忆,而多用助记媒介使读者与材料保持长久联系。
与这个问题有关的一个框架:如果助记媒介被重新设计成一种更深入地参与文本的手段会怎样?
相关的潜在机制:
助记媒介如何帮助读者建立更复杂的理解?
助记媒介帮助读者记住他们读过的东西,这是理解的重要前提(深入理解基于详细的基础知识)。我们还利用这些卡片来帮助读者获得概念性的知识:间隔重复记忆系统可用于发展概念性理解。而且我们能做到的不仅仅是单纯的回忆:助记媒介可以通过简单的应用卡片帮助读者应用他们所学的知识。那么,顺着布鲁姆分类法我们应该如何达到更高的思维水平,以支持更复杂的理解类型呢?相关的早期实验表明,这可能是可行的:间隔重复记忆系统可用于促进应用、综合和创造。(译注:布鲁姆的分类法是一个层次结构模型——一种根据六个认知复杂程度对思维进行分类的方法。布鲁姆的模型由六个层次组成,三个较低的层次(记忆、理解和应用)比较高的层次(分析、评估和创造)更基本,见下图。如果学习者已经掌握了更高的水平,那么可以认为他掌握了以下更低的层次。)
一个角度是关注提取练习和迁移学习(例如助记媒介可以包含支持近迁移的卡片)。
随着时间的推移来增加卡片的复杂性或许是一种解决方案——在读者已经有了牢固的记忆之后再引入综合性的卡片。见助记媒介略加调整后可以容纳逐步发展的体验。
没有作者参与时,我们如何将现有文本转化为助记媒介?
普及助记媒介似乎需要网络出版的普及。此外,许多重要的书籍根本没有任何数字版本;许多人更喜欢纸质书籍和电子墨水阅读器。技术受众将在很长一段时间内继续使用 PDF. 那有声书和视频呢?如果我们能在不牺牲现有媒介力量的情况下,将现有媒介「升级」成助记媒介,那将是非常强大的。
下面的这些方法实际上都差强人意,但也许迭代之后就可以了呢?
「伴读」APP
你面前有本敞开的纸质书;你把手机放在书旁边,打开「记忆伴侣(Mnemonic Companion)」应用程序。你扫描图书的条形码,应用会显示目录(可能出于法律原因被部分删节)和页码选择器。你告诉应用程序你正在阅读第 312 页。屏幕上显示了一堆问题和一个大标题,上面写着:「在第 314 页的分隔处回答这些问题。」你开始阅读纸质书,一边标注重点,一遍粘上便利贴写注释,然后在适当的地方提交问题。应用程序将移动到下一个断点,你可以继续阅读。
这种方法缝合了太多流程。读者必须记住应该在哪里停下来,查看有没有到达这一点,并在两种媒介之间来回切换。听起来很痛苦。我怀疑能遵循这套流程的人会比《量子国度》少得多。
但这是一种非常灵活的方法,基本上可以适用于任何先前的媒体形式。它不需要作者/出版商合作,问题可以来自不同的制作人(相关笔记:有声读物是在各种各样的商业模型下制作的)。
另外,分销渠道很糟糕:阅读一本书的人必须决定单独寻找周围的其他材料,检查我们的应用程序以获得支持,并可能为这些材料单独付费。在 Twitter 上对一本书/PDF 的讨论并不会将人们引向这个同伴。无法形成任何有意义的网络效应。
给在线图书的浏览器扩展页面
对于已经在线的图书(如 Cell Biology by the Numbers),可以通过浏览器扩展来扩充它们。我不喜欢这样——这对用户来说是极高的要求。如果能将页面包装在 IFRAME 中并跨域操纵就好了,但是当然没有浏览器会允许这样做。
内容转换代理
添加一个 <script>
标签,通过「非透明」的网页代理重新提供目标网页。起码对于新用户来说,这种做法相比浏览器扩展的解决方案效果相同,而且更轻量。甚至可以提供可供链接的 URL!
Hypothes.is 使用其中的一种方法来使其「可共享链接」生效:via.subthe.is 注入目标 url。
这…实际上看起来挺可行的!
实现的注意事项
甚至还有一篇 W3C 文章!https://www.w3.org/TR/ct-guidelines/(这是「工作组笔记」,而不是已批准的文件)。
如果代理更改了回应体,则:
1. 必须在 HTTP 头字段添加 214 警告,表示应用了内容转换;
请参阅警告代码。
代理应该在 Via HTTP 头字段留下注释,其中包含 URI "http://www.w3.org/ns/ct",表示其转换内容的能力。
注意链接重写的安全问题:重写代理可能会意外地使两个不同的站点同源(例如与代理站点同源)。这可能会引入漏洞。另外:
**强烈反对**拦截 HTTPS 链接的做法。
如果代理重写 HTTPS 链接,它必须告知用户这样做的安全影响,并且必须提供绕过它并直接与服务器通信的选项。
...
转发来自服务器的响应时,代理必须通知用户无效的服务器证书。
现在基本上所有的链接都是 HTTPS,所以这或多或少相当于「不要重写链接」!或者至少:要「极其」小心。
另请参阅 HTTP 1.1 RFC 的对中间层转换的评论。
转换 200(OK)响应的有效载荷的代理还可以通过将响应状态代码更改为 203(非权威信息)来进一步通知下游接收者已经应用了转换
另请参阅此初步文档:内容转换前景 1.0
自定义 PDF / EPUB 阅读器
我们可以制作自己的 PDF 或 EPUB 阅读器应用程序,将这些元素内联到现有的媒体形式中。或者它可能是基于 Web 的书签式阅览器:在任何 PDF URL 前面加上 “http://mnemonic.com”,以便以这种形式阅读它,等等。
在 DRM 仍然无处不在的情况下,为 EPUB 做这件事不太可行。合法购买的电子书无法在我们的阅读器中打开。因此,为电子书这样做需要成立一家电子书商店。真恶心。
这将是一项繁重的工作。这里的分销渠道问题很大。
老实说,处理 PDF 的一个更好的方法可能是通过无数的「PDF 到网页」工具中的一种。获取学术 PDF;将其转换为网络出版物;然后对其增强(例如,通过把任意网页转化成助记媒介)。
AR 眼镜
如果我们将来都戴 AR 眼镜,我们可以用各种有趣的方式神奇地增强书籍。太遥远了,难以认真考虑?如果有关苹果 2022 年推出眼镜的传言属实,AR 覆盖即将引领新潮流…
如何将助记媒介中得到的理解,应用到侧重深刻情感联系的形式上?
助记媒介在很多方面太过干瘪且强调认知。如果我们从侧重深度情感联系的创制经验(比如最好的电影和电子游戏)开始,并将它们与建立更深层次理解的方法相融合,我们可以发明什么媒介?
助记视频是其中一个早期的想法。
认真对待情感的一部分
参考资料
Matuschak, A., & Nielsen, M. (2019, October 0). How can we develop transformative tools for thought? https://numinous.productions/ttft
助记媒介对下游学习的影响
原文:Impact of mnemonic medium on downstream learning (andymatuschak.org)
对于你关于我的量子计算课的问题,我想说的是,我发现论文在让我记住电路的具体方面和对它们进行的操作方面最有帮助。因此,例如,各种泡利门(X、Y 和 Z)的定义,以及其他门如阿达马门的定义,在每次复习课后肯定会被刻在我的脑海中!我不知道这对问题集是否有特别的帮助。我不知道这是否对问题集有特别大的帮助(我们没有考试),但我想说的是,这对我的帮助很大,因为我从来没有在这些「小」障碍上感到困窘。你有没有过这样的感觉,你想完成 X,但 X 是如此之大,所以你实际上必须事先做一些小步骤 Y 和 Z?它们本身可能并不困难,但在最终达到X之前,你可能需要再次复习 y 和 z,从而消耗大量的时间/精神。我发现量子国度给了我对这些小的基础知识的良好感觉,所以在使用材料时,它们从未成为问题。(当然,我也非常喜欢这些文字!)
从哪些角度看,助记媒介不仅仅是普通文章上面的注解层?
将助记媒介视为「文本+」是一种直截了当的方式。你写一篇散文式的解释,然后再看一遍,并用卡片对其注释,以强调关键想法。不过,更有趣的是思考这种结合如何创造出一种有意义的新媒介——在这种媒介中,问题推动着散文,反之亦然。这种结合会不会蕴藏着巨大的可能性,还是只是在夸夸其谈?
-
助记媒介非常稚嫩,新的助记文本通常会介绍散文中嵌入卡片的目的。
- 它们有时还会在擅长领域的特定卡片下发表评论。例如,量子国度指出一张卡片似乎重复了先前的卡片,并解释了为什么在这种情况下这是有意义的(即间隔重复记忆卡片应该从多个角度对概念进行编码)
材料中嵌入助记媒介卡片能带来安全感
原文:Interleaved mnemonic medium prompts promote a feeling of safety (andymatuschak.org)
我注意到,阅读助记媒介中的一篇文章时,我有种安全感:在阅读的时候,我可能会对细节感觉很困难,但我相信很快就会有复习集到来,确保我读完文章后,我能理解我「应该」理解的东西。不少读者也报告了类似的感受。
Matt Clancy 这样描述他的学生:「他们喜欢观看视频时相信自己学到应该学的知识,因为视频之后就是问题。」
这种感觉在一定程度上具有误导性。读者很容易过度依赖文本中间或出现的复习区域,依赖它们来确保自己按预期学习了材料。但理解概念需与其尽力较量;如果我在阅读时没有实打实地琢磨想法,我只会通过卡片的强化记住一些零碎细节,而不是完整的知识网络。
Yuanting Mao:
我浏览这篇文章时的不确定感大大减少了。事实上,有时我会先回答卡片,然后回头看文本中的解释。
为非技术性助记文章编写稳定回忆的卡片尤为困难
将读者回答《量子国度》问题的正确率,与这几篇非技术性助记文章的正确率比较,别有一番趣味。《量子国度》中,109/112(97%)的问题的文章内准确度大于 50%;97/112(86%)的问题大于 75%.
但其他文章的准确率要低得多(50% 以上的准确率,75% 以上的准确率):
-
我自己,如何写出好卡片:83%,33%
-
Eggplant,地图、领土和元理性:86%,50%
-
Nintil,普朗克是对的吗?老龄化对科学家生产力的影响:90%,77%
(我可能应该将这些分布可视化——这样写太难读了)
Matt Clancy 在她的微观经济学课程中使用 Orbit, 我注意到她的问题正答分布更接近量子国度,而非那些非技术性文章。
失败时的情况更差了:《量子国度》的问题有一半的机会被遗忘;这些文章的问题最差时会有 70% 的可能被遗忘。
这可能是助记媒介的读者有时会因作者的用词而感到受阻的一种定量反映。
将助记媒介应用于非技术性文章的经验教训
原文:Lessons learned from applying the mnemonic medium to non-technical texts (andymatuschak.org)
从作者的感受来说:
趣闻轶事:
-
这似乎还会导致助记媒介可能会促使读者更缓慢、更专注地阅读
- Geoffrey Litt:「集成的 Orbit 让我放慢了速度,更认真地对待阅读这一行为。有几次,它帮助我意识到我浏览了整段文字,甚至没有注意到我是多么地漫不在乎。」
-
有助于激励——感觉像是一项真正的投资
-
Giacomo Randazzo:「Orbit 不仅激励我更仔细地阅读,还给了我投入时间阅读这篇文章的一大动机:我知道,随着时间的推移,我会与它保持联系,与肤浅的阅读相比,我会建立更多的联系。」
-
NothingIsntTrivial:「我觉得我从中得到了一些东西。」
-
-
非常费力
- Geoffrey Litt:比我习惯的「网络阅读」付出了更多的努力!让我进入了「纸质阅读」的思维空间
-
「感觉像是做作业」/「压力很大」
-
Emily:「最近 @meaningness 的文章中关于 Orbit 的事情让我想起了学校作业。」
-
Lucca:「感觉阅读和回答卡片之间存在巨大的心理鸿沟。阅读对我来说就是行走在陌生而奇妙的国度。回答卡片则是一件非常冷淡、灰暗的事情。」
-
Kenny:「总体来说有点不和谐——我真的很喜欢读你的文章,而在文中回答问题则有明显的不同。我不太「看好」它,但我愿意继续测试它!」
-Henry:「…不知何故,这让我压力很大。这不像是阅读(一篇智力已经很密集的)文本,而是让我觉得自己好像在课堂上接受某种方式的测验。我读完了这篇文章大约 30% 的内容,然后退出了,因为它感觉到了奇怪的压力。一开始,阅读一位聪明人对元理性的看法是一次愉快的经历,后来变成了我自己在记忆能力方面的智力缺陷的反映。…我认识到,这其中有一些是我自己的负面故事(和准确的评估),因为我记住了新的、具有挑战性的知识概念。其中一部分是对一些更深层次的东西的情感反应,我还不太清楚。我的一部分希望我可以选择在顶部加入/选择退出,所有的 Orbit 都会动态隐藏在下面。因为我是个成就超群的人,我就是不能(不想?)跳过紫色的方框,但停下来回答每个问题,然后向上滚动找到答案,这会使阅读体验变得更加费力和沉重。更像是我在上一门课,我会拿到分数(呕),而不是培养我自己的智力景观(耶)。与此同时,我完全认识到,通过这些卡片,我对核心概念的记忆可能会增加。因此,我可能只是需要克服自己,花适当的时间去学习这些材料。令我着迷的是,我在这篇文章中有如此发自内心的情感反应,而在阅读你的任何其他(同样智力密集的)帖子时,我却没有。或许我应该说这让我压力很大。虽然不舒服,但绝对不是坏事。」
-
-
卡片期望人们过快地将抽象内化
- Lucca:「文本可以处理理解的可变性,因为它们通常不需要你立即理解所有内容。而如果你没『明白』一张卡片,你马上就会卡住。」
普及助记媒介似乎需要网页出版的普及
普及助记媒介最直接的策略——把任意一个网页转化成助记媒介——无法应用于大多数文本(即使是新文本)因为它们不是以网络书籍的形式出版的。
现代出版商习惯于为多种渠道准备书籍(印刷版、EPUB、Kindle 格式),但很少会将它们作为网页出版。那些提供在线阅读的网站通常是通过(糟糕的)基于网页的 EPUB 阅读器。O’Reilly 是一个有趣的例外ーー他们将在线图书直接由网页呈现。
EPUB 是受限的网页,所以任何准备 EPUB 格式的人离网页出版已经很接近了。
普及网页出版可能存在的障碍
参见关于普及具有新颖认知支持的文字媒体需要普及电子阅读的评论。
盈利问题
如果你制作 EPUB,Amazon 会处理发行。如果你发布网页书籍,你需要自己处理发行。我想这对很多人来说是个障碍。
如果未来的书籍能在开放的网络上发布,能够即时链接且没有任何障碍,那将是很好的。这种方式需要一种让作者赚钱的方法。我不确定具体是什么。内容的微支付历史上问题重重,但也许加密货币会改变这一局面。广告不是一个理想的解决方案,而且我怀疑它们能否产生足够的收入。打赏模式对一些在线发布的作者有效,但似乎不够可预测,也不够规模化,难以普及。
只要传统出版商还参与其中,我预计大多数人只会想要一次性付款。我不知道有哪种通用服务可以让你将网页书放在一次性付费墙后面。Gumroad 可以用于下载内容。看起来有一些 WordPress 插件可以做到这一点,但它们看起来不太完善。
出版工具
如果你在出版纸质书,你可以用 InDesign。如果你在出版电子书,Amazon 提供了免费的面向大众的工具,可以轻松从 Word 文档转换。如果你在出版网页书……你到底该怎么做呢?也许 WordPress 可以处理服务器,但你怎么把书放进 WordPress 呢?你肯定不是在 WordPress 的编辑器里写的吧。
接受助记媒介需要内容量达到临界值
原文:Mnemonic medium onboarding depends on a critical mass of content
助记媒介面对的核心挑战之一,是规律进行间隔重复记忆练习是沉重的习惯。令人欣慰的是,助记媒介可能通过提供作者提供的卡片来辅助编写新卡片。作者提供的卡片降低了成本(不需要编写卡片),并提供更多的价值(作者提供的卡片通常质量高)。但是规律的记忆练习意味着日常投入大量时间,而且这笔开销难以减少。此外,只是为了记住很少内容而开始规律复习是不合情理的,比如为了记住 10 张卡片。卡片提供的价值必须超过规律复习的时间成本。
换言之,最初上手阶段呈现的一小部分卡片,对用户体验的作用却是极大的。量子国度有大约 200 张卡片,对于致力于学习量子物理的人来说,这样数量级的卡片就值得为其开始记忆练习。相比之下,单篇带有 10~20 张卡片的文章,对于开始记忆练习这个新习惯提供的价值还不够......但是假如读者已经有积极的学习习惯,那样用户也会更乐意记忆练习。而如果有十几篇助记文章都让读者产生了兴趣,即便每篇文章没提供多少卡片,培养新习惯估计也能够接受。
读者认识助记媒介的渠道应该是这样一些文章,既对读者足够重要,而且内容有深度,值得为此培养新习惯。因此助记媒介要想得到广泛使用,量子国度这样的跳板就必不可少,它提供有深度的内容,让人愿意尝鲜,进而决定是否培养这种习惯。
相关文章:没有源源不断的新卡片,间隔重复的复习常常变得枯燥而脱节。因此,不仅一开始就要有实质性的内容(如教科书),而且后续要提供源源不断的材料以供学习。否则就必须引导他们写出自己的卡片。
反驳
Devon 指出(2020-04-20),她实际上认为,通过较少的内容来接受助记媒介更容易,因为那样的话,复习环节就会相当短。我怀疑她是否会坚持复习区区 20 张卡片,但如果有许多文章可用,这种方法可能很有效——例如,《边际革命》以这种方式进行注释的话,就能提供很多素材。
助记媒介卡片穿插在阅读过程中
原文:Mnemonic medium prompts are interleaved into the reading experience (andymatuschak.org)
助记媒介提供专家编写的卡片以消除制卡负担中描述的想法的 Quizlet 式实现,把提供的卡片与文本本身分开了。例如,你也许会在读了一篇文章几天后才被问及它的内容。或是在文章的结尾提供卡片,使你读完文章之后才会看到。我们对助记媒介的设计与这些方法不同,它将卡片穿插在阅读过程中,颗粒度更细。
一些(潜在的、预期的、观察到的)后果:
-
为助记媒介应该让读者对他们收集的卡片进行控制提供了更自然的机会
这个设计决定依赖于:助记媒介依赖的卡片应是轻量级的。
一些问题:
助记媒介的读者有时会因作者的用词而感到受阻
原文:Mnemonic medium readers sometimes feel impeded by authors’ wording choices (andymatuschak.org)
在如何出好卡片的反馈中,一些读者表示,他们在回答一些卡片时感到困难,因为这些卡片是以我的措辞为框架。并不是说我的措辞不好或不对——只是这些读者觉得,如果他们自己来写问题,他们会选择不同的措辞,对他们个人来说会更有说服力。
我们在关于《量子国度》的报告中没有收到这种反馈;我认为这是一个专门针对非技术性文本的问题。用词抱怨的出现,是因为没有固定的、预先规定的方式来指代某些概念,这使得我们无法遵循专家回答启发式(由 Issa Rice 提出)。作者不得不自己想出一些术语,而读者觉得他们可能会使用不同的术语。这种情况在技术文本中也会发生,但不太常见:所指对象往往是可以精确说明的。
这种抱怨主要集中在挖空卡片上,它格外受制于用词问题:在非技术性的助记文本中,挖空常常造成挫败感
更广泛地说,助记媒介应该让读者对他们收集的卡片进行控制。
mduncs:
助记文章的格式和 Orbit 的一些复习引起了我的注意,那就是很难记住那些不是用我的声音写的卡片。措辞和用词的小差异让内容更显眼,但却让我难以铭记。
我发现一个问题:虽然大多数卡片都写得很好,但有些答案的用词和我的习惯不同。这让我不确定自己的记忆程度如何。
Soren Bjornstad:
说到这,关于专业术语的卡片对我来说真的有些棘手。我感觉有些词只在填空卡出现,不是由问题先行提及的,这或许加重了上述问题。但我手头并没有一份完整的卡片清单,所以无法做出确切判断。这是否因为某种认知上的冲突,导致我更难去接受并非新概念的术语,毕竟我已经有了自己习惯的叫法?因此,我不太确定我的体验是否对这篇文章的主要读者群有参考价值。
我:有趣的是,很多人都提到了跟填空卡有关的相同问题,特别是那些感觉更像是语言学上的。我觉得我真的需要更深入地了解这一点。当我为自己写这种卡片时,它的效果还算不错。我觉得部分原因是,当我自己这么做时,我在想:「看,我这其实就是在背作者选的一个术语,因为我觉得这个词本身挺有帮助的。」但当这是作者给出的要求时,有时感觉有点被强迫——你被要求记住特定的措辞,这感觉像是错误的抽象层次。
对我来说,这种看法很准确。更新一下,经过大概一个月的复习,我已经掌握了很多,但我仍然觉得某些卡片难以掌握,特别是上述那一类。
Stephen Malina:
无法编辑卡片。我经常发现,我第一次写卡片时的(特别是)答案表述,与我最后实际回忆答案的表述并不相同,尽管我回忆答案的表述也是有效的。因此,对于我自己的 Anki 卡片,我经常编辑答案,使之符合我倾向于回忆答案的表述。不然的话,每次看到卡片,我都纠结:我的回答虽然意思一样,但为啥和卡片上的不一样呢?而在 Orbit 里,问题更大了。不仅不能编辑卡片答案,而且它们都用你(或 Jose)的词汇表述,而不是我自己的。虽然这看起来是小事,但在查看卡片时确实增加了一些负担。
无法添加和删除卡片。我认为你制作的卡片做得很好,但我仍然发现其中少数卡片对我来说没有意义。例如,有一张关于「关注:」的卡片,我总是答错。通常情况下,我会通过移除这张牌或添加额外的牌,填补我认为阻碍我回答这些卡片的空白来解决这个问题(正如你所建议的那样),但在 Orbit 中我无法这样做,所以我发现自己一直被这些“水蛭”困扰。我发现,老是看到这些“水蛭”,每次都答不上来,复习的心情都给弄差了。
相反的观点
我觉得 @Meaningness 的文章(总体上)呼应了我自己的很多想法和经验。我们的「抽象堆栈」可能非常相似。我认为这意味着卡片更容易达到「好」的标准(不太难也不太简单)。答这些问题,更像是延续我已有的一系列思考,而不是深入全新的领域。
助记媒介的复习集使阅读过程产生了自然的中断
原文:Mnemonic medium review sets create natural breaks in the reading experience (andymatuschak.org)
助记媒介卡片穿插在阅读的过程中;在阅读时我注意到,复习集是喜闻乐见的,让人得以喘一口气。部分原因是我知道它们能让我确定自己在对文段进行理解(材料中嵌入助记媒介卡片能带来安全感),还有部分原因是它创造了另一种阅读体验。它打破了长文段,让我从「知新」切换到「温故」。
Gary Bernhardt, Re: 回头见! / 草稿:「将知识转化为间隔重复卡片」:
它们打破了连续的文本,我喜欢这种方式。我在阅读过程中会开小差(或者跳出文本?不确定),这也是我在长时间阅读时的常态。不过在这里,每个复习集就是一个标记点,保证我回到文本中。
相关笔记:
助记文本可以在一段时间内分小段连载,根据读者的记忆情况排期
我们在设计助记媒介时的一个早期理论是,如果把第一章的内容复习几遍,第二章会更容易理解:复杂概念很难学习的部分原因是工作记忆容纳不下其组分。
更进一步的话:
-
写后续章节时,不要当成单独成文的篇章来写,而是对先前章节所叙重点的专门补充。同时可以假定读者已经充分学习了这些材料。
-
每章写得短一些,避免工作记忆超负荷;章节之间的分隔可以充当「检查点」,通过检查点后再写新内容。
-
向读者建议何时阅读下一章,或是在章节列表里呈现,等着读者阅读,或是主动推送通知给读者。也许可以对后续章节施加限制,只有阅读完必须的章节才可以阅读本章。
-
写作时考虑更长的阅读时间轴。如果作者知道,读者读完第一章后,要等待两个月才能读第五章,作者与读者之间的关系可能发生很大改变。(大众媒介大多缺乏超过一天的创制时间维度)
Execute Program 实现了这些概念中的前三个,其体验也很有策划感:
这是助记媒介可调整为将创制经验逐步展开的形式的一个可能实例,一种穿越时间的文本。
可以联系渐进阅读,但作者对不同环节的创作控制更多。
我的个人助记媒介实现
原文:My implementation of a personal mnemonic medium (andymatuschak.org)
我在自己的笔记系统中实现了助记媒介可以扩展到个人笔记的想法。
这套系统的原理是,不断扫描一组 Markdown 文件,寻找其中所嵌入的卡片(卡片语法见下)。之后这些卡片便属于我的活跃卡片集合。我还实现了一个组件,将这些提取出来的卡片同步到 Anki 中。
一些包含这一特性的样例笔记:
系统的实现请见 https://github.com/andymatuschak/computer-supported-thinking。
对于正在进行的未处理的想法,见个人助记媒介
语法
创建典型的双面 SRS 卡片
问:一个量子比特的向量空间有多少维?
答:两维。
问题和答案之间的空行是可选的。问题和答案目前不能跨越多个段落:包括「问:」或「答:」的段落被提取为问题或答案。
创建挖空卡片
在散文笔记的上下文中,我发现挖空往往更自然。这段话对应一张挖空卡片,其中有三个空:
一旦激活,服务工作者{执行一次性的启动计算},然后过渡到{空闲}状态。从这个状态开始,它将处理{获取或消息事件},直到最终终止。
挖空卡片会利用填空所在的整段文本。例如,这个两面的卡片相当于从前面的例子中提取的一张卡片:
问:一旦激活,服务工作者**???**,然后过渡到空闲状态。从这个状态开始,它将处理获取或消息事件,直到最终终止。
答:一旦激活,服务工作者执行一次性的启动计算,然后过渡到空闲状态。从这个状态开始,它将处理获取或消息事件,直到最终终止。
幂等性和唯一标识
这个系统的目的是实现幂等性。也就是说:你可以不断地修改你的笔记文件,它也会相应地跟踪变化。当你改变你的笔记时,系统会保持你所有嵌入卡片的 SRS 状态,除了你直接编辑过的卡片。
更确切地说,嵌入的卡片有唯一标识。你可以修改卡片周围的笔记,甚至把卡片移到一条新的笔记中,而你的复习历史将被保留下来。但是如果你修改了一张卡片的文本,它将被视为一张新卡片,而你的复习历史将不会从旧卡片中迁移过来。这是因为这个系统是基于简易的纯文本文件,它没有足够的语义结构来明确说明一个给定的修改是代表一张新卡片还是一张旧卡片的修改。要解决这个问题,需要引入启发式方法或额外的标识。
双面卡片的标识是由其问题和答案文本的哈希值得出的。挖空卡片的标识是由其包含段落的哈希值得出的。
虽然如果你在笔记文件之间移动卡片,系统会很高兴地跟踪它们,但如果相同的卡片出现在多个笔记文件中,其行为就无法定义。
助记媒介中简单的应用卡可以和回忆卡以同样的方式呈现
助记媒介可以通过简单的应用卡帮助读者应用他们所学的知识。这种卡片与我们现有的回忆卡有许多共同的特点:
-
应用卡可以在 <20 秒内回答
-
不会让人感到非常费力
-
可以自主评分
-
二元评分可能就足够了
-
两种卡片都可以从间隔效应中受益(尽管可能有不同的时间排期)
-
「进步」可以合理地描述为「不断正确作答,而且无需学习的时间间隔越来越长」
-
虽然应用卡在重复时应发生变化,但这些变化可以合理地归纳为一个「卡片」/「练习」实体,随着其组分的不断完善而累积进步。
- 需要注意的是,这要求变体能够相互替代——能在概念上测量相同的隐藏变量。
-
单张卡片不会特别有用,但在几十张卡片上进步将对学习很有意义
-
两种卡片都受益于洗牌和分组(同样,可能有不同的参数)
由于这些问题类型的经验有很多重合之处,记忆卡片的设计问题的解决方案通常也适用于简单应用卡的设计问题。这表明,在现有的间隔重复记忆系统的复习中,几乎不用调整就能呈现简单的应用卡。
应用卡与回忆卡的功能差异
从系统的角度来看,应用卡与回忆卡在几个方面的有所不同:
-
系统每次都应提出不同的问题/答案对(应用卡在重复时应发生变化),归入一个「卡片」/「练习」实体中,以累积进度。
-
这样的卡片有时需要对答案进行解释。但解释不是答案的「一部分」:读者应该明白,如果他们用不同的方式找到答案,并不意味着他们的答案是不正确的。
-
如果读者未能回答一张应用卡,他们不应该被要求在同一个复习环节中重试同一张卡片。为了保持变化,再次尝试时需要显示一个不同的问题。但这要么会给助记媒介作者带来更重的负担,要么会使变化的周期更快。与此相关的是:除非分组的「卡片」/「练习」实体被赋予自己明确的身份,否则读者很可能将重试的卡片理解为另外一个单独的问题,而不是一次重新尝试先前问题的机会。
这些差异都不是非常显著。
对助记媒介的叙事意义
虽然功能上的差异相对较小,但这些卡片迫使我们改变对助记媒介的描述方式,改变我们安排行动的方式,以及对进展的叙述,等等。
在实践中,这意味着:
-
将「几乎毫不费力地记住你所读的内容」修改为「几乎毫不费力地记住并应用你所读的内容」
-
在读者回答中使用更通用的措辞,例如:
-
「你记得」->「你能够回答」
-
「记住」->「正确回答」
-
「加强对材料的记忆」->「加强对材料的掌握」
-
等。
-
助记媒介的实例
原文:Substantive examples of the mnemonic medium (andymatuschak.org)
-
《量子国度》
-
使用 Orbit 编写:
-
《如何写好出好卡片》作者:我
-
《普朗克是对的吗?衰老对科学家生产力的影响》作者:Jose Luis Ricon Fernandez de la Puente
-
(XXX 的本科微观经济学课程,私有)
-
(XXX 本科线性电路理论课程,私有)
-
-
基于别人建立的系统:
-
《曙光指南》作者:Mispy(定制实现)
-
Soren Bjornstad 即将出版的 TiddlyWiki 图书(以 TiddlyWiki 为中心的新实现)
-
- https://www.lesswrong.com/posts/JgBBuDf5uZHmpEMDs/how-you-can-gain-self-control-without-self-control
-
更远的地方
Execute Program 与此有关,因为它也是一个带有嵌入间隔重复功能的交流媒介的例子,但是它与其他媒介之间的区别要比其他媒介之间的区别大得多。
Chessable MoveTrainer 同样是一种集成的教学媒介和间隔重复系统,改编自国际象棋训练文本。
最初的助记媒介在前提上隐含着专制
原文:The initial mnemonic medium is implicitly authoritarian in premise (andymatuschak.org)
在《量子国度》(和 Orbit 的初始版本)中介绍的助记媒介,要求读者紧紧依附于作者,将其所有关键点照单全收地记忆下来。这是一个重大的要求,只有当读者完全信任作者的权威时,无论是在内容细节上,还是在决定哪些内容值得(反复)关注的问题上,这种要求才显得合理。
在机制上:
-
读者被期望与所有问题互动:
-
你无法在一系列问题中跳过某个问题(只能跳过整个问题集)
-
问题一旦被「收集」,你就不能删除或禁用它。
-
进度机制假设你会尝试回答所有问题,并且如果你不这么做,就会受到「惩罚」
-
-
问题是不可修改的
- 读者不能添加自己的问题,也不能根据自己的思考来调整这些问题的位置
如果这确实是读者的态度时,那么采取这样的态度无疑是有力的——就像他们真的想坐在这位作者的脚下,全面吸收他们在某个领域的全部知识一样(如 Gary Wolf 所暗示的那样,一种强有力的师生关系的机制)。但这不是我通常想要采取的态度,我认为大多数人也是如此。
作为一名读者,我确实希望有一种媒介能够支持作者尽可能有力地表达他们的观点。我想(有选择地)完全理解他们认为重要的内容,以及他们具体如何思考这些材料。但我(通常)不想被这种结构「束缚」。我希望我收集的卡片感觉处于我的控制之下。更多相关内容,请参阅:助记媒介应该让读者对他们收集的卡片进行控制。
实际上,对于作者来说,编写与这种专制性相兼容的文本是非常困难的:助记媒介的读者有时会因作者的用词而感到受阻。但我认为应对这一问题的正确方式并不是为读者提供一个「后门」,以便他们在不喜欢问题措辞时使用。我认为我们应该从概念层面上减少媒介的专制性。
参考资料
-
Gary Wolf 在 2021-07-10 发送给我的,有关严肃使用场景的电子邮件
-
Gary 指出,在现今大家都强调独立学习重要性的时代,我们却建立了一种「专制的工具」,这样做「颇具反主流文化」的意味。
-
他建议,作为一个「狂热的追随者」这样做可能是合理的,可以加深与作者的联系,与一些「最重要且通常被忽视的文化传播与创新机制」相关联。
-
这非常引人注目且富有创意,但我认为这并不是我想要创造的东西!
-
助记媒介可调整为将创制经验逐步展开的形式
助记媒介使读者持续接触材料。这意味着助记媒介中的文本——尤其是卡片——的编写不仅要考虑初次的阅读环节,也要兼顾后续几周乃至几个月中理解和吸收的需求(穿越时间的文本)。
作为作者,我认为量子国度这一最早的助记媒介实例,没有过多考虑这方面。读者每次复习时看到的都是相同的材料。就这些材料的变化性而言(例如通过应用卡片在重复时应有所不同),其演进并没有特别考虑到时间跨度。
在助记媒介创造的情境中,读者反复回顾作者的材料。因此,将作者的创制经历随着时间的推移逐渐展现给读者,应当是可以实现的。这在传统媒介中是不寻常的:传统媒介大多缺乏超过一天的创制时间维度
一个简单的例子是,随着时间的推移逐渐增加更多的整体性、综合性问题。另一个例子是,随着时间的推移解锁作者的新段落,在复习环节或复习通知中呈现(如 Execute Program* 的课程在你成功复习其前置知识之前不会解锁;但请注意:高效的复习安排与有门槛的课程序列相矛盾)(译注:Execute Program 是一个编程学习网站。)
另一种方法是:我们把「已记忆 5 天」称为「级别 2」,「已记忆 2 周」称为「级别 3」,以此类推;然后作者可以要求,读者必须在「BOSS 战」中取得成功,才能算作完成一个级别。这样的方法可能适合耗时较长的任务,比如针对一张特定卡片,写长度为一段的回复。
还有一种方法是:助记文本可以在一段时间内分段连载,根据读者的记忆情况排期
助记媒介可以扩展到个人笔记上
原文:The mnemonic medium can be extended to one’s personal notes (andymatuschak.org)
使用间隔重复记忆系统的过程中,你会写笔记来记录你所学习、观察和思考的内容。不幸的是,现有的间隔重复系统不鼓励常青笔记。记忆系统对于记住所写内容并持续琢磨很有帮助,但对于基于想法进一步思考并无太大功效。常青笔记系统有助于逐步完善想法,但对于记住这些笔记并持续琢磨没有太大用处(除了常青笔记的维护近似于间隔重复的效果之外)。因此,你陷入了一个困局,要么在两个不同的系统中混乱地重复劳动,要么放弃其中某一个系统的好处。
助记媒介针对散文解决了这个问题。间隔重复卡片通常是原子化的,而助记媒介为其赋予结构。我们可以如法炮制,在个人的笔记系统内部,就地为间隔重复卡片赋予结构。我们可以将其称为{个人助记媒介}。
例如,想象一下在个人笔记中{用大括号包裹一段内容},即可创建{挖空}卡片。
或者像这样制作传统的双面卡片:
问:如果一个人只在 Anki 中做笔记,他可能会遇到什么重大限制?
答:(例如,在写笔记时难以偶遇惊喜,没有办法轻松地逐步完善笔记,笔记之间的联系有限,难以「通读」某个主题下的笔记,等等)
实现
这个想法的类似版本有以下几个实现:
-
外部 SRS 导入器
-
Obisidan to Anki。需要手动完成一些步骤。
-
Ankify,需要手动完成一些步骤——不适合后台自动运行。
-
使用软件集成的 SRS
-
RemNote,一个日益完善的网络应用程序
-
Mochi,其互动淡化写散文笔记
-
org-fc, org-mode 的不错实现
-
TiddlyRemember,使用一些自定义标记与 TiddlyWiki 同步;需要手动同步,Soren Bjornstad 编写
-
参考文献
Nielsen, M. (2018). Augmenting Long-term Memory. http://augmentingcognition.com/ltm.html
我开始识别开放问题,这些问题是我希望得到答案,但似乎尚未被解答的。我发现了一些充满可能性的技巧和观察,但我还不知道其重要性。有时,我还发现我自认为是整个领域的盲点。我也会在 Anki 中对所有这些内容设问。于是 Anki 成为支持我创造性研究的媒介。此时 Anki 暴露出一些缺点,因为 Anki 设计时并没有考虑到支持创造性工作——比如说, 对于草稿空间中长时间的自由探索活动,Anki 先天不足。
助记媒介可以通过简单的应用卡片帮助读者应用他们所学的知识
原文:The mnemonic medium can help readers apply what they’ve learned through simple application prompts
助记媒介帮助读者记住他们所读内容的具体细节,但许多读者本能地感到,他们的记忆可能过于僵化——仅限于鹦鹉学舌地记住熟悉问题的答案。他们有这样的直觉,即真正的理解比这更加灵活,应该可以应用于新的情况 (即迁移学习)。许多读者说他知道,如果他们能将理解应用起来,他们才真正理解某项知识,无论是实践应用还是社会上应用。
为了真正让理解能运用起来,也就是创造一个类似赋能环境着重于环境所赋能的事中描述的环境——我们需要创造 The Primer++。但我们已经知道间隔重复记忆系统可用于促进应用、综合和创造,所以我们可以沿着这个思路,在助记媒介中包含一些简单的问题,要求读者在陌生情景中综合运用所学。这样的问题有助于读者提高灵活性,增强对其知识的自信心。应用型问题能显著增进助记媒介对理解的积极作用。
例如,除了要求读者回忆量子 X
门的矩阵表示外,我们还可以要求读者应用这一知识,如计算 X
门应用于 (|0>-|1>)/sqrt(2)
时量子线路的输出。然后下一次,我们可能会问读者 X(0.8|0> + 0.6|1>)是多少?
:应用卡片在重复时应有所不同。
这种问题之所以好,部分原因是它和你所记忆的知识非常接近。不需要制定解题策略,不必判断哪些步骤要执行,而要执行的步骤本身也较为容易;也不必将很多细节用全新的方式组合起来。
我们在量子国度 中《量子力学提炼》这篇文章里部署了应用卡片。到目前为止,我们发现了:
一些这个想法更复杂的变化:
一些问题:
参考文献
与迈克尔-尼尔森的对话,2019-12-30
与迈克尔-尼尔森的对话,2020-01-01
助记媒介可以包含一些辅助近迁移的卡片
原文:The mnemonic medium could include prompts which support near transfer (andymatuschak.org)
助记媒介可以帮助读者通过简单的应用卡片应用他们所学的知识中描述的方法,让读者将阅读所得的知识应用在简单机械的场景,从而增进他们的自信心。不过,要形成更灵活的理解,读者需身处不熟悉的情境之中也能创造性地应用他们所学的知识(提取练习和迁移学习)。
助记媒介可以包含要求「近迁移」的卡片:卡片上的任务似乎不熟悉,但其实想明白需要迁移哪些熟悉的知识/步骤就可以了(之后就是一马平川)。
例如以下问题:
这个电路中空缺的门是什么?
|0> —> [?] —> Y —> -i|0>
类似这样的问题当然可以写很多,但这样似乎就有些南辕北辙。这些问题的根本目的,就是要让人迁移知识,在不太熟悉的情境中运用起来。可以写一个不太一样的变体:
如何用基本门将 |1> 转化为 |+> ?
这样的问题做得越多,你越擅长完成填补空缺的电路门这一类题目,但我觉得你迁移知识应用于陌生情境的能力没有提高。
有许多「近迁移」的任务可以满足助记媒介中简单的应用卡片可以和回忆卡片以一样的方式呈现中描述的许多假设,但他们可能会想要一个不同的机制。在这些问题上,重复的作用是不同的:对于应用卡片,重复的变化建立了对单一技能的熟悉;对于近迁移的卡片,根据定义,不同卡片必须是不可互相替换的。
一种方法是把这些问题看成是「BOSS 战」。读完文章之后,你要回答几个「BOSS 战」类型的问题,在每次复习时......但每次的问题都不同。也许有一组 20-30 个或其他问题。如果你做对了一个,就没有必要再重复其他题目。如果你做错了,这组中的其他问题过几个月又会出现,希望你已经忘记了。
上文举出了助记媒介可调整为将创制经验逐步展开的形式的一种办法。
参考文献
Wiggins, G. P., & McTighe, J. (2005). Understanding by design.
助记媒介对于平台知识特别有价值
原文:The mnemonic medium is particularly valuable for platform knowledge (andymatuschak.org)
我们还不知道不同种类的内容在助记媒介上的表现如何。但是有种类型的知识似乎特别受益于这种媒介,那就是「平台知识」。即那些可以用来支持很多后续活动的基础材料,比如量子国度。在这种情况下,记忆系统的日常开销更有可能值得支付。
在某些领域,如果不熟练掌握一些平台知识,实际上可能无法学习更复杂的概念:复杂的概念可能很难学习,部分原因是工作记忆容纳不下其组分。
在其他领域,比如气候科学,少量的平台知识可以让人们用模型而不是直觉来思考。
更有意思的是:平台知识帮助非从业者放大好点子
问:为什么量子国度是值得用助记媒介学习的高性价比材料?
答:它是「平台知识」:很多其他材料都依赖于它。
问:为什么助记媒介用于平台知识特别有价值?
答:学习的额外「成本」得到了更充分的回报。
问:为什么用助记媒介写一篇典型的博客帖子时,成本/收益比可能很差?
答:大多数博客帖子都不是「平台知识」:读者不会有意义地建立在这些知识的基础上。
助记媒介使读者长久与材料保持联系
原文:The mnemonic medium keeps readers in contact with material over time (andymatuschak.org)
除了对记忆的影响,助记媒介的读者通过复习环节与他们所读的内容保持不断发展的联系。相较于读过一次后可能再也不去回想读过的内容,复习环节使得读者反复回顾。这是一种穿越时间的文本。
随着时间的推移,这种联系会有怎样的效果?
-
我认为读者与文本的关系,以沿某种有意义的方式发生了改变。因为你被强制要求在一段时间内反复思考这些材料,所以更容易被认为是,比如说,一个正在思考量子计算的人——而不仅仅是读过一次量子计算文章的人。
-
它制造了一个机会,让概念间可能产生自发的联系。「哦,对了,再次看到这个卡片让我想起......」在复习环节中,读者脑海中的这些材料得以「刷新」,这种效果可能会超越复习环节——读者在其他情境中或许会碰撞出偶然的联系。
-
特别是,如果是为了反思总结写卡,上文的效果就可能产生这么一个机会,人们会随着时间的推移,逐渐在更深的层次上思考这些材料。例如,一个旨在帮助你反思自己设计实践的卡片,在第一天和第一千天的作用差别可能很大。(参见间隔重复记忆系统可用于促进应用、综合和创造)
-
一个不同的角度:间隔重复系统充当教义问答
超越简单的联系:助记媒介可调整为将创制经验逐步展开的形式。
Readwise 试图通过更加被动的参与产生类似的效果。
助记媒介可能通过提供作者创作的卡片来辅助卡片编写
原文:The mnemonic medium may help scaffold prompt-writing through author-provided prompts
助记媒介提供专家编写的卡片来消除编写卡片的负担,这有助于缓解写好间隔重复记忆卡片很难的问题。但是,助记媒介嵌入这些卡片,同样能够帮助那些想要亲自编写卡片的读者。他们可以看到专家编写的卡片,从而将其用作自己卡片的模板。
几位量子国度的读者告诉我们,他们在阅读《量子国度》之前尝试过使用 Anki,但是放弃了,不过现在他们对编写卡片的方法有了更清晰的头绪,便又拾起来 Anki 了。
一种更主动的变体:嵌入卡片模板可以主动辅助助记媒介读者编写卡片
用户对这种效果的反馈
Giacomo Randazzo 谈量子国度的影响/2020-03-28:
「量子国度系列对提升我的 Anki 技巧非常有帮助。里面的抽认卡都是经过深思熟虑的,还融入了一些想法,有利于在刚上手材料时,挖掘出不算显然的问题与答案做成卡片。作者是逐步引入这些想法的,值得赞赏。如果你数学背景知识足够,而且想要学习如何有效使用间隔重复软件,我认为花时间看完整个量子国度系列是非常有价值的!」[来源1,来源2]
参考文献
Matuschak, A. 和 Nielsen, M. (2019年10月). 我们怎样才能开发出变革性的思维工具?https://numinous.productions/ttft
…编写优质卡片是一项难以掌握的技能,用户自己做的卡片可能质量很低,因此如果能提供更高质量的卡片,便能弥补用户没有制作卡片的损失。以后用户自编卡片必要性这个问题,值得深入研究,既要更严谨地论证说明,又要探寻如何获得主动编写卡片的好处。
助记媒介可能会促使读者更缓慢、更专心地阅读
原文:The mnemonic medium may push readers to read more slowly and attentively (andymatuschak.org)
量子国度的读者在采访中用不同方式告诉我们,嵌入的问题(助记媒介卡片穿插在阅读过程中)促使他们更仔细地阅读,或帮助他们注意到走神的情况。撇开卡片对记忆的直接影响不谈,助记媒介中添加的问题,可能只是帮助读者在阅读时放慢脚步,并专注于所读内容。理解概念需与其尽力较量,所以助记媒介的这种效果可能会让读者理解更深刻。
复习区还让阅读自然地停顿,有点类似于 Eckhart Tolle 的停顿符号,但复习区不比停顿符号具有反思性。相关的:助记媒介复习集使阅读过程产生了自然的中断
对于同一篇文章,比较嵌入问题的版本,和没有嵌入问题的版本的阅读时间,估计会很有趣。嵌入问题版本的阅读时间需要排除思考问题的时间。应用上眼球追踪数据也许很有用。
助记媒介应该为那些服务于有意义的使用的学习而开发
助记媒介最明显的应用就是正式的教育环境。它可能可以帮助学生更快、更可靠地学习。但我担心,在这种情境下开发助记媒介会迅速扭曲它的目标:赋能环境的活动直接服务于内在意义的目的。它很容易成为准备考试和被动学习的附庸,而不是像我希望的那样,成为一个服务有意义的创造性项目的个人赋能工具。
当然,我能想象到,如果这个媒介是成功的,人们会用它来更容易地通过考试。但如果让它的开发被这种使用案例驱动,那将是一个错误:这可能会最终产生一个帮助人们通过考试的媒介,但并没有创造有意义的赋能。(助记媒介的目标要比回忆率这个误导性的名称更有意义,如果我们基于——媒介如何更好的服务读者意义的真正来源——来研究,我们最终会得到一些本质上不同的东西。这里有一个路径依赖的问题。
Alan Kay 说:「我不觉得你可以从『文本』或『编程』开始并走得很远。我认为总是最好有一些你想做得更好的重大事情——最终这些事情会为需要发明的帮助做这些事情的各种媒体(包括『语言』)提供线索」(Bret Victor's 2021-06-14 回复我关于研究-背景匹配的电子邮件)。同样在这里,我不认为人们可以从抽象意义上的「学习」开始并走得很远(参见教育计划往往会自我颠覆)。
这一观察使我对助记媒介的几个可能的背景类型感到犹豫:
-
正式教育环境(见上文的讨论,以及助记媒介应该在即时学习环境中发展,而不是在预备学习环境中)
-
与 Grant Sanderson 和类似创作者的合作:这些作品的观众往往由好奇心驱动,而不是一些有意义的使用(另见量子国度的读者大多由好奇心而非严肃的使用背景驱动)
-
参与医学生社区:我担心(也许是毫无根据的),医学上的大部分学习动力来自于竞争和对高分的渴望,而不是来自于实习的压力、真诚的知识兴趣等;见正式教育环境的笔记
有意义的使用还不够。为了成为我研究的良好背景,这种使用的要求还得相当高:助记媒介应针对真正需要流利掌握的情景而开发。
助记媒介应针对真正需要流利掌握知识的情景而开发
量子国度的读者大多由好奇心而非严肃的使用背景驱动。作为系统的设计者,这些读者没有给我带来足够的压力。当然,如果觉得这是在浪费时间,他们就会停止复习。所以不是完全没有反馈。但很难清楚地感觉到记忆系统的相互作用是如何转化成任何真实的东西的。
如果读者都是首次踏上科研之路的研究生,或者是试图转行到量子计算的人,我们就可以与他们进行很多优质的对话,讨论文本/媒介在支持他们目标方面的成功或失败。但由于目前这些读者是受好奇心驱使,很少有外力“回击”,暴露出他们所学的不足之处。
理想情况下,对流利的迫切需求来自于一些对个人有意义的目标(比如一个创意项目),而不是想要通过考试:助记媒介应该为那些服务于有意义的使用的学习而开发。
这一标准表明,与非正式/休闲的「内容创作者」合作(例如 Grant Sanderson)可能不是开发媒介的好环境,因为他们的读者/观众通常并不需要流利。
相关:
助记媒介应该基于即用即学的场景开发,而不要基于预备学习的场景开发
我认为「预备学习」简单来说就是这样:你想当医生,所以你去医学院上学,在头两年上课,然后在第三年你便能诊断一些病人(作为实习生,在监督下)。这种学习方式在正规教育背景下很典型。前两年的主要活动就是培养技能;你在为自己参加未来的一些活动做准备,而这些活动才是实际价值所在。
相比之下,「即用即学」的场景下,人在开展其他主要活动中,发现需要学一些东西,于是才去学习。例如,假如你是住院医生,其他人在围绕似乎一位有运动障碍的病人开展讨论,而你发现你听不懂他们在讲什么。然后你可能会回家复习关于这个主题的书,希望既能帮助你的病人,而未来遇到相似病人,也能为他们效劳。
我认为这些「即用即学」的场景可能更有利于发展助记媒介,因为这些场景将更清楚地展示媒介和有意义的赋能之间的联系。
「预备」学习环境与我们实际要赋能的活动相去甚远。课程大纲(或其他结构)规定了你应该学习的细节。如果课程的反馈回路(问题集/测试)对他们进行奖励,学生就会倾向于使用和重视这个媒介。但是,我们希望媒介的发展是通过让人们做有意义的事情来推动的,而不是通过帮助他们获得更好的成绩。(助记媒介应该为那些服务于有意义的使用的学习而开发)成绩会扭曲我们的工作。例如,如果填鸭式学习能在考试中取得不错的成绩,这似乎是比助记媒介更好的选择。而我们很容易发现自己在帮助学生获得好成绩的同时,并没有提高他们做任何有意义的事情的能力。
从实际情况来看,这可能意味着:
-
针对的是住院医师,而不是医学生
-
支持研究生做研究,而不是支持研究生通过资格考试
-
帮助新手营的学生在校外实习中编写代码,而不是在课业中
-
将员工入职培训的重点从第一周转移到第一年
-
帮助那些正转向新领域的人(而不仅仅是提前学习)
这里有一个挑战,就是完全的新手无法即用即学,因为他们的知识,对于开展有点规模的项目来说还不够。但这正是助记媒介大显身手的地方。间隔重复记忆系统可以加速学习科目的令人不快的早期阶段。如果我们能找到一些情况,人们在完成有意义的活动时,需要学习一些知识,但他们必须从基础开始学起,那就太好了。
相关笔记:
参考文献
- Joe Edelman 在 2021-05-28 的谈话中帮助我理解了这一点。
助记媒介应该允许读者对他们收集的卡片进行控制
原文:The mnemonic medium should give readers control over the prompts they collect (andymatuschak.org)
最初的助记媒介以威权主义为隐含前提。这些机制:
-
不鼓励/阻止许多有价值的主动阅读模式,例如获取精华的略读,以实际应用为动机的指向特定目标的阅读,非线性阅读,等等:最好的阅读方式是高度语境化的
-
鼓励一种被动的心理姿态——读者随波逐流,而不需自主思考,而间隔重复记忆系统使记忆成为一种选择中隐含的正是使用者的主动选择
-
创造学校式的学习美学,实际上与 Orbit - 价值不符,例如,「帮助你加深与你最关心的东西的关系......服务于引人秉烛夜谈的想法与图景......而不是你认为你『应该』学习的……其风格不应当是『教育式的』」
-
当卡片似乎写得不好或没有意义时,就会产生主动的挫败感;见例如助记媒介的读者有时会因作者的用词而感到受阻,在非技术性的助记文本中,挖空常常造成挫败感
-
阻碍了媒介与读者知识工作的其他部分之间的流畅互动,与之不同的是,例如助记媒介可以扩展到个人笔记上
-
创造(正确但不好的)感觉,即卡片不是「你的」,是你认为合适的材料;相反,你是在参观由作者创造的博物馆,一切都隔着一层玻璃
-
使得用户很难用助记媒介来辅助学习如何写自己的卡片(助记媒介可能通过提供作者创作的卡片来辅助卡片编写)
-
不鼓励迭代重构的必要做法(一般来说,间隔重复系统系统性地低估了这种做法)
前进方向
我想更激进地调整 Orbit 的氛围,使其更偏向于以读者为中心。很难在不破坏助记媒介的其他重要特性的条件下实现这一点。专家撰写的卡片确实贡献了大量的价值(助记媒介提供专家编写的卡片来消除编写卡片的负担)。我们希望在提供流畅性、延展性的同时,也能保留这种价值(甚至可能增强这种价值!)。
我们可以从一些相对简单的方法开始:读者应该能够禁用或跳过那些没有共鸣的卡片;读者应该能够对作者的措辞进行简单的编辑;嵌入式界面不应该阻止人们只复习一个页面的一部分。所有这些都将为作者产生有趣的信号:助记媒介可以产生有趣的作者分析
但我认为我们必须更上一层楼。我觉得有几个方向很有前景,不过这些方向都需要进一步完善:
-
不同行为之间应该能切换自如:复习卡片、编辑卡片内容、重构当前卡片(由一张发展为多张)和这张卡片相近的作者制作卡片(多张合并为一张)、受到作者卡片启发而自己撰写新卡片等行为
- 理想情况下,这种互动模式应该延伸到复习体验:在复习过程中,如果你想到了改进卡片的方法,或者你想起了你想写的新卡片,切换到新的动作应该是同样流畅的。
-
对于从文本中获取卡片的方式,从文本挑选的方式值得探索。想象一下,随着阅读,一些短语会以特殊的方式高亮出来,说明作者为文字表达的想法制作了卡片。如果你觉得这些短语有意思,你可以点击这些高亮的文本——然后“轰”,你就能永远记住它。
-
对于这种类型的卡片,我们希望阅读-编辑的互动是同样流畅的。
-
这种类型的互动为众包注释、机器学习 (ML) 生成卡片等指明了方向。更广泛地说:想象一下,如果你可以在任何地方指出你认为有趣的任何想法,并能放心你现在能持久地记住这个想法(最好是深深地内化)。
-
Ozzie Kirkby 建议,这里可能有一些有趣的中间地带,可以鼓励读者自己写卡片,代表他们认为有趣的细节:也许作者(或 ML,或系统)可以为关键文本区域提供不完整/“开头”的模板,用户将根据他们认为合适的方式调整/完成。
-
-
助记媒介的展示形式和互动模式应该非常清楚地传达出你得来的卡片是属于你的,即使你在使用作者制作的卡片。Taylor Rogalski 指出了一个有用的比喻,即复制一份谷歌文档,在上面肆意涂画。
-
我们可以通过充实我的个人记忆媒介的实现,开始尝试媒介与读者的其他知识工作之间的流动互动。这个方向与本说明的其他部分所谈的内容确实不太一样。我不清楚作者提供的卡片与这种笔记的互动情况。因此,也许这仅仅是转移视线......但我的直觉是,这将是有启发性的,所有这些工作都是相互关联的。
-
我猜想这项工作对于 Orbit 的「图书馆视图」是有所裨益且息息相关的。对我来说,一个相关的优先事项是模糊卡片之间的「边界」;见《如何写出好卡片》中的讨论这里,搜索("revision is a holistic endeavor")。这也意味着对作者的卡片和用户的卡片之间的界限进行模糊处理。我们应当避免一种范式,其中不同来源的卡片被放置在不同的概念「空间」中——不过我认为用一些承担特质(affordance)来表达出处还是可取的。
::TODO 本节的大部分内容应在更详细的单独笔记中加以充实::
参考文献
见 Yusuf Ahmad 关于这种紧张关系的说明,他将其归纳为「工业」教育架构与社会建构主义架构之间的鸿沟:https://www.notion.so/Placing-Cog-Sci-ideas-within-a-broader-Learning-Architecture-fa69fc15ba9e41b8a2e136f7fbe0362b
助记媒介提供专家编写的卡片来消除编写卡片的负担
原文:The mnemonic medium supplies expert-authored prompts to remove the burden of prompt-writing
写好间隔重复记忆卡片很难,但助记媒介通过提供作者编写的卡片,能够消除采用间隔重复记忆系统的这一障碍,使读者不用自己写卡片就能记忆材料。
学习别人的间隔重复记忆卡片通常是无效的,但我们相信助记媒介可以解决这个问题,只要更认真地对待卡片写作,并将卡片嵌入到叙事结构中 (助记媒介赋予通常原子化的间隔重复记忆卡片以结构)。这种方法有个重要的问题:最初的助记媒介在前提上是隐含的威权主义。
还要注意,这些卡片并不是孤立出现的:助记媒介的卡片穿插在阅读体验中。
当规模扩大时,这种方法可能有助于解决间隔重复系统能力的限制因素是写出足够多的好卡片。
助记媒介对成熟领域的入门读物很有效
原文:The mnemonic medium works well for primers in established fields (andymatuschak.org)
在人们初学某一领域的时帮助他们增强学习,收益会非常大,特别是帮他们增强记忆:例如间隔重复记忆系统可以缩短科目学习中不愉快的早期阶段。
助记媒介特别适合于此场景,因为最初的助记媒介在前提上隐含着专制:它假定你想要尊重作者在该主题上的权威并记住每张卡片。对于入门读物来说,这一假设极大概率是正确的,因为读者对于新主题没有太多概念或成见。
我认为同样重要的是,入门读物要涵盖一个成熟的领域,这样它的内容就不会有太多争议或作者的癖好。当领域不是很成熟时,读者更可能会质疑作者挑选的重点。
我认为这些原因一定程度上解释了为什么量子国度的效果相对较好。
问:量子国度作为助记媒介很成功,为什么量子国度是入门读物这点对其成功很重要?
答:助记媒介假设读者希望在学习内容和方法上大体上遵从作者的意见;入门读物最符合这一假设。
问:量子国度介绍了一个成熟的领域,为什么这对它作为助记媒介的成功很重要?
答:没有必要质疑内容:如果读者想了解量子计算的基础知识,他们可以相信这是他们需要学习的东西。
助记媒介依赖的卡片应是轻量级的
原文:The mnemonic medium’s design relies on light-weight prompts (andymatuschak.org)
助记媒介的设计目的是为了使卡片的复习变得特别轻量化。
-
**小任务:**在间隔重复记忆系统中, 那些设计出色的回忆卡片通常只考察一个事物,所以它们可以被很快地回答。量子国度的卡片其复习时间中位数是 6 秒(截至 2019/12)。
-
**一键评分:**由于卡片是自主评分的,所以互动本身相当轻巧:只需轻轻一按。无需精确落点:按钮各覆盖一半的屏幕。另见自主评分的间隔重复记忆系统比机器评分的系统更有效率。
-
**无交互式阅读:**只要问题与答案足够短,短到不用滚动也能浏览,就能确保阅读时,揭示答案与给回答评分是唯一所需的两种交互,也就是说,此时阅读问题无需其他状态参与。
-稳定性: 卡片和复习区的布局固定,相邻卡片在 z 轴上堆叠而非垂直,于是每当卡片被回答,下张卡片就会出现在屏幕的同一位置,所以用户不必去「找」下张卡片的问题或答案的起点,因为他们总是在同一个绝对位置上出现。
-
同样,在这些卡片之间,读者也无需用鼠标或手指去「重新瞄准」它们,因为这些按钮总是在同一个绝对位置上。
- 在不同的设备上,卡片也不会改变其布局。
-
**容忍度:**大多数读者不会在意每张卡片。如果卡片像课本上的习题那么沉重,很多读者就会挑挑拣拣,有意识地去想,「是否」要回答每张卡片。这种额外的想法会使得卡片变得更加沉重!但如果卡片是相当容易回答的,一些无趣的卡片就不那么有负担了。可能会有一些读者希望「跳过」这些卡片,不过默认假设读者会回答每张卡片,依旧是合适的。
轻量级卡片对全面覆盖很重要
如果读者打算记住一篇助记文本中的所有关键材料,那作者就必须添加大量卡片(例如,QCVC有 112 张卡片和两万字)。而当卡片变得轻量,在一定水平的兴趣或时间成本支持下,读者能够负担的卡片数量会变得更多一些。如果复习一张卡片需要 6 秒,我们就可以在 QCVC 中添加 112 张卡片,大约需要 10 分钟——这并不坏,因为多数读者需要用 3-4 小时才能读完这篇文章。
在仅考虑阅读文章内的时间下,若卡片需要两倍的时间来回答,看起来也不算太糟,因为用 20 分钟取代 10 分钟,相比于 3-4 小时的阅读体验来说,并不那么重要。但在效率(或低效率)的复合作用下,由于大多数读者需要 5-7 次的重复,以达到数月的记忆留存,若一张卡用时 6 秒,那么可以预计,在接下来的几个月中,为了留存 112 张卡片的记忆,读者将要花费 90 分钟,若这个数字再翻倍,那将是巨大的负担。(参考助记文章能让读者详细记忆其中内容,成本是增加 35-50% 的阅读时间开销)
轻量级卡片可以更有规律地穿插于阅读
传统教材将章节与练习相结合,但这些问题通常相当复杂,他们可能需要你拓展思维,或用纸笔——不管怎样,此时会发生语境从阅读过程中切出,你肯定也不想每隔几段就要考虑切换语境。
而助记媒介的提问相当轻量,在量子国度我们可以每读几百个词就穿插进行一次。这可能会干扰阅读体验,其实我们就卡片弹出的时机问题,广泛地采访了读者,但没有读者反馈说复习集破坏了阅读体验,相反,还发现了一些积极的效果,更多讨论详见助记媒介卡片穿插在阅读过程中。
应用卡在多大程度上可以取代助记媒介中的回忆卡?
助记媒介可以通过简单的应用卡帮助读者应用他们所学的知识。在实现了这种卡片后,在多大程度上还需要传统的原子回忆卡呢?
想象一下,我们在高中的微积分课程中,你刚刚学会 e^ x
是导数为其本身的函数。如果这节课是用助记媒介写的,我们可能会问这些回忆卡:
问:什么函数是它自己的导数?
答:
e^ x
问:
f(x)=e^x
的导数是什么?
答:
e^x
但是,我们也可以想象将其做成一张应用卡:
问:
e^8x
的导数是什么?
答:
8e^8x
解释:e^x 的导数是它本身
如果我们只给他们这一个问题,我不一定期望他们对 e
的陈述性知识最终会很扎实:他们很可能最终只是记住这个问题的答案。应用卡在重复时应该有所变化,所以想象一下,我们还问了一堆变体,比如:
问:令
f(x)=14e^[x]
。dy/dx
是什么?
答:
14e^[x]
解释:e^x 的导数是它本身
想象一下,读者可以解决这个问题,也可以解决其他半打的变体 ,现在距离最初的课程已经过去一个月了。让我们回到我们提出的回忆卡上。我们是否希望读者能够回忆起:「什么函数是它自己的导数?」我认为这是很有可能的......但我怀疑,与回忆卡的准确性相比,变体准确性之间的相关度会更高。
从概念属性上理解 e
与从程序上理解 e
是不同的。我猜想,包括这两种类型的问题可能会产生更丰富的精细编码。
现在,我们是否期望读者能够回答提出的回忆卡:「f(x)=e^x
的导数是什么?」我希望如此,而且可能性很大:毕竟这个问题可以被解释为一个微不足道的应用卡,而且读者已经解决了更难的变体。
这是否意味着,在有那些应用卡的情况下,这张回忆卡是不必要的?考虑一下:如果读者没能够一致地回答那些应用卡呢?第一个变体需要同时应用链式规则(以及 d[kx]/dx = kx
的知识)。第二种变体还需要理解 dy/dx
的语法。这些都是比较复杂的问题。
当读者忘记了回忆卡的答案时,他们会看一下答案,并试图记住它以便下次使用。如果问题是原子性的,而且复习安排调整得很好,这通常会奏效!但如果读者不能回答应用卡,他们就不能只看答案并试图在下一次记住它:应用卡的答案不应该从记忆中得出。他们必须分析答案(可能包括其解释),分辨出他们没有记住的内容,并尝试在下一次回忆这部分内容。这比回忆卡所需的难度要大得多。一个对链式法则仍不放心的读者可能不会注意到他们无法回忆起 e^x
的导数。如果没有单独的以回忆为主的卡片,他们对这个应用卡的回答可能在相当长的一段时间内都是不可靠的。
对这个问题进行实证实验将是非常有趣的!当相关的回忆卡被搁置时,读者的应用卡准确性会受到怎样的影响?
一个有趣的实证例子是 Execute Program:Execute Program 的卡片既是应用卡又是回忆卡。
把任意网页转化成助记媒介
原文:Turning any web page into the mnemonic medium (andymatuschak.org)
量子国度是专门制作的网站;文章的呈现与助记媒介的机制紧密结合在一起。然而,助记媒介的主要交互是足够独立的,因此,这些交互应该可以通过简单的 HTML 代码嵌入任意网页。
我有操作系统层级的间隔重复系统这一愿景,能任意嵌入这点对这个愿景是核心的一环。
Web 组件
通过设定新的 HTML 标签(比如 <card>
),我们可以定义助记卡片的规格。之后我们会提供 Javascript 库,其功能是对导入这个库的页面,将这些组件「注水」,在运行时把标签替换为 DOM 节点。除了 Edge 的所有现代浏览器都支持这样的 Web 组件,而且似乎有 Web 组件的 polyfill。
这种实现方式无需将发布者绑定到特定的用户数据存储服务器:我们的客户端库可以灵活接入各种存储方案,包括支持客户端本地持久化存储(无需账号!)。
这个方法非常灵活:你可以替换客户端的库,只要支持同一个 Web 组件规格即可;未来可以增加对不同后端服务器的支持。可以扩充这个 JS 库所支持的功能。出版者可以自己部署 JS,或者利用我们手下的 CDN。如果 JS 被禁用了,或者脚本无法获取,卡片只是会不显示。甚至可以定义标签打印时的样式。
这个方法需要不少抽象。如果需要大改协议、规格、状态格式之类,我们可能会遇到兼容问题。
更重要的是,这个方法需要作者/出版者撰写 HTML。假如作者的工作流是从 InDesign 源文件导出 HTML,在这样的工作流里加入卡片就比较困难了。如果 HTML 文档不是「真相之源(source of truth)」,只要作者重新从源文件导出,卡片标签会被删除。
对于这种方法,可能需要为 Wordpress 之类的平台写插件。
第三方的用户验证有很高门槛
只要用户登录了,他们应该不用在每个网站登录就在边上网边积累卡片。这样很难实现啊!
托管网站不能写 cookie 让其他托管网站读取;cookie 是按来源锁定的。
我们可以把验证机制嵌入在 iframe 里,在同一来源托管,但这样的 cookie 是「第三方 cookie」。最近几年来,浏览器开始激进地锁定第三方 cookie,其中以 Safari 为最。其原因是第三方 cookie 被广泛用于实现侵犯隐私的跟踪和广告功能。
问题的症结在于,任何允许嵌入式身份验证提示共享凭据的机制,都可能被滥用于用户跟踪和隐私侵犯。我们似乎难以避免被卷入浏览器安全政策的交叉火力中。虽然 Chrome 和 Edge 目前还能「照常运转」,但 Safari 和 Firefox 却不然。值得注意的是,微软 Edge 浏览器已将存储访问 API 列入了「实现中」的功能清单。
苹果和 Mozilla 提供了存储访问 API,允许第三方站点申请访问其存储的身份验证凭据,但在 Safari 浏览器中,这似乎总是需要明确的用户批准,多少有些令人不快。更加严苛的是,Safari 可能仍然只有在用户已经在第一方上下文中与网站产生交互后,才会允许设置 cookie。这无疑是非常苛刻的现实,我们可能需要开发 Safari 扩展来优化和提升浏览体验。
值得欣慰的是,Safari 至少新增了一个 API,供第三方站点判断用户的登录状态。变更集 250944 – WebKit
解析并替换文本块
一些工作流中用户不能随意添加 HTML 标签。比如利用只有可视化编辑手段的博客软件制作网站。
这时候,如果假定我们能注入脚本,作者便可以像我的个人助记媒介实现里一样添加问题,之后在运行时由脚本解析提取。
本科学习环境很少为发展助记媒介提供良好的情境
我记得作为本科生的感受。我选了五门课,只有一两门是我真正感兴趣的,其他的只是因为不得不选。我虽然对学习有兴趣,但生活中还有许多其他事情吸引着我。此外,本科课程对学生的记忆保持要求通常不高。如果教授告诉我「整个学期花两小时用这个系统,以确保记住所有内容」,我可能不会使用它。我已经在用的方法似乎「够用」,尽管我知道自己的记忆并不完美。
实际上,我在项目:2021 年春季 Matt Clancy 微观经济学合作中也观察到了类似的行为。这本不应该让我感到意外!这种行为其实并没有错,大多数情况下是学生的理性选择。只是它并没有给助记媒介足够的压力,使其成为一个对我来说良好的情境:助记媒介应针对真正需要流利掌握知识的情景而开发。
当然,在任何班级中,总会有几个学生真心想要深入掌握材料。我相信在某些课程中,助记媒介会被更认真地使用,无论是学校/教师要求更高,还是主题本身要求更高的流利度(例如有机化学)。
我们可以通过撰写只需要中等领域专业知识的主题来发展助记媒介
在《我们如何才能开发出变革性的思想工具》中,我们提出了「好的思想工具大多是在对严肃问题进行原创工作时产生的副产品。我们还提出,强大的思想工具往往依赖于领域层面的深刻洞察,这些洞察推动了「实践出洞见」的循环。
这有助于解释为什么 Logo 不是一个思考微分几何的好工具。Papert 并没有深入涉足那个领域,所以我们不会期望他开发出关于微分几何的强大想法,这些想法对于在该领域发明一种新的思想工具是必要的。事实上,他可能甚至没有足够的专业知识来评估该工具相对于该领域的力量。
这对于发展助记媒介意味着什么?如果我们想要写关于解决气候变化问题的文章,我们是否必须成为气候变化领域的世界级专家呢?
如果你正在开发一个界面,它通过具体化某个媒介的深刻想法来获得力量,那么你需要对那种媒介有深入的专业知识,才能具体化正确的想法。Papert 没有这样的专业知识。相比之下,助记媒介主要是具体化关于记忆、知识理论、习惯等方面的想法——而不是关于量子计算的思想。QCVC 确实探讨了量子计算中的一个严肃问题(「外星人会有什么样的计算机?」)。这对我们(也就是读者)在媒介中的投入是至关重要的。我们也需要中等程度的专业知识,才能写出好的问题,以及评估我们工作的影响(思想工具应该在有内在意义的目的上下文中进行评估)。
但是,将 Logo 批评类比到助记媒介上,并不是说在助记文本的主题上需要具有最前沿的专业知识。一个量子计算的业余爱好者就能制作出《量子国度》(Quantum Country,一个关于量子计算的助记媒介网站)。
也就是说,领域层面的专业知识很可能会起到事半功倍的作用:在助记媒介中制作询问-回答式卡片可能有助于作者思考他们的主题,这反过来又会帮助他们以更有趣的方式推动媒介的发展。
如果我们想要专注于创建强大的新型可执行书籍,以便我们能够解决气候模型中的问题(还顺便进行交流),那么 Papert 的论点就会更直接地适用,而且我们就需要更多的气候科学方面的专业知识。
参考文献
Matuschak, A., & Nielsen, M. (2019). How can we develop transformative tools for thought? Retrieved December 2, 2019, from https://numinous.productions/ttft
2019-12-03,与 Michael Nielsen 的对话
将助记媒介看作更深入理解文本的手段会怎么样?
助记媒介将其重点放在帮助读者建立所读内容的详细记忆上。这显然对平台知识非常有帮助(助记媒介对于平台知识特别有价值),但是详细记忆通常不是其他类型写作的主要目标。
在思考助记媒介如何让读者从平台类之外的体裁中获得知识?时,一种方法是将卡片更少地用作建立详细记忆的手段,而更多地用作提示更深入理解的手段(助记媒介可能会促使读者更缓慢、更专心地阅读),不仅是在阅读体验中,而且在时间上延伸(助记媒介使读者持续接触材料)。
一种相关的潜在机制:嵌入卡片模板可以主动辅助助记媒介读者编写卡片
将想法送入你的轨道(Orbit)
什么可能构成助记媒介的规范用法?
原文:What might constitute canonical uses of the mnemonic medium? (andymatuschak.org)
一个重要的类别是,许多人难以掌握的平台知识的集中来源(助记媒介对于平台知识特别有价值)。例如:
除了平台知识之外,我们对助记媒介在其他领域的应用理解得相对较少(助记媒介如何在平台类知识之外的体裁中赋能读者?)。
真正的规范用法还需要作者写得出神入化,不仅文章得行云流水,连那些卡片也得做得恰到好处。参见高质量的间隔重复记忆卡片最重要的属性
助记媒介对读者的宏观影响是什么?
原文:What’s the big-picture impact of the mnemonic medium on readers? (andymatuschak.org)
如果说助记媒介帮助读者记住他们所读的内容。那又怎样?
相对于读者生活中重要的东西,为什么记住所读东西很重要?记住之后能获得什么?
相关笔记:
从《量子国度》读者学习到的
实际上,这里的一个关键挑战是量子国度的读者大多由好奇心而非严肃的使用背景驱动
读者的评论
-
对话能力增强
-
Riley Buchanan:「理解(和记住)我在《量子国度》第一篇文章中所学到的东西,对于与朋友和同事的几次对话,都很有帮助,尽管这些对话只是出于娱乐,停留在有趣的探讨之上」
-
Davis Peixoto:「这无疑开启了与朋友和同事的许多有趣和有意义的对话」
-
-
SRS(间隔重复软件) 对个人实践的价值:
- Riley Buchanan:「《量子国度》真正影响我的是,我知道了间隔重复是多么有价值。我后来开始使用 Anki,只是期末稍微背一点,重新学习我早就忘记的知识,我就能通过硕士级别的课程。我希望我在读本科的时候就知道这个技巧。」
-
做了下游的练习:
- Iskandar Pashayev:「在第一篇文章中,有一个说法是每个传统电路都有其等价的量子电路。我觉得这个说法有个有趣的应用,就是利用 IBM 的量子计算笔记本,将行波进位加法器的传统电路形式,翻译成量子电路形式。在这一过程中,我还了解到,比起直接翻译,量子电路模型下有更简单的电路来实现加法。」
-
为下游的课程做了更好的准备:
-
Jeremy Cote:「我得说,在我后来上量子计算课时,复习受到了影响,因为很多关于门和矩阵的基础知识是我已经知道的。」
-
Kevin:我觉得我已经准备好学习更多的算法,比如肖尔算法,并获得一些类似该网站的扩展阅读材料。此外,我想写一些实际的代码,用一些仿真库甚至是真正的量子计算机来进行量子计算。
-
日志
作为理解这个问题的第一步,我今天会给一批在至少 270 天内完成了至少 30 次复习环节的量子国度用户发邮件(20210127155851)。我无法充分地表达我实际能获得什么,所以我只是先开始“网络钓鱼”。
106 个量子国度用户符合这些标准(见:电子表格)。一个令人惊讶的数字——而且其中许多人实际上符合双倍的标准。但是,一旦我在这里建立了影响的「上界」,降低标准并了解那些没有坚持很长时间的人的情况,将会很有趣。这些人是真正的奉献者。
主题:量子国度:许多个月后......那又怎样?
大家好!我是《量子国度》的作者之一。我给你写信是因为你坚持了相当长一段时间的复习环节。
如果你对我说:那又怎样?,我也很感激
那就是:从大的方面看,所有这些复习对你有什么作用?它对后续研究有任何影响吗?如:你开始的项目?与同事的对话?你的自我意识?
我有很多量化数据,这些数据告诉我关于人们在一段时间内的细粒度记忆的所有情况。但最终这不是最重要的。我想了解它是否/如何在你的生活中促成有意义的经历。如果它没有,我也很想知道!在此,我真诚地感谢你愿意分享的一切。
编写非技术性助记文本需要额外的概念抓手
原文:Writing non-technical mnemonic texts requires extra concept handles (andymatuschak.org)
在写《如何写出好卡片》这篇文章时,我发现一个现象:编写卡片的过程中,我经常得回到正文里头,给特定的想法加上具体的名字(概念抓手(来自 Alexander))。举个例子,假如我要针对某个经验法则或者想法写个问题,我得有个简洁的名词或者标签来代指它,不能老是在卡片里重复一大段解释。这种需求在非技术性文本里更加明显,因为相关话题可能没有正式的术语(或者用正式术语不合适)。
David Chapman 的一则与此相关的评论:
你可能会觉得有趣(反正我自己觉得很有启发):因为需要编写卡片,我不得不回头修改我的文章。这实际上提升了文章的质量。以前有些要点我是暗示读者去理解的,现在我得明确地说出来。
Readwise 服务
原文:Readwise (andymatuschak.org)
Readwise 是一项服务,旨在帮助你保持与读到的有趣想法的接触。它从 Kindle、「稍后阅读」服务、照片 + OCR 的实体书等等中提取重点标记。然后,它每天向你发送一封电子邮件,其中包括这些重点的随机组合,以便它们在你的脑海中定期刷新。
「类 SRS」 功能
他们已经逐渐引入了间隔重复记忆系统的一些功能。在每日重点内容的阅读过程中,你可以顺利地将吸引你的内容「升级」为填空题,甚至是自定义问答卡片。这是一个巧妙的策略,用于引导刚接触间隔重复的人:如果你完全是被动的,这种策略只会产出(轻微的)价值,但随着用户加大投入,伴随着渐进的用功,用户能从中获得更多的收益。
请注意,与典型 SRS 的问答按钮不同,Readwise 的核心反馈动作,是一组调节「何时再次重复」的旋钮(更早,更晚,结束)。你并不是用它标记回忆正确还是错误。
如果目标是制作高质量的 SRS 回忆卡片,我担心这么做不能达到效果:在间隔重复记忆系统中,填空卡似乎比问答卡产生更少的理解,而且人们大多写不出很好的问答卡,因为写好间隔重复记忆卡片很难。这种界面还对段落和卡片之间进行一对一地进行编码(而不是拆分成多个卡片),这不利于彻彻底底学习一段材料:间隔重复记忆卡片应该从多个角度对概念进行编码。
但 Readwise 的目标不是详尽地记忆,而更接近「穿越时间的文本」中所描述的愿景:侧重于制造「助记媒介使读者持续接触材料」中我描述的效果 ——「......重点是对你的大脑重新编程。使你的大脑能够发现模式,形成联系,并在正确的时间重新出现正确的想法」。但 ReadWise 的方法是否真的能做到这一点?难说啊!这方面的依据不像单纯记住那样清晰可得,但也是乐趣的一部分。实际上,正因为很难量化当中的产出,用商业方式来测试其中效果显得更合适:如果人们继续为这项服务付费,那显然是发现了它的价值。
下面是书籍的间隔管理界面,交互做得细致而用心。不过,我想知道多少用户会真的编辑它们。相较于让用户明确地设定这些值,让用户在回顾期间(他们好像也有回顾?)点击「少看」/「多看」按钮,根据次数来逐步调整这些内容是否更有意义:
笔记管理
Readwise 还提供了笔记组织功能:你可以在你标记的内容上打标签和添加笔记。
总的来说,我担心围绕材料书本组织一切的方式,会违反自主思考的原则,而且收集材料的作用在感知上被夸大了。你可以阅读之前标记的重点,还可以对它们做笔记,但这个产品很难让你把这些见解相融成更深的东西。对此,恰当的工作流是将标好的重点导出到其他环境中(Notion、Evernote 等)。不过这些环境比较封闭,无法连接你的间隔重复工作流(就我所见)。
组织
Readwise 是由{Daniel Doyon}和{Tristan Homsi}创建的,这是一个自筹资金的公司。
也许正因为这是商业行为,所以其主张之自信往往很有误导性,反而容易卖家秀(报喜不报忧):
我们不能只读一次就记住东西。Readwise 使用一种叫做「间隔重复」的科学方法来解决这个问题。
例如,如果你将 Mastery 应用于深度工作,而你每周的日程表开始被浅薄的电话和会议填满,你的大脑很可能会注意到这种模式,然后开始催促你创造一些不受干扰的空间。
…
天空是极限。
…
但在埃隆·马斯克完成他的 Neuralink 之前,书籍、Readwise 和 Mastery 的组合是我们最有效的技术之一。
参考文献
RemNote
原文:RemNote
RemNote 是网页端的笔记系统,强调结构化的知识模型,对于将笔记整合进间隔重复系统提供了高质量的操作方法。参见:助记媒介的范畴可以扩展到个人笔记
它对知识模型很有自己的看法,而且试图施加到软件中去,但这个模型过于一板一眼:它高度形式化,很是压抑。最终的笔记适用于生成 SRS 卡片,但不太适用于散文。
例如,你可以通过编写 Foo: foo‘s 的定义
为来生成一张 SRS 卡片用于学习定义,或者使用项目符号列表描述概念的属性:
遗忘曲线
* 发现者:艾宾浩斯
RemNote 有嵌入的概念,以便概念层级组合成不同的「文档」。类似 Roam Research ,这种设计的内在逻辑是,按此模型构建的文本块可以构成可重用的单元。我担心文本块的可组合性:嵌入功能受到数据模型的可组合性的限制
RemNote 是有趣的研究实验,值得从中学习。好像其作者 {Martin Schnieder} 正试图将其商业化,但我不能判断他对待这个目标有多认真。该软件会定期更新,已经添加了一长串新功能。
Mochi
Mochi 是网页端上的笔记写作系统, 主要使用 Markdown 语言, 集成了间隔重复记忆系统。
尽管不是很完全,Mochi 试图实现[助记媒介可以扩展到个人笔记]((https://notes.andymatuschak.org/z5ARNXtS5VxteskEW91S1yYTgAcLABNXsZuJE) 中描述的想法:Mochi 的主要功能还是制作卡片,但它也支持在文章式的笔记中嵌入卡片;嵌入卡片这个操作并没有得到强调,这很奇怪:我估计是 Mochi 的预期用途还是语言学习的原因。
Mochi 的界面打磨得很不错,而且在逐步完善。2019 年 2 月Mochi 启动,截至 2021 年 5 月,开发势头很足,并且会规律发布新特性。
笔记内编写卡片
Mochi 的早期版本中,「笔记」和「牌组」泾渭分明,但最近这两者似乎融合了。现在笔记和牌组都是一件事——只是查看方式不同。
所以「牌组」可以像这样作为列表展现:
... 或者作为「笔记本」呈现,每张卡片内容展开,顺次显示:
Mochi 不像是用来编辑连续文本的:每个段落都看成「块」,鼠标不能在段落之间移动。但是打字时有个交互很不错:
-
创建新段落。
-
输入一些文字。
-
输入
---
。 -
再输入一些文本。
-
按两次回车键。
-
一张卡片就做好了!
对于编辑文章来说,Mochi 的交互方式很尴尬:所有操作都是针对单独某个段落的:只有「点中」某个段落才能打开编辑窗口;而且段落内容会动来动去,很难「对准」。不能用光标跨段落移动,也不能同时编辑多个段落。但这些交互从实现的角度很容易修改,所以我拭目以待。
对于把 Mochi 当作「个人助记媒介」使用的思路,还有一个明显的问题,就是如果你写了一篇很长的文章式笔记,里面嵌入了几张填空卡或者多面卡片,那么笔记里所有「段落」都会变成复习任务(也就是变成没有背面的卡片)。我觉得这样设计很奇怪!
SRS 实现
使用经过修改的 SM-2 算法:简易度不会动态调整(虽然对每个牌组可以单独设置),如果忘记一张卡片,下一次的间隔会减半,而不会从零开始。
对于新卡片有「学习」的阶段,就像 Anki. 「新卡片」和「当日到期卡片」会区别对待。新卡片要回答正确了,之后 才加入到明天到期卡片中。
直接嵌入的卡片
2019 年 11 月 18 日,Mochi 添加了直接在笔记中嵌入 SRS 卡片的能力。卡片必须已经在牌组里,而且语法比较古怪。这种操作基本上是嵌入操作。
商业模式
Mochi 桌面版本免费使用。同步功能和 API 需要每月支付 5 美元。这样的商业模式很难盈利:需要有 1700 名活跃用户才能达到 10 万美元的年平均收益率(ARR)。
Mochi 开发者是{Matthew Steedman}。他主要在纽约活动,在各种机构中最为活跃(如 Code and Theory)。他有广告/图形设计的 partial 美术学士校历。
「跳过」机制可能有助于间隔重复记忆系统在复习环节保持情感上的连接
在间隔重复记忆系统中要优化的关键点,是其与复习环节及内容的情感连接。一种可能的方法,是让用户能把不关心的材料顺畅地调低优先级。具体地说,也许可以提供 「跳过」 按钮,按照指数补偿算法将卡片推迟到之后时间。这种方法与删除效果相当,而且更加稳妥:间隔重复可以降低对收件箱进行维护中破坏性操作风险。
对复习效果的影响
但跳过卡片是否会弄巧成拙?学生会不会滥用跳过按钮,结果不再学习?
Nate Kornell 和 Robert A. Bjork(2008) 发现,「允许放弃抽认卡的操作,对学习效果无一例外地展现了负面影响,尽管影响较小。」
超过 68% 的项目在只回答正确一个问题后就被放弃了,还有 8% 的项目根本没有回答正确就被放弃。
......对于那些以放弃难以学习的项目为学习策略的 20% 参与者来说,放弃项目的学习尤其具有负面影响。
......为了创造持久的学习效果,项目如果被放弃,以后应该再回来学习。重新学习以前放弃的项目可以为这些项目提供额外的间隔学习机会。它还能识别出那些实际上还没有学到的、需要进一步学习的项目。
Whitmer(2020 年)对正在受训的海军陆战队员进行了一次实验,给了一组人放弃卡片的机会。这些受训者在后期测试中的记忆力大幅下降。
参考文献
Kornell, N., & Bjork, R. A. (2008). Optimising self-regulated study: The benefits—And costs—Of dropping flashcards. Memory, 16(2), 125–136.
Whitmer, D. E., Johnson, C. I., Marraffino, M. D., Pharmer, R. L., & Blalock, L. D. (2020). A Mastery Approach to Flashcard-Based Adaptive Training. In Adaptive Instructional Systems (pp. 555–568). Springer International Publishing.
将基于机器学习的卡片生成重新定义为过滤问题,有助于我们思考吗?
原文:Can ML-based prompt generation be helpfully recast as a filtering problem? (andymatuschak.org)
当我开始专注使用机器学习模型来生成高质量的间隔重复卡片,我认为这个问题主要在于如何让系统产生我想要的输出。但在体验过一些模型后,我注意到模型通常有能力产生足够接近我想要结果,但前提是我愿意生成并评估足够多的样本。这一过程的问题在于生成满意答案需要生成的样本数量过于庞大……但不是一个博尔赫斯数*。显然,任何足够复杂的模型都包含所有的句子;这不是在说我想要的卡片就在集合中,而是在说我可能会丢弃掉近乎所有的样本。(*译注:博尔赫斯数是一个虚构的数学概念,源于阿根廷作家豪尔赫·路易斯·博尔赫斯的作品《百科全书》。其中博尔赫斯数是一个极其巨大的数字,其大小超出人类理解和表达的范围。它被用来描述一个无限的、包含了所有可能的排列组合的图书馆或书库,其中每本书都是一本独特的书,包含了所有可能的组合)
生成卡片的问题,跟让模型生成可接受的输出的问题完全不一样。或许可以开发一些过滤器,筛选模型的输出,以找出我们需要的问题。此外,我们也可以开发一个界面来适应这个筛选问题。
什么是「不合理」的问题?我发现这些问题并不是胡言乱语,而是非常规矩的问题,也都能说得通。但这些问题中读不出对文章的有趣理解。这种「有趣」有主观因素——有些人对人物时间事件等具体细节感兴趣,有人对关键定义感兴趣,而有人对大局影响感兴趣。但我想知道的是这种有趣是否能客观评价。
比如,假设我们围绕一篇关于跑步者的文章生成问题,文章里有句话是「他绑紧了他的鞋带」,而如果有个问题是「他跑步前绑紧了什么?」,那么这个问题可以在客观上认为是低质量的,其中一个因素是当代故事里的其他跑步者都会这么干(也就是说,这条信息是低熵的)。另一个更为微妙的因素是,这个细节对这个故事并不重要。跑步者的鞋子是无关紧要的;文章之后也没有提起。我觉得量化第一个因素是可行的,但我不确定如何量化第二个因素。有个笨想法:如果你移除文章的某处细节,文章的自编码向量会移动多少?我们能在这里使用模型的熵吗?
参考文献
我在 2021年 9 月 6 日与 Yuval Milo 的电话会谈里意识到了这点。
间隔重复记忆系统中,需要根据卡片回答错误的原因确定干预手段
当学生处理材料遇到困难时,间隔重复记忆系统会如何干预?这里有很多可能的办法,但选择时必须确定读者遇到困难的本质原因。
如果读者只是没有记住他想要记住的东西,便没有必要另加干预;让他们知道正确答案,多练习几次即可。
如果读者无法回答问题,是因为概念理解上有缺失,则应该多加解释,深入说明。
如果读者在程序性知识上有困难,可能并不是因为他们没有记住程序。相反,他们可能是没有深刻理解这套程序应该在何时、何地、如何应用以及为什么要应用。
如果很清楚读者就是相信错误答案,那么可能需要更详细的诊断和调解。
概念型知识的「最优复习间隔」可能更长
原文:Conceptual information may have much slower optimal spaced repetition schedules (andymatuschak.org)
几乎所有关于间隔效应和间隔重复记忆系统应用落地的文献,都只聚焦于陈述型信息,比如单词对、术语定义或简单属性的值。我猜测这是因为概念型信息非常依赖先验知识和背景知识,因此其记忆动力学与陈述型知识截然不同。
针对这类材料,我预计可以使用更保守的复习调度安排,有效降低记忆这类材料的成本,见:优化间隔重复系统调度安排。
用量子国度进行的早期实验显示出比文献中报道的慢得多的遗忘曲线,至少对许多问题是这样:QCVC 问题最初被遗忘的速度非常不同;量子国度的用户在实证五天保留后很少遗忘 。这可能部分是因为信息是概念性的、相互联系的,并且是在叙述的背景下引入的(间隔重复卡片通常是原子化的,而助记媒介为其赋予结构)。但另一种解释是量子国度的高回忆准确率可能是因为给了过多提示而掩盖了可能的遗忘。
更多关于间隔重复系统和概念型知识的笔记:间隔重复记忆系统可用于发展概念性理解
间隔重复系统中选择去记忆某项内容的行为有如轻松的手势
没有实际使用过间隔重复记忆系统的人,常常将其认作一种工具,是在「想记住什么的时候」才应用的。但这种想法对于理解高效记忆系统来说就差之千里了。如果人们没有增强功能,刻意记忆信息是相当费力的。所以人们并不经常记东西。只有一些至关重要的细节才记忆,因为它们的价值抵得上记忆的高成本。
但是间隔重复记忆系统是非常有效的。决定记住什么东西并不是高成本的决定;相反,这项决定只是意味着几分钟的花销,甚至还平摊在未来几年里。如果你只用这些系统来记忆你已经记住的那种材料,那么这些系统没什么意思,因为大多数人并没有清楚地记住很多东西。间隔重复记忆系统不仅使记忆成为一种选择,而且使其成为几乎无代价的选择。从情感的角度来说,它更像是在书上找重点或者写旁注。而且从实际出发,一旦曾经昂贵的资源变得廉价,令人惊讶的事情就会发生(例如电)。
把材料添加到记忆系统时,我感觉就像在做手势,已经内化为一种习惯,甚至对此毫无意识。一般这种行为没有明确的目的——不如说我是在脑中给信息「加下划线」。我对推特的「点赞」按钮的用法可以与其类比。「点赞」不是书签,不是投票,无需付出多少代价;给「推特」点赞是习惯性而下意识的,由此说明我对这条推特感兴趣。
我的间隔重复系统方法的不同之处
原文:Differences in my approach to spaced repetition systems
间隔重复记忆系统已经有许多实现。为什么还要再投入更多的精力呢?我在这里做的一些笔记,收集了我用来实现系统的方法中的一些主要差别,有助于我更好面对更高阶的挑战。
-
间隔重复记忆系统可用于加深概念理解(但现有系统和之前的研究几乎完全集中在概念定义,或简单的陈述性事实上)
-
写好间隔重复记忆卡片很难;这大大阻碍了大众有效而广泛地采用间隔重复系统。间隔重复系统的设计者大多忽略了这一点,但这就像是一家出版公司忽视了句子的重要性一样。
-
单独的间隔重复记忆卡片是一种糟糕的交流媒介,但这些问题可以通过在更丰富的上下文中嵌入卡片来解决(助记媒介对通常原子化的间隔重复记忆卡片赋予结构)
-
我想推动间隔重复系统来加深人们生活中最有意义事情的印象,一反人们都认为间隔重复系统局限于毫无意义的记忆目标的主流想法。
-
我认为间隔重复属于更广泛的一类系统:
-
另请参阅间隔重复记忆系统的特殊应用
常青笔记的维护近似于间隔重复
原文:Evergreen note maintenance approximates spaced repetition (andymatuschak.org)
常青笔记具有密集的关联结构(见常青笔记之间应该建立大量链接),因此撰写新笔记的时候,需要我们不断回顾和修改我们过去的写作,因此这种方式像是对过去的间隔重复。
特别是,这种间隔重复跟随你现在的兴趣进行。如果你对一个主题停止阅读或写作,你就不会回顾相关笔记。如果一个主题是你经常阅读或写作,那相关材料就会被频繁回顾。
从记忆的角度来说,这并不是一种有效的间隔重复:你并没有真正利用测试效应。但另一方面,它确实有利用到类似生成效应的东西,而且对于长期积累的思想库来说,提供了注意力管理方面的思考视角。更具体一点,这种做法鼓励你反复关注那些与当下工作有关的历史想法。并且,因为你可能发现要修改这些过去的想法笔记,所以这种反复关注可能是需要一定程度努力的(*译注:这种努力会确保效应的有效性)。
在维护涉及嵌入的系统时,也会出现这种效果。
参考文献
Ahrens, S. (2017). How to Take Smart Notes: One Simple Technique to Boost Writing, Learning and Thinking – for Students, Academics and Nonfiction Book Writers.
我们学习某样东西时,不仅要联系已有的知识并努力理解它更广泛的含义(阐释),而且还要在不同的时间不同语境下(不同间隔不同变体下)试图提取它,最理想的是在机会来临时特意去努力提取(在背景带来的干扰中提取)。卡片盒(Slip-box)不仅为我们提供了这个机会,让我们以这种有效方式进行学习,而且让我们光是使用卡片盒,就能迫使我们完全按照建议去做。
现有的间隔重复系统不鼓励常青笔记的创作
原文:Existing spaced repetition systems discourage evergreen notes (andymatuschak.org)
尽管间隔重复记忆系统中的笔记,与常青笔记一样都是原子化的(常青笔记应该是原子化的),但这些卡片在很多方面过于原子化(传统间隔重复记忆卡片是原子化的)。这种形式不鼓励渐进式的综合和提炼。
卡片上的问答漂浮在均一的迷雾中,与它们内在的有意义的情境分离开来,不与相关的邻居相联系(常青笔记之间应该建立大量链接),而且看起来除了复习的时候都不适合阅读。这些问答的本意不是成为经久耐用,持续增长的单元,而是用之即弃的残片。如果它们与常青笔记的独立系统有明确的关系,这些问题并不是问题,但它们没有。
令人高兴的是:助记媒介可以扩展到个人笔记。
参考文献
Nielsen, M. (2018). 增强长期记忆。http://augmentingcognition.com/ltm.html
我开始识别开放问题,这些问题是我希望得到答案,但似乎尚未被解答的。我发现了一些充满可能性的技巧和观察,但我还不知道其重要性。有时,我还发现我自认为是整个领域的盲点。我也会在 Anki 中对所有这些内容设问。通过这种方式,Anki 成为支持我创造性研究的媒介。此时 Anki 暴露出一些缺点,因为它的设计并没有考虑到支持创造性的工作——比如说,它并不适合在草稿空间内进行长时间的自由探索。
GPT-4 在指导下,通常能够从解释性文本中为陈述性知识生成可用的间隔重复卡片
通过结合以下的洞见,我在使用机器学习从解释性文本中生成优质的间隔重复卡片中用 GPT-4 取得了成功,通常都能一次搞定:
-
对于卡片生成任务,选择要强化的目标概念,和为这些目标概念编写卡片,是两个独立的问题。在这些例子里,我负责选择制卡对象(例如,通过指向更大篇幅中的短语),模型的任务是根据这些给定的目标,生成有用的卡片。
-
对于卡片生成任务,大型语言模型(LLM)经常需要额外的提示,来确定从何种角度制卡;我提供了这些提示。
这对于简单的描写来说,效果相当好,但对于更概念化的材料来说就不行了:对于卡片生成任务,大型语言模型(LLM)缺乏为复杂概念材料编写卡片的模式
一个提示词示例:20230614123022
如果学生学习材料有困难,间隔重复记忆系统可以怎样干预?
(如果学习材料有困难)典型的间隔重复记忆系统会干两件事:缩短下一次复习的时间间隔,并且(通常)要求学生稍后对该卡片重新作答(SRS 重试机制)。
Sana Labs 会重新引入卡片材料的源文章,或是建议(「也许你想要重读这篇文章?」)或是直接在下一次复习环节中,安排阅读这篇文章(「这篇文章的内容对你而言有些困难」)
由于助记媒介将卡片与源文本紧密联系在一起,助记媒介可能有更多选择:可以将源文章特定部分摘录下来,或者让读者回到源文章阅读。
其他可能性:
-
增添材料的变体,来夯实记忆
- Duolingo 可能会这样做?我无法判断。
-
引入一些针对单张卡片理解困难而编写的材料
-
为寻求他人帮助提供便利
但是,至关重要的是:间隔重复记忆系统中不同干预措施的选择必须从失败的原因出发。
文献
队列
-
Butler, A. C., Godbole, N., & Marsh, E. J. (2013). Explanation feedback is better than correct answer feedback for promoting transfer of learning. *Journal of Educational Psychology, 105,*290–298. http://dx.doi.org/10 .1037/a0031026
-
McDaniel, M. A., Howard, D. C., & Einstein, G. O. (2009). The read- recite-review study strategy: Effective and portable. Psychological Sci- ence, 20, 516–522. http://dx.doi.org/10.1111/j.1467-9280.2009.02325.x
-
McDaniel, M. A., & Little, J. L. (in press). Multiple-choice and short- answer quizzing on equal footing in the classroom: Potential indirect effects of testing. In J. Dunlosky & K. Rawson (Eds.), Handbook of cognition and education. New York, NY: Cambridge University Press.
-
Pan, S. C., Gopal, A., & Rickard, T. C. (2015). Testing with feedback yields potent, but piecewise, learning of history and biology facts. Journal of Educational Psychology, 108, 563–575. http://dx.doi.org/10 .1037/edu0000074
-
Pan, S. C., & Rickard, T. C. (2017). Does retrieval practice enhance learning and transfer relative to restudy for term-definition facts? Jour- nal of Experimental Psychology: Applied, 23, 278–292. http://dx.doi .org/10.1037/xap0000124
-
van Eersel, G. G., Verkoeijen, P. P., Povilenaite, M., & Rikers, R. (2016). The testing effect and far transfer: The role of exposure to key infor- mation. Frontiers in Psychology, 7, 1977. http://dx.doi.org/10.3389/ fpsyg.2016.01977
以想法为中心的记忆系统
原文:Idea-centric memory system (andymatuschak.org)
在间隔重复记忆系统中,中心元素通常是卡片——这是一种特定的任务,旨在通过提取练习(即通过回忆来加强记忆)或产生测试效应(即通过测试来提高记忆效果)来促进记忆。然而,我对于一种新的构想很感兴趣,那就是让想法成为这一系统的中心,或者至少让想法与这些卡片并存。换种方式来说:目前我们通过将想法转化为卡片和任务的形式来输入记忆系统,那如果我们可以直接将想法本身放入记忆系统会怎样呢?这样,当你进行每日复习时,你将参与一些活动,这些活动不仅复习了这些想法,还能加深对它们的理解。
通常,我们在讨论这个概念时会考虑自动化的角度:编写有效的记忆卡片是一项挑战,而且非常耗时。如果能让计算机来完成这项工作,岂不是非常好?但现在我们暂且不谈效率和便利性;我认为,将「想法本身」视为记忆系统的原语更有更核心的原因。
-
**避免模式匹配:**记忆系统卡片的一个问题是,我们往往会根据一些表面特征对卡片进行模式化回应(编写间隔重复记忆卡片应避免浅层次的「模式匹配」)。于卡片本身的静态特性,要完全避免这种情况是很困难的。
-
GPT-3 能够产生间隔重复记忆卡片问题的简单变体,但是基于特定卡片生成的变体可能比直接基于产生这些卡片的想法来生成的变体要局限得多。
-
从情感角度来看,模式匹配也会产生负面影响;它削弱了我对这个系统的信心,让我感觉自己在做无意义的工作,还让我陷入了单调重复的思维模式。
-
-
**多角度编码:**除了表面上的多样化之外,卡片通常只能提供一种有限的记忆强化方法。当我处理通过记忆系统强化的信息时,我常常感觉需要用特定的方式去「回想」,仿佛需要找到一把特殊的钥匙来开启知识的大门。而与此相反,我对编程中的重要想法有着百般不同的理解,因此我很少感到需要寻找正确的钥匙;在任何情况下,这些想法似乎总是可以轻松调出。
-
这就是为什么我们建议间隔重复记忆卡片应该从多个角度对概念进行编码。但在实际操作中,这常常感觉像是对系统的滥用:
-
代表不同视角的卡片是完全独立的,所以在同一个复习环节中,你可能会从多个不同的角度被问及同一想法。对于后续的角度,你不需要从长期记忆中提取信息,这可能会降低记忆强化的效果。
-
此外,连续回答多个实际上围绕同一想法的问题,往往会感到烦人或无聊。
-
我更愿意将这些高度相关的问题分散到几天的时间里,让它们随着时间逐渐展开。
-
-
如果我发现某个角度的记忆卡片比较难,这是否意味着我也应该调整其他角度的复习计划?
-
从组织上看,将这些卡片作为独立实体呈现是令人讨厌的;它们实际上只是同一枚硬币的多个面,但(特别是你在不同时间撰写它们时),没有办法将它们作为一个整体查看。
-
Pan, S. C., & Rickard, T. C. (2018). Transfer of test-enhanced learning: Meta-analytic review and synthesis. Psychological Bulletin, 144(7), 710–756 的研究发现,当问题的答案与练习的回答有很大的重叠,也就是所谓的「响应一致性」时,知识迁移更可能发生。这表明,为了更好地实现知识的迁移,我们不仅需要从多个角度提出问题,还需要有多个角度的回答。
-
嗯,我不确定这是否适合放在这里,或者我是否完全相信这一点。事实上,那些响应一致性高的研究大多与死记硬背有关;而响应一致性低的研究主要涉及问题解决实践、应用和推理问题。因此,这些研究的响应一致性编码可能「真的」对应于,比如说,更高的复杂性,或距离更远的知识迁移。
-
-
**指向东西本身:**我具体的情感体验是:当我听到、阅读或想到一些激发我兴趣的东西时,我会想,「啊!我想把这个纳入我的学习中!」但我无法直接将「这个东西」纳入我的记忆练习;我需要找到一种方法,把它转换成某种我能在练习中使用的形式。有时,这种转换过程是一种有益的锻炼——它让我更深入地理解激发我思考的想法,帮助我分析并更好地理解它。但在大多数情况下,这个过程只是感觉像一个额外的负担。
-
(参见 2022-10-14 Patreon letter - 从 2022 年夏的助记媒介原型中学到的经验教训了解更多)
-
我想强调的是,这种冲动与效率或「降低门槛」无关。它关乎于让核心动词感觉更好——使它更自然地与我的内在意图和情感兴趣保持一致。消除一种经常使我疏远这个过程的摩擦。
-
对我来说,如果可能的话,这显然是我们从一开始就会使用的概念模型……但问题是**它不起作用!**像 Readwise 这样的系统,它们在练习过程中仅仅重新展示想法本身,却并没有产生测试效应,而且似乎很少有人坚持使用它。关于 Kawara,我没有太多使用经验,也没有采访过其用户,但我怀疑它也面临同样的问题。
-
注意,这也更接近最普遍且最自然地使用记忆系统的地方所发生的情况:语言学习和医学院。
-
也就是说,在语言学习中,卡片通常就是单词本身——即你要学习的原始材料。在医学教育中,常见的卡片可能是一张解剖图,其中某个部分被遮盖。同样,这里的卡片就是要学习的事物本身。任务是不言自明的。如果你看到一张写着意大利语单词的卡片,你就知道需要给出它的翻译。如果你看到一张有部分被遮盖的解剖图,你就知道需要指出被遮盖的部位。
-
我认为这也部分解释了挖空卡之所以有吸引力的原因。
-
这是一种实现类似助记媒介可以扩展到个人笔记上这种东西的更自然的方式。在实践中,我发现我经常会记下我在论文中发现的有趣的东西,接着用几种不同的表述创建记忆卡片,然后继续我的笔记。这种做法让整个过程显得不连贯且重复,并且这种笔记读起来也不那么愉快。也许解决的办法是提供更好的折叠功能;但在我看来,更自然的概念设计应该是直接让洞见本身成为练习的对象。
-
「将想法送入你的轨道」——而非「生硬地将想法转换成任务,再将这些任务纳入你的轨道」。
-
-
**随时间深化:**现有的记忆系统让我能够保存关于某个主题的理解的一个有损快照,这里的理解是在我编写相关卡片时形成的。这更多关于的是保存和维护。但正如 Michael Nielsen 所强调的(例如在他的文章《构建更好的记忆系统》中提到的),一个更有效的框架应当是建立联系和深度,而不仅仅是简单地保存信息。如果能在复习时用这些时间去思考材料的新想法,进一步深化理解,发现新的联系,重新建立情感联系,那将会更加有趣,更有价值。
-
确实可以通过卡片来实现这一点(间隔重复记忆系统可用于促进应用、综合和创造),但为自己编写这样的卡片往往既困难又生硬。你想每次给自己设立新的任务,激发自己的新思考。但实际上,你不得不编写一些非常泛泛的卡片(比如:「想一个在你生活中应用建议 X 的新方法...」)。在复习时,我经常发现这类卡片很难在情感上与之联系。我认为使用各种更具体的任务会更好,但对于以卡片为中心的概念设计来说, 这很难实际执行。
-
静态卡片无法自然地指定一个弧线或进程。一个激励性的例子:如果我正在学习物理学中的一些新概念,我可能想从基本的阅读理解检查开始,确保我知道它们的定义和符号;然后一旦这些稳固了,我想练习单独简单地应用它们;然后结合使用;然后可能用它们来做更长的推理。
-
另一个更经典的、以记忆为中心的例子是:如果我在尝试记忆一首诗,我可能会从记住几个对句开始,然后一旦这些稳固了,再进一步记忆诗节,依此类推。
-
从另一个角度看,我想找到一种系统的方法,通过我的练习来逐步扩大我的组块大小。
-
-
**强调问题解决实践:**另一种理解上一点的方式是,我在寻找利用我的练习时间进行问题解决实践的方法。这些问题应该是多样化的,并且随着时间的推移变得更为复杂。
-
理想情况下,这些任务能够在不需要纸笔的情况下完成,这样我就可以在平时使用手机进行的复习时轻松地加入它们。也许仅仅「设置」问题就足够了?
-
一个好的早期「步骤」可能是完成一些工作示例中的步骤(参考有关工作示例效应的文献……假设有研究人员已经探讨了这种作为一项练习任务的效果?)
-
-
**满足助记媒介读者偏好的更简单的共享语言?**正如 2022-10-14 Patreon letter - 从 2022 年夏的助记媒介原型中学到的经验教训所描述的,人们并不是真的想要评估卡片——比如「我应该保留这张卡片吗?」;他们更希望能够指出文本中自己认为最重要的部分。
-
助记媒介需要一种功能,让用户能够表达他们希望学习的深度。在想法层面上指定或控制这一点,比在每张具体卡片层面上做这件事更有意义。
-
(不过,相较于在想法层面,可能在章节或部分层面上控制这一点更合适)
-
如果读者不喜欢某张被要求回答的卡片,他们可能希望能够推迟/删除所有与该想法相关的卡片。
-
如何实现这一系统?
在其最宽泛的形式上,我们讨论的是一个系统,它能通过挑选最适合进行练习的想法并提供恰当的活动来促进练习过程。
对于助记媒介来说,这可能意味着由作者提供一系列预设的活动或活动模板。对于一个更通用的系统而言,这项任务可能需要引入某种生成式人工智能(例如大语言模型);参考使用机器学习从解释性文本中生成优质的间隔重复卡片。然而,这方面仍然存在诸多挑战。
我的构想大致如下:
-
一种高级语言,用于指定需要复习的材料
- 考虑到大语言模型的能力,这种语言可能会非常接近自然语言
-
一种模式语言,围绕练习、复习和强化活动
- ……这可能需要通过微调或提示词工程来实现
如何确定合适的「块」大小?
将卡片作为任务的一个优势在于,它们天然地形成了相对明确的「块」大小。尽管新手在掌握这个恰当的大小时可能会遇到一些困难,但我认为人们通常能够较快地领会这一点。然而,当我们把想法作为基本单位时,情况就变得不同了。一个想法应该达到何种复杂度才算合适呢?这确实是一个值得深思的问题。
在实际学习过程中,当我翻阅像《大学物理学》(Young 和 Freedman 著)这样的教材,试图提取可转化为卡片的「核心知识点」时,我常常感到不尽如人意。以「同性电荷相斥,异性电荷相吸」这个知识点为例。这确实是关于电荷的基本认知,阐述了两种电荷的存在及其相互作用。事实上,这种相互作用是区分两种电荷的唯一特征。那么,围绕这个知识点,我们可以提出哪些问题来深化理解呢?
-
(条件->结果)如果将两个带负电的粒子放在一起,会发生什么?
-
(结果->条件)在什么情况下,两个电荷会相互排斥或相互吸引?
-
(应用)如果你将一个质子放在一个电子旁边,它们会如何相互影响?
-
(应用)如果你想吸引正电荷到某个特定位置,应该在那里放置什么样的电荷?
这些问题作为起点还不错,但我认为它们过于孤立。理想情况下,我们希望这个知识点能与「质子」、「电子」、「导体」等其他概念建立起越来越复杂的联系和互动,形成一个有机的知识网络。
寻找比「想法」更贴切的表述
我发现「想法」这个词可能无法完全准确地表达我的意思。有些我想要纳入日常学习讨论的内容,可能并不完全符合传统意义上「想法」的定义:
-
一首令人心醉神迷的诗歌
-
一道令人惊叹的菜肴
-
一段对话所引发的内心感受
-
一篇文章所隐含的价值观念
-
一个人表现出的与众不同的行为
以下是一些值得考虑的替代概念词:
-
概念
-
洞见
-
节点
-
观点
-
笔记
-
事物
-
条目
-
刺激
我无法找到一个统一的词语来概括这些内容,这可能暗示我正在思考的想法存在一些问题。也许用同一个词来涵盖所有这些事物并不恰当,因为它们所对应的活动差异实在太大。
我想要探讨的核心观点是:目前,人们倾向于将想要在练习中运用的内容编码成问题、任务或卡片;但也许,我们应该直接记录事物本身。
换言之:现在要将某些内容纳入记忆系统,你会将其编码成卡片和任务。如果我们能够直接将事物本身纳入记忆系统,会产生怎样的效果呢?
ACT-R 产生式连接
这里有一个有趣的观察:John Anderson 的 ACT-R 认知模型使用产生式规则来定义条件。例如,「如果我看到两条相交的线,已知一个角度,需要求另一个角度,那么我可以执行 X 操作。」这些规则通常显得相当机械。最近我一直在思考,这种抽象层次可能并不恰当,至少对教学设计者来说是这样。为每个学科制定数百条产生式规则似乎不太现实,而且可能会导致系统过于僵化。也许更好的方法是开发一种从更高层次定义中推导出这些规则的方式,就像为产生式规则创造一种 FORTRAN 语言。我相信在智能辅导系统领域已经有不少这方面的研究,尽管我对这些研究并不十分熟悉。
有趣的是,我发现我对记忆系统的批评与我对 ACT-R 的观察有异曲同工之妙。通常,一个特定的卡片只会强化一个狭窄的、类似 ACT-R 的产生式规则。就像教学设计者不应该被要求在基于 ACT-R 的智能辅导系统中编码所有相关的产生式规则变体一样,记忆系统的用户也不应该被要求编写能涵盖所有相关规则的卡片。在这两种情况下,我们都需要一种更高层次的语言来解决这个问题。
对于卡片生成任务,大型语言模型(LLM)缺乏为复杂概念材料编写卡片的模式
我已成功使用机器学习从解释性文本中为简单的陈述性知识生成优质的间隔重复卡片(在指导下,GPT-4 经常能够从解释性文本中为陈述性知识生成可用的间隔重复卡片),但对于更复杂的概念性材料,效果不尽如人意。这里的问题并不完全是系统生成了「不好」的卡片(至少对于卡片生成任务,如果提供了编写卡片的原则,大型语言模型(LLM)的表现可能会有所提升);更大的问题是,生成的卡片只强化了表面内容 —— 也就是字面的内容,而不是其意义或为何要关心它(基于《如何阅读一本书》- Adler 和 van Doren 的观点)。
举一个非常简单的例子,考虑 Hefferon 的《线性代数》中的定义 $1.10$:
对于一个线性方程组,如果它的非零元素行从左往右第一个非零元素,都严格比上面行的首个非零元素更靠右,并且全零行都在矩阵的底部,那么这个方程组被称为就是阶梯形方程组。
大语言模型会围绕术语提出这样的问题:
-
「线性方程组成为阶梯形必须要满足什么条件?」
- (术语 -> 定义)
-
「对于一个线性方程组而言,如果它的非零行从左往右第一个非零元素,都严格地比上面行的首个非零元素更靠右,并且全零行都在矩阵的底部,我们把这样的方程组叫做什么?」
- (定义 -> 术语)
然而,这些问题只是强化了信息,而非理解。我手动编写的问题还会包括:
- 「这个线性方程组是否是阶梯形的?为什么是/不是?<例子>」
【本行删除】
-
(例子 -> 分类)
-
「给出一个阶梯形线性方程组的例子。」
-
(类别 -> 例子)
-
以及:「给出一个非阶梯形的线性方程组的例子。」
-
-
「如何把一个线性方程组转化为阶梯形(如果可变形)?」
-
(与其他概念的关联)
-
原书的定义这里刚刚引入了高斯消元法,所以只暗示了关联(但我制卡时把它点明了)
-
并且可能还有一些轻量的解题练习:「把这个方程组转化为阶梯形(如果可转换):<例子>」。
-
-
以及许多关于这个概念目的的问题;例如:
【合并行】
【合并行】
-
「阶梯形能快速给出一个线性方程组的解集的什么信息?」
-
「阶梯形如何表明线性方程组的一个方程是否冗余?」
-
「一个有多个解的线性方程组的阶梯形会是什么样子?用一个例子解释。」
-
……等等。这些细节出现在接下来的几页中,所以人们可能会把它们当成分立的概念,单独高亮和强化。但我想强调的是,我不想在没有后续这样卡片的情况下,添加关于定义的卡片;作为读者,如果我还不知道如何提出这些问题,当我看到定义时,我会在心里添加一个「TODO」,并会去寻找这些细节。但是,至少在没有进一步指导的情况下,模型不知道这么做。(译注:让模型从上下文中 query 不就好了)
这应该不会令人感到意外。训练模型的数据不会包括大量分解复杂概念主题的抽认卡,这不是一般性的资料。在我到目前为止的简单测试中,如果我提供大量的指导,语言模型可以生成更详尽的卡片,但一套简单的提示词是不够的(如对于卡片生成任务,大型语言模型(LLM)经常需要额外的提示,来确定从何种角度制卡)。例如,我仅仅念咒「将概念应用于例子」就没获得我想要的卡片。我必须说「生成一个线性方程的例子,并提问它是否处于阶梯形式。」显然,这个模型并不太重视「通过提问具体实例来深入理解概念」这一策略。至少在编写间隔重复卡片的任务中是这样。
一个编写卡片的模式语言可能能给模型足够的指导,让它们做得更好。
对于卡片生成任务,如果提供了编写卡片的原则,大型语言模型(LLM)的表现可能会有所提升
间隔重复记忆系统社区已经发现了许多高质量间隔重复记忆卡片的重要属性。当我将这些属性提供给 GPT-4 时,它似乎在生成间隔重复卡片方面做得更好。与这些提示相关的思维链式提示也可能有所帮助(例如「解释这些卡片是如何满足每个原则的......」)。
目前还不清楚这些效果的强度或可靠性如何。在我的非正式实验中,有时这些因素似乎很重要,有时则没什么影响。如果有一份由专家编写的卡片的数据集进行评估,那将对卡片生成系统的发展大有裨益。
参见示例 20230614114329。
参考文献
最初是在 Twitter 上有人向我提出这个建议(抱歉,我找不到那条信息了!),然后在 2023 年 5 月,Yuval Milo 通过一个具体的提示词再次提醒了我。
对于卡片生成任务,如果提供了充足的上下文,大型语言模型(LLM)可能会表现得更好
原文:In prompt generation, LLMs may perform better with ample context (andymatuschak.org)
许多人试图创建系统,使用机器学习从说明文中为简单的陈述性知识生成优质的间隔重复卡片,这些系统往往会对高亮内容进行处理。你选择一段文字,然后让模型根据所选的内容生成卡片。但是,除非所选的内容是一个孤立的、明确的陈述,否则模型通常需要更多的上下文来理解如何生成优质卡片。比如,你如果从教科书中选择了一句话,模型就需要对教科书的层次、已经介绍过的内容,以及观点的框架等方面有所了解。为此,我发现在目标文本周围提供几千个上下文相关的词元往往会有所帮助。
从某种角度来看,这样的上下文信息就像是在告诉模型,什么样的卡片才符合用户的需求;这也和另一种观点相吻合对于卡片生成任务,大型语言模型(LLM)经常需要额外的提示来确定需要强化何种角度。
实例
<context>设想一个质量为 $m$ 的粒子,被限定在 $x$ 轴上运动,同时受到某个特定的力 $F(x, t)$ 作用(参见图 1.1)。经典力学的主要任务,就是求出粒子在任何特定时间的位置:$x(t)$。一旦我们得知了这个,我们就能算出速度($v=d x / d t$)、动量($p=m v$)、动能($T=(1 / 2) m v^2$)或者其它我们感兴趣的动力学变量。我们如何求出 $x(t)$ 呢?我们应用牛顿第二定律:$F=m a$。(对于保守系统——也就是我们只会考虑的那种,幸运的是,它们也是在微观层面上唯一存在的类型,力可以表达为势能函数的导数,也就是 ${ }^1 F=-\partial V / \partial x$,于是牛顿定律就变成了 $m d^2 x / d t^2=-\partial V / \partial x$。)这个结论,再配合适当的初始条件(通常是在 $t=0$ 时的位置和速度),就能确定 $x(t)$
而量子力学处理同一问题的方式截然不同。在这种情况下,我们要找的是粒子的波函数,$\Psi(x, t)$,我们通过求解薛定谔方程得到它:
$$
i \hbar \frac{\partial \Psi}{\partial t}=-\frac{\hbar^2}{2 m} \frac{\partial^2 \Psi}{\partial x^2}+V \Psi
$$
其中,$i$ 是 -1 的平方根,$\hbar$ 是普朗克常数,或者更确切地说,是他的原始常数($h$)除以 $2 \pi$:
$$
\hbar=\frac{h}{2 \pi}=1.054573 \times 10^{-34} \mathrm{~J} \mathrm{~s}
$$
薛定谔方程在逻辑上与牛顿第二定律的作用相似:给定适当的初始条件(通常是 $\Psi(x, 0)$),薛定谔方程就能确定未来所有时间的 $\Psi(x, t)$,就像在经典力学中,牛顿定律决定了未来所有时间的 $x(t)$。$^2$</context>
<target>薛定谔方程在逻辑上与牛顿第二定律的作用相似</target>
<hint>怎样</hint>
有
没有:「薛定谔方程如何与牛顿第二定律相似呢?答案:薛定谔方程描述了量子状态随环境的演变,就如同牛顿第二定律描述了物体受力后的加速度变化。」
前者更贴近原文的语境。
对于卡片生成任务,大型语言模型(LLM)经常需要额外的提示,来确定从何种角度制卡
原文:In prompt generation, LLMs often need extra hints about what angle to reinforce (andymatuschak.org)
在使用机器学习从说明文中生成优质的间隔重复卡片时,仅给模型一个文本段落和高亮范围,往往无法达到理想效果。对于说明文的片段,其可供强化的视角十分丰富:可以是一个陈述性细节,可以是其真实性的原因,可以是其产生的影响,或者是与前文的对比等等。所有这些都可能写成不同的优质卡片,但模型并不知道你究竟想要哪一个(对于卡片生成任务,选择强化目标和为这些目标编写卡片是两个单独的问题)。
然而,如果我给模型提供一两个提示,指明我希望强调短语的哪个方面,我得到的结果通常会更好。在界面上,这可能看起来像是:高亮你认为重要的部分,然后在上面写上「为什么」。或者,给自己写一张小便签:「这比我想象的要高。」
比如说,阅读 Griffiths 的《量子力学导论》时,我对 $V$ 被用作势能的符号感到惊讶——因为我习惯于用 $U$。我想要一张关于这个的卡片。但是,如果我只是高亮「力可以表示为势能函数的导数,1 F = −∂ V /∂ x」这句话中的 $V$,我得到的是「力和守恒系统中的势能之间的关系是什么?」。这个结果并不令人意外。模型怎么会知道,我感到惊讶的是那个符号呢?相比之下,如果我要求模型强调「符号」,我得到的是「在经典力学的语境下,符号 V 代表什么?」
到目前为止,我发现只有在强化简单的事实陈述时,才不需要提供额外的提示。(例如:「碳的原子序数是 6。」)
个人联系;个人笔记
这里的根本问题是,最好的卡片往往涉及使材料具有个人意义——将一些抽象信息连接到你的目标上,或者深入到一个你认为特别引人注意,但作者并未强调的细节或视角。模型并不能容易地知道这些事情。
一种可能会有所帮助的方法是,从针对某个文本的个人笔记中生成卡片。
卡片生成任务中,选择要强化的目标概念,和为这些目标概念编写卡片,是两个独立的问题
对于使用机器学习从解释性文本中生成优质的间隔重复卡片的问题,大多数人似乎是将语言模型对准一段文字或一个被高亮的短语,然后告诉它「就这些内容写一些卡片吧!」这很少会有可接受的结果,除非文本内容本身某种意义上可以完全决定卡片应该是关于什么的(比如「碳的原子序数是 6。」)
直觉告诉我,对语言模型而言,选择什么内容来制卡要比编写强化某个具体细节的卡片要难得多。见将卡片生成任务定义为强化目标的过滤问题。
原因之一在于,模型无法知道—— 至少在没有大量其他外部信息的情况下 —— 你对什么感兴趣、你已经知道什么、什么对你阅读这个材料的目标来说很重要。在人类作者为一般读者写卡片,这已经是一个问题了(见助记媒介应该让读者对他们收集的卡片进行控制),但至少在那种情况下,作者心中有整本书的结构,也知道为了整体,学习哪些东西是最重要的。
另一个导致「选」比「制」更困难的原因是,我们可以给模型有效写卡的具体建议。如果我们给它一个《如何写出好卡片》中的原则,并要求以此为准验证输出的每一张卡片,它的表现要比简单地 「写一个关于 xxx(特定细节)的卡片」要好得多。相比之下,我们还没有一套关于目标选择的原则。我们只是告诉它例如「写出关于最重要的细节的卡片」。实际上,我们需要编码一些知识理论(给它)。这方面可能已经有一些进展,但我怀疑,用户的输入总是必不可少的,哪怕只为了优化模型选择。(小部分相关内容见:对于卡片生成任务,大型语言模型(LLM)缺乏为复杂概念材料编写卡片的模式)
我觉得这种困难基本可以接受。阅读时,要是看到最重要或最有趣的部分,我们也会用荧光笔画线,这很自然(间隔重复系统中选择去记忆某项内容的行为有如轻松的手势)。这基本上就完成了「选」。回过头来,根据这些高亮部分写卡片,是相当费力和耗时的(写好间隔重复记忆卡片很难);如果模型可以帮助解决这个问题,那就太好了。虽然光有高亮部分也一定不够:对于卡片生成任务,大型语言模型(LLM)经常需要额外的提示,来确定从何种角度制卡。
过去的几年里,一些想法引导我产生如此思考。Ozzie Kirkby 和我注意到(2021-06-10),模型从个人笔记生成的卡片更为优秀,这些笔记已经从较长的段落中提炼出了你关心的内容。同样,GPT-3 可以将填空卡转换成问答卡,也是一个卡片生成任务,其中强化目标已经被非常准确地指定了。
为阅读网页内容时在行内撰写间隔重复卡片而设计界面
原文:Interface for writing spaced repetition prompts inline while reading web content (andymatuschak.org)
助记媒介可以扩展到个人笔记;这种方式为我的卡片提供了结构,并让我更流畅、更自信地编写卡片。但是在阅读材料和笔记之间来回切换仍然是不流畅的。而且,在阅读笔记中的卡片时,我有时仍然会感到迷惑,因为文章笔记中关于源材料的卡片缺乏上下文。我的直觉是,某种行内交互会在这里起作用。
在 2022-12-22 我做了一个类似的工作流原型。
-
我使用 Hypothes.is 来编写内置卡片(它使用的格式与 我的个人助记媒介实现 中所述的格式相同)
-
使用 Obsidian 的插件将这些内置卡片导入到我的 Markdown 笔记中(模板字符串:20211227122651)
-
使用Orbit 的‘笔记同步’功能导入这些卡片。
日志
2022-12-30:Ozzie Kirkby 尝试将机器生成的卡片与我的卡片相匹配!他的笔记。
- Ozzie 提了个值得思考的问题,这个问题让我注意到:「在大多数情况下,我阅读时会实时编写卡片。我注意到,与平时阅读时相比,这样做的阻力要小很多。我认为降低阻力的话,一气完成阅读和制卡会更容易。」
2022-12-27:迄今为止得到的观察结果。
-
与将这些卡片写在我的笔记中相比,将它们写入文内的感觉要好得多,这让我感到惊讶。
-
我注意到上下文切换感觉更加轻松。每次在笔记和文章之间切换,我都需要定位一下:我在哪里?下一张卡片写在哪里?当切换回之后:我在当前页面的什么位置?
-
标重点功能让我对「内容范围」有一些非常粗略的印象。当我在文章笔记中写卡片时,我认为我正在做一些心理簿记,以追踪我写了哪些内容的卡片,哪些没有写。
-
有时,我需要「找到」我写的关于某个概念的卡片,我可以通过滚动到文本中介绍该概念的位置,然后单击合适的标重点轻松地做到这一点。
-
当我查看我已经编写的卡片时,Hypothes.is 界面能实现上述功能,我几乎总是在上下文中查看它——我同时看到「邻近」的文本。这太棒了!
-
-
原则上,在这里极大的优点应该是空间性——即卡片位置和文本位置之间的物理关联。不幸的是,这种效果在我目前的原型中减弱了,因为 Hypothes.is 的注释并没有像谷歌文档的注释一样空间化:它们位于侧边栏中的线性列表中。
-
这意味着我不能简单地滚动到我感兴趣的页面部分,并查看「邻近」卡片。相反,我必须先滚动到页面的一部分,接着点击随机的标重点,以将侧边栏滚动到右侧「附近」,然后从那里浏览,但哪里没有明确标明附近的「边缘」。
-
我很惊讶他们没有在空间上分布注解,因为他们努力在侧边栏的槽中构建非常精细的「提示」,这些「提示」确实是空间化的。
- 很遗憾,那些提示并不能解决我的问题:它们需要点击多次,容易出错。而且它们的交互受到上下文中的细节问题的妨碍。
-
-
编辑界面使得添加同一段落的多张卡片变得笨拙。这还没有那么困扰我。
- 应该能在单个 Hypothesis 注释中编写多张卡片,但是有时在我复杂的导入操作中,用于分隔卡片的新行的格式会丢失。也许我努力一下可以解决这个问题。
-
我不喜欢 Readwise 每天仅从 Hypothes.is 导入一次。这使得在编写内置卡片和编写开放式文章笔记之间流畅地切换变得困难,因为正在考虑的网页笔记可能尚不存在。
-
小阻力:网络书籍各个章节的卡片将被分成不同的笔记,如果我手写笔记,我可能会将它们放在同一个笔记中。
-
有一个 Obsidian 的插件,可以直接从 Hypothes.is 导入卡片;我会尝试切换到它。
-
此外, Readwise 似乎没法导入 Hypothes.is 的文档位置元数据,所以我不能轻易地从笔记摘录跳回到页面位置。
-
……做完了——我已经切换到直接从 Obsidian 导入标重点了。现在等待时间很短,我已经从循环中剪掉了工作流程的一个环节。此外,看来我现在可以成功地在单个 Hypothesis 的标重点中编写多张卡片!太棒了!
-
-
Obsidian 仍然很粗糙,我发现自己不想用它来实际写作......但我可以使用它来运行导入的插件。也许已经有人编写了能够直接运行的一些能替代它的命令行脚本?
语言模型可以基于填空卡生成高质量的问答卡
相比完整的问答卡,填空卡编写起来更容易也更快。然而在间隔重复记忆系统中,填空卡似乎比问答卡产生更少的理解。有一条「中间路径」很有趣,那就是让语言模型基于填空卡生成问答卡。我和 [Ozzie Kirkby] 做了些初始实验(2021-06-10),结果非常不错。
参考文献
这个想法是与 Ozzie Kirkby 在 2021-06-11 讨论时得到的
操作系统层级的间隔重复系统
原文:OS-level spaced repetition system
几十年来,计算机操作系统总是八九不离十地内置一套个人信息管理工具:地址簿、日历、电子邮件客户端、某些基本笔记功能、文件和文件夹等。这些工具的设计与封闭自成一体的 App 不同,典型的 App 竭力从头到尾承担某套工作流程。然而操作系统软件虽然基础,但更具通用性,每个软件既是工具也是服务,通过 API 的支持,在整个操作系统中充分沟通连接。可以在电子邮件里向日历中添加事件,在聊天应用程序中输入联系人的姓名便自动填充,在多个应用程序中打开文件,保存到相同文件夹,等等。
如果有一个“操作系统层级”间隔重复记忆系统会怎么样?如果卡片设计得更像文件夹里的文件,在整个系统中都可读可写,而非像 Anki 或其他现存工具的卡片,存储在 App 的袖珍天地里?
网络文章可以提供嵌入行文的卡片,这些卡片可能由作者编写,如助记媒介的卡片,也可能由读者编写,如《天才/假设》。你可以边阅读边导入卡片,就像你的浏览器在阅读时形成历史记录一样。
你的 PDF 和电子书阅读器的注释自然就可以出现在这个中心化的 SRS 中,而不是封存在某个无法访问的侧边栏中。
当你在日常会议上记笔记时,你可以用一个特殊的标签来标记关键的见解,以便将它们提供给这个系统(就像在助记媒体可以扩展到一个人的个人笔记中)一样,或许未来文字处理器的格式栏将包括粗体、斜体、下划线等按钮和「待复习」。
基于聊天消息或电子邮件,现代操作系统会尝试创建日历事件或建立联系人。类似地,你收入书签的链接,或重复搜索的短语,也可以为系统所用,来尝试创建 SRS 卡片。
但是,一旦你认为 SRS 除了用来记忆还有更多用处,这些想法就会变得更加有趣(参见间隔重复记忆系统可用于促进应用、综合和创造),当要想到间隔重复系统可用于编程注意力,其功能更加强大。
例如,你现在抬起手腕,对智能手表说:「提醒我写下我的想法, SRS 可以设计成为操作系统层级的服务。」这是一次性的提醒。但是有了操作系统层级的 SRS,你就可以抬起手腕,对智能手表说:「记住,我要思考这个问题,什么样的新奇场景会受益于操作系统层级的 SRS 服务?」这样生成的就不是「待办事项」,而是一张可供之后反复思考的卡片。(更多信息请参阅间隔重复可能是增量获得想法的有用工具)
也许是「练习系统」,而不是「记忆系统」
原文:Perhaps “practice systems”, not “memory systems” (andymatuschak.org)
Michael Nielsen 建议我们应该更倾向于「记忆系统」而非「间隔重复系统」,因为间隔重复只是构建强大记忆系统的众多概念之一。但我怀疑即使是「记忆」这一概念,似乎也太局限了。我实际上正在做的,是为练习建立一套例行程序,对我感兴趣的想法进行系统化、有组织的关注(可编程的注意力)。通常情况下,这的确是以记忆为中心:我仅仅在保持我所学习的某些陈述性事实。但当我很好地使用这些系统时,我常常能够建立新的联系,思考新的想法,把这些想法付诸实践。我觉得,我越是进行这样的探索和实践,这些练习就越有趣、越有价值。
当我思考提取练习与迁移学习时,这一点显得尤为明显:我的经验告诉我,要获得可迁移的深刻理解,我需要进行大量应用和解决问题。因此,把这些系统定义为一个「练习」的场所,而非仅仅是「记忆」,或许更好。
这种观念的一个附带好处是,它可能有助于改变许多人认为记忆对深刻的创造性工作不重要这种看法。人们习惯于练习他们想要精进的技能。但他们并不习惯于将记忆放在如此核心的位置。我不打算过度强调这一点;人们可能只需要学会理解记忆在困难的智力工作中的作用。但我认为,人们对机械、呆板的记忆提取的本能厌恶其实并非完全没有道理(相关笔记:以想法为中心的记忆系统)。
或者…可能我们应该称之为「学习系统」而不是「练习系统」?这个范围确实太广了——似乎暗示了教学也包括在内(也许应该包括…)。而「练习」一词更侧重于日常的练习习惯、行动以及稳步提高。但这种说法可能忽略了反思、消化、内化这些重要的方面——这就不太好了。
更倾向于「记忆系统」而非「间隔重复系统」
原文:Prefer “memory system” to “spaced repetition system” (andymatuschak.org)
Michael Nielsen 在他的文章《如何普及记忆系统?》中指出,间隔重复记忆系统这一表达不恰当地过分强调了某一特定机制。实际上,令人兴奋的是一般意义上的记忆系统(甚至可以说是练习系统——也许是「练习系统」,而不是「记忆系统」)。间隔重复只是众多重要概念中的一个(确切地说,是其中的几个),这些概念将在创建强大的此类系统中发挥重要作用。例如,将概念编码进提取练习卡片的不同方法,可能比间隔安排的细节更为重要。助记媒介的感受在很大程度上取决于最初的复习——助记媒介卡片穿插在阅读过程中(实际上没有间隔,也没有重复!)
问:为什么更倾向于「记忆系统」而非「间隔重复系统」?
答:……
规律进行间隔重复记忆练习是沉重的习惯
原文:Regular spaced repetition memory practice is an onerous habit to adopt
间隔重复记忆系统使记忆成为一种选择,但想做到这点,就要养成规律地进行记忆练习的习惯。然而大多数人什么习惯培养起来都费心费力。况且记忆练习对很多人来说尤为不快,这些练习看起来就是死记硬背抽认卡,不免让人想到高中时候的背卡经历。
所以,间隔重复记忆系统只有克服这道阻碍,让用户一用就有效果,才能被用户接受。但大多数记忆系统做不到:他们都是空盒子,用户需要自己去装满卡片。可是写好间隔重复记忆卡片很困难, 所以用户刚开始使用记忆系统时,自己做的卡片必然数量又少质量又不高,却只能用这些卡片去复习。更糟的是,间隔重复记忆系统的好处是慢慢显现的。难怪大众会反感。
我们经常遇到这样的例子,有人觉得「间隔重复感觉很不错,我试过 Anki 之类的,但对我没什么用。」可稍微问一下,就会发现他们根本就把记忆系统用错了,注定行不通。他们写的问题很糟糕,学习的学科他们丝毫不关心,诸如此类错误。他们有点像这样的一类人,感觉「学吉他好啊」,结果开始弹吉他半个小时就扔在一边,说是弹得太难听,吉他就是很差劲。当然,实际上吉他和记忆系统一样,都需要投入足够时间才能用得起来。
(Matuschak 和 Nielsen,2019 年)
参考文献
Matuschak, A. 和 Nielsen, M. (2019 年 10 月). 《我们如何才能开发出变革性的思想工具?》https://numinous.productions/ttft
重试结果可能会提供额外的可提取性信号
原文:Retry outcomes may give extra retrievability signal (andymatuschak.org)
在间隔重复记忆系统中,建模和评估面临一个难题:我们试图估计一个随时间变化的连续值(回忆概率,或记忆的双组分模型中可提取性),但我们得到的却是稀疏的一比特二元样本:记住,或没记住。如果读者没记住,他们的可提取性可能是 10%,也可能是 90%。
但在典型的 SRS 重试机制中,假设读者在第一次尝试后不久的重试中仍未能记住。那么,你对第一次尝试时的可提取性的估计就应该降低。若失败次数增多,应进一步降低估计。
我不确定如何在现实中构建一个包含这个因素的模型。在每次后续失败后,可提取性估计应该下降多少?我不确定如何在这里找到「人工标注」。
这种信号在学术文献中有所体现,其中常见的做法是要求受试者不断练习项目,直至成功。尝试次数有时会被当作一个变量来分析。在 Ebbinghaus, H. (1913). Memory: A Contribution to Experimental Psychology (H. A. Ruger & C. E. Bussenius, Trans.). (Original work published 1885) 一书中,赫尔曼·艾宾浩斯几乎将尝试次数作为唯一的信号(一种较为粗糙的可提取性信号)。
参考文献
这个想法是在 2022-02-22 与 Giacomo Randazzo 的一次交谈中产生的。他抱怨自己不得不扔掉很多「遗忘」的样本,因为这些都是「重试」的尝试。起初,我觉得这是理所当然的,因为这些样本的 ISI 几乎为零,所以毫无意义。然而,后来我意识到了我在这篇笔记中所描述的问题。
自主评分的间隔重复记忆系统比机器评分的系统更有效率
交互是界面设计的成本中心,所以机器评分的间隔重复记忆系统加重了用户的负担。如果要求用户打字输入答案,那就很容易在每项任务上花费 2-4 倍的时间。
一些机器评分系统放弃卡片,转而使用选择题来规避输入成本。但生成任务就转变成了判别任务——对记忆编码的效果大打折扣;参见生成效应
自主评分的间隔重复记忆系统可避免假阴性
原文:Self-graded spaced repetition memory systems avoid false negatives (andymatuschak.org)
在间隔重复记忆系统的复习环节中,如果我因为记错了一个函数的名字而在 SQL 表达式中打错了字,那就不好了,我可能应该再复习一遍。但是,如果我因为手指打滑而打错了字,我仍然自认为是「正确的」。在机器评分的系统中,假阴性是非常令人恼火的。当然,假阴性也是低效的,因为卡片会更快地重新出现。但激怒用户才是更严重的问题。
机器分级系统引入了各种机制来避免这个问题——例如,允许用户输入与答案之间有一定的较小的编辑距离,或者为的拼写变体准备字典。这些措施必然是相当片面的。(译注:编辑距离是针对二个字符串的差异程度的量化量测,量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。)
更多内容请参见《为非常好奇的人提供的量子计算》中的如何使用(或不使用!)问题一节;例如:
你可能已经注意到这些问题是自我评估的。如果你有时即使是在你不正确的时候,但也想评为「正确」,尽可大胆去做!你认为这对你的学习会有什么影响?你喜欢这种略带背德的感觉吗?我必须承认,我喜欢。如果是的话,不要感到尴尬:这应该是,首先是乐趣。或者试着在你正确的时候给自己评分为「错误」,或者干脆跳过这些问题。这些行为对你的学习有什么影响?关键是要弄清楚如何与这些问题尽力较量,从而尽可能快地学习。这意味着要对你的学习方式进行有趣的试验,找到适合你的方法。
参考文献
Matuschak, A., & Nielsen, M. (2019, March). Quantum computing for the very curious. Quantum Country. https://quantum.country/qcvc
间隔重复可以降低对收件箱进行维护中破坏性操作风险
收件箱需要可靠的清空流程才有效,但收件箱维护的分流策略(如「收件箱归零」)往往不够稳健。在很大程度上,这是因为软件界面经常将破坏性操作作为最终决定,而不是视情况而定的选择。
如果你把这些破坏性操作按「不是现在」重新执行,它们带来的感觉就完全不同。那个你关闭的消息并没有真正消失,而是会在稍后回来。比如一开始会在一天后弹出,如果我还跳过,那就或许变成几天后、再是一个星期,以此类推,直到「不是现在」变为真正的「关闭」,但这样的「关闭」不会让你压力山大。这个概念可以应用于任务队列、阅读列表(为保存可能有用的参考资料建立阅读收件箱)、电子邮件收件箱,等等。间隔重复机制让人感觉轻松不费力。
这是可使用间隔重复系统对注意力进行编程的一个例子。
参考文献
Matuschak, A. (2019, December). Taking knowledge work seriously. Presented at the Stripe Convergence, San Francisco.
Discovered in Dec 2020 that Simon Hørup Eskildsen blogged about a similar idea in June 2018.
间隔重复可能是培养或改变习惯的有用工具
原文:Spaced repetition may be a helpful tool to develop or change habits
想象一下,你读了一篇文章,其中提出了这样的建议:
行动时难以抉择各种选项的优先级,到头来白费功夫?想用长长的利弊表来解决的话,如果其中各种因素本身不够有决定性,同样无济于事。要么开辟一条新路,或者确定更有力的评估,要么承认目前做不出足够明智的选择。
你可以用间隔重复记忆系统来记忆文章中的片段,但你也可以用这个系统来把这个习惯「安装」在你的头脑中。下面一些样例问题可供尝试:
问:回忆出一个时候你在一直白费功夫,试图确定各种选择的优先次序。(对于这个问题,再想出一种之前没想过的情况)
答:空白
问:想象一下,你发现自己陷入优先次序不明确的困境后,可能会采取的具体步骤,这些步骤不算常规。(写出你以前没有想到过的步骤)
答:空白
问:设想一种特定的情况,在这种情况下,你很难通过找到一个决定性的因素来摆脱优先次序的泥潭。(写一个你以前没有想过的情况)
答:空白
在你回答过几次这种关于特定习惯的卡片后,做出更具体的卡片来强化这个习惯往往会有帮助。例如(来自 Kanjun,2020-07-01):「当我早上拿起牙刷时…」「…拿起我的手机,打开 Anki。」
这是一个可使用间隔重复系统对注意力进行编程的例子。
参考文献
与 Florent Crivello 的对话,2019-11-17
相关信息来自 Alexey Guzey:用 Anki 灌输新的思维模式并使你的长期记忆负责 - Alexey Guzey
间隔重复对于逐步完善灵光一闪可能有用
原文:Spaced repetition may be a helpful tool to incrementally develop inklings
在谈话或散步中间,我经常灵光一现,想出有趣的问题和想法。大部分时候,我当场是没办法围绕冒出的想法写出很有见地的东西的。我自然写不出高质量的常青笔记。对于这个想法我还无可置喙——只是它看起来特别有趣。
我现在应该怎么做?我应该如何安排行动,从而逐步完善这个灵光一闪?我可以创建一个「待办事项」,或者安排一段时间来思考这个问题,但完善灵感往往不该这么做。相反,我常常该让子弹飞一会:过几天再回顾,看看我又想出了什么。
我可以在为短暂和不完整的笔记而设的写作收件箱中记录这个概念,但收件箱中的内容会迅速变成一堆难以处理的碎片,而我会忽略这些碎片 (收件箱需要可靠的清空流程才有效)。
间隔重复系统可以用来编程注意力,所以间隔重复在这里可能会有帮助。在这样一个系统中,我可能会:
-
坐下来进行晨间写作,阅读当天的写作卡片,这些卡片从写作收件箱中抽取,数量很少
-
我可以添加我目前对卡片内容的想法(也许这些想法让以前写的东西意图更模糊了,除非我添加新的材料)
-
完成之后,我就可以把卡片标记为「有成果」,这意味着它很快就会再次出现;或者标记成「无成果」,系统便大大增加其间隔时间。
-
另外,我可能会花点时间把一些卡片转换成一条或多条常青笔记。
-
任何我直接忽略的卡片,其间隔时间都会增加,但增加的间隔时间比起显然无用的卡片少。
利用间隔重复的指数性质,上百张卡片逐步推进便成为可能,而每天只消考虑其中的几张。
这将会构成「渐进思考」的系统。
实现
Rice Issa 已经发布了一个简单实现。
参考文献
Matuschak, A. (2019, December). 认真对待知识工作. 在旧金山举行的 Stripe Convergence 上发表。
间隔重复机制让人感觉轻松不费力
原文:Spaced repetition mechanics create a sense of effortlessness (andymatuschak.org)
间隔重复记忆系统的核心机制让行动的关键步骤少一些决策和毅力。假设你想研究细胞代谢的分子途径。如果没有 SRS,你需要制定计划,比如「我在每个周二晚上学习细胞生物学」,之后记住这个计划,并下定决心反复执行。但是如果你有使用 SRS 的习惯,你便可写些卡片放进卡片库,并确信你能逐步看到这些卡片。
不需要决定学习这些卡片的频率,也不需要咬牙坚持去研究那些特定的卡片,只要每天去完成 SRS 练习即可。给卡片评分的决定也不算沉重:最多是动动按钮而已;这张卡片无论如何都会重新出现。用格式塔的术语讲,这种感觉来自于毫不费力的行动(无为)。
这与维护收件箱时的感觉截然不同,因为维护收件箱中步步是沉重的决定:维护收件箱的分流策略(如 Inbox Zero)往往太过脆弱。
这种轻松不费力的感觉,是我对间隔一切感兴趣的原因之一:我想将其扩展到卡片之外、更多的地方。
Kawara 是专注于灵感的间隔重复应用,这个应用很好地描述了这种感觉:「Kawara 不会让我忘记,但也不会对我施压去记住。」
这种不费力的感觉与 YouTube 或 Netflix 的「自动播放」功能有联系。自动播放功能是软件驱动你,而不是你驱动软件。在这些情况下,这种关系有些对抗性;间隔重复的追求则是用你认可的方式「自我编程」。(另见可使用间隔重复系统对注意力进行编程)
问:间隔重复机制如何让人感觉轻松不费力?
答:通过消除沉重的决定和对意志力的要求。
参考文献
我在 Twitter 上关于这个话题的帖子: https://twitter.com/andy_matuschak/status/1271997374756315142
间隔重复记忆系统非常高效
原文:Spaced repetition memory systems are extremely efficient (andymatuschak.org)
有了间隔重复记忆系统,只要每天投入短短的几分钟,你就能记住成千上万的问题的答案。这个效果不太直观,其背后是间隔效应的指数特点:投入少许精力,而间隔重复的回报指数级增长。
每当你正确记住一个答案,该问题的测试间隔就会呈几何级数增加,形成一条指数曲线。5 天,2 周,1 个月,2 个月,4 个月,等等。如果你以恒定的速度在软件里添加问题,而每个问题在某一天出现的概率随着时间的推移呈指数式减少,那么你在某一天要复习的问题数量就会基本恒定。
参考文献
Branwen, G. (2009). Spaced Repetition for Efficient Learning. Retrieved December 16, 2019, from https://www.gwern.net/Spaced-repetition
Nielsen, M. (2018). Augmenting Long-term Memory. Retrieved from http://augmentingcognition.com/ltm.html
间隔重复记忆系统可以缩短科目学习中不愉快的早期阶段
对于使用间隔重复记忆系统工作,一个常见的负面反应是:「我更愿意直接上手:我就会自然而然地记住重要的东西」(赋能环境着重于创造成长和行动的机会,而不是技能培养)但是当你刚开始与新主题互动时,你可能一步也迈不开:至少在一段时间内,完成有意义的活动所需的术语与概念,对你来说数量太多,记忆也太不牢固,(相关:在赋能环境中的新手往往不能做被赋能的事情。在这种情况下,间隔重复记忆系统可以帮助你加速,度过这个尴尬的、不愉快的阶段,直到你与材料能产生一段有意义的体验(相关笔记:赋能环境的活动直接服务于一个内在的有意义的目的)。
例如,学习法语的一个有意义的方法,可能是与讲法语的人进行对话。但是,如果你才开始学习法语,你对这门语言所知甚少,真刀真枪的对话很困难——即使你能对话,你可能会如坐针毡,于是不愿再开口。记忆系统可以助你进步,使得你有可能展开有意义的对话。
许多人认为记忆对深入的创造性工作不重要,这便是很好的反驳。
相关笔记:助记媒介对成熟领域的入门读物很有效
问:为什么 SRM 在学习一个科目的早期阶段往往特别有帮助?
答:在这些阶段,你对核心术语和概念的掌握非常薄弱,很难作出什么有意义的事情。SRM 可以让你加速超越这个阶段。
问:如果你刚刚开始学习法语,为什么 SRM 可以帮助你更快地获得有意义的体验?
答:它可以帮助你更快地达到可以用法语与人对话的程度。
参考文献
Matuschak, A., & Nielsen, M. (2019, October 0). How can we develop transformative tools for thought? https://numinous.productions/ttft (see https://numinous.productions/ttft/#how-important-is-memory)
间隔重复记忆系统可用于发展概念性理解
原文:Spaced repetition memory systems can be used to develop conceptual understanding
间隔重复记忆系统显然可以用来记忆简单事实:名称、定义、数字常数等。记忆系统的绝大多数使用者似乎只将其用于这一目的。但是,间隔重复并不仅限于对记忆简单事实有用。如果你自己写卡片,它还可以用来深入理解复杂的材料 (亲自间隔重复记忆卡片有多重要?)。这种面向概念的卡片可能会从联系、影响、原因、后果出发问问题。这些更广泛的想法乍一看根本不是可以记忆的事实,但其实是的。使用间隔重复系统,不仅能让你记住这些概念性的想法,还能让你琢磨更高层次的关系,从而与话题保持联系,更深刻地内化材料。(相关文章:助记媒介使读者长期与材料保持联系)
写好间隔重复的记忆卡片很难;写好概念性卡片就更难了。对于编码抽象而概念性的知识的技术,还没有深入而广为接受的见解。欲了解更多,请参见高质量的间隔重复记忆卡片最重要的属性是什么?。特别相关:间隔重复记忆卡片应该从多个角度对想法进行编码。
间隔重复系统对概念性理解的发展功能,有力反驳了许多人认为记忆对深入的创造性工作不重要的看法。
值得注意的是,间隔重复的认知心理学基础(测试效应)已被证明适用于概念性知识以及陈述性知识 (见 Karpicke 和 Blunt,2011)。
有可能这种类型的信息用间隔重复的时间安排来记忆会更「便宜」:概念性信息可能有更慢的最佳间隔重复时间表。
参考文献
Matuschak, A., & Nielsen, M. (2019, October 0). 我们如何开发变革性的思想工具? https://numinous.productions/ttft (见 https://numinous.productions/ttft/#how-important-is-memory)
//doi.org/10.1126/science.1199327
间隔重复记忆系统可用于促进应用、综合和创造
原文:Spaced repetition memory systems can be used to prompt application, synthesis, and creation
像 Anki 这样的间隔重复记忆系统主要是为了帮助人们记忆大量的陈述性知识,比如词汇。但这类系统的机制也可以用来创建相对非传统的卡片,从而促进应用、综合和创造。
这类问题的一个限制是,因为是「你」写的,所以你必须让上下文比较模糊:「从功利主义的视角考虑最近的一个决定」,而不是「从功利主义的视角考虑死刑」。如果你写的是后一个问题,那么它不会有太大帮助:你可能已经想透了答案,所以当你稍后再次看到它时,它真的只能作为记忆型卡片了。这种限制使得下面描述的想法很有前景:助记媒介可以通过简单的应用型卡片帮助读者应用所学。
相关:
参考文献
推特帖子,2018年03月11日:https://twitter.com/andy_matuschak/status/973020621847187456
与迈克尔·尼尔森的对话,2020-01-01
间隔重复记忆系统并不能迅速展现出它的优势
原文:Spaced repetition memory systems don’t rapidly demonstrate their benefits (andymatuschak.org)
间隔重复记忆系统非常高效,但是前期收效不显。因此,一个新用户在入门间隔重复记忆系统时需要更多的努力......而绝好的学习结果却是延迟出现的。最初,它似乎并不比学校内使用的简单闪卡系统更优,而且它的长期好处很难以察觉 —— 尽管间隔重复让小的努力增量产生指数回报,但这样的事物在生活中十分罕见(使得人们不能立即辨识出来),而且人们对指数的直觉很差。
更糟糕的是:即使在读者取得了重大进展之后,也无法明确感知到这正在发生。大多数情况下,你不会去记忆那些你已经牢牢记住的东西,所以你不会直观地感觉到你已经记住了数百个项目。相反,你的注意力被吸引到你可能已经忘记的卡片上:间隔重复记忆系统让你觉得你的记忆力比实际情况要差。
综上所述,间隔重复系统设计者应该考虑补充「自然」的经验来解决这个问题。在前期,告知它的指数性,可能会帮助人们意识到自己要付出的努力将会在后面迅速下降。在复习环节中显露出总体进展也可能是有用的(就像量子国度所做的那样),这样用户就不会为了了解自己的进展而过度关注一个环节的卡片了。
间隔重复记忆系统让记忆更加自动化,从而有助于更深入的琢磨思考
深入理解需要详细的基础知识。那么,看待间隔重复记忆系统的作用的一个角度是,它们有效地将学习中基础但需要死记硬背的知识自动化,以便你可以专注于更有趣、有意义或概念性的知识。
这是对许多人认为记忆对深入的创造性工作不重要的很好的反驳。
不过,值得指出的是,间隔重复并不只对学习中最死板的部分有用:只是这种方式最容易使用。事实上,间隔重复记忆系统可以用来发展概念性理解。
问:间隔重复如何帮助你把更多的精力用在深入的琢磨思考上?
答:它可以自动化学习中的许多死记硬背的知识。
参考文献
Matuschak, A., & Nielsen, M. (2019, October 0). How can we develop transformative tools for thought? https://numinous.productions/ttft (see https://numinous.productions/ttft/#how-important-is-memory)
间隔重复记忆系统让你误以为自己的记忆很差
间隔重复记忆系统在普及和日常体验中有个问题:你几乎会把所有复习时间都花在那些难记的内容上。容易记住的内容很快就被推到几个月后的复习里去了,因此你在它们上花费的时间较少。与之相对的,是那些陷在「几天或几周」复习周期里的卡片。虽然整体来看,你可能记住了 95% 以上的内容,但在单个复习环节中的正确率可能会低得多。
如果你一次性添加了很多卡片,然后一段时间不再添加新卡片,这种效应会更加明显。你可能会经历几轮复习,几乎全是那一批卡片中难以回答的卡片。(这在助记媒介的新手引导过程中是个问题)。
这种现象产生了一种误会,即用户觉得间隔重复记忆系统效果一般。因为学习者对这个系统效果的直观感受,仅仅来自于自己能否记住被问到的卡片,在这一点上,间隔重复系统给人的反馈是参差不齐的。
或许在复习环节结束时提供一些信息能稍微解决这个问题,但我担心这样做效果有限,因为这(可能)只是读者看一眼就过的文字,而不是他们真切体验到的反馈。
另一种可能的办法是经常添加新材料,这样至少能让复习环节中的正确率相对提高。相关笔记:没有源源不断的新卡片,间隔重复的复习环节常常变得枯燥而脱节
再就是,加入一个「提示」之类的功能,让用户更容易回答正确(但愿这样做不会牺牲记忆效果);具体可以参见 Vaugh 和 Nate Kornell 在 2019 年的相关研究。
换句话说,难度高的测试就像是黑咖啡(令人讨厌),而带有提示的测试则像是加了牛奶和糖的咖啡(美味至极)。
几个实证例子
Robert A. Bjork 在 1994 年发现:
Baddeley 和 Longman(1978 年)发现,那些在集中练习(效率较低)下学习键盘技能的英国邮政工人,实际上对他们的培训更为满意,相比之下,那些在间隔练习(效率更高)下接受培训的工人则较为不满。
Nate Kornell(2009 年)在一项针对 GRE 类型词汇的研究中发现:
跨越多个试验,有 90% 的参与者在间隔学习下表现得更好。但在第一轮学习后,72% 的人却错误地认为集中学习更有效。
……参与者预测,在最终的测试中,间隔学习组的准确率会比集中学习组低 14 个百分点。然而实际情况恰恰相反,间隔学习组的准确率高出了 31 个百分点。
……这样看来,间隔在学习过程中可能会降低短期表现,但同时能增强长期学习效果。当人们误以为短期表现就是长期学习——这种情况经常出现(参见 Bjork,1994 年,1999 年)——他们就可能会自欺欺人,认为集中学习比间隔学习更有效。
参考文献
Bjork, R. A. (1994). Memory and Metamemory Considerations in the Training of Human Beings. In J. Metcalfe & A. Shimamura (Eds.), Metacognition: Knowing about Knowing (pp. 185–205). MIT Press.
Kornell, N. (2009). Optimising learning using flashcards: Spacing is more effective than cramming. Applied Cognitive Psychology, 23(9), 1297–1317. https://doi.org/10.1002/acp.1537
设计间隔重复卡片是为未来的自己设计任务
原文:Spaced repetition prompt design is about designing tasks for your future self (andymatuschak.org)
写好间隔重复记忆卡片很难,但有一个心理模型很有用。当你为间隔重复记忆系统做一张卡片时,你在给未来的自己设置重复性的任务。卡片设计就是任务设计。
因此,如果你写卡片是为了帮助学习一个特定的想法,你必须设计一些任务,在你执行这些任务时加强你对这个想法的理解。如果你写卡片是为了支持创造性的工作,你必须设计任务,使你注意到可能性或联系,如此种种。
用间隔重复卡片「捕捉」想法的行为就像翻译一样
这一过程,与翻译不同语言间的文本,有令人惊奇的相似之感。在翻译一段文字时,你要寻找一些词语,使其像源语言一样,在读者脑中唤起同样的思考与感触。这个过程不能机械照搬。如果这段话涉及影射、隐喻或幽默,你就不会按字面意思翻译;你要试图找到的词语,要能为非源语言使用者的成员,重现阅读原文的体验。
当写 SRS 卡片以帮助你内化想法时,你的行动和翻译非常相像:什么样的任务,一经执行,能和这个想法在大脑里「完全载入」一样,在脑海里激发相同的一组思考?
如何着手设计这样的任务呢?如果这个想法相当简单,就有可能直接构思出一个任务,能可靠地点亮所有这些灯泡。但是当这个想法有太多重要的方面时,就很难设计一个能够可靠地刺激所有这些元素的任务。因此,最好是将概念分解成最简单的单元:间隔重复记忆卡片通常应聚焦于一个原子化单元。
没有源源不断的新卡片,间隔重复的复习环节常常变得枯燥而脱节
间隔重复记忆系统上的每日练习应该有至关重要、息息相关的感觉。然而使用者要是一段时间内没有添加新卡片,每天的复习环节就似乎停滞在过去、与眼下所思所想无法关联。新用户经常滑入这样的陷阱。他们刚开始使用时热情高涨,一股脑加了许多新卡片,然而几个月过后,他们还在复习那些卡片,就感觉无聊了。
参考文献
我一开始很有热情,也已经复习过几轮卡片了。我学到了很多有趣的东西。但是现在有些疲惫了。有的卡片我总是答不对,所以我慢慢开始对每张卡片都回答「是」,结果就扰乱了间隔重复系统。
间隔重复系统充当教义问答
原文:Spaced repetition systems as catechism
在 James (“Brad”) DeLong - 量子国度访谈 - 2019-11-22 中,Brad 开玩笑地表示,助记媒介是一种新的「教义问答」。有趣的比较角度,但也值得认真思考!
下面是一个典型教义回答,来自威斯敏斯特短教义问答:
问:人最重要的目的是什么?
答:人最重要的目的是荣耀上帝,并永远以他为乐。
从表面上看,教义问答是用来记忆教义知识的,但反复接触材料中,学习者身上同样发生了个性的变化。
同样地,间隔重复记忆系统中的复习环节可以帮助读者记住一本书中的材料,但它们也会促使读者随着时间推移重新琢磨这些材料。这在实践上很有用,因为在阅读这段内容几周后,许多读者会发现新的关联。但也许这也促进了身份的改变:你不只是一个只读过一次某篇文章的人,你是一个「那个主题的学者」,因为你的学习绵延更久。
我自己对此有一言难尽的经历。我可能看到一道问题 20 次,而仍然条件反射式地背出来答案,与原始材料完全没有建立情感联系;但有时候我会对卡片主题抛出新的疑问,便感觉和这个话题越来越熟习了。
这都是一种间接的影响,通过记忆与身份相关的细节来改变身份。但也使用间隔重复系统来更直接地编程一个人的身份,也是有可能的。继续用量子计算的话题,一个简单的例子可能是:「此时此刻,我本能地发现量子计算最吸引人的悬而未决的问题是什么?」(背面什么也没有)。如果你在接下来的几个月里经常看到这个问题,你会对这个问题更有共鸣吗?
你可以想象创建一些卡片,关于新习惯的(「想一想一个新的具体情况,在这种情况下,我很难给别人留出说话的空间。」), 或者新价值的(「你认为以世纪为尺度,什么近期情况不寻常?」);参见间隔重复可能是培养或改变习惯的有用工具。更多奇异的间隔万物 系统可以用来调度与某些新个性相关的任意细粒度任务,比如反复在新领域中接触有意思的人。
在这一点上,感觉我们已经从教义问答偏离得挺远了,但这个圣公会教义问答有同样的味道:
问:你叫什么名字?
答:…
问:谁给你起的这个名字?
答:我的教父教母在我的洗礼上为我命名的,洗礼上我成为基督教的一员,神的孩子,天国的继承人。
相关文章:操作系统层级的间隔重复系统
参考文献
可使用间隔重复系统对注意力编程
原文:Spaced repetition systems can be used to program attention
间隔重复记忆系统让记忆成为一种选择,但交由计算机处理时间安排的价值,更在于动态地安排和选择要复习的问题。从某种意义上说,间隔重复记忆系统的功效来自于它编程注意力的能力(可编程的注意力)。不如把它想成「大脑的{cron}」(注:cron 是类 Unix 操作系统下的定期任务管理系统。)
每张卡片都手动决定何时复习,实在是太费力了。况且方方面面成本都很高。如果把安排复习这项工作大部分外包给机器,你就可以做粒度更大的决定——比如 10 分钟专注进行 SRS 复习——而分配好时间块后,一切就交由机器安排。
在传统的抽认卡式系统中,这一观察不仅仅能运用于记忆上:见间隔重复记忆系统可用于促进应用、综合和创造和间隔重复可能是培养或改变习惯的有用工具》、间隔重复的卡片设计是为未来的自己设计任务
但是间隔重复的核心理念——根据一定的时间表自动安排任务,并适时展示——可以在很多软件和领域中应用。我把这个概念叫做 间隔一切。
一些例子:
-
间隔重复可以降低破坏性收件箱维护操作的风险(待办事项清单、电子邮件、阅读清单等)
相关文章:
-
要想了解可以应用简单 SRS 抽认卡的场景,参见间隔重复记忆系统的特殊应用
参考文献
Matuschak, A. (2019, December). 认真对待知识工作. 在旧金山举行的 Stripe Convergence 上发表。
相关文章
与使用间隔重复来「实现」整理收件箱的做法相比,维护收件箱的分流策略(如 Inbox Zero)往往太过脆弱。
我将这个概念用于我对用于保存可能有用的参考资料的阅读收件箱的实现
在间隔重复上稍微多努力一点,就能得到指数级的回报
原文:Spaced repetition yields exponential returns for small increases in effort (andymatuschak.org)
间隔重复记忆系统非常高效,但这句话并没有表达出效率的本质。你可以尝试很多东西来提高自己——读更多的书,与专家交谈,等等。当然,这些事情都会有帮助,但它们也会很快产生递减的回报。间隔重复则不会这样。如果你多花几分钟时间复习关于你所读资料的提示性内容,你会从材料中得到巨大的额外收获。从这一点上看,要达到实质上的永久记忆只需要稍稍多做一些努力。
参考文献
Matuschak, A., & Nielsen, M. (2019, October 0). How can we develop transformative tools for thought? https://numinous.productions/ttft
考虑到阅读这篇文章需要 4 个小时左右的时间,这表明只需不到 50% 的时间投入就可以把文章中几乎所有的重要细节记住几个月甚至几年。
这就是间隔重复的最大也是最反直觉的优势:持续的努力可以获得指数级的回报。平均来说,在复习中每多花一分钟的时间,就会有越来越多的好处。这与生活中的大多数经验形成了鲜明对比,在这些经验中我们往往会面临边际收益递减。比如通常情况下,即使你多花 50% 的时间在阅读上,可以指望获得的额外收益不超过 50%,甚至可能更少。但是通过助记媒介,当你多花 50% 的时间,你可能会得到 10 倍的收益。当然,这些数字并不精确,但它确实传达了一种关键理念:获得巨大的非线性回报。这是一种媒介质量的变化。
间隔重复系统的主流文化圈热衷无意义的目标
间隔重复记忆系统使记忆成为一种选择,但保持记忆本身而并不具备价值。记忆的价值在于它能帮助人们做好那些为其生活赋予意义的事情:思想工具应该在内在意义的背景下进行评估。不幸的是,围绕着记忆系统的主流文化在很大程度上热衷于为记忆而记忆。
如果你花时间在 /r/anki 上,你会看到人们交流各种技巧,只是为了记住非洲所有的首都或所有的美国总统,就好像在学习派对表演技巧一样。这些人往往对记忆系统的性能和效率非常关注——为优化而优化,为记忆而记忆。
还有一些人试图记住读到的每一个细节( “我只是以防万一” ),却没有以任何其他方式认真地参与到文本中。我们可以感觉到,他们很害怕「丢失」任何东西(与此相反,收集材料的作用在感觉上被夸大了相反)。这种痴迷也推动了大部分的笔记写作系统文化,可以追溯到 Ted Nelson。
这对我的工作有害,我不想帮助或扩大这种文化。我工作成果的早期用户往往来自这种文化,这让我必须从上面的角度,小心翼翼地过滤他们的言论,因为赋能环境着重于创造成长和行动的机会,而不是技能培养。花时间去对记忆系统有关的知识进行刻意练习会更有益,它会为真正有意义事情扫清障碍。在间隔重复记忆系统中,关键是优化复习环节及其内容的情感联系。
这一观察的一个重要例外是使用记忆系统来加速学习的医学生群体。当然,他们中的许多人(大多数人?)仅把这当做一种帮助他们通过困难考试的方法,而不是一种改善病人护理的方法。但这是朝着正确方向迈出的一步。
语言学习者的社区中可以看到另外一个另外。这些社区中有许多人正在使用记忆系统来帮助他们更深入地参与对他们来说非常有意义的新文化。当然,也有很多人出发点只是觉得背诵 10000 个汉字是个有趣的挑战,或是什么他们「应该」做的。(好家伙还背出使命感了)
另见:
间隔重复记忆系统在多大程度上能算作刻意练习?
原文:To what extent does spaced repetition memory system practice constitute deliberate practice?
间隔重复记忆系统的复习环节是否能算作刻意练习 (术语来自 Anders Ericsson)?
-
支持算作刻意练习的证据:
-
复习显然是为了学得更好,其本身并不一定愉快
-
指数补偿算法有点像聚焦于弱点练习(译者注:指数退避算法指改变卡片复习间隔的算法,记不清的卡片的间隔缩短得更快)
-
-
不支持算作刻意练习的证据:
-
间隔重复系统的监控只能粗略模仿专家教练的行为
-
复习通常没那么费力,就其本身来说,甚至很顺畅,要么知道,要么不知道。这样似乎没有挑战稳态的感觉:技能发展需要挑战稳态
-
间隔重复记忆系统的特殊应用
原文:Unusual applications of spaced repetition memory systems
尽管像 Anki 这样的间隔重复记忆系统的主要目的是用来记忆陈述性知识,系统中的抽认卡模式还大有可为。
-
回忆非凡之物
-
作家或艺术家的美妙/聪明作品:为什么会奏效?是什么让他们想到这件事的?它对你有什么影响?
-
灵光一闪:是什么关键的观察启发了某种深刻的认识?背景是什么?
-
打破窠臼的时刻:有人说的话出乎你的意料——这是看待世界的不同方式。 是什么让他们这样说?这与你看待世界的方式有什么差异?
-
计划的变化:是什么让你意识到你的旧计划不好用了?为什么它不好用了呢?用什么计划代替呢?代替后会发生怎样一番伤筋动骨的变化?
-
失败:更准确地说,你的错误是什么?这个错误的直接成因是什么?那些成因的根本成因又是什么?当以后这些成因再次出现,你打算使用哪些策略来扭转乾坤?
-
-
过去的艰难决定:让你一锤定音的关键因素是什么?你是如何做出这个决定的?事后看来,你对什么感到惊讶?(Via MN,2020-06-31)
-
好用的操作模式 (例如,在电子邮件或会议中):该模式对你和其他人的感受或行为有何影响?什么时候这个模式合适 (或不合适)?这个模式的成败主要由哪些因素决定?以后你打算什么情况下尝试这种模式?(来自 MN,2020-06-31)
-
记忆引言:使用间接提示,例如每个单词只显示第一个字母 (来自 Divia Eden,2020-07-01)
-
-
更广泛的认知任务类型:间隔重复记忆系统可用于促进应用、综合和创造
-
强化快乐记忆的想象练习;例如,卡片正面:「想象您和 Sara 一起去特拉帕尼的旅行」;背面:照片(来自
Taylor Rogalski
, 2020-06-11)
- 另请参阅 Nick Cammarata 对巅峰体验的论述:https://twitter.com/nickcammarata/status/1315129231102234625?s=20
-
维护人际关系的卡片;例如,卡片正面:「想象一下你的朋友罗布;你有什么要说的吗?」;卡片背面:
imessage://
如果你想的话,这是给他发消息的 URL (来自 Taylor Rogalski,2020-06-11) -
运动记忆卡片;例如在大腿上演奏 C# 小调音阶
-
美育;例如这样一张卡片,正面是浏览网页时发现的有趣图像,可能带有不设问的提示语,如「你觉得这张图哪里引人注目?」;卡片背面:什么都没有(另请参阅片的 Kawara,是侧重于这样的卡片的应用)
-
轻量级、非必要、不紧急的任务:「你最近查看哪些人链接你的博客吗?也许他们有一些有趣的东西:(链接)」
-
让自己接触在你想逃避的想法:例如「X项目失败了,因为我知道 Sal 从一开始就反对它,而我只是任由这种反对情绪恶化团队氛围,却没有处理。」。在文本挖空,由你自己完成观察可能有效。(来自 Divia Eden,2020-07-01)
除简单的抽认卡格式外,一般意义的间隔重复机制可应用于许多领域;有关更多信息,请参阅可使用间隔重复系统对注意力进行编程。
使用机器学习从解释性文本中生成优质的间隔重复卡片
一个颇具挑战的问题。一些相关笔记:
-
LLM 可以完成的一些更简单的子任务:
模型
-
来自 OpenAI Sunny Chen 的 http://autonki.com
-
使用 OpenAI GPT-3 API 的 Polar 和 Sana Labs
-
Ozzie Kirkby 使用 iarfmoose/t5-base-question-generator · Hugging Face(一个经过微调的 T5 模型)进行了一系列实验。
-
Aithal, S. G., Rao, A. B., & Singh, S. (2021). Automatic question-answer pairs generation and question similarity mechanism in question answering system. Applied Intelligence. 使用了在 SQuAD 数据集上微调的 ProphetNet 模型从文本段落生成问题,并应用 BERT 模型来回答这些问题。
-
Steuer, T., Filighera, A., Meuser, T., & Rensing, C. (2021). I Do Not Understand What I Cannot Define: Automatic Question Generation With Pedagogically-Driven Content Selection. ArXiv.
-
一个基于BERT的模型,该模型配备了独立的内容选择机制
-
有价值的参考文献目录
-
阅读队列
- A systematic review: Kurdi, G., Leo, J., Parsia, B., Sattler, U., & Al-Emari, S. (2020). A Systematic Review of Automatic Question Generation for Educational Purposes. International Journal of Artificial Intelligence in Education, 30(1), 121–204. https://doi.org/10.1007/s40593-019-00186-y
坟场
用间隔重复系统来看穿数学概念 - Michael Nielsen
Using spaced repetition systems to see through a piece of mathematics
Michael Nielsen 探索了一种深化数学理解的方法。这种方法能让人对数学的各个组成部分了如指掌,几乎能直观地看出数学结果。他用编写间隔重复记忆系统的卡片来实现这一方法。尽管他在文章最后提到,实际上并不必须依赖 SRS 的形式,这种形式只是帮助将复杂思想细化为更精细的单元。对我来说,写笔记也有类似的效果,只是粒度更粗一些:常青笔记应该是原子化的)。当然,将这些内容作为间隔重复系统的卡片写下来的好处在于,人们将更容易记住这些结果。
他建议分两个大致的阶段进行:首先,通过不断的反复探索来理解证明。你会反复地阅读,编写代表证明中的各个要点的卡片。你会尽量使这些卡片简洁而有针对性,并寻找「思考『相同』数学概念的多种不同方式」——找到各部分之间的联系,提出变体,用多种方式进行解释等。
Michael 希望以强制提问结束这个阶段:也就是说,将整个证明浓缩成一个简单的卡片,直击其核心。
学习别人的间隔重复记忆卡片通常是无效的,Michael 认为这一点在这种情况下尤其如此:对他来说,价值主要不在于记忆,而在于拆解和深入理解的过程。实际上,他理解得越深,其他人就越难理解他的思路;他的许多卡片背面是空白或者难以解释的,因为那些是他无法用言语表达的思考。
Michael 有一些通过人类认知中的「组块」理解的笔记:学习越来越复杂的概念可能相当于形成更大的有效组块
Michael 的第二阶段是「突破界限」:他会改变证明的假设,看看当条件被削弱时会发生什么,寻找替代的证明方法,以各种方式「戳戳看,看看会发生什么」。
间隔重复记忆系统用不同的问题文本会有更好的表现吗?
在间隔重复记忆系统中经常遇到的一个问题是,人们在学习一个问题文本时,过于从字面意思去理解,对其表面特征作出反应,而不是真正思考其内容:编写间隔重复记忆卡片应避免浅层次的「模式匹配」。也许更好的做法是在复习过程中安排不同形式的问题文本,可以由作者创建,也可以由机器生成(语言模型可以为间隔重复卡片产生有用的问题变体)。
- Butler, A. (2010). Repeated Testing Produces Superior Transfer of Learning Relative to Repeated Studying. Journal of Experimental Psychology. Learning, Memory, and Cognition, 36, 1118–1133. 发现用不同形式的问题文本进行提取练习与持续用固定的问题文本进行测试的效果完全没有区别
为别人写质量上乘的卡片可能比给自己写优质卡片更难
写好间隔重复记忆卡片很难,特别是那些在助记媒介里得为别人编写卡片的作者来说,我觉得这更是难上加难。
当你为自己写卡片时,至少在复习时有机会发现问题:比如你可能发现有的卡片总是答不对,或者每次遇到都让人烦躁。然而,大多数作者并非对这些材料一无所知,因此他们或许根本不会亲自复习这些卡片,即使复习,也不会太投入。(具体可见复习环节能为卡片写作提供多少反馈?)
此外,作者还会受到知识的诅咒影响,这让他们容易高估自己卡片的效果。
《我的世界》 vs. 《启蒙琼林》
原文:Minecraft vs. the Primer (andymatuschak.org)
《我的世界》是一个典型的赋能环境:很多人在这个游戏中能够建造庞大的三维结构,如果没有这个它,他们可能就做不到这一点。 大多数游戏都不是赋能环境,因此,将《我的世界》与《钻石时代》中的《启蒙琼林》进行对比,可以给我们很多启发。我们是否能从中学到一些东西,来改进另一个呢?
《我的世界》相比《启蒙琼林》的优势
《我的世界》通过新颖的表现形式(方块编辑)和社交学习(无尽的 YouTube 视频、多人游戏)来提升玩家的 3D 建模能力。而《启蒙琼林》则通过认知脚手架和情景体验来实现赋能。
专业的 3D 建模者通过使用《我的世界》可能会发现,方块的表现形式为他们提供了新的视角,而《启蒙琼林》并没有帮助专家在任何领域变得更出色。
《我的世界》的活动对很多人来说具有内在意义,比如创意表达和审美体验等。相比之下,《启蒙琼林》的活动之所以对 Nell 有内在意义,只是因为她自己的生活比较贫乏。
《我的世界》没有任何隐藏的目的;其开发者主要关注游戏乐趣和世界建设。它没有任何讽刺或居高临下的意味。而《启蒙琼林》的教条主义议程有时会让它的活动显得有些居高临下。创制环境极大程度受作者的动机塑造。
《我的世界》并不试图去教学。它的设计理念是「寻找乐趣」。相比之下,《启蒙琼林》本质上就是一款教育游戏,而教育游戏对于创造赋能环境是注定失败的方法。
《启蒙琼林》相比《我的世界》的优势
《我的世界》的世界是由程序生成的,几乎不涉及叙事,因此它其实并不是一种交流媒介。而《启蒙琼林》精心设计的情景体验是一个案例研究,展示了情景体验增强了叙述的力量的机制。
《我的世界》增强了玩家的 3D 建模能力,但它的工具并不适合处理复杂的现实世界建模任务。这款游戏并不旨在帮助玩家过渡到更高级的环境中;它实际上没有考虑任何严肃的外部目标。相比之下,《启蒙琼林》有着非常严肃的目标,而且《启蒙琼林》是 Nell 余生的一次大型「入职」经历。
另见
参考文献
Stephenson, N. (2003). The Diamond Age: Or, a Young Lady’s Illustrated Primer (Reprint edition). Spectra.
Nell 不知道也不认同《启蒙琼林》的目标
原文:Nell doesn’t know or share the Primer’s goals (andymatuschak.org)
在《钻石时代》里,《启蒙琼林》的目标是培养有创造力和颠覆精神的年轻人。这本书通过《启蒙琼林》是一场巨大的情景体验中描述的技术来实现这一目标。在这个过程中,《少龄淑女绘本启蒙琼林》中的各种活动帮助 Nell 在多个领域提升技能,包括武术、计算机科学、社交操纵等,这些都是为了达到《启蒙琼林》的目标。然而,Nell 对这些背后的策略一无所知。她之所以喜欢《启蒙琼林》,只是因为她喜欢里面的谜题和故事,并不是因为她真的理解并参与到这些目标的实现中去。
这种设计方法带来了巨大的影响。
因为 Nell 并不认同《启蒙琼林》的目标,所以她几乎无法对活动内容有所选择。她必须依赖《启蒙琼林》来指引方向,这就导致《启蒙琼林》里明确的学习任务让 Nell 学着外包掉她的好奇心和兴趣。
因为 Nell 并不认同《启蒙琼林》的目标,所以这本书不得不通过趣味性和讲故事的方式来为活动赋予意义。Nell 学习计算机科学是为了解谜,而不是出于创造或发明的目的。这种方法其实很有局限性:《启蒙琼林》的活动之所以对 Nell 有内在意义,只是因为她自己的生活比较贫乏。
一个奥威尔式的《启蒙琼林》可能会满足于操纵 Nell 一生。但这本《启蒙琼林》希望 Nell 将来能过上自己有趣的生活。只要《启蒙琼林》还在操纵她,这个目标就难以实现——然而,操纵正是这《启蒙琼林》设计的核心。这种张力使得《启蒙琼林》是 Nell 余生的一次大型「入职」经历中描述的急剧转变成为必要。
参考文献
Stephenson, N. (2003). The Diamond Age: Or, a Young Lady’s Illustrated Primer (Reprint edition). Spectra.
「启蒙书」是一个脱离情境的视角
原文:“Primer” is an unsituated framing (andymatuschak.org)
我常常以「打造超级《启蒙琼林》」来思考我的目标。但当我憧憬未来的学习时,「启蒙书」这个概念实际上似乎并不恰当。我希望在真正感兴趣的实践活动中,通过合法的参与学习——情境学习。理想情况下,这意味着在实际的创造性或智力项目中,以一种无论最初多么边缘化的方式,参与到实践共同体中。赋能环境重在推动所赋能的事。而「启蒙书」则意味着一种准备的视角,一个浅浅的儿童泳池,你需要在那里学习基础知识,然后才能放下书本,真正参与其中。
对赋能环境不熟悉的人往往不能完成环境所赋能的事情。这对实践共同体而言,确实是一个设计上的挑战。但我相信,这一难题(通常?总是?)是可以被克服的。我更倾向于采用一种能够体现这种抱负的视角,而「启蒙书」这一视角,并不足以承载这样的愿景。
更具体地说,就《少龄淑女绘本启蒙琼林》而言:《启蒙琼林》是 Nell 余生的一次大型「入职」经历
《启蒙琼林》是一场巨型情景体验
原文:The Primer is an enormous enacted experience (andymatuschak.org)
在《钻石时代》中,《启蒙琼林》的一个显著特点是,它几乎完全通过情景体验来进行交流,这与大多数电子游戏的方式类似。它直观地展示了情景体验可以创造出个人与作者意图的强烈联系。
体验《启蒙琼林》意味着追求冒险,解谜,讲故事等——然而,所有这些活动都是为了引发特定的情感反应,灌输特定的价值观,传达特定的理解。虽然书中有作者设定的情节,但每翻一页实际上都是由 Nell 的行动推动的;感觉上好像是她在推动故事的发展(参见情景体验增强了叙述的力量)。
教育游戏试图通过情景体验进行教学,而且其实《启蒙琼林》本质上就是一款教育游戏。但是,《启蒙琼林》在使用情景体验方面的野心,远超任何现有的教育游戏。
参考文献
Stephenson, N. (2003). The Diamond Age: Or, a Young Lady’s Illustrated Primer (Reprint edition). Spectra.
超级《启蒙琼林》被嵌入到一个领域中,通过情景体验来引导学习者参与
《启蒙琼林》并不是一个可行的赋能环境,但它确实展示了一个充满希望的方向。建立赋能环境(例如,在一个科学领域)的一个挑战是,赋能环境重在推动所赋能的事,但新手往往难以立即上手,结果就是他们常常深陷于抽象的入门材料中。一种颇具前景的解决方案是:情景体验可以引导人们积极参与到赋能环境中。遗憾的是,情景体验很难创作而且情景体验很难分发。
《启蒙琼林》是一场巨型情景体验——这也是人们觉得它特别有吸引力的原因之一。它虽然没有完全实现我所描述的引导效果,但在另一个平行世界中的《启蒙琼林》可能就能做到:包含智力发现的情景体验可以培养 Nell 的好奇心和兴趣(值得商榷)。
正如书中所描绘的那样,Nell 不知道也不认同《启蒙琼林》的目标。她的任务是完成这个它,然后将其置之脑后:《启蒙琼林》是 Nell 余生的一次大型「入职」经历。如果我所描述的「引导」的情景体验与它们所针对的赋能环境完全割裂,那将是自我矛盾的。相反,超级《启蒙琼林》将成为它所支持的领域的一部分,其参与者将与创作者共同追求相同的目标,这类似于情境学习中的情形。
以这种方式制作的《启蒙琼林》可能更像那些杰出组织所提供的师徒式情景体验,但与之不同的是,《启蒙琼林》具备良好的扩展性。(另见:情景体验成为大众媒体时蕴藏极大潜力)
参考文献
Stephenson, N. (2003). The Diamond Age: Or, a Young Lady’s Illustrated Primer (Reprint edition). Spectra.
《启蒙琼林》是 Nell 余生的一次大型「入职」经历
原文:The Primer is one big “onboarding” experience for the rest of Nell’s life (andymatuschak.org)
在《钻石时代》里,《启蒙琼林》并不是 Nell 最终用来指挥部队的环境,也不是她用来为社会创造新思想的场所(这是作者的最终目标)。它更像是 Nell 余生的一场入职体验。通过《启蒙琼林》是一场巨型情景体验中描述的机制来传达内容,目的是为了让 Nell 在掌握后能超越并抛弃它。
Hackworth 在 Nell 完成书中的冒险任务后,建议她做出这一转变:
你今天征服了这个世界,现在你会发现这里其实很无聊。现在,轮到你为别人创造新世界,让他们去探索和征服了。(第 445 页)
Nell 年轻时的大多数重要活动都发生在《启蒙琼林》的幻想世界里,这个世界与现实生活的目标和行为严格分离。Nell 在《启蒙琼林》里没有进行任何原创思想,也不需要这样做——这是留给「入职」之后的事情。
我认为这种严格的分离是不可行的;见 Nell 不知道也不认同《启蒙琼林》的目标。Nell 现实生活中的一个导师,警官,也表达了类似的观点:「你的《启蒙琼林》是一个资源,可以让你受到良好的教育,但它无法让你变得聪明。聪明来自生活体验。」(第 283 页)
因为《启蒙琼林》并没有帮助专家在任何领域变得更出色,所以它并没有真正扩展能力的边界;它的目的是扩大接触面。
参考文献
Stephenson, N. (2003). The Diamond Age: Or, a Young Lady’s Illustrated Primer (Reprint edition). Spectra.
《启蒙琼林》具备良好的扩展性
原文:The Primer is scalable (andymatuschak.org)
《钻石时代》中的《启蒙琼林》之所以吸引人,一个重要原因是它主要通过软件来传递价值观、传授知识和提供指导。相比之下,其他方法要么成本过高(比如私人关系、家教等),要么吸引力不足(比如教科书、讲座等)。即便「ractors」是必要的组成部分,使用《启蒙琼林》来分发这类内容的成本也远低于其他方式。
鉴于《启蒙琼林》是一场巨型情景体验,我们可以将其视为一种解决方案。这种方案不仅解决了情景体验很难分发的问题,还展示了情景体验成为大众媒体时蕴藏极大潜力。
参考文献
Stephenson, N. (2003). The Diamond Age: Or, a Young Lady’s Illustrated Primer (Reprint edition). Spectra.
《启蒙琼林》并不是一个可行的赋能环境
原文:The Primer isn’t a viable enabling environment (andymatuschak.org)
许多人对于在现实生活中实现《少龄淑女绘本启蒙琼林》感到兴奋。可惜的是,《启蒙琼林》本质上就是一款教育游戏,因此它不是一个可行的赋能环境,原因和教育游戏对于创造赋能环境是注定失败的方法一样,甚至还有更多问题。
赋能环境中的活动直接服务于有内在意义的目的,但《启蒙琼林》的活动之所以对 Nell 有内在意义,只是因为她自己的生活比较贫乏
《启蒙琼林》旨在帮助 Nell 成为一个有创意、「有趣」的思考者,然而《启蒙琼林》里明确的学习任务让 Nell 学着外包掉她的好奇心和兴趣。
强大的赋能环境注重专业用例,但《启蒙琼林》并没有帮助专家在任何领域变得更出色。
创制环境极大程度受作者的动机塑造;《启蒙琼林》的作者是出于改善社会的目的,而不是为了解谜和冒险。《启蒙琼林》也未能通过强大的赋能环境通常是追求自身内在意义的项目的副产品中描述的启发式原则。
赋能环境重在推动所赋能的事。《启蒙琼林》试图培养的最重要的能力是原创思考,但 Nell 在《启蒙琼林》里没有进行任何原创思考,事实上,Nell 不知道也不认同《启蒙琼林》的目标。
通过这种角度理解《启蒙琼林》更好:《启蒙琼林》是 Nell 余生的一次大型「入职」经历。
作为「例子」的比较,参见:《我的世界》 vs. 《启蒙琼林》。
但有一点值得辩解:人们认为《启蒙琼林》是一个有效的赋能环境,这是因为《启蒙琼林》让人回想起自己曾经的深层赋能经历。确实,赋能环境的重点是创造成长和行动的机会,而不是技能培养。《启蒙琼林》确实更注重个人成长而不是具体技能,尽管它在建立通向行动的桥梁方面做得不够好(《启蒙琼林》是 Nell 余生的一次大型「入职」经历)。
参考文献
Stephenson, N. (2003). The Diamond Age: Or, a Young Lady’s Illustrated Primer (Reprint edition). Spectra.
《启蒙琼林》让人回想起自己的深层赋能经历
原文:The Primer reminds people of their own experiences with profound enablement (andymatuschak.org)
很多人认为,《钻石时代》里的《启蒙琼林》展示了赋能技术的一种令人难以置信且鼓舞人心的愿景——这种看法有点奇怪,因为《启蒙琼林》并不是一个可行的赋能环境。
至少在许多情况下,我觉得支持这本书的人并不真的反对我的看法。他们的激动更多是出于直觉上的情感反应,因为书中的 Nell 通过《启蒙琼林》经历了深层赋能。很多人以前也有过类似的经历(比如年轻时在机械车间度过的一个夏天)。他们珍惜那些记忆,并希望其他人也能拥有类似的经历。在这种背景下,《启蒙琼林》显得特别吸引人,因为《启蒙琼林》具备良好的扩展性。
参考文献
2019-09-12,与 Michael Nielsen 的对话
《启蒙琼林》里明确的学习任务让 Nell 学着外包掉她的好奇心和兴趣
在《钻石时代》中,Nell 与《少龄淑女绘本启蒙琼林》的关系主要是被动的:整个童年和青年时期,她应当完成书所呈现的活动。几乎所有的活动都是由《启蒙琼林》激发和调节的,而不是由 Nell 发起的。她开始做这些活动,是因为《启蒙琼林》向她提出了挑战;她致力于这些活动,直到《启蒙琼林》认为她完成了(Nell 不知道也不认同《启蒙琼林》的目标)。
在大多数情况下,这种关系是明确的:《启蒙琼林》告诉 Nell 她正在进行探险,她需要从某些地方找回钥匙,她必须解决一些挑战才能得到一把特定的钥匙,等等。在这些情况下,Nell 有意识地将她的大部分智力能动性委托给了《启蒙琼林》。她不认为自己需要决定什么是有趣的或值得探索的;她了解到《启蒙琼林》已为她制定了计划,她只要照着做。这种放弃会阻碍她自己的好奇心和兴趣的增长。内部调节的学习是自我实现的;外部调节的学习是自我否定的。
这就是为何《启蒙琼林》不是一个可行的赋能环境的一个重要原因。Nell 一生中大部分时间都在追求《启蒙琼林》为她设定的目标。当《启蒙琼林》明确的学习任务结束,Nell 在智力上的本领可能仍不健全,能动性也较薄弱。
相比之下:包含智力发现的情景体验可以培养内尔的好奇心和兴趣(值得商榷)。
参考文献
Stephenson, N. (2003). The Diamond Age: Or, a Young Lady’s Illustrated Primer (Reprint edition). Spectra.
《启蒙琼林》的目标是培养有创造力和颠覆精神的年轻人
原文:The Primer’s goal is to produce creative, subversive youth (andymatuschak.org)
虽然很多人记得《钻石时代》中的《启蒙琼林》是一种神奇的教学设备,但这并不是它的主要目标。其赞助人 Finkle-McGraw 最初引用了 Wordsworth 的诗句:
亲爱的朋友,我们两人会在何处呢!
若在那无险的选择时节,
不是像我们这样漫游,
穿越那些富饶本土产物的山谷,
想象的自由土地,幸福的牧场随意穿梭,
而是被人追随,时时刻刻受到监视,被套上绳索,
每个人单独沉浸在忧郁的徘徊中,
像穷人的小母牛在觅食时被绳索束缚,
在孤寂的小路上,被迫服役。
(第 17 页)
他抱怨现在的学校教育只是在生产出千篇一律、缺乏生气的学生。他的理想是:「为了养成一代能充分发挥潜力的孩子,我们必须让他们的生活变得更加有趣。」(第 24 页)后来,他让 Hackworth 设计这本《启蒙琼林》,并特别强调:「我希望你回家后,好好思考『颠覆』这个词的含义。」(第 81 页)
这里其实有点讽刺。大多数人因为它的教育功能记住了《启蒙琼林》,却忘记了它真正的目标。但从某种意义上讲,《启蒙琼林》自己也忘记了自己的初衷;正如描述的那样,《启蒙琼林》本质上是一个教育游戏。《启蒙琼林》里明确的学习任务让 Nell 学着外包掉她的好奇心和兴趣。在《启蒙琼林》中,Nell 没有进行任何原创性思考。
参考文献
Stephenson, N. (2003). The Diamond Age: Or, a Young Lady’s Illustrated Primer (Reprint edition). Spectra.
《少龄淑女绘本启蒙琼林》
原文:The Young Lady’s Illustrated Primer (andymatuschak.org)
在《钻石时代》一书中描述的《少龄淑女绘本启蒙琼林》(通常简称为《启蒙琼林》),是一本虚构的电子书,它促进了儿童的远程、异步教育。课程内容包括数学和阅读等实用技能,主要通过探究式学习来进行,但《启蒙琼林》的目标是培养有创造力和颠覆精神的年轻人。
对于教育技术领域的许多人来说,《启蒙琼林》展现了一个充满启发性的教育未来愿景:
然而,我认为这个愿景并不现实: 《启蒙琼林》并不是一个可行的赋能环境。
参考文献
Stephenson, N. (2003). The Diamond Age: Or, a Young Lady’s Illustrated Primer (Reprint edition). Spectra.
研究思想工具的团体需要足够的能力来建立足以用于严肃工作的原型
有效的系统设计需要从真刀真枪的情境中汲取洞见。因此对于探索思想工具的团体来说门槛变高了:这些团体不仅要有完善概念的能力,还要具备充分的设计能力和技术能力,开发出足以支撑真刀真枪工作的原型。这样你的理念才能通过系统用法清晰地展现出来——这就是实践出洞见。
学术实验室通常欠缺这样的能力:学术界制作的软件界面通常不适合面向更大受众以及更真实的使用场景。
似乎只有两条路可以走:
-
在工具制作者的一种真刀真枪的使用环境中探索思想工具(不容易实现,因为 优秀的工具制造者往往不是优秀的工具使用者,反之亦然)
我们如何将思想工具置于有内在意义的背景中?
原文:How might we situate tools for thought within intrinsically meaningful contexts? (andymatuschak.org)
可探索的解释和助记媒介很酷,但互动文章和间隔重复练习,离实际意义有很大距离:赋能环境的重点是创造成长和行动的机会,而不是技能培养。我们如何调整这些强大工具的设计,使它们能够被置于有深刻意义的互动之中?
如果间隔重复记忆系统的「练习环节」可以被完全删除,代之以构建一个人的真实环境,使「练习」通过日常行为自然发生呢?例如,Twitter 是一种可编程的注意力;常青笔记维护接近于间隔重复。相关笔记:间隔重复系统的主流文化圈热衷无意义的目标。
如果抽象文章可以带入社会环境中,使其具备意义,会怎么样?连接散文和其相关的 Twitter 对话
如果 「学习环境」被内在地嵌入其使用环境中会怎样?例如 The Primer++ 被嵌入到一个领域中,通过情景体验引导参与
我不知道如何高效支配大额资本来为思想工具的研究服务
狭义上这对于我的项目来说是正确的(在将资本转化为相应洞察力方面,我的工作没有可用的模式。但这在广义上也是正确的:如果我是思想工具项目的领导,就职于某个基金授款机构,我将无法利用太多资本。主要是这个领域能够稳步开展工作的人太少了。
似乎我们首先需要有一拨人在稳步开展工作,且在发展共同的行为办法,这样便能成为研究领域的雏形。在短期内,我应该把时间放在加速我自己项目的开发上,而不要做一些元(meta)级别的工作。
赞助人模式在何种程度上可以资助思想工具的创作?
原文:To what extent can patronage fund the creation of tools for thought? (andymatuschak.org)
由于用户界面的新颖创意是公共物品,所以对思想工具的商业投资动机不强。至少在小范围来说,赞助人模式可能是一种有前景的备选模式。那么赞助人在多大范围上奏效?如何最优地利用这一模式?
二次方募资在何种程度上可以资助思维工具的创作?
原文:To what extent can quadratic funding provision tools for thought? (andymatuschak.org)
思想工具很难募资,这很大程度上是因为新颖的用户界面创意是公共物品。那么公共物品的二次方募资是否可以解决这一问题?
这种方法对于项目的投资和维持阶段来说似乎是很有前景的,但是我有几点担心之处:
2020/09/09 此话题的推特风暴:https://twitter.com/andy_matuschak/status/1303759634331701248
合作制作思想工具的人选不是兼职承包者就是全职的深入合作伙伴,没有中间地带
开发思想工具的一个关键问题,是专注的软件开发和专注的学术研究互相排斥,而且软件开发和研究的思维模式之间的切换成本很高。有鉴于此,一个自然选择是找帮手——设计师、工程师、项目管理师之类。但我注意到这里有一大挑战,因为实践出洞见时,往往是摸石头过河而不是先画蓝图,因此很难事先规划出可执行的长期工作计划,让普通的承包者或实习者能着手执行。我大部分时间只知道下一小步路怎么走。也许我能越来越会看得长远,但是有些道理应该不会变。
所以与其雇用全职实习生或者合作者,让他们跟我一次性工作几个月,我更愿意等到手头上做出些东西,而其他需要帮助的时候,和这些人合作一几小时或几周。当然,这样切换成本很高!
另一个极端则是与创意者合作,这样的人选应该具备必要技能,通晓领域知识,能够自己辨识问题并将其解决。但这样的人很难找,而且即使能找到我也雇不起!
按小时计费的承包者,以及深入的全职合作者,这两种雇用模式有天壤之别。如果我能想清楚,在与合作者按月合作时如何最大发挥合作的功用,那我的进展就应该快很多。
思想工具应该在有内在意义的目的上下文中进行评估
我们不会从类似「有多少学生使用它」、「对考试成绩有什么影响」以及「测算它能多快地帮助人们解决问题」这样的角度评估 Mathematica。在某种程度上,这都是相关的代理指标,而不是工具的最终目的。Mathematica 是作为 Wolfram 对符号操作和自动机研究的一部分而创造的,最终扩展到赋能所有的数学家和科学家。它的评估标准可能是:它能在边界上激发出多少强大的洞察力?
与此相关的是,通过询问人们在阅读一篇文章后能记住多少来评估助记媒介是个诱人的想法。但它的真正目的是使人们能够做更多他们认为有意义的事情,帮助他们成为更好的自己。我们需要找到一些方法来评估这个目标达成与否。
如果我们想提供某种世俗的超验叙事,我们必须最终评估我们所有的工作——相对于赋予意义、将人们与世界联系起来、组织人们如何生活等等。当然,我们会需要代理指标,但仅此而已。对这一目的的关注消除了「内容」和「工具」之间的区别,并推动我们去追求那些能够更好地传达意义的想法。
更好的框架包括:
-
每代人能创造出多少多少西斯廷教堂天顶画?
-
创造 The Primer++ 还是 Dynabook++
-
创造极佳的成长环境,并在此基础上建立相应的行动桥梁(赋能环境的重点是创造成长和行动的机会,而不是技能培养)
在这个意义上,「思想工具」是一个有点曲解的术语。它促使我们把「思想」作为最终目标来考虑。我们实际上是在试图构建「在上下文中的意义」。还要注意的是,「上下文」可以是一篇普通的老式论文!」。
参考文献
https://github.com/mnielsen/tpft/blob/master/big_picture.md
- 对于个人和团体来说,支持最高速的成长环境应该是什么样的?设想一个(极不寻常的)在线课程,这个项目看起来会像什么?
- 是否有可能帮助那些相信自己有能力对重要问题产生有意义影响的颠覆者?
- MOOC 真正想成为什么?+ 如何重塑大学?大学++是什么样的?+ 《启蒙琼林》++ 或 Dynabook++ 是什么样子的?+ 一人一生中能创造多少个西斯廷教堂天花板?
Kay, A. C. (1972). A Personal Computer for Children of All Ages. Proceedings of the ACM Annual Conference - Volume 1. https://doi.org/10.1145/800193.1971922
§公司研究实验室的实践
原文:§Corporate research lab practices (andymatuschak.org)
§赋能环境、游戏和《启蒙琼林》
原文:§Enabling environments, games, and the Primer (andymatuschak.org)
与其关注《启蒙琼林》,我发现了一个更有力的视角,将文章的叙述中心放在具有高成长性的赋能环境上。
-
如果要创业,你可以读一本有关创业的书,也可以选择加入 Y Combinator 。那么你会选择哪个?这涉及到赋能环境的力量。
-
选择后者,你能获得一个更高效的成长环境,并且这与是否有资金无关
-
如果靠读书,你便只是无数有创业念头的人中的一个,读的是创始人这个角色的活动,而不是在「实践创业」;当你在 YC 孵化时,你是在一个创业者的社区里不断创业的。书是抽象的,但 YC 不是:每节课针对的情景,都围绕你最关心的想法:
-
-
差异不仅仅是个人感觉上的:在 YC 的环境中,你会更有效地学习这个材料,因为它是一个参与式环境:参与式环境支持学习
- YC 的形式也允许其设计者用好几个月的时间,亲身体验创业的经历,而大众媒介大多缺乏超过一天的创制时间维度
-
真正的目的,不仅仅改善参与者的体验:它也帮助 YC 的创造者设计出更好的系统。
-
当然,YC 并非传统意义上的「上课」—— 并非将内容强加于你。你在 YC 环境下的体验,源自你自主行动的自然反馈。YC 是一个情景体验。
- 即使作为创始人的你不清楚自己正在做的是什么(对赋能环境不熟悉的人往往不能完成环境所赋能的事情),但 YC 系统给了你足够的支持,让你在这个紧张的环境中真实地参与并磨练技能;情景体验可以引导人们积极参与到赋能环境中
-
但这些体验并非偶然的意外。YC 的课程经过精心的创制,某种程度上就像一本书的创制。情景体验可以创造出个人与作者意图的强烈联系;情景体验放大了叙述的力量。
-
遗憾的是,情景体验很难创作且情景体验很难满足所有人的胃口。
- 但仍有光明的未来:情景体验成为大众媒体时蕴藏极大潜力
-
电子游戏设计是我们在这方面最棒的现有技术
-
(关于游戏和情景体验的一些要点说明在情景体验中;需要重构)
-
情感体验和叙事的展开是玩家行动的结果
-
而且他们善于培养技能:游戏能有效地培养玩家的技能
-
游戏展示了动态媒体如何做到书本无法做到的事情:游戏帮助玩家评估他们养成的技能和游戏帮助玩家制定和调整计划
-
但游戏是一种审美媒介;它们是用于「寻找乐趣」的;它们不像纪实文学和 YC 那样服务于外部目标:游戏中的技能培养服从于其他有内在意义的目的
-
-
这就是教育游戏所犯的核心错误
-
(更多该子项和反教育主义标签的笔记;教育计划往往会自我颠覆是一个很好的根节点 ::todo structure subtree in outline::)
-
介绍《少龄淑女绘本启蒙琼林》:
-
比起教育游戏,《启蒙琼林》似乎是一个更好的例子:《启蒙琼林》的目标是培养有创造力和颠覆精神的年轻人;它不是要检查一堆学习目标的勾选框
- 像游戏一样,《启蒙琼林》是一场巨型情景体验,并且《启蒙琼林》具备良好的扩展性
-
不幸的是,《钻石年代》中描述的具体机制不会起作用:见《启蒙琼林》不是一个可行的赋能环境
-
很难想象把教育游戏修改成什么好东西,但《启蒙琼林》足够接近目标,值得批评,而且,可能还值得学习
-
Nell 确实感觉到她自己在实现每一个步骤;在教育游戏中情况并非如此,因为情景体验需要参与者置身的因果关系
-
《启蒙琼林》是关于真正重要的事情(《启蒙琼林》的目标是培养有创造力和颠覆精神的年轻人,即使 Nell 不知道(Nell 不知道也不认同《启蒙琼林》的目标)
-
《启蒙琼林》中的活动更接近于真实的赋能环境。情景体验可以引导人们积极参与到赋能环境中
-
它可以在专家环境中继续下去,而不是什么要抛下的东西(《启蒙琼林》是 Nell 余生的一次大型「入职」经历
-
-
那么,我们如何使这种新的媒体形式呢? ::TODO 这一部分总体上定义相当不足;一些重要的想法在这里还没有被抓住,而且我们的理论在这里也有很大的漏洞::
TODO:
- 诋毁 MOOCs;将 YC 、教育游戏和《启蒙琼林》与 MOOC 进行比较;整合《我的世界》 vs. 《启蒙琼林》
参考文献
Thread with Michael Nielsen: Re: The Primer and Enaction
§收件箱和注意力管理
原文:§Inboxes and attention management (andymatuschak.org)
让思想和信念有机地涌现
原文:Let ideas and beliefs emerge organically (andymatuschak.org)
谨防先入为主的观念。独立思考。
-
通过使用已有作品,更快地完成现在的作品
-
认识论、原创性
-
士气:
-
对自己真实的兴趣和想法做出反应,而不是想着「我应该写 X」
-
不再有「我应该写什么?」的想法
-
§笔记写作系统
原文:§Note-writing systems (andymatuschak.org)
-
原则:
-
阅读与记笔记
-
思考和写笔记
-
写作和写笔记
-
笔记的结构
-
PKMs(个人知识管理系统)中的关联结构
-
影响
-
与参考系统的关系
-
工具
-
纯文本的价值
-
用纯文本 ID 来链接材料
-
在一个没有应用程序的系统中成为人类的连接器
-
历史/社区
-
卢曼
-
Christian 和 Sascha
在电脑上阅读文本令人不快
原文:Reading texts on computers is unpleasant (andymatuschak.org)
这是一个重要的问题,因为普及具有新颖认知支持的文字媒体需要普及电子阅读。
§ 严肃研究知识工作(Stripe 融合讨论,2019-12-12)
原文:§Taking knowledge work seriously (Stripe convergence talk, 2019-12-12) (andymatuschak.org)
讨论大纲
-
-
知识工作简史(对经济增长的助益,等等)
-
-
认真对待记笔记
-
推广结论:可使用间隔重复系统对注意力进行编程
-
间隔重复和收件箱
元信息…
-
姿态:
-
介绍当前工作
-
与其说是揭示答案,不如说是提出问题
-
绝对不是来提供直接可用的解决方案的
-
-
观众得到什么:
-
打开眼界,了解到他们每天工作背后更有一系列引人入胜的问题
-
了解如何提升的方法举例,感到兴奋与可能性
-
笔记类型体系
原文:Taxonomy of note types (andymatuschak.org)
::TODO:充实这篇文章;为每个笔记类型写一条笔记;等等::
对我来说,写笔记跟改笔记,其实就是在一个层级体系中,不断提升笔记的类型:
-
每日工作日志中的临时草稿
-
写作收件箱中的卡片和不完整的笔记(为临时性的和不完整的笔记设置写作收件箱),其中一部分可能转化成常青笔记。这些卡片可以通过间隔重复来积累感想(见间隔重复对于逐步完善灵光一闪可能有用)
-
常青笔记,其发展路径越来越复杂:
-
通过反向链接隐式定义的短篇笔记(反向链接可用于隐式定义知识管理系统中的节点;例如,笔记写作系统,有声读物
-
精确、狭义的陈述性笔记(笔记标题建议使用完整的句子,避免模糊主张);例如,人类的信道容量随着刺激维度的增加而增加
- 如果依照现有论据无法定论,笔记的标题用问题的形式阐述;例如特殊能力在多大程度上是可遗传的?,助记媒介中应用卡片在多大程度上可以取代回忆卡片?
-
更高层次的 API(常青笔记的标题就像 API)
-
将许多其他笔记概括抽象的笔记,例如教育游戏是注定失败的创造赋能环境的方法,在电脑上阅读文本令人不快
-
个人的专业术语,如情景体验
-
-
-
「纲要笔记」,例如§赋能环境、游戏和《启蒙琼林》
不属于本层级体系的笔记类型:
-
专有名词笔记
-
「文献笔记」,标题是作品名,主要是作为其他更长期的笔记的链接,以及作为反向链接的目标。我大致上用「纲要笔记」的形式写这些笔记,除非是记录别人的想法。比如说:Miller - The magical number seven, plus or minus two
-
同样,但不太常见的是,我也有「人物笔记」(例如 Anand Agarawala)和「商业笔记」(例如 Confluent)
-
这些笔记类型是弱常青的。我可能会在后续添加内容,但因为它们不是以概念为导向的(常青笔记应面向概念),所以像常青笔记那样添砖加瓦不是很有用。关于专有名词的较重要内容,通常会提出来写成单独的常青笔记,可以在多个地方使用。
-
「日志」笔记,用于积攒一闪即逝的观察,可能是针对系统、项目、某种行为。它们类似于每日工作日志,但划分标准是话题而非日期。例如,个人助记媒介
-
有了更好的嵌入功能或对上下文反向链接的支持,这种笔记可以直接写在每日工作日志中,而「日志」笔记可以被定义为对这种笔记的查询结果。
-
我的具体方法通常是用标签来表示笔记的「类型」。
不要过分执着于这些东西,也不要过度形式化。请记住:「更好地记笔记」这个描述太过流于表面;核心在于「更好地思考」。
§假日理论
原文:§Theory of vacation (andymatuschak.org)
-
去毛伊岛的旅行,2020 年 1 月
也请参见:Restful retreat / vacation / getaway places
思想工具
原文:Tools for thought (andymatuschak.org)
-
关于资金:
§最关心的事情
原文:§What’s top of mind (andymatuschak.org)
有点像 /now page,但时间范围更广,而且专注于我所想的事情。
-
认真对待知识工作
灵感源泉在何方?
原文:Where do ideas come from? (andymatuschak.org)
队列
-
Mednick, S. (1962). The associative basis of the creative process. Psychological Review, 69(3), 220–232. https://doi.org/10.1037/h0048850
- 本论文意在从联想的角度诠释创意性思考。
-
Friedman, R., Fishbach, A., Förster, J., & Werth, L. (2003). Attentional Priming Effects on Creativity. Creativity Research Journal - CREATIVITY RES J, 15, 277–286. https://doi.org/10.1207/S15326934CRJ152&3_18
- 作者检验了这样一个假设:感知方面注意力的范围的宽窄,对应着概念方面注意力的范围宽窄,从而会促进或阻碍创意的产生。
-
Rowe, G., Hirsh, J. B., & Anderson, A. K. (2007). Positive affect increases the breadth of attentional selection. Proceedings of the National Academy of Sciences, 104(1), 383–388. https://doi.org/10.1073/pnas.0605198104
-
本研究考察这样的观点:积极情绪可能有助于扩大注意力过滤机制的允许范围,降低其选择性。
-
与积极情绪下广泛的注意力集中和增强的创造性问题解决相呼应,创造性智力的个体差异与注意力过滤的减少有关。例如,有创造力的人已被证明表现出较少的潜在抑制,这是对被认为不相关的刺激物的注意力下降的测量(54)。
-
「跳过」:指数补偿的延迟机制和模糊收件箱
原文:“Skip”: exponential-backoff deferral mechanisms and fuzzy inboxes | Patreon 上的 Andy Matuschak
如果你在谷歌学术上搜索间隔重复系统的研究,你会发现有排山倒海的论文都关注算法的优化。这些论文调整算法来减少遗忘,提高稳定度,完善复习安排。这些的确都是有价值的追求。调度的机制是指数级的,所以一旦卡片回答的准确性提升了哪怕几个百分点,系统能容纳的卡片数量都能大大增加。但是,这种对效率的极端关注忽略了最重要的一点:几乎没有人真正使用这些系统,所以它们的实际效率接近于零。正如 Gwern 对这个问题的看法:「如果你这么厉害,你为什么没钱?」
令人高兴的是,记忆系统已经非常高效。在对这些系统进行了几年的实验后,我逐渐相信,优化的关键是复习环节及其内容的情感联系——反之,要坚决地减少引起叹气的元素。这些系统,如果任由它们的自然倾向发展,就会自然而然地腐化,产生仅是为复习而复习的学习材料,而这些材料感觉与你关心的任何事情脱节。
一些技巧可以提前帮助你:不要为未来的某一天「囤积」材料;避免为回应「应该复习它」的感觉而写下一张卡片;写联系、后果、影响——而不仅仅是事实;避免与关心的主题不相干的「孤儿问题」;等等。但这还不够,复习环节需要不断梳理,以保持趣味性。如果你有一段时间没有添加新的东西,复习环节就会失去新鲜感。如果你经常忘记一个答案,就必须重构这个问题,否则就有可能在将来翻白眼。
对我来说,最重要的维护类型涉及我不断变化的兴趣。我可能会偶然发现一篇迷人的论文,并写下几十张卡片,以帮助我内化细节。现在快进 6 个月。在快乐的情况下,当这些问题再次出现时,我很兴奋,因为它们将我与这篇迷人的论文的观点重新联系起来,现在通过我中间的经历,这些观点显得更加丰富。很多时候,我只是对仍然记得这些细节而感到感激。但有时,我不再觉得这篇论文很有趣;复习这些问题将感觉像是个苦差事。
如果这些复习环节要成为长期的习惯,重要的是不要把时间花在对你无关紧要的事情的卡片上。如果不进行删减,复习环节就不再感觉有价值,而开始感觉是一件苦差事。早在一张卡片复习起来感觉起来像个苦差事之前,这种不重要的问题就会使你对其相邻卡片的关注度下降。
问题是,删东西很难。不是功能实现不了——应用有简单的删除按钮——而是有情感障碍。电子化记忆系统的大部分价值在于,用了这一系统后,你就不需要仅仅为了确定何时该做何事而做出无尽的微小决定。我认为记忆系统是一类更普遍的「可编程的注意力」系统的例子,删除卡片的决定相对沉重,虽然可能在名义上是可以撤销的(例如从垃圾桶中),但实际上你知道你不太可能恢复被删除的问题。删除这一决定难以逆转,然而你对卡片只是些许反感,这便产生了矛盾。所以大多数人(包括我自己)会倾向于尽量不删除材料,所以他们的复习环节的情感联系会被冲淡。
我相信不仅记忆系统有这个问题,电子邮件收件箱、阅读列表、一大堆浏览器标签、待办事项列表等等。我一直在探索一种机制,来替代「删除」操作,使其更加模糊,破坏性更小。
想象一下,这就是你在复习卡片时看到的情况:
注意左下角的按钮:「跳过」。我们也可以说「不是现在」「以后」「推迟」,或者干脆叫「算了」。按下按钮之后,我们直接进入下一张卡片。而当前这张卡片之后会重新出现,比如说几周之后。也许那时候我们更会感兴趣了,;如果我们在那时候回答,复习计划会照常推进。但如果又一次按下「跳过」,这张卡片就会被推迟几个月。如果那时候我们又一次跳过,卡片就会被推迟一年甚至更长时间。所以连续几次「跳过」之后,我们实际上就将卡片「存档」了,但我们不必做出删除卡片这一破坏性而突然的决定。我们实则每次只需回应自己的感受即可。如果你觉得一张卡片「算了」,那么根据这一机制,你就能让这一情感安全地释放出来。这就是「模糊删除」。
我认为,这种机制可以有效地应用于任何类似收件箱的东西。我已经在阅读和写作清单方面做了实验,并想拓展它的应用范围。点这里跳转到关于「模糊收件箱」主题的更一般的工作笔记。
这种机制不仅在复习环节中很重要,而且在助记媒介的阅读体验中也很重要。量子国度假设了完成主义的目标:期望读者回答文章中的每一张卡片。这对某些文本来说当然是合适的,但在更非正式的文本中,读者的前置知识和兴趣水平更为参差不齐。完成主义的要求也让作者举步维艰:如果有些卡片是不少读者会感兴趣,但是作为必答卡片又不太合适的,作者便只能放弃这些卡片。
然而,如果让读者挑选卡片并「送入他们的轨道」,来避免完成主义的倾向的话,我们会制造情感阻力,就像删除内容一样。这一决定过于沉重,也为时过早。很多人对于放弃不关注的问题会犹豫再三。而且很多时候,当他们正在阅读了解某一话题时,他们并不知道什么问题比较重要!因此,这一模糊机制在初次阅读时比较有用。
对这种机制的挑战是,你所不关心的材料所带来的厌恶感,与有挑战性的材料所带来的厌恶感有些相似。我们不想鼓励人们因材料有挑战性而跳过问题:合意困难对学习很重要!我不确定如何在界面中解决这一冲突:目前,这一点(和许多其他挑战一样)将不得不通过文化和工具周围的「经典文献」光环来传达。这一挑战比它看起来更基本。记忆系统实现其极高效率,依靠的是预测人们回答卡片变得困难的时机,并在此时安排卡片。这可能是推广该系统的主要障碍:复习环节关注你最难记住的材料,这既会引起些许不愉快,也让人觉得该系统没用!
另一个细节上的挑战是,我不确定如何在界面上表示被跳过的问题的状态。如果一篇文章有 100 个问题,而你跳过了其中的一半,我们是否要用剩下的一半来讨论你对这篇文章的记忆?从图形上看,星芒的射线描绘了间隔。如果我在首次看到卡片时就跳过,代表它的射线会跳到 1 个月吗?这似乎传达了一种虚假的「进步」感......但也许这并不假,因为你并不打算复习那张卡片。另一方面,如果我们将射线保持在最小长度,那么当你复习文章的其余部分时,它会让你有一种不愉快的「掉队」感。
我想我第一次在 WikiWikiWeb 上看到这句话的时候是 13 岁:
前 90% 的任务需要 90% 的时间,而最后的 10% 则需要另外 90% 的时间。
为什么我曾经分享过对项目时间表的估计?你会认为我现在已经学会了。
无论如何。
我已经快要完成 Orbit 首次发布的 90% 内容了。问题简直五花八门。我更换了二进制序列化框架,我要修补平台字体渲染器,因为它的字体微调有问题。为了设计嵌入卡片的样式,我迭代了一轮又一轮,眼睛都瞪成斗鸡眼了。
我们到了最后冲刺阶段。Zeno 一直在做最后冲刺。大的要来了。同时,我已经创建了 Twitter 上的 Orbit 账户,它一直在发布一些不值得在 Patreon 上完整发布的视觉碎片;请随时关注。好东西最终会出现在这里。说到这个,这是我最近做的一个关于光芒四射的有趣小研究:
本周我将组织小型私人会议讨论《量子国度》。这个场合促使我回到对量子国度读者的分析上。我要报告个有趣的发现:在我们如何开发变革性的思想工具中,Michael 和我展示了这条曲线,是个令人愉快的指数。这条曲线说明,读者在复习六次后达到了约 54 天的实证保留。
在 2019 年的下半年,我们对平台进行了一些改进,累积压缩了该曲线两次重复以上。也就是说,现在的读者在复习四次后达到的实证保留率,明显高于去年复习六次后的读者的实证保留率。撇开我对关注效率的犹豫不决不谈,这里确实有很多垂手可得的成果。
像往常一样,感谢你为我的研究基金提供资金,现在蒸蒸日上。与此相关,如果你还没看过,你可能会喜欢 Twitter 上的这个帖子,它扩展了我在上一篇文章中提出的一些资助模式的想法。
与 Andy Matuschak 畅聊:知识工作、笔记写作和间隔重复
问题一
知识工作者的理想训练方式是什么?对于知识工作者来说,疯狂打磨基础技能以达到娴熟,这又意味着什么?
| 知识工作 | 音乐、舞蹈、体育… |
| ------------------------------ | ------------------------------------------------------------ |
| 技能尚未描绘清楚。 | 专家/教练/导师对技能有全面的认识。|
| 不清楚如何进步。 | 关于训练以取得进步的知识非常丰富 |
| 反馈循环缓慢 | 反馈快速且细粒度 |
-
知识工作是「棘手领域*」(Ericsson)(*译注:原文为 Wicked Domain,指一种难以通过练习稳步提高能力的领域,其标志是不断变化的背景和不一致或模棱两可的反馈)
-
相比于芭蕾、音乐来说,精湛的知识工作技能是怎样的,尚不清楚。
-
诺贝尔奖获得者很少当教练,他们并不会记录应该训练哪些技能来积累知识,达到像他们一样的知识水平,取得成功,所以没有形成知识库。
-
知识工作者的基本技能举例:注意力管理、逐步完善想法、良好的团队沟通能力
-
可以做什么练习来提高知识工作的技能呢?
-
每日写作?
-
也许可以参考宗教学习获取灵感?
延伸阅读
知识工作 (Andy Matuschak 的笔记)
Peak: Secrets from the New Science of Expertise(Anders Ericsson 著)
刻意练习总结 (维基百科摘录)
成就专家之路(Anders Ericsson 著文)
问题二
你的笔记对你的学习和创作有多重要?能举个例子说明写笔记时得到的灵感,或者取得的创造性突破吗?
-
我已经写常青笔记一年半了,不清楚效果有多显著
-
他的大部分重大见解都是在他创立笔记系统之前提出的。
-
他能更为持之以恒地完善不成熟的想法
-
《量子国度》起源自 Andy 和 Michael Nielson 持续两年多的对话。
-
传统机制很难支持不成熟想法的逐步完善。
-
能并行发展多个不成熟想法,同时有更多原创思考,而非对已有知识的总结
-
穿越时间的文本 - 基于 100 多条笔记,只花了三个小时就写完了——大部分思考在写作之前就完成了
-
《为什么书本不起作用?》 —— 花了 80 小时,因为他要边想边写
延伸阅读
穿越时间的文本(Andy Matushcak 和 Michael Nielsen 合著)
为什么书本不起作用? (Andy Matuschak 所著文章)
量子国度(Andy Matuschak 和 Michael Nielsen 合著的一系列文章)
问题三
写笔记对你的思考有多重要?你觉得不记笔记还能深入思考吗?
-
很难有定论;但能肯定,有了笔记能更好地完善想法。
-
他认为,在过去的一年半里,他没有发表非常重要的内容(三年后再来看!)
延伸阅读
问题四
与传统教育体系相比,非传统的学习工具 + 系统(Orbit,可汗学院)的作用是什么?它们是应该致力于融入传统教育体系并与之共同发展,还是应该挑战传统教育体系并与之竞争?
-
Andy 曾在可汗学院就职五年
-
离职之后,他便不想再考虑正式教育这一场景了
-
赞同一部分 Woz 与 Illich 等人对反教育主义的看法,但更偏向实用主义。(译注:Illich 是激进的英国教育改革家,创办了夏山学校)
-
在可汗学院:很难取得进展,因为学生觉得配合实验不是他们的目标,所以每个项目的结果都有偏差 / 扭曲。(译注:原笔记不清楚,原视频转录为:17:27 and like most of the kids already decided that they didn't want to be there or like they were thinking about other things you know like this is not)
-
他决定不再关注传统教育系统了
延伸阅读
学校教育的问题(Piotr Wozniak 著书)
逆教育社会(Ivan Illich 著书)
问题五
经常做笔记的人没有严肃的使用场景。
-
不是所有做笔记的人都没有严肃的使用场景,只是有些人如此。
-
他最喜欢的「真刀真枪的使用场景」的例子,是 NASA 的阿波罗项目(来自 Michael Nielsen)
-
这一项目的目标是载人登月,但研发过程中还额外收获了不少有价值的知识,开发了很有价值的工具
-
建造大教堂 - 目标是为宗教服务,但过程中收获了大量建筑学知识
-
很多间隔重复相关文献都不怎么样 —— 这些研究都不是在真刀真枪的使用场景下开展的。
-《量子国度》:想要成为量子计算的入门读物。面向研究生写作——需要认真研究量子计算的群体。
延伸阅读
高效学习的间隔重复(Gwern 的文献综述)
「系统性」思考——从阿波罗太空项目中获得有效管理系统的启发,以及系统政治(Dominic Cummings 著文)
问题六
应用卡的作用
-
对他来说仍然是谜团!
-
应用卡有意让人不借助回忆作答
-
帮助你应用所学
-
应用卡针对的是概念,每次呈现卡片,问题的措辞会变化(2 年内循环一遍)
-
为了辅助迁移学习
-
与作者合作
-
应用卡写起来成本很高,但比练习题成本低
-
人们有时候对通过 SRS 习得的知识不够自信
延伸阅读
Learner’s perceptions of their knowledge vs reality after spaced vs massed learning
笔记类型体系(Andy Matuschak 的笔记)
过程式 SuperMemo(George Zonnios 的博客)
问题七
措辞对最大化迁移的重要性。
-
如果问题能被「模式匹配」,那么迁移的效果很差
-
问题的措辞中有线索
-
GPT3 很难问出好问题。
-
如果你写出问题和答案,让 GPT3 生成句法变种呢。
问题八
从设计者的角度来看,SRS 系统最重要的方面是什么?
-
什么是 SRS 中的基本名词和动词?
-
什么是记忆系统的「原语」?
-
记忆系统的进度很难展现——记忆系统会展示间隔和统计数据,但是没有展现用户现实目标的进度。
-
SRS 看起来不好用,因为你大部分时间都在学习你忘掉的卡片。
-
学术环境下开发的工具,没有在真刀真枪的使用环境中开发测试过。
-
实践出洞见的循环
-
SRS 领域中所有人都低估了情绪的作用
-
大多数人都不能坚持使用 SRS
延伸阅读
实践出洞见(Andy Matuschak 的笔记)
问题九
最喜欢的间隔重复卡片的独特应用。
-
用哲学思考框架分析你面对的伦理决策。
-
分析过去的经验——有人做出惊奇之举时。
-
写卡片和琢磨卡片带来的价值各有多少。
延伸阅读
间隔重复记忆系统的特殊应用(Andy Matuschak 的笔记)
问题十
需要多长时间才能培养写卡片的相关技能。给用户提供模板问题就足够了吗?或者总是需要一定程度的创造力?
-
模板或脚手架有助于用户起步时提高卡片写作技能。
-
Andy 觉得他不是很擅长写卡片
-
第一年写卡片很是困难,从询问他人中收获良多
-
打算为文章作者开设卡片写作研讨会
-
汲取经验出书——就像是把卡片的 20 原则扩展成一本书。
-
他注意到对于一些种类的知识来说,有一些常见模板可以套用,但很多东西套不上模板。
延伸阅读
知识表述的 20 条规则(Piotr Wozniak 著文)
问题十一
为自己的写作内容制卡有什么优势吗?
- 并没觉得更容易。
问题十二
SRS 可以让你获得和记住更多的知识。它如何改变学习中的时间分配策略?是当专家好还是当通才好?
-
SRS 是学习活动的下游
-
并没有改变其根本。
-
学习要为好奇心或者真刀真枪的项目服务。
-
不要为学习而学习。
-
应需而学 - 程序员视角。
-
什么都想学或者想学细枝末节的 SRS 使用者,常常会失败。
-
好的策略 - 深入专精一个领域,同时在其他几个领域达到较好水准。
问题十三
你是怎么写笔记的,在直播中,你似乎是在凭记忆做笔记。
-
他面前有本书,不是仅凭记忆。
-
会做标记来索引书。
-
当他刻意学习时,比如说学习刻意练习这一话题,他会将原材料阅读多遍,每次都对文本做标记,并认真阅读,将关键想法画成地图。
延伸阅读
问题十四
你对渐进阅读的看法如何?
-
很有趣。
-
自己建造了一个原型系统,但现在优先级不是很高。
-
自由感是很大的动力
-
阅读实体书时会有种感觉,放下这本书后就不会再读了。
-
SuperMemo 里的名词和动词都错了,工作流也不对,但为了全方位批判还需要进一步了解。
问题十五
Woz 提问:「我刚才在跟朋友聊,要把人类的所有行为转化成概念网络。每个人都会是神经元,他们需要描述自己的需求、兴趣以及能力。这样就能构建高效的协作和知识交换系统。为了实现这点需要软件基础架构。你觉得呢,Andy?」
-
集体智慧和网状智慧的文献。
-
目前无法描述成功的类似系统
-
对军队运转的研究 - 协调多人行动
-
Michael Nielsen - 重新发明发现(Reinventing Discovery) - 如何有效引导专家注意力。
-
子问题是什么,比如说注意力。
-
担心这套系统的内在想法太过模糊
-
作为系统设计者,你要提出系统的各项属性,但系统的底层理论还不够成熟。
延伸阅读
重新发明发现(Reinventing Discovery)(Michael Nielsen 著书)
Polymath 项目(维基百科文章)
Orbit 的一个新兴审美取向
原文:A nascent art direction for Orbit | Patreon 上的 Andy Matuschak
(你可能重复收到这个帖子的通知:Patreon丢失了上一篇的所有图片,所以得重发一篇!嗐...)
到目前为止,我一直在为 Orbit 使用量子国度的设计语言,只是为了帮助我专注于所有我必须要做的架构工作。这样做短期内是很有用的限制,但 Orbit 几乎已经准备好了它的第一批出版物,所以现在是时候换个办法了:Orbit 的视觉效果如何能加强它的想法?
Orbit 面临两大视觉设计的挑战。
首先:Orbit 最初是作为嵌入的「客人」出现在其他的出版物中。既然是客人就要入乡随俗!它不应该与主人的风格选择相冲突;它不应该干扰读者阅读卡片周围的文本。在《量子国度》中,我们只是对互动卡片和书本身使用了相同的设计语言。你在量子国度收集卡片,然后在量子国度复习它们。但是 Orbit 的模式是,你在量子国度(和其他地方)收集卡片,然后你在 Orbit 上对它们进行综合复习。这就棘手多了!读者浏览了「我们的数据世界(Our World in Data)」(或其他什么),但是文章中这个奇怪的「Orbit」东西要求他们注册,后来他们又收到 Orbit 的电子邮件,要求他们做一些事情。所以 Orbit 需要在你阅读主办方的出版物时将自己作为一个独特的「合作伙伴」实体来介绍。Orbit 是一个研究平台......但鉴于这些限制,它需要有一个「品牌」,让人感觉像一个「产品」。
另一个挑战则更像是机遇:思想工具往往设计不够鲜活,教育的意图太重。如何为 Orbit 打造一套视觉语言,来扭转这样的倾向? 如何更加凸显「体味关切之事」的欢欣,淡化「记住多少琐屑常识」的念头?间隔重复记忆系统让记忆任你掌控,但是记忆率本身是无关紧要的。可惜,记忆系统相关的文化太过「为了记忆而记忆 」了。有些人要把读到的所有细节都记下来(「以防万一」),但不再深入地体会个中要领。他们似乎很害怕「忘记」;笔记狂人背后也是同样的执念。我无意助纣为虐。然而愿意早期尝试我的作品的人,往往受到这些文化的影响很深。这是风险。
对于这个挑战,我的视觉设计能力犹显不足,所以能与 Nio Ono 合作,我非常激动。今年六月,我们花了几周来探索 Orbit 的艺术方向(感谢 Taylor Rogalski 为我介绍!)先把话说清楚,Nio 是真正创作下面这些作品的人:我指出方向,但她描清了全局路线。接下来几个月我会亲自踏上这些旅程,所以我写下这篇文章来热热身——我要向他人阐述这些想法,来更深入地理解并诠释。
在我们深入探讨之前。我意识到,你们中的许多人从未与新生的设计工作进行过互动!让我来分享一些关于如何参与这个材料的意见。这个阶段的工作的目的是要打开门,在问题空间中找到一些指点,创造动力。由于这是一个视觉练习,它特别是关于探索某些美学方法的感觉。你会看到一些看起来像界面截图的图像,你会很想把它们具体地解释为界面。从某种意义上说,它们的确是......但它们实际上是在尝试在背景中看到视觉语言。眯起你的眼睛;少关注「界面」,多关注气场。这个练习是关于探索符号、字体、网格、颜色等的纹理相互作用。在这些视觉原语和它们所居住的界面之间有一个退火过程。在这次冲刺之前,我已经部分地定义了 Orbit 的界面,但如果不发展视觉语言,我就无法进一步发展。同样地,我们现在已经在视觉语言上花了一些时间,但如果不花一些时间用这些想法来推动界面结构的发展,我们就无法走得更远。设计会绕着圈子,在形式和功能之间徘徊,直到事情最终解决。
精神特质
Orbit 的「个性」是什么?它试图传达什么精神?为了给我们一个粗略的指南针,我们从这个有抱负的三重原则开始:
真诚、热忱、好奇心 —— 而不是:义务、工具主义、劳苦
Orbit 帮助你加深与你最在意之物的关系。这些活动主要是认知上的,但你与材料的关系是情感上的。这是为你可以谈一晚上的想法和想象。Orbit 是为那些赋予你生命意义的东西而设的。
Orbit 不在于让你吃掉西兰花。它不适合你认为你「应该」参与的事情,那些需要你唤起意志力的事情。它的基调不是「教育」。Orbit 的结果是学习,但其目标不是学习:而是能够做一些在这个世界上给你带来意义的事情。
无为,不费吹灰之力,「相信过程」—— 而不是:收件箱,图表,旋钮
向 Orbit 添加内容就像打理园子一样。你种下种子,相信它会茁壮成长,开花结果。你并不关心卡片展示时机和展示频率等细节。你大可放心:安排的时间基本上是合理的;你能逐步把添加的所有内容都内化;卡片的间隔会慢慢变长,如同移动到更远的轨道一样,而新卡片的展示机会也是恰如其分的。你的 Orbit 不会有「要溢出来」的感觉。
你的日常 Orbit 练习,就像你的日常冥想练习一样。没有「完成」一说,没有进度的图表一往无前。如同冥想练习一样,你对某一次练习的具体结果并不关心,也不该关心。但你终究会来参加练习,顺应气息,最终你的视野更加清晰。
Orbit 不是一个需要梳妆打扮的收件箱。Orbit 不是一个带着三位数字的红袖章。你不用「拨入」你的 Orbit 卡片。你不用执着地追踪任何一张卡片的「进展」(不过你确实能感受到一些更宽泛的「进展」弧线)。
用功、认真、主动 —— 而不是:自满、被动、敬畏。
冥想在某种程度上涉及不费力气,但在另一种程度上涉及勤奋。你每天都会出现在练习中,并遵循指示,相信这些活动会帮助你变得更聪明,而不了解确切的机制。但这并不意味着冥想是**容易的!**如果你不认真参与,15 分钟就会溜走,而你却没有清楚地观察到一次呼吸。
类似地,Orbit 也同样既轻松又用功。你出席每日的复习,没有特定的期待或要求,但你要全神贯注于你在那里发现的东西。Orbit 本质上是严肃者的工具。它是深入、清晰的理解;它是对那些仅仅想让你记住思考一些东西的老方法的不满。
作者通过提供卡片来塑造使用 Orbit 的体验,但 Orbit 终究是一个靠你自己运用的工具。Orbit 期待并回报你自己的主动性——通过你撰写自己的卡片,重组给你的卡片,抛弃你不关心的卡片,按照你的价值观塑造系统。
视觉主题和灵感
这些原则处于紧张状态!严肃性与不费力气;好奇心与勤奋;认真与 「相信过程」。但是有一条真正的主线贯穿其中。以下是一组冗长的主题和灵感中的几个亮点。
重力既毫不费力又不可避免。它是严肃的,但又是无形的。在视觉上,这意味着沉重和对比的重量,也许是凝重的动感。
约瑟夫-穆勒-布洛克曼的海报,1958 年
天体力学是适当的奇妙的,「相信过程」,精确。当然,Orbit 这个名字自然地暗示了这个方向。
Laura Csocsán 为 Tempus Futurum 创作的海报
对比的几何学呼应了天体的主题,在结构僵化的背景下注入了一些好奇的音符
*Kenzo Hara for hy-phen.jp
模拟的颜色暗示了复古主义的怀旧热情。
博-伦德伯格的海报。
一个核心的识别图形:星光闪耀
旅行者号和先锋号探测器携带了一块由天文学家弗兰克-德雷克设计的带有这种星光的金属板:
这是一张太阳系相对于附近脉冲星的地图。它在视觉上相当醒目,但它也编码了大量的信息:长度代表相对距离;哈希值编码脉冲星的周期。
这个数字(以及其他来自讽刺性的占星术的数字!)激发了 Orbit 的中心标识:一个信息丰富的星形图案。没有固定的「标志」:这个形状每次出现都会改变,提供数据可视化和导航功能。它反映了每个用户在一段时间内的个人行为,但它作为一个主题,其独特性和一致性足以作为一个可识别的「品牌」符号。
渐变的笔触在负中心创造了一个光环状星星的视觉错觉。沉重的线条围绕着空旷的空间,呼应着 「无为」的毫不费力的行动。
从功能上讲,星形图案是一个卡片的集合——可能是你当天要复习的一套卡片,或者是某本书的卡片,或者是你自己制作的一个卡片文件夹。每张卡片对应一条射线;每条线的长度代表一张卡片的间隔。一个密集的星形图案代表一个较大的卡片集合。
在复习课的背景下,星形图案成为一个动态的径向进度指示元素,每完成一张卡片就顺时针打勾,用颜色来表示完成的项目。
当可视化大型集合时,我们可以强调线条的 「尖端」而不是笔画(左)。在密集的列表环境中,星芒可以「解开」成垂直堆叠的线条,每一条仍然代表一张卡片(右)。
字体
我们探索了各种几何风格的无衬线字体,但最终爱上了 Dr, Production Type 制作的古怪字体。这一字体充满对比:圆形和矩形;粗线条和负空间;悬殊的比例。它很独特,但又很灵活,可以配合许多主体出版物的风格配合。我们可以上下调整字体的大小,以保持笔画一致:
还请注意网格结构:这种布局有节律的节奏。一种「有规则」的页面感觉承载着勤奋和毫不费力的行动主题。
在上面的图片中,我们看到一些界面的雏形开始形成,但正如我前面提到的,这些并不试图成为「屏幕截图」:它们在这里是为了探索比例和层次结构。
对于标识,我们希望能呼应博士的大胆几何形状,但又有足够独特的细节来独立存在。它不应该依赖于星形图案的可识别性。这是目前的最爱,是 Nio 在 Herbus 上的一个翻版:
主导的 o 保持了对圆形和天体主题的关注;r-b 连接词继续了圆形运动。直线型的 i-t 构成与曲线型形成鲜明的对比。
图标
当 Orbit 的界面刚刚起步时,很难在图标设计上走得更远:我们还不了解所有的核心操作是什么,以及它们可能如何被安排。但 Nio 观察到,有一个有趣的机会,让图标反映出几何字体、星形图案的渐变笔触,以及对负空间的强调。这幅拼贴画显示了「添加」、「下一个」、「关闭」和其他常见的动作如何能够持续地承载我们已经定义的视觉语言。
Orbit 确实有一个不寻常的核心动作,我们确实很了解:揭示一张卡片的答案。这个动作提供了一个机会,可以做一些独特和令人难忘的事情——见上面右边的「眼睛」。
颜色
在 Anki 中复习卡片,感觉有点像在一望无际的平地上行驶在笔直的、不变的道路上。颜色提供了引入动态的机会。由于其他的视觉元素已经相当朴素和规范,颜色也是强调第一个主题的机会——激情、兴奋、好奇心。
Nio 构建了一个色轮,它奖励了令人惊讶的、明显无层级的组合。(它还以某种方式在大多数有用的组合中保持了 WCAG 可访问的对比度)。
在这个效果图中,我们的想法是,界面的配色方案在一天中会发生变化,加强了复习环节的仪式感。也许,如果你在早上打开 Orbit,你会看到橙色的色调,在晚上则是丰富的紫色。星爆色给人的感觉是不可预测的,但它遵循一个简单的结构:背景是从色轮的内环画出来的;星爆色是逆时针方向一个缺口的外侧位置(一个近似的色相)。
颜色的另一个令人兴奋的潜在用途是表示来源背景。就是说:《量子国度》是紫色的,所以每当《量子国度》的卡片出现在你的复习环节上时,你就会在《我们的数据世界》的蓝色和 Tufte 的书的黄色之间看到一抹紫色。间隔重复的卡片可能会让你感觉到相当的原子化,并且脱离了你真正关心的原始事物;这种颜色的方法可以加强原始的情感背景。
这里的重音玩的是各种色调角度,从类比到四分法到互补法。这是不是太多?也许吧!这就是我之前提到的:在这样的静态展示中,你真的无法判断。大胆的解决方案往往在「静止」时感觉过于激进,但在「运动」时却令人激动。如果你把图形的选择调低到「静止」时感觉舒适,你最终会得到一些无趣的东西。我必须实际生活一段时间才能知道。
上面的图片描述的是应用程序内的 Orbit 复习体验——你去复习你从各种地方收集的所有卡片的地方。但正如我在一开始提到的,Orbit 在嵌入主人的出版物时必须「表现自己」。在这种情况下,我们几乎肯定无法摆脱这些咄咄逼人的颜色,而且我们甚至不应该尝试:复习区不应该把你的视线从周围的散文上拖开。
但这没关系。同样的方法可以用一种更克制的方式来应用。也许在《量子国度》中观看时,同样的颜色被克制地使用,但足以与 Orbit 应用中更大胆的使用产生联系。
请注意,我们强调的是互补的绿色而不是主人的紫色,因为我们的轮子的紫色可能与主人的品牌颜色不完全一致。背景水洗是一个不饱和的三色相对。
我希望作者最终会需要一些用于嵌入式环境的演示旋钮。在一个网站中感觉平衡的设计,在另一个网站中会感觉不堪重负。人们会满足于从 Orbit 的色轮中选择,而不是使用他们精确的品牌颜色吗?也许应该有一个单色的选项,特别是对于那些「品牌颜色」是单色的地方,比如 gwern.net。
我与 Nio 的冲刺已经结束,接下来交给我了。我要实现这种视觉语言。我将在我的日常 SRS 实践中使用它,并且我将对它在各种主人的出版环境中的表现进行原型测试。我相信会打破很多东西,会提出很多新问题,等等。
该平台每周都有很大的进展。我的目标是在 7 月底发布第一批带有 Orbit 卡片的文章,我仍然认为这并不是大错特错。我期待着有更多的带宽来与作者合作者一起工作。
(顺便说一句:「Orbit 卡片」......是「比特」吗? 为时过早,也许。)
从真正意义上讲,如果你们喜欢这项工作,你们应该感谢你们自己。我仍然处于亏损状态,但你们的集体赞助已经减缓了燃烧的速度,使我能够间断地与像 Nio 这样的专业人士合作。事实上,即将发表的文章将与不同的视觉合作者分享另一个令人兴奋的项目。
赋能环境的原语;对于机器生成卡片的初步探索
原文:A primitive for enabling environments; early work on machine-generated prompts | Patreon
我正在构思一种全新的间隔重复系统——一种新的赋能环境——它的核心原语与现有系统有本质区别。
为什么需要一种新的核心原语
现有间隔重复系统的核心原语是抽认卡。如果你想记住某个信息,你需要将其写成闪卡,并添加到系统中。你的系统不知道你想记住什么信息,当然也不知道这条信息与你脑海里其他信息的关联。这套系统只知道这些卡片。
对于记忆简单事实,如国家首都或外语词汇,这种方法还算有效。但间隔重复系统的重要性在于它能支持多样化的学习,帮助你更深入地理解和内化各种复杂概念。然而,问题在于——根据我的经验——当学习内容越偏离简单的事实-抽认卡对应模式,这些系统的效果就越不理想,使用起来也越发困难。
Michael Nielsen 和我在之前的研究中指出,「记忆系统」这一概念比「间隔重复系统」更能全面地概括这一领域。后者仅强调了一种特定的学习方法,而认知心理学家已经发现了许多关于人类记忆的深层规律,我们应该充分利用这些研究成果。选择「记忆系统」这一表述的另一个原因是,它更贴近我们的实际需求。我们需要的是一个能帮助我们形成牢固记忆的系统。(实际上,我们的需求可能更为复杂,这一点我们稍后会详细探讨。)
对于基础词汇的记忆,单纯的间隔重复可能已经足够有效。然而,对于更复杂的概念,我发现仅仅依靠抽认卡形成的记忆往往不够牢固。当我查看同一张抽认卡几次之后,卡片特定的表述方式很容易成为强烈的提示线索。这时,我回忆答案并非是因为真正理解了内容的含义,而是出于一种条件反射式的模式匹配。一个真正有效的记忆系统应该能够让我形成足够牢固的记忆。这个系统应该用不同的线索,从不同的角度展现这个想法,与不同的概念产生联系,从而让我用多种方式来编码记忆。
让我们再次拓宽视野。通常,我追求的不仅仅是记忆,更重要的是学习。我希望所学的每个主题都能是记忆鲜活,手到擒来。我希望能够灵活自如地运用所学知识。我希望对知识的理解能不断深化。我希望能发现新的启示,产生新的想法。现代间隔重复系统的发明者 Piotr Wozniak 曾提出,应该先学习后记忆。然而,根据我的经验和对认知结构的理解,我认为这其实是一个持续而并行的过程。当我们练习和阐释所学内容时,我们不断建立新的关联,加深对知识的理解。记忆与这个过程本就融为一体,而非独立于学习之前或之后的步骤。[1]因此,「记忆系统」这个词已不足以概括这个过程。我们理想中的系统需要一个更宽泛的名称——这也是我经常使用「赋能环境」这个术语的原因之一。
这些内容都非常抽象。事实上,我放入间隔重复系统的许多内容并非如此。我可能会记录下与朋友共进晚餐时的一个富有洞察力的观察,一句美好的名言,或者某人出乎我意料的行为。这样做的重点并非为了记忆,而是为了改变——将这些经历内化吸收,使我在未来的感受或行动有所不同。实际上,这一点也适用于我更传统的学习方式。当我学习音乐理论时,我追求的不只是掌握这些知识,而更希望在演奏音乐时能有全新的感受和表现。当我研究一个历史人物,我不仅仅是想学习事实,也希望将他们看待世界的方式融入我自己的视角中,从而得到新的体验。如此一点点,一步一步,成为一个不同的人。[2]一个着眼于这种目标的系统,才能成为一个含义更加深刻的「赋能环境」。
另一种原语:情境化想法
在阐明了这些超然目标之后,我现在可以指出我对抽认卡的主要不满:它们是静态的。它们就像「死掉的鱼」一样毫无生气。要建立牢固的记忆,需要多样化的线索和知识之间的关联;要实现深入的学习,需要逐步深入,逐步复杂;而要真正内化知识,则需要具体的语境和生动的呈现。
为了给这些系统注入活力,我认为我们需要引入新的核心原语。目前的间隔重复系统主要围绕着抽认卡运行——添加、组织和安排抽认卡。我认为应该循至上游。如果我们希望复习过程能够随时间推移而变化、深化并建立知识间的联系,仅仅提供静态任务是远远不够的。事实上,如果我们的目标是促进知识迁移,我们就不应该预先设定固定的任务:因为迁移学习需要惊喜。我们需要找到一种方式,指向那个激发任务的原始想法,将其置于启发我们的具体情境中,从而让各种变化多端、不断深化的任务能够随时间推移而自然涌现。[3]
在阅读一本书时,标记一个重要想法的最自然的方式,就是直接标注文本。比如用荧光笔高亮某个段落,或者在页边写下我们认为有意义的评注。同样,当我们回顾一次对话或某次经历时,也可以在日记或笔记中采用类似的方法。
具体而言,我设想的这个新的原语——不妨称之为「情境化的想法」(situated idea)——将取代传统的问答格式,它包含以下内容:
-
指向相关上下文的链接,包含完整文本;例如一本书、一篇日记等。
-
在该相关文本中标记需要消化吸收的内容的范围(可能是一处或多处);就像你在书上做的高亮标记。
-
一条可选的额外注释,用于阐明你的用意,或者是你的兴趣;类似于你在高亮旁边写的边注。
然后,系统会根据这些输入,以及与相关语境中其他情境化想法的联系,为不同时间生成适合开展的学习活动。
这一过程基本上模仿了专业教学设计师的工作:他们根据文本中引入的一组「知识点」,设计一系列教学活动(如范例讲解、练习题和思考题等),并循序渐进地在不同时间节点呈现这些内容。在某些情况下,这些教学内容的呈现顺序甚至可能根据你的表现进行调整,不过很少有课程能像间隔重复系统那样有效地强化你的记忆。
我所提出的这套系统最大的特点,就是把控制权从教学设计师转交到了用户手中。这也是我过去几年在研究助记媒介的过程中得到的最重要的启示:具有自主学习动力的成年读者通常不愿意被动地接受作者安排的学习内容。人们阅读文本时的需求各不相同,他们的学习目标也不尽相同。比方说,有人想掌握定理本身,有人则想学会证明定理的方法;由于知识储备不同,有些人需要在这个知识点多加巩固,而有些人则需要在那个知识点多下功夫。更不用说每个人感兴趣的分支领域都不相同:同样一个章节,可能被这个读者一扫而过,却被另一个读者深入研读,反之亦然。
这些见解促使我去年进行了「魔法」荧光笔的实验,并提出了一个更有意思的想法:如果我们能让荧光笔真正实现人们期待荧光笔能实现的功能,会怎么样呢?调查显示,学生最青睐的学习方法通常是反复阅读和用荧光笔标记重点。在最有效的学习方法中,这两种方法往往会排在最后。尽管如此,标记重点的感觉很棒:它不仅能表达兴趣,参与学习,更能在文本上留下自己印记。人们认为标记重点能帮助他们内化学习材料。但实际上,它(在大多数情况下)并不奏效。不过,也许我们可以改变这一现状:你可以使用特殊的荧光笔将「情境化的想法」添加到你的知识库中,然后系统会确保你能够真正内化这些材料。
好了,好了:机器生成的提取练习任务
在 2022 年我刚开始写这个想法时,我的看法与现在大不相同。当时,大语言模型(LLMs)无法针对源文本的特定部分生成优质的提取练习任务。事实上,直到 2024 年底,LLMs 在这方面仍然表现欠佳。但现在,我正在与 Ozzie Kirkby 合作开展一个项目,旨在解决这个问题。
许多人都在这个问题上小有涉猎,但我尝试过的解决方案都未能达到令人满意的效果。我一直对这个问题持谨慎态度,主要是因为我不认同主流的思路:一味追求效率、便捷、可用性。在我看来,这些目标是对问题的过早优化。我追求的是本质上的突破。诚然,不用费力制作抽认卡是件好事,但我更希望这些系统能够真正提升学习效果——形成更牢固的记忆、更深入的理解和更全面的知识内化。
创造一个新的核心原语,这才是更值得探索的方向。我想要的是一套类似于间隔重复系统的系统,但随着时间推移,它的复习活动会发生变化,逐步深入,并串联各种知识。这样的系统要么需要耗费巨大人力去逐一定制内容,要么需要有台机器生成任务。而只有通过机器生成任务,才有可能根据每个人的独特场景来量身定制学习活动。
因此,机器生成任务成为了必然选择!Ozzie 和我已经合作研究这个项目约六周了。虽然仍处于起步阶段,但我想与大家分享一下我们目前的方法和心得。
首先:当前的人工智能模型在为超出简单事实的内容生成有效任务时,并不能自动表现出色,至少仅依靠卡片工程和少量样本例子是无法实现的。这一现象是可以理解的。几乎没有人会使用记忆系统来存储简单事实之外的信息,因此训练数据集中这类例子寥寥无几。问题集和练习题是有的,但提取练习任务则完全是另一种数据子集。而且,即便给定了高亮标记和完整的上下文,模型在定位目标上的表现还是很差劲——它们无法很好地判断读者可能想要针对这段高亮内容探讨哪些具体问题。
尽管如此,这些模型偶尔也能生成结构完善、目标明确的任务。有鉴于此,我们正着手训练一个分类器,用于评估任务质量。我们的思路是,虽然模型只能偶尔写出好的任务,但是我们能把坏的任务删掉的话,那就也可以接受。这样一来,随着时间推移,我们就能通过这种评估不同模型和架构的方法,逐步「扩大」模型在任务编写方面相对稀缺的判断能力。
和大多数机器学习流程一样,数据是制约因素。我们首先手动构建了一个数据集,含有数百个「情境化想法」,其中包括源内容、重点标注范围、提取练习任务以及分类评分。随后,我们添加更多数据,用 LLM 生成任务(有好有坏),然后手工评分。目前得到了超过2000个样本。目前的结果显示,分类器在同一源文本范围内(对预留的测试样本)表现良好,但在处理新的源文本时,其泛化能力却明显下降。
因此,我们正在收集更多数据。我们设计了一个高效的工作流程:
-
在阅读 PDF 或网页文章时,我们使用 Hypothes.is 工具对内容进行高亮标注
-
随后,机器会对高亮部分自动生成相关任务建议
-
对机器生成的每条建议,我们会给出以下反馈:一个机器可识别的「评分」;格式自由的评价性意见;针对同一任务的「修正」版本(可选);以及为我们所发现的错误模式(例如过分关注无关紧要的细节)添加标签(可选)
-
如果机器生成的所有任务建议都不理想,我们会亲自回复高亮部分,提出我们期望的任务
这个工作流程中产生的分类评分和人工编写的任务会被用来进一步改进分类器,从而提升输出质量。我们还会将批评性意见和人工优化的示例用作少样本学习或模型微调的材料,以提升任务生成能力。我们希望随着时间推移,能够更多地采纳模型的输出,这将降低人工反馈的成本,进而让我们能够收集更多数据,形成良性循环。当模型输出变得相对可靠后,我们就可以通过众包方式获取标签,进一步加快这一过程。
下一步计划
我的长远目标是开发我此前所描述的更具动态性的学习系统。不过就眼下来看,我预计这个项目对现有间隔重复系统的用户会很有帮助。我们计划开发一个界面,让用户能够方便地标注文本,并将由此生成的学习任务导入到 Anki、Mnemosyne 等工具中。当然,这一切都建立在我们的处理流程能够达到预期效果的前提下。无论如何,我们一定会将我们的数据集和代码开源。
即便在传统抽认卡生成的有限范畴内,要与现有系统实现良好的整合,最终也需要进行更深层次的改变。在理想的整合方案中,用户无需在阅读过程中评估机器生成的学习任务。他们只需专注于阅读和标注,然后在之后进行复习。这里的难点在于,有时一处标注可能会涉及几个不同的概念——而用户可能并不想全盘接受。因此,用户需要就目标定位、期望的问题深度等方面向系统提供反馈。
要实现这一点,最简单的方法是让用户在阅读过程中评估机器生成的任务,但我可以凭经验告诉你:这样做非常难受。更好的做法是在复习时提供反馈。当然,这需要更复杂的系统整合。从长远来看,如果完全按照我的设想,没有必要让用户评估和批准机器生成的任务,因为任务会随每次复习而变化。这是一种全新的概念模型。
在设计这种动态复习时,机器生成的任务虽然必不可少,但并不充分。初步实验表明,大语言模型(LLMs)能够相当可靠地生成已知高质量任务的简单字面变体,从而避免依赖模式匹配的问题。然而我们需要的任务,需要能够逐步深化理解,关联知识,重新让人置身语境。这需要另一套调研方法和开发流程了。
————————
我由衷感谢 Ozzie Kirkby 与我一同探索这个领域,就相关话题进行了富有洞察力的讨论,并对草稿提出了宝贵意见。同时,也要感谢 David Holz 推动我深入思考分类器的相关问题。
————————
[1] 为了阐明观点,我可能过于简化了 Piotr 的看法。我想他大体上会认同我的论述。他可能会(合理地)指出,那些新的联系和更深入的理解实际上是不同的知识单元——因此,实际发生的是一系列相关的学习/记忆阶段对。从系统设计的宏观角度来看,我的观点依然成立:学习和记忆作为一个持续过程是紧密交织的;一个优秀的学习系统应该能够支持这个动态过程。
[2] 这个框架与我上个月在文章中描述的项目迈向可扩展的闪念培养有一些明显的联系。
[3] 这个想法已经酝酿了一段时间;早期相关讨论请参见:
-
从 2022 年夏的助记媒介原型中学到的经验教训 (Oct ‘22)
-
灵活的记忆实践产生流畅的理解 (May ‘23)
-
高亮引导的实践与理解辅助 (Sep ‘23)
-
我们如何学习? (May ‘24)
Andy Matuschak - 自学,间隔重复,以及为什么书本不起作用
原文:Andy Matuschak - Self-Teaching, Spaced Repetition, Why Books Don’t Work (dwarkeshpatel.com)
「他的学习过程是如此认真、仔细且有效,令我感到震惊」
几周前,我坐在 Andy Matuschak 旁边,记录他阅读一本教科书的过程。
虽然我本职工作就是学习,但他那更为认真、仔细且有效的学习过程,令我大吃一惊。
所以,我邀请他一起录制了一段对话,讨论他的学习方法以及一些其他话题:
-
他是如何找出并深究自己的困惑(这比看起来要难得多,需要付出极大的努力和缓慢的节奏)
-
为什么记忆对理解和决策至关重要
-
为何有些人(比如 Tyler Cowen)能在没有专门的笔记或间隔重复系统的情况下,融会贯通如此众多的信息。
-
大语言模型和电子游戏将如何改变教育
-
独立研究者和作家如何赚钱
-
教育中自由与纪律的平衡
-
为什么现在冯 · 诺依曼式的天才出现得越来越少了
-
像苹果这样的万亿美元公司(Andy 曾在那儿负责 iOS 的底层功能)是如何协调万千差异,让数以万计的人共同设计新产品的。
本期节目可以在 YouTube 上观看。你也可以在 Apple Podcasts、Spotify或其他播客平台上听这个节目。如果需要文字版的访谈记录,点这里。关注我的 Twitter,了解更多未来节目的更新。
https://youtu.be/dmeRQN9z504
如果你想看看 Andy 学习的过程,可以看看我们录的他学习量子物理教科书的视频,他在视频里解说他的思考过程,还用他自己的记忆系统原型来吸收学习的内容。
https://youtu.be/OFuu4pesKf0
你也可以去他的个人网站瞧瞧,看看他的个人笔记,或者在 Twitter 上关注他。
Cometeer
访问 cometeer.com/lunar,首次购买你可以享受 20 美元的优惠,享受你一生中最好的咖啡!
如果你想赞助一个节目,可以发邮件给我,我的邮箱是 dwarkesh.sanjay.patel@gmail.com。
时间戳
(00:02:32) - 娴熟的阅读
(00:04:10) - 人们在乎理解吗?
(00:08:32) - 构建有效的自主学习
(00:18:17) - 记忆与遗忘
(00:34:50) - Andy 的记忆练习
(00:41:47) - 智力精力
(00:46:07) - 用于学习的新媒体(视频、游戏、直播)
(01:00:31) - 学校是为中等生设计的
(01:06:52) - 学习本身就是痛苦的吗?
(01:13:37) - Andy 会如何安排他孩子的教育
(01:31:40) - 超文本的用处
(01:43:02) - 计算机工具如何助力迭代过程
(01:52:24) – 公共工作的变现
(02:10:16) - 间隔重复
(02:11:56) - Andy 的个人网站和笔记
(02:14:24) - 在苹果的工作
(02:21:05) - 间隔重复 2
文字记录
(00:02:32) - 娴熟的阅读
Dwarkesh Patel 00:02:32
今天我有幸与 Andy Matuschak 交谈,他是一名研究员、工程师和设计师,致力于研究思想工具。除了这个播客,我们在 Andy 的 YouTube 频道上做了个有趣的合作,我鼓励你们都去看看,我刚刚看到 Andy 试图学习一些新材料。
那只是一章关于量子力学的引言。说实话,我原本以为会看到一些很酷或令人印象深刻的学习技巧,但 Andy 对学习的精细入微和努力程度让我大吃一惊。
他在这本教科书上每页花了 15 分钟。而每当他感到,「我没有完全理解这一点,作者在这里想要表达什么,他在尝试建立一个类比或关系,我并不完全清楚经典力学方程和量子力学方程之间的关系,作者认为它们是相似的。」时,他都会深入挖掘。
我觉得,这种深入学习新材料的方式非常有趣。因此,在这次对话中,我不仅期待与 Andy 讨论这次经历,还有他的其他研究,以及他所开发的其他工具。
我想问你一个问题。这次经历让我觉得你是一个真正关心理解学习材料的人。你认为人们普遍会去关心他们在书本和教材中所接触到的内容的内化和理解吗?如果他们真的关心,难道他们不会花费更多的努力去吸收这些信息吗?
(00:04:10) - 人们在乎理解吗?
Andy Matuschak 00:04:10
这个观点有点过于笼统,难以置评。事实上,绝大多数学生并不愿意这样做,原因可能是他们正在学的东西并不是他们真正关心的,或者即便他们对所学有兴趣,他们往往也无法看到,他们的阅读或正在做的活动,和最初引起他们对该主题兴趣的东西,或者他们真正想做的事情之间的清晰联系。所以总有一种不明朗的感觉。然而,另一方面,你要是看看 reddit 上的帖子,看看人们对园艺设备或各种打结技巧的痴迷程度,就会觉得很惊讶。比如,人们竞相打一个十八世纪的奇特结,还翻看那个时代的年鉴。所以,当人们对一个主题有兴趣,并且这个主题对他们有真正的意义时,他们确实会希望深入理解,并在他们的行为中显示出这一点。
我认为还有另一个相关的问题。要解释这个问题,我得引用 Mortimer Adler 和 Van Doren 的《如何阅读一本书》,这是一本教人深度阅读的好书。他们考虑到有这样一些人,他们的床头总放着一些难度大或要求高的书。这些书更像是他们的期待,比如,「唉,我多希望能读懂《李尔王》。我想成为那种能读懂《李尔王》的人。」于是,他们就把书放在床头,在睡觉前翻阅。他们发现自己在读书的时候会不自主地打瞌睡,他们并没有真正吸收或理解这本书的内容。问题不仅仅在于记忆力,他们甚至无法理解书中的字句。《如何阅读一本书》的作者们认为,这些在读《李尔王》时打瞌睡的人的问题并不是他们不想保持清醒去深入理解那段文字,而在很多情况下,问题在于他们实际上不知道怎么做。他们在面对这堵难以攀爬的墙时束手无策。就像攀岩新手面对只有微妙凹槽的岩壁,他们只能望洋兴叹。对于有经验的攀岩者来说,那些微妙的凹槽就像是梯子,他们能轻松攀爬,开始探索这面岩壁的秘密。但是,对于攀岩新手来说,岩壁就是一面无法逾越的墙。我想说的是,也许这个说法有些乐观过头,你可以对我提出质疑,但我认为阅读者的技巧是可以提高的,而且,在许多情况下,阅读技巧真的能提高你的阅读效果,尤其是当你阅读的内容与你的真实兴趣相符时。
Dwarkesh Patel 00:06:58
嗯,这儿有两种可能性,解释人们为什么没能把他们接触的内容记牢。一种是他们在某个时候明白了,但后来却忘记了。另一种可能是他们一开始就没弄懂,更糟糕的是他们自己也没发觉自己没弄懂。你那种逐段、逐句审读的方法,还有那种「我理解了吗?」的自问自答,让我觉得特别有意思。那可是我前一周试图读懂的东西。有些东西,当你停下来深度思考的时候,我才恍然大悟,「我其实也没明白。」我之前都没注意到我其实没弄懂。你是怎么做到在读的过程中发现自己的困惑的呢?
Andy Matuschak 00:07:36
这其实是一种可以通过训练而得来的习惯。Adler 和 Van Doren 提出,精读,主动阅读的首要规则就是提出问题并寻找答案。如果你深思这一点,我应该提出哪些问题,如何提出它们,作者不在场时,我又该如何去回答这些问题呢?等等问题。[Unclear] 他们同时指出,如果读者不提问,也就无法获得答案,这是对那些读书不求甚解的人的批评。在我养成这种阅读习惯之前,我读过很多书都是这种态度,我经常发现自己落入这种不求甚解的陷阱。问题不在于我记不住内容,而是我往往连自己是在随意翻阅而已都没察觉到。
Dwarkesh Patel 00:08:27
读到一章的半截,你会突然意识到自己其实不太清楚这章在讲什么。
(00:08:32) - 构建有效的自主学习
我有个更深层次的问题——现在我们手头有各种在线资源,其中一些还得益于你的参与,比如可汗学院。看来,责任心这一品质的重要性显著增加了。只要你能鞭策自己去学习,世界就在那里等你去探索。那么,哪些设计,用户界面,甚至内容的调整能帮助我们提升这种责任心呢?过去,我们可以依赖教授,同学,还有实际的截止日期来推动自己。那么之于责任心,有没有什么类似纸笔之于数学智商的提升方法呢?
Andy Matuschak 00:09:13
嗯,教育心理学有一个经久不衰的结论,那就是当你在进行大量的认知活动时,元认知就显得困难重重。我的意思是,当你对书页上的内容殚精竭虑时,你就很难去做计划,去自我调整,去弄清楚下一步最好的行动是什么,以及去反思和评估你是否真正理解了这些知识。随着学习材料的难度增加和熟悉度降低,这一切都会变得更为困难。因此,在学习科学的领域里,我们经常会把元认知工作外包出去。我们常用的外包方式,包括有人为你提供一份教学大纲,告诉你什么时候应该阅读哪些内容,然后你参考这个大纲来学习。这就是一个用户界面,是一个设计实践。如果你是一名有内驱力的学生,你可以做的一件事,也是我曾经做过的,就是去找一份与你正在阅读的文本相对应的研究生课程大纲,这可能是一个很好的指南,能告诉你哪些是最重要的,以及如何去处理这些内容。
此外,还有很多元认知工作可以直接嵌入到界面中。比如说,在我和 Michael Nielsen 一起开发的一本名为《量子国度》的教科书中,我们为了探索一些围绕增强阅读体验的想法,每 1500 字左右就插入一些复习问题。我们主要的动机是帮助人们记住他们读过的内容。我们有个理论,那就是学习一个复杂主题的难点在于,你需要同时处理大量的新定义、记号、术语和事物,而你还对它们一无所知。你需要不断地回忆这些元素,但却发现自己在这个过程中挣扎,要么是耗费大量时间,要么是成功率很低。
这就是我们的初衷,但同时我们发现,这也带来了一种极其重要的元认知效益。当你在阅读 1500 字后被问到这些问题,你有机会发现,你其实并没有真正吸收那些内容。不是你记不住,而是你根本没有注意到问题中的某个关键词。所以,这不仅能够给你反馈,告诉你可能需要重新阅读那个特定的部分,而且可能会改变你对未来部分的态度。在采访中,读者告诉我们,当他们看到第一组问题,或者遇到一组特别难的问题时,他们会慢下来,更专注地去阅读,或者真正意识到他们的阅读习惯其实并不高效。正如你在对话开始时提到的那样。对于伴随文本的问题,已经有一堆研究了,它们产生了各种影响。这些问题对未来的学习材料有影响,也会让你反思你刚刚学到的东西。除了这些问题,你可能会发现自己在思考,「我被问到这个,但为什么这很重要?」
Dwarkesh Patel 00:12:38
确实,你提到了借用别人的教学大纲。假如你是个自学者,你可能会遇到这样的困扰:你有学习目标,有学习动机,但你又会开始疑虑,「我真的需要理解这一章的内容吗?这些知识点真的对我有用吗?」此时,你所做的就是那些你原本希望通过借用教学大纲来避免的元认知思考。
Andy Matuschak 00:12:56
没错。
Dwarkesh Patel 00:13:00
如果你在自学,而且有个资源很接近你所期望的教学大纲,你应该怎么做呢?是只是心想,「我不知道为何需要这一章,但我还是照着读下去吧」,还是应该听从自己的判断?
Andy Matuschak 00:13:13
学习中总会碰到这个经典问题。当你开始某个领域的初步学习时,你得把「需要掌握哪些知识」这个问题外包出去。比如,你想打造一个能根据描述生成图片的模型,就像 Midjourney 一样,但你对需要学什么一无所知。这时候,你就得翻阅一些机器学习的教材。把这个问题外包给作者来解答:要构建这样的东西,需要掌握哪些知识呢?或许你能找到一本标签是「制作图像生成模型,你需要知道什么」的书。但不管怎样,问题的答案还是来自作者。
你可以把这个答案当作起点,暂时接受它,然后不断迭代、修改。随着你技术的提高,你可以逐渐减少对这类答案的依赖。我觉得,一个很普遍的错误就是人们总觉得自己需要按照标准做法来,而且要做到全面、彻底。如果他们因为找不到想要的知识,感到无聊或者缺乏动力,却又坚信着「只要按照作者的说法做,一切都会好起来的」,结果,他们就会因为这个原因停滞不前,然后就放弃了。这样其实并不好。他们本应按照自己的兴趣随意跳跃,继续下去。
另外我要说的一点是,这些教学大纲的作用就像是脚手架。这个概念来源于学习科学,但它跟我们熟悉的事物有关。如果你想爬到一个建筑物的更高处,你可能自己爬不上去,但你可以围绕它搭建一些脚手架,然后你就能够到达顶层或者建筑物的顶端。脚手架在教育中无所不在。我们先给你简单的问题,这就是一种脚手架。我们先为你解答部分答案,这也是一种脚手架。我们先给你一些解决问题的例子,然后可能会让你预测下一步的工作示例。这也是一种脚手架。但是随着你能力的提高,我们会尽量移除这些脚手架,这个过程叫做「淡出」。一旦你解决了很多微积分问题,你就不需要部分解答,只需填补其中的空白了。实际上,这样做并不能有效地提高学习效率。
如果我在学习计算机科学的内容,这是我非常熟悉的一个领域,我不需要那些教学大纲,至少大多数科目我是不需要的。我想这主要是因为这个科目对我认知的需求远低于其他科目。我已经熟悉了它的大部分内容,所以我可以更有效地部署自己的计划。但是因为我对这个科目了解得太多,我一开始就可以制定出更好的计划。因为制定计划需要模拟一条路径,预测一条路径,或者说,「嗯,我猜我需要看看这个是如何与那个连接的,或者类似的。」如果你的目的地和起点距离很远,那么你可能无法看到中间的所有东西,或者如何划清楚这些线条。但是,如果这些事情只是一两步之遥,你就能很准确地推断出来。
Dwarkesh Patel 00:17:02
明白了。这可能意味着,如果你想学习某个课题,参加一门《XX 导论》课程或者读一本入门教材可能对你大有裨益。这并不是因为它们直接能帮你解决实际问题,而是因为它们能为你的后续学习提供必要的背景和语境。
Andy Matuschak 00:17:25
你说得对。再有就是,你可能还不清楚自己需要学习的所有内容。这是我们为何需要外包的另一个核心原因。比如,非学校教育就存在这样一个基本的冲突,就是让孩子们去追求他们自己感兴趣的事物。这个主意很好,也有很多优点。但比如,如果一个孩子真正热爱的是海洋地质学,然而他们却生活在一个内陆国家,周围的人从来不会谈论海洋地质学,那他们就可能错过一些难得的机会。然而,如果学校能有一个项目,可以邀请嘉宾来做讲座,然后有个专家来给孩子们开一堂海洋地质学的特别课程,这种课程也许在孩子们原本的选择中并不存在,但这绝对是好事,因为这有可能会引发孩子们对世界的新的兴趣。
Dwarkesh Patel 00:18:13
对啊。实际上,和你谈谈非学校教育这个主题还挺有意思的。
(00:18:17) – 记忆与遗忘
在此之前,我想谈谈一段摘自 Paul Graham 博客帖子《你如何认知》的文字,「阅读和经验会塑造你对世界的看法。纵然你忘记了经历过的事或读过的东西,但它们对你世界观的影响却永远存在。你的思维就像一段丢失了源码的编译程序,它能运转,但你并不清楚原理。」这就像一段编译后的程序,源码并非必需。我们读过的很多内容都已经遗忘,这样也没问题吗?
Andy Matuschak 00:18:45
他说的在一定程度上是有道理的,至于这个程度是否足够,取决于具体情况和你的需求。如果你的目标真的需要深入、详细地理解一些材料,那么一本书在你的世界观或习惯反应上留下的烙印可能就不够了。反之,如果你想接触更多的看世界的方式,那么对这些方式的细节并非必要了解。可能你只关心孔子如何强调社区和社会作为道德主体,这与许多人文主义哲学家的个人主义形成鲜明的对比。如果你觉得这个层次就足以在这个领域做决策,那么就没问题了。
说到实际应用,他提到的「编译」一词颇有趣,因为我们认知和学习的一个重要理论,就是由 John Anderson 提出的 ACT-R 理论。它的关键部分就是所谓的「知识编译」过程,也就是我们如何将个别事实转化为可以在更广泛的环境中推广和应用的高阶模式。我想,这正是 Paul 想表达的。通过阅读包含故事或案例研究的书籍,你学会了在一定程度上泛化,并在看起来相关的其他环境中应用它。
我之所以提到 Anderson 的理论,是因为他对知识编译发生的条件,以及你在完成一定程度的知识编译后能做什么,都有一些具体的看法。我想他可能会对此回应说——实际上,为了有效地将你学到的东西编译成能适应未来场景的模式,你需要反复接触这些东西,需要亲身实践,需要做各种能让你的大脑认识到这些东西组合起来使用的重要性的事情。光是阅读可能无法实现这一点。但是,如果你阅读的同时,还进行了许多的对话,并处于一个需要你运用所读内容的环境中,那么你可能就会自然地进行这样的「编译」步骤。
Dwarkesh Patel 00:21:21
其实在准备和你交谈的过程中,我一直在思考这个问题。我有幸和各个领域的一些极富深度的人士有过交谈。当我回顾这些过去的对话时,我发现在我对他们进行采访和做准备的时候,我对于背景的了解其实比现在能记住的要多。有时我会重听之前的谈话,结果发现自己甚至记不清对话内容了。我记得在对话结束之后,我对这个领域的了解比这一小时的访谈能展示出的要深入得多,对吧?我得做一些可能会出现的其他话题的准备。然后我就会想,「我甚至连这一个小时谈论的内容都记不清了。」不过,另一方面我又在想,「嗯,我的播客技术确实在进步」,这可能意味着我已经学到了一些东西。但是,我在这段时间内没有进行严格的学习以持续记住我学到的内容,这实在是有点可惜。
Andy Matuschak 00:22:11
嗯,我猜你所说的进步,其主要的 [unclear] 其实并不完全在于这些材料的细节。我觉得这和你作为采访者的技巧有关,比如你提问的方式。或许你有很多模式,可能你自己都没有意识到。你读别人写的东西,希望能够提出一些好问题。尽管你或许还没有养成对教科书不断提问的习惯,但你已经开始对你要采访的有趣人物的文章或博客这样做了。借用 Anderson 的理论,你在反复做这个过程中,某些部分已经自动化了,你不需要有意识地去做,可以更专注于内容,或许能处理更难的内容,或者在更高层次上理解内容,因为你少了「如何从内容中提炼问题」的困扰。
Dwarkesh Patel 00:23:16
我倒是希望如此。否则,我都得好好反思我这些年到底在做什么。
我采访过一些信息饕餮,他们摄取了大量内容,而且一直在摄取新内容,但他们却没有记笔记的习惯。
你在笔记中也提到并指出了这一点。比如,Tyler Cowen,我不觉得他有任何记笔记的习惯。他只是痴迷于吞噬信息。那你认为这些人是如何融汇贯通他们所阅读的东西的呢?
Andy Matuschak 00:23:47
Tyler 是个很好的例子。我觉得他比我们可能会谈到的其他人稍微容易理解些。所以,我们先来谈谈 Tyler。让 Tyler 特别吸引人的另一件事,是他对写作的义务感。他从 2007 年或者更早开始,每天都在写博客,每周都要为彭博新闻社写一篇大约 1500 字的专栏,而且在过去十年或更久的时间里,他基本上每年都会出版一本书,偶尔还会发表一些学术文章,再加上其他一些附带的作品。这些都算是笔记。我认为,我们也应该注意到,Tyler 写这些博客、专栏甚至书籍的方式,与许多其他的书籍作者的工作方式截然不同。Tyler 的博客文章往往具有一种真实的初稿感。他就是在大声思考,他已经有了几十年的思考出声和第一次就能写出不错观点的经验。所以,他在大部分时间里,第一次就能写出相当好的东西。这对他来说很管用。所以,这就是笔记,对吗?你对某个主题的最初想法,就是你会在笔记中写下的内容。
Dwarkesh Patel 00:25:04
我之前采访的嘉宾之一,Scott Young,对 Bryan Kaplan 和 Tyler Cowen 的书作了一番对比,他说,读 Kaplan 的书就像下一盘棋。如果你试图在教育这个问题上挪动一只小兵,我可以在这里移动一只车。(意译:如果你在教育议题上提出一点观点,他能马上反驳你。)而 Cowen 的书,就像随便聊聊某个主题。
Andy Matuschak 00:25:23
Dwarkesh Patel 00:25:24
对对,就是这样。再换个话题,大语言模型(LLMs)是提高了记忆的价值,还是降低了呢?你可以找出支持两种观点的理由。但总的来说,既然 GPT-4 已经出来了,我们是不是应该在 Anki 卡片库里添加更多的卡片呢?
Andy Matuschak 00:25:38
可能现在正好谈谈记忆是什么,或者说记忆的作用是什么。我们可以理解记忆为一种学习更多琐事的做法。举个例子,我和一些朋友读过一本叫 Cell Biology by the Numbers 的书,书中有很多像这样的问题:一个核苷酸究竟有多大?占用多少体积?知道它的体积大约是纳升在你建模时偶尔会有帮助。这些东西,你都可以记下来,这是一种记忆。我们可以讨论大语言模型(LLM)会如何影响这种记忆。但我想强调的是,你每天做的许多事情和你经历的许多事情,在很大程度上都受到记忆的束缚,或者说是记忆在重要的方面产生影响。比如,你理解一个复杂论点的能力,哪怕只是在读一篇文章的过程中,都受到记忆的限制。这部分是工作记忆。但你理解一个包含许多步骤的论点的能力,这些步骤超出了你的工作记忆能力,取决于你能否将其中的一些步骤与你已经知道的事物联系起来,从而简化或抽象它们。
同样,在创新工作中,有很多研究试图找出人们如何灵光一闪的例子。这有点难以描述,但有个相当一致的灵感来源,就是注意到一个出乎意料的联系或矛盾。这可能会感觉很熟悉,对吧?你在读报纸时,看到人们终于找出了如何做某件事情 X,你就会想,「等等,如果我把它和另一件事 Y 结合起来,我们就能做出其他的事情!」但是,只有当另一件事在你的记忆中,这个想法才可能实现。如果你必须去查找那件事,那么报纸对你就不那么有意义了。
在我初入可汗学院时,我利用记忆系统深入了解了教育市场的许多细节。这使我能够参与到高层的决策讨论中去,我们在试图找出策略时,有人提出一个特定的方向,我就可以说,「教学材料的总预算是多少,那个市场每年增长多少,美国有 10% 的学生在这个地方」等等。基本上,我可以即时对想法进行评估,这是其他人做不到的。总的来说,这和其他一些事情都是我在抱怨人们普遍低估记忆在我们生活中的作用的一部分。
所以,回到问题,关于显式记忆,或者说确保你能可靠地回忆起某件事。我们可以用这些事情来检验。比如对于创新直觉的情况,例如,注意到矛盾,注意到联系,我想我们将会有未来的笔记本能够帮助我们注意到这些,这样就能减少我们依赖自己的敏锐度。但我不知道会降低多少。我自己有时会产生一些奇特的点子,感觉非常新鲜,它给我一种非常个人化的感觉,感觉很 [unclear]。我通常无法清楚地描述这个事物的组成部分。只是有一种感觉,这个大致方向的东西与那个大致方向的东西有关,或者有一种张力。这让我有点犹豫。大语言模型依赖我们能否将事物表达出来,使其能被读懂。回到记忆在学习中的角色。如果你试图理解一些相当困难的东西,你理解那个东西的能力仍然完全依赖于你对那个东西构成材料的记忆。
Dwarkesh Patel 00:29:51
你是否认为遗忘在教学上也具有一定的价值?有一些轶闻或者不相关的证据显示,在神经网络中,通过修剪一部分权重有时可以提高表现。显然,我们总会有所遗忘,记不住所有事物。当我们在睡觉的时候,许多记忆也会消逝。那么,是不是有可能,通过不去深究细节,只抓住要点,反而能帮助我们更好地从文本等地方总结出有价值的见解呢?你对这种思维方式有何看法?
Andy Matuschak 00:30:22
嗯,有可能。记忆与注意力是密切相关的。我们不可能关注所有的事物。记忆的一个作用就是帮助我们将注意力导向重要的事物。比如,我可能知道电子伏特的量级和能量,这是因为我用记忆系统,但我也不希望这件事一直占据我的脑海。我不希望它像我要记住的某些重要设计原则那样突出。所以,遗忘在这里肯定有其作用。还有一些理论认为,我们之所以会遗忘,是因为我们所处的环境或者祖先的环境具有很大的变动性。所以我们希望我们的情景记忆可能不要那么准确。但我其实并不太了解这些理论的最新研究成果。
Dwarkesh Patel 00:31:10
也许这就是我们会忘记梦境的原因,对吧?梦境通常很混乱。如果你把它们想象成和真实生活一样的体验的话。
Andy Matuschak 00:31:17
没错。关于记忆,还有一个奇怪的地方是,据我们目前的了解,记忆并不是真的完全消失,至少不完全是。有一系列有趣的实验显示,即使是几十年后,那些记忆依然存在。只要你找到正确的线索,人们就能够重新找回那些他们以为已经丢失的记忆。当然,你也可以通过特定的方式让人产生错觉,所以这个实验要非常谨慎。我提这个问题的原因是,它与我们普遍认为的「记忆有限」这个观点相左。
我对这个记忆系统,或者说记忆大师们,有点困惑的是:「如果你使用这些技巧,你会开始忘记其他正常人会记住的东西吗?」但奇怪的是,答案是否定的。我已经使用这个记忆系统好几年了,现在我知道的事情更多了。这和实验研究的结果一致,那些研究似乎表明,尽管记忆可能存在上限,但我们离那个上限还远得很。一些记忆大师们记住的事情比我多了一两个数量级。当然,那些会说多种语言的人记住的东西数量就更多了。所以,记忆并不是一个我们需要考虑如何管理资源的问题。
Dwarkesh Patel 00:32:39
如果我们的记忆力并没有上限,那为什么我们会忘记这么多事情呢?大脑遗忘我们碰到的一些事情是出于什么原因呢?或许是因为我们的祖先在一个需要寻找显著事物的环境中生存,而这些事物并不直接和书本学习有关?
Andy Matuschak 00:32:56
这个问题很好。现在我们讨论的这部分认知科学,我并不是非常了解,我猜想我们对此也没有深入的理解。但我可以试着给出一些想法。我们知道的一种现象叫做「扩散激活」。当你试图查找某样东西,或者处理某个特定的情境时,就像在网络中进行 DNS 交换或者路径寻找一样,我们从一个刺激点出发,然后从那里向外扩散,这些联系之间就像是有一些权重一样。通过调整这些权重,我们就能更有效地在网络中发送数据包。至少一部分记忆是在这些权重中编码的。如果你不会忘记事情,那么你可能在网络中遇到奇怪的混乱,特别是在考虑什么是重要的,接下来要做什么,对这个问题的哪个答案最适合。因为你的注意力被吸引到了那些并不太相关的事情上。有一种理论称为「预测效用理论」,它提出,在特定情况下,能够提取某个项目的概率实际上与大脑预测这将有多大用处的模型相符。
Dwarkesh Patel 00:34:28
对,然后这个预测并不一定…
Andy Matuschak 00:34:34
预测并不一定准确。因此,当你反复接触某样东西,或者练习回忆它,对这样东西的有用性的预测就会提高。而且,当你在各种情况下都这么做的时候,这种提高就会在更广泛的情况下发生。
(00:34:50) – Andy 的记忆练习
Dwarkesh Patel 00:34:50
好,这话题很吸引人。你什么时候开始对记忆进行专门的训练?我猜是在你离开苹果公司之后吧?
Andy Matuschak 00:34:54
对。
Dwarkesh Patel 00:34:55
那我想问你,你在苹果公司负责一些 iOS 的旗舰功能,我估计还有其他一些事务。我想可能那时你并没有某种形式的记忆训练,但你每天面对这些问题,这种日复一日的经验,以及问题出现的频率,让你对这些问题有了深入的理解。那么,相较于现在,你通过自己的记忆训练获得的理解,你以前对这些问题的理解是否较差?我不知道我这样问是否清晰。
Andy Matuschak 00:35:25
不,你这个问题问得好,确实有意思。让我告诉你个有趣的事实,我在苹果时做的工作,其实比我现在的工作做得更出色,这听起来可能有些好笑,毕竟这两份工作完全是两回事。我们来深挖一下,这个话题对我来说是非常有趣的。我在苹果的大部分时间都在做工程,虽然有些部分非常困难,但总的来说主要还是工程性质的工作,主要涉及的是一些比较清晰、已知的问题。我并不是总在决定应该做什么,当然,从技术角度来看,我有时会做出决定,但从产品角度来看,我几乎不需要回答这个问题。我是一个有一定设计思维的工程师,我主要是按照既定的任务去完成一些涉及工程和设计的工作。当我加入苹果的时候,我已经有长达 13 年左右的编程经验,而在苹果的生态系统中编程的时间大概占了这段时间的二分之一到三分之二。所以我对这一切都非常熟悉。每天,我都沉浸在这个环境中,我知道我需要掌握的知识,我已经很熟练了。而且,我的工作内容并没有太大的变化。在苹果的大多数工程师,大部分时间并没有在推动技术的最前沿,或者说尝试去发现新的东西,他们主要是在做一些技术难度很大的工作,大部分是将他们已经非常了解和掌握的东西应用到一些基本可以理解的问题上。记忆对我来说是非常重要的,但到我进入苹果时,我已经积累了大量的知识。我为苹果的平台开发了很多东西。我学习了很多东西,了解了那些系统的内部运作。但因为我已经对苹果的平台以及计算机科学和工程有了丰富的理解,我有了一个非常丰富的知识网络,新学的东西很容易就能融入进来。有一条很好的原则就是,如果你已经有了其他的知识,学习新的东西就会变得更容易。因为是别人在决定我们应该做什么,所以我的元认知负担相对较轻。而现在,我在进行研究,我试图发现未知的事物,我试图创造新的东西。我面临的困难问题主要是:我应该做什么?这个问题并不仅仅是一个技术问题,例如我应该如何实现这个需要建立的功能,而是我应该对读者做出何种干预?这需要我综合各种我并不熟悉的文献。
Dwarkesh Patel 00:38:10
我有两个主线想要深入探讨,先提一下其中一个。这个也和我们几分钟前谈到的大语言模型有关,那就是 Swanson 的关联法。Swanson 是一个研读医学文献的人,他对许多深奥的研究成果了如指掌。当不同的情况出现时,他就能识别出哪些事物是相互联系的。比如,他在一种情况下发现头痛与其他某种症状相连,而那种症状又与镁的缺乏有关。结果发现,只要给这些人服用镁补充剂,一大批人的头痛问题就迎刃而解了。这种情况你通常不会注意到,但它又是那种你偶然间可能发现的组合关系。
再来聊聊另一件事,就是你在苹果的所有事务中自然而然地掌握了进展的速度。这种方式在其他领域中,比如说,当你试图从书籍中获取知识时,不去实行一个明确的间隔重复系统,只是阅读一堆书籍,期待有些相关的东西会自然而然地出现,这种做法在其他领域也可能行得通,甚至可能带来更大的优势吗?或者,明确设置记忆卡片这样的练习方式,又有什么特别的价值呢?
Andy Matuschak 00:39:30
那当然,具体情况具体分析。你提到的最贴切的例子可能就是沉浸式语言学习了。沉浸式学习绝对是个好方法,比起间隔重复学习,它更吸引人,效果也更显著。它能整合信息,还具有社交性。所以,社交学习的种种优势也是不能忽视的。但问题是,比如说你今天心血来潮,想学斯瓦希里语,于是你就兴冲冲地跑去当地的斯瓦希里语社区中心,你心里想,「好,我开始沉浸式学习吧。」但祝你好运,你可能连个起步都困难。所以从这个角度看,明确的练习其实就是你自我启动的踏板。我在大学时期认识的最擅长视奏的钢琴家都是在教堂里弹琴的。他们之所以擅长视奏,是因为他们每个星期天都要出现在那儿,每次都要弹奏不同的曲目,每个星期都有新的赞美诗。这其实也是一种沉浸式学习。随着时间的推移,他们就学习到了所有这些常见的和弦进行等等。但如果你一开始就没有一定的基础,你是没办法做到每个星期天都去教堂弹琴的。这其实是个自我启动的论点。明确的练习有一个重要的作用,就是能帮你建立起一个可以自然强化的基础。但是,也有些情况下,自然强化是无法奏效的。例如,你刚刚提到的链接问题,医生们常常需要面对的一个难题就是罕见病的诊断。如果你每隔几年才会遇到一个病人,他的症状才会出现,那就不足以自然强化你对这个病症的记忆。你需要一种超出常规的机制。而不幸的是,我认为,对于很多类型的创新飞跃和洞见,可能更接近我们所处的这种状态。
Dwarkesh Patel 00:41:30
是的,你说得非常对。在很多领域,你需要不断重复的事情,就是你需要强化的部分。如果你是一名研究员,那么可能会遇到的长尾事件,可能每隔几个月才会发生一次,但是规律性并不是决定性的因素,对吧?这对你的工作 [unclear]。
(00:41:47) – 智力精力
这是我有的一个疑问。当我们研读量子力学教材时,持续了大约三个小时,我累得几乎爬不起来。你竟能连续三小时不间断的学习,这让我感到非常惊讶。在我打包东西的时候,你说:「嘿,我要去上钢琴课了。」我实在是搞不懂你怎么能有这种持久的精力。这种精力是你天生就有的吗?还是你后天培养出来的?
Andy Matuschak 00:42:19
我觉得关于精力这个问题,有个挺有趣的点,首先,我们总觉得别人的精力好像总比自己的充沛,我常常觉得我自己的精力很有限,对于精力的管理我也挣扎很久。我写过很多关于我与精力抗争的经历和管理精力的方法。我花了大量的时间思考这个问题,设法管理我的精力,将我的日常生活按照精力的消耗和恢复进行安排。所以我觉得可能常常会有人觉得自己的精力比实际要弱,因为他们误判了别人的精力。好吧,就那个具体的情况来说,我如何解释为什么我能坚持学习三个小时。首先,社交因素。如果我独自学习那本书三个小时,而不是在你面前,我不会有那么大的动力。我肯定会休息。但我想我仍然能坚持三个小时。其中一个原因就是这比我通常做的事情要简单得多。
在某种程度上,学习量子力学应该更难,并且在很多方面也确实需要更多的认知能力。它比我日常的工作在认知方面需要更多。但在 William James 所说的 Energies of Men 上,它的要求却少得多,这种精力有点像生命的力量,允许你按照自己的意愿行动,或者类似的东西。可能是决心,可能是意志力,也有人称之为 [unclear],这些都不完全一样。但坐着盯着一页纸,想下一步在研究项目中应该做什么,这会极大地消耗那种精力。我工作中最难的就是坐着不知所措。「太棒了,能有人告诉我该做什么,真不错」,真是美好的假期。
Dwarkesh Patel 00:44:20
所以,虽然这可能比我们平时的工作要求低,但肯定比我或者大多数人处理教科书或其他材料的方式要求更高。通常,我会先通读一遍,然后等到做习题的时候,我会「检查下自己有哪些没弄懂」。而你一字一句地解析,精神紧绷,让我觉得这种方法更令人疲惫。
Andy Matuschak 00:44:47
嗯,你说的也在理。确实有时候我会在临睡前再读一点,想着「多读点儿。」,但其实这种阅读几乎毫无成效。不过,我想说的是,你可以找到一种平衡,可能你可以称之为「心流」,你的精力投入与你的能力相匹配,你不会被书籍淹没,你感觉自己能够消化掉它,这其实更能吸引人。有时我会发现自己在阅读时不那么专注,因为我并没有对文字产生太大的情感联结,我更像是在尽职尽责地读书,好像是要完成一个任务。这有时会产生一种对抗感,觉得文字是我的阻碍,或者说阅读是一项要完成的任务。通常我会发现,如果我真的投入我的好奇心和注意力,全身心地投入到书中,我所需要的毅力实际上比我硬挺着不停地翻页所需要的还要少。
(00:46:07) - 用于学习的新媒体(视频、游戏、直播)
Dwarkesh Patel 00:46:07
现在人们有许多教育工具的新奇想法,这些工具都是通过媒体,让读者产生更深的联系。有的是通过一段虚构的故事来引入和强化某个概念,有的则是设计出一款有我们心爱角色的视频游戏。可尽我所知,还没有什么能真正利用这些新媒体大放异彩的产品。你觉得是什么原因呢?是因为除了文字和演讲外,其他方式本身就有限制,还是人们还没找到正确的内容和设计?
Andy Matuschak 00:46:40
这个问题我也非常好奇。我想,我可以从几个方面来说说。首先,我觉得有一种媒介已经在人们中间取得了巨大的成功,那就是视频。人们都喜欢看视频。人们愿意花一小时看 Grant Sanderson 解释一道深奥的数学问题,这些人可能平时连斯普林格出版社的研究生数学教材都懒得翻看。问题在于,他们在这次互动中可能没能获得多少理解,但他们的参与度却很高。这很酷。它让我们思考,是否有一种方式,既能吸引人们的注意力,又能帮助他们真正理解知识?也许,一种可能的方式就是游戏。我最喜欢的例子就是 Jonathan Blow 的《The Witness》。你玩过《The Witness》吗?
Dwarkesh Patel 00:47:32
没。
Andy Matuschak 00:47:34
我觉得《The Witness》是一款绝对了不起的艺术作品。这是一款没有任何相关文字的游戏,它仿佛回到了经典的《Myst》风格,你在一个岛上醒来,然后慢慢摸索出了整个情况。游戏通过塑造你周围的环境,而非用文字,向你展示了这个世界里一套相当复杂的规则。你在游戏中学到了很多东西,感觉就像你正在跟游戏设计者进行对话。你会感觉,「他在这里想让我做这个。」其实,没人真正叫你做什么,因为游戏里没有文字,但你能感受到你正在被引导。你在环境中进行了一些互动,你觉得你回应了游戏的挑战。这真的非常有趣。它就像是一种行动的媒介。有些人试图制作教育游戏,游戏明确地围绕算术或其他内容,但 Jonathan Blow 的游戏并非如此。你在游戏中学习是环境的机制。我觉得还没人真正成功地用这种方式针对具体主题。例如,《坎巴拉太空计划》等游戏,也许人们可以从中学到一些关于项目管理或轨道力学的东西。Zachtronics 有一些游戏主要围绕汇编语言。或许你能从中学到一些东西。问题在于,游戏最终是一种审美形式。
游戏的目的是提供一种特定的体验感。所以,它们的目标和 Grant 的视频或一本书不同。Grant 的视频和书籍也有不同的目标。你可能拿起一本书,因为你想,「我想学习做机器人。」所以你就去看一本机器人学教材。那么,有没有一种你可以拿起来的东西,像游戏那样,它是一个活动的环境,你可以在像「我想学习做机器人」这样的情况下使用?可能有吧?但我们现在还没有完全掌握这种方式。我们有一些接近的东西。不知你是否听过《Nand to Tetris》。这是一个非常有趣的项目,走的是这个路线。它的特点是,像游戏一样,都是行动,都是主动的。所以当我对书籍进行提问的时候,那是主动学习,主动阅读,《Nand to Tetris》也是主动的。这是一个课程,你从几乎一无所有开始,有了内存,然后你建立一个虚拟计算机,编程制作 Tetris 游戏。你搭建一个处理器等等。整个过程你都在动手,都在让计算机成长。这和我对书籍提问的行为有些相似,只不过你不需要自己去掌控所有这一切。选择哪个活动要做,是由课程,由学习材料的结构来决定的。我觉得这样一种能在很多很多情况下使用的大众媒体,还有待我们去创造,而我们已经有了非大众媒体版本的这种形式,那就是学徒制。你如果想成为优秀的瑜伽教练,你就去瑜伽工作室里。如果你想成为优秀的冲浪者,你就在其他冲浪者在的时候去海滩,你加入他们,和他们交谈,学习他们的技巧。他们可能会给你一些反馈,你会逐渐从边缘参与者变为社区的一部分。但这并不是大众媒体。我们不能像书那样印出十亿份。
Dwarkesh Patel 00:51:26
看 George Hotz 在直播中一行行编写 tiny grad,那是怎样的一种体验?跟他一起在办公室里工作又有何区别?毕竟你在办公室里,他的时间和互动都是有限的。视频为何不能把学徒制扩展开来呢?
Andy Matuschak 00:51:47
我其实对直播作为这种方式的载体很感兴趣。我们在探讨的是一种特殊的学习过程,这通常被称为「默会知识」。作为一个工程师,你需要学会应对成千上万种奇怪的情况,比如某个东西行为不正常。你最终会学会从中找出规律,学会应对。这些往往都是书本上没有的,没人明确地教你,而是你自己在长期的实践中学到的。我想,人们从看 George 的直播中,确实能学到些什么。这就是学徒制中的学习方式。但还有一些东西是缺失的。你不能得到反馈。有很多废话,有很多可能并不那么有意义的东西。学徒制也是这样。我对直播视频真的很看好。我一直在呼吁,希望有更多设计师能参与直播。
我觉得有个很有趣的点是,我们有一些领域,比如编程,有很多教人如何学习编程的书和课程。但它们并不能提供你所有所需的东西。有一些东西,需要你自己去摸索。如果你参加这些课程,比如你完成了 MIT 的计算机科学公开课,你可以做一些事情,能提升自己。但这并不适用于所有的领域。设计,以及其他很多领域就是例子,比如音乐创作,建筑设计等。不行。它们通常需要在实战课堂中完成,大量的实战反馈。反馈往往会因地制宜,会考虑具体环境。我们还没找到好的方法来传达这一切。我很高兴看到很多程序员在做直播,但我更希望看到其他领域的人也这么做。
Dwarkesh Patel 00:53:50
谈到编程教材越来越多的问题,有点讽刺的是,编程资源之所以丰富,原因是编程本身容易理解,这更有助于人们快速掌握。你只需做的就是巩固这种理解。《Nand to Tetris》就像是一种电子游戏式的学习方式,它或许不仅限于编程,也让你了解计算机内部是如何运作的。但是,编程本身就有游戏的感觉。我有个朋友,他的精神状态总是处于一种高度亢奋的状态,他在青少年时期曾对电子游戏上瘾,现在他却会彻夜不眠地投入编程。这其实是大脑中的同一部分在发挥作用。你对于像电子游戏和小说这样的方式,能否像编程一样有效,你持乐观的态度吗?它们并不像编程那样本身就像一个电子游戏。
Andy Matuschak 00:54:36
编程有点儿像玩游戏,这是因为它的反馈非常即时,有种直接操控环境的感觉。你在探索一个概念世界,但这个世界就在你手指下。操作它的时候,你就能立马得到反馈,红色的波浪线,频繁的执行指令,失败后的感觉实在过瘾。对程序员来说,有种特别常见但又充满噩兆的感觉,那就是,晚上九点钟,你整天都在忙活,项目就快要完成了。你知道,只要调试这最后一个环节,你的项目就能告一段落,你就能去做其他的事情了。所以你告诉自己,「我再多待会,搞定这最后一点就行。」然后你开始调试,终于找到问题并解决了,那感觉实在是太棒了。然后,你又遇到了另一个问题,「哦,程序几乎要全程无错地运行了,就快要从头到尾跑通了。」然后你就告诉自己,「我再多待会儿。」结果,转眼就凌晨两点了。你还是继续忙活,因为那感觉太美妙了。你感到自己在向前进,不再是无尽的空白。遇到一道让你感觉像撞墙的编程问题,那感觉就糟糕了。每一个领域都能变得像编程那样,让你有一种向前推进的感觉吗?你可以得到快速的反馈。我认为这很难,我并不确定一些领域是否能如此转化。我认为,大部分情况下,我们都可以比现在做得更接近一些。
设计用户界面的难点在于,常常有种感觉像是在探索各种可能性。编程往往也让人有种在寻找答案的感觉。你总觉得有一种正确的解决方案在那里。可能有一些正确的解决方法,你在寻找它。你有一些经验,指导你,「哦,这可能是一个需要动态规划的问题!」或者这可能需要通过关注点分离来解决。设计往往感觉不太一样,你也有这些经验,也有这些模式,但往往只有种感觉,「不行,我还得试试其他的。」Figma 的主要操作就是复制。你有一个设计板,试了些东西,结果不尽人意,所以你选择它,然后按下复制键。你看到的结果,看到 Design Twitter 上,就是一堆 Figma 的截图,全是设计板。他们就是在尝试。你并没有这种推进的感觉,或者我就没有,我觉得许多设计师也有这样的感觉。你只是在探索可能性,你在了解哪些是行不通的。最后,你可能会偶然找到一个行得通的方法,但你没有这种感觉自己在接近目标。往往有几周的时间你感觉自己离目标并没有更近,因为你正在做的只是缩小可能性的范围。
Dwarkesh Patel 00:58:02
有意思。然而有些人对设计如痴如醉,他们到底是被什么吸引,让他们迷恋于那个看起来并无明显正向反馈感的过程?
Andy Matuschak 00:58:14
我想,在某种程度上,这些人是实有其技,我认识的这类人,他们不仅技艺精湛,而且他们面对的问题大都能够有效解决。举个例子,设计师们常常会深陷于制作海报的工作。Facebook 办公室墙上的海报一度成为笑谈,那里挂满了一幅幅设计精美,复杂细致的海报,它们是为了即将到 Facebook 演讲的某位嘉宾准备的。为什么有人会对此付出大量精力呢?因为制作海报本身就让人不亦乐乎。海报的范围有限,它是短暂的,你开始制作时,虽然有一定的搜索空间,但很快你就能找到一个不错的构思。一旦找到,你就有一种美妙的感觉,就像是在手动转动曲柄,你可以一直优化,润色,试试这个或那个。而当你在试这个或那个的时候,所有的选项都显得还行,你纯粹是出于好奇,或者想看看是否能做得更好而去试验。这种感觉与你纠结于,「我根本不知道该怎么做」的设计问题是截然不同的。我想这也是为什么那些设计师如此热衷于制作海报。这是一种解馋,一种奖励,也是他们能够掌控的东西,而平常他们并不能这样。
Dwarkesh Patel 00:59:48
哈,只要不告诉经理,Facebook 的海报设计把多少软件工程师的时间都烧掉了就行。
Andy Matuschak 00:59:59
其实并没有软件工程师的事。都是设计师的活。但是,对软件工程师来说,代码高尔夫可就是他们的乐子了,对吧?
Dwarkesh Patel 01:00:05
代码高尔夫?
Andy Matuschak 01:00:07
你知道,在高尔夫球中,你要争取得到最低的分数。所以,在代码高尔夫里,你要试图用最简洁的方式解决问题。像,「哼,我不需要这个,我可以把这个合并起来,我可以用三行代码就做到。如果我用 Haskell,我只需要一行代码。」这就是程序员们喜欢玩的。还有就是无尽的重构,也是类似的。你已经搞出了一个东西,但你还觉得它可以更漂亮。
(01:00:31) - 学校是为中等生设计的
Dwarkesh Patel 01:00:31
我明白了。看起来,你开发的这些工具和理念,更多地是为了服务那些极其聪明且充满上进心的学生。如果我们转换一下受众,你又会为那些在教育体系中平均水平的学生设计什么样的工具呢?这涉及到他们的动力以及其他各种特质。
Andy Matuschak 01:00:54
对,那会截然不同。我退出这种教育领域的一部分原因,就是我不喜欢这种问题的设定方式。对于那些处于平均水平的学生,教育系统似乎更多地是希望他们去做他们不愿意做的事情。它并不是为了帮助他们更简单或者更有效地完成他们的目标。大部分情况下,这些目标甚至并不是他们自己的。这并非一成不变的事实,但对于平均水平的学生,这却是大多数时候的情况。我在可汗学院的时候,就曾思考过这个问题。在那里,我们关注的并不仅仅是那些平均水平的学习者,甚至可能关注的是那些处于低水平的 25% 的学习者。对我来说,最重要的一个观点,也许并不是从效率的角度,而是希望他们能够突破自我,追求那些并非他们自己的目标,就是要强调探究性学习,把学习过程转变成真正与他们的目标相关的体验。我们要提出真正有趣的问题,让他们真正愿意去回答,并让他们以自然的方式参与其中。我们曾做过很多动态媒体和事物表现形式的实验。其中的想法就是,你可能见过那些像塑料积木之类的,可以让孩子在玩的过程中理解数字和数字系统。孩子们会因为乐趣而自发地去玩这些东西。摆弄这些东西就是一种享受。操作它们就是一种乐趣。当你手中拿着这些东西时,就很自然地会产生一种想法,「嗯,你能否组合出这样的图案?为什么你似乎无法构成那样的图案?原因又是什么呢?」
Cuisenaire 棒是一种教学玩具,包含 10 根长短不同、颜色各异的棒子,长度由 1 至 10。你可以拿起代表 8 的棒子,旁边再放两根代表 4 的棒子,这样可以生动地展示出 8 可以分为两个 4。然而,如果你选的是代表 7 的棒子,就无法找出另两根同色的棒子来配。通过这种方式进行尝试和讨论,你会不自觉地发现各种有趣的模式。
我们想要探索的问题是,有没有类似的方式能够讲解更高级的课题?我们能否创造出类似的工具,用于探讨数学中的高级主题,或者关于历史争议的问题?我们采取的策略就是大力推动社交互动。人们喜欢与他人探讨问题,只要这是一场真诚的对话。就像我学习量子力学文本时,因为你在我身边,所以需要的意志力就更少,一个在同伴间进行真实活动的学生同样要用的意志力更少。如果你能恰当地组织学习环境,他们也能从同伴中学习到知识。这样的社会化学习变得十分有趣。不过,从更高的角度来看,我其实已经把这个问题交给了别人去研究。教育领域的大部分人,这可能有些夸大,但至少 90% 的人都在关注学习能力处于最低 25% 的学生,而非中等水平的学生。这是有原因的。很多教育工作者的动力源自对公平和机会的追求。他们希望所有人都能拥有他们曾经的机会。他们深感不公平,因为他们看到了人们在获取机会和支持上的差异。他们为那些处于最低 25% 的学生所面临的现实困难感到深深关切。同时,他们认为对这部分学生的教育工作可能会带来更大的改变,相比之下,可能对处在 80% 左右的学生产生的影响会小得多。或者换句话说,那些成绩较好的学生自然会没问题,这大概是事实。
Dwarkesh Patel 01:05:37
但是「没问题」和「卓越」之间的差别可就大了。
Andy Matuschak 01:05:44
对,这点无可争议。我说这些,只是想表达我理解为什么绝大多数教育人士的关注点是什么。我觉得这很好,也很庆幸他们在做这件事。我大致上决定就让他们继续,我会把精力转移到其他地方。
Dwarkesh Patel 01:06:02
对,我明白。我觉得关注新鲜事物、探究它们的来源,以及如何让这些事物更为丰富,都是极具价值的。了解到原来一套工具并不一定能适用于所有人,真是挺有趣的。
Andy Matuschak 01:06:18
对,困扰我们的部分问题就在于,那些独树一帜的东西,极有可能是从那些在学校表现处于前 20% 的学生那里产生的,因为他们可能会心怀不满、感到乏味,认为这些所谓的学习都与他们无关,是吧?其中的难题在于,如果我们选择放弃帮助这些人学习,那么所有可能出现的有趣创新都将成为泡影。我也不知道该如何应对这种情况。我想,我只是试图解决一小部分我觉得可能有办法解决的问题罢了。
(01:06:52) – 学习本身就是痛苦的吗?
Dwarkesh Patel 01:06:52
一旦所有的工具都造好了,当你走到职业生涯的这个阶段,学习过程是不是应该是快乐的?或者必须是快乐的?即使所有的工具都齐备,还是有那么一种感觉,就像 David Goggins 一样,这将是一种煎熬,但我决定用这种方式学习,而且我必须咬牙忍受。
Andy Matuschak 01:07:13
痛苦从哪里来的呢?我是真心实意地问这个问题,并不是想用这个问题作为修辞的一部分。那我就尝试回答我自己的问题吧。首先,我要明确的是,一般来说,我对 David Goggins 式的态度是非常反感的,无论这种态度用在什么地方。在这个特定的情况下,我的想法是,如果我问为什么学习某个主题会感觉痛苦?我能想到的答案是,首先,我对这个主题不感兴趣。但我认为这不是我们现在讨论的问题。你问的是在这样一个世界,这些伟大的工具都已经存在,有人正在使用这些工具去做他们真心想做的事情。那么另一个可能的原因是你觉得你的进度不够快,或者你正在失败,或者你正在挣扎,而痛苦就来自于对这种感觉的抗拒。它源于你觉得自己做得不好,你不应该这样,做得不好是一种坏事。可能你也会怕别人的评判,或者你觉得时间不够等等。我觉得这主要是一种需要治疗的情绪问题,而不是学习的实际问题。比如在学习有机化学这样的科目时,你真的需要记住 200 个名词或者类似的东西。一个答案是,你可以通过使用现代的记忆方法轻松地完成这个任务。有机化学的学生为此烦恼,其实他们并不需要这样。但即使使用了现代记忆方法,你可能还需要在几周内花上大约 100 分钟来学习所有这些公式。那还是有些不愉快,那这种情况能解决吗?我认为答案是肯定的。我之前提到的《Cell Biology By The Numbers》一书中就有很多这样的事情,比如一个核苷酸的体积是一纳升。学习「一个核苷酸的体积是多少?」这个问题并不是那么愉快。我不确定这是否真的可以算作痛苦。这没什么,我可以在排队等待的时候来做这个。但我认为有更好的方式,那就是解决一个有趣的费米问题,这个问题会涉及到那个词。比如,如果我有一瓶新冠疫苗,如果这瓶疫苗的容量是一毫升,那么它里面可能有多少份新冠病毒的 RNA 呢?这是一个有趣的小问题,我会享受坐着思考这个问题的过程。在这个过程中,我需要回忆起核苷酸的体积以帮我做出这个近似计算。所以我认为有一些策略可以用来解决任何剩下的,感觉有些必要的不愉快或者死记硬背的事情。
Dwarkesh Patel 01:10:10
其实我对你的回答挺吃惊的。我对你的一些观点的理解,是你实际上是在以新的工具来支持传统的教育思维方式。举个例子,如果你回到 20 世纪的一名校长面前,你会问:记住一个学科的分类体系重要吗?你可能会回答:当然重要,这就是为什么你需要花一年的时间去记忆分类体系。然后你会说,记忆很重要,这样你才能有一个词典来继续研究这个学科。所以,你通过新的系统在做同样的事情。在这种特殊情况下,我原本以为你会说,如果你决定学习某件事,你就必须遵守纪律。我原以为在经过三小时的高强度学习之后,紧接着又要进行一次高强度的钢琴练习的情况下,你会累得不行,但是你会坚持说,「不,这是我今晚必须做的。」所以,听到你的回答,我确实感到很吃惊。
Andy Matuschak 01:11:13
是的,我真的很享受这种紧张感。我可能对 Goggins 的引用有些过度反应,但这就是我真实的感受。我一直都在感受这种紧张。在我所关注的教育心理学的历史中,我最认同的两种观点,一种是最呆板、最专制的观点,另一种则是最像非学校教育和蒙特梭利教育的观点。我对这两种方向的观点都有很大的同情,它们在我的思想中形成了一种奇怪的融合,我无法完全把它表达出来。我想我现在所说的部分还处在理想化的阶段。实际上,在实践中,我确实会通过使用意志力来推动事情的发生。例如,我使用一种叫做 Beeminder 的工具,如果我不做某些事情,它就会向我收费。这听起来很严格,但它肯定比我刚才所做的那种自由奔放的姿态要严格得多。我用它来确保我做我的记忆练习。但是,我的记忆练习不应该是充满快乐的吗?它是我研究的核心,对吧?它应该是我一天中最有趣、最兴奋的部分,但实际上却经常不是。所以我使用这个工具来强迫我去做。这里有一些矛盾。
我想我要说的是,我之所以愿意赞同校长对学科分类体系重要性的看法,是因为成本问题。我在高中的时候花了大量精力在记忆上,效率非常低,感觉非常没把握。我甚至无法确定我是否真的记住了这些东西。我不知道怎样才算真正学到了东西,以至于我有信心记住它。这个过程耗费了我大量的时间,因为我没有技巧和工具。现在,我对仅仅记住分类体系如此热衷的原因,部分是因为对我来说,这就像是小菜一碟。好,随便吧,把它扔到卡片里。它在接下来的几周内只会占用我大约 15 分钟的时间,然后我就会记住它。这几乎没有任何代价。学习中的其他事情仍然需要付出实际的成本,这些可能更难以解决。
(01:13:37) - Andy 会如何安排他孩子的教育
Dwarkesh Patel 01:13:37
其实,这或许是个好时机,让我问你一下对于「非学校教育」你持有何种态度。在 Twitter 上有人提出这样的问题,如果有孩子,你会如何规划他们的成长呢?
Andy Matuschak 01:13:50
嗯,我先澄清一下,我现在并没有孩子。
Dwarkesh Patel 01:13:54
好。假设中的孩子。
Andy Matuschak 01:13:57
这个问题很困难。学校的目的不仅仅是教学,它还有社交、社会和行为目的,还有一个务实的目的,基本上是照顾孩子。这些都可以被分开处理。我觉得这个想法挺有趣的。如果我真的有了孩子,我可能会很深入地考虑这个问题。我觉得在家上学的可能性很大。可能不会是 [unclear] 老师,但可能会雇人来教。我有一些资源,我不富有,但我有一些资源,这可能是一个区别。在疫情期间,我被一家名叫 Schoolhouse 的公司所吸引,现在它已经不存在了,这是 Brian Toball 创办的。他注意到人们在疫情期间开始聚在一起,尤其是和学校的同学,大概有五六个孩子。有些小组开始雇佣由于疫情而失业的小学老师。小学老师会去这些人的后院,五六个孩子会和小学老师一起,一整天都在做事情。将一位老师的时间分摊给五六个孩子实际上是很可行的。比如,你想支付给老师每小时 50 美元,这对于老师来说似乎是合理的,这并不难做到,实际上比私立学校要便宜得多。我认为 Schoolhouse 的费用大概只有小学费用的五分之一。当你孩子上到高年级时,可能需要专门的老师。实际上这也不一定。我的朋友 Alec Resnick 正在马萨诸塞州萨默维尔市开一所很有趣的学校,名叫 Powder House,他们的模式就像我刚才描述的那样,他们有一些成年人,他们更像是教练,他们不一定是某个领域的专家,但他们会把人们和领域专家联系起来。总的来说,我会探索这样的模式。如果你想问一些具体的事情的话……
Dwarkesh Patel 01:16:18
好的,我来更具体地提问一下。比如说这个孩子已经长到 12 岁了,你已经教会他基础的算术、阅读等知识。那你接下来会怎么做?是告诉他要学习生物、化学,还是问他对什么感兴趣,比如对罗马历史有兴趣,那就一起来学习水道系统?还是有一套固定的课程,直到他们升入大学?
Andy Matuschak 01:16:39
这确实是个棘手的问题。教育改革运动中有位我十分敬佩的哲学家约翰·杜威,他写了一本精彩的书叫做《经验与教育》。这本书是他在晚年回顾自己致力于改革学校教育,寻求孩子们更多自由的全部努力后写的。他从未走到极端,但总体上他倾向于自由教育。他提出一个深刻的观点,由于孩子们的前额叶皮质还没有完全发育,他们的自我还没有完全形成,让他们随心所欲地做自己想做的事,实际上并不是真正的自由,反而是让他们被各种冲动所束缚。我觉得这个观点很有说服力。这并不意味着要对孩子进行严格管束,但也提醒我们对 12 岁孩子的计划或打算要持有一些怀疑。应该怀疑到什么程度?我也不确定。如果我有个 12 岁的孩子,我可能对此有更明确的看法。但作为一个没有孩子的人,我预感到的是,可能需要找到一种折中的方式。我会尽可能让 12 岁的孩子接触到各种各样的主题和可能性。如果他们只想整天作曲,我会告诉他们,这意味着什么,这样的生活会是什么样子。我会尽量避免强迫孩子做某事。孩子在一定程度上应该承担自己选择的后果。这种复杂性更因为我并非富有,但我的孩子应有机会。如果他们在 13 岁时做出一些奇怪的职业选择,导致他们无法进入哈佛,也没关系。他们可能在 24 岁或 32 岁时终于找到自己的路,也没问题。这个建议可能听起来不太靠谱。你可以看出我对此也感到相当困惑。
Dwarkesh Patel 01:19:16
好的,没关系。我有个问题,从历史角度来看,可能直到现在,提高教育质量似乎一直是个难题。你之前在谈论如何根据学生的能力中位数或特定百分位数来定位教学时提到过这个问题。但我想知道,你觉得针对你教学目标的那个百分位数的教育质量有没有进步?如果没有,这种相对的停滞状态又是怎么回事呢?这是你之前提到过的一个问题。我们有如此多的新 IT 工具,为什么教育仍然大体停滞不前呢?
Andy Matuschak 01:19:49
对你的问题来说,有趣的回答其实是我们已经取得了大量进步。实际上,情况相当不错。我记得有个统计是,在 1900 年,只有 6% 的美国青少年完成了高中学业。这并不意味着 94% 的人没有接受我们今天所说的高中教育,但大概就是这个意思。这些人都在家接受教育。不过,那时候的高中教育程度比现在要低一些。现在有相当一部分高中生在学习并完成了大学预修课程。这是高水平的情况。在低水平的情况,100 年前在美国,文盲是个大问题,而现在则完全不是。现在的情况是,根据你参考的哪个调查,大概有 10% 到 15% 的成年人可能会在进行简单的数字操作或阅读、写作等任务时遇到困难,但我们的标准基本上已经提高了。以前的标准是你能不能完全读懂?这些任务可能有些人为,可能和他们的日常生活不相关,这可能就是他们遇到这个问题的原因。而现在,17 岁左右毕业,掌握特定知识的人口比例基本上一直在上升。这主要涉及到人口的底层部分。过去,大多数人在 10 岁左右就已经没有接受过正式教育,除了在他们的工作中学习的那部分。20 世纪的部分故事就是关于大众教育的。我们之所以有服务经济,有 IT 经济,部分原因就是我们的大部分人口都接受了特定层次的教育。如果你看一下四年级、八年级和十二年级的全国数学和语文熟练程度测试,你会看到第 75 百分位的进步非常慢,而近几十年几乎没有什么变化。但你会看到在底层四分之一的变化非常大。所以从某种意义上说,尤其是在过去的 20、30 年里,故事主要是在讲述如何缩小所谓的学业成就差距,那些在学校资金不足,或者可能家庭环境不支持或困难的群体,他们的教育成就与同龄人相比,差距很大。这个情况已经发生了变化。
Dwarkesh Patel 01:22:42
我比较好奇的是,既然其他部分的能力都有所提升,那么能力的天花板是否也有显著的提升呢?
Andy Matuschak 01:22:50
这要看我们如何定义「天花板」。
Dwarkesh Patel 01:22:54
因为我们可以回头看几百年前的历史,那时候的顶尖人物学识渊博到令人难以置信的地步。比如托马斯·杰斐逊读过的书籍数量就让人叹为观止。还有一个故事,肯尼迪在 1963 年左右在白宫接待了一批诺贝尔奖得主,他说,自托马斯·杰斐逊单独用餐以来,这个房间里集聚的天才和智慧是空前绝后的。
Andy Matuschak 01:23:28
没错,提高这个「天花板」确实困难。「天花板」的教育已经有了贵族家庭的私教,已经有了那种能够孕育出巨大智力的家庭环境和遗传性质。20 世纪初的学校培养出了冯·诺依曼,但现在他们是否能培养出更多的冯·诺依曼,这就很难说了。实际上,冯·诺依曼的成就可能与我们熟知的任何大众教育方式关系并不大。至于顶尖人物,我认为这是很难界定的。我们正在讨论的是一个为大众创立的体系。总有那么些人,在这种体系之外使用着其他的资源。所以,这个为大众设立的体系似乎对这些人并没有什么帮助。这个观点并不让人感到意外。
Dwarkesh Patel 01:24:25
顺带一提,关于冯·诺依曼的事。好,大众体系不能对他们有所帮助。那么,冯·诺依曼这样的人是如何产生的呢?
Andy Matuschak 01:24:33
对,很多人研究过这个问题。我没有特别研究过冯 · 诺依曼的生平,但我知道他的许多同辈,那些 20 世纪的伟人,接受的都像是贵族式的教导,或者他们来自东欧的一些非凡的小型学校,这些学校都有自己的传奇故事。不过对于这些,我其实并不了解,对此我向你道歉。
Dwarkesh Patel 01:24:54
我猜你一定听过那个高中的事情。
Andy Matuschak 01:24:58
对,对。
Dwarkesh Patel 01:25:00
那么,我们是否在培养像冯 · 诺依曼这样的人才上变得越来越差,还是没有变化?
Andy Matuschak 01:25:06
嗯,这个可能性也许存在,我也不确定。让我提一个理论,似乎有一定道理。如果一个人在 19 世纪末有机会接受贵族家庭教师的教育,那他现在是否会选择去一所高级私立学校?而现在的学习体验对他来说是否真的更有利?我不知道。我认为,他们更有可能选择去上那些名牌私立学校,同时仍然拥有高级的家庭教师,然后进入一所精英大学,在那里他们会有大量与教授面对面交流的机会。
Dwarkesh Patel 01:25:38
尽管有一种观点可能不符合这种情况,那就是,那些有可能成为教师或贵族家庭教师的人,现在可能面临更高的机会成本。也就是说,那些可能成为你的私教的人现在可能直接在硅谷或华尔街赚大钱。
Andy Matuschak 01:25:53
这确实很有意思。那么,这可能就是一个论点,也许并不是说我们在 20 世纪对此变得更糟,而是在历史的长河中可能是如此。可能在古代,亚里士多德曾是亚历山大大帝的家庭教师,而现在的亚里士多德可能已经是一位教授,无需再兼职做教师。可能就是这样的。也许一些家庭教师已经因价格高昂而被市场淘汰,但我并不确定最昂贵的家庭教师是否真的是最好的。有很多实证研究关于家庭教师的问题,其中一个问题就是,家庭教师需要有多少经验?有趣的是,有人在教育效果上取得了很大的成效,即使家庭教师并不一定懂得更多。只要有另一个人在场,就能带来非常大的效果。当然,当你拥有一位专家,效果会更好。我对这些研究持有一种健康的怀疑态度。我觉得让亚里士多德作为家庭教师的部分作用是传达一种世界观,这是一种无法通过测试或这些研究所测量的东西。所以,拥有一位极具启发性的家庭教师可能才是关键,而我认为,启发性往往与昂贵的价格是相关的,这并不是必然的,我不清楚。这个问题很复杂。
Dwarkesh Patel 01:27:12
我想说的是,尤其在今天,学习资料随手可得。家教更多的是提供激励和动力,这虽不尽然,但占很大一部分。
Andy Matuschak 01:27:21
对,他们的工作并不只是教授知识。我也要说,我知道很多人现在请的是博士后做家教。这些家教往往是研究生,他们一般很乐意接受每小时 60 美元的家教工作。这虽然有点悲哀,但现在可请来做家教的博士后人数,比一百年前多了很多。尽管家教的人数变多了,并不代表顶尖的 1% 的人才也多了。这一点还没有定论。另一个问题是,过去 50 年间,教师的教学水平是否有所提高?在某些方面,也许他们确实有所提升。比如有许多项目试图推广一些研究成果,那些更有效的教学方法。比如,交织式教学比模块式教学更好,就像是「我们先讲内战,然后再讲女权运动」。这两个主题虽然相隔有点远,但把这些主题交织在一起教会更好,这不仅在历史课上,其他课程也是如此。这种教学法在过去几十年中系统地推广开来。我还没有见过任何研究或证据,可以证明现在的教师比过去的教师更有效。
Dwarkesh Patel 01:28:50
我相信你一定看过这样的主张,那就是 20 世纪中叶一个意料之外的结果是,聪明的女性基本上只能选择教师这个职业。现在有了更多的选择,这对于女性来说无疑是个好事。你懂的,现在很多职业都在争夺那些同样聪明的女性。
Andy Matuschak 01:29:14
哦,这个观点很有意思。我以前没有听说过。我得想想看。我不确定智力到底有多重要,如果你想把它看作是某种可以独立衡量的东西的话。
Dwarkesh Patel 01:29:28
或者其他对她们来说更有吸引力的工作。这个群体被束缚在家务和教书这两个选项之间,别无选择。
Andy Matuschak 01:29:36
我想说的是,假设这种说法是对的,那些现在成为天体物理学家的人,我并不确定他们是否真的能成为优秀的老师。做好一个老师,往往需要同情心、沟通能力以及关心学生。教学是一件亲密且需要个性投入的事情。你需要了解所教授的学科,但如果你只是教一个 15 岁的孩子,其实并不一定需要拥有研究生的水平。有趣的是,我看过一些研究,这些研究探讨的是专业知识对教学效果的影响。我在数学领域读过一些,我相信在所有领域都有类似的研究。这些研究发现,如果你对数学不熟悉或不自在,那你就很难引导学生进行探究性的学习,更难以引导他们以创新的方式思考数学,或解决开放性问题,相比于只是教他们如何套用公式。因为引导这类课程,你需要能随机应变。你可能会提出一个困难的问题,可能并没有唯一正确的答案,你的学生可能会提出各种各样的答案。你需要有能力去整合这些答案,去展示一个学生的答案如何与另一个学生的答案相联系,展示这些理解如何可以用来建立你心中想要传达的理解。总的来说,这种即兴的教学需要一定的数学熟悉度和能力。但我不认为这需要非常杰出的才能。
Dwarkesh Patel 01:31:19
是啊,但那些非凡的才华可能已经被其他领域挖走了。
Andy Matuschak 01:31:23
是的,我在想这两者之间的关系是怎样的。如果真的如此,那么教学效果主要依赖于同理心,那么这两者可能是负相关的。可能那些擅长粒子物理的人根本就不适合做好老师。可能吧。
(01:31:40) - 超文本的用处
Dwarkesh Patel 01:31:40
很有意思。超文本为什么没有更深入地改变人们的写作方式呢?我写博客的时候,常常在想,知道我可以添加脚注和链接,这与传统写作方式究竟有多大的差别?我特别喜欢维基百科的内容组织方式。令人惊奇的是,对某个主题最佳的解释往往来自于一个试图解释每个主题的资源。你不需要在每个主题中都进行详尽的铺垫,可以把这些内容隐藏在链接之后。所以,为什么超文本没有更大地改变网络写作呢?
Andy Matuschak 01:32:14
这个问题倒是提得挺到位。我觉得维基百科之所以运转得不错,关键在于它的条目不得不自成一派。这种情况在超文本出现前就已经存在。实际上,超文本出现前的百科全书就已经有了类似超文本的样子。在电脑发明之前,也存在一些别具一格的超文本。比如 Adler 的 The Syntopicon 就相当有趣。比方说,你想理解古代作家是怎么看待「父亲对女儿的责任」这个话题的,你就可以在 The Syntopicon 里找,里面有来自卢梭、圣经等地方的参考资料。这些参考资料就像是超链接一样,虽然是印在纸上的,但你需要翻开那些书,查看对应的页面。The Syntopicon 并没有火起来,我想其中一个原因可能是,与维基百科的条目相比,这些概念不能那么明确地单独存在。你需要有连结,像筋络一样。其实,我想说的是,虽然维基百科是个惊人的资源,但我很少觉得它是最好的入门或解释某个主题的方式。我更常觉得它像是个不错的跳板,帮我知道应该问什么问题。它作为一本参考书,确实挺不错的。超文本是个相当有效的导航工具。它能帮你快速找到你想要的地方,因为它就是实现了自动翻页。所以作为一本参考书,它十分有效。如果你手头有一本关于化学化合物及其属性的书,超文本就能让你高效地找到你要的信息。同样,词典也因为超文本而焕然一新。你可以点击链接,就像是说「噢,其实是更接近这个意思」,这简直比词典都好用。我想说的是,有些文本更适合用超文本,因为它们更容易让读者从中间开始阅读。百科全书就是这样,词典也是这样。但是大部分文本和概念并非如此。我猜大部分的想法都融入在更全面或更丰富的东西里,它们需要一个叙事的弧线,难以抽离出来。并非所有的事物都是如此,但是那些不是那么原始和单一的信息就是这样。曾经有人梦想写超文本小说,有的人甚至真的写了。超文本小说的一个问题,其实在电子超文本之前的《选择你的冒险》这种书里就已经有了,那就是作者被迫写出一种最小公分母的故事,作为超链接的目的地的那一页,必须适应所有的参考链接,所以它不能形成连贯或一致的情节,除非所有的参考链接都有一种相似性。而参考链接越相似,超文本就越没用。因此,很多人对这个结果感到失望,我也是其中之一。我想说,我发现超文本在我自己的笔记中非常有用,但并不是在阅读中。我其实并不认为它会给其他人的阅读体验带来太大帮助。
Dwarkesh Patel 01:35:55
作为一名读者,我看到你另设了个网页,存放你的工作笔记,真的挺有意思的。能在这个界面上探索你的想法,感觉特别棒。
Andy Matuschak 01:36:04
感谢夸奖。它对于我这个写作人来说,的确挺有意思。它让我能够一点点积累我的观点。今天,我读了一篇很早期的关于附加问题的认知心理学文章,这也是我们之前讨论过的。这篇文章谈的不是你在读的时候提的问题对你记忆问题相关内容的影响,而是提问对你对其他并未涉及到的信息的影响。我写了一些关于这个助记媒介设计决策的笔记,这是我之前谈过的,就是把问题融入到文章的文字之间,这就是我谈过的那个《量子国度》。这些笔记并不完整,会随着时间的推移逐渐成型。做这个的效果如何呢?我关于这个的笔记,主要来自我对读者的采访。每当我读到一篇与之相关的论文,我的这些笔记就会增加一些内容。这就意味着,当我准备设计下一个系统,思考问题在文本中的作用的时候,我有了一个可以去参考的地方。超文本的作用基本上就是帮助导航。如果没有超文本,你也可以做到这一点。那你就会得到一个类似于诺依曼的东西,一个大衣柜一样的东西,但是这个衣柜是由卡片文件组成的,而不是衣服的抽屉。
Dwarkesh Patel 01:37:30
这咱们聊的反倒跟咱们一开始的话题挺般配的,就是说那些人,比如 Tyler,他们是如何在没有显式的笔记系统的情况下,也能消化那么多信息的。我脑子里又冒出了一个人,Byrne Hobart。这又是一个例子,这家伙写作如泉涌,每天都写一份深度十足、洞察力极强的金融简讯。从某种程度上说,这就是他每日的笔记习惯。
Andy Matuschak 01:37:58
对于他们两个人来说,没什么东西真正积累下来,至少方式不太一样。这个挺有意思的。他们每天都重新来过。Levine 的简讯有一点我挺感兴趣的,就是当他反复讨论一个话题时,比如最近的银行崩溃啥的,他得一次又一次地解释什么是利率风险这样的概念。每天都得解释,但每一天的解释都是重新开始,每一天的解释都会因当天的状况有所不同。
这对我做笔记的方式是一种质疑。这是一种支持临时性、每天重新创造事物的观点,因为它会随着你的思考和经历而变化。这点挺有意思的。我发现我现在的做法是混合这两种。我有个日记,专门记录今天的事,我会写很多东西。有时候我会重新写一遍我之前写过的东西,我还有些其他的东西,试图让它们更能经受住时间的考验,成为一个独立于时间之外的有用参考。这种混合方式挺好的。我现在还没有明确的标准,能告诉我哪一种方式更胜一筹。
Dwarkesh Patel 01:39:17
你刚刚说的关于超文本的东西有趣的联系在这里:Byrne 的新闻简报往往缺乏足够的背景信息。如果你对这个主题不熟悉,往往会对正在谈论的概念感到困惑。我曾经问他,你有没有考虑过像 Scott Alexander 那样,让别人在播客中朗读你的博客帖子?他说:「我觉得我的帖子可能不太适合这样做,因为我非常依赖老博客中的超文本规范,比如在其中添加笑话和讽刺。」就像他关于 SBF 和他的崩溃的那篇文章,里面有很多链接——如果你想更深入地了解追加保证金,看这个。然后他说,如果你想了解更多关于功利主义赌注的心理学,看这个,结果链接的就是《罪与罚》的亚马逊商店页面。做这种事情难度更大。
Andy Matuschak 01:40:19
嗯,你说得对。他更倾向于依赖他过去的解释,这点很有意思,因为他无法更新它们。这种写新闻简报然后链接到过去简报的格式,或者就像你说的,那种旧博客的做法,一连串的六个词,每个词都链接到以前关于这个主题的帖子。我肯定写过类似的东西。这很有趣。这接近我之前谈到的那种持久笔记,但没有随着时间推移修订的能力。也许对很多话题,你并不需要这种能力。我现在在想,我第一次重大修改后,我的笔记中有多少部分保持原样。可能至少有三分之一,也可能超过一半。
Dwarkesh Patel 01:41:04
你公开的笔记占比多少呢?
Andy Matuschak 01:41:07
要按字数算还是按笔记条数算?我没法直接回答你。比如说,我每天写的日记,并未公开,那这就积累了一大堆了。如果我们只按笔记算的话,就得把这些都排除掉。我还有一些笔记,记录的是我生活中认识的人,这些通常也不会公开,除非那些人是公众人物。所以,确实有很多笔记是未公开的,但这些大部分都不是那种经久耐用的。这些笔记对其他人来说可能没什么意义。至于日记,可能有意义,但那又涉及到一些私人的东西。
Dwarkesh Patel 01:41:41
你写的这些东西,别人能理解吗?
Andy Matuschak 01:41:45
这得看情况。通常我的日记都是完整的句子和段落。有时候我会列出一些要点,有时候会突然转向新的主题。我的笔记常常包含我正在讨论的事物的链接,因为我试图在这些东西上积累一些背景信息。
Dwarkesh Patel 01:42:07
为什么不只用速记呢?
Andy Matuschak 01:42:11
部分原因是,过去的我和现在的我其实是两个人,这也算是老生常谈了。我常常会回头看一年前的日记。你可能会认为这是我写笔记的方法失败了。从理想的角度来看,我应该不需要去看这些日记,因为如果有什么重要的,我一年后还需要参考的,那应该会出现在某个持久笔记里面。但我又觉得,事情并不总是这么绝对。这感觉就像是在做预备工作。也许有一定程度的预备是好的。我们住在加州,或许每个人都该准备一个地震应急包。这可能是对的,但也许你并不需要囤积 300 罐豆子。有一定程度的预备感觉是合理的,但过度的预备又显得有些过分、让人不快。
(01:43:02) - 计算机工具如何助力迭代过程
Dwarkesh Patel 01:43:02
作为深耕硅谷,身处科研之中的你,对那些创业建议——比如「快速行动,快速失败,立即用精简可行的产品接触用户」——持什么看法呢?你自己虽然在打造产品,但又与一般初创公司有所区别,你对此类建议有何感想?
Andy Matuschak 01:43:22
这个问题让我感到相当纠结。在不同的时间,我需要的建议也不同。显然,不同的人在不同的日子里,需要的建议也各不相同。当我初涉这项工作的时候,那些建议让我不会过于深入地去探讨我所研究的观念。有个新的点子冒出来,我就会想:「哦,我可以试试这个。」我就去尝试,然后我就学到了些什么,然后再重复这个过程。我并没有构建一个全面的理论,去深入探讨问题的本质,以及解决问题意味着什么。相反,我只是制定了一个行动理论。行动理论,而不是改变理论,就是你设想你现在处在什么位置,最终你想达成什么样的目标,然后你环顾四周,问自己:「我能做些什么?我能创建些什么?我能看到些什么可能性?」
而改变理论,就是从结果出发,尝试反向推进。这个比喻并不完美,因为在研究中,你并不完全确定最终的目标是什么,你更不可能知道如何反向推进。我想我想说的是,历史上的那些建议让我去尝试一些简单易行的事情。最有影响力的设计工作,其内部充满了创新思想。我们所熟知并喜爱的非线性文本编辑器之所以强大,是因为我们观察到写作是一个非线性过程,但是用笔写字却使其变成线性。像这样的发现还有很多,以及对于拥有一个思考环境意味着什么的理解,使我们得到了这种特殊的界面。同样,我们得到强大的编程环境,是通过人们深思熟虑地理解制定系统意味着什么,并提出了表达这些理念的新原语。
最强大的界面往往体现了新的想法,或者是捕获到新操作方式的新原语,这些原语给我们带来了全新的可以操控的对象。比如说,在 Photoshop 中,你可以通过所谓的「图层」来操作图片。这个概念新颖且独特。在暗室处理照片时,有一些类似的操作,那就是可能会使用几层胶片。我这里说的不是负片,而是你可能会放在灯光下面的那种凝胶片,用来调整照片的曝光度,让这里的曝光度增强,那里的曝光度减弱。但在 Photoshop 中,这些图层不会被破坏,你可以随时随地调整它们。这就好比是在图片编辑的过程中,我们引入了一种新的原语。这个原语彻底改变了图片编辑的方式。
我想我可能掉进了个大坑,说了一大堆可能让人迷惑的话,但我想表达的是,通过快速构建最小可行产品(MVP)来提出新想法是非常困难的。当然,如果你有个自认为有趣的想法,快速去试验它是个好办法。我感到困惑的一部分原因是,这个方法只有在你已经有了值得测试的东西的时候才是好建议。对我来说,我已经习惯了这种思维方式,已经深深根植在我心中,这让我没办法安静下来,深思熟虑,让想法充分发酵。Michael Nielsen 和我一起创造了《量子国度》,当我在思考下一步该做什么的时候,最直接也是最自然的想法就是,「如果我们在一堆其他东西上试试它,结果会怎么样?」
当这个想法闪过我脑海的时候,疫情刚好爆发,我感到有些胆怯,无论在创造力还是情绪上,我都希望能找到一些让我感到安全的东西,我知道我可以做到。我知道我能够建立一个平台,推广我们为这本教科书所做的一切。所以我就这么做了。我用了几个月的时间就完成了它。但这并不是我应该做的。我问的问题也并不对。这个想法并不足够强大。这样测试它并不是正确的方式。相比之下,我应该建立更多的一次性的事情,而不是任何人都可以使用的自助服务。我现在想要做的不是为全世界建立一种可扩展的东西。我想要做的是构建一种想法。原型就是这个想法的表达。一旦我们找到了好方向,也许我们就能找到一些可扩展的解决方案。但我们还没有达到那个地步。在到达那个地步之前,构建和原型制作的过程中需要进行大量的思考和草图绘制。我在这里的困惑部分是,我经常还需要听到这个建议。我经常会在理论的领域里束手无策。我真正需要做的是让一个朋友让我坐下来,然后说:「你能否找出这其中的一部分,下周就构建出来?」所以你听到了我内心的很多冲突。
Dwarkesh Patel 01:48:54
那么,你在 Orbit 准备好扩大规模之前就推出,这样做的后果是什么?
Andy Matuschak 01:49:05
实际上,我从中学到了一些东西,效果还算不错。它让我更深入地了解了这种特定模式在其他地方的优缺点。但是,找出这些问题的方式并不是那么高效。Orbit 就像一个最小可行产品,功能简单,特性不多。但却具有极高的通用性。这是一个已经部署的系统,拥有基础设施、账户等等,这些都是构建一个实际项目所必须的。这与「我要和某个作者合作,看看我是否能让一本和《量子国度》完全不同的书也能行得通」这种想法有着天壤之别。我肯定可以更快地回答「这种方式对于这本书可行,那么下一本适合尝试的书应该是什么?」这种具体的问题或理论。
Dwarkesh Patel 01:49:56
你觉得,为什么「思想工具」这个概念会吸引硅谷那么多人的注意?
Andy Matuschak 01:50:04
这个观点给科技人士带来的启示就是他们可能有着巨大的潜力。这对于任何人来说,总是让人心动。同时,它对人们来说,好像很容易上手,尽管这种想法可能会误导人。我接触过无数自称对思想工具感兴趣的人,他们中的大部分都是工程师。问题在于,创造出一款有趣的思想工具,基本上全是设计的问题。而他们的设计理念通常并不出色,或者说有很多问题。但是,他们却能做出一个东西来解决他们自己生活中的问题。这个感觉真是让人心动,让人充满信心,就像找到了可以动手去实践的事情。
在硅谷,我们对思想非常感兴趣。我们是爱思考的人。人们对任何可能提高自己能力的东西都怀有极大的兴趣和热情。这同样让人心动。如果我能想得更深更远,那有多好啊。这种想法也让人心动,因为它是「元」。有很多人总是忙着调整他们的系统文件,或者调整他们的博客网站,可能博客里只有两篇文章,但是他们又想改版,所以又要重写。在他们再次重写之前,新的博客可能只会有三篇文章。思想工具也能满足这种需求。这就像是工作中的工作。我说得有点愤世嫉俗,我并不是故意的,我只是在诚实地回答这个问题。
换个更积极、更宽容的角度来看。我们很多人之所以走上计算机这条道路,是因为计算机给我们带来了个人赋权和无限可能的感觉。我们记得自己年少时,深夜被困在卧室里,满心好奇地研究计算机。我们手中有这个强大的工具,它帮我们打开了新世界的大门。对于这里的许多人来说,这是他们个人成长的重要经历。任何人如果能指出,我们还能做出更多这样的事情,一定会感到非常动人。
(01:52:24) – 公共工作的变现
Dwarkesh Patel 01:52:24
这是来自 Twitter 的 Matt Clancy 提出的一个有趣的问题——一个好的众筹研究项目应该具备什么特点呢?
Andy Matuschak 01:52:33
在我进行众筹的过程中,有一件我感到比较遗憾的事情,那就是有些事情似乎很难改变。比如订阅流失率。在我这样一个订阅收入模式的项目中,每个月都会有订阅者流失。在我这里,大约是 2% 的流失率。虽然这个比例并不大,但这意味着我需要一直有新的订阅者加入。我发现无论我做什么,订阅流失率似乎都不受影响,这很惊人。我尝试了各种方法,但并没有实质性地改变流失率。改变的是能够吸引更多人关注我的项目,换言之,就是营销。有些事情确实影响了那些被吸引过来的人中有多少会最终成为订阅者。我真的不喜欢这种思考方式。
总的来说,让我感到伤感的是,我最后不得不去考虑这个问题。我意识到,这个众筹项目之所以能够勉强运行,是因为它对其他人来说比较好理解,也比较吸引人。已经有一些看起来前景光明的结果。很容易想象其他一些项目可能并不具有广泛的吸引力。如果我正在做的是海洋地质学的研究,我可能不会有大量的网友,或者他们也不会像现在这样对我感兴趣。这是一个特点——这项工作很通用,适用于很多人,这些人都有一定的可支配收入。如果我正在进行的研究是关于弱势群体中的艺术家的写作习惯,我的受众可能就没有那么多的可支配收入。
我已经有了一些成果,这一点至关重要。不过,也许对于研究项目的最初阶段来说,运用众筹可能有点困难。我已经设定了一个研究路线,并能清楚地阐述出来。众筹的运用可能需要等到研究的初级阶段完成后。这可能是标准的拨款建议,即在某个时点,我会利用这笔众筹款项去寻找下一个目标,而那时,我可能无法向任何人解释清楚。当然,会有一些萌芽阶段的想法,但你必须有一个正在进行中的项目。我需要能定期地告诉大家我取得了什么样的进展。
比如,我的妻子正在研究生物年龄标记与脑外伤导致的精神错乱的关联性。为了完成这项研究,她需要找到因脑外伤入院的患者,并让他们同意参与研究,提供各种血液样本等等。要找到足够的患者以满足她的研究需求,可能需要两年或者更久的时间。她可以提供一些初步的研究数据,但肯定不能每个月都有更新,对吧?
Dwarkesh Patel 01:55:53
这会是个让人诧异的 Patreon(众筹网站)帖子。
Andy Matuschak 01:55:57
是的,我也做不到每个月都公布新的进展,但确实需要有个节奏。
Dwarkesh Patel 01:56:02
那你为啥费心去做呢?我想肯定有不少有钱人乐意一人独资你的研究。为什么你会选择众筹呢?
Andy Matuschak 01:56:12
如果有这样的有钱人愿意主动联系我并提出资助,我当然热烈欢迎。我确实很幸运,有很多高净值人士赞助我,但他们每人每月在我的 Patreon 上的赞助额只有 100 美元。这就是我从他们那里得到的。我并没有收到更高的资助。
Dwarkesh Patel 01:56:39
我觉得,鉴于你的受众的财富状况,你用错工具了。
Andy Matuschak 01:56:45
也许吧。你的问题可以有几种解读。一种是,既然我可以求助于高净值人士,为何还要进行众筹?另一种是,为何要众筹,而不是申请资助或与慈善机构对话?你主要关心的是第一个问题吗?
Dwarkesh Patel 01:56:59
对。
Andy Matuschak 01:57:01
坦白讲,我选择众筹的原因就是因为它管用。我生活中的很多事情,包括这个项目的众筹历程,都源于 Michael Nielsen 的推动。在我们一开始进行《量子国度》项目时,他就建议我们设置众筹,而我却犹豫不决,回复他,「这可能会让我们分心,现在我们并不真的需要它,等我们有些成果展示时再处理吧。」但他坚决地说,「不,让我们马上开始,因为积聚足够多的订阅者需要很长时间。」结果证明他是对的。从建立订阅者基础到项目众筹,这个过程在我看来至少需要几年时间。所以,早点开始显然是更好的选择。
如果这种方式不奏效,或者我们没有尽早开始的话,我可能就会直接去寻求个别人的帮助,如果众筹失败了,我可能也会这样做。另外,当我想做一些需要招募人员的特定项目时,我会向一些高净值的朋友求助,他们也愿意帮助我,尽管金额只有五位或者四位数。对于他们的帮助,我心怀感激。所以,可能答案会是两者兼而有之。众筹的一个主要限制是,它无法支持一个团队或者机构,甚至对我个人的支持都勉强应付。我现在的情况介于研究生和初级教职员工之间,虽然我可以接受这个情况,但这是因为我有一些特殊的原因,这对于每个人来说都未必合适。甚至对我来说,众筹也无法让我支持其他人。
Dwarkesh Patel 01:58:46
这点就更让人惊讶了。你的名气已经不小了,尤其在愿意赞助你这类研究的人中间。如果说你这样一位在独立公开研究领域里的 LeBron James,收入却只在研究生和初级教职员工之间,这个状况实在是不太乐观。
Andy Matuschak 01:59:19
我可能在这方面并不太在行,这倒是值得深思一下。首先,我作为研究员并没有做得那么出色,你说我像 LeBron James,我不能苟同。尽管在科技研究领域,我或许是最成功的一位众筹研究者,这确实有些诡异。过去几年我确实找到了一些门道,但不能说我有过什么轰动一时的成果。
每次我有重大成果发表,我会得到很多新订阅者,这是肯定的。所以,如果我的研究取得了更突出的成功,可能订阅者数量会有更大的增长。同时,我也确实刻意避免推销自己的研究,这是出于自我保护的考虑。我真的很担心受众和营销腐蚀真诚的探索。很容易让我的工作偏离轨道,更倾向于取悦大众的方向,而非我真正想要深入探究的领域,或者为了能更频繁地发表更多成果,只做那些简单乏味而非深入有趣的研究。
我选择了一条经济上并不明智的道路,那就是拒绝发表那些「最小可行单位的论文」,学术界对此有个更短小精悍的说法——「最小可行论文」。这意味着,只要你的新想法超过了某个标准,就可以立马发表出来。可我就是没这么做。我只是向我的赞助者们写下了一些非正式的信件,告诉他们「我这个月发现了什么新东西」。如果我是个纯学术派的人,这些新发现肯定会被我写成论文发表出来。如果我是个重视营销的众筹型研究员,我肯定会把这些发现包装得花里胡哨,然后宣传说「看,我又有新发现了」。但事实上,我并不觉得这有什么了不起,我更希望快点开始下一项工作。我也有选择等待发表的权利。但真正让我头疼的并不是这个问题。真正困扰我的,是营销,没错,就是营销。营销让我们很难诚实地对待自己,至少在我看来是这样。不仅要对自己认为有趣和重要的事情持有真实看法,甚至对于研究结果,也必须保持诚实。每篇论文,在某种程度上,都像是一则小广告,努力说服人们,它的研究结果非常重要,非常激动人心。这对于研究的过程来说,是十分破坏性的。我们需要对工作有强烈的情感链接,才能做好工作。这种情感链接的一部分,来自于我们对即将揭开真相的激动心情。所以我们总是忍不住想要以最有利的方式展示我们的发现,淡化其不足,让它看起来无所不包。然而,这些都是发现真相的敌人。
Dwarkesh Patel 02:02:40
从一个无意中但又并未刻意去扩大影响力的人嘴里听到这番话,挺有意思的。我对你早有耳闻。我怀疑,或许当你达到一定的质量水平,尝试去推销你的作品反而可能弊大于利。想象一下,如果像 Gwern 这样的人,试图通过 YouTube 的短视频来推广他的博客,那就会让人想说,「你这是搞什么鬼?」他的作品已经优秀到无需推广的地步。
Andy Matuschak 02:03:13
拿 Gwern 来说就很有意思,他的情况让我想到了一个更简单的问题。我经常遇到这样的情况,有人对我说:「啊,我已经很喜欢你的作品好一阵了,我居然不知道你有 Patreon。」这就是我在某种程度上营销失败的一个例子。Gwern 的情况比这个更甚。我特别欣赏 Gwern,从他那儿我学到了很多东西。你去他的 Patreon 页面,他把他的收入都公开了。他在 Patreon 上的收入只有我收入的一小部分,我觉得这不太对劲。Gwern 其实比我更有影响力,他的受众群也比我大得多。他的受众并没有转化为他的赞助者,这大概是他自我介绍和展示的方式问题。并不是他需要在他的网页上吸引更多的人。我猜他的网页流量和受众人数已经足够大了,远超过我。你如何介绍这个会员机制,有很多因素在起作用,我们都不太愿意去琢磨这些。我现在的做法可能在某个方面上更有效,但我敢肯定还有更好的办法来做我正在做的这件事。
Dwarkesh Patel 02:04:28
确实,这是个挺有意思的问题。我有个 Substack 账号,愿意的人可以通过这个平台资助我的播客。这些资助足够我用来制作一些集数,甚至支付出行的费用。不过,比起我将要通过做广告赚的钱,这些收入只能算是九牛一毛。有些人可能会说,「很可惜你不得不做广告」,也许有的听众甚至第一次听说在 Substack 上有这个捐助选项。不过,你肯定也不愿意每期节目都呼吁听众捐款,对吧?
Andy Matuschak 02:05:05
是的,我真的讨厌向人们伸手要钱。这可是我们创作者的通病。我真的非常烦这事儿。我可能得克服一下这个。但有一点我得说清楚,当我把我的 Patreon 从「订阅支持我工作吧」改成「加入会员吧」后,收到的反馈多了很多,就像你刚才说的那样,「一旦你成为会员,你就能享受这些福利。」这些福利不一定要非常实在。在人们心中,打赏和会员的意义是不同的。成为会员有种参与的感觉。如果你能提供一些让人觉得像会员的小福利,可能会有截然不同的反馈。Gwern 那边给人的感觉就像是个打赏箱子。现在,我这边更像是一个会员俱乐部。我觉得,如果 Gwern 能改成「成为 Gwern 研究所的一员」,他应该能收到更好的反馈。
Dwarkesh Patel 02:06:10
他在 Patreon 上有个活动,只要你捐赠五到八美元,他会读完一整本书然后写评论。
Andy Matuschak 02:06:17
是的,这实在太疯狂了。我不知道有没有人真的接他的这个「馊主意」。
Dwarkesh Patel 02:06:19
对,这简直就是把他的时间定价为一美元。
Andy Matuschak 02:06:25
是的,我对此也有些困惑。如果你先能吸引足够多的观众,或许让他们订阅会容易些。你可以免费吸引观众,然后在付费的部分提供一些额外内容。这个问题真让我挺纠结的,也许你能帮我想想。
我写了一大堆只有赞助者才能看到的文章。现在我写作的大部分内容都在这些文章里,因为我在等待有足够的素材可以公开发表下一篇大作。我有几篇大作正在筹备中。我为赞助者写了不少内容,但可能很多观众甚至都不知道这些文章的存在。要让人知道有会员专享的内容存在是个挑战。有时,人们会通过发推特或发送新闻邮件告知有这些订阅者专属的内容,但我就是做不到这一点。感觉告诉别人「这儿有个链接,但你看不了」,这样做很糟心。我不知道你怎么看这个问题,或者你是否考虑过为 Lunar Society 做一些订阅者专属的内容。
Dwarkesh Patel 02:07:39
我正打算跟你提这个问题。我是你的赞助者,我有机会阅读所有只有赞助者才能看到的文章,而且我觉得它们写得非常好。我在阅读的时候就在想,那些不知道这些文章存在的人真可惜。如果他们对你的作品了解得不够多,就不会去订阅,然后这些文章就被 Patreon 隐藏起来了。很遗憾,有时我们为了筹集资金进行公共工作,不得不将部分作品的公开程度降低。
Andy Matuschak 02:08:11
解决这个问题其实有更好的方式,例如从设计上出发。比如,如果我的作品大多数都集中在同一个地方,而不是分散在不同的地方,那么公开的部分和私密的部分在视觉和结构上就能形成对比,读者就会明白还有额外的内容。或许,你可以先看到其中的一小部分,Substack 就有这样的功能,能让你大概知道你会看到什么。然而,我几乎没花什么时间去考虑如何合适地展示这些内容。
Dwarkesh Patel 02:08:46
对,另一个要考虑的是,你的写作影响力很大程度上取决于有多少人真正阅读了它。这个期望值主要取决于它能否在网络上疯传。比如说,你曾发表过一篇非常有见地的文章,基于你在苹果公司的经验,探讨了 Vision Pro 的可能性,以及它在哪些方面达到了期待,在哪些方面又没有。我认为如果那篇文章能广为传播的话,肯定会引起很大反响。
Andy Matuschak 02:09:23
嗯,多谢。我确实把那篇文章公之于众,发在了 Twitter 上,还上了 Hacker News 的头版。我认同你的观点。通常情况下,我其实并不期望我的东西疯传。这些作品对大部分人的价值,主要在于它们揭示了一种罕见的创新工作的幕后情况,这是他们平常难得一见的。并且,这些内容大都富含情境性,不能独立存在。我也并不想写出一种能独立存在的感觉。偶尔,有些东西被大范围传播,然后就会有人发表评论,他们满怀困惑和愤怒地质疑我到底在说些什么,这种体验让人泄气。这就是为什么我只有当我想要写一些面向大众的东西时,我才会刻意这样写。
(02:10:16) - 间隔重复
Dwarkesh Patel 02:10:16
好的,我这儿有一些从 Twitter 上收到的问题。
Andy Matuschak 02:10:23
来吧,看看 Twitter 上的问题。
Dwarkesh Patel 02:10:18
这是 Matt Clancy 提出的另一个问题。你能不能举出一些有益的知识工作习惯的例子,它们可能在很大程度上都因为采取了「间隔重复」这种形式而显得有效,但参与者却并未意识到这一点?
Andy Matuschak 02:10:32
其实,间隔重复已经深深嵌入到我们的工作生活中了。举个例子,如果你是个研究员,你得定期写论文,这个过程中你得反复解释特定研究领域的历史,并引用相关文献,这就是一种间隔重复。或者当你在教学生时,你会反复说,「遇到这样的情况,你必须记住要做什么」。这也算是一种间隔重复。这些其实都是意料之外的间隔重复。医生在查房时也会遇到这种情况——尽管他们不一直在看病人,但他们还是会接触到其他病人。在这个过程中,常常会出现这样的场景:在病人被介绍给你时,你需要自己思考要问什么问题。「我应该怎么诊断?」在你听到答案之前,你其实已经在做一种隐形的记忆提取。间隔重复的模式实际上无处不在。它是间隔的,也是重复的。
我所探索的正式的间隔重复实践,它的不同之处在于,它关注的是那些你通常不会重复的知识,可能是因为你对这个知识还不够熟悉,还没有形成稳定的学习习惯,或者这个知识在你的生活中并没有牢固的依据。
(02:11:56) - Andy 的个人网站和笔记
Dwarkesh Patel 02:11:56
这是 Ian Vanagas 提的一个问题:「一个人在自己的网站上应该花费多少精力才算合适?」我猜他可能被你的 andymatuschak.org 网站上漂亮的 CSS 吸引了。
Andy Matuschak 02:12:12
我其实并不太喜欢它。但对自己的网站来说,这种想法是普遍存在的,对吧?这个网站已经三年了,这让我有重新设计它的冲动,但我不会让自己这么做,因为我觉得这样会让人分心。那么,投入多少精力才是恰到好处的呢?这个问题没有标准答案。当然,这可能会是我的答案,但我能说什么呢?网站的任务是什么?它想达到什么目的?很多人,特别是工程师,过度担心他们的网站,做出大量技术架构,而他们真正需要的只是一个可以发布 markdown 文件的地方。他们更好的选择应该是安装一个 ghost 系统。主要的考虑点是你想向世界展示什么?你想表达的内容的理想形态是什么?试图找到某种组织和表达这个内容的方式。
我们有一些通用模式,比如博客或作品集。人们往往会强迫自己适应这些模式。人们最后可能会使用博客软件来制作一些更持久的东西。那些非常有趣的个人网站通常来自那些想要展现的东西的形态,然后制作出能体现这个想法的东西。通常,一旦你理解了要制作东西的形态,这并不那么费力。我的网站并不是我投入巨大努力的项目,可能我应该投入更多的精力,因为我的收入取决于人们是否通过这个网站找到我。
Dwarkesh Patel 02:13:44
那些有关工作笔记的……?
Andy Matuschak 02:13:46
那个只花了我一个周末。
Dwarkesh Patel 02:13:47
真的吗?
Andy Matuschak 02:13:48
对,我其实对此有点愧疚,因为现在很多商业项目都在模仿那个。人们都以为,「哦,这就是呈现网络笔记的方式」。但我觉得它在很多方面都做得不够好。我只花了大约两天的时间在这上面。
Dwarkesh Patel 02:14:01
哇,我还以为这个问题是在暗示——你一定花了几个月时间在这个上面。
Andy Matuschak 02:14:05
其实并没有。这就像是那个故事里的修车工,他在那里轻轻一敲,然后就明白了一切。我有设计直觉,这将我引向了一个特定的方向。但也有很多东西我并不喜欢。我并没有让自己花更多时间去改进,因为我觉得这没那么重要。
(02:14:24) - 在苹果的工作
Dwarkesh Patel 02:14:24
在我问 Twitter 上的最后一个问题之前,我想询问一下你在苹果公司的工作经历。每个人都有 iPhone,从外看,设计这样的产品必然面临许多不同的权衡和限制。比如某些组件的供应和成本是什么?消费者需要什么?研发团队准备推出哪些功能?在你任职于苹果公司期间,你负责了许多核心的设计特性。如何整合所有这些信息,考虑所有这些限制,然后决定这就是设计呢?这个过程是怎样的?
Andy Matuschak 02:15:00
这个过程其实划分得非常细。你刚刚提到的所有这些因素,对我来说并不重要。所有这些都是预先确定的。在苹果公司,你有自己的小领域,这个领域的界限由其他人的领域决定。比如,有个负责热量管理的人。实际上,负责热量管理的是一个团队,他们会确定诸如「我们的热量预算是多少?在哪种工作状况下,我们可以让 CPU 开机多久?」这样的问题。我不能对此提出异议。这些就是我要遵守的限制。
Dwarkesh Patel 02:15:40
但这些限制不是由各种问题决定的吗?
Andy Matuschak 02:15:46
这是个迭代的过程。我们会遇到这样的情况,有些我们很想做的事,但由于耗电太多而无法实现。比如「Hey Siri」就是个有趣的例子。随时随地通过语音命令激活设备,而无需进行手动操作,这听起来很棒。最初人们想通过后台监听实现这个功能。但这意味着主 CPU 需要全时段运行,处理音频缓冲,这根本不行,因为电池会被耗尽。这种尝试最终导致了专门设计一个功耗较低的辅助处理器,该处理器功能有限且受限制,当主 CPU 未运行时,它可以运行,并监听特定的声音。
Dwarkesh Patel 02:16:31
有没有一个人负责将所有事情综合起来考虑呢?「我已经根据每个人的备忘录作出了决定,你们负责热力学,你们负责这个,你们负责那个?」。
Andy Matuschak 02:16:44
其实情况并不完全如你想象的那样,更多的是一种互动关系。部分优先级是由团队自己设定的。比如说,热力学团队有他们自己的研究重点,他们清楚什么对他们来说是重要的。另一些优先级则是由外部因素决定的。苹果公司的高级管理团队会做出最终决定,规定明年设备的主要开发方向。「嗯,明年,我们将引入面部识别解锁手机的功能,而且我们将取消 home 键。」如果你想去掉 home 键,又想让屏幕覆盖整个前面板,这就对设备的整体设计产生了很大的影响。这个决定为很多团队创造了大量的工作。
有些事情则更多的是在局部水平上处理。比如说,iOS 应用程序的主管可能会做出这样的决定:因为应用程序和系统框架是同时开发的,我们通常会使用一种奇怪的混合框架来构建我们的应用程序,部分是内部框架,部分是公开的开发者框架。内部的那部分总是和外部的有些不同,而且并不总能得到可靠的维护。所以我们在两者之间有很多问题。我们的一个重要目标就是将我们的应用程序的所有部分重写,只使用公开的部分,这样它们就可以在 App Store 上发布。这个决定是在一个更局部的层面上做出的,而不是由最高级别的执行团队做出的。
Dwarkesh Patel 02:18:16
让我感到非常惊奇的是,一个市值高达两万亿美元的公司能把如此多的信息有效地整合起来,形成一个统一而又有序的层级结构,在这个结构下,不同的产品、各种权衡的决策都能有条不紊地进行。这是否让你认为,随着时间的推进,那些运转良好的科技公司会越来越大,它们实际上能够承受起如此庞大运营成本?
Andy Matuschak 02:18:42
首先,我想对你关于公司庞大规模的观察做出回应,然后我们再讨论其他公司。苹果之所以能做到这一点,关键在于他们的管理方式——明晰的责任分配。尽管苹果有着非常严格的指挥和控制体系,且重要决策由一小部分顶层人士做出,但在各个层面的各个领域,各级领导都拥有大量的自由裁量权。这是任何事情能够顺利进行的唯一方式。在各自的领域内,每个人都被赋予了极大的责任和权力去做决策。这就是为何我们可以拥有这么多各式各样的产品。
Craig Federighi 是苹果软件总负责人。那意味着什么?怎么会有一个「软件总负责人」的职位呢?他们有多少个平台?iOS、iPadOS、WatchOS、VisionOS、MacOS,还有一些小芯片里跑的操作系统。所有这些都得 Craig 来管。那这是怎么回事呢?实际上,意思就是他得操心一系列的软件问题,而且这些问题每天都在他的头脑中回旋。我在苹果的时候,Craig Federighi 曾经亲自来我办公室,和我一起研究手势识别的启发式算法,因为这对他来说极为重要。然而同时,他几乎对 95% 与软件相关的决策置之不理。他直接把这些事全权交给了其他人。
有一篇很有意思的哈佛商业评论文章,讲述了苹果的管理结构,以及领导们如何分层次地承担责任。我记不清楚具体的细节了,但是比如说有 5% 的事情是你得全程亲力亲为,全程把控。在这个圈子外面,还有一个稍微大一点的圈子。那些是你得留心的事情,它们很重要,你会接收到关于它们的报告,你会检查它们,思考它们,你会有自己的想法并把它们传递下去,但你并不直接管控它们。然后再往外,就是一些你可以放心交给别人的事情,只有出问题的时候你才需要知道。文章还谈到了这种结构如何随时间演变。我离开苹果已经八年了,所以现在的苹果肯定和我当时认识的那个苹果大相径庭。
(02:21:05) - 间隔重复 2
Dwarkesh Patel 02:21:05
来自推特上的 Bazel Halperin 问道:「间隔重复法使用不广泛,是市场出了问题,还是说这种现象本身就反映了效率?」
Andy Matuschak 02:21:15
我想,大部分情况下,这其实是效率的表现。在能从间隔重复中受益,而且不需要大量新颖的文化知识去支持其应用的领域里,我们确实看到了很多间隔重复的使用。比如在医学生群体中,他们的学习意愿强烈,而且他们需要掌握的知识非常适合使用间隔重复,所以他们广泛使用了这种学习方法。实际上,Anki 的医学生分论坛的人数甚至超过了 Anki 的主论坛。
同样的,在学习语言的人群中,各种形式的间隔重复也颇为普遍。Duolingo 就融入了间隔重复。在沉浸式学习的过程中,间隔重复的存在更是顺理成章。早期的间隔重复工具,不论是莱特纳盒还是 Wozniak 的 SuperMemo,最初都是为了语言学习而设计的。因此,在语言学习这一块,间隔重复有很大的市场。当然,我们也可以以更多创新的方式来应用它。举个例子,Russell Simmons 曾向我指出,通过卡片学习单词往往会错过一些整合各种知识的机会。我们实际上应该多学习一些句子,或者至少向这个方向努力。Duolingo 就在做这样的事情。然而,对于 Reddit 上那些用间隔重复学习语言的论坛,多数人并没有这样做,但也有一些人做,这个问题复杂得多。在市场的边缘,我们需要一些早期的采用者去尝试一些可能还不太完善的东西,这可能会让他们受些伤,流点血,这就是人们不急于接受间隔重复的原因。
至于为何间隔重复在像学习量子物理这样的领域并未被广泛使用,其原因其实很简单,这基本上是成本问题。我可以利用间隔重复更快地学习量子物理,但这并不意味着一切都能如愿以偿。这不像学解剖学那样,只要你复习完卡片就能掌握。你还需要掌握一些其他的知识。我现在正在研究这些。同时,你还需要获取大量现在还很少有人知道的特殊知识,才能用好间隔重复。这也是我录制这个视频的原因之一,我想在实践中展示一些这方面的知识。既然市场无法对这件事情做出反应,那么现在的情况也就理所当然了。
Dwarkesh Patel 02:23:36
这个节点,算是我们这个合作项目的一个完美收尾了。这真的让人深感兴趣。
Andy Matuschak 02:23:44
非常感谢你。
Dwarkesh Patel 02:23:45
我们花了很多小时,获得了许多洞见,给了我很多思考的食粮。
Andy Matuschak 02:23:47
很好。谢谢你。
Dwarkesh Patel 02:23:48
好的,感谢你的参与。
更加灵活的助记媒介架构
原文:Architectures for a more flexible mnemonic medium | Patreon 上的 Andy Matuschak
本月的更新我想做些新尝试——分享一些尚未完成,稍显粗糙的设计工作。这样做有一点很矛盾,就是很多设计还没有敲定,向别人展示起来要费不少功夫。为了交代得通顺,就必须多做不少修修补补的工作。如果设计师在设计所或者公司里规模很大的小组里工作,对这套重活已经很习惯了。但我独立工作,这样做很不自然庆幸的是,你们很了解背景信息,所以我希望你们能忍一下,发挥些想象力。虽然本次讨论以概念为主,但也很依赖于实际界面,因此本文没有音频版本。
上个月我介绍了助记媒介的一个关键设计问题:它把作者放在驾驶座上,假设读者想线性、完整地阅读——并记忆!有时候,这种方式确实恰到好处,但在很多情况下,读者可能(合理地)希望能亲自驾驶,有目标、有计划地阅读。
为了实现这个目标,我开始反思这个媒介的原语。我希望避免创造出好几种不同的媒介「模式」,而是想找出一些基本的元素,这些元素在不同的情况下,能够被作者和读者以各种方式重新组合。当你找到正确的抽象方法,就会有一种「顺着宇宙的纹理」进行雕刻的感觉——感觉上更像是在发掘原本就存在的东西,而非从头创造。比如,VisiCalc 的单元格,文件和文件夹,贝塞尔曲线及其相应的画笔工具,Photoshop 的图层,等等,它们都有这种力量。
阅读场景和行为谱系
要找到这样的原语,通常意味着要找出许多种活动所共有的一些模式。因此,我分析了各种阅读情况,试图发现其中的共通性。
我找到了四个特定场景,这些场景对我们来说具有指导意义。当然,这并不意味着涵盖了所有情况,但它们覆盖了一个较大的范围,同时也揭示了这个问题的复杂性:
-
阅读一本引导式的入门读物,用来在一个自己感兴趣的新领域找到立足之地。如果你有兴趣的话,《量子国度》是一个很好的例子。
-
从经典文献中提取精华,辅助项目创作,或者满足兴趣。例如,如果你研究机器学习,你可能会仔细研究 GPT-3 的论文。
-
查询参考资料、年鉴或手册,以了解有关某个具体问题的信息。这将包括维基百科和我们的数据世界上的许多文章。但它也可能包括像「伟大的首席执行官」这样的手册,其结构设计上就考虑到了按需阅读。
-
为启发而阅读。《纽约客》的文章;反思性的博客文章;像《人类简史》或《思考快与慢》(假设这些主题不是你的创作重点)这样面向大众的非虚构读物。这类阅读通常是为了享受阅读的乐趣,所以读得相对轻松。
助记媒介是否应该覆盖所有这些不同的阅读场景?我其实心里没底。例如,对入门读物,它的好处很明显,但对于启发阅读,效果就没那么明显了。说实话,最省力的做法应该是专注于那些读者众多且兴趣相近的「关键」文本。然而,在设计中我悟出的一条原则是,尽管 80/20 原则有其道理,但为比你立即要实现的范围更大的目标进行设计往往颇具价值。后者可以帮你找到更通用的原语,这些元素能让你「逐步成长」。相反,过于追求 80/20 原则往往会构造出一种限制未来扩展的框架。更糟的是,一旦建立了这样的框架,可能会局限你对未来发展的想象力。当然,关键的挑战在于,你得找准问题的边界在哪。当你扩大问题范围时,设计难题将变得越来越棘手,而且跟你将要进行原型测试的实际情况的紧迫性可能会脱节。我是否应该尝试构建一种包含未来基于机器学习的卡片生成互动的设计架构?要不要全面整合个人知识管理系统的其他部分?我现在的答案是「不」,但我会试图考虑大范围的不同阅读场景。这些都是我认为,由专家撰写的间隔重复卡片可能大有裨益的场景。
这些阅读情境中的一个主要变化轴线是完整性。如果你正在阅读一本引导式的入门读物或学习一篇重要的出版物,你可能想记住所有的关键细节。但是,如果你在查阅像维基百科这样的参考资料,你可能会进行非线性的阅读,只关注文本中的部分内容——对应的,记忆系统也应做出相应的调整。同样地,在为启发而阅读时,你通常对完整性的需求就没那么高了:你可能会全文通读,但你大多只关心一些高层次的「要点」。需要注意的是,后两种情况在不完整性的性质上是有所不同的:在查阅参考资料时,读者希望记忆系统支持选择性和非线性,而为启发而阅读时,读者则希望记忆系统支持更高的粒度和较低的细节层次。
另一个重要的变化轴线是读者意图的可读性。入门读物将自己定位为明确的教学资源,因此作者可以默认读者确实想学习这些材料。让文本在某些地方中断,让你试着回忆关键细节,这完全在理。但在大多数其他情况下,嵌入式的复习可能与读者的意图相悖。例如,我们在读者对 David Chapman 的助记文章《地图、领土和元·理性》的反馈中,就能明显感受到这一点。你正在阅读以获得启发,然后——咣当——弹出一个界面元素,要求你记住论证的一些细枝末节。正如一位读者所指出的,这「感觉就像在学校」:这种要求与你的承诺水平格格不入。在许多情况下,嵌入式复习会显得太过教条或自以为是,好像作者在说,读者必须对他们的每个字眼都要深思熟虑。问题在于,有些读者将 Chapman 的文章当作是明确的教学资源来看待。对于这些读者来说,嵌入式复习反而是一大加分项,但作者无法事先知道哪个读者是哪种类型。这就需要媒介能够让读者自主选择,而不给人一种被强加的感觉。
我想介绍的最后一条变化轴线:读者自己写卡片的倾向性。比如你正在阅读一篇和你的创新项目有关的重要论文。你可能想记住作者描述的所有关键细节,但最重要的卡片可能是关于该论文对你自己想法的影响。同样,如果你在读一篇关于人际关系的文章,你可能会发现自己想写一两张卡片,将它与你自己的生活联系起来。但是,在阅读参考文献时,你通常只是获取现有的内容;在阅读入门读物时,你通常对主题的了解不足,无法自己构建太多联系。
因此,我们想确定助记媒介的原语,它们可以被读者和作者以不同的方式使用,以适应这些变化轴线的不同位置。
工作流和基本要求
我们可以从不同位置的典型工作流来考虑这个问题:
-
当完整性较高时,「在章节/页面中添加所有卡片」是常见的交互......但这些卡片可能会在未来的复习中进行迭代优化
-
当完整性较低时,媒介应提供方便的途径,让读者主动选择与自身有关的详细信息的卡片...
-
.....可以在阅读时因兴趣而产生的即兴反应,
-
......也可以在合适的停下来的地方回过头来决定哪些内容重要
-
-
当读者有明确的学习意图时,媒介时不时地提示他们回忆所读内容是受欢迎的
-
当读者的意图不明确时,媒介不应通过强迫他们复习来使他们感到不悦
-
当读者有可能写他们自己的卡片时,我看到有两个工作流值得关注:
-
当读者在阅读某段内容中突然发现一个他们想记住的联系,他们应该能立即记录下来
-
从我的个人经验来看,我觉得在读完一篇文章(或者对于较长的文章,在每个章节的结束处)反思「那又怎样?」然后针对我所观察到的情况写下卡片,是很自然的事情
-
-
当读者不太可能建立个人联系时,为编写卡片提供的功能不应妨碍收集作者卡片的工作流
这份工作流清单表明,除了现有的复习场景之外,还有三种重要的卡片展示场景:
-
在章节分隔或文章结束时,回顾性地批量展示卡片
-
在阅读过程中针对即时冲动做出反应的内联交互(「哦,让我们确保记住这一点!」)
-
在复习期间/之后/之间迭代优化,在 Orbit 应用的场景下,而不是在作者网页的环境下
读者可能会在这些场景中自由切换,因此我们不希望设置人为的边界。我们希望有某种基本的原语能够在各种场景中展示卡片——就像一条 Tweet 感觉像一个基本的对象,无论是独立嵌入、显示在列表中,还是部分构造在一个编辑界面中,都同样自在。在这些场景中,详细的功能可能会有所不同,但 Tweet 的形式始终保持一致,让人觉得在不同场景中都是「同一个东西」。
因为部分低完整性的工作流会让读者迅速浏览并从一系列可能的卡片中选取,所以卡片需要以紧凑的形式展示,这点非常关键。这也能帮助机器学习驱动的场景,因为我们可能无法精准地生成你想要的卡片,但如果我们能生产出十张卡片供你挑选,那成功的机会就会大大增加。
Jeffrey Heer 在他 2019 年的论文 Agency plus automation 中,找出了一种设计人工智能交互界面的重要模式:共享的表示方式,这种方式既可以由人创建,也可以由机器创建。这就让机器可以提出可能的行动方案,用户可以流畅地适应/采纳,同时用户的行动可以被机器学习系统以同样的方式理解。谷歌的搜索结果建议(如下所示,摘自 Heer 的论文)就是一个很好的简单例子。如果我们在未来追求基于机器学习的卡片生成,这一原则可能直接适用,但即使在现在,它也很适用于混合作者和读者卡片的问题。**作者的卡片应该与读者的卡片是同「一种东西」。**读者应该能够轻松地改编和修改作者的卡片,就像他们处理谷歌搜索结果建议一样。
对于列表展示方式,我总结出的核心需求就是流畅性。当面对一长列由作者或机器学习模型给出的潜在卡片时,读者应能迅速挑选出心仪的那些,然后进行必要的调整。比如,如果在编写卡片时,读者突然发现一条信息实际上可以分成两条,那么此过程不应需要频繁跳转不同的「界面」或「模式」。卡片编辑更像句子,我们通常进行整体修改;在写作或修改卡片时,我应该能随时观察到它的「邻居」的「周边视野」,就像在文本编辑器中编辑段落中的句子一样。
在过去的两年里,我一直在用文本编辑器在纯文本文件中写卡片,这种同时阅读和编辑多张卡片的灵活性让我深深着迷。[1] 我想把这种流畅性带到嵌入式阅读环境中,但比起我那种自由格式的文本文件,我更希望它的结构更为有序。那些待办事项应用给了我很大的启发,它们往往能提供一种连续的文本编辑环境,富于流畅性。苹果的「提醒事项」应用就非常接近我心中的理想状态:
这种连续文本编辑的方式有个好处,就是可以灵活地交换格式。你可以选中一堆卡片复制下来——它们不过是带有一些额外标记的 Markdown 文本。因此,你可以把它们粘贴到 Twitter、PDF 注释、源文件的评论部分等地方。同样,你也可以从这些地方复制纯文本卡片,并将其粘贴到 Orbit 中。复杂的卡片「生成器」可以在你选择的编辑器中作为宏来实现。我认为这种可塑性可能会带来一些出人意料的用户行为。
虽然我们常常不能强求读者去参与测试,但在长篇文章中,每个章节间隙都是嵌入交互的理想场所。假设作者做得很到位,章节本就能成为一个相对连贯的材料群。通过将交互元素放在章节末尾,能有效减轻读者在评估和选择相关卡片的压力:在许多情况下,章节会自然地反映出读者的兴趣边界。对本节有浓厚兴趣的读者可能会「添加全部」,然后删除一些不太有趣的卡片;而对本节只是粗略翻阅的读者,可能会忽略相关卡片,或者快速过目然后挑选出一两个。
另外,《量子国度》的读者报告了在章节间隙嵌入交互的一些有趣体验。这些复习环节提供了一种安全感:如果你在阅读时感到不踏实,也不用怕,很快就有一个复习环节来确认你是否理解了应该理解的东西,如果没有,你还会得到一些关于哪里需要更多关注的反馈。嵌入式的复习让他们在阅读的过程中有了明显的「进步」感:复习帮助他们感知到他们在理解主题上的进步。对其他读者来说,嵌入式的复习帮助他们调控自己的阅读节奏:「我读完了这一节,以为我理解了——但回答这些问题时,我发现我完全没有吸收!于是我又回去仔细地读了一遍。」当然,这些效果有其两面性。如果你对待文章的态度就像一个勤奋的学生,那么它们就很有帮助;而如果你是以一种更轻松或策略性的方式阅读,那么它们可能就成了媒介不适当的强加之物。
解决方案草图
我一直在探索可能满足所有这些特性的表示空间。这总是个反复调整的过程,这里展示的方案肯定还处在试验阶段。
首先,我们不应该对入门读物场景造成伤害。对于像《量子国度》这样的文本,我们仍然希望「默认」的阅读模式包含插入的复习环节,并「保存」遇到的所有卡片。但是在这些默认的情况下,我们也希望能给读者更多的控制权。如果一个问题显得毫无意义,那你就没必要去学习它。如果你想改写一个问题,你应该能够这样做。如果你想添加自己的卡片,那你也应该有这个权限。
我在这里的做法是:
-
入门读物和其他明确的教学媒介可以穿插嵌入的复习区,一开始,它们的行为与现在的模式差不多
-
但在复习过程中,读者可以根据自己的灵感逐步握紧主导权:
-
如果觉得某张卡片没什么意思,他们可以选择跳过
-
如果觉得某张卡片的措辞不太好,他们可以进行编辑
-
如果有灵感,他们可以亲自编写卡片
-
他们可以直接切换到列表视图,我稍后会介绍一下
-
-
读者复习过的卡片(但不包括他们跳过的卡片)会自动添加到他们的账户中;他们跳过的卡片不会
-
当他们完成复习集时,他们会看到一个鸟瞰式的卡片列表,在那里他们可以:
-
撤销自动添加复习过的卡片
-
有选择地添加/删除个别卡片
-
根据他们的喜好编辑和添加新卡片
-
实际的结果是:读者不需要进行任何额外的交互就能享受到当前的默认行为,但他们在复习之前、期间和之后都有一系列平滑的机会去修改这种行为。
你会注意到,后一张截图展示了一个列表风格的界面。这里的想法是,它是一张连续文本画布,就像前面的苹果提醒界面一样。因此,编写新卡片是一种内联体验(译注:直接在行内操作),而不是一种模态体验(译注:打开一个新的窗口):
同样的列表视图也可以在 Orbit 应用程序中用作「库」视图,以便随着时间的推移不断完善卡片,或者编写新卡片。
我在上面描述的工作流非常适合于入门读物和读者有明确学习意图的情况。在其他大部分情况下,这种做法可能会显得过于强硬,但如果我们简单地反转它——也就是说,使其默认显示列表视图,而不是复习模式,那么这种嵌入式元素在许多情况下应该都能派上用场。这种反转让它的情感色彩有了明显的转变:它不再是一个无情的强制命令,而变成了读者可以利用的工具。如果读者真的有意深入学习,他们可以从列表开始进行复习。
我觉得,将这种嵌入式列表用在博客文章的结尾,或者插在可能吸引各种不同兴趣读者的解释性材料中,都是非常有意义的。但对于许多论文的情境,我还是觉得它略嫌冒昧(毕竟它是一个占据视线的大元素,暗示着:「我的研究结果值得记忆」)。而且,对于特别低完整性的参考场景,如文章 Our World in Data,这样的工作流过于粗糙。
对于后一种情况,我认为内联的上下文交互会很有价值。从高层次来看,你或许只是想在读书时,把觉得重要的点给记下来,相信自己能像变魔术一样把这些内容吸收掉。当然,这个想法除了实现上的难题,理念上也有一些阻碍。我在分析《量子国度》的卡片时,发现约三分之一的卡片并不完全对应于文中的某个具体内容。相反,它们更像是将一大块内容进行综合(例如,「X 门的逆是什么?」)。这种稍微抽象一点的问题,比直接照搬文本的陈述性事实,往往带有更深的概念性——也更有用!因此,在很多情况下,你并不能直接找到一个特定的词句,让它自然地对应到最有用的卡片。
为了处理这类场景,我们或许可以另辟蹊径,而不是死守着精确到具体的文本段落。一个可能的做法是,在文中标记出特定的记号,提示读者「这块区域有相关的学习卡片可以参考」。那些帮助整体理解、综合性的问题,可能就会在介绍某个概念的几段文字之后的记号中出现。
注意,这个记号后面弹出的窗口里也展示了同样的卡片列表。
还有一个大胆一些的想法是,我们允许读者选取任何内容,然后我们直接展示出与那一区域相关联的所有卡片——像我前面提到的那样,这种综合性的卡片通常会关联到大片的文本。读者可以自由挑选哪些卡片对他们有帮助。
还有一种方法是设置一个常驻侧边栏,再次重述了列表表示,但布局参考了 Google 文档的评论功能,模糊定位。不过,这种常驻显示方式,对于 Orbit 的艺术方向来说可能有些过于强烈了。
不管我们追求哪种路径,只要你灵感来临,你都应该可以随时写下你自己的学习卡片,哪怕周围没有作者预设的卡片。
在概念上将嵌入式块与这些更内联的交互整合在一起,存在着许多挑战。在接下来的几周里,我将继续在这些架构上进行迭代,并着手制作交互原型。有新的进展,我会随时告诉你们!
————————
有一篇新的关于课堂上提取练习的系统综述论文(Agarwal et al, 2021)。一时兴起,我直播了关于这篇论文的写作笔记和 SRS 卡片。那些对我写笔记的做法感兴趣的人可能会发现这很有趣。
我要感谢 Ozzie Kirkby 对原型和讨论的贡献,这促成了这篇文章中提出的想法。我还要感谢 Nick Barr、Sara LaHue、Marcos Ojeda、Taylor Rogalski 和 Gary Wolf 提供的有益反馈和讨论。最后,感谢你们所有人的持续支持,使这项工作成为可能。
————————
[1] 我应该注意到,RemNote 在商业上一直在追求类似的想法。我没有在自己的工作中使用过这个产品,但他们最近的重新设计给我留下了深刻印象,他们精简了很多以前感觉很碍事的形式。我的主要兴趣仍然是传媒背景下的卡片,所以我很高兴看到这些人在个人笔记背景下的卡片写作环境方面取得了进展。
工具制造者/使用者合作的军械库
原文:Armories for tool-maker / tool-user collaborations | Patreon 上的 Andy Matuschak
Armories for tool-maker - tool-user collaborations.m4a
我以前曾说过,伟大的思想工具很少来自于专注于创造工具的环境。它们通常是某些领域的深度创造工作中的副产品。而且,这些工具的创造者,都极其熟悉这些创造性问题,且投入了不少心血。Stephen Wolfram 创造了 Mathematica 来加速他对细胞自动机的原创研究;Alan Kay 创造了 Smalltalk 来支持 PARC 的个人计算实验;Dan Bricklin 在商学院创造了 VisiCalc 来帮助解决金融模型。这三位发明家都是投身于原创领域问题的严肃计算机科学家。
在这些案例中,发明者的领域问题实际上是数学和计算,这当然更可能产生技能的重叠。我们发现另一个常见的重叠来源是计算机科学家在相对通用的领域发明工具。例如,Charles Simonyi(所见即所得文字处理器的发明者)是一位计算机科学家,但作为一名知识工作者,他当然很会写备忘录。这说明 Bravo(以及后来的 Word)的功能更适合写备忘录,而不是写小说。
在这些常见的重叠领域之外,很少有其他领域的佼佼者也是优秀的计算机科学家。在大多数领域,伟大的工具制造者很少是伟大的工具使用者,反之亦然。Michael Nielsen 曾指出,你可能宁愿让 Stradivarius 为你制作小提琴,而不是 Joshua Bell;反过来说,你也更希望听 Joshua Bell 演奏小提琴。每项活动——无论是小提琴制作还是演奏——都需要独立的精湛技艺和终生练习,而一个人很难同时拥有这两种能力!
但即使你身怀数技,将两者分开也可能有一些好处:工具制造者可以不断地考虑抽象和泛化,工具使用者可以专注于手头的有意义的问题,而不会被系统化分散注意力。
因此,有一些在「思想工具」方面的进展,可能取决于找到方法,让「工具制造者」与「工具使用者」——那些在某种意义上致力于演奏我们创造的乐器的人——紧密合作。这超出了像 IDEO 这样的公司所进行的典型的人群化「设计研究」:制琴师必须自己成为至少中等的「小提琴手」,融入这些社区,并能够对他们的问题做出原创性(但可能是有限的)贡献。同样地,工具使用者必须积极参与设计项目,足够了解工具的制造方式,以贡献有意义的想法。
Photoshop 是一个很好的例子:它是由计算机科学的研究生 Thomas Knoll 和他的兄弟 John Knoll 合作完成的,John Knoll 是工业光魔公司的一名特效艺术家。在开发量子国度时,我与 Michael Nielsen 进行了类似的安排;在研究可汗学院的新型教育环境时,我与像 Scott Farrar 这样的教师合作。
与单一有效的工具制造者/工具使用者的简单情况相比,安排这种结对合作更具挑战。我一直在收集关于这个领域的笔记,今天我想描述一个可能在媒介发明领域中很重要的策略。
「为了提高合作者的水平,研究另一个学科的问题,对我这个计算机科学家有什么帮助?在许多方面:
* 它让我们瞄准了相关的问题,而不仅仅是简单练习或小规模的问题。
* 它使我们对成功和失败保持诚实,这样我们就不会轻易欺骗自己。
* 它使我们面对整个问题,而不仅仅是简单或数学的部分。例如,在计算几何学中,我们不能避免碰撞点三倍体或共面点四倍体的情况。我们不能假设不具备条件的情况。
* 面对整个问题,反过来迫使我们学习或发展新的计算机科学,往往是我们本来不会涉及的领域。
* 抛去上述那些理由,光是站在那些发现蛋白质如何工作、或设计潜艇、或在纳米尺度上造物的巨人肩上审视问题,本身就件是有趣的事。」
——《The Computer Scientist as Toolsmith II(计算机科学家的使命是制造工具 II)》, Fred Brooks (1994).
建立一个军械库
在专注于媒介发明的合作中,工具使用者可能是作家、电影制片人或艺术家。他们是需要面对真实挑战的人——需要回答问题、或是需要叙述事物、亦或是需要探索美学。实际上,如果我们期望工具使用者在这些合作中推动使用的环境,他们将是创意合作项目的主要推动者:嘿,我的这个故事想法真的想用「非线性媒介」来表达。现在有了一个项目,而工具制作者可以开始围绕支持这些创造性目标的媒介进行构思了。
但这里有一个棘手的溯源的问题。如果伟大的创造性工作应该推动新媒介的发明,那么推动创造性工作的最初想法如何能在第一时间开始?
在这个模式中,最初的想法源自工具使用者,可能是半私密的修补或思考的结果。对于我们在非线性媒介中表达故事概念的例子,也许工具使用者是在阅读一篇关于 Twine 的文章时发觉了他们的想法,然后遇到了想法的一些限制,并向工具制作的合作者提到了这些限制。但这意味着,当工具使用者在改进可能成为新的创意项目的想法时,他们大多会采用那些几乎已经「在掌握之中」的工具。如果一对组合希望通过严肃的创意项目,来探索工具领域的一些想法,必然要求工具使用者将他们的想法变得精确和具象化。这对组合必须积极主动地开发一个工具想法的军械库(雏形和成熟均可),以武装工具使用者的探索。
军械库中的工具想法不一定是可以使用的软件。它们只是必须足够坚实,很好理解,以便工具使用者能够在新出现的创造性项目中对其进行修补。例如,当 Michael 开始写《量子国度》时,该软件只是一个早期的草图:重要的是他对这个想法的形状有足够的了解,能够想象出一本书来有力地实现它。在勾画这本书的时候,(有一段时间)只写 「问题:一个量子比特的向量空间有多少维度?」就可以了。在文本中。助记媒介背后的核心理念已经「在军械库中」,建立在多年的间隔重复系统的实验上。
军械库对使用者和制造者的关系和分工有重要影响。工具制造者并没有构思创意项目,所以如果有一个工具制造者认为有前途的想法,他们必须推动其发展,使工具的想法「进入军械库」,这样它就可以激发未来的创意项目。另一方面,工具使用者大多不开发工具创意,所以如果他们被一个工具创意打动,但这个创意还没有稳固到「进入军械库」的程度,他们应该能够依靠工具制造者来推动这个创意的发展,直到它准备好进入军械库。
在这两种情况下,使用者和制造者必须为军械库发展创意,而这些创意不一定会被未来的项目所使用。进入军械库,只是创意在严肃的创作项目中使用的必要(但完全不是充分)前置条件。
这种构思在反复合作的情况下大多是有用的,特别是在不同的项目中。当工具使用者在严肃的创意项目中部署他们的工具想法时,这对组合可以学到很多东西,但每个项目的迭代范围有限。这是因为在延迟和中断的情况下很难与一个创意项目保持情感联系。
要知道为什么,想象一下,工具使用者已经用一种新的媒介写了一本书的初稿。从该草稿卡片中得到的教训促使这对媒介的想法得到了新的迭代。尽管工具使用者可能对这些探索很感兴趣,但他们很可能对使用新的媒介迭代完全重写这本书不感兴趣。媒介可以有一些发展——特别是在起草过程的早期——但它迅速地驶达了一个魄力的极限。
如果每个创意项目所涉及的工具在该项目过程中只能进行有限的进化,那么每个项目的工具前沿基本上是由项目开始时的工具状态决定的。这一挑战表明,这对搭档可以通过一连串的创意项目来最好地发展他们的想法。
这些一连串的项目的大小本身也有讲究。较小的项目将支持更多的工具迭代——更高的「学习率」,如果你愿意的话。但是,小项目可能不够严肃,不足以发展工具的想法。我想,理想的情况是,这对组合应当追求那些足够严肃、但又尽可能小的项目。
当我在潜在的合作背景下与作者和教师交谈时,我看到这些动力在实践中发挥着作用。他们往往对我所表达的媒介概念感到兴奋,因此他们建议使用我所发表的概念的项目或背景。很自然,他们对项目的想法偏向于那些新媒介概念的最易理解的路径。但当然,推动这些想法的方法是把重点放在最不为理解的概念上。
如果我想实现这一点,我需要使这些想法更加具体和容易掌握,换句话说,我需要把它们添加到共享的武器库中。当然,我需要更深入地内化我的合作者的创造性领域,这样我就可以用最适合他们的问题的概念来储备武器库。
成为一名「人工」智能学习助理
原文:Becoming a Wizard-of-Oz learning assistant | Patreon
如我去年 12 月所述,我正在尝试一些对我而言颇为新奇的研究方法。通过数据分析和众多用户访谈,我已经对学习活动有了一种鸟瞰全局的感觉。而现在,我开始转变角度,深入挖掘,试图理解每一项学习行为和设计决策随时间演变后在情感和实践上的影响。
这里再次阐述我(虽然颇为荒诞)的追求:我希望能发明一个彻底变革的学习和成长环境。我想让人产生一种奇妙、近乎陌生的,毫不费力且高效的感觉。到目前为止,我一直在通过构建和迭代可扩展的系统来追求这个目标。但现在,在开始系统化或扩大规模之前,我打算先为一个人打造出那种奇妙的感觉。我想让一个人感觉到他被赋予了不可能的超能力。如果我能一次又一次做到,我希望我能找到在一个系统中捕获那种「闪电」的方法——这样的系统将比我在「系统空间」中迭代创造的系统更为强大。至少,我期待这种 N-of-1* 研究方式会带来一些不寻常的洞察。(*译注:在临床医学中,N-of-1 是一种研究设计,单个患者是分析单位,并作为他或她自己的对照。N-of-1 试验也叫单病例随机对照试验。)
结识 Alex
因此,在过去的一个月里,我一直在担任 Alex(这个名字和性别都是随机挑选的)的「个人学习助理/教练」。他是个富有创新精神、极具进取心的成年人,正在一家初创公司工作。去年,通过朋友的引荐,他遇到了一些正在研究物理学中一项鲜为人知问题的研究者。对此,Alex 对此产生了极大的兴趣,他决定要做出贡献。但是,他面临着一个「小小的」问题:他并没有深入研究过很多高级物理学知识。
去年 12 月,Alex 开启了为期六个月的全职学习之旅。他的目标是理解这个领域的最新成果,并能在讨论这个问题的过程中发挥自己的作用。他雇了两个导师(一个教数学,一个教物理),并开始研读相关的论文和教材。
我提议在他的学习中全程伴随,就像他肩头的一只小精灵,尽我们认为最有用的方式帮助他。我预期会使用记忆系统干预:Alex 已经有使用 Anki 软件学习和编写概念材料卡片的经验。但是,我故意保留了领域的开放性,为可能的创新实验留下空间——无论当前看起来对手头问题最有效的方法是什么。
对我来说,这是一个不太舒服的安排……我认为这是好事。我的实践、经验和文化都专注于抽象和系统化。我心中有一部分总觉得,N-of-1 的洞见都是「虚假」的,当我为单一用户精心定制一次性用品时,我感觉并没有在「做实质性的工作」。挑战这些预设观念,将我的研究领域扩展到新的方向,既令人满意又具有挑战性。现在,我已经在这个实验中度过了四周的时间,我发现,比过去几年,我与设计空间的联系在许多方面都变得更加丰富、深厚。
真实项目的推动力
在我听到 Alex 的计划和他的辅导课程时,我首先感受到的就是他的项目带来的持续的推动力——那些他想理解但又无法理解的论文,那些他无法评估的论点。
举个例子:Alex 的辅导课主要受他提出的一系列问题的驱动,而非导师安排他接下来要学的内容。Alex 的问题既非抽象,也非学术。这些问题是他非常关心的事情中的现实难题。他的项目驱动着学习循环:决定接下来学什么,评估何时理解得够透彻,以及何时该进入下一阶段。而这个特殊的项目在每一步都要求深入的理解。
过去几年里,我访谈并观察了众多的学习者,然而这对我来说是一种全新的学习行为模式。我的直觉告诉我,这正是我的工作所需的那种压力。
我之前观察过的认真投入的参与者,他们的行为大多遵循两种模式。
我称第一种模式为「大纲式学习」,这种模式的目标是「学习某个主题」。有时这意味着试图通过考试或面试。有时这会带来一种义务感觉,觉得是「应该」做的事,例如「我一直觉得我『应该』好好学习统计学」。有时心中有一个项目或兴趣——「温习概率论知识可能对我的数据科学工作有帮助」——但这个项目并没有在日常生活中推动学习循环。它们的共同点在于,学习者与学习内容的情感联系是抽象的。一个外部结构(通常是课程或教材)主导着学习循环:决定下一步要学什么,何时理解得足够,何时该进入下一阶段。大部分的这类学习者并不真正试图把材料内化;他们试图「完成课程」。如果他们能够「应付」他们「应该」做的阅读和练习,那么他们就会觉得大纲式学习已经足够了。
我称第二种模式为「探索式学习」。有人阅读《量子国度》,只是因为他们对量子计算好奇。周日喝着咖啡,寻觅新知,寻找快乐的火花,或者未来的行动灵感。新鲜感和兴趣是他们学习的引擎:决定下一步学什么,知道何时已经理解够了,选择何时前进。由于这种好奇心往往不太会深入到细节,探索式学习通常只是尝试理解结果、方法和思路,而不一定要深究其底层原理。
可能你会认为我在贬低这些学习模式,但我并无此意!这些模式都有其用处;人们(包括我自己)之所以选择这些模式,肯定是有原因的。大纲式学习可以让你以较低的成本,在某个主题上有初步的了解。探索式学习则非常适合向自己介绍各种各样的想法。无论是哪种情况,初步的接触可以指导未来的项目和更深入的学习。
但话说回来,作为一名设计师,我现在正努力创造一种环境,这种环境可以帮助人们深入理解艰深的主题。这样的环境可能对大纲式学习和探索式学习都有所帮助。但这些模式并没有真正提供合适的压力,帮助我创造这种环境。这就像是试图根据那些在城市街道上开车的通勤者的反馈来设计赛车。他们可能会说:「嗯,看起来它能跑得很快。」
因此,我从和 Alex 的合作中获得的第一个重要洞见是:哇,好啊,这才是我想要的压力。炽烈的学习。他被一个项目所驱动,这个项目要求他理解艰深的材料。他对项目的情感投入促使他真正理解材料,而不仅仅是像在大纲式学习中那样「应付」过去。与探索式学习不同的是,这个项目坚决要求他理解到每一个细节。这是一种要求极高的学习模式。在没有援助的情况下,Alex 真的很挣扎。他非常需要帮助。他把赛车带到了一条艰巨的赛道上,尝试打破一个难以匹敌的记录。性能上的任何微小变化都变得极其明显;任何小小的困扰都变成了大麻烦。对我这个设计师来说,这是一个信号强烈、充满活力的环境。
作为强大设计输入的辅导课文字记录
我提出的第一个干预措施是:设想我给你一支特殊的紫色荧光笔和紫色钢笔。当你阅读或做笔记的时候,你将获得新的能力。如果某些内容看起来特别重要或有趣,只需用你的紫色钢笔写下来,或者用你的紫色荧光笔标记。然后,就像魔法一样(通过我像「人工」智能般的努力),你会发现你的记忆系统里开始充满这个材料的各种卡片,以确保你能够内化它。
但是,起码在我们开始的时候,对 Alex 来说最重要的材料并不是来自教材或他自己的笔记——而是来自他的辅导课。幸运的是,他用 Otter 记录了每一次课程的内容,所以他能把音频和对应的文字记录发给我。对于学习系统的设计师来说,这是多么难得的材料啊!这种对话形式让我能看到许多原本对我不可见、隐藏在 Alex 头脑中的内容。
在开展这个项目之前,我一直在思考,如何才能深入洞察 Alex 的认知发展情况。但有了这些文字记录,导师们在很大程度上帮我解决了这个难题。他们提出问题、设计难题,深入考察 Alex 的理解。通过他的回答,我获得了一个关于困扰、自信、挫败、兴趣、惊奇、迟缓和熟练程度的细腻画面。这比我过去收集的任何日记、访谈或观察中所得到的材料都要丰富得多。部分原因在于,导师提的问题是为了帮助 Alex,而当我问访谈对象类似的问题时(比如「你能试试为我解释一下 X 吗?」),更多地是为了帮助作为研究者的我自己。在这种情境下,人们的投入和情感联系要强得多。
因此,我一直在听着这些辅导录音,只要有重要的内容出现,我就会写下卡片。这种方式让「豁然开朗的瞬间」出奇地明显。我可以相当准确地从 Alex 的声音中听出他何时感到惊讶,何时在学习新东西,何时发现了某些重要的事情。我大多数时候并不需要靠紫色荧光笔来帮我找到他想要内化的时刻。但这并不意味着我总能分辨出该时刻令人惊讶或兴奋的具体内容。有好几次我找对了时刻,却对错误的内容编写的卡片。当然,靠他的语气找出这些时刻确实挺费时。我们想要弄个「遥控器」,让 Alex 能实时地标出那些我需要回顾的重要时刻。
辅导课还产生了有力的参考点,从感性层面锚定记忆卡片。比如,有一次,Alex 在处理一个棘手问题时深感困惑,因为他误解了矩阵运算的一个基本特性。我为相关的线性代数问题写了一些抽象的卡片,而他机智地建议:我可以在卡片的答案里添加一个「动机」说明,以阐明这个卡片是如何与他真正关心的物理讨论中的困惑联系起来的。这看起来是个好主意。我写的问题既抽象又直接。很容易想象,几个月后,当这个问题再次出现时,他可能会疑惑:「“为什么我会收到这个随机的关于矩阵的抽象数学问题?谁在乎?」在我自己的学习实践中,我经常遇到这种情况。但如果我能将这个问题与一个深入的讨论、经历或项目联系起来,我想重新激发我的兴趣应该不会太难。Alex 对「冬季」说明的第一印象非常积极。我很好奇他在几个月后会有什么感想。
我的一个目标,就是理解记忆系统卡片与实际流利度之间的联系。在何种情境下,他们两者能够相辅相成?效果有多好?是不是某类特定的卡片对这种技能迁移更为关键呢?我目前的记忆实践在培养实际流利度方面,又有哪些短板呢?在这些辅导课中,我遇到了一个例子,让我对这最后一个问题有了新的认识。虽然 Alex 有大量关于量子系统测量的记忆卡片,但是当他真要动手写出系统的状态,并在测量的情境下操作它们时,仍然感觉笨手笨脚,迟疑不决。我想,这可能是因为记忆卡片都只是停留在理论层面,比如法则、定义、性质等等,但它们并没有真正练习应用那些知识。我想试一试更偏向「练习」的卡片,看看效果如何。
辅导课文字记录的形式也提供了一些我之前可能未曾考虑的方便之处。例如,我注意到有时在 Alex 提出一个问题后,对话在完全解决问题之前就不知不觉地偏离了主题。我能够用诸如「这个问题回答了吗?」和「你对此还感到困惑吗?」这样的注释来标记它们。在某些情况下,Alex 告诉我他其实已经意识到了这个情况,并决定那个问题并不重要;而在其他情况下,他发现指出困惑仍然存在是有用的。他已经建立了一个待解决问题的队列(我想,部分是作为这些辅导课的素材),所以这些已提出但还未解答的问题有了一个自然的归宿。可以想见,在未来的学习环境中,这些问题可以自动呈现。
关于这些辅导课的最后一点说明。对 Alex 来说,早在我来之前,这些录音就已经带来了翻天覆地的变化。他在我们的一次谈话中,对他的音频转录应用 Otter 赞不绝口:「没有 Otter,我简直感到手足无措。[笑]……复习这些课程……这可是学习这些东西的关键……我一开始接触时记不住那么多。[我也]无法抓住足够的信息来制作[记忆系统]卡片。我真是觉得 Otter 对我帮助太大了!」作为一个系统设计师,我感到很惭愧。
在这里,我得提一句,Alex 在刚才的那段话中谈到了复习辅导课程对他的重要性。在我们开始合作之前,他已经在反复细读文字记录,把自己仍然感到困惑的地方都标出来,并编写自己的记忆卡片。对于我给他写记忆卡片这件事,他起初有点疑虑:「这会不会让我变懒?」可能会。这里的确有取舍。情况复杂。从经验上看,他很愿意用我给他写的这些卡片。我希望随着时间的推移,我能对这些取舍有更深的理解。
在复习环节大声思考
另一个让我眼前一亮的事情是一段十五分钟的视频片段。我想知道,几周后,我写的这些卡片会给人带来什么感觉。它们在哪些地方让人觉得枯燥?哪些地方又起到了帮助?哪些地方没击中要害?Alex 能否察觉到某张卡片如何影响他实践的熟练度?因此,我首先要求他提供反馈,建议他在做记忆系统复习时顺便做些笔记。这些笔记的确对我有点帮助,但我希望得到更多的详细信息。我也担心那些笔记过于精挑细选,稍显生硬。所以,我问 Alex 他是否愿意在他复习时,用 iOS 的屏幕录制功能,一边复习一边说出他的想法。
还有,这太神奇了!我觉得我好像触碰到了一个新境界,那是关于为别人编写记忆系统卡片这件事的新洞见。以前,我在读者初次阅读助记文章时,就已经收到他们对每张卡片的第一反应。那些观察对我非常有益,但其实也有局限性——那些读者对卡片的理解还不够深入。但从 Alex 那儿,我却能得到对每张卡片反应,像这样的:
-
「我知道答案,可我发现我并不清楚为啥这就是答案。我只是在机械复述。」
-
「只要这道题一出现,我总忍不住想赶紧过掉。看那一大堆文字就让人浑身不自在。」
-
「我在机械地回答这个问题,脑子根本没怎么动过。」
-
「我感觉这个问题跟前面的那个差不多。」(实际上并非如此...但这样的感觉却透露出了一些有趣的信息)
-
「这张卡片对我来说真的很有用,我注意到在辅导课上已经碰到过好几回了。」
-
「刚开始这个问题还挺有帮助,但现在我觉得我已经烂熟于心了,继续被问到就有点烦了。」
-
「我觉得这张卡片其实应该拆成两个问题。」
有时候,这样的反馈促使我重写卡片或编写新卡片。另一些时候,合适的做法是把一些问题放到 Alex 的待解答问题队列里。还有一些时候,问题似乎更多地出在系统本身。不管怎样,我深信这种方式为我们提供了一个更有效的反馈循环。
在 Alex 的反馈中,一个常见问题是:很难真正准确地把握卡片的目标。我经常写出了乍一看没问题的卡片,使用了所有正确的关键词。但当 Alex 练习它,他发现它并没有强化恰当的方面。又或者,我写的一张关于他曾困惑的事情的卡片,他现在可以回答了…但他仍旧感到困惑;有些重要的东西我没能捕捉到。这种情况与我试图让大语言模型写出好卡片时的体验相吻合。模型能写出看似卡片的文本,里面也都是正确的词,但大多数时候,这些卡片都会微妙地(或者不那么微妙地)偏离了目标。更麻烦的是:通常很难评估一张卡片是否准确,也难以表述它偏离目标的方式。在很多这样的情况下,我觉得可能我们可能无法(无论是人还是语言模型)在首次尝试时就精准打中目标。卡片的编写过程,可能真的需要后续复习环节对反馈压力,才能恰当地给卡片塑形。
从更实际的角度说,这些录制的课程,似乎是改善记忆系统的一个好办法,可以通过引发和解决细致的摩擦日志,来实现一些唾手可及的改进。比如说,Alex 在面对许多题目时,发现自己忍不住想一头扎进去,但又被大段大段的文字吓住了。回头一看,这个反应也在情理之中。他在用 Anki——我猜可能是因为 Anki 最初设计用来背单词——它对长文本的默认排版真的很糟糕。更结构一点,确实应该有一个层次分明的区分,一个是应该检查的「答案」,另一个是如果想要更多细节可以阅读的较长解释。如果两者的呈现方式相同,那么答案部分就会显得异常庞大。(在《量子国度》中我们也遇到了相同的问题,并在卡片背面的可展开部分放置了解释。)所以我进行了一个快速的排版优化,对扩展解释采用了不同的样式。下面有个我修改前后的对比;Alex 反馈说,现在这些卡片看起来舒服多了。
这种事儿小菜一碟,说白了并不算什么大不了的事。但如果我们多做做这类尝试,就能更清晰地看出这些系统真正的界限,不会被无谓的阻碍扭曲了视线。
下一步
虽然刚过去几个星期,我还在试探着脚步;我们也在摸索如何更好地协同工作。说实话,我还没能创造出有革命性突破的工具。但我兴奋得很,比以往任何时候都更快地打造原型,并且我觉得我正在吸收大量知识,即使我还无法具体地表达出来。
我眼下要解决的挑战,就是找到一个好方法来「深入」Alex 的学习循环。在我们刚开始的几轮合作中,他可能在周一提出一个问题,周二去找导师辅导,周三接收我给出的卡片,周四开始复习,周五在我面前反馈学习情况。我们已经将这个过程缩短了几天,而每天关于他的学习计划和遇到的困难的讨论,也让我能更迅速地回应。部分困难在于,我一边进行这个过程,一边还要构建原型,这自然要花费一些时间。可能当我那个「武器库」建立得更为稳固后,跟上他的学习节奏就会容易些。
这次的经历真是热血沸腾,让人心潮澎湃。我们两个人都感觉如烈火中炼,相当激烈!Alex 他挑战的是难题,既要吸收深奥的知识,又得在有限的时间里去探索未解的问题。而我这边,想要通过第二方的干预,给他的学习之旅带来深远的影响。这两个任务对我们来说都像是登天一样困难。我想,有种同病相怜的感觉或许能助我们一臂之力,但说实话,压力之大让人有些喘不过气来,然而紧接着的总是满满的兴奋感。总的来说,我已经迫不及待,想要迎接接下来的挑战。
————————
首先,我要特别感谢 Alex,他勇敢地把自己的学习之旅向我敞开心扉。我也要感谢 Michael Nielsen,Gary Wolf,Robert Ochshorn,Ben Reinhardt,Joe Edelman 和 Nick Barr,他们关于这项工作的深入讨论给我带来了很大的帮助。
被「怎么做」蒙蔽了双眼
原文:Square Signals : Blinded by "how" (andymatuschak.org)
想象一下,你刚搬到一座新城市。每次出门,你都靠一台导航仪告诉你怎么走。但导航仪并不给你看地图,只告诉你走几步、往哪儿拐。出门时,你得戴上眼罩,街名和地标都看不见。但是,经过这么多年,你每次都能准时到达目的地,所以你也没抱怨.
按照这种方式导航,如果没有逐步的指示,你根本不知道如何去一个新地点。你不可能在路上发现什么意料之外的事,也找不出更快到达目的地的捷径,甚至连一个地方和另一个你去过的地方是相邻的都察觉不到。但这恰恰就是我们平时被教育的方式!
这种对待知识的方式几乎无所不在:数学生背一堆特定形式的函数的积分步骤,物理学生将旋转运动方程与线性运动方程分开背诵,而计算机学生死记硬背数据结构的各种特点。他们知道「怎么做」,但对「为什么」却一无所知。这种学习方式是很多人一直到毕业都在用的。
这种只学习一个领域的结果——但不理解背后原理的学生——基本上出社会也只能做些职业贡献。他只能照葫芦画瓢,用在学校里学到的怎么做来处理老师早就教过的问题。但没有了背后的为什么支撑,面对新情况他就束手无策了,就跟那个戴着眼罩在城市里走路的人差不多。
当然,人不可能什么都懂,什么都知道!搞明白「为什么」自然比单纯知道「怎么做」费劲多了。有时候,先知道个大概结果,也能激发你去深挖背后的原理。但麻烦的是,当我们误以为知道了「怎么做」就是真正懂了某事,那就走偏了——这种半桶水的知识容易束缚人,还可能拖后腿。我见过很多人,因为这种知识而变得过于保守,害怕尝试新事物,更糟糕的是,他们沾沾自喜,原地踏步。很多行业里的老鸟,往往也就像是走路带着眼罩,只知道数步数,却看不到前方的路。
我很幸运,生活和工作中,我身边都是一群才华横溢的人。当然,我们应该肯定身边人的才华和贡献,但有时我和他人发出的赞美,却带有些不同的意味。是那种几乎是叹气的、无助的、沮丧的赞叹:「唉,那家伙真的是太牛了。」
对他人的欣赏其实能带给我们动力。它可能会让你意识到自己在哪里需要更努力(e.g. 「唔,我好像得补补我的统计学」),或者启发你如何去解决问题(e.g. 「也许那种方法可以应用在同类问题上」)。但那种「真的太牛了」的赞叹背后,隐藏着恐吓。它无法带来见解,因为它其实是在说「我怎么也达不到他那样」。这就像是我们想去一个地方,但导航并不知道路,自己又无法摘下眼罩。
知识可以指引我们从 A 走到 B——从仰慕者变成榜样。但单靠导航仪提供的脚步数的知识,对规划路线去新的地方显得太过狭隘。要真正探索新路,你需要更广阔的视角——一张地图。每当我自察到赞叹得有点失态,我会摘下眼罩,开始探索周围的环境,绘制一张地图,找一条回家的路。
但在我生命中很多时光里,我都不知道自己带着眼罩,更别提摘下它了。我误将那些按步骤的指示当作了真正的理解。我把「怎么做」和明白「为什么」当做一回事。这些背下来的事实和程序性知识变成了「虚假知识」,有时候比一无所知还糟。(*译注:有点过于抽象了,举个例子:搞 AI 的被 chatgpt 破防了 / 用 python 的不知道 List 背后是数组 )
我从未想过可以用另一种方式来获取知识:毕竟,我周围的人似乎都是按照同样的方式来获取方向的。我从未见过有人摘下他们的眼罩——我该怎么做呢?有谁能指点我该怎么开拓自己的路?我怎么知道我知道了什么?
有时,这种「虚假知识」会引发更强烈的恐惧。有一天,你受邀去一个很远的地方会面。但你的导航从没听过那,你也不知道怎么走。时间渐渐接近,心里的疑惑也随之增多。过去,你总觉得跟着它走就对了。难道真有它不知道的地方吗?有多少这样的地方?它们难道都不重要?你觉得你自己很会导航 —— 难道以前都是靠的运气?
这一连串的想法真是吓人。每一步都在放大不断增长的认知失调。这时,很明显得换种方法来认识事物了。但由于要消除这种失调的压力太大,人们更容易主动回避,逃避那些引发疑问的目标。
另一种方式看起来并不怎么好。这意味着你要鼓起勇气,承认自己所懂的远比想象中的要少。你需要去探索出背后的一群「为什么」,从而衍生出新的一群「怎么做」。因为你正在绘制地图(首先你会明白你需要一张地图,然后才是这张地图到底是什么),所以一开始,你到任何地方都得多花点儿时间。最后容易得到一些结论是:你根本不需要去会面;你不能理解某段数学证明,只有「真正聪明」的人才能;你没办法处理问题,应该「让专家」来处理。
这回,情况比单纯的惊慌失措还糟。认知失调的压力,直接让你放弃了深究事情真相的路。
我见过一些人,当这种恐惧越积越多,特别是在连续几年的顺风顺水后,会涌现出更大的隐患。有时,单纯逃避导航不知之地并不能解决渐增的认知失调。你可能还会劝其他人也不要去那些未知之地。你甚至必须说服自己去那儿的都是蠢货或者害虫,认为他们的导航一定会带歪他们。现在,你已经是个「狂信徒」了。
你并不知道,那些另辟蹊径的人其实并没有被蒙蔽双眼。他们是凭地图行走的,每个人都有自己手绘的地图,他们互相协作,补充其中的细节。
当这些深信不疑的观念在知识“权贵”心中滋生,它们会变得十分危险。强烈的失调会迫使这个狂信徒动用他的权力来维持现状,逼迫他人的方法不超过他能理解的范围,并将问题扭曲成他早已背下的答案所能解决的那种。对于这位狂信徒来说,任何激进的思想是都是对心理健康的威胁。
所以,当这种人能够影响他人,或掌控他人所依赖的东西时,众人就有麻烦了。无论怎么努力,新问题都会涌现出来,而他们的导航仪里不可能提前编入所有问题的解决方案。早晚有一天,会有一个没有预设答案的问题出现。这位狂信徒需要调动他所有的理解来合成一个新答案,但问题是,他什么都不理解,他只不过是记住了一些结论罢了。
在软件工程领域,有许多这样的狂信徒,他们固执地维护这种停滞不前的状态:他们只懂一种编程语言,只想了解这一种,认为这是最好的,其它语言都是垃圾。Steve Yegge 分享过自己从这种偏见中觉醒的经历:
当程序员花费多年时间死记硬背这些编程「咒语」后,告诉他们他们辛苦掌握的编程语言即将被淘汰,那感觉简直就像拿刀对着他们家人呢 …… 编程语言的宗教狂热很容易破解:你只需要编写一个编译器。…… 在此之后的几周,你再看自己的代码都会透视其背后的机制,就像你长时间盯着随机点立体图时的那种感觉。
能够熟练地敲出正确的代码,就像是一位萨满,祈求机器之神,得到你希望的计算结果,这感觉真好。但当你写一个编译器后,那些神话就会破灭,你再也不能创造真正的「魔法」。但你在刺激上失去什么,就在能力上获得什么:对编程语言和与语言相关的工具的掌控力。你会快速而无畏地掌握新的编程语言。你可能失去了那种盲目的信仰,但你会更深入地了解程序那令人心醉的美丽结构。
我的故事,其实起始于物理。我花了好几年时间去背那些物理公式,但背后的推导、它们的关系、它们的意义,我一窍不通。我只知道用这些公式来算题,至于为什么要这么算,一头雾水。这就是我们被教的方式,看起来,连老师也只是这样理解这些内容。
我尝试制作物理效果的游戏,但遇到了预料之中的问题:面对新问题时,我完全不知所措;看到那些成功的游戏开发者,我感到畏惧;这种恐惧建立后,我积极拒绝去深入理解其中的原理,我总是告诉自己,从网上随便搜点代码,拼凑一下就能应付过去。幸好,我当时并没有真正地为了维持这种现状而努力。
在加州理工的大一,有一堂课彻底颠覆了我对物理的学习方式。那是我首次真心对待学科,摘下「眼罩」。在之后的两年,我痛彻心扉地发现,实际上,我对很多事情,包括我最擅长的计算机科学,都缺乏真正的理解。
那堂课是这样的:我们刚学完狭义相对论和电学知识。教授走进教室,把这两块知识巧妙地串联起来。他说:「假设我们有一个电子以相对论的速度沿着导线移动...」他开始写下熟悉的电学和相对论方程。几块黑板的代数运算后,[磁场的方程就这样...出现了](https://href.li/?http://books.google.com/books?id=hlRhwGK40fgC&pg=SA13-PA6&lpg=SA13-PA6&dq="The+relativity+of+magnetic+and+electric+fields"&source=bl&ots=G2RPq-eVq2&sig=5Vh7tDOGUw7nc81NrZVBRYb0tH0&hl=en&sa=X&ei=aeZSUvbvJ6r-igL4y4D4DQ&ved=0CEIQ6AEwAw#v=onepage&q="The relativity of magnetic and electric fields"&f=false)。
那个公式,我早就背下来了,但从未理解过它背后的意义。电与磁,原来差的只是一个看问题的角度。那一刻,我恍然大悟,从此开始对一切都充满好奇,想要深入探究其背后的为什么。
将想法送入你的轨道(Orbit)
原文:Bringing ideas into your Orbit | Patreon 上的 Andy Matuschak
正如我在最近的帖子中提到的,我在过去的几个月里一直在建设基础设施,我希望这将有助于我(和其他人!)围绕助记媒介这样的系统,探索更广泛的想法。从某种真正意义上说,这感觉就像我在建立我的研究实验室!
构建这样系统的一个奇怪之处在于,我对我正在构建的东西只有模糊的构想。我建造这个东西是为了观察,这样我才能建造这个东西,然后继续这个循环。由于我对核心结构的认知在不断发展,所以下面的内容都充满推测!但我觉得,你们可能会喜欢听听我现在是怎么想的。
几十年来,计算机操作系统总是地内置一套差别不大的个人信息管理工具:地址簿、日历、电子邮件客户端、某些基本笔记功能、文件和文件夹等。这些工具的设计与封闭自成一体的 App 不同。典型的 App 想要从头到尾承担一套工作流程。而操作系统的软件虽然基础,但更具通用性。每个软件既是工具也是服务,可以通过 API 构建的集成服务,在整个操作系统中充分沟通连接。可以在电子邮件里向日历中添加事件,在聊天应用程序中输入联系人的姓名便自动填充,在多个应用程序中打开文件,保存到相同文件夹,等等。最近,我们已经开始期待这些功能能够在各处无缝同步,并与各种网络服务通讯。
如果在「操作系统层面」上有间隔重复记忆系统,那会怎样?如果将卡片设计得更像文件夹里的文件,在整个系统和网络上的其他服务中都可读可写,而非像 Anki 或其他现存工具的卡片,存储在 App 的袖珍天地里,那会怎么样?
网络文章可以呈现嵌入行文的卡片,这些卡片可能由作者编写,如助记媒介的卡片,也可能由读者编写,如《天才/假设》。你可以边阅读边灵活地导入卡片,就像你的浏览器在阅读时形成历史记录一样。
你的 PDF 和电子书阅读器中的标注,可以自然地这个中心化的 SRS 中找到,而不是封存在某个无法访问的侧边栏中。
现代操作系统,会根据聊天消息或电子邮件,尝试创建日历事件或建立联系人。类似地,SRS 系统也可能根据你标为书签的链接,或重复搜索的短语,来尝试创建 SRS 卡片。
当你在日常会议上记笔记时,你可以用特殊的标签来标记关键的见解,以将其加入这个系统中——或许未来文字处理器的格式栏,将包括添加粗体、斜体、下划线等按钮……和「待复习」按钮。我已经为自己建立了这种「个人助记媒介」,并且在过去四个月里一直在使用它。我还没有过多地谈论它,因为它非常奇怪,我不了解它。但它很吸引人,而且我认为——前景可期!
但是,一旦你的想法中, SRS 除了用来记忆还有更多用处,这些想法就会变得更加有趣。
在《量子国度》的最后一章中,我们尝试使用间隔重复的卡片来帮助读者应用他们所学到的知识,除了记住他们所学到的知识之外。在我们个人的 Anki 实践中,迈克尔·尼尔森和我已经试验了几年利用这些互动来促进综合和思考。在过去的一年里,我一直在试验利用这些互动来支持渐进的创造性工作和我的阅读队列。
例如,你现在抬起手腕,对智能手表说:「提醒我写下我的想法,可以将 SRS 认为是操作系统层级的服务。」这是一次性的提醒。但是有了操作系统层级的 SRS,你就可以抬起手腕,对智能手表说:「记住,我要思考这个问题,哪些新场景会受益于操作系统层级的 SRS 服务?」这样就不是生成一次性的「待办事项」,而是一张可供后续反复思考的卡片。
这一切都要求我们对间隔重复系统打开视角。典型的印象是抽认卡,用来记忆东西,标记为正确或不正确。但一种更泛用的描述方法是:通过 SRS,你可以安排在一段时间内重复参与一些任务,而且时间轴可以随着你的行动而变化。下面是这方面的一些实例:
-
记忆:重复回忆问题;时间间隔随着回答成功/失败而呈指数级扩大/缩小
-
过程的流畅性:重复完成简短练习,有许多变体;时间间隔随着成功/失败而呈指数级扩大/缩小
-
卡片写作:重复问题、模糊的想法、主干想法,从中积累思考,时间跨度为几个月;将卡片标记为「有成果」或「无成果」,以扩大/缩小时间间隔
-
习惯养成:重复简短的反思卡片,可能根据顺序改变,应用于你的日常经验;间隔默认扩大,但可以放缓
-
阅读队列:一系列 PDF,标签页,书本,总在变换:如果一段时间内忽略某些内容,它就会暂离一周,之后是一个月;比如说「我现在读够什么了」,这东西就会几天之内再次呈现;说某个东西「不是现在读」,那就几个月,之后是几个月之后再呈现……
-
电子邮件收件箱、任务队列、个人通信等
我这些想象的核心,是每日都要练习的一种习惯,类似冥想:打开软件,完成软件呈上的微任务。或许是锤炼记忆,基于反思问题写写东西,简单做些物理题,简单写点东西之类。十分钟之后,你等的火车来了,你登上火车,今天的练习就结束了。明天又有新东西。
总体而言,这个系统意在让你能把想法送入你的轨道(Orbit)。一见到有趣的事物,就将其系上丝线,投入轨道,任其缓缓转动。某个时间点,它会回转到你眼前,但你并不关心几时几分。你会逐渐调整丝线松紧。你所收集的星星点点,在你的头顶上,汇成星座,变化不息。想法、事实、问题、卡片、心之所向,尽在其中。你每日抬头仰望这一角星空,回应众星。
因此,至少现在,我把这个系统称为 Orbit。
在研究中培养深度和沉静
原文:Cultivating depth and stillness in research | Patreon 上的 Andy Matuschak
作为一名研究者,我在成长旅途中一直面临着一个持续的挑战:如何在面对复杂且结构不清晰的创造性问题时,培养出深入且稳定的专注?
在与操作和执行相关的岗位上,我从标准的「生产力」建议中获益匪浅。任务管理和时间规划工具是必不可少的。但现在,这些工具只能帮助我处理工作中最不重要的部分。
Bill Thurston 写道:
数学是一个过程,它要求我们持之以恒地努力凝视混沌与困惑的迷雾,最终穿透迷雾,得到更清晰的认识。
相比《搞定(Getting Things Done,GTD)》,这段描述与我在设计研究中的经历更为契合,尽管《搞定》在我过去的生活中很有价值。若要在我现在的工作中取得进展,我需要「足够努力、持之以恒地凝视那片混沌与困惑的迷雾」。但如果我在五年前读到这句话,我想我不会真正理解它的意义。我无法深刻地认识到这样凝视有多困难,或者在没有这种心态的情况下进步是多么不可能。以下是我可能会对过去的自己说的话:
「这为什么这么难?因为你完全习惯了稳步推进——完成任务、产出成果、解决问题。每当进展甚微或止步不前,每当没有明确的前进路线时,你会畏缩不前。你把注意力转向更安全的事情,转向你能够做的事情。你过早地跳到执行阶段;你有种做更多背景阅读的冲动;你过分纠结易于解决但无足轻重的细节。这些都是排遣行为,是不愿意直面问题的方式。尽管每一件事看似微不足道,但日积月累之后,你的凝视很少能聚焦于迷雾,不足以将其看透。一周周过去,虽然忙忙碌碌,但你只是在原地打转。你每一次移开视线都意味着回到了表面。你必须学会停留在深处。
我在这方面已经进步很多了。但我还需要变得更好!对于我在这一问题上的进展,我想分享一些笔记——主要是「大声」反思。我的策略不是为了推广到更多人,但我希望,我的经历能为其他寻求更多深度的人,提供一些启示。
为什么会畏缩?一些个人心理分析
首先:当进展缓慢,下一步行动不明确时,为什么我会畏缩?为什么有些人似乎不会畏缩?我注意到其中有些模式在起作用。
第一种模式似乎是错误的期望。我在科技行业工作多年,习惯了行业问题快速进展的节奏。在某种程度上,面对这类完全不同类型的问题,我也期望有着相同的速度。研究问题的缓慢进展,相比我习以为常的刺激感,显得迟缓且乏味。我的注意力不由自主地转向其他能立即带来回报的目标。有时候这种转移很明显(如「回复邮件」、「刷推特」);但像「阅读一些论文」或「快速实现一个原型」这样的行为,往往也是对即时刺激的微妙追求。
这种现象在很短的时间内就能体验到。如果我沉迷推特一小时,我就会更习惯于快速的奖励循环。在接下来的几个小时里,所有其他事情都会显得极为缓慢和无趣。我甚至需要极大的意志力来专心阅读一本书一个小时。这种急性效应会在几小时后逐渐消失,但其部分影响会持续到第二天。
如何应对错误的期望呢?下面是一些示例:
-
收集一些生动的故事,帮助树立这类工作进展速度的现实预期。科学家和艺术家的传记对此很有帮助。Mason Curry 的 Daily Rituals 是这方面的一本不错的选集。
-
练习及时察觉内心的冲动;把它当成一个游戏,尝试尽「早」抓住它们,倾听那些越来越微弱的渴望。
-
享受研究中经常出现的微妙洞见。把它当作在培养更敏感的品味。
-
与业内人士交流时要有意识地为自己设防,避免将自己的进度与他们比较,也不要无意中接受他们的价值观。这一点对与生活在旧金山的我来说尤其困难,因为我周围都是行业文化,我的大多数朋友都是初创公司的创始人。
另一种重要的模式是恐惧。当看不到进展时,我会暗自担忧:「这个想法真的行得通吗?真的能取得进展吗?或者,问题在于我自己,我是不是不够优秀,无法取得进展?」每当我用意志力强迫自己继续努力时,这些根深蒂固的恐惧感就会加剧。「等等,我还要继续下去?这不是让我的无能更加显而易见吗?别人会失去对我的尊敬,我会被排挤出局,最终孤独而悲惨地结束。」青少年时期,我经历过深切的孤独,那时我发现,「通过在网络上做些酷炫的事情」,我可以获得别人的认可,并在社群中得到重视。因此,即使到了今天,每当我感到这种恐惧时,我通常会转而去做一些能够迅速看到成果的事情,如制作一个原型、写一些笔记、草绘一个想法。当然,这些行为有时是合适的,但如果它们只是出于恐惧,成为我真正想做的事情的替代品,那就是本末倒置了。
如何应对恐惧反应?下面是一些示例:
-
这些恐惧来自于我错误的期望;参考前面的列表。
-
想一想自己的亲密朋友;注意到我们之间关系和我的工作状态几乎没有任何联系。而那些看似与工作状态有关的不太密切的关系,并不让我觉得非常珍贵;注意到我并不怕失去它们。
-
回顾过去最让我感到满意的工作;注意这些成果从未是一时冲动下为了「产出」而做的。注意这些工作总是源自坚持不懈和无法预测的过程。
-
尽早察觉内心中的这些恐惧感。
-
对于这类问题,大家都推荐的烂大街策略:心理治疗、冥想、迷幻药物。
另一个模式与我对工作的态度相关。当我将研究问题视作一项必须完成的任务时,我更容易因为困难而畏缩。但当我充满好奇心,真心想要理解某事,把它看作是一个探索的领域而非必达的终点时,我就不太会畏缩。幸运的是,好奇心是可以培养的。与仅仅以完成任务为导向不同,好奇心更有可能带领我发现有趣的想法。
我经常自我反思,检查自己对研究的某些方面是否只是出于责任心。一旦我意识到这一点,我通常能通过提问、想象可能的影响等方式唤醒好奇心[1]。往往我需要改进我的思考角度,找到一个更能激发我内心兴奋的角度。如果我找不到能够激起好奇心的问题陈述,那么最好暂时放弃这个项目。
好奇心还能彻底改变我面对挫折的态度。比如,我做了一个实验,收集了数据,完成了分析,现在我正在写一篇论文来阐述我的发现。但是,在写作过程中,我注意到数据中的一列实际上并不支持我之前的结论。糟糕。这本来很容易被视为一个令人沮丧的障碍,需要迅速解决。但实际上,这是一个完全错误的方法,无论是从情感上还是认识上。当我以好奇心的态度来看待这一点时,一切都变得更加积极:「哦,等等,哇!真有趣!这里发生了什么?这能教给我什么?这会如何改变我接下来的尝试?」写作也是一样。例如,当某个主题似乎不适合某种叙事结构时,我通常会感觉这是个需要「解决」的问题。更好的做法是好奇地思考:「嗯,我为什么强烈地觉得这一点跟其他内容有关?这里是否隐藏着某个更有力的统一主题?」[2]
大型早晨工作块
我对度量标准持有保留态度,而且我不认为专注度适合用关键绩效指标(KPI)来衡量。但根据我的经验,我的大多数进步都来自于长期的细心监控和反思——既包括定性数据,也包括定量数据,都要经过深思熟虑的评估。
我为提高专注度做的最重要的实际举措是:我将主要的创造性工作集中在一个大型且连续的时间段内,从早上 7-8 点开始,一直到下午 1-2 点结束,期间不安排会议或较长的休息。我认为重要的不是这个解决方案本身,因为它可能只适用于我,而是我找到这个方法的过程。
我的最初出发点其实很简单:如果我想安排会议,我应该在什么时候安排,以尽量减少干扰?我尝试过把会议安排在午餐时间;试过一天结束时;也试过下午的咖啡时间。回顾我的日志,我发现不论我怎么安排,我下午的时间几乎从未有过深度工作。到了晚上,情况通常会更糟。
我一直对 William James 所描述的「人的能量」很感兴趣:
我想用这个小时来讨论功能心理学中的一个概念,这个概念在实验室环境中鲜为人知,但却是普通人在实际应用中最常用的概念之一——我指的是用来支撑一个人心理和道德活动的能量。事实上,每个人都能感受到自身能量潮汐的高低变化,尽管没人确切知道在这里提到的「能量」究竟指的是什么,或者它的潮汐、张力和水平到底是怎样的。
几年前,我在我的 Apple Watch 上安装了一个名为 Tracker 的应用。它的操作非常简单:它会在一天中的几个随机时刻轻轻震动我的手腕,并要求我评估我的心理能量水平,评分从 1 到 5[3]。这个应用的关键在于它是随机抽样,不依赖于我选择记录的时机;同时它的操作也非常简单,只需一次轻点。通知出现在我的手腕上,显示五个按钮;我点选一个,通知就消失了。整个过程中,我无需查看手机。
多年来,我一直使用这款应用来做有关我的能量水平的实验。在重新审视这些数据,特别是结合我对会议安排的考虑时,很快就发现了一个明显的规律。以下是我一年的数据(每小时大约 50-75 个样本):
受我多年在传统办公室工作的习惯影响,我通常从早上 8 点开始工作,一直到中午,然后休息较长时间用于午餐和休息,再在下午 1:30 或 2 点回到办公桌开始第二轮工作……但这第二轮工作似乎从未真正顺利进行。这是一个巨大的错误!在中午甚至下午 1 点,我的心理能量仍然很高。我正是在这段时间休息,而在下午 2 点我的能量急剧下降时回来工作。这种低能量状态一直持续到我短暂的第二波能量来临才恢复过来,通常在傍晚 6-7 点[4]。
今年,我采用了一个连续 6-7 小时的工作时间块,从早上 7-8 点开始,到下午 1-2 点结束。我提前准备午餐[5],在办公桌边吃。专注的深度是逐渐累积起来的,非常珍贵。多出的一两个小时深度工作时间价值巨大。在这个 6-7 小时的早晨时间块里,我不仅完成了更多的工作,而且深度也比以前一整天的 9-10 小时要深。
这种感觉非常棒。到了下午 2 点,我已经完成了当天的重要工作。我明白自己不太可能再进行深度工作了,如果强行尝试,只会让自己感到沮丧——所以我解放了自己,不再给自己这方面的压力[6]。我可以安排会议、进行锻炼、冥想或者去散长步。下午,我通常会初步阅读一些论文和书籍,或处理一些行政工作。有时,我还会做一些简单的编程。这些都是「奖励时间」,没有任何强制性。采用这个时间表后,我的生活增加了几个小时的空闲,而我的工作成果却有了显著提升。太美妙了!
调整休息时间
我在上一节有所简化。事实上,我并不是真的连续工作 6-7 小时。我的经验是,间断地短暂休息——5 分钟,而不是 15 分钟或 30 分钟——对增强专注深度非常有帮助。
我能想到的最好解释是,工作太难了,或者我还没有完全适应能够持续数小时的深度专注。如果我尝试这么做,很快就会感到筋疲力尽。这种感觉就像是,我必须用越来越多的意志力来维持专注,直到压力变得难以承受,我只能通过分心来释放这种压力。
短暂的休息有助于我恢复意志力。对我来说,5 分钟的休息效果很好;更长的休息时间反而会大大削弱专注的深度。如果休息得当,它不会太多地打断深度的积累。重要的是要避免在休息期间进行任何需要思考的活动:阅读或思考另一个主题会增加切换成本。我最喜欢的休息活动是做一些简单的家务,如收拾东西、洗碗和为晚餐准备蔬菜。休息时看手机、阅读或回复信息很诱人——但这是个坏主意。这会让我完全从深度专注状态中抽离,当休息结束时,我又得重新努力进入深度专注状态。
那么,合适的工作间隔应该怎样的呢?标准的「番茄工作法」建议工作 25 分钟,然后休息 5 分钟。当我真的很难集中注意力时,更短的工作周期的确有帮助——就像在健身房举较轻的哑铃一样。但休息时间确实会产生切换成本。有时它们会打断我平稳运转的思维流程;有时我需要几分钟时间才能在下一个工作阶段恢复状态。当然,这也有实际的时间成本。典型的番茄工作法会让我花掉 17% 的工作时间在休息上。实际上,当计时器响起时,我发现自己需要几分钟的时间来完成手头的工作并重新回到办公桌。我对测量的实际时间成本感到惊讶,我总共有 28% 的时间用于休息!
那么,更长的工作间隔是否更好呢?或者在专注上付出的代价会不会超过减少休息时间的好处?为了找出答案,我进行了一个实验。每天早上,我会随机选择一个工作间隔:25 分钟、35 分钟、45 分钟或 55 分钟,休息固定为 5 分钟[7]。我记录了一份包含主观专注度评分和任务信息的时间表。这个实验持续了 40 天,每个间隔各试验 10 天。
这项研究的总体发现并不意外。更长的工作间隔效率更高:45 分钟和 55 分钟的工作日实际上多出了将近一个小时的实际工作时间。但是,更长的间隔会降低深度专注的可靠性。与 25 分钟间隔相比,55 分钟间隔时浅层专注的可能性约为两倍。但最有趣的结果是,长工作间隔对专注度的影响会随着时间的推移而改变,如图所示:
在一天的前两个小时里,更长的工作块似乎不会对专注度造成明显影响。但到了一天的尾声,长工作块半数时间内只能保持浅层专注,而短工作块反而可能变得更加专注。
因此,过去两个月我的日程安排是:上午 10 点之前用 55 分钟间隔;上午 10 点到中午之间用 45 分钟间隔;之后用 25 分钟间隔。这样调整后,我达到的专注深度比之前更高,早晨的工作时间也增加了大约 45 分钟——而这并未延长总时间。
数据还显示了一个符合预期的现象:某些类型的任务比其他任务更容易专注:
这个图表暗示我或许可以根据任务的难度来调整工作间隔。在这方面我需要格外小心;比如说,在编程任务中,这个样本的评分较低,并不是因为任务本身困难,而是因为我所进行的编程工作太单调且令人厌烦,我并不愿意做这项工作。
微观问题解决
我讨论了一些我所做的重大改变,这些改变帮助我提高了专注的深度。但在日常工作中,我更多的是在训练自己察觉那些微小但会影响深度专注的问题。这里面涉及许多细微的问题解决。以下是一些例子:
-
一个典型的方面是关于技术和互联网的使用。
-
我用
应用在工作时间段内屏蔽了诸如电子邮件、Twitter 这类容易分散注意力的活动。但我发现自己在遇到困难工作时,常常会通过深入研究文献、不断搜寻视觉参考资料或者追踪一些不相关的技术问题来逃避。因此,现在我的电脑在早上默认关闭 WiFi。
- 我发现有时我会重新打开 WiFi,因为确实需要上网查找一些资料……但接着我就忘了再关掉它。因此,我制作了一个 Alfred 工作流,它能够在设定的时间后自动关闭 WiFi,这样我必须明确指定「给我 3 分钟上网时间。」
-
显而易见,我在坐到办公桌前不会在手机上上网。我不想在开始构思自己的想法之前,脑海里已经充斥着别人的想法。
-
-
我发现,即使知道这会影响专注度,我还是会在休息时看手机。因此,现在我早上使用
应用。这个应用让我能用手机播放音乐,但同时屏蔽了几乎所有其他功能。
- 但随之而来的问题是:有时候我需要为送包裹的人开门;遛狗人会告诉我他们马上到。因此,我在 iPhone 上设置了一个「专注」模式,它只接收我在早上真正需要回应的几个通知来源。这个模式按照计划自动在我的工作时间启用。
-
当我遇到困难时,我常常感到困倦。我认为这是因为我期待的刺激超过了实际得到的刺激。注意到这一点后,我就会播放一些充满活力的音乐或做一些快速的运动。
-
如果我在工作时间内挣扎不前,始终没能深入问题核心,我常常会想要加倍努力来「弥补」。但对我来说,正确的做法通常是换个房间,只带上笔记本,在下一个工作时间中通过手写或绘图来深入思考问题。
-
行政任务对我来说是个持续的诱惑:哇,一个我能轻松完成的任务!多么吸引人啊!但这些任务很少是真正重要的。因此,我明确禁止自己在大多数早晨时间做任何行政工作。在早晨的最后一两个小时,如果我感到疲倦和注意力涣散,我有时会转向行政工作,作为「挽救」这段时间的方式。否则,我会在下午处理这些任务;我已经训练自己不介意这些工作的延误或遗漏。(对于等待我的邮件回复的任何人,我在此表示歉意。)
-
我注意到,我经常需要几分钟时间从休息中完全过渡到下一个的工作时间。经过一些实验,我发现一次 15 秒的冥想可以让我立即实现这种转变。身体扫描冥想对我很有效。
-
当我进行非常艰难的智力工作时,我发现周围有其他人会干扰到我。而当我做不太愿意做的工作(例如一些简单的编程)时,周围有人则有助于提高我的专注深度。
-
某种类型的音乐似乎有助于我集中注意力,但具体适合的音乐类型取决于我正在做的工作。如果我正在做的工作非常难(容易感到沉闷),我会选择柔和、重复、无歌词的音乐;如果工作比较简单(容易无聊和分心),我会选择活泼的、让人想跟着唱的音乐。
-
为了保持我早晨工作时间的神圣性,我几乎从不在下午 2 点之前安排会议。这使得与欧洲人会面变得困难,因为时差相差 7-9 小时。我通过在周末早上安排会议时间来解决这个问题。
-
如果我想在某个难度较高的创意项目上取得更多进展,我发现在周末早上加班是提高工作强度的好方法。在工作日加班很少能帮助我在复杂的智力工作上取得进展。
-
我发现不健康的下午或晚上活动很容易损害我第二天早晨的专注度,因为这会让我习惯于追求即时的满足感。
-
以前,我经常在散步时听有声读物和播客。但这导致我内心期待持续的刺激。我已经减少这种活动:最好还是让我的思绪自由漫游。现在我在锻炼和做饭时听这些内容,因为我觉得身体的活动足以分散我的注意力,防止我进行深入思考。
-
为了不让自动的活动干扰第二天的专注,我已经在手机上禁用了 Twitter、邮件等应用,即使是在下午和晚上。
-
我在这里描述的许多内容都基于一本日记,以及我定期进行的每周、每月、每季度和每年的回顾。我认为这些回顾的细节并不重要——最主要的益处来自于我定期回顾自己的尝试以及随之发生的事情。它实际上是在培养我对专注和坚持的深刻感知。这个过程还包括理解哪些因素能支持或破坏这些心态。通过这种方式,我构建了一个丰富的心理模型。
在这一点上,我应该提到:我在这里写的一切都适用于 Thurston 所说的那种工作——那种需要持之以恒地努力凝视混沌与困惑的迷雾的工作。有时候需要无目的地探索。有时一个问题需要轻松愉快且开放的思维方式。这些模式需要完全不同的实践方法,并且通常最好与他人一起进行。有时我只需要执行任务;那时候,传统的生产力建议非常有帮助。但深刻的洞察往往是我工作的瓶颈,而产生这种洞察通常涉及到我在这里描述的实践。
————————
非常感谢 Catherine Olsson、Kanjun Qiu 和 Michael Nielsen 在这个主题上的许多有益交流。感谢 Sara LaHue 建议我研究一天中的不同时间和工作间隔对专注深度的影响。
————————
[1] Michael Nielsen 在他的《创意背景笔记》中提供了一些很好的策略建议。
[2] 我发现自己真的很难对编程问题产生好奇心。可能是因为我做这个时间太长了,但我认为我的问题通常在于与我真正关心的核心问题无关的短暂想法。当我在处理某个令人头疼的 Javascript 构建系统时,我甚至没有一点好奇心去「真正」理解那些狭隘的机制。我知道这些东西明年就会被新的工具所取代。当我在调试数据流的竞争条件时,我至少能对程序结构的基本问题产生一些兴趣。很久以前,这是我的主要工作!不幸的是,如今我的编程问题大多数都是这种狭隘的问题。它们让我开始厌恶编程,这真的很遗憾,因为编程曾经是我生活中最快乐的事情!
[3] 你可以设置这个应用来询问你关心的任何问题(不仅限于能量水平),并自定义响应的量表。但有一个重要的限制:这个应用不提供任何类型的数据可视化。它只输出 JSON 格式的数据,我使用 R 语言来分析这些数据。
[4] 我进行了一个长期的实验,大约在下午 2-3 点(醒后第 8 小时左右)小睡 20-30 分钟。这样做感觉不错,所以我偶尔还会这么做,但这并没有显著提高我下午的精神能量。下午运动也没有显著效果。
[5] 我也进行了一些实验,探究午餐如何影响我的精神能量。我发现无论是吃切碎的沙拉、奎什饼还是以蛋白质为主的三明治,我的能量水平都没什么差别。但像卷饼和糕点这样高碳水化合物的食物确实会影响我的能量。因此,现在我通常午餐吃切碎的沙拉。
[6] 我发现自己内心的某处对于我说我下午 2 点就「完成」工作感到羞耻。这可能是因为在以前的工作中,我确实可以通过投入更多时间来解决问题并完成更多工作。然而在我目前的工作中,这显然不适用,这一点我已经通过不少挫折学到了。阅读作家、艺术家和科学家的回忆录时,我发现每天 2-4 小时的主要创意工作时间似乎是常态。另外,我不想过多强调这一点,因为我希望这篇文章关注质量而非数量,但是:我认为大多数人对他们真正工作的时间有着可笑的误解。在一个典型的早晨时间块内我完成的工作相当于 12 个 25 分钟的番茄钟。在大公司工作时,即使我努力安排我的日程以最大化深度工作,在下午 6 点前完成 8 个番茄钟也很罕见。
[7] 我只是用我的 Apple Watch 的计时器功能。虽然有些应用也能实现这一功能,但我经常在远离电脑的地方用纸质笔记本工作。我也不想在这个过程中使用手机。
演示/演讲:一个新型的围绕文本的助记媒介
原文:Demo/talk: a new peritextual mnemonic medium | Patreon 上的 Andy Matuschak
演示视频:https://youtu.be/aYjJIzJwK8U
去年,我与许多作者合作,在《量子国度》以外的多种情境中测试了助记媒介(即 Orbit)。但是...它的效果远远不如预期!自去年底以来,我一直在根据读者的经验重新定义原语。这次演示/演讲以一本教科书、两篇非技术性论文、百科全书参考资料和一篇学术论文为情境,介绍了一个新的助记媒介框架。
这不是一个产品演示视频。为了对开发界面领域的同行有所帮助,并获得我所需要的反馈,我制作了本视频。因此,我还讨论了很多理论和观点,而不仅仅是炫耀 UI 设计。但或许对于一些人而言,从学习我如何着手设计这类东西的角度来看,这些内容也是很有趣的。
能够发布这个视频,我感觉很棒,这是我在一年多以来发布的第一个重要的设计作品。我要感谢大家的帮助,是你们使这成为可能。
非常欢迎评论、问题和批评意见。
讲稿
这是一个配有讲稿的演讲,我提供了相关材料,以便任何想要评论的人搜索和参考。
---
-
间隔重复是一种非常强大的学习方法。因此,它并没有被广泛采用这个事实令人惊讶。
-
一个关键原因是编写良好的助记卡片(即随着时间的推移你要复习的问题和答案)实际上相当困难。
-
这就是为什么 Michael Nielsen 和我开发了助记媒介:也许通过作者提供间隔重复的助记卡片,并将这些卡片与叙述文本联系起来,我们可以使内化知识变得几乎毫不费力。
-
在过去的两年里,我一直在探索助记媒介在扩展到《量子国度》以外的文本时的发展方向。
-
现在已经有相当多的作者在不同的情境下采用了这个系统,但在大多数情况下,读者对于这个系统的热衷程度远不及《量子国度》。
-
Gary Wolf 很好地总结了问题所在:由于过多依赖作者,我们实际上创造了一种威权主义的媒介。
-
正如我在之前的一篇文章中所写(文章链接见视频下方描述):「当前的交互要求你不仅要按顺序完整地阅读文本,而且要反复学习并记住,作者认为重要的内容——且只能以作者指定的形式。这个记忆系统并不是你的,而是借给你使用的,你无法自由支配。」(译者注:原文是 kept under glass,指东西放在玻璃柜面下,你只能看,不能摸。)
-
如果你正在尝试仔细学习一个明确界定的主题,并且你对这个主题完全不了解,那么跟随权威者很明智!
-
《量子国度》之所以行之有效,是因为它是入门书。读者在此领域的前置知识差别并不大。大多数读者对这个领域了解不足,无法选择他们想要深入研究的具体子话题。他们不太可能对如何组织这些材料有自己的看法。而且,由于他们在这个领域还是新手,无法将之与自己的创意项目联系起来,所以不允许他们添加自己的卡片也无妨。不过,他们仍然希望全面地、深入地理解这些知识。这些读者能从深入的引导式学习体验中受益。
-
但是,大多数阅读并非如此。绝大部分阅读不是那么线性,更依赖于读者的前置知识、兴趣和当前投入的项目。
-
我希望吸收那些我认为有意义的观点,但并不一定想完成作者布置的作业。
-
即使在入门读物中,我也希望助记卡片更像是读者的「私有财产」,而不是作者精心呵护、置于玻璃罩下的东西。这些卡片应该是你可以自由改造的,是能帮你深入地理解自己最关心的问题的。
-
如果我给了你一本教材,我希望你去拆解它,随处写上笔记。
-
写出优质卡片很难,但这并不意味着只有作者享有这一特权:我们希望读者积极参与,将材料与自身经历或理解联系起来。
-
理想情况下,你肩上会坐着一位记忆精灵。每当你读到令人印象深刻的内容,或读到激发自己灵感的文字时,你都能毫不费力地记住这些细节——而且,如果你愿意,还可以在日后重温这些想法,以激发更深入的思考。
-
虽然那是科幻故事,但也指引着我们的前进方向。对于那种毫不费力的境界,我们能接近到什么程度?
-
更实际地说,我们可以将其视为一个信息问题。读者如何通过最少的交互和选择来了解哪些卡片符合他们的兴趣?他们如何最流畅地捕捉反映自己见解的卡片?
-
这些问题没有一刀切的答案。不同的读者对同一文本会有不同的需求。即使是同一个读者,在阅读不同文本或同一文本中的不同段落时,也会有不同的理解方式。
-
在学习新科目时,你可能会更想要依赖作者的指导经验;但当你积累了一些项目经验后,阅读时往往会更加注重实用性。
-
阅读一篇非虚构文章时,你也许只关注其主要论点,或者,你会想要能够从头开始重新构建整个论证过程。
-
在阅读参考资料或百科全书时,你往往会直接跳到感兴趣的部分,只关注其中的一两行内容,或者某行中的特定数字或细节。
-
一段文字可能会激发一位读者大量写作,另一位读者则无动于衷,而另一段文字则引发相反的反应,这取决于文本会如何与每位读者的创作项目和兴趣互动。
-
书面语言的优点在于它能很好地处理这种模糊性。同样的页面布局既可以用于八卦专栏,也可以用于文学期刊。读者可以根据自己的喜好跳读或深入阅读;标题和索引等提示有助于引导阅读策略;页边空白处还鼓励读者做笔记;等等。
-
我们如何使助记媒介也那样的多功能化?
演示
-
让我们从一个大家熟悉的概念开始:教科书。这我选择了《现代统计学导论》,这是一本开放获取教科书,我正在为了测试而改编此书。
-
如果我之前没有接触过这个主题,我可能会倾向于选择《量子国度》那样的引导式学习方法。我会按顺序阅读,并希望作者能给出一些有见地的建议,告诉我应该重点内化哪些内容,以及在哪些地方需要停下来回顾。
-
因此,我会专注于阅读并努力理解材料。几分钟后,我会发现作者嵌入了一个复习框,我可以在其中快速测试自己对文本关键细节的掌握,并将这些材料融入我的 Orbit,以便我随着时间的推移更深入地吸收它们。到目前为止,一切都很熟悉。
-
不过,这里有一个新细节:如果我对某张卡片不感兴趣,我可以直接跳过它,继续下一个。
-
如果我更随意地阅读,这种引导式复习可能会有些生硬。我更倾向于快速浏览复习框中的材料,只保存那些特别吸引我的卡片。
-
但如果我们继续复习,或者只是切换回来,那么当我们完成时,我们会看到的是:
-
我们复习过的卡片——而非跳过的那些——保存到了我们的 Orbit 中。你还会看到,此列表的卡片状态也反映了这一点。
-
此默认设置适用于一般情况:你认真复习的问题会自动保存,而你跳过的问题则被忽略。
-
我们为其他常见情况提供了两个快速批量操作。
-
你可能会在复习后觉得:这并不怎么有趣,我不想再看到它们。只需点击「撤销」按钮,即可撤销自动行为并删除所有卡片。
-
或者,你可能会想:那些我跳过的卡片,我现在不想马上复习,但我确实想保留它们,也许我会再看至少一遍。那你可以直接点击「全部添加」。
-
除了批量操作外,你还可以在这里添加和删除单张卡片。
-
如果你对作者的卡片措辞不满意,可以直接在这里进行修改。
-
我设计这个的目标是让你既能享受到作者在构建这些材料时的细致关怀,又能拥有一本属于自己的书,可以随意涂鸦或剪切。
-
到目前为止,我们所看到的是对现有助记媒介的渐进式修改,因为我们正在体验一个与《量子国度》非常相似的阅读环境——对统计学非常不熟悉,希望将自己交给作者,以获得精心引导的体验。
-
但更常见的是,我们并不这样阅读。在许多情况下,我们最好以非线性的方式、以实用主义的态度来探索这本统计学教科书。
-
以我自己为例:我在大学时学过统计学,但当我分析来自《量子国度》的读者数据时,我发现自己对某些统计学主题所知甚少。当我打开这本书时,我的自然做法是跳过一些内容,专注于与我的项目相关或我不熟悉的材料。
-
在这种情境中,即便是我们在复习框看到的新「列表模式」,也会显得相当笨重。
-
阅读过程中,我发现这些材料对我来说是新的:我从未学过如何手工拟合线性模型。我总是使用计算机,但这让我对概念有了更深的理解。
-
本章的其余部分我都已掌握,我希望只将这部分细节纳入我的 Orbit。我该如何实现呢?
-
嗯,我需要向下滚动直到找到复习框,然后跳过所有与我想强化的概念无关的卡片。
-
我可以切换到列表模式,但那样我就得逐一浏览所有问题,找到与我关心的概念相关的问题。
-
这里实际上有两个问题:一是成本问题,我需要执行大量操作来标记一小部分感兴趣的内容;二是去上下文化问题,我在阅读文本时无法在实际发生的地方和时间标记我的具体兴趣。
-
这种新版本的助记媒介有一个功能,应该能有所帮助。
-
让我们回到我感到有趣的那段材料。假设我刚刚读完,心想:哇,我之前真的没理解这个,但现在我觉得我明白了。我想确保自己真正掌握了这个概念。
- 每当我有那样的想法,我会去看页边是不是有 Orbit 标志。有这个标志,表示这段文本有可用的助记卡片。
-
当我点击它时,会弹出一个侧边栏,展示相关的助记卡片。我可以一键添加所有卡片。
-
或者,我也可以根据兴趣单独选择添加某些卡片。
-
设计这个功能的目的是为了捕捉那种瞬间的灵感火花——当你读到某些内容时,会不由自主地感叹「哇,这个真有意思!」。同时,我们会通过标记在文本中的位置来暗示你感兴趣的内容范围内是否存在助记卡片,希望这样能尽可能地简化操作流程。
-
在像这样的教科书中,读者可以灵活地切换使用我展示的这两种模式:可以边读边选择感兴趣的卡片,也可以在完成一个章节后批量添加卡片进行复习。
-
页边的 Orbit 标记在阅读时提供了一种「外围提示」功能——它提醒你某段内容可能值得记忆。如果你觉得有必要,随时可以将这些内容加入到你的学习计划中。
-
现在,让我们换个话题,把焦点转向非技术类的散文和非正式文章。在这些新的语境中,我们将看到另一种方式,这种方式可能会将我们迄今为止讨论的两种模式融合在一起。
-
我的朋友 David Chapman 很慷慨地同意在他 2021 年初发表的一篇哲学随笔中尝试使用 Orbit。
-
我常常发现 David 的文章很有启发性。因此,我以前会花很多精力为他的观点写 Orbit 卡片。
-
在很多情况下,如果他能为我完成这项工作,或至少给我一个初始便利,似乎会更好。
-
David 按照我的建议,在这篇文章中使用 Orbit 编写卡片来强化他论点的各个细节。然而,尽管《量子国度》的读者响应非常积极,对这次实验的反馈却褒贬不一。许多读者告诉我们,他们觉得这种体验让人不快,受迫感强烈——「就像在学校里一样」。我也收到了几篇尝试使用 Orbit 的其他文章的类似反馈。
-
我认为这里的首要问题是读者的心态。《量子国度》明确是教学性的——作为读者,你是为了学习而来。当文本要求你复习所读内容时,感觉它是在履行职责。
-
但当一篇像这样的非技术性文章在中途开始要求你记住作者的论点时,很容易让人觉得作者自以为是。
-
我对这样一篇文章的态度会随着阅读而变化。我通常会以相当随意的心态开始,主要为了获取知识或满足好奇心而阅读。如果作者真的引起了我的兴趣,我才可能想要更仔细地研究这篇文章。如果媒介过早地要求读者具备后一种态度,就会令人反感。
-
「就像在学校里一样」这个说法很能说明问题。我猜这个人的意思是,他们被要求做的事情与他们自身的兴趣不符。这正是大多数人在学校里的本质体验。
-
第二个需要关注的问题是内容的详细程度。David 按照我的建议,创作了一系列助记卡片,精确地追踪了他论证的每一个细微环节。这对那些希望深入理解文章的读者来说无疑是一个巨大的帮助。
-
然而,在这些深入细节的卡片中,也混合了一些高层次的卡片——根据我的统计,在60 张卡片中有 7 张属于此类——这些卡片概括了文章的核心思想。
-
不同读者对文章的兴趣程度各不相同,这是完全可以理解的。
-
作为一名作者,我认为最佳的写作策略通常是针对那些最认真、要求最高的读者。这些读者想要内化足够多的细节,以便能够完整地重构你的论证过程。
-
但这并不意味着我们应该忽视或疏远那些处于(比如说) 80% 水平的读者:他们可能投入没那么多,但仍然相当专注,并希望能够记住你的主要观点,在未来的几周内继续思考这些内容。
-
在助记媒介的最初设计中,我们只能为所有读者都提供最丰富全面的细节。为了全面覆盖内容,我们需要每隔几百个词就设置一个复习区域。
-
我相信最好遵循熟悉的渐进式披露设计原则:揭示细节的存在,但避免使其成为核心,除非读者自己主动将注意力引向那个方向。理想情况下,再次强调,尽可能减少交互成本。
-
在我们讨论统计学教科书时,我们谈到人们对文本的特定部分感兴趣,而不是整体。这与人们对文本有不同程度的兴趣不完全相同,但我认为相同的原型可以帮助解决这两种需求。
-
在这里,我使用新的设计元素制作了 David 的文章的原型。
-
不再是每隔几段就面对一个复习框,读者将只在文章最后看到一个复习框。
-
这个复习框专门提供整体性卡片,专注于文章的主要观点。这里只有 7 张卡片。
-
如果读者对复习本文毫无兴趣,可以轻易地将这个最后的复习框视为附录,直接忽略。
-
但对更多细节感兴趣的读者会看到散布在整篇文章中的 Orbit 标记。
-
比如说,我特别被 David 提出的这一点所打动:沼泽对地图和地形的对应理论造成麻烦。我可以点击这个标记,方便快捷地将这个想法存入我的 Orbit。
-
整篇文章都是如此。这种方法可能听起来很繁琐,但这并不意味着这篇文章的 60 张卡片会对应有 60 个标记。
-
这些标记表示附近段落存在相关卡片。我们故意将之做成了粗略关联。卡片往往会聚集在一起,通常会有几张卡片从不同角度描述同一个想法。
-
据我统计,我们为这篇 6,500 字的文章中的 60 张卡片使用了 22 个标记。如果均匀分布,大约每阅读一分半左右会有一个标记。不过,实际上有些部分会比其他部分更密集。
-
对更多细节感兴趣的读者可以在阅读时通过点击 Orbit 标记来表明他们的兴趣。
-
他们会在下一个复习环节中看到他们添加的卡片,无论是在文章末尾的复习框中,还是在 Orbit 应用程序中,与其他文章的卡片一起。
-
读者也可以随时停下来复习,这对较长的文本可能会有帮助。
-
就像在统计学教科书中一样,标记的存在提供了一种外围视觉:如果你想要的话,这里有更多。
-
读者可以逐步选择更多的细节。
-
除了标记和侧边栏,如果你读完并完成了最后的复习框,你会在列表标签中看到其他可用的卡片。
-
从概念上讲,现在没有任何卡片「存在」于复习框中。复习框只是作者对前面文本中出现的卡片的整理。
-
如果你读完文章并完成复习框,你会注意到整篇文章中的某些 Orbit 标记的状态现在变成了已添加或部分添加。
-
这个侧边栏外观是整合所有卡片的概念,现在所有卡片都「存在」于此。
-
复习框就像是这个侧边栏的部分视窗。从复习框中,你总是可以跳回到一个卡片的「来源」。
-
注意,我们没有显示这些卡片对应的文本范围——它们只是与一个大致区域相关联。
-
我认为这很重要:在我的设计实验中,我发现许多卡片根本无法与源文本进行精准关联。综合、提炼和连接类的卡片尤其如此——而这些往往是最重要的卡片。
-
这就好比贴在页面侧面的便利贴,指向一个大致范围。
-
侧边栏给了卡片一种它们在媒介的过去版本中从未有过的「对象永久性」。以前,一旦你复习了一个卡片,它就消失了。它不「存在」于你可以找到它的任何地方。
-
那种短暂性当然不能培养我想要创造的可塑性感,但它也造成了实际问题。有时人们想对一个对他们不太有效的卡片给出反馈,但他们再也找不到它了!
-
侧边栏也为你自己的卡片提供了一个家。
-
例如,当我读到这段关于冒险理性主义的段落时,我被我的朋友 Alec Resnick 对「心灵的自行车」这个短语的观察所打动。
-
冒险理性主义如何呼应 Alec 对「心灵的自行车」的批评?通常使用时,它暗示你已经知道目的地了!
-
我可以在这里添加一张卡片,将这个联系带入我的 orbit,就像我在阅读时那样,它是一个一等公民,就像作者提供的那些一样。
-
我也可以在复习期间或之后添加卡片:我发现那通常是我会意识到我希望有哪些卡片的情境。
-
Orbit 标记提供了一个相对安静的外围视觉。它们只是说「嘿,这里有卡片」。但如果我读得很仔细,我可以固定侧边栏,在阅读时将卡片保持在我的视野外围。
-
现在我获得了一个持续的额外信息渠道,了解作者认为什么是重要的。
-
如果我正在写很多自己的卡片,我可能也会发现这种模式更方便——就像在阅读时在文本旁边保持一个笔记本打开。
-
我可以直接点击文本旁边的空白处开始输入。
-
这种设计故意类似于书中的边注和数字注释工具,所以它自然地暗示了分享。
-
也许如果我发现一篇文章非常有趣,我可以使用 Orbit 侧边栏标记它,并与他人分享我的提示,即使作者没有提供他们自己的提示。
-
或者也许我们应该将其视为一个共享的、类似维基的表面,类似 Genius。
-
我想探索这些角度,但至少最初我将专注于专家编写的卡片:Quizlet 和 Ankiweb 已经充分展示了众包卡片写作的挑战。
-
在我迄今为止的实验中,我提出的这种方法似乎能够有效地应用于各种类型的论文、非正式文章和博客文章。
-
这里再举一个例子:Donella Meadows 那篇广为人知的关于复杂系统杠杆点的文章。
-
我采用了与David文章相同的方法,在文章末尾设置了一个复习框,其中包含几个精心挑选的关于主要观点的问题,同时在整篇文章中穿插了Orbit标记,以提供更详细的信息。
-
然而,我发现对于那些信息极其密集的文本——比如参考资料、百科全书和技术论文,我们往往需要一个更为精细的功能来处理。
-
让我们来看看 Our World in Data 网站上这篇关于预期寿命的文章作为例子。
-
这是一个关于预期寿命的百科全书式参考资源,从多个角度全面阐述了这一主题。大多数读者可能会选择性地阅读,重点关注他们最感兴趣的方面。
-
现在,请花点时间浏览本章节的开篇几段。你会发现其中包含了大量数据:「当时,世界上没有任何国家的人均预期寿命超过 40 岁」;「1950 年,全球健康状况存在巨大差异:挪威人的预期寿命为 72 岁,而马里人仅为 26岁。」
-
作为读者,你认为需要哪些辅助功能,才能更好地获取和记住你最感兴趣的信息呢?
-
如果你试图为每一个细节都添加卡片,最终每个段落都会对应一个 Orbit 标记。
-
我认为这种做法会让用户感到不知所措。且不说视觉上的干扰,用户需要每隔几秒就决定是否点击一个 Orbit 标记,并评估每个标记背后的卡片内容。
-
此外,我认为这种方法也会使信息变得过于模糊。以这第三段为例,其中包含了大量的细节信息。假设我对其中的一句话特别感兴趣——「1950 年全球健康状况的不平等是惊人的:挪威人的预期寿命是 72 岁,而马里人仅为 26 岁。」
-
如果这段文字的信息密度不那么高,我可以通过注意到旁边有一个 Orbit 标记并点击它来深入了解我感兴趣的内容。
-
然而,在这样一个信息密集的段落中,标记不再能发挥这个作用:我不得不在大量关于其他句子的提示中筛选,才能找到与我感兴趣部分相关的卡片。
-
对于这些 Orbit 标记,我认为一个更实用的理解方式是:它们代表了「作者在此精心筛选的关于这个子话题最值得记住的要点」。
-
除非我在进行深入细致的阅读,否则我不希望频繁地做出选择。我期望作者能够引导我聚焦于最重要的内容。
-
这种方式可能是这样的:在本节中,有一个 Orbit 标记,它紧邻着总结整个讨论的段落。
-
如果我发现这一节特别引人注目,想要将其牢记在心,我可以点击这个标记。随后,我会看到五张卡片,它们概括了最关键的要点。
-
这些卡片虽然已经相当详细,但有时我可能还想了解更多具体信息。因此,我设计了一种交互方式,旨在将更精细的内容整合到你的 Orbit 系统中,比如具体数字、专有名词和日期等。
-
当我第一次阅读这部分内容时,我震惊地发现全球竟然没有一个国家的平均寿命超过 40 岁。
-
为了突出这一关键信息,我只需选中「40」并点击「新建填空题」按钮。
-
随后,在侧边栏中会显示即将创建的题目预览。Orbit智能地推测我可能需要周围的句子作为背景信息,但我可以通过拖动控制柄来自由调整上下文的范围。
-
此外,我还可以手动编辑上下文内容,实现更精确的控制。
-
如果我创建了多个上下文重叠的填空题,Orbit 会贴心地为我自动合并它们,避免重复。
-
我计划为图像内容提供同样的交互功能,这样就能轻松地为地图或图表等图像细节创建填空题。例如,可以处理《细胞生物学的数字》中的这些图表。
-
值得一提的是,这种「填空题」形式的卡片在教育学术语中被称为「完形填空」。
-
这种填空题很容易制作,因此刚开始使用间隔重复学习法的人常常滥用:他们只是简单地复制粘贴大段原文,然后删掉一些部分。虽然这是一种简单的制作提示的方法,但效果往往不尽如人意。这可能是因为上下文信息过于繁杂,或者问题不够明确,又或者学习者最终只是在进行表面的模式匹配,机械地重复短语而没有真正理解和吸收内容。
-
https://www.brainscape.com/flashcards/experimental-design-8660066/packs/15958967 斯德哥尔摩的一组科学家成功重复了亚特兰大一个团队最初进行的实验。然而,结果却大相径庭。这个实验是,但不是。
-
但根据我的经验,当用于聚焦具体、精确的细节时,填空题的效果会更好,就像我之前举例说明的那样。比如数字、日期、名称、专业术语、用词等。理想情况下,还应该提供紧密相关的上下文信息。
-
我发现,专注于更高层次的、能够综合和总结信息的卡片通常是最有效的。如果缺少这些高层次的卡片,仅仅依赖于细节性的填空练习,可能会导致所获得的知识变得零散且不够牢固。
-
我希望通过让作者专注于那些更具挑战性的高层次卡片,同时为读者提供一种轻松创建超细节卡片的方法,我们能够达到一个很好的平衡。
-
在这种百科全书式的文章中,我们通常不会在页面末尾看到复习框。这是因为这类文章的阅读模式往往是非线性的。
-
因此,对于这种类型的内容,我认为在文章中适当分布一些 Orbit 标记,再配合用于学习细节的填空互动,会更好地满足读者的需求。
-
如果有必要提供更宏观的、针对整篇文章的总结卡片,你可以将它们放在与摘要或结论相关的 Orbit 标记中。
-
我的实验表明,这种模式同样适用于技术论文。举例来说,这里有一篇介绍 IPFS(一种分布式文件系统)的论文。
-
这篇学术论文采用了典型的结构。它首先阐述研究动机,然后介绍相关背景,将本研究与前人工作进行对比。接着概述了整体设计,随后逐步深入技术细节,最后探讨了研究成果的潜在影响。
-
不同背景的读者阅读这篇论文可能有不同的目的。有人可能只是好奇 IPFS 的运作原理,有人可能打算开发 IPFS 客户端,还有人可能想借鉴其设计来创建自己的分布式文件系统。
-
Orbit 标记系统使我能够根据个人兴趣有选择地关注特定主题。比如,我可能对论文的研究动机和背景介绍不太感兴趣——因为我已经从其他渠道了解了这些信息——而更想深入了解文件系统的具体工作机制。
-
我会重点关注第 3 节,并为那些让我获得新知识的主题添加 Orbit 标记。
-
对于我正在构思的项目而言,分布式哈希表中直接存储的「小型」数据的大小阈值实际上非常关键。尽管大多数读者可能不会特别在意这个细节,作者也没有专门为此设置卡片,但我可以通过填空式卡片快速记录这个重要参数。
-
在浏览潜在应用场景列表时,我联想到了另一个相关的有趣话题,于是我可以随手添加一个关于这个想法的提示。
-
IPFS 和 Tim Berners-Lee 的 Solid 项目在哪些方面可能相辅相成? 例如,是否可以利用 IPFS 来实现分布式的 Solid 数据存储单元?
-
通过这种方式,我在未来几周乃至几个月里都会不时被提醒思考这些想法,从而加深理解并激发创新。
总结和结论
-
让我们做个总结,回顾这种创新助记媒介的原语。
-
卡片——包括读者自创和作者预设的——都整合在侧边栏中,灵活地与相关原文内容并排显示。
-
作者可以在复习框中呈现这些卡片。这一设计继承了现有助记媒介的优势,既让读者能够及时复习所学内容,又可以保存重要提示供日后回顾。
-
在这个新设计中,读者可以在复习过程中自主选择,跳过不需要的卡片。
-
此外,新增的列表界面提供了内容全局视图和批量操作功能。
-
作者还可以通过 Orbit 标记在阅读过程中巧妙地展示卡片。这些标记相当于在说:「点击我,即可将这段文字的核心观点纳入你的 Orbit 学习系统。」
-
这些标记使你能够在文本中灵活跳转,根据个人兴趣和需求选择想要深入学习的主题。
-
如果你希望在阅读时随时查看卡片,还可以选择将侧边栏固定,使卡片内容始终可见。
-
作者可以灵活组合使用复习框和 Orbit 标记,为读者量身打造个性化的阅读体验:
-
在撰写学术论文时,作者可能会在文末设置一个综合复习框,概括最关键的信息,同时也可能利用 Orbit 标记系统在正文中插入针对具体主题的详细卡片。
-
对于《量子国度》这类教学性质明确的文本和我之前提到的统计学教材,作者可以在每个章节结尾定期添加复习框,帮助读者把握学习进度。
-
相比之下,百科全书条目和学术论文通常不会使用任何复习框。
-
读者可以创建自己的卡片,这些卡片会与作者提供的卡片并列显示。
-
对于那些过于细节化、难以由作者全面整理的内容,我们提供了一种便捷的交互方式,使读者能够快速生成填空题式的卡片。
-
对卡片进行分类、编辑和撰写的过程并不仅限于阅读环境:我计划将这些基本功能也整合到 Orbit 应用程序中。
-
因此,当你遇到一个不太相关的提示时,你可以选择跳过它,系统会逐渐降低该提示的出现频率。你也可以优化提示的措辞,或者在许多情况下,直接删除它可能是最佳选择。
-
我们此前在侧边栏和复习框的列表标签中看到的卡片列表,在应用程序中也将有一个类似的功能,让你能够浏览和编辑你的个人卡片库。
-
目前,这些新的基础功能仅存在于概念验证阶段的原型中。
-
接下来,我计划开发更加成熟的原型,以便在真实环境中与读者进行测试。
-
我还需要完成大量富有挑战性的设计工作,为我展示的所有新功能设计用户引导流程。在这个视频中,我主要介绍了基础功能,并以熟练用户的身份进行了演示。但实际系统显然需要为新用户提供自我介绍和使用指导。
-
感谢您的观看。欢迎提出批评、问题、疑惑之处,以及任何相关的想法和讨论。
-
我要特别感谢 Ozzie Kirkby,他在去年夏天为这个问题的一些早期解决方案进行了原型设计。同时也要感谢 Nick Barr、Taylor Rogalski 和 Gary Wolf,我与他们进行了富有启发性的讨论。
演示/演讲:打破助记媒介的束缚
原文:Demo/talk: breaking the mnemonic medium out of its box | Patreon 上的 Andy Matuschak
演示视频:https://youtu.be/LRUWdwGZuLA
在本次演讲中,我展示了助记媒介的新一轮原语,专注于我从上一轮原型制作(请看这里的演讲)中提炼出的问题与机会。
如果你对这个特定的项目不感兴趣,你可能仍然会觉得很有趣,看我在一个非同寻常的设计问题的架构上如何思考迭代。
非常欢迎反馈。我已经把演讲内容整理如下,便于讨论特定段落(但别指望这些内容在没有相应的画面时能好理解了)。
讲话稿
-
大家好。
-
今天我将分享助记媒介的新一轮迭代。
-
就像我五月份时展示的设计,这份作品正尝试解决一个特定的问题:为《量子国度》所创造的媒介在技术入门读物以外的场景中有点死板、让人不舒服。
-
我们如何创造一个更加灵活的助记媒介——一个能够被用于非技术书籍、非正式文章、参考材料、论文等其他读物的助记媒介?
-
在本视频中,我将假定你已经看过了五月份的演讲。如果你还没有,我建议看看头五分钟,还有 10-13 分钟,以了解我尝试解决的问题的背景。
-
-
-
本期视频的编排如下:首先,我将回顾我五月份展示过的设计的核心元素;然后,我将描述我在用户观察中发现的问题和设计要点;最后,我将展示旨在解决这些问题的媒介的新版本。
-
好!首先,现在是关于我五月份演讲时的设计的两分钟回顾。
-
为了测试这一设计,我在 Shape Up 这本相对非正式的产品管理书中实现了一个原型。
-
选择这本书的原因是,我认为这将加剧我之前在媒介上发现的许多问题。
-
材料往往是偶然的,有争议的,启发性的,是关于价值观或观点的问题。
-
读者对这本书的阅读体验将因他们的个人背景发生巨大的变化:相对缺乏经验的测试读者会想要非常仔细地学习它,而更有经验的读者将略读,只吸取精华。
-
这不是一本正式的技术书;当然对一些读者来说,这是一个严肃的探讨,值得学习。
-
-
在 6 月和 7 月,我看了十几个人在线阅读这本原型书,大声说着他们的想法和反应。我还从另外几十位读者那里陆陆续续收到了大声思考的日记,并从一些慷慨的设计师朋友的评论会中受益良多。
-
我从那些读者身上学到的东西令人鼓舞——我认为这种媒介可以在类似这本书的环境中发挥作用,这样做对许多读者都颇具价值。
-
然而,不出所料,这些会议也发现了许多问题。一些似乎是界面设计的问题——只需要更多的打磨。但我今天将讨论的难题实际上是结构性的。解决它们的正确方式是改变媒介的概念架构。
-
-
让我们深入这些问题吧。它们大体上可以分为两组:第一,围绕文本的 Orbit 标记和边栏问题;第二,嵌入复习框问题。
-
Orbit 标记和侧边栏呈现了一系列相互关联的问题:
-
首先,一个观察结论的概括:感觉没必要让卡片「远离」文本
- 如果你的显示器很大,这在字面意思上是对的——他们会被巨大的空白区域水平分离。
-
以实践为中心的解释媒介:桌游说明书和不寻常的 Figma 文件
这是后 COVID 世界的桌游之夜。你和几个朋友围坐在桌子旁,尝试新游戏。问题是:有很多小纸板令牌和游戏牌,甚至——我甚至不确定……图腾?
你拿起说明书大声宣读,但几分钟后,大家变得坐立不安。所以你想:开始吧,一边玩一边摸索规则。现在,由于你每十秒钟就要回头查看说明书,第一轮游戏进展得特别缓慢,因为你总是找不到上次看到的位置,每次都需要重新定位;等到第二轮结束时,你意识到需要撤销第一轮的行动,因为你做了一个无效的移动,这将会破坏整个游戏;你不断努力记住你「应该做什么」;如果每玩一会儿就需要参考说明书,就很难沉浸体验游戏。
也许我们还不如看一场电影?
书籍存在的一个问题,我在这里和其他地方已经写了很多:我们往往很快就会忘记除了主旨以外的所有内容。而这里,书籍(特别是那些培养技能的书籍)存在另一个问题:这种媒介使得文字与实践之间鸿沟难以逾越。书籍很少涉及实践他们描述的事情。大多数书籍,甚至是旨在培养技能的书籍,都只是关于它们描述的内容。阅读关于桌游的书,而不是玩桌游。阅读关于对位法的书,而不是在作曲中使用对位法*。(*译注:类似于和声,都是一种构建声部的方法)
那又怎样?我在这里不谈正式的学习科学,只诉诸经验。
如果你问别人,他们何时成长最快,你会发现,最赋能的环境往往涉及实践。与队友紧张地为即将到来的比赛做准备的那个夏天;那个失败的,但学到了许多宝贵经验的创业项目;接受的连续一个月每天写首新歌的那个挑战;为期数周的那个冥想静修;令人不知所措的那个学徒期;等等。在这些故事中,书籍有时是知识的来源,但相对于伟大的导师、队友、背景动机等,它们往往是次要的,关键是实践。
可以自然地类比我们的桌游问题:想象一下,你是第一次玩桌游,但有一位老司机带你。这与之前描述的「冷启动」体验完全不同。在这种情况下,有经验的玩家可能会给你一个简短的介绍——没有任何会让你记忆负担过重的内容——然后你们就可以开始玩了。他们会处理好桌游的设置,要么自己动手,要么指导别人洗牌,发牌,等等。他们可能会讲解:「我先来,做个示范。所以我先抽两张牌,然后我可以选择在这里移动或打这张牌。我将在这里移动,这将阻止 John 移动到这个开放区域。现在轮到你了。你的目标是 XYZ,你可能会先这样移动。现在,如果你抽到了行动卡,如果你愿意,你可以立即打出;否则,请阅读卡上的内容......」在整个游戏的过程中,他们可能会继续讲解你需要知道的内容,恰到好处地解释你可能考虑的选项,提供反馈。只要你有经验的朋友有足够的风度,避免进入盛气凌人的 Clippy 领域,这将是一种更愉快——并且更有效——的学习游戏的方式。
这可能是长久以来入门桌游的好方法,但技能培养的书籍有许多实际优势。比如信息密度。如果你想学习为量子计算机编程,你需要吸收大量材料才能自己「玩」。这可能需要有经验的同伴为你作几十个小时的解释,对大多数人来说,这很快就会变得繁重。说明文可能缺乏个性化和人际联系,但它可以被更仔细地打磨;它不知疲倦,只要你准备好了,随时都可以使用;它可以嵌入图像和抽象符号;它可以被非线性地吸收;它读起来比听讲更快;等等。也许最重要的是,它是一种大众媒介。世界上最资深的专家和最敏锐的传播者可以就这一主题精心编写一本书,而数百万人可以将它握在手中,几乎没有任何边际成本。
所以:我们如何创建一种拥有书本优势的大众媒体,但又立足于实践?我们如何才能创造出一种解释性的大众媒介,它感觉更像是和有经验的朋友一起玩桌游,而不是一边玩桌游一边查说明书?
动态媒介的作用
为何难以创造立足于实践的书籍?原因之一在于书籍是静态、一成不变的。你,作为读者,必须将其文字运到你可以「实践」的环境中。即使如此,「实践」的过程与页面上的文字之间也很少有交互的机会。作者可以告诉你如何在练习后反思,并自我产生反馈,但这些都是你必须在自己的头脑中执行的脚本。即便有视频,情况也没多大改观。然而,计算机和它们支持的动态媒介,是能够表现和响应的。[1]
人们常常提出,我们应该利用这一特性来整合用于实践的模拟环境。也许生物课本可以嵌入一个小型模拟培养皿,你可以用它来「实践」某些细胞生物学实验,缩短文字和行动之间的距离。
但对我来说,只要有可能,我更期待计算环境成为真实的——非模拟、非「教育型」的——实践环境时所带来的情景。非线性视频编辑界面不是剪辑电影的「玩具」方法;它就是专业电影人剪辑电影的真实方式。Mathematica 并非操纵符号表达式的「玩具」方法;它是某些数学工作最真切、最适当的方式。所以,一本关于视频编辑的动态「书籍」不必陷入「玩具」式的实践环境,也不需要模拟的培养皿。反而,它可以直接进入那些用于剪辑世界上最好电影的真实环境中。
那么,在一个真实环境中「立足于自身」的解释型媒介到底意味着什么?解释内容应如何与环境内容相互作用呢?
过去十年,作家和程序员们已经创作了许多交互文章,或许能对我们的问题提供启示(有关这方面的详细介绍,请参阅《与交互文章沟通》)。就我个人而言,这个领域的工作非常令人振奋。然而,我不了解是否有任何文章真正符合我们迄今讨论的期望。这些文章可能是交互的,可能涉及一些实践,但这些实践都被限定在特定的小沙盒里,而非实际运用技能的真实环境。它们更像是与模拟培养皿相结合,而不是真实的实验工作台。
以一篇关于编程主题的文章为例,其结构是长文中穿插小型交互代码编辑器,用于探索某个概念。虽然这肯定比普通的文章有进步,但与我们的愿景相比,「实践」在这里显得相当次要。这些编辑器与真实编程环境差距甚远;要将你所做的应用到真实程序中,你必须费尽周折。这就像是在阅读一本棋盘游戏说明书,其中的交互图片描绘了棋盘游戏的简化部分。或者,说得不那么公正些,这就像一本精致的立体书。你还没有真正投入实践。
如果这些交互文章常常呈现为文字的海洋,而其中点缀着交互的小岛,那么将这一结构倒置或许是一条将真实环境整合进来的路径。我们怎样能够创造出以交互环境为主、却又穿插着文字岛屿的「文章」呢?以编程为例:我们能否让整个体验都融入你所选择的集成开发环境,而不是包含源代码列表的文本文档,同时还能展示解释性的文字呢?[2] 能否将 YouTube 上用 Blender 进行 3D 建模的课程搬进 Blender 软件中呢?
电子游戏在这方面很出色。有时,教程出现在非交互式的剪辑中,与普通游戏截然不同,但更好的例子(例如传送门)将指导和叙述与交互式环境无缝融合,从未将摄像机或控制权从玩家手中「抢走」。产生了在游戏环境中的丰富沉浸感——与桌游的指导手册形成鲜明的对比。
电子游戏还解决了交互文章的另一个难题:文字和动态展示难以分离。这类文章通过一些方法拉近了文字和交互元素之间的距离,例如,将文章中的数字和图中可直接操作的参数关联在一起。但在多数情况下,它们依然是实际分开的,而不是视觉上整合的。读者的目光在文字与交互元素之间不停穿梭,费劲地将参照物与物体联系在一起。这不仅仅是动态元素的问题,传统文字中的静态图形也有同样的困扰。然而,Edward Tufte 的著作中所描述的解决方案在动态领域却鲜有应用,或许是因为编写工具更为复杂、孤立。几乎所有人,几乎一直都还停留在「按生产模式分离」。
电子游戏通过音频将指导嵌入到玩家所看到的画面中,并且不影响看到的内容,但即使只使用文字,它们也可以将文字放在动作的相关部分旁边。这种安排使游戏能够避免玩家在指令和交互之间反复横跳,就像我们在棋盘游戏手册中所经历的那样。而且,由于叙述性交流被整合到一个动态环境中,它可以像环境中的其他元素一样行为和反应。在优秀的游戏中,精心设计的叙述就像对玩家行为的持续回应。这消解了当人们阅读与「实践」相隔离的文本时所感受到的那种距离感。
进入 Figma 文件
说来也怪,这封信的直接原因,竟然是一份非同寻常的 Figma 文件。
(如果你不了解 Figma 的话,简单来说,Figma 就是一款用于设计软件界面视觉效果的协作工具。)
这两年来,我一直在收集关于这篇文章主题的笔记。在某些时候,我想围绕这些想法建立一些原型,并发表一篇更深入的文章。但我觉得现在的想法还不够成熟。然而,你现在正在读这篇文章,正是因为一份 Figma 文件催促我提前写下了这样一份「欠条」之类的东西。
Figma 改变了他们界面中复制和粘贴的工作方式。他们为了向用户解释这一改动,特地做了一份文件。我知道这听起来似乎平淡无奇,但请别急着走。我鼓励你在继续阅读之前,亲自去看一看:点击「复制」按钮开始,然后放大左上角的画框。你可以通过网页浏览器,用一个免费账号浏览这个文件。
这篇文件乍一看就像是一个超文本幻灯片。它通过图像生动地展示了新的剪贴板功能是如何运作的。这是一份在 Figma 中创建和使用的,关于使用 Figma 的文件,这非常优秀,但并不特别。解释的前言穿插其中,文件将控制权交给了你:
这就是我们打破了创作内容和真实「实践」之间的墙。你被邀请去操纵作者所创造的物体。这些对象并不特别;它们和你在别处能自行创建的物件是同一「类别」。你可以把它们复制并粘贴到一个新文件中。当你操作这些对象时,你所用的工具和作者创建文件时所用的工具一样。更重要的是:你所使用的工具,正是你在这个领域真实工作时所会用到的。
这原本可以是一篇充斥着小小的交互「演示」区的博文,但现在,你正身处 Figma 的全景环境,与这个文件交互。在设计领域,这更像是一个实验台,而非虚构的培养皿。除了一些基本的文字外,你在此的「实践」与你自己的创意工作中的「实践」之间毫无隔阂。当我阅读这份文件时,不禁好奇起这些不同构造的组合下,粘贴功能将会如何表现,于是我用已熟悉的工具摸索着去寻找答案。那天晚些时候,我在设计布局时,不假思索地用上了其中一种新的粘贴功能。
重要的是要认识到,这份文件中有大量文字。这也是让它变得如此有趣的部分原因。这样的「练习纸」并不罕见——有很多像这样的 Figma 文件,为你提供练习和一些可以玩耍的情境。
与此相比,复制/粘贴的 Figma 文件非同寻常,因为它大概有一千多字。这里包括大量的解释材料,而且可能还能进一步拓展。这种深入而广泛的文章开启了媒介中经典作品的可能性。另外,这种复制/粘贴的文件中编写的内容与活动之间的交互更加精准微妙。这形成了更短、更精确的反馈循环,让人感觉就像在体验一款电子游戏教程,或者与老友共同玩一款桌游。
这是一篇关于如何使用 Figma 的 Figma 文件。如同一本精雕细琢的使用说明书,这的确是有用的。但是,我们不难想象一个更重要的变化:一本用 Figma 编写的关于界面设计的「教科书」[3]。在这本初级指南中,你不只是了解设计的方法,你实际上是在「实践」设计,而且是在你作为专业人员所使用的环境中。由于解释和行动之间没有人造的界限,我相信这样一本书能让人更贴近于体验一款设计精良的电子游戏教程时的感觉。
对 Figma 文件概念的详细阐述
当然,Figma 的「元文件」媒介本身还有进一步的拓展空间。
复制/粘贴文件中的说明性文本没有行为和反应。对作者来说,这不是一个真正的动态媒介。在解释和行动之间的精细交流的帮助下,读者更容易产生自己的反馈,但这种媒介还可以通过响应读者的操作从而走得更远。《地球:启蒙读本》展示了一个简单的方法,在读者完成建议时「打勾」:
我们还可以设想特定主题的计算元素。例如,讲解色彩理论的一章可以利用关联的表现手法,根据你选择的「主要」颜色来动态展示次要和互补色。讲解网格系统的一章可以协助你直观理解不同的类型层次比例如何影响你设计中的基线节奏。讲解可访问性的一章可能会在你的设计画布中嵌入对比度比率的测量工具。随着你对材料的熟悉程度增加,这些脚手架可以逐步撤去。等等。
另一个耐人寻味的方向——与 Figma 的多人协同设计非常契合——便是在文本中融入合作学习的机遇。合作学习的一个标准「动作」是:提出一个能够用多种方式解决的难题;并把多个学生的不同解答放在一起,助他们互相取长补短。Figma 设计「教科书」可以包含单独和「共享」的画板,甚至能借助异步协同功能促进学生间的思想碰撞。这种方法甚至可以包括一位协调者,配合诸如 Desmos 之类的工具,以更好地支援他们的努力。
从更广义的角度看,我所倡议的交互式解释媒介不仅局限于「教育」场合。在着手一些实质性项目的过程中,它们同样可能大有裨益。比方说,如果我们正在设计一款新的操作系统,我创造了某个新的控件,那么我可能不仅通过制作一个静态的 Figma 文件来向团队展示,还会借助一份能「实践」的文件,协助你领悟如何在你自己的设计中运用它。这样的文件也能作为专业参考资料恰到好处地派上用场:例如,倘若我初次为扩展色域显示屏进行设计,这样的工具就能大显身手。这些文件里的「通道」或许能让你把自己的设计项目「带入」解释文件,使你能在处理实际工作的同时,深入理解这一概念。
扩展到其他环境
支持这种格式的环境不只有 Figma。我们还能在哪里实现类似的东西?一个系统要实现这种文件,必须具备哪些特性?我可以概括出至少几个方面。
文件必须为作者传达解释内容提供途径,解释可能会很长。Figma 有文本元素;编程环境有注释。在其他环境中,如音频制作工具,我们可能需要在文件模型中添加这种能力。或者,解释内容可以通过音频(或视频)渠道传递,但必须确保读者操作文档中的对象时,不打断作者素材的播放。
作者得能在他们内容的某些段落与读者交互环境中的相关元素间建立联系。在 Figma 中,我们可以将文本紧贴在你要操作的每个元素上。在 Finale(一种音乐创作环境)中,文本可以在乐谱之间交错排列,或者定位在特定的乐句上方。在以 Roam 为基础的媒介中,大纲的分层结构可以用来将作者的文字与读者的文字关联起来。
作者需要线性化和结构化的解释方式;读者需要「导航」的能力。在 Figma 中,各画板依次排列,可以通过滚动或键盘快捷键轻松导航。超链接和「目录」画板也方便了导航。清晰的图层列表则如同目录一般,方便查找。在编程环境中,一连串的标签页可能与 Figma 的画板类似。或者像 Natto 的教程那样,我们可以用特殊功能来改进这些功能。
在其他什么环境中,我们可以轻易地想象创建这样的文件?
-
一份关于编写优质自选冒险游戏的 Hypercard 文件(肯定有人已经以这种方式使用 Hypercard 了?)
-
以虚幻引擎文件形式呈现的游戏开发入门读物。
-
以极其精致的 Finale 乐谱呈现的和声分析研讨会。
-
可以动手操作的《卡片笔记写作法》的 Roam 图改编。
目前为止,我所提到的仅限于现今的环境中可以创造的文件。但未来,我们或许不再只局限于现有的设施,而是可能有一天会设计出类似 Figma 这样的系统,使它们更好地支撑这类文件的创建。
————————
感谢 Molly Mielke 就这些 Figma 文件的背景进行的讨论。也感谢 Michael Nielsen 和 Jonathan Blow 在过去的讨论中对形成这些想法的帮助。
————————
[1] 这个框架来自 Bret Victor 的《停止画死鱼》。在这里,不可改变的人物(无论是印刷的还是动画的)都是「死鱼」。
[2] 那么像 Mathematica 和 Jupyter 这样的计算笔记本呢?我不认为这些符合条件;我没发现有任何骨子里是「以实践为中心」的例子,文本中穿插的代码真的与所讨论主题的实践有关。正如 Pavel Panchekha 告诉我关于他的《网络浏览器工程》一书,这种格式似乎更侧重于帮助读者理解作者编写的代码,而不太适合支撑读者自己写代码。
[3] 当然,一些非常好的例子(包括 Braid 和 The Witness)根本就没有使用明显的解释。这是一种极其有力的方法,我得找个时间再深入探讨。
[4] 这样的入门书将特别有价值,因为奇怪的是,没有用户界面设计的「标准文本」。
吹捧数据,迷失意义
原文:Square Signals : Exalting data, missing meaning (andymatuschak.org)
科学脱胎于哲学。在我们拥有哥白尼的行星表或牛顿的运动方程之前,我们就有了亚里士多德的修辞学。尽管那种中世纪的自然哲学是错误的,但它依然能做出有用的预测。
在我围绕着消费品和教育的职业生涯中,我观察到了一种常见的决策失误模式:对数据的过度痴迷——希望表现得科学化——并伴随着对哲学的否定。
在某些领域,如制造业、交通运输和航空,这种痴迷是有益的。但在消费品、教育等许多涉及人性的其他领域,对数据的痴迷会引发不易察觉的错误,并扭曲我们真正的目标。更糟的是,这种痴迷剥夺了我们通过哲学、直觉和故事获得真正有意义的洞见的机会,而这些洞见还无法通过量化系统完全解释。
这种危险潜伏在尚未被系统化的领域中。当涉及到人的问题时,我们缺乏类似牛顿运动方程的公理。实际上:我们甚至不知道对应的方程应该衡量什么。即使我们知道,我们可能也没有能够测量这些量的仪器。有没有可能存在一些有用地描述这些现象的方程呢?我认为可能,但我也不确定我们是否能确定这一点。
在我们在这些领域构建更有力的解释性理论之前,我们必须尊重哲学的作用,并警惕扮演科学家的危险。
什么都测了,什么也没测
我们来谈谈测验分数。
你是否曾经在某个课程中取得了不错的分数——比如说,微积分——但后来感觉自己并不真正理解其中的原理?你能按照学到的步骤解决类似你们课堂上处理过的问题,但你无法解释为什么它们有效,或者在新的情境中应用它们?这种体验似乎普遍存在!
那么:在教育系统中做决策时,你有多信任测验分数?
在教育和设计等领域,我们只能测量一些间接的代理指标:页面点击、网站停留时间、测试分数的变化、问卷调查回应等等。然后我们试图用这些测量结果来做决策。
这就像是在扭动一根杆子,这个杆子连接着一套复杂的齿轮,这套齿轮又连接着我们想要测量的东西,而这个东西又以神秘的方式连接着我们实际正在测量的东西。
当我们并未真正理解我们真正想要了解的内容与这些代理指标之间的映射关系时,我们很容易忽视重要的结果。
在 Kumon* 花费大量时间做活页练习题可能会让一个孩子在算术上变得很棒,但这对他们的好奇心有何影响?对他们长大后自主学习的欲望又有何影响?(*译注:一家日本教培机构,其补习方式以做题为主。)
当 Spotify 默认让你接收吵闹的推送通知(「披头士乐队现已上线 Spotify!」),他们可能会提高某种参与度,但同时也会惹恼他们的用户。这种烦恼可能不会在任何仪表盘上显示出来:也许用户会以完全相同的方式继续使用该服务,但当第二年爆发一些公关丑闻时,他们可能就不那么愿意站在 Spotify 的一边了。
因为我们不了解这种映射,我们不得不做出更多的猜测。而每一次猜测,都有可能我们看到了一些纯粹偶然的结果。只有在考虑到所有尝试过的假设时,统计假设检验才有意义。
另外,有时人们甚至不会去猜测,而只是在数据中寻找规律。如果你在足够大的数据集中寻找模式,你肯定会找到一些的!
(来自 Randall Munroe 的 XKCD 的 Significant)
我们知道,相关不代表因果。有时,你会偶然发现强烈的相关性——就像上面的漫画中那样:数据表明,这种蓝色让用户参与度最高!
但这只是随机噪声,如果你再用那种蓝色重新着色更多元素,你实际上并不会让任何人更开心,也许除了你所在社区中的那些自以为是的人。
另一个危险在于,你发现的相关性可能在掩盖更重要的底层现象。
假设你希望用户先在你的社交平台上分享他们的大新闻。你无法直接策略这个,但你有一个代理指标:那些帖子中附带的照片有 EXIF 数据,记录了它们拍摄的时间。你决定你希望将照片拍摄与分享的时间间隔最小化。
为了弄清下一步该怎么做,你在用户行为日志中寻找相关性。假设你发现照片上传速度与用户立即分享大新闻照片的可能性之间存在强烈的相关性。你告诉你的工程师要专注于优化上传时间!
你上线了优化后的照片上传器......但你在测量的指标中并未看到任何好处。结果,你并非偶然看到这种相关性:你看到它是因为「拥有更快上传速度的人们可以付得起更好的流量」,这意味着他们更可能在外出时上传照片,而不是等到他们使用免费 WiFi 时。
照片上传时间本身只是真正根本原因的一个代理指标。
即使我们非常确定没有任何潜在的原因或后果,我们仔细地考虑了所有的假设,我们也必须记住,这些都是我们正在优化的代理指标。随着情况的变化,这些代理指标与你真正的目标之间的联系可能会减弱——甚至逆转!
如果你的饮食中缺乏维生素 C,那么服用少量维生素 C 可以预防疾病。但这并不意味着你应该寻求百倍的效益而服用百倍的剂量(就像诺贝尔奖双料得主莱纳斯·卡尔·鲍林所做的那样):你将看不到任何边际效益,而只会把所有的维生素 C 拉出来。
在最糟糕的情况下,过度关注这些代理指标可能会产生反向激励。假设你想让学生在生活中为解决具有挑战性的问题做好准备。确实,将学校缺勤天数降至最低可能有助于实现这一目标——但超过了某一个度,其他因素将起主导作用。
如果你过于激进地优化学校的零缺勤天数,你可能会轻易地逆转这种相关性,扰乱学生的家庭生活,或者创造出一种使学生厌恶他们专制学校的氛围。
如果你是产品制造者,总使用时长可能看起来是一个很好的客户喜爱度的代理指标。但是如果你对这个指标看得过于重,你可能会因为帮助客户在比以前更短的时间内完成某项任务而受到惩罚。
在这些领域中吹捧数据还有一个更微妙的问题——这是我的研究伙伴 May-Li Khoe 一再耐心解释给我的。如果你试图通过对商业成果产生最大影响来设计一些具有人性意义的东西,你很可能会最终得到的是几乎没有人性意义的东西......这反过来可能会损害你正在衡量的长期商业成果。
同理,「应试教育」正如你所预期的那样,把课堂上的好奇心和参与性吸干了。
Frank Lantz 在关于游戏设计的演讲中精彩地涵盖了这个问题(此引用在 33:30 处;感谢 Bret Victor 的指点):
这就是量化、数据驱动的游戏设计的困境……所以,这里有个类比:想象你有一个朋友,他在社交方面有困难……「我不知道我做错了什么。我去约会,我带了一个温度计,这样我就可以测量他们的皮肤温度。我带了一个卡尺,这样我就可以测量他们的瞳孔,看看它什么时候在扩张和收缩……」关键是,即使这些都是预测某人性兴奋度的正确测量指标,也没有关系。如果你带了一个温度计和卡尺去约会,你就不可能上床……
那么。
想象一下,两位老师在提高班级考试成绩上有完全相同的测量影响。他们在培养自信的思想家上产生同样影响的可能性有多大?
你决定调整某个变量,因为在过去,它与产品使用量的增加高度相关。你认为这种改变更有可能为用户解决一个有意义的问题的可能性有多大?
无法度量的意义
我们已经看到,以与我们真正目标之间关系模糊的间接测量为主来做决策存在着许多危险。然而,伟大的教师和设计师确实在这些未被系统化的领域中高效地工作!
他们有洞见;他们有直觉。这些都来自于他们对领域内在哲学的内化,这些哲学来自于经验、观察和故事。是的,他们的哲学并不完美;并且,他们也不能一定给你一套卡尺,让你可以用来做出自己的决策。
但是,如果你询问关于一个特定的学生互动,或者一个特定的产品细节,他们通常可以事后解释为什么他们的哲学会推动他们往某个方向走。多听一些,你也许能建立一些自己的直觉。
这不仅仅是运气或某种确认偏误——这些专家的品味有一种潜在的一贯性。即使你和他们都不能量化描述他们是如何做他们正在做的事情,这一点也是明显可见的。即使没有仪表板和 A/B 测试,优秀的老师也会以他人一贯认可的方式一贯地成为优秀的老师。当然,我们可能需要观察一段时间才能看到一个专家是否始终能提供洞见,而不是偶然——这就是知识工作者面试如此困难的原因!——但显然,有些专家的想法比其他人的更一贯地成功。
这种一贯性就是意义所在。
你怎么知道你的房子存在?毕竟,你并没有直接感受到它:你与它的接触是通过各种模糊的视觉处理和你自己的错误记忆来传递的。它存在,是因为它可靠地出现在它上次出现的位置。它存在,是因为当你在它的内部时,你始终能看到相同的图像,影子角度的改变符合你对季节的预期。它存在,是因为其他人可以和你谈论你的房子,并说出一些经过曲折的听觉系统解读的话,这些话不知为何和你自己模糊的感知相吻合。它存在,是因为你的手指可以感觉到门上房号的形状,这与你记忆中很久以前签署的租赁合同上的形状相吻合。
同样的逻辑告诉我们,当一个专家一贯做出公认的成功决策,并且可以用符合直觉的修辞解释他们的哲学时,那里可能真的有点东西。
你的房子是更系统化的——我们可以精确地测量它的高度,绘制蓝图,预测它的质量——但是,在我们拥有这些工具之前,社会仍然可以有效地谈论房子。在我们发现这些工具(和我们想用它们提问的问题!)之前,我们只有传统、专业知识、修辞、哲学。如果我们以平衡的怀疑和好奇心去倾听,这些都可以是强大的工具。
假装衡量意义
其实我没必要这么强烈地说教。在实践中,我们通常无法忽视领域哲学和专家直觉。
有意义的哲学就是有意义的——所以即使我们声称要抛弃它,我们的直觉往往还是与我们的决策紧密相连。
我经常在产品决策中看到这一点。例如,有人可能由于各种哲学上的原因,认为注册墙会降低产品的质量,但他们向外界解释这个决策的方式,是引用某一产品博客上关于这个主题的 A/B 测试的数据。
这些数据并不是他们决定放弃注册墙的原因。它只是他们给别人(通常也是给自己)的解释,说明为何他们做出了这个决策。这种行为在某种程度上是对科学的致敬......同时又违背了科学的核心原则。
在教育领域,人们非常热衷于成长性思维干预。大致的想法是:如果你能说服一个孩子,让他相信智力可以通过练习和努力来增长(就像他们的肌肉一样),那么他们在学校的表现实际上会更好。
最近对这个领域的干预措施的热情源于一系列由斯坦福大学的 Carol Dweck 和她的团队进行的随机对照试验。这些干预措施可能是有效的!但是:这个领域的定量结果在实际中的效应大小上相当适中。
仅凭这些研究无法解释这个话题所引起的热情程度;这其实反映了人们对这些干预措施的预先存在的直觉信念的强烈程度。问题在于,当教育界讨论这个话题时,主要通过这些研究来为成长性思维干预找理由。
这种有目的的推理扭曲了决策对话。我们应该用这样的临时数据来支持——而不是取代——我们的哲学。
当两个人在一个未系统化的领域中对某个问题在哲学上有分歧,但只允许定量的论证,他们最终会通过比他们自己的信念更弱的数据来进行代理人战争。更糟的是:如果我们真的发明了这些领域的强大预测系统,我们需要保持我们的科学智慧,不被事后的矫饰污染。
我希望大家能明白,我并不是在呼吁我们放弃数据和系统性思考。这种科学主义的痴迷其实是一种合理的防御机制!毕竟,在精确测量出现之前,物理学家曾用修辞进行辩论,我们最后得出的结论是燃素理论(也就是说,物质燃烧是因为它们含有一种名为燃素的元素;物质燃烧时燃素被释放到空气中;物质不能在罐子里燃烧是因为那里的空气不能吸收更多的燃素)。
在没有可靠系统的领域,我们无法通过测量来理解。
在这些领域建立系统是一个关键项目,而且可以取得进步。元分析和多质多法检验确实帮助我们奠定了一些基础。然而,在领域系统还在建设中时,我们必须小心不要过于依赖它们。它们还不具备结构上的稳定性。
直觉、哲学和专业知识提供了各种有用的临时解释。如果我们随着时间的推移监控它们的预测,我们将发现局限所在,我们的理论将会发展。在此过程中,我们将发现规律,融入临时的系统性概念,并且灵活地发展我们的信念,无论证据如何,我们都会选择最好的。
喜悦、归属感和赋权可能存在于这个图片中的「定性黑箱」里,但我们仍然可以为它们的产生提供解释。这些解释可能会涉及可测量的输入和输出。但如果我们坚持通过,比如说,参与时间和净推荐值来解释喜悦,我们将得到我们活该得到的喜悦。
驱除《少龄淑女绘本启蒙琼林》的幽灵
原文:Exorcising us of The Young Lady's Illustrated Primer | Patreon
只要提到《少龄淑女绘本启蒙琼林》,就能让教育技术学者的两眼放光。它是 Neal Stephenson 在《钻石年代》中描绘的一本超前的交互式教材。在书中,它将一位年轻女孩从贫困中解救出来,最终助其获得至高权力。这是教育技术领域对极其强大的学习环境的最经典想象。如果你问那些对学习感兴趣的技术专家,他们梦想实现什么,大多数人都会回答:「打造《启蒙琼林》。」
十五年前,我也会给出一样的答案。那时以我浅薄的技能和认知,《启蒙琼林》对我来说遥不可及,看不分明细节,却仍然足以激起内心深处的向往。随着实践的积累,当我认真思考打造《启蒙琼林》意味着什么,我开始意识到这一愿景存在严重缺陷。渐渐地,尽管内心依旧被深深吸引,我却发现它从根本上来说是行不通的。如今,《启蒙琼林》成了萦绕在我心头挥之不去的幽灵。我明白这不是我真正想要创造的,但在找到新的奋斗目标之前,我内心的某个部分似乎无法彻底放下这个愿景。
事实上,我觉得整个教育技术领域都被《启蒙琼林》的幽灵所困扰。这不能怪 Stephenson,而是我们自己的问题。我们共同向往的理想愿景,至今仍然停留在一部科幻小说的情节设计中,因为我们自己还没能够描绘出更好的蓝图。
我希望跳脱《启蒙琼林》的桎梏,重新审视自我。我要清晰勾勒出这本书的愿景何以如此吸引人——那些值得我铭记于心、作为创意源泉的要义。但我也要明确指出我们不应该从《启蒙琼林》汲取的经验教训,以及它所忽视的问题。最后,我要提炼其中真正有益的精华,化为新的养分,构建出一个能够引领我不断前行的崭新愿景。
(请注意:本文的目标读者是那些为《启蒙琼林》所描绘的愿景神魂颠倒的技术人员,因此我假定你们都很熟悉《钻石时代》的内容。如果你还没有读过这本小说,可能难以完全理解下面的讨论。)
我想从《启蒙琼林》那里得到什么
在书中女主角 Nell 与《启蒙琼林》的奇幻历程里,我找到了自己生命中一些弥足珍贵而又难能可贵的体验。她与这本书的互动让我想起了自己成长过程中那些收获最丰、进步的飞快的学习时光——只不过《启蒙琼林》创造的这种奇妙体验几乎贯穿全书,覆盖了每一个话题。这正是我与这部作品最本质的联结。《钻石时代》之所以令我心驰神往,是因为它塑造了一位将大半生都沉浸在我所憧憬的学习状态中的女性形象。
从这个思考角度出发,我认为从《启蒙琼林》中汲取灵感的正确姿势应该是自私的。当我在思考「打造《启蒙琼林》」时,我不是在思考一种教育干预手段、一本帮助儿童学习课标的教材或道德寓言的定位;我在思考作为一个有能力且充满好奇心的成年人,我想要什么。我渴望借鉴其理念,为自己营造一个赋能环境——助我更好地思考、学习和创新。
沉浸感
我最珍视的学习经历,莫过于全身心投入一个主题,动手实践,沉浸其中,日夜钻研。遗憾的是,现实生活中这样的学习经历并不多见。很多主题似乎过于抽象,即便我想要「全身心投入」,也很难找到行之有效的方法。但 Nell 的主要学习方式,恰恰就是如此:通过沉浸式的动手实践。
《启蒙琼林》之所以能做到这一点,关键在于它采用了动态媒介。其中的交互式表征和模拟,大大拓展了沉浸式学习所适用的主题范围。在引入概念性主题时,《启蒙琼林》总是从具体的动手实践项目入手:用二进制编码的铁链讲解图灵机原理,用密码交易阐释微观经济学,用胡萝卜种植演示有丝分裂过程。而深入的理论说明,则会在必要时适时补充。
在这些领域,平常的学习往往不是如此。学习抽象主题,常常需要先掌握必要的理论基础,然后才能深入研究案例和应用。但《启蒙琼林》不同,它让 Nell 每次都从有意义的具体实例开始探索,建立个人理解和直觉,再逐步过渡到抽象概念和理论知识,通过嵌入的书籍获得系统、全面的认识。
我们不必(也不应该!)从纯粹教学的角度来考量这些动态媒介。《启蒙琼林》的纳米显微镜帮助 Nell 入门细胞生物学,但它本质上是一种让专业生物学家变得更加强大的工具。它不是一个玩具,不是建立直觉后就该束之高阁的认知死胡同,而是能够持续支持 Nell 成长、适用于真实场景的实用工具,是开拓整个领域前沿的利器。我的合作者 Michael Nielsen 一直强调,所有强大的知识表征都有这个特点。如果一种表征能让专家更加得心应手,那么同样的理念通常也能帮助初学者更好地学习;反之,如果它只专注于教学用途,就很难真正改变该领域的实际工作。数学软件 Mathematica 就是一个典型:它最初是为支持元胞自动机的前沿研究而发明的,但同时也能让初学者更容易建立复杂数学概念的直觉。
响应性
你可曾在楼梯间或大厅中,感受到声音在空间中跳跃?当你哼唱或拍手,整个房间都会随之共鸣,仿佛你正拨动着一件乐器。这样的感觉,正是我在智力和创造性体验中最为珍视的。我的一举一动都能得到周遭事物和人们的回应,被吸收、反射、放大。整个环境鲜活,而且响应迅速。这是一种罕见而宝贵的体验,而《启蒙琼林》正是一直为 Nell 提供这样的感受。
这种响应性极大地激发了好奇心。《启蒙琼林》不仅耐心解答 Nell 无穷无尽的稚气提问「为什么?」,更会在她对任何事物产生兴趣时,为她提供切实可行的参与方式。随着时间推移,书中内容引领着她走向更深层次的探索,正如下面这个片段所述:
Nell 种下了胡萝卜,想起了久未谋面的朋友 Peter,又在窗台上栽种了天竺葵。《启蒙琼林》传授了她种植的方法,并提醒她每隔几天就挖出一株幼苗仔细观察,以了解它们的生长过程。Nell 发现,将《启蒙琼林》置于胡萝卜上方,凝视书页时,页面会幻化为一幅神奇的插画,逐渐放大,直到她能看清根部伸出的细小纤维,以及附着其上的单细胞生物和线粒体。这个技巧适用于观察任何事物。此后的许多天里,Nell 检视了苍蝇的复眼、面包霉菌,以及从自己手指采集到的血细胞。
丰富的反馈是响应性的另一种体现,而《启蒙琼林》则持续不断地为 Nell 提供实时反馈。例如在学习前滚翻时,《启蒙琼林》会向她展示动作录像,指出还需改进的地方。而对于抽象概念的学习,它同样使用了这个技巧:Nell 通过操纵水道来理解布尔逻辑,通过演奏风琴来掌握打孔卡编程。《启蒙琼林》选取或创设出能够提供实时互动和反馈的表现形式,最大程度地缩短了概念、行动与反馈之间的距离。诚然,即时反馈有时会削弱深度思考,但我总觉得,对大多数主题而言,我所渴求的反馈要比实际能获得的更多。
信心
在我成长最快的那些时光,过程往往充满艰辛,压力重重。但最可贵的是,在那些时光中,我能深切感受到努力带来的丰硕成果。我坚信,只要持之以恒,定能实现梦寐以求的目标。类似地,记忆系统之所以能带来莫大欣慰,关键在于它给人一种无比踏实的自信——只要我想牢记某个知识点,就可以将其纳入记忆系统,并确信自己能够长久掌握,永志不忘。这种确定感推动了一个良性循环:学有所成,满怀欣喜,求知若渴,乐此不疲,如是循环,生生不息。
《启蒙琼林》正是通过这种方式,为 Nell 注入源源不断的信心。它允许她在困境中挣扎(书中屡次描述她反复尝试破解谜题),却不叫她尝到彻底失败的滋味。渐渐地,Nell 开始深信,无论书中出现何种考验,她都终能攻克,因为迄今为止,她从未遭遇任何最终无法掌握的主题。我的记忆系统让我对记忆知识充满自信;我多么希望在学习任何科目和技能时,都能像 Nell 一样充满必胜的把握。
《启蒙琼林》营造这种自信感的一个秘诀,就在于动态构建学习脚手架。回想那些进步迅速的时光,我总能找到一条理想路径,穿越崎岖的学习山峦。时时刻刻,我都能获得恰到好处的支持和引导,足以助我前行,却绝不会令人生厌或觉得不真实。随着技艺日臻成熟,外力扶持也会恰如其分地淡出,让我不断拓展独立掌控的疆域。这种学习经历不可多得。很多时候,当我「全身心投入」未知领域时,要么撞得头破血流,要么陷入细枝末节、进退失据。
然而,不论 Nell 学习何种内容,《启蒙琼林》总能为她搭建契合所需的脚手架,并随时调整。有时候,这个过程绵延数年。比如起初,《启蒙琼林》会为 Nell 朗读;等到她识字渐丰时,书会适时协助她拼读生词;再后来,它就全然放手,任凭 Nell 静心阅读繁复的内容。有些主题的支架搭建跨越数天乃至数周,譬如图灵城堡系列,Nell 便是从一元字母编码循序渐进,最终掌握了图灵机的高深原理。即便在单个学习环节内,《启蒙琼林》也能动态调控支持的力度,正如本段举例所示(方括号中是我的评注):
Harv 和 Nell 正试着生火。旁边放着一堆 Harv 劈好的湿漉漉的木柴。Harv 手里拿着一块石头,正用它敲打刀背。火星噼里啪啦地飞溅出来,却被湿柴吞没了。
「Nell,你来生火,」Harv 说完就走开了,把她一个人撇在那里。
画面停止了移动,一会儿的工夫,Nell 意识到现在完全变成了互动模式。她拾起石头和小刀,开始使劲敲击。…火星四下飞溅,但就是点不着火。
她越尝试越泄气,都快掉下泪来。突然,一颗飞溅的火星落在了旁边的干草上。一缕缕细细的烟雾冒出来,但转瞬即逝。[这并非偶然,而是在她灰心丧气时恰到好处的提示。]
通过一番试验,她发现干燥的黄草比青草更容易着火。不过,火苗每次也只能燃烧几秒钟。
一阵风吹来,几片枯叶飘向她。[这同样不是巧合,而是对她频频受挫的回应。] 她发现火可以从干草蔓延到树叶。树叶的枝梗就像小小的枯枝,这启发她去附近的小树林寻找细枝。树林里荆棘丛生,但她还是在一株枯死的老灌木下找到了想要的东西。
当 Harv 回来时,Nell 正抱着一大捆细小的枯枝朝他走来,他赞许道:「干得不错!」[请注意,正是 Nell 找到树枝触发了 Harv 的及时归来。]…没过多久,他们就点燃了一堆熊熊燃烧的大篝火。
重视情感
我那些成长最快的经历,无一不是由内心的痴迷驱动:或为一个想法的美好而倾倒,或为一个社区的魅力而着迷,亦或是感到一种实现令人向往愿景的使命感。这不是冷酷无情的功利计算,而是炽热的情感燃料。然而,点燃这些火焰殊非易事,稍有不慎便会熄灭。《启蒙琼林》令我念念不忘的原因之一,正是它重视情感的力量。
《启蒙琼林》的全名是《少龄淑女绘本启蒙琼林》。它深知美好的意象能够吸引人心。《启蒙琼林》并非百科全书,而是运用神奇的故事、鲜活的人物和沉浸式的场景,去创造并维系读者的情感联结。书中的对话由一位专业人士倾情朗读,她毕生致力于用声音传达对 Nell 的关爱。
情感既能激励我前行,也能阻碍我进步。知性和创造性工作最大的障碍往往在于情感,而《启蒙琼林》让 Nell 为此做好准备。它精心设计了挫折与挑战,旨在培养 Nell 的坚韧、自我效能和独立精神,同时帮助她掌握特定领域的知识。
另一个重要的情感策略是:《启蒙琼林》让 Nell 处于主动地位,成为自己经历的缔造者。虽然有既定的叙事结构,但每一页都由 Nell 的选择和行动推进。她感觉是在创造故事,而非被动接受。我自身成长最快的经历,无不具有这种富有主导力的情感特质。
《启蒙琼林》还认识到,学习是一个身份建构的过程。我学习某个主题时,不仅是在获取知识和理念,更是在一定程度上成为该领域的实践者。我正在吸收该领域的价值观和视角,改变我看待自己和世界的方式。
诚然,《启蒙琼林》在情感方面有些高高在上,过于操控——这一点容后再议。但我想强调的是,《启蒙琼林》重视情感的做法是正确的。任何希望拓展人类认知的人,都必须同样重视情感的力量。
从《启蒙琼林》得到的错误教训
《钻石年代》是一部小说,而非研究论文。因此,《启蒙琼林》被呈现为一个不可分割的整体,而不是一系列系统设计的属性。那么,在说「我想打造《启蒙琼林》」时,人们很容易把这一愿景视为一个整体——没有其他切入点可以把握。这是一个错误。这个概念存在严重且根本的缺陷。所以,我想非常清楚地说明我不想从《启蒙琼林》中吸取的教训。
专制主义
《启蒙琼林》有一个预设的议程,旨在灌输一套价值观和理念。尽管它支持 Nell 的好奇心,但这些不过是其核心结构的「支线任务」。《启蒙琼林》的十二个「彼岸之地」各有侧重,但既非为 Nell 量身定制,也非 Nell 自主选择。事实上,Nell 甚至不知道《启蒙琼林》为她设定的目标——从未有人告诉过她。它的目标是自身的机密。Nell 人生的大部分时间都受《启蒙琼林》完全操控,难以判断她是否有自己有意义的目标或价值观,还是仅仅接受了《启蒙琼林》创造者认为「对她好」的东西。
《启蒙琼林》建基于伊万·伊利奇所说的「我们的教育傲慢」,即「人能够为上帝所不能为,可以为了拯救他人而操控他人」。这种设计不仅高高在上、将人当作幼儿对待,而且(在我看来)有悖道德。我不想被如此操控,又怎能如此对待他人?
抛开意识形态,《启蒙琼林》还有一个核心矛盾。它的主要目标并非传授特定领域的知识,而是培养富创造力、善于独立思考的人才。问题是,Nell 的全部智力生活都在思考《启蒙琼林》告诉她思考的内容。我们从未见她主动开展实质性的创造项目,或为此担责。我完全不信这一套能奏效。如果一辈子都在解决定义明确的问题,给出既定答案,人就不太可能提出有趣的问题,找到令人惊讶的解决方案。
种种问题迫使我们否定《启蒙琼林》的大部分结构。其核心脉络——公主 Nell 的故事,建立在她基本被动的基础上。《启蒙琼林》将各种课程偷偷编入冒险故事,让 Nell 在不知不觉中掌握重要技能,也是同理。必须颠覆控制权,在提供指导和支持的同时,让学习者对自己的学习议程负最终责任。
隔离
当我询问人们关于他们个人成长中最有收获的经历时,他们总会提到那些全身心投入对自己真正重要的事情的时刻,比如创业、艺术创作或参加比赛。在这个过程中,他们学到了很多东西,但学习本身并不是目的,而是服务于某个更有意义的追求,而且通常是在与他人的共同努力中实现的。相比之下,Nell 沉浸在一个幻想世界里,学习成了唯一的目标。这与任何外部有意义的目的都是割裂的。正如我们所讨论的,Nell 没有任何人生目标。她只是在被动地收集奖杯(钥匙),等待真正的生活开始。
更糟的是,《启蒙琼林》也将 Nell 与其他真实的人隔离开来。书中的人物要么操纵 Nell,要么被 Nell 操纵。扮演 Nell 老师的 Miranda 只是在念剧本,甚至无法看到 Nell 的反应。《钻石年代》试图将人工智能视为人际交往的替代品,指出 Nell 与 Miranda 的互动远胜于老鼠军团与人工智能生成的声音。但更关键的一点被忽略了:无论哪种情况,他们的关系都完全由一个为操控而设计的人工智能所编排。配音质量的差异似乎无关紧要。在《启蒙琼林》的世界之外,女孩们在学校里确实建立了真挚的友谊。但除了对幼年 Nell 的一些保护性干预外,这本书并没有涉及她们任何真实的社交互动。
当我思考自己想要什么样的赋能环境,而不是去想怎么「为别人好」时,这两种隔离的弊端就变得非常明显。我对隔离的学习(为了学习而学习)持怀疑态度。我最享受学习的时候,是当它成为追求某个更有意义的目标的一部分,并且通过学习加深了我与其他人的联系。这并不意味着学习必须是功利的或工具性的。满怀激情地探索自己的好奇心本身就可以是一项有意义的活动,我最喜欢与他人一起追寻或为他人追寻这种好奇。举例来说,当我学习哲学时,只有通过与他人辩论或将这些思想应用到生活中的重要问题时,哲学才变得有意义。
正如我们无法改变《启蒙琼林》的专制主义一样,如果不从根本上颠覆这本书的核心结构,我们就无法改变它的隔离性。我们必须让成长的支持融入人们日益丰富的现实生活中,而不是将人们隔离在虚拟世界里。
游戏化
我有许多收获颇丰的成长经历,尽管充满压力和挑战,但却趣味盎然。然而,学习(尤其在学校中)往往是件苦差事。不少技术专家想知道:为什么学习就不能一直都有意思?《传送门》、《见证者》等优秀游戏表明,即便没有明确指导,玩家也能掌握复杂概念——那我们何不通过游戏来教授一切?更有甚者,我们能否做出如此有趣的游戏,让人玩得根本意识不到自己在学习?
除了前文提到的专制主义和隔离问题,我认为这种愿景在大多数情况下都不可能实现。这种观点没有正视游戏这一形式的内在机制。持此观点者满足于制作平庸游戏:游戏本身缺乏竞争力,没有强制手段注定会失败。
游戏设计的首要目标是趣味性——或美感,或吸引力,或刺激性。从根本上说,游戏是一种审美媒介,主要靠审美体验来吸引我们参与。诚然,有些游戏能让玩家在玩乐过程中习得某些技能或认知。但这并不意味着,我们就能围绕任何内容设计出优秀的教育游戏。看似成功的案例不过是特例。游戏设计者常常反复尝试无数创意,只为找到美学上吸引人的点子。只有当趣味性得到保证后,他们才会考虑如何让玩家学到必要的东西。绝大多数机制本身并不好玩。优秀游戏源自严格筛选,游戏性才是首要考量:寻找乐趣,而非教育意义。我们没有理由相信,任何抽象主题都一定能「寻找乐趣」,并隐含地传授给玩家。
即便你能围绕每个主题设计出有效的教育游戏,努力方向也有问题。教育技术专家常想设计趣味盎然的游戏,让人们抛开教育内容、甚至在无意间就爱上游戏。但如果排除强制因素,假设人们只会选最有意思的游戏来玩,那你就得去跟《堡垒之夜》、《英雄联盟》、《星露谷物语》之类的游戏比拼吸引力,而这些游戏恰恰是经过精心打磨、力求感官刺激最大化的。这正是《启蒙琼林》的策略,之所以看似可行,只是因为女主角 Nell 的生活过于贫乏单调,几乎没有什么有意义的事可做。
如果我们竞逐的不仅仅是纯粹的趣味性,而是别的审美价值呢?说到底,发人深省的艺术电影和肤浅的商业大片不也同时存在于市场中吗?比起「最肤浅的乐趣」,你大可创造出一种互动学习环境,给人最深刻、最震撼,或者最令人愉快困惑的体验。然而即便如此,相比竞争对手,你仍需承担一项格外严苛的使命:既要营造出无与伦比的美学享受,又要确保学习者真正掌握某个学科领域的知识。不管侧重哪种审美取向,不俗的影视和文学作品已然开拓出一片天地,但又有几部成功地教授了抽象的概念?创造深刻的美学体验本已难如登天,全面阐释抽象命题同样不易,要想二者兼顾,非天才莫属。
我绝非要否认学习本身可以是快乐或深刻的。实际上,我最珍视的学习经历,远胜过最爱的游戏。不同之处在于,那些体验本就不是为审美目的而设,学习也并非其唯一诉求,更多是为了让我专注于真正在乎的事:创造、参与、求索、助人。知识的积累和愉悦感,只是顺带获得的馈赠。
我也并非认为这些体验无法经过精心设计,或推广到更多人身上。创业孵化项目 Y Combinator 就运用了大量规划,包括讲座、聚餐、Office Hour、仪式、反馈和 Deadline 等,向创业者传授理念和价值观。这个项目算不上游戏,参与者也不是在「扮演创业者」,但对大多数人而言,这些活动极富吸引力,且意义非凡。我认为这是因为,YC 的框架旨在让他们以更加投入和得力的方式,去做那些至关重要的事。
要想超越《启蒙琼林》,我们大可从游戏设计中汲取诸多宝贵经验。通过模拟和实时反馈,有望打造出帮助人们理解复杂概念的互动环境。重视动机和审美体验很正确;适度的引导和扶持,更能激发人们的潜能;精心设计的环境,可以促进交流,凝聚人心。诸如此类,不一而足。但我相信,我们的核心使命是要借鉴这一切,开创一种崭新媒介,专注于鼓励积极而有意义的行动,而非仅仅制造审美体验。
发现式学习包治百病
在《钻石年代》最生动的几个篇章中,女主人公 Nell 并非通过他人指导,而是置身于高度结构化的环境中,通过探究和实验习得知识。之前引述的片段里,Nell 就是如此学会生火的。许多技术专家谈及「打造《启蒙琼林》」时,设想的是一个主要或完全通过这种最低限度引导的探索来学习的世界。
我理解这种构想的吸引力所在。探究式学习意味着沉浸的亲身实践,而非枯燥说教。那些豁然开朗的瞬间令人心潮澎湃。的确,人们往往更易记住自己得出的见解,或许还能加深理解,因为结论的基石由你亲手搭建。不过,虽然我酷爱发现式学习,却不认为它就能包治百病。
抛开《钻石年代》不谈,教育心理学界对此争论已久(可参见 [Lee 和 Anderson 在 2013 年的综述](https://andymatuschak.org/files/papers/Lee, Anderson - 2013 - Student Learning.pdf),或 [Kirschner 等人在 2006 年备受争议的批评](https://andymatuschak.org/files/papers/Kirschner et al - 2006 - Why Minimal Guidance During Instruction Does Not Work.pdf))。我简要总结如下:
发现式学习方法常忽视学习者极其有限的工作记忆。诸多实验表明,人们在竭尽认知资源解决问题后,已无余力从中学到知识。
同理,这类方法也忽略了长期记忆的现实。对陌生领域的新知,若不经后续重复提取加以巩固,我们极易遗忘。若想学习者熟练运用新技能或识别新模式,则必须反复练习,或采取其他干预措施将其内化。
发现式学习强调形象直观,有利于培养直觉和提高参与度。但诸多领域知识依赖抽象,不加讲解则很难理解如何引入这种认识。缺乏抽象概念引入新内容时,学生往往难以触类旁通。相关的是,具象化倾向于非正式表达和不精确,这在初学阶段或有裨益,但多数领域需要形式化符号和概念的精准有力,方能学以致用。
值得一提的是,《钻石年代》中的《启蒙琼林》也并非是纯粹的发现式学习。Nell 年幼时,书中人物以讲故事形式提供教学指导。随着 Nell 长大,能自主阅读,便如饥似渴地汲取书中知识。书的编排颇具匠心,Nell 通常先从某个探究式活动(如图灵城堡中的铁链)接触新主题,建立起具体感性认识后,再遇到系统深入阐述该主题的篇章。难以想象没有这些篇章,她还能修炼到那般境界。当然,书中所述仍不足以让 Nell 的成就毫无破绽,除了武术和求生技能,鲜少提及刻意练习,也缺乏随时间推移逐步深化的学习。即便在对《启蒙琼林》极度乐观的世界观下,单凭发现式学习也是不够的。
构建新愿景
我渴望去追求一个新的愿景,一个涵盖了《启蒙琼林》让我着迷的各个方面的愿景:动手实践的沉浸感、生动的响应、充满自信,以及专注于学习和创造的情感核心。
即便我要告别《启蒙琼林》,我仍然认为动态媒介是实现以上每个特性的关键。互动式表现和模拟让更多主题的沉浸式体验成为可能。实时反馈带来生动的响应。动态脚手架和自适应练习可以帮我确信,我能学会想学的东西。自适应元认知支持和充满活力的视听元素支撑着我的情感体验。
但我们确实需要告别《启蒙琼林》。它通过操纵、将人与真正有意义的人或项目隔离,以及错误地依赖审美愉悦来施展魔法。我看不到任何方法可以逐步将它的结构从这些缺陷中拯救出来。
相反,我认为我们应该颠覆《启蒙琼林》的结构。我们的系统应该被设计为帮助我们投入到自己觉得有意义的项目和兴趣中,而不是为了「达成学习目标」。我们的系统应该与我们周围的世界交织在一起,与我们关心的事物同在,而不是局限于屏幕上的幻想世界。我们的系统可以通过帮助人们更全面地参与自己的兴趣,并放大由此产生的内在满足感来支持参与度,而不是以娱乐为目标,希望意义是附带的副产品,类似《启蒙琼林》那样。
这个系统是什么样的?如果它如我所想的那样与我们对世界的参与交织在一起,那它就不再是一本书了。它似乎是一种媒介,就像空气之于声音一样:它是无处不在的渠道,提供我们做在意的事所需的支持、结构和表现形式。这可能意味着某种普适计算。我对这种形态的感知还很模糊,但你可以在我最近的演讲《我们如何学习?》中看到这种系统可能是什么样子的初步轮廓。显然,还有很多工作要做。我希望这篇文章能帮助一些同样被《启蒙琼林》吸引的同事挣脱束缚,并希望他们能帮我设计将取代它的系统。
————————
这篇文章的观点得益于多年来与 Alec Resnick、Bret Victor、May-Li Khoe、Taylor Rogalski 的交流,尤其是 Michael Nielsen,与他的对话帮助孕育了如此多的想法。我要感谢所有人。
《量子国度》中的指数和遗忘
现在,我拥有了几年的数据和几个对照实验的结果,在过去的几个月里,我一直在想办法弄清楚《量子国度》中发生的事情。我想讨论一下我一路走来的发现,以及一些仍然困惑我的东西。
请注意:这是对《量子国度》数据的非正式讨论。该分析是初步的,不应该在其他工作中引用或摘录。我这里是在开门造车。
关于指数的更新
间隔重复记忆系统最重要且最令人惊讶的宣称是,它们能够让你投入的时间获得指数级的回报(在记忆稳定性方面)。请花点时间思考一下这有多不寻常!如果你每周投入 2 小时阅读或跑步,然后你将时间翻倍至每周 4 小时,你获得的好处往往不会翻倍。在我们日常的活动中,大部分时候,收益都会随着时间的增加而递减。但是,在很多情况下,似乎通过额外增加几分钟的间隔重复练习,你记住材料的时间可以延长一倍。
2019 年,Michael Nielsen 和我在《量子国度》公布了一些初步的研究成果,展示了这种指数增长,但现在我们有了更加确凿的证据,有了两年额外的数据和实验。这里我将主要讨论第一篇文章,因为它有最多的数据。
下面是一个成本效益分析的全局概览,汇总了大部分细节(去掉了一些可能会让图像过分缩小的离群值)。
说得通俗点,大多数读者只需练习半小时,就能记住文章里几乎所有 112 个问题的答案,而且这种记忆能保持至少 2 周;如果练习时间增加到 1 个小时,记忆保持时间能延长至少 5 周;1.5 小时的练习则可以使记忆保持至少 9 周。注意到了吗?随着练习时间的增加,记忆保持时间呈指数增长。
简单解释一下图表:每个点都代表了某个读者在完成一次复习后的数据记录。纵轴是他们记忆稳定性——他们能够成功回忆出 90% 以上问题的时间间隔——的总体评估。横轴是他们完成该次复习所花费的时间。图表中「突出显示」的点表示每次复习的中位数;虚线则是指数拟合曲线。
当然,数据有相当大的波动。很多波动实际上是调度器细节造成的,这里不做讨论。但我认为这并不影响总体结论。这里特别指出了第 25 和第 75 百分位的数据。对于表现最好的四分之一群体来说,1 小时的复习就能保持 3 个月的记忆。而最慢的四分之一群体虽然增长较慢,但经过 1.5 小时的复习后,也能达到 1 个月的记忆保持时间,这还不到最初阅读时间的一半。
有趣的是,每次复习中,练习时间和记忆保持之间存在负相关性。换句话说,那些学得较慢的读者往往记得不那么牢固。这就是我们在将来优化学习调度时,可以利用的众多参考因素之一。
以展示的记忆保持作为衡量指标的问题
这种表征方式最大的问题是,我们实际上看到的是读者对某个问题真实记忆保持的一个近似下限。我们真正想知道的是,读者等待的最大时间间隔是多少,同时还能有(比如说)90% 的几率记得。我将其称为「稳定记忆保持间隔」。但我们无法直接测量它。作为替代,我们通过查看第 6 次复习的时间和结果来测量他们 5 次复习后的记忆保持。这种测量方法与我们的调度策略相互耦合。
在很多情况下,如果将第 6 次复习安排得更晚,读者可能仍旧能记得,这会导致显示出更高的展示记忆保持值。另一方面,如果某位读者在 40 天后忘记了,他们可能在 30 天后就能记住…但我们当时没有安排复习,因此我们只能报告最后一次尝试成功的时间间隔(例如 20 天)。这样情况下,我们就少报了。
因为这个抽样的局限性,我们在图表上看到的明显的指数曲线主要是我们调度器设计的结果,这个调度器本身是指数式的(根据是否成功,调整间隔时间翻倍或减半)。实际上,经过五次复习后的稳定记忆保持间隔可能要长得多;如果我们能够直接测量,那么曲线将更加夸张。但正如我们后面会提到的,最初几次复习的真正间隔时间在大多数情况下确实要长得多;如果我们能直接测量它们,这个指数曲线可能就会显得更加平缓。
到目前为止,通过将读者展示的记忆保持定义为 90% 以上的问题所达到的间隔,我所展示的图表汇总了文章中的所有问题。但如果我们深入到一个更细致的层面,就能看到很多有趣的细节。
按读者划分
例如,图表中靠近底部的读者实际上表现得比看起来要好。他们能够记住绝大多数问题,并且跨越很长的时间间隔——只是少数落后的问题没有被记住。
这里是第 10 百分位用户按问题划分的展示记忆保持分布。
绝大多数的问题都被记住了 4 个月或更久。只有少数几个问题他们难以跨过 1 个月。再经过一次复习,其中很大一部分将继续向上移动;这是同一个用户下一次复习的情况:
按问题划分
这些「落后问题」在不同读者中有一定的普遍性。仅仅 5 个问题就构成了超过四分之一的情况,其中一个读者在 5 轮复习后,对某些问题的展示记忆保持不足 1 个月。13 个问题占了这些情况的半数。除此之外,剩下的 99 个问题分布较为分散。
这个趋势在下面的图表中表现得更为明显,展示了 5 轮复习后,每个问题的记忆保持时间。这里的每一「栏」都是针对一个问题的箱形图,每个读者都是其中的一个数据点。
约有四分之三的问题,其第 25 百分位数的记忆保持时间超过 4 个月,其余大部分问题也都稳稳保持在 2 个月以上——这实在是太棒了!尽管分散度较大暗示我们还有进一步优化调度的空间。但底部的那些问题似乎显然需要额外的辅助。这些底部问题大多是困难的死记硬背题:「X/Y/Z/Hadamard 门的矩阵表示是什么?」,「匕首操作有哪三个常见称呼?」,「谁在使用量子计算机模拟量子场理论方面取得了进展?」。在这些问题中,有一个更具概念性的问题格外引人注目:「存在哪些电路示例,其中 CNOT 门的目标状态输入不变,但控制状态却发生了变化?」另外还有一些问题聚焦于狄拉克记号和矩阵的幺正性等关键细节。
这种分析方式可以为我们指出问题所在,但这些棘手的问题到底是怎么回事还不清楚。为此,我们需要深入遗忘的动态过程。
反事实:不练习就会忘
为了使助记媒介真正具有变革性,(至少)需要以下四点成立:
-
记忆:如果你按照建议练习,几乎可以长期记住所有内容。
-
成本:不需要花费太多的时间。
-
反事实:如果你不练习,你就会忘记。
-
迁移:这种持久的记忆能够转化为实际的理解和能力,应用于人造练习场景之外。
前面的部分简要介绍了前两点的现状。我必须坦白,目前对于知识迁移的效果,我还没有太多的信息[1]。但在过去几个月中,我对反事实的第三点有了更深入的了解。
你在这一节看到的大部分数据来自我在 2021 年进行的一个实验,该实验随机为新读者分配不同的复习计划。例如,第 1 次复习的间隔时间不同,包括 1 周、2 周、1 个月和 2 个月。这种差异应该能让我们看到如果不复习会发生什么。
但正如我以前讨论过的,情况并不那么明了。这里是所有问题和读者的平均记忆率:
真的吗?1 周和 2 个月之间只有 13 个百分点的差距?这很难让人相信!我在之前的文章中讨论了许多解释和分析,但在这个问题上又花了一百多个小时后,我认为最重要的一点是:许多问题很简单;许多读者非常熟练;因此,你需要更仔细地观察,才能看到明显的遗忘曲线。
现在根据这些数据,我的总体印象是:如果不进行练习,你很可能会忘记「较难」问题的答案;如果你觉得材料很难,你也会忘记许多其他卡片。但是,对于「简单」的问题,即使没有太多支持,你可能也会记住答案一两个月。
补课环节
我们在所谓的「补课」环节中见到了一个相当明显的遗忘曲线。在最新的复习策略中,如果你在读文章时忘了某张卡片,我们会在第 2 天提醒你再复习一遍——为了额外加强而进行的「补课」。如果你在那次复习时还记得卡片,我们将为你安排第 1 个更长的间隔。(也就是说,上文提到的遗忘曲线中的样本,是指在这些补课环节之后的第 1 次复习——即在读者展示他们能记住一天之后。)
但人们并不总能在指定的时间进行复习。邮件可能会放置几天未看。所以,通过查看实际复习时的回忆率,我们可以观察到有多少遗忘发生了。
红线代表了我们讨论中的那些读者的遗忘曲线,他们在 1 天后被安排了一个「补课」环节。而蓝线则表示了一组使用早期策略的用户,这个旧策略最初是在 5 天后才安排复习遗忘的卡片。因此,3 周时间里,回忆率从大约 85% 降到了大约 55%。
蓝线还解决了我对进行此类分析时的一个担忧:选择偏见。比如,是不是那些「迟到」的学生不太自觉,不太认真,记忆力不太强呢?但红线和蓝线之间的紧密吻合说明,实际上这种差异并不明显:迟到的读者与勤勉的读者表现大致相同;间隔时间起决定作用。
此外,这些一开始就被忘记的卡片,在下一个安排间隔较长的复习中,其遗忘曲线要陡得多。这个间隔在不同的实验组中有所变化。
大多数读者在阅读文章时都会忘记十几张卡片。至少对于这些卡片,反事实情况似乎很明确:如果不进行多轮练习,你在随后的几周内很可能会忘记。
此外,还有一个复合效应使得从遗忘中恢复变得更加困难。如果你在第 1 次复习时忘记了卡片,你会像在文章中忘记时一样,在 1 天后被安排一个「补课」环节。如果读者在较长的间隔后忘记,他们在这些补课环节中的表现会更差。当最初的间隔为 2 个月时,读者在第 1 次复习和之后的补课环节中都会有 16% 比例遗忘,而在 1 周的条件下,读者只有 2% 的比例遗忘。
按问题划分
「困难」卡片的遗忘曲线更为陡峭。这里的「困难」是指「在文章中回忆率较低」。这与第一次复习时的回忆率有中等程度的相关性(r=0.65)——实际上比通过基于项目反应理论的模型拟合的难度参数更能准确预测。
接下来展示的是,按卡片难度四分位进行划分后,第 1 次复习的遗忘曲线。图中最上方的线表示「最容易」的卡片,最下方的线表示「最难」的卡片(即,在文章中回忆率最高和最低的)。
因此,如果不复习,你很可能在两个月后忘记「困难」卡片,而在中等难度的卡片上的表现将下降到 C 级。最简单的卡片可能还好!
通过下图,我们可以更清晰地看到难度带来的影响,它展示了不同初始间隔下,各个问题(难度从低到高排列)的回忆率。图中的垂直网格线表示问题的十分位点。
对最简单的大约三分之一的卡片来说,差距不大,但是差距会随着卡片难度增加而扩大,直到最难的十分之一的卡片后再次开始缩小。(此外,我们注意到两个月间隔的样本更少——这是另一个值得关注的现象,但我暂时不展开讨论。)
自然,下一个分析角度可能是按读者四分位来划分,但我们没有足够的样本做这样的分析。但是,我们可以通过观察以下两点来较好地理解这种效应:a) 在文章阅读期间更容易忘记卡片的读者将会忘记更多的卡片;b) 如前一节讨论的,文章阅读时遗忘的卡片有着陡峭的遗忘曲线。
练习的价值
在这个实验中,第 1 次复习间隔为 1 周的读者下一次复习的间隔是 3 周。这允许我们估算这样一个情况:设想你 1 个月后需要某些知识。如果你在 1 周后复习这些材料,然后再等待 3 周(总共约 1 个月),相比那些在这个月里完全没复习的人,你的表现会如何?
遗憾的是,我并没有设定这个实验来做一个完全公平的比较:如果读者在第 7 天忘记了一张卡片,他们在会当天再次复习,然后再隔 21 天复习。因此,这些卡片得到了一些额外的练习机会。并且,在这里坚持进行第 2 次复习的读者群体中,也可能有显著的选择效应。我试图在本文中分享的其他比较中控制这个因素,但在这里我没有足够的数据来这样做。
尽管如此,一个明确的结论是:更多的练习可能比间隔差异带来更大的区别。首先,和我们已经讨论的一些显著例外一样,间隔似乎并不那么重要。重复才是关键。
我们必须从成本与效益的角度考虑重复练习。拿上面图表里「最简单」的四分之一卡片来说,多一轮复习似乎影响不大:只是将回忆率从 95% 提高到 100% 而已!这个成本可能超过了收益。对于接下来的一部分问题,情况可能也相同。但当然,我们不应过分依赖这种观点。仅凭回忆率并不能完全反映情况。额外的复习很可能在这里没有体现出来的微小方面加深了理解。更细微地,它加强了与学习材料的情感联系。我认为,这种联系的减弱是初始复习间隔为两个月的读者坚持下来得更少的部分原因。
理想情况下,我们希望能够比较策略 A 和策略 B,绘制出一个有效边界。如果我愿意投入 X 分钟时间,我能得到的最佳表现是什么?或者,如果我想要达到某个特定的稳定记忆保持间隔,成本最低的策略是什么?
当然,有许多关于这个主题的论文,但都涉及构建遗忘曲线的预测模型,而我一直在特立独行地避免这样做,专注于数据中直观可见的模式。但我并未成功。如果我想深入探讨这个成本/效益问题,我预计需要构建一些模型。
没有文中卡片情况下的遗忘
到目前为止,我们已经讨论了反事实:如果你今天阅读了《量子国度》,并在一段时间内不进行复习,会发生什么情况。但同样值得一问的是:如果你只阅读《量子国度》的文本——没有任何嵌入的卡片,也没有练习,会发生什么?
我们在 2020 年进行了一个实验,可以(粗略地)将其与上述实验数据结合起来进行估算。在这项实验中,我们在某些读者的文章中隐藏了 9 张卡片,然后在 1 个月后的复习环节中悄悄重新插入这些卡片。
值得高兴的是,这些实验问题涵盖了我们之前讨论过的「卡片难度」的 4 个四分位数。我已经没有精力做更多的图表了,所以我只比较了「最简单」和「最难」的这两张卡片,以展示结果的范围。它们分别是「|ψ> 是...的一个例子?」和「如何用狄拉克极好和单位向量 |e_j> 表示矩阵 M 的第 jk 个元素?」。
-
「困难」的卡片需要额外支持,才能在 1 个月后可靠地回忆起来:
-
没有文章内的卡片或练习,1 个月后:42%
-
有文章内的练习和补课环节,1 个月后:71%
-
有文章内的练习和补课环节,在 1 周后练习(可能还有补课环节),再过 3 周后:90%
-
-
「简单」的卡片所需的支持较少:
-
没有文章内的卡片或练习,1 个月后:89%
-
有文章内的练习和补课环节,1 个月后:91%
-
有文章内的练习和补课环节,在 1 周后练习(可能还有补课环节),再过 3 周后:100%
-
但情况也因读者而异。
-
对于文章内回忆率处于最低四分之一的读者:
-
「困难」卡片的数据分别为:23%;62%;75%
-
「简单」卡片的数据分别为:79%;93%;100%
-
-
对于文章内回忆率处于最高四分之一的读者:
-
「困难」卡片的数据分别为:56%;67%;100%
-
「简单」卡片的数据分别为:97%;87% (?);100%
-
这些数据使得反事实的说法显得更加明显。在没有任何支持的情况下,难以掌握的细节很可能会被遗忘。对于那些在材料上遇到困难的读者,即使是「简单」的卡片,也至少需要文章内的练习才能保持可靠的记忆。
————————
感谢 Gary Bernhardt、Michael Nielsen和Giacomo Randozzo对这些议题的有益讨论。
[1] 当然,关于这个问题之前有很多实验,大多是在实验室环境下进行的;例如,见 [Butler (2010)](http://andymatuschak.org/files/Butler - 2010 - Repeated Testing Produces Superior Transfer of Learning Relative to Repeated.pdf) 的综述。
用理解喂养抽象
原文:Square Signals : Feeding abstraction with understanding (andymatuschak.org)
抽象概念能够赋予我们力量,加快我们的步伐。作为理解的有效封装,它们能够推动领域的发展,但创造新的抽象概念必须基于对现有思想的深入理解。所以我要说的是:如果我们要精通某个领域,就不能将它的任何抽象概念视为魔法。相反,我们应该把这些抽象概念当作是我们已理解知识的自动化工具。
这个理念区分了遗传进化的无序、缓慢增强过程与科学进化的有目标、快速探索过程。理解不仅能指引我们前进的方向,还能帮助我们及时纠正偏差,没有这些,我们就无法实现持续的进步。
比如说,如果你总是按照食谱做菜,却不理解每个步骤的原理,那么你很难在做菜失误时做出补救,也很难改进一道普通菜肴,更别提自己创新了。在音乐(「小调听起来悲伤」)、写作(五段论文)、数学(毕达哥拉斯定理)、工程(缓存系统)等领域里,对抽象概念的片面理解也同样适用。
如果你接受这个想法,那么我们就会面临一个实际的问题:没有大量的预备知识,怎样才能学会有用的东西呢?代数课特别容易遇到这种困境。
-
老师:「今天我们将学习如何分解这种形式的二次方程。」
-
学生:「我为什么要学这个?」
-
老师:「这能帮你找到抛物线与 x 轴的交点。」
-
学生:「我为什么要学这个?」
-
老师:「这有助于你计算物体的运动轨迹。」
-
学生:「啥?」
-
老师:「相信我,将来你会庆幸自己学了这些。」
要培养真正的理解,我们必须以这样的方式来组织概念:让学生能够自己找出解决方法,而不是让他们死记硬背一些步骤。当然,只有学生真正想要解决的问题才会激励他们找出解法。
微世界或许是一种解决方案。这个想法是:创造一个小型、自洽的沙盒环境,让学生可以在其中探索某个概念,除了他们已知的知识之外,几乎不需要其他指导。这个沙盒并不是隐藏细节,而是聚焦于特定内容。那么,可以设想,逐步构建这样的微世界宇宙——每个都有其实用价值——这样从一个世界跳跃到另一个世界的距离就不会太远。
想象你在学习弹键盘。开始时,你用的是只能演奏 C 调五音音阶的简易键盘。五个键不会太难。其他的键虽然存在,但是变暗了。你仍然可以弹奏各种曲子和节奏。你甚至可以尝试和弦,虽然许多人可能还没意识到这一点。然后,你可以切换到六音布鲁斯音阶模式:同样简单,同样不复杂。接下来,你可以在键盘上方显示你弹奏的音符对应的五线谱。这样一步步来。在这些简化的键盘上学到的技能,转到更复杂的键盘时也能派上用场!
每个微世界自然会吸引不同类型的学生,这没关系:他们可以自由地在这些世界间穿梭。我们的目标是提供一个供实验和培养理解的沙盒,而不是一个固定的教学大纲。理解之所以奇妙,是因为它本身就是一个反馈循环:我们可以用它来产生更多的理解。
寻找研究和情境的匹配点
原文:Finding research–context fit | Patreon 上的 Andy Matuschak
Finding research-context fit.m4a
早期创业公司总是拼命寻找「产品—市场匹配」——找到一种解决方案,对于某个市场非常有吸引力,结果所有人都在想要你的产品,比你做产品还快。此时指数飞轮便开始运转,而创业公司也能开始履行其雄心壮志。
有抱负的「思想工具」发明者不追求快速的客户增长,但他们的研究速度确实关键取决于一个相关现象:研究与情境的匹配点。为了解释我的意思,我会描述我如何寻找这一匹配点。
量子国度的研究与情境匹配度不高
我一直在努力创造一些环境,让读者更容易学习复杂的想法——这些环境旨在大幅扩展人们的思想和能力。2019 年,Michael Nielsen 和我出版了量子国度,这是一本基于实验性「助记媒介」编写的量子计算教科书。该媒介融入了来自认知科学的强大理念,旨在使人们更容易记住他们所读的内容。
现在想象一下,《量子国度》的大多数读者都是研究生新生。他们即将开始在新领域开展原创研究;他们正试图找到自己作为独立思考者的定位;他们正拼命地学习一个以颇具挑战性而闻名的新领域;他们也许有点不知所措。在他们生活中最重要活动的日常体验中,他们会真切地感受到,像《量子国度》这样的资源的成功或失败。与学生的对话将推动对该媒介的研究。对学生理解的定性影响将引出重要的新研究问题。在这个世界中,我将有研究与情景的匹配点。
但情况并非如此。《量子国度》的大多数读者——甚至是坚持复习环节几个月的读者——都只是仅仅有些好奇的人,有兴趣了解量子计算的基本知识。《量子国度》是其他一些密集的非虚构读物的更精细版本,他们可能在周日早上喝咖啡时阅读。这些读者可能会喜欢这本书,但媒介的成败对他们的体验并不直观可见。
这种背景并没有对媒介或其想法产生足够的压力。它最大的缺陷在哪里?沿着哪些方向可以有意义地扩展读者的能力?什么情况下,一个人可以完美地记住成百上千个细节,却仍然无法理解或行动?这很难说。更糟的是,在这种不太严格的情境中,自发产生的问题倾向于为媒介弱化框架,侧重于帮助休闲读者享受学习。我渴望更强大的框架:开发一种媒介,显著扩展读者的能力,让他们做任何他们认为最有意义的事情。开发这样一个系统的最佳方式,是在一个会如饥似渴地消化其好处的情境中。强烈的解脱和深深的挫败感会推动发问和解答。
我所描述的问题在「思想工具」领域很常见,特别是对于那些主要关注于赋能他人而不是自己的发明者来说。正如迈克尔和我在我们如何开发变革性的思想工具?中指出的那样:
有很多关于思想工具的产品,其形式都是玩具或「教育」环境。就像真正的作家不使用的写作工具,真正的数学家不使用的数学工具… 我们很容易陷入货物崇拜的模式,做一些看似(比如说)数学的工作,但实际上却避免深入这个学科的要害。对于要为其创造工具的学科,这些工具创作者却从来没做出什么重要原创性工作。他们怎么能知道工具需要包括什么呢?
...
假设你想为 X 学科建立工具… 除非你深入地参与到该学科的实践中,否则要建立好的工具是非常困难的。这就像没有实际做任何木工工作,却试图建造新的木工工具。这也许是像 Mathematica 这样的工具能派上用场的部分原因——主要设计者 Stephen Wolfram 对数学和物理学有真正的研究兴趣。
...
这里有一条一般原则:好的思想工具,大多是在对严肃问题进行原创工作时产生的副产品。他们往往要么是由从事这项工作的人创造的,要么是由与他们的工作关系密切的人创造的,这些人是真正创办者。此外,这些问题本身对于问题解决者来说通常具有强烈个人兴趣。他们不是为了薪水而解决问题,他们是急切地想知道答案。
值得强调的是:这个原则似乎可以解释有志于发明思想工具的人中的许多失败!我发现自己很难注意到这一点。我发现自己很难注意到这一点。像许多其他技术专家一样,我有一种自然的工具固定化倾向。如果我不控制这种倾向,我就会陷入这段话所描述的那种失败模式。
就为作者开发工具而言,量子国度对这一原则管理得相当好。我的合著者迈克尔也是量子计算领域标准教科书的合著者。他对成为一个有效的作家的挑战也相当认真,无论是一般的还是关于这个主题的。同样,在我通过 Orbit 将媒介扩展到其他领域的工作中,我花了很多精力与助记媒介的潜在作者建立关系,使他们的问题成为我的问题。
但我最近才意识到,我一直忽略了同样的原则,因为它适用于读者。对于我们这些对创造传播媒介(如助记媒介)感兴趣的人来说,我们必须与作者和读者/消费者建立密切的工作关系,否则我们就必须是这些角色之一。
寻找一个更好的环境
仅仅与读者进行更密切的合作是不够的。我需要在一个强大到能支撑我研究的情境中寻找读者。以下是一些似乎对于助记媒介乃至一般思想工具研究来说,使研究与情境良好匹配的重要因素。
-
强烈的信号:你需要能做出实验,并能以足够的清晰度进行观察,从而实质性地回答你的核心研究问题。就目前的《量子国度》和 Orbit 而言,要回答发展媒介所需的基本问题就相当困难。非常宽泛地说,这可能意味着:什么起作用?什么不起作用?该媒介对读者能力的实际影响是什么?更狭义地说:媒介的具体变化如何影响它对读者的作用?如何影响它赋能于读者的行动?不同种类的互动可以支持什么样的理解?在什么主题下?
-
真正的利害关系:你想要一个情境,让你的工作至少具有变革的潜力。你不能期望立竿见影,但为了指导你的工作,你至少要能看到非线性回报的曙光。思考像助记媒介这样的项目的目标的一种方式是创造一个环境,使一些重要的读者群体从根本上更加有利——简化,一个 10 倍速的阅读环境。但是,无论怎样的媒介改进,都无法「改变」那些除了放纵偶然的好奇心之外,对参与这个主题不感兴趣的读者。
-
驱动的问题:也许最重要的是,你需要的不仅仅是一个可以帮助回答你的研究问题的环境:你需要的是一个足以让你沉浸其中、要求严格的环境,使它能够自己定义出引人注目的研究问题。理想情况下,你根本不会带着你自己强烈的研究问题来。相反,它们应该在对环境的反应中自然产生。
这场讨论中有一个令人困惑的地方,那就是我其实对增强好奇心驱动的读者相当感兴趣。周日早晨的阅读或许起初随意,但这往往能埋下一颗孕育出有意义的创新成果的种子。我怎样才能把这个现象和我所描述的担忧调和起来呢?大体上来说,我认为这个研究领域里面存在很大的路径依赖。就好比一位没有显微镜的生物学家,我需要更强的工具来探寻我正在研究的现象。这在思想工具的领域里看似并不稀奇。工具一开始在某个临界环境下被开发出来,这个环境足够激烈,以至于能孕育出非常有力的想法,然后它们就在要求相对低一些的环境中被广泛应用。当然,这最后一步并不是自动就能完成的。Wolfram 创造了 Mathematica 就是为了满足他作为研究人员的需求,我敢说,要让这个工具适应更随性的使用者,一定做过大量的调整。同样地,为了增强深度阅读而开发的环境,如果要改造它来适应非正式的阅读,肯定需要一番精心的改动。但我猜,反过来可能会更难,或者说根本做不到——比如,把 Calca 发展成 Mathematica。
我现在的初步设想是,「理想」的读者应该是那些对新领域(很可能是技术类的)有严肃的求知欲、并且有着一定的创新项目,比如进行一项原创研究或是筹备一场创业的人。由于我在创造一种传播媒介,所以需要找到这种读者和一个富有激情的作者的交集。要获取充足的反馈,找到一群团结活跃的人并深入其中是最好的选择。
与此同时,我得物色那些在某一领域拥有专业知识、愿意帮助新手,并且热衷于深入合作的作者。光是给作者一个现成的工具,然后在他们尝试写作时解答疑问,这样做远远不够。必须让作者对于主题的需求理解,和对读者面临困境的认识,去引领媒介的进化。一种强大的新型传播媒介,不仅要让读者受益匪浅,对作者也应同样具有深远影响。
更具体地说,我正在探索的两个最有希望的作者/读者情景:
-
为了让门下研究生新生熟悉研究所需话题,教授写下的专著/教科书/笔记
-
一本行业领袖的书,旨在指导人们如何在全新而富有挑战性的领域(如生物技术、机器学习)创业或加入公司。读者可能是科学家,也可能是技术专家。
为了说明选择情景所涉及的问题,我将讨论一些其他的情景,这些情景最初看起来很有希望,但我现在担心它们会带来严重问题。
大学课程
我想回答的一个关键问题是:通过提取练习建立的流畅性,会对你的理解力和创造性解决问题的能力产生何种影响?大学课程有内置结构(如考试、项目、论文),可以帮助我探索这个问题。
但这个情境下的读者面临的问题,和我想解决的并不一样。他们中大多数人并不是在进行有意义的创造性活动的同时进行学习。他们中大多数人都是对外部激励机制做出回应(这是完全合理的!):学习这套你应该知道的东西;通过课程;取得足够好的分数;等等。
我记得作为一个本科生的感觉。我正在上五门课,其中有一半的课程我还算有点兴趣,其他的都是必修课。我确实想学习,但是校园生活有很多其他让我着迷的事情。再说了,大部分本科课程对学生的流畅程度并不寄予太高期望。如果当时有教授告诉我:「只要用这个系统在整个学期中花两个小时的时间,就能稳稳地记住我课程的所有内容」,我可能会对他们的言论半信半疑,但很可能我也不会按他们的建议去做。我原有的学习方法看起来「已经够用了」,尽管我知道我学到的很多知识并没有真正「牢记在心」。事实上,这种态度似乎与我们今年春天在一个本科班级进行的实验体验相吻合。
许多人制作了各种系统,旨在帮助人们更有效、更可靠地提升课业成绩。相较之下,我更感兴趣的却是那些能拓宽人们思维,使他们能自由自在地围绕自认为有价值的事情行动的系统。这两个目标固然有其相关性,但并非完全一致。考试分数不过是对某种能力的一个替代指标,但它给媒介施加的压力,未必能揭示我想要解决的问题。我在这个领域深耕已久,深知「教育」这个词汇背后所蕴含的巨大力量。它更有可能颠覆我的工作,而不是我去颠覆它。
[医学/法学/商科]学生
在本科学习的情境里,问题的一部分在于学生其实并不需要流畅性,就能达成他们当下的目标。但对于医学生来说,这就是必须的了。因为他们要吸收大量的知识,目前已经有一大波医学生在利用间隔重复,去熟悉他们在工作中需要的知识。我估计,法学和商科学生的情况也类似。
但当我浏览 medicalschoolanki subreddit 时,我的感觉是,这些医学生们的主要动力在于,他们想在重大考试中取得高分,其次才是出于对积累或许有朝一日能派上用场的知识的一种抽象乐趣。我妻子是名医生,所以我问她认为是什么在推动医学生的学习行为。她脱口而出的回答是:「恐惧!」害怕考试挂科,害怕分数不够申请心仪的医院实习资格,害怕在大人物面前出丑。但他们并不害怕会伤害病人(毕竟有多重的监督机制在),也不害怕在研究项目上因缺乏必要的知识而手足无措,更不害怕自己理解不了自己渴望掌握的知识。
我相信,在这些情境中,有些学生的感受不同。也许我可以想出如何与他们合作。但我越来越怀疑,这些情境不会为我的研究提供正确的压力。
新员工培训
假如你刚入职一家新公司,你可能急切地想要立马展现自己的能力。然而,要做到这一点,你必须先掌握大把基础知识。以 Stripe 公司为例,新员工需要快速吸收大量公司内部和行业专有的术语,理解复杂的概念,熟悉公司的运作程序。再者,新的开发人员还需要了解关于公司内部基础设施的各种细节。在这种背景下,运用助记媒介可能会产生很有趣的效果。
这里面临的挑战是,正式的企业学习系统几乎总是令人灵魂深处感到压抑,给人的感觉像是学校最糟糕的部分。当你听到「合规培训 」或「再培训」时,你会想到哪些平庸的恐怖?你能感觉到,使用这些系统时的每一步动作都会被统计成一份「报告面板」,供某个地方的管理员查看。围绕这些东西有一个完整的行业,叫做「企业学习和发展」。虽然有些讽刺,但我确实知道有些心怀良意的初创公司(一些已经倒闭,一些还在努力)在这个领域尝试应用间隔重复。我担心他们为了讨好购买者,牺牲了这种方法的巨大潜力。最大的挑战之一就是,这个情境下的购买者其实并非使用者,所以预计的委托—代理问题就会显现出来。
在这个领域的诀窍是找到一个公司,大到让良好的入职培训显得至关重要,但又小到让整个过程不至于从一开始就让人感到烦闷。我的直觉是,应该将此过程调整为以员工为中心的工具:只要你在入职时对任何东西感兴趣,就用你的「魔法棒」指向它,你就能轻而易举地记住它!这个工具的服务对象是你,而不是某个企业的数据看板。这几乎与常规的以雇主为中心,「喂」给员工任务的培训方式截然相反。如果从创业公司的角度来看,这样的做法就是在「颠覆」企业学习和发展领域,通过推出一款「草根」工具,让员工主动兴奋地接受,然后推广到整个公司,就像 Slack 的发展道路一样。
这一切在我听来相当悲惨——当然,我是想找到研究情境,而不是「赢得」一个「细分市场」——但我仍然相信,如果有合适的合作伙伴,这条道路会非常有趣。
高风险的生活变化
某些关键的生活事件往往会伴随购书狂潮:有了第一个孩子,成立了第一家公司,建造了一栋房子,为失去亲人而悲伤,等等。这些主题,尽管技术含量不高,却关乎重要利益,且与我们的生活密切相关。鉴于许多面临这些处境的人已经在购买相关书籍,那我们是否能让这些书籍发挥更大的效用,从而产生更深远的影响呢?
我在这里犹豫不决,因为虽然所有这些事情都很困难,但我怀疑「学习复杂的想法」在这些挑战中,真的是瓶颈所在吗?当然,在这些领域中还有其他有趣的机会,可以让书更好,这些机会不一定都和学习复杂的想法有关。但我已经花了很多时间思考如何使用助记媒介来帮助人们学习复杂的想法,我觉得如果不在这个问题上继续深入,而草率改变关注点,那真是太过遗憾。
我在思考如何提升个人成长类书籍的效果时也有同样的顾虑。例如,我认为像《原子习惯》这样的书,如果能把创制经验延续下去,帮助读者把书中的观点融入自己的生活中,那这本书的影响力就会大大增强。但我直觉告诉我,要认真对待这样的挑战,可能意味着要开发出一种完全不同的媒体形式。再举一个例子,学习佛法的确需要内化大量精确知识。也许助记媒介可以对此有所帮助。但对八正道和四圣谛的提取练习,可能并不是提升这类书籍的最重要的方式。
————————
我内心的一部分在担忧,是不是我想太多,阻碍了我在「足够好」的情景下建立势头。而另一部分则在忧虑,我是不是还没有充分意识到问题的严重性——也许,这才是我工作中面临的最大挑战,我应该把全部精力都放在解决这个问题上。
在可汗学院的工作经历中,我受够了研究/情境匹配差的问题。我现在渐渐认为,良好的匹配度是优质工作的必要条件。这一匹配很是微妙。匹配度差,不会像缺失的仪器或技能一样构成明显的阻碍。但如果你期望建立系统,增强他人的能力,你的见解空间会极大由他们的使用方法决定。
常青笔记的五年历程
原文:Five years of evergreen notes | Patreon
上个月,我发表了一篇文章,这篇文章其实是我五年前就开始创作的。2019 年我动笔时,深知自己对这个主题的理解还远远不够,无法创作出心目中的理想作品。尽管如此,我仍然希望能够推进这项工作——哪怕只是把我目前掌握的一点点知识整理清楚,也可以作为未来深入研究的起点。
于是,我开始实验新的笔记写作法,这在很大程度上受到了尼克拉斯·卢曼的卡片盒笔记法的启发。我的目标不是为了写笔记而写笔记,而是要打造一个强大的思考环境。我希望创造一个环境,让我能够日积月累地收集想法,使那些零散的思绪不断积累、演变,最终凝聚成一个有意义的整体。
对于这种长期积累的需求,传统的笔记方法往往不太奏效。常见的笔记形式是一卷不断延展的草稿,每天都在末尾添加新内容。这样一来,那些有价值的灵感很容易被次日涌现的新想法淹没,而不是被反复打磨成清晰的观点。
在我的方法中,我坚持每天记录大量草稿。然而,每当遇到富有洞察力的内容时,我会围绕这个特定的观点、问题或想法撰写一篇简明扼要的笔记。(你可以在这里查看一些具体示例。)我的目标是让每篇笔记都能独立成篇,清晰易懂,但我会在笔记中穿插大量指向其他小型笔记的链接。这种做法使我能够在各种想法之间快速切换,洞察它们之间的内在联系。我希望每篇笔记都能成为该主题上的「常青」条目,这样我就可以通过持续积累和优化这些笔记,无论是独立的每一条还是作为一个整体的网络,来推进我的思考。
五年时光流逝,我最近完成的一篇文章在某种程度上印证了这种方法的成效——但同时也揭示了一些重要的不足。此刻正是回顾和反思我在笔记写作环境方面所做实验的最佳时机。
笔记的发散与维护
为什么要「常青」笔记?这个(雄心勃勃的)理念是,你笔记库中的每一篇笔记都应该反映你当前对某个问题的最佳思考。这样,随着你在数月乃至数年间不断深化对某个主题的理解,你就能借鉴并拓展这些坚实的思想基础。更重要的是,由于这些笔记之间存在密集的链接网络,当你改进其中一篇笔记时,某种程度上你也在提升整个网络中与之相关的所有笔记的质量。
这种做法的弊端在于维护负担和所谓的「概念债务」。这让我想起软件工程中的一个典型现象。初出茅庐的工程师常常为自己写出了多少行代码、项目规模有多大而沾沾自喜。然而,经验丰富的工程师却往往将代码视为负担而非资产。他们更倾向于精简代码,因为他们深谙每多一行代码都意味着更多需要维护的环节,更多潜在的故障点。随着时间推移,系统的某一部分通常会发生变化,导致其他部分变得不协调或过时——这就产生了所谓的「技术债务」。
今年五月,我感到自己终于积累了足够的知识,可以着手写那篇期待已久的文章了。我在「我们如何学习?」这个主题上的研究,为我提供了看待一些老问题的新视角,同时我也有一些新想法迫不及待要表达出来。但这一次,我没有像往常那样为这些新材料写下常青笔记。我觉得自己已经准备好直接投入写作;写笔记似乎成了一个不必要的迂回。于是,我直接在文章草稿中发展这些新的想法。
如今,这篇文章已经完成,但我仍然保留着数十篇关于这个主题的笔记。其中许多笔记已经无法反映我最新的思考了:就像往常一样,在写作过程中,我的观点不断演变,变得更加清晰和深入。现在回看,有些旧笔记在我看来甚至是错误的。而文章中大约三分之一的想法是全新的,是在之前的笔记中完全没有涉及的。
如今,我关于这个主题的笔记反而成了债务,而非资产。虽然我可以更新它们,但目前我实在提不起兴致。这感觉就像是在做毫无意义的文书工作。这些旧笔记散发着一种陈腐的气息,让我提不起劲儿去重新审视它们。然而,我又不愿意简单地将它们丢弃:我相信日后我还会重拾这个主题,而且笔记中还有许多未被收录到文章中的宝贵材料。
从某种程度上说,这个系统已经完成了它的使命——多年来帮助我为撰写这篇文章做准备。但现在,我的笔记库中存在一个疏于维护的角落,它悄悄地影响着整个系统的使用体验。
该如何应对这种情况呢?一种方法是立即给出视觉上的过时提示,就像发黄的旧纸一样。人们很容易想象,一个 AI 系统或许能帮助我自动维护这些旧笔记。可惜的是,这样的 AI 需要获取我脑海中的隐藏信息。比如,如果我不再认同某条旧笔记的观点,我不一定会在 AI 可见的地方明确表示反对:我可能只是在最近的工作中不再提及它。但并非所有未被提及的想法都是不好的——许多只是不符合我当前讨论的主题而已。
笔记作为思维脚手架
孕育新思想是一项艰巨的任务。我们常常需要同时处理太多相互关联的问题,犹如在空中同时抛接多个球。写作的奇妙之处在于,它减轻了我们大脑同时处理多个信息的负担,因为纸张可以承担部分记忆和思考的工作。
不幸的是,写作同样是一项艰巨的任务。在这个过程中,写笔记犹如搭建「脚手架」。它为我们营造了一个宽松的环境:你无需一蹴而就地完成一篇万字长文,也不必急于构建一个完整的叙事框架,更不用着急判断内容的轻重缓急。你只需专注于一个想法,尽可能清晰地表达它。当进展以数百字的独立片段呈现时,任务就变得更易掌控。面对超出能力范围的任务时,这样的脚手架显得尤为珍贵。
在开启我的笔记写作实践后不久,我开始为赞助人撰写月度文章。这为我的写作和思考提供了一个新的环境,比起工作笔记,它的要求更高,内容更为丰富,但相较于那些更为严肃的主要文章,难度又相对较低。在过去的五年里,我在这些月度赞助人文章中累计写作了逾 15 万字。通过这些持续的写作实践,我的写作能力和自信心都得到了显著提升。最初,我需要借助笔记这个「脚手架」来拓展有限的想法。而现在,我已经能够在写作过程中自如地发展新的想法。准备性的笔记似乎变得不那么必要了。如果我能够直接在文章中阐述想法,我自然会选择这样做:因为这样的作品通常会更加生动、直接,也更加真实。
我的笔记写作实践,如同所有创造性工具一样,既有收益也有代价。随着我写作水平的提高,它所带来的边际效益似乎在逐渐减少。与此同时,随着笔记数量的增加——需要链接和维护的内容越来越多——我确实感到维护成本在缓慢上升。也许有朝一日,当我回顾这个笔记写作系统时,会将其视为一种「训练用」的外骨骼,一种我最终将完全超越的工具。即便如此,我仍然会心怀感激,因为它曾是我成长道路上的重要垫脚石。
笔记作为公共物品
2020 年初,几乎是出于一时兴起,我开始公开分享我的工作笔记。最初的动机很简单:我发现在 Twitter 和各种聊天中,我经常会说「哦,我写过一篇关于这个问题的笔记」。于是我想,如果能够分享单条笔记的链接,或许可以快速丰富我们的讨论。
让我惊喜的是,这种做法最终催生了更多新的讨论。人们在浏览我的笔记时,偶然发现一些引人入胜的内容,随后会给我(或他们的朋友)写信讨论。这种网络效应为我创造了许多新的人际连接和机会。
我在写笔记时面临的一个问题是,这个过程往往缺乏强烈的情感环境。当我只是为了某个抽象的、未知的未来而收集材料,而不是为了应对某个具体项目的需求时,这种体验可能会显得乏味无趣。更糟糕的是,它可能会变成一种义务——一件我「应该」做的事,而不是我热切想做的事。然而,如果我知道他人会阅读我的工作笔记,即使这些笔记还未被整合到一个更系统的项目中,这就能创造一个有意义的创作环境。当我心中有特定的人或对话时,这种环境会变得更加强烈。
社交环境还能带来一些短期回报,对于我这种可能持续多年的项目来说,这无疑是很有激励作用的。收到关于我笔记的暖心邮件总是令人愉悦。有一次令人惊喜的经历是,一位大学生在一次活动中主动来介绍自己,她告诉我,她所在大学的一个学生群聊开始讨论我正在进行的工作,包括我的笔记。
尽管如此,一个带有社交动机的环境——尤其是完全公开的平台——并不适合记录初步的工作笔记。当我正在努力理解一个尚未成型的想法时,这个过程本身就已经十分具有挑战性了。我不希望还要同时去揣测和担心假想读者的想法。这是另一种创造性挑战,更适合在我对材料有了更深入理解后再去应对。此外,我也不想过分重视工作笔记本身。我的目标是专注于创作重要的文章和项目,而笔记只是实现这一目标的垫脚石。因此,在实际记录工作笔记时,我不会过多地考虑社交和情感因素。除非是我已经相当熟悉的想法,否则我会假装这些笔记仅仅是为自己而写。
我的笔记对外公开这一特点使得内容过时成为一个更为突出的问题。多年来,许多人阅读了我上月文章的准备笔记,并就此与我交流。这些笔记至今仍然存在。很可能还会有更多人继续阅读它们,尽管其中许多观点已不再代表我现在的看法。这让我陷入了两难境地:如果不更新这些旧笔记,它们会悄悄地污染信息环境,读者也无法接触到我最新的思考成果;但如果选择更新,我又得给自己增添额外的工作负担。一个简单的折中方案是在所有相关笔记上添加提示横幅。(讽刺的是,我关于写笔记的笔记本身就需要这样一个横幅。)然而,这种做法仍然不够令人满意。
笔记与间隔重复
这种非传统的写笔记方法与我非传统的间隔重复实践相辅相成。观察这两种方法如何相互促进、共同演进是一件颇为有趣的事。每种方法都为我深化理解提供了强有力的支撑,同时也旨在抵御长期学习过程中的遗忘倾向。这两种方法各自对应一种媒介——常青笔记和间隔重复卡片——而这两种媒介的特性有着显著的差异。
常青笔记采用散文形式,虽然我力求让每条笔记聚焦于单个想法,但它们更适合进行较为全面和深入的讨论。相比之下,间隔重复卡片更适合精准聚焦于某个具体细节。一系列卡片可以用来解构复杂系统,但前提是我已经对该系统有了透彻的理解——而这种理解有时只能通过散文写作来获得。这两种方法的目标也各有不同:常青笔记旨在以文字形式保存想法,方便今后的写作和思考;间隔重复卡片则致力于将想法留在记忆中,以用于未来的任务。后者虽然更加理想,但也更耗费精力,而且在处理不那么精确的想法时效果不佳。
通过实践,我总结出了一个有益的指导原则:我主要使用常青笔记来记录自己的想法,或者探讨他人观点与我的想法之间的关联;而间隔重复卡片,我则主要用来内化他人的观点或关于这个世界的知识。
诚然,这里的界限并非泾渭分明。当我开始阅读一本书时,我通常会先专注于理解作者的意思;随后,我常常会不知不觉地开始将内容与自己的想法联系起来,暂时偏离作者的原意。这个过程并非单向的:这两种思考模式往往交替进行。为了能够灵活地在不同视角间切换,我将间隔重复卡片整合到了我的笔记系统中,这样我就可以在记录详细笔记的同时,随手添加一些卡片。
这种集成的笔记/卡片系统使我的学习方法更加自然流畅,但我注意到仍然存在相当多的重复工作。我经常先用散文形式详细阐述我对作者某个论点的理解,然后再将这个结论转化为几张间隔重复卡片。在很多情况下,这基本上只是一种机械的工作:将我的散文句子转换成「卡片语言」,几乎就是一种风格转换。这种重复的内容增加了笔记的冗余,降低了笔记的实用性。这些观察使我对[「以想法为中心」的记忆系统](https://www.patreon.com/posts/fluid-practice-83882597#:~:text=Language models and ideas as primitives)产生了浓厚兴趣。在这个系统中,笔记项目是置于上下文中的见解,而练习任务则是根据这些关键点自动生成的。
笔记系统与间隔重复系统的最后一个交叉点是:能否将笔记本身纳入间隔重复调度中。几年前我对这个想法满怀热情,但经过多次尝试,却未能取得令人满意的成果。例如,我曾设想让系统每天随机展示过往的笔记,以促进思维的偶然碰撞。又或者,当我有了灵感却不知如何发展时,可以设置在一个月后重新提醒自己。这种方法确实曾几次激发出富有成效的写作灵感,但大多数时候却只是无用的干扰。问题的核心似乎在于情感连接:当我对某个主题产生兴趣并记下笔记时,内心充满热情;但当这个笔记被算法重新呈现时,我的思绪可能已经转向别处,那个旧笔记便失去了意义。虽然我经常会重新关注曾经的话题,但这种兴趣的重燃往往难以通过简单的提醒来实现。
未来展望
说实话,我对当前市面上大多数新型笔记工具的功能设计感到困惑,尤其是在大语言模型盛行的时代。就我个人而言,工作笔记并不需要文字润色——我更倾向于在将零散想法整合成完整作品的过程中逐步深化思考。语言、语法和句法等基本问题对我来说不成问题。我也不需要系统自动关联相关笔记——现有的搜索和链接功能已经足够好用,我很少遇到「找不到笔记」的情况。至于自动生成会议纪要或读书笔记的功能,我认为没有必要,因为撰写摘要本身就是深化理解的重要过程。同样,我也不需要工具来帮我调整语言风格。诸如此类的功能,对我而言都显得有些多余。
那么,什么样的助力可能对我有益的呢?
一个角度是彻底避免写这些「常青笔记」。如果能够直接在意识流的草稿中发展想法,同时又能让这些想法随时间积累并产生价值,那么我们就可以避免创建和维护「整洁笔记」所带来的额外工作。Latticework 在这个方向上已经有所尝试,但我认为,一个专门为此目的设计的工具还可以更进一步。理想情况下,我希望能够以非结构化的方式自由畅想,同时又能快速、清晰地回溯到「有价值的内容」。我期望能够随着时间推移逐步完善这些未经加工的想法,而不必经历「创建和命名笔记」这样的繁琐过程。
另一个角度是,我发现自己在写作过程中经常陷入困境。通常情况下,我采用的方法效果不佳,但我却缺乏足够的元认知能力来跳出当前思路,选择不同的策略。更糟糕的是,我往往在身陷此种困境时甚至没有意识到自己的处境。此时,我只感到厌烦和不满。有趣的是,如果我向富有创造力的同行倾诉自己的困境,交谈几乎总能帮我走出困境,而且常常是通过一些再熟悉不过的建议。那么,有没有可能开发一个写作助手,它不仅能提供类似的帮助,还能察觉到我何时陷入这种困境——同时又不会让人感觉像是那个令人讨厌的 Clippy 办公助手呢?
虽然我对 AI 生成的笔记内部连接建议兴趣不大,但我对它推荐外部参考资源的功能颇感兴趣。我注意到我的学术圈朋友们拥有一个巨大的优势:他们身处的环境就像是一个个活动的书目数据库。他们在与其他教职员工或学生共进午餐时,只要提及自己正在思考的问题,对方就会说:「哦,你看过某某资料吗?」当你不知道某些资料的存在,或者不知道应该搜索什么时,要找到相关信息是很困难的。因此,我很希望有这样一个工具:它能够观察我的阅读和写作行为,洞察我思维的前沿,并为我提供精准的建议。
灵活的记忆实践产生流畅的理解
原文:Fluid practice for fluid understanding | Patreon
「这些是我不成熟、粗糙的思考,但对于那些热衷于优化学习方法的人可能会有所启发。本文假设你已经深入了解且熟悉记忆系统。」
我接受的记忆训练彻底改变了探索新知识时的体验,我像是在摇一个曲柄,只要摇下去,我对新问题的理解就会稳步上升,持久而没有停滞。但这只是理想情况,很多时候我感到自己的理解很浅薄,问答复习会让我感到无聊或者疏离,我有时更像在机械地复述他人的话,而不是真正地理解。
一个解决办法,是在记忆系统的应用方面进行自我提升。我会优化我的写卡策略,更有意识地关注知识在情绪、情感上与我的链接。如果方法不奏效,我就积极调整。简而言之,我记忆训练的质量依赖我卡片的质量,以及制卡时我关注点在哪儿,又怎么修正的。如果我对新知识的理解显得薄弱,那意味着卡片、制卡方法需要改进优化。进步
卡片写作是一个有用的能力框架。多年来,我在编写和维护卡片的能力上有巨大提高,我的记忆实践(memory practice)已经变得更加多元化和可靠。但是,这个框架的局限性也是值得思考的。我希望有这样一个记忆实践,不仅能帮助我建立和维持灵活、可靠的理解,而且着实能随着时间的推移加深我的理解。
我一直在思考:学习写出更好的卡片能多大程度上达成目标?单张形式的卡片是否是最好基本单位(达成这个任务的)?普通的闪卡是承载陈述性知识的方便形式,但我想帮助人们掌握复杂的概念。如果我们退后一步,看看产生这种理解实际上需要什么,以及概念的实践的机制,我们是不是能找到更适合理解的基本单位?
从 Alex 身上学到的
部分动力源于我与 Alex 的实验经历,促使我进行这项探索。Alex 是一个自驱的成年学生(今年早些时候,我曾帮他学物理[1]),在实验里,我为 Alex 编写了数百张记忆卡片,帮他更好地内化他的阅读资料和课程。他在记忆系统内外努力理解这些概念,我观察这个过程,也有极多的收获。成为一个观察者而不是学习者,真的很有帮助:当我只给自己写卡时,我总是很难拉开一段距离观察自己,看清楚究竟发生了什么、哪里出现了问题。
在我观察Alex的过程中,我发现一个关键的问题,那就是「知识迁移」的困难。他通常能够回答我编写的卡片,但他的理解很脆弱:问题稍有变动时,他的知识运用就比较困难。在我的实验中,Alex 看起来真正需要的是在实践层面上,对同一个点引入更多的「变体(variation)*」。(*译注:换个方式写卡就产生变体)
对于一些概念知识,我尝试过标准的记忆系统实践,也就是写上十几张(或者更多!)卡片,从许多不同的角度和许多不同的外部特征访问它*。这可能产生了更灵活的理解,但对复习课的影响相当负面:即使卡片被打乱,在单次课中回答同一问题的许多变体也会令人讨厌。由于这些变体很繁重,我没有为尽可能多的概念写它们。从认知角度来看,在第一个问题之后,检索会更加不费力,所以后续的问题可能不会产生它们可能产生的那么多强化效果。(*译者注:你 maybe 可以 try 一 try COTchain of thought )
从体验和认知上说,我相信将这些变体安排到不同批次的复习课上会更好。概念上看,我想我正对同一个核心知识*的编写不同变体,多张卡片用不同方式引导出它,在我的脑海中,这些卡片是一回事 —— 一个「卡片簇」,但实践上,这些卡片在助记软件中被表示为一组无关的集合,尽管在认知上有高度的重叠。(*译注:原文 Platonic idea,指概念的核心本体。)
一个相关现象:我们在 Alex 的复习经历中看到了很多「模式匹配(pattern matching)*」。他的评论通常会包含告知性的短语「这个」,也就是「哦,我知道这个有一个窍门……」。正如我们讨论过的,这可能是迁移问题的一个迹象。但它也是情绪摩擦的标志。机械性地复述让人感到不好。它让你(正确地!)质疑你的练习是否充分利用了时间。它可能会产生死记硬背的感觉。它似乎让 Alex(和我)不去仔细注意它和后面的卡片。我相信模式匹配会产生情感上的距离,对参与感的钝化。(*译者注:模式匹配)
因此,考虑设计目标是有趣的:我们如何使模式匹配永不发生?如果一个想法永远不会被以完全相同的方式访问两次呢?事实上,我强烈的直觉告诉我这是一个糟糕的想法。高度训练的记忆实践建立的反射刺激-反应模式有着非常强大的力量。而且,系统的实践中的流畅感觉是微妙的:你不想有枯燥的死记硬背,但你也不想有毫无意义的做事。尽管如此,我希望更直接地体验这些权衡。
随着时间的推移,Alex 也需要改变卡片的域(scope)。在阅读或者解释材料后的第一时间,他需要的卡片功能,是一次简单的阅读理解检查 —— 许多情况下,他并未实际地理解或消化书上的一些重要论述;其后,他需要卡片帮他持久化地记住枢纽细节:术语、记号、方程、关系等。但仅有上述这些不足以真正理解主题。我们会聚在一起讨论概念和解决问题,每次我都会为他写更多细节层级逐步上升的卡片。
一旦基础知识掌握之后,他真正需要的是在解决问题中获得实践。很多问题对他来说比较困难,所以要从简单过渡到复杂。实践中,我们会穿插性地、很细节地回顾一些已经解完的案例。一个章节做完后的几天,他会希望进入下一章节以保持动力,但整个过程需要确保他会游回早期的章节,并解决相关的问题。此时, “阅读理解” 卡和一些关于符号的基础卡片会感觉是不必要的负担。但是更复杂的声明性卡片,比如关于等式的卡片,似乎仍然有刷新细节的必要。(to Jarrett Ye:do not change the “” to「」for semantic reason)
最后,Alex 和我到了这么一个地步,我们会将正在学习的材料与他觉得有趣的新研究联系起来。我很确信,回顾课经过系统地精心策划可以包括下面这些活动:Alex 向我展示他想要理解的论文,我会说类似「哦,一旦你对电通量有了一些经验,我们将能够一起理解这个图表。」这样的话。
Alex 的学习过程在不同阶段需要包括不同的活动。真正理解材料需要更复杂的实践活动,但也不能让它们马上介入。否则,当 Alex 刚完成一项以更复杂的方式使用这些相同概念的活动时,琐碎而简单的「引导」任务可能会让他烦到爆炸。如果我们希望一项记忆练习可以在重复中逐渐深化理解,那可能意味着要改变任务难度在时间上的分布,以创造出越来越复杂、详细和富有创造性的机会。
总的来说,Alex 和我一起的这段经历表明,优化过程让复习不磕磕绊绊, 有助于产生流畅的理解*。如果你想记住电常数的值,直接的闪卡就有效。但是要内化复杂的概念性客体,你需要被推动着, 变着花样去吸收每一个想法 --- 从不同的角度,用不同的措辞,以不同的方式,组合其他知识。在这个过程中, 复杂性也应逐级提升(*译者注: 而不是零零碎碎, 不可利用, 使用起来感到僵硬的)
复习课作为通用的容器
我有一个模糊的观点,本质上,记忆实践很大一部分潜在收益不仅事关记忆本身,也事关每日时间槽* 的分配。一个稳定的的 anki 用户会在一天中会划出 5 到 15 分钟的时间,用来系统地提高他们的知识和理解。这段划分是一个强大的容器,你可以往里面塞机械记忆的卡片,而富有经验的记忆系统的用户发现不仅如此,用得好了还可以激发更广泛的思考。(*译者注: 原文 「it’s about the daily sessions」. )
我的主张是,当我们要学习复杂的概念时,我们应选择一些既有效又能愉快地深化理解的任务,往那个每日「容器」里填充,而不是必须机械地写成卡片:如果材料是陌生的,放在第一位的应该是关键细节的强化记忆,并且要让你预测一些题目(给出部分步骤)的后续步骤;此后的复习环节,你可能会被要求解决一些简单的问题;此后,是一些不同的,更复杂的问题;一个星期后,我可能给你提供学过的定理的另一种推导方法,以及关联了两种方法的一些问题。也许,你可以尝试整合自己的理解,或者针对你在理解概念中遇到的难题进行头脑风暴。总之,每个复习课的动作都是独一无二的,除了一些适合一遍又一遍重复的动作。
在某种意义上,我认为「记忆系统」可以被看作是「练习系统」。虽然今天的工具不能完全实现我所描述的内容,但经验丰富的用户已经有很多策略去利用系统实现自己想要的任务(*译者注:一个可能的方案是让软件只作为排期软件,记录一些任务在卡片上) —— 也就是,将要理解的东西转化为有趣而有效的练习任务。这些策略反映了使用者一些更基本的、通常是隐式的观念:
-
知识观:在特定语境中,这些知识意味着什么。
-
学习观:如何生成具体的活动,以产生理解,并可以维持?
-
介质观:这些学习任务是记录到记忆系统的 item 上的,如何将抽象的任务具体实现?而且要考虑你的复习课有自己的环境(i.e. 可能在手机上,穿插着其他的任务,手头没有纸笔等)
正如 Michael Nielsen 所指出的,我们很难直接传递这些策略或理解。但我怀疑,在我们设计的这些策略中隐藏着一种「模式语言」。我现在已经为大量的技术材料编写了记忆系统卡片;通过这些卡片及其相关背景,来寻找策略的 “词汇” 和 “语法” 将是一件有趣的工作。
概念性知识的制卡原语
抽认卡的原语相当直接地捕捉了陈述性知识。如果你正在学习意大利语,想记住「carciofo」这个词,你可以把它写在一张闪卡上,背面写上「artichoke」。如果你想学习解剖学,你的卡片可以是一个箭头指向插图的某一部分。你可以通过在卡片上写上「铅的原子序数」,背面写上「82」来记住铅的原子序数。上下文使任务明确;在每个案例中,隐含的任务是要你要回答「这是什么?」
但是,当你在学习电势和电势能之间的关系时,你不能直接把这个概念放入记忆系统。因为这是一个多面的概念,你需要练习许多任务去理解它。当然,你应该确保知道它们之间的符号关系。但你也应该能够在各种情境中应用这种关系;你应该能看出何时应该使用其中一个概念而不是另一个;你应该看到这种关系和电场强度与电力之间关系的并列。随着你学习的深入,你会希望与这个概念形成新的连接。例如,一旦你被引入电容的概念,你就能处理这种电势电势能之间关系的新一面。
你可以把它们当做一个很大的基卡片集合来研究,每一个和概念相关的 “知识原子”,都由一个基卡片(primitive prompt)所强化。但正如我们已经讨论的,它们之间总高度相关,因此将它们间隔到多个复习课中会更好。而它们的排期的反馈,也应该至少在某种程度上相关联。最后,你会希望在每次卡片呈现时,任务的细节都有所变化。一些任务应该在你消化了前置的任务,或者学到了更多知识之后启动。
实际上,对这种概念,我写卡时的思考方式,是想象自己正拿着一个东西 —— 概念的本体 —— 在灯光下转动,并从多个角度去观察它,看看它如何与空间中的其他对象相互作用。我制卡经验积累了潜在的 “模式语言”,会在这个过程中提出了一族任务,当我开始思考这些任务,更多的制卡模式就会自然而然地呈现出来。有时,我会觉得我同时在处理目标概念和它相邻的概念;有时又觉得自己在深入研究其中的某一面,这一面本身会成为我关注的对象,但不影响概念本身在思维中的完整性。我脑海中做的,很大程度上是以越来越丰富的方式「将这个概念放入我的记忆系统」,以越来越丰富的方式。概念是基本名词,而动词(「将其放入我的记忆系统」)是一个凌乱且复杂的活动,它依赖于我的模式语言和我已有的知识。(*译者注:Andy 将概念视作一种不变的客体,从不同角度呈现不同的表征,然后用自己的原语去解离为不同的卡片)
我可以直接将「carciofo」这个词放入我的记忆系统。实际对象(「carciofo = artichoke」)与它在闪卡上的表示(「Q: carciofo? A: artichoke」)几乎没有距离。那张闪卡基本上就是声明性知识原子,这就是原语的强大之处。记忆系统是为学习陈述性知识而设计的,所以它的核心原语与这类信息之间天然有表达上的一致性,这很正常。但现在我们正在尝试扩展记忆系统,使之也能很好地内化复杂概念。从记忆系统转变为「练习系统」,那么是否有另一些原语正等待被创建?—— 它可以让我「添加概念」作为基本操作,就像我可以「添加一个单词」到当今的记忆系统那样。
语言模型,以及 「概念即原语」
在过去的几个月里,许多人尝试使用大语言模型,从解释性文本中自动创建记忆系统的卡片。对于简单的陈述性知识,这有可能离可行很近了(1, 2)。但我对记忆系统的兴趣,更多地在于它们帮我学习复杂的概念性材料,以及深入内化与我创意工作相关的知识。这是一项非常不同的任务,并不明显适用于直接自动化。语言模型似乎并没形成我们一直在讨论的模式语言,因为这可能仍然是小圈子里(记忆系统实践者社区)积极探索的新东西。[2]
但是,如果我能将这种模式语言外化为模型能理解的东西,也许我们就能制造出一个记忆系统,在这个系统中,与具体任务一样,概念 也成为一种基本的元素。在这里,我广义地使用「概念」这个词,来涵盖一个多面但明确连贯的元素——比如电势能和电势之间的关系。在这样的系统中,你也许可以直接「添加一个概念」,并可附上你对感兴趣的性质的评论,然后该系统会使用模式语言在每个学习课中事实创造新的练习活动。
「添加一个概念」意味着什么,具体会添加些什么东西?一种自然的想法可能是从一本书中添加一段文字,或许还会有一些标记,以指出上下文中核心观点。在这一套系统里,记忆系统的数据库不仅仅是(或者不只是)静态的卡片,而是一套指向文本或笔记的被标记的参考。这也意味着,如果一个任务让你感到困扰,你可以轻易地导航到它的出处,看它是怎么启迪你的。
这个概念设计并不是「使用语言模型生成卡片,然后添加到库中」,而是「将概念添加到库中,然后使用模型动态地生成任务」。这些任务在每次学习课中都会变化,帮助你灵活地掌握概念。它们可以变得更复杂,帮助你逐步深化理解 —— 例如,使用模式语言结合多个想法。如果模式语言足够具体,可以在界面中具体化,我们可以为不同类型的活动赋予不同的视觉标记(例如,问题解决练习、可视化、生成示例、解释综合),并允许用户快速在给定概念的备选任务之间切换。
我在这里的主张是,更灵活的记忆实践将产生更流畅的理解。但是,从交互设计的角度来看,将想法视为原语也具有吸引力[3]。作为一个记忆系统的用户,我具体的情感经验是:我听到、阅读或思考了一些激发我兴趣的事物。我会想:「啊,我想把这个放进我的刷卡中!」,但我不能完全将「这个」带入我的记忆系统实践;我必须想办法将它转化为卡片兼容的对象,让我可以刷卡。有时,我喜欢这个转化过程。它使我更接近激发我的原始想法,帮助我拆解它并更好地理解。但大多数时候,它像是一个负担*。我想强调的是,这种冲动并不是关于效率或 “降低门槛”,而是关于怎么让核心动作感到更好——让它更自然地与我的内在意图和情感兴趣对齐。我认为这就解释了为什么挖孔这么受欢迎:它们更接近「添加事物本身」—— 问题是,材料复杂的时候就不好使了,至少直接挖孔是不行的。
下一步
语言模型光鲜亮丽,但我不认为通过系统化和自动化的大跃进,是探索我在此阐述的观点的最好方式。我可以手动实验「实践系统」,与一名学生一起或者我单独的研究中,使用卡片变体、解决问题、逐级学习和「模式语言」。亲密和快速实验仍然是我现在优先考虑的属性。
我对我自己这些观点,有一个正式的保留意见:扩大 MS 的域以涵盖如此多样的实践和学习活动后,我可能会削弱它们作为特定概念的强大性(使用简单原语进行有效、系统的提取练习)。或许最好让记忆系统保持紧小的域,才能更好地发挥它们的自然优势。我一直在描述的其实更接近一个智能辅导系统,这种系统吧…… 我保留意见,我上次与那些研究成果作对抗还是几年前我在可汗学院的时候。如果我继续沿着这条路走,我预计我需要用新的眼光去翻阅原本的文献,对我自己的观点和那个领域的东西做一些更清晰的划分。
————————
[1] Alex 的职业生涯发生了一些重大变化,所以他最近已经暂停学习了。我们可能会及时恢复,或者我可能会与另一个学生合作。
[2] 这与我对最近涌现的「AI 导师」的抱怨有关:它们缺乏明确的教学理论,一些被告知要用无聊的问题来测试你;还有的只被告知「要成为一流的导师,回答学生的问题。」,但成为一流的导师 意味 着什么?这太难回答了;很明显,模型对此并没有强烈的观点。在个人的具体情境中,没有强见解具体意味着什么?一个更好的系统需要描述一个教学理论——在一次学习过程中应该发生什么,这在认知上意味着什么,以及导师应如何通过与学生的互动实现这一点?如果模型训练数据中有数百万个对这些问题的好答案,模型可能就不需要更多的指导。但就像记忆系统的模式语言一样,这种知识大部分是隐性的;即使被写出来,各种观点也相差太大,无法提供太多指导。
[3] 在去年十月的信件中(2022 年夏季的记忆媒介原型教训),从交互设计的角度对「想法作为原语」进行了深入的讨论。
高亮引导的实践与理解辅助
原文:Highlight-driven practice and comprehension support | Patreon
今年夏天,有一个新的洞见让我努力思索了很久:人们在几个月后难以回忆或应用他们所读的内容,通常是因为他们一开始就没真正理解。这种回忆失败感觉很像忘记,但人们常常分辨不出来。我以前一直觉得「书本不起作用」,原因就在于人们看似迅速地遗忘了几乎所有读过的东西。但如果这些所谓的记忆失败其实是一开始就没理解好,那么,增强记忆可能并非正确的解决方案。
所以,我开始探索阅读环境如何能直接辅助理解,并学习在专家实践和干预方面的已有知识。但不论我尝试了哪些新方向,都没有展现出太大希望。最主要的问题,似乎在于这些系统都过于突兀。先前的研究和我自己的实验中的系统对阅读体验的干扰太大了。这些系统都是通过判断你理解了什么、没理解什么,来提供反馈和辅助。要达到这一目的,往往需要大量繁琐的交互。
几周前我有点泄气,便停下来重新思考。好吧,人们确实有理解缺口,但长期练习还是相当有益的,对吧?具体而言,在面对理解缺口时,我有没有观察到提取练习失效了?如果我围绕这些问题改变思考的角度,而不是把阅读理解当作最终目标,会怎样?
以下就是最初促使我走上这条道路的(假设的)问题:
-
对于理解不足的概念性内容,提取练习通常不起作用;你或许能机械地复述,但却不能灵活运用。
-
当提取练习感觉很教条——像是在「猜老师心中的答案」——时,往往是因为存在理解缺口。当其他人编写卡片时尤是如此。
-
对于诊断和填补理解缺口,提取练习(和解题练习)都是一种既不愉快又不直接的方式。
最简单粗暴的解决方案,就是确保人们只练习那些他们理解透彻的内容。那么,我们该怎么做?我意识到,过去几年里我描述过的一些想法,似乎可以串联起来。出乎我意料的是,这条路径似乎为辅助阅读理解提供了一个更有希望的解决方案。
概念综述
顶层设计如下:
-
当你阅读一篇文本时,你有一支神奇的高亮笔。你可以用它来标记任何重要的、任何你想确保自己理解并记住的内容。你还可以简要地写下几个词,明确你特别感兴趣的是什么。
-
未来的练习环节将包含强化和拓展你高亮的想法的任务。
-
当你读完一个小节后,可以点一个按钮,(用不同的颜色)高亮那些你没有标记,但同样重要的细节。这些「额外的」(「建议的」?「暗示的」?)高亮能让你迅速检查是否漏掉了你可能重视的内容。
主要的设计洞见是,高亮这一交互方式既能让读者选择练习什么,也能(虽然不太明显)体现其对内容的理解程度。这一高亮原语也能复用于吸引注意力——以非常轻量的方式——提醒读者注意那些他可能不知不觉中遗漏的重要细节。
这个设计中我喜欢的概念元素
扭转一种自然(但无效)的交互。高亮是大家学习时会自然而然(甚至有点强迫症)会做的事。[这是最受欢迎的学习方式](https://andymatuschak.org/files/papers/Dunlosky et al - 2013 - Improving Students’ Learning With Effective Learning Techniques.pdf#page=15)。这很合理:因为标出自己认为重要的东西会让人感觉良好。这不仅是兴趣的发泄口,也是你付出努力的见证,在纸面上焕发出明亮的光芒。而且,这么做几乎不费吹灰之力。问题是,尽管学生相信它有用,但在对照研究中,高亮的内容[并没有实质性地提高理解或记忆](https://andymatuschak.org/files/papers/Dunlosky et al - 2013 - Improving Students’ Learning With Effective Learning Techniques.pdf#page=17)。如果我们能以某种方式「拯救」高亮,使其真正达到我们期望的效果,那就太棒了。在我提出的这个设计里,高亮这个动作本身依然一如既往的无效;与以往不同的是,这些高亮会触发后续的提取练习(我们知道这是相当有效的)和理解反馈(效果有待验证)。
**将控制权留给读者。**这个设计延续了我在 2022 年的努力,目的是让读者有权选择自己要练习什么。不仅如此,这一目标还扩展到了辅助理解的交互上。(我还没在研究文献中找到类似的东西;[一般的干预方式](http://andymatuschak.org/files/papers/Chi et al - 1994 - Eliciting self-explanations improves understanding.pdf)是让学生在阅读每句话后,大声地解释一遍。)如果文章的前半部分对读者来说并无新意,他们可以毫不犹豫地跳过去。在显示出那些「额外」的高亮后,读者可以直接略过文章前半部分的所有内容——无需交互。接着,他们只需一边滚动一边观察,就能集中注意力在后半部分被忽略的内容上,尤其是那些一度让人摸不着头脑的地方。
非用后即弃的理解辅助交互。上个月,我描述了一个阅读理解辅助系统,该系统让读者在阅读时向他们自己解释文本内容。这种方式往往让人觉得不痛不痒,就像做了件毫无价值的事。我认为主要原因是,这些自我解释没有长远意义,就像是用后即弃的工作。我写这些只是为了确保自己当下能明白过来,但这种交互给人的感觉是得不偿失。因为我和大多数人一样,总低估了自己理解缺口出现的频率,所以觉得即使不这么做也能明白。我看到的所有专注于阅读理解的方法都有这个「用后即弃的工作」的问题。相较之下,在这个新设计里,当你用高亮笔做标记时,你其实是为将来的复习和理解铺路。这样的交互不是用后即弃,它有持久的价值和意义。
以想法为中心的记忆系统。在我 2022 年的助记媒介设计里,卡片和文本是并列的。读者可以挑选将哪些卡片加入他们的收藏里。[从用户研究中我发现](https://www.patreon.com/posts/lessons-from-73309142#:~:text=Act on ideas%2C rather than acting on prompts%3F),人们一般不会去评估这些卡片,而是对文中的某个想法有感而发——「哎呀,这个得记牢了!」——然后才侧目旁边的卡片。用卡片来捕捉这种反应,的确有些拐弯抹角。我感觉,大家真正想要的,其实是能指出他们认为重要的想法;至于卡片,不过是个实现细节罢了。新设计更接近这种[以想法为中心的练习系统,我觉得这可能还会有其他附加优势](https://www.patreon.com/posts/fluid-practice-83882597#:~:text=Language models and ideas as primitives),比如通过多样化和综合化来提高理解的流畅度。
平滑过渡到义务的入口匝道。在我 2022 年底的用户研究中,[我观察到](https://www.patreon.com/posts/lessons-from-73309142#:~:text=be filed! Oops.-,Incrementalism,-Expressivity aside%2C there’s)一个有趣的矛盾:一开始,读者经常不太确定他们有多关心某个细节。他们懂得这点很重要。但他们愿不愿意为此长期练习?这还不好说——他们得继续读下去,了解这个细节在整个大局中的位置。很多人有用高亮笔的需求,我深究后发现,这种不确定性往往是他们有这个需求的原因。大家想先把这些细节标为暂定重要,过后觉得合适再通过保存旁边的卡片来「升级」它们。这么做确实有道理!我自己也常这样操作。我会先大致翻阅一遍,用高亮笔标出看似要紧的地方。然后,我会根据这些高亮内容再过一遍,为那些看似值得深究的细节做卡片。我提出的这个设计正好能让这种逐渐升级的交互更自然。你可以用普通黄色高亮笔来标记暂时看似重要的细节,用紫色的「魔法」高亮笔来标记你认为必须强化记忆的细节。轻点一下,高亮就会「翻转」为其他颜色。这样,读者在「标为重要」和「标为需要强化」的之间,就能平滑地过渡了。
设计面临的概念挑战
高亮不鼓励深度加工。[高效的读者是挑剔的](http://andymatuschak.org/files/papers/Wyatt et al - 1993 - Comprehension strategies, worth and credibility monitoring, and evaluations.pdf),他们会仔细分析文本,解读、拓展,乃至与自己的既有知识建立联系。但人们经常只是随手高亮,而非深度加工文本。有时甚至没有加工,就轻易高亮了文本。这样一来,我的系统在「理解辅助」这一方面,设定了一个非常低的门槛。但如果目标是解决我最初设定的三大问题,这一设计将大有裨益。这样一来,你不太可能收到关于你完全忽视的想法的卡片。而且卡片也能被设计成诱发尚未发生的拓展和阐释。
密度与模糊性。编写卡片让我深刻地意识到,一个句子里能够包含多少不同的细节。如果读者高亮了一个关键句子,那么他们可能对其中的多个,甚至所有细节都感兴趣。也有可能他们只是理解了其中一半(实际测试中我就遇到过这样的情况)。我发现,在这种情况下,做「最小化」的高亮是有帮助的。也就是说,如果你只对一个关键形容词感兴趣,就只高亮它,或许还可以在同一个句子里对其他小细节做单独的高亮。此外,在这些情况下,简单地记几个字来说明你的具体兴趣点也是很有用的。
**只见树木不见森林。**以高亮为中心的交互更注重细节和局部信息。但我通常也希望练习中能够包括整体性的思考。最有力的问题往往能触及某一想法的核心,特别是当你从一个合适的角度去看待它时,找到一句话来表达它。有时我希望我的练习是总结一个长篇论述。
**新手无法可靠地判断什么重要。**原先的助记媒介设计有一个优点,即领域专家会明确地告诉你需要了解的内容是什么。但在新设计中,更多的控制权转交给了读者;专家顶多提供一些「暗示」。这对那些希望有明确指导的读者来说,无疑增加了使用难度。更核心的问题是,读者通常并不一定能准确判断文本中哪些是最关键的。那么,「额外高亮」这一交互是否足够弥补这一问题?
初步测试
我找了我朋友 Elliott Jin(Bradfield 的计算机讲师)当个临时助手,把这主意拿出来走了个「人工」智能测试。继续上月的学习,我读了 Jim Hefferon 的《线性代数》里的 One.III.1 章节,一边读一边高亮我想强化记忆的地方。这些东西 Elliott 早就熟悉了,他自己也仔细挑了这一章所有该注意的点。我读完后,他就把我的高亮和他自己的对比了一下,把我漏掉的想法也标在我这份材料上。然后我就能按照设计的那样,复习那些额外的高亮部分。
首先,最关键的是,这次交互让我注意到了三个我之前根本没在意过的概念。我当时看书的时候这几点就被我遗漏了,我的眼睛仅仅在页面上掠过了他们。这验证了「额外高亮」这一交互形式有助于暴露理解缺口。
同时,这次练习也证明了,标记高亮并不意味着就真理解了。比如有次我高亮了一个定义,但完全忽略了几个关键词。结果证明,这没什么。后续的练习很快就揭露了我遗漏的这些词;由于我高亮了那些定义,也就表示了我想知道这些词——所以这次练习能帮我找出这个盲点,我还挺庆幸的。
在另一个情况下,我忽略了一个「额外」的高亮,因为我觉得它被我别的高亮包括了。结果证明,我错了!我随后做了一些下游概念的练习,这个错误一下子就暴露了出来。这一次很快就找出了问题,但一般来说可没这么简单。
关键是,这种交互让我感觉很好。我本来就喜欢边读边高亮,这让我觉得很顺手,而且更加强大,还不用让我改变阅读习惯。给文字「[上色](https://www.patreon.com/posts/initial-in-self-87053505#:~:text=And there’s a funny thing that happens%3A the shading is somehow viscerally rewarding! It feels good to “fill up” the sidebar%2C to “color in” all the “good bits”.)」让人心情愉悦,如果这些标记能真正有意义,无论是在理解检查还是在后续的练习方面,那就更妙了。在浏览「额外高亮」时,我感到好奇,想要了解它们,但并没有感到不合时宜地被迫去关注。Elliott 高亮了一些我跳过的细节,因为它们要么熟悉,要么看起来不太有趣;很容易跳过这些地方。
在高亮一旁,Elliott 还想标出一些「低亮」——可能值得注意,但相对次要的细节。或许,可以通过高亮的颜色深浅来表示它们的重要程度?如果读者能标记某个点优先级较低,那我们就少给他们安排相关任务。或者,这些级别也可以作为一种反馈,提醒读者他们大多数时间都在高亮相对不重要的细节,而非核心观点。
书的下一节(One.III.2)出现了一些有趣的难题。这一节主要是对上一章里一些重要命题的证明。过程中,也涌现出一些实用的新属性和操作策略。后者用原来的高亮交互就能搞定,但对于证明这块儿,怎么处理就没那么明确了。我觉得,一部分原因可能是读证明的时候,我没有形成自然的高亮习惯,而在读解释性文本时,我的高亮习惯恰好能指出哪里需要强化记忆。从别人的证明中学习似乎需要不同的模式;遗憾的是,我在知识和学习理论方面还比较贫瘠。
最后一个犹豫:我的理解缺口到底有多重要?这个原型揭示了我遗漏的一些有意义的细节。但结果证明,通过本节的习题集,这些漏洞很容易就被诊断出来了。如果没有这个别致的阅读增强环境,我也能应对自如。但[今年早些时候,我辅导过一个学生](https://www.patreon.com/posts/80865178#:~:text=Incomplete absorption),他在阅读理解方面遇到了很大的问题。在用 Hefferon 的书学习前面几节时,我也有类似的理解缺口,导致我在做习题时感到困惑。更糟糕的是,这些缺口可能根本不会被察觉。在审计习题集以寻找它们所涵盖的材料时,我注意到它们主要关注解决应用问题,而不是对文中讨论的概念性细节进行强化,也不会揭示那些细节的理解缺口。
我粗略认为,与事实或程序上的缺口相比,概念上的缺口更有可能在解题练习中被忽略或者误诊。如果问题只考察某种知识的迁移应用,困惑就更容易产生。所以,理论上我们或许可以设计一系列逐渐增加难度的问题,有效地找出理解缺口。但我发现,当我的理解实际上没问题时,我不喜欢回答这种基础问题,感觉无聊又累人。或许,我提出的设计中的这种轻量级理解辅助是个合理的折中办法。
用《量子国度》来评估
我们评估这个新设计的另一个方式就是问:如果以这种方式阅读《量子国度》,会是什么感觉?
首先我们可能会问:读者需要标多少高亮,才能把所有的卡片都「集齐」?我在第一篇文章(QCVC)里,把 112 个卡片跟相应的高亮范围对应起来,发现用 78 处高亮就能覆盖所有卡片。对于大约 25000 词的文章来说,这个数字不算夸张:大约每 320 词就有一个高亮,或者说在我电脑屏幕上,差不多每翻一屏就有一个。(当然,文本的想法概念有很大的变化。)
这个小试验揭露了,QCVC 里有很多我觉得重要但又不那么明显的地方,并没有配备卡片。这其实是原先的助记媒介设计的一个短板:因为每个读者都会收到所有的卡片(而且立即收到——我们没有分阶段引入),所以在设置卡片时,我们必须比较保守。我们也不想让大家被卡淹没不知所措。因此,可能会让人练习一些他们觉得没意义的细节(比如用「船」作为计算范围的比喻),而对于他们认为重要的其他细节,则没有练习机会。
绝大部分的高亮(57 条)只映射一张卡片。16 条映射两张,3 条映射三张,各有一条映射四张和五张。这些一对多的情况大都是我们用多张卡片从不同角度、或多个例子、或强调不同侧面来表达一个概念。全面审计这些成组的卡片后,我感觉至少有 80% 更适合分开练习。这些卡片相互强化,练习一张基本上会减轻对另一张的记忆需求。此外,这种同一主题不同变体的卡片,如果连续出现,很容易让人感觉枯燥乏味和过于死板。
我觉得,这种卡片数量的分布也反映了原先的助记媒介的一个局限:那 57 个「单独」的细节多数都可以从多角度的强化中获益。但由于所有的卡片都被一股脑地展示给所有用户,所以我们只能偏向保守。
有 3 张卡片在文本里没有直接出处,它们要求读者根据一个或多个细节来进行推断。这对我的高亮交互方式来说确实是个大问题!一个可能的补救方法是,如果用户的高亮包括了预期推断所需的「原材料输入」,就分配这些「综合/推断」的卡片。我觉得这种卡片特别有价值,因为它逼着读者跳出文本框架去思考。同时,由于这类卡片的重点在于你不是从记忆中找答案,你或许会希望每次都有新的、涉及这些观点的推断。
有 6 张卡片其实跟可选习题中的问题陈述的细节有关。这些有点棘手。从一个角度看,即使你不去做这些旨在阐明这些陈述正确原因的证明题,你也应该知道这些陈述是正确的。如果我们从这个角度来看,那么高亮交互可能希望那个命题出现在「在正文里」,这样所有读者都能注意到。另一个角度是,如果你通过练习证明了某个结论,你肯定想记住这个结论。从这个角度看,高亮的交互方式应该没问题,其实比《量子国度》的一刀切方式还要好。
这个练习也让我更明白了一个问题:就像我们之前讨论的,读者不一定总能判断出什么是重要的。新的设计相对于《量子国度》,可能会让人们漏掉一些关键细节。这是为了给读者一个更流畅、更个人化的体验而必须要付出的代价。当然,真正的成本和感知到的好处有多大,还需要更多用户研究来明确。
交互成本
两年多前,当我刚开始深入研究助记媒介中读者控制方面的矛盾时,[我注意到](https://www.patreon.com/posts/revamping-medium-55309960#:~:text=And so maybe,think that’s enough.)如果 QCVC 有 112 张卡片,读者肯定不想对每张卡片逐一作出是否保存的决定,更不想在界面上点击 112 次「保存此卡片」!这促使我在去年的原型中引入了「批量」卡片交互。
然而,我发现我并不太担心要求读者高亮 78 次。78 次交互依然看起来很多,那我的感觉为何会如此不同呢?
一个因素是,对许多读者来说,高亮是一种自然的行为。它感觉像是阅读的一部分,而不是一个单独的决定或交互。从空间上看,这都是在文本内部进行的,而不是在一个独立的界面上。
同样重要的是,读者不需要评估卡片。在 112 张卡片中选择哪些保存要麻烦得多:你得仔细阅读并考虑所有这些文字。但在拟议的设计中,你不是在决定「保存哪些卡片」,而是在强调你已经阅读过的文本的某个子集。「额外高亮」视图会提供一种轻量级的方法,快速添加你可能遗漏的重要信息,这种交互甚至都比评估卡片要简单,因为你是在评估正文文本,大部分或全部都是你已经读过的。
QCVC 有些卡片远不如其他卡片重要。在《量子国度》和去年的助记媒介设计中,所有卡片地位都一样,所以用户必须平等地评估所有 112 张卡片。但在拟议的设计中,用户可能很自然地不会高亮对应非重要细节的文本,这也无伤大雅。文本本身没有强加成本。而且,如果有视觉标记来提示哪些信息更重要,那么评估「额外高亮」的成本也可以进一步降低。
实现的细节与挑战
到现在为止,我更侧重于交互设计,并没有涉及实际的工作方式。我觉得这个侧重点没错,但我还是得简要说说实现的方面,尤其是那些会影响我后续设计的部分。
总体来看,这个设计的实现可以分解为三大核心问题:
-
**文本到精选高亮:**给定一段文本,哪些是最关键的细节,而哪些高亮内容能最恰当地吸引人们注意到这些细节?
-
**从高亮到任务:**给定一组带有上下文(或许还有重点备注)的高亮,如何构建一组练习任务?
-
**语义高亮差异对比:**给定用户的一组带有上下文的高亮,怎么判断哪些精选高亮的概念内容没有被「涵盖」?
当然,还有其他切入点来看这个问题。比如,我们可以把高亮内容映射到知识图谱上,再进一步将知识图谱映射到练习任务,以体现各种连接和依赖关系。与其去设定和比较一组「理想」的高亮内容,不如根据读者实际的兴趣和深入程度来推荐一组高亮。我们还可以让读者明确表示他们阅读这篇文章的目的——他们有哪些目标和问题——然后相应地调整高亮内容。但我现在先把这些拓展点放一边。
让我们从一个简化的实现模型开始,这里面不涉及任何前沿的机器学习技术。
-
从文本到精选高亮:与原先的助记媒介类似,由一名专家构建一套「理想」的练习任务,并将这些任务(多对多地)映射到一组「理想」的高亮上。
-
从高亮到任务:给定用户的高亮内容,我们运用传统的自然语言处理工具,比如潜在语义分析,来识别与专家高亮「语义匹配」的内容。读者则会收到来自专家映射中对应的任务。
-
语义高亮差异对比:计算专家的「精选高亮」和(2)中识别出的高亮之间的集合差异。
除了对专家劳动力的巨大需求外,这个模型的主要缺点是,如果读者高亮了一个专家没有强调的细节,那么就没有任务来强化了。同样,读者也无法指望系统围绕一个原创的观察来创建练习任务,或者关注你对某个高亮内容的特定兴趣所做的任何笔记。但这样一个模型让我能够在不涉及大量生成性 AI 支线任务的情况下,探索和完善交互设计。
当然,若非近期大语言模型的突飞猛进,我估计一开始也想不出这个设计方案。这种自由度很高的高亮交互,简直就是在呼唤这些模型所擅长的开放式解读。而且,以想法为中心的练习系统也需要有力的任务生成装置。通过从卡片切换(或扩展)到上下文中的想法作为系统原语,我们能让用户更方便地把自己的想法加入到练习中。这种高亮交互不仅限于别人的文字,对于你自己的笔记也同样适用。比如说,你在读一篇文章时,发现作者的论证有漏洞,那你就可以简单地写下一句话并高亮。同样,如果你在日记里写到朋友有句评论让你印象深刻,你可以简单高亮这条评论,这样以后的练习时就能深入地思考和处理。
回归现实。我用 GPT-4 做了不少实验,来完成这三项任务。目前来看,我的粗略印象是:这些系统真的很了不起,我已经取得了相当不错的进展。虽然输出结果还没达到我所需要的那么好,但我期待通过精心设计的提示词工程、微调,或者静等明年的新模型来实现目标。
-
从文本到精选高亮:意外地有个不错的开局。通常会包括 10-20% 的不重要细节(即使我要求模型给出重要性评分),同时也会遗漏几个关键要点。高亮的起止点也常常不是最佳位置。
-
从高亮到任务:这是三项任务中最难的。我觉得这很大程度上要归结于如何明确教育设计的哲学,或者说复习的「模式语言」。问题通常不在模型的「智能」上;而是你没法清晰地描述你想要(或不想要)的任务类型。尽管如此,对于基础的提取练习任务,我获得的结果中超过一半都是可用的。(更多笔记)
-
语义高亮差异对比:对模型来说意外地困难。特别是当用户的高亮不在「精选」高亮集合里时,模型常常会做出虚假的映射。
下一步
令人高兴的是,解决这些开放性的技术问题并不是我评估和优化这里核心设计思路的必要条件。我打算开展一轮「人工」智能式的用户测试:
-
从文本到精选高亮:由我来创建,跟上面简单模型描述的一样。
-
从高亮到任务:按照简单模型中描述的来,但我会手动把读者标出的高亮跟我自己精选的对上,而不用潜在语义分析这类方法。
-
语义高亮差异对比:我会手动完成。
我会先跟一批有经验的间隔重复用户进行测试,这样能让我专注于高亮交互设计,以及「以想法为中心的练习」这个概念。我想观察:
-
读者是否相信单单通过高亮就能了解他们将来会练习什么。有没有必要加入「重点备注」?
-
「额外高亮」可视化是否能揭示理解缺口,以及读者对此有何感受。
-
从他们的高亮映射出来的任务,在情感上是什么感觉——如果他们间接「报名参加」了这些任务,还会有猜密码的感觉吗?
最终,让我对这个设计感到兴奋的是,它有望解决我过去几年实验中出现的三个独立问题:
-
助记媒介在很多情境下感觉像是令人不快的专制;应该把控制权逐渐交给读者。
-
理解缺口是家常便饭;练习别人的卡片往往不起作用,甚至让人感到压抑,特别是在涉及概念性材料时。
-
「仅仅」对概念性材料进行提取练习通常会产生脆弱的理解,而这种理解在实际应用中迁移得很差;更灵活的实践可能产生更流畅的理解。
可以肯定的是,这个新设计也会失败,但我乐观地认为,它至少会以有趣且富有启发性的方式失败。
————————
我要特别感谢 Elliott Jin,他不仅协助我进行了初步测试,还就这些理念展开了深入的讨论!同时也感谢 Joe Edelman 的有益交流。
我们如何学习?
原文:How Might We Learn? (andymatuschak.org)
Andy Matuschak · 2024 年 5 月 8 日
你理想的学习环境
谈论学习技术时,人们常常只关注技术本身。但我想先问:**你希望你自己的学习体验是怎样的? **假设现在就给你变出一个完美的学习环境,你希望它是怎样的?
开始思考这个问题的一种方式是问自己:你人生中最有收获、成长最快的时期是怎样的?
我发现,这个问题的回答中有两种常见的模式:首先,人们会提到一段他们学到了很多东西的时期,但学习本身并不是重点。相反,他们沉浸在一个对自己真正有意义的情境中,比如创业、研究项目、艺术冲动,或者只是强烈的好奇心。他们全身心投入,亲力亲为,并在过程中学到了一切重要的东西。然后,在这些故事中,学习确实奏效了。人们从中脱胎换骨,变得更有能力,充满了洞察力和理解力,而这些收获多年后依然伴随着他们。
这些故事之所以如此生动,是因为学习通常并非如此。人们往往怀着一种淡淡的惆怅,讲述那些发生在多年甚至几十年前的经历。学习很少能够完全融入真正的追求中。通常,当我们试图「全身心投入」时,往往会碰壁,或者感到自己只是在模仿他人,却没有真正的理解。
为什么我们不能每次都「全身心投入」呢?
相反,我们常常觉得必须先暂时放下目标,去做一些功课——好好学习。更糟糕的是,学习往往并不奏效!我们上了课,读了书……但当我们试图将这些知识付诸实践时,发现它们很脆弱,无法融会贯通。然后我们常常发现,到实际应用它们时,早已忘了大半。
为什么学习常常没有真正奏效呢?
这些问题触及了教育学家和学习科学家之间一个由来已久的争论——内隐学习(implicit learning,又称为发现式学习、探究式学习或情境学习)和引导式学习(guided learning,通常由认知心理学家主张)之间的冲突。内隐学习的支持者主张,我们应该优先考虑探索发现、动机、真实参与以及融入实践社区。而认知心理学家则认为,我们确实需要关注认知结构、长期记忆、程序流畅性,并适当搭建脚手架以减轻认知负荷。
在我看来,这两种视角都有其道理。但它们互相否定对方的立场,结果两败俱伤。内隐学习重视意义和情感,却忽视了认知上的决定性限制——这往往是使「学习真正奏效」的关键。而引导式学习的倡导者专注于让学习奏效,有时确实成功了,但通常是以牺牲那些让我们感到充实的快速成长时期的沉浸感为代价。
一个显而易见的方法是尝试妥协。项目式学习(project-based learning)就是一个很好的例子。通过设计一系列带有脚手架的项目,我们希望能获得内隐学习的一些好处——真实性、动机和知识迁移——同时也能保持传统课程中典型的教学控制和认知意识。但结果往往是两头不讨好——既没有激发兴趣和意义,也缺乏足够的指导、解释和认知支持。
在大学期间,我对 3D 游戏编程很感兴趣,所以选了一门关于计算机图形学的项目式课程。问题是,那些项目并不是我真正想做的。几周后,我发现自己在实现一个光线行进着色器,以提高凹凸贴图的效率。更糟糕的是,因为这门课试图认真对待项目式学习,没有长篇的教科书可以阅读,也没有习题集可做。我只是把给我的数学公式翻译成代码。最终,我做了一个自己不感兴趣的项目,实现了自己不理解的数学公式。
相反,我建议:我们应该认真对待这两种视角,并找到融合两者的方法。你确实希望将做你想做的事作为主要活动。但认知心理学的现实表明,在许多情况下,你确实需要明确的指导、脚手架、练习和记忆支持。
当学习内容的复杂性较低,与你已有的知识相匹配时,沉浸式学习自然有效。这时,自然的参与会不断强化重要内容,从而建立流畅性。但当这些条件不满足时——这大多数时候都是如此——你就需要一些支持。
你希望全身心投入,并且希望学习真正奏效。为了实现这一点,我们需要在你的真实项目中融入必要的指导和支持,借鉴认知心理学的最佳理念。而对于那些需要更专注的外显学习(explicit learning)体验的内容,你希望这些体验完全服务于你的实际目标。
多年来,我一直在思考如何融合这两种视角,坦白说,我大多时候都很困惑!不过,最近我开始关注人工智能(AI)。我知道,提到 AI,大家可能会翻白眼。每次在学习技术中提到 AI,我也会翻白眼。但我得承认,AI 的可能性让我终于在这个问题上有了一些进展。今天我想分享一些初步的想法。
演示,第一部分:可驾驭的沉浸式学习
我们将通过一个分为六节的故事来探讨这种可能的融合。
让我们先认识一下 Sam。Sam 在大学时学的是计算机科学,现在在一家大型科技公司担任软件工程师。但 Sam 对日常工作感到有些无聊。然而,并不是所有事情都那么无趣。每次看到关于脑机接口新成果的推文时,Sam 都会被深深吸引。这些项目看起来有趣得多。Sam 会查阅相关论文,寻找参与的途径,但总是碰壁——太多陌生的主题同时出现。
如果 Sam 能请求帮助,找到一种有意义的参与方式,那会怎样呢?在 Sam 的许可下,我们的 AI——假设它是一个本地 AI——可以收集大量关于 Sam 的背景信息。从 Sam 硬盘上的旧文件中,AI 知道了 Sam 的大学课程。通过工作项目,AI 能洞察到 Sam 当前的技能水平。通过浏览历史,AI 对 Sam 的兴趣有所了解。
Sam 对复现论文中的数据分析很感兴趣,因为这似乎正好发挥了他的特长。他注意到,作者用了一个自定义的 Python 软件包进行分析,但该代码并未公开。这引起了 Sam 的兴趣:Sam 之前开发过开源工具。或许 Sam 可以通过构建这个信号处理管道的开源版本做出贡献。
演示,第二部分:在行动中指导
于是,Sam 开始全身心投入。他找到了一个开源的数据集,并迈出了开始工作的第一步。像 Copilot 这样的工具帮助 Sam 起步,但要跟随这些信号处理步骤,Sam 真正需要的是一种不仅能够理解代码,还能了解论文内容,并知道 Sam 正在尝试做什么的 Copilot。
这个 AI 系统不仅限于自己的聊天框,或某个应用的侧边栏。它能看到多个应用中的操作,并在多个应用中提出行动建议。Sam 可以点击按钮,查看潜在实现的变更集,然后继续对话,顺畅地切换到代码编辑器的上下文中。
比如,这个「axis=1」参数是什么意思?解释需要结合代码编辑器中的上下文、正在实现的论文内容,以及数据集附带的文档。AI 会高亮基于特定信息作出的假设,并将其转化为链接。
Sam 点击了「在这个数据集中」的链接,我们的 AI 随即打开 README 文件并跳转到相关段落。
这一切都是为了实现我们的核心目标——让 Sam 尽可能沉浸在他实际要做的事情中,同时获得他理解自己正在做的事情所需的支持。
演示,第三部分:合成动态媒介
这种支持不仅限于文本。
接下来,Sam 需要实现一个降采样阶段。这次,指导包括合成的动态媒介,让 Sam 通过带脚手架的沉浸来理解降采样的作用。
Sam 不需要阅读抽象的解释并尝试想象它对不同信号的影响。相反,他可以通过尝试不同的采样率,动态媒介的实时反馈将帮助他内化对不同信号的影响。通过操作动态媒介,Sam 注意到一些峰值在信号降采样时丢失了。
这些动态媒体不仅限于聊天框。它们使用的是 Sam 在笔记本中相同输入数据和库。在任何时候,Sam 都可以直接「查看源代码」来调整这个图形,或者在自己的笔记本中使用其中的一些代码。
演示,第四部分:情境化学习
现在,Sam 继续深入学习带通滤波器。但是,这些通过简短聊天得到的宏观解释感觉完全不够充分。什么是频域?什么是奈奎斯特率(Nyquist rate)?Sam 可以复制一些 AI 生成的代码,但他完全不明白其中的原理。显然,聊天界面并不是进行长篇概念解释的理想媒介。是时候进行更深入的学习了。
AI 知道 Sam 的背景和目标,所以建议他参考一本注重实践的本科教材。更重要的是,AI 安慰 Sam,现在不必马上读完这本上千页的书。AI 根据 Sam 的目标,推荐了一些易于理解的路径,Sam 可以根据自己对滤波器理解的深度选择不同的学习路径。AI 还在书的目录中为 Sam 制作了一张个性化的学习地图。
比如,如果 Sam 只是想了解这些滤波器的作用和原因,有一条 25 页的学习路径。如果他想了解数学背景——这些滤波器的工作原理,有一条更深入的路径。如果他想自己实现这些滤波器,还有一条更深入的路径。Sam 可以根据自己的需求选择学习路线。
当 Sam 深入学习这本书时,他会发现每个章节的开头和内容中都有 AI 的注释,这些注释将材料与 Sam 的背景、项目和目标结合起来。例如,「这一章节将帮助你理解如何从频谱的角度看待信号。这正是低通滤波器所处理的内容。」Sam 虽然暂时离开了他的项目,进入了一个更传统的学习环境,但这并不意味着他的学习体验会与真正的实践脱节。
顺便说一下,我听过一些技术专家建议,我们应该用 AI 为每个人定制整本书。但我认为,共享的经典文献有着巨大的价值。在任何一个领域,都有大家共同参考的关键文本,它们构成了文化的共同基础。我认为,我们可以通过在这些文本上添加个性化的背景注释来保留这些经典。
在我理想中的未来,共享的经典文献应该是动态媒介,而不是数字化的纸质书。然而,直到所有的经典作品被重写为动态媒介之前,作为过渡措施,我们至少可以挥手想象,AI 可以合成像这些图表的动态媒介版本。
现在,Sam 在阅读这本书时,可以继续通过提问与文本互动,AI 的回答将始终与他的项目相关。
当 Sam 高亮文本或对某些特别重要或令人惊讶的细节发表评论时,这些注释不会被困在 PDF 中。它们将融入未来的讨论和实践中,稍后我们会看到这一点。
除了 Sam 向 AI 提问外,AI 也可以提出一些问题让 Sam 思考——同样基于他的项目——以促进对材料更深入的理解。
就像 AI 引导 Sam 找到这本厚达千页的书中的正确章节一样,它也可以指出哪些练习对 Sam 最有价值,考虑到他的背景和目标。AI 还能将这些练习与 Sam 的目标联系起来,这样做这些练习的过程就像是他真正实践的一部分。即使练习仍然感觉有些脱离情境,Sam 至少可以更有信心地认为,这些工作将帮助他实现他想要做的事情。
插曲:练习与记忆
Sam 结束了一天的工作,项目上有了些进展,对不少主题也有了新的理解。但这些知识还不够牢固,Sam 对这些内容的掌握还很生疏。如果他试图认真使用这些材料,可能会感觉底气不足。而且,很可能会忘掉刚学到的大部分内容。
我想谈谈记忆这个话题。值得一问的是:为什么我们有时候能记住概念性的内容,有时候却记不住?我们常常上课、读书,甚至查资料,但没多久就几乎忘得一干二净。但有些东西却能记得特别牢。这是为什么?
有些情况比较简单。如果你在熟悉的领域学习新知识,每个新事实都会和已有的知识联系起来。这会提供更多记忆的线索和强化的机会。如果你每天都需要用到这些知识,你会发现记忆很快就变得可靠起来。
像 Sam 正在学习的这些概念性内容,通常不会每天都得到强化。但有时候,环境会巧妙地给这些记忆提供所需的强化。比如,你白天读到一个主题,晚上和同事聊天时又谈到了这个主题。你需要回忆起所学的内容,这个过程会强化记忆。然后,可能两天后,你在项目中再次需要用到这些知识。每次这样强化记忆,你遗忘的速度就会变慢。这样一来,可能一周过去了,你还记得。然后是几周,几个月,依此类推。只要在适当的时间间隔内进行几次回忆,你就能将这些知识记住几个月甚至几年。
相反,有时候你学到的东西,直到下周才再次用到。这时你试图回忆,但可能已经忘了,所以不得不重新查阅。这对记忆的强化作用不大。如果很长时间内都不再用到,下次可能还是记不住,又要重新查阅的。如此反复。这里的关键启示是,你可以为自己安排一个合适的时间表。
有些课程确实会这样做,每次作业都会有意识地复习之前学过的知识。但大多数沉浸式学习,以及大部分学习方式,通常不会这么安排,所以你经常会忘掉很多内容。如果这种强化能融入学习过程,会怎么样呢?
我的合作者 Michael Nielsen 和我创建了一本量子计算入门书《量子国度》,就是为了探索这个想法。这本书可以在网上免费阅读。如果你访问 quantum.country,你会看到乍一看像一本普通的书。
阅读几分钟后,文章会被一些小测验打断。这些问题设计得很简单,每个只需几秒钟:在心里想出答案,然后标记自己是否答对了。到目前为止,这些看起来像是简单的抽认卡。但正如我们讨论过的,即使你现在能回答这些问题,并不意味着几周甚至几天后你还能记住。
注意到每个问题底部的这些标记了吗?这些标记代表时间间隔。你在阅读文本时练习这些问题,然后一周后,你会收到一封邮件,说:「嘿,你可能已经开始忘记你读过的一些内容了。要不要花五分钟快速复习一下?」每次你成功回答后,间隔时间都会增加——先是几周,然后几个月,依此类推。如果你开始遗忘,间隔时间就会缩短,以便提供更多强化。
你可能以前见过类似的系统。语言学习者和医学生经常使用一种叫做间隔重复记忆系统的工具来记忆单词和基础知识。但同样的认知机制也适用于更复杂的概念性知识。基于这个原理,书的第一章里分布了 112 个这样的问题。
《量子国度》是一种新型媒介——一种助记媒介——它将间隔重复记忆系统与解释性文本结合起来,使人们更容易可靠地吸收复杂的内容。
我们现在有数百万条练习数据,可以开始看到它的效果。这张图展示了练习所花的时间(x 轴)与读者的展示记忆保持(y 轴)之间的关系。展示记忆保持指的是读者在不练习的情况下,能正确回答至少 90% 问题的时间长度。这五个点代表了中位用户在第一章中的前五次重复练习。注意,y 轴是对数刻度,所以我们看到的是一个漂亮的指数增长。每次额外的重复练习——持续的额外投入——会带来越来越多的产出——也就是展示记忆保持的提高。
总共花大约一个半小时的练习时间,中位读者在两个月没有练习后,仍能正确回答第一章中的一百多个详细问题。现在,第一章大多数读者初次阅读需要大约四个小时,所以这张图表明,额外不到 50% 的时间投入可以带来几个月甚至几年的详细记忆保持。
探索反事实也很有趣:如果没有额外的强化,人们会忘记多少?作为实验,我们从一些读者的第一章中移除了九个问题,然后一个月后在他们的练习中偷偷重新加入这些问题。这个图表展示了结果。
这九个点代表那九个问题。y 轴显示的是一个月后,读者在没有任何帮助的情况下,能够正确回答该问题的百分比。你可以看到,有些问题比其他问题更难。一个月后,大多数读者答错了最左边最难的三个问题,大约 30% 的读者答错了中间三个问题,而大约 15% 的读者答错了最容易的三个问题。
另一组用户在阅读文章时进行了练习,就像我们刚才在视频中看到的那样。对于他们忘记的问题,第二天还有一次额外的练习。然后这些问题消失了一个月,再进行测试。这些读者表现明显更好,尽管仍有一部分人答错了一些问题。
这里还有最后一组,和前一组类似,但他们在完成阅读一周后额外进行了一轮练习。然后我们在一个月的标记处再次测试了他们,这就是你现在看到的结果。每个问题平均需要六秒钟回答,所以这九个问题的额外练习时间总共不到一分钟。但现在,对于所有这些问题,至少 90% 的读者能够正确回答。
当然,有些读者比其他人更轻松。左边的这张图表关注的是底部四分位数的用户——那些在第一次阅读文章时答错最多问题的读者。注意,我不得不将 y 轴向下延长。我们可以看到,如果没有进行任何练习,他们大多数人会忘记三分之二的这些保留问题。仅靠文章中的练习,仍有大约一半的人忘记了大约一半的问题。但通过额外的一轮练习,即使是底部四分位数的读者表现也相当不错。
像《量子国度》这样的系统不仅对量子计算有用。在我的个人实践中,我积累了成千上万的问题。我为科学论文、对话、讲座、难忘的饭菜写下问题。所有这些都让我的日常生活更加充实,因为我知道,只要我投入注意力,我就能长久地内化这些知识。
这个系统的核心是日常仪式的概念,一个练习的载体。就像冥想和锻炼一样,我每天花大约十分钟使用我的记忆系统。因为这些指数型调度非常高效,这十分钟足以维持我对数千个问题的记忆,并允许我每天增加大约四十个新问题。
但我想提一下这些记忆系统存在的一些问题。
其一是模式匹配:一旦一个问题出现几次,我可能会识别出问题的文本,而没有真正思考它。这会产生一种令人不快的鹦鹉学舌的感觉,但我怀疑它经常让我的记忆变得脆弱:我会记住答案,但只有在练习时完全按照提示的情况下才会记住。我希望问题能有更多的变化。
同样,问题必然在某种程度上是抽象的。当我面对该领域的一个实际问题时,我不总是能识别出我应该使用哪些知识,或者如何将其适应到情况中。认知科学家会说,我需要习得图式(schemas)。
除非我干预,否则问题会在几年内保持不变。它们在维持记忆——但理想情况下,它们应该推动进一步的加工——随着时间的推移增加深度。
最后,回到这次演讲的主题:记忆系统通常与我的真实实践脱节太多。比如说,我正在为一个创意项目学习信号处理的一个主题。除非我很细心,否则那些问题可能不会与我的项目感觉很相关——它们会感觉像是信号处理的普通教材习题。
演示,第五部分:动态练习
现在让我们回到 Sam,看看能否应用一些关于练习和记忆的想法。Sam 已经学习了那些信号处理的材料,因此他希望确保真正记住这些知识。
他安装了一个屏幕小组件,这个小组件会随机展示练习卡片,这些卡片来自于他的高亮标记、提问和 AI 能访问的其他活动。Sam 可以在排队或乘车时翻阅这些问题。注意,这些问题不是泛泛的信号处理问题,而是基于 Sam 的脑机接口项目的具体细节,因此理想情况下,练习会感觉更连贯,更接近他真正要做的事情。
这些合成的卡片每次都会有所不同,这样 Sam 可以从不同角度练习同一个概念。随着 Sam 对材料的熟悉程度增加,卡片会变得更深入、更复杂。还要注意,这些问题并不抽象,而是与如何应用 Sam 学到的知识息息相关,并以适合一口吃下的形式呈现。
小组件还可以包含开放式讨论题。在这里,Sam 会得到详细的反馈——一个额外的细节来考虑他的答案。
当问题以这种方式合成时,重要的是 Sam 可以通过反馈来引导这些问题。未来的问题在合成时将根据反馈进行调整。
到目前为止,我们看到的是 Sam 可以在外出时回答的一口大小的问题,但如果他腾出时间进行更长时间的专门练习,我们可以推荐更有分量的任务,比如这个。更重要的是,我们可以将这些任务从虚拟的练习环境转移到 Sam 的实际环境中——Jupyter 笔记本。注意,这些任务仍然是围绕 Sam 的具体目标,而不是一些泛泛的信号处理问题。
演示,第六部分:社交联系
现在,Sam 加入这个项目并非仅仅作为「学习练习」,而是作为一种开始合法参与的方式。在发挥现有优势的同时,开始在脑机接口方向工作。
正如我们的 AI 能帮助 Sam 找到进入这一领域的可行途径,它也能促进与实践社区的联系——这里推荐了一个当地的神经科技聚会。于是,Sam 参加了神经科技活动,结识了一位当地的科学家,并约定了咖啡会面。在获得许可后,Sam 记录了这次会面,预感到这些笔记日后可能会有用。
当然,在这场对话中,Sam 经历了许多惊喜和好奇的时刻。我们的 AI 能够察觉这些时刻,并帮助 Sam 消化它们。这里,那个洞察转化为一张反思实践的卡片。
设计原则
Sam 的故事中贯穿了四大设计原则。现在,我想回顾这些原则,并针对每一条,指出我认为 AI 能提供的帮助。
首先,我们将引导式学习融入真实情境,而非将其视为一项独立活动。我们能做到这一点,是因为设想了一种能在 Sam 电脑上跨应用程序感知和行动的 AI。正如最后的音频转录所示,这种能力甚至可以延伸到电脑之外的活动。这种 AI 之所以能提供恰当的指导,部分原因在于——在获得许可并在本地运行的情况下——它能从所有曾出现在 Sam 屏幕上的文本、所有他在电脑上的行动中学习。它能合成动态媒体支架,使 Sam 能在指导下通过实践学习。
接着,当有必要进行外显学习活动时,我们将其融入真实情境。AI 将 Sam 的所有阅读和实践活动与他的真实目标相结合。它帮助 Sam 将学习活动与他的兴趣深度相匹配。它利用 Sam 实践中的重要时刻,比如咖啡会面结束时的洞察,或项目实施过程中提出的问题,并将这些时刻融入学习活动中。
除了连接这两个领域,我们还能加强它们各自的力量。我们的 AI 为 Sam 提供了「全身心投入」新兴趣的可行方法,并帮助 Sam 建立与实践社区的联系。
最后,在外显学习活动中,我们要确保学习真正奏效。我们的 AI 创造了一个动态的学习载体,它随时间变化,以确保知识能顺利迁移到实际情境中。而且,它不仅仅维持记忆,还能随着时间的推移加深理解。
为聊天机器人导师喝彩两声
当前关于 AI 与教育的讨论大多围绕聊天机器人导师这一视角展开。
我认为,这一视角正确地捕捉到了语言模型的一个真正美妙之处:它们擅长回答长尾问题……前提是用户能够清晰地表述问题。如果用户试图完成一项常规任务,聊天机器人导师通常能诊断出问题所在,并找到方法让用户摆脱困境。这确实很棒。
然而,当我以我们一直在探讨的更宽广的视角审视他人对聊天机器人导师的愿景时——显然,他们忽略了许多我所期望的要素。我认为,这些愿景往往未能认真对待真正的导师能做的巨大贡献。很大程度上,我认为这是因为这些愿景的提出者通常在思考教育(他们想对他人做的事情)而非学习(他们自己想要的事情)。
现在,这个世界上一个可悲的事实是,博士后和研究生的薪酬极低,因此,聘请一位我关心的技术领域的专家导师,其费用竟然出乎意料地可承受。
但若我聘请一位真人导师,以成人身份学习信号处理,我会告诉他们我对脑机接口的兴趣,并期望他们的每次交流都围绕这一目标展开。我的目标并非单纯的「学习信号处理」,而是「参与脑机接口的创造」。聊天机器人导师并不关心我的实际目标;它们有一套认为我应该知道或能够做到的事情,直到我说出正确的话前,它们认为我有缺陷。
若我聘请真人导师,我可能会请求他们在我尝试实际应用这些知识时坐在我身旁。他们能观察到我的一切操作,理解我所指之处。若情况适宜,我可以稍作让位,让他们短暂主导。相比之下,典型的聊天机器人导师概念如同生活在一个无窗的盒子中,仅能看见门缝下递进的零星纸片上的信息,对外界毫无影响能力。我的目标是深入其中,全身心投入,开始实践。然而,这些聊天机器人导师无法与我一同置身于真正的行动现场。因此,与它们的互动产生了距离,将我从沉浸状态中拉扯出来。
若我聘请真人导师,我们将建立起一种关系。每节课后,他们都会更了解我——我的兴趣、我的优势、我的困惑。通常设想的聊天机器人导师则是交易性的,健忘的。尽管随着上下文窗口的延长,这一点可以得到改善。但这种关系对我情感投入同样至关重要。如果我将与导师的对话视为一种边缘性参与我所期望加入的社群的方式——一种在学科内的新手与导师的互动——那么辅导将成为实践的一部分。但如果我与导师的互动是交易性的,那么这往往会使我的辅导课程感觉像是「学习时间」,与实践相隔离。
最后,人们常提及亚里士多德曾是亚历山大大帝的导师。然而,拥有亚里士多德作为导师的最大价值并非在于「纠正误解」,而在于他展示了真诚、全身心投入智力的成年人的实践与价值观。他示范了思考问题的方式及其原因,他在学科中的品味。我们珍视的高速成长期改变了我们看待世界的方式,重塑了我们的身份。
在我之前的演示中,我展示了一个聊天机器人,但它并不像我看到的许多「聊天机器人导师」那样运作。它将所有行动聚焦于用户的兴趣,而非自带议程。它并未局限于狭小的文本框内——它能在真实使用的情境中观察并采取行动,能通过动态媒体进行交流。它拥有深刻的记忆,汲取了你曾写过或见过的所有内容。
因此,在某种程度上,我所展示的系统更像一位真人导师。但在我理想的世界里,我并不想要一个导师;我渴望合法地参与某个新领域,并尽可能通过与实际从业者的互动来学习所需知识。
我认为增强学习系统的角色是帮助我实现创意兴趣,理想情况下,让我尽可能直接全身心投入并开始实践。这往往意味着搭建与实践社区的联系和互动的桥梁。
关于伦理的说明
本系列 Design@Large 的一个主题是 AI 伦理及其可能产生的巨大社会影响。请允许我说:我对这些影响深感忧虑,尤其是在普遍情况下。我担心独裁者巩固权力、降低生物武器门槛、引发经济混乱。在伦理上,我无法安心研究更强大的前沿模型。
但在学习的较窄领域内,我最主要的道德关切是我们可能陷入一条悲哀而狭窄的道路。一种居高临下、权威主义的视角主导了未来学习的叙事。我将对此进行夸张描述以阐明观点:借助 AI,我们可以让所有这些有缺陷的孩子——那些不知道他们应该知道的东西的孩子——最终掌握这些知识!你知道的:个性化学习!AI 将使我们能精确识别孩子们的错误或无知之处,并修正他们。然后,我们可以将有益于他们的知识填满他们的头脑。
我认为著名的「思维自行车」比喻更好,因为它除了你带来的目标外没有其他议程。它只是让你能到达比步行更广阔的目标范围。而且,如果与朋友一同骑行,这段旅程也会变得有趣。自行车询问:你想去哪里?
当然,这个问题假设你的目的地已为人所熟知,并在某张地图上清晰标出。但那些最令人满足的高速成长经历往往围绕一个创意项目展开。你正试图前往一个无人涉足之地——抵达前沿,然后开始绘制通往未知的链接。服务于创造的学习。这是一种动态、充满情境的学习。它关乎的不仅仅是效率和正确性,更不仅仅是自行车上更快的齿轮。正是这种学习,让我感到几乎有一种道德上的迫切性去助力其诞生。
我是一名独立研究员,我的工作由我的 Patreon 社区众筹支持。如果你觉得这项研究有趣,你可以成为会员,帮助实现更多这样的研究。你将得到深入的月度文章,原型预览,以及研讨会和非会议等活动。
现在,我要表达一些感谢。这次演讲中的想法得益于多年来与 Alec Resnick、Bret Victor、Dan Meyer、Joe Edelman、May-Li Khoe 和 Michael Nielsen 的交流。还要感谢 Ben Reinhardt、Catherine Olsson、Elliott Jin、Laura Deming、Rob Ochshorn、Sara LaHue 和 Taylor Rogalski 在我准备演讲时的有益对话。我感谢这次演讲的主办方,UCSD 设计实验室的 Jim Hollan和 Haijun Xia。
特别感谢截至发布时的赞助级别支持者:Adam Marblestone、Adam Wiggins、Andrew Sutherland、Andy Schriner、Ben Springwater、Bert MuthalalyBoris Verbitsky、Calvin French-Owen、Dan Romero、David Wilkinson、fnnch、Greg Vardy、Heptabase、James Hill-Khurana、James Lindenbaum、Jesse Andrews、Kevin Lynagh、Kinnu、Lambda AI Hardware、Ludwig Petersson、Maksim Stepanenko、Matt Knox、Michael Slade、Mickey McManus、Mintter、Peter Hartree、Ross Boucher、Russel Simmons、Salem Al-Mansoori Sana Labs、Thomas Honeyman、Todor Markov、Tooz Wu、William Clausen、William Laitinen、Yaniv Tal。
在学术工作中引用该演讲请遵循以下格式:Matuschak, A. (2024, May 8). How might we learn?. UCSD Design@Large. https://andymatuschak.org/hmwl
隐式练习——视奏寓言
我认识的最优秀的科学家、创业者和工程师都全身心地投入他们的工作。这种工作无法用打卡表来体现,因为他们创新的飞轮不停地旋转,无论是在淋浴还是在散步时都时刻产生灵感,而且价值不亚于在办公室产出的。然而,我发现顶级知识工作者对待自己的技能的态度,与顶级运动员和艺术家大不相同。
竞技运动员、音乐家和舞者都会不知疲倦地工作——通常有一支教练团队——来评估、发展和保持他们领域的核心技能。他们会回看自己的比赛录像,他们会衡量自己在旨在提炼特定核心技能的微观任务上的表现。在他们的职业生涯中,他们仍然会练习音阶,或进行增强式训练,或做任何他们需要做的事情来保持巅峰性能。
相比之下,我的一些知识工作者朋友有时会告诉我他们正在学习新的编程语言,或者在辅导下回顾统计数据。但我注意到这些「训练」的努力通常是暂时的,而且专注于学科知识,而不是像运动员或表演艺术家可能每天都在精进的「核心技能」。很少有知识工作者告诉我,他们有持之以恒的训练方案,用来专门提升他们解读困难文本、整合见解或提炼研究问题的技巧。
在 K. Anders Ericsson 的书中,他总结了自己研究刻意练习和杰出表现的职业生涯。K. Anders Ericsson 建议[1]我们不应对这种疏漏感到惊讶。网球和芭蕾的核心技能已经被系统地刻画,并且可以容易且客观地评估;哪些练习活动可以提高表现都是已知的,但对于科学家或创业者的技能,我们还不能这样说(至少现在不能)。
但我个人不认为这是故事的全部。当我与严肃知识工作者讨论他们与运动员之间的这种差异时,我经常听到类似于以下的回答:「我确实每天在工作中练习你所说的这些技能。我一直在阅读备忘录、整合洞见和阐明问题。」这里隐含的意思是,他们在日常工作中隐式地练习这些技能,所以他们不需要像其他领域那样专门进行评估和发展。
Ericsson 和其他合作者在另一篇论文中回应了这一异议[2]:
尽管工作活动提供了一些学习的机会,但它们远非最佳选择。相反,刻意练习则能提供重复的体验,其中个体可以关注情境的关键方面,并根据教师给出的结果知识、反馈或两者的结合来逐步改善自己的表现。……在一场 3 小时的棒球比赛中,击球手可能只能遇到 5-15 次投球(可能只有一两次是与某种特定的弱点相关的),而在同样时长的理想练习中,与专属投球手合作的击球手能有数百次击球的机会,可以系统地探索这个弱点……与游戏相比,刻意练习是一种高度结构化的活动,其明确的目标就是提高表现。人们会发明特定的任务来克服弱点,并仔细监控表现,以便找出进一步提高的线索。
我这一年(通过一些艰难的经历)悟出了一个道理:在某种情况下,隐式练习往往会失败——而且是难以察觉的失败。我希望这个故事能帮你在生活中发现类似的模式。
视奏寓言
我从八岁开始学习钢琴。不幸的是,我直到十几岁才开始认真对待这种乐器,而我成年后大部分时间都在追求声乐,这让我分心了。因此,尽管我学琴已经有几十年的时间,但我的演奏水平可能还达不到人们所期望的那样。尽管如此,我可以学习并演奏「早期高级(early advanced)」的古典曲目,我在钢琴前的时间给我带来了巨大的喜悦。
去年,我突然发现,即便是经历了多位老师的悉心教导,以及在钢琴上耗费了数千个小时,我的技能中仍然存在着一个巨大——还无形——的缺口,这严重阻碍了我的进步,也削减了我的享受。我的曲目和技能或许与有点经验的业余爱好者相当,但直到我发现这个问题并开始刻意去修正它之前,我的视奏技能还停留在刚学琴三年的初学者水平。
视奏是指拿起一份你从未见过的乐谱,几乎不做准备或练习就能演奏的技能。相比之下,「学习」一首曲子,就好比慢慢拼读一个用完全陌生的外语和文字书写的文学作品。我在高中时有过这样的经历,那时我要翻译《荷马史诗》中的古希腊语。两年的时间里,我对希腊语的体验就是每小时勉强翻译两行诗句。然后我们开始阅读《圣经‧新约》,我第一次有了「视奏」希腊语的体验:语言简单到让我能边读边翻译。(显然,传教性的文本用的语言越通俗易懂越好!)那是多么快乐、自由的感觉!和我之前那种查阅无数参考资料来理解每个词句的磨人体验,完全是天壤之别。
作为一名钢琴演奏者,我没有意识到自己始终在「学习」而非「阅读」乐谱,因为没有学生会期待能够视奏那些富有挑战性的钢琴曲目。这些曲目需要花费数周甚至数月的时间去学习——不是为了能够从乐谱上迅速读出音符,而是为了熟练掌握复杂的手部动作,对多声部的运动进行精确的演绎等等。
在钢琴学习中,我的老师和我专注于学习「挑战我能力边界」的曲目。每一首都得花上好几个月的时间来学。几乎所有的时间都花在了对曲目的演绎和技巧上。在最初的几次练习之后,我就记住了整个乐谱,所以我不需要再去读它了。但这就意味着,在整整一年里,我只读了几页新乐谱!试想一下,如果每年只有几页散文来学习阅读,那将是什么样的情况。难怪我读谱的速度这么慢。
不幸的是,这种情况只会自我恶化。曲目越来越有深度,学起来就越发耗时,这进一步减少了我每年能阅读的新乐谱数量。我糟糕的视奏技能使得学习新曲目的时间变得更长:因为我没法即时读谱,我得先把乐段记下来才能开始练习。所以每年,我阅读的乐段会更少,而且难度更大,我的视奏技巧也随之进一步退化,如此恶性循环。因此,糟糕的视奏技能导致了更少的培养视奏技能的隐性机会。这真是一个糟糕的反馈循环!
在情感上,糟糕的视奏技能也在我的钢琴体验中造成了一种强烈的匮乏感。每当我开启新曲目的学习,我就知道我需要学上几个月才能弹奏它。而且我知道我每年只能学习几首新曲目。因此,挑选新曲目学习变成了一个需要慎重考虑的决定。坐在钢琴前,我无法随心所欲地追随自己的音乐冲动:我必须坚持一段很长的时间才能完成一首曲目。这种沉重感让弹琴的快乐大打折扣。
我虽无法完全表达出来,但我真的很想能随心所欲地坐下来弹奏新曲。当然,我明白我正在学习的「对口级别」曲目困难很高,因此我无法即兴演奏它们。但即使我选择看似简单得多的曲目,我仍然无法即席演奏。这些较简单的曲目可能需要五次而不是五十次联系,但它们给我的感觉仍然像是「拼读单词」,而不是「阅读」。我觉得,如果我连这些更简单的曲目都不能即兴演奏,那么练习它们就没有意义:我只是在浪费本应花在那些能够提升我钢琴技能的「对口级别」的曲目上的时间。
这里的教训是,单靠隐式练习并不足以改善我糟糕的视奏技能。新曲目需要几个月的学习时间,但我的老师并没有注意到问题,因为这些曲目难度应该很高,应该需要很长时间……尽管事后来看,也许不应该那么久。真正的问题是,不管什么音乐,我都需要相当长的时间去学习,哪怕是多年前我可能学过的级别。但我从未和老师一起练习过这样的「更简单」的音乐,因此没有专家有机会注意到这个问题。
这种情况的讽刺之处在于,钢琴是专业研究人员在讨论刻意练习时经常引用的经典领域。钢琴的技能已经被很好地界定和评估了;我们有提高每个级别、每项技能表现的练习方法;我们有公认的教学方法;等等。实际上,正是这种规范的结构最终把我的视奏问题暴露出来。一位可能担任我新的钢琴老师的人想让我用音乐皇家学院的教学大纲来概述我的能力,这个大纲非常有用,它为不同技能的「等级」设定了明确的标准,并为每个级别提供了学习资源。我自评在各项技能上都能达到 8 或 9 级——除了视奏,大概只有 3 级。哎呀。
我并没有立刻意识到这个差距有多重要。我几乎是出于卫生习惯地想:嗯,也许我应该把这个落后的技能提升到与其他技能相同的水平。于是,我买了一些视奏练习册。这些书提供了按难度编排的曲目片段。你可以找到一个合适的「起点」,简单到足以进行视奏,然后每天视奏一两页新曲目。随着时间的推移,曲目会慢慢变得更复杂,就像儿童的分级读物一样。我进步得很快,但这意味着每天只能弹奏简单民歌的几小节——所以这种成长并没有让我觉得有多深刻。
几个月后,我在 YouTube 上看到一个视频,建议钢琴演奏者通过练习喜欢的音乐的「简单」改编版来提高视奏技能。我买了一本为初学者准备的迪士尼乐谱书——可能说起来有点不好意思——但这本书真的给了我一生中最震撼的音乐体验。这本书到货的那天晚上,我坐在钢琴前,翻开了第一页。我演奏了第一首曲目,然后是下一首,接着是下一首,一直演奏到书的最后一页,一整夜我弹了 200 多页。那一晚我读的乐谱,比我之前十年累积练习的还要多。多年来,每个新曲目我都要练上几个月才能弹得出来。这次能够一下子弹奏出这么多喜爱的曲目,那种兴奋感无以言表。这些编曲虽然简单,但那并不重要。以某种奇妙的方式,比起那些我曾苦练的肖邦难曲,这些简化的曲子更让我感觉自己像钢琴家。它们消除了我以前没有意识到的匮乏感,给了我一种从未有过的主导感。过去一年里,我几乎每天都在练习视奏,每一点进步都让人感到满足。
许多读到这里的音乐家可能会说,我之前的经历真倒霉。如果我的老师们能有更广阔的教学视野,或者我学过像爵士这样依赖即兴和合奏的音乐类型,我本可以避免这个问题。但我觉得我在这种情况下很幸运。我的弱项恰好是在一个适合刻意练习的领域。偶然间进行的评估揭示了问题。一旦问题被识别,我就容易取得快速进展。但如果我的弱点隐藏在一个定义不太明确的领域,一个对刻意练习没有那么友好的领域,那就真倒霉了。
跟 Rob Ochshorn 聊到这个故事时,他问我:我的生活中还有没有潜伏着类似的情况?还有没有其他像视奏一样的弱项技能,导致同样有害的反馈循环?如果在这些技能上做一些水平低得有点尴尬的练习,会不会也同样给人带来满足感?
设计寓言
在那次谈话里,我突然醒悟到,对我来说,另一个极为关键的技能也陷入了同样的恶性循环:用户界面设计的视觉实践。就像我的视奏技能因为我专注于学习「在我能力边界」的曲目而停滞不前一样,我的设计技能也从未有机会发展,因为我的设计项目一直专注于概念上困难的,往往也都是新颖的,交互设计。
许多年轻的设计师通过在概念上「简单」的用户界面——注册屏幕、搜索结果列表、新闻订阅源——上不断迭代布局来磨练他们的技能。通过大量的(或许有些单调的)实践,他们对常见模式有了深刻的理解,这让他们能够在面对新界面时像「视奏」一样:即兴、几乎实时地设计出高品质的布局。
但我作为一名工程师,是偶然进入设计领域的,所以我在苹果的项目都是不寻常的概念:iOS 的 3D 翻页效果、新颖的多点触控手势交互、基于物理的用户界面动画、陀螺仪驱动的 3D 视差效果等等。在可汗学院,我则致力于设计互动数字积木、带插图的数学「跑酷」游戏,以及半同步的同伴学习环境这样的项目。这些项目在概念上都非常有挑战性,因此每个都需要数月才能完成。当然,我和合作者肯定会花些时间在界面设计的视觉元素上,但大部分精力都放在了那些复杂概念问题上。这种情况和学习「对口级别」的钢琴曲目很像,需要花费数月来专注于技巧和演绎,但几次练习后,我就不需要看谱子了。虽然我作为设计师已工作了多年,但我只布局过寥寥数个界面——就像我花了很多年的时间学习高级钢琴曲目,每年只能读几页新乐谱一样。
现在我明白了,我在界面设计方面薄弱的视觉技能,已经造成了一种类似我在钢琴上的稀缺感。界面创意的构思需要我花费大量时间去打磨,因此我觉得需要谨慎选择项目——一年中我能做的新设计屈指可数,就像我一年只能选择几首钢琴曲来弹一样。随着我的职业生涯逐步深入,我接手的设计项目愈加具有挑战性,这通常意味着我每年能设计的新界面越来越少了。但我一直(在无意中)依靠隐式练习来提高我界面设计的视觉技能,因此我陷入了一个恶性循环:缓慢的视觉设计技能导致隐式练习的机会越来越少,反过来这些技能就越来越落后于我的「能力边界」。
我在钢琴上通过刻意练习打破了这个循环。在设计上做到这点就比较棘手:技能的界定不够清晰;评估方式更为困难;我们还缺少有效的练习方法。但是,通过为自己构建明确的练习程序,我已经开始有了一些令人鼓舞的体验。我集思广益,列出了一大堆我希望存在的软件。然后我选择了一些我认为不需要不寻常的表现形式、不需要不寻常的概念或交互模型的例子。这些例子可以只用标准的平台控件,以常规的方式布局。之后,我设计了模仿这些应用的视觉布局。
这种体验感觉就像弹奏迪士尼音乐的「初学者」编曲一样。一方面,这个练习感觉有点「令我不屑」:肤浅,过于简化。让我觉得不值一提。但另一方面,我又感受到了那种令人兴奋的流畅感和自发性。设计界面并不一定非要花费数月时间——看,我可以当场想出一个软件创意并为它设计界面!这是多么自由的感觉。
我清楚地感觉到,培养这项技能比视奏要难得多。我很难评估自己的工作;下一步该做什么,或者如何解决问题,这些都不是很明确。但我对目前的进步感到兴奋,也热衷于继续这种显性练习。
经过这两段经历,我深刻体会到隐式练习的局限。对我来说,最重要的教训是,发展这些技能的难点并在于弄清楚如何练习或是如何获得正确的反馈,而是首先要识别出那些急需改进的技能。现在,我开始留意其他我可能忽略了的技能,它们可能也遵循了类似的模式。我想,还有其他技能退化的重要模式我尚未识别——我也会继续寻找这些模式。
[1] 见他的书 Peak(2016)与 Robert Pool 合著,第 98 页。
[2] [Ericsson et al. (1993). The role of deliberate practice in the acquisition of expert performance.](http://andymatuschak.org/files/papers/Ericsson et al - 1993 - The role of deliberate practice in the acquisition of expert performance.pdf) 见 368 页。
赞美具体性,以及 2023 年学到的其他经验教训
原文:In praise of the particular, and other lessons from 2023 | Patreon
系统性产出与一次性方法
我们很容易掉入混淆目标与方法的陷阱。
我正在努力发明系统,适应不同场景下各类人群的需求。因此,我的直觉让我将发明过程的重点放在了可扩展性和通用性上。如果我有了一个想法,我通常会试图制作一些可链接的东西——我可以把它们发送给各种各样的人,在各种各样的场景中使用。我会发放调查问卷;选择一些遥测变量用于测量和分析;可能进行一个随机对照试验;还会对用户进行采访,了解他们的使用体验。
这可能是我近年来学到的最重要的东西:这些直觉通常是错误的。要发明一个系统性的解决方案,我经常需要从众多非系统性的实验中提炼出见解。也就是说,我的目标——通用解决方案——需要采用性质截然不同的方法(以及中间产物)。
Paul Graham 曾给过初创公司一个著名的建议:「做一些不可扩展的事情」。比如挨家挨户地与客户交谈,而不是购买全国性的广告宣传。他主要从商业、市场和品牌方面来证明这一建议是合理的;我想这也是大多数人所记住的。但他确实简要地讨论了非可扩展性作为创造的方法,虽然他专注于初创公司,但他的论点也捕捉到了我的一些经验。我想在发现和发明的背景下,就「做一些不可扩展的事情」做一些补充观察。
单用户评估
去年晚些时候,我感觉我的实验在一定程度上使我偏离了我的目标:帮助人们深刻理解对他们而言真正重要的复杂概念。我一直在构建系统、开展大规模实验,我能讲解关于遗忘曲线和使用模式的种种细节——但对它们如何与人们真正关心的问题相联系却知之甚少。我知道自己正在取得一些进展,但大多时候我都是盲目地前行,缺乏推动迭代的必要反馈。
因此,在 2023 年,我调整了方向,开始强调亲密性。我把统计分析和总结访谈抛在一边,花了几个小时坐在个别用户旁边,观察他们使用我专门为他们定制的一次性原型。在这个过程的最初几周,我获得了很多洞见,比整个 2022 年都要多。
当然,我获得了另一种类型的深刻洞察。我并未学到任何能够推广到大部分人身上的知识。我无法在改变某个参数时精确测量记忆表现的细微差异。反倒是我能够非常细致地观察到我的设计与更宽泛的学习场景之间的交互手感——这才是我的真正目标,而不是某种替代指标。我能看到事情在我的原型中按计划进行,但当这些知识被应用时,情况却明显地脱离了预期的轨道。我能实时感受到这一过程中的情感波动。我发现了许多此前在调查或事后采访中未曾考虑过的问题。
这算是「严谨」的研究吗?如果按照常规定义,可能不算。但通过这种方式工作,我感到比过去很长一段时间都更有能力推进自己的想法。这样的单用户实验重在发现和探索,而非精确评估。事实上,我在与一位学生的工作中揭露了一个惊人的假设,它占据了我这一年的大部分时间:表面上看是遗忘的问题,有时实际上是阅读理解的问题——从未真正理解过——而我们很难可靠地区分这两者。
在评估方面,单用户实验的负面结果通常能让我学到很多。当我为某个具体的学生定制解决方案,结果却不尽如人意时,我很少觉得有必要通过更大规模的实验来再次验证这一负面结果。尽管有些失败可能源于个人特质或特殊情况,但作为设计师的直觉可以帮助我甄别这些问题;我并不太担心出现假阳性(译注:检测结果是负面,但其实是误报)。与规范测量的受控实验不同,这类定性观察通常能为我提供许多解决方案表现不理想的原因。实践中,评估我工作的一个有效方法似乎是:先进行一对一的设计尝试,直到它们看起来有效,然后再开展更多的量化实验,以了解这种效果的普适性。
单场景设计
我的目标是创造一种增强阅读环境,适用于各种类型的信息性文本——覆盖不同学科、格式和受众。因此,我面临的挑战是以最系统、最通用的形式来考虑每个设计元素。但这实际上混淆了目标与方法。我的许多重要洞见都源于在具体场景的具体设计中所积累和沉淀的对具体的生动观察。就比如,某个学生对某个具体练习感到的挫败。
Fred Brooks 精准地[提炼](https://andymatuschak.org/files/papers/Brooks - 1977 - The computer scientist as toolsmith.pdf)了 Christopher Alexander 的观点:
要实现设计与需求之间的良好契合,唯一的方法是找到并消除不匹配之处;没有方法可以从需求中直接推导出设计形式。良好的契合就是不存在任何潜在的不匹配之处。
当我着眼于通用形式时,往往很难发现「不匹配」。我与问题之间的联系变得愈发模糊。我关注的重点变成了系统本身,而不是它与具体使用场景的交互。这就造成了系统设计师的一个常见的问题:沉迷于纯粹性和抽象概念的构建之中,越来越远离系统在实际世界中的真实目标。
我在「尝试设计一个增强阅读环境」与「尝试设计这本具体的线性代数教科书的增强版本」之间体会到了巨大的区别。当思考前者时,我主要集中在原语、抽象和流程上。而思考后者时,我的注意力则集中在具体书页中对具体概念的需求上。一旦它开始投入使用,我会关注具体学生在具体环境中遇到的具体问题。这些就是我作为设计师需要解决的「不匹配」。
我时常回想起 Ted Nelson 对 Xanadu 的奇想尝试,最初是出于他作为剧本作家的抱负。几十年来,他致力于构建抽象和基础设施,企图包含所有可能的写作形式,但据我所知,这些努力并未真正包含他使用这些设计进行有意义写作的尝试。因此,尽管这些系统的理念颇具吸引力,但大部分至今仍未实现。这并不是因为年轻的技术人员忽略了前人的智慧:许多这样的设计根本未能充分发展,不足以解决它们设想解决的问题,或者未能证明它们能否解决这些问题。相比之下,可以看看 Douglas Engelbart 同期的 NLS,这是为他的实验室开发的合作工具。该设计的每个关键元素在今天的工具中都已成为现实。
当然,我确实希望我的设计具有普适性。这不仅出于实用性考虑,更是一种精神追求:当我恰当地设计出一个系统时,就仿佛揭示了现实的隐秘脉络,触及了某种个人信仰中的神性。在大多数时候,相比于设计的实用影响,我更加重视这一点。我想要打造的系统的确需要进行抽象和泛化。真正具有变革性的系统通常确实依赖于强大的新原语。但我的经验越来越多地表明,这些系统化解决方案的最佳创新动力往往源于那些专注于具体细节的过程,至少在相当长的一段时间内是这样。
具体性的感觉
还有一点,具体性通常在日常中更能唤起情感共鸣,这让工作变得更加轻松有趣。
在一个小时的访谈或观察中,我能与一个人建立起一定的情感联系。他们比电子邮件交流或电子表格中的数据行更加鲜活。但当这些会议结束后,我通常会继续前进,受到了一点影响,但并未发生根本性的改变。相比之下,如果我在多次会议中与某位学生一起工作数小时,我会逐渐产生强烈的愿望,希望帮助这位具体的学生在对他们真正重要的事情上取得进展。我发现自己在工作时自然而然地会一次又一次地想到他们。当一切进展顺利时,我会为他们感到由衷的喜悦。当他们遇到挑战时,我非常希望能够解决这些问题。(我能够理解成为一名教师的魅力所在!)
这一切都使我的动机从广阔、永恒的理论领域转变到敏锐、专注的人际互动上。这不仅有助于我的理解,如我所述,而且在创造力上也极具激励作用,更加及时地激发我的动力。
在我的职业生涯中,我一直与我的工作感受中的一个矛盾作斗争。当我在日常中发现自己的工作相当让人满意时,我发现从长远的角度来回顾它们却常常感到空洞和不满。比如,在我在苹果公司工作期间,那里充满了活力;我被众多聪明人所环绕;我感觉自己非常能干,清楚地知道接下来要做什么;每天都能轻松看到自己的进步。这一切感觉都很棒。但在每年年底回顾工作时,我却深感不满:我没有做出真正属于我自己的创造性贡献。如果别人完成了我所做的项目,结果可能会有所不同,但这种差异并不关键。我的工作并没有反映出对我很重要的思想或价值观。我感到自己在创造力和智力上变得麻木。
相比之下,当我投身于我认为长期来看富有成就感和意义的工作时,日常体验通常是挫败和不快。这份工作令人满意,因为它深刻、个性化且独一无二。不过,在我的项目中,这些特点也意味着进展通常反复无常且难以识别;下一步该做什么往往并不明确;几乎没有人可以求助;我常常感到无能为力。
当然,这些特质不必然导致痛苦,而且我也在逐渐学会更巧妙地应对它们。但我还注意到,当我把工作重点放在具体的人和具体的场景上时,这种直接的情感联系有时能够超越因迷失而带来的日常挫败感。在今年的几个较长时期里,我发现这项工作不仅在当下令人满意,长期回顾起来也同样让人富有成就感。即使专注于具体的事物并没有以我所描述的其他方式助力创意过程,这种情感效应本身也非常值得追求。
迷你甜点
进展常常看起来不像进展
在我的工作中,我常常感到自己没有取得任何进展。我会感到极度的挫败。然后,突然间,一个重大的洞见驱动了数月的工作。这种情况最近一次发生在秋季。现在回顾那些日志,我发现自己在那个洞见出现之前的几周里不断接近它,这让我感到有趣。我不断地从不同的角度逼近它,越来越近,但总是差那么一点——所以当时我觉得自己一无所获。但最终,当我想到那个点子时,它就像晴天霹雳般出现。
当那个洞见降临时,我没有意识到它与之前几页中我所铺垫的轨迹之间的联系。我的体验是一直没有取得任何进展,然后突然之间有了一些。事后看来,我能看到那几周我其实取得了很多进展;只是当时我没有察觉。我怀疑这种情况在我的工作中非常普遍。因此,「我感觉自己没有取得进展」可能不是用来指导我工作的一个好的判断标准。或者,教训可能是我需要对这种工作中许多更微妙的进展方式变得更敏感。
沉静是可以锻炼的
我曾提过,我工作中面临的一个最大挑战是:「如何在面对复杂且结构不清晰的创造性问题时,培养出深入且稳定的专注?」现在我手头有几年关于自我报告的专注度和精力水平的数据,看到这些随着不断实践而逐渐变得更容易,这让我感到欣慰。
我通常在一个长时间段内不受打扰地工作;在 2022 年,这通常是从上午 7:30 至下午 1:30,而且在快结束时我会逐渐感到焦躁。到了 2023 年底,我通常要到下午 2:30 才开始感到焦躁。在 2023 年,我处于「高度专注」状态的时间慢慢地增加了 38%,同时我的总工作时间也增加了 12%。
这其中有一部分是靠我在日常实践中进行的许多小调整积累起来的,但我认为更重要的是,我正在慢慢地——仍在继续地——变得越来越沉着应对在沉静与困惑之中止步所带来的不适。
即使没有领域专业知识,也有帮助
今年,我特别感谢那些愿意和我深入讨论各自在创造生活中遇到的挑战的朋友,他们为我提供了巨大的帮助。令我意外的是,这些朋友是否是我领域中的专家,或者他们是否对我的项目有深入了解,通常并不那么重要。我原本不该感到意外。在 2021 年末,当我寻找一位教练时,我原本希望找到一位有研究和发明经验的人。我曾设想我们会长时间地探讨我的项目及其问题。然而两年后,尽管我的教练对我正在研究的内容只有模糊的认识,他却给予了我极大的帮助。
事实证明,我的教练并不需要深入了解我的工作,这与那些给我提供帮助的朋友出于相同的原因。大部分时间,无论我是否意识到,我最需要进行的关于我的创造性工作的对话,其实是关于我与工作以及工作过程之间的情感关系。我可以从那些敏感、有创造力并且真正关心我的人那里得到这种帮助。他们不需要作为领域专家深入了解我的工作。当然,领域专家的帮助通常非常有价值。但我曾低估了来自我领域之外的高创造性人士的帮助,这其实对我是不利的。
合作的新模式
我的合作经历通常分为两种模式:1)每个人都在全职共同推动项目的创意发展;2)有人负责创意引导,而另一人主要负责「执行任务」——完成定义清晰的计件工作。今年,我经历了两种不同模式下的愉快合作。
自去年二月起,我每周都会花一个下午与去年的研究奖学金获得者 Matthew Siu 一起工作。我们的项目并非我们初次见面时考虑的内容;它也不是我任何项目的核心关键部分;相反,它是我们经过多小时对话后发现的一个富有潜力的领域。Matthew 是这个项目的主要推动者,而我在我们每周的会议中主要负责提供建议、绘制草图和综合信息。(关于这个项目的更多信息很快会公开!事实证明,六个月的奖学金期限实在是太不切实际了……)
同时,我和 Derrek Chow 开展了一种不同风格的合作。在多次长时间的散步中,我逐渐了解了他,钦佩他在人机交互问题上展现出的艺术家气质。Derrek 当时正在寻找一些能激发他创作灵感的原始素材,并寻找一个合作的机会,于是他询问我是否有一些项目创意,他可以参与其中。
我建议的一个想法最终演变成了 BookBridge 项目,我们开始每周会面讨论连续不断的原型设计。像我和 Matthew 的合作一样,Derrek 在我们会议之间为这个项目投入了更多时间。但这次合作的性质不同,因为它需要我更多地进行「引导」:这是我基于自己作为读者的经验提出的一个建议,而不是 Derrek 亲身感受到的需求,因此我的角色涉及到更积极地引导迭代过程,并将各部分综合成一个完整的整体。
对我而言,这两次合作异常激动人心,因为它们让我感觉到了自己在创新上的成长和扩展:仅仅通过每周几小时的投入(偶尔还会有更多的时间投入),我就能深入探索原本不会触及的新颖想法。在与 Matthew 的合作中,我们探讨了一个我一个人可能永远不会想到的问题;而与 Derrek 的合作,让我有机会深入研究一个我一直想探索但苦于没有时间的问题。与 Matthew 合作中,我特别有成就感的一点是,我投入了时间和精力帮助他成长为一名优秀的研究者和设计师。如果我能持续这样做,那将对我的「领域」颇有助益。同时,在与 Derrek 的合作中,我从我们技能和思维方式的差异中获益良多:他的能力和思考方式与我大相径庭,这种差异性不仅新颖有趣,而且极具价值。未来,我希望能够开展更多类似的合作,探索更多类型的合作伙伴!
众筹基本上稳步进行
2023 年是我开始众筹研究的第四年。令人欣慰的是,与去年相比,我的赞助者数量增加了 18%。然而,我的收入却下降了 5%。这种变化是因为高额赞助者的人数下降了,转移到了低额赞助上。我认为这是可以接受的,因为它减轻了不可避免的流失带来的影响。
基本的趋势与过去几年保持一致:流失率和转化率相似。目前最有效的策略仍然是吸引更多人进入「漏斗顶部」(译注:指市场营销中的一个阶段,即吸引潜在客户的阶段,通常包括广告、内容营销、社交媒体等活动),但我并不想在这方面投入太多精力。今年我在 Twitter 上更加积极地推广我的众筹活动和 Patreon 页面,这确实有所帮助,但吸引新的受众群体对增长的推动作用更大:我在 Dwarkesh 的播客节目中的出场为我赢得了今年大部分的新订阅者。总体而言,我的收入水平仍然处于博士后和初级教师之间。虽然不算太理想,但暂时还可以接受。如果我想支持更多的合作项目,我需要寻求更多的外部资金。
2019 年初,我为自己设定了一些五年目标,但此后基本上对它们不闻不问,直到几周前我重新拾起这些目标进行回顾。回头看看,我对于资金的期望和担忧竟如此强烈,让我感到惊讶。但这也并不奇怪,毕竟我在可汗学院的筹款经历还历历在目。我最大的愿望是能有一个稳定的资金来源,让我能自由追寻我最感兴趣的创意项目。我最担心的是,筹款工作会分散我的注意力,或者让我受到资助者利益的影响而扭曲我的工作。有点讽刺的是,我在 2021 年就实现了这些目标,却没意识到我已经比自己设定的雄心勃勃的五年计划提前了好几年。
每天醒来,按照自己的创意罗盘自由飞翔,这是一种难以置信的特权。实现这一切的,是一小群支持我的人:所有现在和过去的赞助者加起来,足以坐满一家典型的百老汇剧院。每当我需要感激之情时,我就会想起这个激动人心的画面。因此,谢谢你,谢谢所有那些使我这种与众不同的生活成为可能的人。
寻找更好的问题
原文:In search of better questions | Patreon 上的 Andy Matuschak
我有一连串极具攻击性的问题可描述我的工作:书籍之后的媒介是什么?是屏幕上的书页图像吗?是讲座视频吗?为什么所有答案都这么无聊?关于学习、感知、行动的重要想法又在哪里?
我一直在探索记忆系统如何回答这个问题。但我认为,为了记忆系统上实现点有趣的东西,要超越现有的对记忆系统的理解。我的目标并不是「做个放大版 Anki」。而是为了理解学习、感觉、思考的方式而建立原型系统,并从中获得新见解——而后用这些见解创造新系统。
具体而言,我每天面对的最大挑战是问出足够好的问题——解答这些问题,能极大改变我们理解现状的方式。我写的这篇颇有些闷气的文章,就是为了在此总结我面对的挑战。我们会姗姗来迟一些无聊,糟糕的问题,并试图找到发现更多有趣问题的办法。
量子国度已经积累了几百万个数据点。看上去很不错!人们听到这个消息时往往相当兴奋,好像积累了大量数据就能产生全新理解一样。但从这些数据中提取意义,你需要好的问题。更为致命的是:如果你心中没有好问题,那么你甚至可能没有收集到正确的数据。
我已经对量子国度的数据进行了几十次分析,跨越了许多对照试验。如果我是初级学者的话,我可能已经用这些实验结果写出了几篇论文。我得多攒点发表/引用的次数!但我没有发表任何这些研究,因为我认为这些研究提出的问题还不够好。我得到的结果太狭隘了,太依赖于局部细节。
提出好问题是很难的,而部分困难在于大部分论文没有问出好问题。不加筛选地选取一部分论文,里面往往都是些无聊的问题,对于领域的进展毫无助益,读了这些论文,你的品味也会变得同样无趣。
容易提出的问题通常是渐进式的。这些问题接纳现有框架的参数,然后试图澄清一些扩展或变化。「一年级学生在学习科学概念时......是否表现出间隔效应?」这样的实验可以增加理解,但和发现该效应的最初实验不可等量齐观。
另一组显然的问题来源于「我们能用收集到的数据做什么?」,而不是「我们真正想知道什么,以及我们如何收集数据来了解它?」这种以数据为中心的痴迷,在硅谷中很常见,让人觉得厌烦:哇,你有这么多的数据!让我们来优化东西!让我们来优化事物吧!我们当然可以利用这些数据来产生一个更有效的复习算法?是的,当然,但效率低下并不是阻碍记忆系统的原因:它们相当高效,即使是使用愚蠢的算法也是如此!为什么算法优化问题是你想问的问题?在大多数情况下,我认为答案是「因为它很容易」。
分析量子国度的记忆数据
这里有一个关于量子国度的坏问题,你可以问:**它有用吗?**这个问题有几个关键问题。第一个问题是:「有用」是什么意思?第二是:像这样一个是/否的问题,所能提供的信息太少。第三是:尽管有阶段性,间隔重复得到了充分的支持,「是」应该被视为零假设。但了解这个问题失败的原因可以帮助我们写出更好的问题。
这里有一个更好的——但仍然是坏的——问题,你可以问关于量子国度的问题:参与的读者中有多少人最终可靠地记住了所有的材料?我从方法上对这个问题做出无聊的抱怨:与什么相比?「参与的读者」是什么意思?「最终」是什么意思?幸存者效应如何?但是缺乏严谨性并不是这个问题的真正问题。真正的问题是:一个答案甚至意味着什么?如果答案是 80%,你的理解与答案是 70% 的世界有什么不同?这个问题的答案能让我们对量子国度有什么了解,更不用说对人们的学习/感觉/行为有什么了解?
让我们再试一次:在不同的时间段,如果读者不做复习环节,与那些做了复习的人相比,他们会记得多少量子国度的材料?这个问题似乎有些糟糕,因为它不那么精确。是的,你需要确定几个要素才能得到一个真正的答案。但抛开严谨性不谈,这是一个更好的问题,因为它开始进入了学习的动力。这是我们的第一个例子问题,它可能会教给我们一些普遍性的东西。
重要的是要记住,毕竟(我就在这里提醒自己!):这才是重点——学习一些可推广的东西。我们正在努力学习一些可能有助于我们建立下一个系统,下一个类别的系统。重点不是(就像科技界通常的做法一样)产生实验数据,以显示「我们的产品有效!」在一些营销页面上。去他妈的。重点是洞察力和其下游的后果。
因此,让我们在可泛化性上多下功夫。这里有一个更不精确的问题,但我觉得它更有趣:一个特定的复习事件对一个人的记忆有什么影响?在这个问题出现的前一刻,他们的头脑处于一种状态。然后他们回答了这个问题,他们的头脑就处于另一种状态,并有持续数周或数月的持久变化。**发生了什么?**我们能描述这种变化吗?这种变化取决于什么参数?它的静止性是什么?从本质上讲,我们能不能建立一个函数,描述提取对记忆的动态影响?
去年夏天,我对这个问题产生了兴趣,并且意识到数百万个数据点实际上不能帮助我回答这个问题,因为它们缺乏沿必要轴线的变化。我不得不人为地引入可控的变化(例如调度的随机变化),并等待新数据的积累。这是一个痛苦但宝贵的教训。
这类问题的另一个问题是,它可能意味着构建一个模型。有关间隔重复的文献中充满了各种模型,例如预测各种间隔后的回忆概率。我对这些模型持非常怀疑的态度。它们可能具有一定的预测性,但我不认为它们具有很强的解释力。我们应该如何理解「回忆概率」实际上的含义?当我在某一时刻有 60% 的机会记住一个答案时,实际上发生了什么,使我的想法与另一个我有 70% 的机会记住的答案不同?这不是我大脑中的骰子的问题。已经有各种尝试将经验性的概率模型与记忆的理论框架结合起来,但这种模型充满了「让我们通过假设指数拟合和做逻辑回归来估计一个概率......」预测性多于解释性。我不相信它。
量子国度有一个不寻常的机会,可以用较少的建模技巧来探索记忆的动态性。例如,像 SuperMemo 这样的系统所面临的挑战是,每个用户都写自己的问题。因此,对于一个特定的人回答一个特定的问题,例如第三次,只有一个样本。在那一刻,要么是「记住了」,要么是「没记住」。或者,好吧,一个 1 - 5 的「评分」。你不会得到一个很好的连续值,如果不做某种曲线拟合估计,就没有办法谈论当时回答该问题的「回忆概率」。是 80%?85 %?你的估计结果有多好?那么,你必须使用另一个模型来评估,根据估计值对后续数据点的解释程度。这就是我们所说的「在上面擦一些线性代数」的理解方法。不要误会我的意思:你可以在没有解释理解的情况下产生有用的系统!但是,识别这样的系统是有帮助的。但是把这种地方作为潜在的机会来识别是很有帮助的。
在量子国度,每个人都会回答同样的问题,所以我们有很多的样本来应对各种情况。我们不需要估计「提取概率」:我们可以看一下群体的比例如何在不同的桶之间转移。例如,在最初阅读文章时记住这个问题五天后复习的 5 万人中,有多少人记住了这个答案?与那些在最初阅读几周后被要求复习同一问题的人的比例相比,情况如何?这里不需要模型。或者你可以把它看成是在一定概率上对隐藏的「提取强度」变量的频率进行估计,我想。不管怎么样,我认为这对于理解这个问题是很好的基础条件。
当有人难以记住一张卡片时,我们应该怎么做?是的,我们可以改变复习安排,但还有什么?我对重试机制进行了对照试验,它似乎有帮助,特别是在学习过程的早期。但这是一个相当难操作的工具。重读?将被遗忘的主题分解成更详细的成分?提供替代的例子?补充解释?或者,也许你可以什么都不做,如果有足够多的其他相邻卡片,这些卡片最终会帮助记忆本来难以记忆的卡片。对我来说,这些干预问题比复习安排的优化问题要有趣得多。
对记忆研究感到厌烦
为了便于讨论,我们来尝试一种不同的方法,进一步远离经过充分研究的 SRS (间隔重复系统)范式。想象一下,你不能问:「用户记得某个答案吗?」。关于阅读信息性文本,一般来说我们可以问出什么样的问题?关于助记媒介呢?
这是一个很好的视角,因为它提醒我们,迈克尔和我并没有把这个媒介设想成一个更容易使用的 Anki。只是,我们很容易问人们是否能记住媒介所提出的问题的答案。所以,我们很容易不小心把注意力集中在这里,尽管其他因素可能更重要。但这是一种懒惰,而且不太可能产生变革性的洞察力。
我们可以说:看,间隔效应和测试效应已经被研究得够多了。它们能可靠地产生稳定的记忆编码。如果你能更好地理解它们,你也许可以让它们更有效地工作。但是它们确实已经很有效了。就死记硬背的问题而言,也许这些问题已经解决地很充分了。
但死记硬背并不是那么有趣。记忆是学习的代理,而学习是有意义的启用的代理。那么,我们能对学习说些什么呢?在什么情况下,可靠的记忆能在多大程度上转移到学科的开放式任务中?也就是说:如果你学过量子国度,你能向别人解释量子计算的课题吗?你能解决以前没见过的(简单)问题吗?你能为一个目的创造电路吗?你能发现与你对经典计算机的理解有未提及的联系吗?更具体一点:作者的暗示是什么?卡片的哪些特征似乎能促进这种类型的迁移学习,以及通过哪些机制?
我们对量子国度的一个核心假设(有待测试!)是,助记媒介可能对下游的课题有重大影响。也就是说,如果你通过助记文本学习第一章,你在学习第二章时会更快吗?更准确吗?更深入吗?你能学习以前实际上无法学习的课题吗?这里有什么关键的相互作用?据推测,有些卡片比其他卡片更重要——这有什么特点?据推测,在练习量和对下游课题的影响之间存在着一种非线性关系——它是什么,它在哪些方面是可塑的?这种影响的上限是什么?为了描绘一幅生动的具体画面:我们能可靠地使一个典型的青少年学习研究生水平的材料吗?
创造力如何?创意从何而来?在《看见别人没有看见的东西》中,Gary Klein 提出,产生洞察力的关键模式包括注意到联系和矛盾(以及其他一些因素,在此不太相关)。注意到联系和矛盾的倾向似乎非常依赖于一个人的记忆中的内容那么:记忆系统可以使我们更有洞察力吗?据推测,某些类型的卡片比其他类型的卡片更有帮助——这有什么特点?特殊的以综合为导向的卡片是否有帮助,或者影响更多的是对基础知识的扎实理解的功能?如果我们设计一个新的「记忆系统」,其唯一目的是对创造性工作产生下游影响,它将是什么样子?它是否会涉及提取练习?
去他妈的「学习」:那么**行动呢?**什么样的学习会导致世界上的下游行动,而不仅仅是为了学习而学习?我们如何设计环境来支持产生这种行动的因素?如何促进与朋友的精彩对话?
那么行为改变呢?启明卡真的有用吗?我们怎样才能写出好卡片,其效果有多广泛?作者提供这种卡片是否有价值,还是必须由读者来创作?也许有一些快乐的媒介?我曾建议,对于像元理性这样的主题,与材料的长时间接触可能会变成媒介的主要价值。我们怎么知道这是否是真的?如果「扩展接触」真的是首要目标,我们应该围绕什么样的基本「名词」和「动词」来建立一个交流系统?
在《量子国度》的用户访谈中,有个令人惊讶的主题——复习环节对读者的身份产生了影响。在几个月的时间里,每隔几天参与有关量子计算的问题,使读者开始认为自己是「一个研究量子计算的人」,这比他们在几个月前的一个下午简单地阅读一篇说明文要直观得多。我完全不明白这一点!我不明白如何知道它是否正在发生,或者发生了什么,或者它的影响是什么——更不用说如何以任何更普遍的方式来描述与文本或媒介的细节的互动。尽管我完全无法围绕这个主题问出任何好的问题,却觉得它是产生好问题的沃土。
本节中的大多数问题都没有表述得足够清晰,无法进行实际的详细探讨。将这些问题细化到可操作的程度,需要大量的洞察力——如果不对这些问题的劣质版本进行探究,可能就无法获得这种洞察力。但是,对我来说,提出这些越来越离奇的问题是一种练习,即积极拒绝那些弥漫在记忆系统和相邻的「学习」技术的文献中的令人目眩的无聊问题。
————————
所有这些关于问题的喋喋不休并不只是空想。我有几个即将启动的项目,我的问题对它们来说是相当不够的!
我现在正与一位经济学教授合作,在一个班级里,我们围绕类似助记媒介的互动进行随机对照试验。我们已经有了核心的机制,所以现在的问题是:我们到底应该在课堂上测量什么?我的意思是,是的,当然,我们会记录他们的课堂考试成绩和多次复习尝试。但是,如果只是简单地发现「使用 SRS 的人在课堂上得到了更好的成绩」,那就相当无趣了。这就是目前的无效假设。我们的目标是要产生洞察力。那么,我们应该在访谈中得到什么?以及在开放式的项目中?我不担心预先登记我的假设或类似的东西。我们所做的一切都是探索性的,旨在改进我们所问的问题。但我确实想确保我们记录的是我们需要记录的内容,以回答广泛的问题。
同样,我对 David Chapman 的新的元理性文章感到兴奋,它结合了 Orbit 的卡片来加强其观点。它与《量子国度》和《如何写出好卡片》都很不一样:它在某种程度上是一篇议论文,尽管它也是一篇说明文,引入了比卡片写作指南中的工具更抽象的工具。到目前为止的反馈很有意思。它有些地方不合适。但是,我认为它也不是不有效。我在这里的问题仍然相当薄弱。目前我还没有深入研究我们拥有的数据,但我将在下周进行研究。
为自我解释提供支持的初步实验
2019 年,我曾论证过「书本不起作用」,理由是人们似乎会遗忘他们所阅读的绝大部分内容。难怪大家觉得学习复杂的知识非常困难。但在过去几个月里,我开始认为,在很多情况下,我们以为的「遗忘」,实际上往往是「一开始就没有真正理解」。当人们发现自己无法利用所学知识时,他们通常无法分辨是真的忘记了,还是根本就没理解过。如果真是这样,而我想要帮助人们更有效地学习复杂的知识,我就需要从遗忘的上游着手。这并不是说要忽视记忆——事实上,我们稍后还会讨论到,理解在很大程度上依赖记忆——但这意味着我们需要在更宏观的层面上去考虑记忆。
所以,「理解」究竟是什么?当我们与(比如说)一篇文章进行交互时,理解在机制上是如何发生的?如果有人没能理解,那么到底是什么环节没有做好?又有哪些因素会影响这些过程呢?知道这些因素后,我们应该如何干预?在这封信里,我会对这些问题的认识做一个简单的分享。
我们是如何理解文字解释的呢?
「理解」究竟是什么呢?学习科学家从现实中的宏观行为开始讨论:「理解就是能够明智且有效地在上下文中使用——迁移——我们所学到的知识,在现实任务和环境中,能够有效地运用知识和技能。」[1] 他们由此向细微处钻研,探究哪些学习活动更可能产生这种宏观的能力。同时,认知心理学家则从大脑的底层机制——感知,注意力,处理,记忆——开始探索,试图理解更宏观且更为复杂的现象。对于他们来说,「理解」并不是单一的概念,而指代了许多协作的过程,是一个不准确的术语。
对于像我一样的设计师来说,问题在于这两个学科的发现还没有交汇。对「理解」的深入理解,有助于我们开发新的方式来增进理解。没有这种理解,我们只能分别从两边尽可能探索,像钟乳石和石笋一样;对于中间的空白,我们要用想象力、直觉和猜测来弥补。
首先,我们要确定一下所探讨的理解是哪种类型。让我们专注于理解一篇文字解释。比如说你在读关于人体循环系统的解释。最后,你可能想「理解循环系统」,但此刻我们只把目标定为「理解关于循环系统的一篇解释」。这个门槛虽然较低,但在很多情况下,似乎就是制约我们的瓶颈。
具体来说,你得搞清楚作者句子的意思;你得能解释文本中描述和暗示的特性和关系;你得能基于这些细节和已有的相关知识,做出简单的推理。至于熟练度或长期记忆,我们暂时不考虑。让我们假设你刚读完这篇解释,而且回答得慢点也没关系。
认知心理学家把这种理解称为「文本理解」。Walter Kintsch 提出了广受研究的构建-整合模型,该模型将这个过程分为两部分[2]。首先,你需要对页面上的文本构建内在表征:阅读单词,解析句法,理解名词的指代和动词的歧义等等。Kintsch 把这种心理表征称为文本基础。如果我们暂时不考虑遗忘,有了完整的文本基础,只需要字面上操纵作者解释的问题就可以回答了。如果你有一个关于「Bargleborp 如果不加控制会引发 hixitak」的解释的文本基础,那你就能回答「没人注意到 Bob 的 bargleborp ,直到为时已晚。会发生什么?」(「Hixitak。」)你知道这些词语是怎么说的,但对他们真正想表达的意思,你还是一知半解。
然后,你需要通过整合来理解含义,形成文章里没有直接描述的联系。你会把文章里的词语和观点,和你自己已经知道的东西联系起来,同时你会推断出作者意有所指但没有成文的细节。Kintsch 将将这种完整而联系丰富的心理表征称为情境模型。
比如,在一篇关于循环系统的解释中,假设你读到这么一段文字:「如果婴儿存在心房间隔缺损,血液无法通过肺部充分排出二氧化碳。因此,血液看起来呈紫色。」[3] 你光有这些句子的文本基础,是不足以理解这个解释的。血液为何呈现紫色?要回答这个问题,你需要将这一问题关联到你对血液流动的已有知识,来赋予它们意义,就像下图展示的那样:
我们可以使用这个模型,为有关文本理解和学习的常见直觉,增添一点机械论的色彩:
更好的整合能够产生更好的记忆。文本基础和情境模型中的信息,都将储存在我们的长期记忆中。然而,回忆和记忆巩固在于关联。如果新的文本信息只能通过单一线索连接到你已有的知识,那你可能会很难回忆起来,而且在之后的认知过程中,这些信息也不太可能得到强化。根据 Kintsch 的研究,为了长久掌握知识,要将新的文本信息和你原有的知识钩连起来,形成更丰富的情境模型。钩连越多,记忆效果越好。学习文本越深入,或者既有知识越丰富,构建的联系也就更多。这也验证了我们的直觉,即在我们已经精通的领域,更容易记住新的信息。
更好的记忆能带来更好的整合。如同我们之前所见,文本基础中信息点之间的联系和推理,往往需要「通过」你已有知识节点间的路径。这暗示着记忆强化在机制中的角色:你无法通过你已经忘记的节点。如果第二章的内容依赖于第一章不太熟悉的信息,我们就需要确保在你需要理解第二章的内容之前,你能够记住第一章的信息。
「用你自己的话说出来。」这是给学生的常见建议。然而,我惊讶地发现,根据 Kintsch 的模型,在学习过程中,如果你不用自己的话来阐述文本(即使这可能在你的潜意识里进行),你基本学不到任何东西。想要形成一个整合良好的情境模型,你得把作者用词所指的概念,跟你已有知识中的概念关联起来。也就是说,你在此过程中处理的是概念,而不是语词。比如,一个作者说的「通过肺部排出二氧化碳」,另一个作者说的「呼出二氧化碳」,你通常需要把这两个短语解读为同一概念。否则你就无法把这两篇文本所形成的情境模型联系起来。
注意力影响理解程度。有一种显然的失败经历大家都很熟悉:有时候,某句话你看得太快了,甚至都没来得及解读它里面的词。或者,你读了句子里的词,但注意力太分散,无法解析其中复杂的句子结构。在这些情况下,你根本无法对文本形成文本理解。你可能只是处理了文本的「表面特征」,例如注意到这部分文字中出现了某个关键词,但你无法利用这些信息,即使是直接照搬都不行。文本的选取会影响这里的行为:在 Kintsch 的一个实验中,如果文本太啰嗦或太熟悉,参与者们会依赖他们已有的情境模型,并形成有损的文本基础表征。
整合程度控制知识迁移。如果你发现你能复述作者的话,但在用你自己的话阐述这些观点,或实践这些观点时,却颇感吃力,那么这说明你的情境模型过于依赖于你的文本基础。也就是说,构成你的心理表征的,主要是与作者的词汇和短语对应的节点。所以,当接收到与文本形状不完全一样的线索时,你无法将它们和你已经学到的东西联系起来。你需要多与文本打交道,把它与你已知的知识联系起来,提出问题,进行推理。
自我解释有助深化理解
Kintsch 的试验几乎没有涉及注意力、自我调控和反思等因素。他的研究通常会设定一个理想情况——学习者根据自身的既有知识,尽可能从文本中建立最优秀的模型,然后去探究这些模型的性质。但在实际中,我认为理解的问题往往源自读者没有根据自己已有的知识,构建出最好的理解模型。这种情况往往是合理的:仔细阅读需要时间和精力,而大部分书籍并不值得花费无尽的时间。理想的读者会根据自身的目标,构建出够用的理解程度。那么,我的「增强」工作,就是去拓宽这个帕累托最优边界。但实际上,正如我们在上月的文章中所讨论的,读者们往往未能如预期般理解文本。他们未能察觉到对概念及其解释理解中的重大漏洞。
那么,我们应该如何应对呢?我们希望能辅助读者,比如帮他们建立联系、监控自我理解、修正理解中的缺漏或误区等等。最被广泛研究的干预方式就是自我解释。[Michelene Chi 和她的同事](http://andymatuschak.org/files/papers/Chi et al - 1994 - Eliciting self-explanations improves understanding.pdf)要求一组学生在阅读时大声解释文本,控制组则要重读文章,以保持总学习时间一致。结果显示,解释组在后续测试中的表现优于控制组,尤其在需要进行陌生推理而更具挑战的迁移问题中。
在解释组中,有些人天生就比别人更能说会道。有趣的是,这些「高解释水平者」通常会学到更多东西,即使我们控制了初始的知识水平和口头表达能力差异。在开卷考试中,「高解释水平者」几乎从不参考材料,而「低解释水平者」(以及控制组)则经常参考材料,这暗示着「高解释水平者」更能把学到的东西内化。值得注意的是,这些组别的自我解释方式也不一样。「高解释水平者」的解释,更有可能在材料涉及的不同主题之间建立联系,而不只是局限于某个主题。他们在解释中会做出更多推理,这可能解释为什么他们在后续测试中能更好解释材料中隐含的细节。
Chi 和她的团队提出,由于「低解释水平者」和「高解释水平者」在预先测试中得分相同,他们之间的差异可能源于自我解释的技巧和习惯。例如,「高解释水平者」可能已经习惯于在主题间建立联系,他们也更倾向于相信多解释一些总是好的。这种看法催生了一系列关于如何[教学生有效进行自我解释](http://andymatuschak.org/files/papers/Wylie, Chi - 2014 - The Self-Explanation Principle in Multimedia Learning.pdf)的研究。
教授这类学习策略后,人们或许更可能理解概念解释。就我个人而言,随着阅读技巧的丰富,我成为了更高效的学习者。然而,我觉得这还不够。大约十年前,我就阅读了这些关于自我解释的论文。但我并没有切实去实施——有时候是因为感觉这像个苦力活,有时候只是因为我想都没想到。我总是很容易陷入「仅仅阅读」的模式,自我安慰说我已经理解得很好了。但往往,我并没有真正搞懂!
一些原型
我对此的理解是,文本解释这种媒介并没有真正鼓励我需要的那种方式。文本解释的默认行为就是不断阅读。文本不会帮助我检查理解程度,或完成恰当的推理;我需要时刻留意自己,何时开始感到困惑。即使我花更多的时间去深入理解一些事物,文本也不会有所反馈。反观对话就不同了。在谈话中,对话的伙伴会留意我是否感到困惑。他们会提出一些关于他们的解释的问题,并解答我们的问题。如果我努力理解,他们会给我鼓励。
过去这一年,我展示过很多文本+链接记忆系统的结合媒介,现在我发现它们更接近于我所期望的行为方式。我常常用一个基本的系统阅读,这个系统里可以高亮任何文字,并为其添加相关的记忆卡片。这些卡片会悬浮在相应文字旁边,相应的文字部分则会加深颜色,表明有卡片存在。这种空间标记使我一目了然,知道我在哪些地方投入了大量精力,哪些地方还没看。而有趣的是,这些颜色看起来非常舒心!把侧边栏「塞满」,或者把所有「精华」部分「涂满」颜色,我会有种莫名的满足感。当然,这有可能会带来误导,高亮文字似乎是很有帮助的,但不应该把整篇文章都涂满高亮。然而,我仍想强调与传统文字的区别:这种媒介自然而然地让我注意到哪些地方我「深入」了解,鼓励我更进一步。相比阅读普通的书本,这种媒介的「默认路径」是更深入的。
写记忆卡片比撰写自我解释难得多。这种额外的困难可能让理解更深刻,但我感觉很多困难其实是无用功,因为写卡片实际上是将解释改写为产生目标提取的任务,而这个过程有很多特殊的要求。因此,我从文本+有链接记忆系统媒介中获得启发,构建了一个阅读体验原型,其中以类似的方式在「被动地奖励」自我解释。阅读时,我可以高亮重要的段落,并用自己的话解释这些文字,而且可以在适当的时候添加颜色和练习。如果我愿意,我甚至可以用口头解释并使用语音输入。这些段落的文字会被着色,让我清楚哪些部分我已经解释过了。另外,我把解释发送给 GPT-4,并且在我出错或者忽略重要的东西时,系统会显示反馈。
我录了个不到一分钟的小短片,展示了我在一份线性代数教材中编写「成功」和「错误」的自我解释。(抱歉,Patreon 不支持内嵌视频。)
在这个主题上迭代了几轮后,我做出的原型还挺有意思,不过我并不打算就此深入下去。好的一面是,如果我用这个工具看书,感觉自己对材料的理解很不错。但这个过程也相当不爽。很多时候,把作者的观点打成字(或者念出来),感觉就是无聊的繁琐活,不管它有没有助于我理解。有趣的是,我并不总是这么想:当我对作者的观点一头雾水时,这个练习自然就变得有趣了。
写记忆卡片也许困难得多,但跟书面/口头的自我解释相比,我觉得这个活动更有价值。我想那是因为记忆卡片并不是阅完既弃的边角料。我写它们不是为了写而写,而是为了将其假如记忆练习。当我读完书后,这些卡片还会跟着我,而我能确信我能长久记住这些卡片中的细节。
所以,我尝试了另一种方式,将自我解释重构为做笔记。如果我在阅读过程中写下的所有自我解释,都会被一个 Markdown 文件所收集,存入我的笔记系统呢?那么,我并不是为了写而写,我还能将它们收入笔记,随时查阅。但是,遗憾的是,我的实验结果并不如人意。我最终得到的笔记文件,只是用我自己的话对原文了总结,不成体系而又冗长难读。但它并不是当我想对原文做些有用的笔记时,会写的那种总结。我并不会想去编写这种笔记。
然而,我觉得我讨论过的两种办法是有价值的。首先,阅读媒介应该能够自然地向你「提示」专家策略。其次,完成那些「额外」的阅读活动后,其结果应该能让你由衷感觉有价值,而非似乎有用的繁琐工作。
这与我对自己在这个领域所处的生态位的思考有关:我非常在意阅读的感觉如何。教育心理学文献充斥着各种干预措施和阅读增强系统,但这些东西对于读者来说体验都很糟糕,而研究人员似乎对此毫不关心。我希望的是,如果我能深入了解这些系统背后的原则,我就可以重新组织这些原则,得到令人愉快且增强人们能力的系统。
————————
[1] [Grant Wiggins and Jay McTighe, Understanding by Design (2005)](http://andymatuschak.org/files/papers/Wiggins, McTighe - 2005 - Understanding by design.pdf), page 7.
[2] 见 [Kintsch’s monograph, Comprehension: A Paradigm for Cognition (1998)](http://andymatuschak.org/files/papers/Kintsch - 1998 - Comprehension.pdf). 我在这可能有些过于简化:构建不仅限于文本基础,整合也不仅限于情境模型;要形成连贯的文本基础,整合也是需要的(例如,厘清含糊的理解)。但对我们的目标来说,这样简化就足够了。
[3] 这个例子取自 [Kintsch, W. (1994). Text comprehension, memory, and learning. American Psychologist, 49(4), 294–303](http://andymatuschak.org/files/papers/Kintsch - 1994 - Text comprehension, memory, and learning.pdf). 遗憾的是,我认为这个例子可能对血液流动有些误解:据我理解,流向肺部的血液应该是深红色的,而非紫色,这是因为这些血液氧气含量较低,而不是因为其中含有二氧化碳。但这个图很不错,所以我们用来讨论。
来自高亮引导原型的初步结果
原文:Initial results from highlight-driven prototype | Patreon
我一直在研究一种以高亮为核心交互的新型阅读增强环境。这个想法旨在为读者提供一根具备两种非凡「力量」的魔杖:
-
你可以用魔杖指向任何内容,并说:「确保我知道这个。」
-
你可以对某个小节挥动魔杖,询问:「我错过了什么重要的东西?」
当然,这些都是理想化的设定。我目前的设计将这些力量具体实现为:
-
你拥有一支特殊的紫色高亮笔。当你用它标记文本时,关于这些想法的间隔重复卡片将被添加到未来的复习环节中。
-
在每个小节的结尾,你可以按一个按钮,显示「建议高亮」,并再次浏览前文。这个按钮会将作者认为重要的所有细节中那些语义上与你高亮的内容没有交集的细节标记出来。你可以快速浏览,检查自己的阅读理解中是否存在缺口。
可以想象出更多复杂的实现方式!这些只是为了实现更高远的目标而迈出的有意义的第一步。欲了解更多背景信息,请参阅我关于这一概念的介绍信。
初步原型
本月,我测试了这个概念的原型,对 Jim Hefferon 的线性代数入门教程进行了改编。你可以在这个新的演示视频(6 分 17 秒)中看到原型的实际运行情况。我邀请了 14 位有学习线性代数的实际需求、且有使用间隔重复记忆系统经验的人参加学习会议。我们面对面、一对一进行交流,这样更有助于我深入了解新原型。
在进行简短的背景调查和界面介绍之后,参与者阅读了教材的第一节,用普通黄色高亮笔和特殊紫色高亮笔进行标记,想怎么用就怎么用。在本节结束时,我们利用「建议高亮」工具快速进行了第二轮浏览。我请读者对每一个额外的高亮发表意见:这是他们理解了但觉得不值得标记的内容,还是他们忽略了的内容?最后,我们复习了与紫色高亮部分相对应的所有间隔重复记忆卡片。我向读者询问了复习这些卡片的感受,以及他们是否认为自己的高亮得到了忠实呈现。
在深入探讨我观察到的情况之前,我应该解释一下,这个原型涉及一些重要的障眼法。读者们以为我实现了一些复杂的机器学习系统。但实际上,至少目前还没有。以下是它的工作原理:
-
在与任何读者会面前,我手动「精选」了与我们阅读的章节中所有重要细节相对应的高亮片段。
-
对于这些高亮,我为每一条都编写了一张或多张练习卡片。
-
然后,在每位参与者阅读的同时,我手动将他们的高亮内容映射到基于相同概念的精选高亮内容(如果有的话)。这有时需要灵活的判断!
-
「建议高亮」功能随后显示了所有未与读者高亮重合的精选高亮。
-
复习环节展示了与我将读者的高亮映射到的所有精选高亮相关的卡片。
这在文字描述中看起来相当复杂,但在实践中却创造了非常透明的体验。读者并没有察觉到手动操作的步骤;他们经常天真地询问,是否可以在我们的会议结束后继续在自己的阅读中使用这个工具。这种「人工」智能式的测试让我专注于交互设计概念,而不是在语言模型流水线中可能是无底洞的问题。目前来说,这是正确的权衡。
从读者那里学到的
对于用户研究,预筛选总是不完美的。对于我的 14 位参与者中的 3 位来说,这本书(作为本科生的第一门课程)读起来太难了。另外 2 位读者实际上并不想详细了解这个主题;他们只是想了解「大局」。在讨论我学到了什么时,我将重点关注属于我目标受众的 9 位读者。
将高亮内容映射到卡片似乎非常有前景
读者们普遍喜欢增强高亮交互这一概念。他们中的大多数都有高亮文本的习惯,尽管他们都承认,这并没有实际影响他们的学习效果。相反,读者将高亮描述为一种发泄行为、一种保持更高参与度的方式,以及一种临时的书签。一位读者最后没有使用特殊高亮笔;他自称具有过人的记忆力,认为自己不需要针对本节材料的练习支持。其余人则大量使用了高亮笔。
大多数读者对给他们提供的提取练习卡片非常满意。一位读者说:「它捕捉到了我的意图,以至于我花了一些时间才意识到它们不是我写的。」另一位说:「这些是我希望能真正拥有的高亮系统。……它不仅仅是原样把东西扔回给我。……对于我高亮的概念,它让我思考重要的逻辑关系。」大多数读者自发地询问他们是否可以在其他书籍中使用「魔法高亮笔」。
有趣的是,尽管我并没有为他们每一条高亮都准备相应的卡片,但读者们对我将高亮映射到卡片的看法仍然非常积极。大多数读者高亮了一些我认为不够重要的点。虽然没有人注意到这些遗漏,但我担心这种悄无声息的遗漏会随着时间的推移削弱对这个工具的信任。要完全解决这个问题,需要可靠的机器生成卡片;在没有这个功能的情况下,我们可以为读者提供一个备用工作流,让他们为这些「遗漏」的高亮编写自己的卡片。
正如我所愿,这种设计在很大程度上消除了我在过去的助记媒介原型中经常看到的两种失败模式。因为每张卡片(原则上)都对应着读者「说」他们想要了解的东西,所以读者在复习环节中不太可能感到令人不悦的权威或「学校式」的氛围。出于同样的原因——结合阅读理解的辅助机制——读者对问题或答案的困惑也减少了。当然,读者可能在没有真正理解的情况下高亮某些段落,但当这种情况发生时,读者并没有抱怨这些卡片像在之前的原型中那样显得武断或不合情理。复习界面提供了一个「查看来源」的按钮,可以显示与他们高亮的原始材料之间的联系。我认为这通常会让读者觉得这种困惑是他们自己「要求」的,而不是「强加给」他们的。
这些会议并不是严格的实验;我只是寻求整体上的定性评估。但我的初步印象是,将卡片与高亮相结合的设计概念似乎有很大的潜力,值得进一步推进。
建议高亮诊断出了一些理解缺口,而且感觉非常轻量
这个原型的第二个重要想法是将「建议高亮」作为一种轻量级的阅读理解辅助干预。在这方面,结果相对更模棱两可。与我合作的读者们在阅读速度和认真程度上差异极大。有些人小声念着每个单词,经常停下来向文本提问并回答问题,多次重读段落以澄清误解。另一些人则用不到一半的时间匆匆浏览,跳过看似重复或显而易见的段落。 「测试」情境本身也引入了失真:尽管我在最初的指导中明确要求他们不要这样做,但一些读者承认,如果我不在场,他们的阅读速度会快得多。
在符合我预期目标用户的 9 位读者中,有 4 位在阅读理解方面存在实质性的缺口。 「建议高亮」交互迅速识别出了这些读者没有注意到的某些重点,并为他们提供了一个简单直接的机会来填补这一理解缺口。有时,读者觉得他们错过的细节并没有那么重要,但通常在读者重新阅读段落后,他们会用特殊的紫色高亮笔标记「建议高亮」。我认为这是一个迹象,表明这种交互发现了一些有意义的东西。
这些读者对这个设计非常热衷。有人说:「这正是我想要的工具!」还有人说:「这太酷了!哇,我真希望这个工具无处不在。」我有一个顾虑,那就是如果这些读者存在一些我的工具可以发现的明显理解缺口,那么他们可能还有其他难以察觉的缺口。也许这没关系,也许这些细节在做习题时就能轻易解决。至少,这种交互确保读者在理解材料时不会被要求做提取练习——这是一个关键目标。我需要进行更多针对性的实验,以更好地了解我的干预对阅读理解的影响。
另外 5 名「目标」用户没有明显的理解缺口;「建议高亮」全都是误报。我对这些读者的理解进行了额外的即兴提问,他们的表现都相当不错。因此,至少在测试环境中,这些读者不需要额外的阅读理解辅助。令人高兴的是,其中 3 名喜欢这个工具的想法,并表示他们不介意误报;他们觉得这种交互足够轻量,仍然愿意使用它:「我仍然认为它有帮助。它给了我一个安全网——护栏。」另外两人则不太确定。
紫色高亮作为待办事项
有些读者以一种出乎意料的方式使用特殊的紫色高亮笔:他们标记了尚未理解的段落。这些读者希望继续阅读,但他们想确保最终能理解他们标记的细节。他们实际上为自己留下了一个「待理解」的待办事项。
这种做法非常合理!毕竟,我告诉他们,如果他们用紫色高亮笔标记某段文字,系统会确保他们内化这些想法。目前的机制在某种程度上实现了这个目标。这些读者收到了关于他们「待办」标记的提取练习卡片。不出所料,他们不知道答案,并点击「查看来源」按钮返回原文重新阅读。在几个案例中,原文的解释在第二次阅读时更容易理解了,因为他们已经见过这些想法是如何融入后文的。
因此,至少有时候,提取练习卡片间接地完成了这些读者的「待办」意图,因为它促使他们重新阅读相关段落。但在某些情况下,段落仍然令人困惑,读者需要进行一些对话来理解它。在其他情况下,令人困惑的段落并没有对应任何提取练习卡片——例如,一位读者对示例问题中的某个特定步骤感到困惑——因此这个待办事项实际上被放弃了。考虑如何更直接地支持「待办事项」工作流程会很有趣。
高亮与卡片的透明映射
我的一位「目标」读者觉得高亮与卡片之间的映射有点「神奇」得令人不安。当我问他觉得复习卡片在多大程度上代表了他的高亮时,他说他真的不知道:他无法轻松地看到对应关系,所以无法判断他的意图得到了多好的体现。整个系统给他的感觉就像一个黑盒子。
这是合理的!我很惊讶居然没有更多的读者有这种感觉。科技人员喜欢将他们的产品描述为「神奇(magical)」,但我们真正想要的「神奇」是指「惊人的能力、便捷性、表现力」,而不是「难以言喻、高深莫测、神秘、古怪」。关于人工智能界面设计,我最喜欢的的论文是 Jeffrey Heer 2019 年的[《代理加自动化》](https://andymatuschak.org/files/papers/Heer - 2019 - Agency plus automation Designing artificial intel.pdf)。他在论文中认为,这样的界面可以从共用的表现形式中受益。你希望自动化系统以你自己可以创建和操作的形式清晰地展示它的建议,并且你希望清楚地看到这些建议与影响它们的输入之间的联系。
然而,我的当前设计缺少了这一点。你无法编写自己的卡片,也无法修改系统提供的那些。在复习时,你可以在每张卡片上点击「查看来源」以查看它是从哪个高亮「产生」的,但这作为一种了解对应关系的方法,相当繁琐。在阅读时也没有类似的功能:也就是说,当你标记一个紫色高亮时,系统并没有给你任何提示,告诉你它理解了你的什么意图——会生成哪些卡片。理想情况下,这些表现形式应该启动一个交互反馈循环。也就是说,你应该能够说「哦,不,那不是我的意思;请关注这一部分。」
一个朴素的解决方案:每当读者标记一条紫色高亮时,我们将展示对应卡片的预览,让读者在需要时进行干预。但我想谨慎避免重新引入我去年年底的原型遇到的问题。在那个设计中,精选的卡片与关联的内容一起呈现在侧边栏中。这种方法使得交互非常清晰:如果你点击保存一张卡片,你将得到你所看到的内容;你可以在原地编辑它以便按需调整。但这也导致阅读体验相当令人分心。那些侧边栏的卡片让读者的目光不由自主地从正文中移开。在用户观察中,我发现他们不断地来回跳跃,丢失阅读位置,然后再找回来,眼睛跳到下一页与侧边栏卡片相邻的文本中。我认为大多数人在评估和选择卡片上花费了过多的注意力。
我采用这种新的以高亮为中心的设计的一个重要动机,就是为了解决这个问题。我希望让读者在阅读文本时更容易沉浸其中,同时仍能从可选的增强中受益。我认为这个原型在这方面表现得相当不错。但我还不确定如何在为卡片创造更透明、更共用的表现形式的同时,保持这种成功。
可定制的卡片映射:强调注解与反馈
这个原型的阅读界面将高亮与卡片的映射视为一个黑盒子,但作为实验,它确实提供了一种「指引」卡片的方法。读者在使用紫色高亮笔时,可以附上一个小注解,明确指出他们特别想强调什么。举个例子,你可能高亮了一个定义,但你真正想记牢的是它的表达方式;或者你想确保内化这个定义与之前某个概念的对比。因此,你可以高亮线性方程的定义,并在旁边写条注解:「与线性组合对比」。
大多数用户并没有重度使用这个功能,但至少用过一次。可以想象,随着他们建立起将高亮内容映射到卡片的心智模型,以及这种映射有时并不完全符合他们的期望,他们可能会倾向于更多地使用这个功能。
在实践中,我只能用我预先制作的精选卡片满足这些请求中的大约三分之一。另外三分之一能映射到更宽泛的卡片,这些卡片包含或间接强化了他们提到的细节。其余的请求则相当独特,可能只有通过机器生成的卡片才能满足。只有一位读者注意到他的请求并没有完全得到满足,而且他并没有表现得很在意。但我认为随着时间的推移,这个问题会更严重,如果「强调笔记」功能不可靠,我不想将其纳入。
「强调笔记」的视角将用户的指导置于首位。另一种考虑这种控制的途径是通过迭代的反馈。例如,一位读者高亮了一个定理,该定理表示,如果一个线性系统通过三种列出的操作之一转换为另一个系统,那么第二个系统与第一个系统具有相同的解集。在他的复习过程中,他收到了一张卡片,写着这个定理在高斯方法安全性中的作用。他对此感到困惑,一旦他点击「查看来源」查看卡片来自何处,他说:「哦,不,我在这里并不关心证明正确性——我想确保我知道这三个『安全』操作。」理想情况下,他应该能在复习过程中告诉系统:「只需确保我知道安全的操作。」
另一位读者希望他能让卡片更加非正式:更多的口头解释和例子;降低符号和抽象的程度。这种反馈应该不仅影响当前的卡片,而且可能影响整本书的所有卡片,甚至是过去、现在和将来的所有卡片。
我的简短实验表明,对于大型语言模型来说,调整预制卡片比要求它们重新生成卡片更可行。例如,考虑这张卡片:「问:在线性系统中,一行的首变量(leading variable)是什么?答:第一个非零元素对应的变量。」我的一位读者希望这种抽象的答案能附上具体的实例。GPT-4 能够根据这个要求适当地重写卡片。当然,这个例子手动完成并不难,所以这里的权衡可能没有意义,除非它们可以应用到许多卡片,或者机器生成非常可靠。
下一步
这里我想说点自己的感受:这最后一轮测试对我来说相当令人兴奋!新设计似乎解决了多年来我在各种记忆系统设计中观察到的许多问题。而且——非常谨慎地说——它似乎还能在阅读理解方面提供支持,帮助一些读者。这是一个很好的迹象,说明我真的很想在日常阅读中使用这个工具。
尽管如此,这轮测试还相当肤浅。我想了解各种人对设计理念的反应,所以我与 14 人分别进行了约一个小时的交流。因为我们只读了书的第一节,所以这些概念之间没有太多机会建立联系,对记忆和理解的要求也不高。而且,由于我只观察了一次会议,我没有机会看到随着时间的推移,遗忘的影响变得显著时,记忆和理解支持的表现如何。
因此,从本周开始,我将转向深度优先的方法。就像今年早些时候一样,我将每周与一名学生会面几个小时。我们将继续深入阅读这本书,其中的材料将以更具挑战性的方式逐渐累积。在这些会议期间,我们还将完成一些习题集,观察这种增强如何与实际能力相互作用。
这些观察仍然是定性的。与此同时,我想开始更系统地了解我的设计对阅读理解的影响。它帮助读者发现有意义的缺口的频率如何?是否有某些类型的缺口容易被忽视?接受这种干预的读者是否能更好地理解材料?在面对材料时是否感觉更有能力或更投入?
目前,我的原型需要我手动将读者的高亮内容映射到精选高亮内容。而且我必须尽快完成,这样他们在阅读完该部分后才能点击「建议高亮」功能。如果我想与几十名用户进行实验,这将耗费大量时间。因此,在与一名学生进行深入研究的同时,我将尝试自动化读者高亮与精选高亮之间的映射。
我的初步测试表明,与我设计中的另外两个目前需要手动完成的任务相比(识别文本中最重要的元素,并为每个元素编写优质卡片),这个任务更容易自动化。这些任务在某种程度上是可分开进行的,这很好,这样我可以通过仅自动化高亮到卡片的映射来取得一些进展。
如果我能自动化这种映射,我就可以把这个原型公之于众,尽管它只限于这一本书。这是一个值得期待的里程碑,我相信——像往常一样——公众使用会带来许多意想不到的启示。从那里开始,是的,自动化精选和卡片编写任务固然很好,但我对使用一本大部头作为深度优先的实验室,探索其他阅读增强想法的前景也很感兴趣,其中许多我在这些文章中都已经讨论过。
让我的作品充满活力的一个断言是「书本不起作用」。展开来说,为了真正理解、内化和记住解释性文本的观点,读者必须采用各种隐含的、往往不可靠的策略,而书这一媒介对此帮助甚微。如果处理文本的经验自然能保证所有这些额外的工作得以完成呢?我希望在处理解释性文本时,能创造出一种异乎寻常的能力和轻松。
分解一些你可能需要的东西,让一本书真正以你所希望的方式「起作用」:
-
**理解。**你需要真正加工页面上的文字,并在你未能做到这一点时察觉到。对大多数读者来说,这在大多数时候都是出乎意料的困难!大多数干预手段都相当突兀;当前的原型是我尝试的一种更实用的增强方式。
-
**记忆。**你需要记住你读过的内容。这促成了《量子国度》和助记媒介的诞生。但我发现,现今的记忆系统往往产生脆弱的记忆,而我希望探索像变化卡片和逐步提升综合性等想法来改善这一点。
-
阐述。你不仅仅需要理解文本的字面意思,还要理解其意义和重要性。你需要将文本的想法与之前的知识和经验相联系。讨论是我喜欢的一种方法;深思熟虑的写作(最好出于某种实际目的)是另一种。我希望发掘更多此类方法,并找到将这些活动更好地融入阅读体验的方式。
-
**流利。**你需要通过实践来巩固你所读的知识,使之内化为一种自然反应。这涉及到模式归纳、图式习得和知识编译。在技术领域,这常常指的是解决问题的实践练习——参见像 Mathigon 和 Execute Program 这样的项目。项目式学习是另一种常见的方法,我对「以实践为中心的解释媒介」等想法很感兴趣。
-
**干预。**你需要诊断并解决可能存在的困惑和误解。专注过程步骤的题目通常无法明确识别概念性问题。在这方面,教授他人是一种经典方法(译注:即费曼学习法),催生了像 AutoTutor 这样的综合干预工具。当用户能够清楚地表达时,前沿的大型语言模型通常能在解决困惑方面表现出色。我对于轻量级、一体化的困惑识别和解决方法很感兴趣。
-
整合。大多数时候,你阅读一本书不仅仅是为了获取知识,而是因为你希望它能以某种方式改变你——改变你的思考方式、看待世界的方式,或你在特定情境中的行为和感受。为了让一本书真正成为现实,你必须将它的想法带入你的生活。与之相关的一些想法,请参阅启明卡和穿越时间的文本。阅读俱乐部在这方面很有用;我也想探索更多结合新媒体与社交活动的创新方式。
当然,这足够作为几辈子的研究计划了。但我之所以在这里详细阐述,是为了帮助自己抵抗旧金山周围的文化压力。这种文化压力使我感到,一旦我有了一个创意——比如高亮引导的记忆卡片——就应该大力推广,使其影响尽可能多的地区和人群。当然,这种做法有其价值。我确实想在所有地方都用上这种特别的高亮笔。但同时,我也需要权衡这种冲动,与发掘更深层次的基础理念并更全面解决我所关注问题的可能性。
————————
感谢所有在这第一轮测试中与我一起合作的学生,也感谢 Benjamin Reinhardt 对我下一步计划的有益讨论。
2021 年的经验所得
原文:Lessons from 2021 | Andy Matuschak
节选自《来自实验室的信》,一系列关于我的研究的非正式文章,面向赞助人撰写。你也可以[听](https://andymatuschak.org/static/2021/Lessons from 2021.m4a)这篇文章(24 分钟)。
年的界限当然是人为框定的。然而以年为契机的仪式依然能生发智慧,激荡暖意。新年伊始,我都会反思去年的所学与收获。秉承去年的文章的精神,我愿分享一些经验所得,以飱读者。
苦难和创造性工作
写书是场让人筋疲力尽的可怕斗争,有如一次久久不停歇的痛苦疾病。 若不是受到什么既无法抗拒,又无法理解的魔鬼驱使,没有人会做这样的事。
—乔治·奥威尔, 《我为什么写作》
你若不能理解你思考的东西,你会感觉很糟糕,浑身难受,这就是困惑(confusion)。困惑很难解决,也并不愉快。开始困惑后你就不开心。有这么一回事你想不透。那么,这种困惑的根源,是不是因为我们都是些猿猴,干这种事就是不灵呢?我们绞尽脑汁,想把两根棍子放在一起来够到香蕉,但就是办不到。就像有个主意就是想不通。这样的类比我总是挥之不去:我是只猿猴,在努力地把两根棍子放在一起。所以我总是觉得自己很蠢。偶尔有一次,我能把棍子成功地拼起来,并能够到那根香蕉。
—理查德·费曼,1963 年访谈
各门各类的艺术家和作家,都和科学家一样逃不过这样的情结:创造性工作带来的满足感无可比拟,但是投入工作的每分每秒都艰难无比。就像在暴风雪里迷茫地摸索着某物,时而缥缈,时而真切,可总是觉得蠢笨不堪。每一天夜幕落下——手上空握一些残章,怎么能交代呢?这样一天天,一周周过去,却没什么能用的。但有什么在撩拨着你。所以你枯坐桌前,迎风前行。一旦触碰到终点,创造带来的超然快乐之下,这些痛苦显得又值得了。
我觉得不必如此。
我直到今年才开始认真考虑,是否有可能让人摆脱「让人筋疲力尽的可怕斗争」,如奥威尔所描述。这个情结太过普遍了。我觉得有些创作者肯定已经想出了一些办法,但我的作者和研究员朋友中,聊天很快转变成互相舔舐这种普遍的痛苦。我认为,我们太轻率地合理化这样的痛苦了。我认为,要发展出和创意工作的新生态,不管结果如何,置身其中的每一时刻都是快乐的。
请不要抱有过高的期望。这篇文章不是实现摆脱这一困境的完整指南。我当然自己还没完全想明白。至少根据我的经验,最重要的一点,是不要把这种痛苦视为理所当然,而是对其进行审视。
为什么困惑的感觉令人百般难受?为什么花了一天尝试解决问题,结果毫无进展的话,我会倍感痛苦?我在担心如果自己完全投身于问题,花费大量时间,却不在乎是否找到答案的话,会有什么发生。对我来说,只要叩问自我足够深入,就会发现,困惑之所以令人难受,症结在于各种各样的社会焦虑。担心成就「不足」,显得无能,蠢笨,迟缓,毫无创见;这些感觉的深层根源是害怕失去「归属感」,无法为他人所接受。
你的答案可能不同。有些朋友发现,他们的创作痛苦源于自我鞭笞:他们已经说服自己,创作的成功取决于坚定的意志,所以如果他们没有取得进展,那说明他们作为人类个体有根本的弱点。沿着这样的思路,创造性的烦恼招致自我厌恶,而不是同情和好奇心。而另一个朋友的创作痛苦部分源于对于入不敷出的过度恐惧,他曾因家庭经济条件差而留下了心理创伤。
至少对我和上面所讨论的这些朋友来说,这些恐惧来自于一些根植于心的错误信念。识别这些信念并将其根除是很有价值的。我在这里不能开出解药,只能邀你共赴一趟旅程。重塑你的情绪系统,使创作经验不会导致痛苦,是有可能的。请咨询你当地的治疗师、冥想指导、执行教练、迷幻药商等,或者同时咨询其中几个。
对我来说,减轻创造工作的痛苦是解决方案的一部分;另一部分与之对映:培养创造工作的快乐。从创造性工作的即使体验中收获更多的满足,是有可能的。起初我很难做到,因为我早已习惯于从产出、成就和他人的认可中获得工作上的满足。在这样的思考方式之下,每当我面临挫折,或者花了一天时间探索,而没有取得明显的进展时,便意味着满足要推迟。写作讲习班、艺术课和研究回忆录,无不仪式般地强调了关注「过程甚于结果 」的好处。我只在纯粹的实践意义上理解这一点:当你在创造性工作中专注于结果时,你的作品往往更糟糕。但这句格言也适用于情感体验。很难把结果当成每天都能收获的奖励。结果太遥远,很不确定,作为满足感的来源十分脆弱。过程也必须让人有收获感。
值得高兴的是,我注意到,一旦摆脱了以前的思维方式,我工作的每分每秒都非常有满足感:遵循好奇心而走上一条小径的快乐;偶遇小小联系的喜悦;注意到我困惑得出人意料的惊喜;选定更合适的词,因而理解更加清晰的满足感。很惊喜的是,观察自己的思维齿轮运作是十分吸引人的一件事。
关于「生产力」和「动机」的建议,往往预设对立性的语境。其意旨总是更专注,更努力,更成功。而你是这一切的障碍。你的意志力太薄弱。只要多点整理能力,少点懒惰——你就能摘到月亮!撇掉让你分心的东西,用定力抵御诱惑,不要断了坚持,制定可量化的目标,向前进发,向正确的道路进发。这些技术往往假设,工作是不得不咽下的苦药,而你的冲动是害群之马,亟待驱逐。要忍耐当下的苦楚,以换取缥缈未来的果实。我不会否认这些技术的作用。我们的思想的确有猿猴的一部分,对驯服很受用。我们也的确会低估长期收获,这样也不合适。但对立性的语境是在头痛医头脚痛医脚,关于「生产力」和「动机」的建议往往并未触及症结根本。我不想将自己训练成对自己的冲动发狂的人,尤其因为我的工作很依赖于追随创意本能。我更想培育更健康的自我和完成工作的关系,这样我的冲动反而有利于我。
不要误以为我的工作是每天让我豁然开朗的恩泽。但今年我的进展意外地非常迅猛,而且我有预感我能完成更多成果。创意工作的痛苦情结,似乎是咎由自取的悲剧幻象。这个幻觉是可以克服的,而这种掌控感是我今年学到的最宝贵的经验。
构建更好的「思想工具」 场景
我独立工作的一个关键原因,在于我的工作「思想工具」并没有天然的学术领域,或者业界的市场定位。但是思想工具的确有某种意义上的场景。
好消息是现在的生态比五年前好得多。我发现创新性、赋能性的用户界面受到前所未有的普遍关注。很多人在业余时间愿意捣鼓思想工具,而且更重要的是,一大群对思想工具很认真的人在不断发布示范性的高质量工作。
但思想工具的生态仍然很贫瘠。不乏呐喊助威之众,但很少有人全身心投入,强有力的想法更是少之又少。我的直觉是,还有许多变革性的想法隐藏在触手可及之处。我觉得思想工具的发展可以更快,成就可以更多。
那么是什么阻碍了我们?以下是我注意到的几个瓶颈:
钱:最明显的制约因素。没什么人有足够的资金支持他们做思想工作,甚至暂时的支持都很困难,更不用说可持续的。什么模式可能适用呢?
-
Jupyter 和 Scratch 等项目的运转,依靠的是慈善基金会和公司资助。但是在我看来,这些资助主要面向的项目,都经历过数年跋涉,已经度过创意构思的困难阶段。
-
从理论上讲,国家资助机构应该很适合资助那些处于早期探索阶段的项目,但实际上,雄心勃勃的系统工作在相应的学术领域是不受欢迎的(人机交互)。
-
我在众筹方面取得了一些小的成功,但我担心这样的成功可能难以复制:有其他人尝试这条道路,但似乎时运不佳,至少目前为止是这样的。我将在本文后面给出我的众筹实验的最新情况。
-
来自 Emergent Ventures 等低要求项目的小额资助是可喜的动向,但我担心,把这些小额资助拼凑起来,以推动实质性进步,会比较困难。然后呢?也许像这样的小型资助可以帮助创业者过渡至获得大型慈善机构的资助。关于这方面如果有更多的实验就好了。
-
尽管现代风险投资通常不适合(初创企业的基本动力是增长),但也许不那么亢奋的商业模式也能起作用?在不同意义上,此处有 Mathematica 和 VisiCalc 以及 Photoshop 作为成功案例。我所关心的主要问题是:一旦这些东西变成一门生意,还能进行多少基础性的探索?成立公司也许是从最初探索阶段获取价值的方式,但显然不适合用来资助持续的发明工作。Mathematica 在这方面表现尚可,但其成功似乎相当罕见。
-
Ink & Switch 正借助 Muse 大胆尝试一种方法,我感觉这种方法更好。他们采取转化模式,将一些项目分拆出去,由这些项目资助「母体」实验室的开放式探索。目前,评估这个方法还为时尚早,但我很乐于学习他们的经验。
科技领域坐拥巨额资金,这对于思想工具来说是双刃剑。一方面,如果你能在「思想工具」研究项目上取得不错的成果,凭这份能力你也能找到份年薪数十万美元的工作,或者创业并且斩获数目喜人的种子轮投资。先不论「普通」技术,AI 和加密货币的淘金热方兴未艾,这些领域不乏有趣问题:为何不投身其中?另一方面,这个环境里资金如此充裕,那么不少人能轻易积累起足够的资本,供他们随心所欲地研究问题。科技行业中能诞生更多「绅士学者」。当然对于资助研究而言这未必理想,但我认为这条道路在短期内更有价值。我愿意鼓励更多人思考这一选项。如果你对于从事原创研究感兴趣,我鼓励你更严肃地看待资本富集的领域。请自己预测未来。根据你的境况和生活方式不同,细节差异很大,但你也许能通过工作几年来赚出创造的自由。
技能:我们对工程的重视程度过高,对设计和理论建设的重视程度不足。
似乎有个问题:如果你是工程师,你实际上可以自己建立一个系统并对其迭代。你的系统可能不包含任何有趣的界面创意,但你肯定能做出点东西来!相比之下,如果你是设计师或综合学家,没有工程技能,你当然可以为计算的未来勾勒出新颖的概念。麻烦的是,如果没有实际的互动,你就无法在交互系统上迭代更多。设计和理论建设是必要的,但不是充分的。
因此,为了在这个领域取得进展,我们需要的要么是工程师—设计师—理论家的混合体,要么是由技能互补的人员组成的团队。这两种情况都比较罕见。一个人很难在工程与设计领域都培养出很强的能力,因为两个领域都深不可测,尤其是设计通常需要经历学徒期。团队则不多见,因为单单找出愿意从事这一薄利而又古怪的方向的人,就足够艰难了;找到两个人愿意为同一个项目工作相当于两个小概率事件的乘积。
尽管如此,我相信有可能助推更多工程师和设计师组建二人搭档。我感觉有许多工程师对这个问题空间非常感兴趣,但他们拎得清自己有多少做设计、做理论的能力。如果我们能够为有想法的设计者找到小额资助,也许他们可以将自己的概念加以完善,之后我们便能为他们匹配热心的技术专家来共同合作,制作原型,开始迭代。
在这里,部分麻烦是由于文化。像「增强人类认知」这样的表述框架,很容易吸引许多工程师,但对我认识的许多设计师来说,这样的表述听起来非常生硬。如果我们开始谈论创造、表达或意识的变革性环境,情况就会有所改善。另一个问题,正如 Joe Edelman 向我指出的那样,各种各样的「增强」,往往基于人与计算机的关系来讨论,而不是基于人与人之间的关系,其中可能涉及到计算机。个人主义的框架常常难以契合设计的集体主义文化倾向。不过在增强集体智慧和创造力方面还有很多机会。类似目标的项目可能会吸引更多设计师来合作。
发展:在方便的业余参与、指导、技能建设上,途径还不够多。对于刚刚开始研究思想工具的人,这个问题很是真切紧急,就算我也有同感。我觉得这个问题最好的解决思路,是资助研究生式的学徒制度,但是只有在解决先前提到的资金可持续性问题之后,学徒制才能实现,而那个问题是更广泛层面的。在此之前,学徒制只能是风雨飘摇的空中楼阁。
团队合作:以团队为单位制作思想工具的典范和模式寥寥无几——独行侠占了大多数。这样的现状限制了能实现的成果,不仅如此,不少人偏好在团队或大机构中工作,这些人被排除在外了。Ink & Switch 是我们见到的最好的现代团队典范,对其运作模式的书面讨论,对于思想工具的生态很有益。尽管如此,我注意到他们现在主要关注的是软件界面的技术基础,而不是界面本身。我猜测后者需要不同的模式。我不确定下一步该怎么做。正如我在技能部分所述,更多地资助合作者,似乎是好的起点。
校园:我们没有教师休息室或汉明式午餐桌,没有研讨会。缺乏固定场合,来开展自发且深入的讨论,共同探讨正在进行的项目和领域动向。大部分人甚至没有一个固定地方来互相批判设计。推特是糟糕的替代品。有一些播客和展示-介绍系列(注:show-and-tell series, 美国加拿大等地的教学活动,学生把一件东西拿到课堂上介绍)很不错,但这些场合仅关注于分享想法,而不是评价想法和创造想法。真实意义上的校园也许不是解决办法,但能指出我们没有的:支持共同打磨,互相启迪的环境。我觉得可以从关注深度的小型见面会开始,这只需一笔数额不大的资助。更奇异的是,我很乐意在旧金山找寻一处物理空间,用来举办定期活动和协作会议。
和善于实践的队友共同加速研究
去年我写道,开发新的思想工具面临一个重要的实际问题:只有在真实的环境中使用新的界面创意,我们才能真正理解这些创意,然而打造实际可用的软件系统要花很多力气。更糟的是:由于在「研究思维」和「工程思维」之间来回切换的成本相当高,一个研究人员往往在数周或数月内只能看到森林或树木。因此,从个人来讲,很难积聚足够动力去单枪匹马地迭代研究系统。
因此,由于今年一些大方的捐赠者慷慨提供了更多资金,我开始做一个实验,雇用实习生和承包商来帮助我完成偏重执行的工作。其中一些合作仍在进行中,但我想与大家分享一些早期的见解,即思想工具团队中什么样的结构是最优的。
研究系统的最大问题是,不确定性增加得很快,而且非常迅猛——相比普通软件开发尤甚。在传统产品开发环境中,你通常足够了解系统的限制和机会,能画出足够稳健的路线图,规划好要开发的功能,要开展的实验,要修正的问题。团队在开发新功能时当然需要引导和反馈。但是对于某些项目,你通常能提前说明好工作,团队能推进工作数周,不会因困在反馈问题而停滞。
一个解决方案是,不仅将执行,而且将核心的创造性解决问题的工作委托给团队成员。我当然希望如此,但现在我们谈论的是一个非常不同的工作描述,以及而胜任者也更罕见。我相信只要给予足够的指导和关注,我坚信有更多人能具备这些经。但是前路漫漫,而且比起雇用主流技能的程序员帮我实现来说更加困难。这条道路更像是给研究生做导师。每段经历会花上几年,而且很难说能回本。
我现在正在尝试的另一种方案是,间歇性地雇用承包商解决一些短期工作,这些工作的内容我已经描述得足够清楚,可以保证执行上的专注。这种方案有交易负担,并且破坏了语境的连续性,但能让我专注于效用最高的工作上。范围固定的参与可以最小化优先级的颠倒,这种情况可能会发生在团队成员清空了工作清单时。
Adam Wiggins 用过一个比喻来描述一个相关模型,深得我意。电影制作通常以「预制作」阶段开始,此时只有几名创意人员,他们负责弄清楚电影到底是什么。之后,你一旦觉得各个部分差不多敲定了,就雇佣上几百个人开始「制作阶段」,让电影落地。几个月后,所有人分道扬镳,直到下一个项目开始执行。
与独行侠相对的是合作,我接触的一些合作伙伴自己便有能力完成杰出的工作,我和他们的合作体验非常美妙。这样的关系珍贵而稀有。雇佣到这样的人很难,尤其是在我并不宽裕的情况下;这样的人也更喜欢当合伙人而不是当员工。我很期待在 2022 年设法达成这样的合作关系,但我也认识到,合作无法解决我一开始描述的问题——加速一些实验性系统的实现。这样的创意工作合作能够改变我对问题的认知,这点是很不错的;但合作不意味着进度更快(以我的经验而言)。
钟点承包者和深入的全职伙伴这两种工作模式之间存在巨大的鸿沟。如果我能更有效地利用全职员工,我也许能取得更多成果,但是这还是有待解决的问题。也许这个问题根本解决不了!Philip Guo 最近回顾了 PythonTutor 的十年历程,他认为独自工作有利于项目的存活。我很感激我自己今年没有雇用多少全职工程师和设计师,自己完成各种实验。我会继续尝试。
众筹依赖高度可见的公开工作
众筹研究仍然非常罕见,所以我想尽可能地帮助其他人从我的不寻常情况中吸取经验。众筹资金募集实验又经过了一年的实践,让我们看看从中能收获什么经验。
去年的订阅者缓慢而稳定地增长,最后的资金规模大致相当于研究生的研究资金。今年,这种增长在上半年继续,然后在下半年停止,稳定在国家科学基金会 CAREER 资助的四分之三左右(学术界早期职业教师的典型资助)。
这样的资金水平足够我维持下去,但我们应该如何看待增长的停歇?应该为此感到担忧吗?
有一个重要细节是,自 2020 年中期以来,读者停止订阅的比率一直是每月 1-3% 而保持不变。订阅者停止增长的原因,是新赞助人的增长变慢。这种下降可以归因为访问 Patreon 页面的人数下降了。在整个期间,访问者转化为会员的比例基本相同。
最终关于众筹研究,我们得到了一个平白无聊的故事:增长,以及在较小程度上的可持续性,取决于为工作引来新的关注。这一假设对众筹研究有一些重要影响。不应该对我的缓慢增长感到惊讶,因为我在 2021 年没有发表任何抓人眼球的重大工作。
首先,不要误解我的意思: 2021 年是成果丰硕的一年!但我的不同工作(像任何研究人员的工作一样),在可读性和对新观众的吸引力上,都有很大差别。我在这一年里进行了各种实验,没有一项足够光彩或足够有总结性。但这些实验都提供了有益的见解,有助于推动我目前的工作。如果我是传统学者,我可能干脆把这些实验整理成论文发表了,因为一般期望是每年都要发表几篇论文。而我没有这些压力,所以我宁愿等到我能把故事讲得更完整时,再发表工作。
碰巧的是,我在 2021 年实际上发表了大约 45,000 字——对我来说是远超预期,创下新高——但大都是为赞助人写的非正式的短篇文章,而不是备经打磨的、让我愿意宣传以吸引更多受众的成熟作品。我为这些作品感到自豪,但我并不指望这些小文章能吸引大量的新访客。事实上,这些文章中有许多不能吸引新的访问者:它们只提供给赞助人!
然而订阅取消率并没有变化,可见对于今年貌似缓慢的进度,我的赞助人并未感到很苦恼。所以问题还是在于这样的文本发布模式难以吸引新的观众。对我来说这点可以接受,因为目前的资金水平下,我至少能付清自己的账单,而我预计在 2022 年能发表更光鲜亮丽的作品。
但我今年经历的模式说明了众筹的一些局限性。有些研究者需要在每个重大项目上花费几年时间,中间没有办法提供任何东西来吸引主流大众。对于这种研究者来说,众筹的效果可能不会太好。而且这种情况可能无法提前预测。研究工作没有时间表。这个行当就是会遇到「慢」的年份。
众筹渠道的转换率难以提升,因此作品必须吸引相当广泛的受众。而且,唉,研究人员如果想维持生计,就不能完全忽视营销。每月1-3%的取消率是相当小的,但这意味着需要适度的持续受众增长。这些研究性众筹的受众会以何种速度饱和?是否有人能真正在整个职业生涯中维持众筹研究?我现在大约有 650 个赞助者,但以我现在的资金消耗率,为了维持我目前的资金规模,未来十年内必须有 1650 个额外的会员订阅。
等着吧!以这种方式来结束这一年的反思有点平淡,但我个人对来年相当乐观,我也很期待更多变革性的软件环境涌现。
如果你觉得我的工作很有趣,你可以成为会员以帮助实现更多的工作,并获得更多像这样的文章。致我的赞助人:你们亲自促成了我过去几年的生活。谢谢你们;谢谢你们!我希望你的 2022 年能大放异彩。
我还要感谢以下人士,和他们的谈话助我形成了上述观点:Adam Wiggins, Andrew Sutherland, Catherine Olsson, Danny Hernandez, Joe Edelman, José Luis Ricón, Kanjun Qiu, Michael Nielsen, Molly Mielke, Nadia Eghbal, Nick Cammarata, Ozzie Kirkby, and Philip Guo。
最后,特别感谢我的资助级别的赞助者,截至发布时:Adam Marblestone, Adam Wiggins, Andrew Sutherland, Ben Springwater, Bert Muthalaly, Boris Verbitsky, Calvin French-Owen, Dan Romero, Dwight Crow, Eugene Soltes, fnnch, James Hill-Khurana, James Lindenbaum, Jesse Andrews, Kevin Lynagh, Lambda AI Hardware, Ludwig Petersson, Matt Knox, Mickey McManus, Mintter, Nathan Lippi, Patrick Collison , Paul Sutter, Peter Hartree, Russel Simmons, Sana Labs, Tim O'Reilly, Todor Markov, Tom Berry, Tooz Wu, William Laitinen, Yaniv Tal。
从 2022 年夏的助记媒介原型中学到的经验教训
原型:Lessons from summer 2022’s mnemonic medium prototype | Patreon
在过去的几周里,我为我最近的助记媒介原型进行了二十次在线观察,并阅读了一大堆异步测试者的日记。我想分享一些我学到的东西,以及我未来的方向。
无论好坏(我们会看到两者都有),在这个迭代过程中,我在筛选测试者上遇到了麻烦。我怀疑很多人只是急切地想看看我在做什么,所以他们忽视了我对测试者要求的指示。我浪费了太多时间与那些没有充分理由仔细阅读测试材料的人交谈,或者那些从未听说过间隔重复系统(SRS)的人交谈。当然,这个系统最终需要向不熟悉 SRS 的人解释自己,但这次我并没有试图测试这个——这一点之后会展开讨论。
大体来说,当测试者符合我预期的资格条件(测试者真诚地想要内化材料,并且他们之前对 SRS 有了解)时,这个系统起的作用和我希望的差不多。在其他情况下,它很少起作用。我们可以这么定义「起作用」:对读者产生了显著的净利益;读者对此表示了感激,并相应地在界面上做出了行动;读者表示他们想要复习他们保存的卡片;读者(通常)表达了他们希望在更广泛的文本拥有这种交互。
尽管如此,「它起作用了吗?」这个问题模糊了大部分有趣的洞见。让我们深入研究一下。
对于助记媒介可能的应用范围,我学到了什么?
我试图回答的关键问题之一是:助记媒介的理念能覆盖到多广的范围?有没有可能,在未来的某一天,我们可以在每一篇知识性文本中使用这样的工具?为了充分发挥其潜力,这种媒介将会朝着什么方向发展?在《量子国度》中,这种媒介的效果很好……但是我们能否就此断定,它只适用于技术入门读物?我用两本书测试了这个最新的原型:Introduction to Modern Statistics(IMS)——一本正式的技术教科书;以及 Shape Up——一本关于产品管理的非正式、非技术书籍。
乍一看,IMS 与《量子国度》有许多相似之处。但《量子国度》的处理方式对这本书并不尽人意。《量子国度》是一本专注的入门读物,面向的是准备完全听从作者指导的读者。像 IMS 这样的大部头教材,读者并无须从头至尾、一字不漏地阅读。我所有的试读者都曾涉猎过统计学(尽管有些是很久以前);许多人只想挑选一些关于新材料的卡片来阅读。还有一些人希望回顾全书,但并不想保存关于熟悉材料的卡片。这两种工作流在《量子国度》的设计中都无法实现。去年,当我试图将那种设计扩展到像 IMS 这样的文本时,我看到用户经常因系统的刻板命令式作风感到沮丧。然而,在我最近的测试中,我观察到非线性的阅读方式顺利进行,几乎没有遇到阻力。我现在越来越确信,助记媒介可以有效地应用于各类技术教科书上——不仅仅是线性的入门读物。因为 IMS 属于技术类教材,我还无法对助记媒介在非技术类教材中的表现下定论。
Shape Up 这书,虽然也是教程,但它的语气轻松,内容也不算太专业。如果这种媒介能在这书上运用得当,那媒介的适用范围就能大幅扩大了。但在这方面,结果却起伏不定。我的目标读者(对内容感兴趣,对间隔重复系统有所了解)虽然很欣赏这种媒介,但我感觉他们从中受益似乎没那些读 IMS 的人多。这种媒介在这种情况下,倒像是锦上添花,而非革命性的提升。
重新审视这个问题,我们先把间隔重复暂且放到一旁,然后想一想:对于 Shape Up 这本书来说,理想的个人高效成长环境会是什么样的?这个问题的关键——就像许多读者指出的那样——是你能否真正改变你的产品创作习惯。这就意味着你可能需要大量的实践活动,需要有人一对一指导,或许还需要不断发展的反思/应用卡。你可能也会想要用到启明卡,帮你把书中的理念和实际情况联系起来。当然,传统的提取练习也会有帮助。我就发现自己在还没来得及实践书中的方法之前,就已经把细节忘得差不多了。但显然,这并不是最关键的,你并不需要依赖电子工具来帮你消化前面的章节,以便理解后面的内容。
有趣的是,从某种意义上说,Shape Up 很像一本自助书。事实上,许多非正式、非技术的教学书都像自助书。在心理学、哲学或商业这些领域,大众热衷的书籍往往围绕着如何改变你的生活展开。所以,增强也应该围绕这个主题来做。作为一个习惯使用 SRS 的读者,我确实想在这类书籍上应用助记媒介。提取练习确实帮助我将这些书中的思想带入我的生活。但作为一个研究者,我的直觉是,这类型的书并不是助记媒介的下一个战略目标。如果我想将助记媒介扩展到技术性较弱的文本,我应该试着将它应用到如心理学或政治学这样的软科学书籍上。如果我想让非正式的文本也能享受到助记媒介的益处,我应该试着对技术话题的通俗解释类文章进行改编。如果我想增强像 Shape Up 这样的自助书,我应该集中研究其他的支持机制,比如穿越时间的文本——这类文本能帮助读者根据书中的理念重塑生活。
边栏卡片对阅读体验的影响
在最新的原型中,我们将作者的卡片搬到了侧边栏。这个改动彻底地颠覆了阅读体验。读者普遍表示,边栏卡片标出了特别重要的段落,暗示他们该关注何处。读者感觉到,这些卡片使他们放慢了阅读速度,变得更加专注。多数读者(尽管不是全部)都欢迎这种影响。
我想分享一个多位读者都有过的具体经历。在首次阅读某段文字时,他们感觉似乎没什么要点。然后,他们注意到边栏中的卡片标记,有些摸不着头脑:等一下,难道这里真的有关键细节吗?于是,他们在卡片的指引下,仔细地重新读了一遍那段文字。每次重读时,读者都承认他们漏掉了卡片所强调的重点。他们感激能够得到这样的纠正机会。
我们也从《量子国度》的读者那里听到了类似的反馈。嵌入的复习环节让人们重新阅读某些章节,或者更加用心去读。但在这个原型中,这种感觉更加强烈,出现的次数也更多,因为边栏卡片始终在那里,时刻影响着读者。
作为总结的卡片
在 Shape Up 这本书中,如果读者的屏幕足够大,卡片的「正面」会一直出现在边栏中。但是,空间并非总是充裕。在小屏幕上,以及在 IMS 中,卡片是「折叠」的。也就是说,读者只能看到一个表示这里有卡片的标志。当他们将鼠标悬停在标志上时,卡片的文本就会显示出来。这种差异对阅读体验产生了很大的影响!
当卡片文本始终可见时,许多读者会将卡片当作附近段落的轻量级总结,他们在阅读相关段落之前先阅读卡片。这些读者通常会根据卡片内容来决定是否阅读相关段落。而我最初的设想则正好相反:人们应该先阅读主文本,当遇到某些特别吸引他们的内容时,他们可以水平扫描到侧边栏,阅读并可能保存相关的卡片。
我对这种总结优先的行为感到担忧。先读卡片的阅读方式往往会遗漏有意义的细节:完整的文本包含了一些叙事内容,为后面的部分提供必要的背景信息。更广泛地说,助记媒介的卡片并非总结。它们并不是孤立存在的。卡片中包含的信息需要通过提取练习来加强,但它们依赖于与之相关的叙事中的结构和细节。实际上,这种联系正是助记媒介试图解决一个核心问题的方式:除了死记硬背的材料外,学习其他人的间隔重复「牌组」通常效果不佳!这样的卡片往往感觉是孤立的,与真正的理解脱节。相比之下——至少在理想情况下——当你回忆助记媒介卡片上的信息时,你接触到的远不止其原文。复习会重新激活那些你找到这张卡片时更丰富的叙事背景。
其中一些总结优先的读者其实并不真正关心提取练习的机制。他们真正想要的只是文本的段落和章节级别的总结。这似乎是一个值得探索的阅读功能,但如果我尝试解决这个设计问题,我不认为我的解决方案会同时兼顾间隔重复的卡片。总结和卡片是相关——但不同——的媒介。还有个相似的观察:有些读者在阅读某个段落时感到困惑,他们提到卡片通过提供另一种表述帮助他们理解了内容。这同样让我觉得是个很好的次生效应,但卡片并非最适合完成这个任务的工具。
完美主义的卡片阅读
即使读者不将卡片作为总结,大部分用大屏幕的读者,在阅读 Shape Up 时,会读遍每一张卡片,这些卡片的「正面」始终展示在侧边栏中。我猜这部分原因是由于原型的新鲜感。人们感到好奇。但半个小时后,这种行为在我看来有些强迫性——仿佛他们感到有义务这样做,如果不看卡片,就好像没有「正确地阅读」。这种完美主义式的卡片阅读让我有些担忧。这就像阅读带有大量脚注的文本一样,可能会严重干扰阅读体验。你的视线在页面上飘忽不定,注意力在叙事中跳跃。也许卡片能有助于你的阅读,但这能弥补分心带来的影响吗?让你眼睛在卡片和文本间来回跳动的原因,真的是有益的指导吗?还是更多地是一种义务感,一种完美主义的驱使?
当读者在阅读的同时与卡片互动时,出现了另一个惊人的效果:这种行为有时等同于隐式的、就地的提取练习!也就是说,当人们在侧边栏中阅读卡片文本,试图自己回答,然后移动鼠标到卡片上阅读作者的回答时,他们实际上在做的事情和他们在「真实」的复习环节中做的一样——他们只是没有给自己「打分」。实际上,相比「传统」的助记媒介嵌入式复习框,这种在阅读中复习方式可能更自然,前者可能让人感到阅读的节奏被打断。问题是,这些就地的复习可能效果不佳。复习得过早。你刚刚读了包含那个概念的句子,所以(通常)很容易给出回答——可能是来自短期记忆。间隔效应的研究表明,这种即时复习可能不会让记忆巩固太多。最好等待几分钟;或者,更可能需要等待几个小时。另外,至少在这个原型中,读者并没有告诉系统他们的记忆提取是否成功。这意味着我们无法适当地设置初始复习间隔。但也许这都无所谓。我认为在间隔重复记忆系统中,最重要的事情是营造正确的情绪体验。即使在调度算法十分朴素的情况下,这些系统的效率也足够了;问题在于人们不喜欢使用它们。如果这种就地的复习感觉比那些相对打扰人的复习框更自然,那么接受这里的效率下降也无妨。
如果卡片被「折叠」(在 IMS 中,以及在小屏幕的 Shape Up 上),我之前描述的那些行为就会发生显著变化。有少部分读者会把鼠标放在每个卡片的标记上,查看它的内容。但大部分读者只在某个段落让他们感到特别困扰或者特别有兴趣的时候,才与卡片互动。身为设计者,我对增加用户的交互负担感到担忧……但是在「折叠」模式下的阅读行为,给我一种更健康的感觉,至少更接近我原本的设计目标。
对于这个问题我该怎么办呢?我的直觉是把「折叠」模式设定为默认选项,同时让用户可以自行修改。当我将这种媒介应用到更多的文本,进行更多用户观察时,我会在每次使用时随机更改这个设定,持续观察人们的反应。
「保存卡片」是正确的原语吗?
全有或全无的卡片保存行为
在这种新设计中,保存卡片成了一种轻量级的行为,它表达了你对某段文字的浓厚兴趣。「我对这个细节十分关注,我想通过反复练习记住它,使其深深内化于我心中。」新设计流畅、即兴并富有情境感的操作流程,确实让人感觉舒适。但是,无论这个交互动作有多轻便,其表达的愿望都异常强烈:你承诺要反复接受这个细节的测试。当然,如果我们在复习界面中的筛选工具设计得恰当,你可以在后续逐步摒弃那些让你感到乏味的卡片。当然,使用 SRS 系统的「老手」知道,卡片的成本实际上微乎其微——可能第一年只需要三十秒,之后的时间甚至还能减半——因此你其实没有太大的负担。但在你决定保存浮动在边栏的卡片时,你的感觉常常并非如此。
测试读者经常发现自己想要在关键段落做个标记,以此来强调,「这一点很重要!」。但他们的冲动往往与「保存卡片」这个念头并不一致。他们可能只是出于一种本能的情绪反应,想要找个方式来表达这种情绪,并不是真的打算为自己安排将来的复习计划。我的原型设计把他们的这种冲动限制在两个相去甚远的选项中:你要么保存(或创建)一张关于那段内容的间隔重复卡片,要么让文字完全保持原样。
我发现,太多的冲动都在这两种选择间无所适从。我看到读者在阅读时常常犹豫,他们可能会选中一段话……然后他们就开始寻找高亮功能,或者希望能给这段文字加个「书签」,或者把它「安全地搬到」笔记系统里。读者会创建一张空卡片作为「占位符」,就为了标记他们觉得重要的部分。虽然这种做法不太好,但你又能责怪他们什么呢?他们别无选择!
这不仅是我的原型存在的问题,同时也是数字阅读普遍存在的问题。这就好像你看书的时候,书却被一块玻璃隔着。网络阅读更是糟糕。即使你正在使用支持高亮和做笔记的浏览器插件,但总感觉就像是手上套着厚厚的手套在翻书。你无法真正地在页边的空白处涂鸦:因为你的笔记都藏在图标后面,或者是在一个无空间感的侧边栏里。无论你在 EPUB 还是网页上,你能做的就是在文本上做小小的黄色标记。想随意做标注?「天呐,如果页面重排怎么办?」安别慌,工程师,你需要想出解决办法。(苹果的 Pages 做得差不多了!至于 PDF,可以看看 LiquidText;至于网络阅读,学术系统 iAnnotate 和 SpaceInk 做了些尝试。)很少有数字阅读工具可以像实体书那样,给予你如同用笔、荧光笔、便签和纸张一样的表达空间。没错,超文本很好,搜索功能很方便,复制和粘贴也很实用。但是在电脑上,我仍然感觉像是隔着一块厚厚的玻璃在阅读。我要想插入自己的想法,还得填一堆表。然后,也许,才能显示一个黄色的矩形框。
我猜这段牢骚恰好戳中了许多测试者的心声。我给他们展示了一个他们未曾意识到自己渴望的东西:一个能和网页书籍进行空间交互的工具,一种能在「页边空白处涂鸦」的方式。但结果却是又一种形式化的工具——这回甚至直接就是又一份需要填报的表格!靠。
渐进主义
除了表达能力问题,优化这个原型的全有或全无交互方式还有另一个重要的理由:渐进主义。在一些情况下,读者对间隔重复的了解还不够,或者他们对高亮的认知价值有所误解。更多的时候,读者只是还没有准备好做出超过简单高亮的任何承诺。他们有点兴趣。但他们还不确定这个兴趣有多深。通常来说,只有在你读完一整部分内容后,你才能明确地评估什么是对你重要的。相比你真正想做的行动,保存作者提供的卡片可能有点过了。如果没有提供卡片,情况就更糟了:对大多数读者来说,写一张全新的卡片需要巨大的投入。
高亮标注有时只是漫长过程的开端。有些读者习惯先草草地带着高亮笔过一遍;等对全篇有了大致了解后,他们会再细心翻阅那些重要的部分。另一些人则愿意先大概读一遍,然后让内容沉淀一下。如果他们发现在接下来的日子里这些内容一直盘旋在心头,他们就会借助这些高亮标注来深入研读文本。
如果 Orbit 能够促进这种渐进的方式呢?以下是我对其可能的运作方式的简单梳理。首先,你读第一遍文章,高亮标记一些让你印象深刻的部分,甚至可能做些简短的记录。过了一周,你可以看到你之前做的摘录和笔记,用类似 LiquidText 的方法,让这些内容在原文的上下文中流畅展示。如果你对某些高亮标记重新激发了兴趣,就可以付出更多的努力,将它们转化为卡片,或者干脆多花点时间关注这段文本。Taylor Rogalski 称这种方法为「反向 Orbit」:你起初与文章保持一定距离,然后再将重要的观点引入更紧密的轨道。
我对这种渐进的工作流程有天生的兴趣,但过去的一些尝试让我小心翼翼。例如,Readwise 就实现了类似的模式:先高亮文本,然后(回复定期发送的电子邮件)将最有趣的材料修订为卡片或更深入的笔记。我和很多 Readwise 用户交谈过,但我没有遇到谁真的充分利用其渐进细化的工具。在进一步推进这个想法之前,我需要对此有更深入的了解。就我个人来说,我发现一旦过去了几天,我常常会失去对文本的情感联系。零星几处的高亮往往不足以重新激发我对它的兴趣。有时,我会在一本纸质书上做些标记,打算稍后写一些卡片。但到了下个星期,当我看到桌上的那本书,我感觉好像是给自己布置了作业。相反,在阅读体验中,文本的叙述会产生强烈的情感联系。这通常足以激发我在阅读时就开始写卡片。到了第二天,写卡片就变得烦人了。我通常需要重新阅读文本一段时间,才能再度激发自己的兴趣。如果与相关段落的作者提供的卡片已经可用,这种情感的疏离可能就无关紧要了。我可能只需要点击一个按钮,就接受了作者的卡片。但我担心,这种情感问题还是广泛存在的难关。
另一个值得一提的研究成果出自 Piotr Wozniak,他是当代间隔重复学习法的开创者之一。他的 SuperMemo 系统内置了一个叫做「渐进阅读」的功能,也试图满足类似的需求。这个设计虽然用户不多,但确实有一群极度热衷的支持者。不过对我来说,这不是一套合适的原语。在 SuperMemo 的渐进阅读工作流中,你主要的操作是精炼和摘录。你从将一篇完整的文章精炼为几个需要进一步关注的简短摘录开始。然后,在之后的阅读里,你只会看到这些摘录——每一个都是孤立的,脱离了上下文——你可能会将它们编辑成聚焦于你认为最重要的内容的摘录。然后,在下一次的阅读中,你可能会把这些摘要变成间隔重复卡片。这些卡片通常是挖空卡,很容易制作,但效果不是很好。我喜欢渐进主义;我喜欢 Piotr 的劝告:一旦你感到无聊或注意力不集中,就立刻停止阅读。但我不喜欢的是,主要的原语都是去上下文化的。在 SuperMemo 的概念框架中,文本就像是充满词汇的信息篮子,等待着你去挖掘出宝贵的知识精华,然后「存下来」。但对我来说,文本有叙述,有散文,有结构,有声音。卡片是有用的,但它们不能替代原文那更丰富的内容。我不希望削减原文;我希望在它的基础上,叠加不同的视角。
围绕想法行动,而不是围绕卡片行动?
我有种直觉,单纯依赖渐进主义的方式恐怕难以解决我在测试中发现的情绪问题,但如果我们能让核心行动更直接地与读者的表达意图匹配,或许能望见一线曙光。这就是我想试一试的方法。
我最新的原型试图实现这样的工作流:读原文,遇到觉得重要的想法时,查看侧边栏中相关的卡片,阅读并评估它,如果它能符合你的期待,就保存下来。那如果我们将主要的工作流改为围绕想法,而非围绕卡片,会如何呢?可能的做法是:读原文,遇到觉得重要的想法时,选取一些相关的文本,然后点击「保存」。就这么简单!你选中的文本就会高亮,存入你的个人摘录库中。你可能还可以顺手记下一条与其相关的笔记。
我刚刚说的,其实只是一个普通的标注工具而已。但助记媒介的独特之处在于:如果你保存的文本里面,恰好关联了作者提供的相关卡片,那么这些卡片也会被自动保存下来。这些卡片在你以后复习的时候就会像往常一样出现,可能会加上一些设计元素,用以把它们和你保存的文本(以及其上下文)联系在一起。这些卡片一旦保存,你就能在侧边栏看见(选择的时候也能稍微看到一些),所以你可以评估它们,要是觉得需要,还可以进行编辑或删除。但我其实希望你通常不必费心考虑这些卡片。你只需要暂时接受和你的高亮部分相关的作者卡片;我们会让你以后想要丢弃它们的时候尽可能轻松。如果没有作者卡片,你会发现侧边栏一片空白。你可以选择立即写一张卡片,不过你也可能稍后再通过一种另行设计的呈现流程,将文本提炼成卡片。(至于 Readwise 用户在后面这个步骤中遇到的问题该如何解决,我现在还没头绪。)
我没有完全解决这个问题。读者们希望能有一个风险较低的方式,来表达他们觉得文章中哪些地方重要,而不必决定是否「保存卡片」,或者承诺自己将来要复习。但我认为这个流程启示了一个重要现象:读者往往只是想表达他们对某个想法的热衷。强迫他们去处理「和他们感兴趣的想法有关的卡片」,就加重了他们的负担,让他们偏离方向。如果我们能在阅读体验中消除这种干扰,我想大家就不会有太大压力去挑选和决定卡片了。那些认真阅读的人可能会欢迎在以后的复习中出现与他们的高亮内容相关的高质量卡片——尤其是那些能明显与读者选择的文本联系起来的卡片;如果这些卡片给人的感觉像是暂时的提议,而不是责任;如果拒绝这些提议感觉轻松、不带罪恶感、而且可以撤销。在这里,我们有足够的空间调整选择添加或取消添加的感觉。
以想法为中心的交互模式仍旧能带来之前所提及的许多间接好处。那些未被保存但是关联着卡片的文本可能会有浅浅的高亮,或者在文本边缘还会有一些小图标——总归会有一些方法能让你大致了解文本的额外层次,让你不经意间就领悟到「这里有重要的东西!」。如果你想更深入地研究文本,你或许可以开启一个功能,像这个原型那样在侧边栏显示未保存的卡片。
说到这里,有趣的是,当你不是在认真阅读,或者你对文本不太上心的时候,以想法为中心的设计就大有裨益了。有人可能会合理地提出,我不应该在这种情况下浪费精力。这样做并没有充分利用这种媒介的优点——即帮助认真的读者去理解难以理解的材料。事实上,当你非常认真地阅读的时候,你可能会希望默认保存每一张作者卡片;任何高亮显示的交互都会显得麻烦。但我现在的感觉是,这条界限并不那么明确;人们对文本的态度会根据实际情况反复变化。
这只是粗略的想法,很多难题还没解决。最棘手的是:如何处理那些涉及整个段落,而非具体短语的高阶总结或提炼卡片?这种卡片往往最有价值。一个简单的解决方案是,只要你标出了这些卡片涵盖的长篇段落中的任何短语,就包含这些卡片。但我对这个办法并不满意。
更实际一点,我并不想再推出一个新的注释和摘录工具,尤其是考虑到用户自然会期待后续的图书管理和整合工作流。只有当我找到了避免这种情况的方法,我可能才会走这条路。
文中复习
这种以想法为中心的设计思路,让我重新对一个已经琢磨了好久的问题产生了兴趣:我们能不能让复习过程直接在文中进行?目前,你阅读一篇助记文本,保存了卡片,之后这些卡片就一张接一张地出现,与它们的来源完全没有联系了。你可以点击一个链接回到原文的位置,但这就意味着你需要离开复习,切换到另一个界面和工作流。这种复习与文本的分离削弱了卡片与原始叙述的情感联系。同时,这种分离也增加了满足好奇和修正错误的困难。比如,如果你记得答案但是不太理解它的含义,你应该能够顺畅且即刻查看原始上下文,且不打断你的复习节奏。同理,如果你突然想看一看你记得在原文附近的插图,也应该可以轻松做到。
在过去的四 (!!) 年里,我曾数次试图实现这样的设计,但都未能成功。以下是我在此过程中发现的几条笔记:
-
你不想为提取练习提供过强的线索。所以,也许只有当答案揭示时,才展示其上下文。
-
过多的附加文本往往令人应接不暇,让人分心,无法专心回答问题。因此,这些文本可能需要逐渐模糊,但在你触摸或挥动时又会变得清晰。
-
通常,人们在手机等移动设备上进行复习,这就需要在显示答案的屏幕空间和显示上下文之间进行权衡。那么,或许上下文可以模糊地「隐藏」在答案的「后方」,而在你触摸屏幕时,它就能「浮出水面」。
-
还有一个大胆的想法,就是在文本的上下文中展示每张卡片,而像填空卡一样挖掉它们。这样,复习就会变成一连串的源文本窗口,每个窗口都会有一部分被遮盖。但是,这种方法提示性过强,而且填空卡似乎并不如问答卡有效。
-
最后,一个更广泛的问题:当你对一个主题的理解越来越深入时,你对卡片的理解往往已经超越了任何来源,而变成了它们之间的联系以及你自己的观点。如果我们仍然固执地将卡片明显地固定在某个源文本中,这可能实际上会阻碍这个过程。
我直觉上感觉这里一定有个好办法,能从根本上改变复习的感受。我想这也有助于模糊重显高亮和重显卡片之间的界限,因为这两种交互都紧紧依附在原文的语境中。这种界限的模糊,反过来又可能让文中「保存」这个动作变得更加自然。找到这样的解决办法,或许能开启一种新的「渐进阅读」方式,让你像在 SuperMemo 中那样,既能提炼出关键的观点和联系,又能保留原文的丰富语境。
「新手引导」
事与愿违,我实验的一半读者要么对间隔重复一窍不通,要么就是没看出这个方法在除语言学习以外的地方,对他们这些脑力劳动者有何益处。一开始这让我颇感不快——我原本并没打算对这种对间隔重复一知半解的读者进行测试——但是我稍后会解释,这反倒成了个有教育意义的经验。我为了不白费这些实验,花了五到十分钟的时间向这些对间隔重复一无所知的测试者推广其在理解概念性知识上的优势。我做得还算不错:在那些真正需要这些知识的、对间隔重复一窍不通的测试者中,几乎所有人都开始认真对待这个方法。但这些对话明显地体现出我在「新手引导」设计方面所面临的重重困难。
在《量子国度》中,我们把大约两千字的媒介长篇介绍巧妙地融入到了第一章中。我们并没有一口气全说完,而是一段段、一点点地嵌入到了首章的结构之中,与具体的界面元素并列,一起向读者传递上下文信息。然后,我们利用后续的邮件跟进和复习总结,慢慢地、逐步地增加解释的深度。这看起来确实起了作用,但我摸不着头脑,不知道怎么把《量子国度》的这种手法迁移到一个通用系统中,让每一篇文章都能像嵌入这样的层次。默认情况下,用户速通界面文本。《量子国度》的读者能够有耐心读完我们的长篇介绍,是因为这些介绍是用书中作者的笔调写出来的,这种笔调在讨论媒介之前就已经获得了读者的信任,而且这些解释在风格上和结构上都被当作主文本的一部分来呈现。
有些测试者已经读过《量子国度》。他们立即理解了我目前的原型。看来,新手引导至少是有「迁移效应」的。还有一部分测试者可能没接触过助记媒介,但他们读过 Michael Nielsen 的《增强长期记忆》或 Nicky Case 的《如何永远记住任何事情》或 Gwern 的《高效学习的间隔重复》。这些测试者也立刻领会了助记媒介可能带来的好处。这进一步证明了长篇介绍文章能做到这一点。然而,这些文章都比《量子国度》中关于媒介的部分长得多。因此,我们在实践中并没有取得太大的进展。
最后一批测试者在学习语言或者一些需要死记硬背的科目(例如解剖学、药理学)时,已经积累了大量间隔重复的经验。这些测试者对助记媒介的反应各不相同。一种常见的反应是:间隔重复记忆法对学语言真的很管用,但我从没想过怎么把它用在其他地方——哇,这真是太棒了!然而,另一个常见的反应是:间隔重复学习虽然有用,但却很繁琐;它只是用来死记硬背大量信息;我真不觉得这能帮我理解我感兴趣的事情(小声嘀咕:我不认同你的解释)。对这类用户,以及那些有过在学校里不好经历的人,我猜可能还需要做一些反引导工作。
我渴望摆脱「复习」这个词,甚至是「重复」这个词。相比「记忆」一篇文章的观点,人们(正确地)对「内化」它们更感兴趣。在理想状态下,这个系统是关于沉淀思考,是一种强大(但相当轻松!)的方式,帮助你与自己认为重要的理念深度交融。这不是关于「学习」、「复习」或者「练习」。我提出这些替换词,不是为了浮夸地重新包装:我希望改变系统的内在机制和给人的感觉,以更好地反映我想要强调的词语。
撇开用词不谈,如何让系统向初次接触 SRS 的读者解释自己呢?目前,我还没有头绪——我更倾向于把这个问题放一放。近期,我想将主要精力放在通过精心挑选的文本进行演示,这意味着我可以至少在一定程度上借鉴《量子国度》的方式。我打算撰写一段扼要而深入的介绍,让作者能够「用他们自己的口吻」在文本中表达(如有必要进行修改)。我会在那里以及用户界面中,加上链接,指向「Orbit 网站上」的一篇更深入、论文式的详细解释。
长期来看,「正确」的引导方式会很大程度上取决于上下文。如果我在探索的是作者亲自参与的助记文章,那就应由作者亲自来介绍这种形式,我会在旁边协助他们。如果我正在准备的文本是要在课程或项目中使用的,那么引导这种形式的工作应由课程负责人完成,我同样会提供帮助。如果我尝试的是在任意文章上添加可分享的用户生成「层」,我就需要依赖于社区来编写并流传一些像 Nicky、Michael 和 Gwern 那样经典的介绍,或者参考他们的作品。也许在某个时候,人们会制作出一些经典的 YouTube 介绍视频——也许会在我开始尝试助记视频的时候吧?
下一步计划
除了上述的概念性讨论之外,我还有一些日常设计问题需要解决。比如,人们期待他们保存的卡片能在章节结束时的卡片列表中以某种方式呈现。当用户在 IMS 中费尽心思挑选出重要的卡片时,他们却发现内联复习中依旧包含每一章节的所有卡片,这让他们感到困惑。至于「跳过」按钮的功能,几乎没有人能够理解。诸如此类的问题还有很多,不过我觉得这些问题都是可以解决的,我希望在下一轮的测试之前把这些问题处理清楚。
接下来,我想探索 IMS 和 Shape Up 之间的一些中间地带:对技术话题的不那么正式的「解释」,以及对非技术主题的深度探讨。我也希望找到一个更为真实的场景来测试系统,让读者真的感到他们需要学习这些材料,也许是作为一个由他们自己驱动的项目或者课程的一部分。
同时,我将开始着手构思一些设计概念,以解决我在上述讨论中描述的更多的概念性问题和挑战。我们拭目以待。
----------------
我要感谢 Taylor Rogalski 对以卡片为中心与以想法为中心的交互设计讨论的有益建议。我也要感谢 Hammad Bashir,他在实施这个最新设计中与我同行。
液体橄榄和苹果手机;解决问题和发现问题;不确定性思维
我在中西部长大,那时我对高级餐厅的看法非常简单。首先,高级餐厅有高级服务员,他们不会让你用错餐具。其次,高级餐厅使用更高级的食材:菜单上可能包括肉眼牛排和龙虾,而不是汉堡和烤肉。但后来我搬到了加州,长话短说,一碗木薯粉竟让我落泪了。我才明白,伟大的餐厅是具有非凡创新性和艺术性的稀有机构。
大约在这个时候,我白天是苹果公司的实习生,晚上则在如饥似渴地学习高端烹饪技巧。我觉得这两个世界之间有很大的联系。在我职业生涯的那个阶段,它们共享一种必要的匠人(shokunin) 式的工艺:是的,发明很重要,但首先我们必须完美地呈现每个像素,精确地切割细丁(brunoise)。但是——这在当时对我来说是相当神秘的——这两个世界也都有一些实践者,他们思考着不可想象的事情,推动着他们的领域向前发展。这两个世界是如何并存的?这些团队是如何运作的?
在世界最好的餐厅,每晚提供出色的服务是不够的。这是一个竞争异常激烈的领域。坐以待毙意味着落后。苹果公司的情况也很类似:iPhone 可能是有史以来最令人惊讶的消费产品之一,但仅仅每天生产同样的设备是不够的。同样,世界上最好的餐厅在专门的研发业务上花费了大量资金,开发新的烹饪方法,采购和了解新的原料,发明令人惊讶的工艺改进,并发展餐厅独特的烹饪风格。
我相当羡慕 Vaughn Tan 为准备他的新书《不确定性心态》所花费的时间。他把自己置身于世界上一些最好的餐饮集团的烹饪实验室中,研究他们如何开设新店、解决问题、开发新菜品——并在马戏团帐篷下的泥地里召开了一次重要会议。从他的观察中,Vaughn 在这些团队的组织实践中提炼出几个共同但不寻常的特征。在阅读这本书时,我感到很震惊,因为这些做法与我在苹果公司的最佳经验是如此相似。我将分享其中的一些故事,以及它们与 Vaughn 的烹饪研发团队的故事之间的关系。尽管我对这本书感到兴奋,但我注意到它的做法似乎与我的经验不太一致,因为它们已经越来越多地转向研发的「研」方面。我也会试着描述这种演变的特点。
不断协商的角色
在初创企业中,角色是流动的。每个人都有很多头衔:重要的不是你的工作描述,而是需要解决的问题。不过,随着公司规模的扩大,抽象化变得很重要。如果没有明确的工作头衔和责任范围,管理成千上万的员工会非常困难。不过,至少在 iOS 的早期,苹果公司是这样做的。正如 Vaughn 所说,角色是「模块化和临时的」。我们为每一个新的问题流畅地组合起来,为那个特定的项目提供所需的技能。
我的头衔是「软件工程师」,但在实践中,这不是一个对组建团队有用的描述词。它既太宽泛又太狭窄。首先:是哪种软件工程师?最初,我的经验主要是在界面和 API 设计方面,但我最终发展了架构和系统工程方面的技能,这将使我被拉入一套完全不同的项目中。但更重要的是,我的角色演变为包括有意义的设计和产品管理工作,部分是为了满足项目的需求,部分是为了满足我的兴趣。这对我个人来说是很好的,它使我保持兴趣,但对组织来说也是很好的,因为像 parallax 这样的项目需要具有不同技能组合的跨学科的团队
Vaughn 认为,由于活动本身的不确定性,这种不断变化的角色定义对于团队的创新至关重要。考虑一下 el Bulli 著名的液体橄榄:一个看起来是橄榄的卵形体出现在你面前的勺子上,但当你把它放进嘴里时,你会发现它实际上是一个围绕着爆炸性橄榄汁的薄纸膜。为了制作这些球体,厨师们将橄榄汁滴入海藻酸钠溶液中,使其发生反应,从而形成精致的皮肤。想象一下,你正在为一个烹饪研发团队进行招聘,你想雇用发明这种技术的厨师。你在工作要求上写什么头衔?什么资格?材料科学?化学工程?糕点烹饪?当然,这个提示的前提是,你甚至能够将「发明液体橄榄」作为问题陈述——你不能这样做。这样一个团队的活动本质上是不确定的。这并不是说它们是危险的:危险是你可以理解、计划和管理的。相反,它们只是充满了未知的未知数。你的团队成员的角色必须处理这种固有的不确定性,而这种不确定性本身会随着时间的推移而变化。
演示驱动的开发
当然,并不是厨房里的每个角色都是如此模糊不清。你也会需要一支单纯的预备厨师队伍。同样地,苹果公司的绝大多数软件工程师仅仅只具有软件工程师的能力,也只需要大多数软件工程师仅仅作为软件工程师就能感到高兴。在苹果公司分离那些极不寻常的工程师的过程听起来非常像 Vaughn 描述的烹饪团队使用的过程。
我从一个简单的软件工程师转变为一个「演示驱动的开发」的过程,我的导师 Ken Kocienda 在《创意选择》(推荐!)中介绍了这个过程。我们的工作围绕着一个有规律的示范节奏进行。当我在 iOS 上研究从左到右滑动导航的手势时,我每隔一两天就会向设计师、工程师和高管演示我的工作。苹果公司软件工程主管 Craig Federighi 会到我的办公室来,玩玩这个手势,注意哪些地方可行,哪些地方不可行,提出建议。所有这些都有助于使手势本身良好。但它也有一个重要的组织目的:这些项目和演示作为正在进行的公共测试发挥作用。每个人都能看到我是如何处理(或未能处理)各种出现的问题的。当下一个项目来临时,这将有助于领导层组建更好的团队。因为我的同事们也参加了许多这样的演示,他们可以亲眼看到我在哪些方面做得很好或很差,这既可以为他们自己的工作提供参考,也可以在未来的项目分配中减少怨恨或困惑。
如果你要有一个不断协商角色的团队,你需要一个不断协商的背景。这些演示将「测试」与实际工作统一起来。Vaughn 描述了烹饪研发团队遵循类似的路径,通过要求团队成员在不同的操作配置中解决各种各样的问题,来测试他们的能力。每一天都在集体品尝中结束,就像我们的日子经常在集体演示中结束。
这种项目驱动的方法也为新员工创造了肥沃的培训土壤。不断的反馈是新团队成员学习公司「风格」的好方法。不同的指导合作可以被尝试和摒弃。这使得培训感觉有点杂乱无章——有时还相当紧张——特别是在追求开放式目标时,很难创建一致的正式培训计划,原因与在这种团队中很难精确规定任何人的工作职责一样。
绝望的项目
烹饪研发团队的另一个常见做法与我在苹果公司的经历有很大的重叠:战略性地使用绝望。摘自 Vaughn:
模式中的每一点都是这样的:对一个超出团队能力的项目作出承诺,团队中的每个人和集体一起发狂,疯狂地工作,最后以某种方式从失败中取得胜利,大大地松了一口气。我常常遇到这样团队的人。当他们处于这些项目的中间时,他们似乎很绝望:情绪和心理上都很疲惫,担心(用轻微的恐惧来描述往往更合适)事情不会成功,或者(更糟糕)会是灾难性的。这些团队似乎无法从错误中吸取教训,从而避免这些绝望的项目。事实上,他们一直致力于做这些项目。在成功时会松一口气,然后--下个月或下一年——找到其他的事情来做,再次陷入绝望。
最后,我开始理解,他们把自己置于这些可怕的境地,作为迫使自己创新的一种方式,这种绝望是有成效的,而不是破坏性的。尽管是绝望,但却是设计好的。
2012 年底,我在一次长途飞行后着陆,当我们 300 人同时关闭飞行模式时,我们共度了仪式性的一刻。转瞬之间,我的手机被在扑面而来的通知淹没。Scott Forstall(主要负责 iPhone 创造和最初几个版本的主管)被解雇了。以前只负责硬件设计的 Jony Ive 也将负责软件设计。11 月下旬,一个真正令人绝望的项目被宣布。Jony 想重新设计整个操作系统和我们交付的每个应用程序。我们将在 6 月初把它交到开发者手中。即使我们只打算改变操作系统的最外层皮肤,这也是一个疯狂的提议,但最初的野心,至少,远远超过了这个。
只是为了说明问题,我所做的一个项目是基于这样的观察:在物理世界中,白色的东西从来就不是真正的白色。这些物体总会带上周围环境的某些特征,随着视角和外部照明条件的变化而变化。也许我们可以开发一种特殊的材料——「数字白」,它将体现出类似的微妙的动态。我的设计原型是使用陀螺仪来创造一种微妙而鲜活的光泽,几乎就像书皮上的素压印。我们的想法是用它来表示屏幕上的可互动元素,因为我们正在剥去按钮的拟物设计束缚。我们最终放弃了这个想法,因为这种设计太耗电了,用 Jony 的话说,这个想法「有点......疯狂」。
但是,这仍然是我在那七个月中领导的至少半打类似的主要的、全系统的项目之一。我的日常工作很简单:每天,我醒来,翻身,拿起我的笔记本电脑,一直工作到睡觉前才放下来,天天如此,连续七个月。我们在深深的绝望中工作,但正如 Vaughn 所描述的,这绝对是我生命中最令人振奋,充满变化的时期之一。
解决问题和找寻问题
当我阅读 Vaughn 的书时,我感到我在苹果公司的经历,和他的烹饪团队的故事之间有很深的联系。但是,这种联系相比与我在可汗学院的经历相比要弱得多,而与我最近的研究相比则更弱。我无法完全描述这种差异,但我认为它可能建立在创新和发明,解决问题和寻找问题之间的区别上。
我和我的朋友 May-Li Khoe 一起加入可汗学院,她曾在苹果公司深度参与创新工作。我们一起成立了一个研发小组,希望将这种探索性的工作带到可汗学院。在我任职的五年中,这个小组的职责发生了很大变化,在这些变化中,我觉得注意到了 Vaughn 描述的工业研究的局限性。
对于我们的一些项目(如在线扩展开放式问题),我们的团队几乎就像组织中其他部门的内部顾问,为一些可以被模糊定义的问题创造解决方案。这在很多方面都与我在苹果公司的时候相似:是的,我们在创造有趣的新界面,但是是为了回应某种外在的问题表述。在这种情况下,问题表述基本上从来没有被完全定义过——项目的一部分是在商讨要解决的问题到底是什么,例如「撕毁简报」等等。项目之间的部分工作是为未来要解决的问题向高管进行游说。但问题表述的存在是项目的基础,它确定的项目的界限。定期的演示是有意义的,因为你可以在不断发展的问题表述的背景下评估它们。绝望可以施加有用的压力,因为你可以做出务实的权衡,也许可以牺牲一些大胆的艺术性来追求一些实用的解决方案。
但我们的一些项目(如 Cantor)更多的是在寻找问题而不是解决问题。没有明确的问题表述。没有一个真正的客户或顾客。事实上,要做的最重要的工作是确定一个强有力的问题表述——对于许多这样的工作,我们从来没有做到过我今天工作中有趣的部分大多是这种类型的。是的,有一些具体的问题需要解决,其中很多我已经在这里讨论过了,但我工作中最强大的力量是关于寻找问题。与我的其他经历相比,这项工作感觉与 Vaughn 的描述联系得更少。
与运动员和音乐家相比,为什么知识工作者对提高他们的基本技能似乎根本就不认真?我们如何才能创造出既能完成既定的工作,又能更积极地参与所希望产生的影响的环境?这些已经是非常不寻常的问题,仅仅提出这些问题就是一个重要的贡献。但是这些大视野的问题表述碎裂成一百个子问题,而我工作中的大部分进展来自于识别和改进这些子问题的表述。当然,实际解决这些问题也很重要,但那是下游工作。
在寻找问题的时候,理论和概念往往是行动的中心。快速迭代的演示和原型变得更难产生,而且在这个阶段,更不相关。至少在我的经验中,绝望变成了一种不太有用的力量。当我们还不可能清楚地表达出一个需要解决的问题时,在火上浇油只会产生胡乱的喷发。一天中往往需要漫长的散步思考和长达数小时的午餐讨论。
我承认我不太理解这种区别。我的经验表明,一定量的「演示」和一定量的绝望实际上对研究很有帮助。但我注意到,沃恩描述的大多数故事都是一个烹饪研发团队对外部定义的问题(尽管可能是一个模糊的问题)做出的反应:这个试吃菜单需要一个清口剂;这些通心粉的生产效率很低;这家餐厅需要帮助开业;等等。可以从一些蛛丝马迹发现问题,比如上面描述的 el Bulli 的液体橄榄,但这些并没有像其他的那样被清楚地记录下来,而且很明显也不清楚这些故事是否遵循了同样的原则。毕竟,据我所知,是 Ferran Adria 本人(主厨)开发了这项技术,而不是他雇佣的某个研发团队。
这就是发明和创新之间的区别吗?学术研究和应用研究?学术界和工业研发?这些界限很模糊,我并不敢说了解它们。在我度过的著作中,Vaughn 的书是讨论工业研发组织最有见解的!——现在我渴望了解更多,更多地关注研发这个方程式的「研究」方面,而不是「发展」方面!
感谢 James Cham,他向我推荐了这本书,并促使我将书中的观点与我自己的经验进行比较。
记忆系统如何帮助解决问题
原文:Memory systems and problem-solving practice | Patreon
大部分有关记忆系统(助记系统)的讨论都存在一个问题:这个系统真正的目标,不是记住卡片上的答案,而是扩展你思考和付诸实践的能力。当然,你的 APP 会告诉你,你可以把这组卡片记得很牢,历经好几个月而不忘。但这对你真实的行动与思考意味着什么呢?其中的联系还不甚清晰。如果我们的目标是获得实际运用的能力,而不是死记硬背,那么对于记忆系统,应该如何使用、设计和重新定义呢?多年来,我一直想深入研究这些问题,但建立有效的实验环境相当困难 。令人高兴的是,这个月,我可以与一位学生合作,观察他如何迁移记忆系统中得来的知识,应用到解决复杂的问题上。
我一直在担任 Alex 的「个人学习助手」,他是一名成人学习者,正在学习物理,为了一个有意义的项目服务。我们每隔一天或两天就讨论他在学习过程中遇到的问题和取得的进展;我聆听他的辅导课程;我指导他应对遇到的挑战;并且我为可能有帮助的干预制作原型。这个月,Alex 一直在学习由 Young 和 Freedman 所著的经典教材中的静电学。我撰写了记忆卡片以加强内容的掌握——我们学过的每一章大约都有 70 张,涵盖了声明式、程序式和概念层面的材料。
然而,问题来了。在 Alex 阅读每一章并完成了几轮记忆练习之后,他仍然觉得课本的习题很困难。我敢肯定,记忆练习是有帮助的:在解决问题时,他能够凭记忆回忆起长长的方程式和定义。然而,仅仅通过详细的记忆练习,还不足以让他独立地解决复杂的习题。他的学习停滞不前,而且会犯显著的错误。
在解题上花了很多小时后,Alex 发现答题变得更容易了。在解决这些习题时,有一些重要的事情发生了,重要程度要超过他在读教科书,做精细记忆练习时发生的事情。当然,这背后的代价并不轻:我估计他在解题上花费的时间,至少是阅读和复习文本的四倍。
在某种程度上,这并不令人惊讶。当然,学某个主题时不能仅仅阅读相关内容。你甚至不能只回答一堆问题。你必须去实践这个主题。但在解决问题的过程中,在认知上发生了什么?我们能否安排某种有针对性的练习,以更有效或更高效地引起这些变化?对于那些没有现成问题集的主题,这意味着什么?还有:我们如何确保在此期间获得的任何见解,都能像通过记忆练习加强的其他材料一样能保持下去?
迁移恰当的加工
我们可以从名为「迁移恰当加工」的理论中找到一组答案。这一理论认为,我们记住信息的能力,在某种程度上,取决于编码时的加工方式,与回忆时的加工方式,多大程度上是匹配的。仅仅练习回忆信息并不足够:练习中对信息的处理,应该与日后应用时的加工方式相同。
我在 Alex 身上亲眼目睹了类似的情况。他可以流畅地向我解释电场与电力之间的关系,但遇到个问题需要求出某个电场对某个电荷施加多少力,他却难以应用这一知识。当我演示了如何做到这一点时,他很快就理解了这与他刚刚给出的概念解释之间的联系。但是,这种联系是与解释本身分开的东西,而不是解释本身。
认知心理学家 Garrett O’Day [最近进行了一系列相关实验](http://andymatuschak.org/files/papers/O'Day - 2019 - Improving Problem Solving with Retrieval-Based Learning.pdf)。他旨在探讨迁移恰当加工对提取练习的影响,特别是在解决复杂问题的背景下。在一个实验中,他给本科生提供了关于泊松过程的简明教程。「练习」组需要测试回忆解决泊松过程问题的程序步骤,而与此同时「对照」组则阅读更多的例题。然后,他们被要求解决类似于他们所学习的问题。这种情况通常会引发「测试效应」——主动提取通常比被动重读产生更好的表现。但实际上并没有。这两个组的表现差不多——表现都很差。O’Day 进行了后续实验,其中「练习」组会重复解决类似的练习问题并接受反馈,而不仅仅是回忆过程步骤。这次,在一周后的后测中,练习组的表现明显优于对照组。
仅仅学习例题是不够的;复习过程步骤也不够。这两组在后测中的表现都很差。O’Day 的实验表明,要想提高解决问题方面的能力,你需要练习解决问题,最好是有反馈。从理论上讲,迁移恰当加工表明,你不需要解决问题本身;你只需要做一些练习,其中涉及了与问题类似的认知加工过程。我不确定这到底是什么。也许只需要设定一个问题,或者在解决问题的过程中采取某个「步骤」就足够了。目前,我还不知道有任何这方面的实验。
图式习得:提升解决问题的灵活性
O’Day 的研究结果强调了另一个挑战。如果测试问题与练习问题相似,练习会带来良好的表现。但是如果测试问题需要对过程进行小幅改动,表现就下降了。练习带来的收益没有得到迁移。
认知心理学家 Yeo 和 Fazio 在使用类似材料的几个实验中[观察到了类似的结果](http://andymatuschak.org/files/papers/Yeo, Fazio - 2019 - The optimal learning strategy depends on learning goals and processes2.pdf)。不过,他们还观察到另一个有趣的现象:在练习问题特别难(正确率 < 50%)的一个实验中,相比解决练习题,学生学习例题效果更好。然后,在后续实验中,当材料发生变化以在学习阶段提高问题解决能力时,测试效应又回来了。
Yeo 和 Fazio 提出,我们实际上观察到了多个过程在相互作用。一方面,学生需要将他们学到的东西转移到长期记忆中,并提升熟练度。练习和测试能支持这个目标。但要在测试中解决迁移问题,学生还需要将他们学到的东西进行泛化。文献将其称为「图式归纳」。[这种说法认为](http://andymatuschak.org/files/papers/Sweller - 1988 - Cognitive load during problem solving.pdf),当专家解决问题时,他们在很大程度上依赖图式,这些结构「使问题解决者能够将问题分类,化解为能够运用某些步骤解决的问题」。为了建立灵活的解决问题能力,你需要习得这些图式。这通常是通过归纳完成的——在一组问题中注意到模式,注意到某一组步骤似乎有所帮助。
另一位认知心理学家 John Sweller [提出](http://andymatuschak.org/files/papers/Sweller - 1988 - Cognitive load during problem solving.pdf),解决问题的练习存在重要的权衡。困难的问题可能会产生更强的记忆编码,但它们也会给你的工作记忆带来负担,产生「认知负荷」。结果,你可能在注意问题结构中的模式时,几乎没有剩余的容量来「获取图式」。
在 Yeo 和 Fazio 的第一个实验中,他们设置了相当困难的问题,而学习例题的学生,比解决习题的学生表现更好。作者们认为这是因为在阅读例题时,学生们遇到的认知负荷,要小于解决问题时。因此,这些读者有学习图式的脑容量余裕——尽管代价是他们更快地忘记了学到的东西。
在他们的第二个实验中,Yeo 和 Fazio 简化了问题,设置了具有相同表面特征的问题(只改变数字)。这有所帮助:练习解决问题的学生,比学习例题的学生表现更好。但他们的迁移表现很差,这是说得通的,因为他们练习了一堆相同的问题。学生们对练习问题所涉及的内容建立了持久的记忆,但他们没有获得通用的图式。
因此,在最后一个实验中,Yeo 和 Fazio 简化了习题,但让它们的表面特征各不相同。学生们的迁移表现得到了足够的改善,以至于与相同问题的表现之间不再存在统计学上显著的差异。作者们认为,这个实验的练习问题足够多样化,可以进行泛化,而认知负荷足够轻,使得图式获取成为可能。不幸的是,他们的实验并没有真正设计来测试这个特定的假设,因此我们目前只能进行跨实验比较。
这里的粗略含义与常识相符。图式获取和记忆至少在某种程度上是独立的。你可以注意到模式,但无法持久地记住;你可以强化解决问题的记忆,但这种强化很脆弱,无法迁移到不熟悉的问题上。认知心理学家经常谈论[合意困难](http://andymatuschak.org/files/papers/Bjork - 1994 - Memory and Metamemory.pdf)——产生更复杂加工的有益挣扎——但学生确实可能面临着[不合意困难](http://andymatuschak.org/files/papers/Chen et al - 2018 - Undesirable difficulty effects in the learning of high-element interactivity.pdf)。如果你想要灵活性和持久的流利,那么你应该沿着平缓的斜坡进行练习。你不想让你的工作记忆负担过重,以至于你的思维无法重新组织相关概念的表示。而且,在刚开始时,这通常意味着你最好仔细研究已解决的例子,而不是自己解决问题。简而言之(因为记忆当然与建立灵活性有关),你首先要能够解决问题,然后要建立流利度,以便长期解决问题。
我提到的所有论文都没有涉及保持问题——也就是说,在很长一段时间内持久地保持这种可迁移的解决问题的表现。我猜想一旦获得了这些灵活的图式,你可以通过普通的分散提取练习(译注:即间隔重复)来加强它们。正如我们在上一节中讨论的,你需要实际解决问题,而不仅仅是提取程序。也许你可以使用「友好数字」来设置问题,以便它们总是可以在你的头脑中轻松解决。为了加强这些灵活的图式,你需要每次都让问题有所变化。人们可能可以使用语言模型来生成这种相当好的变化,但实际上没有必要拥有一个真正无底的池子:如果练习广泛分散,你可能可以不必练习少量结构变化,特别是当数字随机生成时。
值得注意的是,此时我们正在接近智能辅导系统(ITS)的领域,这是教育技术研究的另一个分支。受到认知负荷理论的强烈启发,这些系统专注于针对理想目标,找出最顺滑的问题解决路径。这些系统更少考虑灵活运用和持久记忆这些目标,但思考如何将记忆系统与 ITS 技术相结合,或者如何调整 ITS 以支持灵活运用和持久记忆,这些方向很有趣。
知识吸收不完全
在前两小节中,我已经开始解释,在解决问题集过程中,认知上发生了什么,以及我们如何使其中一些活动更有效。但对于一些 Alex 遇到的困难,还有另一个简单的解释:Alex 实际上并没有完全理解教材所说的部分内容,而且他没有察觉到。
遗憾的是,练习并没有明确地揭示这些漏洞。如果有题目依赖没有理解的知识,这道题目只是让人感到困惑和困难,但这种感觉是模糊而无指向的。然而,在他的记忆练习的有声思维录像中,相当多的问题引起了类似这样的评论:「我记得答案是 X,但我不明白为什么」,或者「答案是 X ,我很奇怪。」举个例子,有个问题是:「如果你将装有质子的盒子在每个方向上的尺寸加倍,为什么电通量不会改变?」这个问题有很多合理的解法,但问题在于,所有解法 Alex 都理解不了。
对于这个问题和其他类似问题,我并没有试图帮助 Alex 产生新的理解或学习通用模式。这些问题实际上只是为了直接强化记忆。它们直接重述了文本中的一些重要解释,并使用了类似的措辞。如果 Alex 无法得出答案,但一旦他阅读解答,解答就立刻能让他理解,那么更多的提取练习可能会有所帮助。另一方面,如果答案没有意义,死记硬背并不是正确的解决办法。如果他不明白答案为何是这样的,那么他就没有理解我们试图强化的概念。仅仅记住答案没有多大意义。
这是一个重要的区别,需要理解,我担心这是记忆系统设计师一直忽略的一个问题:对于「错误」回答的适当干预,将因卡片的性质而有很大的不同。如果你忘记了你应该记住的东西,那么多次回顾它直到它牢记在心可能是可以的。如果你一开始就没有理解答案,那么你需要非常不同的干预。还有其他有意义的类别。如果问题是生成性任务(例如,「用五声音阶小调哼一段旋律」),你发现它太难了,你可能想浏览一些例子,或降低任务难度(例如,「为这个五声音阶小调旋律哼一个最后的小节」)。如果是解决问题的任务,你可能想阅读解决方案,然后添加关于重要模式或程序步骤的重点卡片。或者,采用 ITS 风格,你可能想阅读关于你的回答所暗示的误解的解释,然后将一些关注这个混淆的简单问题加入学习队列。
在 Alex 的情况下,我认为最合适的下一步干预就是简单地重新阅读教材中相关的段落。我不认为书中的解释难以理解;他在阅读这些段落时可能走神了。(我认为每个人或多或少会有这种情况,但我们通常没有察觉。)我已经将每张卡片直接链接到来源位置,所以从操作上来说,重新阅读相对容易,但实际上做起来会更困难。打断复习会话的顺畅进行,转而去阅读教材会让人感觉不好。此外,Alex 喜欢用手机复习,而在手机那个小屏幕上查看教材页面会非常不方便。因此,最好的办法是将这些问题标记下来,并建立一套在学习过程中处理这些问题的流程。如果书中的解释仍然无法理解,那么下一步可能就是一起讨论。或者,对于某些概念,最好暂时放一放,等到后面是否能理解。
在《量子国度》中,我认为我们的设计对这种情况有所帮助。首先,你需要在阅读书籍的过程中复习每张卡片,而不是在记忆复习会话中进行复习。因此,如果你发现自己不理解某个答案,稍微向上滚动一点重新阅读即可,这样不会打断阅读流程。由于复习是在阅读中每隔几分钟进行的,相关的段落也不会离得太远。我们访谈的读者经常表示,他们在阅读时会有一种不寻常的自信,因为他们知道,穿插的复习会确保他们能吸收到他们「应该」学到的一切。
为什么我们没有使用像《量子国度》那样的设计来进行 Alex 的物理复习呢?首先,是因为他正在阅读一本纸质版的书!后来他换成了读数字版教科书。我已经实现了集成记忆卡片的 PDF 阅读器,但 PDF 渲染太闹心,我还没有实现文本中穿插复习。目前,卡片在边栏中显示,就像去年夏天的原型那样:
在这次讨论中,难以理解的记忆卡片扮演了不寻常但重要的角色。它们不再起到加强长期记忆的作用,而是充当防护网。这些卡片保证,如果你没有理解那部分文本,或者没有集中注意力,你就会重新注意到!我认为这非常有价值。通常情况下,你会尝试解决习题,结果因为有些重要概念没有理解而停滞不前,困惑不已。正如我之前提到的,问题在于你不清楚自己缺少什么。即使阅读例题,也不可能像我们一直在讨论的简单卡片那样,让遗漏的概念变得如此明显。
从交流中学习
费曼在《讲义》一书的引言中写道:
问题是个很好的机会,可以补充讲义材料的空白,让其中的概念更符合实际,更完整,记得更牢固。
然而,我认为,对于这个教育问题,除了意识到只有学生和一位优秀老师之间建立了直接的个人联系,才能开展最好的教学,别无他法。在这种情况下,学生可以讨论观点,思考并谈论知识。仅仅出席课堂,或者仅仅做一些指定的题目,是不可能学到很多东西的。
Alex 和我大约每周见面一次,共同讨论材料并一起解决问题。我不确定费曼的说法有多正确,但 Alex 告诉我,这些会议对他来说非常有价值。我认为这些会议并不能取代记忆系统的作用:为了更充分利用我们在一起的时间,我们没有复习基本原理,他也没有一直在查东西。而记忆系统确保我们取得的大部分进展都会得到巩固。
但我可以想象,在理想的世界里,Alex 在解决所有问题时,我都会在身边(或者更有效的辅导者)。这并不是作弊;我没有通过给出答案,简化他的工作。我让他努力,当他陷入困境时,我会提出探究性问题,这可能会帮助他突破困境。我可以在需要的地方提供原始信息。如果我发现误解指出,我可以提出问题以其引发有启发性的对话。我会提醒他注意可能遗漏的模式或联系。
这很难不让人开始思考:大型语言模型是否可以完成其中的一部分或全部工作?虽然我肯定利用了我丰富的物理和教育上的专业知识,但我不认为我做了什么特别的事情。足够好的模型,还可以帮助处理那些没有现成问题集和讨论题的主题。现在有六千亿个「AI 辅导员」创业公司在筹备中,但我还没看到路子走对的。我对我的抱怨没有明确的认识:过于教化,过于关注「正确答案」,对讨论和意义建构的兴趣不足。
我们合作解决问题的会议中有一个元素,我猜这些系统可能难以提供:社交能量。 Alex 非常有动力,也非常自律,但像我们所有人一样,他的精力有时高有时低。在某些日子里,很他难鼓起勇气去读另一章。但他发现,当我们一起学习时,他更容易对学习过程保持兴奋和激情。当与他人合作时,我也确实在……嗯,基本上是所有事情上都有过这种经历!
最后,我要指出的是,虽然在这篇文章中我提出了很多问题,但我对在这里学到的东西感到非常兴奋。这对我的研究来说是理想的环境。 Alex 非常有动力去深刻理解。这种理解面临很大的压力。他正在挣扎,所以有真正的增强机会。我可以亲眼目睹他的学习过程,有充分的干预机会,以及对我尝试的任何事情的紧密反馈。这是令人振奋的!现在我只需要大干一场。
论学习的广度与深度
原文:On breadth vs. depth in learning | Patreon
研究了这么多关于记忆和理解的内容后,我发现它给我带来了一个滑稽的负面影响——一种纯真的丧失。我深刻体会到,如果我用平时默认的「休闲」方式去阅读,我对那些复杂想法的理解将会多么肤浅,记忆将会多不牢靠。我也了解到了一些能帮助我更深入、更牢固地理解的方法,比如记忆系统、主动阅读练习、精细笔记等等。
但这给我带来了两个新问题。第一个问题是,我总觉得自己「应该」始终或至少更经常用这种更慢的方式阅读。现在,在我休闲阅读非虚构类作品时,我都会感到一丝愧疚。我非常清楚自己真正吸收的知识是多么少。
第二个问题是,我开始感受到时间和资源的有限和稀缺。深入学习一篇文章需要很长时间!在这种模式下,我原本一分钟就能读完的一页,现在要花上十分钟、二十分钟,甚至一个小时。我可能会花费几十个小时仔细研究一本专著,但我的阅读清单却长得没完没了。照这个速度,我只能读完其中的一小部分。万一真正重要的洞见藏在书单的中间呢?
我该如何解决这些问题?我又该如何权衡阅读时的广度与深度,又或说数量与质量呢?我的观点无疑是基于个人的视角,侧重于我自己的偏好和优先级。但经常有人问我类似的问题,我希望这能有所帮助。
反对幼稚的「效率至上心态」
首先,我经常看到这类讨论走向非常错误的方向:它们将问题框定为一个简单的优化问题。比如,「我怎样才能读尽可能多的书?」或者「每周我有十小时的学习时间,怎样才能学到尽可能多的内容,同时保持足够的深度?」
如果把这种态度太当真,反而会被它损害到真正的好奇心和创造力,而这些才是产生优秀作品、深刻洞察和(对我而言的)美好生活的基础。
当我读到我认为对我有意义的想法,而且其解释引人入胜时,我会想沉浸在文本中。我想知道如何深入探索,而不是想着怎样更快「读完」。
真正的问题在于,我的大部分非虚构类阅读都被我贴上了「仅仅有用」的标签。某篇论文可能不值得深入关注,但它确实在某种程度上帮助我实现目标。为了改进优化的框架,我们可以提出这样的问题:「如何为特定目标找到最美的见解来源?是否存在一条阅读路径,只穿过那些值得沉浸其中的文本?」
而这种新框架的问题在于,这样的阅读路径通常并不存在。 如果我试图触及某个问题的人类知识边界,我会发现许多关键想法零散地埋藏在成堆原本平淡无奇的资料中。当然,世界上有许多关于美妙想法的精彩文本,足以让我们终生沉浸其中,但如果我只读这些,浅尝辄止地了解千百个主题,那我就牺牲了我个人的创意兴趣。
另一个问题是,我经常不确定自己的目标是什么——我在探索,跟随直觉,寻找与自己不成熟的兴趣共鸣的想法。我还没准备好沉浸到任何事物中。有时,这是因为我在闲暇时间阅读,那时候我有探索的精力,但不足以进行深入研究。
这两个问题都需要我在深度上做出妥协。现在我已经把这些问题放在一个有意义的背景下,我更愿意探索我们如何「优化」。如果我已经探索完当前目标下最吸引人的资源,或者我不确定我的目标是什么,又或者在我精力不济时,该如何安排阅读以支持我的创意实践和对美的追求?
绘制领域地图
当我开始钻研关于阅读理解干预的研究时,我对这个领域还不太了解,连我想认真读什么都不清楚。最开始的一两周,我更多是在四处摸索,我的问题过于模糊,无法明确表述。在这段时间里,我当然没有深入学习。我翻阅了好几十篇论文,记着一些关键词、人名和概念(大部分都记在心里)。同时,我也在留意自己内在的反应(「真无聊!」、「有意思…」、「靠谱吗?」等等),这些都帮我更清楚地了解自己到底想知道什么。
在这段时间,我主要是优先考虑广度。我对自己很诚实:我知道我吸收的不多。我偶尔写些笔记和记忆卡片,差不多像是路标,但我的目标是大致绘制这个领域的地图。我想弄明白主要「领域」有哪些,它们之间怎么联系,以及在这些区域内的哪里可以找到主要的想法。最终,一些问题逐渐清晰,尽管它们仍然相当宽泛:
-
导致阅读理解缺口的机理有哪些?
-
这些缺口如何影响理解?
-
文本理解的过程与我所知的概念学习过程有什么联系?
-
是什么导致有些人阅读时理解得比别人多?
-
人们尝试了哪些干预措施?效果怎样?
利用这些问题,我开始更细致地阅读那些在我的初步扫荡中显得「经典」的一小部分论文和书籍。这一轮阅读帮我进一步提炼问题和阅读清单。例如,我开始提出更为具体的问题,比如怎么将阅读理解缺口与记忆编码和提取问题区分开来。
随着问题变得更加明确,我梳理出了一份更好的参考书目,并开始更加细致的阅读。我确保自己能够完全还原关键实验的过程。我仔细理解理论框架的细节,以便将它们应用到我自己的问题上。
在这个过程中,我阅读速度的「动态范围」相当广。起初,我只是阅读摘要,每篇文章大约花费一分钟。几周后,我会花一两个小时来阅读一篇论文。一个月后,我会花上一两天的时间深入研究一篇特别好的论文。
我在文章开头谈到了两个问题:我常常感觉自己「应该」始终慢速阅读;而当我慢速阅读时,又会感到焦虑,担心覆盖的内容太少。我做文献综述的例子展示了我解决这些问题的一种方式。当我不确定自己的目标时,我没必要坚持慢速阅读。实际上,在这种情况下,我应该是浅尝辄止地阅读,尝试构建一个索引,去了解哪些内容是重要的。这种方式可以让我快速覆盖广泛的内容,并且以较低的成本锁定少数几篇更值得深入研究的高质量作品。当我的精力不足时,这也是一种有建设性的阅读模式。但关键是,我不会自欺欺人,以为自己在目标层面上真的学到了很多。一旦我对自己的目标有了更清晰的认识,我对这些具体问题的情感联系就会增强,这让我更容易安排出专门的时间进行慢速、仔细的阅读。然后,当我穷尽了最吸引人的资料来源时,最好的办法是再次提速,浏览更广阔的领域,直到我再次找到令我流连忘返的想法。
无需计较卡片数量
当我开始使用记忆系统时,我有一种长期优化者的焦虑:考虑到复习成本,我应该把哪些内容加入到我的记忆系统中?需要多详细?幸运的是,这些问题已不再困扰我了。现在,我认为复习时间基本上是「免费」的。我用几个例子来说明这一点。
《量子国度》的第一篇文章大约有 25,000 词,包含 112 张卡片,大约每 225 词就有一张。一般读者需要大约四小时来阅读这篇文章。根据目前的复习安排,他们在第一年大约会花一个小时来复习这些卡片,未来花的时间则会更少。
我最近为 Jim Hefferon 的《线性代数》教科书的第一节编写了一些卡片。这一节大约有 2,500 词,我写了 28 张卡片,约每 90 词一张。我的测试者读完这一节大约需要 45 分钟。我没有这些卡片的复习时间的长期数据,但根据我对类似文本的经验,他们第一年复习这些内容大概需要 15 分钟。
这些例子综合起来表明,记忆练习所需的额外开销大约只有原始阅读时间的四分之一到三分之一。这实在不足以让我担心。我最初的优化者焦虑认为复习时间会让学习成本增加一倍甚至三倍,现在看来这完全是多虑了。如果我发现某些材料很有启发性或可能有用,那么额外的四分之一或三分之一的时间几乎在所有情况下都是值得的。
相比之下,完成那个线性代数章节的习题集花了我大约 2.5 小时,是记忆练习「额外开销」的十倍。如果提供了练习题,我应该做多少题呢?如果这些题目跟我真正想搞懂的想法有关,那么它们就是珍贵的礼物;我的大致策略是,只要在解答过程中我很投入或感到惊讶,就继续做下去。
如果我宁愿多看 25% 的内容,也不想确保自己真正内化了我认为重要的细节,那通常有几种可能:
-
我对自己认为重要的内容还不太确定,正在浅尝辄止地浏览以绘制领域的地图。只要这是有意为之的,就没问题!
-
我低精力状态下阅读,暂时不想太费脑筋。如果我是为了消遣而阅读,那这样做也挺好。
-
我在自欺欺人,以为不需要额外的帮助也能「足够好」地理解和记住这些内容。对于我真正关心的想法而言,这通常不太可能。
实际上,复习的时间成本比我们之前讨论的要低得多,因为复习的时间很少与认真阅读的时间冲突。我在碎片化的时间里复习,比如排队、坐公交、等人的时候。那种时候我本来就不会去认真阅读。所以对我来说,复习时间更多是跟像刷推特这样的时间相竞争。
因此,我现在不再担心复习的时间成本了。但还有两个相关的成本值得关注。第一个是,虽然复习成本不高,但编写优质卡片可能会使我的阅读时间增加一两倍。现在来看,这是一个略带误导性的观察——很多时候,编写卡片的过程迫使我更深入地理解内容,还能帮助我建立起在没有写卡片的情况下不会想到的联系和阐述。假设材料是有意义的,那么这些时间都花得很值。但其中也有相当一部分时间的工作是机械呆板的,而且这个成本要比复习的成本影响大得多。(后面会进一步讨论。)
「复习时间成本」问题的另一个更为显著的版本是复习的情绪成本。例如,当我初次涉足一个新领域时,我通常不太清楚哪些内容重要,需要多少重复强化。几个月后,我常会发现自己被那些早期写下的、现在看来有些幼稚的复习卡片围困,我会觉得无聊,情感上脱节,想做别的事情。这当然不是我想要的复习环节的感觉。我并不担心复习每张卡片的时间成本;我更担心的是,那些不再合适的卡片可能损害我与复习之间的关系。
推进动力边界
在教育科技领域,设计师经常讨论如何推进学习的帕累托边界。也就是说,给定学习时间,并使用现有的最佳方法,你能在给定主题上学习到一定的深度。但如果我们能开发出新方法,就能提高这个上限,让你在相同的时间里学得更加深入。反过来,如果你想在某个领域达到特定水平,新技术可能会缩短最佳路线所需的时间。
我认为,把这个框架中的时间轴换成「动力」、「精力」或「热情」,会让它更加贴切。
相比传统抽认卡学习法,用算法安排的间隔重复系统,可以让我在给定时间内学得更多、更深入。但我不认为时间是限制我使用传统抽认卡的最主要因素。更关键的问题是,传统抽认卡很快就会耗尽我的热情。几个环节下来,大多数卡片我都记得很清楚的,基本不用再复习。但这种方法还是要求我翻遍整套牌组,回答每张卡片,确保那些难点卡片能得到强化记忆。间隔重复系统的指数级增长的时间表减少了(但没有消除)这种动力税。而且因为它让我专注于复习那些我更可能忘记的卡片,让我更加深切地感受到复习的价值,从而激发了我的动力。这些机制让我更愿意用间隔重复系统,而不是传统抽认卡。
我喜欢把播客和演讲的播放速度调到 2-3 倍。这主要不是因为我想快点「听完它们」,而是正常速度下,这些媒体传达的洞见不够频繁,没办法让我保持注意力。如果按原速播放,我往往会心神飘忽,或者想换别的东西听。速度控制是一项技术,它推进了我的动力边界:它让我在给定的热情水平上从这些媒体中收获更多。
像可汗学院这种个性化学习系统,旨在通过算法安排练习,让每个学生在给定时间内都能做到最合适的题目。通常看待这个问题的角度是从单位时间内学得更多出发,但我认为最关键的问题是动力。没有什么比一长串你已经能流畅解决的问题更能消耗热情了。而如果题目太难,远远超出你的水平,也会让你的动力大打折扣。现在,当我们从动力而非时间的角度来看这个问题,我们就会发现,优秀的解决方案将需要不仅仅是估计成功答案的概率。它需要我们思考,怎样才能安排一些对学生来说既有意义又有回报的活动。
我对助记媒介和最近我提出的基于高亮笔的记忆系统特别有热情,背后也源于类似的逻辑。确实,写出优质的记忆卡片需要时间和专业技巧,但很多时候,更关键的瓶颈在于动力。要写出详尽的卡片,既繁琐又累人;在许多情况下,我编写的卡片远远少于我愿意复习的数量。我希望能够推进这个帕累托边界——以较低的动力税达到给定的学习深度,或者在给定热情水平下增加我的学习深度。
从做中学与「书面学习」
我从小就是个程序员。和大多数程序员一样,我特别喜欢「从做中学」。面对新的编程语言,我不会先去啃手册,而是直接动手尝试写点什么,遇到问题时再现学现用。这种方法对我来说有很多好处。它让我得到快速的反馈和奖励,让我的学习活动更贴近我真正的目标(编写程序)。当我确实需要「书面学习」时,我也更有动力,因为那是为了解决我遇到的具体问题。而且,实际动手的过程在认知上也很有帮助:要在实践技能如编程方面建立流畅性,我们必须在许多经验中归纳并学习模式。
哪些材料可以用这种方式学习?这种学习风格会带来哪些问题?我还没有好的答案。目前,我只能分享一些粗略的观察。
我十几岁就开始写 C 语言,但总是遇到程序因为「错误的内存访问」崩溃的问题。我花了好长时间盯着代码,试探性地修改程序,想找出 bug 的原因。但我完全摸不着头脑。原因是我根本就不懂指针和内存分配这些概念。我写指针就像照搬,把别的程序里的代码复制过来用,自己却不知道它们是干嘛的。光靠「尝试写程序」是解决不了这个问题的。我需要静下心来好好学习这方面的概念知识,这些在我有的几本书里都讲到了,但我以前都没怎么看。不幸的是,那时候我已经养成了不好的习惯:依赖从做中学,没耐心去研究艰深的概念性材料。我用了好几年时间才慢慢补上这些知识漏洞。类似的问题在我后来「学习」OpenGL 的时候又出现了,那时我主要是通过模仿教程里的代码来学。尽管我有很多概念上的漏洞,但我还是做出了一些复杂的游戏。但越来越多时候,我遇到了难以克服的障碍。后来在大学,我自己实现了一些机器学习系统,但对它们如何运作一知半解。不久,我又陷入了困境,不知道问题出在哪里。
这个故事的寓意并不是说,在动手做一些严肃的项目之前,我应该先从头到尾读完一本教科书。实际上,那些动手实践的工作确实激发了我对这个领域的热情,并且也让我掌握了一些真正的技能。如果有一个导师能直接告诉我:「噢,你遇到困难是因为你不懂指针。读读这几页书,然后我们聊聊,我再建议你接下来看什么。」这样我就不用再沮丧几年了。
我的编程故事之所以可能,因为编程是个特殊的领域,哪怕你懂得很少,也能开始做些有意义的事。烹饪也是如此。有这种特性的主题特别适合从做中学。学习的问题大多变成了如何安排一些辅助活动,来弥补在理解概念上的空缺。根据我的经验,最可能的失败模式是,我在概念学习上花的时间太少,因为我无法觉察自己的知识缺口带来的影响,或者无法看到获得某些理解的潜在价值。
另一方面,对于大多数主题,我开始深入研究前,都需要一定程度的「书面学习」。面对这种情况,我有自己的一套方法。
一种方法是,我把最初的「书面学习」当作是画地图。我先粗浅地阅读,弄清楚我想做什么项目,需要学哪些东西才能做起来。这样一来,我再去深入阅读这些片段,相信我会得到一些有意义的活动作为回报。
还有一种方法是让自己爱上那些概念本身。我之前对数学不太感兴趣,主要是因为我只接触过糟糕的数学书和教师。我把数学当做工具,就像是为了编程而不得不吃的西兰花。但后来,我遇到了充满美感和震撼的数学讨论,发现自己很容易沉浸其中,不再需要特定的项目作为动力。我多希望早点遇到这样的数学呀。
大家经常问我,记忆系统真有必要吗?如果某个想法真的重要,难道不是自然就会在工作中用到吗?如果不重要,忘了不是更好?我常用的几个回答其实和之前的讨论有关:
-
很多时候,自然的学习环境并不会明显地暴露出我们对某个概念的理解漏洞。即便你现在对某个概念掌握得很好,但这种环境也不一定能全面巩固你的理解,尽管这些细节将来可能派上用场。
-
记忆系统能帮你更快地「启动」,达到能自然运用这些知识的水平。
-
当你觉得某个想法很有趣或引人深思时,即使你目前的项目用不到它,深入探究它本身也是有意义的。
但我认为,这些反对意见也揭示了记忆系统的一些重要问题。复习往往感觉枯燥乏味,跟我真正感兴趣的事情没什么关联。很经常,对某个想法的讨论让我着迷,但当记忆系统里的相关卡片出现时,我却提不起兴趣。而且,跟技能有关的练习似乎效果不佳,可能是因为我并不是在实际使用这些知识的环境中进行练习。我认为,无论是更熟练地运用现有系统,还是创造新的系统级改进,我们都有可能解决这些问题。
————————
我要感谢 Michael Nielsen、Alec Resnick 和 Gary Bernhardt,他们以前的很多讨论让我对这些观点有了更深的理解。还要特别感谢 José Luis Ricón,他的文章《大量输入和/或间隔重复》激发了我就这个主题写作的灵感。最后,还要感谢 Nick Barr,他提出的「虔诚学习」这个概念,我在这里有所借鉴。
坐下来独立学习
原文:On sitting down to study independently | Patreon
在过去两年里,我与众多认真的成年学习者进行了深入交流。这些人为了支持自己真正关心的创新或职业项目(例如他们的创业公司),独立钻研一些技术性学科(如物理)。在这些对话中,我观察到一个出人意料的共同现象。我们通常会花费大量时间讨论如何提高学习效率:从课程设置、知识理解、记忆方法,到练习技巧、熟练程度等各个方面。然而,令人惊讶的是,在谈话进行一两个小时后,往往会发现,尽管这些学习者态度认真,但他们在坐下来去学习时却遇到了困难。
如果书本始终无法翻开,那么之前所有关于理解和记忆的讨论都变得毫无意义。随着我越来越频繁地遇到这种情警,我逐渐意识到这是一个被严重低估的问题。许多学习工具和资源往往假设,认真的学习者最需要的是清晰的讲解、及时的反馈或有效的练习方法。但实际上,对于很多学习者来说,他们最迫切需要的是如何调整生活方式和心态,以确保他们能够投入时间学习他们想要学习的内容。从教育心理学的角度来看,我们可以说,他们需要在「自我调节」方面得到帮助。
我讨论的并非那些对历史作业不屑一顾的叛逆少年。这里探讨的是那些聪明、有上进心、富有创造力的成年人。他们为了实现自己的创意目标,主动努力学习某些主题。他们确实有意愿认真学习,可是一周又一周过去了,他们却始终未能付诸行动。这到底是怎么回事?为什么自主学习如此艰难?作为设计师,又该如何提供帮助呢?
在哪些情况下学习更容易?
在一些情境下,成年学习者似乎很少遇到自我调节上的困难,通过观察这些情境,我们可以更好地理解这个问题。
同步课程。 有趣的是,即便这些学习者向我诉说他们在独立学习中的挣扎,他们往往会同时提到自己正在参加某个效果很好的其他科目课程。这类课程的关键要素似乎包括:固定的上课时间、明确课程范围和要求的教学大纲、充满活力的社交环境、受人尊敬的导师,以及适度的责任机制(通过学费、社会规范等形式)。然而,这些课程也通常存在功能性学习问题(如记忆、理解、熟练度等);而且学习者常常感觉课程内容与自己真正的学习目标脱节。
一对一辅导。 与传统课程相比,这种学习方式的效果似乎更加因人而异。更紧密的师生关系、个性化的反馈以及更明确的责任往往能激发出更多的魄力。然而,无论利弊如何,大多数辅导老师都没有固定的教学大纲。学习范围、预期成果和具体要求通常比较模糊,多为即兴制定,这导致许多学习者感到迷失方向或与学习目标脱节。
同伴学习小组。 在旧金山,成年学习者经常组织定期的晚间学习小组。据我所知,最常见的模式是大家在同一个空间里各自学习不同的内容,在学习前后进行简单的社交活动。这种方式的优点在于固定的学习时间、相互督促的氛围,以及与朋友相聚的乐趣。当小组成员学习相同的内容时,这种模式似乎更加有效,因为社交环境为大家提供了一个通过讨论深入理解学习材料的宝贵机会。然而,我观察到这些小组往往难以长期维持,几周或几个月后就会解散。能够长期稳定运作的同伴学习小组似乎相当罕见。
协作社区团体。 让我们暂时跳出技术领域,关注一下社区音乐团体、运动队和表演团体。这些组织与同伴学习小组有相似之处,都能提供结构化环境、社交责任感和社区归属感。但它们更注重协作:团队或乐队共同面对成功或失败。成员之间能深切感受彼此的进步或停滞。一个成员的成长可能会激励其他人也奋发向上。当有成员遇到困难时,其他人都有动力伸出援手。这种模式在表演艺术领域很普遍,但如何将其应用到技术学科的学习中,还需要进一步探索。
基于项目的学习/学徒制。 当「直接动手」行之有效时,它往往是大多数学习者最青睐的方法。这种学习方式以实际目标为基础和范围,允许通过不断尝试来替代教科书学习,而项目本身则提供反馈和强化。这种方法也非常适合社交场景,无论是与同伴合作,还是在有经验的导师指导下进行。然而,当需要掌握的概念较为复杂时,这种即兴式学习往往难以深入理解概念基础。
设定演示目标。 一个可靠(尽管压力不小)的学习方法是主动提出就某个主题做演讲,或教授一门短期课程。我在与播客主持人 Dwarkesh Patel 和 Joe Walker 的交谈中也观察到了类似的模式。这两位主持人以深度研究式采访而闻名,他们通常会为每位嘉宾投入数十小时的学习。在所有这些情况下,都存在一个即将到来的高风险演示日期,这创造了紧迫感。同时,这个日期也设定了一个明确的终点:学习者清楚地知道何时能够「完成」任务。
让我们退一步,来看看这些方法所具有的一些共同特征:
-
默认时间表: 这些学习结构通常会为学习安排特定的时间。这个时间往往是固定的,不易更改。这样做反转了默认模式:你不需要不断地督促自己去学习;相反,如果学习时间已经在你的日程表上,你反而需要做出决定才能取消它。
-
目标明确: 我下一步该做什么?如何分配精力?什么程度才算「够了」?许多这样的学习结构能为这些问题提供明确的答案。
-
进步感: 例如,通过完成教学大纲的各个部分,产出具体的学习成果,或与同学、导师进行交流讨论等方式,能让学习进步变得清晰可见。
-
即时回报: 虽然掌握足够的知识来完成你心仪的项目可能需要很长时间,但这些学习结构能够让你在短期内就感受到学习的意义,比如通过与同学讨论或完成练习项目。这些环境也可能让学习材料变得更加生动有趣,增加你的学习兴趣。
-
心理保障: 这些学习结构往往会传达这样一个信息:「别担心。你正在做正确的事。只要坚持不懈,你就一定能达到目标。」
-
社会认可: 「对不起,周二我不能去,我那天晚上有[课/学习小组/辅导]」这样的说法,比「对不起,周二我不能去,那是我这周仅有的两个空闲晚上之一,我打算每周抽两个晚上学习物理」要容易得多。对自己说也更容易。这种结构为你提供了一种可以被社会认可的理由。同样,你可能觉得为了上课或参加相关主题的学习小组而提前下班是可以接受的,但仅仅是坐在办公桌前看教科书就显得不那么恰当了。
-
好时机: 正如 Taylor Rogalski 所说,你可能有充分的理由去学习某个主题,但你可能没有充分的理由非得在这个星期六学习。即使这些学习结构没有明确的时间安排,它们也能通过短期的压力创造出立即行动的动力:及时学习,否则就要承担社交代价。我对主要依赖负面强化持谨慎态度——稍后会详细讨论——但学习者确实需要一个今天就开始学习,而不是将来某天再说的充分理由。
当成年学习者尝试在我前面提到的那些结构之外独立学习时,他们往往会发现自己失去了所有关键要素。没有默认的时间表, 没有明确的目标,感受不到进步,得不到即时的回报, 没有成功的保障,缺乏他人的认可,也没有好时机。从这个角度来看,我们就能理解独立学习者需要多么强大的自我调节能力了。他们不仅要学习艰深的知识,还需要创造并维持足够多的这些要素来保持学习动力。难怪他们经常感到举步维艰!
从时间开始
考虑到前面的讨论,独立学习者应该认真考虑加入或创建我提到的那些学习结构。比如,参加当地的课程、加入学习小组或找个导师;确定一个能推动学习的项目;或是邀请朋友们参加你要做的讲座等。然而,我接触过的许多成年学习者都有充分的理由解释为什么这些方法可能不奏效或不够理想。他们可能觉得课程内容与实际应用脱节;也可能试过几个导师但都不太合拍;或许唯一的空闲时间是清晨;又或者不知道该如何准备讲座等等。那么,面对这些情况,这样的学习者该怎么办呢?
在与学习者的交流中,我通常首先关注的是时间。很多学习者往往会精心设计学习计划,准备各种学习工具,却忽视了为实际学习预留时间。一个经常奏效的方法是设立「学习约会之夜」。具体来说,就是每周固定一两个晚上,划出几个小时专门用于学习。然而,学习者还需要努力捍卫这些时间段,抵御接踵而至的社交活动和现实琐事的干扰。这通常是一个不小的挑战。如果他们能够坚持下来,就相当于为自己创造了一个有利的学习环境,它能提供我们前面讨论过的几个自我调节要素:默认时间表、好时机,甚至是一个受认可的理由(「抱歉,我不能去,因为我把周二晚上安排给数学学习了。」)
在讨论时间管理问题时,一个常见的障碍是学习者实际上没有可支配的时间。他们的日程已被工作和个人事务排得满满当当。表面上看,他们似乎在晚上有几个小时的空闲时间,但每当他们试图利用这些时间学习时,却因疲劳而难以集中精力。幸运的是,这种情况有比较直接的解决方法。如果学习者希望取得实质性进展,他们必须适当削减其他活动,以便定期腾出几个小时的高质量学习时间。当疲劳成为问题时,人们往往会试图「想办法在深夜保持精力充沛」,但我从未见过这种方法奏效。相比之下,那些争取到公司允许在工作时间内学习、调整作息以便在上班前学习,或者把学习安排在周末的学习者往往更容易成功。在解决这个根本问题之前,讨论其他更复杂的自我调节问题或学习策略都是没有意义的。
反对「自律」
在解决了时间问题之后,我与成年学习者交谈时常常会发现另一个问题。他们已经安排出了时间,但效果并不理想。他们发现自己本该阅读书籍,却在观看 YouTube 视频或处理电子邮件。或者他们被家里的闲聊或琐事分散了注意力。学习者在谈到这一点时往往会表现出强烈的自责情绪。他们的想法类似于:「要是我能更自律就好了!」
我认为,当这些学习者给自己开「加强自律」的处方时,往往作出了错误的诊断。但他们察觉到有问题需要解决这一点是对的。造成困惑的部分原因是,我们在太多不同的场合使用「自律」这个词。让我说得更具体一点。
让我们从一个相关的古典美德谈起:节制。如果一个人的理性被低级欲望所支配,那么他就存在节制问题。在学习的语境中,这个问题表现为学习者过度沉迷于社交媒体或 Netflix,以至于这些欲望凌驾于理性之上。在这种情况下,学习者的确需要加强对欲望的控制,可能需要通过某种纠正性训练来实现。但我认为,我接触过的大多数学习者并不存在这个问题。有力的证据是,他们平时并不会在社交媒体上浪费数小时——只有在开始学习时,这个问题才会突然出现。他们的欲望通常处于相对平衡的状态。
对这些成年人而言,独立学习似乎存在某种特质,容易让他们被欲望所支配,或使他们产生心理疏离。有人可能会认为,这些学习者需要培养的是毅力——即坚持完成艰难任务的坚韧品格。典型的英雄主义故事常常描绘士兵们在恶劣环境中连日跋涉,或单亲妈妈每天破晓前起床写作数小时的场景。在这些故事中,任务本身必然充满艰辛,但主人公为了更崇高的目标而忍受这种痛苦。然而,这种观点似乎并不完全适用于我们讨论的成年学习者。有趣的是,同一个在自学时难以专注的学习者,在参与课程或学习小组时往往不会遇到太大困难。
因此,我认为这些学习者并不需要变得更擅长忍受必然痛苦的任务。相反,我们应该探究为什么独立学习对他们来说会伴随着如此多的痛苦(或预期的痛苦)。当我深入研究这个问题时,我发现学习者通常有充分的理由来回避他们的学习:
-
对计划缺乏信心。 学习者对自己制定的学习计划缺乏信心,不确定所选的学习材料是否真能帮助他们实现目标。他们不断质疑自己:是否选对了学习重点?选择的教材是否恰当?他们担心自己在浪费宝贵的时间和精力。
-
与真正的目标和兴趣脱节。 学习者对脑机接口的研究充满热情,却被本科阶段的微积分课程所困扰。他们对脑机接口的热忱无法转化为对 ε-δ 证明的兴趣。这些学习材料仿佛成了通往「精彩内容」路上的障碍,必须先被攻克才能继续前进。
-
看不到明确进展。 学习者虽然坚持学习,却无法判断自己的努力是否有成效。目标遥不可及,让他们感觉不到丝毫接近的迹象。
-
感到徒劳无功。 学习者觉得自己进度太慢,无法真正理解学习内容,认为自己能力不足。他们被无能、不足和失败的感觉所困扰,陷入悲观情绪中。
-
缺乏认可。 学习者感觉自己在争分夺秒,仿佛是在借来的时间里学习。他们从一个不利的位置开始,觉得自己本应已经掌握正在学习的内容。这项学习在社交或职业上「不算做」成就,这成了问题,因为学习者只有在不断取得可见的成就时才感到安全和自信。
「加强自律」并非解决这些问题的正确药方。如果你正在做的事情毫无用处、徒劳无功或毫无意义,你就不应该坚持。在最后一种情况——即感到不安时,从理性角度来说,坚持可能是个明智之举,但强行压制这种受威胁感很可能只会随着时间推移而引发更多内心冲突。
几个有助于治愈的主题
在所有这些情况下,我认为值得认真对待这些感受,并试图解决它们。为什么要把独立学习视为需要通过严格自律和咬紧牙关才能坚持下去的事情呢?为什么要创造一种每次坐下学习都需要调动意志力的情况呢?我们的目标应该是对日程表上划出的学习时间感到兴奋,将其视为我们给自己的一份满足好奇心和促进成长的礼物。我认为这是一个可以达到的目标——尽管实现起来可能并不容易。
公园巡查员
成年学习者常常难以为他们想学习的每个主题找到一位好导师。在本科水平之上的主题中,合适的导师人选明显减少,而且大多数技术专家也不愿意定期花时间进行辅导。他们中的大多数人可能也不特别擅长辅导。但如果我们回顾上面列出的问题,或者审视成功学习结构中的常见要素,我不确定辅导是否真的必不可少。
一个更恰当的比喻可能是「公园巡查员」。与公园巡查员交谈能增强你的信心,帮助你根据自身的体能和装备选择合适的路线到达目的地。他们可以向你保证,许多条件相似的人都顺利完成了这条徒步路线,没有遇到任何问题。如果你告诉管理员你特别喜欢瀑布,他们可能会为你设计一条以瀑布为特色的路线。你可以询问为什么要绕那个又大又难看的弯路,当得知是为了避开滑坡区后,你会感到更加安心。巡查员可以给你一张标有他们建议的地图,这将帮助你了解自己在整个路线中的进度。
这种「公园巡查员」式的关系对专家的要求要低得多。这些问题你可以在一次简短的咖啡聊天中提出,也许一两个月后再进行一次跟进。无需确保每周都有固定的会面。这种方法对专家的教学经验不足也更为包容。我曾经对成年学习者扮演过这样的角色,将他们的实际目标与学习材料联系起来。据我的经验,这种方式非常有帮助,同时对我的要求相对较少。
这个概念源于我在《我们如何学习》一文中提出的一个设想:或许大型语言模型能够提供这种学习指导。我认为,这种前景在提供更细致的信息方面极具吸引力:它不仅能推荐该读哪些书,还能根据学习者的具体目标建议阅读哪些章节。然而,建立信心这一环节更多涉及情感和人际关系,可能还是由人类来完成更为合适。在我看来,在提供高层次指导方面,人类「公园巡查员」的供应是充足的。
调整学习预期
我遇到的许多成年学习者正在初次接触高等数学或物理学。这些学习者面临的问题,很大程度上源于他们不切实际的预期。首先,他们都是某个领域的专家,习惯了阅读自己专业内的资料。然而,对于这些学习者中的大多数人来说,新领域的解释(尤其是在符号和抽象概念方面)比他们原本熟悉的内容要复杂得多。
这些学习者常常感到挫败。他们要么觉得自己进步太慢,要么尝试以平常的速度阅读却发现自己几乎无法理解内容。这种情况会让人产生一种徒劳无功、注定失败的感觉。然而,这种感觉实际上是不必要的。现代信息文化可能加剧了这种情况:我们经常接收到这样的信息,仿佛任何知识都可以通过一个二十分钟的视频,或一篇简短的博客文章轻松掌握。事实上,放慢学习速度并不会带来任何实际问题。只要学习者稳步向前,他们终将取得显著进步。但是,努力的感觉,真正与每一页内容搏斗的体验,对许多人来说往往是陌生而令人生畏的。
Sheldon Axler 在 Linear Algebra Done Right 的导言中给出了一个恰当的忠告:
阅读数学不能像阅读小说那样。如果你能在不到一小时内浏览完一页,那么你的速度可能太快了。当你遇到「请自行验证」这样的提示时,你确实应该进行验证,这通常需要你动笔推导。当某些步骤被省略时,你需要自己补充缺失的部分。你应该深入思考并充分内化每个定义。对于每个定理,你都应该寻找例子来理解为何每个假设都是必要的。与其他学生讨论对学习会很有帮助。
遗憾的是,我遇到过几位读者,他们因在学习这本书时进展缓慢而感到沮丧。令人惊讶的是,他们都没能回想起导言中提到的这一点。即便他们记得,我也不确定是否能有多大帮助。至少在旧金山,速通(speed-run)一切的冲动已深深根植于文化中。如果某件事无法速通,人们往往会认为这不是值得投入时间的事情。不过,参加课程和学习小组似乎能够抵消这种影响,因为它们营造了一种共识:每个人都学得很慢。
值得注意的是,书籍这种媒介本身在这方面并没有提供太多帮助。在上述引用中,Axler 列举了学习者应该采取的各种行动——这些都是在书本范围之外,需要学习者自己安排的。显然,书本可以做得更多,使这种有条不紊的行为成为自然而然的选择,比如通过支持理解的交互方式。书籍还可以更好地帮助学习者切实感受到自己的进步,例如展示他们累积的学习成果,并预测他们达到关键里程碑的时间,就像 Math Academy 所做的那样。
享受过程
我要谈论的是那些被明确目标驱使的成年学习者:他们学习是为了推进一个对自己至关重要的项目,或是解答一个他们迫切想要弄明白的问题。这些学习者与学习材料之间的关系,与普通学校里的学生有着本质的不同。后者学习往往只是为了在一些乏味的表格上敷衍了事地打个勾,或者仅仅是为了避免受到惩罚。
然而,这些学习者对实际目标的执着可能会如此强烈,以至于许多成年学习者不愿意在学习过程中真正沉浸到学习材料中去。在他们眼中,所有的前置知识都只是「妨碍」了他们想要完成的项目。如果发现必须在学习计划中增加新的主题,那就仿佛又增添了一道新的障碍。我能够理解这种心情,但这种态度实际上意味着学习者注定要耗费无数时间,在克服重重障碍中艰难跋涉。
另一种更好的方法是:一旦学习者意识到某个主题对他们的项目至关重要,他们就可以尝试培养对这个主题的好奇心。如果不再把学习材料仅仅视为通往目标路上的绊脚石,那么它本身的魅力就会开始吸引人。具体来说,我发现在深入研究那些更为艰深的材料之前,先从观看一个引人入胜的主题讲解视频开始会很有帮助,这样可以激发学习热情。此外,鼓励学习者与同伴或在社交媒体上讨论他们正在学习的内容和他们的疑问,也往往会收到很好的效果。正如哲学家 Agnes Callard 所说,推特是一种让人关心任何事物的方式。
我在《我们如何学习?》一文中提出了另一种方法,那就是通过建立学习者项目与前置知识之间的有意义联系,来充实预备课程的内容。我曾在与学生交流时实践过这种方法,效果似乎相当显著。我推测,当今的大型语言模型在这方面可能大有潜力,尽管我尚未进行相关实验。
对某些学习者而言,我认为真正的障碍在于他们缺乏一种「许可感」。这些人天性好奇,本该乐于沉浸在预备知识的学习中。然而,他们觉得自己不允许享受学习过程,认为必须立即开始创造价值,其他一切都是可有可无的奢侈。这种心态是很难扭转的。
对某些学习者而言,这种信念可能确实符合实际情况。他们的创业公司可能真的没有太多时间可以浪费。在这种情况下,我通常会建议采取一种综合方法:一方面快速应对眼前所需,另一方面则慢慢而稳步地为未来项目奠定坚实基础。
然而,很多时候这种信念实际上并不符合事实——只是感觉上如此。一个常见的原因是学习者过分在意他人对自己及其产出的评价。对此,我只能建议这是一个值得与心理治疗师深入探讨的话题。至于设计师在这方面能做些什么,我不太确定。
————————
如果你是一位独立自主的成年学习者,正在为自己真正关心的事物而学习,我很想听听你在这方面的亲身经历和感受。
————————
特别感谢 Alec Resnick 和 Sara LaHue 的宝贵讨论,也衷心感谢众多与我分享学习历程的成年学习者们。
《量子国度》可疑的平直遗忘曲线
原文:Quantum Country’s suspiciously flat forgetting curves | Patreon 上的 Andy Matuschak
自 2019 年以来,我一直在对《量子国度》的读者进行一系列随机对照实验。我之所以没有发布这些实验结果,是因为我不明白发生了什么。读者的遗忘速度非常慢。慢得出奇!每进行一次实验,我都会排除一些理论,但这些数据似乎挑战了记忆系统的一个核心假设:随着时间的推移,我们的记忆会沿着一条陡峭的曲线遗忘。这让我一整年都非常困惑,但现在我有一个理论可能解释了发生了什么。如果我是对的,这将意味着通用的记忆系统将无法复用传统以词汇为中心的记忆系统用来评估和改进自己的方法。
请注意:这是对《量子国度》数据的非正式讨论。该分析非常原始,不应该在其他工作中引用或摘录。我只是在这里开门造车。
《量子国度》的细分市场
《量子国度》是一种人类记忆的观察站——或者至少是对它的一个非常有限的切片。当然,对人类记忆的研究不计其数,但《量子国度》让我们观察到了一个被忽视的细分市场:
-
读者是在自我激励的环境中的成年人,而不是在正规学校教育或人工实验室环境中的孩子或本科生
-
材料主要是概念性的,而不是事实、词汇、定义、随机数据等
这个细分市场之所以重要,是因为它代表了大多数成年人在其创造性工作过程中必须进行的那种有意义的学习。
当然,一些专业人员在工作中会使用 SuperMemo、Anki 和 Mnemosyne 这样的工具,但对这些数据的分析有一个重要的限制:每张卡片每次复习时只有一个数据点,因为卡片(通常)是由每个用户自己编写的。开发人员必须依靠重要的模型假设来理解这种稀疏的数据。有了《量子国度》,我们可以(希望如此!)分析一大群读者在同一组卡片上的表现,并在很大程度上避免这些模型假设。Duolingo 和 Quizlet 也可以做同样的事情,但主要是针对以词汇/事实为中心的材料,而不是概念性主题。同时,来自学术研究的数据集几乎只限于人工和课堂环境——尽管应该指出,他们的数据通常要干净得多,而且控制得更好!
对我来说,所有这些数据的意义在于学习有关记忆系统和人类记忆的工作方式,以便我们可以设计更好的系统,从而赋予人们超能力。我研究《量子国度》的数据不是为了理解人们如何学习《量子国度》,而是为了间接理解人们可能如何使用这些系统进行普遍意义上的学习。在高层次上,我们想回答的问题包括:
-
这些系统可以变得多高效?对于特定用户来说,何时复习特定卡片效果最好?
-
这些系统的适用范围有多大?它们在哪些方面表现糟糕?它们的应用领域能多广阔?
-
这些复习互动如何转化为一个人在其他情境下解决问题和应用这些知识的能力?
-
......等等。
当然,这些问题是碎片化的。我一直在试图回答两个相关的子问题:
-
什么是反事实的?如果没有复习机制,人们在多大程度上能记住文本的关键细节?
-
《量子国度》目前的复习间隔是太短了还是太长了?对于哪些读者和卡片而言?
事实证明,这些问题比我预期的要难得多!
排期实验:基础知识
在这篇文章中,我将重点讨论我最近进行的实验,因为至少对于我上面描述的问题来说,这个实验控制得更好。
每位新读者都被分配到四种不同的排期表中,初始间隔分别为 1 周、2 周、1 月和 2 月。也就是说,在「2 周」条件下的读者将在他们初次在文中回答一张卡片的两周后被提示复习。我在这里有些简化了,但这足以让我们开始。
这些条件综合起来,应该能帮助我们找到一个初始复习「甜蜜点」*。此外,2 月的条件应该告诉我们一些关于反事实的情况:如果一个读者整整两个月都不复习会发生什么?(*译注:sweet spot,有「最有效点」、「最佳击球位置」的含义)
因此,以下是读者在第一次延迟复习时的准确率中位数,按条件划分(括号内为第一四分位和第三四分位读者的准确率):
-
1 周:87%(81-92%, N=35 位读者)
-
2 周:87%(81-91%, N=35 位读者)
-
1 月:85%(77-92%, N=25 位读者)
这些数据仅限于《量子国度》的第一篇文章——拥有最多的数据——并且代表了那些收集了至少 50 张卡片并且复习了他们收集的 90% 以上卡片的读者。(你会注意到我在这篇文章中有意回避了模型和统计测试。这是因为我们讨论的是效果,我希望这些效果大到可以一目了然!)
在 2 月的条件下,只有少数读者完全完成了他们的第一次复习,所以我还不能报告该条件下每个读者的统计数据,但我们可以通过将每个条件下的所有复习归为一个大类,并查看每个分类中被记住的卡片的比例,来了解一些情况:
-
1 周:86%(N=138 位读者,6381 次复习)
-
2 周:84%(N=142 位读者,6319 次复习)
-
1 月:83%(N=90 位读者,4477 次复习)
-
2 月:81% (N=50 名读者,1744次复习)
我们可以通过增加 2019 年初的读者来增加一个数据点,当时第一次复习只隔了一天。这不是一个干净的比较,一是因为可能有队列效应,二是因为这些用户没有「重试」的反馈机制,但只是为了得到一个感觉:
- 1 天:89%(N=2210 位读者,122139 次复习)
这是一条几乎令人难以置信的平缓的遗忘曲线:从 89% 到 81%,跨越两个月!这是我的困惑。这个浅浅的斜率是我困惑的核心,但首先让我们谈谈有意义的部分。
最初被遗忘的卡片应该得到更频繁的安排
如果我们专门看一下读者在第一次回答文章中的卡片时忘记的卡片的延迟回忆准确性,数据会变得更可预测。这样的卡片首先会在一天后再次被分配,必要时反复进行,直到读者记起——之后他们会在延迟后分配卡片。回忆准确率,按延迟计算:
-
1 周:84%(N = 79 位读者,626 次复习)
-
2 周:77%(N = 73 位读者,447 次复习)
-
1 月:69%(N = 57 位读者,341 次复习)
-
2 月:56%(N = 27 位读者,138 次复习)
这些数据展示了一个更为人们所熟知的情景,并为记忆系统的作者指出了一个相当清晰的路径。如果我们的目标是确保记忆率保持在 90% 以上,那么当读者最初忘记一张卡片时,我们应该很快再次安排复习。自动晚一天的「重试」环节不足以支持较长的后续间隔。
事实上,这种效应是累积的。如果读者在第一次延迟复习中忘记了一张卡片,那么一天后就会再次分配给他们。对于最初间隔时间较长的读者,在随后的那个环节中恢复的可能性较小——也就是说,他们更有可能再次忘记。根据第一次复习环节的延迟来看恢复率(注意,这些样本量现在越来越小):
-
1 周:90%(N = 31 位读者,79 次复习)
-
2 周:78%(N = 33 位读者,86 次复习)
-
1 月:83%(N = 24 位读者,70 次复习)
-
2 月:57%(N = 9 位读者,44 次复习)
好了,对于记忆系统设计师,我们从中提炼出了一个相当清晰的启示:当一张卡片在文中被遗忘时,初期的间隔应该果断地缩短。
麻烦开始了:当卡片最初被记住的时候
但在文中,卡片并不经常被遗忘。在这四种情况下,对所有读者进行汇总,文中的准确率为 91-92%。那么,卡片最初被记住的常见情况是什么呢?这就是麻烦所在。
在文中被记住的卡片的首次复习回忆率:
-
1 周:86%(N=137 位读者,6174 次复习)
-
2 周:85%(N=140 位读者,5814 次复习)
-
1 月:84%(N=89 位读者,4108 次复习)
-
2 月:83%(N=49 位读者,1599 次复习)
和上一节一样,我们可以不负责任地使用 2019 年读者的数据,增加一个在 1 天时的数据点:90%(N = 2207 位读者,109031 次复习)。和之前一样,请注意这并不是一个受到良好控制的比较。
这条遗忘曲线出奇地平缓!当然,如果我们想达到 90% 的回忆率,这个数据表明我们应该在不到一周的时间内安排第一次复习。但是,但每次复习都有成本;如果读者可以跳过一两次初始复习,以换取较低的几个百分点的准确率,我认为大多数人会接受这个交易。毕竟,完整地复习第一篇文章的 112 张卡片每次大约需要 25 分钟。我们应该如何考虑这个问题呢?
一个需要考虑的因素是我们在前一节中看到的「恢复」效应。相对于那些一周后就忘记的人,在更长时间后忘记的人是否更难在接下来的复习中恢复呢?下面是恢复率(即,在文中记住,在第一次延迟环节中忘记,次日的准确率):
-
1 周:84%(N=68 位读者,600 次复习)
-
2 周:81%(N=66 位读者,529 次复习)
-
1 月:85% (N=44 位读者,384 次复习)
-
2 月:74%(N=16 位读者,147 次复习)
这看起来不是很有说服力。也许两个月后会有麻烦,但我想先看到更多的样本。在这里,看起来我们可以将第一次复习延后一个月而不会真正付出什么代价。
推迟初次复习的另一个原因是引发间隔效应,但我将在这篇文章中跳过这个讨论。简而言之,基于目前稀少的数据,我还没有观察到在第一和第二次复习间隔之间存在间隔效应。
按卡片进行切分分析又如何呢?看看第一篇文章中初始准确率最低的十张卡片,但读者在阅读时记住了这些卡片的答案,我们仍然在第一次延迟复习中看到了一条陡峭的遗忘曲线:
-
1 周:74%(N=74 位读者,273 次复习)
-
2 周:71%(N=67 位读者,277 次复习)
-
1 月:65%(N=47 位读者,210 次复习)
-
2 月:65%(N=25 位读者,85 次复习)
这很有说服力,但曲线很快就消失了。下面是接下来十张「最难」卡片的准确率,按初始延迟计算:
-
1 周:73%(N=129 位读者,474 次复习)
-
2 周:74%(N=114 位读者,446 次复习)
-
1 月:74%(N=77 位读者,312 次复习)
-
2 月:75%(N=40 位读者,151 次复习)
我们没有足够的数据在每张卡片的基础上提取可信的遗忘曲线,但随着剩余 10 张卡片组的截距不断增加,平坦的曲线仍然持续。中等难度的 10 张卡片稳定在 82%;最简单的 10 张卡片稳定在 95%。
因此,卡片在难度上有所不同,但随着时间的推移,回忆率似乎并没有下降。我们应该从这里得到什么结论?当然,我们可以更早地安排「难」卡,但这实际上有用吗?除了 10 张最难的卡片外,这些数据显示,更短的间隔并没有提高回忆率。
这种情况的一种解释是,关键在于人们需要练习,而具体的复习时间点并不是太重要。事实上,我们之前的发现表明,一旦中位数的读者在延迟(任何长度)后记住了一个答案,他们在接下来一年的复习中的回忆率是 95%!
但我对这些数据持怀疑态度。这些遗忘曲线太过平缓,不符合我的个人经验。如果我两个月不去复习我所学的知识,我记住它的可能性肯定要比在一周后复习它小很多。我们的数据似乎在暗示,一旦成功地延迟记忆后,我们可以安全地将后续复习推迟数月。但我个人对此表示怀疑。
这里发生了什么事?
我的理论:线索提示效应
如果你仔细考察一张具体的卡片,情况可能会变得更清晰。来看看这张卡片(在文中的回忆准确率大约处于 75% 的百分位数):
这个任务强烈地塑造了你的提取行为:它让你寻找规范条件和测量概率之间的联系。你可能会立即想到这个答案;但你也可能当场思考这个问题,并推断出这是唯一合理的答案。
我们收集的准确率数据并没有区分这两种可能性。但这一区别很重要!如果我们改为要求你解决某个间接依赖于这个属性的问题,你可能无法做出你需要的推断。
我们真正关心的是流畅性:你思考有趣想法、解决有趣问题、察觉联系并创造性地应用你的知识的准备度。你想要锻炼一个模式丰富的推理机制。
我的直觉是,尽管从 1 周到 2 个月之间,线索回忆似乎没有显著下降,但自由回忆和迁移任务将显示出更陡峭的曲线。我刚才描述的那种流畅性确实会下降。如果你能看到这种下降,你可能会想要更早地安排下一次复习。
如果这个理论成立,那意味着《量子国度》和通用记忆系统需要采取与之前在这一领域大部分工作截然不同的路径。遵循 SuperMemo 的引领,大多数系统通常以一个简单的阈值来考虑安排复习:当估计的回忆概率降至 90% 时,安排一次复习。这样,你在任何给定时刻的期望回忆率应该保持在 90% 以上。
我认为,对于语言学习、事实和术语定义对,这是一个合理的启发式方法。你通常无法当场重新推导出这些答案。目标是从记忆中产生答案。对于像《量子国度》这样的概念材料,明确地给提取线索的效果应该远小于我们所观察到的。
如果我们不能用线索回忆率来近似一个概念细节的编码深度,就不能使用传统的启发式调度方法。我们需要建立一些其他方式来驱动控制循环。
响应时间似乎是流畅度的一个有趣指标,但我在《量子国度》读者的响应时间中出人意料地几乎找不到规律。
一个更具侵入性的方法是插入一些卡片,要求读者在一些新的背景下间接地使用知识。如果线索提示效应对概念性知识来说确实特别重要,那么即使回忆准确率保持稳定,我们也应该看到迁移表现随时间推移而下降。无论如何,我想做这样的事情,以此来确认复习系统所强化的知识的灵活性。
检验这一理论的另一个方法是考虑那些我认为比较「死记硬背」、概念性不强的卡片。这些卡片应该有一个更明显的遗忘曲线。例如,以下是要求提供 X、Y、Z 和 H 门的矩阵值的卡片的回忆率:
-
1 周:56%(N=91 位读者,234 次复习)
-
2 周:60%(N=87 位读者,215 次复习)
-
1 月:56%(N=59 位读者,144 次复习)
-
2 月:48%(N=26 位读者,54 次复习)
这里的样本不多,但这个数据并不支持我的理论。1 周和 1 个月之间的平坦曲线仍然让我觉得难以置信。我猜测,人们可能是根据记忆中这些门的预期效果重新推导出这些值,但我觉得这种可能性并不大。
对于这一切混乱的一个简单解释,也许是人们只是在撒谎。《量子国度》是自主评分的。也许人们在不恰当地把答案标记为记住了?我觉得这不太可能。请记住,中位数的读者在 1 周至 1 月内的自我报告准确率为 85-87%。这个中位数的用户仍然将大量卡片标记为遗忘。令人困惑的是,为什么 1 个月的中位数用户不比 1 周的中位数用户将更多卡片标记为遗忘?
另一个扭曲我的数据的重要因素是幸存者偏差。2 个月后回来复习的读者可能比 1 周后复习的读者更认真。他们可能对这个主题更关心,并阅读得更仔细。这种效应可能夸大了后期间隔的表现,但我没有好的方法来确定夸大了多少。
我想我在这里的下一步是深入挖掘文献,其中确实包括许多专注于概念性知识和迁移学习的记忆实验。也许其中的一些方法或讨论可以在这里帮助我。
————————
感谢 Gary Bernhardt 对这一主题的有益讨论。也感谢大家一直以来的支持,这使我有可能进行这样的长期研究。我们现在大约有 3/4 的路要走,相当于国家科学基金会的 CAREER 资助,我不断地震惊于这样的事情可能发生。节日快乐!
思想工具的棘轮过程
原文:Ratcheting progress in tools for thought | Patreon 上的 Andy Matuschak
有一些人在尝试开发思想工具,但「思想工具」这一概念还没有形成有意义的领域。这里的关键在于,领域的发展是一个棘轮过程:形成一个不断增长的共享知识体和方法,使得研究者之间、年份之间的项目能有意义地建立在彼此的基础上,如此往复,形成一个向上的循环。个别人确实贡献了强有力的洞见,但对于这个领域来说,真正的成功意味着人类工具制作的新实践,以及创造许多能改变人们思考和行动的工具。
Michael Nielsen 和我曾建议,最强大的思想工具表达了对基本主题的深刻洞见。创造这些工具涉及到我们所说的「实践出洞见」,其中强大的主题思想使新系统成为可能,而对这些系统的观察使新的洞见得以涌现,如此循环。一个理想化的活动循环可能包括以下关键步骤:
-
识别关于某些主题领域或一般认知的强大洞见,这些洞见可能被有效地系统化
-
建立系统,在其原语中表达这些洞见
-
在真实的环境中认真使用这些系统,并通过它们折射出你的理论洞见
-
从那些能产生对主题领域或认知的新理解的观察中提炼出可推广的洞见,并允许建立新的、更好的系统
-
传播该洞见,以便其他人能够在此基础上继续发展
这种高层次的视角忽略了许多细节,而每一个步骤都是一种复杂的实践,需要人们通过几十年的时间积累技能。但是我们可以在计算机驱动的思想工具的「黄金时代」设计工作中看到这些实践:Engelbart 的 NLS,PARC 的 Alto,Sutherland 的 Sketchpad,等等。不幸的是,如果我们观察当代的原型领域,我们会发现,大多数对思想工具感兴趣的人(包括我自己)并没有可靠地执行所有这些步骤——这使得我们挣扎的领域没有一个正常运作的棘轮过程。
常见的失败模式
一个在学术界尤其常见的失败模式,就是缺乏严肃的使用环境。这会导致观察阶段的数据常常源于容易产生误导的人造环境。有时候,研究者对他们正在打造的系统投入不够,也就难以从所做的成果中提炼出有力的新洞见。另一个更难以察觉的问题是,如果没有一个严肃的使用环境来驱动研究项目,他们最初的主题洞见可能会受到限制或误导。
初创企业和科技企业是工具开发的有力场所。他们通常并不试图推动思想工具领域的发展。但我们可能会希望他们能顺便推动它的进步。遗憾的是,科技行业的做法常常因为一些常见的模式,阻止它们对这个棘轮领域做出贡献。
最常见的问题可能就是科技行业的从业者过于专注于构建系统。这些系统通常是技术或市场洞见的表达,而非关于某个主题领域或认知的基本洞见。对于企业或其用户来说,这当然没问题!但是,如果他们的系统不能将新观点具体化,我们就无法从观察中获得能推动整个领域进步的深度洞见。
科技公司的另一个常见模式是,它们以一些深刻的洞见作为出发点,这些洞见激励了创始人创业(或为现有企业构思新的产品线)。公司将这些洞见具体化为系统,观察他们在严肃的环境中的表现,从观察中提炼新的想法,改进产品。这很好!但是,这些迭代的对象很少是「可推广的主题洞见」,这是有充分理由的。这些企业正试图改善其产品在客户和市场中的表现。有时我们很幸运,这恰好产生了可推广的洞见——通常只有在其他人逆向工程并传播这些洞见之后。但更常见的情况是,由于目标的不同,他们的关注范围,在整个领域看来,就变得狭窄了。他们正在解决痛点,增加产品线,优化工作流,增加功能......通常不改变产品的任何基础理论。事实上,对产品基础理论的改变通常被视作「禁区」(而且这往往是合理的),或者对产品团队来说根本不重要。我认为,优秀的思维工具研究常常是要超越和抛弃现有系统,提出「我们应该如何构建下一个系统?」这样的问题。但是优秀的企业通常不会每隔几年就扔掉他们的核心产品,构建一个截然不同的产品。
对于科技公司为这个领域做出贡献来说,另一个可能的挑战是,如何把他们的研究成果传播出去。看到像 AutoDesk、Adobe 和 Epic Games 这样的公司发表计算机图形学基础问题的惊人论文,实在令人兴奋。但是,如果那些研究思想工具的公司正在产生关于认知或其主题的强大新理论,我们很少看到这些想法被发表。
在思想工具方面,我最喜欢的一些工作来自于特立独行的 Twitter 修补匠。这群人经常产生迷人的作品,但通常缺少其中一个或多个步骤。最常见的模式似乎是:一个工匠发现了一些关于表象的强大想法,并设计了一个原型,但随后却没有认真参与观察并从他们建立的系统中获得洞见。有时,这来自于技术障碍——原型太粗糙,不能在严肃的环境中使用,所以他们得到的洞见就有限。但我认为这里还有一个文化的鸿沟,即缺少一种仔细、勤奋的观察和综合的研究实践。这些项目往往给人的印象是:「看,我做了一个东西!是不是很酷?我能让多少人用上它?」。但他们需要回答的问题是:「我们能从这个项目中学到了哪些有力的、可推广的想法?下一波系统应该如何在此基础上构建?」
把产生研究洞见的设计融入系统
忽视制度因素,这个循环之所以难以流畅运作,是因为它极其困难。每个步骤都相互关联。你不能只有一个强大的想法,然后设计一个表达这个想法的系统,再接着去观察它,等等。你必须以能揭示系统背后想法的方式设计并操作它。或者换个说法,你必须把系统塑造成能够提出你想问的问题的形式。但问题是,往往在看到系统运行之前,你甚至无法确定应该提出什么样的问题。
以《量子国度》为例,它背后的一个关键思想是,作者可以通过交织叙述和提取练习,帮助读者深度吸收复杂、抽象的主题。我们构建了一个表达这一思想的系统。我们有很多数据。读者们似乎觉得它很有效。我们可以看到,人们确实记住了他们所读的材料。但是,这个领域应该从这个实验中学到什么?我们能得出什么可推广的结论?我们怎样才能提高我们对这个最初想法的理解,以便我们能够创造一个更好的未来媒介?
有时候,有趣的答案会意外出现。例如,当我们采访读者时,我们惊讶地发现,除了记忆效应外,定期的复习环节明显改变了人们与材料的关系。这让他们认为自己在「做量子计算」,这比他们只是在某个下午读一篇文章要认真得多。这种洞见催生了穿越时间的文本以及其他相关的方向。
但许多洞见不能仅仅依靠被动观察和开放式访谈去探索。叙事和提取练习究竟是如何交互的?其主要效应是便利性吗——即在阅读过程中提供卡片,若在阅读之后给出卡片,你可能就不会去做了?还是元认知——即卡片的反馈调节了你的阅读,使你重新阅读你表现不佳的段落?还是主要与记忆有关——即最有效的提取练习计划涉及立即练习、强化知识,而不是几天后?或者完全是其他原因?对这些问题的不同回答,将指出助记媒介进化的截然的不同路径。
要回答这些问题,系统必须被设计成能够产生必要的观察结果。或者你必须通过实验操作这个系统,如果你最初设计系统时没有考虑到这些问题,这可能会很困难。我发现,更微妙的是,设计思想工具的实验以便可能得出一些可推广的结果,尤其是一项挑战——这涉及到理论、界面设计、工程和实验方法的复杂平衡。这就像认知心理学家在他们的实验设计中面临的问题一样,只不过「仪器」被换成系统,它必须既能解决现实世界的问题,又能产生必要的实验数据。
人机交互研究的先驱 Ben Shneiderman 在《研究的新 ABC》中为研究项目的设计提供了这个迷人的示意图。他称之为「两个父母,三个孩子」模式。
这个挑战与学习科学家在设计教育干预时所面临的情况类似。在《[发展研究的原则和方法](http://andymatuschak.org/files/papers/van den Akker et al. - 1999 - Design Approaches and Tools in Education and Train.pdf)》中,Jan van den Akker 精妙地解读了在该领域里,进步的一小步到底是怎样的(感谢 Sarah Lim 的指点):
[教育设计]原则,通常会像下面这样给出一些有启发性的陈述:「如果你想设计干预措施 X(为了在环境 Z 中实现目的/功能 Y),那么,你最好把 A、B、C 这几种特性加入到方案中(实质性强调),并通过 K、L、M 这几种手段来操作(程序性强调),这是因为有 P、Q、R 这几个论点在背后支撑 [(理论性强调)]。」
这样的陈述最关键的地方在于,它明确地把理论认识、设计方法和期望结果连接在一起。我当然警惕一概而论,把所有的研究都套入某一模式,但这样明确地描述目标,无疑是极其清晰的。如果你是一个研究者,想要开发一种新的干预措施,你需要设计一个实验,其结果可以生成这样的陈述。
我认为,对于思考工具的研究循环,我们也应该设法产出类似的陈述。我们的理论和设计决定都会产生什么结果?别人又如何借鉴这些结果?进步意味着我们能够制定出大量精细的启发性陈述,比如:「如果用户记不住答案,那么复习系统应该给予他们几分钟后再试一次的机会。我已经做了严格的实验,发现如果没有这个机会,用户在下一次尝试时,失误的可能性会增加 10 %」但同时,我们也需要能够对系统的核心机制做出更高层次的阐述,比如:「间歇性的后续复习可以通过作者的 X、Y、Z 这几种方法,改变读者对书面材料的情感关系,方式是 A、B、C,这是由理论 P、Q、R 预测的,并得到了 K、L、M 实验的证实。」
或者,再举一个例子,我知道我的许多读者是大纲文本编辑器的粉丝。今天早上,受赞助人 Ethan Plante 的信息启发,我去寻找关于大纲处理器的理论或实证基础的学术研究。我对我能找到的内容之少感到震惊。因此,如果你正在尝试构建大纲处理器,或「基于块」的工具,或其他什么,这里有一些需要你去回答的问题:这些非主流的写作原语对写作、思考、阅读有什么影响?有什么理论可以解释这些影响?我们应如何确认这个理论的正确性?这个理论还有什么其他含义?能够回答这些问题的研究系统是什么样子的?它们与人们构建的商业系统有何不同?
一些正面典范
我写这篇帖子,其实是为了解决我个人面对的挑战,因此在某种程度上,文章中不可避免会流露出些许挫败感。然而,我希望能以一种更积极的态度来结束本文,那就是引出几个现代项目的例子,它们成功地实现了我刚才所描述的完整循环:
Bret Victor 的项目就是典型的现代范例。我将对他研究分支之一做个粗略的概述。在《可探索的解释》(2011 年)一文中,他提出,如果作者不仅仅提供数据,而是将他们的动态模型植入到写作媒介中,那么阅读环境就可能转变为思考的环境。接着,他做了一系列关于阅读、写作,以及与动态系统互动的项目,探索这一思路和其他几个相邻的思考方向,每个项目都提供了具有普适性的深刻洞见。最后,Bret 和他的同事对屏幕的局限性和作者的非对称角色感到不满,从而诞生了他当前项目 Dynamicland 的独特创新理念——把一栋建筑变为一台电脑。
Ink and Switch,这个工业研究实验室,对自由形式的多模态平板电脑界面进行了一系列深思熟虑的、有据可查的实验,以支持创造性的思考。他们的第一个实验,Capstone,基于一个模型,即创新工作是依赖于收集和筛选原始素材以发现模式和洞察的。他们构建了许多交互行为来支持他们的模型,找出这个系统的机会和局限性,并根据这些洞见设计了一个新的系统,名为 Muse。这个项目把墨水放在了中心位置,并产生了一些关于设计以墨水为中心,无额外装饰的界面的通用理念。现在,这个研究项目已经成为了一个产品公司(由赞助人 Adam Wiggins 共同创立)。我对他们尝试证明转化型的研发模型感到振奋,也非常期待看到他们在这样的环境中是否仍然能够产生和传播可推广的洞见。
Piotr Wozniak,现代间隔重复的缔造者,是另一个伟大的典范。他有最初的关键洞见,即计算机化的间隔重复系统可以产生非常巨大且廉价的记忆资料库。然而,他对这些观点的思考已经延续了几十年。他不仅优化了调度算法,还使用数据提出和探索人类记忆的新模型(例如人脑能容纳多少知识)。尽管这个研究似乎没有受到 SuperMemo 商业环境的限制,但可能是因为它的运作并不像现代美国软件公司那样激进。
Evan Wallace 在 Figma 开发并记录了一种用于表示和编辑矢量路径的新原语,其受到现有矢量编辑工具的实际问题驱动,这些工具更直接(原生地?)展示了底层的贝塞尔曲线。他展示了这种新的表达方式如何让一些常见的操作变得更加容易。这项工作可能不会颠覆性地改变和扩大人们的思维,但 Sketchpad 和 Illustrator 的原始钢笔工具肯定都很重要,这似乎有意义地扩展了那项工作。我确实希望 Evan 能对这项工作进行更实质性的描述,但显然,他更关注于产品的改进,而不是对领域的贡献。最近有一篇不错的技术文章,但它是以实现为中心的。
在准学术性的 Twitter 修补匠中,我想为 Omar Rizwan 的 TabFS 实验喝彩。该项目表达了 Omar 的深刻洞见:终端用户编程的捷径可能在于将操作系统的架构扩展到应用层面的对象,如浏览器标签。从许多方面看,这个项目都像是 Plan 9 的升级版,但是却强调了「更坏即更好」的民间/工艺哲学。但与我的许多心爱的 Twitter 修补匠不同,Omar 一直在认真地总结和传播他和其他人如何使用 TabFS 的新洞见。不幸的是,这些洞见都存于赞助者的电子邮件通讯中,没有永久链接,但你可以从他的 Twitter 中感受一下。长远来看,我相信 Omar 会详细地写出他的发现,这样其他人也可以在此基础上进行探索——他已经为过去的工作做到了这一点。
你最喜欢哪些当代人在思想工具中完成「全周期」工作的例子?请在评论中分享。
阅读理解与记忆系统
原文:Reading comprehension and memory systems | Patreon\n译者注:本文的「助记媒介( mnemonic medium)」指的是作者的具体项目。而不是字面意思。
在追求「让人们更容易记住他们读过的内容」这一目标时,我碰到了一个出人意料的困难:对于大段大段的文本,人们一开始就没搞清楚它们到底表达了什么意思。
这还没涉及到长期记忆。问题在于,读者的目光就像打水漂的石子一样掠过书页。他们对文本的处理最多只到视觉解码层面,文中的概念甚至从未进入工作记忆。诚然,我们可以不屑一顾,将之归咎于「阅读技能很差」,但我并不想过于轻视这一问题:我怀疑许多高薪的知识工作者也经常会像这样,在最简单的阅读理解上出错。
自从我将阅读作为一个研究问题进行探索以来,我的阅读能力已经大大提高。然而,我仍然(意外地)经常会犯些低级失误。去年,我报名参加了芝加哥大学的一个为期四年的名著研读项目。这个项目非常有趣:我们每周都会聚在一起,深入讨论各种富有挑战性的文本。但是,在大多数课程中,讲师的提问(不少于一个)会让我意识到,我其实并没有理解某个重要段落的文本所表达的内容 —— 而且我自己都没有注意到。
领会主旨
受过教育的成年人,真的每天都在基本的阅读理解上出现问题吗?也许是我的问题,我考虑的情景要求上太严苛了 —— 在我的研究中,我要一直观察读者的理解,并且我追求的目标是帮助人们极其详尽地内化文本,而我参加的芝大课程,涵盖了自古流传的一些文本,它们也难度极大;另外一种可能是,讨论题比你「平常」阅读时会探索得更加深入。
另外,有人说,反正大多数人只是「为了领会主旨而阅读」。他们只想看几个要点,不觉得有必要真正理解作者论述的所有关键细节,更不用说记住。好吧,假设我暂时接受这个观点。那么,人们「领会主旨」了吗?他们知道自己是否领会了主旨吗?
[在一个研究成人阅读理解的开创性实验中,Michael Pressley 及其同事要求](http://andymatuschak.org/files/papers/Pressley et al - 1990 - Sometimes Adults Miss the Main Ideas and Do Not Realize It.pdf)大学生阅读 SAT 风格的短文片段(约 118 到 520 词),并指示他们调整阅读速度,以保证读完后可以回答相关问题。其中一些问题涉及「主旨」—— 比如「陈述段落的主要思想或基本目的」,其他的问题则涉及细节。学生每读完一个段落后,他们需要回答一个问题。 如果他们觉得之前回答错了的话,可以选择是否要重读该段落,以及是否要修改回答。
该实验的核心发现是:对于涉及主旨的问题,如果读者第一次阅读后给出了错误答案,他们不大可能选择重读并再次尝试回答 —— 只有 20% / 27% (对应两种实验情景)的测试情况会选择再次尝试。在重读的情况中,也只有 50% / 57% 的最终回答是正确的。
可能只是学生们比较懒,因为这只是一个人为的实验而不选择重读?或许吧,相比之下,如果是涉及段落细节的问题,回答错误的学生会选择重读,并且有 60% / 75% 都改变了答案。这个差异不符合「学生们比较懒、不关心答案正确」这个假设。为了进一步的探索该假设,作者进行了第二个实验。这一次,学生只需要对自己答案的自信程度评分,但不能重读和修改答案。结果,在对「主旨」问题的错误回答中,60% / 64% 的学生都显示高度自信!实际上,不论正确与否,他们对于自己的答案都非常自信。
作者还想知道,察觉自己是否理解的意识(comprehension awareness),是否只源于有较高的「语言理解和表达能力」(SAT verbal,verbal ability)?结果发现并非如此。他们对同样的学生样本实施了一次微型的口头 SAT,发现口头测试表现虽然和回答的准确度存在中等相关,但与学生的自信评分相关性并不明显。作者对此的解释是,这种自省意识至少部分区别于传统的自省评估手段(译注:也就是说传统的评估可能测不出来)。学生在 SAT 考试中得分较高是因为他们的第一次尝试就更可能是对的。当他们的答案错误时,相较于比他们的分数低的同学,他们不一定更可能注意到这一点。(译注:也就是高理解的同学在答错的时候,并不会更可能意识到自己错了)
上述论文的作者还发表了另一项研究[1],标题很有吸引力:《你不一定了解心里笃定的文章主旨》。他们做了另一个实验,和上文介绍的实验类似,也是要求一组学生阅读每篇文章并回答问题。不同的是,这一次,为了可以自信地回答问题,只要学生觉得有必要,可以不限阅读次数。对照组则是只能读一次文章。结果,「高确定度」的实验组虽然在每篇文章上花了更多的时间,且拥有更多的自信,但再理解上并没有显著地表现得更好。
现在,我们还不应该得出「没有人可以『领会主旨』」这样的结论。有经验的读者的确存在 —— 像[积极发表论文的教授通常富有经验](http://andymatuschak.org/files/papers/Wyatt et al - 1993 - Comprehension strategies, worth and credibility monitoring, and evaluations.pdf)—— [我们可以从研究他们的行为当中学到很多东西](http://andymatuschak.org/files/papers/Pressley, Afflerbach - 1995 - Verbal Protocols of Reading.pdf)。但是我猜测大多数的知识工作者会经常表现出阅读理解问题,就像我们反复在大学生中观察到的那样[2]。
从「它说了什么」到「它意味着什么?为什么?」
自从几个月前和 Alex 一起工作以来,我就一直有在思考阅读理解的问题,但是最近的另一次经历使得我开始重点关注它。
Dwarkesh Patel 是播客月球学会的主持人,该播客重点采访科学家和领域专家。Dwarkesh 的采访超越了普通的浮浅聊天,他对访谈嘉宾提出的问题追根究底、精心考察,因此而别树一帜。接下来几个月他安排了几位物理学家来节目,所以他决定认真学习更多物理知识以做准备。在讨论他如何最有效地实现这一目标时,我提议 Dwarkesh 来观看我的学习过程,我会学习他已经开始阅读的量子力学书籍,他或许会喜欢这个过程。我会把我的思维过程说出来,而他可以随时向我提问[3]。
Dwarkesh 对我学习这本书的方法非常惊讶。我阅读一页要用大约 15 分钟,而他只用几分钟或者更少。更重要的是,我不断地向文本和自己提出问题。例如:
-
这句话是什么意思?我能用自己的话解释它吗?
-
在此处,哪些想法和概念尤为重要?
-
作者显然默认我应该明白这个声明为什么正确ーー那么为什么它是正确的呢?
-
作者在强调这个细节ーー那么,它为什么重要?
-
在此处,作者似乎进行了对比ーー那么,对比点到底是什么?
-
这个细节和我已有的物理知识有什么联系?
-
如果我遮住这个例子只剩它的开头,那么我能够自行推导出剩下的内容吗?
-
我刚才弄错了ーー我理解了犯错的原因吗? 我能解释我的误解吗?
-
当然还有:我能简单回忆一下上一页说了什么吗?
做学术研究的读者会对这些问题比较熟悉。在《[如何阅读一本书](http://andymatuschak.org/files/papers/Adler, van Doren - 1972 - How to Read a Book.pdf)》中,Adler 和 van Doren 认为,为理解而阅读的本质是向书本提出问题,并尝试回答这些问题。要求不高的读者「不提任何问题——也得不到任何答案」。我是在以相当普通的方式严格要求。
但是,Dwarkesh 有着大学教育背景,他的工作也需要大量仔细阅读,他是一个有经验、有动力的思考者。然而这些策略——这些审问文本的方式——对他来说却出奇地新颖。他不仅在阅读文本时没有提出这些问题,不仅没有完全理解我所审视的许多词句的意思,而且并没有意识到自己没理解作者这些词句中的意思。作为一名读者,阅读的过程实际也在隐式地选择对文本的挖掘深度,他并不是主动选择不深入挖掘文本(比如因为时间原因)。而是说,他没有意识到自己正在经历选择。
我不认为这很罕见:我猜想大多数(尤其是 STEM 领域的)知识工作者在大部分时间都是这样阅读的,却没有意识到他们所做的权衡。当然,在我开始研究学习之前,我也是如此。
Adler 和 van Doren 给了我们一个过度简化的对比:「为了获取信息而阅读」和「为了理解而阅读」,即能够说出作者在说什么(信息),与能够说出他的意思以及他为什么这么说(理解)之间的区别(*译者注:这两者都能回答「What」,但前者至少不能回答「另外一个场景下我怎么用」)。在前文中,我们主要关注的是在理解作者在说什么时面临的问题。我们看到学生被要求陈述文本的主旨,而不是进行复杂的推理。相比之下,Dwarkesh 错过了关于意义和暗示的细节。
这些更深层次的内容要求读者超越印在字面的东西,因而更难获得。如果无法理解你专注阅读的句子,其文字就会让你困惑。另一方面,如果你理解一个句子的字面意思,但领会的不是作者定义的那个意思,字面上的文字不一定会引起困惑。只有当你头脑中的某种声音持续不断地提出「这部分如何融入整体?」这样的问题时,你才会注意到。这样问题不会印在页面上,答案通常也不在 —— 至少不是明显地呈现在页面上。
阅读理解与记忆系统之间的相互作用
因此:阅读理解比许多人预期的要复杂得多,特别是在更深层次的理解上。对我一个可能的影响是,如果我的目标是帮助人们可靠地内化困难的文本 —— 不仅知道它们在说什么,还理解它们的含义和「why」——那么直接关注记忆可能是本末倒置了。
我曾试图为 Alex 提供一个记忆系统,来帮助他学习物理 —— 其中装载了他所学习的章节中所有的重要细节。但他在复习环节中常感到痛苦和折磨:许多卡片,他觉得答案令人困惑,或是不明白它的重要性,或是觉得自己在机械复述而非真正理解。无论是复习花费的时间、难度还是收益,都比我预期的来得坏。理所当然地,Alex 逐渐反感记忆练习。
我越来越倾向于认为这些问题的根源在于阅读理解。当 Alex 发现卡片的答案令人困惑时,我认为他阅读原文中的相关解释后依然会困惑。因此,这些问题很可能不是由遗忘引起的,除非 Alex 在阅读时由于对前提概念的记忆较差导致认知负荷过高。也就是说,如果你没记清电场的基本细节,你就会难以理解下一章关于高斯定律的解释。但是他对第一章的卡片也有困难,所以这并不能完全解释目前发生的事情。
我们可以非常朴素地说:首先,请你理解材料;然后,我们会确保你记住它。这是两个互相独立的问题。SuperMemo 的创始人彼得·沃兹尼亚克(Piotr Wozniak)提出了类似的观点。这是一个很好的简化启发式方法*,但记忆系统的卡片与理解过程之间可能存在更复杂的关系。(*指提供一些简单的条例去做一个事情,这里就是 20 条要求去指导制卡? ——译者注)
问题嵌入文内,促进理解
在诸如《量子国度》的助记文本中,我们将提取练习直接穿插进文本中,因此每阅读几分钟后,你就会停下来回答关于刚刚阅读内容的问题。读者告诉我们,这种嵌入练习极大地改变了他们的阅读方式。关于文本中的「附加问题」的[现有研究](http://andymatuschak.org/files/papers/Hamaker - 1986 - The Effects of Adjunct Questions on Prose Learning.pdf)已经确定了四个明显的效果:
-
**特定前溯效应(specific backward effects):**附加问题会让你主动回忆前面的信息,增加你未来回忆起它们的可能性(译注:这几个中文词我编的,不是术语,反正意思就是你被问过后,你会倒回去留意以前没注意的,也会更留意以后相关的)
-
**一般前溯效应(general backward effects):**问题会引发对周边环绕文本和相关概念的脑内回顾,并进行深度加工;表现不佳可能会促使你重新阅读文本[4]
-
**特定后溯效应(specific forward effects):**在后续文本里,你会更加关注问题所涉及的内容;你对相关的后续材料会有更好的回忆[5]
-
**一般后溯效应(general forward effects):**再后续阅读时,你会更加专注,包括对于无关材料的专注;如果发现自己表现不佳,你可能会阅读得更慢、更仔细
我的理解是:在一定程度上,所有这些效应都会发生,即使你对材料的理解得不是很好。实际上,遇到嵌入问题可能会向你「揭露」你没有理解材料的大事实,从而「促使」你去理解材料(例如更仔细地重读)。这些效应展现了一个比线性的「理解 -> 记忆」的过程更为复杂的模型。
抛开具体的执行策略不谈,阅读理解在很大程度上与自我调节有关。你应该以多快的速度阅读?你应该关注什么?你应该对文本提出什么样的问题?你当前的行为在多大程度上产生了你想要的结果?当你的大脑被困难的材料占据时,你会很难回答这些元认知上的问题,尤其在你还没有养成自省的习惯时。嵌入练习在一定程度上外包了这些问答。嵌入的卡片建模了(一种特定类型的)「成功」阅读行为模式,它提供了反馈,并创造出思考和整合信息的自然停顿。
复习环节促进理解
让我们讨论你首次阅读之后最初的复习阶段,在几天和几周内。
如果在这个阶段,你发现自己完全不能理解某张卡片,那么进行回忆练习可能对你的理解帮助不大,除非这促使你重新阅读原文。但这种撞上「不理解」的方式,是令人不快的。你不在书桌前;很难找到原文本;你要么打断复习过程去重读(很麻烦),要么标记该概念以供之后学习(不靠谱)。将该卡片标记为「已忘记」然后继续复习是很诱人的选择(没有软件会提供「我不理解这个」按钮!)。我和 Alex 做实验时,还不像助记媒介那样将问题嵌入到他的阅读中,所以他的感觉是,常常「几天后才发现理解问题」。
但对于并非完全不能理解的例子来说,复习环节为更深入的理解提供了一个很好的机会。当你第一次回答问题的时候(阅读中),脑中的概念还很原始。但当你在几天或几周后再次回答时,你可能会以稍微不同的角度看待它。也许你已经阅读了更多依赖于这个概念的材料,或者你已经用它来解决过问题,或者你曾在谈话中提到过它。其中一些经历将与最初的细节一起重现。它们可能会帮助你注意到新的概念之间的联系。即使在我自己撰写卡片时,我也经常在经过几轮复习之后,才会意识到作者所表达的意思还有另一些重要方面。
提取促使增进理解的行动发生
假设你刚刚阅读了有关高斯定律的内容。你觉得你理解了作者的意思。你可以向别人解释它。你根据给出的示例学习如何使用它,且看到了它与库仑定律的关系。换句话说,你知道「作者的意思以及他这样说的(部分)原因」。在线性的「先理解后记忆」模型中,你已经完成了第一部分。
但是,当你尝试在一道简单的练习题中使用高斯定律时,感到很费劲。你不断地翻回去查看定义和示例。如果你能解决这个问题,以及其他几个问题,你会更深入地理解高斯定律。例如,你会直观地理解公式表面积分里点乘的结果。但是对材料的记忆不牢固,导致你很难解答这个习题。
如果你在几天内复习了相关的卡片,你就能将这些细节合并为更高层次的组块,并建立相关连接,这些连接会帮你在解决问题时以正确的时机提取到正确的知识细节。在做了一打习题后,你会对高斯定律的一些问题建立起解决过程上的自动化,这会使你更容易去解决更多问题,进而促进更多的理解。
在这个故事中,我们翻转了「先理解后记忆」的模式:反而是记忆帮助了你创造某种理解。
制卡促进理解
到目前为止,我讨论了助记媒介的框架,即专家为你 —— 也就是读者 —— 编写记忆系统卡片。但是,如果你愿意并能够自己编写助记卡片,这个过程对你的理解会产生深远的影响。
这个路线要求很苛刻。要写出好的助记卡片,你必须不断地思考:这段文本的哪些部分很重要,哪些不重要?我能用自己的话表述这个概念吗?这个概念与我已知的其他内容有什么联系?它与我的兴趣有什么联系?我能找到概念里需要写成卡片的边界条件吗?我能为实际问题生成一些例子吗?我能观察到作者的心智模型或动机的重要之处吗?这些编写卡片的问题在很大程度上与为理解而阅读的问题相重叠。而且在两种情况下,你都经常会发现,自己因为没有仔细阅读而无法回答这些问题。这给了你一些调节阅读所需的反馈。
在上一段中提到的问题是你会对文本提出的问题,但是随着你更好地理解编写卡片的媒介的内禀「粒度」,你会注意到你也会对自己的卡片提出上述问题。你会看着你写的卡片思考:这是否概括了这个观点的核心?你会尝试完善卡片:这些细节中是否有不必要的、可去除的部分?你会想知道:我是否捕捉到(概念节点之间)所有重要的联系?你已经写了一张卡片来陈述 A 是这个情况;所以现在你自然地会问:我能否写一张卡片关于 A 为什么是这个情况的?通过回答这些问题,你对于所读材料的把握会更加明晰。
所有这些,奇怪之处在于,表面上你创建这些卡片是为了以后记住这些细节。但很多时候,可能是创建卡片的过程本身——而不是后续的复习 —— 对你的学习体验影响更大。以至于你感觉可以扔掉这些卡片,只是把它们当作一种结构化的笔记方法。对此,Michael Nielsen 指出,对卡片后续的练习有极大的激励作用。抱着记笔记的念头,有时像是做抽象的作业,你知道你可能永远不会再看这些笔记,这会侵蚀你的动力。但如果你有过「记忆练习帮助你轻松牢记大量细节」的用户体验,就会对「为有趣想法编写新卡片」自动产生价值感。你会树立了这样的信念:「制卡有益」,你知道你将再次看到这些内容。你有信心持久地记住你所写的所有细节,所以这个过程感觉更真实、更有意义 [6]。即使其中许多卡片实际上只是「糟粕」,是写后即丢的引火物,这一点依然是对的。你用它们来理解材料,以写出一些你真正关心,愿意复习的卡片。
当然,这是一个非常费力且困难的过程。这大概就是为什么助记媒介会完全自动化卡片编写过程。一些脚手架式的半自动领域也是值得探索的有趣之处。
对我研究的影响
我最初以一种简单的方式框定我的目标:「让人们更容易记住他们所读的内容。」但在学习的情景和处理解释性文本的情境中,我更感兴趣的是「让人们更容易内化和运用复杂的思想。」这的确更有意思,但也意味着问题的扩大化。上个月我写过,记忆系统可能需要扩展以支持实践问题解决。现在我谈的是,记忆系统可能需要扩展以支持阅读理解。
扩大研究范围不一定是好主意,事实上反而可能比较糟糕。单单研究回忆、问题解决、阅读理解就已经耗费了很多人毕生精力,所以我并不打算着手解决整个问题。但由于这些问题之间存在明显的相互作用,如果在它们交织的部分上,对着不寻常的点进行深入思考,或许我会得到「解决其中某个问题子集」的更强大的方案 —— 相比于仅仅专注于单一方面(e.g. 记忆)而言。
以理解为中心的文内问题
前文,我们讨论了在助记媒介中嵌入的问题,是如何帮助提高阅读理解能力的。但值得注意的是,我们并不全都「试图」这么做。我说话仅代表我自己——Michael 的设计目标可能有所不同——我试图测试和强化读者对卡片中特定材料的记忆,并为后续的练习留一个入口。我们谈到了在阅读中实时「反馈」的概念,谈到了塑造好的助记卡片,但我们并没有采用一个明确的框架以系统性地促进阅读理解。
这个问题很有意思:如果以增强阅读理解能力为主要目标,你会怎么设计呢?比如只是为了在元认知上获得同样的收益,你可能不需要问那么多的问题。如果只是为了元认知,更好的做法是在当天提出一两个更高层次的「解释性问题」,而推迟记忆细节到第二天。解释性的问题旨在促进对文本的深层加工和反思,我们(图它的过程)而不是答案本身 —— 答案本身可能根本不在文本中。对于回忆类型的卡片,我们在设计上不鼓励回头查看源文本;但对于这些理解类的卡片,我们希望界面上的设计不排斥甚至鼓励用户回滚页面、再次阅读。
在受控的实验环境中,[有证据表明](http://andymatuschak.org/files/papers/Hamaker - 1986 - The Effects of Adjunct Questions on Prose Learning.pdf)这类问题可以帮助阅读理解。但我对这个方向并不是非常兴奋。很多书已经包含了类似的解释性问题;它们似乎并没有强大的影响力;那么我的建议又会有什么不同呢?关于这一点,许多教科书在文本中嵌入了类似提取练习的复习问题。助记媒介的不同之处在于,当你回答出现在助记文章中的问题时,你主观上的设定,是自己要记住答案直到永远。
我发现,大多数情况下,我不喜欢回答书中与理解相关的问题。它们常常让人感到居高临下、无聊,就像令人不快的家庭作业。我不在乎回答这些问题,而且,(不管对错)我通常觉得这样做,对我关心的方面没有助益。
讨论题
教科书习题列表中的解释性问题?不行,无聊,我不在乎。但是在芝加哥大学的课堂上,讲师问了我一些解释性问题,我发现我愿意回答它们。有时候是因为问题非常有趣,但通常它们是一些简单的问题,比如:「亚里士多德对于 X 给出了什么样的理由?你相信吗?」
我认为区别主要在于社交环境。一个我尊重的、真实的人正在问这个问题;他们会真正地与我的答案互动;其他学生可能会在我的回答上展开讨论,或者给出有趣的个人想法;讲师会把我们的答案与后续的问题联系起来,等等。这也部分关于我活动的构架或安排方式。我选择参加了这场关于书籍的讨论,所以这就是我要做的。我正在「讨论」,而不是「做无聊的阅读理解题」。
当然,这些简单的「讨论」题常常揭示了我未能理解作者的意思。我要明确这一点:我在阅读理解方面也有困难!之前我与 Dwarkesh 呈现的情景中,他看到的我正处于「非常仔细的专家阅读模式」。我「上心」是因为我知道那是他想要看到的,而社交环境强化了我的参与感。当我处于「仔细加工文本以编写卡片的模式」时,我的理解力相当好。但在不那么极端的情况下,我经常会犯错。我希望有一种阅读增强技术,可以帮助确保我对一篇文本的理解达到我期望的深度——只要这种增强不会带来过于沉重的负担。
这些讨论确实能够增强我的理解力,尽管进展非常缓慢,且覆盖面有限。而且,我做不到对我所阅读的一切都轻松地组织一场具有良好引导的讨论。对此,技术党的速答是:使用大语言模型(LLMs)!让一个机器人向我提问并为我的答案提供反馈。也许在未来的某个时候,我能够与机器人建立起持续的关系,但目前来说,我发现这种互动无法引起我的兴趣。我并不在乎回答机器人的问题;我知道它并不真正「想要」知道答案;它并不「关心」我的回答;我的答案对它来说没有「意义」,等等。
还有一个可期的替代方案,可能接近于「[精细口头复述](http://andymatuschak.org/files/papers/Simpson et al - 1994 - Elaborative verbal rehearsals and college students' cognitive performance.pdf)」。这是一个很简单的练习:在阅读完一段文字后,闭上眼睛用自己的话解释其内容。这种方式与问答的相似点是,它们都可以加强基础理解力,但两者的情绪感受却非常不同。特别是,它不会让我觉得在回答一个我不关心的无聊问题。对了,这里也有一些有趣的增强的余地。例如,目标文本可能有你在解释中没有包含的重要细节,因此可以在实时生成的语音文稿上进行涂画,圈出与它相冲突的部分。再比如可以用一些标记打在文本上,反映你理解了文本的含义,但不知道它为什么是重点。
实用角度上,有一个重要的问题亟待解决:被要求记住从未理解的细节令人非常不快。避免这种情况的一种方法是促进理解,正如我们之前讨论的那样;另一种方法是避免问及尚未理解的材料。也许尽言复述提供了一种实现后者的方式:我们只会要求你记住你的解释中包含的细节。
开卷练习
我理想中的记忆系统不仅会加强我对一个概念的回忆,而且会随着时间的推移深化我对它的理解。我们已经讨论了一些可能实现这一目标的方式,例如辅助式的问题解决实践、反思卡片、综合卡片等等。这些任务旨在从内部产生理解 —— 即:通过解决某种类型的问题,你会获得某种类型的洞见。
但是,如果两周后我带着加强的记忆和新鲜的视角再读一次文本,或许也能够加深我的理解。我可能会更好地理解作者的某个观点的重要性,或者发现我在第一次阅读时错过的某种联系。当前的复习环节的模式存在一个限制,即它与文本是分离的;它基本上假设你在第一次阅复习读时就完全「理解」了一切。如果你没有理解,那么就一定视作一种简单的记忆失败。而复习环节实际上无法包含可以引导你重新解读文本提问。
我想象中,可以围绕「开卷考试」设计一种复习界面。想象一下,在屏幕的一侧浮动一个卡片,而其余部分则用于显示原始文本。结构化、辅助式、有目的的重读可以直接融入到复习体验中。而且开卷考试[似乎](http://andymatuschak.org/files/papers/Agarwal et al - 2008 - Examining the testing effect with open- and closed-book tests.pdf)也能对长期记忆产生相当的效果。
表面上看,这个建议似乎与我之前提出(并否掉了)的整合式理解问题非常相似。但是我认为有两个重要的区别。首先,我想象中引导阅读的卡片不会是简单的理解问题,而是深入探究的问题,鼓励读者以新的方式看待文本,或者与后续材料建立连接。其次,我认为在复习环节的情境中可以遇到相应问题这一点很重要。你已经同意了做练习,然后我们给出了练习题。当你阅读时,你可能会觉得自己同意的是阅读,而不是回答复习题。
————————
很明显,我还在摸索如何利用我近期对阅读理解和问题解决实践的观察。我怀疑这与记忆系统可能存在着一些有价值的可结合领域,等待着我们去发现。
————————
感谢 Michael Nielsen 和 Russel Simmons 针对这个话题的有益对话。同时也感谢 Dwarkesh Patel 和 Alex 分享他们的学习经验。
脚注
[1] 不幸的是,我找不到这篇文章的全文(《国家阅读会议年鉴》看起来像一个小型的论文集),所以在这里,我无法评估整个研究,只能总结概要。
[2] 更多信息请见[这篇综述](http://andymatuschak.org/files/papers/Pressley et al - 1997 - Some of the Reasons Why Preparing for Exams Is So Hard.pdf)第九页第一段所包含的参考文献。
[3] 这一视频将在接下来的几周内发布,同时还会有一个更传统的采访。
[4] Hamaker 的综述没有讨论后一观点,但我从助记媒介的读者那里听到过很多这样的反馈。有趣的是,我在有关附加问题或阅读理解的文献中尚未找到探索这种效应的研究。可能是因为我还没有找到合适的专业术语。
[5] Hamaker 的综述没有讨论后一观点,且这一观点的研究程度不如我提到的其他效应,但通常将其称为「测试强化学习」或「前向测试效应」。例如,可以参考 [Arnold 和 McDermott 的论文《测试强化学习:区分测试的直接效应和间接效应(Test-Potentiated Learning: Distinguishing Between Direct and Indirect Effects of Tests)》(2013 年)](http://andymatuschak.org/files/papers/Arnold, McDermott - 2013 - Test-Potentiated Learning.pdf)。
[6] 这种建立信念的过程部分说明了为什么「仅仅机械地重复答案」的经历极为有害。问题不仅仅在于那一刻感觉像是浪费时间,或者你没有理解自己想要理解的东西。这种经历(理所当然地)破坏了你对记忆练习的价值的信念。
当一位独立研究者反思 2020 年
原文:Reflections on 2020 as an independent researcher | Andy Matuschak
2020 年是我成为「独立研究者」的第二年。这个工作名字听起来很古怪,但给了我很多自由,我对此很感激。不过这个工作也不太明确。对于已存有的机构和角色通常自然而然便可提供的模式和结构,我尚需自行毫无导引地摸索。为拉开 2021 年的序幕,我将分享我所学到的一些东西,以及似乎是最相关的关键问题。这些观察自然是相当个人化的,但我希望它们能够引起其他考虑走类似道路的人的兴趣,发挥一些作用。
1. 为什么要独立工作?
我对为独立而独立不感兴趣。我的兴趣是创造可以大大扩展人们思考和行动的环境。实现这个目标——而非一个特定的头衔、角色或做法——是我工作的动力。当我用「独立研究者」这样的短语来描述我的工作时,这个头衔是一种简略表述,代表了我真正重视的东西:探索的自由。
就这一点而言,我对「独立研究者」是否是一个稳定或理想的长期身份持怀疑态度。独立性提供了自由,但它也有相当大的局限性,我将在这篇文章的后面详细讨论。如果工作进展顺利,独立研究者很可能会找到令人信服的机会,发展成为一些更高杠杆的机构——工作室、基金会、学术中心、企业。如果工作进展不顺利,大多数独立研究者将很难维持下去。
对我而言,我的志向不仅仅是解决目标问题,比如说,忘记了你读过的内容。我想更深入地理解赋能环境的属性——操作原则、设计程序和模式、与个人和社会认知的关系——以培养一个经常发明这种新环境的社区。领域的创造十有八九会包括机构的创造。但我现在的理解尚浅,无法看到更多。
为什么不创办一家初创公司呢?
我通过制作软件来理解理论,而且我住在旧金山,所以人们常常以为我打算成立一家创业公司。但我的兴趣与创业公司的基本动力:增长不一致。我对创造深刻见解感兴趣,对创造增长不感兴趣,除非增长是理解我试图探索的想法所必需的。
一些公司想出了如何协调这些目标,使边际收益/利用率能够带来边际的基本洞见,而基本洞见又能带来边际收益/利用率,以此类推,形成一个良性的循环。皮克斯就是一个很好的例子。尖端的图形学研究促成了新的叙事方式,其带来的收益又资助了更多的研究。可以肯定的是,许多初创公司确实发现了基本洞见,但通常是作为一种和公司的根本目标不一致的手段。像皮克斯这样的稳定循环是相当罕见的。你需要一个具体的理论,说明为什么一个特定的商业模式与一个特定类型的洞见生成有关。你还需要解释为什么边际洞见仍然是边际业务的持续的前提条件,而不是在省事时可以削减的「可有可无的东西」。对于我自己的工作,我还没有这样的理论。这种飞轮效应在我的领域里极其罕见,因为新颖的接口创意通常是公共物品。它们的开发可能需要大量的投资,但一旦创造出来,往往可以被其他人低成本复制,而发明者的回报有限。
我不得不为自己理清一个相关的问题:我真正的目标是洞察力,还是影响力?我的目标仅仅是发明这样的环境——还是要将其操作化、规模化和推广?好吧,我的工作确实是受使用启发;我更认同应用研究人员,而不是纯粹受发现驱动的基础科学家。所以我不想在一个没有可能产生变革性影响的项目上工作。但是,只要我有一些关于这种影响如何产生的有说服力的理论,我就更愿意专注于通过原型产生洞察力。我更愿意让别人把这些洞察力变成可扩展的产品。
换个说法,我在此引用一句关于创业公司的常见套话:「创意低贱;执行为王」(ideas are cheap, execution is what matters). 这句话是个不错的的经验法则,或许被过分强调了——但不是因为新创意不重要。创业公司是脆弱的。它们通常专注于执行力为主要竞争力的利基市场,这是因为它们不得不如此。如果面对的利基市场要求公司兼备出色的执行力,以及深刻的原创性洞察力,那么创业公司往往无法存活。从这个视角出发,我找到了描述我的目标的一种方式:把想法完善得足够「显然」,跻身「低贱」的创意食粮之列,让未来某批参加 YC 课程的创业公司可以用得上。
令我对创业犹豫不决的另一个关键错位是「文化」。科技文化与研究文化不同,而我在科技文化(的倾向)已经有了相当大的比重。任何在某个行业工作了一段时间的人都倾向于采用该行业的文化元素——包括流程、标准、价值观和隐性知识。当然,这其中有很多非常有价值,但这些标准也造成了限制。
例如,科技文化的节奏比研究文化快得多。对硅谷的技术人员来说,一个「大型项目」可能持续一年或两年的时间;而对研究人员来说,一个「大型项目」可能持续十年。坚持解决一个困难的问题,对一个技术人员来说可能需要数十小时,而对一个研究人员来说,无论怎样高效也需要成百(上千)小时。这并不是因为技术人员天生懒惰:事实上在制造业,花几百个小时来思考某一个问题通常不是个好主意。最好是创造一个符合 80/20 原则的解决方案或尝试不同的方法。但是,基础性的深刻见解往往需要更多耐心和专注的思考,而无法用科技文化天然鼓励的启发式方法。来自科技行业的我,对于我正在处理的许多问题,常常会严重错估其进展速度。当我觉得我已经对一个问题苦思冥想了很久的时候,其实才花费了几十个小时而已。这算不了什么!这种心态不仅会使我错过我探求的结果,还会顺带把我逼疯。我正在努力更放松的面对慢节奏。
为什么不成为一名学者?
如果我对探索的自由感兴趣,并专注于产生洞察力,为什么不加入学术界?有一些无聊的答案:「要么出版,要么灭亡」,「资助跑步机」,霸道的行政责任,保守主义等等。但真正的原因是我选择的领域。我的目标、价值观和实践与最自然地承载我的工作的学术学科——人机交互(HCI)——很不一致。如果在另一个宇宙中,我对不同的主题感兴趣,我很有可能会成为一名学者。
这是不带偏见的说法。主观和更具煽动性的说法是,我觉得 HCI 的学术研究阻碍了视野和想象力。看起来局部问题是该领域过分追求成为一门科学。它强调经验方法,经常对无趣乏味的系统进行精心的人工评估。同行评审员似乎更青睐分析和数据,而不是独创性和引人入胜的研究方向。这个领域不鼓励建立足以探索新模式的重要系统;发表的系统很少由严肃的使用环境驱动。我每年都会阅读( HCI 的)重要会议论文集,然而通过研究游戏设计师和特立独行的 Twitter 多面手,我学到的 HCI 知识要比读论文集多得多。当然,也有一些研究人员克服该领域的挑战做出了大量的工作。你很难不被 Hiroshi Ishii 或 Ken Perlin 这样的人所启发。我得声明,以上是对该领域的评论,不针对其中的个人,他们一直给我留下善良和好心的印象。但不利因素似乎太强,无法克服。
我再分享一个关于这个领域的故事。我注意到我喜欢的几篇论文上有一个教授的名字,所以我邀请他们来聊天。我们就这个领域的话题进行了友好而广泛的交谈。然后在一个点上,我问道:「您是如何在推进实验室的长期研究计划和支持您的研究生的研究之间取得平衡的?」他们有些惊愕地回答:「哦,不不,你搞错了。我主要是帮助学生进行他们自己的研究项目。我并没有推动我自己的任何长期研究计划」。我怀疑他们夸大了自己的立场。表面之下,我可以看到一些一致理论贯穿学生论文。但是,如果所有的教授都真的抱着这样的信念来进行研究,可以想见会发生的问题。整个领域将只由学生的工作组成,没有任何场所让高级研究人员随着时间的推移形成自己的想法。我确信这不是实际发生的情况,但定性地看,这与我在阅读主要会议的论文集时得到的感觉并没有什么不同:感觉就像在浏览一片汹涌的泡沫——微小的孤立研究很少被纳入更广泛的潮流。
我批评 HCI 的学术研究的原因不是出于恶意,而是出于真正的困惑。老实说,我不明白为什么这个领域会变成看上去的那样。要是我错了,该多好。如果你认为我误解了什么,请多多指教。也许问题在于,我实际上是在试图启动一个还不存在的领域,所以当然 HCI 看起来是错位的。也许这是我的 Bryan Caplan 的酸葡萄版本。也许我太傲慢或太闭塞了。
所以我独立工作。不是因为这是一个理想的安排,而是因为我没有看到一个好的替代方案。我还不知道如何创建或加入一个机构,以实现更好的工作。部分麻烦来自于在一个原始领域工作,没有足够坚实的方法论或原则来有效地支持一批新研究者。事实上,我对自己的项目还不够了解,无法有效地围绕项目协调大型团队,尽管多来几个人我肯定可以派上用场。当然,最实际的增量制约因素是资金。让我们来谈谈资金问题。
2. 众筹研究的意外成功
当我在 2019 年初离开可汗学院时,我和我(非常善解人意的)妻子制定了一个粗略的计划:在 2019 年,我会专注于工作,完全不考虑资金问题;在 2020 年,我会想出一些可持续发展的计划,并开始朝着这个方向前进;希望到 2021 年底,我们会停止烧钱。我的合作者迈克尔·尼尔森建议我们在 Patreon 上建立项目,为我们的工作筹集资金,我没有多想就同意了。他现在已经离开了,但我很感谢他的早期推动。
不到两年后,我的赞助人已经众筹出了大约一个研究生的奖学金补助。这不是一笔巨款,但足以支付我的生活费用。这是一个重要的里程碑!只要这个收入流继续下去,我的跑道就可以无限期延长,或者至少在我开始为无法储蓄而感到紧张之前。我的目标是在 2020 年结束时制定一个如何最终资助我的工作的计划,但我现在惊讶地发现自己在 2020 年结束时就有了充足的资金。
这是一个其他独立研究人员可以使用的模式吗?我的故事不一定具有普遍性,但我将分享一些观察结果,这些观察结果可能对其他有兴趣尝试众筹研究的人有用。
增长的众筹研究基金
首先,我们应该研究增长和流失的动力。如果要成为独立研究的可行来源,资金必须是稳定的。在技术与勇气中,[Ivan Sutherland 将勇气描述为研究的关键因素之一](http://andymatuschak.org/files/papers/Sutherland - 1996 - Technology and Courage.pdf)并指出:
我发现我只有这么多的余地来承担风险。当我能减少我生活中某些方面的风险时,我就能更容易面对其他领域的风险。我通过减少我在其他领域对勇气的需求来为自己提供做一些事情的勇气。
这显然符合我的经验,不仅是在 Patreon 方面,而且在婚姻、房屋所有权、对幸福的投资等方面。
这些图表描述了我在 2020 年的月收入和月会员人数增长的趋势(差异是由于赞助人的认捐数额分布的波动造成的):
那么,总体而言,我的 Patreon 经历的特点是不太快但稳定的增长。为了了解资金的稳定程度,我们应该了解流失的变化,而这些图表并没有描述这一点。这方面的情况看起来还不错:每月的新増赞助人比率(中位数,第25-75%)为 9%(8-15%);每月流失的赞助人比率为 3%(2-4%)。这显示出合理的稳定性,尽管流失量应该随着时间的推移而增加,因为我的 Patreon 账户是新的,而新赞助人的增长可能会随着对我感兴趣的受众的饱和而下降。
年度计费对我很有帮助。大约有四分之一的新赞助人选择按年认捐。假设资助稳定增长,那么,这些赞助人的年度捐赠使我的资助增长曲线快进了约三个月。年度认捐还为估量资助的稳定性提供了一个有用的额外方法。
我在 Patreon 上提供了三个资助级别:5 美元、20 美元和 100 美元。目前,这三个级别几乎是我随意指定的——唯一的区别是 100 美元级别可享有公开署名权(似乎没有赞助者很关心这个)。但是这些级别使人们可以根据他们的兴趣和能力来调节他们的支持力度。我对价格组合的效果相当满意。我的大半资助来自 5 美元级别的赞助人,而少数更慷慨的赞助人的捐款则大大增加了我的资金。总的来说,这种组合产生了足以维持生计的资金,也不会让我有面对单独资助者时的心理负担。这使我可以保持良好的心态。在可汗学院时,我们经常相当依赖少数提供巨额资金的捐赠者,因此我们经常为讨好他们而烦恼;如果某个人拒绝再提供一笔资助,会给我们的财务状况造成巨大的压力。「草根」环境为我和资助人创造了一种更健康的人际关系——其中一些人是私人朋友,我不希望有人出于某种负罪感而觉得必须继续资助我。
赞助人的增长看上去大致是线性的,但你会注意到在 5 月前后,图表的斜率出现了变化。那时,我决定尝试分享更多赞助人专属的创作内容。这个策略似乎确实起到了吸引作用,尽管我实际上并不确定独家性有多重要。这些文章推动了新赞助人数量的增长,我推测部分原因是,赞助人网络中的其他人有了更多机会偶然发现我的作品。较高的增长速度,是因为人们想要解锁付费门槛,还是因为文章创造了流量?我几乎没有推广我的 Patreon,因为我还不知道如何以一种让我感到舒服的方式来推广。所以,这种类型的流量可能很重要。
公开研究
众筹研究的一个惊喜是,我很高兴与热衷于我的想法的群体建立了更密切的关系。但是,为了做好工作,我不应过多考虑资金和赞助人。那么,持续提供独家内容的承诺造成了一些紧张感。与典型的付费通讯或博客不同,面向赞助人的独家内容是我主要工作的次要副产品。在这方面,我不是一个传统的「内容创作者」。我发现自己有时候会去想我接下来要给赞助人创作或报告些什么。这可不好。这种过于认真的心态,会助长旨在讨好他人的浮浅工作。此外,我也是人,所以我自然希望报告成功。但是这会造成压力,正如科学出版中已存在的一样:短期主义、保守主义、出版偏见、有害的过度宣扬。在研究中,非常重要的一点是,你要对自己「诚实到近乎残忍」。我认为,如果做不到对现实视而不见,你就不可能为你的「巨大进展」制作营销信息——这意味着你在与他人谈论你的工作时,最好要「诚实到近乎残忍」。
作为对策,我尝试实践迈克尔所说的「反营销」策略。也就是说,要使大众的关注点集中于我的项目中最不乐观的部分——哪些是令人困惑的,哪些是令人沮丧的,哪些是不成功的。很难始终做到这一点,但当「反营销」成为目标时,有趣的挑战就变成了积极的东西:成为公众对话的有用素材,而不是被扫到地毯下。我猜想这也会使我与读者建立起更深刻、更真实的关系。
更宽泛地说,我今年试验了一种心态,我称之为「开门造车」。我试图分享我的工作过程中粗略的、正在进行的部分,包括存放我大部分日常思考的工作笔记。当我采用正确的心态时,这种做法效果相当好——我分享的是作为我主要工作的一部分而制作的东西,而不是专门为发表而制作的东西。
这种做法产生了更多「自由的」对话和偶然收获。值得注意的是,在大多数方面,相较于页面浏览量或其他更传统的指标,不寻常的收获对我的工作来说是一个更好的先导指标。流行的项目可能会获得更多的大众关注,但来自特别的、非凡的人的关注却少得多。这些人往往会引入令人惊讶(且更有意义)的见解和机会。
除了可能的干扰和曲解外,在与广大读者谈论正在进行的研究时,还有另一个小问题。你的想法中最清晰、最熟悉的部分是你最容易沟通的部分,也是你的交流对象最容易掌握的部分。通常情况下,这些元素已经有点主流甚至是陈词滥调了。其他人很可能有许多关于这些想法的思考缓存(cached thoughts),而且这些思考缓存往往会被渐进式地理解。
但是,如果你在做一些原创性工作,这些工作最有趣的方面,往往是别人和(尤其是)你最不了解的方面。特别是在早期,你可能无法很清楚地表达你想所追求的新元素。这个新元素听起来可能仅仅像特别的副词,或是看似无伤大雅的修饰词。其他人对你的作品的反馈,倾向于强调最主流的元素,因为对于你都不理解的地方,他们可能没注意到,甚至无从回答。这样的对话往往会把你拖回主流道路。这是一种思想上的「均值回归」。
优秀的同事和合作者会主动采取措施来避免这种倾向。例如,如果迈克尔听到我在谈论一些好似无关紧要的想法,他会故意调整对话走向,直击我言语模糊之处,这正是我竭力超越典型解释的地方。这个做法归属于一个更广泛的行为,他称之为「赋能倾听(listening for enablement)」。我在可汗学院时的研究同事 May-Li Khoe ,听到我描述一些我自己都不太理解的想法时,会在难以预料的地方即兴思考,以此回应。她的简略描述往往探索的是截然不同的路径,但这些生动的回应,往往可以帮助我更好地理解自己的零星想法。不幸的是,我还不知道在与广大读者定期讨论想法时,该如何避免这一「回归」问题。
赞助人买的是什么?
免费网站通常有一个「捐赠」按钮,上面写着「如果你喜欢这份(免费)内容,请考虑用捐赠来表达你的感谢」。这就是我们一开始对 Patreon 的认知:差不多就是个小费罐。但在赞助模式中,人们持续资助着我的工作。小费罐模式并不能很好地解释这种行为:为什么(人们)会因为对旧材料的谢意而持续捐赠?
在与赞助人的互动中,我惊讶地发现,利他主义很少是主导力量。赞助人大多不认为自己是在为已有的工作成果买单;他们是在为我未来的工作产出买单。
从这个角度来看,把工作成果的生产本身看作是一种产品可能更有意义。当赞助人购买该产品时,他们购买的是什么?在其最不可抗拒的形式中,赞助人的资助带来未来工作成果的产出,且没有资助就不会有产出。也许没有赞助人的资助,创作者必须花一些时间做自由职业者来支付账单,因此他们的项目范围受限;但有了资助,创作者就可以全职从事更艰巨的项目。或者,他们可以聘请自由艺术家为他们的游戏绘制插图等等。这就像 Kickstarter 的众筹活动,只不过是以一种持续的方式,而不是只有一次性付出。对当下的我来说,小额资助为我买到了一些更微妙的东西:不断增长的信心和稳定性;不必取悦基金会或投资者的自由。随着资金的不断增长,小额资助很可能使我可以将一部分工作外包,以扩大项目范围。
在 2020 年 12 月,我请求我的赞助者简要解释,为什么他们支持我的工作。大约有四分之一的赞助者回信了。绝大多数人写道,他们的动机是支持我未来产出工作成果。有些人目的比较具体,他们想使用我正在开发的原型;其他人只是想看到某些想法得到进一步完善。大约三分之一的人写道,他们资助的是「人,而不是项目」,普遍对我未来工作的吸引力抱有信心。自然,这是我最喜欢的一种支持。与此不同,第二类常见动机则只是为了获取独家内容。
我曾考虑让赞助人从事先写好的列表中选出最喜欢的几个原因,但我后来认为阅读开放式的答复会更有趣。我很高兴我这样做了!我不曾设想过以下动机中的任何一个,但每一个都有 10% 以上的受访者表达了出来:
-
赞助机制创造了一种处于新事物「前沿」的感觉
-
参与众筹研究这个实验
-
「近距离」观看我的工作是个人灵感的来源
-
想支持广泛意义上的「思想工具」(而不是我的任何具体项目)
了解这一切有助于我更好地确定如何公布描述并关联 Patreon。例如,将独家内容作为重要动机的读者相对较少,但它显然加速了资金的增长。看到赞助人的这些反应,我深入研究了数据,发现在我开始与赞助人分享额外的内容后,赞助人的退出率下降了大约一半。我目前的理论是,对许多赞助人来说,这种内部内容之所以很重要,主要是因为它加强了「是他们的支持创造了边际生产」这一印象(这大概是真的),这是迄今为止人们提到的最主要的动机。
我的可持续发展之路
我在众筹方面取得了微小成功,这种做法可重复性如何?其他人能走这条路吗?我不知道,但有必要阐明一些可能至关重要的因素。往高了说,我的故事是借力科技行业的职业资本的故事。正如 Adam Wiggins 所建议的那样,我猜想,很多有数年行业经验的技术人员都可能做到这一点。
首先,也是最重要的是,我在经济上可以做到几年内(按原计划)无任何收入也可以维持生计。对大众而言,这是少见而幸运的!不过,对于许多科技工作者来说,这并不是一个非常离谱的目标。这些资本大部分来自于在苹果公司工作的五年:加入可汗学院(一个非营利组织)使我的收入减少了三分之二。旧金山的房价相当昂贵,但我们通过用买房替代租房降低了成本,当然这也需要资本。我妻子的大方和通情达理是罕见而必不可少的。不过从实际情况来看,她的医生职业也很有帮助。从 2011 年到 2020 年中,她一直在接受培训(学医太疯狂了!),最近则开始担任她的第一个「正式」主治医生职位,现在终于有了自己的高收入潜力。此外,我们没有(也没有计划要)孩子;抵押贷款是我们唯一的债务;我们各自的原生家庭也不需要我们在经济上予以支持。除了居住在旧金山这一点以外,这是一个相当理想的财务状况。
我应该提到,对我(以及其他许多科技工作者)来说,还有一条直截了当的道路,根本不需要众筹。在我离开苹果公司之前,我的计划是攒够钱,在辞职之后持续用利息给自己提供研究生津贴。如果我足够勤奋,这本来需要再来五年左右。这似乎是很容易实现的,尽管当时苹果公司的工作让我感到乏味,甚至到了可能会造成一些永久性伤害的程度!
虽然我计划在没有收入的情况下生活,但我通过成为 Emergent Ventures 赠款的幸运接受者,避免了动用储蓄。这涵盖了我第一年的开支。我当然会向其他试图寻找支持其独立工作的人推荐 Emergent Ventures。我的申请只花了几个小时;我与 Tyler Cowen 进行了半小时深思熟虑的愉快谈话;他们在几天内就做出了决定;我唯一的义务是向他们发送一些简短的报告。与我平时和基金会打交道时的沉重经历相比,Emergent Ventures令人愉快,而且给了我勇气。这笔资助引导我成功创业:在资助用完时,我的赞助人们(的支持)已经几乎能覆盖我的大部分开销。自我淘汰似乎是慈善资助的一个理想结果。我猜这种引导对很多人的独立工作众筹相当重要:赞助人需要时间来积累,但最初的几百笔捐款还不足以让你辞职。
撇开资金不谈,有一些相关的职业资本因素可能对我的工作进展也至关重要。它们可能对其他从事类似工作的人也很重要。
首先,也是最重要的是,我有足够的专业经验,建立了一个罕见的技能组合。我可以独立研究、设计、实施、分析和报告新颖的软件环境。当然,我不是世界级的平面设计师或文献审核人,但我能够独自执行整个端到端的过程,这一点意义重大。另外,还有一个程度的问题。能够建立系统雏形很重要,但我能更容易地建立经过高度打磨的成品系统,这些系统能够有组织地吸引用户,且能够与严肃的真实世界的情境相接洽。我猜想,学术 HCI 的一个关键挑战是,研究人员往往缺乏设计和执行面向消费者质量的软件的技能(如果有这种倾向的话)。没有这些技能,许多项目就会止步于玩具阶段。
我过去的经历也产生了必要的社会资本。大多数人似乎并不关心我是独立开发者,但我怀疑这只是因为我可以在介绍自己时说我在苹果公司帮助建立了 iOS 系统,并在可汗学院领导研发工作。如果没有某种强有力的社会证明,可能很难让人认真关注我的工作。按照同样的思路,我过去的工作和写作已经积累了一个不太大但足够可观的网上读者群体。我不需要学术期刊或出版商推销我的作品,因为我可以在 Twitter 上「发表」。按照「公共知识分子」的标准,我的读者不算太多,但它足以产生强大的网络效应,使我的工作得到相当广泛的传播,并促使人们建立有趣的内在联系。这个网络也是我大多数赞助人的来源。我想,如果没有 Twitter,我不可能招募到这样的资助者受众——至少不可能让我在几乎毫不费力和为此而分心的情况下招募到。
因此,我的职业旅程似乎有一些重要的路径依赖。如果我试图立即进入我现在的工作,我就会缺乏许多关键的技能;我就会工作得太慢;我就会为推广我的工作和向资助者推销而分心。也许尽管有这些挑战,我还是会进展顺利。我不确定!但我的经验确实表明,更多的「主任/首席」级别的科技工作者可以成功地转向独立实践。
我对最后这一点不太确定,但我怀疑我的工作取决于在旧金山生活的时间。在 COVID 大流行之前,我的大部分晚上都是在谈话中度过的,这些谈话强化了认真、高强度、不合群、机敏等心态。Patrick Collison 建议:「想办法去旧金山旅行,认识其他搬到那里追求梦想的人。为什么是旧金山?旧金山是高度开放、聪明、有活力、乐观的人的谢林点*。全球怪胎的总部。」我认为他是对的。在这里生活深深地改变了我。也许其他地方在类似的维度上也会有类似(或更好?)的影响。例如,我喜欢在马萨诸塞州剑桥市的谈话对我的精神状态的影响。但是当我住在俄勒冈州的波特兰,举例来说,这样的环境倾向于强调一套不同的价值观:社区、工艺、可持续性、享受。我也喜欢这些价值观,但我怀疑它们不会如此自然地加强我现在的工作。(译注:Schelling point:谢林点,是博弈论中人们在没有沟通的情况下的选择倾向,做出这一选择可能因为它看起来自然、特别、或者与选择者有关。)
你能通过互联网吸收一个场景的价值观吗?当然,在某种程度上,我青少年时期在圣路易斯生活时做到了这一点。从那时起,社交技术才开始进步。在许多方面,像 Twitter 这样的分布式网络比现场互动能更流畅地传递价值。但我感觉到网络互动中的带宽限制很显著。如果不能持续地亲身沉浸其中,有些深度很难吸收。
3. 独自工作
我可能是在独立工作,但这不一定意味着独自工作。
独自执行
我很感激自己的工作有一个适度的、可能是可持续的资金来源。但正如化名博主 Applied Divinity Studies 所写(在获得自己的 Emergent Ventures 资助后):
我想,人们的期望是我把钱存起来或花在房租上。其隐含假设是,我的资金消耗率定义了我跑道(的长度),而钱能用来延长我继续做我已经在做的事情的时间。
但这太愚蠢了。这不是任何有抱负的人花钱的方式,也不是长期发展的途径。我肯定有办法把这些钱真正用于做更好的工作,赚更多的钱,并且实现指数增长?……除了把钱给房东,我肯定还能用这些钱做点什么?
自 2018 年以来,工作时我一直在写一个相关的指标:为了达到目标,我认为自己能有效利用多少资本(比如说,每年)?在 2019 年初,它是几万块;现在我想把这个数字调整到一两百万。这仍然不太多,但至少它在不断攀升。与之前不同的是,我现在很了解这项工作,足以设想如何与团队一起加快进度。
我也明白,我独自完成我手头上的这种项目,会面临一个巨大的挑战。我可能是个万事通,但落到实践上时,我担心我如果也包揽各种概念的实现,就无法完成优质的研究。这个问题的简单版本是,有很多原型想法是我没有选择去探索的,因为探索要花的时间会很长,而且还有很多概念是我已经勾勒出轮廓,但没有时间去实现的。但是这里面还有个更深刻的问题。
我的研究方法需要开发新的软件界面来表达我的见解,然后研究这些界面和它们的用例,从中获得新的见解,如此循环。迈克尔和我称之为「实践出洞见」。然而在实践中,埋头开发规模足够大的软件工程项目的同时,便很难深入思考理论。两种活动的思维状态截然不同。此外,如果每天花很多时间思考、写作和学习,开发软件的动力便难以构建起来。更糟的是:在软件开发和研究思考之间转换的成本很高。我试图把一天分为「构建」和「思考」两部分,甚至是一周,但不是很成功。
2020 年 3 月,我为助记媒介写了一份研究问题清单,之后便着手开发 Orbit。我计划借助 Orbit 来研究这些问题。九个月后,这些研究问题的进展乏善可陈。我基本投身于开发 Orbit 上了。有时候我需要「强制切换」才能回去考虑这些问题一段时间。这时候,我又很难为 Orbit 构建什么有用的东西。
也许没关系。我只是需要在一种或另一种模式中一次花费数月的时间,我需要更有耐心。但是,当我投入到软件开发中,完成每天的开发进度时,我就会思维局限,视野狭窄(tunnel-vision),全神贯注在软件系统和其问题上。问题是不仅要在当时摆脱狭窄视野。我担心这种工程心态(engineering mindset)会阻碍我作为一个研究者的成长(目前仍处于初级阶段),甚至在紧张的实施期过后的几周也是如此。
缓慢地来回循环的另一个问题是,反馈环路会变得过长。例如,在二月份,迈克尔和我发布了一项尝试,包含一种新的间隔重复卡片,即「应用卡片」,我们认为这可能有助于读者应用他们所读的东西。我们已经围绕这些卡片进行了一些初步的分析和采访,但事实上,自从它们问世以来,我们对它们的了解出奇地少——主要是因为我一直专注于构建 Orbit。对我这一年的一个非常合理的批评是,在我充分利用已有的观测站之前,我又建立了一个宏伟的新观测站。
至少我对自己的部分项目已经很了解,可以通过引入以执行为导向的伙伴来加速它们。在 2021 年,我想尝试与志愿者和用合同雇佣的合作者(这取决于众筹资金)一起实验。协调开销很容易对我的工作造成净损害——所以这个目标将取决于能否找到合适的人。
文化和场域天才
我可能不想加入学术界,但我深深地羡慕一个发展良好的领域的智力亲属关系。单人做工程有相当明显的局限性;单人做研究会带来更微妙的问题。我很感激与其他从事相关工作的人所进行的断断续续的对话,但在大多数情况下这是不够的。
我想成为一群场域天才中的一员,其中有很多认真的、有能力的人,全职从事有关赋能环境的原创研究。我想参加座谈会,会上要经常有能让我惊叹的想法。我希望我的同行们能够坦率地指出我的想法的局限性,然后和我一起改进它们。
我还不知道如何实现这一目标。我的领域雏形(有希望)拥有一个场域天才的雏形:许多兼职的多面手,许多初创公司在有空闲的时候做一些研究性的工作。资金是限制全职工作发展的一个因素。而文化是另一个。这个领域,只要存在,就主要是从科技文化中汲取其规范和价值——就像我最初做的那样。我喜欢艺术文化对这个领域的影响,它能鼓励一个更广阔的、有趣的设计方向。但是我担心,我们需要研究文化的大量注入,以支持耐心的、探究的、自我批评的工作,而这可以产生变革性的见解。
我知道,在前文诋毁学术 HCI 之后,再来呼吁更多的研究文化有点讽刺。但我之前指出的问题在于领域层面的规范和目标;许多在其中工作的个人仍然可以有巨大的影响。而且我们可以借鉴其他领域的研究人员,我将在下一节中描述。
我想在 2021 年将更多的精力集中在这个问题上。
真刀真枪的使用环境
对我来说,独自工作有一个问题最严重,就是我缺乏真刀真枪的使用环境。我是为了制造工具而制造工具。正如迈克尔和我其他地方已经描述过的那样,这是我这类型的工作最常见的失败模式之一。
阿波罗计划创造出不计其数的威力巨大的科学和工程工具,但这个计划的重点是把人送上月球(并能比苏联人高过一头)。同样,当皮克斯创造革命性的动画工具时,许多团队已经在计算机图形学方面深耕多年,但皮克斯的这些系统,源自于对讲好一个故事的热切追求。Mathematica 之所以如此伟大,是因为 Wolfram 制作它的目的是帮助他自己的数学研究……不一而足。
实际上,这样的环境能提供实在的反馈。关于一个系统雏形的许多关键见解,只有在与系统本身无关的、严肃的创造性问题的背景下才会出现。但也许最重要的是,这些项目也提供了强烈的个人联系,从而使得伟大工作成为可能。
有许多「可探索的解释」是很接近我工作的性质的。这些可探索的解释试图通过新颖的互动媒体解释一个话题。有些文章很是令人击节称叹。但是大部分作品的动机,主要是作者对这种实验性媒介感兴趣。大多数作者擅长的是制作界面,而非他们试图解释的学科。这些作者不精于目标学科,对其热情缺缺,因此他们所能想出的界面想法,也受限于此。相比之下,量子国度有严肃而实在的使用场景,这对量子国度很重要:针对想学习量子力学的学生,帮助他们学习量子力学和量子计算的所有基本原理,以及一些应用。这样的使用场景更加有血有肉,而我们之所以有能力支持这个场景,是因为迈克尔是一名前驱量子计算机研究者。
因此,「实践出洞见」的一个秘诀可能是,一些同事专注于一些可能从增强中受益的严肃领域问题(「工具使用者」),而其他同事则希望利用这一背景来推动新环境的创造(「工具制造者」),两者之间进行深入合作。我在 2020 年的计划本来是与迈克尔一起沿着这样的思路建立一个实验性的媒体工作室,但他的计划发生了变化,我只能搁置了这个项目,因为他作为一个综合专家的技能必不可少。在过去的几个月里,我一直在与那些可能成为类似的有趣合作者的领域专家建立联系。现在宣布成功或失败还为时过早,但这种类型的合作是不容易建立的。
独立研究和独立资助的限制是什么?如果独立研究是一块垫脚石,它能打开哪些新的道路?我的处境仅是出于侥幸吗,还是说可以成为示例?独立研究人员能否在没有传统机构的场景中成功运作?
我不确定如何回答这些问题,但我很感激有尝试的机会。新年快乐。
这篇文章最初是赞助人限定的。几周后,在收到一些希望在公开谈话中提及这篇文章的赞助人的电子邮件后,我决定将其公开。
特别感谢我的赞助商级别的赞助者,截至出版时:Adam Marblestone, Adam Wiggins, Andrew Sutherland, Bert Muthalaly, Calvin French-Owen, Dwight Crow, fnnch, James Hill-Khurana , Lambda AI Hardware, Ludwig Petersson, Mickey McManus, Mintter, Patrick Collison, Paul Sutter, Peter Hartree, Sana Labs, Shripriya Mahesh, Tim O'Reilly.
围绕读者控制力改造助记媒介
原文:Revamping the mnemonic medium around reader control | Patreon 上的 Andy Matuschak
Revamping the mnemonic medium around reader control.m4a
在读非虚构作品时,一切由你做主。你可以只读最后一页看结论。你可以飞快翻书只看标题;你可以花一周极其仔细地阅读 10 页内容。你可以关注多篇材料,把两本书并排翻开,对比他们的论点。好的非虚构作品作者事无巨细地把控着他们的文本,但只要书落到了你的手上,这本书就是为你服务的工具。你要根据你的需求和兴趣使用这些工具。
这种以读者为中心的特点,是非虚构作品和视频和讲座之类信息大众媒体的区别。消费那些形式的媒体时,观众无法「控制」自己的体验,例如,关注他们认为最有趣的部分。事实上,没有控制权是这些媒体吸引力的一部分。全心跟从 3blue1brown 之类优秀解释者的节奏,是很有趣的体验。如果我不想自己做主,我就会看他的视频:我想放松下来,享受从 Grant 的视角审视他讨论的话题。
然而,如果作品的目标是增强读者的能力,那么以读者为中心做法有一些重要的优势。这时候,作者需要考虑读者已经知道哪些知识,可能对哪些知识感兴趣,并据此设计文章的框架。当然,很难有普适的方案能解决大部分情况,但并没有问题;读者可以与作者合作,根据自己的兴趣调整阅读体验。由此,相比以作者为中心的媒介,以读者为中心的文本能让读者获得更多场景的能力。可能更重要的是,文本让读者持续关注他们认为有意义目标。
说了这么多,我现在可以明确指出助记媒介的一个关键问题:助记媒介不得不由作者做主。助记媒介的关键见解,是将间隔重复记忆卡片与叙述散文相结合。这些由作者提供的记忆卡片使人们很容易记住他们所读的内容,但其代价是控制权完全交给了作者。阅读助记文本与阅读普通文本有着极大的不同。目前的互动方式不仅要求你完整地阅读一篇文本,还要求你反复地学习——并记住——作者认为重要的内容,无论作者选择的形式是什么。记忆系统不是「你的」;它是从作者那里借来的,放在玻璃罩里。正如 Gary Wolf 向我指出的,这是一种专制的媒介。
当今助记媒介的成与败
尽管有这些限制,量子国度还是成功了,因为它是成熟技术领域的入门书。作为入门书,它可以安全地假设大多数读者之前没有什么经验。他们可能特别愿意(也可能特别合适)听从作者的意见。因为《量子国度》是对成熟领域的介绍,所以它有一套预期要涵盖的主题。它的目录,部分出于作者的选择,但主要反映了普遍共识。想了解该领域的读者通常不会觉得有必要在这些基础概念中挑选。而且,由于量子计算是技术性话题,卡片的内容较少依赖于作者对隐喻或措辞的选择。而主要是对一些物理定律的标准描述。因此,读者更有可能乐于按原样内化卡片,而不会想重新表述这些卡片,以更好切合他们对主题的思考角度。
如果这些假设不成立,当前设计的助记媒介的效果就差多了。例如,在我自己的助记文章《如何写出好卡片》中,许多读者对编写卡片有丰富的经验,而其他读者则从未写过卡片。读者的兴趣领域和投入程度差异很大。文章的主题没有清晰共识,也没有标准化。我发明了自己的抽象概念,这与一些读者的经验产生了很好的共鸣,而与另一些读者的经验则不尽相同。而且,由于这是非技术性的话题,这些卡片更多地依赖于我作为作者的隐喻、命名、措辞等选择。根据读者的反馈,其他作者的类似助记文章也遇到了类似的问题。
这不是话题不够正式的问题,也不是读者不愿意付出精力的问题。助记媒介的一个有价值的应用是增强重要的学术论文。暑期实习生 Ozzie Kirkby 一直在探索去中心化技术相关的话题,所以作为一个实验,我把星际文件系统(IPFS)的论文改编成助记媒介,并记录了他的阅读经验。我的许多卡片都是照本宣科,但也有些卡片专注于他个人并不想探索的方面。Ozzie 发现自己想在某些部分内化更多细节,所以他在日志中写了额外的卡片(假装他可以通过这种方式将它们添加到 Orbit 中)。有几张卡片对于他的知识背景来说感觉太复杂,所以他把它们分成了更短的卡片。我相信,由于背景和动机差别很大,而且论文的阅读要比散文更具策略性,因此像这样的问题在大多数论文阅读经历中都会出现。
只有编辑和删除按钮是不够的
从实际角度来说,我得到的读者反馈听起来像是对控制的简单请求:你可以添加一个让我删除卡片的按钮吗?你能让我编辑作者的文字吗?我一直犹豫是否实现这些简单的功能,因为我认为助记媒体的基本模式需要重新塑造。传统文本是一种工具,可以按照读者的意愿使用。读者是驾驶员。但编辑和删除按钮还不足以将助记媒介的作者离开驾驶座。即使有了这些按钮,读者也只是随波逐流,也许会在途中做出调整。
这里的部分问题是媒介的积极起始假设,即读者被期望收集作者的所有卡片(除了他们否决的卡片)。这创造了一种学校式的学习范式,一种作者正在分配你从文本中获得 X、Y 和 Z 的感觉。一些读者会对此感到沮丧并放弃;其他人则会毫无激情但被动地学习他们并不真正关心的东西,这实际上与 Orbit 的价值观(「帮助你加深与你最关心的东西的关系......而不是为了你认为你应该参与的东西......不是教育的口吻」)不相符。这种不匹配的情况确实让我不能只在类似助记媒介的「入门」背景下推进助记媒介(按其现状),在这种背景下,许多读者不介意放弃控制权。我想提倡一种更加自主、更少义务的学习态度。
问题的另一部分在于,如果没有为读者提供更完整的创作体验,允许编辑的媒介仍然会给作者的写作带来很大的特权。这种媒介允许读者调整作者的措辞以更好地配合他们的理解,但不允许读者捕捉他们注意到的与文本之外的一些想法的有趣联系。读者无法捕捉到他们认为有趣但作者并没有提供卡片的细节。读者无法捕捉到文本在第二天所激发的想法。从哲学角度看,这种不对称性促进了这样一种观点:卡片是你消费的东西,而不是你创造的东西。想象一下,如果你在仔细研究一本书时被禁止使用任何你自己的书写材料:你只允许在书页的空白处写字。你的思想会相应地收缩。
当然,这里的一个简单解决方案是在 Orbit 上添加一个创作界面。我对一种可能性感到兴奋,即作者的卡片写作实践将为读者自己的卡片写作能力提供帮助。但是,如果读者不能在受到启发时流畅地写出卡片,这就不会发生。今天人们可以在阅读助记文章时,在 Anki 或 SuperMemo 中添加自己的卡片。但我的直觉是,在参与作者提供的卡片和写自己的卡片之间建立强烈的分离——例如,要求读者在阅读时访问一个单独的应用程序或页面来写自己的卡片——是有害的。如果你在看卡片,你应该同时能够写卡片。作者提供的卡片应该感觉是你手中的材料,可以根据你的需要和兴趣塑造,而不是与你为自己写的卡片不同「种类」的东西。我想要纯文本的流畅性:在文档之间复制和粘贴、粗略或精细地编辑和组合、批量处理、生成、grep、pipe、转发社交媒体,等等。
记忆幻想
让我们退一步,重新审视这种媒介的最初目标。暂时沉浸在科幻小说的幻想中,如果能把插头插到我们的脖子上,按一下开关,就能深入理解任何主题,那就太好了。这个目标(暂时)无法实现——但我们能做到多接近呢?
试想,每当你阅读或思考一些有趣或重要的内容,你都能轻松地记住那个想法。学习不会像即插即用那样简单,但你可以读一本书(只读一次)并记住每一个有意义的细节;你可以在你的工作台上琢磨这些想法,并记住你在实践中注意到的一切;你可以与合作者讨论这些想法,并记住产生的所有影响。为了避开反乌托邦的反对意见,想象一下,你也可以毫不费力地纠正那些证明是错误或无用的记忆。上述这些事情在现在还做不到,但我们至少可以在某种程度上接近。
间隔重复记忆系统让我们能以在第一年花费 20-60 秒,之后每年花费不到 10 秒的代价,记住一个特定的细节。这并不算不费吹灰之力,但也不是特别繁重——如果你已经写了一张好卡片。写出好卡片比复习需要更多的努力,而且需要一种很少有人已经掌握的技能。这提示我们的幻想有一个稍微容易实现的版本:一个精灵自动为你读到的、想到的或听到的所有有趣的东西创造间隔重复卡片;你只需每天花费,比如说,十分钟的时间复习,就能记住所有这些细节。
我们的精灵需要两种技能:它必须读懂你的心思(即注意到你觉得有趣的是什么,在什么情况下,以什么方式理解);它必须写出有效的间隔重复卡片(即这些卡片能引导回忆起构成理解的细节)。作为一个更合理的近似,你也许可以想象雇一个人整天跟着你,参加你的会议,读你正在阅读的内容,听你大声思考——并为所有看起来重要的事情写下记忆卡片。你可以称他们为你的「记忆主管」,向你的首席助手示意。当然,这非常昂贵(并且有侵入性);而且因为这个助手不能读懂你的心思,他们的工作会不完美。但是,作为一个非科幻模型,如果你有能力的话,你可以实现它,这还是很有趣的。我们能否更经济地近似这个模型呢?
书籍与这种情况至少有一部分是惊人的类似。如果你很富有,你可以聘请一位私人导师来教你某个课题。这在某些方面很不方便,当然,这也相当昂贵。幸运的是,由于印刷术和互联网的出现,你可以选择阅读有关该主题的书籍。在某些方面,这本书将提供比你与导师合作更好的体验:当你买了一本书,你可以(间接地、部分地)聘请世界上最优秀的领域专家来教你。书中的文段将(希望)代表精心编辑和雕琢的叙述,而不是即兴的解释。当然,你阅读的速度比你听的速度要快得多。对于「翻阅书页」或「扫视标题」这样的动作,没有对应的对话形式。
我们可以将类似的逻辑应用于我们的「记忆主管」,至少对于你花在阅读上的一部分时间是这样。这里的想法是,你在这些文本中认为重要的细节,会与其他读者认为重要的细节有所重叠。因此,也许你的「记忆主管」在你阅读这篇文本时需要做的工作,可能会与其他人的「记忆主管」需要做的工作有很大的重叠。如果重叠足够多,那么这可能成为领域专家——也许是作者,也许是另一个专家——写出涵盖这些重叠部分的卡片的高杠杆机会。事实上,对于这个特定的文本,领域专家可能会比通用的「记忆主管」写出更高质量的卡片。
现在我们得到了一个类似于助记媒介的想法,但还不是助记媒介。在我们的思想实验中,我们的想法是让你毫不费力地记住你认为有趣或有意义的一切。作者提供的卡片只是这一过程的素材。更具体地说,想象一下,当你阅读时,你通过扬起眉毛或在向你认为重要的材料挥手来大声地与你的「记忆主管」交谈。如果作者已经做了一些工作,写了关于那一点的卡片,而且这些卡片符合助手认为你觉得有趣的内容,他们就可以走捷径,使用作者的卡片。否则,他们就得自己动手,绕写新卡片的远路。也许在某些情况下,你会大声说:「这个细节实际上与我在研究项目中遇到的问题有关;这是一个考虑做 X 而不是 Y 的理由。」与助记媒介不同,这种工作流是由读者的兴趣,而不是作者的规定,驱动的。作者提供的卡片是一种捷径,而不是一份期望清单。
好吧,现在想象一下你没有「记忆主管」。我认识到,在这一点上,我们已经离「I know Kung Fu*」很远了,但如果我们把自己限制在你每天花在阅读上的部分,那么在软件中使用作者提供的卡片,我们能达到什么程度?Ozzie 和我一直在沿着这一思路探索一些方法。我们的原型还很初级,但你可以想象在阅读时高亮你觉得有趣的细节;如果作者提供了相关的卡片,你会收集这些卡片;否则,我们可以提供一个批量编辑界面,将笔记塑造成卡片,包括那些你可能无中生有的卡片。(*译注:在《黑客帝国》中,尼奥为了对抗矩阵,必须学会各种武术对抗特务,而他不需要经过多年训练,而是直接将几十种武术风格下载到自己的大脑中,然后说出了 I know Kung Fu 这句台词。这个梗的意思其实就是刷的一下,毫不费劲就学会了。)
不费吹灰之力
这种方法有很多问题!一个核心的矛盾是,几乎在所有情况下,赋予作者的正确权限并不是零;赋予读者的正确控制和责任也不是 100%。我们应该如何在作者和读者之间协调控制的比例?
作者的卡片其实并不只是一种捷径,正如我之前所描述的那样。它们还带有意义。卡片标志着作者认为什么是重要的。它们传达了一种规范,说明理解一个话题意味着什么(或至少是作者认为意味着什么)。它们使作者有机会以不同的方式传达文章的观点,甚至在卡片和文章之间创造对话——但这是另一篇文章的话题了。它们引起人们的注意和参与;当它们运作良好时,它们会产生一种支持和安全的感觉。
因此,也许我们仍然应该展示作者的卡片,也许是以注释的形式,但让读者「勾选」他们想收集的每张卡片。这里的问题是,交互是界面设计中的成本中心。如果在 80% 的时间,有 80% 的用户想收集作者 80% 的卡片,那么一个朴素的勾选机制将需要读者进行大量交互来标示常见情况。想象一下,读完《量子国度》的第一章,一张一张点击边缘处的 112 张卡片来全部收集它们。你也许可以通过把这些交互分批放在章节结束的「复习区」来改善这种情况,类似于 Orbit 目前的复习区——但我认为这还不够。
如果我们不小心,我们不仅会要求用户进行过多的交互:我们还会分散他们的注意力,并造成决策疲劳。想象一下,当你在阅读一篇文章时,你得不断地评估出现在文本旁边的卡片:我想收集这个卡片吗?还是想写我自己的?你的目光在文本和边栏之间来回游移;你的注意力从文本中被吸引过去。这种设计的混乱性质可以通过在章节末尾的批量操作来改善,但要求用户一张一张明确决定是否想保留《量子国度》第一章中的 112 张卡片,这仍然难以想象。要求他们努力记住答案已经很强人所难了。
另一个困难的问题是调和。假设你发现一个细节特别有趣,所以你高亮了它。你看到作者为这段话提供了一张卡片——很好。但现在你需要决定:作者的卡片和我发现的有趣意义相关吗?你需要对你想写的卡片形成一些画面,如果你要写卡片的话,然后阅读作者的卡片,并进行某种差异比较。更糟糕的是:如果你不完全信任作者能够写出好卡片,你还需要评估他们卡片的质量。我对阅读其他人的记忆文本的实验表明,这两项活动都相当费力。
我认为这里的成功方法可能是更加渐进的,即阶段性地对卡片集进行精炼。也许你可以用一些非常粗略的交互来标记你认为有趣的段落。如果一个段落激发了一些你知道作者不会涵盖的特定卡片——例如,因为它们与你目前的项目有关——你可以在阅读时就在那里写下来。渐进地,在各部分结束时,你可以回顾标记段落中作者提供的卡片,这既是为了加强你的记忆,也是为了提供一个轻量级的机会来丢弃或编辑那些明显不适用的卡片。也许你在这个时候注意到,作者并没有就你认为重要的一些细节提供卡片,所以你当场写了一些。然后,在接下来的几周复习中,你完善来自这一文本的卡片,修改和删除那些没有灵感的卡片,删除无意中重复的卡片,用新的卡片来填补细节,增加你没有注意到的联系,等等。但关键是,这篇文本的卡片感觉像是你的;它们与你自己写的,有关自己想法的卡片混合在一起。Taylor Rogalski 提出了一个我喜欢的比喻:有人把他们的谷歌文档发给你,然后你点击文件 > 复制,这样你就可以肆无忌惮地在上面乱写乱画。
关于机器学习和语言模型的后记
我想,我的许多读者一直都在念叨着这句话:那语言模型呢!?为什么坚持要求作者(或那些将其文本改编为助记媒介的人)做所有这些工作?那些永远不会被改编的小众文章怎么办?
我知道。我也对这些问题感兴趣。我沿着这些路线试验了几种方法,到目前为止,我的印象是,对于某些类型的卡片,这里有可能实现部分自动化,但一个像样的解决方案将需要大量的工作和深刻的见解。我不认为正在流传的简单方法会代表可行的路径。但我确实认为这项工作值得一做;如果你有兴趣并有能力把它作为一个研究项目,而且你希望我监督你的工作(并可能提供资助)或提供建议,请联系我。
根据我的直觉,至少在短期内,这个问题更应该看作增强问题,而非自动化问题。顺着这个思路,我有一些具体的工作流程的想法,但哪些东西日后再谈论吧。
————————————
我想感谢 Ozzie Kirkby 在这个夏天和我一起围绕这个问题进行了原型设计;感谢 Nick Barr、Ty Jung 和 Taylor Rogalski 进行了长时间的讨论和白板交流;感谢 Gary Wolf 在这个问题上的宝贵通信。
我想感谢你们,所有 Patreon 赞助者,感谢你们的善意支持。有机会像这样进行开放式的探索是相当了不起的。你们的贡献使之成为可能,我很感激。
我在研究自己的线代学习过程
原文:Studying myself studying linear algebra | Patreon
过去几个月,我一直在深挖问题解决和阅读理解,我感觉现在漂浮在抽象的迷雾中,需要将想法落实下来。那些我眼里的问题,是不是只是量不够?只要阅读方法得当,题目难度适中,是不是问题就能迎刃而解?如果去除掉这些,问题还会剩下哪些?
所以这个月我没有继续观察学生,而是在观察自己。**即使我用上了自己的记忆系统,掌握了「专家级」的阅读技巧,做完了所有的习题 —— 我的学习经历中还会受到什么阻碍?**我希望在学习解释性文章的过程中,能创一种特殊的轻松和自信感。之前跟学生 Alex 的合作让我意识到,他的障碍主要集中在阅读理解,以及需要解题的脚手架。如果它们对我来说不是问题,我的系统和策略又欠缺哪些(以满足我希望的自信感)?
其实我是想重新学一遍线代。大约 17 年前,我在加州理工学院尝试学习线性代数,但因文科背景,那时的数学理论我几乎没掌握。如今,每研究计算机图形和机器学习论文,我都感受到知识的不足,线代的粗浅理解,限制了我在研究图形学和机器学习时的深入了解。我真想彻底掌握它们!
对我来说,线性代数不仅涉及陈述性的知识,也正好包括我做实验所需要的概念性和程序性知识。具体来说,这门学科包含:一大堆符号和专用术语,很多相关联的数学概念和大量的性质,以及处理它们时,一些经典而必要的数学方法。相较于传统记忆系统侧重的陈述性知识,问题解决的实践更强调程序性知识。尽管如此,我一直试图将记忆系统延伸到概念性(以及浅层的)程序性知识域中。
我选的是 Jim Hefferon的《线性代数》这本书,一来它名声在外,二来它的版权也比较宽松:我知道,以后或许要以这书为基础做些实验。一开始,我就认认真真地啃了前 35 页(就像我和 Dwarkesh 在视频里做的那样),一边读一边做了 65 张记忆卡片。我把那几节的 57 道题都做了,还对着答案核对了一遍,检查哪里错了或者有什么新发现,并都做了笔记。这一通操作下来,差不多花了我 20 个小时。
虽说我觉得对学习内容的理解还不错,但我的内在体验和「异乎寻常的轻松和自信感」一点边都沾不上。我给自己构建的这个学习环境,在很多关键点上都支持得不够。不过好在,这也给我后面(对助记媒介)进一步的原型开发和探索指了不少路。
辅助理解
在我需要担心如何构建深刻理解或长期记忆前,我首先得确保最基本的事情 —— 自己能搞懂文本在说什么。
我有个习惯,那就是通过提问和精细阐述文本来加强阅读理解。这样确实让我比很多人更有优势,但我知道,单凭这些还不够:经验表明,我仍会遗漏文本里的关键信息。
但这本书可能有所不同,因为我有了记忆系统和习题集的额外支持。现在,咱们来看看这些支持是如何影响我的阅读理解。
制卡与辅助理解
如果对文本写出详尽的记忆卡片,我的阅读理解通常更加可靠。这个过程让我进入一种主动的视界,我会留意任何看起来重要的内容;我基本不会忽略关键细节,而且,为了将这些细节转化为提取任务(指转换为 SRS 卡片),我通常需要以某种自底而上的方式来理解它们。
这么做很不错,但我注意到了一些明显的局限性。
有时候,我不知道怎么写这些卡片。学习写优质的卡片如同学习写优质的文章:你都需要摸索出一整套应对各种细分情况的策略。但我还没有(或者说尚未)找到针对某些特定材料编写记忆卡片的策略。举个例子,此书讲解解集的首选形式(Preferred Form)时,首先展示了一个抽象的符号表示,然后通过多个对比鲜明的例子来深化讲解,目的是让读者理解这种解集形式为何如此设计,以及它在实践中的作用。用这种抽象符号做一些基础卡片还算简单,但要针对这些例子展示的微妙之处,以及选择这种形式的多重原因去编写卡片就难多了。如果我真的全身心投入并充分发挥创意,一般还是能找到解决办法的。但这经常会让我觉得很累,所以我就走马观花地往下读,有时甚至不自觉地就这么选择了。在这种情况下,编写卡片并没有真正验明我的阅读理解。(当然,这也意味着这些细节不会得到强化——后面再细说。)
**卡片带来的义务感。**我当然想把作者说的话都搞懂,但我不一定想不停地复习作者说的每一句话。当我大量依赖记忆卡片来加强理解,我经常会感觉被「卡片的密度」压得喘不过气。有时我发现很多细节我并不怎么在乎,或者这些细节在后面的综合卡片中已经得到了强化。当然,我可以把多余的卡片删掉,但每删一个都有点成本。而且,写那么多「不必要的」卡片比直接读出来给自己听要麻烦多了。这其中有一部分努力让我对内容有了更深刻的理解,但很多时候感觉像是白费劲。(译者注:依我看,阅读时容易产生大量不成熟的想法,因为不知道什么时候处理,所以产生了必须处理它们的强迫感。如果是「渐进阅读」,你有不止一次回到文本的机会,因此文本中诞生的想法不需要立即写下来,这样不容易开环。完全可以等到理解稳定了再制卡)
**肤浅的卡片,粗浅的理解。**当文章给出一个关键定义时,仅用文中的定义稍作改写就能快速写出一张卡片,这样看似很简单。但这就是问题所在,因为很容易在没有真正理解的前提下做改写,这一点在[自我解释的研究](https://andymatuschak.org/files/papers/McNamara - 2004 - SERT.pdf#page=19)中也有体现。一般来说,仅仅是简单改写文本的效果不是最佳。要写出有效的卡片,往往需要深挖并拓展。有人可能会对我说:「那就把卡片写得更好一点嘛!」当然,但我要指出,这种方法并没有引导我做正确的事。很容易在不经意间写出肤浅的卡片,要避免这种情况,我不仅需要保持高度自省 —— 这在学新东西时很难 —— 还需要在写卡片上多下工夫,但「值不值」这么做,我并不总能确定。
助记媒介与辅助理解
如果自主制卡是个辅助理解的策略,那么他人写的助记媒介中,这可能成为问题。这些内嵌的记忆卡片确实(无意间)起到了个基础的「理解检测」的作用。如果你对段落后的卡片感到莫名其妙,那多半不是忘记什么,很可能因为阅读时就太过粗略。而且这些内嵌卡片还有个间接作用:许多读者发现自己的理解这么糟后,就会开始细心阅读(正如附加问题研究所预测的那样)。
不过我们在设计这个内嵌的回顾界面时,考虑的是记忆练习,而不是理解检测。通过观察一些使用助记媒介的读者,我发现人们对记忆失败和理解失败这两者之间的感受大不相同。
记忆上的失败一般是感到在挖掘一个你曾经理解但现在忘了的东西:「哦,那个虚数项又藏到哪儿去了呢?(查看答案)哎呀,在右上角那里。好,得再复习一遍。」或者:「这个我不记得了,但我也不关心能否记住它。(删了)」当读者清楚地知道某样东西是什么的时候,他们会更放心地宣称自己并不关心它。
相对来说,理解上的失败让卡片感到莫名其妙:「这是啥意思,我一点儿也不明白。(看答案)啊……行吧?还是不懂。」界面上有两个按钮:「记得」和「忘了」。这两个选项对读者来说都挺让人纠结的。他们觉得「应该」按「忘了」,但同时也清楚,这样做只会让这个同样的问题在学习结束时又弹出来。他们不想再碰这个问题:他们知道下次看到还是会一头雾水。因为连答案都不明白,所以也就不觉得记住它有啥用。他们知道,如果问题再出现时能「正确」回答,那也只是机械地复读,没啥意义。按「记得」虽然能「让卡片走开」,但这也不是解决问题的好方法:说不定这事儿挺重要的?他们也不想以后还得再应付这问题。(译者注:这是个典型的开环)
如果我们打算用附加问题来检测理解,我觉得最好在内容和界面设计上做点儿区别,让它跟用来做提取练习的卡片不要太像。
习题集与辅助理解
近来翻阅了一堆文献后,我发现无论是这本书(还是其他大学级别的教材)中的练习题,其实都有三个不同的目的:
-
检查理解:确保你真的阅读并理解了文本。
-
促进技能习得:通过应用所学,来归纳使用模式,强化长期记忆,构建程序化的自动性(译者注:教育语境里,会强调学习知识要达到「自动化」)。
-
挖掘深意:促使你扩展思维,从而看到更多不易察觉的细节,激发创造力。这样不仅让你对材料有更深刻的理解,也让记忆更牢固。
当然了,这几个目标间的比重在不同的题目中各不相同,但所有问题都或多或少地涉及到检查理解。这样做的好处是,你可以通过实践——通过将材料运用起来——来检查理解。比起直接回答死记硬背的理解(和记忆)问题,这样的过程通常更能让人投入其中。特别是当这些题目本身就足够吸引人时,这一点尤为突出。
但大体上,由于习题的目标太多了,这本书里的习题集给我的理解支持没有达到我的预期。我认为,其他类似的书的习题集也有同样的问题。
糟糕的失败模式。有时我感到被问题卡住,但当时会不确定这种卡住,是因为没利用好知识,还是遗漏了正文里关键的点。由于一般情况下,如果理解上没问题,那么缺的只是硬啃的努力。所以我就会想,是不是我得再加把劲。结果,我就在问题上乱搞一气不得其法。这样做毫无建设性,因为我根本就缺少某个关键信息。麻烦在于,自己处于什么情况往往我是不清楚的。要弥补理解的缺口,一般最有效的方法就是重新看一遍文中的某个解释。但就算有答案手册在旁边,我也不清楚应该注意哪一部分。在这种情况下,我只能整个章节重新翻阅,看能不能找到可能有用的点。这种失败的模式,大概是个普遍问题,因此用习题来检查理解程度并不总是那么准确。
覆盖的有偏性:在读完一个章节后,你通常能学到某条定理成立的事实,为何成立,以及为什么它有意义。习题主要强调应用、分析和综合,所以它们通常考察的是你是否理解了某条定理成立,而对其他方面则关注较少。以线性系统为例,书里讲述了线性系统的解,可以由一个特定解配上一组与之相关的齐次系统的解的线性组合来表示。章节大部分内容都在证明这个定理和它的一些派生含义。但没有一个习题检查了我是否理解了证明,对这个定理解释性的部分也仅仅触及皮毛。后来我自测看能不能解释这个证明,才意识到我没理解一个关键步骤,尽管我成功地完成了习题集。
有人可能会说,这仅是教材的一个不足——习题集应该全方位地考察你对该章节所有内容的理解。但我想,习题天然就该偏向于检查对一类内容的理解,而不考虑另一类,这是它的内禀属性。如果强行违背这天然的粒度,最后产生的东西可能就不再是我们通常说的习题了。
哪些题目覆盖新的点?哪些是重复?有的题外观上看起来差不多,内里别出心裁,做起来感到对学过的内容不同角度出击。但有时候,相似的题目只是为了多练几遍,提高娴熟度。有时我觉得没必要再解一道线性方程组:我感觉自己已经炉火纯青了!但有的题目其实有点细微的差异,检查的是新的理解点。所以,我没有放过任何一道小题,但其中许多我都觉得没有必要。换个说法:这些重复的练习应该「分散」到未来几周里,以促进长期记忆。而我并不想推迟对理解的检验。
**答对了,但没领会精髓。**有几次,题目就是这么设计的,按照书里讲的某个规律一步到位就能解出来。我虽然解出了答案,但却没抓住问题的核心。要察觉到这一点,光对答案是不够的,还得重新推敲一下解题步骤,看看跟自己有什么不同,特别是在关键的地方。
技能习得
我们学习新技能的过程中,会出现一个有趣的转折。一开始,我们得仔细琢磨每一个细节和步骤,经常得自言自语道:「解高斯消元,我得用这三招…」但练习多了之后,我们就学到了解体模式。不用再费脑筋去回想,我们天生就知道该怎么做:「好,这方程先除以二,再用它把另一个方程第一个项给消了……」[1]
我自己的感觉是,单靠提取练习并不能让这转折自然发生,尽管它能让过程顺一点,可能因为相关的陈述性知识牢牢记在了长期记忆里,减轻了工作记忆的负担。解题练习是让这个转折发生的传统方法。这招对我来说大多数时候挺管用的,但也遇上几个小挑战,感觉还有改进的空间:
**应当随着时间推移一点一点刷题。**我通常是一节内容看完后,就做这一节相关的所有题目。很多题目都是重复练习同一个技能,比如说:找出含有自由变量的线性方程组的解集。这很好——正是我需要的,提升我的熟练度——但连续做十道这样的题目实在让人心烦。传统的教学方法是只布置课本里一部分题目来解决这个问题,但如果我需要大量练习才能达到熟练呢?从情感和效用(间隔效应)来看,最好是把解题练习分散在不同的时间里。然而,这在实际操作中颇为困难。也许你希望说,显示每天做一道题,再是隔天做一道,再是一周做两道 ...... 以此类推?这需要一种可编程的注意力。
**我应该练多少?**也许我只需要做书中一半的题目?我不确定。那种「以掌握为目标」的学习方法往往有个规则,就是「连续做对五题,就可以停下来了」。这里的问题是,有一些内容在学完之后仍未达到[「无需思考就能识别」](https://andymatuschak.org/files/papers/Anderson - 2000 - Learning and memory.pdf#page=344)的标准,当我碰到更难、需要用到这个前置技能的题目时,我可能就会卡住,因为这个前置技能仍然需要大量的认知负荷,而且原因并不一定清楚。就好像「可汗学院告诉我,我已经掌握了所有前置知识!」,但真正用起来,却还是手忙脚乱。关于程序性知识的文献可能已经找到了一些有用的答案,但我还没有深入地阅读这个主题。例如,我猜测时间压力(例如 Number Munchers?)会揭示出更为明显的差异。
**如何练习证明题?**本书包含了大量证明题。当然,证明题没那么机械化:你并不是在学习执行某种一致的操作。某种程度上说,证明是为了促使你更深入地理解(这一点我们会在下一节中讨论)。但这些证明题,也是在学习对特定的模式的识别、熟练利用数学对象的特定属性。那么,当我未能识别出其中的模式,或者未能看到如何利用这个属性时,我应该怎么做呢?我可以阅读答案,并记下我遗漏的洞见 —— 甚至为此写下一个卡片。但下一步怎么加强练习呢?怎么保证我下次能认出这个套路?证明题跟一般题目不同,没法轻易出一个题目去考察同一个属性(译者:但是你有 GPT 呀)。
深化理解
我不只是想知道文本的字面意义,更想搞懂它的含义,为什么它很重要。我希望能把这些新东西和我的先验经验联系起来,将来还能创造性地用上。总体说来,我想把这些内容彻底内化,形成一个完整且深刻的认知表征。
编写记忆卡片对此有点儿帮助:这个过程让我生成实际的例子,推断文本未明说的部分,思考可能的推论,还能弄清楚为啥我觉得某个细节重要。这些都是比较「高级」的卡片编写方法,大部分用记忆软件的人不太会体验到这一点。助记媒介的读者通过写卡片也不见得能有这种收获,但如果作者设计的卡片能引导他们这么想,那他们也能收获同样的益处。
这本线性代数书的习题就给了我这种启发。很多题目明显是为了让你更深入地思考正文里的细节。有个简单的例子:「在 3.6 引理的证明中,如果没有 0=0 这样的方程会怎样?」尽管我有写卡片的习惯,但当我读这个证明的时候,我就是没想到这一层。
但大部分习题其实是围绕着解题练习来提高你的技能。与其说我想要单纯的记忆支持,不如说我更希望能回答更多促使我去深思和推理的问题。每次复习时解一两道,持续几周。理想情况下,这些问题能逐渐提高我运用知识的广度(译注:即提高知识迁移的距离)。
记住我所学的知识
付出这么多汗水,我当然希望能长久记住我学到的东西。我的记忆练习当然能起到一定作用。但在这里,还有几个饶有兴趣的议题,一些是我们在《灵活的记忆实践产生流畅的理解》一文中首次探讨的。
**高质量的习题能在多大程度上替代有针对性的提取练习呢?**我的很多卡片都是为了让我回想某个具体的信息点,(比如:什么是「奇异性」的定义?)。但如果我解了一个需要用到这个定义的题目,那我其实也是在从长期记忆里提取这个信息,这也有助于加固记忆 —— 甚至可能因为进一步的拓展而更为牢固。解题可能会让人觉得不枯燥,更有意思。但代价是费时费力。这之间该如何取舍?哪种卡片更适合单独练习,而不是整合到一个综合性的题目中?问题的答案会随着我们的熟悉程度而有所不同吗?
**相关卡片应该在复习中分散。**以矩阵的「奇异性」这一概念为例,我当然应该知道它的定义。但除此之外,我还应能:根据定义说出相应的术语;给一个实例后,能判断是否满足「奇异性」;如果知道一个矩阵是「非奇异」的,应能推断出与它相关的线性系统的解有多少种可能性;回答一些特别强调「奇异矩阵必须是方阵」的问题等等。问题在于,当我一口气回答好几个这样的问题后,对于后续问题我就不必再从深层记忆里去摸索答案,因为前面问题的一部分答案还停留在我的短期记忆里。我觉得更高明的做法是,在多次的复习中,把这些密切相关的问题分散开来。可能要让一张问答卡的回答影响到其他问题的复习周期。这也是概念性知识的记忆软件,与传统的、为事实性知识服务的记忆软件之间有所不同的一个关键环节。
**有些卡片需要变体。**我偏好那些包含实例的问题,比如判断「这个矩阵是不是奇异的?」,你肯定不想每次都看到同一个矩阵,那样就变成死记硬背了。关键是熟悉操作流程,这种问题很适合来点随机,或者至少从几个预制的选项里挑一挑,就像《量子力学简明教程》里所用的「应用卡」那样。
**如何将问题解决能力整合到复习环节中?**在完成这些题目集后,我深感自己已经可以将所学用到各种场景下了。如何通过复习以保持状态?一种方法就是在复习中穿插类似的问题,但这些问题确实会改变我的复习形式:很多题目需要专门准备纸笔,要花费更多的时间。我通常在手机上复习,也不一定总有纸笔在手边。也许我得每周专门腾出一两个时间段,做些更复杂的练习?另外,为了试验,我也能把这些问题改编成「心算」的形式,不用纸笔也能解决。这个策略能普遍应用吗?这些「降级」过的问题,足够维持我所学的技能吗?
**如何处理解题过程中迸发的新洞见?**这书里最有意思的题目,似乎是为了让我在解题过程中产生一些特定的洞见。好多时候它们只可意会不可言传,多半涉及到符号或者抽象概念中微妙的联系或强调。但我明确感到这是有价值的学习。怎么确保我能牢记这一经验呢?要编写关于这些洞见的卡片,我总感到伤脑筋。
如何处理知识的证明?坦白讲,我对证明还真没有一套行之有效的知识体系。我真正想要的不仅是知道那个证明,更重要的是深入了解其关键步骤和洞见,这样才能应用到其他相关的命题上。比如,书里给出了一个证明,说改变线性方程的顺序不会影响解的集合。借此思路,我也证明了高斯消元中的缩放和组合操作是靠谱的。但怎么做才能永保这种理解?我对应该写什么样的卡片,或者怎么写,感到不是很确定[2]。现在距离我第一次学这个已经两周了,我自测了一下,虽然费了点劲,但最复杂的证明我还是能复述出来。
**编写卡片很耗时。**大概算一算,我在这几节里花了 20 小时,其中至少有两小时是在写这些卡片上。虽然制卡税只有 10%,但相对于能增强理解和记忆,也算不得什么。但这个过程比单纯看书或者解题都费神,感觉至少占了我三分之一的精力,有时候甚至是一半。(译者注:woz:渐进!渐进!)
总结几个高屋建瓴的点
抛开细节不谈,如果我有根魔法棒,我想要实现的愿望包括:
-
一种「迅速检测我有没有理解这一段」的小交互。也许简单的问题能促使我梳理一下关键点,不至于让复习变得乏味。在明白了文章的意图之后,解决问题和提取练习就会更加得心应手。
-
一个简便的方法,让我能把以技能习得为导向的复习,散布到不同复习时间上。
-
在我的复习练习中,逐步加入 2-3 倍量综合性、由多种概念复合的问题。
-
将我的复习环节从单纯的提取练习,转向不固定的问题练习,后者在某种程度上应该能包含前者。
-
解题过程中会出现洞见的萌芽,如何捕捉、加强这些萌芽呢?希望能更好地理解这个过程。
-
最后,尽量不用亲自编写记忆卡片。
如果我能如愿以偿,我想我会感到更加接近「异乎寻常的轻松和自信感」。预计接下来的几周,我会着手制作一些这方面的原型。
————————
感谢 Gary Bernhardt、Elliott Jin 和 Russel Simmons 在这些主题上的有益讨论。
————————
[1] 欲了解这个过程的更多细节,可以参考 [John R. Anderson 的《学习与记忆》一书的第九章](https://andymatuschak.org/files/papers/Anderson - 2000 - Learning and memory.pdf#page=334)。
[2] Michael Nielsen 的文章《如何用间隔重复深入理解数学》给了我不少启发,但我现在还不能完全把这些见解联系起来。\n[译后注] 本文是一篇试图解决复习卡片时一些顽固问题的实践。andy 提出了一些制卡模式遇到的问题,并试图通过卡片的创新来突破它:1、涉及过程的知识很难制卡,2、通过解题过程产生的灵光,很难通过文字记录在日后进行重放(文脑屏障?)3、综合性的卡片的问题等。
有规律的记忆练习的承载能力;刻意练习和心流
缓慢、复利的进步是一种微妙的力量。普通的举重运动员可能不会在每次训练中都感觉到自己的进步,但随着时间的推移,他们会发现自己可以承受以前会把他们压扁的负荷。Richard Hamming 在《做科学和工程的艺术》中对智力方面的努力做了类似的观察:
我与 John Tukey 共事了一些年,才发现他基本上与我同龄,于是我去找我们共同的老板,问他:「跟我差不多大的人怎么能像 John Tukey 那样知道这么多?」他靠在椅子上,把双手放在脑后,微微一笑,说道:「如果你像他那样努力工作那么多年,你的知识也会多到让你惊讶的」。我羞愧至极,简直是马上溜出了办公室!我考虑了几个星期,决定虽然我不可能像 John 那样努力工作,但我可以做得比以前好很多。
在某种意义上,我的老板说智力投资就像复利一样,你做得越多,你学会的东西就越多,所以你能做得越多,等等。我不知道该如何分配复利,但它一定远远超过 6%——在一生中每天多做一个小时,总产出就会增加一倍多。稳定地应用多一点的努力,就会有很大的总积累。
这是一个很好的启发式方法,但要想知道如何实施,却不是那么容易。大多数知识工作活动实际上并没有以这种方式可靠地复合。但正如其他地方所描述的那样,记忆系统确实以这种方式复利。少量的边际努力在一个人回忆特定知识的能力上产生复合回报。
大多数人都有定期的运动练习,定期的电子邮件练习,定期的新闻阅读练习。定期的记忆练习有一天可能会成为该清单上的一个平凡的条目吗?如果是这样,可能会有什么影响?又是什么原因导致了这种变化?
我们可以先看一些简单的数字。假设每个人愿意每天复习十分钟左右。即使使用量子国度的极其简单的算法,我们每天可以增加大约 14 个新问题,同时保持在这个时间限制内(假设准确率为 90%,每个问题平均 6 秒)。这相当于每年有 5100 个问题。作为参考,量子国度包含大约 200 个问题。因此,你的练习可以适应每两周摄取一篇量子国度大小的文章。时间因素是线性放大的,所以你可以通过复习 20 分钟而不是 10 分钟来加倍你的承受能力。
我以前曾指出,我觉得这个领域的大多数研究人员过度重视优化和花哨的调度算法。但是在这个以效率为重点的背景下,我们可以看到这些选择真的很重要!例如,如果我们实施了一些更精确的调度,将平均错误率从 10% 降低到 5%,我的简单模拟器表明你可以每天增加 16 个问题而不是 14 个。这样,一年下来就会多出 730 道题——几乎是多出四本量子国度大小的书。定期的记忆练习对调度器性能的小幅提高表现出了巨大的回报。
那又怎样?我们想象一下,如果人们每年定期持久地摄取 6000 个原子的知识,会有什么影响?好吧,如果他们以大多数人开始使用记忆系统的方式来使用这种新发现的能力——也就是说,用于学习不重要的琐事——这样的记忆实践大部分是在浪费人们的时间。这些系统的承诺在于不把它们用于无意义的事实,而是用于更深入地参与对你最重要的事情。
正如迈克尔·尼尔森和我写道:
开发「量子国度」的一个动机,便是证明记忆系统的用武之地不仅限于简单的陈述性知识,如词汇表和各国首都等。事实上,记忆系统对掌握抽象的,概念性的知识也有极大的帮助,也恰恰是学习量子力学和量子计算等科目所需要的。其做法便是依照很多精细的策略来构建卡片,从而灌输对抽象的,概念性知识的理解。不过更重要的,在描述文本中嵌入了间隔重复卡片,这样的学习才成为可能。这种嵌入使得情景和理解以独特的方式构建起来,是其他记忆系统中难以实现的。… 在某种意义上,「量子国度」的目的是拓展用户能够理解的主题范围。在这一点上,它所希望达成的愿景与之前所有的记忆系统都很不同。
除了那里提到的愿望之外,助记媒介还希望解决我所描述的那种常规记忆实践的最大突出障碍:提出问题的挑战。要提出能有效编码抽象、概念性知识的问题是相当困难的。即使一个人已经掌握了相关的技能,它也是相当费力的。复习 100 个概念性问题只需要几分钟,而提出 100 个好的概念性问题则需要几个小时。如果你只能抽出时间来提出几百个问题,那么一个每年能承载 6000 个问题的系统有什么用呢?
助记媒介通过提供专家撰写的问题解决了这个问题。当然,其他的 SRS(间隔重复系统)平台允许用户分享问题,但我们的经验表明,这只对相当简单的陈述性知识有效,因为问题是高度原子化的。每个小问题都必须独立存在,可以在任何时候以任何顺序呈现。但是,这使得我们很难用问题来有效地传达一个本身就高度结构化和有序的想法。在实践中,想法通常取决于其他想法,而情感的突出性要求将这些想法与一个更大的整体联系起来。相比之下,正如我们在上面的节选中所指出的,助记媒介为这些问题提供了叙述结构和有意义的背景。至少在《量子国度》中,这似乎让我们创造了一套有效的专家撰写的卡片,而没有遇到共享问题通常遇到的问题。
但我对仅由摄取和保留他人所写的知识组成的常规记忆练习并不感到兴奋。我的希望是,随着更多高质量的书籍在助记媒介中被写出来,这些专家写的卡片将作为一个支架,帮助人们在写自己的卡片时发展流畅性。我们已经收到了来自量子国度用户的一些反馈,当然,现在说这些还为时过早。
像《量子国度》这样的文本可能会帮助人们学会写自己的知识编码卡片,但还有很多其他有趣的方式来使用定期的记忆练习。我用我的来保持我的新兴理论的顶端,研究我过去的决定,为自己提供审美的火种,修改习惯,等等。另外,迈克尔描述了一个人如何使用这些系统来「看穿」复杂的想法。这些更具代理性、目的性的实践目前对大多数记忆系统的使用者来说是不可及的,但我认为自撰的文本在这里也可以为使用者提供支架。
———————————
Merlin Mann 在撰写「收件箱归零」和处理个人待办事项清单的做法时崭露头角。但随着时间的推移,他对这种文化和他自己过去的建议的框架越来越感到失望。他观察到:看,你需要一个花哨的数字待办事项清单或一个生活黑客博客来确保你玩视频游戏吗?不需要吗?也许这就是你的待办事项清单所需要解决的问题。
当然,如果从字面上看,这是一种夸张的说法——Akrasia* 是真实的,等等。但值得一问的是:当我们说「定期的记忆练习」时,我们想象的是一个「应该」还是一个「想要」的习惯?也就是说,它是像牙线一样的东西,你并不真正喜欢它,但你还是为了长期的利益而做?或者说,它更像是在艰苦的一天结束后享受一杯葡萄酒的习惯?(*译注:在作出理性判断后,因情势驱使而作出违背理性的行为。举例来说:我知道不能整天看手机,应该好好学习,但我就是整天看)
当间隔重复的效率最高时,你会感觉自己一直在失败:每个复习环节都渴望向你提出你几乎忘记答案的问题。换句话说,优化记忆效率的间隔重复练习不应该产生心流。它更接近于 K.Anders Ericsson 所说的刻意练习:一种有计划的训练活动,侧重于产生刚刚超过你目前能力的表现,并有快节奏的反馈和思考。刻意练习一般来说是不愉快的。
但是,当我参与记忆卡片时,这些卡片更多的是将过去的经验可视化,或者记住一个重要决定的关键因素,这些并不是真正的「推动我的表现水平」。这些活动更接近于问答式教学,它们可以产生心流状态。
这两种活动能在同一实践中重合吗?情感体验和目标是相当不同的!但也许这没关系:人们喜欢统一的收件箱界面,将他们的个人和工作电子邮件账户结合起来。
我不知道该如何把它们串联起来。我担心围绕效率和承载能力的讨论会把我们带到一个过重责任的方向。也许我们可以通过设计能产生持久利益的活动来拒绝应该/想要的二分法,但这些活动也能在情感上吸引人,即使是在当下。
为了获得灵感,我把钢琴家 Nahre Sol 「留给你」,她在自己的 YouTube 频道上有许多视频,描述了她在练习中如何通过作曲和即兴创作使重复的段落在音乐上变得有趣。(不幸的是,Patreon 不允许我在线嵌入 YouTube 视频;点击这里可以看到她的视频!)
银河大脑问题;速通的用户界面
原文:The galaxy brain problem; speed-running UIs | Patreon 上的 Andy Matuschak
在过去的几周里,我花了很多时间来让 Orbit 能够自解释。
在《量子国度》中,所有文章本身在某种程度上就是关于助记媒介的文章。第一篇文章花了 1000 多字介绍、激励和阐述该系统;后来的文章花了数百字。但我们不想每一个使用 Orbit 的作者都得费劲写一篇冗长的序言来介绍这个媒介。这个系统本身就得有自我介绍的能力——至少是部分介绍。
这可真是个棘手的问题!如果我们强迫人们在使用嵌入卡片之前,先得了解一遍教程或者什么的,许多人可能会因此却步。但我们又不能解释得太晚,毕竟我们需要让人们注册,以便向他们发送他们的复习环节。
更让这个问题棘手的是,新概念产品常常遇到的一项挑战。我称之为「银河大脑问题」。
你说 Orbit 是什么?简单说,就是「毫不费力地记住你所读的东西」,但这太简单了。但这样说未免过于肤浅,有些贬低了 Orbit 的能力。
一个更详细的解释是:「帮助你更深入、更有效、更可靠地理解复杂的主题」。不幸的是,这也远不如「毫不费力地记住你所读的东西」来得具体和直接。而且,Orbit 的目标仍然比这些总结都要广泛。
正如我所描述的(例如在穿越时间的文本中),一个更广泛的框架是,Orbit 让你在一段时间内与材料保持联系,可能是以一种可编程的方式。它就像「将想法带入你的轨道(Orbit)」一样。这种说法抓住了 Orbit 的特点......但对不了解背景的人来说还是过于空洞。
最后,最一般的、类似于银河大脑的实例是:「Orbit 是个协调动态微任务调度的系统。」这抓住了「可编程的注意力」的意义,超出了你可能阅读的媒体中的具体实例。但这种解释对我的读者之外的人来说基本上毫无意义。
那么我们应该怎么办呢?现在,我的做法是先把 Orbit 介绍成一种记住所读内容的方式,但随着你对系统的深入了解,我会「点缀」一些代表更广泛目标的表述。然后,后续的电子邮件和复习环节结束时的内容会逐渐揭示更多的理念。
你最初看到 Orbit 可能就是这样子。注意到了吗,横幅上的文字只是肤浅地告诉你这是关于什么的:「快速温习你刚才所读内容。」按钮旁的说明文字也是这个意思。
随着你在复习中的推进,横幅和辅导标记会继续解释界面。然后,一旦你完成,你会看到这个较长的解释,开始介绍更广泛的愿景。虽然还是有点啰嗦,但我已经到了一个阶段,很难再去掉更多的细节,同时还要保证人们有足够的动机为又一个服务注册账号。
当 Orbit 最初推出时,我可能不会在讲故事方面弄得比这更精彩。这没关系,我会随着时间的推移增加额外的部分。这东西太难了!
————————
你去过 /r/speedrun 吗?这是由一群痴迷于「速通」游戏的人组成的社区。他们搞些什么呢?比如尝试尽可能快地通关《马里奥 64》,利用游戏 Bug 来争分夺秒。不止如此,还有更离奇的速通任务。比如速通 Windows 95 安装。
Michael 和我注意到一个行为,它使 Orbit 的新手引导设计问题变得难上加难:**人们会速通界面文本。**弹个窗出来?我得赶紧找到「关闭」按钮。需要读的教程屏幕?点点点,三下两下就过去了。我们发现,甚至连那些对界面理念很上心的人也这么干——坦白说,我们自己也这样!这种行为常常没错:这类文本通常就是糟糕的软文,或是粗制滥造的界面设计的烟雾弹。但就算我们一丝不苟地写界面文字,充分考虑了用户的时间,人们还是不屑一顾。
这和人们对文章的态度截然不同。人们读文章时,竟然是如此认真细致。我们发现有人甚至原汁原味地引用了我们在《量子国度》关于助记媒介的文章。这绝不仅仅是因为这段文字的作者更有水平:写界面文字的人,也是作者本人!
文章的作者倾尽全力来构建与读者之间的信誉和信任,向读者表明,他们的时间得到了尊重。我们采取的一个策略,就是在《量子国度》的界面上利用这种信任:文章和界面的字里行间保持同一语气,同样的用词,同样的说法,以统一明显的作者风格——也许还能让人们停止对界面的「速通」。虽然这绝非完全解决问题的方法,但我们无法在 Orbit 上使用这个策略。
我想,下一个较好的办法是,创造出类似文章的文字背景来谈论Orbit,这样的文字背景并不在界面中,因此不会被「速通」。例如,我可能会就媒介及其可能的用途写一系列的文章,然后随着时间的推移,作为一份简讯发送给 Orbit 的用户。或者也许只是让它们通过社交媒体等方式在网络上自然流传。
我在不断取得进展!现阶段的工作得非常细致——最后的 10% 总是如此——但一周一周过去,感觉事情越来越顺手了。
用户观察带来的惊喜
原文:The joyful surprises of user observation | Patreon 上的 Andy Matuschak
我设计出了点新东西。过去几周,我一直在观察其他人使用我的作品。我非常有收获,也备受鼓舞。观察用户使用产品总是让我受益匪浅,这个设计步骤似乎有种魔力,在乎其快乐,在乎其神秘。
火箭科学家的设计过程某种意义上比较容易。发射火箭时,不是按火箭质量配上相应的燃料就能把火箭发射进轨道的。火箭燃料本身也是火箭的负重。所以配上足够发射火箭本体的燃料后,你又要给这些燃料配燃料,这样一直循环。不过可喜的是我们知道怎么解微分方程,这个循环有很好的解析解。
其他方面的设计也存在循环,不过不是总那么如人意的。如果是设计新的事物——比如说汽车——仅仅考虑怎么把乘客从 A 点移动到 B 点是不够的。设计会影响生活的生态。如果人能随心所欲以 30 公里每小时的速度移动,他所能构建的生活,跟只能步行的人是截然不同的。一旦这类人越来越多,群聚起来,互相影响,城市结构就会发生转变。转变之一就是路会修得更好,进而能支撑得起 70 公里每小时的高速,进而会发生更多转变,如此循环。
很难预测这样的循环能否收敛。如果新事物足够有趣,用户很快就会背离设计师精心编制的「用户历程」流程图。
总而言之:设计师需要仔细发问,审慎建立理论,进而以这些理论为基础打造出产品。然后,站在一旁,观察人们如何与这个产品互动,看这件东西如何左右他们行为,进而催生出新的理论。这不是简单的「用户测试」。你主要关注的不是「它能用吗?」,而是应持开阔和求知的心态,根据实际情况重新审视和定义问题。
赞美轻盈之感
三月时,我找到了一组很有潜力的设计原语。到了四月,我写了篇讲稿,在不同场景下考虑我的想法。我对讲稿的反复修改也推动了我对设计的迭代。五月,我搞出了个原型,为演讲的视频提供画面。我随后录制了视频,发布在 patreon 上。后来我去旅行了几周,暂时搁置了这个项目。
我旅行归来时,我又看了一遍视频,结果非常揪心。我心想:我对这个解决方案还是非常热情,但它还是太复杂、太难以理解了。我还想想出入门指导的功能可见性设计。把想法实现到能公开测试的程度,还得要苦干几个月。
跟 Rob Ochshorn 一起吃晚餐时,他指出我忘了一件很重要的事情。考虑下面两个场景:
第一个场景中,你让体验者坐下,旁边是你的笔记本。你展示原型设计,并把笔记本递过去,来观察他是怎么使用的。如果有东西出问题了,你给他解释出了什么事情,再调侃几句这破原型,并伸手过去输入指令来重置。在用户逐步体验原型的过程中,你还能实时地给出注解:「啊对,这块还没实现呢。」
到了第二个场景,你把原型的链接用邮件发给对方。你没办法实时地给出使用原型的预警和注解了,必须在邮件里全部解释清楚。当然你也知道,面对这么一大篇文字,对方肯定一概不读,直接点进链接。你没办法在原型出问题时即时给予修补,所以你必须解决障碍清单上的十几个对于主要概念并不要紧的毛病。
我做简陋原型的习惯由来已久。但我似乎忘掉了这两个场景的区分。Rob 注意到我在瞄准第二个场景做事(甚至完成度更要高,更公开)。他婉转地问,想要在下周就搞定第一种场景,而不是下个月或下个季度,该怎么做。听到这个,我感到如释重负。
我给演讲视频做的原型简直是空有其表,只有完全按我演示的那样行进才能工作。我正打算把这个原型搁置一边,开始打造一个「实打实」的原型,且要与 Orbit 系统集成。但是根据「下周做出来呢?」的思考方式,我开始不求周全,在这个原型上继续东搞西搞,做成个勉强能用的东西。
这也促使我仔细挑选测试用户。我的设计还很粗糙,不适合给那些对间隔重复闻所未闻的受众。若要将原型完善到从这批受众中汲取经验,我还要继续做很多设计。但我意识到,若是面对更有经验的用户,我就可以很快就拿出一个原型了。我的设计原语要低门槛,宽墙面,高上限。有经验的用户有助于我提高上限,拓宽墙面。降低门槛的工作可以等到未来的迭代再做。
在与 Rob 谈话后的下一周,我按照他的建议,开始了与测试用户的第一次会面。我的原型出了千奇百怪的错误,但并不要紧,因为我在场,能够及时化解这些小麻烦。更重要的是,(我在场的情况下)原型表现得还不错,足以让用户能认真地阅读演示所用的文本——这让我充分了解了用户如何与之互动,以及这个产品对阅读行为的影响。
第二周,我解决了实地观察到的最大障碍,并通过 Zoom 直播开展了几次原型演示。若要借助视频会议来演示原型,比起作者在身旁实地演示,原型必须更加成熟:因为互动关系更弱;不能方便地指给他们看屏幕上的哪个部分有问题,更别提伸手去修正了。更糟的是,大量的身体语言信息也被忽略了。
我不断修复测试者遇到的问题,让原型更加稳定,减少我的干预。又过了一周,我把原型分享给了一小部分高上下文的观众(比如你!)。我让人们测试时把各种想法记录在一个文本文件里,这样能低成本地收集更多数据,不过相比现场测试环节能获得的信息仍然微不足道。
整个过程感觉非常棒。一小步一小步地行进,我旅程归来时深深的反胃感得到了缓解。更重要的是,我不必制作保真度更高的原型来获取我需要的信息。我在根据我的观察大幅度地重新设计我的原语。比起花上几个月做出一个公开访问的原型再发现需要重新设计,花上几周打磨下简单的原型无疑要好得多。
通过在去年发布 Orbit,我学到了很重要的一点:按最初的设计,助记媒介在大部分阅读情境下都不好用。读者需要更多控制权。我感觉,相比搭建一个「平台」,如果我能迭代更快,制作的是用后即扔的原型,只跟少数精心挑选的作者合作,我本应更快获知这点。实现比设计更坚实——这样可不好。
所有这些都是可笑的设计入门问题。没错,你当然应该制作出一些粗略的原型,测试它们,扔掉它们。但在实际操作中,要将这种理念与我渴望在严肃环境中探索系统的愿望相协调,并非易事。最近一个月做原型的经历教会了我,要让工作更富有动感,不拖泥带水。我想尽办法避开那些沉重如「基础设施」的元素。哪怕这意味着我得站在一旁,看着你工作的同时还得手忙脚乱地撑着框架,也许这样也无妨。
一些惊喜的观察结果
过去几周的反馈揭示了原语的一些重要问题,这些问题将导致根本性的变化。不过等我有了新的设计,谈论这些部分将会更有趣。作为替代,我想分享一些读者的反应,这些反应在重新定义问题时起到了推动作用。这种珍贵而微妙的反应仅在人们真正用设计来做实事时才会显现。
需求诱导
这是个类似递归火箭燃料重量问题的例子*。城里的主干道交通拥堵,你花了个十亿,在原有基础上多修了四条车道,大幅度提升了道路容量。结果现在道路上车辆更多了,但每个人依然堵在路上,通勤时间一点也没缩短。哎哟:诱导需求。多出来的供给反而释放了「被压抑的」需求。(*译注:就是火箭燃料增加,火箭的总重量也会增加,为了推动更重的火箭,就需要更多的火箭燃料。详情请搜索齐奥尔科夫斯基公式。)
在这个原型中可以看到类似的动态,我相当着迷。
在新的设计中,我将间隔重复卡片做得更像旁注。它们有一种类似实体的触感,在侧边栏中有着固定的位置。
一下子,几乎所有的测试者都觉得,既然有了这样的旁注,那么其他相关的功能也应该有。人们想要高亮,想要剪藏,甚至想在旁边随意做些笔记。剪裁矩形的范围也进一步扩大了。人们想把这些剪报提取出来,在不同的阅读材料之间建立联系。人们希望将信息嵌入或链接到他们的个人知识管理系统中。
这一切都很合理——真的!这就是为什么我多年来一直使用「个人」助记媒介的原因。但我没料到,大家的需求会突然变得如此强烈。这些冲动很少出现在关于《量子国度》和 Orbit 的讨论中。现在一加上这么个侧边栏,向周边文本(peritext)点头示意,然后「砰」的一声:诱导需求。人们突然更加明确地感知到了他们的需求。
作为支持结构化阅读功能的卡片
另一个惊喜的是,这些周边文本的卡片对阅读体验有着巨大的影响。超过一半的读者会先看这些间隔重复卡片——把它们作为一种高层次的总结。如果卡片看起来很有趣,他们就直接跳到与之相关的正文部分。
这样做有其道理。卡片就像一种压缩:它们精选、提炼文本中最重要的部分,以供强化记忆。但如果我们的目标是结构化阅读,那么卡片可能并不是最佳的支持功能。它们包含了句法的噪音:为了将见解表述为一个问题,不得不添加一些多余的词。而一个见解要全面地展示出来,往往需要好几张这样的卡片。
一些测试者将其与 Christopher Alexander’s The Timeless Way of Building 进行比较,那本书里有一种用于结构化阅读的特殊方法:
即使我怀疑间隔重复卡片是否是正确的原语,在动态媒体时代,结构化阅读的支持功能似乎还没有得到充分探索。
在电脑上阅读文本令人不快
大部分测试读者一开始都很乐意体验试用版,对各种功能和增强颇感兴趣。但等到最后的总结阶段,他们基本上都会说:「但你知道,其实我平时不会在电脑上看这类内容。我更喜欢纸质书,或者用 Kindle。我有点讨厌在电脑上看书。」有的人还给出了一个让人哭笑不得的补充:「如果所有的阅读材料都能用这套系统,那也许我会愿意在电脑上阅读!」
这个问题在之前关于《量子国度》的采访里为何没多提及,我也不太清楚。可能是因为这个新原型让人想把它应用到所有的阅读材料上,而《量子国度》似乎是一次性的。
这群人说得一点儿没错。在电脑上阅读长文确实受罪,多年来,我也在不经意间积累了这方面问题的笔记。我当然不想看到这样的结果:大家都讨厌在电脑上阅读,但因为有几样高科技的好处就勉强忍了下。这不仅是助记媒介面临的问题,也是「书之后是什么?」这个大问题的一部分。虽然我一直在回避这个问题,但这种一致的反应再次让它成为焦点。
如果我的论文是《让我们用动态媒介来增强读者》,那么我要么得让电脑上的阅读体验不那么糟糕,要么就得把这种动态媒体搬到实体阅读上去。
————————
我诚挚地感谢所有与我面对面并在线尝试此试用版的人,也感谢那些给我发来关于他们经历的笔记的人。
占据我注意力的大部分可操作的洞见来自慷慨的设计评论会,而不是来自用户观察。在未来的信中——当我有新的设计工作可以分享时——我会更详细地说明这一点,但是我在这里要先感谢 Rob Ochshorn, Gray Crawford, Niko Klein, Joe Edelman, Yiliu Shen-Burke, Shan Carter, Cameron Burgess, Marisa Lu。
基于众筹支持的三年研究
原文:Three years of crowdfunded research | Andy Matuschak
2023 年 1 月。节选自《来自实验室的信》,一系列关于我的研究的非正式文章,面向赞助人撰写。你也可以听这篇文章(19 分钟)。
我是独立研究者。这个头衔确实很不寻常——但更不寻常的是, 2022 年已经是我作为众筹支持的独立研究者的第三年了。我的主要收入一直是一个会员项目。大部分研究者要对几个提供研究基金的委员会负责;而我要对几百个网络上的陌生人负责。
有趣的是他们似乎已经不像是陌生人了。在 2020 年,我认为这个会员项目仅仅是筹集资金的渠道,是不用扭曲自己的目的去申请基金,也能付清账单的办法。但慢慢地,自发地,这个项目正在成长,在我的创意生活中占据更加重要而鲜活的位置。现在,这个项目如同一段摄人心弦的旋律,是赋予我工作以能量和结构的情景。
三年过去了,这个会员项目还在不断演进,而我对这个项目的情感也在不断变化。我在此将种种感触留存下来,以备新年。众筹如何塑造了我的工作?我情感上如何与其共情?这个项目未来会如何演化?我确信我的经历很难推广,但如果有人想走上一条类似的路,他们可能会对此感兴趣。
高上下文的听众
研究的节奏往往很慢;很多项目常常要横跨数年。在这个缓慢的步调中,我的会员项目创建了一列快速的鼓点,一块积极观察我研究工作的空间。我的手头上有一个庞大的项目,但托会员项目这一场景所赐,我可以比较规律地发表作品;今年我发布了:可以工作的原型、关于项目和方法论的文章、新设计的带脚本演示讲解、数小时的音频。
我担心为赞助者写作会变得像写尽职「报告」一样。在 2020 年,我的确感觉如此,但问题在我。随着我与会员交谈,并理解他们的想法,我的情感态度有了一些改变。他们不是项目负责人,搜查着受助人有所产出的证据。他们是充满好奇心的创意人士,想近距离观察一种不寻常的生活方式,一个充满挑战的创意过程。我一开始以为大家想「一睹幕后」是非常急切而高压的:他们想让我赶紧完成可以用的原型——赶紧,赶快!其实,从他们的评论来看,他们想知道的是,我做这个奇怪东西的感觉是什么样的。他们想看到各个部件摆在桌子上,看见我动手干活,分享灵机一动的那一刻,哪怕只是暂时应付的方法。魔法般的作品令人激动,但有时候驱散魔法,窥探内部齿轮,是更加令人兴奋的。
这对会员来说没问题,但我的收获是什么?认识到这样的事实后,我摆脱了写文是义务的想法——文章这一场景,让我仔细思考我工作一些方面,这一场景让我分享创造性满足感——可靠地,及时地——因为我的长期研究项目还在缓缓前行,不可预测。有了这样的框架,为会员们写文章变成了我的工具箱中的一个创意「动作」。选择一个问题,一处细节,一种做法,一个想法;写出我觉得我在想的东西;在写作过程中获得更多发现。写文章实际上变成了研究的一部分,而不是平添的负担。
这听起来很像是典型的(好)建议:写作有助于思考!写得越多,想得越深!这的确不假,但这个会员项目对我来说有一个地方很不同,就是我是为「极高上下文的听众」而写作。我的大部分读者都读过很多关于我项目的文字。可能有超过一百个人读过介绍我最近工作的文章超过一百万字了(这句话……挺难懂!)这意味着我可以直接讨论工作的最前沿,直接讨论我在思考的地方。当我向大众讲解我的研究时,我要把大部分时间花在描述背景上。我得到的大部分回馈,都是我之前都听到过十几次了的。相比之下,我的赞助者想直接看齐我的位置,这彻底改变了我对会员文章写作的态度。
没有会员项目,还有可能面向极高上下文的观众写文章吗?我确信有很多作者仍然可以做到,但对我来说这样写作在心理上说不过去。现在定期新闻简报很常见了。但订阅这一信号太微弱了。我订阅了不少邮件列表,但很多我都并不关心,我相信你也是这样。大部分新闻简报作者需要假设读者群体分布非常广泛。的确,作者可以为一小部分长尾分布末端的读者写作,即便这样有可能会疏远大部分读者群体……但这对于作者来说需要钢铁般的毅力。另一方面,如果你是我的赞助者之一,你跻身于直接赞助我研究的几百人,这对我来说是非常强劲的兴趣信号,而我也能很容易传达相应信息。
有了强劲的兴趣信号,我也更容易诚实地写作了。大部分关于发明创造的论文和公开文章,都包含不少宣传成分(可以理解)。无论是否有意,作者都会试图说服读者,他们创造了新颖而富有价值的作品,而作品的不足之处往往轻描淡写,只在文章末尾用几段话简单讲讲。这对于「完成的」作品可能比较可取,但如果针对进行中的项目,通过写作来思考,这样的思路肯定是不对的。我撰写这些「中间阶段」的文章,是想关注还没有成功的部分,关注我还没有理解,让我牵肠挂肚的细节。而对于兴趣充足,上下文极高的观众,这样做对我来说很安全。
现在到了令我百感交集的部分了。这些高上下文的常客弥足珍贵,因为他们重现了优质大学中的体验,那里有一张可以畅快讨论的午餐桌,有一系列优质的讲座。我没有这些东西。我试图拼凑出这种体验,跟旧金山里的朋友散步,与遥远的同事开展长长的邮件沟通,为我高上下文的会员编写文章。我非常感激这些渠道,但我也知道这代替不了高质量的日常社交沉浸。当然,这远远胜过我几年前的社交体验,而我会在今年尝试一些新的机制。
另一个令人惊喜的方面是,我的会员项目模拟了身处大学的体验:我有机会帮助其他人成长。很多有理想的发明者告诉过我,看我努力思考、听我推理问题、看我规划项目,取得进展,对他们非常有帮助,这给了他们力量。我深有同感。我从看我的同事做事中成长颇多。从某种意义上扩大这种隐式知识的传播,这让我很满足。确实,我会组织答疑时间,也会写一些很有说教味的材料——但回看这些东西,我觉得这些东西的确不如简简单单,事无巨细地展示我在做什么,来得有价值。
我并不是「内容创作者」
你可能读过一些描述「创作者经济」的激情四射的文章。数千位写作者通过新闻简报订阅实现经济独立。很多广受欢迎的播客只面向付费听众开放。我使用的会员平台是 Patreon,这个平台的初衷,是通过按作品付费的方法,来支持音乐家和视频创作者。这些例子都在传达一个简单的理念:你定期付费后,便能稳定获得专属内容。(在这里给想尝试众筹的人一个警示:我不会向新入门的创作者推荐 Patreon。Patreon 会把你锁定在他们的平台上:你根本没办法迁移,除非每位会员都重新输入一遍付款明细。如果我现在开始众筹,我会用 Ghost 或者 Memberful。这两个平台都允许用户把付款明细迁移到其他平台。可能的话我也会迁移——Patreon 对我的工作的展示太过粗笨,我也无法调整。我有朝一日会迁移出 Patreon,但工作量会很大,所以我先暂且搁置。与此同时,我的会员每年向他们支付数千美元的费用。)
我在之前的章节讨论了我为赞助人规律编写的文章。但我并不是电子邮件简讯作者:我并不想当「内容创作者」。这些文章不是我的卖点,或者至少不是我预想的卖点。我是研究者,我要发明新工具,为人们提供新的认知能力和创造能力。对于邮件简讯作者来说,写作就是主要活动。但我的文章是次级产物,是我开展占据我大部分时间的核心工作时,偶尔创作的副产品。我不能(也不想)与全职作家竞争。
我对会员的描述并不像交易,而更像是传统意义上的赞助。我的工作是公共服务,而我的主要产出也能免费获得。当我的会员就像是当一名小小的基金提供者,就像是说:「是的,我希望每个月付出一杯拿铁的价钱,支持 Andy 追求他的领域,取得进展。」这是非常纯粹的关系,更像是一个精美的捐赠箱。但我之后迷糊了概念:作为额外的奖励,我说,你也能规律获得幕后文章、活动、早期原型等等。
在过去的调查中,有相当多赞助者表示,他们成为会员的主要动机是支持我的研究。只有一小部分人把获得独家内容作为主要因素。但独家内容的确很重要!2020 年年初,我把我的会员计划设想为更纯粹的捐赠箱,而那时候浏览我主页的人,相比现在更不可能成为会员并留下来。我们怎么平衡这两件事?
我听到的最好解释来自于同为独立研究者的 Craig Mod:「从根本上说,会员项目就像一个迷你 NPR 电视台——福利当然会有,但成为会员的主要理由应该是:Craig 你个怪人,我想看到你的更多作品问世。」我记得小时候我收看 PBS 会员筹款活动。有一个全职团队在运营,而他们觉得福利也是必要的。所有主持人拿着高人指点的石板,上面写着:福利!必须推销这些福利!的确,你们这些观众的支持不可或缺——但是——必须每十分钟就提一次盒装 DVD 套装和纪念运动帽!会员项目比商品贵很多,所以这仍然是以捐款为主,但这些福利显然促成了交易。
但我也是本地现代艺术博物馆 SFMOMA 的会员。会员费比普通门票差不多贵四倍:会员能为自己以及一名同伴免除博物馆门票费。所以你跟同伴至少去两次,会员费就赚回来了。博物馆很勇敢地将这种做法描述得像 NPR/PBS 一样:请支持这家非盈利博物馆……作为福利,你能获得这些免费门票!我很喜欢 SFMOMA,但我必须坦白,「支持博物馆」在我成为会员的动机中只占 0%。这个公共物品的存在感过于稀薄。我是这家博物馆的常客,我实际上只是通过会员来买票而已。
所以,我的会员项目是类似 NPR 那种,还是 SFMOMA 呢?以捐款为主,还是购买福利为主?我每次写到这里,我都很清楚,未来的会员应该将这个项目看作以支持我的研究为主。但我感觉我在对抗一股愈发兴盛的文化潮流。非订阅不可见内容太过普遍了,而且在不断增长。我在这里是少数派,运营着一个奇怪的 NPR 风格的会员项目。如果有人买过五名内容创作者仅限订阅者的内容,之后加入了我的会员项目,很难想象他们不会向我流露对「内容创作者」的期望,哪怕是潜意识地。我感受到了这种「内容创作者」的压力,尽管比较模糊,难以描述,但我也因此感到担忧。我在尽可能忽略这种压力,但我必须意识到它对我有微妙的影响。
或许我最好的辩护也挺蠢的。如果你把我看做内容创作者,那么相比其他内容创作者,我的月度会员费会显得「很不划算」。所以你自己就会选择退出!论证成立!
活动
运营这种小众领域会员项目的一个好处是,我聚集起来了一大帮人,他们共享很多小众兴趣。我感觉帮助这些人互相认识是有道理的。今年我为会员主持了 24 场活动,形式各异。我的动机有一部分是为了自己:也许我能培养我研究的「场景」,培养出一些未来的同行或合作者?
我知道很多会员自己就在创作新颖的用户界面,我就从公开答疑时间入手。我会回答问题,构思创意,主持设计批判活动等等。应该有十几个会员勇敢地带来了他们未完成的作品。不过十次活动之后候选人选也差不多用光了。没多少人在自己做比较大的项目,而且做到可以在那里分享的程度。
我围绕一些知名论文或讨论举办了一系列研究座谈会,这方面效果更好。这些会对我很有用,因为我选的工作都是我希望更加深入理解的。我会带着笔记来讨论,但其他参加者总是会提很多好问题,分享很多不错的观察。关键在于确立规矩:我要求参与者必须读过论文或者看过演讲。所以讨论是激烈且高信息密度的。此外找一些不在我的会员项目中,但是对讨论的作品有独到见解或较高兴趣的人,让他们参与讨论,也有一定帮助。
我也为会员举办了两场「非会议」。组织起来花不了我多少时间,因为我们用 Gather 来主持,而且是成员自行构建日程表的。就像其他非会议一样,日程都是非正式的,而且格式多样:演示、演讲、研讨会、解决问题环节、展示与介绍等等。这两次活动很是激发了我的灵感——特别是第二次会议,我还邀请了其他几个小社区参加。可惜的是,在在线会议中,非常重要的「过道讨论区」也近乎无形,即使在 Gather 也是如此。我主要想帮这些成员互相认识,这是个很大的问题。疫情催生了一批远程社交工具,但这些工具似乎没有解决这个问题。
显然有一个方法是我还没试过的:使用 Discord、Zulip、Discourse 等工具,开设实时讨论社区。我加入过这些平台上很多在线社区,没一个效果很好。这些社区最终都会成为负担——又多了个要看的收件箱,一件我要追踪的东西——而不是快乐人际联系的源泉。而且如果我真要培养我的「场景」,我不喜欢被付费墙阻隔,非会员莫入的讨论社区。如果我们真的关心优质对话,我们希望社区里的成员是做了优质工作,贡献了优质对话的。这些人的集合跟我的会员的集合只是部分重叠。我可以添加一些邀请,但我不想担起这么大规模的主持人的责任。我会继续跟高度参与这种环境的其他人讨论;也许之后某一天我会找到一个不错的角度。
付清账单
我的朋友不确定这个问题怎么说出口。「所以,你的众筹……怎么样了?」他们的实际意思是:Andy,你没事吧?你打算把你的一生储蓄一把火烧了?
好消息是我付得起我的账单。真的——互联网上的陌生人能为我付账单(我要暂停一下说:这真是难以置信)。坏消息是这个项目的收入增长基本上已经停滞了。
\n
我的收入介于研究生和初级教职员工之间。这个水平……说得过去,但显然不够理想。很多刚开始职业生涯的人很想跟随我的路径,也经常跟我沟通,我想要留下警告:这对我说得过去,因为我在科技界工作过十年,有不少储蓄;我们的房子是自己的;我的妻子很支持我,她有一份稳定的职业;我们没有孩子,除了按揭之外也没有债务。换句话说,这要归因于我们极其幸运的初始境况。
在我对 2020 年的反思中,我引用了 [Ivan Sutherland](http://andymatuschak.org/files/papers/Sutherland - 1996 - Technology and Courage.pdf) 的话:
我发现我能够承担风险的余地只有那么多。如果我在我能降低生活中某些方面的风险,我就能有更多余裕去面对其他地方的风险。为了获得能完成一些事的勇气,我要降低我在其他地方所需的勇气。
这对我来说仍然很真实!我坦白,相比两年前,众筹需要更多一些勇气。我对众筹长期可持续性又不那么乐观了。在我现在的水平,收入持平是可以接受的,但二阶导数估计呈现负数,而我刚刚达到收支平衡。
2020 年以来会员增减的趋势没有改变:流失率很低,也很稳定(每个月 ~2%),必须要有稳定的新会员流入才能平衡。很惊奇的是,流失率几乎不受我的行为影响。新的福利、改变发布频率、加快或者减慢进展(对我来说)——这些事在过去几年对流失率没有很大改变。其实这也挺让人舒心的,我明白了流失率不是我能任意调控的。
每年会员主页的新浏览者,注册成为会员的比率基本相同,但相比 2021 年,2022 年的新浏览者更少了。正如我去年指出的,这意味着哪怕是为了维持现状,我都需要不断扩增我的受众,让新人进入我「转化漏斗的顶端」。至少对我来说,这种思考模式,对研究者思维来说,是非常有害的。如果我的众筹收入下降太多,我更愿意寻求基金或者其他资助来源,而不是用「增长营销」来解决这个情况。
很显然,我这种会员项目很难支撑一个团队或一个机构的成长。前些年里,我实验过合同制雇用队友,使用的是另外的资金,来自于一些捐赠者为这个方向慷慨提供的拨款。我今年也在继续做这些实验,取得了更多成功。而在 2023 年,我将与一位全职研究员(Research Fellow)合作六个月。我对这些合作非常兴奋!为了在这些方向取得更多进展,我估计我需要其他资金来源,而不是我的会员收入。
听起来有些灰暗,所以我想这样来结束这一节:我仍然靠众筹成功付清了我的账单。明年仍然如此。这已经非常让人吃惊了!
好奇与疑惑
让我们聚焦于这种震惊上。在日常之间,我经常会忘记我的生活有多奇怪。三年之后,这种生活看起来似乎……几乎有些无聊?一切都归于稳态,我感觉。
但我参与的几乎每一次社交活动中,别人都会提醒我,这种生活其实很不寻常。我会参与这样的对话,几乎一字不差,循环往复:
「你是做什么工作的?」
「我尝试发明工具,给人们提供非同寻常的认知能力或创造能力。」
「酷啊!你在创业吗?」
「呃,不是,我只是在做研究。我会制作一些原型,并写一些文章。」
「哦,在大学做研究吗?」
「不,我是独立研究者。」
「所以你就像自由工作者一样,有人雇你做研究?」
「不,我研究我自己的想法。」
「可是……谁出钱呢?」
「呃……互联网上的一帮人。」
说完这些话后,对方会流露出好奇和疑惑交杂的感情。我想说的是:我认真想的时候,这两个词正是我对我处境的感觉。
好奇——我得以探索一块无尽的开放领域,如我所愿纵情探索。Craig Mod 将其描述为 「获得许可去做我认为我能做的工作,但我还没有强到靠自己能做完。」我也觉得是这样,而且我也很感激,但我心中大部分好奇来自于无需许可的感觉。我不需要其他人认可,就可以做我觉得有意思的事情。我不需要写基金申请,不需要迎合长聘教授委员会,我能迎面挑战真正的任务(更加困难的任务!),那就是鼓足勇气追随我以为最重要的任务。这不是大众想让我做的任务;不是短期内能产出漂亮成果的任务;不是我能力圈内能够轻松完成的任务。这项任务是高耸入云的挑战,我对此非常感激,我也要竭尽全力才能完成。
所以,接下来就是困惑——我所得到的这一无上自由背后,有什么条件?我当然对我的会员有一些承诺。但他们也对我有所承诺。我应该保持怎么样的进展?我的兴趣可以游离到什么地步?代价是什么?*这些问题很难通过调查问出来。我觉得我自己很难为我通过会员项目支持的其他人,给出可靠的答案。我当然不希望我的会员给我无限宽松的缰绳。(*译注:那么,古尔丹,代价是什么呢.jpg)
这种困惑更困难的地方在于:即使我能回答这些问题,我必须不遵从这些答案!如果我知道项目 X 会花很长时间,而我的参与者很可能会丧失耐心?那又如何?那意味着我不应该做这个项目吗?这会导向很糟糕的研究做法。
所以,在我的会员项目这个情境下,做优质研究意味着主要关注好奇,关注感激,并且基本上忽略疑惑。这可不简单!
让整个过程更轻松的是:几乎我与赞助者开展的所有对话都是高度支持、互相信赖、非常坦诚的。这些信息轻轻消解了那些令人困惑的问题。这里有几百个人,他们都只是对我要做的东西很感兴趣。
所以,对我的所有会员,无论是否继续——谢谢你们,谢谢你们,谢谢你们!过去几年是我人生中最为充满创造力而又充实的几年,而是你们是亲自贡献,让这一切成为可能的一小群人。
如果你觉得我的工作很有意思,你可以成为会员以支持我的工作,并获得类似这样的文章。
最后,特别感谢我在出版时的赞助商级赞助人:Adam Marblestone,Adam Wiggins,Andrew Sutherland,Ben Springwater,Bert Muthalaly,Boris Verbitsky,Calvin French-Owen,Dan Romero,David Wilkinson,fnnch,Heptabase,James Hill-Khurana,James Lindenbaum,Jesse Andrews,Kevin Lynagh,Kinnu,Lambda AI Hardware,Ludwig Petersson,Maksim Stepanenko,Matt Knox,Mickey McManus,Mintter,Nathan Lippi,Patrick Collison,Peter Hartree,Ross Boucher,Russel Simmons,Salem Al-MansooriSana Labs,Thomas Honeyman,Todor Markov,Tooz Wu,William Clausen,William Laitinen,Yaniv Tal
轻而易举,不费吹灰之力
原文:Too easy to be effortless | Patreon 上的 Andy Matuschak
现在,一些 Orbit 实验正在进行中,我上个月的大部分时间里都在重新挖掘量子国度的数据。我发现一个令我惊讶的问题:「基本上每个人都记得差不多所有事,基本上始终如此」。
感情驱动的优化
记忆能有多不费力?
在极限情况下,我们可以想象自动记住我们感知到的一切。我们可能并不想要这样——像 Shereshevsky 这样的怪才经常报告他们完美记忆的诅咒般的症状。也许我们会满足于像移动肌肉一样轻松地记住或忘记一些东西。这样的世界会是怎样的呢?肯定的是,学校将不再是我们所知的那样,那么工作场所和工作室呢?人际关系呢?Borges、姜峰楠、Wachowskis 和其他伟大的科幻作家都已经描绘了这些影响,但我也对平凡的事物感兴趣:工作场所协作的互动方式的变化;突然显现的巧合和矛盾。
(当然,不费力只是许多有用视角之一!一个相反的视角指出,也许费力才是你想从你与记忆的互动中得到的东西。你希望不断质疑你认为你「知道」的事情;你希望一切都保持熔融状态,以便你能形成新的联系,以新的方式看待事物;等等......)
即使有如今的系统,记忆也远非毫不费力。我们能做到什么程度呢?通常的方法是将其作为一个优化问题来处理,但我发现,将不费力视作一种感觉是很有意义的。强大的技术感觉像是身体的延伸。边界消失了;意图和行动之间的距离缩小了。然而,如果你在铅笔上绑上一个砖块,它就不再感觉像你手的一部分。同样地,和朋友们热烈讨论时,学习似乎不费吹灰之力,但在无聊的自习室里,同样的想法可能需要你付出超出你能承受的努力。
这个视角给了我们一种不同的方式来思考如何「优化」思想工具。哪些类型的互动会产生分离感、尽职感和厌烦感?
在任何一种计算机化的学习系统中(包括间隔重复系统),无聊的一个可靠来源是感觉太容易的材料。这种材料并不是好的那种不费力气的材料。翻阅这些材料的感觉几乎就像在软件安装程序中快速运行许可协议提示。「是的,是的,我知道,我知道。」我不需要真正思考;我没有真正参与;我不喜欢被要求。有时,问题在于我实际上并不关心这些材料,在这种情况下,我真的应该删除它(也许是模糊不清地)。不过,很多时候,我确实关心这些材料。如果它在那一刻感觉不那么微不足道,我就会更认真地参与。
这个观察引出了学习技术中的一个经典问题:正确估计学生的知识状态,以优化学习计划。不同的是,如果我们坚持使用基于感觉的视角,我们就不会把优化本身看作是要解决的问题。我们的核心目标是实现一种毫不费力的感觉。模型优化是实现这种感觉的一种有效手段。但也有其他的手段。你无法在没有记住许多复杂规则的情况下玩《见证者(The Witress)》,但当你与环境互动时,你会自然地记住这些规则:记忆本身并不是需要努力的部分。
量子国度过度轻松的努力
在进行了这一崇高的忏悔之后,让我们把注意力转向一个不寻常的记忆增强系统的表现:《量子国度》。
请注意:这是对量子国度数据的非正式讨论。该分析是初步的,不应该在其他工作中引用或摘录。我这里是在开门造车。
一方面,《量子国度》实现了它的承诺,帮助人们记住他们读过的内容。在第五次重复之后,大多数读者已经能够在超过一个月的时间间隔内回忆起 95% 以上的问题。这相当了不起。根据我过去阅读教科书的经验,一个月后能记住一小部分细节就很幸运了。
另一种看待这个问题的方式是「维护成本」。为了在第一年维持第一篇论文的 112 个问题,中位数读者进行了 567 次复习,消耗了约 1.5 小时。读者报告说,阅读第一篇文章需要 2-4 个小时,所以我们可以将第一年的复习看作是这些读者选择为了永久记住那篇文章所有的关键细节而支付的约 50% 的额外时间成本。我预计第二年的时间成本大约是一半,但我们还没有这方面的数据。
我想,问题在于,《量子国度》的效果「太好」了。几乎所有人,在几乎所有时间,记得几乎所有内容。
我们要讨论的麻烦始于我所说的「维持」阶段。对于一个特定的读者和问题,历史通常可以分两个阶段:最初的「学习」阶段(通常很短),在这个阶段中,读者对材料的吸收足以让他们在不同的时段记住它;接着是「维持」阶段(更长),在这个阶段中,重复主要用于对抗遗忘的侵蚀。你可以通过说人们在第一次成功重复后过渡到维护阶段,来非常好地近似这个划分。
在第一次成功重复某个问题后——也就是他们进入「维持阶段」后——中位数的读者在随后的重复中回答正确率为 95%。事实上,在所有第一年的问题历史中,82% 的问题在那之后都没有遗忘(这确实符合从 p=0.95 的二项分布给出的第一年重复次数的期望)。
这有点抽象。具体地说:在他们第一次成功的重复之后,中位数的读者在接下来的一年里,在第一篇文章的 112 个问题的 448 次复习中只忘记了 15 次。
整整一年的勤奋复习,只有 15 次遗忘!433 次成功的回忆!这里的问题并非完全是效率问题。在与读者的交谈中,很多人愿意(而且已经)支付 50% 的时间成本来彻底内化这些材料。问题并不在于 448 次复习太多,或者花费的时间太长。问题在于,复习你已经非常了解的材料感觉很无聊,就像浪费时间一样。而这大多是人们正在做的事情。
但实际上,遗忘的情况比我说的还要偏斜。如果这 15 次遗忘是从所有问题中等概率抽取的,那可能感觉还不算太糟:任何一个问题都可能是你今天遗忘的问题!但事实是,所有长期遗忘中的一半来自 12% 的问题。从情感上讲,这些问题会产生「哦,不,又是那个问题......」。相比之下,中位数问题在「维持阶段」的第一年里,每十个读者只会遗忘一次。对于 95% 的问题,中位数的读者在维持阶段的第一年里从未忘记过。因此,大多数复习可能感到乏味且没必要。
我们可能会担心,也许对中位数的读者来说一切都很好,但许多能力较弱的读者却在挣扎。毕竟,他们的遗忘在问题中高度符合幂律分布。但读者的分布并不那么明显。在第一年的维持阶段中,我们的第 25 百分位的读者在 483 次重复中忘记了 35 次。第 10 百分位的读者在 516 次重复中忘记了 59 次。而且,这些遗忘集中在相对较小的问题池中。即使是对相对较不成功的读者而言,绝大多数的问题也没有出现遗忘。
当遗忘确实发生时,通常情况并不那么糟糕。一种看待这个问题的方式是,询问连续多次忘记的问题有多频繁,以至于读者无法在他们之前能够跨越的间隔内回忆起一张卡片。这几乎从未发生:在大约 2% 的第一年读者/问题历史记录中会出现。因此,我们的「实证保留」进度指标是一个相当好的指标。一旦你证明了一个特定的保留间隔,只要你继续复习,你就非常不可能失去它。如果确实发生了遗忘,那么它「倒退」到读者无法记住五天的概率只有 7%。这里提醒一下,《量子国度》在一个问题被遗忘时,大致会将复习间隔减半。鉴于这些数据,Anki 在每次遗忘时将间隔重置为零的默认行为在我们的情况下似乎特别不合适。
这里的意思是,我们也许应该更激进地拉长复习安排。是的,这将使体验更高效;但我真正关心的是,这可能会使体验不那么乏味。
这个复习安排到底应该是什么?许多论文建议为这些复习安排建立动态且复杂的模型,也许我将在某个时候实现一个。理想的复习安排应该在避免枯燥乏味与其他重要的感觉变量进行权衡:与材料的联系,重复忘记同一事物的挫败感,复习时机的可预测性。就低垂的果实而言,简单的启发式方法能走多远令人惊讶。例如,当读者在阅读文章时和在第一次复习环节上都成功地回答了一个问题时,接下来一年中,96% 的历史记录中没有出现遗忘。可能可以安全地大幅度地拉长它们的间隔。
仅通过关注过于简单的问题,我们可以很容易地想象,把维持第一年所需的重复次数减半,甚至更多。如果我们这样做,第一年的复习次数就会从 567 次减少到 343 次,减少了 40%。第一年保持记忆的边际时间成本将从 50% 下降到 30%。
我呈现的数据对反事实并没有太多的说法。如果间隔是现在的两倍,我们会看到更多的遗忘,还是会看到混乱的局面?我一直在沿着这些思路进行对照实验,它们产生了非常有趣且令人困惑结果......这将不得不等待另一个时间。
助记媒介的复习安排与现有的 SRS 模式相比
几乎所有围绕间隔重复系统的工作——包括学术和商业——都集中在定义上:语言学习者的词汇、医学生的术语、历史课的人物和事件,等等。这类知识往往是相当随意、缺少联系的,因此我怀疑它被遗忘得更快。
《量子国度》的复习安排相当激进。我们从五天的时间间隔开始,每次重复都会增长 2-3 倍。默认情况下,Anki 从一天的时间间隔开始,增长 1.8 倍。然而,我们仍然看到很少有遗忘。我不认为问题出在 Anki 的疯狂保守上。我认为这是因为概念性的知识,在一个叙述性的弧线中被引入,并与先前的知识彻底相连,与词汇的记忆动态非常不同。助记媒介的复习安排可能应该与传统的间隔重复系统的复习安排有很大的不同。
SuperMemo 用「卡片复杂度」建立了类似于我所描述的效果的模型,但由于每个用户都建立自己的数据库,它必须从几个点的样本中估计每张卡片的复杂度。助记媒介的共享问题创造了一个有趣的机会:卡片的复杂度可以通过汇总许多先前用户的尝试来估计,而通过比较他们在文章中的表现和先前学生的表现,可以估计一个新用户对材料的现有熟练程度。这种类型的方法已被用于安排西班牙语词汇练习的模型中,我对探索它在更多概念性题目上的表现很感兴趣。助记文章(与词汇表不同)面临的一个显著挑战是,这些问题高度相互依赖。复习一个问题使读者更有可能回答其他各种相关问题。因此,我可能需要将像我所描述的模型与深度知识追踪这样的模型结合起来,后者可以解释卡片间的相互作用。
我还不确定我想在这种优化上走多深。在这个领域有很多机会可以探索,而我的时间又是如此之少!事实上,有许多简单的杠杆可以让人感觉不费力,而不涉及实际减少重复的次数。例如,当我们将复习「分批」进行,使相邻几天的小型复习环节合并为一个完整的环节时,复习环节的读者感到复习的负担大大减轻。
在未来的一篇文章中,我将探讨多个实验是如何努力测量量子国度上任何明显的遗忘时间的。直到下一次,感谢你们的支持。
思想工具:科学、设计、艺术、工匠精神?
原文:Tools for thought: science, design, art, craftsmanship? | Patreon 上的 Andy Matuschak
「计算机的命运是成为全世界所有经常上网的人的交互式智能放大器。
如果你想加快计算机成为交互式智能放大器——发明人机界面,从根本上扩大人类的认知和创造力——需要做什么?进步如何发生?
此外,我们如何才能取得集体的进步?在共享知识、框架、方法、价值观和传统方面有哪些潜力,可以相互加速许多独立的探索路线?
「思想工具」可以——或者应该——成为一个科学领域吗?一门设计学科?一个艺术「场景」?一种工艺实践?
对我来说,这不是一个抽象的问题:这是一个非常现实的问题,涉及如何塑造我一整天的工作!我相信这种困惑也阻碍了这个领域的集体进步。
至少对我来说,这些标签似乎没有一个是完全正确的。日复一日,这个过程感觉更像是凭直觉行事,而不是遵循一本指南。但是,很难判断我在任何特定时刻真正在探寻什么,更不用说我「应该」探寻什么了。这是为了更深入地理解什么吗?对未来的感觉?对于事情应该怎样的期望?关于展现某种完美?
我的直觉借鉴了所有四个角度。每一种思维方式在创新过程中都有其独特的帮助。但我认为它们可以被综合成一幅更清晰的画面,说明集体为这个项目做出贡献的意义,即扩散和完善增强人类能力的工具。
作为科学领域的思想工具
奖励在于发现的乐趣,探索的兴奋,以及看到其他人使用它——这些才是真正的收获。
思想工具的「发现」过程并不像 DNA 。思想工具不受自然规律的支配,就像强核力可以被理解一样。因此,思想工具不是自然科学的一个领域。
也就是说,理解的动力是我工作中的核心感觉,也是我大多数贡献的基本要素。同样,我产生的一些最有价值的产出是一种知识。我不认为自己是一个科学家,但我确实通过这些特征感觉到与科学家的相似之处。
什么样的理解和知识生产对思想工具的进步最有用?但在哪些领域又是一个不太有用的框架?
Herb Simon 介绍了一个我觉得很有帮助的概念:有些领域可以理解为「人工科学」。物理学和化学努力理解自然现象,但建筑学和商业管理的某些进步来自于对人工现象的研究,即我们自己建造的「人工制品」。
这一框架为那些追求思想工具的人提供了几个可以创造和分享知识的强大空间。其一是深入理解在人工环境和自然环境之间的交汇点——人机界面——上运作的自然现象。
对于软件界面来说,这通常意味着认知心理学和该领域的细节。Vannevar Bush 关于 memex 的论点(产生了今天的超链接,以及其他许多概念)基于人类记忆的联想性。如果你对符号逻辑的理解足够深刻,你也可能会发明 Mathematica。强大的界面通常会重塑关于它们所代表的现实的深刻理念,所以培养这样的理念很有潜力。
SuperMemo 是第一个计算机化的间隔重复系统,它的存在得益于艾宾浩斯在 19 世纪末首次提出的关于人类遗忘的观点。但关键是,作者 Piotr Wozniak 在现实世界中使用该系统的经验使他形成了自己的遗忘理论,这反过来又使他能够改进他的人工制品。这似乎很矛盾,但研究一个人工现象却开启了对一个自然现象的新见解。这个循环就是 Michael Nielsen 和我所称的「实践出洞见」。
我们还可以研究——也许甚至是定量和实验性地——研究我们所创造的人工构造物,以及它们的来源。
当 Wozniak 努力改进他的记忆系统的算法时,这项工作的某些部分取决于人类记忆的自然现象,但许多机会也来自于对他所创造的调度系统的「人工」动态的理解。多年以后,当我建立自己的记忆系统时,我从这些知识中受益,尽管我有不同的目标。这就是科学的进步,以它自己的方式!
可用性研究通常是关于理解我们所使用的「材料」。菲特定律引导我们把菜单和关键操作放在边缘和角落。尼尔森·诺曼集团的可用性试验磨练了标准的控制方式,比如键入式搜索栏。我的印象是,这类知识在边缘上是有帮助的,但很少是变革性的。
对我来说,对思想工具最有力的理解往往是对于首先可以制造什么样的人工制品的见解。
在 PARC 创造的图形用户界面——它建立了我们今天仍然使用的大部分原语——依赖于这样一个深刻的想法:「[用图像做符号](http://worrydream.com/refs/Kay - User Interface, a Personal View.pdf)。」这个想法产生了一个普遍的范式:我们用鼠标来操作图标,而这些图标又代表了抽象的操作。
这是一种什么样的知识?什么样的知识体现在「文件」、「应用程序」或「转发」等抽象概念的创造或发现中?
这类知识扩大了可以生产的人工制品的空间。他们提出了全新的人工制品种类。当我沿着这样的道路前进,追逐一个新的抽象概念时,我所做的部分事情来自于一种深刻的理解冲动。但大部分都来自于一种可能的强烈感觉,某种诱人的想法在迷雾中召唤着我。
当我的注意力从试图理解现在的事物转移到追逐可能的事物时,我就会把这种存在方式与设计联系起来。
作为设计学科的思想工具
自然科学关注的是事物如何存在。......另一方面,设计关注的是事物应该是怎样的,是设计人工制品来实现目标。
—— Herb Simon, The Sciences of the Artificial
计算机化的电子表格是一件多么令人吃惊的事情。核心的创新是,一个单元格不仅可以包含一个值,还可以包含一个引用其他单元格值的表达式,它体现在一个新的原始抽象概念中:「公式单元格」。重要的是,除了它们的值可以自动计算外,这些公式单元格的行为与其他单元格一样。公式单元整齐地组成了一个更大的整体,这个整体已经被多年的使用巧妙地调整过了。
发明这样的东西是什么感觉?很明显,我不是 Dan Bricklin;我没有发明过像 VisiCalc 那样的东西。但我已经尝到了这种经验的滋味。
对我来说,这感觉就像用手指在现实的接缝上描画,围绕着一个问题空间的边缘。在我的另一只手上,我正在摆弄一袋拼图,其中一些拼图的形状与现实中的接缝部分相符。我开始收集可能适合的碎片,这样或那样地旋转它们,结合并有时重塑它们的边缘,直到突然出现一种「咔嚓」声。一些拼图的碎片在现实的接缝处卡住了位置。现在我看到一个新的整体,那里曾经只有部分。现在我更清楚地看到现实的接缝,我可以创造一个更好的配合。现在我以一种新的方式瞥见我的拼图碎片,我看到如何使用它们来达到这里的这个更大的接缝。现在我观察到接缝与人工制品的边缘产生共鸣,我看到如何利用振荡的模式来玩。我开始和谐起来。
在 Bricklin 的案例中,我可以想象一些可能在起作用的拼图。我可以想象把它们放在我的手里。同象性。符号参考。链接表示。矩阵编程。后期绑定。等等。那感觉一定很特别。
当我在类似这样的原语上创造时,我感受到的主要动力是一种创造可能性的感觉。理解是其中的一部分,也是重要的;大的进步往往来自于更深刻的理解。但是,在这些时刻,理解的冲动感觉次要于更广泛的创造过程,即实现可能实现的东西。有时候我觉得我不是在创造,而是在发现。我看到一个图像突然从魔眼的渲染中跳了出来。原理它一直就藏在在众目睽睽之下!
设计的进步来自于发明新原语,找到结合旧原语的新方法,发现应用它们的新地方,等等。增长感觉就像是模式、原则和方法的积累。我们可能偶尔会找到统一的原则和框架,但它们永远是偶然的。我们永远不会「触底」,因为问题和它们的解决方案是无止境的。
那么,集体的进步看起来就是有效地分享这种积累。一些新的模式(关于协调 Mechanical Turks 的想法?)将只适用于少数从业者。但许多模式至少会在许多领域中部分相关。直接操作、链接表示、复制和粘贴以及菜单就是很好的例子。最近影响广泛的原语包括「多人」编辑可供性、越来越可靠的语音到文本的交互,以及,是的,上下文的反向链接。在外围,有更多脆弱的想法——计算原语的普遍金融化;机器学习生成的媒体;等等——最终可能成为重要的拼图。
这种设计能成为一门科学,一门设计科学吗?Simon 认为这将需要「一套关于设计过程的智力上强硬的、分析性的、部分可形式化的、部分经验性的、可教的学说」。如果我们有这样的东西,在搜索空间中行走可能会感觉更像遵循 GPS 的指示,而不像在雾中蹒跚而行。当然,许多人已经试图以这种方式将设计过程正规化。我没有深入阅读过这些文献,但我对此持悲观态度。至少在不久的将来,我认为思想工具中的创新设计理念将继续需要一个由聪明才智、运气和毅力组成的模糊过程。
至少对我来说,进步还需要一种表达性的渴望。
作为艺术场景的思想工具
每一幅带着感情描绘的肖像画都是艺术家的肖像画,而不是坐着的人的肖像画。模特只是个意外,一个机会。画家所揭示的不是模特;画家只是在彩色的画布上展示自己。
——奥斯卡·王尔德,《道林·格雷的画像》
当今设计领域的主流方法论是「以人为中心的设计」。简化地说,在这个框架中,设计师首先要沉浸在潜在用户的世界中,试图理解他们的价值观、目标、挑战和障碍。然后,通常在用户的直接参与下,设计者反复地创造出将解决用户问题的产品。
这是一个创造产品和解决问题的非常有效的方法。但是,除其他限制外,我认为它缺少了一些对许多最具变革性的思想工具至关重要的东西:对世界应该是怎样的,什么是美丽的,什么是值得强化的,有一个强有力的视角。
「梦想机器」是一个有说服力的标题。Ted Nelson 有一个梦想,那就是计算机对个人的创造力和自由意味着什么。这并不是「设计思维」。Alan Kay 的大部分工作都是由一种几乎是精神上的信念所驱动的,那就是年轻的孩子们被浪费的创造潜力。考虑一下他的衡量标准:「有些人用答案正确率/测试或考试通过率/年来衡量进步,而我们对西斯廷教堂-天花板/寿命更感兴趣。」
Bret Victor 坚信我们必须使计算摆脱「小黑板」的束缚。对此有解决问题的解释,但在我看来,它们显然不是这种驱动力的幕后推手。Bret 不想将计算实体化,因为屏幕太小,会伤到眼睛,并且具身认知的带宽更高。这是因为他认为在这个世界上,与我们的身体在一起,彼此在一起,是人性化的和美丽的,是事情应该有的样子。他把这种动力描述为「一种渴望」。
像这样的渴望有时也是我工作的动力。Orbit 可以说是一种保留你所学知识的工具。所有其他记忆系统都是这么做的。但这不是我对它的看法。让我兴奋的是更深入地汲取思想的感觉,以及在形成一种持续共鸣的过程中得到支持的感觉。在某种非常真实的意义上,这个项目表达了我想与知识建立联系的一种方式。
我刚才描述的这种冲动与我在设计时感受到的可能性,或在进行分析时感受到的对理解的渴望完全不同。它更像是一种表现我认为美好的事物的愿望。它是个人的,特立独行的。它反映了我的目标。
当这种驱动力占主导地位时,我觉得我在创作一种艺术。
现在在「思想工具」附近进行的许多最有趣的工作至少部分是由这种艺术表达驱动的。Omar Rizwan 的作品始终反映了他强烈而不寻常的审美观。Ink and Switch 围绕本地优先计算的项目在我看来既关乎艺术表达,也关乎问题解决。Sprout 反映了它的创造者认为协作应该是什么感觉。在 Gentle 中,我看到了 Rob 对口述的一贯尊重。在 Cuttle 中,我看到 Toby 对工艺在当代所扮演角色的阐述。
总体而言,这个现代群体和计算先驱们都表达了一致的渴望:计算的强大力量可以从集中制表的米黄色世界中挣脱出来,转而投入到人类规模的形式中,在那里它将改变我们的思维和行为,无论是个人还是集体。这不是一个设计声明。它当然也不是科学声明。它更像是一份宣言。
如果我们把思想工具看作一个艺术「场景」,我认为集体的进步来自于具有启发、指导和重新定义的超越性工作。发明原理的十周年纪念日即将到来。也许我们终于该得到另一个具有这般启示性的贡献了?
作为匠心实践的思想工具
Vi Hart 和 Bret Victor 都像这样:一部分时间是疯子,另一部分时间对细节的关注达到了痴迷者的水平。这就像米开朗基罗:首先他必须想象把什么东西画在西斯廷教堂的天花板上,但他也亲自花了四年时间,仰面躺在床上,蜡烛蜡滴入他的眼睛,画出这该死的东西。这是最简单的秘诀:找到米开朗基罗。
——Alan Kay
还有一个冲动经常影响我的实践,我不太确定它的适当作用。
作为铺垫,我想讲一个我没有公开分享过的故事,关于我在苹果的第一个星期。我当时刚从大学毕业,加入了 UIKit,这个技术团队负责 iPhone 和 iPad 的用户界面和「应用程序」结构。当时(iOS 3),这是一个约有八人的团队。最年轻的成员至少比我大 10 岁。我觉得自己有点格格不入,因此,当我不得不问起每个人桌子上的小黑物件时,我有点羞愧。
「哦,那是一个珠宝商的放大镜。我们用它来观察像素。」
这句话把我击倒在地。这是个荒谬的答案。我的整个年轻生活都是和软件人员一起度过的,我从来没有见过一个有珠宝商的放大镜的人。然而,这显然也是正确的。这是一个有力的象征,表明那里的人重视什么。事实上,这些放大镜非常实用!而且,在我工作的头几周,我发现一个需要解决的小问题:一种特定的按钮的边缘是「模糊的」。我看了看。我看不出他们在说什么。我用放大镜看,然后我看到了。直线边缘似乎被反锯齿到邻近的像素中。我把放大镜拿开,我无法不看到它。
这个放大镜是我在苹果公司整个经历的代名词。多年来,同样的故事一再发生——在触摸互动、动画、概念模型方面。每一次我的同事眼中的毛刺起初都是我看不到的;每一次我都被帮助看到了;而每一次我都不能再不看到。我离开了苹果公司,但被灌输的对工匠精神的痴迷却没有离开我。
这种冲动感觉不同于理解的动力,也不同于机会感,更不同于表达的渴望。它给人的感觉是一种想要亲自体现一种完美的强烈欲望。它给人的感觉像是对精雕细琢的事物的一种仪式性的尊重。而且,由于我很少能达到这种心态所要求的崇高境界,它常常令人沮丧。
我不知道该如何看待这种冲动。
在我看来,很明显,学术界的人机交互会获益于工匠精神的注入。对一些新的界面进行精心的评估性研究是荒谬的,这些界面的操作如此草率,以至于基本没人会在研究之外自愿使用。然而,这正是在该领域最重要的会议上发表的大多数系统论文的情况。
有时候,要在这个空间中表达一个想法,工匠精神是必不可少的。The Mother of All Demos 是一个有远见的设计作品,但在当时,要在旧金山的舞台上实现实时表演,需要登峰造极的技术工艺。今天的 Dynamicland 也是如此。
这里的另一个因素是,现实中的细节多得令人吃惊。基本设计元素和工匠精神之间的界限往往并不清晰。当 Xerox PARC 的人在 Bravo(第一个所见即所得的文字处理器)中加入比例宽度的字体时,那是设计方案中不可分割的一部分,还是为了使有限的东西更加完美的冲动?当我纠结于间隔重复卡片的轻盈感时,那会感觉像是在打磨边缘,但我怀疑这实际上是一个「承重」的设计元素。
工匠精神的冲动之所以有用,另一个原因是,只有当用户把一个系统作为他们生活的一部分,并且用它来做一些对他们来说真正重要的事情,许多见解才能达到。没有人愿意用一个垃圾来做任何重要的事情。因此,一个精心设计的系统有可能让更多的人参与到真实的环境中,从而产生更多的洞察力。
更直白地说,工匠精神有助于吸引注意力。它使一个人的作品更清晰易读,更具吸引力。我不认为这是一个非常重要的事情,但它值得考虑。
从侧面看,我认为这种冲动在我身上可能过于强烈。我经常会花一个下午的时间来打磨一个我很快就会放弃的互动的细节。这样做有一定的必要性,但我怀疑我经常可以用更少的时间来处理。
总而言之,我的直觉是,工匠精神通常不是这个领域里的非常重要的事情或进步的瓶颈,而只是一些中等程度的门槛。我认为,出于上述原因,在这个领域的从业者中培养工匠精神传统是有价值的,但我不确定通过工匠精神作为主要动力来实现集体进步意味着什么。
协调这些力量
我不认为我能忍受这些冲动中的任何一种。它们似乎都以各自的方式对我的实践至关重要。
至少对我来说,设计是最持续有力的镜头。进步取决于大胆的、富有想象力的想法,即如何塑造一个抽象概念,使其与现实的缝隙共舞。这些新的人工制品在创造和改进过程中都通常依赖于深刻的理解。而最有趣的艺术品往往表达了一些个人的渴望,而不仅仅是为了达到目的。也许在这个框架中,工匠精神最好被理解为迭代设计过程的一个元素,我对此不太确定。
同样地,我认为我们集体进步的最佳模式看起来不像一个科学领域,而更像一个设计学科。我们已经建立在大量共享的模式、原则和方法的集合之上。有时我们也可以建立在相关领域的经验知识和理论上。这些都加速了我们的工作,但每个项目都必须是量身定制的。创建新的抽象概念没有公式可循。进展将继续需要创意巧思的闪电一击。
————————
祝大家新年快乐。回顾这一年——我可能会在未来几周内做更多的工作——我有点不知所措,因为以我所拥有的自由追求我的工作是多么奇怪和美妙。这是一个令人难以置信的特权,而且是你们每个人使之成为可能。在这种情况下,我想很容易感到自己是一大群人中的一个小角色。象征性的一滴水,就像一个人对总统的投票。但实际上,你们只有几百个人!你们——你们亲自——扮演着重要的角色。你——你亲自——在我能够做我所做的工作中发挥了令人惊讶的重要作用。谢谢你们。
还有一些具体的感谢。我感谢 Michael Nielsen 向我介绍了设计科学的概念,并影响了我对科学在界面发明中的作用的思考;感谢 Bret Victor 的电子邮件交流,它促使我更努力地思考这个问题;感谢 Kanjun Qiu 对这里的「科学」和「设计」驱动力之间的区别的有益讨论。
自上而下,再自下而上
原文:Square Signals : Top to bottom; bottom to top (andymatuschak.org)
我得提醒你一下:人类现在可以把机器人送到火星。我们现在能到做这样的事!在延续了几代人的认识论革命的基础上,我们不断累积和拓展,创造新的奇迹,乃至于获得了这样荒谬的能力。
我喜欢想象这种进步背后的抽象之塔。你若仔细看,会发现支撑它的是一个惊人(且并不完全令人放心)的交错结构。火箭技术依赖于化学工程和相对论,但与药理学无关;而流感疫苗则依赖于化学工程和药理学,却与相对论无直接关系。
现在,我们可以在这个塔的任意位置上研究同样的数据或问题。举个有趣的例子:你的头发为什么是这个颜色?是因为你有表达这种性状的基因!或者……是因为表达了这种基因的细胞内机制?是因为那些驱动机制运作的电化学原理吗?还是因为光学?或是因为那些影响了偏好这一基因的交配习性的文化譬喻?
有一种观点认为,通过将复杂的系统分解成基本组分,观察者可以达到最好的理解,直到她碰到公理,这些公理即是真理的所在(也许只是暂时)。这种方法有时被称为还原论(reductionism)。这个词还有其他截然不同的定义,但此处我指的是这个意思。(译注:reductionism 一词,我在字典里查到的是这个意思:「an attempt or a tendency to explain complex phenomena or structures by relatively simple principles, as by asserting that life processes or mental acts are instances of chemical and physical laws – often used to show disapproval 还原论:用相对简单的原理解释复杂现象或结构的企图或趋势,这种理论认为生命过程或思维活动是遵循物理和化学法则的[通常为贬义]」)
与此同时,也有人觉得,对于很多复杂系统,其组分细节只是噪音:真正的意义只在最高层次上涌现。特别是在谈及人类的意识和自由意志时,这种看法尤为可信。毕竟,谁愿意从永恒翻涌却又结局注定的化学反应的角度看待自己呢?我把这种观点叫做整体论(holism)。当然,这词也有其他的意思。
上图出自 Douglas Hofstadter 的《哥德尔、艾舍尔、巴赫》的「蚂蚁赋格」。里头的字母是用其他字母组成的。从最宏观的层面,我们看到的是「MU」。「M」由「HOLISM」三次叠加构成;「U」则由「REDUCTIONISM」构成。而「HOLISM」里的每个字都由「REDUCTIONISM」构成,反之亦然。更有意思(但从这张缩略图看不出来)的是,图里最小的字母,实际上都是由不断重复的「MU」组成的。
这个图的每一个层次都在传递信息。如果你只是简单地使用还原论,分解每一部分,或者像整体论建议的,站得远远的看,你只能看到「MU」。而在汉字中,「無」意味着虚无,常常带有精神层面的意味。
虽然并非不能从这两个视角出发去辨别中间层的单词,但这样并不高效!单独观察每一个抽象层都会给我们带来新颖的观点和理解。我认为,对于任意复杂的问题研究来说,情况也都是如此。
那么,怎样才能独立地探索每个层次呢?简单来说,就是我们大体上应该如何培养专业技能——如何学习一个复杂领域的各个方面?
教育中的一个关键问题是,学生的目标常常是整体的。例如,她想学习如何制造机器人,但可能并不想费功夫理解能使机器人动起来所需的伺服驱动和传感器知识,而这依赖于电子工程,电子工程又依赖于物理学的复杂分析。
这里有两个隐患。首先,最明显的一点:如果该学生只是玩玩预制的马达和部件(而不去理解或思考它们的构成原理),那她组装它们的能力将大大受限,而且会不断地遇到难以诊断和解决的问题。
第二个隐患更隐秘:这种简单(而偏重实践?)的整体学习方式看似一时行得通。但一两年后,等到她真正碰到认知视野的「天花板」后,在继续前进时,她可能会面临巨大的心理障碍。这时,她必须摒弃狭隘观念,谦虚地面对她原本认为已经理解的领域,耐心地——暂时!——以更缓慢的速度向她表面上的目标前行。
但如果她选择从基础开始构建理解之塔,依着还原论一步一个脚印地学,久而久之枯燥可能会胜过理想,一开始的动力也可能会慢慢消退。
我建议采取一种混合的方法:通过自上而下的探索激发学习动力和直觉,同时通过自下而上的攀登来加固理解,以及获取至关重要的普遍了解。关键是,她可以将底层知识与在经验中观察到的涌现行为联系起来,在自身经验的背景下研究它们,从而使底层知识能够作为根据,激发学习动力。
有的学校针对物理系学生和工程系学生开设不同的物理课。但大多数时候,工程系的物理课只是删减了概念,跳过了大量材料,并忽略了推导过程,而不是带给学生真实的情境体验。
考虑到这点,个性化教育的巨大优势不止在于能随着学生的进展和既往经验调整节奏,更在于能让学生对那些平时易被忽视的关键基础知识产生兴趣。
给你讲个我自己的故事。在加州理工,我主修计算机科学,但实际上却有两年时间都在忙着学习数学、物理、化学、生物、天文,甚至包括做实验——这就是规矩!不论什么专业的学生,都得修这些核心课:就算你主修历史,也得学习统计热力学。
当时,这种情况带给了我极大的痛苦。我感觉是在浪费时间,也就没怎么认真对待这些学习材料。我本该大一就弄懂线性代数的,但我没有。后来我去自学机器学习,学了几年貌似还挺顺,却突然碰壁,那时候我才发现这个问题。
于是,我又回头在真实的情境中重学线性代数。这回,我认真了起来,东西也记得牢了。我明白了这些抽象概念的实际应用,所以一切都说得通了。这次学习经历很不错,让我在几年后能够(一时心血来潮)大幅改进了 iOS 的 3D「翻页」效果,使其更准确地追踪用户的手指移动。
在物理、化学和生物课上,我也有过相似的体验。这些课程只是达到目的的手段,但直到目的近在眼前,我才真正领悟了它们的主题内容,并以此为基础进行建构。
在我的记忆系统研究中通过亲密性产生影响
原文:Towards impact through intimacy in my memory system research | Patreon 上的 Andy Matuschak
反思我自己在助记媒介方面的工作,我注意到:在问题的广度和规模上,我取得了很好的进展,但在更重要的深度和影响方面上还远远不够。这并不是因为我缺乏尝试——对于后者的尝试,我总是以失败告终。但如今,我想明白了其中的原因,至少是想到可能的解决方法。在新的一年里,我想积极地重新调整我的工作方向,专注于这个核心问题:「如何建立一个更强大的记忆系统,可以让人们对复杂的概念材料轻松建立深入、灵活且持久的理解?」
在这篇文章中,我将阐述现状,并描述我应对的最佳见解。除了帮助自己理解,我的目标是为与其他人的对话创造一个良好的背景,这些人可以帮助我改进计划。关于这里讨论的问题,我仍对其中不少观点感到困惑,所以这应该被理解为一个过渡性质的临时讨论,但我希望它是一个通往更好道路的有用讨论。
我对记忆系统如此感兴趣的原因
因为这是一篇关于我进展偏离目标的文章,所以仔细重新阐述驱使我来到这里的志向是值得的。
我花了近十年的时间探索如何使用计算机(特别是动态媒介)来创建高增长环境。我做过关于微观世界中的探索性学习、计算机支持的协作学习、掌握学习、基于机器学习的个性化学习等项目。但是,我的个人记忆系统经历非常生动,以至于我花了多年时间研究的其他机制相比之下显得微不足道。记忆系统让我产生一种强烈的眩晕感。我觉得自己像一个穴居人,偶然发现了一个装满简单机械的盒子。我可能不理解机械优势的原理,但即使是原始的摸索也能产生惊人的效果!
如今的记忆系统是一种小众的工具,主要用于记忆词汇和简单的事实。这些应用本身并不那么吸引人,但一些专家用户发现了一些巧妙的方法,可以将它们应用得更加广泛,支持许多种思考。举几个不寻常的例子,我用记忆系统来增强创造性的洞察力,和消化有意义的经历。不过,在这篇文章中,我们将重点关注影响最直接感受到变革的地方:理解困难的概念性材料。
当我使用记忆系统阅读书籍或陌生主题的论文时——一切都进行得很顺利——我感觉到一种异样的轻盈。我可能仍然会对这些想法感到困惑,但是有一种内化的确定性:我可以开拓出真正可靠的立足点;我可以不断积累,直到我满足自己的理解需求;几个月后,我可以长时间记住这些知识。这种感觉与我以前学习新主题的经历完全不同。
我想起了从模拟计算机到数字计算机的转变。当组件积累错误时,就会有一种无处不在的脆弱感——随着系统规模的扩大,其复杂度会急剧上升。通过纠正每个组件内的错误,你可以组装出可靠的系统,而不会产生压力。这不是一个完美的比喻。理解不是二元的;我并不是说所有的思想都必须是「无误的」。但我毫不怀疑,这种「整流器」让我能够学习更多、更深入、更广泛的知识。
有了这样的赞誉,人们可能会想象记忆系统只需要被普及、「扩展」、去掉粗糙的边缘。但是记忆系统并没有被很多人使用,是有个中缘由的。在我看来,最重要的问题是,我刚才描述的事情——用它们来加强任意的材料——是很难做到的。人们必须发展一种专业技能才能做到这一点;我花了几年的时间积累了各种策略,将不同种类的想法消化成记忆系统卡片。此外,仅仅帮助读者发展这些技能是不够的。即使对我来说,写这些卡片也需要花费太多的时间和精力,以至于它只涵盖了一部分我觉得有意义的知识。更糟糕的是,对于不熟悉的材料,要很好地使用记忆系统尤为困难——当然,这正是记忆系统最有用的时候。作为一个外行,我的卡片往往强调错误的元素,或错失了重点,或没有编码足够的联系来支持丰富的理解。
我之所以对助记媒介感到兴奋,是因为它是通往更强大的记忆系统的途径
编写卡片涉及到「有成效的努力」,我相信它能有效地帮助我们深入理解。有时候,没有办法绕过这项工作:我许多有价值的卡片就是把个人经验联系起来。然而,我相信我们可以用更低的成本做更多的事情。现在的记忆系统「让记忆成为一种选择」——但这是一种在中等成本/高收益和零成本/零收益之间的严峻选择。我们可以设计一些提供中间点的系统。更重要的是,我相信我们还远没有达到「有效边界」。所以我们既可以降低成本,又可以大幅提高收益。
理想情况下,当我学习新的知识时,这些知识的丰富表征会不断地被编码到我的记忆系统中。这个系统不仅帮助我可靠地记住我所学的东西,而且随着时间的推移,它实际上还加深了我对材料的理解。整个过程自然地融入到我的智力生活中,负担如此之小,以至于它可以广泛地应用各种场景。这种理想可能是遥不可及的,但如果我们能够做出接近这种理想的东西,很难想象这样一个系统不会「改变文明的思维模式」。
这里有一个值得尝试的方法,即让专家创建并分享关于各种主题的记忆系统卡片。很多人都尝试过。共享卡片似乎对于词汇和简单的事实有一定的效果,但对于更具概念性的材料则不太有效。当我尝试这些卡片集合时,我发现我可以机械地回答卡片,但我的理解非常脆弱——例如,我很难向朋友解释这些材料。在用户访谈中,其他用户也一致陈述了类似的问题。
相比之下,当我把一篇写得很好的解释消化成自己的记忆系统卡片时,我的理解就不那么脆弱了。我敢肯定,其中一个原因是:写卡片会迫使我更多地思考材料。但我注意到,当我练习这些卡片时,我经常会回想起叙述中相关的段落。孤立的卡片(至少部分地)被锚定在一个更加广泛、更为紧密联系的背景中。而那个更丰富的背景,也会也让我在复习时更有情感投入。
这就是我对记忆媒介感到兴奋的原因。如果我们把专家写的卡片和解释性的叙述结合起来,也许可以让读者更容易理解和记住材料。这种策略可以让我们更接近我之前描述的理想。
在实践中,我们可能会担心:当专家,而不是读者,写这些卡片时,我们牺牲了多少理解和联系?采访表明,读者很少在使用卡片时感觉到不稳定和疏远,而我从使用下载的记忆系统牌组的用户那里经常听到这样的反馈。但我需要更好地理解这种权衡,并在我力所能及的地方改进它。
除了它的实际效果之外,助记媒介还有可能成为一个强大的实验室,用来探索这一课题:「我们如何能够建立更好的记忆系统?」
这里有一个简单的例子。如果你在读完一本书后的几周内,不仅要回忆你学到的内容,还要在一些简单的练习题中应用这些内容,而这些练习题是你以前没有见过的,那么随着时间的推移,它可能会帮助你加深对知识的理解吗?你为自己设计这样的练习题可能会很困难。即使你能写出好的练习题,但关键是要把知识应用到一个新颖的情境中。而助记媒介提供了一种自然的方式,让一个人可以创作这样的材料,而另一个人可以用全新的眼光来使用它。
助记媒介也使得迭代实验变得更加容易。例如,设计者可以在他们创作的材料中,只针对某些主题包含这些新的练习题,然后比较读者对这些概念和其他概念,理解程度的增长情况。如果设计者学到了一些新的东西,他们可以对系统进行迭代,观察这些的改变对新读者有什么影响。
我有很多想要探索的改进想法,和想要回答的问题——有些是关于认知和效果的,有些是关于情感和感觉的。理想情况下,助记媒介应该支持快速的迭代周期,以实现一个更好的记忆系统。但我写这篇文章,是因为我还没有能够创造出一个合适的环境,来迭代最重要的问题。事实上,「量子国度」的第四篇文章实现了我刚刚描述的「练习题」的想法——而我还没有能够理解它的影响,完全没有。
尽力深化
在过去的两年里,我大部分的进步都是在解决与助记媒介的概念设计相关的问题。也就是说:使用专家编写的记忆系统卡片,以及将记忆系统嵌入到不同类型的文本和不同情境中的问题。这是好的,也是必要的!这些问题是这个想法的核心,必须解决它们才能让这种媒介发挥作用。
但是,当我在这方面取得了更多的进步时,我也陷入了解决越来越边缘的问题的困境——让这种媒介适用于普通人,在日常环境中使用。我偏离了我的核心目标:「如何建立一个更强大的记忆系统,可以让人们对复杂的概念材料轻松建立深入、灵活且持久的理解?」
更糟的是,我无法告诉你今天的助记媒介已经做得有多好。我已经进行了很多关于读者回忆嵌入卡片的实验,但我对媒介如何影响实际重要的东西——他们理解的深度、利用知识的能力知之甚少。
通过与大学教授和课程讲师的合作,我曾试图创造一个环境,观察我的设计对后续实验的影响。但是我没有从这些实验中学到很多。很少有学生对深入理解材料感兴趣;不仅是记忆系统,而且整个课程都参与度很低。
即使没有这些问题,我现在也认为我之前的实验方法是错误的。我以前是用统计测试的思维,试图测量记忆系统的性能和下游表现之间的因果关系。但我现在需要的不是统计效力,而是「亲密性」——一个关于读者理解如何与记忆系统协同发展的详细而生动的画面。我宁愿与少数几个认真的测试读者建立紧密的关系,也不愿做一个只能报告表现数值变化的高效实验。后者在后期的优化和验证时会有用,但它不是驱动早期、开放式设计决策——即确定正确的基本原语——的正确数据。
我以为我的课程合作会面临的麻烦是流失率让我的样本量太小。但真正的问题是「这些情境没有建立起我和我的测试读者之间正确的关系」。在这些课程中,积极参与的学生很少,他们对记忆系统的反馈也只是偶尔敷衍了事。这是可以理解的:他们报名参加的不是这个!这是一个额外的负担。即使他们更愿意帮助我,这些学生通常只是想「混过」这门课。我没法从一个不尝试深入理解的人那里,有效地学习记忆系统对理解深度的影响。
相比之下,我理想中的测试读者会非常认真地深入理解材料。他们会对系统非常挑剔,最好像是系统的合作者一样。他们会在系统的边缘挑战,并创造性地为自己的目的利用它。他们会乐意面对困难的挑战,主动地寻找自己理解中的薄弱点。
这里有一个重要的区别需要认识到——这个区别对于典型的硅谷做法来说是很陌生的。对,没错,一个理想的系统也能满足那些浅尝辄止的人的需求。但这并不意味着他们是帮助发明这个系统的合适人选。当这个系统已经能够在最理想的情境中产生巨大的效果时,就可以借助那些要求不高的人的反馈来改进和优化它,让它能够适应更多的情境和人群。如果想要让一个有潜力但尚未成熟的系统变得拥有惊人的颠覆性,那么这些反馈是错误的推动力,除非这个系统本身就是基于社会互动和合作的设计。
为了找到一个具有最高潜力的系统形式,我想要为(且与)有高要求的专家,在困难的情境中设计。我想要一种紧密的合作关系,而不是一种疏远的「供应商」关系。
勾勒出前进的道路
现在我已经阐述了这个愿望——这种从广度到深度的转变——我应该如何实际地实现它呢?我的主要想法是与一小群人密切合作,他们试图借助一个记忆系统,深入理解一个他们非常感兴趣的话题。我会选择那些已经是目前记忆系统的专业实践者,或那些对于未来更好的记忆系统感到兴奋,并愿意一起合作开发的人。我的目标是形成一个亲密、细致的读者认知和情感体验的画面——然后用它来驱动实践出洞见的循环。
我想尝试的一些具体做法:
-
个人的「记忆仙子」 :我跟着我的合作者走,把他们阅读清单上的下一篇文章改编成助记媒介——这部分模拟了一个未来的理想状态,即这些助记功能是无处不在且毫不费力的。每一篇改编的文章都可以包含一个或多个要测试的新想法(无论是在系统层面还是在内容层面)。
-
小组课程 :教一门我很擅长但又困难的小组课程。创建或改编教材,使用助记媒介和其他看起来最有用的增强功能。重复教这门课程几次,每次都尝试新的想法,并用前一次的经验改进教学方法。
-
记忆教练:帮助我的合作者更好地使用现有的记忆系统。我们会定期地见面,回顾他们写的材料,讨论这些材料对他们的效果如何。我会帮助他们克服障碍,提出改进的建议。作为一个专业用户,我的目的是对我的原则施加压力;这应该能帮助我测试和提炼我的方法,理想情况下还能开发出更好的方法。此外,这种做法会帮助我关注记忆系统在实际使用中的效果和体验,而不总是为了设计新的记忆系统。
我不是想在这里建立复杂的统计评估,或者做出可以推广到大规模人群的严谨的结论。我在寻找一些在质和量上有明显差异或变化的结果——它可能暗示着我可以利用的变革力量,也可能暗示着可以削除的障碍。这里的主题是小样本的、定制的、细节优于泛化的、探索优于验证的。
为了达到这个目的,我会专注于讨论和日记,我会要求我的合作者在阅读和练习的时候做记录。我们想要记录那些时刻,即当:感觉理解不稳固、脆弱或机械;思维显得迟钝;读者正在查找资料;读者感到无聊、勉强或不自在。但也要记录那些时刻,即当:出乎意料的轻松、快速、自信、联系或兴奋。用新学到的知识的感觉如何——在创造性的工作、在社交场合、在个人反思中?向别人解释这些想法的感觉如何,学习后续的材料的感觉如何,解决问题的感觉如何?
作为一个附加目标,我自己也想要更多地使用助记媒介。我对记忆系统的理解,很大程度上来自于多年的创作和研究。这些经历帮助我更细致地了解记忆系统。但是我没有亲自用助记媒介来学习困难的材料。因为这样做是非常困难的,因为我通常是制作助记媒介的人,而不是使用助记媒介的人!
我最接近的一次是在开发量子国度的时候,但我太分心于修复系统的早期问题,没有足够的注意力放在自己的学习过程上。更重要的是,我没有强烈的动力去深入了解量子计算。没有任何需要用到量子计算的问题、项目或社会环境挑战我的知识,所以我不知道它有多可靠。
我很久以前就停止复习量子国度的材料了,主要是因为它没有和我的常规记忆系统结合起来。时间过去了足够长,我可能可以通过重新学习量子国度来学到很多关于助记媒介的东西,也许还可以手里拿着一个我感兴趣的项目。但这有点本末倒置。在一个我已经有了深入理解的需求的领域,追求这种经验会更好。
我想找一个既懂记忆系统又懂相关领域的专家,改编一本我感兴趣的教科书,以供我自己学习。但仅用这种方法来对记忆系统本身进行结构性改变是很困难的:我需要提供新的功能,然后让别人来好好利用它。不过,我觉得如果我能更深入地了解和运用这种媒介,而且还能和其他使用者密切合作,我一定会受益匪浅。
————————
所以:我错过什么更好的方法?我忽略了哪些关键考虑因素?我的前提在哪里有缺陷?
我没有详细说明实验设计的具体细节。我可能会遇到什么潜在的陷阱?为什么我可能会发现自己看不到我需要看到的东西?
————————
这篇文章直接来源于我和 Michael Nielsen 的一系列对话,其中很多思想都归功于他。我特别感谢 Michael 提出的一些重要观点,比如我陷入规模问题、强调小样本方法以及记忆教练的想法。
我还要感谢 Rob Ochshorn , Joe Edelman 和 Joël Franusic 精辟的意见。
迈向可规模化的闪念培养
原文:Towards scalable blip cultivation | Patreon
11 月 1 日
我正在与朋友 Taylor Rogalski 合作开发一个实验性的智能注意力管理系统。由于项目仍处于早期阶段,此时与其展示具体的界面截图和原型,我更想分享我们在整体概念设计层面的一些思考。
问题所在
我的生活中常常闪现出各种值得关注但疏于照管的灵感(闪念)。这些闪念需要持续的关注才能开花结果,但它们又难以简单地归入待办清单或既有的创作流程中。因此,这些可贵的闪念往往就这样被遗忘了。举个例子:
-
**疑问:**在重温 Bret Victor 的「基于原则的发明」演讲时,我不禁深思:在我践行「基于原则的发明」这一理念的过程中,这些指导原则究竟应该是什么?
-
引用: 在一次散步闲谈中,Gena Gorlin 向我提及,心理学领域的「行为改变阶段理论」可能对我正在研究的穿越时间的文本有重要的启发意义。
-
**见解:**在写日记时,我察觉到自己一直潜意识里认为:要成就非凡的事业,必须怀有坚定的信念和宏大的愿景。然而我的朋友 Rob Ochshorn 却始终保持着轻松愉快、随性自在的态度,而他的表现总能给我带来启发。这让我明白,在工作中保持更多的趣味性和活力,或许也是一条可行之路。
-
**想法:**在与 Matthew Siu 探讨 Rewind 这类持续屏幕录制工具的应用场景时,我们迸发出一个想法:开发一个新功能按钮,可以回放显示任何浏览器标签页被打开前的那个时刻,让用户能够追溯到「这个页面最初是从何处打开的」。
-
**探索:**我曾几次偶然访问绘画教学网站 drawabox.com。每次浏览都有相似的感受:网站的内容很吸引人,但课程体系过于庞大,让人望而生畏。我总是难以找到一个合适的方式开启这段学习之旅。
-
**愿景:**我希望能找到一个固定的场合,与富有才华的同好一起合唱和声,但我不想参加正式演出,也不想排练固定的曲目——只希望每次相聚时都能一起探索演绎新的音乐。
我很清楚,如果只是把这些闪念添加到待办事项清单中,它们多半会被遗忘。虽然投入深度的创造性思考可能会让这些闪念得到发展,但这种珍贵的注意力资源往往已经被占用在那些更系统化的项目中了。
问题的关键在于,我常常难以判断这些闪念对我究竟有多重要。比如「研究改变阶段理论」这样匆匆记下的想法,目前看来似乎意义不大,所以我不太愿意投入深入思考。但我又对这个想法缺乏足够了解,不能贸然将其抛弃。如果稍加关注,它可能会变得意义非凡。就这样,它陷入了一个令人困扰的模糊地带。
更令人困扰的是,这些闪念中,许多都不是你能够一次专注就能完成的事情。比如说「探索自己的人生原则」,或是「学着以轻松的心态生活」,亦或是「尝试在 drawabox.com 上学习绘画」,都需要在漫长的时间里反复投入和探索。然而,要有条不紊地分配注意力,持续关注这些事情,却实在不是一件容易的事。
总的来说,这些闪念之所以难以处理,主要在于它们通常:
-
缺乏明确的下一步
-
需要调动创造性思维
-
难以判断其重要程度
-
当下似乎无关紧要,但在未来某个情境中可能变得重要
-
无法一次解决
在注意力管理方面,我确实掌握了一些行之有效的方法:我懂得如何专注于大型创意项目,也知道如何维持日常习惯和兴趣。但这些能力究竟源自何处?在我看来,它们往往源自于我们刚才讨论的那些闪念——一个想法、一个疑问、一个引用,或是一份愿景。然而,这个发展过程却相当随机。只有当这些闪念来得足够清晰,或是恰好遇到一段空闲时间,又或是反复出现多次时,它们才有可能发展成真实的成果。否则,它们就会被不经意间遗落,而这种遗落并非出于我的主动选择。这一切总让我感到失落。
这让我想到了间隔重复记忆系统,它很好地解决了记忆过程中的随机性问题。一旦我将某个内容输入到记忆系统中,它的记忆就不再依赖于偶然因素。我能够非常有把握地确保自己会记住这些内容。同样地,对于那些界定明确的具体任务,采用「GTD(Getting Things Done)」这类管理系统,(通常)也能帮助我建立起确定感,不再受制于偶然因素。
那么:我们究竟该如何为这些闪念建立一个行之有效的注意力管理系统呢?
我们的解决方案
我们建议:
-
设计一个让闪念定期浮现的信息流
-
配备一些轻量级的推进方式
-
在手机刷推等放松时刻使用
-
直到你对这些闪念有了充分认识,可以着手实施或是放下它们
让我用一个例子来说明。假设我随手记录了一个想法:「研究行为改变阶段理论」。接下来会这样展开:
-
第二天,这个闪念出现在我的信息流中,系统建议我设置两分钟计时,对着麦克风分享这个想法的由来和为什么觉得它值得关注。我的讲话内容会被转成文字,整理后保存在这条记录中。
-
几天后,这个闪念重新浮现,这次配上了维基百科的理论概要和几篇相关文章。我阅读了概要和其中一篇摘要,随后发现自己对其中的干预措施特别感兴趣,尤其是这些措施如何能应用到辅助自助书籍阅读的间隔重复系统中。
-
再过几天,这个闪念又出现了,带着一份常见干预措施的列表。系统提示我标记出特别相关的内容。
-
在接下来的几周里,我会利用闲暇时间,阅读描述这些干预措施的论文片段,用语音记录下自己的观察感悟,逐渐形成对这个理论如何融入我工作的整体认识。
-
最终,当我对这个闪念有了充分的理解,觉得可以告一段落时,我就让这个闪念进入休眠期,六个月后或是当我在另一个想法中提到「穿越时间的文本」时再唤醒它。
这个例子最终以暂时搁置收场,乍看之下可能有些奇怪。但事实上,这恰恰是一个实打实的成功案例。在几周的零散时间里,我渐渐对这个理论有了充分的理解,看清了它如何与我的工作相契合,也为未来埋下了更多可能性的种子。这些积累的见解都被记录下来,可以在将来派上用场。我很清楚,一旦这个闪念变得相关,它就会重新进入我的视野,所以我可以放心地暂时将它搁置。这并不意味着它就此终结:它很可能会成为未来某个项目的关键部分。反过来说,如果我只是把它简单地加入待办清单,我怀疑上面这一切都不会发生。
让我们来看看这个系统如何应对了我们之前列出的那些闪念难题。我们曾经提到闪念会:
-
缺乏明确的下一步
- 系统会主动提供下一步的行动建议。
-
需要调动创造性思维
- 这些活动特别适合精力较低的时段,只需要短暂的创造性投入。
-
难以判断其重要程度
- 这些活动帮助我对想法有了更清晰的认识。
-
当下似乎无关紧要,但在未来某个情境中可能变得重要
-
我为未来可能需要的场景积累了笔记和见解。
-
我知道只要提到相关话题,这个闪念就会自动重现。
-
-
无法一次解决
-
虽然这个例子理论上可以一次性完成,但考虑到它的重要程度,我不会选择这样做。
-
因此,系统帮助我把这个任务自然地分散到了一段时间里。
-
对比原始的间隔重复
我此前曾试图解决这样的问题。举例来说,我开发了一个采用间隔重复理念的写作收件箱,让我能够记录下「我在探索创造怎样的原则?」这类闪念,并且可以随着时间推移多次回顾。这个想法听起来很棒。但实际运用中,我发现当这样的卡片出现时,我往往提不起兴趣去深入思考。
其中一个问题是卡片过于单调。每次看到都会想「唉,又是这个。」面对着和上次一样的空白页面,我常常无法产生任何新的想法。
另一个问题是语境缺失。在专注思考某个特定问题时,我会记录下一些想法或疑问。但这些想法常常会在我已经不再思考那个问题的时候重新浮现。这种情况下,我会感到与当初的思考状态脱节,自然也就不愿意投入思考了。
还有一个相关的最后问题是「终局处理」:当我稍微深入发展了一个想法之后,就会到达一个暂时告一段落的时期。这时我既不想继续定期查看这个想法,但又不敢简单地把笔记归档,因为我担心一旦归档就可能永远与这些想法失联了。
在我们的新系统中,两个核心理念可以帮助解决上述问题。
第一个理念是系统的阶梯式微任务设计。当一个闪念重新浮现时,系统不会简单地重复显示同样的旧卡片,而是会提供一些具体的后续行动建议,有时还会附带一些新的信息供你思考。我们尽可能为这些行动设定明确的属性:时间限制(「设定两分钟计时,然后...」)、清晰的进度指引(「让我们列出一些例子...」),以及具体的目标(「至少添加三个例子...」)。我们正在积累一个微任务模式库,并将这些模式整合成适用于不同类型闪念的行动指南。
第二个关键理念我们称之为情境化重现。当一个闪念出现在你的信息流中时,它会附带其他相关闪念的链接——这些可能是一些原本要很久以后才会出现的旧想法。有时这些相关闪念会成为推荐微任务的一部分(例如「思考它们之间的关联」)。你还可以明确指定特定主题,让暂时搁置的闪念在合适的时机重现。这些设计旨在解决前述的情境脱节和终局处理问题,它让你能够深入挖掘富有价值的思考情境,或是将某个闪念暂时搁置,直到你再次思考相关话题时再重新展现。这样做的整体效果是带来一种安全感:你能多次遇到每个闪念,并且确信它们还会再次出现。
这两个理念的实现都依赖于大语言模型的最新进展。不过,我们运用大语言模型的方式与大多数「提升生产力」的系统有着本质区别。那些系统通常致力于让大语言模型来完成任务。但实际上,大语言模型并不能真正「完成」我前面提到的那些闪念。正如 Taylor 巧妙地表述:其他系统是你在引导大语言模型,而我们的系统是让大语言模型来引导你。
下一步
Taylor 和我一直在采用经典的「“人工”智能测试(Wizard of Oz experiment)」来构建这个系统的原型:我们将闪念发送到一个专门的邮箱。然后我们互相「扮演 AI」的角色,通过回复来重现对方的闪念并设置微任务。收到邮件的一方可以通过回复来「完成」这些微任务,如此往复。这种方式产生了令人惊喜的效果!我们可以识别和复用那些未来可以整合到大语言模型流程中的模式,同时在想要尝试新方法时也能随时打破这些固有模式。
我在这里特别提到我们的方法,是因为我经常见到许多技术人员一上来就急着构建大语言模型基础设施,结果最终陷入困境。除非你的应用场景确实需要实时交互,否则在确认某个方案能真正解决问题之前就急于自动化是毫无意义的。通过人工交互来迭代优化概念设计要容易得多。当你发现某个方案效果好到让你希望突破手动操作的限制时,那才是着手引入自动化的最佳时机。
现在,我们的原型系统已经到达了这个阶段。从许多方面来看,系统的设计都取得了令人振奋的成效,它很好地推动了我们闪念的发展。但随着「数据库」规模不断扩大,加上我们希望录入更多内容,我们已经难以手动处理日益复杂的调度工作和情境关联需求。是时候开始引入一些自动化元素了。
我们还面临着大量亟待解决的概念设计难题,包括许多在本信中未曾提及的系统细节问题。尽管这些挑战让人有些不知所措,但我仍然感到无比兴奋,因为我们终于在可编程注意力(programmable attention)这片充满希望的未知领域实现了突破。
------
感谢 Taylor 在这个合作项目上的慷慨精神,以及对这篇文本的有益建议。
如果我们有了人工通用智能(AGI),还有什么东西值得学?
原文:What’s worth learning if we have AGI? | Patreon
4 月 1 日
GPT-4 最近迎来了它的一岁生日。然而,我必须承认,我仍未消化我们所生活的这个变化的世界。我经常发现自己仍在坚持那些在大语言模型(LLM)出现之前形成的计划和信念。与其做一些零散的更新,我更希望退一步,深入理解:在一个拥有强人工智能的世界里,我们能创造出哪些变革性的赋能环境?
但在探索这个问题之前,我首先需要弄清楚一个更根本的问题:在一个拥有强人工智能的世界中,学习和成长的目的是什么?哪些知识和能力依然重要,或者变得更加重要了?
作为边界条件的不确定性
一个常见的回答是,我们依然需要掌握足够的知识来指导、监督和协调 AI 系统。这实际上是一个不断变化的目标,它取决于 AI 的能力。三年后,模型能达到什么水平?在我的有生之年会发展到何种程度?这些问题很快就演变成了猜谜游戏。我们可以向预测市场(prediction markets)求助,或是参考尺度定律(scaling laws)。但我们可以通过探索一些明确的界限来找到更持久的答案——无论 AI 多强,有些任务我们似乎永远无法完全交由它们来完成。
几周前,我让 GPT-4 把一个挺复杂的 JavaScript 算法转换成 Python 代码。结果看上去基本正确,但因为两种语言在数值基本类型上的细微差别,代码中出现了一些严重的错误。我必须足够了解这两种语言,才能发现并处理这些错误。事实上,即使我向 GPT-4 解释了错误,它还是不断生成带有同样根本错误的代码变体,因此我还是需要有足够的编程能力去亲自编写修正程序。
但这只是一种暂时的情况。我已经给模型提供了它产出正确解决方案所需的一切。理论上,它完全有能力验证翻译后的程序在执行上是否与原程序完全相同。模型不需要额外的信息或说明来改进它的答案:它只需要掌握两种语言的文档,并具备足够的逻辑推理能力来正确进行翻译。因此,我们不需要借助预测市场或尺度定律就可以预见——或许在明年,或许在遥远的将来——我将不会再需要我用来监督这次翻译的知识。这一事实是任务本身及其基本可解性的结果[1]。
并非所有任务都是如此。比如,假设你是一位作曲家,正在创作一首大提琴协奏曲。你能像委托程序翻译任务那样,将其外包给 AI 吗?
你遇到的第一个问题就是沟通。你心中有一个想要表达的模糊概念,你需要一些知识来帮助你把这些想法清晰地传达给模型。现今的生成音频模型允许你用文字来描述你的需求。为了精确控制输出,你可能需要了解一些专业词汇,比如「断音」,或者了解变音和弦结构等概念。文字并不是传递音乐想法的最佳媒介,所以你可能还需要掌握主旋律谱、ADSR 包络线或频谱图等表示方法。
但将你的大提琴协奏曲外包给 AI 的主要难题,其实并不是如何精确地向模型传达你的想法。真正的问题是,你自己还不知道自己究竟想要什么。作曲本身就是一个探索过程,正如 Donald Schön [所说的](https://andymatuschak.org/files/papers/Schon - The Reflective Practitioner.pdf)「边做边想」。在尝试不同主旋律时,你会发现每个主旋律如何与你心中构想的音乐风景相互影响。这些反馈不仅指导了你的创作方向,也帮你澄清并转变了你的初衷。你无法提前知道自己将需要哪些知识,或者 AI 需要掌握哪些背景信息,因为这些都是你在尝试中才能发现的。通过作曲的过程,你逐渐明白这部作品应该变成什么样。这并不是说 AI 不能在这一过程中提供帮助,实际上,它确实能大大拓宽你的创造视野。但如果你把整个过程都外包出去,最终得到的作品肯定会大相径庭。
从这个角度来看,作曲任务与程序翻译任务属于不同的范畴。但这种区别并不仅限于艺术领域。它还包括 Herb Simon [所说的](https://andymatuschak.org/files/papers/Simon - 1996 - The Sciences of the Artificial.pdf)大多数「人工科学」(sciences of the artificial)领域,如工程、建筑、城市规划、商业、教育、医疗、经济等,这些领域关注的是「事物可能的状态,而不仅仅是现状」。在这些领域中的许多任务,「正确」的解决方案需要通过不断的迭代和协商来确定,需要在一个错综复杂的因素网中权衡取舍,这些因素既不是你,也不是 AI 能预先指定的。重要的工作往往不在于解决问题本身,而在于弄清楚问题到底是什么,这涉及到我们不断变化且相互作用的偏好。
例如,人们常常困惑:为什么软件开发这么难?为什么软件常常漏洞百出,而且完成的时间总是比预定计划晚很多?为什么我们不能简单明了地说明需求,然后把这些需求准确无误地转化成完美的软件呢?其实,能做到这一点的工具确实存在,人们有时会用它们来开发或检验一些关键组件。但这些工具在实际应用中并不常见,我认为这是因为在大多数情况下,我们无法提前准确地定义软件应有的行为。现在,AI 对精确度的要求比传统的规范建模工具要低。在一些简单的场景中,我们可以让 AI 来补充宏观描述的细节,例如「编写一个 Python 脚本,合并这些 CSV 文件,同时去掉所有空行」。但对于更复杂的软件,我们需要在不断构建和反思的过程中探索它应该如何运行,这一点和我们在创作大提琴协奏曲时的探索过程很相似。
那么,如果这类本质上依情况而定的任务需要我们持续参与迭代,需要我们监督 AI 承担越来越多的工作,我们又需要具备什么样的知识和能力呢?
学会驾驭
像 Midjourney 或 DALL-E 这样的工具,非常适合随意制作一些奇思妙想的图片。比如,「在中央公园的黄金时刻,两只金毛寻回犬下棋」的插图。在这种情况下,我不需要任何特殊技能或知识,就能轻松得到一个令人满意的结果。但此时,我并没有强烈的表达欲望;我不是在为复杂的场景寻找完美的图像。我只是想要一张可爱的图片,用来做派对邀请函。
然而,我也可以以更精细的方式使用这些图像模型。如果我需要在一个重要的演示中用图像支持我的观点,我就需要更多的控制。我会多次修改图像,每次都仔细观察并指出哪些地方做得好,哪些不行。经过十几次迭代后,我通常会意识到我一开始的方法就错了(「其实,这里真正需要的是……」),然后我会用新的角度重新诠释我之前的想法。
如果我是一名专业的视觉艺术家,这些图像模型依然能有意义地拓展我的创造力。但若要用这些工具来实现复杂且个性化的创作目标,我就需要更进一步地控制。我需要对想要达成的视觉效果有更明确的想法,也需要精确表达这些细微差别,以便严格约束输出的范围。
为了得到一个可控的结果,我不能只说「我喜欢这张图片」或「我不喜欢那张图片」。那样的话,可能的输出范围就太大了。我需要驾驭,而这就需要我掌握一些特定的专业技能。
我脑中对视觉创意和技巧的积累,决定了我如何构思我要做的事情,以及我能想到的各种「操作」的广度。为了给出好的建议,我需要深刻理解不同构图和操作对结果可能产生的影响,以及这些选择如何限制未来的操作。每制作一张新图像——每进行一次新的尝试——我都得清楚看到各个元素及其对整体的影响。这次操作是否达到了我预期的效果?它还带来了哪些其他后果,这些后果是如何与我的目标相互作用的?这些观察通常会让我重新思考我要达成的目标,或者促使我彻底改变我的方法。
简便起见,我把这称为「品味」:我掌握的行业思维和技巧,我对不同构图和操作可能带来的影响的理解,以及我感知和评估结果的能力。虽然这一节我主要讨论的是图像生成,但我认为这些观点同样适用于我之前提到的专业领域,比如软件设计、建筑、商业、医学等。在艺术之外的领域,这种能力可能被称为「专业判断」或「决策专长」,但我认为,这归根结底是一个能力:在高度依赖具体情况的领域中进行精准驾驭的能力。
在一个拥有强人工智能的未来,我相信我们仍然需要这种「品味」,以便在这些领域中深入工作[2]。当任务涉及到人类的复杂情境和模糊偏好,且行动空间复杂到无法简单通过试错解决时,这种能力就显得尤为重要。你需要以此来确定自己想要创造的图像、软件或其他任何东西。虽然使用 AI 能拓宽你的想象和达成的可能性,但你仍需亲自驾驭。实际上我预计,随着 AI 越来越多地处理一些较为通用的元素,对于某些任务来说,这种「品味」将变得更加重要。
那技术知识呢?
到目前为止,我讨论的主要是我们对模糊启发式方法和直觉的持续需求。但现在,大多数学习都集中在获取信息、详细地理解概念和提升技术熟练度上。在一个拥有强人工智能的未来,这种情况会有何改变?如果我是电子小工具的发明者,我还需要学物理吗?如果我是作曲家,学习音乐理论对我有帮助吗?如果我是建筑师,我还应该继续提升我的绘图技能吗?
我对此感到相当不确定——我认为不同的答案可能差别很大——但有几点值得我们考虑:
沟通媒介。普遍地说,抽象的术语和概念对于沟通依然很重要,无论是与代我们执行任务的 AI 系统,还是与人类合作者。你需要描述你所处情境的限制;表达你的特殊意图;理解并监督权衡。所有这些通常都会从技术语言中受益。领域特定的表述方式(如音乐符号)可能仍将对高效传达思想至关重要。
目的媒介。你的意图——即使是内心的构想——也常常会涉及到复杂的领域特定的概念。比如说,在强人工智能的帮助下,你需要什么样的理解才能发明比特币?首先,你得清楚自己想要达成什么。在比特币之前,市面上已经有不少数字货币,但它们都存在一些关键问题,这些问题往往涉及深奥的技术细节。要构想出类似比特币这样的目标,你需要了解女巫攻击(sybil attacks)和通缩货币政策等问题的权衡。另一种看待这个问题的方式是,你的评估能力——你对给定解决方案的价值的感觉——部分依赖于你的领域知识。
知识库构建的概念。我曾说过,品味的一部分来自于你对专业领域中的思想、操作和框架的掌握。你可以通过积累一生的零星经验来构建这个知识库,但这种方法效率极低。理解概念可以让你在抽象层面上有所提升,将这些孤立的元素整合起来,还能启发出新的可能性。拿烹饪来说,很多人只是做了许多单一的菜谱,而没有培养出有创意的灵活性。但如果你深入学习炖煮这一概念,而不仅仅是制作几个使用这种技术的菜谱,你就能看到这些菜式之间的共通之处,也能更清晰地看出它们的不同。你会把炖煮看作是一种可以在多种情境下使用的抽象「操作」。例如,如果你的 AI 食谱建议你做一个蒸茴香的菜,而天气又比较凉爽,你可能就会意识到,自己更倾向于将其炖煮——但这种想法只有在你能用炖煮的概念来思考,而不是单纯依赖具体食谱时,才会出现。
自启动的关键因素。品味的一个要素是,你能够预判不同操作对工作的影响。当你凭直觉选择某种方法而不是另一种时,其实是在依赖长期积累的经验。但如果一切问题都让 AI 从头到尾帮你解决,你又怎能学会识别这些模式呢?这说明,你需要技术知识来达到自启动——在不同情境中运用基本操作,从而内化它们的运作规律,从而(可能)在未来更多地依赖 AI。
失去自主权。考虑一下相反的情况:如果将所有技术知识外包给 AI 系统,我们会失去什么?这里我想到了尼尔·波兹曼的[《技术垄断》](https://andymatuschak.org/files/papers/Postman - Technopoly.pdf)和伊万·伊里奇的[《友好工具》](https://andymatuschak.org/files/papers/Illich - Tools for Conviviality.pdf)。当我们理解我们的工具时,我们可以根据我们的价值观塑造我们的环境和社会,而不是仅仅被我们的工具/环境塑造。相比之下,当我们依赖的工具和系统不透明,且很少有人理解它们时,这可能会使权力集中在技术官僚精英的手中,并且可能会有剥夺个人和社区的自主权的风险。在一个拥有强人工智能的世界里,我们可能需要保持对技术知识的深入了解,这样才能确保自己对自身命运有参与权。
好吧:这些观察的建议是,在未来拥有强人工智能的情况下,我们仍然需要掌握一些技术知识。但到底需要哪些类型的知识呢?显然,有些知识的重要性会降低,而另一些则会变得更加重要。
我预见到的一个变化是,涉及到具体如何执行任务的知识价值将会发生改变,这类任务的输入和输出可以清晰定义。在有了 Mathematica 这样的工具的世界里,学习如何把二次方程分解成二项式可能很有用,因为这有助于理解零点的概念。但我不确定记住二次方程的公式还有多少价值。同样,有了当今的 AI(以及我广泛的编程领域知识),我实际上不需要详细了解编程语言的语法,就能有效地使用它。
在高度依赖具体情境的领域,把工作外包可能比较困难,但这些工作通常包括一些简单的子任务,这些任务涉及的重要权衡较少。如果这些子任务中的知识不影响更加复杂的整体任务(如语法知识),我们可能会发现,我们不再需要这些知识。这一观察同样适用于只涉及这些子任务的操作技能。我的验光师过去常用一台复杂的机器来检测我的近视;现在,一个自动化的激光器就可以完成这项工作。但这只是我看诊的一部分,我还是很高兴能和她讨论选择处方时涉及的复杂权衡。
把这个想法应用到各个领域的课程审计中,会很有意思。我们能删掉多少内容?还需要增加些什么呢?
我有一个顾虑:有时候,洞察和启示会在意想不到的地方出现。有时候,当我在做一些相对机械的界面设计工作时,我可能会突然发现一个之前没注意到的机会。一位医生在做常规检查时,也可能会观察到一些细微的、原本不在检查范围内的现象。这些权衡我还真不知道该怎么考虑。
行动的意义
还有一条很明显的边界:在那些亲自动手做才能体会到其意义的活动中,你肯定还是需要相关的知识和技能。
即使 AI 可以合成出完美的大提琴旋律,很多人还是会选择学习弹大提琴,因为亲自演奏能带来极大的乐趣。很多作家可能会喜欢用自动拼写检查,但他们不愿意放弃亲手打磨一个优美句子所带来的满足感。
如果你在读亚里士多德或《圣经》,我相信在未来拥有强人工智能的时代,你还是会想要阅读它们。哲学和精神探索的意义,很大一部分来源于内心。这种意义的一部分也可能源自与他人的讨论,可能有一天 AI 可以在这方面提供帮助,但至少目前在这些话题的讨论中,我发现自己无法与它的回应建立情感联系。
如果未来我们能借助 AI,让更多人在更多领域体验到深入参与的乐趣,我会非常高兴。我已经从非艺术家使用 Midjourney 的体验,以及非程序员使用 GPT-4 开发软件的故事中,看到了这种可能性的一些端倪。
一些遗留问题
关于硬科学。到目前为止,我的讨论主要集中在艺术和「人造科学」上。那么硬科学(译注:形式科学和自然科学)呢?未来的细胞生物学家需要掌握哪些知识?这个问题让我感到相当迷茫。如果你对某个细胞运作的机制感兴趣,这本身就是一个复杂而又不明确的问题,我也不确定这个问题取决于什么。这是针对客观现实的问题。虽然最好的答案可能取决于谁在问这个问题以及为什么问,但科学文献中已有很多关于如何良好描述细胞机制的先例。细胞生物学家需要有足够的知识来提出有意义的问题。这一需求或许就包括了传统课程大纲的剩余内容,但我不确定。正如 Michael Nielsen 所指出的,AI 推动的科学可能会在实验方面遇到瓶颈,尤其是在生物学这种「世界历史上的偶然事实对现象有重大影响」的领域,但我们的角色仅仅是开展实验吗?
品味的极限。我对品味的见解总能成立吗?一个足够强大的 AI 难道不能学会我的品味,并在充分理解我所有复杂背景的前提下,精确地创造出我所期望的东西吗?我觉得答案取决于我的意图有多个性化、难以捉摸和苛刻。比如,如果我想让我的大提琴协奏曲精确地表达我内心情感世界的那些难以言述的细节,很难想象一个 AI 能做到这一点,除非它能准确地模拟我的主观体验。在很多专业场合,尤其是那些看似相当偶然的情况,这种看法似乎并不适用。诊断医生需要依靠我所说的「品味」来引导他们的检查并反思他们的发现。但理论上,一个多模态 AI 应该能够得出同样的诊断结果。这种情况相对客观。建筑师的工作则居于中间——既有需要解决的客观问题,解决方案还要体现出建筑师那些难以捉摸的创意偏好。
做大蛋糕。在本文中,我默认了现有的职业世界、活动种类和知识领域。但在一个拥有强人工智能的世界里,我们的生活方式将会发生巨大变化。我们将会有新的爱好、新的艺术形式、新的科学领域、新的职业和新的机构。尽管我们还不知道这些在未来会是什么样子,但我们能否预测一下,哪些学习和成长在这些新领域中可能会有价值呢?
————————
感谢来自 Catherine Olsson、Jason Crawford、Joe Edelman、Laura Deming、Michael Nielsen、Sara LaHue 和 Sebastian Garren 的有益交流。还要感谢 David Chapman 向我介绍 Donald Schön 的作品。
————————
[1] 当然,在一般情况下,有些程序翻译在理论上是难以解决的。例如,如果你需要将 Python 代码转换成只支持全函数的语言,我们期望 AI 能告诉我们哪些情况下无法转换输入。但根据莱斯定理(Rice’s Theorem),这通常是不可能的,因为函数的完整性是无法判断的。因此,我们的 AI 有时可能会生成一个无效的程序,或者无法结束运行。然而,我可以主张,目前我们没有任何原则上的理由来区分人类能够执行的程序翻译任务与一个能力足够的 AI 能执行的任务之间有什么差异。
[2] 当然,AI 的一个神奇之处在于它能极大地降低进入这些领域的门槛。如果你缺乏品味,生成模型将大大扩展你的能力。它们能让你接触到一些粗略的结果,这些是你原本无法得到的,在很多粗浅涉猎的场合,这已经足够了。
与作者一起工作:文本写作和卡片写作相互依赖
几周前,我迎来了一个值得庆祝的里程碑:我开发的 Orbit 软件终于进入了一个新阶段,作者们现在可以使用它来发布文本了。通常情况下,当软件项目达到重要里程碑时,人们总能看到一些显而易见的新功能「上线」——这些功能往往可以直接展示给他人。然而,这次情况有所不同,我们「上线」的是一个基础设施;接下来的挑战在于如何帮助他人充分利用这个工具,创造出富有意义的内容。
在与众多作者的合作过程中,我逐渐认识到一个我本应更早洞察的重要问题:那些尚未在个人学习中成功实践间隔重复法的作者,通常很难有效地运用 Orbit 进行写作。回顾过往,这一点再明显不过。Michael 和我此前已经使用 Anki 多年,这些丰富的经验为我们创作《量子国度》提供了坚实基础。若我们缺乏编写间隔重复卡片的实际经验,根本无法完成这项工作。
我曾经认为作者面临的主要挑战是「如何通过卡片有效传达信息」,这确实是个问题——但更为根本的是,他们还需要通过个人实践来掌握基本的知识建模技能。现在的困境在于,我发现这个问题存在着循环依赖的关系。
Orbit 的一个核心理念是:编写优质的复习卡片是间隔重复学习系统难以普及的一大障碍。然而,我们可以通过巧妙地将专家编写的卡片融入上下文叙述中,显著降低这一门槛。当你阅读越来越多专家编写的卡片时,你会逐渐掌握如何在这个领域进行创作。这样一来,你自己编写卡片和建立个人学习体系的难度就会大大降低。
然而,这里存在一个潜在的困境:如果要使用 Orbit 创作内容,你需要有扎实的个人间隔重复学习基础;而要建立这样的个人学习体系,又需要通过阅读 Orbit 上的内容来学习。这就陷入了一个两难的循环。我们需要找到一种方法来打破这个循环。一种可能的方案是从那些已经建立起强大个人学习体系的作者着手……但是这样的人实在太少了,这种方法似乎不太可行。
我认为,一个更可行的方法是投入大量精力帮助作者培养建立强大个人学习体系所需的技能。我预计这会比教导普通大众如何编写优质卡片更容易:毕竟,作者们已经习惯于深入思考如何用文字准确表达想法,而且他们格外重视表达的精确性。
最初,我原本计划通过编写一些关于如何通过卡片进行有效沟通的资源来开始与作者们的合作。然而,我现在意识到,要想利用 Orbit 为他人创作高质量内容,首要任务是学会为自己设计出色的卡片。因此,我决定在这个月着手编写一本关于卡片写作的小手册。我邀请了一些作者参与一个小型研讨会,目的是实践这些概念并帮助我不断完善手册内容。如果效果理想,我可能会为更广泛的受众举办更多类似的研讨会。无论如何,只要最终成果足够有价值,我都会公开发布这本手册(当然,你们将是第一批读者)。在编写过程中,我计划使用 Orbit,以帮助读者更好地掌握和记住关键理念和技巧。
尽管已有不少文章讨论如何撰写优秀的间隔重复卡片,但它们往往缺乏系统性,仅仅提供了一些零散的建议,比如「避免使用列表」。我认为,我们可以从更基本的原则出发,深入理解为什么某些卡片行之有效,而其他的则失败了。
特别是,有一个模型给了我很大启发,那就是将编写间隔重复卡片视为给未来的自己布置一项反复进行的任务。换句话说,卡片设计实际上就是任务设计。如果你的目标是增强记忆力,那么这些任务的目的就是进行提取练习。这是认知心理学中的一个重要原则,我会在手册中详细阐述。简而言之,你必须设计这样的任务:当你执行时,需要你主动调用相关的知识。
这个过程与跨语言翻译惊人地相似。在翻译时,你需要寻找那些词语,它们在被阅读时能在读者心中唤起与原文相近的认知反应。这绝非机械性的操作。如果原文包含典故、比喻或幽默元素,直译往往难以传神;你需要找到能让目标文化读者获得与原文读者相似体验的表达方式。在设计学习型提示时,你也在进行类似的「翻译」工作:我们需要设计哪些任务,才能在执行时「激活」那些与充分理解该概念相关的心智模型呢?
对于相对简单的概念,可能只需设计一个任务就能准确地激活所有相关的认知元素(同时避免激活无关的部分)。但当概念涉及多个重要方面时,设计单一任务来有效刺激所有这些元素就变得困难了。这时,我们就需要将概念分解为多个子任务。这正是知识建模发挥作用的地方。面对一项知识,我们如何表达其构成要素及其之间的关系?答案会因知识类型(如陈述性、程序性和概念性知识)而异,但每种类型都有其相应的框架可供使用。
————————
管理说明:如果你住在欧洲,你现在可以选择用英镑或欧元支付你的会员费,而不是美元。我一如既往地感谢你们的善意支持。我无法相信这个小小的实验室社区现在有 400 多人在里面!
一位经济学家认为我们的教育系统基本上没用
原文:An Economist Argues That Our Education System Is Largely Useless (chronicle.com)
发布于 2018 年 1 月 29 日
经济学常被戏称为「令人沮丧的科学」(dismal science),而 Bryan Caplan 的观点可谓是悲观主义的集大成者。作为乔治梅森大学的经济学教授,Caplan 先生对教育——他自己所从事的职业,同时也是福利国家的基本福利——提出了尖锐的批评。在他看来,教育基本上是无用的,至少对于我们通常认为它应该提供的东西——学习而言是如此。
大多数人都认为,小初高和大学教育能够提高我们的智力或增强我们的职场竞争力。然而,在《反对学校教育的依据:为何教育系统是对时间和金钱的浪费》(普林斯顿大学出版社,2018 年)一书中,Caplan 先生提出了一个颇具争议的观点。他认为,学位的主要价值在于向雇主传递的信号:大学毕业生具有足够的毅力和服从性,能够完成多年看似毫无意义的繁重任务。正是这种信号——而非教育可能实际上并未传授的更高水平技能——使毕业生能够在毕业后获得高薪工作。与此同时,那些中途辍学的学生,无论多么聪明勤奋,都会因为不愿随波逐流而在职场上遭受不公平的对待。
秉持其自由意志主义理念,Caplan 先生主张将更多教育成本从政府转移到个人身上。然而,他对此也持悲观态度:考虑到美国每年在教育上投入数千亿美元,再加上文凭所带来的回报,他认为我们可能难以改变现状。
Caplan 先生在接受 The Chronicle 采访时,探讨了教育中一些无关紧要的方面。
•
在《反对学校教育的依据》一书中,你将艺术、历史和外语等学科贬为「无用」。那么,教育是否必须在日常工作中能够立即应用才能被认为有价值呢?
不尽然,但它应该要么有用,要么能带来愉悦。遗憾的是,对大多数学生来说,这些学科两者都没有。人们接受的教育与他们在多数工作中实际应用的知识之间存在巨大鸿沟。我的意思是,他们或许能从中获得一些微不足道的收获。但大部分内容,一旦期末考试结束,他们就再也用不上了。如果这些是学生毫无兴趣的必修课,他们仅仅为了拿到文凭而不得不学习,那么从几乎任何角度来看,这都似乎是一种浪费。
你在书中写道:「据我所知,我教授的唯一具有市场价值的技能就是『如何成为一名经济学教授』。」但这难道不是因为你缺乏想象力来使你的学科与现实相关,而非教育本身的失败吗?
要让我教授的学科切实贴合学生需求,我恐怕得深入了解学生们从事的各种职业,这实际上等同于去教授一门全然不同的学科。经济学本质上并非为培养银行家或销售人员而设计的职业培训课程。谈到提升工作表现,我实在无法坦言自己正在提高那些从事我并不熟悉的工作的学生的职业能力。
我确实努力向学生传授一些最有价值的技能,例如「如果看电影不开心就毫不犹豫地离场」。这正是经济学理论告诉我们应该做的。但即便如此,我也不太乐观地认为学生们会因为课堂所学而真正改变自己的生活。大多数人把教育仅仅视为在考试中写下一些答案,然后继续过自己的生活,回到从前的老路子上。
多数孩子骨子里都是俗人。在书中,我引用了屡获教学奖项的哈佛大学心理学家 Steven Pinker 的话。他发现,在学期开始的几个星期里,课堂上仍有一半的学生缺席。这不禁让人困惑:这些可是世界顶尖的学生,在公认最好的大学里,聆听最优秀教师的课程,为何还有一半人认为不值得来听课?更何况他们还要为此拿分数,本应更有动力来上课,却仍然选择缺席。唯一的解释是,即便是世界一流的教师,与学生们能做的其他事相比,也显得乏味无趣。这个事实令人沮丧,难以接受,但确实如此。
强迫学生学习他们可能不感兴趣的科目是否有价值呢?他们或许会因此发现新的兴趣所在。
这种情况虽然极为罕见,但确实会发生。然而,更多的学生经历这种煎熬却没有从中获得任何价值。那些不喜欢学校的人很少会撰文诉说其中的痛苦经历。相反,他们往往选择默默忍受或向朋友倾诉,之后就去寻找一份务实的工作,从此我们再也听不到他们的声音。关于教育的讨论主要由那些享受学校生活并从事教育工作的人主导。我想要做的,部分是为那些沉默的人发声,说:「尽管他们可能不会说出来,但他们正在遭受痛苦。」如果你真的走进教室观察学生们的表情,这就不是什么难解之谜了。学生们普遍不快乐,他们感到厌倦。
然而,如果你与当今的雇主交谈,许多人却会赞扬文科教育,表示他们希望招聘全面发展、思维开阔的人才。
在这本书中,我深入探讨了社会期望偏差这一现象。人们常常说一套做一套,有时甚至自己也相信自己说的话。但仔细观察他们的行为,你会发现他们要么在说谎,要么并未完全相信自己所说的。举个例子,雇主们声称他们想要全面发展的人才,但看看他们在招聘时实际上奖励谁?我并没有看到他们真的在奖励全面发展的人。相反,他们奖励的是那些能够出色完成工作并为公司创造利润的人。雇主们想给人留下善良、开明的印象。他们不愿意直白地说:「只要你能给公司赚钱,我才不在乎你是否像个穴居人呢。」但说到底,这才是他们的真实想法。从雇主的角度来看,文科学位之所以受青睐,是因为它是筛选优秀员工的一种手段。一旦这些人开始工作,谁还会在意他们是否真的热爱高雅文化或其他什么呢?
你主张削减政府在教育方面的开支,减少接受高等教育的人数。为什么不选择改革教育系统,而是要消减教育呢?
在我的书中,我用了一个生动的比喻来阐述问题:假设你有个朋友在使用一种治疗脚趾甲真菌的药膏,但没有效果。你劝他停用,他却说:「除非你找到一种有效的治疗方法,否则我就继续用下去。」显然,找到这样的良方并非易事。那么,为什么我们不先停用无效的方法,然后四处寻找一些可能有效的方法呢?也许能找到,也许找不到,但至少在这个过程中我们不会白白浪费金钱。这正是我看待教育改革的方式。目前我们在教育上做很多明知是在浪费钱的事情。第一步应该是停止这种浪费。然后,第二步我们可以开放地讨论如何更好地利用这些资金。也许最终得出的结论会与教育完全无关,这也未尝不可。
我们似乎面对的是一个极度失灵的系统,即便发现了有效的方法,也难以得到推广应用。在我的博客中,我曾讨论过一篇文献综述,该综述采用研究领域的黄金标准,评估了各种教学技巧的有效性。令人震惊的是,那些被证实有效的方法却很少被采用,而许多被证明无效的方法反而广受欢迎。举个例子,在课本上划重点这种方法完全无效,但却在全球范围内被广泛使用。这正是问题所在:我们面对的是一个功能失调的系统,而人们似乎对改进它缺乏兴趣。
假设你被赋予改革美国教育体系的重任,请描绘一下你心目中的理想解决方案。
首先,我们应该大幅提升职业教育的重要性。对于那些对学术科目本身缺乏兴趣的孩子而言,13 或 14 岁是一个理想的年龄,可以开始为他们的未来职业做切实准备。这并不意味着他们的人生道路就此被局限,例如注定要成为一名水管工。更明智的做法是让他们接触各种各样的职业,观察他们真正感兴趣的领域和展现出天赋的方向,安排他们进入不同的工作场所进行实地体验。当然,在这个年龄段,我们仍然需要继续培养他们的阅读、写作和数学能力,但可以将其他学科的内容精简到最低程度。
就丰富人们的生活而言,我认为不应该过分将资金集中在年轻人身上。事实上,如果我们的目标仅仅是给人们一个充实自己的机会,我认为在人生的中后期适度投入资金也是非常有意义的。
在高等教育领域,我们应该将资金重点投向那些能提供实际就业机会的专业,同时大幅削减或完全取消对那些主要服务于个人兴趣或爱好的专业的政府支持。我不禁要质疑,为什么某些爱好能得到政府支持,而其他的却不能?举例来说,为什么漫画不能获得政府支持,而诗歌却可以?从艺术价值的角度来看,我认为当今的漫画比诗歌更具创新性和表现力。然而,诗歌却因其较高的社会地位而备受青睐。
Scott Carlson 是一位资深作家,专注于报道高等教育的成本和价值。如需联系他,请发送电子邮件至 scott.carlson@chronicle.com。
本次采访内容经过编辑,以确保篇幅适中并提高可读性。
美国大学:如何物尽其用
原文:College: How to Make the Most of It - Econlib
作者:Bryan Caplan
说实话,你在大学里学到的实用知识可能很有限。你可能不得不忍受一些无聊的说教。更不用说那些令人不快的新冠防疫措施了。获得一纸文凭以证明自己的能力似乎是上大学唯一说得过去的理由。尽管如此,既然你已经踏入校园,何不好好利用这个机会呢?我在大学里已经度过了 33 个年头,一直在密切观察这个环境。接下来,我会给你一些建议,告诉你如何让你投入的时间和金钱物尽其用。
-
选课前务必查阅教学评价。教学水平差异很大,即便整体水平不高,你也无需忍受平庸的教学。
-
坚持坐在第一排,积极提问,主动与教授交流。即便他们的观点看似极端,你也能通过提出深思熟虑的问题获益良多,哪怕只是在思维方式上。
-
在谷歌学术上搜索教授的名字,了解他们的研究成果。然后在办公时间与他们讨论其工作。准备一些显然不会出现在考试中的问题。
-
关键:从大一就开始这么做!这个阶段,没人会怀疑你是为了日后的推荐信而讨好教授。
-
浏览你认真考虑的每个专业的教师网页,查看他们的研究方向。如果你觉得有 5% 或以上的可能性会对某位教授感兴趣,就在谷歌学术上搜索他的名字。如果兴趣依然存在,就去他的办公室询问他的研究。
-
不要害羞。大多数教授都感到无聊和孤独。即使在顶尖学校,他们也很少遇到了解并关心他们工作的人。他们其实渴望你的到来……即使他们自己可能还没意识到。
-
如果你与某位教授相谈甚欢,就继续关注他们的研究并经常拜访。邀请他们共进午餐。成为教授最喜爱的学生并不难,因为竞争并不激烈。
-
对所有人保持极度友善。每次在宿舍遇到人都热情问候。记住热情问候的三要素:眼神交流、微笑以及清晰的问候声。
-
绝不独自用餐!如果在食堂不认识人,就找一小群看起来友好的学生,礼貌地询问是否可以加入。几乎没人会拒绝。
-
看看学校是否有有效利他主义(EA)俱乐部。如果有,要经常参加。即使你对慈善事业毫无兴趣,EA 也是一个激发思考和好奇心的理想场所。
-
做个友善的「异端者」。以轻松愉快的态度对待官方的「洗脑」。这会吸引志同道合的人:许多学生和你一样对正统观点持怀疑态度。如果你态度友好,他们会向你展示真实的自己。
-
疫情期间,尽量保持正常生活。在允许的范围内灵活处理规定,与那些不盲目遵守规定的学生交往。因为学校可能试图压制你的个性,你必须努力保持自我。
-
远离酗酒派对。它们确实被高估了。仅考虑宿醉和意外,预期收益可能是负面的。努力在清醒状态下放松自我。记住:真正沉迷酒精的人也最可能因此毁掉人生。
-
在远离酗酒派对的同时,试着寻找真爱。尽管有奥威尔的宣传,但仅仅因为邀请他人约会而遭受迫害的可能性极低。请记住:你再也不会有如此便利的约会对象资源了。在现代社会,同事间的约会已经式微,但同学间的约会仍然盛行。至少目前如此。
教育:经济与学术视角
原文:Education: Economic vs. Academic Perspectives - Econlib
作者:Bryan Caplan
随着我对教育领域研究的不断深入,我越发意识到社会科学家在评价教育方面存在两种截然不同的方法。
第一种是「经济」视角:以经济回报为标准评判教育。从这个角度来看,教育无疑是一个巨大的成功。然而,令人遗憾的是,很少有人充分利用教育所提供的这个绝佳的投资机会。Goldin 和 Katz 合著的《教育与技术的竞赛》就是持这种观点的典型代表作。
第二种是「学术」视角:以学习成效为标准评判教育。从这个角度来看,教育的表现令人失望,甚至可以说是不尽如人意。同样令人遗憾的是,很少有学生真正把握住教育所提供的这个宝贵的智力发展机会。Arum 和 Roksa 合著的《学术漂移:美国大学有限的学习成果》就是持这种观点的代表作。
如果你正在阅读这篇博客,你可能已经熟悉了评估教育的经济学方法。因此,我将重点介绍学术方法。学术方法与经济学方法同样依赖数据,但它关注的是你所获得的知识和学习成果,而非你的收入增长。《学术漂移》一书聚焦于大学前两年的学习情况,得出了该领域研究的典型结论:
许多学生在高等教育阶段,其批判性思维、复杂推理和写作技能仅有微小提升。根据我们的样本数据,从大一入学到大二结束,学生在这些能力上的平均提升仅为 0.18 个标准差,这是通过 CLA(大学学习评估)测量得出的。
在我们 2,300 多名学生的大规模样本中,至少有 45% 的学生在批判性思维、复杂推理和写作技能方面没有统计学上的显著进步。
考虑到大学生很少投入时间学习,而且像躲避瘟疫一样逃避具有挑战性的课程,这个结果并不令人意外:
平均而言,[学生们]报告每周只用 12 小时学习……更令人担忧的是,37% 的学生表示每周花在课程准备上的时间不到 5 小时。
事实上:
假设学生每晚能睡足八小时,这已是相当乐观的估计了——要知道他们上早课时常常迟到,有时甚至衣冠不整。按此计算,每周还剩下 85 小时可供支配……那么,这些额外的时间都用来做什么了呢?看来,大部分都花在了社交和娱乐上。
乍看之下,经济学界和学术界对教育的看法似乎水火不容。经济学家会说:「教育既然能大幅提高收入,怎么可能不把学生培养成生产力显著提高的劳动者呢?」而学者则会反问:「教育既然未能明显提升技能,又怎么可能把学生塑造成生产力明显提高的劳动者呢?」
在我正在撰写的《反对学校教育的依据》一书中,贯穿全书的一个核心主题是:关于教育影响的两种观点对其各自关注的变量都有正确之处。尽管教育并未显著提高学生的生产力,但它确实能大幅增加收入。这听起来不可能?其实并非如此。教育的信号传递模型可以轻松解释这两个看似矛盾的事实。简而言之:只要生产力低的人较少接受和完成学业,而雇主又缺乏完全的信息,那么即使你在学校里没学到任何有用的知识——甚至什么都没学到,继续接受教育也能在因果关系上提升你的收入。就是这么简单。
同时,《反对学校教育的依据》一书还将论证,无论是从经济角度还是学术角度来看,将教育美化都是错误的*。即使大多数人没有掌握学术技能,现代社会也能存续和繁荣。我们如何得知?因为事实是,绝大多数人都未能掌握学术技能——然而现代社会依然在蓬勃发展。
将学术界比作歌剧,这个比喻并不夸张。两者都只适合少数具备欣赏能力和兴趣的人。对于其他大多数人来说,这两者都没有太大用处——也没有必要强迫他们接受。事实上,有充分的理由不这样做。设想一下,如果强迫所有来看棒球比赛的人去听歌剧会怎样。也许会有极少数球迷因此爱上歌剧,但至少有一百倍的人会感到极度无聊和反感。他们会抱怨、坐立不安,从而破坏真正的歌剧爱好者的观赏体验。
这种现象在全世界的课堂上普遍存在。教育者们强迫学生学习他们在现实生活中可能永远用不到的高雅文化,然后又困惑为什么如此难以教会他们任何东西。与此同时,那些真正渴望学习的学生却因为课程进度缓慢而感到无聊,还要忍受不满同学们的情绪骚扰。这无疑是极大的浪费。
*《学术漂流》这本书有时似乎支持信号模型:
从长远来看,由于白领劳动力没有接受普遍严格的培训,可能会削弱这个国家的全球竞争力。但从短期来看,即使大学提供的学术学习有限,仍然可以履行其主要的社会功能:根据学历而非实际技能为学生分配职业岗位……
然而,这种支持态度并不一致:
在现代经济体系中,个人的职业发展前景越来越依赖于其学术成就。要在经济领域获得长期的职业成功,不仅需要拥有学历证书,更可能需要具备扎实的学术能力。
《反对学校教育的依据》的左派经验
原文:Leftist Lessons of The Case Against Education - Econlib
作者:Bryan Caplan
总体而言,《反对学校教育的依据》一书所引发的反响可谓理性而公允。尽管我受到了不少批评,但这些批评都是针对我的实际言论和观点,并未歪曲我的本意。唯一让我感到些许遗憾的是:虽然来自左派的批评质量上乘,但在数量上却相对有限。诚然,我曾在 Vox 网站上与 Sean Illig 进行了一场精彩的对话,Steve Pearlstein 也在《华盛顿邮报》上为我撰写了一篇不错的评论文章。此外,我还与中左派评论员 Michael Baranowski 在《政治家伙们》播客上进行了一次生动的讨论。但不得不说,我参与的非左派播客节目数量是左派播客的十倍有余。更值得一提的是,迄今为止,尚未有左倾智库邀请我前去演讲。
我认为这实在令人遗憾,因为《反对学校教育的依据》一书中其实包含了许多左派人士应该会欣赏的研究成果。比如:
-
**许多工人——尤其是受教育程度较低的工人——所获得的薪酬低于他们的真实价值。**如果信号传递在就业市场中扮演着重要角色,那么必然存在大量「未经雕琢的钻石」——这些优秀的工人因为缺乏正确的文凭,让雇主相信自己的能力,最终导致他们的薪酬被严重低估。
-
**许多工人——尤其是受教育程度较高的工人——获得的薪酬超过了他们的实际价值。**同样,如果信号传递在就业市场中扮演着重要角色,那么必然存在大量能力平平的员工,他们仅仅因为获得了具有误导性的高学历文凭,就得到了与其能力不相称的高薪。
-
**大量的教育内容实际上只是毫无意义的形式主义,就像马戏团里的动物被训练跳圈一样。**长期以来,校园激进分子一直抨击教育系统强加给无助的学生一套脱离实际、固步自封且带有精英主义色彩的课程。我认为他们的批评是完全正确的。
-
**教育市场效率低下。**从信号传递理论的角度来看,教育实际上产生了负外部性。我的分析因此揭示了一个严重的市场失灵现象:出于个人利益的考虑,学生往往会追求超出社会整体最优水平的教育。
-
闭锁综合症。由于存在传递从众性的信号机制,教育市场不仅仅是暂时的效率低下;而是长期处于效率低下的状态。换言之,教育市场不是短暂地失灵;而是持续地失灵。
-
**人们严重夸大了政府对 IQ 测试的「禁令」,这根本无法解释雇主为何如此依赖学历证书。**尽管 Griggs 案在法理上为 IQ 就业测试(以及几乎所有的招聘方法)设置了近乎不可逾越的障碍,但实际执行却相当宽。
-
学历通胀相当猖獗。技术进步只能解释现代劳动力市场变化的一小部分。人们普遍认为,与父辈相比,现在的工人需要接受更多的教育才能获得同等的工作,这一观点完全正确。
-
从基层做起需要付出漫长的努力。虽然有证据表明员工的能力可以提高工资水平,但这是一个漫长的过程。如果你很有才华却没有相应的学历证书,即使累积十年的工作经验,也很难完全赶上有学历的人。
-
在许多方面,过去的劳动力市场对贫穷和工人阶级家庭的人来说更加友好。诚然,现在的平均生活水平远高于 1950 年,但在 1950 年,人们对高中辍学者的歧视要少得多,对没有上大学的工人几乎没有歧视。现代人看到贫穷家庭出身的大学毕业生,认为这就是「社会正义」,却忽视了更多来自贫穷家庭、从未获得大学学位的孩子所面临的困境。
-
**把中产阶级的期望强加给每个人,会给贫穷和工人阶级家庭的孩子带来痛苦和挫折。**许多孩子讨厌上学,他们在学校非常无聊,备受老师无休止的批评和打击。这些孩子很大一部分来自贫穷和工人阶级家庭。但是,由于课程设置由中上阶层把控,他们坚持「大学教育适合所有人」的理念,而把职业教育置于次要地位。结果是:大多数贫穷的、工人阶级家庭的孩子在学校饱受痛苦煎熬,最终离开校园时,既没有掌握职业技能,也缺乏继续深造的能力。
诚然,我并不否认《反对学校教育的依据》这本书中确实也包含了不少右派经验。你可能会对此不以为然,但我一直努力做到的是,抛开成见,只是追随论据和证据的指引,看看它们会将我引向何方。我想强调的是,在我这本新作中,其实也有很多内容是左派人士会欣赏的。我真诚地对所有左派朋友说:我非常乐意就这些问题与你们进行深入的探讨!
甚至连日托都没有
原文:Not Even Daycare - by Bryan Caplan - Bet On It
人们对《反对学校教育的依据》最普遍的误解是认为它仅仅针对大学教育。事实上,我的论述不仅涉及高中教育,还包括了从幼儿园到初中(K-8)的阶段。在教育存在的地方,就存在着「教育信号」这一现象。
然而,每当我评论 K-8 阶段的教育时,我都会做出一个重要让步。尽管学校在很大程度上浪费了纳税人的钱和学生的时间,但它们确实提供了一项无可否认的有用服务:日托。学校把孩子们集中在一起照看,使得父母可以专心工作、料理家务或放松身心。直到几个月前,我还认为这种好处是必然的。我认为,即便学校传授的有用知识再少,对年轻人最无效的「教育」也必然会附带提供日托这一功能。
我错得太离谱了!简直是大错特错。从去年三月开始,美国各地的学校纷纷让学生回家,并开始为从幼儿园到高年级的学生实施所谓的「远程教学」。这简直是天大的笑话。显而易见,除非有家长全程监督,否则幼儿园学生根本无法进行远程学习。任何有能力辅导幼儿园课程的家长,还不如直接自己教孩子。这同样适用于绝大多数一到四年级的学生。五到八年级的成熟学生或许能在没有家长密切监督的情况下完成学习任务,但大多数学生仍然做不到。自从去年三月学校关闭后,我便将年幼的孩子们纳入了我的在家上学体系,从此再也没有回头。
诚然,远程教育可以被视为一种应急措施,几乎没有人将其视为课堂教学的可靠替代品。这是一种典型的「我们假装教,他们假装学」的情况。大多数家长配合这场闹剧,为让那些受欢迎的教师保全面子。
然而,现在许多学区却在变本加厉,进一步强化对年幼儿童进行远程教学这一荒谬做法。我所在的费尔法克斯县学区最初宣布,家庭可以选择每周接受两天的线下教学。这意味着每周两天的日托。虽然这不足以让双职工家庭全时间工作,但总算是聊胜于无。
然而,就在昨晚,费尔法克斯县公立学校改变了此前的政策。
鉴于「全国和地区的健康状况持续恶化」,费尔法克斯县公立学校宣布 2020-2021 学年将全面推行远程教学。
学区总监 Scott Brabrand 博士周二提出了这一远程教学的建议,学校董事会接受他的提议,允许总监推进他的计划。
所有课程将至少在整个学季内以线上方式进行。尽管如此,学校仍将获得全额的税收拨款。作为回报,他们甚至拒绝提供日托服务。即便以公共部门一贯的低标准来衡量,这种服务质量也着实令人失望。实际上,参与远程学习的学生家长将不得不扮演起在家教育者的角色。既然如此,他们不妨干脆摆脱繁琐的程序和诸多烦恼,正式选择在家上学。值得一提的是,弗吉尼亚州的在家上学法规相对宽松。既然可以轻松成为自己的老板,何必要做学区的无薪劳工呢?
有人可能会说:「至少我们应该给虚拟教育一个机会。」但我坚决反对,甚至不愿意给它任何尝试的机会。作为一个在学校度过了 44 年,并已为人父母 17 年的人,我认为没有必要浪费时间去尝试这种荒谬的做法。让孩子们每周回学校两天与朋友见面本来是个合理的选择。然而,现在所谓的「送」孩子「回学校」去「见」朋友,既可笑又令人心酸。如果我的孩子们不能在学校里与其他孩子自由玩耍,那他们去学校就失去了意义。
长期以来,我一直倡导大幅削减教育支出。而在当前情况下,采取财政紧缩政策的理由更是显而易见。如果学校无法提供日托服务,纳税人为什么还要继续每年为每个孩子支付超过 1 万美元的费用呢?现在,费尔法克斯县的每一位纳税人都有充分的理由说:「我要求退还我的钱。」
当然,考虑到我们面对的是政府机构,你最好还是省省力气吧。
学校是为了浪费时间和金钱
2022 年 9 月 1 日
我对学校教育的智力价值和社会意义深表怀疑。我的论点可以简要概括为三点:首先,每个人最终都会离开学校;其次,在学校里学到的大部分知识在毕业后都无关紧要;最后,人们很快就会遗忘那些鲜少使用的知识。
有趣的是,正是这些质疑让我认为,新冠疫情对教育造成的负面影响可能已经成为过去。尽管我们被迫保持乐观态度,但不可否认,在疫情期间,数百万学生经历的线上教育俨然是一场教学灾难。有研究表明,参加线上课堂与完全不上学几乎无异。还有研究发现,学生的考试成绩提升幅度远低于往常水平。
然而,基于我对学校教育价值的怀疑,我推断学生在线上学习中失去的大部分知识,即使在正常的面授环境下,等他们步入成年早期也会消失殆尽。我并非主张从长远来看,线上学习的效果几乎可以媲美线下学习。恰恰相反,我的观点是,从长远来看,线下学习的效果几乎和线上学习一样垃圾。
这些惊人的发现是如何得来的呢?我的研究主要聚焦于成人知识测试——即探究成年人在毕业后还能保留多少知识。总体来看,结果令人震惊:成年人所保留的学业知识少得令人咋舌。大学毕业生的知识水平仅相当于我们对高中毕业生的期望;高中毕业生的水平则仅相当于我们对辍学者的期望;而辍学者几乎是一无所知。这并不意味着这些学生从未掌握过更多知识,而是表明他们所学的内容中,只有极小一部分能长期留存在记忆中。
这种现象在基础的「三 R」(阅读、写作、算术:reading, writing, arithmetic)之外的学科中表现得尤为突出。尽管通常要求学生学习两年的外语课程,但能够声称在学校里学会熟练掌握一门外语的美国成年人还不到 1%。成年人对历史和公民知识的了解更是少得可怜。如果你测试一些最基本的事实,比如列举政府的三个分支,他们平均只能答对一半。同样的情况也出现在基础科学问题上,例如「电子是否比原子小?」或者「抗生素能否同时杀死病毒和细菌?」
这些测试成绩到底有多糟糕?答案是:糟糕到令人震惊的地步。让我们打个比方:如果一个人只认识字母表中的一半字母,我们不会说他「半识字」,而是会毫不犹豫地认定他是文盲。我认为,对于缺乏基本的历史、公民和科学知识的情况,我们也应该采用同样严格的标准。如果一个人连历史、公民和科学的基础知识都只了解一半,那么实际上他对这些学科根本就没有真正的理解。
诚然,传授基本的读写和计算能力能带来更大的回报。这是因为成年人在日常生活中经常运用阅读、写作和数学技能,从而能够保留大部分所学知识。然而,即便在这些基础领域,学校的表现也只能说是平庸,而且难以显著改善。数十年来,学校一直在努力帮助学习落后的学生提高阅读、写作和数学水平。短期内提升他们的成绩是可以做到的,但长期存在的问题是「衰退效应」——教育干预的效果会随时间推移而逐渐减弱,甚至完全消失。
我坦率地承认,我对美国教育的悲观评价在经济学界属于少数派观点。大多数经济学家提供了大量证据,证明教育对成年人的收入有显著影响。诚然,他们在这一点上基本正确,但这并不意味着我们可以忽视另一个事实:同样有大量证据表明,教育对成年人实际掌握的知识影响甚微。
这种认知盲点尤为令人费解,因为其实有一个清晰的解释可以同时解释这两组看似矛盾的证据。那就是:学校教育之所以有利可图,主要是因为它能够证明或者说传递就业能力的信号。大多数教育并非直接的职业培训,而是获得真正培训机会的通行证,而真正的培训是在工作中进行的。这就解释了为什么毕业对个人如此有利。你在学校最后几周可能学不到多少东西,但完成学业这一事实会让雇主对你产生信任。这也解释了为什么文凭的泛滥对国家整体回报如此微薄。除非学生在求学过程中真正掌握了长期有用的技能,否则仅仅颁发越来越多的高中、大学和研究生文凭,是无法让整个社会变得更加富裕的。
如果学校停课并不会使我们的孩子比疫情前更加无知,那么为何学校停课会被视为一场暂时的灾难呢?答案很简单:当学校关闭时,它们停止了履行其唯一无可争议的重要职能:提供日托服务。线下授课使父母能够专心致志地全职工作,照顾婴幼儿和老人,完成家务,甚至有时间放松自己。
学校停课实际上是对日常生活便利性的一次沉重打击。尽管你不太可能听到政客公开宣称「便利至上」,但行动胜于言辞。截至 2021 年 2 月,约 90% 的私立小学和初中已经恢复了线下教学。为什么会这样?很可能是因为他们深知家长们渴望线下教育带来的便利性。相比之下,同期只有不到一半的公立学校(它们依靠税收而非学费维持)完全恢复开放。许多大型学区的停课或混合教学模式甚至持续了一年多。虽然停课对教学质量的冲击还有待评估,但它对生活便利性的负面影响却是毋庸置疑的。
如果我们抛开一厢情愿的想法,冷静地反思新冠疫情期间教育领域的情况,我们可以得出两个深刻的教训。首先,疫情之前的学校已经辜负了纳税人的期望——它们获得了慷慨的资金支持,却未能为学生提供多少长期有用的知识。其次,疫情期间的学校表现更加令人失望——它们享受了大量的紧急拨款,却连最基本的日托服务都不愿意提供。
即便在疫情之前,美国学校每年在每个学生身上的支出就已超过 15,000 美元。那么,有什么办法能让我们的资金得到更有效的利用呢?最直接的方法就是大幅削减开支。美国的学校系统根本无法培养出真正的双语人才,那么为什么还要浪费宝贵的资源来维持这种假象呢?同样的道理也适用于大部分的课程设置。
私立学校的情况则恰恰相反。它们是否真能提高学生的考试成绩?现有的研究结果并不一致。然而,在新冠疫情期间,当家长们迫切需要托管服务时,私立学校迅速作出了响应。因此,教育券制度——即将资金直接投向学生而非教育系统——成为了另一种可能提高教育投入回报率的可靠方案。亚利桑那州已经实施了一项年均为每位学生提供约 7,000 美元的教育券计划,这既激励私立学校控制成本,又促使它们努力满足家长需求。学校选择制度不仅能在未来可能发生的停课情况下保护家庭利益,还能在教育领域出现任何其他问题时为家庭提供保障。尽管学校选择制并非解决一切问题的万能良方,但固守现状无疑是愚不可及的。
Bryan Caplan (@bryan_caplan) 是乔治梅森大学经济学教授,他的著作包括《开放边界》和《反对学校教育的依据》。
教学的艺术
原文:Teaching Teaching - by Bryan Caplan - Bet On It
在过去的三年里,我的大儿子们在西班牙语学习上取得了令人瞩目的进步,从几乎一窍不通到如今能够流利使用。考虑到我对外语教育的公开蔑视,这背后的故事确实值得一提。
我让他们从 9 年级开始学习西班牙语,主要原因是几乎所有顶尖大学的入学要求都包括 3-4 年的外语学习经历。从一开始,我的儿子们就计划通过西班牙语 AP 考试来证明自己的语言能力。我们都深知,仅仅应付考试是远远不够的,他们必须真正掌握大量西班牙语知识。尽管最初几个月的学习过程并不愉快,但幸运的是,我的儿子们渐渐喜欢上了这门新科目。然后他们变得痴迷……以一种积极的方式。如今,他们已经能够在西班牙和危地马拉上面向当地人的大学课程,使用西语原始资料撰写关于墨西哥历史的学术论文,而且他们之间的日常交流也主要使用西班牙语。
既然我们的应急在家上学计划中有这两位西班牙语高手,我认为让他们教导弟弟妹妹西班牙语可能会是一个很好的尝试。毕竟,弟弟妹妹们将来上大学时也需要掌握一门外语。
有趣的是:上周开始西班牙语教学时,我发现我的大儿子们虽然懂西班牙语,却不知如何教西班牙语。于是,我一边教他们如何教学,他们一边教授西班牙语。作为一名拥有 25 年专业教学经验的教师,这些教学原则对我而言已成为第二天性。然而,对于人生中首次尝试教学的人来说,这些原则并不显而易见。事实上,根据我的经验,超过半数的在职教师都未能真正内化这些原则。正如《黑客帝国》中墨菲斯告诫尼奥的那样:「尼奥,迟早你会和我一样意识到,知道路和真正走上路是两回事。」
有效教学的原则
-
确定你认为合适的教学难度。确定好了吗?好,现在将其降低十倍。请记住,作为教师,你觉得显而易见的内容,对学生而言可能并不容易理解。
-
如果你在麻省理工或加州理工这样的顶尖学府任教,这个难度可能刚好合适。但如果是在其他学校,再降低十倍。别忘了,即使是聪明人,初次接触新事物时也往往表现得很糟糕。
-
不要期望学生「能自己理解全部内容」。从讲解典型例题开始,然后以以蜗牛般的速度逐步深入。
-
在向学生展示了清晰的示例问题之后,布置一些稍有变化的练习题。鼓励他们积极动手,努力完成。
-
如果你学生的正确率不到 75%,说明你的题目还是太难了。这时候,你需要引导他们解决问题,这些问题应该简单到你无法想象他们是有多无能才做不出来。这不仅能提高学生的知识水平,也能锻炼你的想象力。
-
如果你学生的正确率在 75% 到 94% 之间,请为他们提供更多练习。练习,练习,练习。
-
如果你学生的正确率达到 95% 以上,就说明他们已为进阶学习做好充分准备。但即便如此,请记住,除个别具有严密递进关系的学科外,学生很可能会遗忘之前所学,除非你定期给他们提供复习练习。
-
切勿将逻辑等同于心理逻辑——并记住,在教学过程中,心理逻辑往往更为重要。这话怎么说?不要理所当然地认为,学生能够因为 A–>B 就理解 A–>B,哪怕对老师来说再明显不过。你的任务是让无知的学生觉得显而易见的知识显而易见。变换你的例子。混合搭配。转换角度。运用重复。运用重复。运用重复。
-
观察学生的表情。如果他们显得无聊,那你就要更有趣。讲笑话。自嘲。搞怪。夸张地表达所有情绪。放下自尊;教师要么是表演者,要么就是失败者。
-
观察学生的表情。若他们感到沮丧,请更加耐心。切勿在负面情绪之上再添负面情绪。若学生情绪低落,请以温和坚韧的态度作为榜样。绝无例外。绝无例外。绝无例外。
-
观察学生的表情。若他们感到努力似乎徒劳无功,便向他们推销你的学科。告诉他们学习这门学科将带给他们的益处,即便最诚实的回答仅是:「你需要这个来毕业。」
-
观察学生的表情。如果他们不信任你,赢得他们的信任。不要仅仅避免欺骗;保持坦诚。不要美化世界,即使是对小孩子。除非丑陋的真相会让他们做噩梦或让你被解雇,否则请平静地分享。
-
观察学生的表情。若无法解读他们的情绪,就向他们提问,进一步追问,了解他们已掌握的知识,探明他们的困惑所在,弄清他们是快乐、悲伤,还是认为你疯了。像天使一样接纳他们的回答,并根据实际情况调整教学方法,使之适应你所面对的学生。
-
严格执行纪律。如果你制定了计划,就要坚持执行。如果你宣布了惩罚,就要贯彻到底。如果你承诺了休息,就要如实兑现。教育是为了学生,但它不是民主的体现。认真倾听学生的意见,但改革必须建立在你立场坚定的基础之上。不要只是表现得慷慨,而要真正做到宽宏大量!如果你认为这与第 9 条原则相矛盾,请明白你的想法是错误的。要像小丑一样活跃气氛——但要像国王一样统治。
-
这些原则都是针对一对一教学进行优化的。如果你在教授更多的学生,你必须找到平衡点。你总会让某些人感到亏待。抱歉,这就是课堂——这是支持在家上学的另一个理由。
解释 FSRS(上篇):算法描述与运作原理
原文:FSRS explained, part 1: What it is and how it works : Anki (reddit.com)
如果你正在使用 Anki 但还没听说过 FSRS,那我来简单地给你介绍一下:它是一个新的调度算法,比 Anki 的默认算法更加灵活、准确。最近,FSRS 的新版本已经发布,它比之前更加精确,因此我决定写两篇关于 FSRS 的文章。
注:我并不是 FSRS 的开发者。我只是一个在 GitHub 上经常提交错误报告和功能请求的普通人。但我对 FSRS 非常了解,特别是 v4 版本的很多改动,都是我一手提议的。
等级 1:小白版
FSRS 采用了一个叫做 DSR 的记忆模型,全称是「难度(Difficulty)、稳定性(Stability)和回忆概率(Probability of Recall)」。如果你是 Piotr Wozniak 的话,可能会说成是「保留率(Retention)」或「可提取性(Retrievability)」。不过在他的术语中,「保留率」和「可提取性」又不是一回事……唉,要给这些概念起个好名字真不容易。
R 代表着用户根据某卡片的复习历史,在某一天回忆起这张卡片的概率。这个概率取决于自上次复习过去了多少天,以及 S。重要的是,任何诚实的间隔重复算法都得能预测 R,无论用什么方式(即使它不使用记忆稳定性)。否则,它不可能确定哪些间隔是最优的。
S 代表记忆稳定性,定义为 R 从 100% 降到 90% 所需的天数。越高越好。比如,S=365 意味着整整一年后,回忆某张卡片的概率才会降到 90%。估计 S 是最难的部分,这正是 FSRS 的核心所在。
D 代表难度。不同于其他两个变量,难度没有明确的定义,而是基于一堆与人类记忆理解不太相关的启发式方法来计算的。简单说,如果你按下「简单」,难度就下降;如果你按「困难」或「重来」,难度就上升。
这个模型最初是由 SuperMemo 的缔造者 Piotr Wozniak 提出的。几年前,u/LMSherlock(译注:正是在下)发表了一篇论文,也用到了这个模型。
等级 2:完整描述,但不涉及数学
对于任何给定的卡片,FSRS 都会进行以下操作:
如果这是首次复习:
-
根据评分——「重来」、「困难」、「良好」和「简单」,设置初始的记忆稳定性 S。这些初始值是经过特定方法优化后得到的,并作为参数传递给调度器。
-
计算初始难度 D。这个难度完全基于评分。
-
根据 S 和期望的回忆概率 R(由用户设置)来安排下一次复习。
若不是第一次复习该卡片:
-
计算复习时的理论(预测)回忆概率 R。它基于两个变量:从上次复习到现在过去的天数 Δt,以及复习时的记忆稳定性 S。
-
计算难度 D,但与第一次复习时的公式不同。D 基于两个变量:其先前的值和此次的评分。
-
根据 D、S 和 R 来获取复习后的新稳定性估计。每次成功的复习后(用户按下「困难」、「良好」或「简单」),稳定性都会提高或至少保持不变,但在失败后(用户按下「重来」)会降低。新的稳定性估值取决于四个变量:D、S、R 和评分。如果用户按「重来」,公式会有所不同。
-
根据 S 的新估值和期望的回忆概率 R(由用户设置)来安排下一次的复习。
等级 3:完整描述,包括数学
FSRS v4 的强项
-
得益于通用记忆公式与机器学习的结合,FSRS 能够适应任何用户的记忆和复习习惯,例如只使用「重来」和「良好」。所以你不需要改变自己的复习习惯。
-
FSRS 让你能够自己设置期望的回忆概率 R,这使得你可以在复习压力和长期记忆保留之间权衡。
-
FSRS 允许你提前或推迟复习,同时最小化对长期学习的影响。当你积压了大量的复习时,可以选择推迟;考试前,可以选择提前复习。但过于频繁的推迟/提前仍然可能造成伤害。如果你选择某天不学习,如周日,FSRS 也允许你有「休息日」。所有这些都得益于 FSRS 能够准确预测 S 和 R,即使复习太晚或太早。
-
FSRS 能帮助你准确估算目前大脑中掌握的知识量。这是任何其他插件都做不到的,因为它依赖于准确预测所有卡片的 R。
-
从标准的 Anki 调度器转到 FSRS 并不需要花上数月或数周——只需轻触按钮,卡片就可以被重新安排。不过,重新安排后的初始复习量通常较大。顺便说一下,这个辅助插件同时支持 v3 和 v4 版本。
-
如果你一直在为「学习步伐」、「毕业间隔」、「简单奖励」等参数的最佳值而烦恼,那么现在不需要再折腾了。优化器会为你找到最佳参数,再也不用手动调整了。
FSRS v4 的弱项
-
对于最简单的卡片(D=1)和最困难的卡片(D=10),理论上预测的 R 与实测的 R 存在较大偏差。这表明我们计算 D 的公式有待改进。尽管我们注意到了公式中的其他一些问题,但修正尝试都未能取得成功。
-
FSRS 要求很多复习数据(至少一千条,最好更多)才能准确优化其参数。如果你是新用户,还没有做过几千次的复习,优化器只会给你默认参数,这些参数可能适合也可能不适合你。
-
FSRS 的用户友好度不高。目前,它有三个模块:优化器(在 Google Colab 中为你找到最佳参数的部分)、调度器(你粘贴到 Anki 的代码)和助手插件,而目前还无法将它们合并成一个模块。除非 Anki 的开发者决定直接将 FSRS 整合到 Anki 中,否则这种情况不太可能改变。我敢赌 100 块,就算太阳成为红巨星并吞噬地球,也比这来得快。
-
虽然我说你不再需要手动调整任何参数,但如果你目前的学习步伐超过有超过 1 天的话,唯一需要更改的是将你的学习(和重新学习)步伐设置改为不超过 1 天。否则,你可能会遇到「困难」的间隔比「良好」或「简单」的间隔长的情况,这会导致辅助插件和调度器出现奇怪的行为。不幸的是,Anki 的数据库有些古怪,所以处于「学习」(和「重新学习」)阶段的卡片与处于「复习」阶段的卡片的处理方式不同,FSRS 调度器只能影响处于「复习」阶段的卡片。这也意味着「休息日」功能并不如名字所述,它只是让你选择的日子不再有「复习」卡片,但你仍然需要处理「学习」和「重新学习」的卡片。
在下篇,我将解释如何评估间隔重复算法的准确性。剧透一下:尽管这个 Reddit 版块上的人都在说需要随机对照试验,但实际上并不需要。真正需要的是大量的复习数据。
PS:如果你目前正在使用 FSRS v3,我建议你切换到 v4 版本。如何安装,请在此处查阅。
解释 FSRS(下篇):准确度
原文:FSRS explained, part 2: Accuracy : Anki (reddit.com)
如果你还没有读过上篇,我建议你先读一读:https://www.reddit.com/r/Anki/comments/15mab3r/fsrs_explained_part_1_what_it_is_and_how_it_works/
注:我并不是 FSRS 的开发者。我只是一个在 GitHub 上经常提交错误报告和功能请求的普通人。但我对 FSRS 非常了解,特别是新版本的很多改动,都是我一手提议的。
很多人都对 FSRS 的复杂性抱有疑虑,质疑它是否真的能比 Anki 的简易算法更准确。许多人觉得 Anki 设置的复习间隔已经够好了(但这纯粹是个神话)。要想公正比较,我们得有个合适的指标。你脑海中最先浮现的是什么指标?
我猜你会说是每天的复习量。但其实,这指标一点都不靠谱。它并不能真实反映间隔时间是否合理,而且太容易被操纵了。想降低复习量?那就随便设计一个算法,比如直接将前一个间隔乘以 100。如果之前间隔是 1 天,那你下次复习就得等 100 天。如果上次是 100 天,那下次你就得等 10,000 天后。与 Anki 比,复习量自然是减少了。但对于真正学习效果来说?那肯定是大打折扣的。
这意味着我们需要一个不同的指标。
首先,你得知道这一点:每一个诚实的间隔重复算法,必须能够根据一张卡片的复习历史,预测在特定时刻,回忆起它的概率(R)。但 Anki 的算法并不具备这功能。它不进行概率预测,无法评估哪个间隔是最优的,哪个不是。因为在没有计算回忆概率的方法时,你无法确定什么是「最优间隔」。如果一个算法不能预测 R,那么我们根本无法评估它的准确度。
因此,乍一看,似乎很难在 Anki 和 FSRS 之间进行有意义的比较,因为后者预测了 R,而前者没有。但其实,有个巧妙的方法可以将 Anki 给出的间隔(实际上,我们比较的是 SM2,而不是 Anki)转化为 R 值。具体结果会取决于你如何调整它。
如果你此刻在想:「肯定有一种直白的方法来比较这两种算法,而不需要一篇该死的 1500 字的长文来解释吧?」那我很抱歉,答案是「没有」。
不过,现在是时候介绍一个非常有用的工具了,它被广泛用于评估二分类器的性能:校准图。二分类器是一类算法,它输出一个介于 0 到 1 之间的数字,可以解释为某物属于两个可能类别中的一个的概率。例如,垃圾邮件/正常邮件、生病/健康、回忆成功/回忆失败。
以下是从 u/LMSherlock 集合中得出的校准图(FSRS v4),包含 83,598 条复习记录:
x 轴表示理论预测的回忆概率,y 轴表示实际测量的回忆概率。橙线代表一个完美算法。蓝线代表 FSRS。绿线只是一个趋势线,不必过于关注。
以下是其计算方法:
- 将所有复习记录按预测值分组。例如,从 1.0 到 0.95,从 0.95 到 0.90 等。
以下面的例子为例,我们把所有 0.8 到 0.9 之间的预测值放在一个组:
第一组(预测):[0.81, 0.85, 0.87, 0.87, 0.89]
- 对于每个组,测量复习记录的实际结果,是 1 还是 0。「重来」= 0。「困难/良好/容易」 = 1。别担心,这并不意味着你选择的「困难」、「良好」或「容易」没有任何影响。评分依然重要,只是在这里没那么重要。
第一组(实际):[0, 1, 1, 1, 1, 1, 1]
- 计算每个组内所有预测值的平均值。
第一组平均值(预测) = mean([0.81, 0.85, 0.87, 0.87, 0.89]) = 0.86
- 计算每个组内所有实际结果的平均值。
第一组平均值(实际) = mean([0, 1, 1, 1, 1, 1, 1]) = 0.86
对所有组重复上述步骤。组数的选择是任意的;上图用的是 40 组。
- 以预测的 R 值为 x 轴,测量的 R 值为 y 轴,绘制校准图。
橙线代表一个完美算法。如果某个事件发生的概率是 x%,而算法预测的概率也是 x%,那么这就是一个完美算法。预测的概率应该与实际(观察到)的概率相匹配。
蓝线代表 FSRS。蓝线与橙线越接近越好。换句话说,预测的 R 值与测量的 R 值越接近越好。
图表上方写着 MAE=0.53%。MAE 是平均绝对误差的英文缩写。可以理解为「预测误差的平均幅度」。0.53% 的 MAE 意味着 FSRS 的平均预测与实际情况只有 0.53% 的偏差。当然,MAE 越低越好。
简单地说,我们取预测结果,取实际结果,各自取均值,然后看两者之间的差异。
你可能会想:「等一下,当预测的 R 值小于 0.5 时,蓝线看起来就像垃圾!」但那是因为那个区域的数据实在太少了。这并不是 FSRS 的一个小缺点。事实上,几乎所有的间隔重复算法都会有这种表现,因为用户希望有较高的记忆保留率,于是开发者就制定了能产生较高保留率的算法。计算 MAE 时,需要根据各组内的复习数量对预测值进行加权,这就是尽管图表左下方部分看起来表现不太好,但 MAE 仍然很低的原因。
如果你对校准图仍然有些困惑,这里有一个简单的例子:假设天气预报说今天下雨的概率是 80%;如果今天没下雨,这并不意味着预测是错误的——他们并没有说他们有 100% 的把握。相反,这意味着在平均情况下,每当天气预报说下雨的概率是 80% 时,你应该预期这些日子里有大约 80% 会下雨。如果天气预报说「80%」的概率时,实际上只有 30% 的日子下雨,那就意味着他们的预测结果和实际结果之间校准得很差。
现在,我们得到了一个数字,告诉我们 FSRS 的准确度如何,我们可以对 SM2(Anki 所基于的算法)进行同样的操作。
蓝线代表 SM-2 算法,橙线代表完美算法。再次强调,不必关注绿线,它其实不太重要。
胜负已分。
为了比较,这里有一个 SM-17 的校准图(SM-18 是最新版本),来源于:https://supermemo.guru/wiki/Universal_metric_for_cross-comparison_of_spaced_repetition_algorithms
请注意,Wozniak 使用了不同的方法来绘制他的图,他并没有使用分组。而且,他称 R 为「可提取性」,而不是「回忆概率」,但这无关紧要。红线只是一个趋势线,并不代表「完美算法」。尽管在这种情况下,二者非常接近。
我听说很多人要求对 FSRS 和 Anki 进行随机对照试验(RCTs)。虽然随机对照试验非常适合药物和临床治疗的测试,但在间隔重复的背景下,它们并不是必需的。首先,要执行这样的试验难度极大,因为你需要组织数百乃至数千人参加。如果没有真正的研究机构协助,祝你好运。其次,这并不是适合这项工作的正确工具。这就像用冰淇淋勺子吃披萨。
你不需要数千人;相反,你需要数千条复习记录。如果你的集合至少有一千条复习记录(1000 是最基本的数量),那么你应该能够得到一个不错的 MAE 估计。这一过程在优化器中会自动完成;优化完成后,你可以在优化器的 4.2 节查看自己的校准图。
我们决定比较 5 种算法:FSRS v4、FSRS v3、LSTM、SM2(Anki 基于该算法)以及 Memrise 的「算法」(我简称其为 Memrise)。
Sherlock 实现了一个基于 LSTM 的算法(长短期记忆),这是一种常用于时间序列预测的神经网络,如预测股市价格、语音识别、视频处理等;实现的版本包含 489 个参数。实际上,你不能真正地在实践中使用它;它纯粹是为了基准测试而实现的。
下面的表格基于 FSRS wiki 的这一页。所有 5 种算法都在大约包含三百万条复习记录的 59 个集合上运行,结果基于每个集合中的复习记录数进行加权平均。
我很惊讶 SM-2 的表现只略微超过了 Memrise。至少 SM2 尝试自适应,而 Memrise 甚至没有尝试,只是给每个人相同的间隔。而且,FSRS v4 只有 17 个参数,但其表现却超过了具有 489 个参数的神经网络。尽管这里值得一提的是,我们正在比较一个经过精细调整的单一目的算法和一个根本没有经过精细调整的通用算法。
虽然还有改进的空间,但是很明显 FSRS v4 是所有选项中最好的。基于神经网络的算法不一定更准确。这并非不可能,但你显然无法用开箱即用的设置超越 FSRS,所以在特征工程和神经网络的架构上,你必须聪明点。那些不使用机器学习的算法,如 SM2 和 Memrise,在准确度上根本无法与使用机器学习的算法抗衡,它们唯一的优势是简单。说点题外话,Dekki 是一个使用神经网络的机器学习项目,尽管我告诉开发者参与我们的「算法竞赛」会很酷,但他要么是对此不感兴趣,要么只是忘记了。
PS:如果你目前正在使用 FSRS v3,我建议你切换到 v4 版本。如何安装,请在此处查阅。
美国公共教育束缚我们孩子的手段及目的
John Taylor Gatto
我在曼哈顿几所最差和最好的学校教了三十年书,在这期间,我成了研究无聊的专家。在我的世界里,无聊无处不在,我经常问孩子们,为什么他们感到如此无聊,他们总是给出相同的答案:作业愚蠢,毫无意义,他们早就知道了那些知识。他们说与其整天坐在教室里,他们更想切实地做些事情;老师们似乎对他们的学科知之甚少,显然也不想深入学习。孩子们是对的:他们的老师和他们一样无聊。
无聊厌倦是学校教师的常态,在教师休息室待过的人都可以证明,里面的教师萎糜不振、满腹牢骚和灰心丧气。毫不意外,教师们往往会把厌倦归咎于学生。教那些粗鲁且只对分数感兴趣的学生,谁不会感到厌烦呢?当然,学生们极度厌烦的十二年强制学校课程,教师们早已经历过,何况他们作为学校员工,被困在比强加给孩子们的更为僵化的体系中。那么,到底是谁的错呢?
我们都难辞其咎。我的祖父曾这样教导我。在我七岁的一个下午,我向他抱怨无聊,他狠狠地拍了我的头。他告诉我,永远不要在他面前再用那个词,如果我感到无聊,那是我的错,与他人无关。我要自己承当起自娱自乐和自学的责任,不知道这一点的人都是幼稚的,也要尽可能避开他们。当然,这种人也不值得信任。那次经历彻底治愈了我的无聊感,多年来,我也时不时把这门课传授给一些优秀的学生。然而,大多数情况下,我发现挑战「无聊和幼稚在教室里是自然的」这个官方观念是徒劳的。我经常不得不违背习俗,甚至违反法律,来帮助孩子们摆脱这个陷阱。
当然,教育官僚帝国会反击;幼稚的成年人常常将反对意见视为背叛。有一次,我休完病假回来,发现所有关于我请病假的证据都被故意销毁了,我丢了工作,甚至没了教师资格证。经过九个月的煎熬,当一位学校秘书作证目睹了整个阴谋时,我才重新获得资格证。在此期间,我的家人遭受了我难以想象的痛苦。1991 年,当我终于退休时,我有充分的理由证明,学校实际上是儿童工厂,长期像牢房一样强制监禁学生和教师。然而,我真的不明白为什么学校必须如此。我的亲身经历告诉我:如果我们愿意,我们可以轻松且经济地抛弃陈腐愚蠢的教学体系,建立新的体系,帮助孩子们接受教育,而不仅仅是接受学校规训。我们可以更灵活地安排时间、教材和考试,向孩子们介绍真正有才能的成年人,并赋予每个学生所需的自主权,让他们偶尔冒险,从而发展他们的好奇心、冒险精神、韧性和惊人的洞察力,这些是青春期最好的品质。许多教师也明白这些,但又因为害怕报复而保持沉默。
但我们没有这样做。我越是质疑,同时坚持像工程师那样思考学校教育的「毛病」在哪,我就越容易忽略重点:如果我们的学校没有「毛病」呢?如果学校无视教育常识和长期以来的经验一意孤行,并付出昂贵代价的行为,正是他们故意为之呢?乔治·W·布什在说我们「不让一个孩子掉队」时,是否无意中说出了真相?我们的学校是否在刻意阻止孩子真正长大成人?
我们真的需要学校吗?我不是指教育,只是强制性的学校规训:每天六节课,每周五天,每年九个月,持续十二年。这种死板的例行公事真的有必要吗?如果有必要,又是为了什么?不要把阅读、写作和算术能力当作借口, 200 万快乐的在家自学的孩子无疑已经让这种陈词滥调不攻自破。有相当多的知名美国人,即使从未经历过我们孩子目前经历的十二年折磨,他们也过得很好。乔治·华盛顿、本杰明·富兰克林、托马斯·杰斐逊、亚伯拉罕·林肯?肯定有人教过他们学习,但他们不是学校系统的产物,他们中没有一个人是从中学「毕业」的。在美国历史上大部分时间里,孩子们通常不上高中,然而那些没有受过学校教育的人也成为了海军上将,如法拉格特;发明家,如爱迪生;工业巨头,如卡内基和洛克菲勒;作家,如梅尔维尔、马克·吐温和康拉德;甚至学者,如玛格丽特·米德。事实上,就在近代,年满十三岁的人就不再被视为孩子了。艾丽尔·杜兰特与她的丈夫威尔合著了一部世界史巨著,她在十五岁时就幸福地结婚了,谁敢声称艾丽尔·杜兰特是一个未受教育的人呢?她也许没有受过学校教育,但并非未受过教育。
我们在这个国家被灌输(即学校驯化)将「成功」等同于「学校教育」,或者至少依赖于「学校教育」,但从历史上看,在知识或经济意义上并非如此。世界上许多人找到了自我教育的方法,而无需诉诸于经常像监狱一样的强制性普及教育系统。那么,为什么美国人会把教育与这样的系统混为一谈呢?我们公立学校的真正目的是什么?
强制性的大规模学校教育在美国真正扎根是在 1905 年至 1915 年之间,尽管它的构想要早得多,并在整个 19 世纪大部分时间里都在被推行。造成这种家庭生活和文化传统巨大变革的原因,大致可以归结为三个方面:
-
培养好人。
-
培养好公民。
-
使每个人都完全发挥自己的潜能。
尽管学校实际上往往难以达成这些目标,这些目标至今仍被频繁提及,我们大多数人或多或少地接受它们,作为公共教育使命的体面定义。但我们大错特错了。雪上加霜的是,国内文献中关于强制学校教育真正目的的论述不胜枚举,而且惊人地一致。例如,伟大的 H. L. Mencken 在 1924 年 4 月的《美国水星》杂志中写道,公共教育的目的并非向年轻人传授知识并启迪智慧……事实远非如此。其目的仅仅是尽可能地将个体降低到同一安全水平,培养和训练标准化的公民,压制异议和创新。这是公共教育在美国……以及其它任何地方的目的。
考虑到 Mencken 是一名讽刺大师,我们或许会误以为这段文字只是夸张的讽刺。然而,他的文章深入探讨了我们教育体系的根源,追溯到那个虽已消逝却永远不会被遗忘的军事强国——普鲁士。尽管 Mencken 清楚我们刚与德国(普鲁士文化的继承者)交战,他在这里的态度却是极其严肃的。我们的教育体系确实起源于普鲁士,这一点确实令人担忧。
一旦你留意,就会发现一个奇怪的事实:我们的学校有着普鲁士血统的证据比比皆是。William James 在本世纪初就多次提到这一点。Christopher Lasch 在 1991 年的著作《真正且唯一的乐园》中的主人公 Orestes Brownson,早在 19 世纪 40 年代就公开反对美国学校的普鲁士化。Horace Mann 在 1843 年向马萨诸塞州教育委员会提交的《第七次年度报告》,实际上是对腓特烈二世的普鲁士的赞美,并呼吁将那里的教育体系引入美国。考虑到我们早期与那个理想国的联系,普鲁士文化在美国的影响力巨大并不令人意外。在独立战争期间,一位普鲁士人担任了华盛顿的助手,到了 1795 年,已有众多讲德语的人在此定居,以至于国会考虑出版德语版的联邦法律。但令人震惊的是,我们竟如此热切地采纳了普鲁士文化中最糟糕的方面:一个故意设计来生产平庸智力、残害精神生活、显著地剥夺学生的领导力,并确保公民顺从且残缺的教育体系——这一切都是为了使民众「易于管理」。
我从 James Bryant Conant 那里首次了解到美国学校教育的真正目的。Conant 在哈佛大学担任了二十年的校长,还是一战时的毒气专家,二战中原子弹项目的执行官,二战后美国驻德国高级专员,堪称二十世纪最具影响力的人物之一。没有他,我们可能不会有今天这种教育风格和标准化测试,也不会有,像位于科罗拉多州利特尔顿,著名的哥伦拜恩高中那样,一次容纳 2000 到 4000 名学生的大型高中。我退休后不久,偶然读到 Conant 在 1959 年的长篇论文《儿童、父母与国家》(The Child the Parent and the State),他不经意间提到现代学校是 1905 年至 1930 年间的「革命」产物,我对此感到非常好奇。革命?他没有详细说明,但确实指引好奇者和不知情者去阅读 Alexander Inglis 在 1918 年的著作《中等教育原理》(Principles of Secondary Education),书中提到「人们通过一位革命者的眼睛看到了这场革命」。
Inglis(哈佛大学的教育讲座就是以他的名字命名的)明确指出,这片大陆上的强制学校教育和 19 世纪 20 年代普鲁士的目的一样:成为新兴民主运动中的第五纵队(第五纵队指隐藏在对方内部、尚未曝光的敌方间谍),新兴民主运动威胁要赋予农民和无产阶级在谈判桌上的发言权。现代工业化的强制学校教育,旨在外科手术式地切割下层阶级未来可能的团结。
学校教育通过学科、年龄分组、持续的考试排名以及其它许多更微妙的方式来分化孩子,无知的大众在童年时期就被分离,他们重新整合成一个危险的集体的可能性就大大降低了。
Inglis 将现代学校教育的真正目的细分为六个基本功能,对于那些天真地相信前面提到的三个传统目标的人来说,任何一个都足以让他们大吃一惊:
-
调节或适应功能。学校旨在培养对权威的固定反应习惯。这当然完全排除了批判性判断。它也几乎摧毁了教授有用或有趣材料的想法,因为通过让孩子们学习去做愚蠢且无聊的事情,你才能测试他们是否具有条件反射般的服从性。
-
整合功能。这完全可以被称为「规训功能」,因为其目的是使孩子们尽可能相似。随大流的人是可预测的,这对于那些希望驾驭和操纵大量劳动力的人来说非常有用。
-
诊断与指导功能。学校旨在确定每个学生在社会中的适当角色。这是通过在档案上记录数字和轶事证据来完成的。就像「你的终身档案」。是的,你确实有一份。
-
区分功能。一旦他们的社会角色被「诊断」,孩子们就会被根据角色分类,并只接受与其在社会机器中的位置相称的培训——绝不多走一步。所以,让孩子完成自我实现的想法就到此为止了。
-
选择功能。这并不是指个人选择,而是指达尔文的自然选择理论,该理论适用于他所谓的「优势种族」。简而言之,这个想法就是,通过有意识地尝试改良种群,来加速自然选择的过程。学校的目的是通过低分和补课等惩罚措施,给不合格的学生贴上标签,让他们的同学确信他们低人一等,然后高效地把他们排除在折偶范围之外。从一年级就开始,所有这些不起眼的羞辱都是这个目的:把污垢冲进下水道。
-
预备教育功能。这些规则所暗示的社会系统需要一个精英团队来管理。为此,一小部分孩子将悄悄地被教导如何管理这个持续的项目,如何监督和控制一群被愚弄和驯化的民众,政府便可安然运作,而公司永远不缺温顺的劳动力。
不幸的是,这就是我国强制公共教育的目的。为了避免你认为 Inglis 是一个孤立的、过于愤世嫉俗的教育批评者,你应该知道他并非孤军奋战。Conant 本人,基于 Horace Mann 等人的理念,不懈地为设计一个沿同样路线的美国学校系统而奋斗。像 George Peabody 这样的人,资助了整个南方的强制学校教育,他们肯定明白,普鲁士系统不仅有助于创造无害的选民和温顺的劳动力,还能培养出一群无脑的消费者。随着时间的推移,许多工业巨头认识到通过公共教育培养和管理这样一群人可以获得巨大的利润,其中包括 Andrew Carnegie 和 John D. Rockefeller。
现在你知道了。我们不需要卡尔·马克思关于阶级斗争的概念,就能看到,无论是复杂管理、经济还是政治,它们的利益都在于愚弄、打压和分化民众,如果不服从就抛弃他们。可以用阶级来表述这个问题,就像 Woodrow Wilson,当时的普林斯顿大学校长,在 1909 年对纽约市学校教师协会所说的那样:「我们希望一类人接受自由教育,而我们希望另一类人,一个在每个社会中人口都非常庞大的阶级,放弃自由教育的特权,使自己适应困难体力劳动。」但推动这些令人作呕的决策的动机根本不需要基于阶级。它们可能纯粹源于恐惧,或者现在为人熟知的「效率」至上的信念,而不是爱、自由、欢笑或希望。最重要的是,它们可能源于纯粹的贪婪。
毕竟,一个以大规模生产为基础、有利于大公司而非小企业或家庭农场的经济体中,蕴藏着巨额财富。但大规模生产需要大规模消费,而在 20 世纪初,大多数美国人认为,购买实际上不需要的东西反常又愚蠢。此时,强制学校教育简直是天赐之物。学校不必直接给孩子们灌输消费意识,因为它做得更好:它鼓励他们根本不去思考。这使得他们成为现代时代的另一项伟大发明——市场营销的活靶子。
现在,你不必学习营销就知道,有两类人总是可以被说服去过度消费:成瘾者和儿童。学校在将我们的孩子变成成瘾者方面做得相当不错,但在阻止我们的孩子长大成人方面做得更加出色。这并非偶然。从柏拉图到卢梭再到我们自己的 Inglis 博士的理论家们都知道,如果把孩子们隔离在一起,剥夺他们的责任感和独立性,鼓励他们只发展贪婪、嫉妒、嫉妒和恐惧这些次要的情感,他们就只会长成巨婴。在 1934 年版的他那本曾经著名的书《美国公共教育》(Public Education in the United States)中,Ellwood P. Cubberley 详细描述并赞扬了连续扩建学校的策略如何将儿童期延长了两到六年,而强制学校教育在当时仍然相当新奇。这个 Cubberley ——他是斯坦福大学教育学院院长,Houghton Mifflin 出版社的教科书编辑,以及哈佛大学的 Conant 的朋友和通信者——在他的 1922 年版的《公共学校管理》(Public School Administration)一书中写道:「我们的学校是……工厂,在那里原材料(孩子)将被塑造和成型……而学校的业务是根据既定的标准加工学生。」
从我们当今的社会来看,那些标准是什么已经显而易见了。在我们生活的各个方面,心智成熟几乎都消失了。简易的离婚法律让我们不必尽力维持婚姻;宽松的信贷消解了财务自律;触手可及的娱乐消除了取悦自己的需要;敷衍的答案消灭了好奇心。我们已经成为一个儿童般的国家,乐于放弃我们的判断和意志,接受政治劝诫和商业诱惑,这些对成年人来说都是侮辱。我们购买电视,然后购买在电视上看到的东西。我们购买电脑,然后购买在电脑上看到的东西。我们购买 150 美元的运动鞋,不管我们是否需要,当它们很快破损时,我们再买一双。我们驾驶 SUV,并相信了它们构成某种人寿保险的谎言,即使我们负债累累。而最糟糕的是,当 Ari Fleischer 告诉我们「要小心你说的话」时,我们连眼都不眨一下,即使我们记得在学校里被告知美国是自由之地。我们也简单地相信(buy)了这个说法。正如预期的那样,我们的学校教育已经做到了这一点。
现在来说好消息。一旦你理解了现代学校教育的逻辑,它的伎俩和陷阱就相对容易避免。学校训练孩子们成为员工和消费者;那就教你的孩子成为领导者和冒险家。学校训练孩子们本能地服从;那就教你的孩子批判且独立地思考。顺服校驯的孩子难以忍受无聊;那就帮助你的孩子发展精神生活,这样他们就永远不会感到无聊。督促他们学习历史、文学、哲学、音乐、艺术、经济学、神学中的专业知识,所有学校教师都不愿意教的知识。让你的孩子在大量的独处中挑战自己,让他们学会享受独立,和内心对话。顺服校驯的人习惯性地害怕独处,他们在电视、电脑、手机和昙花一现的浅薄友谊中寻求忠贞不渝的陪伴。你的孩子完全可以过上更有意义的生活。
然而,首先,我们必须看清学校的本质:操纵幼小心灵的实验室,培养企业社会所需的习性和态度的训练中心。强制教育只是顺带教育孩子,其真实意图是将他们变成仆人。不要让你的孩子延长童年,哪怕是一天。如果 David Farragut 能在十几岁时就指挥一艘被俘的英国战舰,托马斯·爱迪生能在十二岁时出版一份报纸,本杰明·富兰克林能在同样的年龄成为一名印刷学徒(然后自己完成足以让耶鲁大学高年级学生窒息的课程),那么你的孩子能有多大成就也是难以想象的。在经历了漫长的一生和三十年的公立学校生涯之后,我得出的结论是,天才就像泥土一样普遍。我们还没有弄清楚如何管理受过真正教育的人,就只能抑制天才。大道至简,我的解决方案就是:让他们自我管理。
学校教的七堂课
原文:Seven Lessons Taught in School - by John Taylor Gatto | Wanderings
演讲者:John Taylor Gatto
1991 年纽约州年度最佳教师
请叫我 Gatto 先生。26 年前,那时也没别的更好的事可做,我试着当了一名学校老师。我的教师资格证上明明白白地写着,我是一名英语语言及文学教师,但我实际从教的内容根本不是这些。我教的不是英语,而是学校——教得还挺出色,因此获了奖。
在不同的地方,教学意味着不同的东西,但从哈莱姆区到好莱坞山,有七堂课却是普遍教授的。它们组成了一套全国统一必修课程,你为之付费的方式之多超乎想象,所以你最好知道这些课到底教了些什么。当然,对于这些课程内容,你可以持任何看法,但请相信我,我此番陈述绝无半点讽刺之意。这就是我教的东西,就是纳税人花钱请我来教的。你且随意评说吧。
1. 混乱
几天前,印第安纳州杜博伊斯的 Kathy 女士给我写了封信,信中写道:
「**对小孩子来说,有哪些大道理最重要?**我认为,最重要的是让他们明白,他们所学的知识并非杂乱无章——这一切都有其内在规律,不会像一场倾盆大雨,让他们手足无措,淋成落汤鸡。他们要做的,就是理解并整合这些知识。」
Kathy 搞错了。我教授的第一堂课就是「混乱」。我教授的所有内容都脱离背景。我教授的是打破万物之间的一切联系。我教授的是割裂性。我教的太多了:天体运转、大数定律、奴隶制、词类修饰、建筑制图、舞蹈、体育、合唱、集会、意外来宾、计算机语言、家长会、教师培训日、分科教学、让学生跟(可能一辈子再也不会见到的)陌生人接受辅导、标准化考试、在现实生活中绝不会存在的按年龄隔离授课……这些东西之间能存在什么有机联系吗?
即便是在最好的学校,如果你仔细审视它的课程设置和教学安排,也会发现其中缺乏内在的连贯性和逻辑性,充斥着自相矛盾之处。所幸孩子们还没掌握足够的词汇来准确表达他们的感受,否则他们会直言不讳地说出在面对那些违背教育基本规律、却被冠以「高质量教育」之名的做法时,内心深处的恐慌和愤怒。学校思维的逻辑是,当学生毕业离校时,掌握一箩筐经济学、社会学、自然科学等学科的皮毛术语,要比怀揣满腔热忱更加有用。然而,优质教育的内涵应该是让学生对感兴趣的领域进行深入系统的钻研和探索。孩子们被众多陌生成年人强加的混乱所困扰,这些成年人各自为政,彼此间联系微弱,而且常常假装拥有(但实际上并不具备的)专业知识。
追寻有意义的知识,而非孤立的事实,是每个精神正常的人类的天性,教育则是将原始的事实转化为意义的编码过程。然而,学校却用千拼凑的课程和对死板事实理论的迷恋,掩盖了人的这种天性和教育的初衷。这种弊端在小学阶段尤其难以察觉。小学的教学体系看似有条不紊,孩子们天真地以为老师要求他们「学这学那」,都是有意义的安排,稚嫩的孩童还无法分辨学校里的种种教学活动背后空洞乏味的实质。
反观生活中那些连贯有序的自然过程,如孩童牙牙学语、蹒跚学步;追逐日升日落的自然光影;目睹铁匠农夫裁缝的古老手艺;观察母亲准备感恩节大餐时忙碌的身影——这些过程环环相扣、浑然一体,每个环节彼此映衬、互为注脚,串联起过去和未来的意义。
学校的学习过程则大相径庭,每门课程内部,以及不同学科之间,都缺乏内在的逻辑和联系。这些课程设置荒唐透顶,毫无明确理由,也经不起任何细究。由于一切都必须无条件接受,很少有老师敢于培养学生的批判性思维,质疑学校或老师的教条。学校科目的学习,如果真能称之为学习,就像机械地背诵教义,或记忆英国国教的三十九信条一般。
我所教授的,就是要将万事万物割裂开来,使其支离破碎,与内在的统一性背道而驰。与其说我是在建构秩序,倒不如说是在编排一台电视节目。在这个家庭关系日渐式微的世界里,父母长年在外奔波,不是频繁搬迁,就是更换工作,满腔的野心,或是其他种种,让人们无暇顾及家庭,陷入无尽的混乱之中。面对这一切,我要教你坦然接受混乱,将其视为命中注定。这就是我教的第一课。
2. 班级地位
我教的第二课是班级地位。我教导学生必须留在他们所属的班级。我不知道谁给他们划分了班级,这也不关我的事。每个孩子都编上了号,这样如果谁逃跑了,就可以被遣送回正确的班级。多年来,学校编号的方式层出不穷,每个孩子身上的数字之多,几乎掩盖了他们的真实面目。编号工程俨然已成利润丰厚的大生意,其真正意图却难以捉摸。我甚至不知道为什么家长面对学校如此对待自己的孩子,却默不作声,毫无异议。
当然,这也不关我的事。我的工作,就是要让他们心甘情愿,与自己编号相同的孩子关在一起。或至少要能像训练有素的运动员一样,忍气吞声。如果我干得好,他们甚至无法想象自己身处别处,因为我已经向他们展示了如何嫉妒、畏惧更好的班级,如何蔑视更差的班级。在这套严密而有效的规训下,全班学生就会自觉维系既有的等级秩序,进行自我管理。这就是学校这种操纵竞争的课程所要教授的——让你明白自己的位置。
尽管整体课堂蓝图假定 99% 的学生会安分守己地待在自己所在班级,我还是会公开而努力地敦促他们考出更优异的成绩,暗示只要高分就能被调到更好的班级,以此作为奖赏。我时常含沙射影地表示,未来的雇主会看重他们的考试分数和成绩等级来决定录用,尽管我自己的经历告诉我,雇主并不在乎这些。我从不公然撒谎,但我逐渐意识到,正如苏格拉底千年前所言,真理与学校教学在本质上是水火不容的。编号班级所传授的课程内容是——每个人在金字塔里都有固定的位置,除非分数变魔术般飙升,否则你无法离开自己的班级。如果做不到这点,你就必须留在你被安置的地方。
3. 冷漠
我教给学生的第三课就是冷漠。我教他们不要对任何事物太过用心,哪怕他们表面上装出很在乎的样子。我用相当隐晦的方式来达到这一目的——要求他们全身心投入我的课程,兴奋地坐立难安,激烈地争夺我的青眯。看到他们那副模样,我也感到一丝欣慰;这给所有人都留下了深刻印象,我自己也不例外。状态最佳时,我会为了营造出这种热情而精心设计教案。但是下课铃一响,我便会强硬要求他们立即停下手头的任何事,赶紧进入下一节课。他们必须像电灯开关那样说开就开,说关就关。在我的课上,从未完成过什么真正重要的事情,据我所知其他课堂也是如此。
除了分期付款,学生们从未真正拥有过一次完整的体验。
**铃声传递的课程其实是:没有什么事情值得完成,所以又何必要全心全意地投入呢?除极少数最顽强的学生之外,持续多年的铃声会让的所有人习惯于这样一个现实:你再也找不到真正有意义的事情可做了。铃声隐藏着学校教育的秘密逻辑,而这种逻辑是如此残酷无情。**铃声摧毁了过去和未来,让每一个时间段都变得千篇一律,就像地图上将群山大河简化为抽象符号,让它们失去了原本的风貌。铃声给每一次努力都烙下了冷漠的印记。
4. 情感依赖
我教的第四课就是情感依赖。我用小红星、勾号,微笑和皱眉,奖赏、荣誉和耻辱来教导孩子们臣服于既定的指挥系统。在校园中,权利可以被任何权威随意给予或剥夺,学生无权申诉。正如最高法院所裁定的那样,除非得到校方许可,否则学生在校内没有任何权利,就连言论自由也不例外。作为老师,我时常干预学生的个人决定,我可以批准自己认为合理的请求,也可以因为学生的行为可能威胁我的管控而发起纪律处分。儿童和青少年总是不断地坚持自己的个性,因此我需要快速而频繁地做出裁决。个性与分级理论格格不入,是所有分类体系的克星。
以下是一些常见的表现方式:借口上厕所而偷偷溜号享受片刻私人时光,或者以需要喝水为名在走廊里偷得片刻闲暇。我心知肚明,但我允许他们这样欺骗我,因为这能让他们习惯于依赖我施予的恩惠。有时,学生会因为一些不为我所知的事情而愤怒、沮丧或高兴,他们的自由意志就这样摆在我面前;教师不能承认这种权利,只能承认可以收回的特权,让学生成为良好行为的人质。
5. 智力依赖
我教的第五课是智力依赖。「优秀」的人就是乖乖等候老师发号施令的人。这是最重要的一课——我们必须仰赖受过更多训练的他人,来赋予自己的人生意义。所有重大抉择全由「专家」做主;而身为老师的我,才有权决定你们究竟该学什么——其实,这些抉择权最终掌握在那些给我发薪水的人手里,我只是奉命行事罢了。假如有人告诉我「进化论是个不容置疑的事实而非一个理论」,我就得照单全收,把这个「真理」灌输给学生,至于那些敢于质疑、不肯接受的人,就只有受罚的份。这种主宰学生思想的权力,使我轻而易举便能分出所谓的优等生和劣等生。
优等生毫不怀疑地接受我给他们安排的思考任务,既不抵触,还要表现出一定的热情。在数百万个值得学习的知识中,究竟选什么来教,全由我一手掌控;确切地说,是由幕后雇佣我的人说了算。反正这些选择取决于他们,我又何必横加争辩呢?在教书育人的过程中,好奇心根本无关紧要,惟有服从,才是至关重要的。
当然,劣等生会反抗。尽管他们并不真正明白自己在反抗什么,却坚持要自行决定学什么、什么时候学。作为学校教师,我们怎能坐视这种情形发生?幸好,总有办法能让这些学生乖乖就范。如果他们有父母愿意出面维护,事情会变得棘手一些;但即便学校的声誉不佳,这类状况也日渐稀少了。在我二十六年的教学生涯里,从没见过哪怕一个中产阶级家长真的相信自己的孩子就读的是所差学校。一个也没有,着实令人惊讶。这恐怕就是最能证明那七堂课影响的结果了:当父母自己也曾在学校受过完整的洗礼,他们的家庭也必将随之改变。
**「优秀」的人总是等待专家告诉他们该做什么。**毫不夸张地说,我们的整个经济体系都建立在这一课之上。试想一下,如果孩子们不再接受「依赖他人」的训练,许多行业恐怕难以为继:社会服务业或将后继无人,难逃与其共生的那段历史一同湮灭的命运;心理咨询师和治疗师会惊恐地发现,前来求助的精神残疾者竟渐渐稀少;一旦人们重拾自娱自乐的能力,包括电视在内的商业娱乐形式势必日渐衰败;倘若人们重新亲自采买食材烹饪佳肴,不再依赖他人,餐饮业、食品加工业及其他相关行业的规模都将大幅缩水。假如学校不再年复一年地培养出无助的毕业生,那么现代法律、医疗、工程等众多行业恐怕也难以维系,服装业和教育行业亦难幸免。
如果你还在期盼薪水照常发放,最好别太急于投票支持学校改革。毕竟,我们早已适应了这种生存之道——唯命是从,因为我们不知道自己该做什么。这是我所教授的最重要的一课。
6. 临时的自尊
我教的第六课就是临时的自尊。如果你试过对付一个桀骜不驯的孩子,而他的父母已经让他相信他们无论如何都会爱他,你就知道要让一条自信的灵魂服从有多难。如果社会上人人自信,恐怕这个世界撑不了多久。所以我教导学生,你的自尊必须应该取决于专家的意见。我的学生无时无刻不在被打分和评判。
学校会给家长寄去一份内容详实的月度报告,要么表扬孩子有进步,要么一个百分点一个百分点地告诉家长该对孩子失望到什么程度。「好」学校的运行法则,与商业社会如出一辙,都是靠让人持续不满为生。尽管这些数字记录背后付出的心血少得可怜,但它们客观公正的外衣积累起来的威力,足以迫使孩子听信旁观者轻率的判断,对自己和未来做出种种决定。纵观古今中外的哲学体系,自我评判从来都是不可或缺的题中之义,在学校教育中却从未被纳入考量。成绩单、分数、考试传递的信息只有一个:孩子不该相信自己或父母的判断,而必须唯命是从,让官方认证的权威人士给你的人生定分量。大众需要被告知他们的价值。
7. 无所遁形
我教的第七课是无所遁形。我教导孩子们,他们时刻处在监视之下,所有人都在我和同事们持续不断的监控中。孩子们没有私人空间,没有私人时间。为了将学生之间的交往保持在最低水平,课间休息仅持续 300 秒。我们鼓励学生互相告发,甚至告发自己的父母。当然,我也鼓励父母举报孩子的不当行为。一个接受告密训练的家庭,不太可能隐瞒任何危险的秘密。
我布置了一种延伸的学校教育,叫做「家庭作业」,将监控的效果渗透到学生的私人家庭中。否则,他们可能会利用课余时间向父母学习,或是通过自主探索、向社区里睿智的长者学习一些未经学校授权的内容。在学校看来,任何偏离学校教育理念的行为都是魔鬼的诱惑,会让学生无所事事,误入歧途。
持续的监视、对隐私的剥夺背后的深意是,任何人都不值得信任,个人隐私是非法的。监视是一项古老的必然要求,得到了众多有影响力思想家的推崇,成为《理想国》《上帝之城》《基督教要义》《新亚特兰蒂斯》《利维坦》等著作的核心教义。这些没有子女的作者都得出了相同的结论:要让社会处于严格的中央集权控制之下,就必须密切监视孩子们。如果你不能让孩子们加入穿制服的军乐队,他们就会跟随私人鼓手。
II
政府垄断的强制大众学校教育取得了伟大的胜利,即便在我最优秀的教师同事和学生家长中,也只有极少数人能够设想一种不同的教育模式。「孩子们必须学会读写,不是吗?」「他们必须掌握加减法,不是吗?」「如果想保住工作,他们必须学会服从命令。」
就在几代人之前,美国的情况还截然不同。创新和多样性比比皆是;不受条条框框束缚的自由,使我们成为全世界仰慕的奇迹;社会阶层之间的藩篱并非难以逾越;国民个个自信满满、创意迸发,能够独立自主地思考问题,独立自主地行动。我们是独一无二的,我们这些美国人,无需政府对我们的生活指手画脚,无需各种机构告诉我们该如何思考、如何感受。我们是独特的个体,我们是卓尔不群的美国人。
然而,自南北战争前夕起,我们的社会就逐渐被中央集权所控制,而这样一个社会需要强制学校教育和政府垄断教育来维系自身。在这一趋势出现之前,学校教育在任何地方都未曾受到如此重视。我们有学校教育,但程度有限,完全取决于个人意愿。即便如此,人们依然能够出色地掌握读写和算术;一些研究表明,在美国独立战争期间,至少在东海岸的非奴隶人口中,识字率几近百分之百。Thomas Paine 的《常识》在 300 万总人口中售出了 60 万册,而当时奴隶占了五分之一,契约仆人占了二分之一。
**殖民者是天才吗?**并非如此。事实上,只要学习者渴望且自愿,传授阅读、写作和算术只需大约一百小时。诀窍是等人主动求教,然后趁热打铁快速开始。数以百万计的人靠自学掌握这些技能,其实并非难事。1850 年的五年级数学或修辞课本可媲美今日大学水准。对「基础技能」训练的呼声不绝于耳,实则是烟雾弹,让学校得以霸占孩子 12 年光阴,向其灌输我刚刚描述的七堂课。
自内战以来,我们的社会逐渐受到中央集权的控制,这种控制渗透到我们的方方面面:衣食住行,甚至横贯东西海岸的公路指示牌,无一幸免。我认为,美国当前盛行的毒品滥用、自杀、离婚、暴力、残酷行为,以及阶级向种姓固化的趋势,都是我们生活的异化、个人、家庭和社区重要性不断削弱的结果,而这种削弱正是源于中央集权。庞大的强制性机构如黑洞般汲取,直至榨干最后一滴资源。学校剥夺了我们的孩子在社区生活中扮演积极角色的机会——事实上,它通过将儿童的教育托付给所谓的认证专家,瓦解了社区——这样做的结果是,我们的孩子无法全面发展成为完整的人。亚里士多德曾言,如果不能在社区生活中扮演完全积极的角色,一个人就无法成长为健康的人。他的观点无疑是正确的。如果你想要一个例证,不妨在下次经过学校或老年人社区时环顾四周。
学校按其设立的初衷,是为了支持一种社会工程愿景的基本系统。在这个愿景中,大多数人沦为金字塔基座的砖瓦,供奉着塔尖的统治阶层。学校巧妙地将这种金字塔式的社会结构伪装成不可违逆的定律,尽管这完全背离了美国独立的初心。从殖民时代到共和国时期,我们几乎没有真正意义上的学校——读一读本杰明·富兰克林的自传,你会领略到一个无暇蹉跎于校园的人的风采——然而,民主的曙光虽然升起,我们最终还是背弃了这一诺言,转而追随古埃及法老的图谋:全民必须俯首听命。这就是柏拉图在《理想国》中不情愿地传达的秘密。当格劳孔和阿德曼图斯请求苏格拉底勾勒一个由国家全面掌控人民生活的方案时,苏格拉底说:「我可以向你们展示如何缔造这样一个狂热的城邦,但恐怕你们不会喜欢我要说的话。」就这样,传授七堂课的学校蓝图初具雏形。
当下关于是否要设立国家统一课程的争论纯属子虚乌有。实际上,上述七堂课已经锁定了全国统一课程。这种课程必然瘫痪身体、思想和灵魂,无论教学内容如何变革,都无力扭转其戕害。在当前社会对学业不佳的歇斯底里中,讨论的焦点都偏离了本质。学校实际上在尽职尽责地执行着既定使命:让你做一个恪守本分的「好埃及人」,在你该待的地方待好。
III
这一切都非命中注定,亦非不可改变。培养年轻一代的路径有很多,并无唯一正解。如果我们能够突破金字塔式等级制度的幻象,定会觉察这一点。尽管面对媒体持续不断地宣传相反的神话,但事实上并不存在威胁我们国家生存的生死攸关的国际竞争,尽管这个想法很难被接受,更别说相信了。我们的国家在各个重要物质领域,包括能源,都能实现自给自足。我知道这个观点与当前最流行的政治经济学思想相悖,但他们口中所谓经济「深刻转型」,既非不可避免,亦非不可逆转。全球化经济学并未触及公众对有意义工作、可负担住房、优质教育、充分医疗、洁净环境、诚信问责的政府、社会文化复兴或朴素正义的诉求。所有全球化的野心,皆建立在脱离普通人现实的生产力与美好生活定义之上,我坚信这种定义是错误的。如果人们能够看到另一种选择,大多数人定会赞同我的看法。如果我们能重拾一种哲学,去发现真正意义所在——在家庭中,在朋友间,在季节的更迭中,在大自然中,在简单的仪式和习俗中,在好奇心、慷慨、同情心和服务他人的行为中,在体面的独立和隐私中,在所有免费和廉价的事物中,真正的家庭、真正的友谊和真正的社区就是由这些构建的——那么我们自给自足,甚至无需那些全球化「专家」坚持要我们关注的物质「充裕」。
这些令人不安的场所,这些被称为「学校」的机构,究竟是如何诞生的?长久以来,非正式的学校教育就以各种形式存在于我们的社会中,充当成长过程中一个温和有用的辅助角色。但如今我们所熟知的「现代学校教育」,实际上源自 1848 年和 1919 年两次令人谈虎色变的「红色恐慌」。当时,一些强大的利益集团惶恐不安,担心国内的产业工人会揭竿而起,掀起革命。另外,现代学校教育的兴起,部分原因还要归咎于美国的传统家庭。他们对 19 世纪 40 年代大举涌入的凯尔特人、斯拉夫人和拉丁裔移民带来的异质文化,以及天主教信仰,都难以接受。当然,建立一个号称学校的儿童「囚笼」,还有第三个推波助澜的因素,那就是南北战争后,当这些「美国人」目睹非裔美国人开始在社会中崭露头角时,心中泛起的惊惶和不安。
再看看学校教授的七堂课:
-
混乱
-
班级地位
-
冷漠
-
情感依赖和智力依赖
-
临时的自尊
-
无所遁形
所有这些,无一不是在为永恒的下层阶级量身定制枷锁,让他们无法找到施展自身独特才华的人生舞台。随着时间推移,学校教育已经远远背离了最初管控穷人的宗旨。从 20 世纪 20 年代开始,学校官僚体系便野蛮生长,而那些隐藏在幕后,自学校教育中牟利的各路产业,也在疯狂滋生。于是,这个最初为控制社会底层而生的怪兽,竟已悄然将魔爪伸向了中产阶级的子女。
苏格拉底被指责收取授课费用时愤慨不已,这有什么好奇怪的吗?即便在那个时代,哲学家们就已洞悉教书育人职业化的必然走向,抢占了属于健康社区中每个人的教学功能。
有这些我日复一日教授的课程,难怪我们会面临一场真正的国家危机,其实质与官媒的宣传大相径庭。如今的年轻人对成人世界和未来漠不关心,对周遭的一切都提不起兴趣,只沉湎于玩乐和暴力。无论贫富,面对 21 世纪的孩子都注意力涣散,时间观念淡薄。他们不信任亲密关系,就像离异家庭的孩子(因为我们剥夺了他们应得的父母关爱);他们厌恶独处,他们冷酷、物质、依赖、被动、暴力、害怕意外、分心上瘾。
学校教育将孩童的种种不良倾向一一放大,其潜在课程阻碍了健全人格的发展。说到底,如果不利用和强化孩子的恐惧、自私和幼稚,学校这一机构将难以为继,而我这个持证上岗的教师也一样。任何学校若胆敢传授批判性思维技能——如辩证法、启发法等解放思想的工具——很快就会遭到无情的摧毁。在这个世俗社会,学校已然成了教会的替身,同教会一样,它要求学生必须全盘接受,奉为圭臬。
我们是时候正视这一残酷的现实了:学校里制度化的教学模式正在戕害我们的下一代。在七堂课的摧残下,包括老师在内,没有一个人可以完全幸免。这种教学方式从根本上就违背了教育的初衷,它是反教育的。小修小补解决不了问题。讽刺的是,要从根本上改革学校,实际花费会比现在少很多,但既得利益集团绝不会让改革发生。你必须认清,学校的存在首要目的是提供就业岗位、发包合同。为了维持运转,学校不愿意通过缩减业务、调整「教学产品」来节省开支,即便这么做有利于学生的健康成长。这就是机构化学校教育的铁律——它本质上就是一门生意,既不受正常财会制度的约束,也不受市场竞争的制衡。
我认为,在公共学校教育领域引入一些自由市场机制,可能是解决问题的根本出路。在教育市场充分竞争的环境中,家庭学校、小型创业学校、宗教学校、工艺学校、农场学校等各类办学机构百花齐放,同政府举办的学校展开角逐。我所向往的教育自由市场,就像美国内战前的景象:学生可以自主选择适合自己的学习方式,即便是自学也无妨。事实上,这对本杰明·富兰克林的成长似乎也没有什么负面影响。如今,这些多元化的教育选择虽然还残存,但只有极少数机敏、勇敢、幸运或富有的人才能享用,曾经蓬勃而充满活力的教育生态已名存实亡。对于那些困顿的贫困家庭,以及徘徊在城市中产阶层边缘的广大群体而言,优质教育资源几乎可望而不可即。这预示着一个严峻的事实:除非我们能够对当前一团糟的政府教育垄断体制进行大刀阔斧的改革,否则教授七堂课的学校灾难只会愈演愈烈。
在我成年后的教学生涯中,我坚信大规模学校教育的方式本身就是其全部内容。不要被表象所迷惑,认为优质的课程、设施或教师是决定孩子教育的关键。我们所见到的种种病症,很大程度上都源于学校的课程阻碍了孩子与自己及家人的重要约定,使他们无法学习自我激励、毅力、自立、勇气、尊严、爱——以及为他人服务,而这些恰恰是家庭和社区生活的重要课题。
三十年前[六十年代早期],孩子们放学后还有时间学习这些内容。但如今,电视占据了大部分时间,加上双职工或单亲家庭所特有的压力,更是吞噬了原本属于家庭的大部分时光。我们的孩子几乎没有时间去完整地成长为成熟的人,他们只能在贫瘠的荒漠中艰难前行。
我们的文化正面临着一个迫在眉睫的未来,它将要求我们所有人都领悟非物质体验的智慧;为了在这样的未来中生存,我们必须选择一种在物质消耗上更为节俭的自然生活方式。然而,这些至关重要的课程是无法在现有的学校体系中习得的。学校已经沦为一个为期 12 年的监禁,孩子们在这里真正学到的只有坏习惯。作为一名教授学校、屡获殊荣的教师,我对这种情况心知肚明。
为什么美国学校没有教育
原文:Why Schools Don't Educate - The Natural Child Project
演讲者:John Taylor Gatto
我在此,代表那些多年来我所敬仰的优秀教师们,接受这份荣誉。他们与孩子们的每一次交流都力求高尚,这些教师,无论男女,从不自满,总是充满质疑,不断探寻「教育」这一词汇的真正内涵。年度教师并非最顶尖的教育者,那些真正的佼佼者往往低调,不易被外界发现,但他是一个标杆,象征着那些默默奉献、乐于为孩子们服务的普通人。这份荣誉,同样属于他们。
我们正身处一个学校危机四伏的时代。在阅读、写作和算术这些基础能力上,我们的孩子在全球 19 个工业国家中排名垫底。是的,垫底。全球的毒品经济,很大程度上依赖于我们对这些虚幻梦想的消费。如果我们不那么疯狂地购买,这个行业恐怕早已崩溃——而学校,竟成了这些毒品的重要销售渠道。我们的青少年自杀率,是全球最高的,而这些走上绝路的孩子,多数来自富裕家庭,而非贫困之家。在曼哈顿,有一半的新婚夫妇,熬不过五年。这一切,无疑都在告诉我们,一定有哪里出了什么问题。
我们的学校危机,实则是更大社会危机的缩影。我们似乎已迷失了自我。孩子和老人被圈养、隔离于世界的繁忙之外,程度之深前所未有——不再有人与他们交谈。没有孩子和老人融入日常生活,一个社区便失去了未来与过去,只剩下无尽的现在。实际上,「社区」这一名称,几乎不再适用于我们彼此间的互动方式。我们生活在网络中,而非社区里,我所认识的每个人都因此感到孤独。学校以一种奇特的方式,在这场悲剧中扮演了重要角色,正如它在社会阶层间日益扩大的隔阂中所起的作用一样。利用学校作为筛选机制,我们似乎正走向一个种姓制度,其中不可接触者*在地铁车厢中乞讨,露宿街头。(译注:印度种姓制度中,达利特即「不可接触者」,为社会最底层的人。)
在我二十五年的教学生涯中,我注意到一个引人深思的现象:学校和学校教育,对于地球上伟大的事业而言,正变得越来越无关紧要。如今,无人再相信科学家是在科学课上培养的,政治家是在公民课上塑造的,诗人是在语文课上诞生的。真相是,学校并不传授任何知识,除了如何服从命令。这对我来说是个巨大的谜团,因为成千上万充满人性关怀的人在学校担任教师、助教和管理者,但机构的抽象逻辑却压倒了他们的个人贡献。尽管教师们确实关心学生,工作也非常努力,但这个机构却是心理变态——它没有良知。铃声一响,那个正沉浸在写诗中的年轻人必须合上笔记本,转移到另一个教室,在那里他必须背诵人类和猴子源自同一祖先。
美国的强制学校教育制度,大约在 1850 年由马萨诸塞州首创。这一制度曾遭到约 80% 的当地居民抵制,有时甚至引发枪战。直到 19 世纪 80 年代,巴恩斯特布尔作为科德角上的最后据点,才在民兵的强制下,将孩子们押送至学校。
这里有一个值得深思的有趣观点:不久前,参议员 Ted Kennedy 的办公室发布了一份文件,声称在强制学校教育实施前,该州的识字率高达 98%,而实施后,这一数字再未超过 91%,直至 1990 年依然如此。我希望这能引起你的兴趣。
另一个值得思考的有趣现象是:在家上学运动已悄然壮大,目前有 150 万年轻人完全由父母在家教育。上个月,教育界媒体爆出惊人消息:在家接受教育的孩子,在思维能力上似乎比正规学校教育的孩子领先五到十年。
我不认为我们会在短期内废除学校,至少在我有生之年不会,但如果我们要改变这个迅速演变成无知灾难的现状,我们必须认识到,学校机构在「规训」上做得很好,但它并没有「教育」——这是其设计本身固有的缺陷。这并非糟糕的教师或投入资金不足的过错,而是教育(education)与上学(schooling)本质上就不可能等同。
学校是由 Horace Mann、Barnard Sears、芝加哥大学的 Harper、哥伦比亚大学师范学院的 Thorndyke 以及其他一些人设计的,旨在成为科学管理大众的工具。学校旨在通过应用公式,制造出行为可预测且可控制的人。
在很大程度上,学校成功做到了这一点。然而,我们的社会正在瓦解,在这个社会中,唯一成功的人是自力更生、自信且具有个性的——因为保护依赖者和弱者的社区生活已经消亡。正如我所说,学校教育的产品是无关紧要的。顺服校驯的人也是无关紧要的。他们可以销售胶卷和剃须刀片,处理文件和打电话,或者无意识地坐在闪烁的计算机终端前,但作为人类,他们是无用的。对他人无用,对自己也无用。
我认为,我们周围的日常苦难在很大程度上是源自这样一个事实:正如 Paul Goodman 三十年前所说,我们迫使孩子们以荒谬的方式成长。学校教育的任何改革都必须解决其荒谬之处。
成为这样一个系统的成员是荒谬且反生命的,这个系统迫使你与年龄和社会阶层完全相同的人一起坐在封闭的环境中。这个系统有效地切断了你与生活的多样性和多样性协同作用*的联系,实际上它切断了你与自己过去和未来的联系,就像电视一样,将你塑造成一个不断重复现状的人。(译注:多样性的协同作用,又称为「多样性红利」,一个由不同年龄、性别、文化和专业背景的人组成的团队会比一个同质化的团队更有创造力和适应性)
成为这样一个系统的成员是荒谬且反生命的,这个系统迫使你在想学习建筑构造时去听一个陌生人读诗,或者在你想读诗时与一个陌生人讨论建筑构造。
成为这样一个系统的成员是荒谬且反生命的,这个系统令你青春年华的每一天里,随着铃声从一个教室转移到另一个教室,不允许你有任何隐私,甚至侵入你家中的避风港,要求你完成它的「家庭作业」。
「他们将如何学会阅读?」你可能会问,我的回答是:「记住马萨诸塞州的教训。」当孩子们被赋予完整的生活,而不是按年龄分级的牢房生活时,如果这些技能在他们自然而然的生活中有意义,他们将轻松学会阅读、写作和算术。
但请记住,在美国,几乎没有人因为阅读、写作或算术而受到尊重。我们是一个善于言辞的民族,我们给予健谈者最高的报酬和最多的赞赏,因此我们的孩子们模仿电视和学校教师这些公共榜样不停地说话。如今,教授「基础知识」已经变得非常困难,因为它们在我们所建立的社会中并非不基础。
目前,两个机构主宰着我们孩子的生活——首先是电视媒体,其次是学校。这两者将智慧、勇气、节制和正义这些真实世界的品质简化为无休止的抽象概念。在过去几个世纪里,儿童和青少年的时间会用于实际工作、真正的慈善、真实的冒险,以及寻找导师来教授他们渴求的知识。他们在社区活动中花费大量时间,练习关爱,接触并研究社区各个层面,学习如何建立家庭,以及成为全人所需的众多其他任务。
但如今,以下计算反映了我的学生们应对琐事的时间:
每周有 168 小时,我的学生们睡觉需要56 小时。这给他们留下了 112 小时来塑造自我。
根据最近报告,我的学生们每周会看 55 小时电视。这给他们留下了 57 小时来成长。
我的学生们每周上学 30 小时,准备和往返学校大约用 6 小时,做作业平均每周花 7 小时——总共 45 小时。在此期间,他们处于持续监视之下,没有私人时间和空间,如果试图在时间和空间使用上展现个性,就会受到纪律处分。这给他们留下了 12 小时来创造独特的自我意识。当然,我的学生们需要吃饭,这需要一些时间——不多,因为他们已经失去了家庭聚餐的传统,但如果我们每周分配 3 小时用于晚餐,每个孩子可获得的私人时间净额只剩下 9 小时。
这不够。这真的不够,对吧?当然,越富有的孩子看的电视越少,但他们的时间同样被一系列更广泛的商业娱乐活动所限制,并且不可避免地被安排参加一系列私人课程,而这些课程往往并非他们真正选择的领域。
令人惊讶的是,这些事情际上只是一种更表面的的方式创造无法自立的人类,使他们无法充实自己的时光,无法采取行动赋予生活实质和乐趣的意义。这是一种全国性的疾病,这种依赖与盲目,我认为学校教育、电视和课程——整个肖托夸夏季教育会(Chautauqua)的理念——与此有很大关系。
想想那些正在摧毁我们国家的事物——麻醉药物、无脑竞争、消遣性行为、暴力色情、赌博、酒精,以及最糟糕的色情——献身于消费的生活,将贪婪囤积奉为信条——所有这些都是依赖性人格的成瘾行为,而这正是我们这种学校教育必然产生的结果。
我想告诉你,剥夺孩子们的所有时间——他们成长所需的时间——并迫使他们将时间花在抽象概念上,对孩子们产生了什么影响。你得听听这些,因为任何不针对这些具体病态的改革都只能是表面文章。
-
我所教的孩子们对成人世界漠不关心。这与数千年的经验相悖。小孩总是对大人们的所作所为充满好奇,但如今谁还想长大呢?谁又能责怪他们?玩具成了我们的全部。
-
我所教的孩子们几乎没有什么好奇心,即便有也是短暂的;他们无法长时间集中注意力,即使是他们自己选择的事情。你能否看出,催促他们换课而一遍遍响起的铃和注意力一转即逝的现象之间存在联系?
-
我所教的孩子们对未来缺乏感知,不知道明天与今天紧密相连。如我之前所说,他们只有连续的现在,他们所处的这一刻就是他们意识的边界。
-
我所教的孩子们没有历史感,他们不明白过去如何决定了他们的现在,限制了他们的选择,塑造了他们的价值观和人生。
-
我所教的孩子们对彼此残忍,对不幸缺乏同情,嘲笑弱者,对那些明显需要帮助的人表示轻蔑。
-
我所教的孩子们在亲密和坦诚面前感到不安。我猜想,他们在这方面就像我认识的许多被收养的人一样——他们无法应对真正的亲密,因为他们一生都在习惯性地将一个秘密的内心自我,隐藏在一个「由电视上学来的」或「为了左右老师想法而习得的」行为碎片组成的外在人格之下。因为他们并非自己所表现的那样,所以在亲密关系中伪装会变得薄弱,从而必须避免亲密关系。
-
我所教的孩子们都很物质,追随那些物质地给一切「评分」的学校老师,以及那些提供世界上一切免费物品的电视导师。
-
我所教的孩子们在新挑战面前依赖、被动和胆怯。这往往被表面的勇敢、愤怒或攻击性所掩盖,但在其下是一个缺乏勇气的真空。
如果我们要阻止国家的衰落,我可以列举出一些其他情况,学校改革必须解决这些问题,但到现在为止,无论你是否同意,你已经理解了我的论点。这些病态要么是学校造成的,要么是电视,或者两者兼有。这是一个简单的算术问题,学校教育和电视共同吞噬了孩子们的所有时间。这就是摧毁美国家庭的原因,它不再是其子女教育的一个因素。电视和学校教育,问题必然出在这两者身上。
该怎么办?首先,我们需要一场激烈的全国性辩论,不间断地进行,日复一日,年复一年。我们需要就这个问题大声疾呼、争论不休,直到它得到解决或彻底崩溃,再无其他可能。如果我们能修复它,那很好;如果我们不能,那么在家上学成功的例子表明,另一条道路具有巨大潜力。我们目前投入家庭教育的资金,可能会一举两得,既能修复家庭又可修复孩子。
真正的改革是可能的,但不应有任何花费。我们需要重新思考学校教育的根本前提,决定我们希望所有孩子学习什么以及为什么。140 年来,这个国家一直试图从由「专家」组成的中央精英、社会工程师的高级指挥中心自上而下地强加目标。这并没有奏效。它也不会奏效。这是对曾经使这个国家成为一个崇高实验的民主承诺的严重背叛。俄罗斯试图在东欧建立柏拉图的理想国的尝试已经在我们的眼前毁灭,我们试图通过学校作为工具强加同样的中央正统观念的尝试也在逐渐瓦解,尽管更缓慢、更痛苦。它是行不通的,因为它的基本前提是机械的、反人类的,并且对家庭生活充满敌意。生命可以通过机械教育来控制,但它们总是会用社会病态的武器进行反击——毒品、暴力、自我毁灭、冷漠,以及我在我所教的孩子们身上看到的症状。
是时候回头看看,找回一个有效的教育哲学了。我特别喜欢的一个教育理念,几千年来一直是欧洲统治阶级的最爱。在我的教学中,我尽可能多地采用这个理念,也就是说,在当前的强制学校教育体制下,我能做到多少就做多少。我认为这对贫困儿童和富裕儿童都同样有效。
这个精英教育体系的核心信念是,自我认知是真正知识的唯一基础。在这个体系中,无论哪个年龄段,你都会发现孩子被安排在一个无人指导的环境中独自解决问题。有时,这个问题充满了巨大的风险,比如骑马奔跑或跳跃,但这个问题在十岁之前已经被成千上万的精英儿童成功解决了。你能想象有谁能掌握这样的挑战,还会对自己的能力缺乏信心吗?有时,问题是要掌握孤独,就像梭罗在瓦尔登湖,或爱因斯坦在瑞士海关那样。
我以前的一个学生,Roland Legiardi-Lura,尽管他的父母都去世了,他没有继承任何财产,但在他还未完全脱离少年时代时,就独自骑自行车穿越了美国。那么,当他成年后决定拍摄一部关于尼加拉瓜的电影时,即使他的日常工作是一名木匠,尽管他没有钱,也没有电影制作的经验,但这部电影却获得了国际奖项,这又有什么奇怪的呢?
现在,我们正在剥夺孩子们发展自我认知所需的所有时间。这必须终止。我们必须创造学校体验,把大量时间还给孩子们,我们需要从很小的时候就开始信任孩子们进行独立学习,也许是在学校安排的,但要在学校环境之外进行。我们需要创造课程,让每个孩子都有机会发展自己的独特性和自立能力。
不久前,我花了 70 美元,让班上一个 12 岁的女孩和她不会说英语的母亲乘巴士沿着新泽西海岸去请海滨小镇的警察局长吃午饭,并为丢弃的佳得乐瓶子污染了他的海滩而公开道歉。作为交换,我与警察局长安排了这个女孩在小镇警察局进行为期一天的实习。几天后,我的另外两个 12 岁的学生独自前往西一街,从哈莱姆区开始,他们在一个报纸编辑那里开始了实习。下周,我的三个学生将在早上 6 点出现在新泽西的沼泽地,学习一位卡车公司总裁的思维,他正派遣 18 轮卡车前往达拉斯、芝加哥和洛杉矶。
这些孩子是「特殊」项目中的「特殊」孩子吗?从某种意义上说,是的,但除了孩子们和我自己,没有人知道这个项目。他们只是来自中央哈莱姆区的可爱孩子,聪明机警,但当他们来到我这里时,大多数人都不能流利计算加减。而且没有一个人知道纽约市的人口或从纽约到加州的距离。
这让我担心吗?当然,但我相信,随着他们获得自我认知,他们也将成为自我教育者——只有自我教育才有持久的价值。
我们必须立即给孩子们独立的时间,因为这是自我认知的关键,我们必须尽快让他们重新接触现实世界,以便他们的独立时间可以用于大量抽象概念之外的事情。这是一种紧急情况,需要采取激烈的措施来纠正——我们的孩子在学校教育中像苍蝇一样死去,无论是好学校还是坏学校,都一样。无关紧要。
重新构建的学校系统还需要什么?它需要停止成为劳动社区的寄生虫。在人类账本的每一页中,只有我们备受折磨的条目将孩子们束之高阁,不要求他们为公共利益服务。我认为,在一段时间内,我们需要将社区服务作为学校教育的必修部分。除了教会他们在无私行动中的经验外,这是让年轻孩子在生活的主流中承担真正责任的快捷方法。
我曾经运营了一个游击队式的项目五年,让每个孩子,无论贫富,聪明还是笨拙,每年都要付出 320 小时艰苦的社区服务。几十个已经长大成人的孩子在多年后回来找我,告诉我那次帮助别人的经历改变了他们的人生,教会了他们以新的方式看待事物,重新思考目标和价值观。这是在他们十三岁时,在我的实验学校项目中发生的——只有在我所在的富裕学区处于混乱时才有可能。当「稳定」回归时,实验项目被中止了。它对于一个由各种孩子组成的群体来说,这样做太成功了,成本也太小了,以至于不被允许继续运行。因为我们让昂贵的精英项目相形见绌。
城市中并不缺乏真正的问题。我们可以请孩子们帮助解决这些问题,以换取整个成人世界的尊重和关注。这对孩子们好,也对我们其他人好。这是教授正义的课程,正义是每个精英教育体系中的四大基本美德之一。对富人和有权势者有益的东西,肯定也对其他人有益——更重要的是,这个想法是完全免费的,就像所有其他真正的教育改革想法一样。向这个病态的机构投入额外的资金和人力只会让它更加病态。
独立学习、社区服务、经历冒险、充分的隐私和独处、千差万别的实习机会,无论是一天还是更长时间——这些都是开始真正学校改革的强大、经济且有效的方式。但在我们迫使「学校」的概念开放之前——包括家庭作为教育的主要引擎之前,任何尝试修复我们受损的孩子和我们受损的社会的大规模改革都不会奏效。瑞典人在 1976 年意识到了这一点,当时他们实际上放弃了收养不受欢迎的孩子的制度,而是投入国家的时间和资源来加强原生家庭,以便瑞典出生的孩子受到欢迎。他们并没有完全成功,但他们确实成功地将不受欢迎的瑞典儿童数量从 1976 年的 6000 人减少到 1986 年的 15 人。所以这是可以做到的。瑞典人只是厌倦了为那些不是由亲生父母抚养的孩子所导致的社会废墟买单,所以他们采取了行动。当然,我们也能做到。
家庭是教育的主要引擎。如果我们利用学校教育将孩子与父母分离——不要误会,自从 John Cotton 在 1650 年宣布这是海湾殖民地学校的目的以来,以及自从Horace Mann 在 1850 年宣布这是马萨诸塞州学校的目的以来,这一直是学校的核心功能——我们将继续经历我们现在所面临的恐怖景象。家庭课程是一切美好生活的核心,我们已经偏离了这个课程,是时候回归了。教育中走向理智的方式是,我们的学校要带头解除机构对家庭生活的束缚,促进学校时间内家长与孩子之间的融合,以加强家庭纽带。这就是我让那个女孩和她的母亲沿着新泽西海岸去见警察局长的真正目的。我有很多想法来制定家庭课程,我猜一旦你们开始思考这个问题,你们中的许多人也会有很多想法。我们在推动基层思考以改革学校教育方面遇到的最大问题是,我们有大型的既得利益集团占据了所有的讨论时间,并从学校教育中获利,尽管他们的言辞与此相反。我们必须要求新的声音和新的想法得到倾听,我的想法和你们的想法。我们已经受够了电视和新闻媒体所发表的通稿——现在需要的是一场长达十年的自由辩论,而不是任何更多的「专家」意见。教育专家从未正确过,他们的「解决方案」昂贵、自私自利,并且总是涉及进一步的中心化。够了。是时候回归民主、个性和家庭了。我说完了。谢谢。
© John Taylor Gatto 版权所有。
本文是 John Taylor Gatto 在 1990 年 1 月 31 日接受纽约市年度教师奖时的演讲稿。经作者许可,本文得以重印。
「不让孩子留在室内」:解决国家问题的糟糕方案
原文:“No Child Left Inside”: Poor Solution to a National Problem | Psychology Today
这项法规无法解决它的目标,反而会适得其反。
发表于 2008 年 10 月 8 日
9 月 18 日,美国众议院以 293 票对 109 票的压倒性票通过了其「不让孩子留在室内」法案的版本。参议院版本尚未投票表决。这项立法是由环保主义者、教育工作者、公共卫生专家和商业团体组成的联盟推动的,该联盟被称为「不让孩子留在室内」联盟。
联盟的所有关切,我也有,至少正如联盟网站上所表达的那样。我热心环保,非常关注对我们星球环境的破坏,以及其潜在的未来可居住性。我关切公民对户外活动非常无知的问题。我关切今天孩子在户外玩耍少有玩耍的问题。我关切,今天经常被称为户外「游戏」的是高度结构化、由成人监督的运动,而与户外的探索几乎毫无关系。今天,我关切儿童肥胖和抑郁的流行率,我同意联盟的观点,即这些比率至少部分是儿童生活中没有户外玩耍的结果。
既然我同意联盟在所有这些上的观点,你可能会认为我会支持「不让孩子留在室内」的立法,该联盟一直在努力通过该立法。但我并不支持。
学校是个吸血鬼,任何东西进了学校,只要包含乐趣,都会被吸食走。难道还要让「户外玩耍」也变得干瘪瘪吗?
在我看来,正是这种立法方式、思维方式,恰恰造成了联盟想要解决的问题,而不是那种可以解决这些问题的思维方式。每次我们看到一个国家问题,特别是如果这个问题与儿童有关,就会通过学校系统解决这个问题。好像每每出了问题,再整一套必修课程和考试给学生,问题就可以解决。你们联盟成员!难道看不到学校系统和我们对它的依赖来照顾我们的孩子,并迫使他们不断增加的「教育」要求才是问题所在吗?难道你看不到,我们越是试图通过政府授权来规范学校活动,就越与建立学校的初衷背道而驰吗?
如果这项新法案成为法律,那么每个州都将被要求向美国教育部提交一份「环境素养」计划。以下是众议院法案对该计划的看法(引用自联盟的网站):
「州计划必须包括:相关内容标准、内容领域以及将进行教学的课程或科目;描述计划与州毕业要求的关系;描述教师的专业发展计划,以提高他们的环境内容知识,关于环境问题的教学技能,以及基于现场的教学技能;描述州教育机构将如何测量学生环境知识;以及描述州教育机构将如何实施该计划,包括获取资金和其他必要支持。」
毫无疑问,这项立法的通过将是教育行业的一场政变(见我 8 月 27 日的帖子)。这将产生一套新的课程、测试、教科书、教育专家、项目管理员、拨款撰写人等。它会给孩子做什么?这将给他们另一套学校要求,另一套要通过的测试。这是让孩子们爱上和探索户外的方式吗?学校系统难道很成功吗?学校让孩子爱上它所教的其它东西了吗?看看数学、历史和物理,我们就知道,我们现在到底应不应该委托它去教我们的孩子热爱户外活动。
举个例子,看看我们的学校系统在「体育」领域做了什么。由于人们认为身体和心灵都需要训练,所以大多数学校要求学生每年上体育课。这门课所做的是把一些本来快乐的东西变得乏味,有时还特别可恶,随之而来的往往就是尴尬。通过强迫每个人按照学校的时间表同时进行相同的活动,并对孩子们进行测试和评分,并公开比较他们的表现,学校系统有效地将所有应该玩的东西变成了工作。
如果您关心孩子对户外的热爱,请写信给您的美国参议员,要求他们投票反对「不让孩子留在室内」。
我们如何才能增加儿童的户外游戏和冒险?
要解决问题,先思考问题的根本原因,通常很有价值。当我还是个孩子的时候(比我说的要早),大多数孩子都花了大量的时间在户外。我们走来走去,到处骑自行车。我们在空地上、城外的农村地区以及公园里玩游戏。我们邂逅蝴蝶、青蛙和蛇这样的生物。我们自己去钓鱼和游泳。我们在冰冻的湖泊上进行滑冰冒险,独自在树林里徒步旅行,没有成年人陪伴。是什么导致了这一切的变化呢?
这件大事就是,学校和校外的成年人全面接管了孩子的生活。当我还是个孩子的时候,在学校的表现没那么重要,和现在完全不一样——作业几乎没有。在上学的日子里,我们 3 点后大半天都在玩,外加一个小时的午餐时间(在此期间,我们可以不在学校)。当时的学年比现在短,我们有三个月的夏天可以玩。大多数社区没有成人组织的体育联赛,就算真有,我们参加也不是为了给简历增色添彩。我们的父母不觉得他们有责任开车带我们去各个地方,或者观看我们做的每一件事情,为我们加油或保护我们免受危险。他们信任我们。他们相信,给予自由后,我们会自己尽情享受,并且在大部分情况下会做对我们有益的事情。
许多父母会争辩说,他们不是不信任自己孩子,而是不信任周围的环境。我在很大程度上理解这种恐惧。部分原因是在户外玩耍的孩子更少,事实上,许多社区现在可能比那时更不安全。过去,如果有人在户外骚扰某人,周围会有很多各个年龄段的孩子作为目击者和威慑者。同样的情况是,今天,由于大多数家庭的父母都有工作,任何特定社区在家的成年人都更少,能够发现潜在问题的成年人也更少。今天,认识邻居的人们(成年人和儿童)也比过去更少,这也使社区不那么安全。当然,街道上的汽车比以前多了,社区不再觉得建造和维护人行道、公园和游乐场是他们的职责。
因此,如果这些是户外游戏和冒险减少的原因,那么这些就是我们应该解决的问题。让我们停止试图通过增加学校教育来解决问题,这只会让问题变得更糟,而开始尝试通过给孩子更多真正自由的步骤来解决这些问题,包括户外玩耍的自由。以下是你可以做的一些事情:
反对增加上课时间、家庭作业和考试。让你的学校董事会、学校校长和社区中的其他人知道,作为家长,你憎恨强加给孩子的大量繁忙工作,并憎恨学校越来越多地侵入孩子的时间和家人的时间。发起地方立法,缩短学校的上课时间和学年。抵制州规定的考试。
得把这项工作落实在学校系统之外,为孩子们开发安全的地方玩耍。让您所在社区的立法者知道,他们应该开始减少在学校上花钱,开始在人行道、公园和儿童可以玩耍的地方的警察保护上花更多的钱。敦促您的社区开发并维护安全但又提供冒险机会的公园——有树林可以探索、树可以爬、池塘和溪流可以钓鱼的公园。制定和支持项目,允许儿童以自己玩耍的方式,在自己的时间,与自己选择的玩伴一起参与户外活动,无需成人监督,当然也无需考试。
与您附近的其他家长会面,讨论提供安全场所和娱乐机会的问题。也许您可以组织邻里互相看护儿童,以确保社区里儿童玩耍的安全。也许您可以想办法与其他家庭一起周末旅行,去露营地或其他地方,在那里孩子可以安全地玩耍,让孩子们在新奇的环境中一起玩耍,而成年人只需要在一旁交流就可以了。
我知道这些步骤可能并不容易,落实下来需要积极行动。这些步骤与大多数社区的宣言背道而驰,这些宣言总是提倡更多学校和更多成人对儿童的直接监督。然而,如果你触及社区中成年人的思考表面,你会发现他们中的许多人在他们的心中认识到,今天儿童比他们小时候更受约束,被监禁更多。如果你让他们说出原因,他们可能会自己列出很多,与我在这里建议的没有什么不同。我们现在需要做的是将这种发自内心的理解转移到脑海中,让我们的努力形成合力,并采取理性行动,让我们的孩子真正自由地在户外玩耍。
------------------
我希望在下方的评论部分中,你们中的一些人能提出更多方法,为孩子们提供户外游戏的自由和机会,也许是你们自己的孩子所经历过的有效方法。不要忘记告诉你的参议员投票反对「不让孩子留在室内」法案。
---------
参见新书《自由学习》
---------
「为什么学生不喜欢上学?」呃,呵呵……
原文:“Why Don’t Students Like School?” Well, Duhhhh… | Psychology Today
孩子不爱上学,因为他们热爱自由。
发布于 2009 年 9 月 2 日 | 审稿人:Matt Huston
最近有人给我推荐了一本书,因为他觉得我会喜欢这本书。这本名为《为什么学生不喜欢上学?》的书,由认知科学家 Daniel T. Willingham 所著,出版于 2009 年,面向从幼儿园到高中的老师,受到了无数教育工作者的好评。但这本书完全没有回答书名所提出的问题。
Willingham 的论点是:学生不喜欢上学,因为他们的老师没有充分理解某些认知原理,从而没有尽其所能地教导学生。老师没有以最能吸引学生的方式上课。可以想见,如果老师们听从 Willingham 的建议,运用认知科学提供的有关思维运作方式的最新理论,学生就会喜欢上学。
抛开房间里的大象不谈!
随便找个学生,问他为什么不喜欢学校,他会告诉你:「学校是监狱。」他们可能不会用这几个字眼,因为他们太有礼貌了,也可能是因为他们已经被洗脑了,认为学校是为他们好,所以学校不可能是监狱。但他们真正想说的,其实就是:「学校是监狱。」
Willingham 当然知道学校是监狱。他不可能不知道;每个人都知道。但在这里,他写了一本书,题为《为什么学生不喜欢上学?》。他不止一次地提出,他们不喜欢上学可能只是因为他们喜欢自由,而他们在学校并不自由。
我不应该对 Willingham 这么苛刻,因为他不是唯一一个回避这个问题的人。每个上过学的人都知道学校就是监狱,但几乎没有人这么说,因为这样说是不礼貌的。说真话会让我们显得很刻薄,于是我们都小心翼翼地回避这个事实——学校是监狱。这些善良的人怎么会把他们的孩子送进监狱,度过人生的前 18 年呢?我们的民主政府,是建立在自由和自决原则基础上的,怎么能制定法律,强制要求儿童和青少年在监狱里度过这么长的时间?这是不可想象的,因此我们尽量不去想。又或者说,即使我们敢想,我们也不敢说。当我们谈论学校的问题时,我们假装没有看到大象,而是在谈论大象周围的皮屑。
但我认为是时候大声说出来了:学校即监狱。
如果你认为学校不是监狱,请解释二者的区别。
我能想到的唯一区别是:要进监狱,你必须犯罪,而把你送进学校,只需要你的年龄到了。在其他方面,学校和监狱是一样的。在这两个地方,你的自由和尊严都被剥夺了。他们会告诉你必须做什么,如果你不遵守,你就会受到惩罚。事实上,比起在成人监狱里,你在学校里必须花更多的时间,去做规定的事情,所以在这个意义上,学校比监狱更糟糕。
在某种程度上,每个上过学的人在潜意识里都知道学校就是监狱。他们怎么会不知道呢?但人们会通过说(不过通常不是用这些字眼)「孩子们需要这种特殊的监狱」来合理化它,如果监狱管理得好,孩子们甚至会喜欢这种监狱。根据这种合理化的说法,如果孩子们不喜欢学校,并不是因为学校是监狱,而是因为「狱卒」不够善良,不够有趣,或不够聪明,没有恰当地侵占孩子们的思想。
但任何了解孩子的人,只要诚实地思考,就应该能看穿这种合理化。孩子们和所有人类一样,渴望自由。他们讨厌自由受到限制。在很大程度上,他们正是通过自由来自我教育。他们生来就有这种能力。在我以前的文章中,我曾多次谈论过这些内容。孩子们通过探索和自由玩耍,以了解他们成长过程中所面临的物质和社会世界。而在学校里,他们被告知必须停止追求自己的兴趣,而是要完全按照老师的要求去做。这就是他们不喜欢上学的原因。
在一个社会里,如果我们能够证明他们需要这种特殊的监狱,以获得成为好公民、成年后的幸福和找到好工作所需的技能和知识,那或许,我们可以合理地强迫孩子上学。许多人,也许是大多数人,认为这一点已经得到了证实,因为教育机构谈论这一点时似乎已经证实了这一点。但事实上,它根本没有得到证实。
事实上,几十年来,那些选择让孩子「不上学」,或把他们送到瑟谷学校(本质上是一所「不上学」的学校)的家庭就是反例(例如,见此处)。为孩子们提供学习工具,包括接触各种各样的其他人,孩子们通过自主游戏和探索,学习他们需要知道的知识,甚至更多。根本没有证据表明,被送进监狱的孩子比那些可以自由使用工具的孩子表现得更好。那么,我们如何才能继续合理地将孩子送进监狱呢?
我认为,教育机构戴着有色眼镜看待非学校教育者和瑟谷学校的经验,是因为他们害怕会发现什么。如果像监狱一样的学校并非必要,那么这整个庞大的事业,既雇佣了如此多的人,又深深植根于文化之中(参见我的文章《为什么学校变成如今这副模样》),将何去何从?
Willingham 的书延续了长期以来的传统,试图将心理学的「最新发现」与教育问题联系起来。所有的努力都避开了大象,专注于清理皮屑。但只要大象还在那里,皮屑就会不断堆积。
在未来的文章中,我会谈论一些心理学在改善教育方面失败的历史。每一代新的家长,每一批充满热情的新教师,都会听到或读到一些心理学的「新理论」或「新发现」,这些理论或新发现声称会让学校变得更有趣,并提高学生的学习能力。但没有一个理论或发现是有用的。在人们面对真相之前,这些都不会发生:孩子们讨厌学校,因为他们在学校里没有自由。快乐的学习需要自由。
现在,你对此有何看法?……从某种意义上说,这篇文章给大家提供了交流的平台。无论我们是否认同,你的疑问、想法、故事和观点,都受到我和其他读者的尊重。文章的原网址 Psychology Today 不支持评论,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
教育简史
原文:A Brief History of Education | Psychology Today
为了理解学校,我们必须从历史的角度来看待它们。
发表于 2008 年 8 月 20 日|审稿人:Matt Huston
当我们看到,法律强制要求每一个孩子去上学,几乎所有学校的组织结构都如出一辙,而社会投入许多精力和金钱去设立这样的学校,我们自然会猜想,这一切都应当拥有某些合适而合乎逻辑的理由。好像我们不强制孩子去上学、学校的运作方式和现在不一样,我们的孩子就无法适应现代社会。好像教育专家已经领悟一切,并给出了某种证明,就好像关乎孩子发展和教育的其他方式已经被检验过并宣告失败。
在之前的一系列文章中,我提出了反对证据。特别是 8 月 13 日的文章,我描述了瑟谷学校:40 年来,一直有孩子,在与传统学校教育相反的环境下,进行自我教育。对该校及其毕业生的研究表明,正常且普通的孩子,通过他们自己的游戏和探索而受到教育,而无需接受成人的指导或催促,也成为了在社会中人格充实、行事有效的成年人。瑟谷学校并没有提供指导和督促,而是提供了一个丰富的环境,让学生能在其中玩耍、探索和亲身体验民主;而且它比运营标准学校所需的成本更低,麻烦也更少。那么为什么大多数学校不是这样呢?
要想理解为什么标准学校如今成了这副模样,我们就必须破除陈见,即标准学校是逻辑必然性或科学洞察力的产物。相反,它们只是历史的产物。如今的学校教育,只有从历史的角度来看才有意义。因此,我将简述人类起源至今的教育历史,作为解释学校变成如今这副模样的第一步。大多数教育史学者会使用与我不同的术语,但我不觉得他们会否认这一简述的整体准确性。事实上,我已经用这些学者的作品来帮助我建立简述。
一开始,数十万年以来,孩子们通过自主游戏和探索来自主教育。
就人类这一物种的生物史而言,学校是非常新近的机构。在数十万年前,在农业出现以前,我们都是狩猎采集者。在 8 月 2 日的文章中,我总结了来自人类学的证据,证明狩猎采集者的孩子通过自己的自主游戏和探索,学到了成为合格的成年人所必须具备的卓越才能。孩子们对玩耍和探索的强烈渴望,大概是在我们作为狩猎采集者的进化过程中产生的,目的是为了满足教育的需要。在狩猎采集社会中,成年人允许孩子们几乎无限制地自由玩耍和探索,因为他们认识到这些活动是孩子们自然的学习方式。
随着农业和工业的兴起,儿童被强迫劳动。游戏和探索被禁止了。任性本来是一种美德,现在却变成了一种必须从孩子身上除掉的恶习。
农业的发明始于一万年前,它引发了人类生活方式的巨大改变。采猎生活方式需要大量的知识与技能,但不需要太多劳力。 为了成为高效的猎手和采集者,人们必须掌握的丰富植物和动物知识。他们不得不培养手艺,使用捕猎和采集需要的工具。 他们在寻找食物、跟踪并抵御入侵者时不得不富有创造力。但他们并不需要长时间劳作,他们所做的工作令人兴奋,并不沉闷。人类学家发现,采猎者并不像我们那样将工作与玩耍区别开——基本上所有的生活都被理解为玩耍。
农业逐渐改变了这一切。有了稳定的食物来源,人们可以生养更多孩子。农业还允许——或者强迫——人们定居在农田附近,而不是像游牧民一样四处生活。但是这些改变需要付出巨大的劳力。当采猎者们巧妙地收获自然生长的食材时,农民不得不耕地、种植、照料牲畜,等等。成功的农事需要长时间、相对不那么有技巧的重复劳动,很多活计儿童都能干。家里人越来越多,孩子也不得不去地里干活帮忙养活弟弟妹妹,或者在家里照料他们。儿童的生活逐渐从自由追求自己的兴趣转变成越来越多的工作,为家庭服务。
农业及其相关的土地所有权和财富积累也造成了明显的地位差异。没有土地的人,逐渐依附于有土地的人。此外,地主们发现,让别人给自己干活,可以增加自己的财富。奴隶制和其他形式的奴役制度开始发展壮大。那些有钱人可以在那些依附他们生存的人的帮助下变得更加富有。这一切在中世纪的封建制度达到了顶峰,当时的社会等级森严,少数国王和领主处于社会顶层,大量的奴隶和农奴处于社会底层。在当时,大多数人,包括孩子,都是奴隶。孩子们的首要课程是学会服从,压制自己的意志,对领主和主人表现尊敬。性格叛逆很可能招来死神。
在中世纪,领主和主人们体罚孩子以令其服从,就如家常便饭。例如,在 14 世纪末或 15 世纪初的一份文献记载,一位法国伯爵建议 ,贵族的猎手们应该「挑选一个七八岁的小男孩做佣人」, 并且「这个男孩需要被狠揍,直到他对于未能执行主人的命令抱有适当的恐俱」[1] 此文接着列出了男孩每天要做的大量家务,并指出,为了照顾好家里的狗,他晚上要睡在狗窝上的阁楼里。
随着工业和新资产阶级的兴起,封建主义逐渐衰落,但大多数儿童的生活并没有立即得到改善。工商业主也需要劳工,并且他们的利润,也来自于尽可能让劳工做尽可能多的活,支付尽可能少的报酬。每个人都知道,随之而来的剥削依然广泛地存在于这个世界上。工人们,包括幼童在内,在每天醒着的大部分时间都在干活,每周工作 6 至 7 天,而且经常处在恶劣的环境中,只是为了生存下去。童工被赶出了田地,被剥夺了阳光、新鲜空气,还有偶尔玩耍的机会,被赶进了漆黑、拥挤、肮脏的工厂或煤矿。在英国,穷人的监工们通常会把穷人的孩子和孤儿出租给工厂,在那里,孩子们遭受奴隶一般的待遇。每年都有成千上万的童工死于疾病、饥饿和疲劳。直到 19 世纪英国才通过法律限制儿童劳动。例如,在 1883 年,新的法律禁止纺织品制造商雇用 9 岁以下的儿童,并将每周最高工作时间限制在 48 小时(10 至 12 岁的儿童)和 69 小时(13 至 17 岁的儿童)[2]。
总而言之,在农业出现之后的几千年里,在很大程度上,儿童的教育是为了使他们成为好的劳动者而压制他们的任性。好孩子是听话的孩子,他会抑制自己玩耍和探索的欲望,尽职尽责地执行成年主人的命令。幸运的是,这样的教育从来没有完全成功过。人类玩耍和探索的本能是如此强大,不可能从孩子身上抹除。但是那个时期的教育哲学,在一定程度上,与几十万年前狩猎采集者所持有的哲学相反。
由于各种原因,为了宗教也好,为了世俗也罢,全体儿童接受强制学校教育(译注:强制教育)的思想产生了,并逐渐传播开来。教育(从此)被理解为灌输。
随着工业的发展和自动化程度的提高,世界某些地区对童工的需求有所下降。新的观念开始传播:童年应该是学习的时间,应该建设儿童学校,作为学习的地方。全体儿童接受义务公共教育的理念和实践,在欧洲逐渐发展起来,从 16 世纪初一直到 19 世纪。这是一个广受拥戴的理念,而这些支持者关于儿童应该学习的课程,都有自己的议程。
普及教育的推动力主要来自新兴的新教。马丁 · 路德声称,获得拯救的方法,取决于每个人自己对圣经的阅读和理解。从而,人们得出结论,每个人必须学会阅读,也必须了解圣经代表着绝对的真理。为了防止灵魂堕入永世地狱,路德及其他宗教改革的领袖将公共教育提升成基督教徒的义务。到 17 世纪末,德国作为学校教育发展的领头羊,在大多数州都有法律要求孩子们上学,但是管理学校的是路德教会,而不是国家 [3]。
17 世纪中叶,美国的马萨诸塞州成为第一个施行强制学校教育的殖民地,其既定目标是将儿童变成优秀的清教徒。到了 1690 年,马萨诸塞州邻近殖民地的儿童使用新英格兰初级教科书学习阅读,也就是俗话说的「新英格兰的小圣经」。它用简短而押韵的对句教儿童认识 ABC 英文字母表,从「In Adam's Fall, We sinned all (亚当之过,世界皆堕落)」开始 , 到「Zaccheus he, Did climb the tree, His Lord to see(撒该爬上了树,看到我们的天主)」结束。这本课本还包括《主祷文》《信经》和《十诫》,还有许多课程,专门用来向孩子灌输敬畏上帝,以及对长辈怀抱强烈的义务感。
工业界的雇主认为,学校教育是为了培养更好用的工人。对他们来说,最重要的是教会学生守时,听从指令,忍耐长时间的苦工,以及掌握最基本的读写能力。他们认为(虽然他们不会这么说),学校教的课程越枯燥无聊越好。
随着国家逐渐定型,权力逐渐集中,国家领导人认为,学校是为了培养爱国者和士兵。对他们来说,最重要的是让学生领略祖国母亲的壮丽,开国领袖以及各位领导人的壮举与美德,以及保卫国家不受境外邪恶势力侵害的必要。
各种人物之间,还有真正关心孩子的改革者,他们传达的信息,在今天的我们听起来很是值得同情。他们认为,学校这个地方,需保护学生免受外界破坏性力量伤害,并让他们打下道德与智力基础,以成长为诚实自强的成年人。但他们对孩子需要学什么也自有安排。孩子应该学习道德与拉丁语,数学等学科,以锻炼思维,成为学者。
所以,所有这些学校的建设者和支持者,都对儿童在学校需要学习的内容有清晰的看法。很正确地,没有人认为儿童能靠自己便准确地掌握所有他们(成年人)高度重视的内容,即便儿童身处于丰富的学习环境之中。他们都认为学校教育是灌输,是在儿童的思想里刻印下一些真理和思考方式。而灌输的唯一办法,无论是当时还是现在,就是强迫重复,并测试重复内容的记忆强度。
随着学校教育的兴起,人们逐渐认为,学习是儿童的工作。迫使儿童在农田和工厂里工作的强权手段,自然就转移到教师手上。
对于儿童来说,重复并记忆学习内容是繁重无聊的工作,因为他们的本能在不断提醒他们,要自由地玩耍,自己探索世界。就像儿童不会乐意适应农活和工厂劳动一样,儿童也不会乐意适应学校生活。相关的成年人对此并不意外。在历史的这个时间点上,儿童自主意志的价值早已被遗忘。所有人认为,为了让儿童能在学校里学习,儿童的自主意志必须被贬斥。人们认为,各种形式的惩罚,是教育过程不可或缺的一部分。某些学校允许儿童在一定时间段玩耍以发泄情绪;但玩耍不被认为是学习的手段。在教室里,玩耍是学习的敌人。
18 世纪的学校对玩耍的主流态度,在约翰•卫斯理为卫斯理公会派学校制定的校规中显露无遗,其中一条校规如此写道:「我们没有游戏日,也不允许有任何玩耍时间,因为贪玩的孩子终将长成贪玩的大人。」[5]
长久以来,把孩子束缚在田地和工厂中劳作的强制力又延伸到了教室,强迫孩子学习。有些报酬过低、 能力不足的老师特别喜欢虐待学生。德国的一个老师记录了 51 年执教生涯中对学生实施的惩罚,部分记录如下:「用棍棒打过 911527 下,用藤条打过 124010 下,用尺子打过 20989 下,用手打过 136715 下,10235 下打在嘴上,7905 拳打在耳朵上, 1118800 下打在头上 。」很明显,他为自己的“教育”感到自豪。
18 世纪马萨诸塞州著名牧师约翰 · 伯纳德在自传中赞许地描述过那些美好的旧日时光:他在小时候是如何经常被自己的学校老师责打。他因为无法抗拒的玩耍欲望而挨打,因为学习不好而挨打,甚至因为他的同学学习不好而挨打。因为他是个聪明的男孩,被要求辅导同学,当他们背不出课文时,他就会因此挨打。 他只抱怨过一件事,他的一个同学为了看他挨打,故意背不出课文。最后他解决了这个问题,放学的时候,他「狠狠地揍了一顿」那个同学,还威胁说以后还会揍他。
最近,学校教育的方法变得不那么苛刻了,但其底层逻辑并没有改变。学习仍被定义为孩子的工作,而且需要使用强力手段让孩子工作。
在 19 世纪和 20 世纪,公立学校教育逐渐发展成为我们如今所知的传统学校教育。管理纪律的方法变得更加人性化,至少减少了体罚;课程变得更加世俗化;课程随着知识的扩展而扩展,包括不断延长的科目清单;强制学校教育的时间、天数和年数不断增加。学校逐渐取代了田间劳动、工厂工作和家务劳动,成为儿童的主要工作。就像成年人在工作场所每天工作 8 小时一样,今天的孩子在学校每天工作 6 小时,再加上一个小时或更多的家庭作业,以及往往更多的补习班。随着时间的推移,孩子的生活已经越来越多地被学校课程所定义和安排。现在,孩子的自我几乎普遍被他们在学校的成绩所定义,就像成人被他们的工作或职业所定义一样。
今天的学校比以前要宽松得多,但关于学习性质的某些前提仍然没有改变:学习是艰苦的工作;是必须强迫孩子去做,而不是通过孩子自我选择的活动,自然而然发生的事情。孩子必须学习的具体课程,是由专业教育工作者决定的,而不是由孩子决定的,因此,今天的教育仍然和以前一样,是一种灌输(尽管教育工作者倾向于避免使用这个术语,而欺诈地使用「发现」这样的术语)。
当今,聪明的教育者可能会把「游戏」作为工具,以让孩子们享受他们的课程,孩子们可能会在课间休息时被允许有一些自由玩耍的时间(尽管在最近的时代,即使是这样也在减少),但孩子们自己的游戏肯定被认为不足以作为教育的基础。那些玩耍的动力如此之强,以至于孩子们不能静静地坐着听课。他们不再挨揍,而是被“治疗”。
在如今的学校,所有的孩子都在学习一种狩猎采集者闻所未闻的区别——工作和游戏之间的区别。老师说:「你们必须完成工作,之后才能去玩。」显然,按这话说,工作,包括所有的学校学习,是人不想做但必须做的事情;而游戏,尽管是人唯一想做的事情,并没有价值。这也许是我们学校教育方法教会孩子的重要一课。即使孩子在学校没有学到其他东西,他们也会学到工作和游戏之间的区别,学习乃是工作,而不是游戏。
在这篇文章中,我试图解释我们现在所看到的学校,是如何在人类历史中逐步发展而来的。在我的下一篇文章中,我希望讨论,为什么现代一些试图从根本上改革学校的尝试,是完全徒劳无功的。
----------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
-----------
注解
\1. Quoted by Orme, N. (2001), Medieval children, p 315.
\2. Mulhern, J. (1959), A history of education: A social interpretation, 2nd edition.
\3. Again, Mulhern (1959).
\4. Gutek, G. L. (1991), An historical introduction to American education, 2nd edition.
\5. Quoted by Mullhern (1959, p 383).
\6. Again, in Mullhern (1959, p 383).
\7. From “Autobiography of the Rev. John Bernard,” Collections of the Massachusetts Historical Society, 3rd Ser., 5 [1836]: 178-182. Extracted in J. Martin (Ed.) (2007), Children in Colonial America.
对成年后的非学校教育者的调查 I:研究发现综述
原文:A Survey of Grown Unschoolers I: Overview of Findings | Psychology Today
有 75 名曾接受过非学校教育的成年人参与,他们报告了自己童年和成年的经历。
发布于 2014 年 6 月 7 日 | 审稿人:Matt Huston
在进行本文描述的研究之前,我的同事 Gina Riley 和我开展了另一项研究,调查了非学校教育家庭的父母——在这些家庭中,孩子不去上学,也没有接受基于有培养方案指导的家庭教育,而可以对自己的教育负责。在 2011 年 9 月,我在博客(这里)以及各种网站上发布了参与调查的号召。在回复者中,一共有 232 户家庭符合我们的参与标准,并完成了问卷。大部分回应者都是母亲(只有 9 名是父亲)。在那项研究中,我们询问了他们为何选择非学校教育,他们如何走向非学校教育,以及根据他们的体会,非学校教育有哪些益处和挑战。
为描述研究结果,我在博客里发布了三篇博文——第一篇,第二篇,第三篇——此外我和 Gina 在 Journal of Unschooling and Alternative Learning 《非学校教育与其他学习方式期刊》(这里)发表了一篇相关论文。调查的参与者对非学校教育经历的态度是热情而积极的,这并不奇怪。他们描述的益处,包含了孩子心理生理健康改善,更好的社交生活,学习效率的提升和学习态度的改善。他们也写道,一家人更亲近更和睦了,他们还不需要步步紧跟学校施加的时间安排。他们描述的挑战里,有跟那些不理解他们或者反对他们做法的人,解释他们非学校教育的做法,以及克服他们根深蒂固的教育观点。
看了这项调查的结果,我们开始好奇,除了他们的父母,那些非学校教育者对他们自己的非学校教育经历有什么看法。我们同样开始思考,如果那些长大的非学校教育者选择接受高等教育,他们的表现又是如何,除此之外,他们能否找到有成就感,有满足感的职业。为解决这些问题,我们针对成年非学校教育者开展调查,这也是本篇文章,以及本系列后续三篇文章所描述的。
我们对成年后的非学校教育者研究采用的调查方法
2013 年 3 月 12 日,我和 Gina 在这个博客上发布宣告(这篇)来召集调查参与者。其他人注意到了这篇宣告,并转载到了其他网站上,社交媒体上也有所流传。为保证参与者明白我们口中「非学校教育」的含义,我们在宣告中将其定义为:
「非学校教育不是学校教育。非学校教育的父母,不会把孩子送去上学,也不会在家里做学校里会做的事情。具体而言,他们不为孩子设置培养方案,不会为达成什么教育目的而要求孩子完成某项任务,也不测试孩子的进度。相反,他们让孩子拥有追随自己兴趣的自由,以及有自主学习所需知识的自由。他们可能用各种方式为孩子的学习提供环境和支持。通常而言,非学校教育者认为,人生学习实为一体。」
之后,宣言声明了参与者必须(a)至少十八岁;(b)(根据以上定义)在一般人读高中的年龄实施了两年以上的非学校教育;(c)没有上过高二高三。
宣言附上了 Gina 的邮箱地址,并要求申请者联系 Gina 以获得知情同意书和调查问卷。调查问卷询问了申请者的性别;出生日期;学校教育、家庭教育和非学校教育的历史(每种教育的年限);选择非学校教育的原因(自己所认为的);在非学校教育的时段里,父母对他们教育的作用;非学校教育之后,他们接受的各种正式高等教育(包括他们如何成功申请,以及如何适应学校生活);他们目前的职业状况;他们成长期和现在的社交生活 ;非学校教育的利与弊;他们是否会让自己的孩子接受非学校教育。
我们在宣告发布六个月之内都接受调查问卷的提交,Gina 和我会分别将问卷阅读两遍,并各自编写定性的编码系统(译注:一种对问卷调查回答进行分类和标记的方法),以将他们的回复分类。确定了编码系统之后,我们会各自重读回复,确定自己的编码选择,对于不一致的地方,我们会加以讨论来解决分歧。
参与者和三个组别的划分
共有 75 人符合标准,填写并提交了问卷。其中,65 人来自美国,6 人来自加拿大,3 人来自英国,1 人来自德国(在德国,非学校教育是违法的)。回应者的年龄中位数是 24 岁,年龄范围从 18 岁到 49 岁。有 8 人处于青春期,48 人 二十多岁,17 人三十多岁,2 人四十多岁。58 人(77%)为女性,16 人为男性,有一人自我定位为性别酷儿。女性比例较高,可能是因为女性相比男性更可能回复调查请求,而非因为更多女孩接受了非学校教育;实际上,我们之前的研究结果是男性接受非学校教育更多——不知为何,完成了调查的家庭中,接受非学校教育的男孩比女孩更多。
为能加以比较,我们根据回应者最后接受学校教育或家庭教育的年级,将他们划分为三组。第一组是完全非学校教育者——完全没接受 K-12 教育(译注:小初高),也没接受家庭教育(这里的「家庭教育」和报告其他地方,指的是在家里接受的学校式教育,不属于非学校教育)。第二组接受了 1 年或更长时间的学校教育或家庭教育,但都在六年级后停止了;第三组,则是在六年级之后接受了 1 年或更长时间的学校教育或家庭教育。因此,第二组的人可能接受了 1 到 7 年(K-6)的学校教育/家庭教育,而第三组的回应者可能接受了1 到 11 年的学校教育/家庭教育。
下面的表格具体说明了我们研究这三组人群的统计学发现。表头记录了每组人数。前三行分别说明了年龄中位数和范围,学校教育与家庭教育的年限之和的中位数和范围,以及每组女性占比。很显然,这三组的参与者数量、年龄中位数和女性占比大抵相似,但是学校教育和家庭教育的年限之和是不一样的。
非学校教育之后的正式高等教育
问卷的第五个问题是,「请简要描述你任何正式高等教育的经历,比如社区大学/大学/研究生学校。没有高中文凭,你是如何入学的?你之前都在进行非学校教育,你是如何调整自己,适应这种更正式的教育?请列举你获得的所有学位,以及你正在攻读的学位。」
在这个系列的后续文章里,我会更详细地描述他们的回复,我会大量引用他们的原话。在这里,我会简单总结我们编码分类回复得到的统计学发现。
总共有 62 (83%)名参与者表示,他们接受了某种形式的高等教育,其中包括职业训练(比如料理学校),社区大学课程,以及本科课程和研究生课程。由表格第四行可见,三组的高等教育比例基本相同。
总共有 33 名(44%)参与者读完了本科学位或更高学位,或者目前是全日制本科学生。由表格第五行可见,选择攻读本科学位的可能性,与之前接受学校教育的年限,是负相关的关系。完全非学校教育的一组最可能攻读本科学位,而六年级之后接受了一定学校教育的一组,最不可能攻读本科学位。然而这种差别并没有统计学上的显著性(卡方测验得到 p=0.126).
选择读本科的 33 人中,有 7 人表示他们参加了相应测试以拿到普通教育文凭(General Education Diploma,GED),有 3 人表示他们通过在线流程拿到了学位。其他人没有高中学位也读上了本科,但有些人自制了学位证书,我们认为这种证书应该没有官方认可。33 人中只有 7 人表示,他们参加了 SAT 和 ACT 考试以申请大学。目前而言,这些年轻人读四年制大学最常见的敲门砖是社区大学。33 人中 21 人在申请四年制大学之前完成了社区大学课程,并在申请中用社区大学的成绩单作为敲门砖。有些人在比较小的时候就开始上社区大学课程了(有一人 13 岁开始,大部分 16 岁开始),这种程度上为他们的大学生涯获得了先发优势。他们将社区大学的学分转移到四年制大学,减少了修本科学位所需的学期数(以及学费)。有些人也提到通过面试和各种证书来申请大学。
他们选择的大学比较多样,从州立大学(比如南卡罗来纳大学和 UCLA),到常春藤大学(康奈尔大学),以及各种规模较小的人文大学(比如 Mt. Holyoke, Bennington, and Earlham)。
出人意料的是,从参与者反映来看,他们在大学体会到的学业困难非常少。从来没有在教室上课,或者阅读教科书的学生,斩获了全 A 成绩并拿到了奖学金,不仅在社区大学,而且在本科项目里。显然,没有学习他人强加的课标,并没有让他们缺少什么在大学成功所需的信息或技能。大部分人认为,相比他们的同学,他们具有学业上的优势,因为他们没有因为先前的学校教育而耗竭殆尽,并且在非学校教育中学会了自我导向与自我负责。他们认为上大学是他们自己的选择,并希望充分利用大学提供的资源。他们上大学本希望能沉浸在充满智力挑战的环境,相反,他们发现同学们对同学会派对和喝酒更感兴趣。我会在本系列下一篇文章对这些现象加以详细描述。
他们的职业情况
问卷第四题是:「你现在有工作吗?如果有,你在做什么?你现在的工作,和你非学校教育时期的兴趣/活动匹配吗?如果匹配请解释。」我们在分析这一问题的回答之后,又编制了跟踪问卷,发送给了全部参与者。我们让他们列举并描述他们做过哪些有薪酬的职位,我们据此来判断他们是否足以自给,并描述他们目前的职业理想。75 名参与者中有 63(84%)人回答了跟踪问卷。
在接受调查的时段,大部分回应者都在从事有薪酬的工作,当然全日制学生,以及孩子还小的母亲不在此列。回答跟踪问卷的人里面,有 78% 认为他们在财务上足以自给,不过有些人补充道,他们的收入并非丰厚,能财务独立的部分原因,是他们的生活方式比较节俭。有些人认为节俭是种美德,并表示相比那些更挣钱的工作,他们更喜欢从事那些他们喜欢并觉得有意义的工作。
总体而言,回应者的职业和工作相当多样,但在我们的定量分析和编码中,我们注意到了两条规律。
第一条规律是,根据我们的编码,有相当高比例的参与者的职业属于创意艺术类别——比如工艺、音乐、摄影、电影、写作等。总共有 36 名(48%)参与者从事这些职业。值得注意的是,在表格第八行里,完全非学校教育的一组中有 79% 的成员从事创意艺术职业。相比其他参与者,这组更有可能从事创意艺术类职业,这一观察是有极高统计学显著性的(根据卡方测试,p<0.001)。
第二条规律,是参与者中有很大比例是创业者。属于这一分类的参与者,会创建自己的生意,并以此为生,或者正在朝这个方向努力。这一分类与创意艺术分类有很大重合,很多人在售卖自己的创意产品或服务。根据我们的分类,总共有 40 名(53%)参与者是创业者。从表格第九行可见,一直非学校教育的一组中创业者比例最高(63%),但在这个方面,组别之间的差异没有统计学显著性。
对于成年职业与童年兴趣和活动的关系这一问题,58 名(77%)参与者表示,这两者显然是彼此关联的。对于很多人来说,这个关系是顺理成章的。艺术家、音乐家、戏剧方面等职业,都将童年兴趣无缝转化成了成年职业;从事艺术之外行业的人,同样描述了他们的童年兴趣自然演化为自己的职业。从表格第六行可见,完全非学校教育一组中,童年兴趣与成年职业紧密契合的人比例最高,不过这一差异没有统计学显著性。
关于非学校教育者后续职业的这些规律,会在本系列第三篇文章,引用参与者的回复来详细描述。
他们对自身非学校教育经历的评价
问卷第七题是,「对你来说,非学校教育的主要优势是什么?请考虑你成长过程中的感受,以及你现在回顾过去的感受。在你看来,非学校教育怎样帮助你长大成人?」
几乎所有回应者都用各种方式描述,在非学校教育之中,他们自由而独立,并有时间来发现和探索。有 70% 的人也表示,他们的这些经历,让他们得以成长为自我驱动力强大而又自我引导的个体,很多人也写道,他们拥有了身处学校所决不能有的学习机会,他们能相对顺畅地过渡到成年生活,以及相比学校内的社交,他们在学校之外有了更加健康(混龄)的社交生活。
问题八写道,「对你来说,什么是非学校教育的主要不利之处?同样,请考虑你童年的感受,以及你现在的感受。对你来说,非学校教育是否阻碍了你转向成人生活?」
75 人回应者中,28 人表示非学校教育没有任何不利之处。在剩余 47 人中,最常见的不利之处包括:(1)处理其他人的指摘和对非学校教育的意见(至少有 21 人反映如此)(2)某些程度的社交孤立(有 16 人反映如此)(3)他们接触高等教育时,必须自我调整社交取向,以适应那些全程接受学校教育的人的价值观和社交方式(有 14 人反映如此)。
75 人中有 72 人认为,非学校教育利大于弊。只有 3 人持相反看法,其中有两人对于他们自身的非学校教育经历,以及一般意义非学校教育,表达了相当强烈的负面看法(本系列第四篇文章会详细描述)。
问卷第九题为:「如果你选择组建家庭或生孩子,你会为他们选择非学校教育吗?为什么,或者为什么不选择?」有一位回应者没有回答这个问题。剩余 74 人中,50 (67%)的回应可以认为是坚定的「会」,其中有 8 人已经有了到达入学年龄的孩子,并为他们选择了非学校教育。剩余回应者中,我们将 19 人的回应认定为「可能」(对他们而言,这个选择需要考虑诸多因素,如孩子的性格和意愿、另一位父母的同意与否、以及家附近有没有好的非传统学校),而 5 人的回应被我们认定为坚定的「不会」。回应者中总共有 3 人对他们自身的非学校教育经历不满意,而这 5 人中便有其中 2 人。至于 5 人中的另外 3 人, 虽然对他们自身的非学校教育经历持积极态度,但不会为他们的孩子选择非学校教育,有各种原因。
在本系列第四篇文章,会更深入描述这些回应者对于非学校教育之利弊的感受。
本调查的局限性
当然,本研究有一大局限,就是参与者是自我选择的样本,而非从成年非学校教育者中随机挑选的样本。在前文也提到了,响应本研究的男性相对较少。更大的问题在于,这一样本中,那些对非学校教育体验和他们的后续生活非常满意的人群,可能其比例比实际更高,因为这一人群相比不满意的人群更可能参与研究。因此,这一研究不能作为依据,来支持关于整个非学校教育人群的体验和感受的较强主张。不过,这一研究无可置疑地反映了,采取非学校教育,并走向令人满意的成人生活,是有可能的。对于回复了我们调研的这部分人群,在高等教育,理想职业,以及各种有意义的生活体验上,非学校教育似乎是利大于弊的。
请期待本系列剩余三篇文章的发布(稍后逐篇发布),届时您将能够阅读到这些成年非学校教育者,用自己的话讲述他们的感受。
--------------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
----------------
关于教育自决的人类本性,请参见《玩耍精神》)。
注:本文章头图《非学校教育入门》由 Idzie Desmarais 绘制。Idzie 是「幼儿园辍学生」,她写了篇很棒的博客,名为《我没有上过学。不错我会写字》。她的网站上有一系列青年成年非学校教育者撰写的博客,以及一些对成年非学校教育者的采访。
教得少学得多的又一例证
原文:Another Example of Less Teaching Leading to More Learning | Psychology Today
顽劣男孩不上课学业收获更大
发表于 2017 年 9 月 26 日|审稿人:Ekua Hagan
在 1920 年代至 1930 年代,一些非常有趣的教育实验得以开展,而这些实验现在基本无人问津。在那个年代,很多教育上的进步思想广为流传。甚至是公立学校都在尝试减少教学而增加自学机会,以期获得较大的教育益处。
Benezet 的不教算术实验
在先前的帖子里,我描述了 L.P. Benezet 开展的实验,当时是 1920 年代后期和 1930 年代前期,他在新汉普郡曼切斯特担任学校主管。针对他所辖校区中最穷的学校,他改变了其中一半学生的课程,在六年级之前都不开设算术课。他发现,这些孩子在刚上六年级时,比其他孩子在数学应用题上表现得更好——这类问题需要把数学知识与常识结合起来。这些孩子可是一点都没接受过算术教学。他们甚至比那些富人区的孩子表现更好,那些孩子可是从小学到大的。当然,在按照普通教学方式设定的加减乘除计算问题上,他们的表现稍显落后,但六年级结束时,他们在计算问题的表现上已经跟上其他人了,而且应用题的表现仍然遥遥领先。
Benezet 总结道,算术早教不仅浪费所有人的时间,并且对最终掌握算术是毫无益处的。按他的话说,算术早教是「用氯仿熏烧孩子的思想」,让他们丧失数学相关的基本常识。
现在,没有教育相关人士讨论 Benezet 的实验了。甚至没什么人都听说过。Benezet 的实验结果与一些研究是契合的,这些研究证明了,暑假期间,学生在数学推理上取得的进步,比上学期间取得的进步更大(参见此处),这个结果现在也没什么教育人士讨论了。
William 让顽劣男孩免于教学的实验
还有一个教育实验也是现在无人问津的。这个实验在 1930 年发表于《学校与社会(School and Society)》,其题目为「自主教育的一次实验(An Experiment in Self-Directed Education)」,Herbert Williams 著,他也是完成这一研究的教师。
William 试图解决的实际问题是,如何处理那些顽劣的男生,他们经常旷课,在社区里胡作非为。为了这次实验,他翻阅了这座三十万人口城市的少年法庭记录,并尽可能找出了「恶劣」的男生。几所学校的校长又提名了一些男生,都是他们认为「存在最为严重的问题」。他最终得到的实验组有「从 8 岁到接近 16 岁的男生,IQ 从 60 到 120,涵盖有色人种,波兰人,匈牙利人和本地白人。」
实验于 1924 年 1 月开始,于同年七月结束。试验期间,这些男生不必正常上学,而是前往一间特殊房间。这个房间位于一所技术学校,是为他们专门开设的,里面配有课桌,黑板,一张巨大的桌子,一些书籍,包括故事书,非虚构书籍,以及不同年级的教科书。在 1 月份,这些男生接受了标准的成绩测试,而四个月后又接受了一次测试。
对于事情的进展,可能 William 自己的话最能描述:
「没有正式的教学环节。实验一开始,孩子们被要求自己找事情做,不要打扰其他人。这是唯一贯彻的规矩。除此之外,他们可以想干什么就干什么。指导者(Williams)偶尔过来看看这些孩子在干什么。可能有个孩子在忙着临摹一本书里的图片;还有个在读童话书;另一个孩子在忙着解算术题;还有个孩子在读历史书;还有的孩子在地图上寻找某个地方;还有些孩子在研究机械。」
「只要有孩子展现了对某件事的兴趣,他会得到鼓励,并获得发展这种兴趣的机会……喜欢并擅长机械活的孩子,得到了在高中机械工房里做这种活计的机会。如果有人对汽车机械、木工、打印之类感兴趣,也能得到同样的机会。有些娱乐活动在附近的基督教青年会安排。」
「每个孩子都获知了成绩测试的结果,并被鼓励以补足他们的弱项,但没有人会强迫他们。作者惊奇地发现,这些孩子会自然地从一个学科转向另一个学科学习。一个孩子可能读一本书读一整天。第二天他可能做一整天的算术题。有个 10 岁孩子对解平方根问题起了兴趣,他便把算术书里能找到的平方根问题都做完了。有个有色人种男孩对历史感兴趣,他便把我们能提供的所有历史书都读完了。他会讲有趣的历史事件,所有孩子都听得如痴如醉。只要有孩子在书里发现了可能有趣的东西,他可以把这件事讲给所有人听。然而,他们不一定要听讲,可以继续做手头上的事。」
「很多男孩走到黑板前做算术。他们会创造一些涉及算术的游戏。比如,有个游戏是比赛累加 17 直到 1000,往往有两个或更多男孩参加,一发令就开始。比赛往往很激烈。对于有些孩子来说,他们基础的算术速度和准确性得到了非常惊人的提升。孩子对有趣内容的报告也会激发其他孩子阅读所报告的书,或者是类似的书。有一种可能是,他们做这些任务的动力是争取同伴的认可,否则他们并不会尝试这些任务。」
「尽管一共有 26 个男孩参加这个特殊的实验组,时间有长有短,但只有 13 个孩子同时参加了一月的 A 组和六月的 B 组斯坦福成绩测试。缺席的原因有校外调整和转学等。社会适应更为重要,如果有人紧急需要男孩去农场工作,那么不能为了保证实验记录完整而阻止他。」
这是成绩测试的结果:
在为时 4 个月的实验期间,13 个孩子取得了平均超过 14 个月的语言学龄进步;算术 14 个月;阅读 11 个月;历史和文学 6 个月。实验结束时,所有孩子的总体水平超过了相应年级水平。有三个男孩进步最小,而他们也是经常缺席实验的,其原因有健康方面和家庭问题等。有 10 个男孩经常出席,他们的平均进步是语言和算术 17.4 个月;科学 15.8 个月;阅读 15.5 个月。
在文章结论中,Williams 写道:
「最令人震惊的是,如此显著的进步,竟然可以源自如此非正式且自主的活动,并且也确实如此。笔者对这些男孩的教育发展并不感兴趣。他预期中更关心的是社会适应的问题。他使用这个特殊房间,只是为了更好地熟悉这些男孩,并避免他们违反强制出席法。他们是否阅读,学习算术、地理、历史等等学科,笔者并不关心。应当记住的是,相比一般孩子,这些孩子呆在教室里的时间更少,而更多呆在商店、健身房、操场里。为了解释这种学业成绩的提高,笔者只能假设……刺激孩子的,是监管者对孩子的家庭状况、社区状况、娱乐、健康等方面的个人兴趣,以及对孩子个人的关心。」
我自己的猜测是混龄学制同样发挥了作用,这点 Williams 并没有提到。这群男孩从 8 岁的到接近 16 岁的都有。自主教育在混龄环境下发挥最好(参见这篇和这篇)当然,这些孩子能自由地按意愿在学习上花时间,因此他们能深入地研究,这是普通课堂所不能及的。虽然普通教室在设计上完美地阻碍了兴趣热忱的发展和培养,这种「教室」对此并不设障。
如果教育局能回顾这些旧研究,并在现在重新开展,那该有多好!现在,教育局似乎认为,教育的不足,只能通过更多教学弥补——这就是把不灵的药方又开一遍。与此同时,Benezet 和 William 的研究证明了,少点教学,多点信任,可能就是答案。
本博客的忠实读者应该知道,我对标准学业测试并不感冒,也不喜欢那些看重标准化测试成绩,把取得高分为第一目标的学校系统。以我看来,(而我估计 William 也这么想),我们认为应该在学校就读的时间,应该用来探寻自己是什么样的人,找出自己喜欢的事情,并提高这些方面的技能,此外要掌握人际交往能力和情感能力,并培养一种信心,即你想学什么,何时需要知道什么,便能掌握什么。这些能力来自于真正的自主教育,让年轻人自由探索世界,而不必依赖于某个配有教科书的特殊房间,或者提分的鼓励,或者他人心中的「成绩」。对我而言,Williams 的实验又一次说明了,对于我们在学校牵挂万分的所谓「成绩」,如果年轻人因为一些原因想要达成,那么按照最适合他们的方式追求,其实是很容易而且无痛苦的。
参考文献
Herbert D. Williams (1930). Experiment in Self-Directed Education. School and Society, 31, 715-718.
美国的儿童越来越不自由,创造力越来越低
原文:As Children’s Freedom Has Declined, So Has Their Creativity | Psychology Today
最新研究显示,美国的学龄儿童正变得越来越缺乏创造力。
发布于 2012 年 9 月 17 日
如果问有什么能让美国在国际上脱颖而出,那答案一定是创造力。全世界都钦佩「美国的创新精神」。我们可能不是最富有的国家(至少按最低贫困比例来看不是),也不是最健康的国家(差得远呢),我们的孩子在标准化考试上的成绩也不是最高的(尽管政治家们错误地认为这样做能帮我们达到目标)。但我们是最具创新精神的国家。我们是伟大的创新者,擅长探索新的做事方法和新事物。这种特质可能源自美国的特殊历史,或者源自我们这种独特的民主形式。这种民主强调个人自由和尊重与众不同。在商业、学术和艺术等各个领域,创造力都是我们最重要的财富。在 IBM 最近的一项调查中,1500 名 CEO 确认了这一点,他们指出,是否拥有创造力是预测未来是否成功的最关键因素。[1]
因此,阅读 Kyung Hee Kim 近期的研究报告令人警醒。该报告记录了美国学龄儿童在过去二三十年间创造力持续下降。[2]
Kim 是威廉与玛丽学院的教育学教授。她分析了从幼儿园到十二年级学生在几十年间的创造力测试成绩,这些测试称为托兰斯创造思维测试(Torrance Tests of Creative Thinking, TTCT)。Kim 教授的分析显示,从 1984 年到 1990 年间,各年级的测试成绩开始下降,并且一直持续下降至今。成绩的下降在统计上非常显著,有些甚至下降幅度很大。Kim 教授指出,数据显示「孩子们的情感表达不如以往丰富,没那么有活力,不爱说话,口头表达能力在下降,幽默感和想象力在减少,不怎么标新立异,没什么生气和激情,感知能力减弱,不那么能将看似无关的事物联系起来,综合能力降低,也不太能从不同角度看问题。」
根据 Kim 教授的研究,虽然创造力的各个维度都有所下降,但下降最多的是一个称为「创造性详细阐述」的指标。这一指标主要评估一个人将特定想法以新颖有趣的方式扩展的能力。从 1984 年到 2008 年,托兰斯创造思维测试(TTCT)中,从幼儿园到十二年级的每个年龄组的「详细阐述」平均得分下降了超过一个标准差。换言之,2008 年超过 85% 的儿童在这个指标上的得分低于 1984 年的平均水平。唉。
你可能会好奇,如何评估创造力。按照创造力的定义,有标准答案的测试都不能真正评估创造力。托兰斯创造思维测试是由 E. Paul Torrance 在 20 世纪 50 年代末期开发的,当时他是明尼苏达大学的教育学教授。在 Sputnik 卫星发射后不久,美国政府担心在科学创新方面落后于苏联(这其实并非如此),因此开始重视识别和培养美国学生的天赋,以追赶俄罗斯人。
当 Torrance 的大多数同事们还在用标准的智力测试来评估学生潜能时,Torrance 却选择了研究创造力。他之前在空军与战斗机飞行员合作的经历让他深信,创造力是个人成就和适应不同常规情况的关键。[3] 因此,他着手开发了一种新的测试方法,要求参与者「利用各种刺激物创作出新颖有趣的作品」,以此来展示他们的创造性。这一努力最终诞生了以他名字命名的一系列创造力测试。在这些测试中,最常用的一种是提供一些简单的图形,如波浪线、平行线和圆圈,参与者需要围绕这些基本图形绘制出既原创又有意义的图画。这些作品会根据它们的原创性、寓意深度和幽默感等方面进行评分。
支持 Torrance 测试真的能够衡量创造潜力的最有力证据,来自于一系列纵向研究。这些研究表明,儿童时期在 TTCT 测试中的高分与他们后来在现实世界中的成就之间,存在着显著的正相关关系。[4] 正如一篇评论这些研究成果的文章所指出的,高分者在成年后的表现更为突出,他们创作了更多的书籍、舞蹈、广播节目、艺术展览、软件程序、广告活动、硬件创新、音乐作品、公共政策、担任了更多的领导职位、应邀进行了更多的讲座,并设计了更多的建筑,相比之下,分数较低的人在这些方面的成就要少得多。[5]
确实,根据现有研究,TTCT 可能是迄今为止最能预测人生成就的工具。它预测未来成就的准确性超过了智商测试、高中成绩或同龄人的评价。[6] 研究显示,儿童时期的 TTCT 得分与成人时期的创造性成就之间的相关系数,根据不同的测试内容和成就评估方式,最低可达 0.25,最高可达 0.60。[6]
因此,学龄儿童 TTCT 得分的下降确实令人担忧。Kim 教授甚至将这种现象称为「创造力危机」,这个说法也被多家流行杂志引用。
这其实并不令人意外。几十年来,社会对儿童的自由限制越来越多,现在我们发现他们的创造力也在下降。
创造力需要自由的滋养,但现在的孩子们却常常受到持续监控、批评、成人指点的压力,以及整齐划一带来的束缚,这些都严重抑制了他们的创造性。在现实生活中,很少有问题只有唯一的答案,很少有难题只有一个解决方案;这就是为什么创造力对成功如此关键。但我们却越来越多地让孩子们接受一种教育,这种教育认为每个问题都有一个标准答案,每个难题都有一个正确解决办法。如果孩子们和他们的老师敢于尝试新方法,他们会被给予惩罚。正如我在之前文章中所述,我们还在不断剥夺孩子们课外的自由时间,不让他们自由玩耍、探索、体验无聊、战胜无聊、失败并克服失败——这些都是他们发展全部创造潜力所必须经历的。
在这一系列的下一篇文章中,我会展示研究证据,这些证据将表明,创造力确实是在自由的环境中生长,而在过度指导、过度保护、评判过严的教师和家长手中则会逐渐凋零。
----------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
------------
参见新书《自由学习》
参考文献
[1] IBM 2010 Global CEO Study: Creativity Selected as Most Crucial Factor for Future Success. http://www-03.ibm.com/press/us/en/pressrelease/31670.wss.
[2] Kyung Hee Kim (2011). The creativity crisis: The decrease in creative thinking scores on the Torrance Tests of Creative Thinking. Creativity Research Journal, 23, 285-295.
[3] Garnett Millar, Christine Dahl, and John Kauffman (2011). Testing the whole Mind—educating the whole child.” Illinois Association for Gifted Children Journal, Spring, 2011 issue.
[4] Mark A. Runco, Garnet Millar, Selcuk Acar, & Bonnie Cramond (2010) Torrance tests of creative thinking as predictors of personal and public achievement: A fifty-year follow-up. Creativity Research Journal, 22, 361-368.
[5] Mo Bronson & Ashley Merryman (2010). The creativity crisis. The Daily Beast, July 10, 2010. The Daily Beast, July 10, 2010. http://www.thedailybeast.com/newsweek/2010/07/10/the-creativity-crisis.html.
[6] See: Mark A. Runco, Garnet Millar, Selcuk Acar, & Bonnie Cramond (2010) Torrance tests of creative thinking as predictors of personal and public achievement: A fifty-year follow-up. Creativity Research Journal, 22, 361-368. Also: Kyung Hee Kim (2008). Meta-analysis of the relationship of creative achievement to both IQ and divergent thinking scores. Journal of Creative Behavior, 42, 106-130.
美国教育学家:我们“比不过”中式教育,我对此很满意
原文:Be Glad for Our Failure to Catch Up with China in Education | Psychology Today
我们的学校比中国的好,毕竟我们的学校没那么“好使”。
发布于 2013 年 5 月 28 日
二十余年来,我们国家的教育目标始终瞄准着模仿中日韩的教育系统。我们一直致力于集中控制,提升课程标准和教学方法的标准化程度,延长课堂时间,增加家庭作业,这一切都是为了让学生在标准化考试中考得更高。20 世纪 90 年代克林顿的《2000 年目标》,在下一个十年布什的《不让一个孩子掉队》法案,然后是奥巴马的《力争上游》,无不着意在此。每当国际测试中我们的学生得分低于其他国家的学生,我们都感到尴尬。在 2010 年 PISA(国际学生评估项目)考试中,目睹 15 岁的上海学生在阅读、数学和科学方面名列榜首,而我们远远落后,我们的教育领导人再次坚定了效仿中国的努力。美国教育部长 Arne Duncan 称之为「警钟」[1, p 120]
你也许会认为,中国的教育领导者们,会因为中国孩子在国际知识竞赛中名列前茅而高兴。并非如此。越来越多的中国教育人士认为,中国教育系统糟糕透顶。在我们继续努力效仿他们的同时,他们也在努力效仿我们,或者说像我们之前的样子,尽管到目前为止还没有取得多少成功。他们发现他们的系统正在压制创造力和主动性,最终产出体面的官僚和算数家,而不是发明家和企业家。北大附中国际部主任江学勤,在《华尔街日报》上回应了让 Duncan「警醒」的同一份 PISA 报告:「众所周知,死记硬背体系的缺点是:丧失社交技能、实践技能、自律和想象力,对学习失去好奇心和热情。…如果 PISA 成绩下降,那么就说明我们成功地改变了学校。」(添加粗体)[2]
让我们「近距离观察」下中国的教育系统吧。
根据杭州市教育科学研究所开展的一个调查,中国的小学生每天都要花 10 小时学习,初中生是 11 小时,高中生是 12.5 小时。[3] Keith Bradsher 最近报道了一位典型中国高中生的生活:「她每天早上 5:30 起床学习,7:30 吃早饭,然后上课,早上 8:30 到 12:30 ,下午 1:30 到 5:30,晚上 7:30 到 10:30。她在周六周日也要花一部分时间学习。」[4] David Jiang 是美籍华裔,但高中在中国就读。他在博客中写道:「我[高中时]看到身边是一大群僵尸。…正是在这里,我意识到成绩是多么肤浅….」[5]
中国学生如此疯狂学习,只为高考名列前茅。家长老师联手角力竞争,要竭力榨干孩子,换来赫赫高分。如果孩子考得差,家长就体罚。所谓差就是没有拔得头筹。
最近,中国和英国研究者面向中国小学生开展了一次大规模调查,调查揭露了孩子们普遍承受着心理苦楚。作者将结果总结如下:「81% 的小学生『非常』担忧考试,而 63% 的小学生很担心老师降下惩罚。有 44% 的学生至少遭受过一次身体上的霸凌,其中很多霸凌受害者是男孩,而 73% 的孩子曾被家长体罚。超过三分之一的孩子反馈,他们每周会发作一次心身症状(psychosomatic symtoms,心理压力过大导致的身体症状)。压力水平极高(压力测评分数前四分之一)的孩子,出现心身症状的可能性增加了三倍之多。」
中国媒体年年吹嘘高考状元,他们和父母一时风头无两,但是后续研究证明,高分不意味着高成就。高分学生离开学校后,其成就和分数较低的同龄人相比并不显著;事实上,一项研究的结果表明,平均而言,高分学生的成就比分数较低的同龄人要低下。[7, p 82] 事实上,根据中国教育专家赵勇的说法,中国现在常用高分低能一词来指代他们的教育制度的总体结果。这要归咎于学生几乎每时每刻都在学习,毫无余裕涉足他事。他们很少有机会发挥创造力,主动出击,练习运动技能或者交际。
赵勇先生在中国长大,并亲历了中国的教育系统。如今他是 Oregon 大学的教育学教授,他的两个孩子就读于美国学校。他的大部分研究关注中美教育的异同及其对经济的影响。在最近的两本书——《迎头赶上,还是领跑全球》(2009)和《从美国教改的迷失看世界教育的趋势》(2012)中,他描述了中国教育体系的危害,并记录了中国当局对改革教育的兴趣。
在解释为什么美国教育系统的实际效果优于中国教育系统时,赵教授写道:「简而言之,美国教育在扼杀创造力和企业精神上,没有中国教育成果斐然。两国教育体系在根本上是相同的,也就是将孩子加工成标准功能齐全的产品,通过课标的掌握程度衡量,而课标就是成人认为孩子应知应会的东西,毫不考虑不同孩子的背景、兴趣、与差异。」[1, p 134-135]
赵教授还解释道,美国教育系统的好处,是它在实现自身的目标上很失败;美国孩子没有被驯服。他做了个类比,美国教育系统就是一把“钝刀”,一刀切后孩子还能保全自我。
中国领导人想要效仿美国教育系统,而美国领导者想效仿中国教育系统。也许几年之后,如果双方大功告成的话,中国人会开始发明创新,而更多的美国孩子需要找儿科医生和儿童心理医师治疗压力诱导的儿科疾病。
为何不能彻底革除这套自上而下、胁迫强制的教育系统呢?废掉这一刀切的系统,营造环境让所有孩子能自选道路,自由地自主教育,而不必向学校系统争取这权利。若要了解更多,请参见《玩耍精神》。
-----------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
-----------
参考文献
[1] Yong Zhao (2012), World class learners: Educating creative and entrepreneurial Students.
[2] Jiang Xueqin. The Test Chinese Schools Fail: High Scores for Shanghai’s 15-year-olds are actually a sign of weakness. Wall Street Journal, December 8, 2010.
[3] See Zhao, 2012, pp 1240125.
[4] Kieth Bradsher. In China, Betting It All on a Child in College. New York Times, Feb. 16, 2013.
[5] David Jiang (July 12, 2011). China; Education System Made Me an Individual. http://diaspora.chinasmack.com/2011/usa/david-jiang-china-education-system-made-me-an-individual.html
[6] [Hesketh T](http://www.ncbi.nlm.nih.gov/pubmed?term=Hesketh T[Author]&cauthor=true&cauthor_uid=20133328), [Zhen Y](http://www.ncbi.nlm.nih.gov/pubmed?term=Zhen Y[Author]&cauthor=true&cauthor_uid=20133328), [Lu L](http://www.ncbi.nlm.nih.gov/pubmed?term=Lu L[Author]&cauthor=true&cauthor_uid=20133328), [Dong ZX](http://www.ncbi.nlm.nih.gov/pubmed?term=Dong ZX[Author]&cauthor=true&cauthor_uid=20133328), [Jun YX](http://www.ncbi.nlm.nih.gov/pubmed?term=Jun YX[Author]&cauthor=true&cauthor_uid=20133328), [Xing ZW](http://www.ncbi.nlm.nih.gov/pubmed?term=Xing ZW[Author]&cauthor=true&cauthor_uid=20133328). Stress and psychosomatic symptoms in Chinese school children: cross-sectional survey. Arch Dis Child. 2010 Feb;95(2):136-40. doi: 10.1136/adc.2009.171660. Epub 2010 Feb 4.
[7] Yong Zhao (2009), Catching up or leading the way: America education in the age of globalization.
自主教育的生物学基础
四种强大且与生俱来的内驱力能引导孩子自主学习
原文:Biological Foundations for Self-Directed Education | Psychology Today
发布于 2016 年 9 月 28 日
来源:萨德伯里山谷学校,已授权
在之前的许多文章中,我主张儿童天生具备有助于自我教育的生物学机能。学龄前儿童坐拥惊人的学习能力(这里),采猎文化中的儿童,青少年自我教育的方式(这里),当今民主学校(这里和这里)和非学习教育家庭(这里和这里)中的孩子自我教育的方式,就是最好的证明。
在本文中,我希望能更精确地描述一下自主教育的生物学原理。我认为,这样的原理主要存在于所有正常儿童都拥有的四种强大内驱力中:「好奇心」、「爱玩耍」、「爱社交」和「有计划」。这些内驱力的根基编码在 DNA 中,在我们漫长的演化史中由自然选择所塑造,服务于教育的目的。我们的标准化学校为了促进一致性并将儿童禁锢在学校课程中,有意地抑制了这些内驱力,尤其是前三种。相比之下,自主教育——正如非学校教育家庭和民主学校中的那样——通过允许这些自然内驱力蓬勃发展而运作。在这里,我将详细阐述每一个内驱力,以及它们如何相互作用以促进教育:
好奇心
亚里士多德关于知识起源的伟大论著《形而上学》是这样开头的:「人类天生对事物充满好奇。」这再明显不过了 。从出生到死亡的每一刻,我们都充满了强烈的好奇心。出生后几个小时 , 婴儿看新奇物体的时间就比看已经看过的东西要长 。随着他们获得行动能力,先是手,然后是腿,他们使用这些行动力去探索环境中更广阔的领域。他们想要了解他们所处环境中的物体,他们特别想知道他们能用这些物体做什么。这就是为什么他们总是不断地沉迷事物和探索。这就是为什么,一旦他们掌握了语言,他们就会问非常多问题。这种好奇心不会随着孩子的年龄增长而减弱,反而持续地激发在更广阔的环境中,进行更加复杂的探索和实验,除非好奇心被学校教育所摧毁。儿童是天生的科学家。
爱玩耍
爱玩耍(即玩耍的内驱力)在服务于教育目的方面与好奇心相辅相成。 好奇心促使儿童探寻新知与理解,爱玩的天性则剌激他们实践新技能,并富有创意地使用这些技能。 无论在哪里,只要孩子们有时间玩耍,并且有很多玩伴,他们就会花大量的时间玩耍。他们玩耍是为了好玩,而不是刻意地去教育自己,但进化过程中产生的强烈的玩耍欲望会产生教育这个副产物。他们在玩耍中充分发挥各种技能,这些技能对他们的长期生存和福祉至关重要。
-
他们用身体玩耍,攀爬、追逐、打闹,这就是他们发展强壮身体和优雅动作的方式。
-
他们用语言玩耍,这就是他们掌握语言的方式。
-
他们和其他孩子一起玩社交游戏,这就是他们学习谈判、妥协和与同龄人相处的方式(这里)。
-
**他们在玩耍时遵守隐含或明确的规则 **,这就是他们学会遵守规则的方式。
-
他们会玩想象游戏 ,这就是他们学习进行假设性和创造性思维的方式。
-
他们用逻辑玩耍,这就是他们培养逻辑的方式。
-
他们玩建设游戏,这就是他们学习建设的方式。
-
他们使用他们文化中的工具玩耍,这就是他们熟练使用这些工具的方式。
玩耍不是教育的课间休息,而是教育本身。孩子们在游戏中学到的东西,比在教室里学到的东西要多得多,而且快乐得多。(更多有关儿童通过游戏学习的内容,请参阅此处。)
爱社交
我们人类不仅是最好奇、最爱玩的哺乳动物,而且也最具社会性。我们的孩子来到这个世界时,本能地明白,他们的生存和福祉取决于联系他人和学习他人的能力。所有人,尤其是年轻人,都想知道他们周围的人知道什么,并与他人分享他们自己的想法和知识。人类学家报告称,世界各地的儿童,通过观察和倾听他们周围的人所学到的东西,比通过任何其他方式所学到的要多得多。[1]
语言是我们对社会生活最独一无二的适应,极大地增强了我们从别人那里学习的能力。孩子们几乎一会说话就开始发问。他们不想被告知他们不感兴趣的事物,但他们强烈要求得到对于他们所感兴趣事物的答复。语言让我们能够与他人分享任何种类的信息。语言不仅能让我们告诉别人此时此地的事情,还有过去、将来、远之又远以及假设的事情。正如哲学家 Daniel Dennett 在《语言与智能》中所言:「把我们的大脑同鸟类或海豚的大脑相比几乎没有任何意义 , 因为我们的大脑实际上互相联结成一个认知系统,其他物种都相形见绌。 我们可以被一种能侵入大脑的新方法——语言一一相联结 。」[2] 自主的学习者,热切而自然地将自己连接到这个网络中。今天,因为有了互联网,这个认知系统比以往任何时候都要大。能够上网的年轻人可以接触到整个世界的假说、想法和信息。自主教育从来没有像现在这样容易。
有计划
我们比任何其他物种都更有超前思考的能力。实际上,我们是被驱使地这样做的。我们不只是对当下的情况作出反应;我们预测未来的情况,为此制定计划,并且贯彻执行这些计划。这是对我们基本教育内驱力的最有意识的认知,它比其他内驱力发展得更慢。随着孩子们年龄的增长,他们越来越有能力和内驱力提前做计划,甚至更进一步。这是一种驱动力,引导自主学习者思考他们的人生目标,无论大小,并有意识地寻找实现这些目标所需的知识和技能。认知科学家将这种制定计划并执行计划的能力称为自主执行功能。这些科学家的研究表明,与那些花更多时间参与成人组织的活动的儿童相比,那些有充足的自由时间独自玩耍和探索的儿童以及与其他不依赖成人的儿童,能够更充分地发展这种能力。[3] 这并不奇怪。当孩子们在没有成人控制的情况下创造自己的活动时,他们不断练习制定计划和执行计划的能力。他们会犯错,但他们会从错误中吸取教训。
--------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
也请看:《玩耍精神》、self-directed.org(以找到自主教育的盟友);并在脸书上关注我。
-------
参考文献
[1] Lancy, D. F., Bock, J., & Gaskins, S. (2010). Putting learning into context. In D. F. Lancy, J. Bock, & S. Gaskins (Eds.), The anthropology of learning in childhood, 3–10. Lanham, MD: AltaMira Press.
[2] Dennett, D. C. (1994). Language and intelligence. In J. Khalfa (Ed.), What is intelligence? Cambridge: Cambridge University Press.
[3] Barker, J. et al (2014). Less-structured time in children’s lives predicts self-directed executive functioning. Frontiers in Pssychology, 5, 1-16.
教育是否能被量化?人生是否能被定义?
原文:Can You Measure an Education? Can You Define Life’s Meaning? | Psychology Today
请你抚躬自问,教育的目的究竟是什么?
发布于 2012 年 12 月 14 日 | 审稿人:Ekua Hagan
在美国以及其他许多国家,都对量化某件事物非常痴迷。我们总是说「无法估量的,就无法掌控。」于是我们尤其想要量化学生的教育水平,自《有教无类》法案(No Child Left Behind)颁布后,更是江河日下,愈演愈烈。孩子成为了竞争的棋子,在教师、学校甚至国家之间的竞赛中任其摆布,而这仅是为了从孩子身上榨取出最高的分数。在这场战役中,我们剥夺孩子的睡眠、玩乐甚至于探索的自由……换句话说,剥夺他们的童年,以提高他们的考试成绩。
让我们深呼吸,是时候站在社会的角度,反省自己了——教育是什么?教育的目的究竟是什么?即使可以回答这些问题,那么能够量化的「教育」是否能够适用于所有人呢?
教育起源之初的目的
今天,我们知道学校源自于新教改革(见此处的详细说明)。这些改革者认为,教导孩子阅读以便他们能够阅读圣经是基督徒的责任。他们还认为,向孩子灌输信仰也是基督徒的责任——主要讲述的是服从的价值,以及那些调皮捣蛋者等待的严重后果。
在当时,教育的目的很明确——那就是要从孩子们身上驱除原罪,让他们对权威产生适当的恐惧,并记住圣经以及为孩子灌输服从的道德教诲。从这个目的出发,如何定义教育的成功是很清楚的。如果孩子们遵从教师(那时候称作「主人」)的规矩上课,并且不和成年人顶嘴,那么孩子的教育便是成功的。课程的内容并不重要(只要不与圣经相矛盾);重要的是孩子们是否顺从地完成它们。如果他们不顾殴打和羞辱,坚持反抗,按照自己的意愿行事,那么,对他们来说,学校教育就失败了。
在很久以前,人们并不认为学校教育便是教育的全部。为了工作生活,人们会学习各种各样的技能。学校虽然很糟糕,但是在那时的孩子的生活中,学校仅占一小部分。
随着时代发展,学校逐步被政府接管,学校增加了教授的课程科目,对学生的学业安排也逐渐增多。许多人都认为,学校教育便是包括了教育的全部。随着工业革命的发展,学校模式逐步向工厂转移。学校如同流水线一般,将学生沿着流水线一级一级递送,在每一站,新老师都会在「产品」中添加知识和规矩,最后,成品会从流水线滑槽中落下,盖上批准证书。
尽管我们在许多方面已经远远超过了历史上的工厂阶段,但直至今日,这仍然是我们的标准教育方法。但如果这便是我们所称的「教育」,那对于如何衡量「教育」也很清晰了——我们在「传送带」的各个站点测试每一个学生,检验他们对「事实」和技能的掌握程度,并准备继续送往下一站。
然而,在时间长河的检验中,这个工厂系统的质量并不尽人意。自上而下的操控教师个体,或是学生进步的标准,这些并不是绝对的。仍有一些教师认为学而不同,孩子们理应花费大量时间自由地玩耍和探索,探索自身的兴趣和激情。在标准的制定和继承中,校与校,师与师之间存在着差异。
因此,《有教无类》法案(NCLB)随之颁布,一心想要消除这些差异。于是,所有「产品」都必须符合标准规定——无论「原材料」有何差异,也不论学业之外的生活对孩子的影响,自然也不论孩子自身想做想学何物的一切期望。《有教无类》法案仅仅是合乎逻辑的工厂模型,用于生产出更加一致且标准化的产品。
因为《有教无类》法案,教师的工作和学生在标准化考试中的表现紧密联系起来,这令教师的压力变得很大。由于标准化考试注重于数学、阅读以及低程度(极为狭隘)的科学,于是这些科目重点教授,而其他科目便被搁置一旁。
但时至今日,正如我先前所敦促,让我们退一步脱离狂热,深呼吸理智思考何为教育。我妻子觉得做些瑜伽会很有帮助。
思考教育的新视角
即使我们将教育仅仅定义为学习阅读和数学,我们也没有正确合理地传授这方面的知识。当孩子真正想要阅读时,他们会轻松地学会阅读;同样,当他们想要学数学时,他们也能轻松地学会数学(你可以参考这里,这里,还有这里了解更多)。
问题的关键在于想要。当我们将阅读和数学分解成为麻木的、强迫的、流水线般的步骤时,孩子便会厌恶。没有人会为了阅读而阅读,或者为了做数学而做数学。阅读是为了获取信息或是享受故事,做数学是为了解决有趣的数学问题。这是人们在现实生活中的学习方式,也是孩子们在民主学校和非学校教育里的学习方式,他们自己决定自己的教育。
但现在,让我们将思绪从阅读和数学抽离向更关键的事情。教育的目的到底应该是什么?或者,换句话说,我们对孩子发展的目标究竟是什么?
如今我们大多数人并不希望孩子们成为权威人士的绝对附属品——在这条路上,我们能看到太多的灾祸降临于孩子身上。正确的教育目标难道是在综艺上涂脂抹粉——「嘿,你比五年级的孩子要聪明吗?」——五年级的孩子(或任何其他年级学生)应该知道这几乎与人生的成功无关。
所以我们究竟想要什么呢?或者可以这么说:你想要什么?我想要什么?出于你我对于人生意义与孩童期冀的分歧,我们的答案很可能不一致。
我希望他们能够主宰人生,成为想要成为的人。我希望他们幸福,同时也能为他人追寻幸福。我希望他们坚韧不拔,勇于同人生那些无法回避的压力和失望作斗争。我希望他们对自己终身学习的能力满怀信心,在瞬息万变的时代里能够适应世界。我希望他们有人生抱负,满腔热血地向着未来奋进。我希望他们大脑清醒,理智严谨地做出每一个理想路上的决策。我希望他们树立积极人文意识和道德取向的价值观,把人当人,维护并践行人类均而与生俱有之权利。如果我现在有小孩,我想这便是我对他们的期冀。
但障碍就在此了。这些的一切均无法在学校课堂上传授。朝气蓬勃的孩子们需要大量的时间玩耍、探索、发现、创造,最终才能学会这些为人之根本。我们能做的,就是树立一个优秀的榜样以及构建一个裨益于人、循循善诱的氛围,让我们的孩子找到他们正在寻找的东西,并学会换位思考。归根结底,教育的目的是寻找人生的意义,这是每个人都必须,并有且只能由自己来实现的。
那么,教育是否能被量化?人生是否能被定义?也许自我能够以追寻人生意义,怀揣抱负前进来衡量自身。但是,绝对没有人能去量化,能去定义另一个人。
--------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。无论我们是否赞同,你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)。
孩子们可以自己教育自己 I:证据综述
原文:Children Educate Themselves I: Outline of Evidence | Psychology Today
孩子天生就会教育自己。
发表于 2008 年 7 月 16 日|审稿人:Ekua Hagan
作为成年人,我们确实对我们自己的孩子和全世界的孩子们都负有一定责任。营造安全、促进健康、相互尊重的环境,让孩子在其中茁壮成长,是我们的责任。确保孩子有合适的食物、清新的空气、可以玩耍的无害地点,以及与不同年龄阶段的人们自由交往的充足机会,这些都是我们的责任,更是人道主义的要求。
但有一件事是我们不用担忧的,那就是如何教育孩子。
我们无需操心课标、教学计划,激励孩子去学习,测试他们,以及所有其他属于教育学范畴的事情。我们反而应该把这些精力用在创造孩子们可以玩耍的合宜环境上。孩子的教育是孩子自己的责任,而不是我们的。只有他们才能做到。他们就是为此而生的。我们关于教育的任务就是袖手旁观,任由它发生。我们越是试图控制它,我们就越多地干扰它。
我说教育是孩子自己的责任,而他们生来就是为此负责的,我并不指望你们相信这一断言。在我们生活的世界里,这种断言不再像过去那样是不证自明的真理。在这个世界里,几乎所有的儿童和青少年都被送去学校,开始上学的年龄越来越小,离开学校的年龄越来越大,其中的「学校」一词具有一定的标准含义。我们衡量教育的标准是考试成绩和在学校系统中接连升级的成功。
因此,我们几乎会自然而然地认为,教育是由懂得教育艺术与方法的专家在学校里完成的,他们知道如何将孩子们的潜能转化为教育产物。
因此,我把提出证据支持我的主张看作是我的任务。在某些情况下,我们可以看到孩子们在没有学校教育的情况下教育自己,这正是对此最直接的证据。这里有三种类似情况,我将在接下来的三篇博文中详细说明。
- 儿童的大部分教育发生在他们开始上学之前。
儿童自我教育能力最明显的证据,凡是明眼人都能看到,来自于观察孩子们在出生后的头四五年时间里,在任何人试图以任何系统的方式教他们什么之前的时候。
想想他们在那段时间学到的一切。他们学会走路,跑步,跳跃,攀爬。他们学习所有能够得着的物品的物理特性,以及如何摆弄这些物体。他们学习自己的母语,这无疑是人类所能掌握的最复杂的认知任务之一。他们学习其他人的基本心理——如何取悦他人,如何惹恼他人,如何从他人那里得到他们需要或想要的东西。
他们不是通过任何人提供的课程学会这一切的,而是通过他们自己的自由玩耍,他们永不满足的好奇心,以及他们对其他人行为的自然关注。我们不能阻止他们学习这一切乃至更多,除非我们把他们单独锁在壁橱里。
- 采集-狩猎社会中的孩子不需要所谓的学校教育也能成长为成功的成年人。
人类物种历史的大部分时间中,我们生活在相对较小的游牧、采集的群体中。我们的基本天性——包括我们的嬉戏、好奇心,以及我们出自生物本能的学习适应能力——都是在这种生活方式的背景下进化出来的。一些狩猎-采集者群体设法在保持他们的文化完好无损的情况下生存到了现代。
在非洲、亚洲、新西兰、南美洲和其他地方对这些群体进行研究的人类学家发现,这些群体在对待儿童的态度上有着惊人的一致性。在所有这些文化中,儿童和青少年基本上每天从早到晚都可以玩耍,随心所欲,不受成年人的干涉。
这些人数千年的经验证明了他们的信念,即年轻人通过玩耍和探索来自学,然后在准备好时,自然地开始将他们所学的东西用于造福于整个群体。通过自己的努力,狩猎-采集社会的儿童获得了在他们的文化中成长为成功的成年人所需的大量技能和知识。
- 在我们的文化中,一些受过「『非学校』教学」的孩子不需要所谓学校教育就能成为成功的成年人。
多年来,我一直在马萨诸塞州弗雷明翰的瑟谷学校观察儿童和青少年。这所学校创办于 40 年前,创始人对教育的信念与狩猎采集者非常相似。
这所学校是为 4 至 18 岁的年轻人开设的,它与典型的学校完全不同。它是个民主的环境,儿童真正拥有与成年人平等的权力,学生完全通过自主活动学习。从本质上讲,它是个安全的环境,年轻人可以在其中玩耍、探索、承担责任,并与各个年龄段的人自由互动。
没有考试,没有小星星之类的奖励,没有及格或不及格,没有必修课或作业,没有强迫或哄骗孩子学习,也没有期望工作人员对孩子的学习负责。
到目前为止,数以百计的年轻人在这种环境中自学成才。当然,他们最终并没有成为狩猎采集者。他们成为工匠、艺术家、厨师、医生、工程师、企业家、律师、音乐家、科学家、社会工作者和软件设计师。他们活跃在我们文化所重视的所有职业中。
在接下来的三篇博文周刊中,我将逐一详细阐述这三个年轻人自我教育能力的证据来源。现在,请在下面用你自己的评论、论点和经历来回应。你们的想法将有助于我下一篇博文的发表,也将有助于影响世界对童年和学习的看法。如果你认为这样的讨论是值得的,请与其他人分享这篇文章。
孩子们可以自己教育自己 II:来自小孩子的一课
原文:Children Educate Themselves II: Lessons from Little Kids | Psychology Today
观察幼儿学习可以彻底改变我们对教育的看法。
发表于 2008 年 7 月 23 日
你是否想过,在孩子出生后的头几年,还没开始上学,还没有任何人试图以任何系统的方式教他们东西时,他们自己学会了多少东西?他们自然而然地学习,靠着玩耍、探索和观察周围人的本能。但,说学习是自然而然的,并不是说它毫不费力。婴幼儿投入了巨大的精力学习。他们的持续专注能力、身体和精神的努力以及克服挫折和障碍的能力都非比寻常。下次,在你观察一个五岁以下的孩子时,请坐下来观察一会儿。试想,在孩子与世界的互动中,他或她的头脑中每一刻都在发生什么。如果你允许自己进行这种难得的观察,你就会有收获。这种体验可能会让你从全新的角度思考教育——这种角度来自孩子内心深处,而非表面。
在这里,我将勾勒出发展心理学家对幼儿学习的一点认识。为了帮助将这些知识与关于教育的想法联系起来,我将把它分为物理、语言、科学和社会教育和德育等类别。
体育
让我们从学走路说起。用两条腿走是人类的一个典型特征。从某种意义上说,人体为行走而生。但学走路不容易。每一个来到世界上的人都要付出巨大的努力来学习走路。
我记得很久以前的一个春日,我的儿子在快一岁时,可以扶着东西走,但不能独立行走。那天我们碰巧在一艘大型旅游船上旅行,我儿子坚持要在整个旅程中牵着我的手在甲板上走来走去。我们花了很多时间走完了整条船,我不自觉地弯下腰,以便我的手能够到他。当然,动机完全是他的。我只是一个方便的工具,一个人肉手杖。我一直试图说服他休息一下,因为我需要休息;但他是个控制术大师,每当我停下来休息一会之后,他就会操纵我重新开始行走。
研究人员发现,处于学习走路高峰期的幼儿平均每天花 6 个小时走路,在此期间,他们平均走了 9000 步,走了 29 个足球场的长度((Adolph et al., 2003,Child Development,74,475-497)。他们并不是想去什么特别的地方;他们只是为了走路而走路。当他们接触到新类型的地面时,他们对行走变得特别感兴趣。我怀疑我的儿子在我们坐船时儿子「暴走」的部分原因是船的运动使行走变得困难,让他感到了新的兴奋和刺激。
在独自行走的早期阶段,孩子们经常摔倒,有时会伤到自己;但随后他们又爬起来,再试一次——再一次,再一次,再一次。走路之后是跑步、跳跃、攀爬、摇摆,以及各种新的运动方式。我们不需要教孩子这些,当然也不需要去激励他们。我们所要做的就是为他们提供适当的安全场所来练习。
语言教育
如果你曾经作为一个成年人试图学习一种新的语言,你就知道它有多难。需要学习成千上万的单词,有无数的语法规则。然而,孩子们在四岁时就或多或少地掌握了他们的母语。到了这个年龄,在对话中,他们出关于词义和语法规则的复杂知识也难不倒他们。事实上,在双语家庭长大的孩子在四岁前就掌握了两种语言,并能以某种方式区分它们。
四岁的孩子不能描述他们语言的语法规则(大多数成年人也不能),但他们对规则的隐含知识在他们的语言和理解中是很清楚的。他们在全新的名词上添加 s 以使其成为复数,在全新的动词上添加 ed 以使其成为过去式,他们构建新奇的句子中体现出对语法类别的理解——名词、动词、形容词、副词等等。正如 Noam Chomsky 很久以前提出的那样,婴儿来到这个世界上可能对语言有一些先天的理解,但每种语言的具体词汇和规则都不同,显然必须学习。
婴幼儿不断自学语言。在婴儿期的早期,他们开始咿咿呀呀地发出类似语言的声音,练习发音的运动行为。随着时间的推移,他们越来越多地将自己的咿呀声限制在他们所听到的特定语言的声音上。到几个月大时,可以观察到他们密切注意别人的讲话,并进行一些举动,似乎是为了帮助他们弄清别人在说什么。例如,他们经常跟踪大孩子或成年人的眼睛,看别人在看什么,这有助于他们猜测别人在说什么。有了这种策略,一个在花园里的幼儿如果听到有人说「好漂亮的菊花」,就有很大的机会识别出所指的是什么物体。在两岁到 17 岁之间,年轻人平均学习约 60,000 个单词(Bloom, 2001, Behavior & Brain Sciences, 24, 1095-1103);这相当于,他们清醒一小时便学一个单词。
语言学习,就像学习走路一样,是一种游戏。它是引人入胜的,紧张的,为了自己而做。幼儿到处给东西命名,只是因为有趣,不求回报。随着儿童年龄的增长,他们的文字游戏越来越复杂,采取了诸如谜语、双关语和押韵等形式。我们不能教孩子们语言;我们只能提供一个正常的人类环境,让他们能够学习和练习语言,也就是说,提供一个让他们能够与说话的人接触的环境。
科学教育
幼儿对他们周围世界的所有方面都充满好奇。甚至在他们出生后的头几天,婴儿花更长时间看没见过的物体。到了他们的眼手协调能力足以使他们能伸手操作物体的年龄,他们便不断伸手把玩物体。6个月大的孩子检查他们能接触到的每一个新物体,只为了解它的物理特性。他们捏着它,把它从手里递给别人,从各个角度看它,摇晃它,丢弃它,观察发生了什么;每当有有趣的事情发生时,他们就试图重复它,似乎是为了证明这不是一个偶然。看一个6个月大的孩子的行动,仿佛在看一个科学家。
年轻人探索的主要目标是学习如何控制他们的环境。许多实验表明,婴幼儿对他们可以控制的物体比不能的更感兴趣。例如,他们会更痴迷一个可以通过自己的努力开关的音频播放器,而不是一个自动开关或者由成人控制的播放器。在他们学习如何控制这些物品的期间,他们尤其被这些物品所吸引。一旦他们学会了如何控制一个物体,并且用了各种玩法,他们往往就会索然无味。这就是为什么花哨但无法控制的玩具的外包装硬纸盒可能比玩具本身更耐玩。
弄清物体如何运作以及如何控制它们,这一动力并没有随着幼儿期的到来而结束;只要儿童和成人能够自由地走自己的路,这种动力就会继续下去。这种动力是科学的基础。没有什么比一个告诉每个人他们必须对新物体做什么以及如何做的环境,更能迅速地破坏它了。科学的乐趣在于发现,而不在于科学所产生的知识。这对我们所有人来说都是如此,无论我们是 6 个月的孩子在探索移动的事物,2 岁的孩子在探索纸板箱,还是成年科学家在探索物理粒子或酶的特性。没有人进入科学领域,是因为他们喜欢被告知其他人问题的答案;他们进入科学领域,是因为他们喜欢发现自己问题的答案。这就是为什么我们在科学方面培训人们的标准方法,从未能将他们变成科学家。那些成为能科学家的人即使不接受这样的培训,也会成为科学家。
社会教育和德育
对幼儿来说,社会环境比物理环境更有吸引力。孩子天然地被别人吸引,尤其是那些比自己大一点、能力强一点的人。他们想做那些人做的事。他们也想和别人一起玩。任何孩子要接受社会教育和德育,一个重要且天然的方式便是多人游戏。
正是通过游戏,儿童学会了与他人相处。游戏中,他们必须考虑到其他孩子的利益,学会从别人的角度看问题、尝试妥协、协商分歧、控制冲动、取悦他人,如此一来,他们才能互为玩伴。学会这些并非轻而易举,但如果我们想生活幸福,这些便是必修课。这些东西,我们无法教给孩子;但是,我们可以让他们和别人一起玩,让他们自己体验社会失败和成功的结果。孩子天生就有与人玩耍的强烈动力,这促使每个正常儿童在游戏中努力与他人相处。相处失败就会结束游戏,这一自然结果,带来的学习经验非常有益。任何说教或建议都不能替代这种经验。我现在不会进一步阐述这个问题;这将是未来几期的主题。
五、六岁时动机会发生什么变化?
有一次,我七岁左右的儿子在公立学校上学时,我向他的老师提到,他在上学之前似乎明显比现在对学习更感兴趣。她如此答道:「嗯,作为一名心理学家,我相信你知道这是一种自然的发展变化。孩子在小时候天生就是自发的学习者,但后来他们会变为以任务为导向。」
我可以理解她为什么会有这种想法。我看到发展心理学教科书按照年龄划分单元,把学前时期称为「游戏时期」。所有关于游戏的讨论都发生在最初的那些章节中。仿佛游戏在五六岁就停止了。其余各章主要是研究儿童如何完成成人交给他们的任务。我猜想这位老师在学习教育课程时曾读过这样的书。但这样的书对何为自然的看法是扭曲的。在接下来的两篇文章中,我将提出证据,表明当五六岁以上的孩子被允许有自由和机会来追随他们自己的兴趣时,他们玩耍和探索的动力会继续激励他们,像以前一样,朝着越来越复杂的学习形式前进。
---------------
现在,我邀请你在下面的评论区贡献你自己的想法。你观察到的幼儿活动中,有哪些与我在这里提出的论点相吻合或相悖的地方?你如何看待幼儿园和学前班越来越多地刻意教导幼儿,甚至测试他们的趋势?在你看来,幼儿的理想学习环境是什么?
PS:因为我放暑假了,所以从这个周末开始,我将离开互联网一阵子。我相信我将能够在 8 月 3 日星期日发布自我教育系列的第三部分,并在 8 月 13 日星期三发布第四部分。之后,日程安排还是照旧,每周三定时发布。
孩子们可以自己教育自己 III:狩猎采集者的智慧
原文:Children Educate Themselves III: Wisdom of Hunter-Gatherers | Psychology Today
狩猎采集者的孩子们不需要学校也能学习的原因。
发表于 2008 年 8 月 2 日
千百年来,追溯至农业诞生之际(约一万年以前),我们都是采猎者。我们人类所有的本能(包括学习本能),都是在这样的生活背景下产生的。所以,在本系列文章中,关于儿童本能的自我教育方式,我自然应该问:狩猎采集者的孩子是如何学习他们需要知道的东西,以成为他们社会中成功的成年人?
二十世纪下半叶,人类学家找到并发现了许多人类族群,在非洲,亚洲,澳大利亚,新几内亚,南美洲和其他偏远的地方,他们仍然过着狩猎采集的生活,几乎不受现代生活方式的影响。尽管每一个族群都有自己的语言和不同的文化传统,但是经研究发现不同族群在基本方面有许多相似之处。这也是我们将「狩猎采集式的生活」作为独特的一点提出来的原因。无论他们在哪里被发现,狩猎采集者都生活在小型游牧部落中(每个部落约 25 至 50 人),民主决策,拥有以平等主义价值观和分享为中心的道德体系,以及丰富的文化传统,包括音乐,艺术,野外游戏,舞蹈和历史悠久的故事。
为了补充我们在人类学文献中可以找到的内容,Jonathan Ogas(他当时是一名研究生)和我在几年前联系过一些与狩猎采集者一起生活的人类学家,并请求他们回答一份关于他们对儿童生活观察的书面问卷。有九位学者友好地回答了我们的问卷。其中,他们研究了六种不同的狩猎采集文化——有三种在非洲,一种在马来西亚,一种在菲律宾,一种在新几内亚。
我从文献和问卷中学到的东西令人惊讶,因为它具有跨文化的一致性。我在这里总结出四个结论,我认为这些结论与自我教育问题最为相关。因为我希望你们把这些实践想象成现在正在发生的事,所以我将用现在时态来描述它们,尽管这些做法和文化本身在近年来已经被周围更“发达”世界的入侵所摧毁。
- 采猎者的孩子必须学习大量知识才能成为出色的成年人。
因为采猎者不需要知道很多而认为学习知识对他们来说没什么用是绝对错误的。实际上,他们必须学习大量的知识。
为了成为富有成效的狩猎者,男孩必须在狩猎团队中学习两三百种不同种类哺乳动物和鸟类的习性;必须知道如何使用最细微的线索跟踪此类猎物;必须能够完美地制作狩猎工具,例如弓箭、吹枪和飞镖、圈套或网;并且必须非常熟练地使用这些工具。
为了成为富有成效的采集者,女孩必须熟记她们所在地区里的无数种根须、块茎、坚果、种子、水果和蔬菜中哪些是可食用的和有营养的,何时何地可以找到它们,如何挖掘它们(如果是根或块茎的话),如何有效地提取可食用的部分(就谷物、坚果和某些植物纤维而言),以及在某些情况下如何加工它们,使其可食用或增加其营养价值。这些能力包括通过多年练习磨练身体技能,以及记住、使用、添加和修改大量在文化层面上共享的、与食物材料相关的口头知识。
此外,狩猎采集社会的儿童必须学会在广阔的觅食地中确定方位,建造小屋,生火,做饭,抵御捕食者,预测天气变化,治疗伤口和疾病,协助分娩,照顾婴儿,保持群体内的和谐,与邻近群体谈判,讲故事,制作音乐,并参与到各种舞蹈和他们的文化仪式中。由于除了作为狩猎者的男性和作为采集者的女性之外,几乎没有什么专业化的工作,因此每个人都必须学会很大一部分总体文化知识和技能。
- 孩子们能自发学习,不需要教导。
虽然狩猎采集者的孩子们必须学习大量的知识,但狩猎采集者没有像学校那样的东西。成年人不会制定课程,也不会试图激励儿童学习,或教授课程,或监测儿童的进步。当被问及孩子们如何学习他们需要知道的东西时,狩猎采集社会成年人给出的答复总是一针见血:「他们通过观察、玩耍和探索来自学。」偶尔,成年人可能会提供建议或演示如何做得更好,例如如何让箭头成型,但只有在孩子明确需要时才提供这种帮助。成人不得发起、指导或干扰儿童的活动。成年人没有表现出任何担心孩子教育的证据;几千年的经验向他们证明,儿童是自我教育的专家。[1]
- 孩子们有大量的时间玩耍和探索。
在回答关于孩子们有多少时间玩耍的问题时,我们调查的人类学家一致表示,他们观察到的狩猎采集者的孩子每天大部分时间(甚至整天)都可以自由玩耍。典型的回复如下:
-
「[Batek] 的儿童几乎全天都在自由玩耍;没有人期望孩子们在十几岁之前做严肃的工作。」(Karen Endicott)
-
「[Nharo 人中]的女孩和男孩几乎每天都有整天自由玩耍的时间。」(Alan Barnard)
• 「[Efé] 的男孩在 15-17 岁之前可以几乎成天自由玩耍;对于女孩来说,除了在跑腿和当保姆之外,一天中的大部分时间都花在了玩耍上。」(Robert Bailey)
- 「[!Kung] 的孩子们从早玩到晚。」(Nancy Howell)
采猎者的儿童享有自由地追求自己利益的原因部分来自于成年人的理解,他们知道这种追求是获得教育的最可靠的途径。它也来自普遍的平等主义和个人自治精神,这种精神弥漫在狩猎采集文化中,适用于儿童和成人[2]。狩猎采集社会的成年人将儿童视为完整的个体,拥有与成年人相当的权利。他们的假设是,当孩子们在发育上准备好这样做时,他们会自愿开始为团队的经济做出贡献。没有必要让孩子或其他任何人做他们不想做的事情。想到我们学习和为社区做出贡献的本能在一个我们的本能被信任的世界中进化,这真是太了不起了!
- 孩子们观察成人的活动,并将这些活动融入他们的游戏中。
采猎者的孩子从不与成人活动隔离开来。他们直接观察营地里发生的一切——搬家的准备、小屋的建造、工具和其他文物的制作和修补、食物的准备和烹饪、婴儿的照顾和护理、对掠食者和疾病的预防、八卦和讨论、争论和政治、舞蹈和庆祝活动。他们有时陪同成年人进行食物采集之旅,到 10 岁左右时,男孩有时会陪同男人进行狩猎旅行。
孩子们不仅观察所有这些活动,而且还将其融入到他们的游戏中,通过这些游戏,他们熟练地掌握了这些活动。随着年龄的增长,他们的游戏逐渐变成了真实的东西。在嬉戏的参与和真正参与群体的宝贵活动之间没有明显的区别。
例如,有天男孩们用他们的小弓箭顽皮地捕猎蝴蝶,后来又顽皮地猎杀小动物并带其中一些回家吃,而后来的一天,他们仍然本着游戏的精神与男人一起进行真正的狩猎之旅。另一个例子是,男孩和女孩通常都建造游戏小屋,仿照父母建造的真实小屋。Nancy Howell 在回答我们的问卷时指出 Kung 的儿童通常在距离真实村庄几百码的地方建造了一整个狩猎村庄小屋。然后,狩猎村变成了一个游乐场,在那里他们表演了他们在成年人中观察到的许多场景。
我们调查的受访者还提到了许多其他有价值的成人活动的例子,这些活动经常被儿童在游戏中模仿。挖根,钓鱼,用烟将豪猪从洞里薰出来,做饭,照顾婴儿,爬树,搭建藤梯,使用刀和其他工具,制作工具,搬运重物,建造木筏,生火,防御捕食者的攻击,模仿动物(识别动物和学习其习惯的一种手段),制作音乐,跳舞,讲故事和争论都被一个或多个受访者提及。 因为所有这些游戏都是在一个年龄混合的环境中进行的,所以年龄较小的孩子不断地向年长的孩子学习。
没有人必须告诉或鼓励孩子们做这一切。他们自然而然地这样做,因为就像世界各地的孩子一样,没有什么比长大成为像在他们周围看到的那些成功的成年人一样令人渴望的事情了。对成长的渴望是一种强大的动机,它与玩耍和探索的动力相结合,并确保孩子们如果有机会,将不停地练习他们成为有效成年人所需的技能。
这些观察结果对我们文化中的教育有什么意义?
当然,我们的社会与狩猎采集社会非常不同。你可能怀疑我们从采猎者那里学到的教育经验能否有效地应用于我们今天的社会中。首先,狩猎采集者没有阅读、写作或算术;也许自然的、自我激励的学习方式对学习 3R's(译注:即 reading, writing and arithmetic)不起作用。在我们的社会中有无数种不同的谋生方式,这与狩猎采集社会不同,儿童可能获得无数种不同的技能和知识,儿童在日常生活中不可能直接观察所有这些成人技能。在我们的社会中,与狩猎采集社会不同,儿童在很大程度上与成人工作世界隔离,这减少了他们看到成年人做什么并将这些活动纳入他们的游戏的机会。
然而,在下一部分中,我将论证,当我们提供一个允许这些手段发挥作用的教育环境时,对狩猎采集者如此有效的自然学习方式确实对我们的孩子同样有效。我的下一篇文章预计将于 8 月 13 日星期三发布,内容将是关于马萨诸塞州弗雷明汉的一所学校,在过去的 40 年里,儿童和青少年通过自主游戏和探索取得了非凡的成功。
敬请关注。
----
更新。有关狩猎采集者教育的更多信息,请参阅:(1)瑟谷学校如何像狩猎采集部落;(2)教学的人性 II:我们能从狩猎采集者身上学到什么?
附注:
1 参见 Y. Gosso et al. (2005), "Play in hunter-gatherer societies." In A. D. Pellegrini & P. K. Smith (Eds.), The nature of play: great apes and humans. New York: Guilford.
2 参见 S. Kent (1996), "Cultural diversity among African foragers: causes and implications." In S. Kent (Ed.), Cultural diversity among twentieth-century foragers: an African perspective. Cambridge, England: Cambridge University Press.
孩子们可以教育自己 IV:来自瑟谷学校的一课
原文:Children Educate Themselves IV: Lessons from Sudbury Valley | Psychology Today
40 年来,孩子们在这所学校完成自我教育。
发表于 2008 年 8 月 13 日 | 审稿人:Ekua Hagan
在过去的 40 年里,瑟谷学校是美国教育界最不为人知的秘密。大多数教育专业的学生对其闻所未闻。教育学教授选择视而不见,不是出于恶意,只是因为这所学校的教育理念与这伙人的观点势如水火。
瑟谷学校的教育模式,不是标准教育的变体,也非传统学校教育的先进版本。这种模式不是更先进的蒙特梭利式、杜威式或皮亚杰式建构主义学校,这种模式截然不同。
为了理解该学校,必须跳脱出当前主流教育思想,采用一种截然不同的思维模式。必须树立这样一个想法:成年人不能控制孩子的教育;孩子们可以教育自己。
不过,瑟谷学校的面纱正徐徐揭开。瑟谷学校的学生,或直接体验过瑟谷学校的人,正为其积极宣传。如今,全世界至少有二十余所学校效仿瑟谷学校。
我预测,从现在起 50 年后——甚至是更早——瑟谷学校模式将出现在每本标准的教育教科书中,并被许多公立学校系统采用。我预测,50 年后,当今的教育方法将被许多——更可能是绝大多数——教育工作者视为过去的野蛮残余。人们会很奇怪,为什么世界花了这么长时间,才掌握瑟谷学校的创立理念,这是简单到不言自明的想法:孩子们可以教育自己;我们不必越俎代庖。
在上一篇文章中,我总结了证据,证明狩猎采集者的孩子通过自己的自主游戏和探索,学到了成为合格的成年人所必须具备的卓越才能。在更早的文章中,我指出,当今社会中的孩子们在上学之前就自己主动学习了许多课程,对于他们堪称所学之中最困难的,并没有成人的指导或催促。现在,根据瑟谷学校的经验,我认为自我教育对于当今社会的学龄儿童和青少年,其成效与其对于学龄前儿童和狩猎采集者完全相当。
多年来,我作为该学校学生的父亲,同时也是一位学者,一直有机会观察瑟谷学校,将这里作为研究玩耍和自主学习的资源。在此,我会告诉你一些关于学校的情况。
首先是简单的信息。这所学校成立于 40 年前,此后一直在持续运营。此校是私立走读学校,位于马萨诸塞州弗雷明翰,招收四岁到高中年龄的学生。
这所学校在任何意义上都不是精英学校。它录取学生时不考虑任何学习成绩,而且它的每名学生的学费大约是周边公立学校的一半。这所学校目前有大约 200 名学生和 10 名成年教职员工。一座维多利亚时代的公馆和一栋改建的谷仓承载了整个学校,占地 10 英亩,在学校开办时,当地主要是农村地区。现在,关于学校运营模式的更引人注目的事实是:
学校按照参与式民主运作(译注:参与式民主鼓励公民直接参与公共事务,无须通过议员代公民表达意见)
瑟谷学校首先是儿童和青少年直接体验民主政府的特权和责任的社区。主要行政机构是学校会议,由所有学生和教职员工组成。
每周召开一次学校会议,并以一人一票的方式制定学校的所有规则,决定学校的物资采购,建立委员会来监督学校的日常运作,以及雇佣和解雇教职员工 。在所有议题中,学校里四岁的孩子、年长的学生和成年教职员工拥有同样的投票权。
学校里所有的教职员工都不是终身聘任制,合同仅仅为期一年,每年必须通过无记名投票选举延长合同。由于学生选民的数量是教职员工的 20 倍,经历了这一过程并且年复一年地连任的教职员工,是那些受到学生钦佩的人。他们为人友善、德才兼备,对学校的环境做出了显著和积极的贡献。作为成年人,在某些方面为学生们提供了效仿的楷模。
校规的执行方是司法委员会,其成员经常变化,但总是包括一名教职员工和代表学校各个年龄段的学生。当一名学生或教职员被另一名学校成员指控违反规则时,原被告双方必须出庭接受司法委员会的审讯,由司法委员会裁定被告无罪或有罪,并在后一种情况下决定适当的判决。以上所有,学校对教职员工与学生一视同仁。没人能凌驾于规则之上。
学校不会干涉学生的活动
在不违反学校的任何规定的前提下,学生们每天都能支配所有时间,自由地在学校里做任何他们想做的事情。这些规则都是由学校会议制定的,旨在保护学校,保护学生不受他人阻碍地追求自己兴趣的机会。
学校成员不得在指定的「静音室」里制造噪音,滥用设备或在使用完成后未将其收好,污损校园财产,使用违禁药品,以及用骚扰人的方式对待他人。做出这类行为的人,会面临司法委员会的控诉。
这里完全没有关于学习的规章制度。学校不设置考试,不对学生的进步予以评价或评分。[1] 学生不用上课,学校也不会试图激励学生学习。
只有学生自发主动组织才会开办课程,而课程的去留也由学生意愿决定。该校许多学生从未参加过课程,学校认为这没有问题。
该校的教职员工不以老师自居。相反,他们可视为提供各种服务——而教学只是其中一部分——的社群中的成年成员。他们的大部分 “教学” 形式都可以在任何环境下进行,比如说回答真诚的问题、在真实对话的背景下提出想法。
校园环境丰富多彩,适合玩耍探索,因此也适宜学习
在瑟谷学校的学习大部分是附带的成果,是学生自主游戏和探索的副产品。学校是玩耍和探索的好地方,为此类活动提供了空间和时间,还有设备:包括电脑、设施齐全的厨房、木工车间、艺术室、游乐场设备、各种玩具和游戏以及许多书籍。学生还可以进入池塘、田野和附近的森林进行户外玩耍和探索。
有些产生小众兴趣的学生,需要一些新的设备,他们可以选择说服学校会议进行采购,亦或者通过一些途径,比如在学校卖饼干,筹集资金自己购买。
对于大多数学生来说,学校里最重要的资源是其他学生,他们拥有广泛的兴趣和能力。由于学校自由的混龄学制,学生经常在活动中与比之年长和年轻的其他同学产生思维碰撞。
跨年龄的玩耍为低龄学生提供了不断向学长们学习的机会。例如,该校许多学生的阅读能力习得,实际上只是一项活动的副产品——与已经掌握阅读的学生一起玩涉及书面文字的游戏(包括电脑游戏)。他们在此过程中甚至没有意识到自己在学习。
学生们在学校的探索,尤其是青少年的探索,大多是通过对话进行的。学生之间以及与工作人员谈论一切可以想象的事情,通过这样的谈话,他们可以接触到各种各样的想法和观点。因为没有人是官方权威,所以谈话中所说和听到的一切都被理解为需要思考的东西,而不是需要记住的教条或测试反馈。
这些对话不同于为考试记忆材料,它们能够激发智力。伟大的俄罗斯心理学家列夫·维果茨基(Lev Vygotsky)很久以前就认为,对话是深刻思想的基础;根据我对瑟谷学校学生的观察,我相信他是对的。思想是内化的对话;与其他人的外在对话启动内在对话。
数百名毕业生证明了学校的教育成效
我在多年前对瑟谷学校完成了第一次研究,对毕业生开展了追访调研。从那时起,学校本身已经对毕业生进行了几项研究,并已著书出版。[2] 所有这些研究都表明,瑟谷学校作为教育机构运作良好。
如今,现代社会重视的各行各业里都有瑟谷学校的毕业生的身影。他们当中有技艺娴熟的工匠、企业家、艺术家、音乐家、科学家、社会工作者、护士、医生等等。那些选择接受高等教育的人在进入大学时并无特别困难,甚至是那些标准严苛的大学,并在被录取后亦表现出色。还有许多人没上大学却也在事业上功成业就。
更重要的是,以前的学生表示他们对自己的瑟谷生活很满意。绝大多数人很高兴自己就读于瑟谷学校,并相信这所学校为他们提供的教育比传统学校更能适应成人生活的现实。在很大程度上,他们在成年时保持着在学校里发展和完善的对事业和生活的好玩(这意味着专注、激情和愉快)态度。
如果你有兴趣了解更多关于瑟谷学校的信息,它的学校网站是个不错的地方。丹尼尔·格林伯格(Daniel Greenberg)是该学校的思想领袖,也是该校的创始人之一。他的书和其他关于学校的书都可以在学校的网站上找到。我推荐一本他的最新著作:与著名的商业教授兼改革家 Russell Ackoff 合著的 Turning Learning Right Side Up(《转向正确的学习方向》)。
我创作本次和未来帖子的主旨,并非宣传瑟谷学校这个教育机构,而是开启关于玩耍、好奇心、人性、教育的对话。这所学校的见闻给了我一定程度的启发。到目前为止,我只触及了表面。我确信,对于大多数读者来说,这篇文章提了很多问题,而文章本身并未作答。你也可以在此畅所欲言,提出你的质询和反对意见。
注释
\1. 学校不评价学生的制度有一个例外。希望获得高中毕业证书的学生,必须准备一份书面论文,证明他们已经有能力过上负责任的成人生活。会有其他瑟谷模式学校的从业者组成小组,以评估学生的论文,学生也需完成口头答辩。
\2. 我与 David Chanoff 合著的毕业生研究报告,发表在《美国教育杂志》第 94 卷第 182-213 页上。瑟谷学校出版社发布了该校对毕业生的最新研究报告,刊登在学校网站上。
孩子能自己学会阅读
原文:Children Teach Themselves to Read | Psychology Today
非学校教育者对儿童如何学习阅读的解释
发表于 2010 年 2 月 24 日 | 审稿人 Matt Huston
我们的文化普遍认为孩子必须被教才会阅读。大量研究致力于找出最科学的方法来教会孩子阅读。在任何重点大学图书馆的教育书库中,专门研究阅读教学的书籍和刊物汗牛充栋。在教育界,被称为「阅读战争」的激烈争论已经持续了数十年,争论的焦点是:应该更注重教授语音拼读法还是采取所谓的「整体语言」阅读教学方法。许多对照实验将一种教学方法与另一种进行比较,拿幼儿园和一年级学生作实验。语音拼读法的支持者说,在这些实验中他们的方法已经「大获全胜」,而整体语言的支持者则说这些实验是被操纵的。
标准化学校表明,要孩子学会阅读并不容易。从学前到小学前几个年级,教授阅读需要巨量的时间精力。此外,教育工作者鼓励家长在家中教授年幼的孩子阅读,以便为日后在学校中的阅读教育做好准备,或者作为加餐补课。以阅读教育为目的的教育材料,其营销之多,已经发展成为大型产业。互动软件、视频和特别编排的书籍等等,旨在「科学地」教授语音拼读法,并为初学者提供日益增长的视觉词汇。
最近我读了一篇由两位认知科学家撰写的文章,声称阅读教育的下一个发展方向将是个性化教育[1] 。据作者们称,现代的脑成像方法将被用来确定每个孩子的独特学习风格,数字化的文本传递程序将根据他们的独特需求和学习方式来教授阅读。作者和他们的同事确实在开发这样的系统。对我来说,这也蛮蠢的。每个孩子的独特需求并不仅仅是由大脑硬件的差异所决定的,而是因为他们的特定经历、愿望和喜好而时刻变化,这些变化是由孩子自己控制的。只有当我看到脑成像可以用来预测白日梦内容的证据时,我才会开始相信这些研究人员的说法。
与所有这些关于教授阅读的疯狂做法形成鲜明对比的是,参与「非学校教育」运动和瑟谷「去学校」运动的人们的观点,他们声称根本不需要教阅读!只要孩子在有阅读者的识字社会中成长,他们就能学会阅读。他们可能会在途中询问一些问题,并从已经知道如何阅读的人那里得到一些指导,但他们将在所有这些事情中采取主动,并自己组织整个过程。这是个性化学习,但它不需要脑成像或认知科学家,而且除了正在学习的孩子之外,其他人几乎不需要付出任何努力。每个孩子都清楚自己的学习风格,知道自己想做什么,并将以自己独特的方式,在自己独特的节奏里学习阅读。
21 年前,我的两名本科生进行了一项研究,课题是瑟谷学校(Sudbury Valley School)学生学习阅读的方式,该校的学生整天都可以自由地做自己想做的事情(请回顾我关于瑟谷学校的文章)。他们确定了 16 名自入学以来学会阅读,但并没有接受过系统阅读教育的学生,并采访了学生、家长和学校员工,试图找出每个人学习阅读的时间、原因和方式。他们发现每个人的情况都不一样,无法进行概括。学生们开始进行真正的阅读的年龄范围非常广泛,从 4 岁到 14 岁不等。有些学生学得非常快,从完全不会阅读到流利阅读只需几周时间;而其他人则学得更慢。有些人有意识地学习,系统地学习语音拼读法,并在途中寻求帮助。其他人则是「自学成才」。他们有一天意识到自己能够阅读,但不知道自己是如何学会的。学生们最初学习阅读的年龄与采访时的阅读涉及程度之间没有系统的关系。一些最热情的读者早早就学会了阅读,而其他人则很晚才学会。
我的儿子在瑟谷学校工作,他告诉我那项研究现在已经过时了。他的印象是,如今大多数瑟谷学校的学生开始更早地学习阅读,而且更轻松,因为他们身处一个人们经常用书面语进行交流的文化中——在电脑游戏、电子邮件、Facebook、手机短信等中。对他们来说,书面语和口语本质上没有什么不同,因此所有人类用来学习口语的生物机制,也被更多或更少地自动应用于他们的阅读和写作(或打字)学习中。我很想以某种方式研究这个问题,但迄今为止还没有想出如何在不侵犯隐私的情况下进行。
几周前(请参考 2010 年 1 月 6 日的文章),我邀请非学校教育或瑟谷学校的读者给我写信,分享没有正式教学的情况下学习阅读的故事。18 个人——其中大多数自称是非学校教育者的父母——很大方地与我分享了他们的故事。每个故事都是独特的。正如我的学生在他们在瑟谷的研究中发现的那样,现在的非学校教育儿童学习阅读的方式似乎没有规律可循。
通过列出和组织每个故事所提出的主要观点,我提取出了一些原则,能帮助理解无需学校教育的阅读学习过程。在我看来,这些原则大致有七条。我选择围绕这些原则组织本文的其余部分,并用发送给我的故事中的引语来举例说明每个原则。一些发送故事的人要求我只使用他们的名字,而不是他们孩子的名字,所以我将在整篇文章中遵守这个约定。
七条不上学就学会阅读的原则
- 不上学的孩子什么时候都可以学习阅读,没有关键期。
在标准化学校里,孩子得按学校规定的节奏学会阅读,这非常重要。一旦落后,就无法跟上其他课程,并可能被贴上「差生」的标签,或者被要求重读一年级,或者被认为存在某种智力障碍。在标准化学校中,学会阅读是所有其他学习的关键。首先你要「学会阅读」,然后你才能「通过阅读学习」。如果不知道如何阅读,你就无法学习大部分其他的课程,因为很多课程都是通过书面文字呈现的。甚至有证据表明,未能按时学会阅读会预示在标准化学校中随后的顽皮行为。在芬兰进行的一项长期研究发现,学前和幼儿园阶段的阅读能力差,预示着后来小学阶段的阅读能力差,并预测了随后的「外显问题行为」,这基本上意味着行为不端。[3]
但不上学的孩子学阅读,则完全是另一番景象。他们随时都可以学阅读,但没有明显的副作用。我的读者给我提供了 21 个不同的孩子学习阅读的案例。两个 4 岁开始学习,7 个 5 岁或 6 岁开始学习,6 个在 7 岁或者 8 岁开始学习,5 个在 9 岁或 10 岁开始学习,还有一个在 11 岁开始学习。
即使在同一个家庭中,不同的孩子学会阅读的年龄也可能相差很大。Diane 写道,她的第一个女儿在 5 岁学会了阅读,第二个女儿 9 岁;Lisa.W. 写道,她的一个儿子在 4 岁学会了阅读,而另一个在 7 岁学会;Beatrice 写道,她的一个女儿在 5 岁之前就学会了,而另一个在 8 岁学会。
这些孩子如今都没有阅读困难。Beatrice 报告说,那个 8 岁才学会阅读的女儿,到了 14 岁——「每年读几百本书」,「写了一本小说」,「获得了许多诗歌奖」。显然,阅读晚与后来超凡的文学能力并不矛盾!然而,这个女儿在学会阅读之前,就已经显示出其他文学早熟的迹象。据 Beatrice 说,在她 15 个月大的时候,她就能凭记忆背诵《鹅妈妈全集》中的所有诗歌。[注:见 Beatrice Ekwa Ekoko 的优秀博客:http://radiofreeschool.blogspot.com/.]
在这些学习阅读的故事中,最经常反复出现的信息是,由于孩子们没有被强迫或诱导去阅读,他们对阅读和学习有着积极的态度。这可能最清晰地由 Jenny 所陈述,她写道,关于她的女儿(现在 15 岁),直到 11 岁才开始阅读得好:「让她按照自己的节奏和主动性来阅读,最好的一个结果就是她拥有了这个经验,通过这个经验她意识到,如果她能做到那个,她就能学会任何事情。我们从来没有强迫她学习任何事情,因此,她的学习能力始终保持完好。她聪明好奇,对周围的世界充满兴趣。」
- 兴致勃勃的孩子一下子就能学会阅读。
在某些情况下,非学校教育的孩子会在观察者看来似乎是一瞬间从不识字到识字。例如,Lisa W. 写道:「我们的第二个孩子是一位视觉思维者,直到七岁才学会阅读。多年来,他可以从图像线索中找出他需要知道的信息,如果遇到困难,就让他哥哥为他读。我记得他开始阅读的那一天。他曾要求他的哥哥在电脑上为他读一些东西,他的哥哥答道:『我好多事情要做,哪有时间天天给你读书』,然后就走开了。在几天内,他就能够读得很好了。」
Diane 写道:「我的大女儿到 5 岁生日( 3 月)时还不会阅读,但到了年底,她就能流利地大声朗读了。」而 Kate 写道,她的儿子在 9 岁时「自学阅读」,仅用了一个月。在这段时间里,他有意识地自学阅读,并从一个犹豫不决、阅读能力差的读者进步到高度流畅的阅读者,远远超出了标准学校认为他应该达到的「年级水平」。
这种明显的阅读能力的阶梯式提升可能至少部分地是因为早期的、更隐蔽的学习阶段并未被观察者注意到,甚至可能连学习者自己都没有注意到。Karen 将她观察到的儿子阅读能力的迅速提高归因于他突然获得的自信心。她写道:「在过去的这个夏天,我的儿子 A(现年 7 岁)从不敢表现出他的阅读能力,到现在能够阅读章节书。这个夏天就完成了!现在,六个月后,他对自己的阅读能力感到足够自信,我经常早上起来发现他正在大声朗读给他的妹妹听。他甚至主动要求给他父亲和我读书。一年前,他因为感到尴尬和缺乏自信心而对自己的能力水平进行了隐瞒,这种情况闻所未闻。我很高兴我们没有逼迫他!」
- 试图在阅读上拔苗助长只会适得其反。
有三位给我发来经历的人写道,他们曾经试图教他们不识字的孩子阅读,而这种尝试看起来产生了负面后果。以下是他们的说法。
Holli 写道,当她的儿子「大约 3 岁半」的时候,她试着教他阅读。「我感觉那些 Bob 书(美国的一种教授阅读技能的儿童读物)枯燥乏味,内容还重复,我找了一些还算有趣的书,让他开始练习……讲真,他还没有准备好阅读,而且无论他准备好与否,只要他不想,他就不愿做,所以他很抵触……很快我就发现,尽管他在阅读技能上取得了成效,但我对我的儿子造成了伤害,而且得不偿失——我让他厌烦阅读了。我立即停止了正式的阅读教学,只在他想听的时候,给他读书。」Holli 接着指出,大约两年后,她的儿子「完全悄悄地」开始自己看书,最终开始阅读,显然,他隐藏自己的兴趣和做的练习,是为了避免感到压力。
Beatrice 写道,她的女儿在 8 岁学会阅读:「当她 6 岁时,我也有过试图『让她』阅读,真遭罪,我是担心上学的孩子会更早学习这项技能,就不想让她落后。所以我连着几个星期都坚持让她阅读,还让她跟我一起写日记,我拼写所有单词,然后她把所有的东西都抄下来。后来,她干脆说:『别管我』,她不会听我的了,她说她如果『准备好』了,自然会开始学习阅读。」
Kate(在家教育孩子的英国妈妈)写道,她曾试图教儿子阅读:到 9 岁,他对任何英语都有抵触情绪,阅读成了一场常规战役。他抵触,觉得无聊,而且表现出烦躁,所以最后我克服了自己的学究气,尝试了一种新的放手政策。我说,我再也不会要求他读书了,甚至不会建议他读书......在接下来的一个月里,他悄悄地回到了自己的房间......并自学了阅读...... 我[在他不感兴趣时]花了四年时间教他基础知识,但现在确信他可以在几周内学会这些。
- 为了实现某些有价值的目的,孩子会以阅读为途径,开始阅读。
有个陈年老梗,几十年的笑话了,讲一个孩子到了 5 岁还没说过话。然后,有一天,吃中饭的时候,他说:「这汤冷的。」他的妈妈大跌眼镜,说:「我的儿,你不是哑巴啊!为什么你之前不会说话!」「嗯,」男孩说,「因为之前汤都是热的。」
这个故事完全是凭空捏造的,学说话不可能是这个样子,所以这是个笑话。需不需要说话来满足需求,孩子们都能学会说话;这是他们的基因决定的。但是这个故事,稍加修改,可以合理地应用于学习阅读。当孩子们认为有充分的理由去学习阅读时,他们似乎会自发地学会阅读。我收到的许多故事都说明了这个观点,以下是一些例子:
关于她在瑟谷式学校就读的女儿,Amanda 写道:「直到去年 11 月(7 岁时),她一直对别人说她不知道怎么读。她要求她爸和我为她做她最喜欢的布朗尼蛋糕,但是我们都不愿意做。不久之后,她跑进房间问我是否可以为她打开烤箱,并找一个 9 x 11 的烤盘(她说『 9 ex 11』而不是『9 by 11』)。我给她拿了一个烤盘并打开了烤箱。过了一会儿,她跑进来请我把布朗尼蛋糕放进烤箱里。然后她说:『 妈,我想我现在会读书了。』她拿来了一些书,然后大声朗读给我听,一直读到她跳起来说:『那些蛋糕闻起来做好了。现在你能把它们拿出来吗?』……现在她告诉别人,她知道如何阅读,并且是自己教会自己的。」
Idzie,19岁,自学者,没有受过正规教育,但教育素养很好。她的博客上的一篇文章,回忆了自己学习阅读的经历。她写道:「当我大约 8、9 岁的时候,我妈给我和我妹妹朗读《哈利·波特》。但是,妈妈很忙,要是读得太久,她的声音还会哑。因此,我非常沮丧,迫不及待地想知道接下来会发生什么,于是我便自己拿起书来读了起来。」
Marie 是一位非学校教育者的妈妈。她写道,她现在 7 岁的儿子在当地的一家剧院表演中找到了提高阅读能力的动力。他一直很热衷于组织「演出」,但现在他已经够大了,有了真正的表演经验。他意识到阅读是他热爱的这项活动的重要组成部分,这给了他一个强烈的理由去成长和发展成为一个更优秀的读者。最近,他在《仲夏夜之梦》中扮演了一个角色,需要阅读和记忆莎士比亚的作品。这完全不需要「教师」的任何指导。
Jenny 写道,她的女儿在 11 岁之前并没有开始阅读书籍,但她听人朗读、看电影、借阅光盘、听有声书,以此满足自己对故事的热爱。最终,她开始阅读是因为她对电子游戏(比如卡通镇)和漫画书感兴趣,玩这些都需要阅读,但没有人愿意为她朗读。
- 阅读和许多其他技能一样,是在共同参与的社交中学习的。
在瑟谷学校和其他类瑟谷学校的观察表明,许多儿童通过混龄的玩耍来学习阅读。非阅读者和阅读者一起玩游戏,包括电脑游戏,上面有些文字。为了使游戏继续下去,阅读者阅读单词,而非阅读者则负责找到它们。
类瑟谷学校 Diablo Valley School 的工作人员 Vincent Lopez 给我发来了这个混龄学习的可爱例子: 「他们在艺术教室里制作标志,模仿刚开始播放的电视节目。在我看来,这是一个愚蠢的、道德低下的、受媒体驱动的、无约无束的约会节目;我之前已经表达过这个观点。他们以自己的方式正在处理即将来临的未来……但我离题了。这段话的精髓在于,那个五岁的孩子正在试图在各种年龄段的同伴的帮助下阅读这个标志……学生们学习是因为他们想听懂笑话,想像周围的同伴那样更加成熟。」
几乎所有家庭自学者的故事都包括阅读方面的共同参与。我最喜欢的一个例子是由 Diane 提供的,她注意到,她的女儿在 5 岁时学会阅读,是因为家庭的定期圣经阅读时间激发了她对阅读的兴趣。在她还不会阅读的时候,她坚持要轮流读圣经,「而轮到她的时候,她会编造一些单词来读!」
其他人还提到了一些需要一起玩的家庭游戏,这些游戏也需要阅读。或者一起看电视节目,为不识字的人读屏幕指南和字幕。随着时间的推移,不识字的人需要的帮助越来越少,他们开始自己认识并阅读越来越多的词语。最常提到的共同参与的例子是父母或兄弟姐妹给不识字的孩子读故事,通常作为睡前仪式的一部分。不识字的孩子在一边看着,看着文字和图片,有时读出一些单词;或者他们会记住被反复读过的书,然后假装读这些书,也注意到了其中的一些单词。假装阅读因此也逐渐变成了真正的阅读。
在我以前写的一些文章里,我引用了优秀的俄罗斯发展心理学家 Lev Vygotsky 的话,他的主要观点是,孩子通过与技能更娴熟的同伴共同协作,首先在社交中发展新技能,然后私下使用这些新技能,服务于自己的目标。在阅读方面,这个普遍原则似乎也适用。
- 有些孩子在学会阅读之前,先对写字感兴趣,于是他们在写字中就学会了阅读。
有七八个人告诉我,他们的孩子对写字感兴趣,或者打字。这些都发生在对阅读感兴趣的同时,甚至是之前。以下是些例子:
Marie 写道,她现年 7 岁的儿子是一位艺术家,他花费巨量时间画各种东西,尤其是故事和发明。因此,他自然希望用标题、说明和引语让他的画作「说话」。「妈妈,『Superdog 想回家』怎么拼?」他会拼出整个句子,五分钟后,他又问:「妈妈,『Superdog 看到自己的房子』怎么拼*?」这个男孩通过阅读他自己写的句子,至少部分地学会了阅读。
Beatrice 也讲了类似的故事,她的小女儿在 5 岁前就学会了阅读。「她学阅读是因为她想用笔表达自己。从她能拿起铅笔的时候开始,无论是写诗、歌曲、设计广告,她都问我拼写:『海狸怎么拼,建议怎么拼?』」
Lisa R. 也提到了她儿子,在学习阅读的过程中:「他的阅读能力增长得益于他努力写作。他用自己的拼音写了简短的笔记和故事标题。有时他会问怎么拼写笔记或书里的单词。通过重复,他现在记住了其中的一些单词。」
Lisa W. 写道:「我们的大儿子在4岁时学会了阅读,为了搜索免费在线游戏,他学会了阅读。他得打开浏览器,让我拼写 free,然后是 online,再然后是 games 。突然间,他就能读了。」
- 孩子学习阅读的方式「无规律可循」。
您要是认为,我讲这些故事,是想传授如何「教」或「帮助」孩子阅读的有用技巧,那您就搞错了。每个孩子都独一无二。您必须让孩子告诉您如何帮助或不帮助他。我不清楚您的孩子,任何所谓的阅读专家也不清楚。我唯一的建议是,不要强迫;倾听您的孩子;适当回答您孩子的问题,但不要过度地告诉他们超出他们想知道的范围。您一旦做得过火了,孩子慢慢地不会再向您提问。
很多给我写信的人都对他们孩子阅读的学习顺序感到惊讶。一些孩子在学习较简单的单词前,就已经学会了一些从未在启蒙读物中出现的生僻单词。有些孩子在学会阅读之前就已经学会了写作。有些孩子似乎以很快的速度学习,然后就停滞不前,几年后才进一步进展。我们成年人可以欣赏这一切,只要记住我们的责任不是改变它。我们只是观察者,有时是孩子为了实现目标的工具(这个目标也是孩子自己的)。
----------------
我非常感谢大家能寄给我故事,这些故事写得如此详尽,颇具用心。我希望许多刚刚读过这篇文章的人能够在下面的评论区补充自己的故事。或许应该趁热打铁,创建一个真实的帐号,展示在家受教育的孩子学习阅读的多种方式,这个帐号可以和那些讲授阅读教学的书籍比划比划。
最后的最后,我不禁要用我儿子学阅读的故事来结尾。他阅读很早,在新英格兰一个广场的内战纪念碑前,他的阅读能力初步显现,他当时才三岁半。他看着那些文字,问道:「为啥大家要为了个洋葱(onion)的死活大打出手?」
----------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
[1] D. Rose & B. Dalton (2009), Learning to read in the digital age. Mind, Brain, and Education, 3, 74-83.
[2] R. M. Savio (1989), Self-initiative in the learning process; and A. DelGaudio (1989), SVS Reading Study. Unpublished senior honors theses.
[3] A. Halonen et al., (2006). The role of learning to read in the development of problem behaviour: A cross-lagged longitudinal study. British Journal of Educational Psychology, 76, 517-534.
儿童和青少年自杀与上学时段的关系
原文:Children’s & Teens’ Suicides Related to the School Calendar | Psychology Today
精神病急诊和青少年自杀率在上学时段急剧上升。
发布于 2018 年 5 月 31 日 | 审稿人:Matt Huston
Source: Pixabay Creative Commons
校园枪击案让人感到万分悲痛,这是理应如此的。每一起校园枪击案都是国家级别的悲剧。其他发达国家基本上都已经在枪支管控方面采取了行动,而美国却没有,应该为此感到羞愧。然而,尽管校园枪击案这个悲剧非常严重,与另一桩学校引发的悲剧相比,则不值一提:自杀。
对于 10 岁以上的学龄儿童,自杀是第三大死因;对于 15 岁以上的孩子,自杀是仅次于意外事故、高于他杀的第二大死因(详情请见这里)
四年前,我分享了一组数据(点此查看)——这组数据来自康涅狄格州一家精神健康设施,展示了三年时间(2011 - 2013 年)内儿科急诊精神健康就诊量与上学时段之间的关系。数据显示,学龄儿童的平均每月精神健康急诊接诊量,从 5 月份(最后一个完全呆在学校的月份)的 185 例下降到 6 月份(学校开始放假的月份)的 102 例,然后在 7 月和 8 月(完全脱离学校束缚的月份)分别下降到 74 例和 66 例。到了 9 月,这一比率又开始上升。总体来看,学期间的就诊率是 7 月和 8 月的两倍多一点。当我撰写那篇文章时,我并不知道有其他研究评估了学年时段对精神健康崩溃的影响。自那以后,更多的研究成果不断出炉。
精神崩溃和自杀未遂与上学时段的关系
Collin Lueck 及其同事在 2015 年进行了一项研究,调查了洛杉矶的一家大型儿科急诊精神健康科,以周为单位分析了可能危害自身或他人的精神病就诊率,数据横跨 2009 至 2012 年。他们发现,在学校开学期间,此类就诊率比学校不开学的时段高出 118%。换句话说,上学期间的精神病科急诊就诊率是非上学期间的两倍多。值得注意的是,不仅在暑假期间,在其他的学校放假期间,此类就诊率都会显著下降。
研究者还发现,在为期四年的研究区间中,上学时段的精神科急诊就诊率持续上升,但假期时段则没有变化。这表明:自杀意图和尝试随着时间增长,来源于这段时间里学校带来的压力持续增长,而非某些与学校无关的因素。在另一项较新的研究中(2018 年),Gregory Plemmons 及其同事发现,从 2008 年到 2015 年的七年间,学龄儿童因自杀意图和尝试而导致住院的比例激增了近 300%,且每年这种住院的比例在上学时段都明显高于暑假。
实际自杀率是上学时段的函数
基于我迄今所述的数据,有人可能会认为,上学期间急诊精神科就诊量的增加,是因为学校人员有心观察,并将儿童转介给了就诊机构,从而可能挽救了孩子们的生命。根据这一观点,父母对孩子们的问题不如老师敏感。然而,没有数据表明这是真的,而且有非常有力的理由相信这是假的。如果这个假设成立,那么实际自杀率——与自杀意图或尝试相反——在上学期间应该低于非上学期间。但实际上,实际自杀率与自杀意图和尝试率是相似的。
在 2011 ,Benjamin Hansen 和 Matthew Lang 年利用各州机构收集的数据,分析了 1980 至 2004 年间美国青少年的自杀情况。这项研究年代较早,那时候学校压力相对较小、青少年总体自杀率较低。尽管如此,他们还是发现学年期间的自杀率远高于暑假期间。他们还分别分析了男生和女生的情况,这是我所找到的其他研究中未曾做过的。结果显示,对于男生来说,上学期间的自杀率平均高出 95%,而女生则高出 33%。这与一般的观察相符,即男生比女生更难适应学校的约束。
Hansen 和 Lang 还发现,青少年自杀率在上学期间的增加仅限于学龄儿童。对于大多数已经完成高中学业的 18 岁青年,就几乎没有这种增加趋势了,而到了 19 岁和 20 岁,这种趋势完全消失了。其他研究显示,成年人的实际自杀和自杀尝试与季节相关很小,夏季的自杀率反而略高,而不是较低,这与学龄儿童和青少年的发现相反(Miller et al, 2012; Cambria et al, 2016)。
这只是冰山一角
实际上,自杀事件和紧急心理健康服务的接收人数,只是学校对年轻人带来压力的冰山一角。我曾在其他文章中概述了更多相关的证据(参见此处和此处)。特别值得一提的是,美国心理学协会几年前的一项大规模调查发现,青少年是美国压力最大、最焦虑的群体;83% 的青少年认为学校是他们压力的来源;在学期间,有 27% 的青少年报告他们经历了「极度压力」,而在暑期,这一数字降至 13%。
而悲剧在于我们还在向学校添加压力,而研究已经证明这些压力完全不必要。年轻人若能以他们自然的方式学习,他们能学得更多,学得更好,压力还更小(公共开销更低),我在我之前很多博客文章以及我写的《自由学习》都指出过。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
Cambria, D. G., et al (2016). Do suicide attempts occur more frequently in the spring too? A systematic review and rhythmic analysis. Journal of Affective Disorders, 196, 125-137. Note—this a study of all suicides, not specifically children’s and teens.
Hansen, B. & Lang, M. (2011). Back to school blues: Seasonality of youth suicide and the academic calendar. Economics of Education Review, 30, 850-851.
Lueck, C., et al (2015). Do emergency pediatric psychiatric visits for danger to self or others correspond to times of school attendance? American Journal of Emergency Medicine, 33, 682-684.
Miller, T. R., et al (2012). Suicide deaths and nonfatal hospital admissions for deliberate self-harm in the United Sates. . Crisis, 33, 169-177.
Plemmons, G., et al (2018), Hospitalization for suicide ideation or attempt: 2008-2015. Pediatrics, 141 #6.
儿童的自由:人权视角
原文:Children’s Freedom: A Human Rights Perspective | Psychology Today
对大多数人来说,人权增加了——但对儿童来说,人权却在减少。
发表于 2019 年 2 月 28 日 | 审稿人:Jessica Schrader
过去几十年来,美国在许多民权领域都取得了进步,非裔美国人、妇女、同性恋者和残障人士的权利都得到了扩展。这在一定程度上要归功于计划周密的民权运动,其中许多人都呼吁为这些群体争取权利。但儿童的权利却有所缩水。
公民权利是美国政治意识形态的基石。作为一个民主国家,我们的进步体现在我们在多大程度上将权利保障扩展到更广泛的人群。杰斐逊在美国《独立宣言》中宣称,「不可剥夺」的人权包括生命、自由和追求幸福。美国宪法《权利法案》旨在保障言论自由、新闻自由、集会自由和人身自由等权利。人身自由是最基本的权利,其他权利都与之相关。《权利法案》第五修正案宣布,「未经正当法律程序,不得剥夺任何人的人身自由」。我所了解的宪法和其他任何法律中,都没有关于儿童不算人的声明。然而,儿童却经常在未经正当法律的情况下被剥夺自由。
事实上,如今的儿童比 60 多年前我小时候,甚至 90 多年前我父母小时候都更加缺乏自由,并且他们正因此而遭受痛苦。正如我在其他记录中写的,今天的儿童正面临着空前的焦虑、抑郁,甚至自杀问题(Gray, 2011; 2013)。根据对几十年来一直未变的标准化临床评估问卷的分析估算,现在青少年中重度抑郁症和焦虑症的发病率大约是 20 世纪 50 年代的八倍,学龄儿童的自杀率是当时的六倍。儿童的严重精神障碍与他们自由被剥夺的程度成比例增加,有理由怀疑后者是导致前者的原因之一(Gray,2011;2013)。
导致儿童自由缩水的两类原因
几十年来,社会的诸多变化都减少了儿童的自由,但主要分为两类。
第一类与学校教育有关。
很明显,强制学校教育(字面意思就是强制学校教育)是对儿童自由的侵犯。儿童必须去上学,而在学校里是没有自由的。事实上,儿童在学校被剥夺的自由比成年罪犯在监狱里被剥夺的还要多。他们几乎所有时间都被规定了应该在哪里、做什么事;言论自由和集会自由都被剥夺了;他们对必须遵守的规则没有发言权;当他们被指控违反规则时,也没有正当的程序来裁定他们是否有过失、如何惩罚。一直以来学校都是如此,但现状比过去更加糟糕,因为学校数量更多了,管理和限制也更加严格。以下是一些变化的例子:
-
学年变长了。现在的学年比 20 世纪 50 年代我小时候平均长了五周。
-
学校的上课时间变长了。现在全国平均每天的上课时间接近七个小时,而我小时候只有六个小时。
-
课间和午餐休息的时间和自由度都大幅减少了。在 20 世纪 50 年代,小学通常有两次半小时的课间休息和一小时的午餐时间,孩子们可以随心所欲地自由玩耍。如今的许多小学没有课间休息或者只有 15 分钟,我还从家长那里听说有的学校只有 20 分钟的午餐时间,并且不允许孩子们说话,更不用说来到室外玩耍了。
-
这些年来,家庭作业大量增加。现在即使是小学生也会被布置家庭作业,并且家长会强制监督他们完成,因此他们回家后也无法摆脱学校的束缚。
有时人们会说,儿童上学的感受和成年人工作的感受是类似的,但这是一种错觉。对某些成年人来说,工作有时可能像监狱,但学校就是监狱。法律并不强迫成年人从事某项工作,他们一直都有辞职的自由。对成年人来说,强制劳役是违法的,这就是所谓的奴隶制。我不知道有哪个成年人会自愿接受这样一份工作:像孩子们在学校里那样受到严格的、事无巨细的管理,不能与同事交谈、未经许可不能离开座位、还要不断地接受监视和测验,被以一种几乎是故意羞辱人的方式和同事互相比较。一个多世纪前,我们禁止了儿童从事全日制劳动,认为当童工对他们无益。但现在,学校教育在时间投入上已经等同于一份全职工作,并且在繁重程度上比成年人能忍受的全职工作还要糟糕。
儿童自由减少的另一类原因与日益增长的校外管制有关。
在 20 世纪二三十年代我父母还是孩子的时候,50 年代我还是孩子的时候,甚至 70 年代我儿子还是孩子的时候,孩子们都在户外度过了大量的课外时间,在周围没有大人的情况下与朋友一起玩耍和探索。在这种自由的环境中,孩子们练习并掌握了生活中最重要的、学校无法教授的技能。他们学会了如何创造活动、解决问题、交朋友、与同伴协商、应对欺凌和管理情绪。换句话说,他们学会了如何掌控自己的生活。在这个过程中,他们获得了能够促进自信和韧性的技能,免受抑郁、焦虑和自杀的困扰。
但现在,我们几乎禁止儿童进入公共场所。大多数家长不允许自己的孩子在没有成年人监督的情况下进行户外活动,允许孩子户外活动的家长在某些情况下会因疏忽照顾儿童罪而被逮捕。我们倾向于将儿童户外活动减少归咎于科技的诱惑力,但对儿童的调查显示,如果允许的话,他们很愿意花更多时间与朋友们一起户外活动(见 Boyd,2014;Gray,2013)。
这就是当今社会中儿童的处境。与过去相比,他们必须花更多的时间待在学校这个监狱里,课外时间大体上也处于软禁状态。在历史上,除了儿童被奴役和进行繁重的、像奴隶一样的童工劳动的情景以外,我们今天的儿童就是最不自由的。
我们为何对儿童自由被剥夺无动于衷?
我们为什么不上街游行,高呼「解放儿童」?为什么不签署请愿书,要求政客为了获得我们的选票而支持儿童的自由?为什么即使能看到儿童正因被剥夺人权而遭受痛苦,也对此放任不管?
我不认为这是因为我们讨厌孩子,大多数人都喜欢孩子。我认为问题在于无知。更具体地说,有两个原因导致大多数人没有感到愤怒。
\1. 这些变化是日渐月染的。
在儿童的自由方面,尽管现在与 20 世纪 50 年代或更早以前差异巨大,但这种变化是渐进的。它足够缓慢以至于大部分人都没注意到,而是适应这种变化并相信我们任何时候所见的都是正常的,与以前没有太大区别。这有点像温水煮青蛙:如果你把一只青蛙放入接近沸腾的水中,它会立刻挣扎逃走;但如果你把它放入温水中,并非常缓慢地加热直至沸腾,它就会接受这种这种变化,最终死亡。
假如这种变化是突然发生的——比如,在 1955 年突然颁布法令把儿童的在校时间增加到今天的水平,要求小孩子也必须完成家庭作业,取消课间和午餐休息,让孩子们花大量的时间钻研考试,甚至校外时间也禁止他们在没有大人控制的情况下与其他孩子一起在户外玩耍——那么就会发生叛乱。教师、家长和孩子自己都不会接受。但这种变化是渐进的,渐进到人们以为事情一直就是这样,我们现在的情况的就是事情的必然结果。
\2. 儿童的能力被低估了。
儿童权利得不到支持的另一个原因是,越来越多的人认为儿童不懂事。在儿童没有能力做出合理决策的假设下,我们成年人必须帮他们做决定。类似的论调在过去常被用来为压迫妇女和非裔美国人辩护。因为妇女和非裔美国人没有白人男性的思维能力,所以白人必须替他们做决定。尽管现在我们不常听到这样的论调,但是关于儿童的这种观点却比以往更为普遍。甚至有心理学理论认为,儿童的思维方式和成年人有本质上的区别,他们没有逻辑推理能力。我们现在知道这些理论都是错误的(例如这里)。实际上我们所有人在大概 4 岁以后(参见这里)的思维方式都是类似的。
当然,我并不是说儿童和成年人一样,或者不需要比成年人更多的照料和保护。儿童的平均年龄更低,对世界的认识比成年人少,而且在经济上依赖于成年人。所以,是的,儿童需要成年人的照顾,但我们对儿童需要照顾的理解可能会走向极端,忘记了他们同时也需要自由。
儿童对照料的需求和对自由的需求之间的矛盾
儿童对照顾的需求与他们对自由的需求可能会发生冲突;当两者冲突时,恰当的平衡点在哪里?近几十年来,这种平衡已经完全失调。我们对照料,或者说我们认为的照料的重视程度,压倒了我们对自由的关注。我们把孩子们关在室内,或者始终在成年人的监视之下,因为我们认为这样可以保证他们的安全。我们要求他们接受更多的学校教育,因为我们认为他们的前途取决于此。
在这一切中,我们没有认识到,妥善照顾儿童的一个关键是允许和鼓励他们自立——这样他们才能学会如何解决自己的问题、自学、掌控自己的生活。这些是童年阶段的主要任务,而当我们剥夺儿童的自由时,就会阻碍他们完成这些任务。我们还忽略了一个事实,即妥善照顾儿童的另一关键是确保儿童快乐。没有自由的人是不会快乐的。我们在不断监视、窥探的过程中也剥夺了儿童的自由,剥夺了他们私生活的权利(有关这方面的一篇有趣文章,参见这里)。
当人们谈论儿童权利时,这种照料和自由之间的冲突可能会导致一种奥威尔式的双言巧语。联合国《儿童权利公约》就是一个例子。它是一项旨在保障儿童权利的国际公约,起草于 1989 年,通过了除美国外所有联合国会员国的批准。在阅读这份公约里一些迂回的语言时,我们会非常清楚地意识到自由与照料之间的冲突。例如第 37 条包括「不得非法或任意剥夺儿童的自由」。当然,这里的关键在于「非法」这个条件。如果你制定法律要求儿童必须上学,那么强迫儿童上学就不是非法剥夺自由。
更能说明问题的是第 28 条,其中包括这样的文字:「缔约国承认儿童有受教育的权利,为了实现这一权利,缔约国应该实行全民免费义务初等教育。」我不知道写下这份条款的人是否注意到了其中的讽刺意味。从本质上来说,这代表批准这项协议的国家保证不管儿童是否愿意,他们都有权被迫上学。
在总结这篇文章时,我注意到我们的社会对儿童权利的压制在很大程度上是出于善意。我们的错不在于恶意,而在于无知。
人们坚信如今儿童在户外或远离成人的任何地方都比过去更危险,尽管这种想法在客观上是错误的。向人们宣传这方面知识是 Let Grow 基金会(主要由 Lenore Skenazy 创立,我是董事会成员之一)的任务之一。人们必须明白,严格限制儿童的自由会降低他们长期的幸福感和安全感,因为这会阻碍他们培养面对生活中必然的挑战所需的韧性和应对能力。
人们相信,以奖惩驱动的、课程为本的强制性、侵入性的学校教育,对于儿童顺利长大成人来说是必不可少的,而且现在比过去需要更多这样的学校教育。尽管我们现在有很多证据能证明这是错误的,人们仍然相信这一点。来自越来越多家庭的证据表明,他们找到了绕过或者无视强制学校教育的方式,对孩子进行「非学校教育」或让他们进入能够自由追求兴趣、不受制度审判的民主学校。对这些群体的研究(包括我的研究)显示,以这些方式进行自主教育的人在现实中表现非常出色(Gray,2017)。我是自主教育联盟的创始成员之一,该联盟的一项任务就是推广这项研究,让人们认识到有一些方法可以绕过强制教育法律,并且选择这些方法的人在世界上都做得很好。联盟的另一项更大的任务是推动社会变革,让所有儿童无论家庭收入和背景如何,都有机会接受自主教育。
认为儿童需要被剥夺自由才能受教育的观点已经站不住脚了。任何愿意调查的人都会发现,有大量证据表明儿童非常善于发现和学习他们需要了解的东西,以便过上他们自己选择的满意、富饶的生活。从生物学层面来说,这是他们与生俱来的能力(参见这里)。
促进儿童公民权利运动重要的第一步就是向人们展示这样的证据:当儿童有充分的自由去追求自己的兴趣爱好而不是持续受到成年人控制时,他们会更快乐、学得更多、更安全、生活得更好,从短期和长远来看都是这样。我国的《独立宣言》声明,追求幸福是不可剥夺的人权之一。这项权利尤其应该属于儿童;但今天我们剥夺儿童这项权利的程度远比过去的几十年更甚。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
Boyd, D. (2014). It’s complicated: The social lives of networked teens. Yale University Press.
Gray, P. (2011). The decline of play and the rise of psychopathology in childhood and adolescence. American Journal of Play, 3, 443-463.
Gray, P. (2013). Free to learn: Why unleashing the instinct to play will make our children happier, more self-reliant, and better students for life. Basic Books.
Gray, P. (2017). Self-directed education—unschooling and democratic schooling. In G. Noblit (Ed.), Oxford research encyclopedia of education. New York: Oxford University Press.
传统学校教育和信任型养育之间的冲突
原文:Conventional Schooling Conflicts With Trustful Parenting | Psychology Today
信任型养育和传统学校教育可能并不兼容。
发表于 2009 年 8 月 26 日 | 审稿人:Ekua Hagan
我在前几篇文章中都谈到了信任型养育这个主题,以及当今社会对它的阻力和克服这些阻力的办法。我认为,在现在这个时代,对信任型养育最为强大的社会阻力是学校系统。几十年来,学校对儿童和家庭的掌控力不断增强,以至于对现在的父母来说,几乎不可能对就读典型公立或私立学校的孩子进行信任型养育。
正在我写下这篇文章的时候,全美国的儿童和青少年都在疯狂地完成指定的暑期阅读任务,这样他们才能在开学第一天交出读书报告。或者就是父母正在疯狂地催促他们完成作业,而他们只是敷衍了事。
如果你的孩子没能上交这些报告,学校很可能认为这既是你孩子的过错,也是你的失职。你可能会被请到学校,羞辱地坐在教师桌前的小椅子上,听老师一本正经地提醒你,父母在监督孩子完成学校任务上的责任有多么重要。
学校系统的运作假设是,孩子们,包括青少年,没有自己做决定的能力。他们没有能力自主选择阅读材料(甚至是他们自己的暑期读物!);他们没有能力凭自己的主动性去学习。这个假设认为,孩子们需要持续的监管,才能学到成长为有用之才所需的一切。如果放任儿童自由成长,他们只会虚度光阴,甚至可能误入歧途。作为父母的你,如果过于信任你的孩子,可能会被视为玩忽职守,疏于监护。
如果你的孩子认为完成家庭作业是在浪费时间而敷衍了事——通常来说的确如此,尤其是当孩子觉得自己是被逼无奈做作业时——你可能会和孩子一样受到「责备」。你应该监视、督促,甚至贿赂或者威胁你的孩子——不管你得做什么,都要让这个懒鬼去完成作业。也许你必须告诉 Mary:「不,你不能去读**《破晓奇兵》**,因为那不是你要写报告的书。」
校长和教师们已经意识到,要让孩子们完成作业,提高考试成绩,从而让学校和老师在与其他学校和老师的竞争中胜出,就必须让父母充当家庭作业的强制执行者。如今,父母们经常需要在孩子的家庭作业上签字,还要签收并回复关于孩子表现好坏的定期报告,并以其他方式充当教师的执行助手。电子邮件使得教师和父母之间「打小报告」有了质的飞跃。
家庭成为了学校的延伸,父母沦为了老师的助手。许多父母对此乐此不疲;毕竟他们也在与其他父母竞争,培养履历最出色的孩子。但这样做的代价是牺牲了孩子的自主性和责任心。更可悲的是,这种「孩子无能」的观点最终往往会成为自我应验的预言,孩子们自己也开始相信自己无能。
要想成为一个信任型的父母,让孩子从小就感到自己是被信任且值得信任的,你或许需要让他们离开现行的教育系统。这里有两个可供你考虑的替代方案。你可能不得不让他们脱离传统的学校系统。这里有两种选择可供参考。
瑟谷模范民主学校
在之前的两篇文章(这里和这里)中,我谈到了瑟谷学校,这也是我开展部分研究的地方。现如今,全球已有二三十所瑟谷模式学校,而瑟谷学校本身也为那些想要创立新学校的团体提供指导。
41 年来,瑟谷学校一次又一次地证明了,只要给儿童和青少年一个机会,他们就能负责任地掌控自己的生活,并且自发地学习成为有能力的成年人所需的知识。据我所知,对该校毕业生的跟踪和记录比其他任何学校都更加全面。[1] 如果说有哪所学校在培养快乐、有能力的成年公民方面得到了证实,那就是瑟谷学校。
这项已有 41 年历史的「实验」成果,如今在全球范围内得到复制,颠覆了当今关于教育和儿童的普遍观念。在瑟谷学校,没有人规定儿童必须学习什么,或者如何安排时间。相反,学校为自主教育提供了理想的环境。学校里有各个年龄段(从 4 岁到 18 或 19 岁)的孩子可以作为学习的榜样。有成年教职员工,他们具备各种特殊技能和知识,会帮助任何提出请求的孩子。学校有电脑和其他在当今社会文化中有用的设备,书籍也随处可见。学生和教职员工以一人一票的方式民主管理学校,这不仅有助于实现有效治理,还培养了深厚的社区责任感。民主决策和司法制度,以及稳定的混龄学制,使得该校的关爱、照顾和安全水平在其他学校中极为罕见。
只有信任型教育的父母才会把孩子送到这样的学校。不信任孩子的父母即使阅读了相关证据、参观了学校,也无法相信这样的学校会成功。
如果你想更多地了解瑟谷学校和它的效仿者,可以回顾我之前提到的文章,访问瑟谷学校官网(网站内有和学校有关的书籍),在那里或维基百科上查看类瑟谷学校名单。
在家上学和「非学校教育」
对于许多无法选择瑟谷学校的父母来说,在家上学可能是传统学校教育的唯一替代方案。近几十年来,随着学校对家庭生活干预日益加剧,选择在家上学的家庭数量急剧上升——在今天的美国已经超过了一百万。
然而,并非每一位选择在家上学的父母都信任自己的孩子,也不是每一位父母都特别重视孩子的自由。许多父母选择在家上学主要是出于宗教原因;他们希望按照某种宗教传统抚养孩子,保护他们不受其他思想和习俗的影响。有些父母选择在家上学是因为他们格外不信任孩子;他们想让孩子一直处于自己的控制之下。有些父母选择在家上学,是因为他们认为(通常是正确的),相较于当地的学校系统,他们更有能力让孩子进入哈佛。还有一些父母——我非常同情他们——选择在家上学,主要是为了保护孩子免受当地公立学校中的骚扰和霸凌。
最能体现信任型养育的在家上学模式通常被其支持者称为「非学校教育」,这一术语由 John Holt 于 20 世纪 70 年代在其杂志**《无需学校教育的成长》(Growing Without Schooling)中首次提出。只要用谷歌搜索一下,你就能找到许多与非学校教育、在家上学以及儿童自由相关的有趣且实用的网站。我最喜欢的网站之一是 Natural Child 项目,你可以在这里找到 Jan Hunt 的书,包括《自然儿童》(The Natural Child)和《非学校教育》(Unschooling)**。
根据我的经验,最成功的在家上学和非学校教育家庭都能认识到,家庭虽然是生活和学习的良好基础,但仍不足够。下面是三个考虑因素,在某些情况下可能会成为挑战:
-
**学会独立解决问题和不依赖父母是成长过程中很重要的一部分。**大约从 4 岁开始,孩子们就渐渐被其他孩子所吸引。在狩猎采集文化和其他传统文化中,以及直到我们的现代文化中,4 岁以上的孩子每天都会在成年人看不见的地方,与年纪相差较大的孩子们一起玩耍和探索。通过这样的游戏,孩子们学会了独立解决问题。在我看来,这是教育的根本任务,而这只有在孩子们远离父母或其他关注他们的成年人时才能实现。
-
**孩子从其他大孩子和小孩子身上学到的东西最多。**我在之前的系列文章(从这里开始)中讨论过儿童混龄互动的价值,这里就不再赘述,只想提及一点:年幼的孩子热衷于学习他们在年长的孩子身上看到的技能,而年长的孩子通过与年幼的孩子互动,学会了关爱和照顾。
-
**孩子们需要的成人榜样不仅仅是他们的父母。**孩子们爱他们的父母,也需要父母的爱,但在学习如何成为大人这方面,他们天生就会向其他成年人学习,甚至比从父母身上学到还多。通过观察其他成年人的所作所为,旁听他们的想法(包括那些他们自己的父母认为是大不敬的想法),孩子们可以接触到各种行为和观念供他们选择。孩子们并非被动地模仿其他孩子或成年人。当他们接触到足够多的行为、观念和态度时,他们会做出自己的价值判断,并将所观察到的融入他们不断成长的个性中,使他们成为独一无二的个体,而不是父母或任何其他人的复制品。
许多非学校教育者已经找到了应对这些挑战的方法。他们为孩子们找到了远离自己玩耍和探索的方式,让孩子们结识不同年龄段的朋友,并自然地接触到各种各样的成年人。但在我们这个家庭规模较小,邻里间友谊普遍缺乏的社会中,这往往并不容易。
-----------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。无论我们是否赞同,你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)。
参考文献
[1] 有关 Sudbury Valley 毕业生及其学生的跟进研究,请参阅:Peter Gray & David Chanoff, "Democratic Schooling: What Happens to Young People Who Have Charge of their Own Education?" American Journal of Education 94 (1986), 182-213; Daniel Greenberg & Mimsy Sadofsky, Legacy of Trust: Life after the Sudbury Valley School Experience (1992); Daniel Greenberg, Mimsy Sadofsky, & Jason Lempka, The Pursuit of Happiness: The Lives of Sudbury Valley Alumni (2005).
D1. 我们如何解释过去 70 年青少年(高中生)自杀率的巨大变化?
原文:https://petergray.substack.com/p/d1-how-might-we-explain-the-huge
这是一个真诚的发问。我列出数据并寻求想法。
这篇文章是我关于玩耍的系列信件的一个题外话。因此我用 D(题外话)来标注它。这是我的第一篇题外话,故记为 D1。每当我思考到一些可能引起订阅者兴趣的话题,尤其是当我认为读者们的反馈可能会帮助我理清思路时,我就会发表题外话。
近年来,青少年自杀率上升问题得到了媒体的大量报道。为了直观地呈现这一上升趋势,看看近年与过去几十年间相比如何,并了解青少年男女之间的自杀率差异,我从疾病控制和预防中心(CDC)保存的记录中整理了美国青少年自杀的统计数据,以制作下面的表格和图表。数据针对的是 15-19 岁的年轻人,这是因为我对高中生群体最感兴趣,而 CDC 的标准年龄分组中的这一组与之最为接近。
[好吧,我这下可真是暴露年龄了。说实话,我发现用手在方格纸上画图表,比摸索如何在 Excel 里操作并调整 X 轴分布要容易得多。具体数据请参阅下方的表格。]
这张图表揭示了几个值得关注的现象。
首先,纵观所有年份,男生的自杀率始终远高于同龄女生。经常有报道称,女生尝试自杀的频率比男生更高,但她们选择的自杀方式致命性较低,更容易得到及时救治。不过,对于未造成死亡的自杀行为,我们难以判定这究竟是真正的轻生之举,还是一种引人注目的求助方式。但无论背后原因如何,过去 72 年的数据清晰地展现了一个事实:男性青少年自杀身亡的比例始终远高于女生。
其次,令人震惊的是,在 1950 至 1990 年间,男生自杀率呈现出急剧的、近乎线性的增长。每 10 万人中的自杀率猛增了 5 倍多,从 3.5 飙升至 18.1。相比之下,同期女生的自杀率仅增长了一倍多一点,从 1.8 升至 3.7。
第三个引人注目的现象是,1990 至 2002 年间,男生自杀率出现大幅下降,而同期女生自杀率的降幅则相对较小。
值得关注的第四个显著变化是,2010 年至 2018 年期间,男生自杀率再次急剧攀升。事实上,这一时期的上升速率与 1970 年至 1990 年间相当,尽管未达到 1990 年的峰值。同期,女生自杀率也呈上升趋势,增速超过了以往任何时期,但仍远低于男生。[顺便一提,2020 年自杀率的下降,很可能源于新冠疫情期间学校停课,导致青少年自杀人数明显减少,这一点已有充分记录。更多信息请参见此处。]
由此,我产生了以下疑问:
-
1950 年至 1990 年期间,是什么原因导致男性青少年自杀人数急剧且几乎呈直线上升,而女性青少年自杀人数增幅小得多?
-
1990 年至 2002 年期间,又是什么原因导致男性青少年自杀人数急剧下降,而女性青少年降幅小得多?
-
2010 年至 2018 年期间,是什么原因导致男性青少年自杀人数急剧上升,而女性青少年自杀人数虽然增幅较大,但仍明显低于男性?
这些都是真实而紧迫的问题,但我却不知该如何解答。我提出这些问题,是希望大家能在下方评论区分享自己的想法。你们有什么猜想吗?请基于你们对这些时期的任何了解,来畅所欲言地推测。也许你们的推测能为解答这些问题提供线索。如果我们能集思广益,提出一些合情合理的假设,或许我就能在他人的帮助下,找到支持或反驳这些假设的证据。
对于所有关心青少年心理健康的人来说,这些问题都至关重要。
D2. 为什么 1950 年到 1990 年青少年(特别是男孩)自杀率急剧上升?
原文:https://petergray.substack.com/p/d2-why-did-teen-suicides-especially
本文将探讨青少年自杀率大幅上升的相关证据及各种理论,并得出结论:孩子失去了作为孩子应有的自由,这是导致这一严重现象的主要原因。
亲爱的朋友们:
希望您不介意这种亲切的称呼。既然这一系列文章被称为「来信」,我希望以给朋友写信的方式来与您交流。
这是「D」系列的第二封信。一直关注我 Substack 的读者都知道,我目前在写两个系列。主系列主要探讨「玩耍让我们成为人」这个主题,以 # 标记并用数字编号。另一系列则探讨与这一主题关联较远的话题,以 D (题外话)标记并编号。
在上一封信 D1 中,我用表格和手绘图分别展示了 1950 至 2021 年美国青少年自杀率(区分男女)的变化。此次,我要由衷感谢国家玩耍研究所执行董事、我的同事 Tony Christopher,在他的帮助下,我得以呈现更加精美的图表。Tony 具备我所不具备的专业技能,而且非常乐于助人,对此我深表感激。
在D1一文中,我邀请读者在评论区分享任何可能的想法,来解释自杀率(尤其是男孩自杀率)发生重大变化的原因,如图表所示。具体而言,是什么导致了以下三个趋势:(1)1950 年至 1990 年期间自杀率急剧上升,基本上呈线性增长;(2)1990 年至 2002 年期间自杀率急剧下降;(3)大约从 2010 年开始,自杀率再次急剧上升。
我的请求引发了许多富有见地的评论,提出了相当合理的建议。在这篇文章中,我将结合这些观点,探讨关于第一个问题的理论,即 1950 年至 1990 年期间男孩自杀人数大幅上升(以及女孩自杀人数相对较小的增幅)的原因。至于第二个和第三个问题的相关想法,我将在后续文章中讨论。
在深入分析之前,有必要探讨一下男孩和女孩在自杀率上巨大而明显的差异。无论我们考察哪一年的数据,这种性别差异都非常显著且始终存在。
为什么男孩自杀的频率远高于女孩?
自杀率存在显著的性别差异,这一现象不仅存在于青少年群体,也普遍存在于各个年龄段。通常据报告所示,女性自杀未遂的比例高于男性,但男性自杀既遂的比例更高。值得注意的是,自杀问题专家认为「企图自杀」这一说法可能具有误导性。如果一个人「企图自杀」但并未死亡,那究竟是真正的自杀未遂,还是一种求助的信号、一种引人注目的表达方式,本质上传达着「如果现状不改变,我就无法继续活下去」的讯息呢?
正如一些自杀研究者所指出的,如果一个人真的下定决心结束自己的生命,其实并不难做到。使用枪支、上吊,或者在无人能及时发现的地方服用足量毒药,都能达到目的。其中,枪击和上吊是自杀既遂的最常见方式;相比之下,在他人易于发现的场合服用不足量毒药,则是最常见的「企图自杀」手段。
自杀率的性别差异,显然与焦虑、抑郁或绝望感等心理状态的性别差异无关。调查问卷显示,女性报告这些负面情绪的比例一贯高于男性。对这种差异的一种解释是,男性可能比女性更容易获得枪支,而枪击是结束生命最快、最有把握的方式。与这种枪支理论相一致,2020 年的数据显示,在已遂自杀案例中,青年男性使用枪支的比例达到 58%,而青年女性只有 29%。对于女孩和年轻女性,最常采用的自杀方式是窒息(主要是上吊),占比达到 42%;服毒也相对常见(女性为 16%,男性仅为 3%)。
另一个解释或许更具说服力,那就是冲动理论。总的来说,男性比女性更容易冲动,在青少年中表现得尤为明显。这就解释了为什么男孩被诊断为 ADHD(本质上是一种高度冲动的表现)的比例远高于女孩,同时也说明了为什么男孩往往会不经深思熟虑就做出危险行为,比女孩的类似行为要普遍得多。
换一种简单的说法,我们可以这样理解。当一个男孩经历了严重的负面事件,并由此萌生了自杀的念头,他很可能会在冲动下果断付诸行动(尤其是家中有枪的情况下)。而当一个女孩遭遇了类似的不幸,也动过自杀的念头,但她不会冲动行事(即使家里有枪)。相反,她会反复思考这个想法,可能会向亲友倾诉,也可能会寻求心理咨询,又或者会通过服用一定剂量的药物来宣示她渴望改变的强烈需求,虽然看似是一次自杀尝试,但实际上并不致命。与这种「冲动理论」相符合的事实是:无论男女,ADHD 患者的自杀率都远高于常人(Garas & Balazs,2020)。
上一段的论述也为另一种性别差异理论提供了支持,我们可以将其称为自立理论。总的来说,在面对情感需求时,女性比男性更愿意寻求帮助。无论是出于生理因素还是文化因素(很可能两者都有影响),男性更倾向于自己解决问题,即便他们唯一能想到的解决方式就是自杀。
我认为这些理论都有一定的道理。综合起来,它们可以解释自杀率上巨大的性别差异。
是什么原因导致 1950 至 1990 年间自杀人数(尤其是男性)急剧上升?
现在,让我们进入这封信的核心主题。关于 1950 年到 1990 年间青少年自杀率持续显著上升的现象,以下是多种解释理论。我将从一个有着最为充分的证据支持的理论开始。
独立性受限理论
我一直主张,且有充分证据支持的观点是:这几十年间青少年自杀率近乎直线式地显著上升,其主要原因在于儿童和青少年在日渐失去行动的自由,包括追求快乐的自由、培养勇气等品格的自由,这些品格恰恰是他们日后从容面对人生坎坷所不可或缺的(Gray, 2011, 2013;Gray, Lancy, & Bjorklund, 2023)。
历史研究、社会学家多年的报告、流行杂志育儿建议文章的分析,再加上我的切身经历,这一切都清晰地表明:与世纪末相比,20 世纪中叶及更早年代的儿童和青少年享有远远更多的自由,他们可以尽情玩耍、四处探险、结交朋友、勇于尝试,乃至为社区作出有意义的贡献。正是这些活动让年轻人感到快乐,也帮助他们培养起面对逆境时所需的坚韧品格(Gray, Lancy, & Bjorklund, 2023)。他们的自由不是一夜之间消失的,而是日渐式微的。正因为这种变化发生得很缓慢,许多人要么未能觉察,要么即使察觉到了,也因年际变化微小而觉得微乎其微。然而,纵观整个 40 年,变化之巨大,却是翻天覆地、影响深远的。
我们在最新发表于《儿科学杂志》的一篇文章中指出,年轻人独立自主活动(即不受成年人直接管控和监视的活动)的自由度持续下降,是其心理健康状况不断恶化的一大原因。这一观点有多方面的证据和逻辑支撑,详见我与人类学家 David Lancy、发展心理学家 David Bjorklund 合著的文章全文或第 15 期简讯。文中还提到,尽管我目前只关注 1950-1990 年间的情况,但限制年轻人自主权的趋势自 1990 年以来仍在延续。90 年代前后一度出现的自杀率回落,则与另外一些变化有关,我将在下一封信中讨论。
鉴于近几十年来,儿童和青少年越来越多地被「囚禁」在学校和家中,我本想用监禁理论来形容这种自杀率上升的解释,但为了避免流露出对当前教育和管教方式的极度愤慨,我还是「委婉」地称之为独立活动受限理论吧。
虽然自由的减少会让男孩女孩都深受其害,但我们有理由认为,总体而言男孩可能会受到更大的影响。在 D1 的评论区中,读者 Linda Hagge 提出了一个很有见地的观点(经她允许,我在此引用):
「我有一种感觉:自二战以来,男孩的自由正在逐渐受到限制。城市化程度越来越高,监管的目光越来越多,户外活动时间越来越少,诸如此类。我们压制了他们的天性,否认了青春期男孩本该结伴成群、四处游荡、上蹿下跳、惹是生非的进化需求,殊不知这个阶段对男孩的成长至关重要。我们以为是在推进文明进程的东西,实则可能适得其反。」
确实如此。作为一个二战时期出生的人,我亲身经历了我们所讨论的这段历史。事情的发展正如上述所言。不过,读者们还提出了一些其他可能导致自杀率上升的因素,这些我也应当一并提及。
死亡记录方式变化理论
一位读者提出,官方记录死亡方式的改变可能影响了自杀死亡人数的统计。在较早的年代,自杀存在更多社会耻辱,因此为了照顾死者家属的感受,自杀案例更可能被官方记录为意外事故。这种说法有一定道理,但有两点理由反对将其视为变化的主要原因。
首先,在这一时期,自杀率的大幅上升仅发生在青少年和年轻人(20-24 岁)群体中。对于 25-65 岁的成年人,两性自杀率均保持相对稳定, 65 岁以上的人自杀率反而显著下降。因此,如果记录理论成立,就意味着人们有动机篡改年轻人自杀身亡的记录方式,却不会为自己深爱的配偶、父母和祖父母这样做。
另一个反对记录理论的论据是,上吊死亡很难被解释为意外,因此该理论主要只能解释容易被归因为意外的枪击死亡。但是,如果早期确实存在将枪击自杀记录为枪击意外的情况,那么那个年代的枪击意外死亡率应该相对更高。然而,记录并未显示出这种意外死亡率的变化(Cutler et al., 2001)。
家庭持枪理论
这一理论认为,既然大多数自杀都是通过枪支实施的,那么枪支获取难度的降低可能就是一个原因。确实有证据表明,生活在有枪支的家庭中的青少年,其自杀风险是无枪家庭中青少年的四倍(Cutler et al., 2001)。值得一提的是,家庭持枪也增加了家庭成员的所有其他与枪有关的死亡风险,包括意外枪击和他杀。这些事实应该足以让那些认为家中存放枪支是好主意的人三思。
然而,在我们研究的这些年里,美国至少拥有一支枪支的家庭比例非但没有增加,反而有所下降。例如,根据一份报告(链接),家庭枪支拥有率从 1973 年的大约 50% 逐渐下降到 2000 年的大约 30%。因此,「家庭持枪理论」似乎缺乏数据支持。
宗教信仰下降理论
一位读者提出了一个非常合理的建议,即教会参与度的下降可能是原因之一。确实有证据表明,平均而言,去教会的人比不去教会的人更幸福,但这可能更多源于教会活动的社交属性,而非宗教信仰本身。总的来说,人们的社交参与度越高,他们的幸福感就越强。参加教会活动和其他定期社交活动能让人们聚在一起,增进友谊,加强人际联系,获得社会支持,从而降低抑郁风险、减少自杀倾向。
然而,一项关于宗教信仰与自杀关系的系统性综述研究表明,宗教信仰宗教归属能预防自杀的证据既微弱又不一致(Lawrence et al, 2016)。不仅如此,有证据表明,在同性恋群体(他们在自杀者中占比很高)中,那些持有宗教原教旨主义信仰或来自原教旨主义家庭的人,自杀风险反而更高,其原因不言自明(Lytle, 2018)。他们可能认为自己触犯了神的戒律,或是家人基于这种信仰而排斥他们。
家庭结构变迁理论
另一个来自读者的合理观点是,随着时间推移,家庭结构的变迁可能导致了青少年自杀率的上升。确实有证据表明,父母离异的青少年自杀风险有所升高(Cutler et al, 2001)。但据我所知,并没有证据显示他们的风险会高于生活在父母一方长期虐待另一方的家庭(在离婚变得更容易之前更为常见)中的青少年。此外,离婚率在 1979 年达到顶峰后逐渐下降([见此](https://www.cdc.gov/nchs/pressroom/95facts/fs_439s.htm#:~:text=Data highlights&text=The divorce rate had risen,about 4.7 during 1988-93)),但青少年自杀率仍在持续攀升。
尽管在我们讨论的这一时期内,单亲家庭(包括未婚父母)的比例有所上升,但几乎没有证据表明,相比双亲家庭,单亲家庭青少年的自杀率更高(Cutler et al, 2001)。此外,虽然在这一时期,由单亲抚养的家庭在黑人群体中的比例一直高于白人群体,但数十年来,黑人青少年的自杀率却始终远低于白人青少年。不过,有一些证据表明,青少年自杀率与父母在外工作的时间之间存在关联(Cutler et al, 2001),而在讨论的这一时期内,双职工家庭的比例的确有所上升。
结论与最后的思考
通过对这里描述的研究的分析,我得出的结论是,青少年独立性受限是 1950 年至 1990 年期间青少年自杀率上升的主要原因。但同时也有理由认为,其他因素,尤其是父母在家时间的减少,可能在一定程度上加剧了这一趋势。
正如我在文章开头所言,长久以来,我一直坚信,1950 年后青少年焦虑、抑郁和自杀率上升的主要原因,是他们自由玩耍、漫游、与同龄人自由交往以及以其他方式主动参与现实世界的机会受到越来越多的限制。然而,这还是我头一次认真思考 1950 年后可能加剧自杀率上升的其他社会变化。我非常感谢那些在 D1 中留言的朋友们提出的发人深省的见解。现在,我更加确信自由的丧失是罪魁祸首。
青少年自杀率图表中最大的谜团,也是我尚未触及的问题是:是什么导致了 1990 年至 2002 年间自杀率的骤降,以及 2002 年至 2010 年趋于平稳,而后又再度攀升?我必须坦白,在之前的著作中,我忽略了这个谜团,而是聚焦于 1990 年前和 2010 年后鲜明呈现的青少年痛苦加剧、自杀率上升的总体趋势。我曾经满足于将这段异常的下降期视为一个无法解释的反常现象,仅仅是年轻人心理健康持续恶化的整体图景中的一个偶然波动。但如今,我已经无法像从前那样置之不理了。
这或许只是个异常现象,但其幅度之大,绝非随机波动可以解释。如此巨大的反常背后必定有其缘由。1990 年前后,一定有什么发生了变化。那会是什么呢?在即将发布的 D3 信件中,我将分享目前的一些想法和见解。我的几个理论或许会令你大吃一惊。
参考文献
Cutler, D.M., Glaeser, E.L., & Norberg, K.E. (2001). Explaining the rise in youth suicide. Ch 5 in J. Gruber (ed.) Risky behavior among youths: An economic analysis. University of Chicago Press. 2001. (Out of print but available at https://www.nber.org/books-and-chapters/risky-behavior-among-youths-economic-analysis)
Garas, P., & Balazs, J. (2020). Long-term suicide risk of children and adolescents with attention deficit and hyperactivity disorder—a systematic review. Frontiers in Psychology, Vol. 11. Article 557909.
Gray, P. (2011). The decline of play and the rise of psychopathology in childhood and adolescence. American Journal of Play, 3, 443-463.
Gray, P. (2013). Free to learn: why unleashing the instinct to play will make our children happier, more self-reliant, and better students for life. Basic Books.
Gray, P., Lancy, D.F., & Bjorklund, D.F. (2023). Decline in independent activity as a cause of decline in children’s mental wellbeing: summary of the evidence. Journal of Pediatrics 260, 1-8. 2023. Available here.
Lawrence, R.E., Oquendo, M.A., & Stanley, B. (2016). Religion and suicide risk: A systematic review. Archives of Suicide Research, 20, 1-21.
Lytle, M.C., Blosnich, J.R., De Luca, S.M., & Brownson, C. (2018). Association of religiosity with sexual minority suicide ideation and attempt. American Journal of Preventive Medicine, 54 (#5), 644-651.
D3. 为何 1990 至 2005 年期间青少年(尤其是男孩)的自杀率大幅下降?
原文:https://petergray.substack.com/p/d3-why-did-teen-suicides-especially
数字革命——带来了需要掌握的新技术和琳琅满目的电子游戏——是否成为了青少年自杀率下降的原因之一?
亲爱的朋友们:
这是我「D」系列信件的第三篇,探讨的是 1950 年至今青少年(尤其是男孩)自杀率的剧烈变化,具体数据如下图所示。在 D1 中,我展示了这张图表,并请读者对曲线的各个阶段做出分析。在 D2 里,我阐述了男孩自杀率为何远高于女孩,接着讨论了 1950 至 1990 年期间自杀率(特别是男孩)持续急剧攀升的可能原因。
在 D2 中,我探讨了 1950 年到 1990 年间自杀率上升的几种理论解释:死亡记录方式变化理论(即早期的自杀案例往往被记录为意外事故);家庭持枪理论(枪支易得性的提高可能导致自杀率增加);宗教信仰下降理论;家庭结构变迁理论(包括离婚率上升、单亲家庭增多,以及父母在家陪伴时间减少等)。
然而,现有证据表明,这些理论都难以充分解释自杀率的变化。我在文中提出的最有说服力的理论,是「独立性受限理论」。
我在 D2 中的核心论点是,在 1950 年到 1990 年的 40 年间,儿童和青少年逐渐失去了自由玩耍和进行其他独立活动(不受成人管控或监督的活动)的机会。这类活动不仅能给孩子们带来即时的快乐,还能培养他们的勇气、自信心和自主意识,使他们能够从容地应对人生的种种挑战。
在过去的 40 年里,我们越发倾向于「保护」孩子远离可能存在的危险,不断加强对他们的教导和引导,却留给他们越来越少的机会去学习如何自主开展活动、解决问题。久而久之,这就导致了心理学家所说的内部控制点的下降——即一个人感觉能够掌控自己的生活,并在问题出现时有能力加以解决的这种意识。
大量研究表明,任何年龄段的人,如果缺乏强烈的内在控制感,都更容易产生焦虑、抑郁乃至自杀倾向。当人们缺乏机会去学习如何掌控自己的活动、解决自己的问题时,就会产生无助感,这几乎就是焦虑的本质;同时也会产生绝望感,而这几乎就是抑郁的本质。十多年前,我曾在《美国玩耍期刊》上发表过这个理论的早期版本(Gray, 2011)。最近,我又在《儿科期刊》上发表了该理论的更新版本,有多方面的研究证据作为支持(Gray, Lancy, & Bjorklund, 2023)。
现在,我首次提出一个新颖的理论,解释为什么自杀率,尤其是男孩的自杀率,在 1990 年到 2005 年间大幅下降。简而言之,我的理论认为,计算机技术和电子游戏为儿童和青少年重新带来了自由感、兴奋感、掌控感和社交联结感,从而改善了他们的心理健康。
青少年引领数字革命
如果你年纪够大,在大约 1990 年到 2005 年期间当过青少年的父母,你大概还记得当时是你的孩子吵着要家里买台电脑。孩子们总是比成年人更快地接受新事物、掌握新技能,几乎无一例外。(这可能是下一封信的话题了。)当你终于把电脑搬进家门,你的孩子很可能比你先学会了使用它,等到你小心翼翼地想要学习时,还得由你的孩子来教你。哇哦,角色互换了——你的孩子成了大师,你反倒成了学徒。
我记得那时走进百货商店新开设的电脑区,比如西尔斯(还记得西尔斯吗?),发现导购员清一色都是青少年。我还记得,当波士顿学院心理学系终于(姗姗来迟地)跟上潮流开始使用电脑时,我们雇了一位青少年来研究如何使用这些新技术,然后教会我们这些教授。那是在学校配备专业 IT 团队之前的事了。
我想说,曾经确实有那么一段时间,青少年(有时甚至包括年纪更小的孩子)因为在掌握新技术方面表现出的出色能力,以及能够指导我们这些反应迟钝的成年人,而在相当程度上受到重视。这种经历一定提升了孩子们的主观能动性,也减轻了他们的抑郁和绝望感。
大约在 2005 年前后,90 年代的青少年已经长大成人,有些也有了自己的孩子。新一代青少年所处的地位已经与前辈们大不相同。他们的父母已经掌握了电脑技能,百货公司和大学聘请的技术专家也从青少年变成了成年人。随着越来越多的成年人也成为数字原住民,昔日青少年作为「数字原住民」所拥有的独特优势和影响力逐渐消退。青少年不再扮演特殊角色,这或许可以解释为什么抑郁和自杀率重新开始上升(这个话题将在 D4 中详细讨论)。
电子游戏重塑「儿童文化」
研究全球儿童的社会学家和人类学家注意到,无论是在其他文化还是在我们自己的文化中,直到大约半个世纪前,孩子们通常都生活在一种「儿童文化」之中。这种文化的特点是:孩子们可以持续不断地与其他儿童进行社交互动,而不受成年人的过多管控。正是在这样的环境中,他们学会了如何自主开展活动、独立解决问题、制定和遵守规则、与同龄人和睦相处,以及勇敢面对欺凌。简而言之,在儿童文化的沃土上,孩子们习得最终步入成年生活所必需的独立技能。
如果要描述 1950 年到 1990 年间儿童生活发生的变化,那就是在这段时期内,我们整个社会正在逐步摧毁儿童文化——我们将孩子们禁锢在家中,剥夺了他们在户外自由探索和与其他儿童玩耍的自由,让他们越来越多地被动接受成年人安排的活动。(关于儿童文化以及我们是如何几乎将其完全摧毁的更多讨论,请参阅这篇文章。)
顺着这个思路,如果要描述 1990 年前后儿童生活的变化,那就是数字技术在很大程度上重新恢复了儿童文化。尽管由于成年人施加的种种不合理限制,孩子们仍无法在户外尽情冒险和与同伴面对面互动,但他们却能够借助数字科技、尤其是通过电子游戏,在虚拟空间中展开探索并与其他孩子建立联系。
孩子们之所以对电脑如此着迷,原因有很多,但最主要的原因是电子游戏。游戏本身越来越精彩刺激,挑战性越来越强,同时也带来了前所未有的社交体验。游戏机和电脑成为了这一切的基石。一位名叫 Riad Chichani 的作者在一篇探讨游戏发展历程的文章中写道:
「1993年,随着 Pathway to Darkness 的发布,网络多人游戏迎来了真正的繁荣,『LAN 派对』也应运而生。1994 年,Marathon 登陆 Macintosh 平台,多人游戏的热潮再度高涨。而 1996 年,第一人称射击游戏 Quake 的问世则将这股热潮推向了顶峰。与此同时,Windows 95 系统和价格亲民的以太网卡让联网游戏在 Windows PC 上大行其道,多人 LAN 游戏因此愈发流行。」
电子游戏重新将孩子们聚在一起。尽管他们中的大多数仍然不被允许去户外活动,但在室内,游戏却成了联结彼此的纽带。即便是在网络多人游戏尚未普及的早期,电子游戏也已经具备了强烈的社交属性。孩子们常常聚在同一台游戏机前,沉浸在游戏的乐趣中。在学校时,只要有一点空闲时间,他们就会围在一起谈论游戏。电子游戏成为定义新一代儿童文化的共同语言。成年人大都无法理解这些游戏的魅力,很多人甚至对此嗤之以鼻,但这反而让孩子们更加兴奋。这是独属于孩子们的游戏王国,孩子们再一次拥有了自己的世界。
电子游戏的魅力在于满足心理健康的三大基本需求
21 世纪初,研究者们开展了广泛且深入的研究,旨在探究电子游戏为何如此风靡。孩子们从游戏中获得了什么?
一组研究人员(Przybylski, Rigby, & Ryan, 2010)从基本心理需求理论的视角来探讨这一问题。该理论已被数百项针对各年龄段人群的研究所证实,它指出心理健康取决于三大基本心理需求的满足:自主权(自主选择的自由),能力感(在自选任务中感到胜任),以及关系性(与他人建立情感联系)。通过一系列广泛深入的研究,包括用问卷调查、焦点访谈等形式来采访孩子们喜爱游戏的原因,分析热门游戏和失败游戏的差异,以及在实验室让孩子们亲身游玩并汇报游戏前、游戏中和游戏后的感受等,研究者们得出结论:电子游戏之所以广受欢迎,正是因为它们能够极大地满足人们的这三种基本心理需求。
以下是进一步的阐述:
• **自主权。**对于从前鲜少拥有自主权的孩子而言,电子游戏恰似自由的清风,令他们倍感振奋。孩子们可以自行挑选游戏,自主决定玩游戏的方式,无需成年人在一旁指手画脚。随着游戏日渐丰富,游戏内的选择也变得纷繁无穷。每一款游戏都是孩子们自己创造的冒险之旅。
• **能力感。**这些游戏难度很大。研究表明,许多孩子认为游戏的挑战性,以及攻克挑战后获得的掌控感,是他们最主要的动力来源。即使是启动游戏,孩子们也得先弄清楚如何设置、如何掌握操作方法。游戏本身还包含了多重智力挑战。游戏的设计让挑战永无止境,当你尽兴地通过一个关卡,就会进入难度更大的关卡。一位中学生在被问及为何喜欢玩电子游戏时这样说(Olson, 2020):「终于有件事让我觉得自己做对了!」 与电子游戏具有智力挑战这一观点相符的是,大量研究表明:电子游戏能培养认知技能,比如快速且准确决策的能力、分辨重要信息和干扰因素的能力,以及在某种方法行不通时及时调整策略的能力(参见此处和此处)。
• **关系性。**在前文中,我提到游戏如何重塑儿童文化。在问卷调查和小组形式的焦点讨论中,许多孩子表示,结交朋友并保持联系是他们玩游戏的重要动机之一。一些孩子还指出,即便是独自玩的游戏,在不玩的时候也能成为与其他孩子交流的话题。一名中学生解释说:「如果我不玩电子游戏,我都不知道该聊些什么了,因为游戏是一个很好的话题。」另一个孩子说:「你可以问别人『你有游戏机吗?』来开始聊天。如果他说『有』,就接着问『是什么类型的?』」(Olson, 2010.)
但是从长远来看,电子游戏真的能够改善心理健康吗?目前的研究给出了「肯定」的答案。我的 Psychology Today 博客文章总结了部分相关研究成果(点击此处查看)。例如,哥伦比亚大学 Mailman 精神卫生学院开展的一项针对 3000 多名 6 岁到 11 岁儿童的大规模研究发现,与很少或从不玩电子游戏的孩子相比,每周玩游戏超过 5 小时的孩子在智力发展、学业表现、同伴关系等方面都表现出明显优势,同时他们也更少出现心理健康问题(Kovess-Masfety et al., 2016)。
结论与最后的思考
在此,我总结了一些令人信服的理由,说明为什么数字革命,尤其是那些激动人心、富有挑战性和社交吸引力的电子游戏,在 1990 年到 2005 年期间青少年(特别是男孩)心理健康状况的改善和自杀率的下降中功不可没。
我相当确信这是那一时期自杀率下降的主要原因,但可能不是唯一原因。Jack McCain 在十多年前发表的一篇文章中指出,有证据表明当时 SSRI 类抗抑郁药物使用的增加可能也发挥了一定作用。这一观点我或许会在后续文章中进一步探讨。
在下一篇文章中,我将分析图表上抑郁曲线的最后一部分——自 2010 年前后开始,自杀率快速反弹,几乎回到了 1990 年的水平。这是为什么?有人认为智能手机和社交媒体的出现是唯一可能的解释,但我对此有不同看法。
参考文献
Gray, P. (2011). The decline of play and the rise of psychopathology in childhood and adolescence. American Journal of Play, 3, 443-463.
Gray, P., Lancy, D.F., & Bjorklund, D.F. (2023). Decline in independent activity as a cause of decline in children’s mental wellbeing: summary of the evidence. Journal of Pediatrics 260, 1-8. 2023. Available here.
Kovess-Masfety, V., et al (2016) Is time spent playing video games associated with mental health, cognitive and social skills in young children? Social Psychiatry and Psychiatric Epidemiology, 51, 49-357.
J McCain, J.A. (2009). Antidepressants and Suicide in Adolescents and Adults A Public Health Experiment with Unintended Consequences? Pharmacy and therapeutics, 34, 355-378.
Olson, C. K. (2010). Children’s motivation for video game play in the context of normal development. Review of General Psychology, 14, 180-187
Przybylski, A. K., Rigby, C. S., & Ryan, R. M. (2010). A motivational model of video game engagement. Review of General Psychology, 14, 154-166.
D4. 儿童的自由在 1950 至 1990 年间的逐渐丧失,及其多种原因
原文:https://petergray.substack.com/p/d4-the-decline-in-kids-freedom-from
大众眼中孩子的形象是如何从坚强能干转变为脆弱无能的。
亲爱的朋友们:
在本系列的 D2 信中,我提出了 1950 至 1990 年青少年自杀率持续攀升的一大原因,在于同期孩子们参与独立活动的机会日益减少,这些活动不仅关乎他们即时的幸福感,更是培养他们以平和心态面对人生挑战所必需的勇气、自信心和主观能动性的重要途径。
一些在 70 年代还是孩子的读者回忆起,与今天的孩子相比,他们的童年享有多得多的自由与独立。当我指出儿童的自由早在 70 年代之前就已开始渐渐丧失时,这些读者颇感意外。有鉴于此,我想在此回顾 1950 至 1990 年这 40 年间美国儿童生活的历史变迁。以下内容主要基于研究美国儿童生活的变迁史的相关著作,同时我也会举一些自己生活中的例子来加以说明。我出生于 1944 年,正好亲身经历了文中所述的年代。希望你不会觉得我一再提及个人经历显得太过自我。我之所以这样做,只是因为这些都是我最熟悉的第一手资料。(当然,重温往事也颇有趣味。)
在一本关于美国儿童玩耍史的书中,作者 Howard Chudacoff 将 20 世纪上半叶称为「游戏的黄金时代」。彼时,世纪初童工法的实施已基本杜绝儿童血汗工厂的现象;进步主义运动高度重视游戏、创造力和自由的价值;学校为玩耍预留了充裕的时间;课余时,儿童受到公共场所的普遍欢迎。尽管期间经历两次世界大战、大萧条等社会磨难,1900 至 1950 年仍是孩子们的美好时光。他们有大把时光在户外尽情玩耍和探险,与同龄伙伴相伴,鲜少被成年人打扰。
然而,20 世纪 50 年代起,一系列社会变革逐渐剥夺了儿童自主探险的机会,主要包括:电视的出现;由成人组织的儿童体育活动兴起;儿童从事有报酬的工作,或为家庭经济做出实质性贡献的机会减少;以及社会日益强调对儿童进行全天候的监管和保护。下文将逐一展开论述。
电视把孩子们困在了室内。
根据 Chudacoff 的观点,儿童玩耍方式的转折点出现在 20 世纪 50 年代,那时大多数家庭都购置了第一台电视机。电视让孩子们比以往更多地待在室内。电视本质上是被动的——你只是在观看,而并不能参与其中。它是一种娱乐,而非一种游戏。它把孩子们局限在自己的小家庭中,与外部世界隔绝。Chudacoff 特别提到 1955 年开播的「米老鼠俱乐部」电视节目,这档节目在孩子们放学后、吃晚饭前播出,导致许多孩子放学后选择回家看电视,而不是在外与其他孩子一起玩耍。
我对这个节目记忆犹新。1955 年,我 11 岁,家里刚买了第一台电视机。看那个节目确实挤占了我放学后和朋友们一起钓鱼、打球、滑雪或是在池塘上溜冰的时间。(我得承认,就像全国数百万个 11 岁的小男孩一样,我当时也深深爱上了「米老鼠俱乐部」的小明星 Annette Funicello。)
Chudacoff 指出,电视不仅直接减少了孩子们在户外活动的时间,还让商家有机会直接向儿童推销玩具,而这些玩具(包括女孩的芭比娃娃)大多是供室内玩耍的。孩子们不再需要自己寻找或发明玩具,而是可以缠着父母买电视上看到的现成玩具。
成人主导的体育运动开始取代孩子们自发的玩耍活动。
在 20 世纪 50 年代,我醉心于棒球、篮球、橄榄球,以及在明尼苏达州结冰的池塘上打冰球。这些活动从未受成年人的左右,实际上,在我们玩耍的地方,基本看不到大人的身影。所有的比赛都是由聚集在空地、学校操场或池塘边的孩子们自发组织、自行安排的。
小联盟棒球创立于 1939 年,但直到 20 世纪 50 年代中期才开始广泛流行。到了 20 世纪 60 年代,在成人主导下的体育运动项目如雨后春笋般涌现。除了小联盟棒球,还出现了儿童篮球联盟、青少年冰球联盟和 Pop Warner 橄榄球联盟(Friedman, 2013)。父母们对这些活动的热情甚至超过了孩子本身。他们不仅经常开车接送孩子去参加比赛,还会留下来为孩子加油助威。由此可见,成年人逐渐渗入并接管了原本属于儿童的世界。在这个过程中,孩子们从创造者沦为了受摆布的棋子。正如我在 #9 信中所讨论的那样,成人主导的体育活动无法为孩子们提供自行组织活动、独立解决问题的机会,而这些恰恰是儿童自发游戏与生俱来的特质。
我有意避开这一切,因为我更喜欢自由自在的体育游戏,我的父母也很明智地没有给我施加任何压力。直到上了高中加入校篮球队和棒球队,我才首次参加了成人主导的体育活动。但我的许多朋友都陆续加入了这类联赛,这导致能一起自发玩耍的孩子越来越少。
「公共」空间渐渐成了「成年人」的地盘
在上世纪 50 年代初及更早时期,各个年龄段的儿童(大约 5 岁以上)的身影几乎随处可见。他们在街头巷尾、闲置的空地上玩耍,时而也会跑到邻居家的院子里。在商铺、电影院(票价仅需 25 美分)乃至各种公共交通工具上,都能看到无需大人陪同的孩子们。
1948 年,我 4 岁那年与上白班的母亲和祖母一起,居住在明尼阿波利斯一个工薪阶层社区的繁华街道上。我的祖母行动不便,她教会我如何过马路,还时常会派我跑到两个街区外的商店,去帮她买些需要的东西(包括香烟)。那时的我可能比同龄承担这种差事的孩子还要再小一点,但也相差无几。我想,当年小小的我走进烟草店要一包「给奶奶抽的 Kools 香烟」时,大概没人会觉得有何不妥。这些经历至今让我记忆犹新,因为它们给我一种长大成人的感觉。年仅 4 岁的我不再是个依赖他人呵护的幼儿,而是一个能在熙攘的都市街头来去自如、给祖母跑腿的小大人了。这段经历无疑是我成长路上的一剂滋养。
有些大人喜欢看到孩子们在各处玩耍的景象,但其他人却觉得他们是个麻烦。一些人担心孩子的安全,另一些人则对年长的孩子感到不安。孩子们吵闹、淘气,有时甚至彻底地违法乱纪。渐渐地,随着时间的推移,人们常常打着保护儿童的旗号(有时这种做法是合理的),采取各种措施将儿童从公共场所中驱逐出去。保安开始把孩子们赶出商店;成年人一旦认为孩子构成威胁,就会报警;父母被指责管教不力;城市规划者在设计公共区域时不再考虑儿童的需求(Cahill, 1990; Valentine, 1996)。在我们讨论的这 40 年间,类似的变化不断发生,循序渐进。「公众」空间中的「公众」逐渐被界定为「成年人」。儿童逐渐变得只有在成年人的陪同下,才被视为公众的一份子。
儿童从事有报酬的工作和为家庭经济做出实质性贡献的机会减少了。
20 世纪 50 年代,16 岁以下的儿童全职工作通常是非法的;但还有许多兼职工作可以让孩子们赚取零花钱,并有机会向自己和他人证明自己的能力和可靠性。请允许我再次用自身经历来举例说明。
9、10 岁时,我就开始给邻居帮忙以赚取零花钱,夏天修剪草坪(用那种老式手推割草机),冬天则是铲雪。11 岁,我有了份送报纸的工作,一天送两次,早上一趟、下午一趟。13 岁那年,我们搬家到 Duluth,我放学后在一家装订公司打工,负责在城里徒步送货,以及在下班后打扫卫生。从那时起,我就开始为社保缴费,如今每年看自己的社保福利单时,总会想起这段打工的经历。16 岁,我就被 Duluth 市政府聘为救生员。
这些工作经验非常宝贵。不仅因为我有了自己挣的钱,更重要的是,它们让我无需为成年后的生计而担忧。我被委以重任,并被付给相应的报酬。如今,孩子们对自己的未来感到焦虑和迷茫,很大程度上是因为他们几乎没有机会接触和体验职场。到了上世纪七八十年代,即我儿子那一代,我小时候的大多数工作已不再适合同龄孩子,如今适合孩子的工作机会更是一个都不剩了。
正如 Markella Rutherford 在她 2011 年出版的《成人监管必不可少(Adult Supervision Required,)》一书中指出的那样,与几十年前相比,如今的孩子不仅外出工作的机会更少,在家中为家庭做出有意义贡献的机会也减少了。她提到,大约在 1960 年以前,人们理所当然地认为孩子应该分担家务。但从 1960 年前后起,家务变成了一个值得讨论的话题,讨论的侧重点在于什么对孩子有利,而不是什么对家庭有益。人们开始形成这样一种观念:学习才是孩子的本职工作,因此学校作业开始取代家务。
正如一位作家(Zelizer, 1994)所说:「孩子失去了经济价值,却拥有了无限的情感价值。」我敢肯定,在成长过程中感到自己在经济上毫无贡献或在情感上过度珍贵,都不利于孩子的健康成长,更不用说两种感受并存的情况。这会让孩子觉得自己更像一只宠物,而不是一个独立自主的人。
请允许我再次讲述一些我小时候为家里做贡献的例子——除了 4 岁时为祖母买香烟外,我从 8、9 岁起就开始给家里的草坪除草、铲雪。到 10 岁时,我有了一项固定的(对当时的我来说很令人兴奋的)工作,就是在家后面的焚烧炉里烧垃圾。11、12 岁时,家人就放心让我自己粉刷我的房间,后来我还粉刷了家里其他所有的房间。
我 10 到 11 岁时,父母靠经营一家小镇周报维持生计,而当时那样的报纸在全国各地日渐式微。每到周四早上,都要用一台巨大的手动印刷机印制报纸,以便当天午后发行。父母常常通宵忙活,然后让我在周四清晨负责印刷,好让他们能休息一下。这也就意味着,那天上午我必须(实际上是幸运地得以)请假不去上学。
我想,父母难免担心我操作印刷机的安全,毕竟如果送入纸张后没能及时抽手,手可能就会被压得粉碎。但他们想必意识到了,让睡眠充足的我来操作,要比他们熬夜后疲惫不堪地干这活更安全。事实证明他们的判断是对的,这让我感到无比自豪。
如今,除了安全隐患,人们恐怕还会担心我耽误学业。但我记不得当年有谁对此表示过担忧,就连我的老师和校长也不例外。我算不上什么好学生,但也不至于不及格。何况,我做的事和那些 10 岁、11 岁就在农场干活的小伙伴们没什么两样。他们也常常驾驶大型农具,在家里最需要帮手的收获季节也会请假不上学。那时候,学校并非是我们生活的全部。我们现在常常忽视这一点:孩子们都喜欢感觉自己是有用的。
「陌生人威胁」的观念引发了对儿童安全的社会焦虑。
我就简单说明一下这点,因为这是我此前多次写过(e.g., Gray, 2011, 2013)、也是大多数读者都曾亲身经历过的事情。20 世纪 70 年代末至 80 年代初,在一定程度上源于当时两起广受关注的儿童被陌生人绑架谋杀案,父母们开始频繁接触到并逐渐相信这样一种观点,即如果孩子在公共场所没有大人相伴并随时保护,就会面临严重的危险。
基于我前面提到的种种原因,儿童户外活动的时间已经大幅减少,而从 1980 年开始,这一趋势变得更加明显。实际上,那些让家长感到恐慌的暴力犯罪,无论是在当时还是现在都极其罕见;但媒体却对此大肆渲染,导致整个社会都陷入了这种恐惧之中。正如 Rutherford 在她的著作中指出的那样,到了 90 年代中期,如果你哪怕只是让孩子在家门口的街区玩耍,或是在没有大人陪伴的情况下步行几个街区去上学,你就可能被指责为玩忽职守的家长。而在 1980 年之前,这些事情对几乎所有的孩子来说都是再正常不过的。
为了说明这种变化,我们不妨来看一项 2010 年前后在英格兰北部开展的小型研究(Woolley & Griffin, 2015)。在儿童自由度方面,英格兰与美国经历了基本相同的变化历程。研究人员采访了两个家族的祖母和母亲,这两个家族的三代人都居住在谢菲尔德的同一地区。研究者想了解每一代人在 6 到 10 岁时被允许独自外出的距离,以及他们自己的 6 至 10 岁孩子的活动范围。一位祖母(她应该是 20 世纪 50 年代末 60 年代初的孩子)表示,父母对她的活动范围没有任何限制;另一位则回忆说,那时她可以去离家 2 到 3 公里远的地方。到了母亲这一代(她们是 80 年代初的孩子),活动范围大大缩小,最多只能离家 0.5 公里左右。而当代儿童的独立活动空间已完全丧失,没有大人陪同,他们甚至不被允许走出自家大门一步。
结论与最后的思考
根据我所描述的这一系列变迁,在这 40 年间,人们看待孩子的方式发生了巨大的改变。孩子们一度被视为坚强、能干的(尽管常常令人头疼,有时还会行为不端),但渐渐地——不仅在成年人眼中,更令人难过的是在孩子们自己眼中——他们变成了娇贵、脆弱、毫无经济价值的负担。当一个人这样看待自己时,生活就会变得可怕而绝望。难怪在这 40 年里,青少年的焦虑、抑郁和自杀率持续不断地大幅攀升。
正如我在 D3 中所描述的,从 1990 年前后开始,新技术的出现为孩子们带来了新的自我价值感、新的娱乐方式和社交方式,让孩子们的处境得到一定程度上的缓解。得益于此,青少年的焦虑、抑郁和自杀现象在大约 12 年的时间里有所减少。但从 2010 年左右开始,这些问题又再度抬头。在下一封 D 系列的信中,我将就其原因提出一些思考。
参考文献
Cahill, S.E. (1990). Childhood and public life: reaffirming biographical divisions. Social Problems, 37, 390-402.
Chudacoff, H.P. (2007). Children at play: An American history. New York, NY: New York University Press.
Gray, P. (2011). The decline of play and the rise of psychopathology in childhood and adolescence. American Journal of Play, 3, 443-463.
Gray, P. (2013). Free to learn: why unleashing the instinct to play will make our children happier, more self-reliant, and better students for life. Basic Books, 2013.
Friedman, H.L. (2013). When did competitive sports take over American childhood? The Atlantic. Sept. 20, 2013.
Rutherford, M.B. (2011). Adult supervision required: private freedom and public constraints for parents and children. New Brunswick, NJ: Rutgers University Press.
Valentine, G. (1996). Children should be seen and not heard: The production and transgression of adults’ public space. Urban Geography 17, 205-220.
Woolley, H.E. & Griffin, E. (2015). Decreasing experiences of home range, outdoor spaces, activities and companions: changes across three generations in Sheffield in north England. Children's Geographies, 13, 677-691.
Zelizer, V.A. (1994). Pricing the priceless child: the changing social value of children. Basic Books.
D5. 为什么 2008 年至 2019 年青少年自杀率急剧上升?
原文:https://petergray.substack.com/p/d5-why-did-teens-suicides-increased
大量证据表明,《不让一个孩子掉队法案》和《共同核心课程标准》这两个教育政策导致了年轻人焦虑、抑郁和自杀人数的激增。
亲爱的朋友们:
这是我 D 系列信件的第五封,旨在探究 1950 年至今美国青少年自杀率变化背后的原因。请看下图所示的变化趋势:
在 D1 中,我展示了一张折线图,并请读者就图中显示的自杀率变化提出他们的解释。在 D2 中,我重点分析了自杀率的性别差异(男性远高于女性),并提供证据表明,1950 年至 1990 年自杀率的持续攀升,与同一时期儿童自主活动机会的大幅减少密切相关。这类活动不仅能带来即时的快乐,更能培养孩子们面对人生挑战所需的勇气、自信和行动能力,使他们不至于在困境面前束手无策。在 D4 中,我进一步阐述了这一观点,详细描绘了 1950 年至 1990 年间的社会变迁如何逐步剥夺了儿童原本享有的独立与自由。
在 D3 中,我指出,1990 年至 2005 年左右,自杀率出现了一定程度的下降。这在很大程度上得益于计算机技术和电子游戏的兴起和普及,它们为儿童和青少年群体注入了新的自由、激情、掌控感和社交联结感,有效改善了这一人群的整体心理健康状况。
在这封信中,我将阐述并论证一个理论,以解释自杀率曲线最后阶段的变化,即从 2008 年到 2019 年(COVID 大流行前一年)间出现的急剧攀升。
我的理论简而言之就是,在这段时期,学校教育变得比以前带来更大的压力,也更容易损害学生的心理健康。这导致了学生群体中焦虑、抑郁人数和自杀率的上升。教育体系的这种负面变化源于两项政策: 2002 年成为美国法律的「不让一个孩子掉队(NCLB)」法案,以及 2010 年由联邦政府作为 NCLB 的后续措施推出的「共同核心课程标准」。
为支持这一理论,我提供以下证据:(a)NCLB 和共同核心课程标准确实以减少学习乐趣、增加学习压力的方式改变了学校教育;(b)儿童和青少年自己表示,造成他们高度压力和焦虑的主要原因是学校压力,而非其他因素;(c)学生在校期间试图自杀和实际自杀的比率要比不上学时高得多;(d)由 NCLB 和共同核心课程标准引入的学前教育和幼儿园学业训练与测试,对儿童发展造成了长期负面影响。
不让一个孩子掉队法案和共同核心课程标准减少了学校的乐趣,增加了学习的压力。
研究人员在评估「不让一个孩子掉队」和「共同核心课程标准」政策的影响时,无一例外地指出,这些干预措施显著改变了学校教育的本质。它们为大多数学校带来了更加僵化的课程体系和高负担的考试制度。这些考试不仅用于评估学生的学习情况,还被用来评估教师和整个学校系统的绩效。教师不再能够根据学生的兴趣和需求,去自由调整教学方式和内容。他们感到必须以某种特定方式授课,并寄希望于这种教学可以提高标准考试的分数。
由于人们认为,花更多时间反复训练就能取得更好的成绩,许多学校开始缩减乃至取消了课间休息时间,以及音乐、艺术等没有强制性考试的科目。根据疾病控制与预防中心于 2014 年开展的一项调查,美国小学生每天用于课间休息的平均时间(包括与午餐时间相关的任何休息)仅为 26.9 分钟,一些学校甚至完全取消了课间休息。
在美国联邦政府实施这些教育干预措施后,学校教育的变化引发了众多评论。评论家们一致指出,富有创造力和趣味性的教学活动不断减少,而高负担考试的应试训练则成为了备受关注的重点。一位评论员(Will, 2019)直言:「教师们感到教学变得越来越死板,创新的空间被不断压缩。一些教师坦言,对标准化考试成绩和学生数据的过度关注,使得课堂上师生关系的建立变得更加困难。」
另一位评论员(Jarrett, 2019)则表示:「我认为目前的情况令人担忧。尤其是那些高度贫困地区的学校,更是沉闷压抑到了极点。这些学校面临着提高考试成绩的巨大压力,不得不将大量时间花费在『应试技巧训练』等准备活动上。更有甚者,某些学校教师的薪资直接与学生考试成绩挂钩,这迫使教师们为考试而教学,不得不布置大量作业,并期望以此提高学生的分数。」
在调查中,孩子们表示学校是他们痛苦的主要来源。
在人本主义心理治疗中,有一句老话:「想要了解一个人的烦恼,就直接去问他们。」近年来,儿童焦虑和抑郁呈上升趋势。对此,成年人根据自己的猜测提出了各种假设。但如果你直接询问孩子们,就会得到一个出奇一致的答案——困扰他们的,正是学校。以下是我找到的相关全国性系统调查的结果,这些调查都是在实施共同核心课程标准后进行的:
• 皮尤研究中心在 2019 年发布的一项关于青少年自身和同龄人面临压力的调查显示,61% 的受访者认为「在学校取得优异成绩」给他们带来「很大」压力,另有 27% 的人表示这会带来「一些」压力。在青少年的回答中,没有其他原因能达到如此高的比例。
• 哈里斯民意调查在 2023 年发布的一项针对 9-13 岁儿童的调查发现,64% 的孩子提到他们最常见的担忧是学业表现。其他担忧都远不及这一比例。
• 2013 年,美国心理学会开展了一项大规模、具有人口统计学代表性的「美国压力」调查。调查结果显示,在校青少年是全国压力最大的群体。在所有受访青少年中,83% 将学校压力视为主要压力源,69% 认为「考上理想大学或规划高中毕业后的去向」是压力根源,其他因素的比例都远低于这两项。数据还显示,在学校期间接受调查的青少年,有 27% 自述近期承受「极度压力」,而暑假期间这一比例仅为 13%。
国家公共电台 2013 年对青少年和家长的采访和 Facebook 调查,从个人视角印证了上述统计数据,几个案例发人深省:
• 一名高三女生因成绩单未能拿到完美的 4.0 分而心碎欲绝,她母亲感叹:「女儿彻底崩溃了,哭了好几个小时,我简直难以理解她为何如此反应。」
• 在 Facebook 上关于压力的话题讨论中,一位 16 岁孩子倾诉:「今年,我每天约花 12 小时在学业上。现在我因为巨大压力导致身体严重不适,不得不待在家里而没法去学校。由此可见,学业在我的生活中占据了很大一部分!」
• 另一位同学在谈到学业压力时写道:「这个问题基本上被大多数人忽视了。因为人们普遍存在这样一种心态:『你成绩这么好,还有什么可抱怨的?』」这位同学进一步透露,他在初中时就出现了压力症状,到高中时被诊断出患有惊恐障碍和广泛性焦虑障碍。
• 还有一位同学写道:「在这方面,父母是最不通情达理的。我耳边听到的都是『你要努力学习,你这么聪明,我知道你有这个潜力,如果想上大学就得更加用功。』简直让人心力交瘁。」
Suniya Luthar 及其同事的研究进一步证实,学校压力在青少年精神崩溃中扮演着举足轻重的角色。研究表明,在被定义为考试成绩尤其突出、毕业生大量进入名校的「高成就学校」就读的学生,其焦虑、抑郁和自杀企图的比例要远高于普通学校的学生。这类学校的学业压力特别大,学生出现焦虑、抑郁和自杀行为的比例也相当高。如需了解更多有关 Luthar 研究的信息,请参阅我在《今日心理学》上发表的文章此处。
学生承受的压力不仅仅来自于学校繁重的课业,更多地源于外界对他们学习表现的持续评判,以及他们错误地认为自我价值完全取决于在学校的表现。许多学生深信,哪怕仅是一门课考试失利,也会彻底毁掉他们的前程。
学生自杀和自杀未遂的比率在学校放假期间大幅下降。
近年的研究表明,与学校放假时相比,学生在正常上课的月份和周数里,精神崩溃和自杀的比率要高出许多。
Collin Lueck 及其同事(2015)以周为单位,统计了 2009-2012 年洛杉矶一家大型儿童急诊精神健康机构的就诊率。他们发现,总的来说,学校上课期间该机构的精神科急诊率比放假期间高出 118%,换言之,上学期间的急诊量是放假期间的两倍多。这种急诊量的显著下降不仅出现在暑假,也发生在学年其他时段的假期。研究人员还发现,在这期 4 年间,上学期间的急诊率持续上升,而假期期间则保持稳定。这一现象印证了「学校生活的压力逐年增大,而校外生活压力却未见增加」的观点。
Youngran Kim 及其同事(2023)利用一个大型医保数据库,统计了 2016 至 2021 年全美 13-18 岁青少年和 10-12 岁儿童因自杀意念或自杀未遂而急诊住院的月度比率。研究结果如下图所示。可以看出,青少年的急诊率远高于年龄较小的儿童,但这两个年龄组都表现出同一特点:上学期间的自杀相关急诊住院率远高于暑假月份(6、7、8月)。
这个图表中有一个值得关注的现象:与往年不同,2020 年 3 月、4 月和 5 月的入院率大幅下降。在这几个月里,受新冠疫情影响,大多数学校都停课了。一些研究(详见我此前的评论)表明,这段时间学生的整体心理健康状况实际上有所改善。这一发现与某些人先前的悲观预测恰恰相反,他们曾断言封校会对孩子们的心理造成毁灭性打击。事实上,停课期间学生的心理健康状况反而有所改善,这也与其他一些证据相吻合。
一项针对美国国家经济研究局开展的大型研究发现,青少年自杀率与学校教育之间存在紧密关联。研究者 Benjamin Hansen 及其同事(2022 年,原文)逐月跟踪调查了多年来全美青少年自杀状况,结果显示:在校期间青少年自杀率远高于假期。他们进一步对比分析了全国不同县的数据,发现青少年自杀率上升的时间点,与当地学校开学日期高度吻合。在 8 月开学的地区,自杀率从 8 月起飙升;9 月才开学的地区,情况也相应推迟到 9 月。该研究还指出,2020 年 3 月中旬,各地学校因新冠疫情停课,青少年自杀率随即大幅下降,并一直维持在低位,直到新学年学校重新开学才出现反弹。
文章开头的图表清晰反映了这一现象:2019 年至 2020 年间自杀率的短暂下降,正是源于疫情期间学校的关闭。
学前班和幼儿园的学业培训已被证明会造成长期伤害。
要全面认识 NCLB 和共同核心课程标准对儿童心理健康造成的危害,我们还必须思考在这些联邦干预措施影响下,幼儿园和学前教育发生的种种变化。在 NCLB 和共同核心课程标准出台之前,幼儿园主要是让孩子们通过游戏来适应离家生活、学习与同龄人相处的快乐园地。但这两项政策实施后,幼儿园却日渐沦为要求孩子们掌握读写算术技能的场所,而这些能力原本是到一年级才开始学习的(Repko-Erwin, 2017)。如今,许多学前教育机构甚至要求幼童每天投入数小时到「学业」上,并坚信这是为了应对幼儿园的严格要求所必需的!
我时常受邀在学前和幼儿园教师大会上发表演讲,众多与会教师对他们被要求对幼儿在课堂上做的事情表示愤慨和反感。不少优秀教师已经愤而辞去教职。关于教师们对这些变革的反应,我曾在此处和此处专门探讨过。
我找到的所有关于早期学业训练长期影响的研究都表明,其影响效果是负面的。研究人员通过对比实验发现,与游戏式学前班或幼儿园的孩子相比,学业性学前班或幼儿园的孩子到了小学三年级及以后,在社交、情感甚至学业方面都处于劣势。我在此处和此处总结了部分相关研究。
其中最严谨、说服力最强的一项研究聚焦于田纳西州一个面向贫困家庭儿童的学前学业项目。由于报名人数超过名额,研究人员采用随机抽签的方式决定入选者,创造了理想的对照实验条件。范德比尔特大学的科学家跟踪记录了实验组和对照组儿童至六年级的各方面发展状况(Durkin et al.,2022)。
这项研究的主要发现是,到了 6 年级,参加过该项目的儿童在各项指标上的表现都不如未参加者。他们在所有学业成绩测试(包括阅读、数学和科学)的得分都更低。最值得关注的是,与未参加项目的儿童相比,他们在 6 年级时被诊断患有学习障碍的可能性几乎高出一倍。此外,与对照组相比,他们还明显表现出更多的行为问题,包括在学校违反纪律和打架。
我非常怀疑,强迫幼儿接受新的学前班和幼儿园课程,对一些孩子而言很可能是一种创伤性的虐待。这会让他们感到自己是个失败者,在人生真正开始之前就对学校乃至生活的其他方面都丧失热情。如果那些参加了田纳西州学前教育项目的孩子(现已是青少年)比当年留在贫困家庭的儿童更容易产生自杀倾向,我也不会感到惊讶。
结论与最后的思考
强制学校教育,也就是以不符合学生天性的方式强迫他们学习(或装模作样地学习),从来就不利于儿童和青少年的心理健康(Gray, 2013)。然而,由于「不让一个孩子掉队」法案和「共同核心课程标准」)计划所带来的变革,学校在这方面的状况已经明显比从前更加恶化。无论是儿童和青少年自己的反馈,还是他们在学校日程中出现心理崩溃和自杀的时间点,都清楚地表明,学校已然成为美国儿童和青少年心理痛苦的主要根源,哪怕不是唯一的根源。
我们社会中的大多数成年人,很难正视这一结论。他们宁愿将年轻人所承受的痛苦归咎于其他任何事情。我在这封信中提到的研究,几乎从未在大众媒体上被报道。女孩使用社交媒体与焦虑之间的微弱关联,却能获得主流媒体的大幅报道,有时甚至会配上耸人听闻的标题;但当一项研究显示,83% 的青少年将学校压力列为主要困扰来源,远超其他任何原因,或者青少年在校期间的心理崩溃和自杀率约为放假期间的两倍之多时,却基本上不会得到任何报道。
在我们的社会中,似乎存在一种忌讳,不愿承认学校给大多数学生带来精神困扰。学校教育是我们公众强加给年轻人的,因此指责学校教育就等同于指责我们自己,这很难被接受。相比之下,指责那些逐利的社交媒体和游戏公司要容易得多。如果你只关注大众媒体,而不仔细阅读实际的研究文献,你可能会认为新技术是导致年轻人精神困扰的主要原因。在即将发布的一篇文章中,我们将仔细审视那些被大众媒体夸大的研究证据,即社交媒体、智能手机或电子屏幕是导致当今年轻人出现焦虑、抑郁和自杀问题的元凶。敬请关注。
和往常一样,我们欢迎大家在下方评论区留言讨论,提出你们的想法和问题。这将大大增加本文的价值,并可能为未来的文章提供灵感。不过,我们保留删除某些评论的权利,包括那些毫无逻辑、没有证据支持,或措辞明显无礼的评论。
参考文献
Centers for Disease Control and Prevention (2015). School health policies and practices study: 2014 overview. Atlanta, GA: US Department of Health and Human Services.
Durkin, K., Lipsey, M.W., Farran, D.C., & Wiesen, S.E. (2022). Effects of a statewide pre-kindergarten program on children’s achievement and behavior through sixth grade. Developmental Psychology, 58, 470-484.
Gray, P. (2013). Free to learn: Why releasing the instinct to play will make our children happier, more self-reliant, and better students for life. Basic Books.
Jarrett, O. (2019). From playing to play advocacy: An interview with Olga S. Jarrett American Journal of Play, 11, 145-155.
Kim, Y., Krause, T.M., & Lane, S.D. (2023). Trends and seasonality of emergency department visits and hospitalizations for suicidality among children and adolescents in the US from 2016 to 2021 JAMA Network Open, July 19, 2023.
Lueck, C., et al. (2015). Do emergency pediatric psychiatric visits for danger to self or others correspond to times of school attendance? American Journal of Emergency Medicine, 33, 682-684.
Repko-Erwin, M.E. (2017). Was kindergarten left behind? Examining US kindergarten as the new first grade in the wake of No Child Left Behind. Global Education Review, 2, 58-74.
Will, M. (2019). Teaching in 2020 vs. 2010: A look back at the decade. Education Week, Dec. 10, 2019.
D6. 日益增加的数字科技使用能否解释 2008 至 2019 年间青少年自杀率的急剧上升?
原文:https://petergray.substack.com/p/d6-can-increased-use-of-digital-technology
大量研究否定了社交媒体或其他数字科技的使用导致了近期青少年心理健康的下降。
亲爱的朋友们:
首先,我要为上一封信和这一封信之间的延迟道歉。许多项目分散了我的注意力,之后我又花了好几天时间埋头研究有关青少年使用数字科技和社交媒体的文献。这方面有数百项研究和许多系统综述。我想确保自己没有遗漏任何重要内容。
这是我 D 系列信函的第六封,旨在探究 1950 年至今美国青少年自杀率变化的原因,如下图所示。
在 D1 中,我介绍了这张图表,并征询读者对其中所示自杀率变化原因的看法。
在 D2 中,我探讨了青少年自杀率的性别差异(男孩远高于女孩)这一现象,并列举证据指出,1950 至 1990 年间持续攀升的自杀率,源于这一时期儿童从事独立活动的机会持续且大幅萎缩。这些独立活动不仅关乎儿童当下的幸福感,更是培养勇气、树立自信、形成能动意识,进而锻造心理韧性的关键。在 D4 中,我进一步阐述了 1950 至 1990 年间发生的社会变迁,正是这些变迁逐步剥夺了儿童曾经拥有的独立和自由。
在 D3 中,我提出一些理由,认为 1990 至 2005 年左右自杀率出现下降,很大程度上得益于计算机技术和电子游戏的普及。它们为儿童和青少年注入了新的自由感、兴奋感、掌控感和社交体验,从而促进了这一群体的心理健康。
在 D5 中,关于图表中自杀率曲线的最后部分,我总结了证据表明,学业成就压力的增加(至少部分由「不让一个孩子掉队」和「共同核心」政策引起)是该时期青少年自杀率急剧上升的原因之一。我将在未来的信件中进一步阐述这一观点,并回应相关的一些疑问。
这封信我主要想探讨的是当前一种流行的理论,即青少年使用数字技术,特别是智能手机和社交媒体的时间增加,是否是 2008 年至 2019 年间他们心理健康状况下滑、自杀率上升的主因。与绝大多数研究这一问题的行为科学家的观点一致,我得出的结论是,数字技术或许会对年轻人的心理健康产生一些负面影响(也有一些正面作用,我将在下一封信中谈到),但这种负面影响太微弱,也不一致,不足以解释这一时期青少年心理健康水平的断崖式下跌。
目前探究青少年使用数字技术与心理健康之间关系的研究主要分为三类:横断面相关研究、纵向相关研究和随机分配实验。下面我将逐一讨论。
横断面相关研究的发现
通过对已发表的几十项横断面研究的系统梳理和评论,我们可以看到,研究者主要采用问卷调查的方式,收集了一组青少年的数字设备使用时长数据(如总屏幕时间、使用智能手机或社交媒体的时间等),以及他们的焦虑、抑郁等心理健康指标数据,考察两个变量之间是否存在关联。
综合这些研究结果,尽管个别研究的结论不尽相同,部分显示正相关,部分显示负相关,还有部分未发现显著相关,但纵观十余篇独立的综述文章可以发现,总体而言,青少年使用数字技术的时间与他们的心理健康水平之间存在微弱的负相关,无论测量指标是总屏幕时间、使用手机时间还是社交媒体使用时长,这一趋势都较为一致。不过,多数评论者也指出,尽管这种负相关在大样本研究中具有统计学意义,但相关系数本身较小,实际效应可能比较有限。以下是几项主要综述得出的代表性结论:
• Christopher Ferguson 及其同事在 2022 年发表的一项元分析中,综合了 2015 年至 2019 年期间发表的 33 项独立研究,得出以下结论:「总的来说,现有数据并不支持这样一种观点,即接触屏幕媒体(尤其是社交媒体和智能手机)与负面心理健康症状之间存在普遍关联。具体而言,相关研究的效应量低于判断结果是否支持假设的 r = 0.10 的临界值。鉴于该领域存在一些难以避免的方法学局限性,这种微弱的『统计学显著性』更有可能是由于系统性的方法学缺陷,而非真实效应导致的。这一点得到了以下证据的支持:那些采用了恰当控制措施的研究通常比未采用控制措施的研究得出了更低的效应量。」
• Jacqueline Nesi 及其同事在回顾了一系列关于社交媒体使用与自残思想和行为(SITBs)关系的研究后得出结论:「值得注意的是,并没有证据表明社交媒体的使用频率与自残想法和行为之间存在关联。」
• Candice Odgers 和 Michaeline Jensen 于 2020 年发表的一篇综述性文章评论了 2014 年至2019年期间多项关于数字技术总使用量与精神健康指标之间关系的研究。他们得出结论,个别研究得出了一系列经常相互矛盾的结果,包括微弱的正相关、负相关和不相关。 他们还指出,最新、最严谨的大规模预注册研究发现,青少年每天使用数字技术的时间与其幸福感之间存在微弱关联,但这种关联无法区分因果关系。研究人员估计,这种关联可能没有临床或实际意义。
• Amy Orben 和 Andrew Przybylki 在 2019 年发表的另一篇关于数字技术总使用时间与精神健康指标之间关系的综述性文章中总结道:我们发现数字技术使用与青少年幸福感之间存在负相关,但程度很小,最多只能解释幸福感变化的 0.4%。综合考虑数据的大背景,这种影响太微弱,不足以作为政策改变的依据。
• Amy Orben 在 2020 年发表的一篇综述的综述中得出结论:总的来说,数字技术使用,特别是社交媒体的使用,与心理幸福感之间存在负相关,但相关性非常微弱。
• 在另一项针对社交媒体使用的25项综述的整体评估中,Patti Valkenbur 和同事(2022)得出结论:「大多数综述认为,社交媒体使用与心理健康之间的相关性『微弱』或『不一致』。」
纵向相关研究的发现
横断面研究能够揭示数字技术使用与心理健康指标之间的正向或负向相关性,但无法确定因果关系的方向。举例而言,社交媒体使用与抑郁之间的微弱相关,可能意味着社交媒体使用导致抑郁程度略有增加,也可能是抑郁导致社交媒体使用略有增加(或许是一种应对抑郁的方式),还可能两者都是由某个第三种(未知)因素所导致。
尝试确定因果关系方向的一种方法是开展纵向相关研究。在此类研究中,研究人员在两个或多个时间点评估参与者的社交媒体使用和心理健康状况。如果在时间点 1 高度使用社交媒体,而在时间点 2 心理健康状况下降,就表明社交媒体使用可能是导致心理健康恶化的原因。反之,如果在时间点 1 心理健康状况不佳,而在时间点 2 社交媒体使用增加,则表明心理健康状况欠佳可能是社交媒体使用增加的原因。
Abigail Bradly 和 Andrea Howard(2023)以 187 名大学生为研究对象所做的一项研究就是一个典型案例。在连续 12 周的时间里,学生们每周提交一次手机「屏幕使用时间」的截屏,同时完成压力和情绪状态的问卷调查。研究结果显示,不论从哪个角度分析,智能手机使用时间与被试者的情绪状态之间都不存在显著的相关性。某一周智能手机使用时间较长,并不意味着周末会出现消极情绪;同样,压力水平较高,也不会导致智能手机使用时间的增加。研究者由此得出结论:「我们的研究佐证了学界日渐形成的共识——智能手机使用时长很难反映年轻人的心理健康状况。」
另一项时间跨度更长的研究由 Silje Stensbekk 等人(2023)完成,研究对象是 180 名年龄在 10 至 16 岁之间的青少年。在两年的时间内,对每个受试者的焦虑、抑郁以及社交媒体使用的数量和类型进行了四次评估。结果表明,无论男女,社交媒体使用的各项指标与焦虑抑郁程度之间都不存在显著的因果关系。社交媒体使用情况无法预测未来是否会出现抑郁或焦虑症状;反过来,抑郁或焦虑程度也无法预测未来社交媒体的使用情况。
这只是已发表的众多纵向研究中的两项。Samantha Tang 及其同事(2021)在一篇相关综述中得出结论:这些研究表明,屏幕时间对年轻人的影响微乎其微,几乎可以忽略不计。研究人员在结论中写道:「在媒体报道、社区讨论和政治话语中,我们经常听到有关屏幕时间对年轻人幸福感负面影响的言论。但本文综述表明,这些论调可能并不能准确反映现有的科学文献结果。实际测得的影响大小从小到微不足道。屏幕时间的增加对近年来年轻人心理健康问题上升的影响程度,其实是可以忽略不计的。」
随机分配实验研究的发现
随机分配实验通常被视为研究因果关系的「黄金标准」。但我要指出,用这一方法研究社交媒体的影响,是存在严重缺陷的。
如今,很多实验都以大学生为受试者,将他们随机分为实验组和对照组。研究人员要求实验组在特定时期内减少使用数字技术(或其某些功能),而对照组则无需任何限制。如果实验结束后,实验组的心理健康水平相较对照组有所提升,就可以视为技术使用会抑制心理健康的佐证。
这些研究呈现出的结果喜忧参半,与相关性研究非常类似。最能说明减少社交媒体使用价值的例子,可能是 Manuela Faulhaber 及其同事(2023 年)对 230 名大学本科生开展的一项研究。学生们被随机分配到两组,一组要将社交媒体使用时间限制在每天 30 分钟,另一组则在两周内正常使用社交媒体。两周后,限制了社交媒体使用的学生在自我报告的焦虑、抑郁和孤独感方面出现了统计学意义上的显著降低。
从表面上看,这项研究似乎很好地证明了减少社交媒体使用有益于心理健康。然而,我必须指出,所有此类实验都存在两个根本性问题——这些问题实际上否定了这一研究方法的价值。
社交媒体对心理健康影响研究中的一大难题是「安慰剂效应」。无数研究表明,当人们采取任何自认为可以减轻焦虑或抑郁的措施时,无论是行为干预还是药物治疗,这些措施在短期内确实能起到缓解作用。这使得我们很难证实治疗焦虑或抑郁的药物是否真正有效,因为安慰剂组的效果往往非常显著,药物组难以展现出更优的疗效。我们可以合理地推测,社交媒体实验的受试者自愿参与,很可能是因为他们了解到,社会上普遍认为社交媒体会对心理健康造成负面影响。与药物研究不同的是,药物研究可以向受试者隐瞒分组信息,但在技术研究中,受试者通常清楚自己所处的组别。因此,没有办法证明减少社交媒体的效果不仅仅是安慰剂效应。
第二个问题被研究人员称为「需求效应」。在研究实验中,受试者往往能准确猜测实验假设,并有意或无意地努力去证实这个假设。(我相信也有一些特立独行的人会努力推翻假设,但大量研究表明这类人属于少数。)在有关减少社交媒体使用的实验中,实验假设通常非常明显。我们很难找到有效的方法来规避需求效应的影响,尤其是在以大学生为受试者、本校教授为研究者的典型实验中,这种效应可能格外明显。
我发现,那些随机分组的实验都没有很好地解释或提及安慰剂效应和需求效应。在我看来,这使得相关实验的结果变得缺乏说服力。然而,即便受到安慰剂效应和需求效应的影响,这类实验的结果仍然喜忧参半,要么没有显著效果,要么效果十分有限(参见 Orben 在 2020 年的综述)。
结论与进一步思考
我通过深入研究屏幕、智能手机和社交媒体的影响得出个人结论:研究在一个方面已经相当明确,即这些都不是导致近期青少年自杀率(或其他精神健康问题指标)大幅上升的原因。部分研究发现的微小影响被媒体放大,加剧了公众的偏见。研究人员应及时向大众清晰传达这些发现。禁止孩子们使用智能手机或社交媒体,并不能从根本上扭转他们目前高焦虑、抑郁和自杀的比率。
然而,整体上缺乏显著影响,并不意味着青少年使用社交媒体就没有问题(我们其他人也一样)。社交媒体利弊并存,可能因人而异地体现。我的下一篇文章将从定性角度探讨青少年使用社交媒体和数字技术的多种方式、他们从中受益的途径,以及某些使用方式可能带来的危害。我建议与其剥夺年轻人使用智能手机和社交媒体的机会,不如与他们共同商讨使用守则。
遗憾的是,近来每当认为存在危险,社会的本能反应就是剥夺年轻人的自由,而非教导他们如何保障安全。我们已经在户外活动中这样做了。数十年前,我们曾教导孩子们如何在户外确保安全——如何过马路,如果陌生人让你上车该如何应对等。而现在,我们直接禁止他们外出,导致他们只能借助社交媒体在没有成年人干预的情况下与伙伴交流。目前,一些人呼吁禁止年轻人使用社交媒体,这无异于切断了他们在没有成年人监管和控制下与同龄人联系的所有渠道。请不要让我们走上那条道路。
参考文献
Bradley, A.H., & Howard, A.L. (2023). Stress and Mood Associations With Smartphone Use in University Students: A 12-Week Longitudinal Study. Clinical Psychological Science 11, 921–941
Ferguson, C.J., Kaye, L.K., et al. (2022). Like this meta-analysis: Screen media and mental health. Professional Psychology: Research and Practice, 53, 205–214.
Faulhaber, M.E., Lee, J.E., & Gentile, D.A. (2023). The Effect of Self-Monitoring Limited Social Media Use on Psychological Well-Being. Technology, Mind, and Behavior https://doi.org/10.1037/tmb0000111
Nesi, J. et al., (2021). Social media use and self-injurious thoughts and behaviors: A systematic review and meta-analysis. Clinical Psychology Review, 87.
Odgers. C.L., & Jensen, M.R. (2020). Annual Research Review: Adolescent mental health in the digital age: facts, fears, and future directions. Journal of Child Psychology and Psychiatry, 61, 336-384.
Orben, A. (2020). Teenagers, screens and social media: a narrative review of reviews and key studies. Social Psychiatry and Psychiatric Epidemiology, 55, 407–414
Orben, A., & Przybylski, A.K. (2019). The association between adolescent well-being and digital technology use. Nature Human Behaviour, 3, 173–182.
Steinsbekk, S., Nesi, J., & Wichstrøm, L. (2023). Social media behaviors and symptoms of anxiety and depression. A four-wave cohort study from age 10–16 years. Computers in Human Behavior 147, 107859
Tang, S., Werner-Seidler, A., et al. (2021). The relationship between screen time and mental health in young people: A systematic review of longitudinal studies. Clinical Psychology Review 86, 102021
Valkenburg, P., Meier, A., & Beyens, I. (2022). Social media use and its impact on adolescent mental health: An umbrella review of the evidence. Current Opinion in Psychology, 44, 58–68.
D7. 青少年使用社交媒体的益处、挑战及应对策略
原文:https://petergray.substack.com/p/benefits-and-challenges-of-social
青少年从社交媒体中获得了什么? 如何将负面影响降到最低?
亲爱的朋友们:
这是我关于青少年使用社交媒体这一争议性话题的两封信中的第二封。一些研究人员发现,社交媒体的使用与青少年(尤其是女孩)的心理健康指标之间存在负相关关系。基于这一发现,一些人提出应该限制青少年使用社交媒体的建议。这些报告促使我投入大量时间,深入钻研有关青少年社交媒体使用与心理健康的相关文献。
在我的上一封信(D6)中,我重点探讨了一系列旨在确定青少年花在社交媒体上的时间与其心理健康指标之间是否存在整体相关性的研究综述。几乎所有的综述都得出一个普遍结论:总的来说,研究表明社交媒体使用与青少年心理健康之间存在非常微弱的负相关。然而,研究者们一致指出,这种影响无论是对男孩、女孩还是对两者整体而言都太过微弱,不足以解释青少年心理健康水平差异的主要成因。此外,研究人员经常提到,所观察到的负相关都可能是因为抑郁或焦虑导致了更多的社交媒体使用(这可能是一种缓解心理压力的方式),而非因果倒置。在 D6 中,我还回顾了那些试图通过纵向研究和实验来确定相关性因果方向的研究,最终得出结论:目前还没有任何研究能够提供确凿证据,证明社交媒体使用会导致青少年心理健康状况的恶化。
在今天的来信中,我想重点探讨两个问题:一是青少年自己如何看待使用社交媒体这件事,二是社交媒体对青少年即时情绪影响的相关研究。青少年为何在社交媒体上投入如此之多的时间?他们从中有何收获?在他们看来,社交媒体给心理健康带来了哪些正面和负面影响?在社交媒体使用对心理健康的影响方面,青少年之间存在哪些个体差异?最后,青少年(乃至我们所有人)可以采取哪些防范措施,才能安全地使用社交媒体,最大限度地降低乃至规避相关风险?
青少年为何在社交媒体上花费大量时间?
长久以来,青少年总是喜欢聚集在各种公共场所。在那里,他们可以与朋友聚会、闲谈,认识新朋友,并有机会在远离父母和其他大人的地方,与同龄人畅谈他们关心的种种话题。这种现象跨越了文化和时间的界限,似乎已经成为青少年成长过程中不可或缺的一部分。
然而,近几十年来,青少年乃至更小的孩子们逐渐被剥夺了在外面与同龄人自由聚会的机会,他们也越来越难以摆脱成年人的直接监管和干预。一方面,他们的时间更多地被成年人安排的活动占据;另一方面,当他们想要离开家与同伴相处时,不仅要面对过分担忧的父母的限制,还要应对购物中心等场所保安人员日益严格的管控,而这些地方在过去几十年里一直是青少年们聚会的热门场所。(我在 D4 中描述了导致这种变化的各种因素。)
在此情况下,社交媒体无疑成了他们的救命稻草。它为青少年提供了另一种保持联系的途径。通过智能手机,即便无法面对面地聚在一起,他们也可以分享内心的想法和感受。哪怕成人安排的活动占据了大量时间,他们也能利用零碎时间进行交流。如今,网络空间已然成为青少年新的公共场所。倘若剥夺了这一领地,他们将无处可去——也就无法进行青少年在成长过程中一直渴求和需要的那种热烈而私密(屏蔽了成年人)的交流。
在社交媒体时代初期,即大约十多年前,danah boyd(她的名字全用小写)进行了一项深入探讨青少年为何频繁使用社交媒体的研究。这是我发现的第一个针对这一问题的深入研究,后来以书的形式发表(boyd, 2014)。boyd 采访了来自全美各地不同族裔的 166 名青少年。当被问及频繁使用社交媒体的原因时,他们普遍表示是为了与朋友保持联系。而当被问到为何不与朋友面对面聚会,而要通过互联网交流时,他们往往回答说其实更想当面聊天,但受制于时间不够充足、行动也不够自由,所以很少有机会那样做。
这些青少年还表示,对他们而言,在远离父母等权威人士监视的环境中与同龄人交流至关重要。正如 boyd 所言,「他们渴望能不受那些『管东管西』的人打扰……他们想要避开那些家长式的大人,那些人总以安全和保护为由,监视他们的日常社交。」此外,boyd 还写道,「2012 年,当我问那些较早使用 Twitter、Tumblr 和 Instagram 的青少年,为何青睐这些社交平台多过 Facebook 时,得到了几乎一致的回答:『因为我爸妈还不知道这些平台的存在。』」
最新研究表明,青少年使用社交媒体的主要目的仍是与朋友保持联系。在皮尤研究中心的一项研究中(Anderson & Jiang, 2018),研究人员询问了 743 名 13 至 17 岁的青少年,为什么选择使用社交媒体而不是与朋友面对面地相聚。41% 的受访者表示,他们的日程安排太满(太多安排好的活动),抽不出时间与朋友外出聚会。此外,34% 的人表示他们的朋友也因自身事务而抽不开身,32% 的人提到交通不便,33% 的人则指出在网上联络朋友比安排线下见面更加方便。
青少年眼中社交媒体的利与弊
非营利组织 Common Sense (Nesi, Mann, & Robb, 2023) 近期开展的一项大规模研究重点关注了 11 至 15 岁的女孩群体,因为有观点认为这一年龄段的女孩最易受到社交媒体潜在的负面影响。该项调查覆盖了 1300 多名女孩。
在其中一组调查中,研究人员询问女孩们使用各类社交媒体平台对情绪的影响主要是积极、消极还是中性的。调查结果显示,对于每个平台,认为影响是积极的女孩都多于认为影响是消极的。以 TikTok 为例,43% 的女孩认为其影响是积极的,26% 认为是消极的,其余则认为是中性的。Instagram 的数据是 38% 积极、19% 消极;Snapchat 是 32% 积极、26% 消极;对于即时通讯应用,有 50% 的女孩认为是积极影响,10% 认为是消极影响;YouTube 则有 65% 的女孩觉得影响是积极的,仅 5% 认为是消极的。
在另一组问题中,研究人员询问女孩们,如果无法使用特定社交媒体平台,她们的生活质量是会变好、变差还是保持不变。结果显示,对于所有平台,认为失去它会让生活变得更糟的女孩,都远多于认为生活会变好的,不过也有相当一部分人觉得不会有什么区别。例如,仅 9% 的女孩认为没有即时通讯应用会让生活更美好,而 43% 的人则认为生活会变得更糟;当被问及 TikTok 的影响时,16% 的人觉得没有它生活会更好,但持相反看法的占 34% 。
总的来说,在使用社交媒体的女孩中,认为它有益身心健康的比例远高于认为它有害的。
在青少年看来,社交媒体为何能提升他们的幸福感?在此前提及的 Pew 研究中(Anderson & Jiang, 2018),81% 的青少年表示,社交媒体让他们能更好地了解朋友们的生活,约三分之二的人认为,这种交流让他们相信困境中总有人支持自己。与之一致的是,71% 的人觉得社交媒体给他们带来归属感,而仅 25% 的人感到被排斥;同样地,69% 的人表示社交媒体让他们更自信,而只有 26% 的人因此感到不安全。这些结果都印证了这个观点:青少年通过社交媒体获得社会支持。
至于社交媒体潜在的负面影响,Pew 研究发现,许多青少年偶尔会感到压力,觉得自己只能发布那些能展现良好形象的内容(43%),或者能吸引大量点赞和评论的帖子(37%)。不仅如此,45% 的人坦言,他们有时会被人际交往中的狗血桥段淹没,其中相当一部分人表示,正是因为看不惯太多闹剧,才在网上屏蔽了一些人。
Pew 研究中心的学者在分析数据时,分别考虑了性别和年龄(13 至 17 岁)的因素,结果发现不同性别和年龄段的青少年对社交媒体的看法大致相同,并无明显差异。研究还发现,当代青少年很少发布「自拍」,这一点与十多年前的情况形成了鲜明对比。自拍发布量的下降或许可以解释,为什么近期研究显示,社交媒体给青少年带来的容貌焦虑较之过去有所缓解。
采用经验取样法研究社交媒体对情绪的影响
要想了解社交媒体使用对青少年情绪的即时影响,一个思路是在不同时间点向他们发送信号,让他们报告收到信号前的一段时间内(通常是一小时)社交媒体的使用情况和当下的心情。
Ine Beyens 及其同事(2020)在一项此类研究中试图验证一个假设,即被动地使用社交媒体(只浏览而不发布内容)可能会对情绪产生负面影响。这一假设的理论基础在于,当人们只是刷刷别人的动态时,往往会感到自己被排斥在社交圈之外,并对他人的精彩生活心生羡慕。
研究结果并不支持上述假设。事实上,研究人员发现,在多轮抽样调查中,平均有 46% 的青少年在被动浏览社交媒体后感到心情更愉悦,只有 10% 的人感到情绪更差。其余的人总体上感受不到情绪好坏的变化。另一项研究(Valkenburg et al., 2021)也得出了非常类似的结论——同样表明只有一小部分青少年在被动浏览社交媒体后情绪变糟;大多数人要么感到心情更好,要么没有受到影响。Beyens 和同事还发现,与其他研究结果一致,主动使用社交媒体,例如在社交平台上发送消息、发帖或分享内容,会持续提升青少年的幸福感。
Jessica Hamilton 及其同事(2021)的一项研究对患有抑郁和自杀倾向的青少年进行了调查,以检验社交媒体是否会对这一群体产生更大的负面影响。研究者招募了 100 名正在参加抑郁和自杀倾向密集门诊治疗项目的青少年。在为期一个月的研究中,这些青少年每周到诊所就诊时,都会报告他们过去一周的社交媒体使用情况,同时接受抑郁症状和自杀意念的评估。研究结果出人意料:使用社交媒体频率较高的青少年,在心理健康方面反而表现出更大的改善——其抑郁症状和自杀念头都有所缓解,这一效果优于那些很少使用或完全不使用社交媒体的青少年。由此,研究者得出结论:「对于自杀高危青少年而言,使用社交媒体可能意味着一种适应性的、有益心理健康的社会参与方式。」
Stephanie Fredrick 及其同事(2022)开展的另一项为期两年的追踪研究,以 800 名 13-15 岁青少年为样本,分四个时间点评估他们的社交媒体使用情况和抑郁水平。研究结果虽然比较复杂,但有一点非常引人注目:与男孩相比,女孩更频繁、更主动地使用社交媒体,却表现出更低的抑郁水平。这一发现与「社交媒体尤其损害女孩心理健康」的观点恰恰相反。在这项研究中,社交媒体似乎给女孩带来了更多益处。
明智使用社交媒体的建议
总的来说,研究表明青少年从社交媒体中获得的收益远远大于损失。尽管网络空间不如现实世界那么理想,但在当今青少年难以面对面聚会的时代,使用社交媒体总比毫无交流要好得多。青少年自己也表示,如果没有社交媒体,他们的心理健康状况会更加糟糕。在我看来,他们的观点显然是正确的。我们应该努力改变现状,创造条件让青少年有更多机会在现实生活中相聚,但就目前而言,剥夺他们使用社交媒体的权利是残忍且不人道的。
然而,正如青少年自己所承认的那样,使用社交媒体也可能带来一些负面影响。我认为,给所有青少年——当然也包括成年人——开设一门有关如何安全使用社交媒体的短期课程是个不错的主意。我虽不是设计此类课程的专家,但以下是我想到的一些注意事项。
时间管理
被问及这个问题时,青少年经常承认自己有时会在社交媒体上花费超出预期的时间。他们承认自己常常被社交媒体深深吸引,完全沉浸其中,以至于忽略了时间的流逝。这可能会对他们造成伤害,因为过度使用社交媒体占用了他们本可以投入到其他活动中的宝贵时间。
在当今时代,智能手机已然成为我们所有人(而不仅仅只是青少年)生活中不可或缺的一部分。来自手机的消息提示总是时刻诱惑着我们去查看,一旦开始回复消息,就很难抽身而退。正是这种现象,让一些人将其称为「手机上瘾」,但我很不赞同在此情境下使用「上瘾」一词。因为它暗示这是一种病态,而非正常现象。
我们所有人(尤其是青少年)都喜欢与他人交流,也自然会对下一条信息的内容充满好奇。我(和 boyd 一样)更愿意将其定义为时间管理问题,而非上瘾。所谓「上瘾」听起来很难戒除,但「时间管理」却是每个人只要愿意就能够掌控的事情。在社交媒体上花费大量时间无可厚非,但可能会占用原本可以用于其他更有意义的事情的时间。
对大多数人而言,包括青少年在内,适度限制使用智能手机不失为一个好办法。你可以有意识地规划手机开关机的时段。比如,一家人共进晚餐时,所有人都应该关机,放下手机,专注于面对面的交流。同样,当你与家人以外的朋友相聚时,也应该关闭手机,全身心投入到真实的社交互动中,不被手机分心。
事实上,在睡觉时间把手机放到另一个房间是个好主意。熬夜玩手机或被手机铃声吵醒,是智能手机能带来的最糟糕的影响之一。
除了睡觉时间,我们可能还有其他想要关机的时候。比如,当我在写一些重要的东西时,我会关掉手机,因为我讨厌被打扰。每个人都可以根据自己的情况,决定哪些活动是不容被干扰的,并在那些时候把手机关了。青少年可能担心,如果不立即回消息,朋友会认为自己不在乎他们。但这个后果可以通过事先给朋友发这样的消息来避免:「请你务必知道,有时我会关机。如果那时你给我发消息,我会晚点再回你。如果你想要我立刻回应,请在__点到__点之间联系我,那时我很可能开着手机。」
网络霸凌和社交闹剧
在 boyd 对青少年的采访中,她发现他们并不认为网络霸凌像成年人想象的那么严重。在他们看来,学校里当面的霸凌才是更大的问题。在网上,你可以直接屏蔽骚扰你的人;但在学校走廊被霸凌者堵住时,就没那么容易脱身了。这一点值得我们思考。如果真的有人在网上骚扰你,最好的办法是不予理睬。把时间花在与朋友相处上,而不是与霸凌者纠缠。与他们打交道不会有任何好处。
然而,boyd 也发现,成年人口中的所谓「霸凌」,并非全是真正的霸凌行为。有些只是青少年之间的拌嘴,虽然可能粗鄙冒犯,但并非出于恶意;还有一些则是夸大其词、甚至故意装腔作势的抱怨,青少年们称之为「戏剧性」。一些青少年乐在其中,喜欢制造或挑起这种闹剧,但也有人并不喜欢。对于后者而言,最明智的做法是远离那些挑事者,Pew 研究中心的调查显示,许多青少年正是这么做的。
隐私
Boyd 等人指出,青少年使用社交媒体,某种程度上是为了避开父母和其他成年人的干涉(虽然多出于好意),让彼此之间能够私下交流。但他们有时会忘记,在网上发给朋友的内容可能会以某种方式公开传播。我们应该区分公共平台和私人平台,但要谨记,即便是私人平台上的消息也可能会公之于众。给大家一个忠告:不要在网上发布任何你不想让未来潜在雇主看到的内容。
总结与思考
纵观历史,每当一种新的交流方式出现——从文字、纸质印刷品、广播、电视、电脑再到互联网——我们都会经历一定程度的成长之痛。新一代往往倾向于接受新事物,而老一辈则持怀疑态度,认为这会毁掉下一代。让我们试着避免这种情况。让我们倾听孩子们的心声,不要根据我们的偏见来评判他们。一些成年人对孩子们在社交媒体上与其他孩子共同消磨的时间感到震惊,但是,正如一些具有进化型思维的学者所指出的(Katiyar et al., 2023),过去的孩子们通常每天花很多个小时——甚至往往是一整天——与其他孩子待在一起。他们现在仍然这样做,只是由于我们的限制,这种交往从面对面变成了在社交媒体上进行。
好了,就这样。我已经写完了关于社交媒体的内容,除非你还有一些想让我回答的问题。在我的下一篇 D 系列的帖子中,我打算展开我在 D5 中介绍的观点,即自 2008 年左右以来,青少年的焦虑、抑郁和自杀率急剧上升,在很大程度上是由于学业表现压力增加和对未来的恐惧加剧造成的。敬请关注。
参考文献
Anderson, M., & Jiang, J. (2018). Teens’ Social Media Habits and Experiences Pew Research Center, November, 2018.
Beyens, I., et al., (2020). The effect of social media on well‐being differs from adolescent to adolescent. Nature Research Scientific Reports. | https://doi.org/10.1038/s41598-020-67727-7.
boyd, d.(2014). It’s complicated: The social lives of networked teens. Yale University Press.
Hamilton, J.L. et al. (2021). Social media use and prospective suicidal thoughts and behaviors among adolescents at high risk for suicide. Suicide Life Threat Behav. 51, 1203–1212.
Nesi, J., Mann, S., & Robb, M. (2023). Teens and mental health: How girls really feel about social media. San Francisco, CA: Common Sense.
Katiyar, T., et al. (2023). An antidote to overpathologizing computer-mediated communication: An evolutionary perspective on mixed effects of mismatch. Pre-Print available at https://osf.io/preprints/psyarxiv/t4azn/.
Valkenburg, P.M., et al, (2021). Social media browsing and adolescent well-being: challenging the “passive social media use hypothesis.” Journal of Computer-Mediated Communication 00, 1–19.
D8. 2008 年以来青少年自杀率上升的多种原因
原文:https://petergray.substack.com/p/d8-multiple-causes-of-increase-in
学校压力,成就压力,对未来的恐惧,习得性无助,以及关于「创伤」的自我实现的预言可能是青少年自杀率上升的基础。
亲爱的朋友们:
这是我探索美国青少年自杀率变化原因的系列信件的第八封,也可能是最后一封。下方的图表展示了 1950 年至今青少年自杀率的变化情况。
在 D1 中,我介绍了这张图表,并征询读者对图示自杀率先升后降再升趋势背后原因的看法。D2 探讨了自杀率的性别差异(男孩远高于女孩)问题,并指出 1950 年至 1990 年自杀率持续上升的原因在于,儿童从事独立活动的机会不断减少,而这类活动对他们当下的幸福感和勇气、自信及自主面对生活挑战的培养至关重要。D4 进一步阐释了这一观点,描述了 1950 年至 1990 年间的社会变迁如何逐步剥夺了儿童此前数十年来享有的独立性和自由度。
在 D3 中,我有理由相信,1990 年到 2005 年左右青少年自杀率的下降,至少部分归功于计算机技术和电子游戏的普及。它们为孩子们的生活带来了久违的自由感、兴奋感、掌控感和社交归属感,从而改善了他们的心理健康状况。在 D5 中,我给出了有力的论据,认为 2008 年至 2019 年(新冠疫情前一年)青少年自杀率的急剧攀升,至少部分源于美国「不让一个孩子掉队」(NCLB,旨在提高学业成绩)和「共同核心」(Common Core,旨在统一教学标准)两项教育政策所导致的学业压力骤增。在 D6 和 D7 中,我列举了诸多研究证据,反驳了一种流行观点——2008 年后青少年自杀率上升的主要原因是过度使用数字技术,尤其是沉溺于智能手机和社交媒体。
在本文中,我力图就 2008 年前后青少年自杀率和心理健康问题普遍増加这一现象,提供一个更加综合全面的社会影响因素分析。我将进一步印证在 D5 中提出的「学校压力假说」,同时也会将其置于更广泛的社会变迁背景下进行审视。这些社会变化或许加剧了年轻一代对未来的恐惧感,并日渐滋生出一种无力感和绝望情绪。
2008 年后青少年自杀率上升的现象,并未在欧洲国家出现。
关于反驳「智能手机和社交媒体是造成青少年自杀率上升主因」这一假说,我在前几封信中没有提及的一个证据是,尽管全球各地青少年普遍拥有智能手机并使用社交媒体,但其他国家青少年的自杀率并未像美国那样出现增长。仅以德国为例,德国青少年智能手机普及率的提高与美国相当(参见此处),但这些年德国青少年的自杀率并未上升。事实上,将欧盟 27 国作为一个整体来看,情况也是如此。我从欧盟统计局下载了数据,在上图美国数据所用的同一张图表上,用黑点和线条标出了 2009 年至 2020 年间 15-19 岁欧盟青少年自杀率的变化。从图中可以看出,在美国青少年自杀率急剧攀升的同时,欧盟国家同龄群体的自杀率基本保持稳定,甚至还略有下降。由于数据库的限制,我无法按照性别细分欧盟青少年自杀率数据,因此图表展示的是男女合并的平均自杀率。
其他采用不同评估标准的研究同样表明,欧洲青少年的心理困扰程度的上升幅度远未达到美国的水平。例如,根据在 36 个主要欧洲国家开展的大型青少年调查,该调查 2002 年至 2018 年间每四年统计一次,一项研究得出如下结论:「总的来说,我们发现青少年身心健康问题略有增加,但生活满意度并无明显变化。基于这两项指标,我们的研究结果并未提供证据证明整体人群的心理健康状况出现显著下滑,因为其影响较为轻微。」(Cosma et al.,2020)。
因此,如果我们思考 2008 年以来美国青少年心理健康急剧下降这一问题,就需要问:在美国出现了哪些欧洲没有发生的情况,可能会对青少年的心理健康产生影响?
学业压力、成就压力和缺乏经济保障
在 D5 中,我引用了多项调查结果,这些调查显示,绝大多数美国青少年将自己的严重心理困扰主要归因于学校压力。我还列举了一些研究表明,在所考察的那些年里,青少年的焦虑、精神崩溃和自杀率在学校放假期间大幅下降,而在开学后又重新上升。此外,我还提到了一项研究发现,就读于「高成就学校」(注重高分数和亮眼履历)的青少年比其他学校的学生更容易出现焦虑、抑郁和自杀行为。我认为,随着「不让一个孩子掉队」和「共同核心」等政策的实施,学校过度强调应试训练,减少了更多有趣、富创意的教学活动,加剧了学校教育的厌恶性和压力,这正值青少年自杀率开始攀升之时。
在我发表 D5 后,一位颇具影响力的智能手机/社交媒体假说支持者曾试图引用一项研究来反驳学校压力假说(这里),该研究指出,在讨论的年份里,高中生在家庭作业上投入的时间并未增加,初中生的作业时间可能还略有减少。然而,Pew 研究中心开展的另一项研究却显示,那几年间,学生,尤其是女生,花在家庭作业上的时间显著增加了(Livingston, 2019)。
然而,更重要的是,我认为用在某项活动上的时间并非衡量该活动引发心理困扰的合理指标。即便不深究人性,我们也不难发现,人们往往会回避那些让自己焦虑不安的事情。学校压力加重,学生对学业倍感厌倦和焦虑,可能会导致一些人花更多时间在家庭作业上,而另一些人则减少了作业时长,最终使平均时长变化不大。
几年前(2015 年),我在《今日心理学》上发表了一篇博文,谈到大学生情绪抗压能力下降的问题。文中提到,考试或论文得到低分后,一些学生会情绪崩溃。对他们中的一些人而言,任何低于 A 的分数都算低分。这篇文章引发了数百条评论,其中一些来自大学生和高中生。读这些学生的评论,我印象最深的是他们对社会压力表现出的愤怒——在他们看来,社会迫使他们不惜以牺牲真正学习为代价,也要获得高分。下面摘引了评论中的几个例子:
• 在我们看来,任何低于 A 的成绩都是不可接受的。父母从小就向我们灌输,要想在竞争激烈的世界里取得成功,只有做到完美才有机会。这篇文章提到学生备受焦虑困扰,即使是B也被视为失败——原因正在于此。每当考试成绩不是A,我都会陷入深深的绝望,仿佛掉入了无底深渊。
• 我讨厌那些抱怨我们这代人要求太高、被宠坏了的文章。可是,是什么让我们认为非得拿到所有科目的 A 呢?正是父母、奖学金、老师和网络。
• 你说你想让大家努力学习?说拿个 B 也无妨?少来这套!你想要的只是「最优秀的人」,你想要那些能考出一堆A的学生。没错,我的成绩单上有一排A,但我在学校里却非常不快乐。
• 他们告诉你,优异的成绩还不够,拿到所有的 A 只是基本要求。你必须加入至少两个社团,而且不能仅仅当个成员,还要争取当上领导。无论何时何地,你总被灌输一种观念:仅仅简单学习和尽全力是不够的。如果你不能胜过其他同学,你的一切努力都是徒劳无功的。你所做的每一件事都是拿来与他人比较的,你必须不断证明自己比其他同学更加优秀。
这些案例虽然比较极端,并夸大了学业成绩对个人前途的实际影响,但人的主观感受就是其心理现实。这些引言反映了年轻人普遍认为,学校体系乃至整个社会强加给他们沉重的竞争压力。他们被灌输这样一种观念:如果无法在那些并非出于自主选择、也难以理解的评判标准上胜过同龄人,他们注定会在人生中失败。
在 D5 中我曾提出证据,表明在自杀率开始攀升的同时,由于共同核心课程标准的推行,人们对学业成绩和考试分数愈加关注。同一时期还发生了 2008 至 2009 年的经济大衰退,失业率骤然剧增,股市暴跌导致很多人的积蓄化为乌有,人们对经济前景也丧失了信心。
诚然,大衰退不仅席卷美国,也波及欧洲,但有理由相信,它对美国民众的心理冲击要大于欧盟国民。相较于美国,欧洲国家普遍有更多由政府支持的民生项目,如全民医保、失业保护和高累进税率等,能更有效地让人们摆脱贫困。在美国,一个人更容易从富足跌入贫穷,从安居沦为露宿。大衰退可能显著加剧了美国父母对子女经济前景的忧虑——这种忧虑或许会持续多年,甚至在衰退结束后仍难以消除。
加之美国根深蒂固的竞争意识,以及越来越多人认为孩子们的竞争领域是学校和其他可能有助于丰富大学或就业履历的、由成人主导和评判的活动,父母对子女前途的焦虑感进一步增强。这使得父母较以往更热衷并焦虑于孩子的学业和课外成就,从而加重了孩子们自身的焦虑和压力。这是一种推测,但相当合理,有助于解释为何 2008 年后,美国青少年的心理健康状况较欧洲出现了更加明显的下滑。
大量研究表明,社会施加的成就期望会导致内在化的完美主义,而这最终可能引发心理崩溃,因为事实上,完美是永远无法企及的(Curren & Hill, 2022)。无论成绩多么优异,在完美主义者眼中似乎都不够好。这一点与高成就学校的学生比其他学校学生承受了更多心理创伤的研究结果不谋而合。我在 D5 中提到的 APA 研究也得出相似结论:在被调查的青少年中,仅次于学业压力,第二大压力源是「考入理想大学或决定高中毕业后的发展方向」。
我们是否在让年轻人习得无助感,并让他们对「创伤」变得过度敏感?
尽管这会使论证更加复杂,但自 2008 年以来青少年心理健康下滑的另一个可能原因,或许与我们这个社会应对孩子们痛苦的方式有关。随着我们成年人接管孩子生活的方方面面,让他们远离我们、独立探索的机会越来越少,与此同时我们也越来越深入地参与和体验孩子的整个情感世界。在这个过程中,我们可能无意中放大了孩子对负面情绪的感知,让他们变得更加敏感脆弱。
无心的玩笑可能被视为「霸凌」,调情的举止或言论可能被视为「性骚扰」。这些行为是否会变得「令人困扰」,甚至被视为「创伤」,在很大程度上取决于我们自身或整个社会如何教导人们认为它们应当「令人困扰」或造成「创伤」。在极端情况下,如果有人将每一句令人不快的话或评论都视为「微歧视」,他们可能会觉得自己仿佛生活在万箭穿心般的讥讽和攻击之中。曾几何时,大人会教导孩子「棍棒石头虽断吾骨,恶言恶语伤不了我」,而如今,成年人更倾向于强调,即使是看似无害的言辞也可能造成伤害。
不仅如此,成年人总是暗示孩子遇到问题就该求助老师或权威人士,这其实传递了一个潜在的信息,暗示他们无力解决自己的困难。久而久之,我们可能让孩子觉得自己是个脆弱无助的人,而不是个坚韧有能力的人。如果再加上限制孩子独立游戏和探索的机会——这可是孩子们学习自己解决问题的传统途径——那这种无助感可能会加倍强烈。要知道,无助是焦虑的主要成因,它往往引发绝望的情绪,而绝望几乎就是抑郁的代名词。
诚然,这个问题有两面性。真正的霸凌和性虐待由来已久,但长期以来被过度隐瞒。有时,人们或许需要专业人士的帮助,以从心理层面应对难题。但在所传递的讯息中,我们可能将好意做得有些过火了。
女权主义作家吉尔·菲利波维奇在《大西洋月刊》近期的一篇文章(2023)中,对自己曾经支持「触发警告」表示了些许悔意。所谓「触发警告」是基于这样一种前提:哪怕只是在演讲或日常交谈中提及令人不快的内容,也可能对听者造成心理创伤。她指出:「到了 2013 年,『触发警告』已经变得如此盛行且充满争议,以至于《Slate》杂志宣布那一年为『触发警告年』。」她继而写道:
「在给予个体伤害和受害感受更多重视的同时,我们是否无意中培养了缺乏应对逆境、将困境转化为行动力的能力的一代?……用创伤的语言来诠释一个事件,会改变我们看待它的方式。这或许有利于直面那些真正让生命断裂为『之前』和『之后』的时刻,寻求帮助,开始治愈。但这也可能放大无力感和绝望感,让这些感受凌驾于自主性和掌控感之上。……一个人对自己是否有能力渡过难关,抑或无力应对的主观认知,往往会应验自我。」
我同意。
总结
几周前,我开始动笔写这个 D 系列信,缘由是我十分担心那些声称青少年心理健康问题都源于智能手机和社交媒体的言论。他们认为,只要我们把电子设备从孩子手中拿走,或想办法限制使用,就可以轻松解决问题。
这些观点之所以广受欢迎,时常被媒体引用,是因为它们迎合了我们社会对孩子几乎自动化和本能化的思维方式。如果孩子出现问题,那么问题一定是由孩子的某种行为引起的。要解决问题,就必须禁止他们做任何可能引发问题的事,进一步剥夺他们本就所剩无几的自主权。身为成年人,我们从不愿意反思自身的责任。我们坚信,只有限制孩子的自由,让他们接受越来越多的校内外管束性教育,才是在更好地教育他们。而当孩子表达不同看法时,我们却选择充耳不闻。
事实上,与其简单粗暴地没收孩子的智能手机,不如着眼于改变社会结构,为孩子们创造独立玩耍和探索的空间,这对他们健康快乐地成长,培养坚韧品格至关重要。与其一味地强制推行严苛的教育,不如切实改革学校,让教学方式与孩子的天性特点相协调。与其过度强调竞争,不如营造合作共赢的社会氛围。剥夺电子设备的做法看似简单,实则治标不治本,非但无法从根本上解决问题,反而会使情况更加恶化。
现在,我希望自己已经做好准备,可以重新回到这个订阅专栏的主旨,继续探讨游戏如何塑造人性这个话题。让我们拭目以待吧。
参考文献
Cosma, A., et al. (2020). Cross-national time trends in adolescent mental well-being from 2002 to 2018 and the explanatory role of schoolwork pressure. Journal of Adolescent Health 66 (2020) S50eS58.
Curren, T., & Hill, A.P. (2022). Young people’s perceptions of their parents’ expectations and criticism are increasing over time: implications for perfectionism. Psychological Bulletin. https://doi.org/10.1037/bul0000347.
Filipovic, J. (2023). I was wrong about trigger warnings: Has a national obsession with trauma done real damage to teen girls? The Atlantic, Sept. 2023 issue.
Livingston, G. (2019). How teens spend their time is changing, but boys and girls still differ. Pew Research Center Feb. 20, 2019.
大学生心理韧性下降:高校面临的严峻挑战
原文:Declining Student Resilience: A Serious Problem for Colleges | Psychology Today
各高校工作人员正在努力应对学生日益增长的依赖需求
发表于 2015 年 9 月 22 日 | 审稿人:Jessica Schrader
一年前,我应邀参加了一所著名大学的教职员工和管理人员会议,共同探讨如何应对学生心理韧性下降的问题。在首次会议上,我们惊讶地得知,过去五年间,向心理咨询中心求助的紧急电话数量激增了一倍多。学生们越来越频繁地寻求帮助,甚至因为日常生活中的普通问题而陷入情绪危机。
近期提到的案例包括:一名学生因室友骂她「婊子」而自认受到心理创伤;另有两名学生因在校外公寓里发现一只老鼠而寻求心理咨询。这两名学生甚至还报了警,善解人意的警察随即赶到,并为他们放置了捕鼠器。
与会教师们指出,在评分过程中,学生的情绪脆弱已经成为一个严峻的问题。一些教师坦言,他们开始害怕给表现不佳的学生低分,因为随后他们将不得不在办公室里应对学生的情绪危机。据他们反映,如今许多学生将 C,有时甚至 B,都视为失败,并将这种「失败」等同于世界末日。教师们还注意到一个日益明显的趋势:学生更倾向于将低分归咎于教师——认为教师没有明确指出考试范围,或没有清楚说明什么样的论文算好、什么样的算差。他们描述了另一个越来越普遍的现象:学生面对糟糕的成绩,更多地选择抱怨,而非思考如何增加学习量或提高学习效率。
大部分讨论围绕着一个问题:教师应该在多大程度上对学生悉心照顾,又在多大程度上采取「振作起来,这是大学」这样的态度。有人担心,过度照顾是否只会助长并延续学生的依赖心理和逃避责任的倾向?而采取强硬立场是否可能导致学生严重的情绪崩溃,甚至——谁也无法预料——自杀?
两周前,那位心理咨询中心主任给我们全体发了一封后续邮件,宣布将召开一系列新的会议。他的邮件中包含了这样一段令人深思的内容:
「近几个月来,我就大学生心理韧性这一主题进行了广泛的阅读和研究。研究结果显示,我们的学生与全国范围内报告的晚期青少年或刚步入成年期群体的状况并无明显差异。一方面,可诊断的心理健康问题呈现上升趋势;另一方面,许多年轻人应对生活中日常挫折的能力却在下降。无论我们是否愿意承认,这些学生正将他们的困扰带到校园,影响着与他们日常接触的教师和其他工作人员。学生缺乏心理韧性不仅干扰了大学的教育使命,还阻碍了他们的情感成长和个人发展。」
他还向我们提供了一份在系列会议中凸显的主题概要,其中包括以下要点:
-
适应能力较差、依赖性强的学生正在重塑教师的工作环境。教师们被期望提供更多的个别指导,降低学业标准,避免给学生过度挑战。
-
教师群体中普遍存在一种无力感。许多教师对当前的情况表示沮丧。关于学校该如何应对这一问题,几乎没有人提出切实可行的建议。
-
学生们害怕失败,不愿意冒险,渴望确定性。对许多学生来说,失败被视为灾难性的、绝对不可接受的结果。外在的成功标准,如分数和评价,比学习过程和自主发展更受重视。
-
教师,尤其是年轻教师,感受到迎合学生意愿的压力,担心如果不这样做就会得到学生的低评分。学生们会为琐碎的事情发邮件,并期望得到即时回复。
-
我们需要将失败和挣扎正常化。学生们对犯错感到极度不适。他们希望重做作业以弥补先前的错误。我们必须让犯错和从错误中学习成为常态,培养学生的抗压能力。
-
教师们,无论是个人还是集体,都在纠结应该提供多少「保姆式」的指导。他们在培养学生自主性和提供必要支持之间寻求平衡。
-
真正的成长是通过在支持和挑战之间取得恰当平衡实现的。我们需要重新调整这个平衡点。我们已经变成了一个过度保护学生的「直升机式*」教育机构。(*译注:原文为 helicopter,意指像直升机一样在学生周围盘旋,过度参与、过度保护和过度关注学生的方方面面。)
《高等教育纪事报》最近刊登了 Robin Wilson 的文章《痛苦蔓延:面对学生精神健康需求激增,大学陷入应对困境》(2015 年 8 月 31 日),进一步证实了这是一个全国性问题。长期以来,大学一直是高等学术教育的殿堂,学生被视为成年人,理应能够处理自己的日常生活问题。然而,如今越来越多的学生及其父母要求学校承担「代理父母」的角色。与此同时,诉讼的阴影始终笼罩着校园。一旦发生自杀事件或严重的精神危机,学校往往会被追究责任。
Wilson 在采访了多所大学的心理咨询部门负责人后写道:
「家长们普遍期望大学能够提供即时、专业且持续的心理健康服务。这种期望不无道理,毕竟大多数父母仍在适应子女不再每晚回家的新生活,他们希望大学能像他们一样悉心照顾自己的孩子。学生们同样期望学校能在他们需要时及时提供帮助。而学生们确实需要大量帮助。近十年来,美国大学生的焦虑和抑郁发病率急剧攀升,越来越多的学生在入学时就已经在服用相关药物。有自杀倾向的学生人数也在上升。一些学生正面临严重的心理问题,如精神病,这类疾病通常在成年早期显现,恰巧与学生步入大学的时期相吻合。然而,更多的学生正在努力应对校园辅导员所说的大学生活中的常见压力:学习成绩不佳、恋爱失败、首次独立生活等。这些都给大学的心理咨询中心带来了巨大压力。」
在我此前的一些文章中(例如这篇和这篇),我曾探讨过近几十年来儿童独立玩耍、探索和追求兴趣的机会急剧减少的现象。我认为,这种变化带来的后果包括有据可查的焦虑和抑郁症状增加,以及自主掌控生活能力的下降。我们培养了一代缺乏学习解决自身问题机会的年轻人。他们没有机会遇到麻烦并自己寻找出路,没有机会经历失败并认识到自己能够承受,没有机会被他人叫难听的名字,并学会如何独立应对而不依赖成人干预。因此,我们现在看到的情况是:即便到了 18 岁上大学的年纪,这些年轻人仍然无法或不愿为自己负责,仍然觉得一旦出现问题就需要成年人来解决。
大学与学院咨询中心主任协会前主席 Dan Jones 似乎也持相同看法。在接受《高等教育纪事报》采访时,他这样说道:
「如今的学生们没有培养出自我调节情绪的能力,这是因为他们的父母总是帮他们解决所有问题,扫清一切障碍。与上几代人相比,这些学生似乎缺乏毅力和韧性。」
在我即将发表的文章中,我将深入探讨研究证据,这些证据表明所谓的「直升机式养育」确实是问题的症结所在。然而,我并不认为应该责备父母,或者至少不应该仅仅责备父母。从某种意义上说,父母也是社会更大力量的受害者。他们不断受到「专家」的警告,声称让孩子自主发展存在诸多危险;他们面临学校系统日益增长的影响力,以及认为孩子在成人细心指导和监督下才能获得最佳发展的学校思维模式;他们还要承受因让孩子独自进入公共场所而可能遭受的更严厉的法律和社会制裁。遗憾的是,我们已经演变成了一个「直升机式社会」。
如果我们想让孩子为上大学做好准备——更确切地说,为人生的各种挑战做好准备!——我们就必须抵抗这些社会压力。我们需要给予孩子们自由,这种自由在过去一直是儿童所享有的,让他们有机会远离成人的监管。这样,他们才能练习如何成为成年人——换句话说,学习如何为自己的行为负责。
发展心理学与学校系统的「联姻」
原文:Developmental Psychology’s Marriage to the School System | Psychology Today
对在校儿童的关注扭曲了我们对童年的理解。
发表于 2009 年 9 月 30 日
你见过《儿童心理学手册》吗?如果没有,我建议你下次有机会去大学图书馆时看看它。将这部作品称为「手册」并不合适;你需要用上双臂才能把它全部搬起来,如果你的背部力量较弱,你可能一次只能搬起一部分。在我看来,它标题的其余部分 ——「儿童心理学」 —— 也是一个误称。
这部作品的最新版共有四卷,包括近 5000 页双栏页面。它分为 79 章,每章由不同领域的儿童发展专家或一组专家撰写。作者名单可以为发展心理学名人录奠定基础。这部作品旨在全面介绍心理学关于儿童行为的发现和理论。发展心理学的研究生通常被鼓励将其作为培训的基础。该手册的出版商 Wiley 对这部作品的描述如下:「这套权威的四卷本参考书涵盖了整个儿童发展领域,已成为所有其他学术参考书的标准。」
当最新版来到我所在大学的图书馆时,我急切地将它从书架上取下,想知道它对孩子们的玩耍和好奇心有什么看法,这些都是我最感兴趣的主题。以下是我的发现。
这 79 章中没有一章是关于玩耍的,甚至在标题中也没有提到玩耍。当我查看每卷的主题索引时,我发现了一些与玩耍相关的页面引用,但当我进一步查阅时,我发现在四卷书中,总共只有不到 10 页关于玩耍的内容。也就是说,在一部旨在总结我们所了解的儿童心理学的作品里,5000 页中只有 10 页——占全部内容的 0.2%——涉及玩耍这个主题!
那么好奇心和探索呢?它们的情况甚至更糟。不仅没有关于这些主题的章节,而且好奇心根本就没有出现在索引中,探索只出现在一卷的索引中。当我查阅那个引用时,我发现只有 1 页关于探索的内容。问题并不在于索引太短或不完整;每卷的索引都相当多。而且,这部手册也没有使用其他术语来描述玩耍、探索和好奇心这些主题。我已经做了详尽的查找。
这是怎么回事呢?一部现代儿童心理学手册怎么会对玩耍和好奇心几乎一无所知呢?如果你在街上随机问几个人,让他们对「儿童」这个概念进行自由联想,「玩耍」或「好玩」这个词通常会位列榜首,而「好奇」也不会落后太多。对大多数非学术观察者来说,玩耍和好奇心构成了儿童时代的很大一部分本质。借用(并稍作修改)William James 曾经用过的一句话:「只有一个因过度沉浸在学术中而被污染的大脑」会在谈论儿童时不去考虑玩耍和好奇心。比起这部声称全面阐述儿童心理学的作品,马克·吐温对真正的儿童心理学有更多的见解。
这种令人遗憾的状况是如何产生的呢?我认为,这是发展心理学领域与学校系统之间长期紧密的「联姻」所致。
学校为儿童发展研究提供了环境、对象、研究者、思维方式和研究问题。
想要研究人,你需要找到一群受试者。在社区的学校以外的地方寻找愿意接受研究的人不仅困难,还耗时且昂贵;在学校里研究人要容易得多。学生为研究提供了一个现成的、或多或少被限制的群体。大量关于成人心理学的研究都以大学一二年级的学生为对象,他们「自愿」参加,因为这是课程要求的一部分,或者因为这可以提高他们在心理学导论课程的成绩。研究大学年龄以下人群的心理学家需要稍微离开象牙塔,去寻找他们的研究对象,而最方便的地方无疑是学校。
学校里的孩子们习惯于被操控、观察和测试。你可以让不同的学生群体面对不同的条件,然后在操控前后对他们进行测试,并统计结果,瞧,你很可能获得了一个可以发表在儿童发展学术期刊上的研究成果。如果在邻居家的游乐场或街头尝试做这样的研究,你可能会被警察抓起来。(事实上,你可能仅仅因为站在那些场合观察孩子而被抓,尤其是如果你是个男性。)
当孩子们不在自己的学校里接受研究时,他们通常会在大学的心理实验室里接受研究。招募到的孩子,如果他们已经 5 岁或更大,几乎都是在传统学校上学的孩子。实验室里使用的实验研究范式与孩子们熟悉的学校范式相契合,所以孩子们很容易明白他们应该做什么。研究对象是学生,研究者是老师,实验操控是课程,测试就是测试。这种匹配不仅在研究对象的心中契合,而且在研究者的心中也契合。我的心理学学术同事经常在口误中,将他们班上的学生称为「研究对象」,或者将他们的实验室研究对象称为「学生」。
研究儿童的心理学家通常称自己为发展心理学家,因为他们主要关注儿童的发展,即儿童如何走向成年。在我们的文化中,学校教育是如此无处不在的力量,以至于大多数人在直觉上将儿童发展与在学校系统中的进步联系在一起。研究心理学家通常是学校系统最优秀的产物。我们是那些经历了至少 20 年(直至博士学位)学校教育并幸存下来的人,甚至是在学校教育中茁壮成长的人,现在我们仍然在学校里,只不过是作为教授而非学生。相比我们文化中的大多数人,我们对人类发展的直觉理解与学校系统中的进步观念更加紧密相连。
在学校的发展模式,对于寻求理论整齐划一并坚持只研究可衡量事物的心理学家来说,也很方便。学校里的发展有序、统一且可衡量;一厢情愿的想法使所有的人类发展都变成这样。发展心理学研究的另一个重要影响因素是资金。如果你将研究与儿童教育联系起来,比起不联系教育,你获得政府资助会更容易,而在大多数资助审查者下意识的理解中,教育理所当然地等同于学校教育。
考虑到这一切,发展心理学家试图在研究中回答的问题绝大部分都与学校相关,这并不奇怪。许多问题明确地涉及学校课程;例如,它们涉及教授阅读或数学的方法。但即使不那么明显与学校相关的问题,也受到学校范式的强烈影响。它们涉及到成人在受控环境中为儿童设立的结构化情境对儿童的影响,在这些环境中,做什么事情的选择受严格限制。这本身就基本排除了对真正的玩耍或好奇心的研究。
这一切都不含任何恶意。这些诚实的研究者试图研究他们和周围人所认为重要的问题。然而,最终产出的却是对儿童本性极度偏颇且狭隘的看法。
学校是一个什么样的地方,这如何影响我们对儿童的理解?
如果我对学校在发展心理学思想和研究中的影响的看法是正确的,那么了解学校作为一个促进某些行为并阻止其他行为的环境,可以帮助我们理解发展心理学中存在的偏见。学校是一个怎样的环境,它如何影响发展心理学的理论和发现?
- 学校是一个儿童或多或少受到成人持续管控的地方。
在学校里,决定做什么、什么时候做,以及如何做的决策,由老师或老师上级的权威做出。学生的任务就是遵循指示。我认为这极大地影响了心理学家对儿童行为的思考和研究方式。关于儿童如何做出选择、采取主动或与周围世界互动的研究和理论非常少。相反,大量研究关注的是儿童如何回答成人要求他们回答的问题,以及他们如何处理或记住成人给予他们的信息。
- 学校是一个将「工作」和「玩耍」划分得泾渭分明,并将学习归入前者的地方。
学校不断传递的观念是,工作和玩耍是非常不同的事物。工作(具体来说是「学校工作」)是你必须做的事情;工作让你进步;工作让你受教育。玩耍是你在课间休息时,从工作中抽离出来做的事情,或者在你完成工作后做的事情。这里隐含的观念是,玩耍是微不足道的。我认为,这有助于解释为什么大多数发展心理学家避免研究玩耍,以及为什么那些确实研究玩耍的少数人很少被邀请为这个领域的总结性著作,如《儿童心理学手册》做出贡献。
- 学校是一个经常进行测试、强调规范并根据测量指标对儿童进行排名的地方。
学校系统需要进行大量测试,以判断孩子们何时准备好进入下一课程或年级。心理学通过大量关于构建测试的研究,以及基于可衡量成就规范的整个发展理论,来满足这一要求。事实上,可以公平地说,发展心理学是从 20 世纪初,当 Alfred Binet 受法国教育部委托开发一种测试时,开始起步的,该测试的目的是帮助学校系统为新生分配年级和分组。当然,这就是我们今天所知道的智商测试。即使在今天,智商测试仍然是发展心理学的主要应用领域之一。因此,发展心理学与学校系统的联系可以追溯到发展心理学的起源。(也许本文标题中的婚姻隐喻会引起误解。你可能会认为发展心理学是学校系统的孩子,而不是配偶,而这个孩子还没有远离家门。)
- 学校是一个严格按年龄分隔的地方。
在如今的学校里,孩子们几乎没有机会与比自己大或小几个月的孩子互动。我认为,这一事实有助于解释,为什么在发展心理学的研究中,几乎没有涉及幼儿与青少年之间或相差两三岁的儿童之间的互动。然而,正如我在之前的文章中所论述的,在非学校环境中,不同年龄段的混龄游戏似乎是年幼孩子获取新技能和知识,以及年长孩子发展领导力和养育能力的主要途径(参见 2008 年 9 月 9 日开始的三篇系列文章)。通过关注学校中的儿童,并将学校模式作为人类发展的内隐模型,发展心理学整个领域完全忽视了自由混龄互动对发展的作用。
- 学校是一个竞争激烈的地方。
学校从设计之初就是竞争环境。孩子们竞争获得高分,竞争在班级排名中获得高位,最终竞争进入名额有限的名牌大学。课堂上的「游戏」,如拼写比赛,通常都颇具竞争性,课外活动也是如此。学生们竞争参加学校演出,或参加校际运动队,或参加精选合唱团,或参加拉拉队。此外,年龄分隔本身也容易导致竞争。所有这些都导致了学校竞争氛围的产生,这种氛围甚至影响到学校内的非正式活动。在学校环境中,孩子们(尤其是青少年)形成了受欢迎程度的社会等级,发展心理学家往往将其视为孩子们天生的特点。然而,对非学校社会的研究以及对校外儿童的研究(通常由人类学家而非心理学家进行)对这种等级普遍性产生了质疑。即使是猴子,当它们被限制在笼子里与未经自己选择的伙伴在一起时,也会比在自由漫游和选择自己的伙伴时更具有等级观念、竞争性和攻击性。
-----------
如果我们想了解人类潜能,而不仅仅是了解人们如何适应学校和类似学校的环境,那么我们必须拓宽研究范围,涵盖在各种环境中对儿童的研究,以及采用各种方法的研究。如果我们不在允许这些品质充分展现的环境中研究儿童,我们永远无法充分了解儿童的玩耍、好奇心、自主性以及自由混龄的力量。不幸的是,在我们的社会中,这样的环境越来越少。让我们找到它们,研究它们,并像对待濒临灭绝的物种一样呵护它们!
------------
附注
这些帖子中的一些超链接是自动生成的,可能会也可能不会将你链接到相关网站。作者生成的链接通过下划线与自动链接区分开来。
[1] 对研究心理学家来说,「儿童心理学」和「发展心理学」这两个术语在很大程度上是同义词,尽管有些发展心理学家研究成人的发展。这里我谈论的不是作为临床实践的儿童心理学(实际上,临床实践中相当多的关注集中在游戏这个主题上——尤其是将玩耍作为治疗的手段),而是作为一门旨在了解儿童心理特性,以及涉及儿童向成年人发展过程的学术学科的儿童心理学。
更多关于孩子自然的学习方式,请参见《自由学习》。
自主教育和进步教育之分
原文:Differences Between Self-Directed and Progressive Education | Psychology Today
自 主 教 育是未来,进步教育则不是。
发表于 2017 年 6 月 27 日|审稿人:Ekua Hagan
本博客的常客都知道,我倡导自主教育。我和其他人的研究,让我坚信,自主教育行之有效,而且非常实用。而且,比起我们认为是「标准」的强制教育体系,给大家带来的麻烦要少得多。
大写的自 主 教 育*(Self-Directed Education)作为一个术语,越来越多地用于自称为 「非学校教育者」的人的教育实践,或者用于那些专门为支持自我导向而设计的学校或学习中心,没有强制课程,如瑟谷模式学校和 Agile Learning Centers ,以及一些自称为「自由学校」的学校(Gray, 2017)。(*译注:由于中文没有大小写区分,这里在每个字之间加入空格来表示大写。这一点很重要,下文中作者会专门讨论。)
我发现,每每我写点、说点什么关于自 主 教 育的东西,就有人误以为我谈的是进步教育。进步教育和自 主 教 育有很多相同的目标,甚至惯用的术语也一样,但是它们的哲学全然不同,方法也很不一样。
接下来,我将检查进步教育的基本原则,然后再检查自 主 教 育的基本原则。最后,我会解释我为什么认为自 主 教 育是未来,会成为以后的教育标准模式,进步教育则不会。
进步教育
进步教育一般用于描述一场始于 19 世纪末的教育改革运动,大致和各州实行强制学校制度的时段一致,并在此后至少起伏了两次。
大约在 1890 年到 1940 年期间,进步教育理念在教育领域取得了繁荣发展,许多进步式私立学校应运而生,有些还试图合力将进步理念引入主流公立学校。当时领军美国的进步教育哲学家是约翰·杜威。其他早期进步主义教育思想家包括鲁道夫·施泰纳(1869-1925)和玛利亚·蒙特梭利(1870-1952),他们的理念分别在瓦尔多夫学校和蒙特梭利学校中存续。
进步教育随着二战及其余波逐渐销声匿迹,在六七十年代又逐步发扬光大。大约八十年代后又式微了。不过呢,最近,进步教育观又开始复兴,宣扬项目式学习。
进步教育者通常强调实践学习、与学生现实生活经验相关的情境学习、批判性思维、深刻理解而非死记硬背、团队合作而非竞争、基于产出而非考试的评估,以及培养社会责任感、民主态度和对社会公正的关注。他们通常谈论「培养完整的个体」和「以学生为中心」的教育,与仅仅以学科为中心的教育形成对比。进步式教师往往需要了解每个学生的个人情况,并发挥他们的优点。
进步教育网(一个建立于 2009 年并试图复兴进步教育的组织)宣称,进步教育肩负历史使命:
「教育必须(一) 发扬学生的发言权、主动性、道德心和智慧,建立一个更加公正、正义且可持续的世界;(二)鼓励学生积极参与自己的学习、社区和世界;(三)响应学生的发展需要,重视他们在社交、情感、智力、认知、文化和身体方面的成长;(四)尊重和培育学生天生的求知欲和自发学习的本能,促进内在动机的培养以及对个人兴趣、目的和追求的发现;(五)结合不同群体的利益、经历、目标和需求来推进教育,培养体谅他人的能力,促进不同群体之间交流与合作;(六)培养学生、教师、家长和社区之间互相尊重和互相合作。」
阿尔菲·科恩,现今最主要的进步教育倡导者之一,他指出,学校的进步性可以根据其(一)关注儿童全面发展,而不仅仅是考试能力;(二)社区感;(三)合作精神;(四)追求社会公正;(五)培养内在动机;(六)深度理解;(七)主动学习;(八)重视孩子的需求;的程度来衡量。
进步教育者倾向于视教育为学生与教师之间的合作课题。大部分主动性来自于学生,但教师有责任以有益的方式引导这一主动性。儿童的内在兴趣起着重要作用,但教师需要「培养」或甚至「激发」这些兴趣。玩耍被理解为学习过程的一部分,但需要教师指导和解释玩耍,目的在于确保实现某些教育目标。总体来说,进步教育认为教育应该由学生和教师合作,主动性很大程度上来自学生,教师的责任在于,要以有益的方式引导学生的主动性。
自 主 教 育
自 主 教 育的倡导者与进步教育的倡导者一样,强调教育的意义远不止于应试学习。自主教育联盟网站将教育定义为 「一个人所学到的一切知识的总和,这些知识使他能够过上幸福有意义的生活」。这包括对自己的认识、规划和指导自己活动的技能、如何与他人和睦相处的技能,以及对周围世界的充分了解,以便有效地驾驭这个世界。我想,大多数进步教育者都会同意这样的教育定义。
进步教育和自 主 教 育各自持有不同的全人教育观,这就是差别所在。进步教育者会认为,全人教育需要一位乐于合作、充满慈爱、能力出色的老师,她能够润物无声,将孩子的天真烂漫的想法导向孩子和社会的长期利益。若倡导自 主 教 育,则只是利用周遭可利用的资源(例如一些渊博能干的人)来达成教育目标,促成孩子追随自己的自然倾向,据此理解世界,也理解自己。
提倡自 主 教 育便意味着,教育是否成功仰赖儿童的天赋,而不是教师的本领。推动自 主 教 育的大人,其工作负担比进步教育教师要小。在自 主 教 育中,大人不需要对学生可能想学习的每个课题都了如指掌,也不需要全面了解每个孩子思维工作的内在机制,也不需要掌握教学法(管它是什么)。相反,他们只需确保给孩子提供一个环境,让孩子的天然学习本能得以有效运作。简而言之,大人的职责仅是提供一个适宜的学习环境,由孩子自己主导学习进程。
根据我以前的论点(这里和[这里](https://www.psychologytoday.com/us/sites/default/files/Children's Natural Ways%2C published.pdf)),孩子的学习环境应该具有以下特征:(一) 孩子探索和玩耍的时间不受限制,有充分的自由;(二)孩子可以用到该文化中最实用的工具;(三) 孩子处在关怀友爱的社区,里面都是各个年龄段聪明能干,知识丰富的榜样;(四) 孩子可以接触到若干愿意回答问题(或者试图回答)并在需要时提供帮助的大人。这就是自 主 教 育学校或学习中心以及成功的自然学习式家庭为孩子提供的学习环境类型。在这种学习环境中,孩子可以充分发挥自然探索和自主学习的本能。
根据这一观点,教育不是师生合作,而是完全由学生自己承担的责任。而进步教育者仍然认为,教师需要确保学生掌握某些知识、技能和价值观以及评价学生是否进步。相比之下,自 主 教 育的协助者则不认为这是自己的责任。虽然进步教育与传统教育存在一定连续性,但自 主 教 育实质上和传统教育观念完全脱离。它认为教育完全由学生自己主导,而不通过教师与学生的合作来完成。所以,自 主 教 育比进步教育对传统教育模式的质疑更为深刻。
接下来,我想谈谈一个过去隐而不现的区分(我自己也没有注意),即大写的自 主 教 育和小写的自主教育的区分。我认为,大写的自 主 教 育适用于学龄儿童,他们的家人在深思熟虑后决定,孩子只需根据自己的兴趣自我教育,而不必经受强制课程之苦,这些孩子可能上学也可能不上学。小写的自主教育,则广泛得多,每一个人在清醒的每时每刻,都在自主教育。我们都忙于奔命,追求自己的利益。大多数我们每个人所掌握的知识——不管我们接受了多少以课程为基础的学校教育——都是来自于自主教育。
追求自 主 教 育的人实际上在表达,(小写的)自主教育十分强大、足够有效,只要为孩子提供能够优化自我教育能力的环境,他们就根本不需要强制教育。事实上,许多人认为强制教育会干扰自主教育,因为它占用了孩子太多时间,把学习变成一件不愉快的事,还让孩子在教育上依赖他者的观念根深蒂固。
为什么我认为自 主 教 育是未来教育的标准形态
我敬佩进步教育者。无一例外,他们都是好人。他们深切地为孩子着想,想要帮助孩子越过越好。他们深知标准教育系统荼毒不浅,试图改变现状。
进步教育者如今冲在前线,不断推动减少家庭作业(这样孩子在校外就有课余时间)、恢复课间休息、减少或取消标准化考试、让教师在课堂上更加灵活地响应孩子需要。他们如今还在苦战,我对此表示敬重。
这是一场持久战,强制学校教育新生伊始,战争的号角就已经吹起。进步教育有助于限制强制教育,不使其过度。进步教育不可能战胜强制教育,因为进步教育还是接受了太多关于教育本质必须如何的标准观点。
只要老师认为,他们的任务就是要确保孩子在规定的阶段学到规定的东西,那么无论他们的思想多么先进开明,他们都不得不使用强制手段让孩子照做。孩子在天性上就对不同事物感兴趣,所以根本不可能在一个统筹规划的教室里同步学习,面对十几个学生,你不能假设所有的学生都会对规定的课程感兴趣。
我敢说,大多数新教师,从师范院校毕业后,刚步入教师行列,都以为自己会成为进步教育者。毕竟,他们选择当老师是因为热爱孩子;在师范课上,他们读和听到的教育理念,大多数为进步理念——指导、培养和启发,而非强制。但是,后来,他们进入了教室的现实世界。在那里,一个教室里有 30 个孩子,老师需要维持秩序,需要做点什么让学习活动看起来正在进行;他们的进步思想很快就被抛到了脑后。那些最能按照进步原则运作的学校往往是高昂的私立学校,这也正常,这些学校需要小班授课、高师生比以及极为负责、投入的老师。
即使进步教育的狂热信徒也承认,进步教育之所以没有被广泛采用,是因为它对教师的要求非常高。比如,阿尔菲·科恩说过:
「比起传统教育,[进步教育]对教师的要求极高。如果教师想要学生『真正理解生物学或文学』,而不仅仅是『简单记忆青蛙解剖结构或句子结构』,他们就必须对所教学科非常精通。此外,由于没有任何学科知识(比如科学或英语专业知识)能告诉你如何促进学习,进步教师还必须对教学法有丰富的了解。」
此外,教师还被要求认识每一个学生,并帮助学生发展自己的潜能和兴趣。据此,你可以理解为什么进步教育没有取代直接、机械训练和考试的教学法,成为标准教学法了。
进步教育者经常引用卢梭作为他们观点的早期倡导者。卢梭关于教育的唯一一部作品《爱弥儿》(首次出版于 1760 年),是关于一个男孩教育的虚构故事。如果这本书对现实世界有任何应用的话,那也只是对一名王子的教育。爱弥儿的老师是一位私人导师,他的唯一工作,人生的唯一使命就是教育这个男孩,老师对学生的比例是一比一。根据卢梭的描述,这位导师几乎是一位超级英雄。他不仅在所有学科上知识渊博,而且对爱弥儿了解透彻,远远超过任何一个人对另一个人的了解能力(我觉得是这样)。他知道男孩在任何时间的所有意愿,并且他清楚在任何时间提供什么刺激可以最大化男孩满足那些意愿时获得的教育效益。因此,导师创造了一个环境,爱弥儿总是在做他自己想做的事,但却正学习着导师精心为他安排的课程。
我想,只要教育家真去读《爱弥儿》,而不仅仅是引用它,他们就会意识到进步教育理论的根本缺陷。它极大程度上过分要求了教师的实践,而且还不切实际地觉得人类欲望和动机是可以预测、确知的(对《爱弥儿》的进一步分析请见我的文章)。从整体上看,进步教育充其量只能帮助调节传统教学法的严苛,并为学生的校园生活增加一点自主权和创造力。
相对于进步教育,自 主 教 育的成本低且高效。例如接近成立 50 周年的瑟谷学校,每学生预算不到当地公立学校的一半(更多有关该学校的信息见这里和这里)。不需要非常高的师生比,因为大部分学生学习并不是来自于与成人的互动。在这个混龄的环境里,年幼的学生持续从年长的学生那里学习,所有年龄的孩子通过游戏、探索、谈话和追求自己的兴趣,练习关键技能并试验想法。他们还会主动使用书籍,使用现代工具——互联网资源,随时随地来获得他们需要的知识。
人们常常批判自 主 教 育它行不通,或者说,只有少部分人才有那种自我驱动力来自主教育。事实上,进步教育者恨不得马上和自 主 教 育划清界限,因为他们不希望自己的观点与看起来「浪漫化」或「疯狂」且不可行的观点混为一谈。例如,我相当确定阿尔菲·科恩在这里所说的就是自主教育:
「这一讽刺画展现了这样的景象:孩子可以为所欲为,只要有趣的东西就是课程的内容(不有趣的就不行)。他们认为学习会自动发生,而老师只在一旁观察和微笑。本文没有足够的容量来给出这种误读的例子——或者完整说明为什么它是如此错误,但是相信我:人们确实会基于一个与进步教育几乎无关的形象,而对进步教育的理念嗤之以鼻。」
科恩对自 主 教 育的「讽刺画」描述不太准确,因为孩子们确实会自发选择不那么有趣的事情去做,老师也不仅仅是在一旁观察和微笑。但这种描述也有一定道理。而且这样的教育是可行的。别信我的一面之词,读读看相关证据,批判性地反思这些证据。对自 主 教 育学校和自然教育成年学员的跟踪研究表明,这种根据自己兴趣自主学习的人在生活中进展很好。您可以在之前的博文、各种学术文章(例如这里、[这里](https://www.psychologytoday.com/us/sites/default/files/Published Grown Unschoolers I.pdf)和[这里](https://www.psychologytoday.com/us/sites/default/files/Published Grown Unschooles II.pdf))以及我的《自由学习》一书中读到更多相关信息。
自 主 教 育之所以有效,是因为我们天生就具备这种能力。基本上,整个人类历史长河里,孩子们通过探索、游戏、观察和倾听他人,在确定和追求自己的生活目标来获得教育(例如这里 和Gray, 2016)。在一项关于跨文化教育的人类学文献广泛综述中,David Lancy (2016)总结到,学习(包括教育中的学习)对人类来说是自然的,但是教学和被教却不是。丘吉尔的名言「我一直喜欢学习,但不喜欢上课。」说出了任何时代、任何地点、任何人的心声。
在我们现代社会中,只要我们提供让这些学习本能得以发挥作用的条件,孩子的学习本能仍然可以很好地起作用。促使狩猎采集社会儿童学习狩猎、采集和做所有必要的事来成为称职的成人的同样本能,也驱使我们社会中的儿童学习阅读、计算、操作电脑和做所有必要的事来成为称职的成人(参见 Gray, 2016)。自 主 教 育对每个人来说都那么自然、那么更令人愉快和高效,我不得不认为它重新成为标准教育路线是大势所趋。
强制学校教育在人类历史上只是昙花一现,它的设计目的是服务于工业化带来的暂时需求,压抑创造力和自由意志(详见此文)。强制学校教育现在已是强弩之末。一旦人们重新发现,自 主 教 育行得通,而且也不会像强制教育那样,给孩子造成压力和伤害,一旦我们开始把现在花在强制教育上的数十亿美元中的一小部分转用于为所有儿童提供自 主 教 育的资源,自 主 教 育将再次成为标准教育路径。到那时,我们可以不再适用大写形式的自 主 教 育这一术语。我们也不再需要进步教育来润滑强制教育给予的枷锁。
---------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。无论我们是否赞同,你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)。
参考文献
Gray, P. (2016). Children’s natural ways of learning still work—even for the three Rs. In D. C. Geary & D. B. Berch (eds), Evolutionary perspectives on child development and education (pp 33-66). Springer.
Lancy, D. (2016). Teaching: natural or cultural? In D. C. Geary & D. B. Berch (eds), Evolutionary perspectives on child development and education (pp 67-93). Springer.
12年前的美国专家:学生应该增负,早该增增了。
原文:Doing More Time in School: An Unimaginative, Mean Proposal | Psychology Today
那些想要更多强制学校教育的人无视了学生的意见。
发布于 2012 年 5 月 23 日
学校教育效果不佳,我们的解决方案竟是让孩子们在学校里花更多时间!
这似乎是奥巴马总统、他的教育部长 Arne Duncan、许多教师工会(只要教师能获得丰厚的加班费)以及学术界内外的许多教育政策制定者热情支持的政策。
孩子们在学校学得还不够多,因此:我们要求他们从更小的年龄开始上学;每天在学校里待更长的时间,每年上更多的天数;18 岁之前不许离开学校。我们对贫困儿童的做法更甚:他们现在从学校得到的最少,所以最应该让他们多上上学!
在我读到、听到这一「增加强制学校教育时间」的辩论时,最让我不安的是学生的意见被完全忽视了。即便是奥巴马,这位看上去很有人情味的、慈爱的父亲,在一次支持增加强制学校教育的演讲中,也无视了他女儿的感受。他说:「我知道,更长的上学时间并不受欢迎——不论是对我的女儿 Malia 和 Sasha,还是对我的整个家,可能你们家也一样。但面对新挑战,我们需要更长的课堂时间。」(出处)
几天前,出于研究目的,我勉为其难地收听了《波士顿公共广播》的一个节目,讨论的是延长在校时间的议题。节目邀请了马萨诸塞 2020 的联合创始人 Chris Gabrieli,他推动了马萨诸塞在校时间延长的计划,还有波士顿教师协会主席 Richard Stutman。他们讨论的是一项提议,要把波士顿公立学校的每天上学时间增加 3 个小时——从现在的 6 个半小时延长到 9 个半小时!如果这个提议通过,那么学生们将在从上 7 点开始上课,一直到下午 4 点半才结束!
这套系统让学生早上六点就得挤校车,下午六点才能回家。回到家后,他们还得抽出两三个小时写作业,然后才能抓紧时间睡觉;第二天一大早,五点多就得起床,准备迎接新的学校生活。这种做法,明摆着就是对孩子的极端折磨。但 Gabrieli 和 Stutman 却极力支持。他们坚称,延长在校时间能提高考试成绩。好极了!看来,我们关心孩子们的时候,唯一在乎的就是他们的考试分数。
节目快结束时,一个听众打电话来问:在父母同意的情况下,孩子们能否拒绝延长课程?回答是「肯定不能」。回答这个问题时,Gabrieli 还特意提到了学生对延长学习时间的反对,并把这当做必须强制执行的理由。他说:「如果你在一天结束时问学生谁愿意留下来继续上课,能有 10% 的学生说『愿意』就不错了。」学生的意见就这么被无视了。学生的意见似乎并不重要,甚至需要被「克服」。
延长学校时间是利是弊?翻阅有关的学术研究时,我发现了一项以态度为主题的研究结果。在一所最近延长了学年的学校里,88% 的教职工赞成将延长计划继续实行到下一年,但仅有 12% 的学生支持。这项发现被某篇综述文章视为对计划的肯定,其中,学生对延长学习时间的不满被无视,文章的最终结论中甚至未提及学生的意见。[1]
一项采取了时间取样法(Time sampling)的研究表明,相较于平时所处的任何其他环境,学生在学校的幸福感最低。[2] 一些学生非常痛苦,乃至选择自杀。大量学生因为学校压力和缺少自由玩耍的时间而患上抑郁症或焦虑症。[3] 我听的那个广播节目根本没有讨论这个问题。在探讨这一主题的诸多文章中——无论是学术期刊还是大众传媒——这些问题也无人问津。大家似乎只关心:「我们是否能通过延长上学时间从学生那里榨取出更高的标准化考试分数?」以及,「如何为教师的额外工作时间支付费用?」
增加在校时间可以提高考试成绩的论点尚有争议。Patell、Cooper 和 Allen 在他们的系统综述中指出,虽然有一些证据显示考试成绩有所提升,但「对于确定因果关系来说还远远不够…」[4] 他们还指出,一些在国际标准化考试上得分高于我们的国家,如世界成绩领先的芬兰,以及挪威、波兰、荷兰、澳大利亚和日本等,每年的上学时长实际上却比我们少。[5]
为什么我们在解决孩子的问题时这么缺乏想象力?我们试图通过学校系统来解决所有问题,但这个系统总是失败。它之所以失败,主要是因为孩子们不喜欢学校。在让令人痛苦的环境中,人很难茁壮成长、学有所成。这一点是如此显而易见,却几乎完求被教育政策制定者忽视了。如果允许孩子在一个真正有得选的环境中做出自己的选择,而且这些选择与真实生活紧密相关,那么他们学到的东西将远比被迫学习对他们来说毫无意义的课程要多得多,也要高效得多。这一直是本博客众多文章想要传达的核心理念。
与其向学校系统砸更多的钱,让孩子在学校花更多的时间,为何我们不试图寻找一些其他方式,来改善孩子们的生活——尤其是贫困孩子的生活?
很多年前,当我还是纽约市的一名大学生时,我在城市最贫困区域之一的一个课后社区中心工作。这个中心由 YMCA 赞助,面向那些负担不起「真金白银」的孩子们。它是免费的,客户几乎全部是波多黎各人和非裔美国人。这个中心位于一栋破旧的建筑里,只有一名全职员工(一个来自社区的和蔼可亲的男士)和我这个在课后时间的兼职。它服务大约 200 名孩子。有一个摇摇欲坠的旧体育馆、一些游戏、书籍,以及一个孩子们可以自愿写作业的地方。这一切都由他们自己选择。来这里的孩子年龄大约从 7 岁到 18 岁不等,他们常常在室内和建筑外的街道上,结成年龄各异的小组玩耍。有时我看到年纪较大的孩子帮助年纪较小的孩子做作业,我经常看到年长的孩子给年幼的孩子读书或教他们玩游戏。这是一个几乎完全由孩子自己运营的激励环境。我从未见过严重的霸凌行为。尽管建筑破旧,但孩子们为拥有自己的中心而感到自豪,并且他们中心内外都将彼此照顾得很好。如今,大多数人不相信这样的事情可以存在。我们前所未有的低估了孩子们的能力——尤其是贫困孩子的能力。
请大家,作为社会的一部分,开始创造孩子们喜欢的环境,而不是迫使他们在学校这样的监狱里待上更多时间。不妨开设一些项目,让青少年有机会在社区里获得真正的课后工作,他们可以挣些钱,了解一些实际工作,怎么样?提供学徒或实习机会,让他们可以尝试未来可能从事的职业,怎么样?提供混龄玩耍的机会和安全场所,怎么样?我们为什么不努力提供像这样的一份机会菜单,让孩子们可以在放学后、周末和假期中自由选择?年轻人,尤其是贫困的年轻人,在放学后没有适当的环境去工作、玩耍和学习,这才是我们应该解决的问题!只需要用比“教师工会要求增负所需的资金”更少的钱,再加上一点点想象力和主动性,我们就能为孩子们创造丰富的选项——这些选项由他们参与设计,他们也喜欢这些,并会从中自由选择。这样,他们将会快乐地茁壮成长。
-------
你怎么看待延长在校时间的问题?你希望你所在地区的儿童和青少年在放学后和暑假期间能参加哪些活动?目前有哪些因素阻碍了这些活动?这个博客是一个讨论平台,无论是我还是其他读者,都非常重视你的观点和见解。请在下方的评论区分享你的想法和问题。
我一贯更倾向于你在这里发表你的评论和问题,而不是私下通过邮件和我交流。因为在这里发表评论,你不仅是在和我分享,也在和其他读者分享。我会阅读所有评论,并尽力回答所有严肃的问题。当然,如果你有些话真的只适合你和我之间交流,那就给我发电子邮件。
--------
参见新书《自由学习》
附注
[1] Patall, E. A., Cooper, H., & Allen, A. B. (2010). Extending the school day or school year: A systematic review of research (1985-2009). Review of Educational Research, 80, 401-436.
[2] Csikszentmihalyi, M., & Hunter, J. (2003). Happiness in everyday life: The uses of experience sampling. Journal of Happiness Studies, 4, 185-199.
[3] Gray, P. (2011). The decline of play and the rise of psychopathology in childhood and adolescence. American Journal of Play, 3, 443-463.
[4] Patall, E. A., Cooper, H., & Allen, A. B. (2010). Extending the school day or school year: A systematic review of research (1985-2009). Review of Educational Research, 80, 401-436.
[5] Patell et al. (2010). Wolfgang, B., The Washington Times, Dec. 13, 2011.
学前教学危害深远
原文:Early Academic Training Produces Long-Term Harm | Psychology Today
研究揭示了学业型学前教育和幼儿园的潜在风险。
发布日期:2015 年 5 月 5 日 | 审稿人:Matt Huston
目前不少学前班和幼儿园老师被各方施压,要他们教小孩子学术技能,还要定期测试。这些老师告诉我,这让他们非常不爽,有些已经打算辞职了。他们亲眼目睹孩子闷闷不乐的表情。在传统幼儿园或者托儿所里,孩子会玩耍、探索、交际,老师们猜测其实这样孩子能学到更多有用的知识。学术研究则很好地佐证了他们的猜测。
大量严格对照的研究比较了以学业为导向的早教课堂和以游戏为基础的课堂的效果(其中一些研究在 Nancy Carlsson-Paige、Geralyn McLaughlin 和 Joan Almon 的文章中被回顾,文章见此处)。[1] 这些研究的结果惊人的一致:早期学业培训一定程度上提高了儿童在学前培训特定测试中的直接分数(没什么好奇怪的),但这些最初的收益在 1 至 3 年就消失了,至少在一些研究中,结果最终适得其反。也许比早期学业培训缺乏长期学业优势更可悲的是,有证据表明这种培训会造成长期伤害,特别是在社交和情绪发展领域。
一项在德国进行的研究改变了那里的教育政策
例如,在上世纪 70 年代,德国政府资助了一项大规模对照实验,对比了来自 100 个幼儿园的毕业生,其中一半的幼儿园以玩耍为主,另一半采用直接教学法。[2] 尽管直接教学法组最初的学习成绩有所提高,但到了四年级,直接教学法型幼儿园的孩子在各项测试中的表现都明显差于玩耍型幼儿园的孩子。特别是,他们在阅读和数学方面进步不多,在社交和情感方面的适应能力也较差。在研究期间,德国正逐渐从传统的玩耍型幼儿园转向学业型幼儿园。至少部分由于这项研究的结果,德国扭转了这一趋势;他们回到了玩耍型。
对美国贫困儿童的大规模研究
美国的类似研究也得出了类似的结果。一项由 Rebecca Marcon 指导的研究主要关注特别贫困家庭的非裔美国儿童。[3] 正如预期的那样,她在对 343 名学生的抽样调查中发现,那些参加以学业培训为中心的学前班的学生,与那些参加以游戏为基础的学前班的学生相比,显示出最初的学业优势;但是,到四年级结束时,这些最初的优势发生了逆转:来自以游戏为基础的学前班的孩子现在表现更好,在学校的成绩明显高于那些来自学业型学前班的孩子,这项研究不包括对社会和情感发展的评估。
一项对贫困儿童的跟随调查一直持续到他们到 23 岁
1967 年,David Weikart 和他的同事们在一个严格对照的实验中,让密歇根州伊普西兰蒂的 68 名高度贫困的儿童到三种类型的幼儿园中去上学:传统型(以游戏为基础)、指导型*(与传统类似,增加了更多的成年指导者)和直接教学型(着重于教授阅读、写作和数学,使用练习册和测试)。入学名额是随机分配的,确保三组儿童在所有初始指标上一致。该实验还包括每两周一次的家访,旨在指导家长帮助他们的孩子,以作为幼儿园教育的补充。这些家访的重点与幼儿园教学的重点一致。也就是说,传统型幼儿园的家访侧重于游戏和社交的价值,而直接教学型幼儿园的家访则侧重于学业技能和写作业等。(*译注:原文为 High/Scope,是一种基于皮亚杰和杜威儿童发展理论的早期教育课程)
这项实验的最初结果与其他此类研究的结果相似。那些在直接教学组中的人显示出早期的学业成果,但很快就消失了。然而,这项研究还包括在参与者 15 岁和 23 岁时的后续研究。在这些年龄段,各组之间在学习成绩上没有明显差异,但在社会和情感特征上却有很大的差异。
到 15 岁时,直接教学组的学生犯下「不当行为」的平均数量是其他两组的两倍多。到了 23 岁,作为青年人,这种差异甚至更为显著。相比其他两组,直接教学组的人与别人发生摩擦的情况更多,更有可能表现出情绪障碍的迹象,结婚并与配偶同居的概率更低,而且更有可能犯罪。事实上,到 23 岁时,直接教学组中有 39% 的人有重罪逮捕记录,而其他两组的平均只有 13.5%;直接教学组中有 19% 的人曾因使用危险武器攻击他人而被传唤,而其他两组为 0%。
该如何解释学前班受试者的显著影响?一种可能是,最初的学校经历为以后的行为奠定了基础。那些在教室尝试去计划要做的事、与他人玩耍和协商分歧的人,可能已经养成了终身的个人责任和亲社会行为模式,这些模式在他们的童年和成年早期都很好地帮助了他们。那些在教室里强调学习成绩的人可能已经养成了以成就和出人头地为目标的终身模式,这种模式——尤其是在贫困的情况下——可能会导致与他人的摩擦,甚至导致犯罪(为了出人头地而误入歧途)。
我怀疑每两周一次的家访起到了重要作用。在注重游戏、社交和学生主动性的班级中,那些父母可能已经形成了育儿风格,并在孩子的成长过程中继续强化这些价值观和技能。而在学业培训组中,那些父母可能已经形成了更注重个人成就(狭义)和自私自利价值观的育儿风格,这些价值观对现实世界的成功不是什么好兆头。
---
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
也请看:玩耍精神 和 alternativestoschool.com;并在脸书上关注我。
参考文献
[1] Nancy Carlsson-Paige, Geralyn Bywater McLaughlin, & Joan Wolfsheimer Almon. (2015). Reading Instruction in Kindergarten: Little to Gain and Much to Lose. Published online by the Alliance for Childhood. http://www.allianceforchildhood.org/sites/allianceforchildhood.org/file…
[2] Linda Darling-Hammond and J. Snyder. 1992. “Curriculum Studies and the Traditions of Inquiry: The Scientific Tradition.” Edited by Philip W Jackson. Handbook of Research on Curriculum. MacMillan. pp. 41-78.
[3] R. A. Marcon, 2002. “Moving up the grades: Relationship between preschool model and later school success.” Early Childhood Research & Practice 4(1). http://ecrp.uiuc.edu/v4n1/marcon.html.
[4] Larry J. Schweinhart and D. P. Weikart. 1997. “The High/Scope Pre- school Curriculum Comparison Study through age 23.” Early Childhood Research Quarterly 12. pp. 117-143.
教育的未来:取代小初高和大学的将会是什么?
原文:Education’s Future: What Will Replace K-12 and College? | Psychology Today
自主探索;探索职业;然后……
发表于 2017.11.13|审稿:Jessica Schrader
真相正慢慢地露出其真容。越来越多人开始意识到,强制学校教育系统挥金如土,学生在其爪牙下蹉跎岁月,承受着严重的压力与焦虑。
儿童生来具备各种有助于自我教育的生物学机能。他们充满好奇心,浑身都是干劲,喜爱玩耍与交际。这些自然选择的产物对于教育的功用不可轻视(参见这里)。结果我们在干什么?我们花大价钱(公共 K12 教育每年为每个孩子大约要花上 15000 美元),把他们送到学校里,只为屏蔽他们适宜教育的本能——压制好奇心、掐灭干劲、禁止玩耍、限制交际。之后,用一套奖惩系统,撩拨傲慢,舔舐[羞耻]https://www.psychologytoday.com/us/basics/embarrassment),煽动恐惧,花上好大一股气力,试图施加一番“教育”。而一切都费时费力,徒劳无功。
研究表明,促进青少年天生的自我教育方式,相比于压制这些本能,成本更小,痛苦更少,结果更好(见这里和这里)。更多家庭正意识到这点,并且想方设法把他们的孩子从强制教育的牢笼中解救出来,转而投身自主教育(见这里)。
孩子的前十二年人生要小学初中高中一路读过去,似乎已经成了常理,好像教育是层次分明的工厂,学生只要沿着流水线学过去就好。我之前撰写的教育相关文章,基本都围绕这个过程展开。我也解释过,Sudbury Valley 和其他面向自主教育优化的环境中,将整套分级系统弃之不顾,让年轻人不论年龄任意群聚,不论时间按其兴趣学习实践的做法,为何效果绝佳(比如这篇和这本书)。
但对于我们称之为“高等教育”的教育阶段,尤其是本科四年来说,情况又如何呢?迫于家庭社会压力,许多年轻人基本把大学看作是必经之路。对他们而言,大学只是高中的延伸,是第 13,14,15,16 年级(译注:高四、高五、高六、高七)。而且大学教育的几年,远比之前更加昂贵。学费或是由家长支付,或是要学生背债,花上数十年还清。更糟的是,越来越多的证据表明,高等教育中学生所学甚少。归根结底,大学是社会准许的歧视系统。
有位大学教授,Shamus Khan,他对自己的行当颇有看法:「我置身于学历作坊之中。… 大学入学已经偏袒美国人了。他们甚至也不必学多少东西,做多少事,四年结束后就能拿到证书,从而有权获得更高收入。学校糊盖住了美国社会的贵族性。与生俱来的特权(显然是不公平的)经过改头换面,化作一纸履历(貌似是才能的证明)。」[1]
近来有研究表明,学生在大学时期实际上所学无几。按照教育系统的设计,大学教育是学生花力气花钱拿到手的一件货,成本越少越成功。我在十几年前上大学的时候就这样了,今天尤甚。研究表明大学生每周平均学习时间,从 1960 年的 25 小时下降到了现在的 12 小时,而且如果课程要求大量原创写作,广泛阅读,现在的学生倾向于不选这些课。[2]
大学管理者总是辩解道,读大学的主要好处是培养批判性思维能力,然而系统性研究已经证明,大学生批判性思维能力的提高微乎其微,甚至对于 45% 的大学生来说,他们丝毫没有长进。[2] 我目前没有找到证据来说明,同一个人或类似的一群人,把四年时间用来读大学而不是拿来干别的事,批判性思维能力有更显著的增长。在 PayScale 公司最近开展的一次调查中,50% 的雇主抱怨道,他们雇用的大学毕业生完全没有做好就业准备,而最主要的一点是,这些毕业生恰恰缺乏批判性思维能力。[3] 可能原因是原本猖獗于高中的死记硬背,现在逐渐蔓延到了大学。根据我自己的观察,批判性思维的成长,主要来自于追求自己的兴趣,以及与志趣相投者开展深入而主动的对话,而非普通的上课念书。
我不知道转变会何时到来,以何种形式,我只知道传统 K-12 和四年制大学教育时日无多,教育界将会回到理智,探寻出路。我预测未来教育将分为以下三个阶段:
第一阶段
发现:了解你的世界、你的自我,以及这两者如何契合。
根据这种观点,在理想情况下,人生前 15 到 18 年首要的是自主探索与游玩。这样年轻人才能逐步理解身边的世界,尝试各种处世之道,寻得志趣激情并不懈追求,同时至少有尝试去谋划如何支持自己成人自立。那些自主学习的人,在针对自主教育设计的学校或学习中心学习的人,或者在家里或社区中开展自主教育(一般称作「非学校教育」)的年轻人,已经实现了这点。我希望的是,在未来,公共支持的学习娱乐中心,能够将这样自主教育的能力赋予所有人,不论贫富(这篇)。
第二阶段
探索职业道路。
我们目前的教育系统有一个问题,就是学生历经 17 年寒窗苦读,大学都读完了,结果却对可能的职业道路毫无了解。他们亲眼观摩过的成人职业只有教师。学生可能会出于某种原因立志成为医生,或是律师,或是科学家,或是商业经理。他们可能觉得这些职业貌似受人尊敬,光鲜亮丽,但实则对每个职业的实际情况一无所知。
在我所想象的合理的教育系统里面,学生应该有机会在真实世界中工作。这样他们才能明白不同职业的内涵,以备之后接受专业训练。比如说,如果有人想要成为医生,他应该在医院工作上一段时间,当当护理员或助理。这份工作可能是正式的实习,并涵盖一些课业,也可能只是普通的工作。由此一来,他就能目睹医生日常工作的状态,并与他们交流,从而亲身体会医生这份职业。之后他就有底气来斟酌是否将医生作为毕生事业了。我喜欢待在医院里帮助病人吗?若要成为医生,我有足够的同情心、果决与智慧吗?如果答案是否定的,那就应该换条职业道路了。
其他行业也同样适用。对法律感兴趣的人,可以在法律工作室工作;想成为科学家的人,可以当实验室助理或现场助理员;想成为工程师的人,应该当工程师学徒。由此一来,他们接受了更广阔的教育,获得了真实世界的经验,还能得到一笔收入,而不必欠一屁股债。这个过程中,学生能够与相关领域的专业人士互相沟通,而这些人可以给学生写推荐信,帮助他们申请进阶训练或升职。
很多公司已经注意到,典型的大学教育无法培养他们需要的人才。为此他们开发了各种学徒项目。根据美国劳工部统计,美国国内的学徒项目数量,从 2011 年的 35 万跃升到 2015 年的 45 万,并持续抬升中[4]。举个例子,宝马在南卡罗来纳州斯帕坦堡开设了培养工程师的学徒项目(参见这里),而且不止一家商业保险公司开设了培养公证师和承保师的学徒项目(参见[这里]https://www.thesimpledollar.com/why-you-should-consider-trade-school-instead-of-college/)——这些工作先前都需要大学文凭。
第三阶段
为专业化工作接受认证
有些工种不能糊弄了事,其从业者往往必须完成专业训练,过程中要由专家指导,并接受严格测试来评估能力。与外科医生、牙医、律师、电工、水管工打交道时,我希望他们是已经接受认证,获得许可的,并且这个过程能证明他们的能力。在我构想的教育系统中,只有这个阶段必须设置考试。获得认证是这些职业的学徒工作的重要目的,不过也可以通过在专业学校中进修来完成,比如医学、工程学或者其他职业学校。假设一位年轻女性立志成为医生,并已经当过助理医生来探索这个行业,而现在要申请医科大学。这时候她需要证明她了解医生这门职业,并且准备充分,可以接受训练。完成大学学业后,她需要证明她已在她选择的医学专业领域上积累了足够能力。
总结
我认为在这样的系统下,会少些闷闷不乐的医生、律师、商业经理,多些乐意从事这些职业的人。
我将其描述为未来的愿景,但未来已经在路上。我说过,越来越多的家庭,在寻找替代传统 K12 教育的方案,而越来越多的公司发现,不用大学文凭判定能力,而通过学徒制等手段自己训练员工,是更好的选择。这些家庭和公司仍然是少数,但队伍在不断壮大。
若这一愿景成为现实,现有的教育机构怎么办呢?划分年级的 K12 学校将会消失不见,取而代之的是不同年龄人群混杂的学习中心来支持自主教育。大学不会消失,并仍然接受公众支持,但主要充当研究中心,并且不再像今天一样招收「学生」,而是招收助理和学徒。他们可能继续深造,成为成熟的科学家与学者。社区大学在今天看来很有用,能够以低廉的价格提供面向不同职业的实践性强的训练。因此社区大学可能会扩大规模,成为学徒系统的一份子,提供需要在课堂开展的训练 。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
\1. Erik Hayden. Study says college students don’t learn very much. The Atlantic, Jan. 18, 2011.
\2. Richard Arum & Josipa Roksa. Academically Adrift: Limited Learning on College Campuses. Chicago University Press. 2011.
\3. Douglas Belkin. Exclusive test data: Many colleges fail to improve critical thinking skills. The Wall Street Journal, June 5, 2017.
\4. David Paulson. Apprenticeships: College without debt. USA Today, March 23, 2016.
所谓「暑假滑坡」的真真假假
原文:Facts and Fiction About the So-Called “Summer Slide” | Psychology Today
孩子在暑假真的学得少吗?什么学得少?
发表于 2017 年 7 月 22 日
每到夏季,教育专家就会提起学业训练中的「暑假滑坡」现象(比如这篇和这篇)。他们的说法是,过完暑假,学生就把学校学的东西忘光了,到了秋季必须把课补上,这会浪费不少时间。有些人认为,为避免这种滑坡,学校应该在夏季继续开展教学!我每次听到暑假滑坡,都会想到这样一些问题和想法:
如果仅仅经过夏季的几个星期,孩子就忘记了学业技能,那么他们真的学到了这些技能吗?估计学习得不怎么牢固(详情请参照 Kerry McDonald 写的这篇文章)。
如果学校教授的技能这么容易遗忘,那么学生毕业离校生活后又会怎样呢?那时候这些技能不会忘掉吗?如果为了保证他们不忘掉那些技能,我们要迫使学生整个夏季都待在学校里,那么也许我们应该强迫所有人一生都呆在学校里,否则他们会把这些技能统统忘掉!
讨论暑假滑坡的人经常假定,唯一重要的学习,就是学校里的学习,通过学校考试衡量的学习。竟然有很少人会质疑这种假定,我对此非常惊讶。我在我的书和这一系列文章里都论证过,人生最重要的经验,是老师教不了的,只能在现实生活中习得。在现实生活中,我们学会怎么自己做决定,怎么安排自己的活动,怎么真正做一些事情,而不是记住。对学生来说,夏季是沉浸在现实生活的时间。学校充其量就是让学生准备好上更多的学。而现实生活让学生准备好度过现实生活。
关于暑假滑坡的主张,让我对相关数据感到好奇。学术界真的揭示了暑假会导致学校学习的技能遗忘吗?我花了几天研读文献,而我找到的材料证明,我们听到的关于暑假滑坡的许多说法都是谬误。
与暑假滑坡相关的研究已经延续了 100 年之久。赞成学期应延长到夏季的那些人,他们引用的研究基本上都是数十年前开展的(相关综述请参见 Cooper et al. 1996 年)所以我阅读了这些研究。总的来说,研究证明,按照标准学业能力测试,暑假期间的学业能力增长和下降基本持平。大部分研究关注的是阅读能力和数学能力。虽然不同研究之间结果不太一致,大部分研究证明,在夏季阅读能力没有明显变化,也没有明显提升。问题似乎出在数学上,不少研究说明数学能力出现了较大下降。我就好奇了。是各种数学能力都下降了吗,还是只有部分数学能力?
在暑假,数学计算能力下降了,但是数学推理能力上升了。
我发现有三项研究使用了分别考量数学计算能力和数学推理能力的测试,在暑假前后测试了学生,这些研究都说明,暑假过后,学生的数学计算能力有轻微下降,但是数学推理能力大幅提升了!我并不意外。
计算测试评估了正确计算加减乘除的能力(不使用计算器)。比如一个比较简单的问题是「58 + 44 = ?」比较难的问题如「5.291 x 8.3 = ?」学校里学生学习这种计算步骤基本靠死记硬背,而并不理解为何这样计算。死记硬背学来的材料,不加练习就很容易遗忘。现在,出了学校后几乎没有人会做这种计算;我们都会用计算器或者计算机来算。
数学推理测试评估了学生对数学概念的理解水平,以及他们利用这些概念解决问题的能力。这种测试,相比计算所需的死记硬背,当然需要理解更加深刻的知识。典型的简单问题如「如果一加仑的油漆能涂满 200 平方英尺,那么一间 20 英尺长,15 英尺宽,9 英尺高的房子,涂满四面墙需要多少油漆?」这个问题需要进行一些计算,但首先你需要弄明白你需要计算什么。
这三项分别考察计算和推理的研究的结果如下。
Parsely & Powell (1962 年) ,在学年末对俄亥俄州 Willoughby-Eastlake 公立学校的一至六年级学生开展测试,之后又在下一学年初进行测试。在计算测试上(他们称之为「基础」),他们发现每个年级的变化规律都有所不同,但总的来说,经过暑假后没有明显的增减。在推理测试上,大部分年级的学生在经过一暑假后有了显著提升。当我对所有年级计算数学推理能力的平均提升,结果是相当于 0.24 学年。换句话说,他们在暑假学到的,相当于他们经过四分之一年的学校学习所学到的。六年级学生展现了最大的提升——相当于 0.55 学年。
Grenier (1973 年)在学年末测试了乔治亚州 Griffin 的公立初中七年级学生,之后对一部分人在下一学年的头几天,另一部分人在学年开始两周之后测试。她的数学测试包括三个部分:计算、概念、应用。我在此将概念和应用部分的分数合起来,作为数学推理的成绩。这是 Grenier 得到的结果。在计算上,他发现假期结束之后立即测试的人,出现了相当于 0.22 学年的下降,然而两周之后测试的那些人,出现了相当于 0.1 学年成绩上升。所以计算部分是有暑期滑坡的,但只要上两周学,这部分损失就补上了,甚至还提升了一点。换句话说,在三个月的暑假里,他们的数学推理能力进步了将近半学年。
Wintre (1986年)测试了多伦多一、三、五年级的小学生,在学期末以及下一学年处的表现。我无法把她的研究与其他研究直接进行比较,因为她只报告了每项测试的原始平均分,而没有换算到相应的学年。但她结果展现的模式与其他两项研究相同。综合考虑所有成绩,她发现数学推理能力上有显著提升(平均分有 5.4% 的提升),而数学计算能力上有轻微下降(-1.7%)。她也测试了常识和阅读理解,并发现这两项均有显著提升,分别为 +5.2% 和 +6.2%。
什么能力是更重要的?是精确手算的能力(现实世界没人在意这个),还是理解数学概念并应用到实际问题的能力?前者在学校比在暑假增长得更快;后者在暑假比在学校增长得更快。
所以,假如不放暑假,我们会得到很多懂得做计算,但不懂除了通过考试之外为什么要做计算的毕业生。当然,他们毕业后也会忘记怎么做计算,这就是不上学便会丧失的技能。
也许,与其延长学年来降低计算能力上的暑假滑坡,我们更应该延长暑假,来降低推理能力上的学期滑坡。
在结尾之前我必须声明,所有这些关于暑假滑坡的担忧,都与经济条件不好家庭的学生与其他学生之间的差距有关。实际上贫穷家庭出身的学生,相比更富有家庭出身的学生,经过一暑假后在考试上忘的比学的更多。这个问题很严重,因为这是一些贫穷家庭出身的年轻人无法从事那些需要更高水平教育的部分原因。下一篇文章我会考虑这个问题。敬请关注!
-----------------
Source: Basic Books,已授权
此时此刻,你对这一切有什么看法?你支持延长学年,还是缩短学年?如果孩子们没了暑假会失去什么?得到什么……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点,都会被我以及阅读这篇文章的所有人尊重,并认真对待。请在评论区发表评论,不要发送私人邮件给我。在这里发布,你能和更多人分享,而不仅仅跟我分享。我会阅读所有评论,并努力回答所有认真的问题,如果我能说些有用的话。当然,如果你有独属你我之间的话,请发邮件给我。
参考文献
Cooper, H., et al. (1996). The effects of summer vacation on achievement test scores: A narrative and meta-analytic review. Review of Educational Research, 66, 227-268.
Grenier, M-A. (1975). An investigation of summer mathematics achievement loss and the related fall recovery time. Doctoral dissertation, University of Georgia, 1975. 可在 ProQuest Dissertations 与 Theses 获得。
Parsley, K. M., & Powell, M. (1962). Achievement gains or losses during the academic year and over the summer vacation period: A study of trends in achievement by sex and grade level among students of average intelligence. Genetic Psychology Monographs, 66, 285-3
Wintre, M. G. (1986). Challenging the assumption of generalized academic losses over summer. Journal of Educational Research, 79, 308-312.
强制学校教育、焦虑,与所谓的「学习障碍」
原文:Forced Schooling, Anxiety, and "Learning Disorders" | Psychology Today
作者:彼得•格雷 发表于 2021.3.28 | Reviewed by Hara Estroff Marano
早期学业压力会造成学习障碍,即医学中失调症的一种。
我们的学校系统建立在一个极其错误的假设上:所有同龄的孩子应该在同一时间,用同样的方式,学同样的课程。这样只会给学生带来无尽的痛苦。最近几个世纪里,学校对学生的管控越来越严,完全无视学生的个性和兴趣。但并不是所有学生都服从于管控,因此那些不服从的学生就被贴上了「学习障碍」的标签。学校的官僚永远也不会承认学校系统是病态的、变态的、不利于人的发展的。官僚们回避学校的错误,与此同时给孩子们贴上学习障碍的标签,比如 ADHD、阅读障碍(dyslexia)、书写障碍(dysgraphia)、算数障碍(dyscalculia)。心理学界也被其裹挟,只得把这些所谓的「障碍」算作种种疾病,并加上种种诊断标准。
我在之前的一篇文章中提到,很多人认为每种学习障碍意味着大脑存在缺陷,甚至是特定的认知缺陷,但目前的研究证明不了这点,被贴上这些标签的孩子,都是智力正常甚至中等偏上的,只是他们按照学校的教学进度和教学方法,学不进去(证据请见 Benson et al., 2020)。我在之前另一篇文章中写到,有些传统学校中的孩子被诊断为阅读障碍后,被学校开除,转而在家自学。针对其中 10 个孩子的问卷发现,这些孩子刚离开学校时,他们在阅读时焦虑很严重,甚至抗拒阅读。过了一段时间,当这些孩子不再有被迫阅读的压力,他们开始表现出对阅读的兴趣,还愿意因此接受帮助。
被贴上「学习障碍」标签的孩子更容易焦虑,进而影响学习
多个研究结果一致证明,被贴上某种「学习障碍」标签的学生焦虑水平比其他学生高的多,尤其是对学业本身的焦虑(Nelson & Harwood, 2011; Panicker & Chelliah, 2016)。不出预料地,大量研究证明焦虑会影响学习(summarized in Gray, 2013)。学校,是产生焦虑的根源,而且它几乎就是为此而设计的。想象你是个敏感的小孩,出于各种原因,在学校的阅读课中,你在学习如何发音上不及你的同学。(实际上,我无需想象这样的场景,我亲身经历过。在低年级时我是班上水平最差的阅读者之一,这曾令我很尴尬。)你被要求在那些看起来水平比你高的孩子们面前大声朗读。你僵住了。你想尖叫,你想逃跑,但你不能,不管老师多和蔼可亲都不能。而且,和蔼可亲的老师往往带来更糟糕的结果,因为你不能归咎于他/她——于是错全赖你。
想象一下,你是个非常焦虑的孩子,一见到字就手足无措,之后被诊断为阅读障碍。这个结果可能让你长舒一口气:「所以我不笨,我只是大脑有些地方有问题,以至于读不了书。」但这种解脱很是古怪。你不会因此而愿意阅读,而是开始觉得「我不是读书的料,不用费劲了」。诊断结果能让你感觉好些,但对你的阅读无济于事。当你出于某种压力而必须阅读时,那种焦虑就会表现为讨厌阅读。事实上,针对这些孩子的问卷显示,他们会声明「我讨厌阅读」。而那些真正克服阅读障碍的孩子,靠的是离开学校后的自主教育,或是一个相对放松的家教环境。他们不再有压力了。没人再计较你的阅读水平,你对人们的价值取决于你是谁,能做什么,还取决于你的善良。阅读不是生活的全部。在学校,学习有两三成都取决于阅读水平,但在别的地方却并非如此。此外,阅读焦虑随着离开学校而渐行渐远,在一段时间后,孩子们又会重拾阅读。
此处我主要论述阅读技能,因为它对于在学校成功而言是最重要的技能,而且阅读障碍是最常见的学习障碍标签。但其他学术领域也是同样存在类似的问题。一些人还害怕数学(事实上,有很多学校导致数学恐惧症的证据,这是在美国最常见的恐惧症,见 Burns, 1998),或者是一写作就害怕。
学前班的儿童患上「学习障碍」的比例要比待在家里的对照组更高。
还有一个原因导致越来越多的孩子被诊断为学习障碍。孩子开始接受学业教育的年龄越来越小,压力也越来越大。目前,几乎整个社会都认可一条假设:在孩子年龄越小的时候教育孩子,孩子学得越好。有多个研究证明这条假设是错的,但我们依然视而不见,一意孤行。许多严谨的实验(这里)证明了,尝试通过在学前班或幼儿园教授学业知识,所谓让孩子赢在起跑线上,只会适得其反。三年级的孩子中,没接受过早教的孩子,远比接受过早教的孩子,在学习、社交和情绪管理上表现要好。
这里有一项研究,不仅考察了早教对整体学习能力的影响,还研究了最终有多少儿童被诊断出特定的学习障碍。这是田纳西州幼儿园的研究(Lipsey et al., 2018)。我在前一篇文章中(这里)描述过了,但现在我想在这里呈现一些更详细的结果。
这项研究起源于田纳西州资助一项针对低收入家庭的孩子的学龄前(Pre-Kindergarten)教育项目。范德堡大学的研究者开始研究这一项目对孩子的影响。由于项目的申请者比名额多,所以通过随机分配来决定录取哪些儿童。那些没有被录取的儿童则是这项研究的控制组。研究者们发现,那些录取的儿童在一开始上学前班时,学业成绩要比控制组的儿童更好,但这点优势很快就消失了。到了三年级,那些录取者不仅在学业上,而是在方方面面都比没有被录取的儿童糟糕。显然,哪怕你身陷贫穷,为了你的最终学业发展着想,待在家里,也比参加这个面向学业的学前班项目要好。
那些参与项目的孩子不仅仅在学业上整体表现较差,而且大多数孩子到了三年级时确诊了学习障碍。实际上,到了三年级,学前班的学生确诊患有特定学习障碍的可能性,比对照组高 46%,而确诊为智力超常的可能性则降低了 43%。因为这些儿童是随机录取的,并且差异具有统计显著性,所以这些差异并非由先天的大脑差异引起;这是学前班所造成的有害影响。这是第一个在实验中记录到的对学习障碍或智力天赋的影响,但这只是因为这是第一个去检查这种影响的实验。我敢打赌,这种影响早就发生了,并且无处不在,不论是学前班,还是幼儿园,是一年级还是高年级。一旦我们在强制条件下,强制孩子去学习那些于他们而言无聊且无意义的学业知识,孩子就会感到焦虑,并在学习这些学校想教授的技能上遇到学习障碍。
很明显,这些研究并没有得到学校的重视。把头埋进沙子里比正视学生的问题并做出改变容易得多。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
Benson, F. N., et al (2020). A national survey of school psychologists’ practices in identifying specific learning disabilities. School Psychology, 35, 146-157.
Burns, M. (1998). Math: Facing an American phobia . Math Solutions Publications.
Gray, P. (2013). Free to learn: Why releasing the instinct to play will make our children happier, more self-reliant, and better students for life. Basic Books.
Lipsey, M., Farran, D. & Durkin, K. (2018). Effects of the Tennessee prekindergarten program on children’s achievement and behavior through third grade. Early Childhood Research Quarterly , 45, 155-176.
Nelson, J., & Harwood, H. (2011). Learning disabilities and anxiety: A meta-analysis. Journal of Learning Disabilities, 44, 3-17.
Panicker, A., & Chelliah, A. (2016). Resilience and stress in children and adolescents with specific learning disability. Journal of Canadian Academy of Child and Adolescent Psychiatry , 25: 17-23.
反对教育根本变革的力量
原文:Forces Against Fundamental Educational Change | Psychology Today
为什么教育变革必然发生在学校之外。
发表于 2008 年 8 月 27 日
在之前的文章中,我提出了支持以下主张的证据:(1)在我们作为狩猎采集者的漫长历史中,孩子自己玩耍和探索的本能为教育提供了基础(8 月 2 日的文章)。(2)如果为孩子提供一个支持他们玩耍和探索本能的环境,现在的孩子可以自我教育并且会做得很好,无需胁迫或成人的催促或指导(8 月 13 日的文章)。(3)传统学校之所以成为今天这个样子,是因为历史境况导致人们贬低了玩耍,认为儿童的任性必须被根除,并认为包括学习在内一切有用的东西,都需要辛劳(8 月 20 日的文章)。
如今,已有许多人认识到自由玩耍和探索的教育价值,遗憾的是,孩子们很少有机会进行这样的活动。人们相信,孩子们的任性对他们的发展、教育和生活乐趣具有积极作用。然而,学校教育仍然如以往一样。事实上,传统学校教育及其他成人主导的类似活动,占据了孩子们越来越多的时间。为什么扭转这一趋势如此困难?为什么在学校体系内实施根本性的改革如此艰难?我并不敢妄自认为知道这个问题的全部答案,但以下是我的一些想法,列出了一些导致教育体系难以根本改变的力量。
传统学校教育的常态化
正如社会心理学家经常指出的那样,人们会竭尽全力表现得像正常人。如果我们的行为与常态不同,其他人可能会排挤我们,而作为社会动物,没有什么比被排挤更糟糕的了。如果某个文化中的所有人都给女孩子裹脚,基本上就是让她们残废,那么即便那些不相信这种做法的父母也会这样做,以免她们的女儿看起来古怪。如果社区里所有的孩子都去传统学校上学,那么不去传统学校上学的孩子可能会被视为怪胎,而父母也可能被认为不仅古怪,而且失职。
作为我们今天在多大程度上认同孩子应该接受传统学校教育的一个证据,试着听听任何一个成年人与刚认识的孩子之间的对话(或尝试进行的对话):「你上几年级?」「你最喜欢哪个科目?」「你喜欢你的老师吗?」「你期待开学吗?」。我们需要找到全新的方式与那些不上这种学校的孩子交谈。
新型学校所依据的原则,与传统学校截然不同,因此吸引到的学生也相对较少,因为即使是那些相信这些原则的人,也害怕因做出看起来「异常」的事情而受到影响。如果孩子们决定去这样的学校,需要大量的社会支持来抵消这种恐惧,而他们的父母则需要更多这样的支持。
传统学校教育的自我实现预言
传统教育推广的思维和行为方式,使其自身的前提变成了自我实现的预言。这些前提看似正确,是因为我们在传统教育背景下,依据这种教育所建立的标准对其进行评估。
以下是这类前提的一个例子:「学校需要激励孩子学习」。我遇到过很多家长,他们认为,像瑟谷学校这样的非传统学校只适合「自我激励的孩子」,但不适合他们的孩子,因为他们的孩子「缺乏自我激励能力」。孩子们自己也经常这么认为。他们会说类似这样的话:「我需要教师来督促我,否则我整天什么都不会做。」为什么我们的文化里,人们普遍认为,如果让学龄儿童自己安排学习,他们就不会学到什么东西呢?几乎没有人会对学龄前的孩子有这样的看法(7 月 23 日发布),而狩猎采集者不会这样看待任何年龄段的孩子(8 月 2 日发布)。
人们普遍认为学龄儿童缺乏自主学习动力,其中有个原因是我们的文化普遍接受了学校体系对学习的定义。如果学习被定义为完成学校作业或类似于学校作业的工作,那么确实可以说,那些接受「非学校教育」的孩子们,或是就读瑟谷学校的孩子们,在「学习」方面花费的时间很少。相反,他们把时间花在玩耍和以不可预测的方式探索,顺带地掌握了文化中的知识和技能。
另一个导致这种认知的原因是,那些在传统学校度过一天,参加考试和做自己不喜欢的作业的孩子们,在一天结束后,可能会选择利用空闲时间放松、休息或释放压力,就像他们的父母在度过紧张的工作日后所做的一样。这妨碍了孩子们充分投入到我们更容易认为具有教育意义的游戏、探索和交谈之中。
另一个自我实现的学校预言是:在学校表现优秀预示着后续成功。我们通过为孩子们建构一个世界,将「成功」基本定义为在学校表现优秀,使这一预言成为现实。孩子们的任务是在学校取得好成绩,而这会带来许多奖励。好成绩是晋升到分级学校体系的下一层级的标准,也是进入「荣誉榜」、获得参加体育比赛资格、进入大学、获得热门社团提名、受到许多成年人表扬等等的条件。因此,当然,在这些成功标准下,学校表现优秀(以成绩衡量)预示着后续的成功。
我们也经常被各种统计数据轰炸,这些数据显示受教育年限与职业成功(以收入为衡量标准)之间存在相关性。但是这些相关性存在许多与学习无关的原因。以下是其中的三个原因:
(1)我们建构了这样一个世界:某些高薪工作,如法律、医学和商业管理,通常要求一定年限的高等教育。在这样的世界里,受教育年限和收入不可避免地存在关联。
(2)我们建构了一个世界,其中「成功」或多或少地被定义为年轻时的好成绩和之后的高收入。在这样的世界中,那些渴望追求成就的人,按照传统标准,会为了在学校获得高分数和在成年后获得金钱而努力工作;于是,瞧,相关性就产生了。我们还建构了这样一个世界,很少有人不去传统学校上学,因此父母和孩子很难找到通过其他途径取得成功的榜样。
(3)富裕家庭的孩子可以负担更多的学费,所以他们获得更多的教育。富裕家庭的孩子也有更多获得高薪工作的机会,因为家庭关系和许多其他优势,这比贫困家庭的孩子要容易得多。这也有助于产生受教育年限和后续收入之间的相关性。
由于这些原因以及其他原因,在我们所建立的世界中,教育与「成功」之间的总体相关性是不可避免的。从统计学的角度,我们无法确定这种相关性是否与在学校实际学到的东西有任何关系。
教育产业的根深蒂固
另一个抵制教育系统根本变革的原因,与庞大、根深蒂固的教育体制有关。在美国,目前有 680 万人以教师身份谋生(美国人口普查局)。与普遍认识相反,教师的薪酬通常高于普通白领或专业工作的平均水平(Greene & Winters, 2007),并提供许多其他福利,包括常见的工作保障、优越的养老金计划和大量的假期。为传统学校培训教师的教育学院占据了高等教育机构的很大一部分。教材行业同样庞大且利润丰厚。教育系统的彻底变革将颠覆这一切。这样的改变将消除我们对目前定义的教师的需求。这也将消除我们对教育学院的需求,以及大部分(如果不是全部)对教材的需求。
在我们的文化中,许多人出于经济利益,不仅要保留,甚至要扩大传统教育。我们要求年轻人上学的时间越长,就可以雇佣更多的教师、学校管理者、教育学教授以及教材作者和出版商。教育产业就像其他任何产业一样;为了那些从中获利的人,它始终在努力扩张。
教育产业因微小的变化和潮流而欣欣向荣。关于如何激励孩子学习的新观念、新课程以及教授旧课程的新方法(如「新新新数学」),都为教育学教授和教材出版商提供了工作机会。但是,像我在此博客之前的文章所讨论的那种根本性改变,将颠覆一切。
循序渐进的改变是行不通的
我一直在谈论的学校改革的另一个障碍在于,它无法在一个学校或教育系统内逐步实现。这种变革需要一种范式转变,从教师主导教育过程转变为每个学生真正主导自己的教育。你无法一点点进行这个改变。只要教师制定课程大纲,无论他们在大纲内提供多少选择,学生都会认为决定学什么是教师的工作,而不是他们自己的工作。只要教师评估学生的进步,无论他们如何评估,学生都会认为他们的任务是满足教师的期望,而不是确立并满足他们自己的期望。
实际上,在传统的学校体系中增加更多选择和不太明确的评价方式,可能会对学生的生活增添更多压力。在这种「自由化」变革之后,每个学生的任务就变成了猜测老师希望他们做什么,并猜测真正的、未说出口的评估标准。学校变成了一场「读心术」的练习。我个人认为,在传统的学校体系内,最温和的教学方式是尽可能清晰地说明要求和标准,这样学生就可以以最小的恐惧去满足这些要求和标准,而不用担心自己正在学习错误的东西。
在传统的学校制度中,你也无法一门一门课地逐步去除评估。假设你在课程中引入一门不打分的课程。你会发现,即使学生想要学,大多数学生也不会在那门课程上做任何事情。在其他课程都打分的制度中,未打分的课程被认为是无关紧要的。如果其他课程都打分,好学生怎么能为没有打分的课程投入时间呢?要改变这种心态,整个系统都必须改变。
改变将如何发生
不过,教育的根本变革正在传统学校体系之外发生。它发生在那些决定让孩子进行「非学校教育」(即以自由的方式在家教育孩子,没有课程和评价)的家庭中,以及那些创办类似瑟谷学校模式的非学校教育机构的人们中。这些运动中的人们在彼此之间建立了一套新的社会规范,使他们能够克服以看似异常的方式行事的障碍。他们观察到那些正在自我教育的孩子,从而以崭新的眼光看待教育,将其视为值得欣赏、享受的东西,但不应控制孩子。他们开始看到许多在传统学校体系之外自由快乐地接受教育,并在各种有意义的成功定义下过上成功生活的例子,因此理解了传统学校的自我实现预言的本质。
我们没有理由对教育的未来感到气馁。我们只需意识到真正的改革不会在现有的学校体系内发生。它将继续在该体系之外发生。逐步发生的变化是越来越多的人会选择退出传统学校教育。为了让这种情况发生,我们需要确保人们有合法权利选择退出。在政治层面上,这应该是我们这些期待孩子能自由、快乐地成长,充分体验民主及其相关权利和责任的人最优先考虑的事项。
----------------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
----------------
学校如何伤害学生?Kirsten Olson 列举了几种途径
原文:How Does School Wound? Kirsten Olson Has Counted Some Ways | Psychology Today
Kirsten Olson 博士的访谈记录:学校造成的七种伤害
发表于 2011 年 7 月 28 日 | 审稿人: Ekua Hagan
Kirsten Olson 博士是一位教研员、活动家、顾问、作家,她关爱儿童,钻研学习,还密切关注学校状况。同时,她还担任 IDEA(美国民主教育研究所)董事会主席等职务。
几周前,我第一次见到她。我们共进午餐,交谈了一番。之后,我如饥似渴地阅读了她的新作《被学校所伤:重拾学习的乐趣,对抗落后学校文化》(Wounded by School: Recapturing the Joy in Learning and Standing Up to Old School Culture)。如果您曾经上过学,或者有孩子正在或即将上学,或者关心在校儿童,我力荐此书。
《被学校所伤》一书是 Olson 在哈佛大学攻读教育学博士学位期间开始的研究的成果。作为热爱学习、一直十分敬重教育的人,Olson 原本打算研究人们在学校教育过程中体验到的喜悦与启迪。为了了解这些积极影响,她开始采访人们。但她发现,人们谈论的反而是学校带来的痛苦。Olson 的博士生导师 Sara Laurence-Lightfoot 在该书前言中这样写道:
「首次探索这一领域时,她进行了几次深度访谈。这些访谈的对象包括获奖建筑师、杰出教授、才华横溢的作家、营销高管。本来,Olson 以为会听到快乐而富有成效的学习经历,听到不乏严肃、有冒险也有快乐、有工作也有玩耍、伴随着渴望与承诺的校园故事。事实却恰恰相反,在受访者对学校生活的生动回忆中,她发现了痛苦、失望,甚至愤世嫉俗的阴影。在期待中的光明之地,她却发现了黑暗。受访者们的故事里不仅提及了那些早已愈合的旧伤疤,也讲述了那些至今依然疼痛未愈的深切伤口——这些伤口至今依然损害和扭曲着他们的自我认知,不论是作为个人还是作为专业人员。」
随着访谈不断深入,Olson 开始采访各个年龄段的人。下至学龄儿童,上到爷爷奶奶辈,受访者来自各种社会经济背景,从事各种各样的职业。人们谈及校园经历时仍然倍感伤害,其情之真、其伤之深令 Olson 动容。于是 Olson 开拓了一种方法,以便直接理解学校对心理发展的影响:她请那些上过学校的人回答「学校如何影响了他们」。
在书中,Olson 将这些伤害分为七类,并引用她的采访来详细阐述。然后,在书的后半部分,她描述了充满关爱的父母、教师和学生自己可以采取什么样的措施来帮助预防和治愈这些伤害。本文中,我将列举并用自己的话简述 Olson 所述的七个类别。(我在描述每种类型的伤害时加入了自己的理解,所以如果你发现描述有误,大概率是我的错,而不是 Olson 的。)
前四种的伤害主要源于学校对学生行为和学习的限制——预设的课程、有限的几种可被接受的学习方法、每个问题只有一个正确答案的考试,以及,学生没有参与制定且往往专横武断的校规。这些伤害的类型分别是:
-
伤害一:创意丧失。学校扼杀创造力。这或许是学校最明显的伤害之一。学生自己的激情和兴趣通常被忽视。学生们独特的、创造性的解决问题方式以及超越常规的答案,因不符合老师的标准答案而不被理解,老师们匆匆看一眼就判错。死记硬背的学习方式和每个问题只有唯一正确答案的考试,无法给创造力提供任何空间。Olson 的受访者中,那些过着创作生活的人们,往往是尽管受了学校教育还保留了创造力,而绝不是得益于学校教育而富有创造力。他们不得不恢复或重建创造性精神,挽救曾经自然而然就具备却被上学经历伤害了的创造力。我自己的猜想是,总体上,有太多人在学校失去创造力后,就很少再考虑创造力这回事了;他们甚至可能没有察觉到受了这种伤害。另外有一些人在学校教育未覆盖的领域依然保有创造力,但一涉及学校课程的统治区域,就会变得缺乏创造力。有多少人因为学校的教学方式而完全失去了数学创造力?
-
伤害二:一味顺从。在学校中,学生必须不断遵循一系列规章制度,而他们没有参与这些规章制度的制定。同时,他们还得完成与自己的学习需求毫无关联的作业。学生通常不能质疑这些规则和作业;如果他们这样做,他们就是自作聪明,或者更糟。为了避免惹麻烦,他们学会了盲目服从。在这个过程中,他们逐渐成为民主政治中的糟糕公民。民主需要公民敢于质疑规则、坚持改变不公正或无意义的规则。他们还因为在生活中走得太窄,而伤害了自己。如果不是被学校教导「探索边界是危险的」,他们本可能会选择更宽广的道路。
-
伤害三:过度叛逆。一些学生对武断的规则和作业的反应是反叛,而非顺从。在某些情况下,对于剥夺了他们自由和尊严的学校系统、似乎与学校沆瀣一气的老师,以及顺从安排、讨好卖乖的同学,他们会感到强烈的愤怒。他们可能通过坐在教室后排、讽刺挖苦、公然无视规则、很少或根本不完成作业来表达自己的鄙夷不屑。反叛有时是比顺从更健康的对待方式,但反叛过度可能会造成比顺从更大的伤害。在学校失败可能会切断宝贵的前途。对学校的愤怒可能导致人们远离所有形式的学习。而且,也许最悲剧的是,反叛可能会给自己或他人带来生理上的伤害,特别是当人们将毒品、滥交性行为和犯罪作为自我表达和个性的表现形式时。
-
伤害四:麻木不仁。被学校不断摧残,按照学校的课程表一个接一个地完成乏味的作业,遵循学校的程序,最终会导致思维僵化。Olson 的许多受访者描述自己只要一去学校就会变得「心不在焉」或「思维僵化」。在学校中,思想活跃很少得到奖励,反而是机械地做你应该做的事,永不错过截止日期,会被嘉奖。在某个科目中的表现出色可能以忽视其他科目为代价,这可能会让你在这两门课中分别得到 A 和 F。但是如果你能在两个科目中都做出不够卓越却也还说得过去的工作,你可能会在两门课中都拿到 A。这是学校杀死「运用聪明才智的热情」的众多方式之一。当学生确实表现出热情时,它通常与他们的课程无关。
Olson 提炼出的剩下三种伤害,大致上都是由人们被学校的排名和分类的方式造成的。根据排名,无论被分为优秀、差劲还是普通,人们都会受到各种伤害。
-
伤害五:低估自己。在 Olson 的采访中,一些人描述了他们因为种族、社会阶层、性别或在某项旨在测量智力或能力的测试上的表现,而被人们做出的假设所伤害的情形。在某些情况下,顺从这种假设似乎比反抗来得容易,因此,这种假设变成了自我实现的预言。更普遍的是,一门课程或一系列课程中获得的低分,可能会过早地阻止人们追随他们曾经的梦想。因为十年级的生物课得了 D,一个潜在的生物学家选择了一条不那么理想的道路。一个潜在的作者因为一位英语老师看不到她文章的闪光点或她非传统句式的才华而给了她低于平均水平的成绩,从而得出专业写作超出了她能力范围的结论。要是学生们知道,我们社会中曾有多少杰出的大成就者在其获得成就的领域内曾经得过糟糕的学校成绩就好了!要是老师们也知道就好了。
-
伤害六:苛求完美。好成绩和智力测试上的高分数也可能造成伤害。将自我认同建立在高成就上的学生,可能会产生在各个方面都继续保持高成就的巨大压力。对他们来说,即便是某一门课程中的 A- 成绩,或者在班级剧中只获得第二好的角色,或者被顶尖的常春藤联盟学校拒之门外,都可能被认为是可怕的失败——没能达到别人对他们的期望,或他们对自己的期望。完美主义的伤害解释了为什么许多「顶尖」学生在感觉自己必须得到大家期待的成绩时会作弊(参见《学校是培养作弊者的温床》)。当成绩成为完美的衡量标准时,一切都是为了成绩而做。在学校中,「完美」和思维僵化是相容的。关于完美主义的伤害如何干扰真正的教育,我推荐你阅读一年前 Erica Goldson 大胆发表的毕业生代表演讲。
-
伤害七:自认平庸。校领导眼中,既非落后也非优秀的中等学生,可能会遭受到被忽视的伤害。在 Olson 的采访中,这些人形容自己感到卑微,仿佛是无足轻重的人。在最糟糕的情况下,他们形成了自我认同,认为自己是无关紧要的人,不会引起轰动,随波逐流但从不领导。
教育本无需如此大费周章!正如我之前所解释的,教育并不需要强加课程、强制作业或是分数和排名(参见《瑟谷学校的启示》)。在允许学生自主学习的环境中,每个人都有自己独特的兴趣、技能和不足。用统一的标准来评判谁优谁劣是没有意义的。这种学校比我们一直在讨论的标准学校更接近真实世界。现实生活中,我们需要各种各样的人、独特的才能和个性,才能让社会运转,让生活变得有趣。
------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
另一个视角审视学校教育的伤害:我在之前的文章《强制教育系统的七大罪行》中,从一个不同但相容的角度阐述了这个话题。
早期学术训练如何阻碍心智发展
学术技能最好在个人产生意愿和需求时再学习
发表于 2015 年 6 月 3 日 | 审稿人:Jessica Schrader
在我的上一篇文章中,我总结了研究发现,指出过早进行学术训练会对儿童造成长期的负面影响。现在,在这篇文章中,我将深入探讨这种负面影响可能是如何形成的。
在这里,区分学术技能和心智技能(academic skills and intellectual skills)很有必要——儿童权益倡导组织捍卫早期教育最近发表的一篇文章中,Lillian Katz 很好地阐述了这两种技能的区别。
学术技能与心智技能的区别,以及为什么应该先培养心智技能
学术技能,广义而言,是一套经过验证的有效方法,用于组织、处理或应对特定类别的信息,以实现某些特定目标。以阅读为例,学术技能包括能够准确说出字母表中每个字母的名称,能够正确发出每个字母通常代表的音,以及能够根据字母与发音之间的关系朗读单词,即使是遇到新词也能做到。在数学领域,学术技能包括能够熟练背诵乘法口诀,以及运用所学的步骤化程序或算法进行加减乘除运算。学术技能可以,而且确实正在学校中通过直接教学的方式传授,这些教学方法包括示范、朗诵、记忆和反复练习。这类技能特别适合进行客观测试,因为每个问题都有一个明确的正确答案。
心智技能,相比之下,主要涉及一个人的思维方式,包括推理、假设、探索和理解,简而言之,就是他们认知世界的方式。每个孩子天生就是一个知识分子——一个充满好奇、善于理解的存在,不断地尝试理解周围的物质和社会环境。这些技能是与生俱来的,并通过观察、探索、游戏和提问等自主活动得到进一步发展,每个孩子都有其独特的发展路径。试图直接教授心智技能往往会失败,因为这些技能需要儿童通过自己发起的活动,以自己的方式来发展。然而,成年人可以通过营造适当的环境来影响这一发展过程。例如,在一个充满文字和数字的环境中成长的孩子——比如经常有人为他们朗读、能看到他人阅读、参与涉及数字的游戏,以及物品被测量且测量结果有实际意义的环境——会以他们自己的方式理解阅读的目的,以及数字的基本含义和用途。
现在,让我阐明我想强调的关键点。对于那些尚未建立必要的学习动机和认知基础的儿童而言,过早地教授学术技能通常是徒劳无功的,甚至可能产生负面影响。如果孩子们还没有认识到阅读的重要性或价值,他们就不会有动力去学习与阅读相关的学术技能,也难以理解这些技能的本质。同样地,如果孩子们还没有理解数字的概念及其实际应用,他们可能会学会加法的计算步骤,但这些步骤对他们来说将毫无意义。
在缺乏适当认知基础的情况下学习学术技能,其效果必然是浅尝辄止的。一旦训练中断——比如在暑假期间——这些技能就会很快被遗忘。(这就是众所周知的学术能力「暑假滑坡」现象,一些教育工作者希望通过让孩子全年无休地上学来缓解这种情况!)事实上,我们的大脑天生就倾向于保留我们真正理解的知识,而摒弃那些对我们毫无意义的信息。更为关键的是,如果通过死记硬背来学习这些技能,特别是在学习过程缓慢、痛苦且令人感到羞耻的情况下(这在强制学习中经常发生),这种学习方式可能会阻碍真正的阅读能力或数学思维所需的心智发展。
被动接受填鸭式教育的孩子们可能会失去自主探索文学和数学世界的兴趣,从而无法建立起真正的阅读和数学能力所需的心智基础。这就解释了为什么研究人员反复发现,在学前班和幼儿园阶段进行学术训练,反而会导致孩子们在以后的学术考试中表现更差,而非更好(详见此处)。正因如此,诸如「捍卫儿童早期发展」和「儿童联盟」等儿童权益倡导组织才会如此坚决地反对当前这种向越来越年幼的儿童灌输学术技能的趋势。特别是在早期阶段,应该让孩子们尽情玩耍、探索,发展他们的智力基础,这样他们日后才能相对轻松地掌握学术技能。
在本文的剩余部分,我将回顾一些在本博客先前文章中讨论过的研究发现。这些发现表明,过早的学术训练可能弊大于利,而一旦一个人建立了必要的心智基础,并产生了学习学术技能的意愿,学习过程就会变得相对容易。
示例 1——Benezet 的实验揭示了一至五年级数学训练的负面影响
20 世纪 30 年代,新罕布什尔州曼彻斯特市进行了一项引人瞩目的教育实验。这项由时任曼彻斯特学区教育局长 L. P. Benezet 主持的实验,其结果却长期被教育界忽视。(该实验的详细介绍可参阅这里)[1]。在实验报告的开篇,Benezet 这样写道:「多年来,我一直观察到一个现象:过早引入算术教育会钝化甚至麻痹儿童的推理能力。」他指出,大量的机械练习导致孩子们在思维中将数字和算术与常识完全割裂。结果是,尽管这些孩子能够按照所学方法进行计算,却不理解其中的原理,更无法将这些计算技能应用到实际生活中的问题解决上。用本文提出的术语来说,我们可以认为这些孩子通过死记硬背掌握了学术技能,却没能将这些技能与对数字本质及其用途的深入理解结合起来。
基于这一观察,Benezet 提出了一个即便在 20 世纪 30 年代看来也极为大胆的实验。他要求曼彻斯特最贫困地区的部分学校的校长和教师,在一至五年级的课程中完全取消算术教学。这些班级的学生在升入六年级之前,将不会接受任何传统的加减乘除课程。他之所以选择最贫困社区的学校,是因为他深知,若在富裕社区尝试这一做法,那里的家长多为高中或大学毕业生,必定会强烈反对。
作为这项计划的一部分,Benezet 要求教师们将原本用于算术教学的时间改为进行课堂讨论。在讨论中,鼓励学生畅谈任何他们感兴趣的话题——只要能激发真挚、活跃的交流即可。他认为,这种方法不仅能提高学生的逻辑推理和沟通能力,还能让学习过程变得更加有趣。此外,他还要求教师们安排一些测量和计数的实践活动,以确保学生能获得一些与数字相关的实际经验。
为评估实验效果,Benezet 邀请了一位波士顿大学的研究生,在六年级学生的不同阶段对曼彻斯特的孩子们进行测试。结果令人振奋。六年级伊始,那些此前未接受过任何算术教育的实验班学生,在解决需要运用常识和基本数字概念的应用题时,表现远胜于传统班级的学生。诚然,在六年级初期,实验班的学生在标准算术测试中——即那些按照学校惯例设置、只需套用死记硬背的算法就能解决的题目——表现略逊一筹。然而,到了六年级结束时,实验班的学生不仅在这方面完全追平,在应用题的解答能力上更是遥遥领先。
总而言之,Benezet 的实验证明,仅在六年级接受一年算术训练的孩子,在标准算术运算中的表现至少不逊色于接受了六年算术训练的孩子,而在数学应用题上的表现甚至更加出色。这一发现尤为引人瞩目,因为那些仅接受一年训练的孩子来自最贫困的社区——这些地方过去的考试成绩一直是最差的。
多么令人震撼的发现啊!Benezet 的研究揭示,我们完全可以摒弃那持续五年之久的枯燥乏味(对某些学生而言甚至是痛苦)的反复训练。更令人惊讶的是,放弃这种训练后,六年级学生的表现反而超越了那些经历了五年刻苦操练的同龄人。这种颠覆性的研究结果本应引起教育界的高度重视,却常常被有意无意地忽视。如果教育工作者真的认真对待这些发现,他们可能会面临失业的风险,因为 Benezet 在数学领域的发现实际上可以推广到所有学科。年轻人拥有惊人的学习能力,当他们遵循自己的兴趣,以自己的方式,在自己掌控的时间里学习时,几乎不需要太多外界指导就能取得卓越的进步。
然而,当前的教育趋势似乎与这一发现背道而驰。为了缩小贫富学生之间的学业差距,一些教育工作者正在推行更早开始学术训练的做法,尤其是针对来自贫困家庭的孩子。但是,Benezet 的研究以及其他相关研究都指向了一个可能令人意外的结论:要想真正缩小这种差距并全面提高学习效果,更有效的方法可能是推迟学术训练的开始时间,而不是提前——也许应该推迟得比我们想象的还要晚。
示例 2:在瑟谷学校为数学 SAT 备考,此前未系统学习过数学
这里有一个观察结果,其重要性甚至超越了 Benezet 的研究成果,尽管它并非源自一项正式的实验。在我先前的文章中(这里和这里),我曾详细介绍过位于马萨诸塞州弗雷明汉的瑟谷学校。这所学校采用了一种非常独特的教育模式:它接纳 4 岁到高中年龄的学生,不按年龄分班,不设固定课程,不进行任何形式的正式评估,而是让学生完全掌控自己的学习过程。每个学生都可以按照自己的兴趣和方式进行探索和学习。对该校毕业生的追踪调查显示,他们在未来的生活中都表现优异。以下是我在先前的一篇文章中分享的关于瑟谷学校数学教育的故事:
「为了深入了解没有接受过正规数学教育的学生如何应对大学入学考试中的数学部分,我采访了 Mikel Matisoo。他是瑟谷学校的一名教职员工,经常被学生们寻求 SAT 数学考试方面的帮助。Matisoo 告诉我,找他求助的通常是那些对数学兴趣不大的学生;他们的目标仅仅是在 SAT 考试中取得足以进入心仪大学的分数。他解释道:「SAT 的题型结构使得针对性备考相对容易;有一些能快速提高成绩的技巧。」通常情况下,Matisoo 每周与学生面对面辅导 1 到 1.5 小时,持续 6 到 10 周不等,而学生们每周可能还会自学 1 到 1.5 小时。这意味着,即使是那些此前从未接受过正式数学训练的学生,总共只需要 12 到 30 小时左右的数学学习。根据 Matisoo 的经验,这种备考方式通常能让学生在 SAT 数学部分取得足以被中等竞争力大学录取的成绩。Matisoo 补充说,那些真正热爱数学并能在 SAT 中拿高分的学生往往不会来寻求他的帮助,因为他们完全有能力自主备考。」
当学生向 Matisoo 寻求 SAT 考试帮助时,他们已经在这个充满数字的世界里生活了大约 16 到 18 年。在成长过程中,他们自然而然地掌握了我们日常生活中使用的「生存数学」——就是你我因为经常应用而记住的那些基本数学知识。有了这个基础,再加上他们独立完成过许多需要抽象思维的任务(无论是否涉及数字),以及他们想在 SAT 考试中取得好成绩的强烈动机,他们就能轻松掌握实现目标所需的知识。Benezet 的研究表明,不仅一至五年级,甚至整个一至十二年级的大量练习都是多余的。当年轻人在心智上做好准备,并且有明确的学习动机时,这些数学技能就会变得非常容易掌握。
示例 3:非学校教育和瑟谷学校的儿童如何学习阅读
在传统学校中,按照学校规定的时间表学会阅读至关重要。如果你未能做到,你可能会被贴上「学习缓慢」的标签,甚至更糟,可能会形成自认为愚笨的自我认知。这可能导致你永远落后于他人。然而,如果你不去那种要求所有学生都必须按部就班学习的学校,你就可以在任何想学的时候学习阅读。在这种情况下,学习阅读通常是愉快而相对轻松的过程,甚至学习者本人往往都没有意识到自己在学习。
几年前,我对一些实行非学校教育的家庭进行了调查。这项调查旨在了解那些不上学、在家也不受固定课程约束的孩子,是何时以及如何学会阅读的。详细内容可以参阅那份报告,以下是几个主要结论的摘要:
(1) 对于未接受学校教育的儿童而言,学习阅读并没有所谓的关键期或最佳年龄。有些孩子很早就学会了阅读(最早 3 岁),有些则要晚得多(在本次调查中最晚的达 11 岁)。学习阅读的时机似乎并不取决于孩子的智力水平,而是由兴趣驱动。有些孩子,不论出于何种原因,很早就对阅读产生了兴趣,而其他人则相对较晚。
(2) 有学习动机的儿童可以在很短的时间内从显然不会阅读到熟练阅读。对于那些有学习动力且心智发展已经具备条件的孩子来说,学习阅读并不需要我们在学校里常见的那种痛苦而缓慢的反复练习。许多孩子能够在没有任何明显的教学的情况下自然掌握阅读;有些孩子可能会寻求一些帮助,比如几节关于字母发音的简单课程。
(3) 试图强迫孩子学习阅读可能会适得其反。孩子们(就像我们成年人一样)天生就会抵制被迫做不想做的事情,这一点在阅读学习上同样适用。
(4) 当阅读成为实现某个重要目标的手段时,孩子们才会学会阅读。那些渴望自己阅读故事而不再依赖他人朗读,或者需要通过文字获取特定信息的孩子,往往会主动学习阅读。很少有孩子会仅仅为了学习阅读而学习阅读。
(5) 阅读,如同许多其他技能一样,是在社交互动中通过共同参与而习得的。不会阅读的孩子常常通过聆听他人朗读,或者与已经掌握阅读技能的孩子一起玩需要阅读的游戏来学会阅读。
(6) 有些孩子在学会阅读之前就对写作产生了兴趣,他们在学习写作的过程中逐渐掌握了阅读技能。这正是「从实践中学习」原则的一个典型例证。相比阅读,写作是一种更为明显的主动行为,因此吸引了一些孩子。他们渴望创作自己的故事,在这个过程中寻求帮助,并通过这种帮助学会了阅读。他们最初阅读的往往是自己创作的故事。
(7) 儿童学习阅读(或者任何其他知识)的过程并没有一个可以预测的「固定路径/课程」。这从本质上解释了为什么我们的学校会如此失败:它们建立在一种错误观念之上,认为所有儿童都可以通过相同的课程,在相同的时间内学习。
本文源于当前社会的一个热点话题——学前班和幼儿园中学术训练的争议。然而,随着讨论的深入,文章转而探讨了一个更为根本且具有挑战性的问题:我们是否真的需要学校来进行学术教育。本博客经常强调的一个观点是,孩子们真正需要的是能够激发智力的环境——一个让他们能够按照自己独特方式发展智力的环境。在这样的环境中成长的孩子们,通常能够在恰当的时机轻松掌握学术技能,几乎不需要教师的特别指导。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
另外,我诚挚推荐阅读我的著作《自由学习》;还可以访问 alternativestoschool.com 网站了解更多信息,以及在 Facebook 上与我保持联系。
参考文献
[1] L. P. Benezet (1935/1936). The teaching of Arithmetic: The Story of an Experiment. Originally published in Journal of the National Education Association in three parts. Vol. 24, #8, pp 241-244; Vol. 24, #9, p 301-303; & Vol. 25, #1, pp 7-8.
学校如何挫败激情
原文:How Schools Thwart Passions | Psychology Today
追求激情需要时间玩耍和自主教育。
发布于 2018 年 11 月 25 日
本文是我在 2018 年 5 月发表的 TEDx 演讲的文字记录(部分修改)
「追随你的激情。」几乎每个毕业典礼演讲者都会对应届毕业生说这句话。其实这句话非常残忍。如果你的生活里除了学业就是跟学业一样摧残人的事情,你怎么知道你要追求什么?怎么去追求?为了能找到并追求激情,你需要足够的自由和时间来玩。玩,从定义上来说,就是在追随你的激情。但我们几乎把玩耍从年轻人的生活中移除了。
学校无味
资料来源: Max Pixel
过去数十年里,我们不断延长孩子在学校的时间,在家花在课业上的时间,以及校外补课的时间。我们把童年偷换成了打造简历的流程。打造简历来乞求他人瞩目,这可换不来激情。你要做自己爱做的事,不要管其他人想什么。追求热情且成就显著的人,无不表达了对学校的厌恶以至于痛恨。有 50 余人发表了对学校的看法,参见这里。
学校遇害者
Kirsten Olson 是哈佛毕业生,她在几年前开始研究成功人士的学校生活如何鼓舞激励他们。她本想记录下学校如何能激发热情,但她初期的研究便让她决定把角度反转 180 度。她最终写了《学校遇害者》(Wounded by school)这本书。我的书评在这里。这书中前言的一句引用,来自她的论文导师 Sara Lawrence-Lightfoot:「她刚刚着手时——深入采访各位获奖建筑师、杰出教授、天赋傲人的作家、市场经理,Olson 原本期望能听到快乐充实的学习经历。与此相反,在各位人士绘声绘色地回忆学校时,她窥见痛苦的暗影,希望的幻灭,愤世嫉俗的苦笑。她没有沐浴于假想的光明,而是一身扎进了黑暗。他们的故事不仅描述现已愈合的古旧伤痕,更有深深穿透身体的伤口,仍然青肿不堪,隐隐作痛,仍然啮噬着扭曲着人格和职业者的感知。」
相比 Olson 的采访者在学校就读的年代,现在的学校压迫更加沉重。课间休息越来越短,甚至被取消。课表里的创意活动不见了踪影。作业倒是越堆越多。这一切都是为了多做对几道选择题,提高标准化测试的分数。这样群魔乱舞的结果可想而知。研究表明,在这段时间的,所有年级的孩子的创意思考能力在不断下降(此篇)。儿童焦虑与抑郁愈发严重,自杀人数逐年上涨(此篇和此篇)。美国心理学会在 2014 年开展的一项调查表明,美国人中青年人的压力最大,而 83% 的年轻人将高压归咎于学校(此篇)。这样的环境可不利于兴趣的发展。
我的兄弟 Fred
讲点高兴的事情吧。我最小的弟弟是 Fred Carlson,我跟他不同姓,我们是同母异父的兄弟。他比我小 12 岁,因此在我上大学的那年,他才开始在一所公立学校上小学一年级。大概在他四年级的时候,我妈妈成了一名嬉皮士,带着我的弟弟们搬到了佛蒙特的一处社区。Fred 因此离开了公立学校,入学了一所很小的自由学校,这所学校是我妈妈协助建立的,其中没有强制课表,Fred 能随心所欲做他想做的事。
然而这所学校没能认证为高中,所以他在 14 岁时转入当地一所公立学校上九年级。入学后第二天,校长告诉他:「我们不欢迎像你这样的嬉皮士。」所以他离开了。后续几年里也没有上学。整日在社区里兜兜转转,帮忙修建了一所房子。他开始对木头和木工手艺感兴趣。同时,他也对音乐产生了兴趣,学习了吉他和班卓琴的演奏。
他在 16 岁参加了面向高中辍学生的社区支持项目。项目负责人问他想做什么,他说:「我想造班卓琴」。项目里没有人了解乐器制作,但负责人帮他找了一位当地人,他名叫 Ken,拥有一家木工店,并且对于制作班卓琴略知一二。就这样在 Ken 的帮助下, Fred 制作了一把班卓琴。Fred 父亲为他准备了一笔教育 资金,Fred 用这笔钱在一所吉他制作学校上了六周的课,并购买了开店需要的工具。剩下的事情也不必我讲了。(译注:Fred Carlson 成为了有名的乐器制作者)。
我的兄弟 Fred 和他的一项发明
Source: Fred Carlson, Beyond the Trees
Fred 年满 21 岁时,史密森博物馆展出了他制作的一把吉他。之后他一直在制作乐器,每种乐器都互不相同,都是独一无二的发明。弦乐器制作者中他以艺术造诣高超、创意丰富、技艺精湛而闻名。(比如这张图片,更多作品请参见此网站。)Fred 和我始终认为,如果他待在学校,他永远也不会发现心之所向。
自主教育是对热情的追求
我的大部分学术生涯都在研究自主教育的结果——那些不在执行课程标准的学校上学,而是追求自己兴趣,进行自我教育的人。我研究过位于马萨诸塞州的瑟谷学校的毕业生,学生小到四岁,大到青春期后期,都拥有充分的自由来追求自己的兴趣。我最近研究了成年的非学校教育者(参见此篇以及此篇)。非学校教育者在法理上是在家接受教育的人,但实际上不受课程标准的限制,能够自由地追求自己的爱好。对我们来说,最有趣的发现是,这些自主教育者中,很大一部分人目前从事的职业,直接延展自童年时期在玩乐中发展起来的兴趣。这是一些例子:
-
一位女孩喜欢船,在十几岁时她自发去当一名船长的学徒,之后她也成为了一名游轮长。
-
还有一位女孩喜欢玩玩偶,就像许多女孩那样。她开始给玩偶做衣服,之后又开始给自己做衣服,给朋友做衣服。在我们开展研究的时候,她在一家时尚公司当服装样板设计部门的领头人。
-
有个男孩对各种建造游戏非常感兴趣。他会用黏土制作一套套村庄,一座座工厂,比例精准。青少年时他经常待在当地车库周围,一边观察一边询问,学习机动车的知识。研究时他已成为机工和发明家,且备受追捧。
-
另一个孩子十分热爱科幻小说。由此他发现了数学这门学科并保持着相当的热情。他后来成为了数学教授。
-
还有个孩子在十几岁时对电脑十分着迷。研究时他已经 22 岁,并且成立并领导了一家非常成功的软件开发公司
-
有个女孩在 3 岁时喜欢上了马戏团,在 5 岁时开始接受马戏表演的训练。到了十几岁时,她能够非常专业地表演高空秋千,在 19 至 24 岁期间,她跟好友成立了马戏公司。
-
有个男孩在 11 岁时喜欢上了跟朋友制作 Youtube 视频。他在十几岁开始学习电影制作。他经验丰富,充满热情,这让他在 18 岁时受大型电影公司雇佣,成为一名制作助理。20 岁时,在我们的调查研究期间,他正在和洛杉矶的一位著名导演合作制作一部大片。
-
有个男孩在 15 岁对三件事非常感兴趣——野外徒步、滑翔伞运动、摄影。他接受调查时是 21 岁,他成为一名小有成就的空中野外摄影师,成功结合了他的三样兴趣。
-
有个女孩之前就读于传统学校,她在 13 岁时发起反抗,头也不回地离开了学校。她之后开始对艺术、革命和野生动物非常感兴趣。28 岁的她在接受调查时,是全职的绿色和平活动者,募捐者和管理者。
烘焙师 Molly
资料来源: Molly and Kerry McDonald,已授权
摄影师 Jack
来源:Jack 和 Kerry McDonald, 已授权
Jack 的照片,《反射》
资料来源: Jack MacDonald,已授权
配音演员 Marley
来源:Marley 和 Akilah Richards, 已授权
这些只是我的研究记录的一小部分例子。所有这些人之所以能发现自己的热情并不懈追求,全然是因为他们离开了遵循课标的学校,或者甚至没有进入这类学校。
最近我咨询了一些非学校教育者朋友,了解他们孩子的兴趣。我了解到了这三位:
-
Kerry MocDonald 的女儿 Molly 热衷于不少兴趣,其中一个是烘焙。在她 9 岁 10 岁左右,有人问她未来想做什么,她回复到:「我想成为烘焙师,但我已经是了。」我明白,自主教育者不会把人生划分成为筹备未来和享受未来生活的阶段。他们不区分学习与生活,不区分学习与实践。童年如此,成年也如此。
-
Molley 的弟弟 Jack 对摄影如痴如醉。他非常仰慕著名风景摄影师 Ansel Adams 的作品,并会模仿他。我在此附上 Jack 的艺术摄影作品,《反射》。
-
Aiklah Richard 的女儿 Molley 声音甜美,很喜欢配音。她在 13 岁时已经完成过动画配音和同人小说配音的工作。 因为配音,她开始学日语,因为她最喜欢的一些作品都来自日本。到了 14 岁她已经能给另一个孩子教日语了。
这些人具备一大优势,就是免去上学之苦。
那么,学校如何挫败激情?
很显然。学校通过以下方式挫败激情:
-
强求所有人在同一时间做同一件事情。让同一间教室里的孩子,在同一时刻对相同的东西感兴趣,是天方夜谭。
-
将内生动机用外生激励替代,比如成绩和奖杯。为了追求激情,你必须专注于你想要做的事,而不是要引人瞩目,夺得荣誉。
-
给孩子灌输「问题都有唯一正解,行事都有唯一正道」的教条。这样来掐灭兴趣火苗于萌芽之中,百发百中。
-
**告诉孩子学习是工作,玩耍不过是学习间隙的休息。**但只要感受过激情兴趣的人都知道,玩耍、学习、工作三位一体,密不可分。
综上所述,如果我们要让孩子在长大成人拥有追求,我们必须找到学校的替代品。我们起码可以减少学校和类似学校活动对他们生活的侵占,并大幅增加他们随心所欲地探索的机会——也就是玩耍的时间。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
赞美民科主义
原文:In Praise of Amateurism | Psychology Today
专业人士以此为生,而业余爱好者则为之而生。
发表于 2024 年 1 月 19 日 | 审稿人 Tyler Woods
最近,我读到 Natalia Beard 的一篇文章,也是我为这篇帖子所选的标题,这让我开始思考民科主义(Amateurism 即业余主义)的价值。Beard 是一位职业记者,她分享了自己「31 岁时重新发现对钢琴的热爱,并在远离钢琴十年后重新追求这一爱好」的经历。关于业余与专业的区别,她这样写道:
「将艺术家简单分类为专业或业余的做法,问题不仅在于它是一种过于简化的二分法,更在于它引发了不必要的比较:业余者常被视为不如专业者,业余主义被看作是一段草草结束的旅程中不尽人意的终点。我多次听到过这样的说法:『我知道自己永远不可能成为专业人士』,这成了他们年轻时放弃心爱追求的理由,而这种放弃后来常常让他们后悔。当我们轻视业余者时,我们忽略了一个事实:『amateur 』(业余)这个词源于拉丁语动词『amare』——爱。激情是内心世界的一部分,是『慰藉之地』,储存着意义深重的事物,随时待命,供我们在需要时汲取。无论如何,我们都应该培养这些激情。」
在我上一篇文章中,我提到我们常常只用职业而非兴趣爱好来定义自己。我们应该把 Natalia Beard 称作记者,还是钢琴家呢?我想她对这两种称呼都不会介意,但如果非得选其一,我更倾向于称她为钢琴家。
业余与专业的区别
业余者和专业者有什么不同?我们通常认为这是能力上的差异。专业者被认为是非常有能力的;而业余者则不然。但真正的区别其实在于动机和态度,而不是能力。
这里,我不打算深究这些概念的模糊性,也就是说,专业者在某些方面可能表现得像业余者,反之亦然。我将用一些固定的刻板印象来对比他们。这种对比部分受到我读过的一篇文章的启发,文章的作者是著名人类学家 Tim Ingold (2020),他在文中感叹自己的领域过度专业化,民科精神却被牺牲了。
专业人士以此为生;业余爱好者则为之而生。
在词典中,专业人士和业余爱好者的区别在于,前者通过活动赚钱,后者则出于爱好(享受、寻求意义、满足感)参与活动,不以此为生。当然,专业人士也可能对他们的工作充满热情。但研究显示,当一个人的生计依赖某项活动时,他们的态度往往会变,开始把它当作「工作」而非玩耍,只在报酬的时间里从事此活动。相反,业余爱好者则可能在任何空闲时间都会参与其中。对专业人士来说,这项活动是谋生的手段;对业余爱好者来说,却是生活的一部分。
专业人士在既定边界内工作;业余爱好者则自由探索。
专业人士为了维护其专业形象并赚取薪水,必须在一定的边界内操作。他们需要专心完成特定的任务。这对于水管工、医生、律师或会计等职业来说尤其如此,对专业艺术家和学者虽然影响较小,但同样适用。
艺术家要成为专业人士,必须遵循市场的规则。学者若想在大学里稳坐教职,也得在自己学科认可的学术范围内努力。而业余爱好者则不同,他们可以随心所欲地创作和思考。随心所欲也许会创造出毫无意义的成果(尽管无法定义什么是毫无意义的),但有时也能催生出后人称赞的天才之作。对专业人士而言,打破常规充满风险;对业余人士来说,这却是再自然不过的事。
22年前,我辞去了大学教授的有薪职位,转而担任一个名为「研究教授」的无薪职位,虽有头衔,却无具体职责。我的身份从一个专业教授变成了业余教授,这听起来似乎很矛盾。正如我之前文章中所述,这一转变让我变得更加高效和富有创造力,因为我只专注于那些我认为有趣且有价值的事物,对其他事则置之不理。我可以向那些对我所讲内容感兴趣的听众「讲授」,而不是仅仅对课堂上的学生或学术会议的学者「讲授」。
专业人士在懂;业余爱好者在学
profess(专业)这个词来自拉丁语 professus,意为公开宣称。因此,专业人士是那些「有其值得听取或参考的知识,因而得到报酬」的人。他们通常会在自己的领域内,根据现行的标准,获得某种官方的认证。他们的知识和专业技能是他们谋生的资本。
相反,业余爱好者则没有获得认证的知识。他们可能懂,也可能不懂;他们的所谓「知识」可能靠谱,也可能不靠谱,但他们总在寻求新知。他们以自己的方式探索知识,这种方式对他们个人的生活可能很有意义,但对别人来说未必如此。业余爱好者永远在学习,从未停止过对知识的追求。
有意思的是,professor(专家)和 professional(专业)这两个词都源自 profess(声称)。教授们声称自己有知识,并靠传授他们的知识来赚钱,根据 2020 年 Ingold 的研究,这或许是许多教授(包括其他专家)感到自己才不配位的原因。「我们真的懂吗?」
专业人士力求把情感从思考和行动中剥离出去;业余爱好者则不这么做。
成为专业人士,就意味着要保持客观和冷静。而业余爱好者,本质上就是满怀激情的人。因为他们情感上的投入,业余爱好者常常成为积极倡导者,为与他们热情相符的事业而努力。相比之下,如果专业人士变成了积极倡导者,人们往往会担心他们失去了客观性,让激情盖过了理智。
当我放弃了作为专业教授的职位,转而成为一名业余教授时,我为自己赢得了激进的自由。我不止是在研究和写作关于儿童需要更多游戏和自由的主题,我还在为这些目标的实现而积极奋斗。
最后的思考
在下一篇文章中,我打算继续探讨业余主义的主题,讲述一些由当时的业余人士做出的革命性科学突破或见解。我将指出,他们之所以能突破常规思维并获得这些见解,部分原因是他们是业余人士,而不是专业人士……敬请关注。
参考文献
在我对业余爱好的研究中,我希望读者能简单分享一下自己民科经历。如果您有参与此类,欢迎您在这个网站上描述您的经历,同时您也可以了解其他读者的民科经历。我可能会在未来的文章中引用这些故事。我一直非常欢迎大家对我的文章提出有深度的评论和问题。Psychology Today 不再接受评论,因此我也在另一个平台这里发布,非常期待您的留言。
Beard, Natalia (2022). In praise of amateurism—a pianist’s story. Financial Times Dec. 29, 2022.
Ingold, Tim (2020). In praise of amateurs. Ethnos 86, 153-172.
与其「创造就业」,不如少点工作?
原文:Instead of “Job Creation,” How About Less Work? | Psychology Today
自动化程度的提高并没有减少我们的工作量。为什么? 如果减少会如何?
发布于 2016 年 11 月 26 日
(译注:Pixabay,一个图像分享网站)
来源: Pixabay Free Image
1930 年,英国经济学家约翰·梅纳德·凯恩斯预测过,截至本世纪末,每人每周平均工作时长为 15 小时左右。从 20 世纪初开始,自动化已经淘汰了很多职位,因此凯恩斯预测,自动化浪潮会不断加速,最终人们只需要付出很少的体力或精神劳动,就能享受美好生活。凯恩斯关于自动化趋势的预测是正确的。现在的机械、计算机、机器人能飞速解决非常耗费人力的工作,并且这种趋势仍在高速发展。但是他关于工作时间减少的说法并没有实现。
随着旧的工作被机器取代,新的职位不断涌现。这些新工作中的一部分是新技术的直接结果,除了让人们就业之外,毫不意外还能以各种方式造福社会(Autor,2015)。信息技术工作是公认的范例,迎合新发现的娱乐领域的工作也是如此,比如电脑游戏设计和制作。但我们也有越来越多的工作似乎完全无用甚至有害。例如,有越来越多的行政人员和助理行政人员在倒腾不需要倒腾的文件,公司律师和他们的工作人员帮助大公司缴纳的税款低于他们应得的份额,金融行业中无数人在搞些什么鬼把戏,游说者(译注:lobbyists ,指对政府或委员会进行游说的说客)用尽千方百计进一步腐败政客们,以及广告经理和销售人员推销没有人需要或真正想要的东西。
悲伤的事实是,世界上有很多人把大多数时间放在了他们知道并不会对社会有利的事情上(见 Graeber, 2013)。这导致了一种玩世不恭即人们开始不再认为工作应该造福社会。不可思议的荒唐在于:两党的政客都拼争于让军工厂在各自所在的州开工,以保留工作岗位,即使军方自己表示工厂正在制造的武器已经淘汰。还有政客和专家认为,为了就业,应该维持化石燃料开采和高碳排放工厂运作,不惜让环境去见鬼。
真正的问题当然是经济问题。我们已经探索出如何减少生产我们需要和实际想要的东西所需的工作量,但除了通过每周四十个小时(或者更长)的工作获取工资,我们仍未想出如何分配这些资源。事实上,技术正在将越来越多的财富集中到越来越少人口比例中,这加剧了分配问题。此外,工业革命有遗留下了一种文化风气,认为人们工作一定为了得到什么。因此,除了工作上的交替,我们对任何其他共享财富的严肃计划都讳莫如深。
所以,我说,别老想着工作挣钱,多想想快乐生活!我们天生热爱玩耍,而非工作。我们在玩耍时处于最佳状态。让经济学家们去思考如何创造一个玩乐最多、工作最少的世界。这个问题似乎不难解决。如果让那些从事无用或有害工作的人都去尽情玩乐,而我们都平等地从事必要的工作,并共享由此产生的利益,我们都会过得更好。
工作是什么?
当然,工作这个词有许多不尽相同、相互重叠的含义。正如 Keynes 所使用的,以及我在前面几段中所说的,它指的是完全或主要因为我们觉得必须这样做,才能在经济上养活自己和家人的那些活动。工作也可以指我们经历的任何不愉快的,但又觉得必须要做的事务,无论它是否对我们有经济利益。根据这个定义,工作的同义词是辛劳,这样的话,它就成了玩耍的反义词。还有一种定义是,工作是能对世界产生积极影响的任何活动,无论它本身是否令人愉快。根据这个定义,工作和玩耍不一定有区别。一些幸运的人认为他们谋生的工作就是玩耍。即使不需要为了谋生,他们也愿意这样做。这不是我在这篇文章中使用的工作这一词语的含义,但这个含义值得铭记,因为它提醒我们,我们现在把很多东西称为工作,是因为我们以此谋生,倘若在一个日常生活能以其他方式得到保障的世界中,它们也可以被视为玩耍。
工作是人类本性中必不可少的一部分?不。
许多人惊讶地发现,在人类物种史的时间尺度上,工作是一项新发明,它与农业一同产生。在那个时代,人们不得不花很长时间犁地、种植、除草和收割;然后它随着工业进一步发展扩大,当时人们花无数时间,干着乏味或令人厌恶的组装工或在矿场劳作。但是农业伴随我们只有一万年,而工业的时间更微不足道。在此之前,数十万年来,我们都是狩猎采集者。一些研究人员在世界各个偏远地区观察幸存下来的狩猎采集者,并于他们一同生活。这些研究人员经常报告说,他们很少花时间做我们文化中认为是工作的事情(Gowdy,1999;Gray,2009;Ingold,1999)。
事实上,量化研究表明,成年狩猎采集者每周平均要花 20 个小时打猎和采集,而其他与生计相关的工作,如制作工具和准备饭菜,则要多花几个小时(参考文献见 Gray,2009)。他们醒着的其余一些时间用来休息,但大部分都献给了好玩、愉快的活动,比如制作音乐、创造艺术、跳舞、玩游戏、讲故事、与朋友谈笑风生,以及拜访邻近部落的亲朋好友。甚至狩猎和采集也不被视为工作;他们一点也不勉强,而是热情地完成这些。这些活动很有趣,还能和朋友携手并肩,所以自愿参与者总是不少,且因为每位群体成员都一同分享所获的食物,哪怕有一天(或一周或更长时间)你不愿去狩猎或采集,也没有人会强迫你去。
一些人类学家报告说,他们研究的族群甚至没有工作这个词;或者如果有的话,它指的是与他们接触的农民、矿工或其他非狩猎采集者所做的事情。人类学家 Marshal Sahlins(1972)将狩猎采集者称为「原始富裕社会」——富裕不是因为他们拥有太多,而是他们的需求很小,从而可以用相对较少的努力满足这些需求,也就有很多时间玩耍。
从进化上讲,一万年这段时间几乎微不足道。早在农业或工业出现之前,我们就进化出了基本的人类本性。所有人本质上都是狩猎采集者,本应享受我们的生活,且不仅局限于此,还应有大量的空闲时间来创造我们自己的快乐。现在我们可以用很少的工作完成所有的农业和制造业,只要能够解决分配问题,就可以重新获得我们在进化史上享有的大部分自由。
我们需要通过工作保持积极快乐?不。
有人担心,生活中缺少工作将会造成懒散和抑郁。他们认为,人类需要工作才能有人生的目标感,而非只是机械地早上起床。他们观察人们在失业时的抑郁程度,或是下班后回到家中无所事事的人有多少,以及一些人在退休以后百无聊赖,感慨于力不从心的状况。但这些观察都发生在一个大众心中失业与失败划等号的世界,一个工人每天回家都精疲力竭的世界,一个吹捧工作、贬损玩乐的世界,一个从小学到退休的工作生活使得许多人忘记了如何玩耍的世界。
看看孩子们,他们还没有开始上学,因此还没有因为工作而抑制他们的好奇心和玩耍。他们懒吗?不。他们在不睡觉的时候几乎一直在活动。 他们总是出于好奇心而涉足事物,在他们的游戏中,他们编造故事,构建事物,创造艺术,并对周围的世界进行高谈阔论(是的,高谈阔论)。没有理由认为这种活动的内驱力会随着年龄的增长而自然减少。他们的衰落是因为我们的学校重视工作,贬低游戏,把玩乐精神从人身上榨出,然后再由枯燥乏味的工作和职业继续榨干他们的精力。对于狩猎采集者来说,内驱力不会随着年龄的增长而下降,如果不是所有的工作都强加在我们身上,它也不会下降。
学校的发明主要是为了教我们毫无疑问地服从权威人物(老板),并及时执行繁琐的任务。换句话说,它们的发明是为了抑制我们探索和玩耍的自然倾向,为接受工作的生活做好准备。在一个重视玩耍而非工作的世界里,我们不需要这样的学校。相反,我们会让每个人的玩乐精神、创造力和自然的努力找到在生活中的意义。
根据定义,可以说,工作是我们不想做的事情。它妨碍了我们的自由。我们必须工作就意味着我们不能自由选择并找到自己生命的意义。人们需要工作才能快乐的观点与人们无法驾驭自由的傲慢观点密切相关(见 Danaher,2016)。几个世纪以来,这种对人性的悲观一直被宣扬,并在学校中得到加强,以维持稳定的劳动力。
具有文化意义的发现、创造和发明是否依赖于工作?不。
人们喜欢发现和创造。我们天生好奇且爱玩,发现和创造分别是好奇和爱玩的产物。有些人认为,减少工作并用更多时间投身自己感兴趣的领域会导致科学、艺术和其他有关创造力的成就减少,这纯属无稽之谈。
我们创造力的施展在一定程度上受文化环境的影响。对游牧的狩猎采集者而言,无法轻易携带的物品是一种负担,他们探索身边的物理和生物环境,以此为基础进行创造——歌曲,舞蹈,笑话,故事,身体装饰等。这些创造本身往往难以长久地保存下去,只有形式保存了下来。而从农业时代至今,创造力不仅能以这些形式施展,还产生了各种成果,创造出了改变基本生活方式的物质发明。
几乎所有伟大的科学家、发明家、艺术家、诗人和作家都把他们的成就当作游戏来谈论。例如,爱因斯坦将他在数学和理论物理学方面的成就称为「组合游戏」。他这样做是为了好玩,而不是为了钱,他在专利局当书记员赚钱。荷兰文化历史学家 Johan Huizinga 在其经典著作《卢登斯人》(Homo Ludens)中令人信服地指出,大多数丰富了人类生活的文化成就包括艺术、音乐、文学、诗歌、数学和哲学,甚至法理学,都是游戏内驱力的衍生物。他指出,在历史上的有些地方,有时会有相当数量的成年人从工作中解放出来,他们可以在重视玩耍的环境中玩耍,这时就会迎来科学文化成就的大爆发。古代雅典就是一个典型的例子。
我们会因没有工作而道德退化?不。
我很赞同十八世纪的诗人和哲学家弗里德里希·席勒的一句话:「人只有在玩耍时才拥有完全的人格。」我和席勒一样清楚,我们人性的一部分,是在玩耍中体现的,那就是对人类同胞的关心。
在这个所有人埋头苦干的世界,我们经常掉进一个陷阱,即工作职责凌驾于对他人的关心之上。工作会损耗时间和精力,有时甚至会减损动机——帮助有需要的邻居,打造更美丽的环境,或促进旨在改善全人类的事业。尽管工作压力很大,但仍有这么多人参与此类人道主义活动,这一事实证明:人们希望帮助他人并使世界变得更美好。如果不是因为时间和精力的浪费,以及工作造就的贪婪和屈服于权力的倾向,大多数人都会为人类同胞做更多的事情。
正如我所说,部落狩猎采集者过着玩耍的生活,人类学家深知他们渴望分享和乐于助人。这类社会的另一个术语是「平等主义社会」——这是迄今为止发现的唯一没有社会等级制度的社会。他们建立在玩耍中的精神,是一种禁止任何人拥有比其他人更多的地位或物质的精神。在没有或少有工作的世界里,我们都会不那么关心向上爬,或是最终走向何处,而更关心别人的幸福——那些人毕竟是我们的玩伴。
所以,与其如此努力地维持工作,我们为什么不解决分配问题,减少工作,并允许自己玩乐呢?
这是个好问题。
--------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
也请阅读:《玩耍精神》、self-directed.org(以找到自主教育的盟友);并在脸书上关注我。
参考文献
Autor, D. H. (2015). Why are there still so many jobs? The history and future of workplace automation. Journal of Economic Perspectives, 29 (3), 3-30.
Danaher (2016). Will life be worth living in a world without work? Technological unemployment and the meaning of life. Fortcoming in Science and Engineering Ethics. Available online at http://philpapers.org/archive/DANWLB.pdf.
Gowdy, J. (1999). Hunter-gatherers and the mythology of the market. In R.B. Lee & R. Daly (Eds.), The Cambridge encyclopedia of hunters and gatherers, 391-398. Cambridge: Cambridge University Press.
Graeber, D. (2013) On the phenomenon of bullshit jobs. Strike! Magazine, Aug. 17, 2013.
Gray, P. (2009). Play as a foundation for hunter-gatherer social existence. American Journal of Play, 1, 476-522.
Gray, P. (2014). The play theory of hunter-gatherer egalitarianism. In D. Narvaez, K. Valentino, A. Fuentes, J. McKenna, & P. Gray (Eds.), Ancestral landscapes in human evolution: culture, childrearing and social wellbeing (pp. 190-213). New York: Oxford University Press.
Huizinga, J. (1955; first German edition published in 1944). Homo Ludens: A study of the play-element in culture. Boston: Beacon Press.
Ingold, T. (1999). On the social relations of the hunter-gatherer band. In R. B. Lee & R. H. Daly (Eds.), The Cambridge encyclopedia of hunters and gatherers, 399-410. Cambridge, UK: Cambridge University Press.
Keynes, J. M. (1930/1963). Economic possibilities for our grandchildren. Reprinted in John Maynard Keynes, essays in persuasion. New York: Norton.
Sahlins, M. (1972). Stone age economics. Chicago: Aldine-Atherton.
绩点堆得高,创新想得少
原文:Inverse Relationship Between GPA and Innovative Orientation | Psychology Today
学生越着迷于高分,越缺少创造力。
发布于 2016 年 4 月 30 日
Source: Agencia Brasil, Creative Commons
当今中小学生承受着非同以往的巨大成绩压力。几个月前,我发表了一篇文章(此处)证明大学生也是如此。许多学生留言回应,父母、老师和整个社会都对着他们说,他们的未来取决于有没有在高中和大学里斩获全 A。下面来看一些留言:
-
只要成绩不是 A 就罪不可赦。我们自幼就让家长灌输这样的观点:竞争如此激烈的世界之下,事事完美是成功的唯一道路。
-
你知道是谁在向我们灌输必须全 A 的思想吗?父母,奖学金,老师,还有网络。
-
所有人都倾注着这样的声音,只尽自己最大努力学习远远不够。他们毫不关心你是否理解材料,是否有所成长。他们说道,除非你可以击败其他学生,否则你的所作所为一文不值。他人功过是一把标尺,时时刻刻将你衡量。
为什么谷歌不要求应聘者的成绩单或考试成绩
与此相悖的是,在接受《纽约时报》的采访时,谷歌人力运营高级副总裁 Laszlo Bock ,如此描述谷歌的招聘经历与做法:「一番数据分析后,我们发现绩点作为招聘标准毫无价值。考试成绩也不值分文……众所周知,谷歌曾要求每个应聘者提供成绩单、绩点和考试成绩,但到了现在,除非是刚出校门几年的学生,我们已经对此不作要求。我们发现这些数字毫无预测作用。」
Bock 继续解释道:「我认为校园环境是人为捏造的环境。在校园环境中成功的人,基本上都被驯化得挺服帖。读大学以及读研时,我知道教授提出问题是为了某个特定的回答,这点很是恼人。你能答出来,然而解决一眼看不出答案的问题,却是更有趣味的。喜欢解决一眼看不出答案的问题的人,才是你想要的人才。」 接着 Bock 指出随着 Google 招聘越来越成熟,Google 越来越倾向招聘根本没上过大学的人,而现在,谷歌有些小组里有 14% 的成员从未上过大学。
研究表明,成绩水平与创新倾向呈负相关
越来越多的对照实验也表明,大学绩点和创新倾向之间,完全不存在相关性,甚至是负相关的。纽约大学的 Matthew Mayhew 和他的同事们进行了一项重要的研究(这里和这里),最近引起了大众媒体的注意。[1] 这些研究人员调查了五所不同高等教育机构的数千名大学毕业生,并进行了一系列的心理测试和问卷调查。他们的主要发现之一是,学生的绩点与他们对创造性或创新性工作的倾向呈负相关。绩点越高,学生对创新的兴趣就越萎靡。
研究者提出了一些原因来解释这种负相关:「也许性格上喜好创新的学生,相比平均分更高的学生,对考核记忆水平的分数系统更不感冒。另外,具有创新精神的学生往往认为要通过大学教育发现新的想法,而非迎合绩点形式的一系列外部评估手段。」[1]
进一步的证据
还有很多研究得出了相似结论,我在先前的文章中总结了一些。比如在中国开展的一项研究指出,高考中分数最高的那一部分高中生读完大学后,在后续人生中取得的成就,并没有超过比他们高考分数低的人(这里)。美国学校唯考试成绩独尊的倾向愈演愈烈,而经过客观衡量,每个年级学生的创造性思考能力都在下降(参见这篇)。
我们的教育系统是为截然不同的时代设计的。那个时代的工作需要循规蹈矩地行事,一丝不苟地服从。那时对大多数人来说,创新思考不仅不必要,而且会拖后腿。可悲而讽刺的是,我们没有根据现代社会的需求调整教育系统,而是在这个老东西上不断押宝,因而现在的年轻人,为了保全发展他们自然的好奇心与创造力,会面临前所未有的困难。目前来说,我建议公司要去雇用那些把教育系统甩到一边的人,而非那些对教育系统顶礼膜拜的人。越来越多的公司在如法炮制。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
--------
想了解更多关于学习本能的内容,请见玩耍精神 和 alternativestoschool.com;并在脸书上关注我。
参考文献
[1] Matthew J. Mayhew et al. (2012). Exploring Innovative Entrepreneurship and Its Ties to Higher Educational Experiences Res High Educ 53:831–859.
有可能开展真正的教育改革吗? 如果可能,怎么办?
原文:Is Real Educational Reform Possible? If So, How? | Psychology Today
教育改革必然发生在强制学校系统之外
发表于 2011 年 8 月 19 日
自从制度化学校教育诞生以来,一直都有改革者试图改变教育方式。这些改革者大体上可以划分为自由派-保守派,或者说是进步主义者-传统主义者。自由派认为,只有孩子足够开心,有选择权,学习材料对他们有意义,而且能控制他们学习的内容和方式,他们才能学得好。保守派一端认为,只有孩子由权威老师指挥引导,他们才能学得好,因为他们比孩子更清楚什么要学,怎么学。随着时间的推移,教育的钟摆在这两端之间不断来回摆动。但钟摆从未摆动得太远。传统派觉得进步主义者头脑简单,他们风格温和,在一些时候主导教育,但效果并不好。而进步主义者觉得传统派都是老古董,这些传统主义者则手段强硬,他们也在一些时候主导教育,但效果也不好。
钟摆从来摆不远,很快就被人向另外的方向推动,因为两种类型的改革都不奏效。如果教育系统仍然要求孩子学习一套预先定义的技能和知识体系,在这种系统里引入进步政策是行不通的,因为孩子们并不会主动去选择这些设计者想让他们学的课程内容。传统主义者的务实政策有其优势,能明确告知孩子们应当做什么和学什么,但这些政策也行不通,因为它们阻碍了创造性思维,严重干扰了孩子们天然的学习方式。孩子们或许能把材料死记硬背下来应付考试,但他们既不会记住它们,也不会在日常生活中使用,因为这些内容对他们而言没有意义。
围绕着怎么前后微调这个钟摆,无数人大费口舌辩论,无数教育教授写了无数的书。写书和微调钟摆人自称为改革者,但这种轻微的推动并非真正的改革。
我所说的真正的教育改革是什么意思?
我所理解的真正的教育改革,需要我们彻底改变对教育过程的理解。这种改变正是我在整个博客系列中一直努力推动的。
首先,我们必须放弃一个观念:成人应当掌控儿童的学习。简而言之,我们必须摒弃我们整套学校教育体系的前提。
事实上,所有参与教育改革的人——无论是进步派还是传统派——都坚定地认为成年人要掌管儿童的学习。进步教育者认为老师要巧妙地操纵孩子的学习环境,设置各种物件、加以不着痕迹的引导,让孩子玩正确的游戏,以正确的方式探究正确的问题,掌握正确的答案,并最终通过考试(参见卢梭的谬误)。而传统主义者则寻求一条更直接的路径,不要什么游戏,直接传授正确的答案。两派都认为优质的学习源于优质的教学,只是对什么构成优质教学持有不同看法。他们也同意,成年人有责任决定孩子应该学什么,并需要去测试孩子的能力,无论方法,无论正式与否,这样才能保证孩子学到了正确的知识。
《自由学习》这个博客之前的大多数文章都围绕着一个中心观点:孩子们自己负责自己的学习,且应该如此。孩子们带着强烈的学习动力来到这个世界,渴望探索周围的物理、社会和文化世界;但他们需要自由来追随这种内在的动力。在他们生命的前四五年里,我们通常会给予他们这样的自由。在这最初的几年中,他们不需要任何教导就学会了人生大部分的知识。他们从零开始,学会了整个母语。他们掌握了物理学的基本实用原理。在心理学方面,他们学会了如何讨好、激怒、操纵以及吸引周围人的注意。他们积累了大量的事实知识。他们学会了如何操作允许他们操作的各种设备,即使这些设备对我们成人来说看起来极其复杂。
这一切都是靠他们自己的主动性完成的,基本上没有成年人的指导。实际上,除非成年人将他们关在壁橱里,否则无法阻止孩子们学到这一切。这不仅仅是一些特别的「天才」或具有独特自我驱动力的孩子能做到的;所有孩子都会这样做,除了极少数真正有大脑损伤的孩子。
但到了上学的年龄,我们却做了等同于将孩子们关进壁橱的事。我们强迫他们进入所谓的「学校」,在那里剥夺了他们自然的学习方式,使他们无法自主学习,然后我们让老师承担起「教育」他们的任务。因此,在这种环境下,孩子能够学到的内容极大地受到老师的影响。这是一种自我实现的预言。如果你强迫孩子们进入他们无法自学的环境,那么学习必然依赖于教学。
没有人给孩子系统教学或者刻意教学,他们也能学得很好。尽管如此,我们成年人有责任营造条件让孩子能够自主学习。我认为,真正的教育改革,是提供这些条件的改革。
最关键的条件就是自由。为了自主学习,孩子们需要足够的时间去玩耍、探索、感到无聊并克服无聊、发现自己的兴趣并追随它们。为了掌握相关知识以成为社会中高效、有贡献、有道德的一员,他们还需要丰富的环境。所谓丰富的环境,就是能让他们真正接触到整个文化中被重视的工具、技术、理念、道德原则、风俗和重要讨论的环境。这样的环境有且不限于下列特征。这个环境是混龄的,这样小孩子就可以通过观察和与大孩子及成年人的互动学到新的技能和思想;而大孩子通过与小孩子互动学会怎样培养和领导他人。
狩猎采集者部落里,这些条件都是自然具备的,并不需要花多少心血,因为孩子们自然参与了部落的所有活动(参见狩猎采集者的智慧)。瑟谷学校及其后续模仿的学校证明了,通过一些思考和努力,完全可以为身处于我们文化中的孩子提供这样的环境——而且费用和麻烦远远少于目前的公立学校,其教育成果也非常优异(参见来自瑟谷学校的一课)。很多非学校教育的家庭同样找到了方法创造出了丰富的环境,让孩子们能够非常出色地自我教育。
真正的改革不可能在现有的传统学校系统内开展。
我的朋友,进化生物学家 David Sloan Wilson,常说「你无法从当前位置到达那里」,这句话说明了一个既适用于文化进化也适用于生物进化的进化原则。无论是生物体如恐龙,还是文化体如我们现行的强制教育系统,它们都能发生渐进的演化,但这种变化能力是有限的。有时候,实在无法从当前位置到达目的地。现有结构的构建方式使其无法进行必要的调整,以实现我们所期望的、适应性的结果。恐龙因为无法适应新的生存条件而灭绝,它们的位置被一种新的、极具适应能力的小型生物——哺乳动物所取代。我们的强制学校系统——最初是为了灌输和服从训练而建立的(参见教育简史)——无法被改造来有效地实现真正教育的功能。
对我们现行教育系统进行渐进式的改变,并没有办法完成我所倡导的真正教育改革。那些被进步教育者推崇、看似朝正确方向迈出的小步骤,在这一体系内注定失败。原因在于,若单独实施这些措施,或只做出微小调整,它们便是无效的。在以考试成绩为成功标准的体系里,给予孩子们一点点「自由」于事无补,因为自由的孩子们不会去选择掌握考试的答案。在一个按年龄隔离、且限制孩子玩耍内容的环境中,「玩耍」并不是特别有效的学习工具。
现如今的教育系统,就像恐龙一样庞大且笨重,抗拒变革的力量。它是一个巨型公司,雇佣了数百万人,出于既得利益,他们更倾向于维持现状。由于「顾客」(学生)是被迫而非自愿来到学校的,所以这个系统并不觉得有必要为了取悦「顾客」而做出改变。相反,它更多地服务于那些管理者的既得利益。由于教育在好几代人以来都是强制性的,几乎每个人都经历了这一系统,很难想象没有它的生活会是怎样的。强制学校教育非常擅长于教导我们一个错误的观念——认为我们需要强制学校教育才能学习。
出于这些原因,还有其他种种,真正的改革在我们现有的学校系统内是不可能的。(更多信息请参见:反对教育根本变革的力量。)
真正的改革只有等到足够多的人离开传统学校系统才能开展。
如今,大多数人都相信我们现行的强制学校系统、或其某种形式,对我们社会的教育至关重要。当他们谈论改革时,他们讨论的是教育钟摆的一点点摆动,两种方向的都有。但是,越来越多的人持不同看法。他们离开了传统学校教育系统,因为他们和我所见略同,都认为在该系统内看不到有效改变的希望。一些人选择了,甚至创立了类似瑟谷学校这样激进的非传统学校。其他人选择了在家上学或非学校教育(本质上是由孩子们自己主导的在家上学),许多人正聚集在一起为他们的孩子创造丰富的学习环境,如宾夕法尼亚州的 Open Connections。现在,这些小型学校和学习中心,像白垩纪晚期的小型哺乳动物一样,如履薄冰,小心潜行,避免被恐龙踩踏压扁。但我认为,未来是它们的。
对于真正的教育改革,我设想了这样的情形。人们离开传统学校教育系统的趋势将持续并且加速。这种加速是因为,每当有新的人选择离开,这个选择对于其他人来说就会显得越来不怪异。我们大部分人都受从众心理影响,很少有人愿意做出与众不同的事。但随着越来越多人的离开,每个人都会认识到一两个做出这种选择的家庭,看到这个选择让孩子们更加快乐,而且随着他们成长,对他们在社会上成功的机会没有任何损失。人们的观念会逐渐改变:「看,没必要非得按照传统学校的方式来学习。孩子们可以在玩耍、探索中享受童年,同时学到东西。」
人们会逐步意识到他们有选择的权利。他们将如何选择——是接受传统的学校教育,按照别人的要求行事,还是选择自由?当人们真正明白他们在自由和专制之间有得选时,他们历来会选择什么?
在这一过程中,临界点将会在某一时刻到来。那时,为孩子们选择自由的人将变得如此之多,以至于公众对传统学校的兴趣不足以继续为其提供资金。相反,人们将呼吁发展优质、安全的公园、手工艺中心、设备齐全的图书馆、瑟谷式学校(孩子们可以离开父母在那里玩耍和探索)以及其他优秀的公共学习中心——这些地方为孩子们提供丰富的学习机会,而无需强迫。这些设施的成本将远低于我们的公立学校。通过强制手段让孩子们留在学校里的成本非常高,原因和让犯人待在监狱里的成本非常高是一样的。
这种变革需要多久才会发生?我不知道,但我认为我们可以加快这个进程。我们需要在政治上有所作为,以创造发育的自由选择权。在一些州,由于他们设置的强制学校教育和强制测试法律,开办瑟谷学校,开展非学校教育或者在家上学都成为非法行为。一些有能力雇佣律师的人能找到绕过这些法律的方法;但这很困难,许多家庭发现自己无法按照自己的意愿行事。让我们首先为教育选择的自由而努力,然后,正如我的资本家朋友们喜欢说的,让市场来决定。我赌这些非常规教育会取得胜利。
-----
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
-------------
孩子对自己学习做主时,学数学更轻松
原文:Kids Learn Math Easily When They Control Their Own Learning | Psychology Today
一出了学校,数学就变得有趣,有用,学起来还开心。
发布于 2010 年 4 月 15 日
我们恐惧它、厌恶它;对擅长它的人,我们羡慕而又怀疑;我们对它极其尊敬,让孩子在每一学年的每一天都学习它(或假装学习);它也被用作大学入学的主要标准。它就是数学。我们将数学捧上神坛再转过头去,或是唾弃万分——正如各种我们捧上神坛的事物一样。
数学是我们无法糊弄过关的学校科目,因此很多人都非常害怕数学。每道问题要么正确要么错误,没有部分得分。对很多人来说,数学成绩反映了基本智力。数学成绩差就是逻辑能力差,所以相比其他学科,在数学里人们更恐惧失败,而对失败的恐惧会阻碍学习。我猜测数学在 SAT 和 ACT 大学入学考试中分量如此之重的原因,是人们认为数学是一般推理能力的指标。但他们错了。
掌握数学的第一步是将其推下神坛。我们看重的现实问题是:我应该跟谁结婚?我应该结婚吗?同性恋应该有结婚权利吗?我应该选择什么职业,应该做什么准备?如果我发明了个小玩意,有人会买吗?公司应该和个人一样具有宪法权利吗?通厕所的最好方法是什么?数学对这些问题无用,而这些问题也无法根据公式得出非黑即白的正确答案,或错误选项。人类智能和推理能力在于智慧,而非数学。智慧是针对我们面对的问题,整合常识,人类价值观,好恶,对其他人及其好恶的理解,形成解决方案——从而提升我们和其他人的幸福感,消除我们和其他人的不幸。数学有其作用,在我们的现代社会里有非常宝贵的作用,但数学远远称不上是智能的核心。数学发明之前,人类就具备智能了。我知道的有些聪明人——甚至是一些最优秀的科学家——并不是特别擅长数学。
掌握数学的第二步是要意识到数学并不难。数学并没有什么魔法般的成分。做数学不需要超出常人的天赋。我们让学龄儿童学上上千小时的数学,但其实这并非必要。实际上,着眼于成绩,而非快乐或者实际作用,来强迫孩子学习上千小时的数学,这正是让数学看上去如此困难可怖的罪魁祸首。
证明数学不难的最好证据,来自非学校教育运动,以及瑟谷类学校的实践。我在先前的帖子中描述过这些运动。非学校教育者指的是不为孩子设定培养方案,或衡量学习进度的在家教育家庭。瑟谷类学校是依照瑟谷学校模式设立的学校。所有年龄的孩子每天都能自由选择与任何人交流,能追随自己的兴趣。对于我们传统上对在社会里取得成功的关键,非学校教育者和瑟谷学校式教育者将其完全否定。各种可见证据说明,在这样的环境下,孩子能够成长为快乐、高效、有道德的社会成员,能为自己的生活做主,并在成年后持续学习(关于瑟谷学校毕业成员的研究,参见我 2008 年 8 月 13 日的帖子)。
几周前,我向本博客的读者征集了孩子自主学习数学的故事。共有 61 名读者回应,有些人写得非常好,足以单独成文了。我对此非常感激。大部分故事是非学校教育的父母写的,他们记录了自己的孩子学习数学的过程。我花了几天来整理并定性分析这些故事来找出共同点,而现在我已经初步完成了这项任务,可以与各位分享。
我发现,根据这些数学学习故事背后的主要动机,可以很方便地分为四类。我将其概述为:趣味数学(或者也可称「纯数学」),工具数学(为解决现实生活问题而学习的数学知识),教学数学(根据学习者之外的人设置的培养方案或计划来学习的数学),高考数学(为 SAT,ACT 等大学入学考试取得好成绩而学习的数学)。我描述这四类数学学习时有一些约定,这样适合想略读的人找重点。我会只使用故事讲述者的名字,而不会使用孩子的名字,因为有些人想保持匿名。我在故事之后的评论会采用引言格式,而故事投稿者的话会用圆点列表的形式标出。
趣味数学
我决定以我最喜欢的趣味数学开始。有人管趣味数学叫「纯数学」。这是真正的数学家和四岁孩子都在做的数学。趣味数学之于数字,就像诗歌之于文字,或者音乐之于声音,艺术之于视觉。我之后会描述作为游戏工具的数学,但我现在所描写的是数学作为游戏本身——为其快乐与美感而做的数学。趣味数学在于发现或创造数字中的规律,正如同诗歌在于发现或创造文字中的规律,音乐在于发现和创造声音中的规律,艺术在于发现和创造视觉空间中的规律。
四岁孩子很擅长把身边的世界带入自己的游戏中。他们把玩单词,所以他们是诗人,他们把玩声音,所以他们是音乐家,他们把玩蜡笔,颜料,黏土,所以他们是艺术家。而他们也把玩数字,所以他们是纯数学家。我注意到一个事实,瑟谷学校的学生并没有任何强加的培养方案,所以他们长大后会继续这种玩耍。他们继续把玩文字、声音、颜料、数字,并往往会非常擅长这种游戏。非学校教育家庭中长大的孩子似乎也是如此。
小孩子最早开始的数学游戏,往往是发现有固定规律的数字序列,即有规律重复现象(十进制)的数列,而只要理解了规律就可以一直数下去。可以从非学校教育者的故事中引用三句话来说明这点:
-
Evelyn 有个 4 又 ¾ 岁的儿子(他坚持必须写上 ¾),她写道:「当他理解连点成线后,他突然明白了数字的顺序。他开始无时无刻不大声数数,无论是走路还是躺在床上……有一天他和他同学玩耍,那位同学的母亲很惊讶他怎么如此擅长这些「大孩子才会」的数字……他为她用西班牙语数到了三十,并告诉她自己能用英语数到一百万。所以在此之后他会从早到晚不停数数。这有时对其他人来说很不好受。我们得提醒自己这是好事……他现在数到了 5068……如果我跟别人说他正在数数一直到一百万的时候,他说:「不,一千万。」我希望我能活到那天!
-
来自英国的 Lucy 有个刚满五岁的孩子,她写道:「他有一次在换衣服的时候从 1 数到了 100,只是觉得这样很好玩。那时候我才意识到他会数数!他喜欢排列数字形状的磁铁,让我告诉他排出的数字是多少,他特别喜欢摆百万级别的数字!通过玩冰箱磁铁,他掌握了千以上的数字。他在街区里面走路,注意房子上的数字,于是掌握了奇数和偶数。他能在其他情境下认出这些数字。他通过预测下一个房子的数字掌握了两个两个数数的方法。我们从来没正式教他算数,也没做过书面练习。」
-
Kathy 写道:「我们最大的孩子 6 岁,他非常喜欢数字。他 4 岁前就能数到 199。他喜欢数数,也喜欢让我数数,他跟着做动作。我一边数数,他一边蹦蹦跳跳,在沙发上蹦来蹦去。他开始学数学的契机,是他想知道如果他的东西翻两倍会有多少。我们经历过一段双倍的时候!」
随着小孩子玩数学游戏,他们经常会明白基本的加减乘除概念。有了概念后,具体的计算方式就很容易掌握了。很多故事都可以佐证这点:
-
Janet 有个小女儿,她写道:「就像一般孩子一样,她逐渐掌握了数数。她数数会用手指、食物、玩具、游戏小物件、游戏板以及电脑游戏上的空间等……自然她就借助手指和这些物件开始加加减减,之后便开始心算……她有时候会突然问道:『四加十等于十四吗?』我说:『是』,她说:『那么五加十等于十五,七加十等于十七吗?』她很快发现了加减法的规律,并开始应用这些她自己发现的规律,很有价值。对数字规律的兴趣在她七岁时最为显著……我上学时最怕数学,即使是到了青春期也是。但我必须说随着我观察女儿并跟她交流,我得以用新的目光审视数学,我感到思维更加清晰,之前从未感受过。在她逐渐构建与数字的关系的过程中,我感受到了一种美。」
-
采取非学校教育的妈妈 Lori 写道:「这就是两分钟之前的事。我的小儿子(五岁)在用乐高搭积木,我在另一个房间,他突然一边在沙发上跳,一边笑着喊我:『妈妈!4+4+4+4 是多少?』我说:『16』他笑了,接着说:『8+8 呢?』我说:『16』他笑得更开心了,又问:『2+2+2……』他说的那些 2 加起来正好等于 16。显然他知道这些问题的答案。这些不是有人教他,他再记下来的,而是他从玩乐高,在脑海里摆弄数字,用手指数数得出的。他非常喜欢操纵数字。对他来说,这就是一场游戏。」
-
A-L 有一个小儿子,她写道:「我们的客厅有一扇大窗户。他三四岁的时候有一天走进客厅,并发现窗户有四行窗格,每行七个。『所以』,他说,『如果我数 7 数 4 次,那就是 28』我印象中在那之前我们没讨论过乘法,但他基本上只靠观察格子的排列,就弄明白了乘法的原理和算法。他开始自己捣鼓实验,将纽扣排成行,就像窗格一样。他基本上还要靠数数得出答案,因为他没有记住,但他理解乘法的原理和意义。」
-
Barbara 对她接受非学校教育的女儿描述道:「她刚才一直在跟我说她和她朋友在玩什么游戏,之后我们沉默了几分钟。突然,她兴奋地喊道:『啊我明白了!!』我问她什么意思,她说:『我理解除法了。』她解释道除法是把整个东西分成同等的几个部分。之前我们从未讨论过除法。我没让她解过题,也没向她解释什么是除法……我的故事没有说明她是如何学习这些数学概念的。但我知道,我们选择的生活方式,让她有时间消化思考她的所听所闻,并提出问题。她能用自己的方式关联各种概念,弄懂各种问题,检验自己的理解。我确信一旦她『掌握』了一件事,她会将其记住并运用,因为那完全是她自己的发现。」
-
Aurora 这样描述她的儿子:「那是他七岁时,有天晚上他带着一包彩虹糖回家。就像很多孩子一样,他喜欢把彩虹糖放在盘子上,按颜色整理好,并用彩虹糖玩耍。那天他带了九粒彩虹糖,他把这些彩虹糖排成了三行,每行三个。他说:『看,九这个数字是个方形。』我告诉他这应该叫平方数,并告诉他四行四个彩虹糖也能排成平方数。他后来排了一个又一个方形,越来越大……最后没办法用彩虹糖排方形了(数字太大),或者可能是因为他觉得无聊,他拿出计算器开始计算更多平方数,并把他们写了下来。」
有些读者肯定在想:「当然,好的老师也可以用这些演示技巧来教授数学。相比让孩子自己发现,有老师教的话孩子能更快更高效地学数学。」然而这种想法的问题在于,每个孩子都是不一样的,而无论老师有多聪明,老师都不能钻进每个孩子的脑子里,找出在那个时间点最能让那个孩子聚精会神的技巧来。这就是为什么在长期看来,自主学习——孩子做主的学习——几乎是最高效、最持久的学习,是再才华横溢的老师教孩子也无法比拟的。
工具数学
数学不只是游戏,而更是日常生活中的有用工具。因此我们也会自然而然习得数学。大部分寄给我的数学故事,都讲述了为日常生活使用而学习数学。我从这些故事中引用如下:
-
Amy 是家庭教育妈妈,她有七个孩子。她写道:「他们就是通过跟钱打交道和做饭,而掌握了乘法、除法、百分比计算、加法和减法。他们不仅要把好吃的零食在他们之间均分,还要分享给总是泡在他们身边的朋友。我觉得这对数学学习非常有帮助。食物和金钱能教孩子不少数学,能给他们非常多的动力。」
-
Anne 写道:「我的五个孩子都掌握了阅读菜谱,阅读带单位的数字,如何给料理的调料分量做除法,翻倍或者翻三倍。他们会读地图,能弄明白旅程有多长。他们会玩各种棋牌游戏,这些游戏需要运用数字和推理能力——Uno,Skip-bo,Pinochle 等。随着他们参与各种当地的体育运动,他们掌握了怎么计分和算平均值。其中一个男孩掌握了用表格记录他们组的击球纪录。他们都有银行储蓄账户,也在用分类账簿。」
-
Vincente 是瑟谷学校的员工,他给我寄来了这则可爱的故事:「不知为何我们手上会多出不少零钱,需要把这些钱捆起来存到银行里。我们有个小同学决定帮我们(在我的协助下)。我们把五元钱捆起来,五十一捆。后来他越来越熟练……一周后我在玩躲避吸血鬼的游戏。我们还有个很小的孩子邀请我玩他组织的角色扮演冒险游戏。数零钱的孩子还有其他人也在看着我们,他们在学习。地下城主在敏捷检定中掷出 4 个 5,他的吸血鬼执行一个极好的跳跃和旋转,一只手落在一根铅笔般细的树枝上。在第二次听到数零钱的孩子的话时,Peter 的博客预留的空间叮当作响:『四乘五是二十,五乘四是二十。』乘法交换律——学到了。」
-
Jennifer 也写道:「3 年前,我的儿子(八岁)被确诊为一型糖尿病。现在,每顿饭都要用数学。我们要根据配料表计算碳水化合物总量,每顿饭摄入的碳水化合物总量,每天每个时刻的碳水化合物与胰岛素的比率,校正因子,百分比等。现在他为了活着必须掌握数学。他还是讨厌背乘法表。如果我问他,『3x6 是多少?』他只会无神地盯着我。有一天他想吃曲奇饼,所以我说:『好,如果每片曲奇有 6g 碳水化合物,你要吃 3 片饼干,那这些曲奇一共多少有碳水化合物?』,他眼都不眨地说:『18』。」
-
但有助于学习的不只是食物和金钱。还有一个例子:
-
Beatrice 写道:「女儿在弹钢琴时告诉我她在做数学。她碰到了很多分数——二分音符、四分音符、八分音符、十六分音符,不仅在于乐符,而且在于规律和韵律里。」
很多寄给我的工具数学故事都与游戏有关。现在孩子玩的很多游戏都会涉及数字,至少需要计分;很多游戏需要非常复杂的数学,而为了玩游戏,玩家都会积极地学习。这有几句代表性的引言:
-
H 写道:「我有三个孩子在上民主学校,那里没有强加的培养方案。我的孩子花了很多时间玩网络游戏,都是真实游戏,而不是愚蠢的教育游戏。我 11 岁的儿子在玩冒险岛,他为了玩游戏而掌握了非常复杂的数学。『如果我想买某个价格的头盔,为了赚到这些钱,我需要按一定的时薪玩多少小时才能买到这个头盔?如果我在市场卖了这个东西,手续费是一定的百分比,扣除手续费后还剩多少?我如果的经验是这个百分比,我每小时获得的经验是那个百分比,我需要玩多少小时才能升级?』……此外在游戏里玩家需要与三种不同的货币打交道,需要时常在不同货币之间换算。假如把这些问题从游戏的场景中抽出来,拿来问“真实”学校的五年级学生,你看看能怎么样。」
-
Rebecca 写道:「我最大的孩子在上学前就掌握了基本的数学,因为他要从侵略者手上拯救世界。」
-
Gillian 写道:「我有两个孩子,一个 10 岁,一个 5 岁,他们都接受非学校教育,生活中充满了各种刺激,他们不可能不接触数学。具体而言,我儿子玩的电脑游戏和 PS3 游戏——魔兽世界、模拟人生、神秘海域、英雄之城——都自然而然地运用了数学概念。我并不喜欢故意『教育』人的游戏,我的孩子也一直不喜欢这些游戏。我每次想诱导他们玩这些游戏,他们很快就失去兴趣,这可能是因为这些游戏的语调过于高高在上,相比那些精心设计的游戏都不够复杂。但只要让他们玩需要智慧的游戏,他们必然会掌握那些试图通过课程大纲传授的东西,但他们会学得更加自然,更加轻松。」
-
Erica 也写到:「我的两个儿子(11 岁和 7 岁)一起设计了个游戏,叫『画图战斗』。这是个策略游戏,需要使用加法和减法。他们都会绘制自己的角色……然后每个角色开局会得到 50 点数,可以分配到战斗技巧、武器、生命、护甲上。合理分配点数非常重要,因为有些东西更为重要。每个玩家轮流发起进攻,每人都要计算对敌人造成了多少伤害点数,减去你的角色失去的点数。最终获得最多点数的玩家获胜。」
数学不仅对食物、游戏、理财有用,还对一些职业至关重要——物理、工程学、会计等。无论先前数学教育有哪些空白,自由选择了这些职业的人,会主动学习他们需要掌握的数学,这是他们自主训练的一部分,以下内容引自三则关于为职业而学习数学的故事:
-
Terry 为孩子选择了在家教育(但不是非学校教育),她写道:「我的大儿子对数学总是避之不及……我让他做数学练习册,他会跟我打架,所以我对他在数学上要求越来越少……我们五年级后就不再碰数学了。他基本上可以无限制地玩电脑,并自学了编程和游戏开发。他十七岁的时候,有个拍卖市政债券的公司想让他去那边实习做编程相关工作。他非常擅长编程,对债券和税款之类的东西手到擒来。他经常和大银行的高官通电话,那些人根本不知道跟他们打电话的人如此年轻。他仍然不能立刻说出 6x7 是多少,需要在脑子里算一下。他为了读社区大学而参加了定位测试。他的数学成绩很差,需要参加补习数学课程。他很烦这点,因为这个课需要花钱,但没有学分。所以他学了两天数学(我加了强调),并重新参加了测试。这下他不用上补习数学课,也不用上基础数学课了。如果他觉得有必要学什么东西,他就会好好学。否则他就会根本不管!」
-
Dan 在读人类学博士,他写信给我说明,他在大学修了一些根本没有应用场景的数学课,这些课对他博士生涯中需要的统计学根本没用。他补充道:「经过大量自学和少量指导后,我现在比我遇到的大部分教授都擅长统计学。」
-
我的一位同事是备受尊敬的生物学家,他的工作包括研制数学模型。他在一篇自传性质的短文中写道,他高中和大学数学成绩都很差,也没学到什么。他写到:「我在大学修了一年数学,是大一微积分,我几乎被干掉了。在研究生院我有充足的学习数学的动机,我也学了。我买了《傻瓜都能看懂的微积分》,学的很刻苦,遇到困难就去骚扰懂得多的同学。这个过程不算有趣,但我每次弄懂了什么东西,我就会感到一股成就感,于是就愿意继续下去。我还是研究生的时候,就发表了我的第一篇理论性论文,而我现在是颇有名气的理论生物学家了。」
教学数学
如果这篇文章是那种典型的数学教育文章,那我就会完全讨论教学数学了——“专业”教育者教授给“天真”学生的数学。我们的社会秉持着一种强烈的信念,即数学必须由教师传授,因此即便选择了非学校教育的家长,一开始也不愿意放弃正式或半正式的数学教导。他们会暂且服从于两种文化理念,即(1)必须由教师教授数学才能在社会里取得成功(2)数学并不有趣。所以大部分人不会试图自学数学。但慢慢地,随着他们不断观察孩子,他们变了主意,并放弃了指导。这是两则很好传达这些观点的引语:
-
Rebecca 写道:「显然在征求儿子的同意后,我们姑且选择使用一整套带有视频的数学学习方案。后来我和我的儿子都丧失了热情。他觉得很无聊,我不喜欢材料的讲述方式……重复,重复,还是重复。所以在一番心理斗争后,我松开我的手,放弃那可预测且步调一致的培养方案,告诉我儿子说我放弃了。放弃数学培养方案(和期望)让我轻松不少。很久以来我的心里都是分裂的——『我们采取非学校教育,除了数学。』我对数学非常纠结,我以为我必须努力鼓励(胁迫?)我的儿子使用传统方法来学习数学。」Rebecca 继续解释道她一开始坚持数学教学的顾虑是对上大学的期望。她多年来都坚持,她的儿子必须上大学才能过上好生活,而他必须学数学才能上大学(即便他还没到九岁)。
-
Carin2Learn 写道:「我承认有一刻我太过焦虑就给我儿子看了一个数学练习册网站……他也声称他想要本数学练习册。我给他买了一本,他没有做。可喜的是,数学远不止坐着写题。」
-
还有一些回应者指出,如果孩子自己选择做数学题目或者上数学课,并且能按照自己的办法、自己的节奏做,那么这些对孩子就非常简单。这里有一些引语来证明这个现象:
-
Carlotta 有个儿子,他 12 岁之前都没做过正式数学练习,她写道:「他很快就学完了关键阶段 3 的数学*,只花了三周的时间,一天做一点。他发现这些题目简单得有点可笑,他只花了不到一小时就记住了乘法表(对他发现的各种规律有些兴趣)……三角学不费吹灰之力,方程也不成问题。他小时候在 RuneScape* 里面的市场上玩了挺久,也在不少(有趣的)游戏中解决了很多数学题目。但这就差不多了。根本没费多少功夫。」(*译注:英国教育划分了若干个关键阶段,关键阶段 3 是 11 岁到 14 岁;RuneScape 是一款非常受欢迎的在线角色扮演游戏(MMORPG)。)
-
Fawn 写道:「从二年级到五年级,我的 11 岁女儿都接受家庭教育。我们并没有开展多少正式数学指导,可能每周也就一个小时。她有个练习册,她想做就做,如果她有问题,我就会简单解释一下,但基本上都看她自己。4 年级结束后,她的标准数学测试水平比同年级学生高了不少。她现在在一所传统学校读六年级,这是她自己的要求。她数学平均分有 94 分。」
-
Leslie 写道:「我们做了一些实践活动,但说实话,我自己的数学教育反而是一种障碍。如果我试图向我孩子解释什么东西,他们中有一个会打断我说:『你把我弄糊涂了——我是这么做的』,他会更优雅地解释怎么获得正确答案,这正说明他们对数学的理解比我高出太多。我倍感谦卑。」
-
我上篇文章的一位匿名评论者写道:「我有一个朋友也是非学校教育者,她儿子的数学教育就是随便读读《可怕的数学》。他 14 岁时决定在社区大学修代数课。他找了本教科书,几周内就掌握了所有算术内容。我的另一个朋友让儿子在五年级的时候去读书。接受测试之后学校说他的儿子在年末根本不可能赶上五年级的水平。结果他一个月内就赶上了。」
-
Chris 的女儿就读于传统学校,她写道:「她被诊断为有学习障碍。在小学她能凭直觉给出作业中复杂的数学问题的答案,比如复杂的分数或长除法,但她不知道自己怎么得出这个答案的。我试图向她展示如何写出题目步骤时,她会大声哭泣。『老师不是这么教的!』她会试图写一些神奇的步骤,她记不清,但觉得这就是长除法的步骤,这样得不出正确答案。她拒绝采用我的步骤,即便这样做能获得正确答案,因为老师不是这么教的。」
高考数学
现在,我们最终要来讨论中产阶级家长最担心的数学了。基于一些奇怪的理由,社会决定了想上大学的年轻人——即便是那些想成为诗人或语言学家的青少年——都必须参加评测代数、几何、三角函数能力的考试,即便这些知识他们有生之年可能都不会用到。所以,一些公司靠给孩子做考试辅导赚了不少钱——那些孩子已经在学校“学习”了数千小时数学。很多时候这些辅导非常有效,因为这时候年轻人为了上大学而有充足的动机学习这些数学。之后他们就可以把这些临时记忆的数学永久忘掉。这里有两篇关于接受非学校教育的孩子如何为 SAT 或 ACT 考试做准备的故事。
-
Leslie 的儿子在上大学之前都完全接受非学校教育,她写道:「他最初接触的正式数学教育就是他准备 ACT 考试的时候。在他小时候我们买了数学练习册,甚至还买了一些教科书。但他基本没怎么看过。数学的『肮脏小秘密』是,不同于文化灌输给我们的想法,数学其实不用花那么多时间来学。我的儿子只是花了几周学了一些 ACT 考试准备书,就在 ACT 考试上拿了 33(译注:ACT 数学满分 36)。」(注:在美国,中部的州常用 ACT 考试作为标准,而东西海岸的州常用 SAT 考试作为标准。)
-
为了更多了解没有接受正式数学训练的孩子,如何应对大学入学的数学考试,我采访了 Mikel Matisoo,他是瑟谷学校的学校员工,学生要准备 SAT 考试时经常咨询他。他告诉我,找他的学生往往对数学没有多少兴趣;他们只想取得足够高的 SAT 分数来进入心仪的大学。他说:「SAT 的结构让 SAT 考试准备很容易;有取得高分的小技巧。」Mikel 一般与学生每周见面一到一个半小时,一共见面 6 到 10 周,学生每周再练习 1 到 1.5 小时。因此这些从未接受正式数学训练的学生,总共需要花 12~30 小时。根据 Mikel 的说法,他们一般能取得的成绩,足以进入门槛稍高的学校了。Mikel 解释道,那些非常喜欢数学,SAT 分也非常高的孩子,一般并不找他,因为他们能靠自己准备。
--
-
所以,家长们,请不要担心孩子的数学学习。如果他们有玩耍的自由,他们很有可能会玩数学并喜欢上数学的规律。如果他们生活贴近实际,并会接触计算,他们会按照自己的方式掌握这些必要的计算。如果他们决定上大学,他们很快掌握考试拿到好成绩所需的数学技巧——无论是考试辅导书、课程还是教程。如果他们选择需要数学的职业,他们会积极想办法学习这项职业所需的数学。你们的担忧反而会妨碍他们的脚步。
-
所以,教育者们,请跳出你们的一方天地,看看这些伟大的教育运动——非学校教育和瑟谷学校运动——并研究它们,你们就知道,换一种角度,让孩子自由,做主自己的学习,教育竟能如此无痛而快乐。没有人,至少没有学生,会从我们迫使孩子接受的数千小时数学学习中受益。那些自由的孩子用少得多的时间就能学到相同的知识。
----------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
学习需要自由
关于玩耍、好奇心与学习的新博客介绍
发表于 2008 年 7 月 9 日 | 审稿人:Ekua Hagan
原文:Learning Requires Freedom | Psychology Today
如今,无论我们走到哪里,我们都能看到专家和政客争辩,学校制度要有更多限制。当然,他们不会使用「限制」一词,但他们想要的就是限制。他们想要更多的标准化测试、更多家庭作业、更多监督、更久的在校天数,更长的在校年限、更多制裁那些想要请假一两天参与家庭假期的孩子。在这一点上,两大党派(译注:民主党和共和党)以及各级政府的政客似乎都达成了一致。增加学校教育,或者将其严格化,比减少学校教育或者更宽松的教育更好。
「学校教育」和「教育」(在当下社会的语境中,「教育」通常等同于「学校教育」)这两个术语被各种光环笼罩。它们「本质」上就是好的;根据我们平时听到的逻辑,更多学校教育的价值是无可辩驳的。如果孩子学习了,我们就感谢学校。如果孩子没学到什么,那就意味着他们需要更多的学校教育。如果经济表现不佳,那一定是因为我们没有在学校教育上投入足够的精力。如果经济表现良好,这证实了学校教育的价值,并表明我们应当再接再厉加大学校教育力度。如果人类知识在不断加速增长,那么我们必须要求学生学习更多学科。如果当今世界需要批判性思维,那么我们必须在长长的教学考试大纲中增加批判性思维一项。如果我们相信人类拥有「多元智能」,那么我们必须将它们一一列举,并教授给每一个人。如果我们重视平等,那么我们必须要相信每个人应当学习同样的课程并参加相同的测试,这样我们才能让他们平等(不要想着忘记我们(译注:作者是美国人)民主制度的缔造者的观点:人人生而不同但价值平等)。
关于孩子通过自由玩耍和探索学习的理念发生了什么?从皮亚杰开始,所有严肃的学习心理学理论都假定,学习是由学习者控制的、受好奇心驱使的主动过程。世界各地的教育工作者口口声声支持这些理论,但随后又创建学校,阻止自主游戏和探索。如果我们停下来想一想,我们每个人都知道,我们学到的最有价值的知识不是那些「在幼儿园学到的」的,也不是后来在课程中学到的。相反,它们是当我们允许自己完全而深入地追随兴趣和欲望时学到的。通过这些方式,我们习得了技能、培养了价值观、思想和信息,这些将伴随我们一生,而不仅仅是为了下一次考试。而且,也许最重要的是,我们发现了自己最喜欢的事物,这是找到令人满意的职业的第一步。
每当我们要求孩子必须在学校里多待一小时,多写一小时作业,每当我们哄骗胁迫孩子参加由成人主导的校外活动,我们进一步剥夺了他们玩耍、探索、反思和体验自主的快乐和挫折的机会。我们每次增加新的限制,我们就在学校系统中制造了更大的障碍,把越来越多不能或不愿接受这种限制的年轻人赶走。尤其是男孩,越来越不愿意接受学校教育的限制,越来越多地以各种方式辍学。
我在一所名牌大学任教了很长一段时间。在我的班上,学生在高中的平均成绩是 A。但是他们对所学科目知之甚少。他们之所以获得高分,是因为他们很聪明,而且有动力通过标准程序取得成功。他们琢磨出了怎样才能获得高分,然后他们按此执行。他们想出了如何少花时间学习,又能在考试中取得好成绩。他们学会了如何记住老师想要的信息,只要考试时没忘就算成功。
我并不反对所知甚少的学生进入我的课堂。查找信息和提供信息都很容易。如果学生发现,他们需要一些背景知识才能听懂我说的话,或者看懂他们阅读的内容,他们可以询问或者自行查阅。我只是很遗憾,他们要在学校浪费如此之多的时间,而他们本可以更好地玩耍和坚持自己的兴趣。如果他们这样做了,那么那些决定上大学并选修我课程的人,是秉承着明确的理由的;而其他人也会有很好的理由选择其他的路线。在大学学习中探索和追求自己兴趣的学生很少见,也令人愉快;他们不会把大一当作高四。
我还认识一些在读高中的青少年。他们中有些人是「好学生」,有些不是。我发现,这两个群体对学校的态度同样玩世不恭。「好学生」可能不太明白自己的态度是玩世不恭,也不会认同,但这种态度显然存在。他们找遍捷径来取得好成绩,正是这种态度的最好体现。他们在寻求帮助时会说:「但我并不需要理解它;我所需要的只是正确答案。」这便是一例。
如果我们能够创造环境让孩子们能够安全地玩耍,能够自由地与各种各样的人交流,能够追求自己的兴趣,那么我们就能够为孩子创造更好的生活,提高他们的学习水平,而且花费要比我们现在的学校成本少得多。我知道这一点,因为我曾经见识过这样的环境,我将在以后的文章中告诉你们这些观察结果。
我在此开设《自由学习》这个新博客 ,因为我非常关心教育的状况,和孩子们日益减少的玩耍和探索的机会。我是进化和发展心理学的教授。我对儿童和成人的自然学习方式特别感兴趣。本文是这个博客的首期文章,我在此阐述了一个观点。在未来的几期文章中,我会处理几个以下问题,来继续支持这个观点:
-
为什么人类是所有动物中最爱玩的?
-
爱玩的人适合学习是什么意思?
-
玩耍是工作的对立面吗?(在什么意义上是,在什么意义上不是?)
-
好奇心有什么进化意义?
-
随着孩子长大,好奇心会发生什么变化?
-
儿童和青少年说「我觉得无聊」是什么意思?
-
自由混龄在儿童学习中有什么价值?
-
孩子需要「结构」吗?(当然,他们需要,但是哪种结构?)
-
在什么样的条件下,年轻人能自然而然地自主教育,无需强迫或哄骗?
-
说某人受过良好教育应该是什么意思?
-
成年人在儿童教育中的合理角色是什么?
-
保护儿童免受风险这一行为本身的风险是什么?
-
为什么我们觉得很有必要控制孩子的学习?
-
为什么学校要这样运作?(答案就在历史中。)
-
为什么教育自由化改革总是失败?
-
工作和职业需要什么样的专业,如何习得这种专业?
-
自由的含义是什么,我们为什么要追求自由?
敬请关注,并加入讨论。我会在每个星期三发帖,我会考虑你的问题,评论和论点。我希望能让你们相信,我所说的不是天上掉馅饼的理想主义。我们将讨论活生生的人、真实存在的学校以及系统化实证研究的发现。
宣言 2015 :启动教育革命
原文:Manifesto 15: Triggering the Education Revolution | Psychology Today
这份关于「教育的未来」的宣言正在获得全世界的支持。
发布于 2015 年 1 月 15 日
宣言 2015 之四
对于教育问题,世界公民 John Moravec 放眼全球和未来。他是 Education Futures LLC 的创始人,也是 《Knowmad Society》一书的著者,更是 Invisible Learning 计划的合作发起人, 我与他有三次会面:一次在德国,一起作为咨询委员会的成员,协助开创一所全新的民主学校;在荷兰两次,共同支持欧洲的民主教育。
2015 年的第一天,当人们才从新年前夕苏醒过来,John 发出了一个文件,名字很简单——《宣言 2015》。如今,时机已到,全世界需要重新反思教育,促其剧变。宣言 2015 可以促成这一点。
宣言的副标题乃是——「让学习进化」。进化,可以以两种方式进行,生物或是文化。一种是发源于已有系统中的渐进式进化,另一种是通过新系统的出现,占据了旧系统的位置,从而取代了旧系统。正如我在其他地方论证的那样,我认为后者是教育必须改变的方式,而且已经在改变。我们目前的教育系统是一只恐龙,落后到难以再改革进化。
我同意宣言 2015 中一位评论者的观点,他引用 Buckminster Fuller 的话写道:「你永远无法通过对抗现实来改变什么。若要改变一些东西,就要建立一个新的模型,以体现现有模型的过时。」我认为,这份宣言可以引发成百上千个小革命,以不同的方式遍布世界。如你所见,John 同意了。
我将在此重铸整个宣言,但首先让我们从这里开始:
John Moravec 有关该宣言的评注
我曾经问过 John 有没有一些对于重置版宣言的评注,以下是他发给我的:
「该宣言打算以一种简介的形式呈现,它讲述了我们如何跟上时代去学习,来创造良好的教育未来。」它并不是要吹嘘我们已经知道了所有的答案或最好的办法,但它是对我们现状的诚实评估,并通过陈述原则来说明我们的目标。」
「宣言具有全局观,它是一份原则声明,所以它没有规定我们必须做什么。 我相信,对于未来的教育,我们需要关注多样化的选择生态,而不是单一的元叙事。并且,如果我们创造一个多样化的选择生态,我们需要在自己、社区、家长、学生、政府等之间建立更多的信任......我相信宣言中的第十二条讲述了这些。我认为这一点非常重要,是需要强调的。」
「我发现并非所有人都同意宣言中的所有内容,有人认为它不完整。激励更多关于它的讨论是很重要的。因此,该文档是在知识共享协议(Creative Commons)下授权的,这允许(并鼓励)人们改写我们所写的内容,并拥有将其分享给他们自己社区的资格。」
「短短一周,宣言 2015 的影响力就令我瞠目结舌。我们的读者来自 48 个国家。许多人以前对我来说都是陌生人,现在他们完全不请自来,用自己的语言翻译了宣言。截至今晚,它已经有 7 种语言版本,且至少另有 6 种正在翻译。」
「今天早上,来自危地马拉的 Rebeca Zuñiga 发来了一副优秀的的宣言插图:这里——真是令人震惊。我做梦也没想到我们会收到如此热烈的反响……而这些完全是来自陌生人。」
「我从未想象过这个计划会受到这样的欢迎。再次强调,这只是一份原则声明,而不是行动计划。然而,我们可能刚刚引发了一场运动。现在是时候就我们的下一步展开讨论了。」
既然如此,下面就奉上此宣言:
《宣言 2015:让学习进化》
2015 年 1 月 1 日
许多文件极为鼓舞人心,且多与某个日期密切关联。美国《独立宣言》于 1776 年 7 月 4 日签署;《七七宪章》于 1977 年 1 月颁布;《道格玛 95》于 1995 年制作。思想会随着时间的推移而改变和发展。这份宣言代表了我们对未来的想法、愿景,以及迄今为止我们对学习和教育的了解。这篇文章作为一个参考,来帮助我们理解:迄今为止我们都做了些什么,以及我们下一步需要采取什么行动。
「在一个充满不确定性和原有教育系统逐渐过时的世界里,我们如何才能确保个人、社区和地球的成功?」我们需要让教育进化。
到现在,我们已了解到:
\ 1. 「未来已经来到,只是尚未普及」(William Gibson,格莱斯顿,1999 年)。教育领域远远落后于大多数其他行业,很大程度上是因为我们倾向于回头看,而不是向前看。例如,我们教文学史,但不教导学生书写未来。我们教授历史上重要的数学概念,却不参与创造建设未来所需的新数学。此外,在学习中发生的一切「革命」都已经在不同的规模、不同的地方、不同的地方发生了。当我们鼓起勇气从彼此的经验中学习,并在实践中承担以未来为导向的风险和责任时,对我们自己和我们组织的全面影响将会实现。
\ 2. 1.0 时代的学校没有能力教授 3.0 时代的孩子。我们需要重新定义和清晰理解这些问题:我们教育的目的是什么,我们为什么要这样做,我们的教育系统为谁服务。主流强制学校教育是建立在一种过时的 18 世纪模式之上的,这种模式培养有潜力成为忠诚、高效的工厂工人和官僚的公民。在后工业时代,这不再是教育的最终目标。我们需要支持学习者成为创新者,能够利用自己的想象力和创造力为社会实现新的成果。我们这样做是因为今天的挑战不能通过旧的思维来解决。我们都有责任共同创造一个造福世界各国人民的积极未来。
\ 3. 孩子也是人。所有的学生都必须被当作拥有权利和义务的人来对待。这意味着,学生在与他们学习有关的选择上有极大的发言权,包括他们的学校如何运行,如何和何时学习,以及日常生活的所有其他领域。这是真正意义上的包容。所有年龄的学生都必须有自由,在不侵犯其他人同等自由的前提下,就可以探索适合他们的教育机会和学习方法了(摘自 EUDEC, 2005 年)。
\ 4. 如果别人把你推下去,你就不会有自己从悬崖上跳下的快感。换句话说,自上而下的师生关系并不能最大程度上进行学习,因为它吞噬了好奇心并消除了内在动机。我们需要采用扁平化、横向化和分布式的学习方法,包括同侪学习和同侪教学,并让学生实现这些模式。教育工作者必须创造空间,让学生决定是否「跳下悬崖」,以及何时「跳下悬崖」。失败是学习过程中很自然的一部分,我们总是可以再试一次。在平坦的学习环境中,教师的角色是帮助确保学习者做出平衡的决定。失败是可以接受的,但是创造失败就不行。
\ 5. 不要看重评估的价值,而要对我们看重的价值进行评估。我们太痴迷测试,不知不觉就让经合组织通过 PISA 体系成为了「世界教育部」,对教育评估的狂热便蔓延全世界。全国性的、州与州之间的竞争,宛如在相貌平平的家族里挑出最漂亮的孩子。更糟糕的是,我们的学校正在培养不知道如何解读考试成绩的政治家和政策领袖。最好的创新往往在我们开始担忧评估的那一刻就被扼杀了。我们需要结束强制考试,并将这些资源重新投入到创造真正价值和成长机会的教育项目中。
\ 6. 如果「技术」是答案,那么问题是什么?我们似乎沉迷于新技术,却不了解它们是用来做什么的,也不知道它们如何影响学习。技术是伟大的,我们已经做得比原来好很多了,但「使用新技术在课堂上做同样的老东西」,这是一种浪费。黑板已经被白板和智能板所取代。书籍已经被 iPad 所取代。这就像建造一个为马车提供动力的核电站。然而,一切都没有改变,我们仍然把大量的资源集中在这些工具上,浪费了利用它们的潜力来改变我们的学习内容和学习方式的机会。通过用技术重现过去的实践,学校更关注硬件和软件的管理,而不是开发学生的「思维工具」和「有目的」的使用这些工具。
\ 7. 数字学习技能是看不见的,学校也应该有技术。隐形学习是承认我们所做的大多数学习都是「隐形的」——也就是说,它是通过非正式的、不正规的和偶然的经验而不是通过正式的指导(Cobo & Moravec, 2011)来实现的。它考虑到技术进步的影响,以真正使无形的空间得以出现——但正如空间一样,技术的使用同样是无形的和流动的。如果我们的学校和政府面临的挑战是培养在创造力和创新方面脱颖而出的学生,而不是盲目地背诵和重复旧思想的学生,那么任何学习技术的使用都必须实现这些创造性和创新方向。学校不应该使用计算机「工作」,围绕预先分配的参数和规定的结果;它们应该被用来帮助设计和创造超出课程想象的产品和学习成果。不要把技术放在最前沿,使学习变得模糊,而是让它无形而又环境化,使学习者能够利用这些工具发现自己的发展路径。
\ 8. 我们无法管理知识。当我们谈论知识和创新时,我们经常将这些概念与数据和信息混淆在一起。我们常常欺骗自己,以为我们给了孩子知识,其实我们只是在测试他们能重复哪些信息。需要明确的是:数据是零零碎碎的,我们把它们组合成信息。知识是获取信息并在个人层面上创造意义。当我们采取行动,用我们所知道的去创造新的价值时,我们就是创新。理解这种差异暴露了学校管理和教学面临的最大问题之一:虽然我们擅长管理信息,但学生头脑中的知识是否会降级为信息,我们无能为力。
\ 9. 「网络就是学习」(Siemens,2007)。本世纪新兴的教育学并没有经过仔细的规划。相反,它的发展是流畅的。我们在网络之间的穿越是我们学习的途径,随着网络的扩展,我们的学习也在扩展。在连接主义的学习方法中,我们把我们的个人知识连接在一起,以创造新的理解。我们分享我们的经验,并由此创造新的(社会)知识。我们必须以个人在这一领域的导航能力和独立建立联系的能力为中心,发现如何将他们独特的知识和才能结合起来解决新问题。
\ 10. 未来属于书呆子、极客、创造者、梦想家和知识狂人。虽然不是每个人都会或应该成为一名企业家,但那些没有培养企业家技能的人将处于巨大的劣势。我们的教育系统应该关注「企业家」的发展:利用他们的专业知识去梦想、创造、制作、探索、学习和促进企业家、文化或社会事业,承担风险,享受过程和最终结果一样多,而不担心过程中可能出现的失败或错误。
\ 11. 打破规则,但首先要清楚地了解「为什么」。我们的学校系统建立在服从、强制服从和自满的文化之上。学生、教职员工和我们的机构的创造力在本质上是被抑制了的。别人告诉我们该想什么比我们自己思考要容易得多。公开地提出问题,并建立一种元认知意识,了解我们创造了什么,以及我们想对此做些什么,才能最好地治愈这种制度化的萎靡。只有这样,我们才能合理地打破现有体制,挑战现状,并有可能产生真正的影响。
\ 12. 我们必须而且能够在我们的学校和社区建立信任文化。只要我们的教育系统继续建立在恐惧、焦虑和不信任的基础上,上述所有挑战就会继续存在。在 Minnevate! 项目(MASA, 2014),研究人员发现,如果教育工作者要建立一个转变教育的集体能力,我们需要参与的社区,我们还需要与我们服务的社区参与。这需要一种新的行动理论,以信任为中心,学生、学校、政府、企业、家长和社区可以参与合作行动,共同创造新的教育未来。
有人说,这些原则需要一场革命才能实现。还有人说,我们需要大规模的创新,才能让积极的教育在未来成为现实。我们认为二者我们都需要,或者正如 Ronald van den Hoff(2013 年)所说:「我们真正需要的是一种创新!」(p . 236)。这是我们的崇高追求:不仅用我们的想法进行「创新」,而且用我们通过个人努力和共同努力在全球范围内有目的地应用我们所学到的知识。
《宣言》中列出的参考文献和推荐读物
Cobo, C., & Moravec, J. W. (2011). Aprendizaje Invisible: Hacia una nueva ecología de la educación. Barcelona: Laboratori de Mitjans Interactius / Publicacions i Edicions de la Universitat de Barcelona. http://www.aprendizajeinvisible.com (http://www.aprendizajeinvisible.com)
EUDEC. (2005). EUDEC guidance document. European Democratic Education Community. Retrieved January 1, 2015 from http://www.eudec.org/Guidance+Document#Article_1:20_Definitions (http://www.eudec.org/Guidance+Document#Article_1:20_Definitions)
Gladstone, B. (Producer). (1999, November 30). The science in science fiction [Radio broadcast episode]. In Talk of the Nation. Washington, DC: National Public Radio. http://www.npr.org/templates/story/story.php?storyId=1067220 (http://www.npr.org/templates/story/story.php?storyId=1067220)
Gray, P. (2013). Free to learn. New York: Basic Books.
van den Hoff, R. (2013). Society30: Knowmads and new value creation. In J. W. Moravec (Ed.), Knowmad Society (pp. 231–252).
Minneapolis: Education Futures. http://www.knowmadsociety.com (http://www.knowmadsociety.com)
MASA. (2014). Minnevate! 2013-2014 activity report. St. Paul, MN: Minnesota Association of School Administrators. http://minnevate.mnasa.org (http://minnevate.mnasa.org)
Moravec, J. W. (Ed.) (2013). Knowmad Society. Minneapolis: Education Futures. ISBN (print edition): http://www.knowmadsociety.com (http://www.knowmadsociety.com)
Siemens, G. (2007). The network is the learning. (http://www.youtube.com/watch?v=rpbkdeyFxZw)
---------------
你能做的事
你不必完全同意这份宣言。大多数有思想的人都会挑剔别人写的东西。但是,如果你同意 90% 的内容,并且觉得余下的内容值得讨论的话,我建议你在这里签名,在这里你也可以添加你的评论并发送给其他人。另外,请把这篇博文转发给其他人。
不论你是否同意这份宣言,我都邀请你在下方的评论区提出你的想法、批评、评论和疑问。这份博客是一个讨论平台,我和其他读者重视并尊重你的想法。和往常一样,我更喜欢你把你的想法和问题贴在这里,而不是通过私人邮件发给我。把它们放在这里,你就可以和其他读者分享,而不仅仅是和我。我阅读所有的评论,并试图回答所有严肃的问题,如果我觉得我有一些有用的东西要说。当然,如果你有什么真的“只”适用于你和我,那就给我发邮件吧。
想了解更多关于教育未来的信息,以及如何找到未来,请访问 AlternativesToSchool.com 和 Free to Learn。
弥合贫富学生的学业成绩差距
原文:Mend the Gap Between Rich and Poor in School Achievement | Psychology Today
我们知道如何缩小学业差距,但是我们却反其道而行之。
发表于 2017 年 9 月 20 日
我们的强制公立学校系统被认为是「伟大的平等器」。通过为每个人提供同样的教育,它应该促进年轻人的机会平等,而不论其社会经济背景如何。然而,事实上,这个系统从来就不是一个伟大的平等器,而且研究表明,它今天甚至比过去更不公平。
几年前,斯坦福大学的 Sean Reardon(2012年)发表了一篇分析,总结了许多研究成果。这篇分析显示,总体而言,从 1970 年代中期到 2000 年代初,最富有的 10% 家庭的学生和最贫穷的 10% 家庭的学生之间的成绩测试分数差距增长了 40% 至 50%。这种差距在所有年级都存在,但在学校教育的后期比早期要大得多。到了高二,家庭收入最低的 10% 的学生的平均考试成绩比收入最高的 10% 的学生低三到六个等级(取决于考试类型)。
在这里,我将描述一些在缩小成绩差距上失败和成功的尝试,然后我会解释,为什么我认为公众支持自主教育,将是缩小甚至消除差距的好办法。
一些缩小差距的尝试以失败告终
在学校教育上花更多的钱并不能解决问题
在过去几十年间,联邦、州和地方政府大大增加了公共教育的开支,缩小了贫困学区和富裕学区之间的开支差距。在同样的几十年间,贫富学区的学业成就差距却不断扩大。事实上,一些研究表明,即使在富裕地区,在同一所学校就读的富学生和穷学生之间的平均差距,几乎与在不同学校就读的富学生和穷学生之间的差距一样大(Deruy, 2016; Tucker, 2007; Schmidt et al., 2015)。
缩小班级规模并不能解决问题
人们可能会认为,如果班级规模较小,教师更多关注那些最需要帮助的学生,从而缩小差距。然而,迄今为止的研究表明,班级规模与学生的整体成绩或贫富学生差距的大小几乎没有关系(参见,Hoxby, 2000; Cho et al, 2012)。事实上,只有为数不多的研究表明,小班的成绩有所提高,但这些研究也说明,富学生比穷学生受益更多(Jackson & Page, 2013; Li & Konstantopoulos, 2017)。也许缩小班级规模会导致教师在成绩好的学生身上花费更多时间,而更需要帮助的学生仍然被忽视了。
施加更多压力、训练、测试和标准化于事无补
《不让一个孩子掉队》法案和最近的《每个孩子都成功》法案,其部分动机是缩小成绩差距。从理论上讲,这些计划将减少学校之间和教师之间在教学方式上的差异,并确保所有学生学习基本相同的课程,并给予相同的压力以在学校取得成功。然而,在这些计划实施的这段时间里,差距却在扩大。
在其他地方(参见),我已经解释了为什么这个结果应该在意料之中。许多研究表明,较高的压力会提高那些已经熟练掌握某项任务的人的表现,而使那些不熟练的人的表现更差。学习新事物的最佳方式是在一个充满乐趣、无压力的环境中学习它。如果经济贫困的学生在开始上学时对学校所教的内容了解得比富人少,那么高压会降低他们的分数,而提高富人的分数。(关于这个想法的更多信息,见这里。)此外,教学和测试的标准化减少了教师因材施教的机会,所以它很可能导致忽视经济贫困学生的真正需求。
小小年纪就开始接受学业训练并不能解决这个问题
缩小成绩差距的另一个失败的方法,是提前开始教授学业技能——幼儿园甚至是学前班。正如我在其他地方记录的那样(这里),如果以一年级的考试成绩作为衡量标准,这些项目通常会产生短期效益,但从以后的学业考试成绩和社会技能评估来看,会产生长期危害。学前班和幼儿园的学业培训所促进的早期学习显然是肤浅的,没有建立在智力理解的基础上,所以它干扰了以后更深层次的语言和数学技能的学习(关于这一点,见这里)。
当「学校氛围」改善时,这种差距就会缩小
另一种学校改革的方法——与压力、训练和标准化的方法完全相反——是改善「学校氛围」。这里的「氛围」是指渗透在学校文化中的态度。积极的氛围是指,教师对学生热情,并且支持、信任、尊重学生,将学生看作独特的个体,而学生感到学校和学校成员在支持他、赋予他能量,总体感觉积极。
最近,Ruth Berkowitz 和她的同事(2017 年)发表了一份关于学校氛围与学业成绩之间的研究综述。该综述显示,总的来说,氛围的改善与学习成绩的提高正相关,至少在一些研究中,与成绩差距的缩小正相关。
显然,导致成绩差距的一个原因是,富人学生倾向于认为他们「属于」学校,而穷人学生倾向于认为他们不属于。因此,教师和其他工作人员共同努力,表明每个人都有归属感——每个人都受到尊重、关心和欢迎——这往往会提高经济贫困学生的参与度,从而提高他们的成绩,这比富裕学生的参与度提升要高,从而缩小差距。
评估「探究式教学」价值的研究与学校氛围研究密切相关。这种教学风格相比学校的方法更为自下而上。其目的是把学生自己的问题放在最前面,认真对待学生——所有学生——的想法。如果执行得好,它能吸引所有学生,包括那些本来最不愿意参与的学生。一些研究表明,这种教学方式对以前成绩差的学生的帮助,甚至超过了对以前成绩好的学生的帮助,从而缩小了成绩差距(Marshall & Alston, 2014; Dickinson, 2016)。
在纽约州宾汉姆顿市开展的为期一年的实验,成效显著
几年前,David Sloan Wilson——宾汉姆顿大学的进化生物学家与同事们一起进行了一项了不起的教育实验。他们在纽约州宾汉姆顿市开办了一所新的公立高中,只招收成绩最差的学生(Wilson et al., 2011)。只有那些进入 9 年级或 10 年级,在上一学年有三门或更多课程不及格的学生才有资格录取。在符合条件的 117 名学生中,有 56 人被随机分配到名为实验组学院的实验学校,其余的人组成对照组,继续留在宾汉姆顿的单一公立高中。
Wilson 和他的同事们根据从进化理论和研究中得出的原则设计了这所学校,但是,为了我们的目的,该设计可以被理解为主要是为了改善学校氛围。这些创新包括团体认同建设活动;由学生和教职员工共同参与的集会和理事会会议;由所有学生和教职员工签署的学校章程;校长和每位教师每天都试图与每个学生进行个人的积极互动;参与艺术活动的机会(包括大厅里学生绘制的壁画);探究式教学;以及强调合作和课堂上的相互支持。应学生的要求,周五下午专门成立了一个有趣的俱乐部,学生可以在其中从事他们自己选择的活动。当然,这些活动减少了可直接用于学业教学的时间总量;然而,学校却取得了显著的学业成果!
实验组学院的学生不仅在年底的纽约州规定的成绩测试中大大超过了对照组,而且表现与宾汉姆顿高中所有学生的平均水平相当。至少从这个角度来看,在实验组学院的一年时间里,他们消除了之前几个学年积累的不足。根据 Wilson 和他的同事们的说法,这个项目的每个学生的成本只比普通宾汉姆顿高中的成本略高。
然而,显然由于某些官僚主义方面的因素导致教师流动问题,使该项目在第二年停止了。[可悲的是,这并不让我感到惊讶。公共教育的历史中,有各种创新之举在显露其成功之处之后就遭到废除]
为什么我相信支持自主教育会最终会缩小差距
有一个经验教训是:学校安排越是依赖僵化、专制、狭隘的任务和考试来推动,那么贫富学生之间的成绩差距就越大。越是友好、信赖和赋权于学生,差距就越小。
我听到有人辩解说,自主教育——在瑟谷模式学校和 Agile Learning Centers 发生的那种完全信任的、授权的、由学生主导的教育——可能对中产阶级和上层阶级的孩子有效,但对贫困家庭的孩子却不起作用。这一论点的前提是,较富裕家庭的孩子在家里有丰富的教育资源,因此不需要强制学校教育,而贫穷的孩子没有这样的家庭环境,因此需要强制学校教育来学习。但我认为,在为这种教育设计的学校或学习中心的支持下,自主教育对贫穷的孩子特别有效,正是因为它提供了较富裕的孩子在家里经常有的那种自主学习的机会和支持。
到目前为止,由于没有公共资助,来自贫困家庭的儿童在自主教育学校就读的人数相对较少,并且缺乏研究比较这种教育对贫困儿童和富裕儿童的影响。但我敢打赌,这样的学校将大大减少甚至消除成绩差距,只要差距不是由营养不良和铅中毒等贫穷造成的生理上的伤害所导致的。据我观察,来自贫困家庭的孩子和来自富裕家庭的孩子一样好奇,一样有动力去了解这个世界,一样有动力为自己创造美好的生活。像所有的孩子一样,他们渴望有机会掌握自己的生活,控制自己的学习;他们只是需要机会。他们不需要胁迫;他们需要的是一个让他们感到受欢迎、被爱、有能力的环境,以及让所有人都能自由获得充足的学习机会。
如果在某个学校,在某个地区进行这样的实验,岂不妙哉?自主教育学校的每个学生的成本通常比标准公立学校的成本要低得多,所以这个实验实际上会节省公共资金。关于自主教育的更多信息,见这里。
-----------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
------
------------
参考文献
Berkowitz, R., et al. (2017). A research synthesis of the associations between socioeconomic background, inequality, school climate, and academic achievement. Review of Educational Research, 87, 425-469.
Cho, H., et al. (2012). Do reductions in class size raise students’ test scores? Evidence from population variation in Minnesota’s elementary schools. Economics of Education Review, 31(3), 77–95.
Deruy, E. (2016). In wealthier school districts, students are farther apart. The Atlantic, May 3, 2016.
Dickinson, K. (2016). An exploratory study of inquiry-based learning to close the achievement gap in high school reading and writing. Doctoral dissertation, Seattle University. Available at ProQuest.
Hoxby, C. M. (2000). The effects of class size on student achievement: New evidence from population variation. Quarterly Journal of Economics, 115, 1239–1285.
Jackson, E., & Page, M. E. (2013). Estimating the distributional effects of education reforms: A look at Project STAR. Economics of Education Review, 32, 92–103.
Li, W., & Konstantopoulos, S. (2017). Does class-size reduction close the achievement gap? Evidence from TIMSS 2011. School Effectiveness and School Improvement, 28, 292-313.
Marshall, J., & Alston, D. (2014).Effective, sustained inquiry-based instruction promotes higher science proficiency among all groups: A 5-year analysis. Journal of Science Teacher Education 25, 807-821.
Reardon, S. F. (2012). The widening academic achievement gap between the rich and the poor. Community Investments, 24 (2), 19-39.
Schmidt, W. H., et al. (2015). The role of schooling in perpetuating educational inequality: An international perspective. Educational Researcher, 44, 371-386.
Tucker, M. (2017). Differences in performance within schools: Why so much greater than in outer countries? Education Week’s Blog, Sept. 6, 2017.
Wilson, D. S., et al, (2011). A program for at-risk high school students informed by evolutionary science. PLoS ONE, 6 #11.
微创教育:印度经验
原文:Minimally Invasive Education: Lessons from India | Psychology Today
数千名贫困的印度儿童如何掌握计算机技能
发布于 2009 年 1 月 28 日
十年前,1999 年 1 月 29 日,时任 NIIT(总部位于新德里的信息技术公司)学术主管的 Sugata Mitra,启动了一系列关于儿童自主学习的有趣研究。
那天,Mitra 打开了一台他安装在 NIIT 大楼外墙上的电脑。这堵墙正对着新德里最大贫民窟,那里的孩子大多不上学,基本都是文盲,从未见过电脑。他安装了电脑,放在那,告诉孩子们可以玩,然后用摄像机监控周围的活动。
这些孩子——大多数在 6 到 13 岁之间,他们好奇地接近着这台电脑,开始探索这个像电视机的奇怪装置。他们开始触摸计算机的各个部位,惊奇地发现,通过在触摸板上移动手指,可以移动屏幕上的指针。这引发了一系列令人兴奋的发现。当指针移动到屏幕的某些部分时,会变成一只手。按下触摸板时,屏幕会发生变化。于是他们呼朋唤友,告诉他们这机器的神奇。每一个新的发现,无论是一个孩子还是一群孩子发现的,都会与其他人分享。几天之内,数十个孩子已经学会在网上冲浪,下载音乐和游戏,用 Microsoft Paint 画画,不胜枚举。
随后,Mitra 和他的同事在印度其他 26 个地方重复了这个实验,包括农村和城市,结果总是大致相同。在其他国家也有类似的发现,例如柬埔寨、埃及和南非。直到如今,当我写下这些文字时,新的户外电脑正在世界各地的贫困地区安装。
无论在哪里设置电脑亭,孩子们都会迅速聚集,探索设备,并在没有外界帮助的情况下,通过互相帮助,发现使用它的各种有趣方法。孩子们为电脑、其部件、屏幕上出现的各种图标以及他们可以用电脑进行的活动编造了名字。例如,有一组孩子用他们的母语印地语称呼指针为「针」,文件夹为「橱柜」。那些不懂英语的孩子,通过与电脑互动和与他人讨论,学会了许多英语单词。认字的孩子有时会找到并下载他们感兴趣的文章,用他们熟悉的语言(通常是印地语或马拉地语)阅读。
Mitra 和他的同事将他们所实验的这种教育称为「微创教育」,借用自医学领域外科手术术语,意为对孩子的生活干扰极少。实验表明,孩子们在没有成人老师的情况下,以惊人的速度学习。教育者所需要做的只是提供工具——电脑。拿到工具后,孩子们天然的好奇心、爱玩本性和社交能力便接管了一切。
Mitra 和他的同事估计,每安装一台户外电脑,平均有 300 个孩子在三个月内掌握基本的电脑操作技能。也就是说,100 台电脑在三个月内可以使 30,000 个孩子掌握电脑技能。米特拉所说的「掌握电脑操作技能」是指他们能够「完成以下大部分或全部任务」:
• 使用所有 Windows 操作功能,例如点击、拖动、打开、关闭、调整大小、最小化、菜单、导航等。
• 用电脑画画。
• 下载保存文件。
• 玩游戏。
• 运行教育和其他程序。
• 在有网络连接时上网冲浪。
• 注册邮箱。
• 收发电子邮件。
• 在线聊天。
• 进行简单的故障排除,比如扬声器不工作。
• 下载和播放流媒体。
• 下载游戏。
对这些使用户外电脑的孩子(随机选择)进行各种测试,Mitra 得出结论,这种环境下孩子们的学习能力「似乎与他们的教育背景、英语或任何其他语言的识字水平、社会或经济水平、种族和出身地(城市、城镇或村庄)、性别、遗传背景、地理位置以及智力无关」。
Mitra 的观察生动地佐证了我博客的许多观点。我主要认为,孩子们能够自我教育。米特拉观察到,孩子们自学使用电脑,然后利用电脑自学更多的知识。他们之所以能做到这一点,是因为他们内在拥有一系列强大的自我教育本能——好奇心、爱玩本性和社交能力。
好奇心:所有哺乳动物都有好奇心,人类尤为如此,特别在童年时期,好奇心达到了顶峰。人类擅于使用工具,所以我们的好奇心不仅引导我们用感官探索新事物,还引导我们动手去探索。当我们看到新事物时,我们想知道可以用它做什么。从婴儿期开始,孩子们通过操纵新物体来探索它们——推、摇、挤、丢、扔、弹——以观察可能产生的有趣效果。在米特拉的实验中,好奇心吸引孩子们来到户外电脑前,并激励他们以各种方式操纵它,了解它的特性。这些操作带来了令人兴奋的发现,每一个发现又引发了新的问题和新的发现。例如,发现点击一个图标会导致屏幕变化后,孩子们会点击所有其他可用的图标,只是为了看看会发生什么。
爱玩:所有哺乳动物的幼崽都喜欢玩耍,但人类是最为好玩的。爱玩本性促进技能发展,这也是主要的进化功能之一(参见 2009 年 1 月 1 日的文章)。玩耍涉及重复但多样化的动作,旨在产生玩家心中想要的效果。这些动作——无论是身体的还是脑海中的——都是为了纯粹的乐趣而进行的,但结果是对这些动作的熟练掌握。在 Mitra 的实验中,爱玩使孩子们在使用电脑功能方面变得非常熟练。例如,已经探索过绘图程序并知道如何使用它的孩子们,会被激励去玩这个程序,即用它来画很多画。通过这样的玩耍,这些孩子们在电脑绘画方面变得熟练。通过玩耍,孩子们巩固了已经获得的知识,并发展了使用这些知识的技能。玩耍常常无意中导致新的发现,这又激发了新的好奇心,导致新的探索。玩耍和探索是密不可分的。
社交天性:我们不仅是极其好奇和爱玩的动物,也是极其善于社交的动物。我们的社交天性使我们想知道别人知道的事情,并且想与他人分享我们的故事和知识。和其他哺乳动物相比,这一点尤为突出。通过语言和我们与他人交流和理解的愿望,我们的思想与其他人的思想联系成一个庞大的网络。没有其他动物拥有这种交流的能力和驱动力,这也是为什么其他动物无法发展出文化。在 Mitra 的实验中,社交天性激励孩子们一起玩耍,想知道和做别人知道和做的事情,并与他人分享自己的知识。当一个孩子发现电脑可以做某件新事情时,这个发现就像野火一样在附近的孩子群体中迅速传播;然后这个群体中的某个孩子会把新知识的火花带到另一个群体,在那里点燃新的野火,如此反复,直到大约 300 个在不同时间使用电脑的孩子都受到了影响。每个孩子的发现都成为了共享知识,社交网络里的孩子都会知道。
为什么 Mitra 的微创教育实验的教育效果显著且传播迅速,而学校课程却不能如此?要回答这个问题并不难。以下是几个可能原因:
• 学校里的孩子不能自由探索自己的兴趣,热情因之削减。
• 学校里的孩子不断受到评估。一旦孩子过度关注这些评估,无论喜欢还是讨厌,都会压倒并破坏他们学习特定知识的兴趣。
• 在学校的孩子往往拘泥于标准答案,也不准得出其他答案,丧失了寻找新方法的热情。
• 学校按年龄对孩子进行分班,这阻碍了年龄混合和多样性,而这,似乎是自然学习的关键。Mitra 观察到,围绕户外电脑聚集的混龄儿童中,有着各种能力和兴趣的混合,确保了不同的孩子尝试和玩弄电脑的不同功能,并且做出了各种各样的发现,这些发现可以在孩子之间传播。
当学习自然发生,一切都显得如此简单和有趣。在教室里,我们牺牲了孩子进行自然学习的机会,并用强制手段取而代之,学习于是变得困难和乏味。如果我们能够专注为孩子们提供优化他们自我学习能力的环境和工具,在混龄中学习,并且停止控制孩子的学习进程,人们的生活会变得更轻松有趣,文化也会更为繁荣。
--------
参见新书《自由学习》
---------
一些描述 Mitra 工作的参考资料:
要观看 Mitra 讲述他对微创教育研究的视频,请点击这里。
要了解 Mitra 微创教育项目的最新进展,请点击这里。
Mitra 及其同事发表的文章:
Dangwal, R., Jha, S., & Kapur, P. (2006). Impact of minimally invasive education on children: An Indian perspective. British Journal of Educational Technology, 37, 295-298.
Inamdar, P. (2004). Computer skills development by children using ‘hole in the wall' facilities in rural India. Australasian Journal of Educational Technology, 20, 337-350.
Mitra, S. (2003). Minimally invasive education: A progress report on the "hole-in-the-wall" experiments. British Journal of Educational Technology, 34, 267-371.
Mitra, S. (2004). Hole in the Wall. Dataquest (India), Sept. 23 issue. URL http://dqindia.ciol.commakesections.asp/04092301.asp.
Mitra, S. (2005). Self organizing systems for mass computer literacy: Findings from the ‘hole in the wall' experiments. International Journal of Development Issues, 4, 71-81.
Mitra, S., & Rana, V. (2001). Children and the internet: Experiments with minimally invasive education in India. British Journal of Educational Technology, 32, 221-232.
我对《自由学习》的期望
原文:My Hope for “Free to Learn” | Psychology Today
在成年人的权利上我们取得很大进步;那么儿童的权利呢?
发布于 2013 年 3 月 30 日
我感觉,自己有点像安徒生《皇帝的新衣》里,那个大喊「但他什么也没穿啊!」的孩子。我估计一些读者也有类似的感觉。
所有人似乎都相信,我们的学校教育胁迫系统,对教育儿童是不可或缺的。他们相信这一点,不是因为他们根据自己的眼睛和常识,判断出这是对的,而是因为所有人都这么说,那么这肯定是对的。很多人对此并不多加思考,他们只是接受这是对的。他们可能自己痛恨学校,但仍然假定学校是必要的,就像难吃的药物一样。更不用说大部分药只消几秒便能吃下,而强制学校教育却要耗上 11 年(甚至在美国某些州要花上 13 年)。
几乎所有政治领袖都拥护一个观点,即更多强制学校教育会通往更好的未来。慈善家热忱地工作,来让儿童更早上学,每天上更多小时的学,每年上更多天的学,整个人生上更多年的学。联合国关于儿童权利的宣言——毫不讽刺地说——宣称所有儿童都有接受强制教育的权利(如果你不相信,参见这篇文章的第七项。)这是对人类“权利”多么扭曲的诠释:你有权利被强迫置身于你必须服从命令的环境,长达数年,而你无法拒绝。这是典型的奥威尔式双言巧语(doublespeak),但很少有人能够意识到它的存在。我们太过执迷于儿童必须被强迫学习的想法,我们已经无法想象儿童可能没有强迫学习会更好。(作为辩护,我在此指出这篇联合国宣言也说出了儿童玩耍的权利。)
但我认为,就像那些赞颂皇帝美丽新衣的大多数人一样,那些宣称相信强迫学校教育价值的人,对这种信念并非心悦诚服。他们的“相信”,只是因为大家都说自己相信,因为说自己不信会看起来很蠢,因为相信后有利可图,或者因为忤逆大众令人浑身难受。但同时,他们也发现,很难全盘否认他们双眼所见,常识所向,同时也很难将他们关于自由和尊严的信念,与孩子关在学校里不应有自由和尊严的信念相平衡。当我与强制学校系统的拥趸谈话,并循循善诱让他们放下防备,我很快就发现他们浅浅一层信念之下便是厚厚的疑虑。我对此感到希望。
自从我的新书《自由学习》(译注:中文正式译名为《玩耍精神》,本文采用此书名的直译版本,下载地址)出版以来,很多人问我为什么要写这本书,要达到什么目的。我对在这里讨论我自己的书有些疑虑。我自我讨论了很久,扪心自问我甚至应不应该在这里提到这本书,但我太希望传达这条信息了,因此这些疑虑便不足挂齿。当然,关于学校教育,我远远算不上是第一个高喊出皇帝在裸奔的孩子。的确,不少本博客的常客比我更早高喊出这种声音,而我在先前的帖子里也提及了一些先驱思考者,比如 A.S. Neill,John Holt,John Taylor Gattor, Sandra Dodd,Daniel Greenberg 等。我们需要这些声音,我们需要大家听到这些声音。所以……
在个体层面上,我希望《自由学习》这本书,对于那些认识到强制学校在伤害他们的孩子、在扰乱他们家庭生活的家长,能给他们做出改变的勇气。我也希望,那些已经选择非常规教育路径的家庭,能把这本书当成工具,以有力说服他们那些怀抱疑心的亲戚朋友,告诉他们自己并非疯癫。但我最宏大的愿望,是这本书能触及那些对这个问题未加思索的大多数。我希望这本书能让更多人深入考虑童年、教育(education)、学校教育(schooling)(以及这两者的区别),同时希望这本书能在社会层面上促进我们对待孩子方式的改变。
这本书的中心观点是,儿童生来具备自我教育的精巧机制和强烈动机。他们不需要被强迫去学习;实际上,强迫会破坏他们对学习的天然渴望。他们需要的是机会。我对社会层面的观点是,我们要停止考虑教育儿童,要开始考虑如何营造一种情况,最大化儿童自我教育的能力。自我教育刻印在儿童本能的生理机制之中,但为了好好实现自我教育,他们需要与标准学校那种强迫而贫瘠的情况截然不同的形势。
这本书的基础并不是抽象的理论、哲学的假设、或浪漫的理想主义。这本书的基础是大量的实验证据。有一些证据来自人类学家,他们在观察前农业社会的儿童如何自我教育。有一些证据来自对我们文化的研究,这些研究说明,如果一些儿童被允许自我教育,并获得了相应的资源,他们便能充分学习各种必备知识,以成长为快乐、有生产力、有道德感的公民。有一些证据来自心理学家的实验室,他们发现,儿童对于探索与理解身边的物理与社会世界,怀抱着强烈而高效的内驱力。有一些证据来自于一些研究,表明对于习得新的想法、技能以及创意思考而言,玩耍式的思想模式是最佳的,而玩耍更是天然的工具,能让儿童掌握他们所处文化中的技能和价值观,并学习如何与他人相处、解决自己的问题、管理自己的情绪和冲动,并掌控自己的生活。这本书同时记录了我们强制学校教育的历史;也说明了这套系统兴起的目的,是赤裸裸的灌输与服从性训练,而不是我们现在所认为的教育。更进一步,这本书记录了我们剥夺儿童健康成长所需的自由和玩耍后,在他们身上造成的心理伤害。
聚合各种来源的证据,《自由学习》试图论证,我们可以并应当改变对待儿童的方式,应改变为一种相信他们、考虑他们真实需求和能力的方式。这本书也描述了最适合儿童自我教育的环境条件。这些条件包括玩耍和探索的自由、能获得文化中的常用工具、能接触成人专家、儿童青年之间自由混龄,以及在稳定、有道德感、关怀备至的本地社区中生活。相比我们如同监狱一般的学校,只要用心,我们能以更为低廉的成本营造这些条件。
活到现在,我已见识到人权取得不少进步。对于承认任何种族、性别、性取向的人都有同等能力与权利,我们取得了长足进展。现在我希望,在我有生之年,能看到儿童的能力与权利得到承认。因为只有儿童能自由地成长为人,我们才能期望这样的社会,其中的成人理解如何处理自由及相应的责任。这就是我写下这本书的理由,同时我将尽我所能去宣扬它们,以期推广这些理念的真谛。
------
我同样邀请你们在评论区分享你们的问题、想法和异议。本博客是讨论的论坛,而我和其他读者会看重并尊敬你的评论与问题。请在评论区发表评论,不用发送私人邮件给我。在这里评论,你能和更多人分享,而不仅仅跟我分享。我会阅读所有评论,并努力回答所有认真的问题,如果我能说些有用的话。当然,如果你有独属你我之间的话,请发邮件给我。
任何值得学的东西都无法被教会
原文:Nothing Worth Learning Can Be Taught | Psychology Today
教学可以引导我们自己去学习有价值的知识,但不会产生有价值的学习。
发表于 2023 年 6 月 11 日| 审稿人:Hara Estroff Marano
来源:Artist unknown/PublicDomainPictures
最近,我感觉自己越来越不喜欢把「教学」和「学习」等同起来,这种说法不仅来自学校当局,还来自记者和大众:他们认为学习完全是学校的功劳,是教学的产物。
到现在还有这种说法:「由于新冠疫情,学生过去整整一年的学习都白费了。」我曾被邀请参加一次 PBS 电台辩论,讨论「孩子在暑假应该玩耍还是学习?」 我的辩论对手是某组织的领导,该组织正在四处游说,试图将学年延长到整个夏天,因为「暑假导致学生丧失了太多学习机会。」不知为何,节目主持人和我的辩论对手都没有意识到,很多真实的学习发生在玩耍中,而很多虚假的学习发生在学校里。
几十年前,我在波士顿学院任教时,我逐渐开始意识到,学生在我课堂上学到的东西与我认为自己在教授的内容关系不大。我第一次开始思考教学与学习之间的脱节。这种担忧,以及其他一些原因,促使我邀请了 Peter Kugel,他是我波士顿学院计算机科学系的同事,来心理学系做一个关于「从计算机科学家的角度看教学与学习」的讲座。我知道他在计算机科学研究中从基本层面思考过学习的概念。他的讲座题为《任何值得学的东西都无法被教会(Nothing Worth Learning Can Be Taught)》,随后他发表了一篇同名文章(Kugel, 1979)。
这个标题致敬了奥斯卡·王尔德(1908 年)那句名言:「教育是一件令人钦佩的事情,但我们要时不时地记住,没有什么值得知道的东西是可以被教会的。」 这一观点曾被许多深入思考教学与学习的人以不同方式表达过,包括柏拉图、Kierkegaard、Carl Rogers 和 John Holt,他们都出现在了 Kugel 的文章中。
什么值得学?
有的言论被一些人视为深刻、被另一些人视为愚蠢,Kugel 和王尔德的主张在多大程度上是真实的,取决于定义。
首先,什么叫「值得学习的」?我认为,对于 Kugel 和其他提出类似观点的人来说,值得学习的东西是指那些能够在现实生活中对学习者的行为产生积极影响的内容。在学校中,有一种人为的标准:某些东西被认为是「值得学习的」,只要它能帮助学生通过考试并取得好成绩(从而最终完成学业)。但那只是学校系统的特产。你可以通过简单重复老师讲的内容来通过考试,而不需要真正学到任何会影响你其他行为的东西。我将「值得学习的」一词限定为:即使没有学校考试和成绩也值得学习的内容。同样的道理,有助于在智力竞赛中表现出色的应试技巧,在我这里不算「值得学习的」。
Peter Kugel
来源:波士顿学院公共关系部
然后是「教」或「被教」的概念。Kugel (于 2022 年 10 月去世)被誉为一位伟大的教师,学生们争相选修他的课程。我不认为他觉得自己的教学毫无价值。我想他会说,虽然教学本身不直接促使学习发生,但它可以在学习过程中发挥作用,就像学习者在世界上经历的任何其他体验一样。真正的学习(学习那些值得学习的东西)不是被动地吸收信息,然后简单地复述出来。学习始终是一个需要学习者思考和主动性的积极过程。这种学习总是创造性的探索。学习者经历的事件——包括有时教师展示的文字或图像——是可以提供帮助的刺激,即探索中的线索,但这些线索并不是探索的原因。真正的发现是由学习者自己完成的。
出于文化背景,你我与大多数人可能都认为:阅读和算数总是值得学习的。因此,让我们在阅读和数学的背景下探讨 Kugel 的前提。
学阅读
如今,大多数人似乎认为,人们之所以会阅读,是因为老师教了怎么阅读。你可能见过这样的车贴:「如果你能读懂这个,感谢老师。」历史地看,这种流行看法还是比较新颖。在 18 世纪和 19 世纪初,强制学校教育出现之前,西欧和美国有很大比例的人能够阅读。人们普遍认为,如果你在一个识字的家庭中长大,阅读是你生活环境的一部分,那么无论是否经过刻意的教学,你都能学会阅读(Bowles & Gintis, 2000; Thomas, 2017)。
近期,大量研究表明,孩子能够自主教育,自己学会阅读。甚至有证据表明,刻意的教学往往会减慢或打断学习阅读的过程(见这篇和这篇,以及 Gray, 2016 和 Pattison, 2017)。
有理由相信,阅读障碍之所以产生,通常是因为孩子还没有对阅读产生兴趣、还没有准备好投入脑力,如此揠苗助长当然会适得其反。施加太大的压力会让他们感到焦虑,甚至形成对阅读的心理障碍(见这篇和这篇)。当孩子对阅读产生兴趣,并准备好进行必要的探索时,他们就会学会阅读。他们会自己寻找线索,无论这些线索在哪里,都能帮助他们探索阅读,最终成为流利读者。老师的言语或示范中就有很多线索。
学数学
多年前,我经常给社会科学专业的学生教授统计学。我意识到,几乎没有学生真正理解他们高中学的数学。这些学生就读于一所精英大学(波士顿学院),大多数人在高中数学课程中都得了 A。有少数学生记得如何推理,但他们不知道这些推理为什么有效,或者为什么以及何时需要使用它们。在我让他们匿名填写的问卷中,大多数人声称自己患有「数学恐惧症」,我怀疑这是因为他们的学习压力较大,没学会也要假装自己会了。
在我早期的一篇博客文章中(见这篇),我描述了一个在 20 世纪初在新罕布什尔州曼彻斯特进行的著名实验。在这个实验中,一些学校的学生直到六年级才开始学习数学——没有加法、减法、乘法、除法。结果发现,到六年级初,那些没有学过数学的学生在数学应用题上表现得比那些一直上常规数学课的学生更好,这些应用题涉及对数字的推理使用。
这项研究的主要负责人,恰好也是曼彻斯特学校的督学,他得出结论:数学教学导致学生对数字有 PTSD(创伤后应激障碍),使他们在涉及数字的问题上失去了常识。当研究结果不符合偏见时,教育系统会忽视这些优秀的研究,这是共识。这项实验从未被重复过,我也没有看到任何证据表明它在教育学院中被讨论过。
在另一篇文章中(见这里),我描述了一项非正式研究的结果,这项研究探讨了未接受正规教育的孩子如何学习数学概念。这些方法包括日常与数字和计算自然接触,或者培养他们对数学思维模式的兴趣。通过这种办法,他们不会产生数学恐惧症,因为不存在任何强制教学。并且,当他们需要或想要了解数学知识时,他们完全能够自己学会这些知识。
在另一篇文章中(见这里),我提供了证据,它们表明:在暑假期间,学生会忘记上一学年学到的死记硬背数学,但平均而言,他们在数学逻辑方面的进步比上学期间更多。
再一次,我认为所有这些,都证明了真正的数学学习不是教学的结果,而是兴趣和投入的结果。一位有兴趣和投入的人可能会利用老师作为资源,就像他或她可能利用一本书或其他任何东西一样,但主动性和积极努力来自于学习者,而不是老师。
真正的教育科学应该更多地致力于理解孩子们自然的学习方式,以及如何提供支持这种学习的环境,而不是研究和发展教学方法。教育由学习者主导,而非教师。
----
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
Bowles, S. & Gintis, E. (2000). The origins of mass public education. Ch. 33 in Roy Lowe (ed.), History of education: major themes. Volume II: Education in its social context. London: RoutledgeFlamer.
Gray, P. (2016). Children’s natural ways of educating themselves still work: even for the three Rs. In D.C. Geary & D.B. Berch (eds), Evolutionary perspectives in child development and education pp 67-93*.* Springer.
Kugel, P. (1979). Nothing worth learning can be taught. Improving College and University Teaching, 27, 5-9.
Pattison, H. (2017). Rethinking learning to read. Shrewsbury, UK: Education Heretics Press.
Thomas, A. (2017). Forward to H. Pattison, Rethinking learning to read.
Wilde, O. (1908). The critic as artist. Intentions, 3rd edition. Methuen & Co.
我们的社会义务:提供教育机会,而非强迫上学
原文:Our Social Obligation: Educational Opportunity, Not Coercion | Psychology Today
我们如何非强制地促进普及教育
发表于 2009 年 9 月 16 日|审稿人:Ekua Hagan
儿童可以自我教育。儿童就是为自我教育而生的。他们探索、观察、偷听长辈谈话、提出无数问题、摆弄文化艺术品、思想和技能的本能,都是为了教育的目的。我博客的忠实读者都知道这是我所有文章的主题。
**我们通常所说的学校,会妨碍孩子们自我教育的能力。**当我们将儿童和青少年关在学校中,他们被按照年龄分配到不同年级,无法选择他们的同学。他们无法追求自己的兴趣,必须遵循老师的命令和上课铃声。我们妨碍了孩子们自我教育的能力。孩子们与生俱来的自我教育需要自由。老读者们知道这是我的第二篇论文。
在前两篇文章中,我概述了一个反对强制(强迫)学校教育的案例。这次,在本文中,我将谈谈学生们对学校的「喜欢」,以及他们对学校的「喜欢」程度,并概述一下我的想法:社会应该如何满足他们的欲望,为他们提供机会,让他们在没有强迫的情况下自我教育。
学生喜欢学校哪里?
我们的公立/私立学校中的大多数学生对他们学校的态度并非完全是负面的。我还没进行正式的调查,但我的非正式观察表明,学生们经常或有时说他们喜欢学校,具体的方面如下:
-
交朋友和见朋友的机会。在过去数十年间,随着成年人越来越多地掌控孩子的生活(例如此文,孩子遇见其他孩子和交朋友越来越难了。学校是少数几个有很多孩子聚集的地方,在空闲时间——上学前、午餐时和课间(在那些仍然存在课间休息的学校),他们有机会一起聊天和玩耍。儿童按年龄分配到班级和学校,这使孩子们无法结交不同年龄层的朋友,但至少他们可以在学校结识其他同龄儿童并成为朋友。
-
远离父母的机会。有些孩子ーー他们有专横、“直升机”式、或(极端地)恶毒残暴的父母ーー很享受在上学日逃离父母的机会。即使是拥有最完美父母的孩子,也需要离开父母一段时间来学习如何在没有父母的情况下生活,并自己解决问题。在狩猎-采集文化中,儿童可以整天自由地做他们想做的事情,4 岁以上的儿童即使不是大部分时间,也有很多时间与其他儿童在一起,在成年人的视线之外。他们就是这样学会独立和自治的。但是学校的儿童没有这种独立性,因为他们受老师的管理,但至少他们远离父母,正在学习如何在家庭之外的环境里独立应对问题。
-
摆脱贫困或其他限制条件的机会。在我最近的帖子中,一位评论者恰如其分地指出,对一些孩子来说,学校是“一个逃生出口”。我的当地报纸最近刊登了一篇关于波士顿贫困地区一名年轻女孩的文章,她的父亲抛弃了她,她的母亲死于艾滋病,她许多年轻朋友死于谋杀或其他与贫困有关的原因,但她自己却在学校系统中“成功”。她是一名明星高中生,因为她自己的巨大主动性,她注定要上大学。这样的故事提醒我们,我们需要为那些出生贫困的人提供上升通道。我们需要比现在的学校更好的上升通道。众所周知,我们的学校不能满足大多数底层人民上升的需要。只有很少数穷人能真正通过教育上升阶层,而且他们也无法选择在家上学。
-
接触新想法和新思维方式,以及接受重要技能的指导。学生常常提到学校的无聊、考试的焦虑以及必须花大量时间在毫无意义的家庭作业而几乎没有时间留给生活,他们对此愤愤不平。但是有时候,从积极的方面来说,他们也会谈论一些他们在学校听到的,让他们兴奋的想法,他们在学校中学到新技能的乐趣,或关于他们在学校读到的一本书的快乐。有些老师在突破单调乏味、关心成绩、寻找激励学生的方法等方面比其他老师做得更好,学生们也更加珍惜这些老师。不幸的是,学生们几乎从来没有选择老师的机会,所以有没有好老师只能看运气。而且,即使是最好的老师,也只有一小部分课堂时间能让大多数学生兴奋地动用大脑,部分原因是所有老师都要讲授死板的课程,进行标准化考试。
如果我们愿意,我们应怎样为所有儿童提供机会,让他们在不受胁迫的情况下进行良好的自我教育
我认为,孩子们喜欢学校,也是因为学校可以帮他们更好地自我教育,这并不奇怪。孩子们渴望学习,但他们渴望以自己的方式学习。当他们自控时,他们会学得很好,而当别人试图控制他们的时候,他们经常会变得愤愤不平,就像你我一样。但是为了让孩子们学习,我们需要提供机会。我们不仅要为富人和中产阶级家庭提供这些机会,也要为穷人提供这些机会。
简而言之,在我对未来的设想中,我们将拥有一个向所有人开放的社区教育中心,而不是我们今天所知的学校,孩子们——如果他们愿意的话,成年人也可以——可以来这里玩耍、探索和学习。如果可能的话,那里会有田野和树林,孩子们可以远离大人,自己去探索。那里有很多可用的学习工具,包括电脑。镇上的图书馆将成为每个中心的一部分。拥有各种技能的当地人会在那里花一些时间为那些想参加课程的人提供课程——音乐、艺术、体育、数学、外语、烹饪、商业管理,财务工作,以及任何人们觉得有趣 、好玩或重要到需要学习或练习的课程。
只要花费比我们目前的强制教育系统少得多的钱,我们就可以建立美丽的社区教育中心,提供令人兴奋的自我教育机会。孩子们会涌向这样的中心,因为他们的朋友在那里,那里有许多令人兴奋的东西可以玩和探索。在这个中心里,我们文化中所有最重要的东西都会被呈现出来,孩子和成年人也可以随心所欲地尝试。每个中心的建设和提供的细节可由每个社区内部的地方和民主决定。购买设备将是对需求的回应,而不是某人「预先」期望的结果。工作人员将通过民主程序以有限期限聘用,以确保工作人员能够满足参与者的需要。不会有终身职位。
有了这样的社区教育中心,我们可以相信孩子们自我教育的本能会发挥作用。他们将学习成为成年人所需要的知识,并发展出深刻的兴趣,这将引领他们从事适合自己的职业,而不是苦役。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
玩耍,而非需求,是发明之母
原文:Play, Not Necessity, Is the Mother of Invention | Psychology Today
一个关于人类发明轮子,猴子创造锤子的故事
发表于 2024 年 3 月 13 日 | 审稿人:Davia Sills
核心观点
-
玩耍是早期发展的关键环节,能有效激发学习能力和创造力。
-
其他动物同样能在玩耍中开发工具和创造新事物。
-
猕猴的例子生动说明了这一点:它们在玩耍石头的过程中,逐渐学会了用石头砸破贝壳获取食物。
Ox Cart (1935–1942) by Wilbur M Rice.
Source: The National Gallery of Art/Rawpixel/Public Domain
有句广为流传的英语谚语说:「需求是发明之母。」但这种说法是否准确呢?在此,我想提出一个我认为更贴近真相的修订版:「玩耍是发明之母;需求是工程之母。」
玩耍能够打开心灵之窗,激发原创思想和创新灵感;而需求则是将这些创意付诸实践,使之满足实际用途。玩耍带领我们遨游于广阔的想象天地;需求则让我们聚焦于当下和熟悉的事物,以解决眼前的具体问题。
谁发明了轮子与车轴?
让我们来看一个例子。轮子——或者更准确地说,让制造推车(cart)成为可能的轮轴组合——通常被认为是人类历史上最伟大的技术发明。它彻底改变了人们的生活方式。有了车,尤其是当你把一头牛套在车上时,就能比以前更高效地在陆地上运输沉重的木材、农产品或任何货物。需要运输物品的人们不必居住在河边。一旦车被发明出来,它就像我们现在所说的「病毒式传播」一样迅速普及。很快(好吧,在几个世纪内),车就遍布各处了。
然而,考古记录中发现最早能用的轮子和车轴并非用于车辆,而是出现在一个小陶瓷郊狼玩具下。这个玩具是在约 6000 年前一个被埋葬儿童的遗骸旁发现的(Cassidy,2020)。它很可能是由某个富有创意的陶工制作的,他们认为制作一个可以用绳子轻松拉动而不会倒下的动物玩具,既有趣又能为孩子提供娱乐。在北欧各地也发现了类似的物品,只是时间稍晚一些。
直到几个世纪之后,欧洲的能工巧匠们才从轮子和车轴的概念中获得灵感,制造出了能够实际使用的车辆。在当时,这种车辆的诞生堪称工程学上的一大壮举。它不仅要求轮子和车轴必须完美圆润以最大程度地减少摩擦,整体结构还必须足够坚固以承载重物。然而,若非工匠们的生活中早已存在轮子和车轴的雏形——那些相对简单、粗糙、微型且易于制作的儿童玩具,这项工程是难以实现的。
我认为,回顾整个技术发展史,从最初的轮子到现代的台式电脑,探究这些创造背后的原始灵感是如何产生的,将会是一件非常有趣的事。尽管我尚未进行过这方面的研究,但我敢打赌,在许多情况下,这些灵感都源于玩耍。人们往往只是出于兴趣或为了制作某种玩具而随意尝试,却意外地产生了真正创新的想法。当这些想法后来被工程师或技术人员发现并经过适当改进后,常常会显现出实际应用价值。不过,现在让我们转向一个来自其他动物的例子。
猕猴是如何发现石头可以用来砸破贝壳的?
在其他动物中,技术发明是一种罕见现象。然而,在所有已记录的案例中,似乎都是该物种的幼崽通过玩耍活动首先获得创新的灵感。我最喜欢的一个例子来自于对日本猕猴的广泛而深入的观察研究。
20 世纪 70 年代,研究人员观察到一种前所未见的现象:某些猕猴群体中的幼年成员开始玩耍石头(Huffman, Nahallage, & Leca, 2008)。这些小猕猴会捡起石头,时而像抱婴儿般怀抱,时而随意抛掷,更引人注目的是,它们偶尔会用一块石头敲击另一块,似乎对由此产生的声响乐此不疲。根据观察者的判断,这纯粹是一种玩耍行为,除了获得乐趣外别无他意。
起初,这种玩耍方式仅限于幼年猕猴。成年猕猴既没有创造这种行为,也没有模仿年轻一代。然而,更年幼的猕猴会模仿它们玩石头的方式,而且那些玩石头的猕猴长大成年后仍保持着这一习惯。因此,在后续的观察中,研究人员发现不仅幼年猕猴,连成年猕猴也参与其中,新生代的小猕猴则从长辈那里习得这一行为。就这样,玩石头逐渐演变成某些猕猴群体的文化传统,成为整个群落的特征,并且代代相传。
几年后,研究人员发现了一群生活在沿海地区的猕猴,它们不仅会玩石头,还懂得利用石头开启贝类(Tan,2017)。从单纯用石头敲击另一块石头发出声响,到用石头敲击贝类获取食物,这一看似微小的进步实则意义非凡——它将石头从单纯的玩具转变为实用工具。尽管我们无法确定这一转变是如何发生的,也不清楚是幼年还是成年猕猴首先做出这一尝试,但可以肯定的是,幼年猕猴在玩耍中开创的行为模式为这些沿岸生活的猕猴提供了一种获取食物的创新方法。一旦石头被用来砸开贝壳,这些「猕猴工程师」(姑且如此称呼)就开始不断改进敲击技术,以更高效地打开贝壳。
因此,这个例子不仅展示了玩耍如何为工具使用奠定基础,更重要的是,它清晰地表明这种玩耍形式最初是由幼年个体发起和延续的。只有当这些幼年发明家成长为成年猕猴后,这种行为才逐渐演变成猕猴群体的文化传统。
进一步思考
猕猴的例子阐明了一个具有普遍性的观点,这一观点对人类而言比对猕猴或任何其他动物群体都更为贴切。这个观点是:生命的幼年阶段是一个充满发现和创新的时期。
对于刚来到这个世界的孩子而言,一切都是崭新的。他们对世界的每一次了解都是一次探索,每一项掌握的技能都是一次创新。孩子们天生就为探索和创造做好了准备,而好奇心和爱玩耍正是激发这种潜能的关键。
随着年龄的增长和阅历的丰富,人们往往会形成固有的信念和行为模式,与此同时,他们探索和玩耍的动力也会逐渐减弱。然而,有些人(如我在上一篇文章中提到的科学家们)能够终生保持高度的好奇心和爱玩耍的特质。这些人可能会在一生中不断产生新的见解,为文化的发展做出持续的贡献。
然而,从更广泛的角度来看,创新能力的巅峰期通常出现在青春期和年轻成年期。处于这个阶段的人已经对世界有了相当的了解,但他们也清楚地意识到还有大量未知的领域等待他们去探索。他们的好奇心和爱玩耍的特质仍然保持在高水平(除非被强制性的学校教育扼杀了)。这些特质,结合他们不断增长的知识和技能,为他们在文化层面上的新发现和创新奠定了坚实的基础。
本文同时发布在我的 Substack 平台上,欢迎您前往阅读并留下您的宝贵评论。
参考文献
Cassidy, C. (2020). Who invented the wheel? Chapter in Cassidy’s book, Who Ate the First Oyster?
Huffman, M. A., Nahallage, C. A. D., & Leca, J-B. (2008). Cultured monkeys: Social learning cast in stones. Current Directions in Psychological Science, 17, 410-414.
Tan, A. W. Y. (2017). From play to proficiency: The ontogeny of stone-tool use in coastal-foraging long-tailed macaques (Macaca fascicularis) from a comparative perception-action perspective. Journal of Comparative Psychology, 131(2), 89–114.
为什么要选择容易考而且学费低的大学
原文:Reasons to Consider a Less Selective, Less Expensive College | Psychology Today
为什么菲奇堡州立大学可能比哈佛大学更好。
发表于 2008 年 10 月 22 日
一些家庭多年来一直尽职尽责地将钱存入大学学费基金。而在过去的几周里,这些家庭发现,一只臭鼬窜进了他们的储蓄。以股票为主的教育基金暴跌,家长的退休基金和房产价值也大幅下降。这种情况让许多高中生在申请大学时拓宽了思路,同时也让他们在收到录取通知书时,更加慎重地考虑哪封录取通知书更合适。与精英私立学校相比,当地的州立大学或者州立学院的费用要低很多,这使得这些学校比以前更具吸引力。
许多年以前,当我的妻子快要从高中毕业时,她的学业成绩足以让她进入大多数门槛较高的大学。然而,她选择了菲奇堡州立大学,这所学校在《新闻周刊》的顶尖院校排名中从未出现过,也不会出现在任何关于美国最高门槛学校的指南中。她仔细研究后,得出结论:对于她想学习的专业,菲奇堡的课程和其他任何学校一样好;她尤其喜欢的是,她和她的父母都不需要为她的学费负债累累。她还很高兴她的同学来自不同的背景。如今,她作为业内备受尊敬的顶尖水平医生,从未后悔过那个决定。她骄傲地展示着她的菲奇堡毕业证书,没有任何迹象表明,相比选择哈佛而考取哈佛证书,这张证书会逊人一筹。我个人真的很羡慕,她能在那些来自名牌学校的同事面前(微妙地)露出一种与众不同的优越感。
几十年来,我们国家的教育部门,一直在宣传着过度简化的错误大学选择观。这种观念认为:申请你有机会进入的门槛最高的学校,然后在录取你的学校中选择门槛最高的去就读。外界的观念认为,如果你不去愿意录取你的门槛最高、费用最贵的大学,那么你就是「贬低自己」「没有发挥出你的全部潜力」。因为这种观念已经深入人心,所以多年来,私立大学在学费和其他费用上的增长已经远远超过了通货膨胀,简直是令人发指。在这里,我将阐述一个慎重思考的观点,避免陷入许多人已经陷入的陷阱。
对于同等能力的学生来说,相比在低门槛的大学接受教育,在高门槛的大学接受教育并不会带来更好的工作或更高的收入。
有些人被误导性的统计数据所迷惑。是的,确实哈佛(及其同类)毕业生的平均收入要高于菲奇堡州立大学(及其同类)毕业生。但请记住,那些去哈佛的人在一开始就和去菲奇堡的人有很大的不同。因为大多数人都有这样的心态,认为他们应该进入能够被录取的门槛最高的学校,哈佛和其他类似的学校就能选拔到顶尖人才(按照通常定义的顶尖)。无论这些人上的是哪所学校,他们注定会在职业方面表现出色。他们中的大多数都非常聪明且有上进心(其余的人的父母非常富有或出名)。
精英大学的普通毕业生在成年后的收入比非精英大学的普通毕业生多,并不能说明你(或你的儿子或女儿)通过上精英大学就一定能赚更多的钱。唯一能够帮助回答这个问题的研究,需要对比那些在最初学术能力和收入潜力上相等,但选择了声望水平不同的大学的学生。幸运的是,已经有这样的研究了;但这些研究依然鲜为人知。
2002 年,Stacy Berg Dale 和 Alan Krueger 发表了一项关于学生就读大学与其后收入之间关系的大规模研究,这些学生在其他方面具有可比的潜力。[1] 他们利用了 1972 年美国高中生全国纵向调查数据。他们有一部分研究关注那些至少申请并被至少一所精英大学和至少一所非精英大学录取的学生。之后,在这个群体中,他们比较了选择精英学校的人的成年收入,和选择非精英学校的人的成年收入,结果显示并没有显著差异。此外另一部分研究中,他们基于高中时期的学生信息,(比如 SAT 成绩)使用统计学手段保证学生收入潜力相同,并再次发现,具有相同初始潜力的学生,在收入方面基本上表现相当,无论他们所就读的大学声望如何。
值得注意的是,在大学声望对成年收入影响的普遍结论中,有一个有趣的例外。这个例外是那些来自非常低收入家庭的学生。对于这个群体,仅限这个群体,就读精英大学确实显著提高了他们的平均收入。也许,对于这个群体来说,上一所精英学校从多方面帮助他们进入更高的社会阶层,使他们在成年后获得更好的工作,获得比原先更高的收入。然而,对于典型的中产阶级大学生来说,就没有这种效果了。所以,如果你恰好来自低收入家庭,且在高中期间成绩和 SAT 成绩优异,那么考虑其他许多条件之后,你可能需要听从常见建议,尽量进入你能够被录取的最有声望的学校。同样值得注意的是,声望最高的大学,为来自低收入家庭的学生提供最优质的经济援助。如果你被哈佛录取了,而你的家庭没有钱支付学费,哈佛将承担你的所有费用。对你来说,哈佛可能不仅比菲奇堡州立大学提供更大的助力,而且可能还更便宜。
没有证据表明大学教育的质量与其学费有相关性。
大学教育的质量难以评估,甚至不可能以任何通用的方式来评估。对于一个人来说非常有效的教育,可能对另一个人来说非常糟糕。此外,就像我其他博客想表达的主题那样,你在大学里接受的教育,无论你选择哪所大学,都取决于你投入了多少。真正的教育不是施加于你的,而是你自己完成的。因此,在评估学校时,重要的是你在那里能做什么。
此外,在许多精英学校,最著名的教授(那些薪水最高的人)通常对身为本科生的你来说是最难接触的。他们会忙于自己的研究,以及指导研究生。现在的例行做法是,获得大量研究经费的教授,会用其中部分资金来「买断」部分或全部课程。结果是,这些课程是由研究生和校外兼职人员教授的,他们被大学以低廉的价格雇用。
很多课名义上是知名教授开设,实则是研究生和兼职教师负责。如果你去一所非精英大学,尤其是没有研究生院的大学,那里的教授可能不出名,但他们可比那些人水平高多了。他们也更有可能专注于教学,并且有更多时间和动力来了解你这个人。他们可能会欢迎你作为本科生参与他们的研究或其他学术或社区工作,这可以为你提供课堂上无法获得的宝贵经验。
多年前,我进入一所常春藤联盟大学就读,部分原因是因为该校物理系教授富有声誉。当时,我计划主修物理。我选修了第一门物理课,是这个系最著名的教授开办的,然而这是我一生中上过的最糟糕的课程。他经常迟到,而且讲课时语无伦次;他似乎是当场现编一些东西来叫我们,而且常常心不在焉。我们谁都听不懂他在说什么,大多数人最后干脆不再上课。这次经历让我改变了研究方向,转向生物学和心理学——这个改变或许是好事,也或许不是。
当然,在名校里也有许多非常优秀、认真对待教学的教授。我自己也认识其中的一些人。我只是想说,你不能假设随便一所著名学府里的知名教授都是好老师,或者他们都在教学。无论你申请哪所学校,你都应该了解实际上是谁在教你可能选修的课程,并尽可能了解学生对这些老师的评价。如果可能的话,去参观他们的课堂。
当“小池塘里的大鱼”通常比“大池塘里的小鱼”要好。(宁做鸡头不做凤尾)
有个有充分文献证据的心理现象,是与你选择大学息息相关的,这一现象被社会心理学家称为「大鱼小池效应」[2] 。这一现象与自尊有关。许多研究表明,学术能力相同,处于非精英学术环境的学生,对自己的学术能力感觉更好,而处于精英环境的学生则不然。换句话说,能力一般的学生,在充满学霸的环境中,可能会感到无能,甚至抑郁。相反,在他或她的表现脱颖而出,名列前茅的环境中,这个学生可能会觉得自己像个学霸——甚至他的成绩也会变得像个学霸。不幸的是,我们的教育世界会让学生处处好强,所以这种比较及其对自尊的影响是不可避免的。被常春藤盟校录取可能会让你立刻感受到自尊心的飙升,因为你的同学会羡慕地看着你,你的祖父母会洋洋得意;但上了那所大学,且其负担超出了你的预期,你可能会陷入一段非常漫长的抑郁。
除了自尊,做鸡头而非凤尾还有另一个优势。在次一档的学校里,优秀的学生通常更容易被教授注意到,因此,他们更有可能获得额外的教育机会,并拿到不错的推荐信,有利于未来职业和研究。而如果这些学生身处更优秀的学校则不一样了。在许多情况下,这些额外的机会和热情洋溢的推荐信,可能会弥补因未能进入哈佛等名校而带来的声望损失。此外,如果不那么知名学校的课程更容易一些,这不仅对你的自尊心有好处,而且对你的教育也有好处。这会给你留出更多的时间,跳出课业的框框,主导自己的学习,从长远来看,相比课堂的作业和测试,这样学到的东西更多。
----------
我并不是说,在录取你的大学中选取最知名大学,绝对是错的。我只是说,有很多充分的理由认真考虑其他选择。还有一点值得考虑的是:对你来说,对于你真正想要做的事情,四年制大学是否真的很有用?如今,许多年轻人——包括很多能轻松进入全国最知名大学的人——并没有上大学,也活得很不错,他们享受自己的工作,生活也不错。可以说:「如果有更好的事情要做,把头脑浪费在大学里可惜了。」不过,这是另一篇文章的话题了。
----------
参见新书《自由学习》
----------
参考文献
-
S. B. Dale & A. B. Krueger, "Estimating the payoff of attending a more selective college," Quarterly Journal of Economics, 117 (2002), 1491-1527.
-
H. W. Marsh & K-T. Hau, "The big-fish-little-pond effect on academic self-concept," American Psychologist, 58 (2003), 364-376.
卢梭之谬误:荼毒至今的教育理论
原文:Rousseau’s Errors: They Persist Today in Educational Theory | Psychology Today
可怜的爱弥儿啊!
发表于 2009 年 2 月 12 日 | 审稿人:Ekua Hagan
让-雅克 · 卢梭以其「自然主义」教育理论闻名。教育相关文献常称,是他最早提出了以儿童为中心的自然教育。如果你们经常读我博客就会知道,我也写了很多儿童自然教育的内容,你们可能会觉得我受到了卢梭的不少启发。我的确很受启发——并准备指出其谬误所在。
卢梭教育理论方面的著作只有《爱弥儿》。该书首次出版于 1760 年,书中虚构一位与书同名的男孩,讲述了他所接受的教育。《爱弥儿》用哲学小说的风格写就,讨论了人类的自然善好,以及如何通过不会腐化本性的教育,保存这一善好。
可怜的爱弥儿啊!按当今术语来说,卢梭笔下的爱弥儿,接受了最为极端的儿童中心教育(或称渐进教育)。爱弥儿人生的前二十五年都与一位导师相伴,书中尊为「大师」,言行举止用第一人称呈现。大师聪慧至极,能力精湛。他极其专注地研究爱弥儿的一举一动,从不间断,并由此掌握爱弥儿所有的动机与异想,以此给孩子设定一次次体验,把他认为最应该学的知识,全部传授给这个男孩。师生比是一比一。
大师总是控制着孩子,但他并不通过发号施令来控制,而是通过两个世纪后的斯金纳*主义心理学家会称之为「行为工程」的方式,他调整爱弥儿周边的环境,使得孩子决定去做的事情,始终都是大师认为对他好的。为了实现这点,大师让爱弥儿在 15 岁之前都与社会隔绝,甚至不接触其他孩子。大师是他唯一的伙伴。卢梭规定,爱弥儿在这十五年中只能阅读一本书,那就是《鲁滨逊漂游记》。根据卢梭的观点,单单这本书讲的故事,就足够健康地滋养孩子思想,启发健康的幻想,提供健康的娱乐了。(*译注:斯金纳,行为主义心理学家,操作性条件反射之父。操作性条件反射通过强化和惩罚来操控个体的行为。)
爱弥儿独自一人玩耍探索,并自以为他的行动非常自由。但实际上,大师早就定好了他所能玩耍探索的材料,与材料互动的方式,以及学到的知识。卢梭完全不相信孩子的自然本能。在他的愿景里,孩子的一切决定与知识,都由智慧的大师精巧地操控好,这位大师也十分情愿地将他的全部人生与才智,倾注于单单这个孩子的教育上!
我们很容易以为,卢梭写这本书,是在描绘一场闹剧。如果有说法称,这本书是卢梭的诙谐之举,他在刻意夸大那些教育理论家的学说来取笑他们,我很愿意相信这个说法。但显然他是认真的。他将《爱弥儿》称作他最重要也是严肃的哲学著作。他当然知道书中提出的教育计划不切实际,但他认为,若能实现这一计划,便再理想不过了。如过江之鲫的现代教育学教授提及这本书,也未尝将其当做笑谈。无论他们赞同书中观点与否,他们都认真地认为,《爱弥儿》是现代儿童中心进步教育理论的基础。
如果你常读本博客就知道,我自己的教育观点,部分源于我对瑟谷学校的观察,部分源于我对狩猎采集部落中儿童教育过程的研究。专栏右侧*便是我讨论这些话题的文章。虽然我跟卢梭都认同,玩耍和探索对儿童学习来说至关重要;除此之外的方方面面,我大多不认同他。(译注:请访问原文查看。)
让我在此列出我心中卢梭教育理论存在的主要谬误。这些谬误很重要,不仅是对卢梭的批判,更是直击卢梭一脉的教育理论体系,这套体系现在仍然兴盛不衰。
- 儿童脆弱谬论:必须保护儿童,避免他学到错误知识
在整本书中,卢梭对爱弥儿学到错误知识的担忧,远胜于他对于传授正确知识的关切。开篇第一行便阐述了其中缘由:「出自造物主之手的东西,都是好的,而一到了人的手里,就全变坏了。」对卢梭来说,自然是好的,而社会是坏的,所以为了让爱弥儿成长为良善的人,他在童年就必须置身大自然之中,而与社会隔绝,直到他长大成人,性格足够强韧,能够抵御社会之恶,才能与社会接触。
有些人要控制孩子看什么电视,玩什么游戏,听到什么话,交到那些朋友。他们的想法也类似卢梭,只不过更加具体。儿童脆弱理论,甚至部分支持了我们强加给儿童的年龄隔离——年龄隔离就是在保护儿童不受我们眼中那些坏榜样的影响。
我的观点与瑟谷学校的理念与办学相契合,我认为人性既非本恶,也非本善,而比起大孩子或者成年人,小孩子也并非更加天真纯洁。我们本质上都是社会的造物,因此剥夺孩子与各种人交往的权利,就是破坏他们正常人格发展的基石。儿童观察到他人的行为后,并不会盲目模仿。他们会有所思考:不仅关注他人的行为,而且关注这些行为的后果。孩子探索现实世界越多,他们越能善于应对各种现实情况。为了确定什么现实模型可行,什么不可行,孩子需要能观察各式各样的模型,听取各方看法,自己找出矛盾之处。若要为现实世界的生活做准备,儿童必须在这个世界中成长壮大,旅经风霜严苦之处,遍访水草丰美之所。
如果社会腐坏不堪,为了儿童长期健康发展,成年人应当径直揭露腐败之处,而非隐藏遮掩。此外在民主社会中,我们赋予每人同等的投票权来不断改良社会。通过这些手段,我们创造了规则和流程,来减少个人利益和群体利益的冲突,从而防患于未然。瑟谷学校是民主的社区,小到四岁,大到青春期的孩子能直接体验民主的权利与义务。
- 发展阶段谬误:儿童在特定年龄只能学习特定种类的知识
卢梭将《爱弥儿》分为数卷,每卷对应他理论中儿童的不同发展阶段,而每一阶段都是生活方式的巨大转变。最重要的是,卢梭笃信儿童在 12 岁前都不能逻辑清晰地理性思考。将近两个世纪后的著名发展心理学家 Jean Piaget,与卢梭在这点上不谋而合。根据卢梭的说法,跟小孩子理论是没有用的,因为他们不具备理性思考的能力。小孩子能学习身体技能,也能直接体会其行动后果来学习。但他们无法通过符号化的语言来学习任何知识。这一预设会被所有孩子和所有曾是孩子的人反对,只有那些不打算认真听孩子讲话的人会拿来当理由。今天仍然有人这么找借口,甚至这些人了解自己童年的所思所想,心知肚明这样的假设是错的。当然,瑟谷学校应用四十年并收效显著的民主方法,其前提就是孩子能理性思考。
- 儿童独自置身自然谬论:儿童主要甚至是全部的学习方式,就是与环境中的自然物体交互。
儿童十二岁前不能理性思考这一理念的推论,就是他们不能通过语言学习任何重要的知识。他们的学习必须依靠直接感官体验,和操纵现实物体。卢梭和 Piaget 都同意这点。但仅凭日常经验就知道,他们是错的。如果孩子想要了解什么事情,他们最常用的办法就是问问可能了解这件事的人。观察孩子的反应就可以知道,他们基本能理解他人的回答。孩子会适当追问,并合理地反对别人的回答,有时候太过合理以至于让人上火。孩子后续的行为也说明他们能理解这些内容。孩子的确会通过非社交的手段学习,他们通过直接操纵环境中的物体来学习,这个途径很重要。但是他们通过语言学到的知识更多。对人类来说,能够交谈与理解的他人,实在是人类环境的必然要素。孩子不能从社交环境中学习的看法荒谬至极。
- 儿童可控制谬误:有可能充分了解孩子以控制其学习而不受察觉
卢梭最严重的错误,是认为人类行为是可预测、可控制的,而老师能够像大师引导爱弥儿一样引导学生。不过卢梭至少愿意承认,能实现如此壮举的老师基本上就是超人了——他拥有非凡的观察力和思考力,能够把他的一生奉献给单单一个孩子。一些近代的教育理念,似乎期待现实的老师能不顾自己的正常生活,为更多孩子同样做到这点。
教育学中的传统主义者和进步主义者,围绕控制儿童的方式一直争论不断。双方都同意,教育者的职责是保证学生完成课标,但是两方手段不同。传统主义者认为要直接了当:告诉学生要学习什么,直接而公开地展示权威,布置大量练习,让他们能学会;之后要测试这些知识。如果他们没学会,那么整套流程再来一遍。
进步主义者则认为行事要间接:你知道孩子应该学习什么,并认为你有责任让孩子学到这些知识,但是尽可能不要明显地用权力施压。你希望利用玩耍和探索等儿童的自然学习活动,不被察觉地调整活动导向,让孩子能够自己「发现」正确答案,并且避开错误答案。这就是卢梭的办法。在这场争论中,我很难说我偏向哪方:这两边我都不同意。
卢梭以及所有现代教育者的根本错误,是认为成功的教育依赖于教师能力。事实并非如此;教育的成功取决于儿童能力。儿童能自我教育。
瑟谷学校开创者的一大洞见,就是课标是不必要的。几百万年前的狩猎采集者也懂得这点。你没有必要为孩子的学习而负责,也不必挥动拳头绞尽脑汁撺掇孩子去学习。你只要提供环境,让孩子(a)能尽情探索、玩耍、交际;(b)免受霸凌等等威吓之苦,(c)与各年龄段的人自由交际,(d)能够接触到普遍认同的学习工具,(e)能够直接体会他们身处的文化,让他们明白如何行事。
不同于卢梭的漫天幻想,瑟谷学校已付诸实践。这所学校已良好运转近四十年,学生平均每人花费远小于当地公立学校,且麻烦更少,快乐更多。毕业生已有数百人,职业各异,但都有所成就。世界上的教育学教授啊,是时候认真研究这所学校了。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
在我们的时代,通往信任型养育之路
原文:Routes Toward Trustful Parenting in Our Time | Psychology Today
孩子们自由翱翔,而我们保驾护航。
发布于 2009 年 8 月 5 日
在上周的文章中,我提到了一些社会趋势,这些趋势在过去的几十年中共同作用,消弭了「信任型养育」,转而提倡「命令型养育」,锁住了孩子探索的自由。在文中我谈到:(a) 邻里间关系的削弱及儿童户外游戏的缺失;(b) 大多数人在成为父母之前与儿童互动的经验减少;(c) 媒体对户外活动危险性的夸大;(d) 未来的不确定性增加,使得父母错误地认为可以通过套牢枷锁来保护孩子的未来;(e) 学校干预儿童和家庭生活的权力不断增强,甚至包括了课后时间;(f) 更多的关注对孩子的知识教学,将育儿简单的视为教学或强迫式学校学习,使家庭生活变成了课程的一部分而非生活。还有读者提到了其他一些影响因素,包括家庭规模的缩小,这使得父母对单个孩子的关注过多,以及许多父母利用电视机填补孩子的空余时间,进一步缩短了其户外活动的时间。
儿童的自由被剥夺是一个严重的社会问题。我认为,这是儿童抑郁发病率和自杀率急剧上升的一个重要原因。人无分老幼,都渴望着自由,并痛苦于自由被剥夺。作为社会中的一员,我们已经切身体会到了自由之无价,但我们宁愿把头埋在沙子里,也不愿面对孩子们也渴望自由、需要自由以感受快乐和健康成长的证据。毫无疑问,若是孩子们有力量,他们必将为此抗议,以解决这个问题——正如非裔美国人、妇女和同性恋者在近现代所做的那样。但很遗憾,他们缺乏力量。
假设你是一位接受 「自由的孩子才能茁壮成长」这一观点的父母。尽管面临着种种生活压力,你仍需要抽出时间思考怎样才能成为一位更加信任孩子,给予孩子更多的自由的父母。这里有六条建议:前三条建议与调整自己的思想和习惯有关,剩下的则是关于如何为孩子营造一个健康成长的环境。
首先,问问你自己: 「怎样才是幸福的生活?」
迈向信任型养育的第一步是审视你自己的价值观,并思考这些价值观应该如何表现于你与孩子的日常相处中。你是否重视自由、个人责任、主动性、魄力、诚实、正直以及同情心等品质?如果这些品质在你的价值体系中占据重要位置,并且你也希望在孩子身上看到这些特质,那么你应该成为一个信任孩子的父母。这些价值观无法像学校课程那样被教授。它们只能在日常生活中习得。
你可以通过自己践行这些价值观,并将它们应用到你与孩子的互动中,来帮助孩子建立这些价值观。信任可以孕育出值得信赖的品质。而监视、控制和说教只会助长谎言。来自外部的强制命令阻止了孩子体验自由和习得个人责任感和主动性。孩子在学校、社会中所被迫参与的连续不断的竞争,促使他们采取防御性的生活态度,这使他们难以学会诚实、坚韧和同情。
将你那些应该掌控孩子未来的想法抛之脑后吧。
如果你珍视自由,重视责任感,那么你就必须尊重子女规划自己人生道路的权利。你的抱负不能成为他们的抱负,反之亦然。人生的自我规划始于婴儿时期,而不是 18 岁、21 岁或 35 岁。要学会承担责任,孩子们就必须学会如何决定自己的每一天、每一周乃至每一年应该如何度过;而他们只有通过实践才能学会这一点。
所有慈爱的父母都深切关心着孩子的未来,也正因此,情难自禁地试图去掌握孩子的未来。但是,越俎代庖往往适得其反。当我们试图决定孩子的命运时,我们就剥夺了他们自己掌握命运的机会。当我们试图引导他们度过生活中的迷雾时,我们就剥夺了他们探索的机会。若我们总是自顾自的、如连珠炮般给出一连串建议,他们在真正需要时就越来越不情愿征求我们的意见。
要成为一个信任孩子的父母,你可能需要经常提醒自己,你不是你的孩子,你的孩子也不是你。你只是那塑造孩子的环境基质的一部分。你孩子的命运是超越你,飞向一个你可能并不理解的世界。尝试去阻止这一过程只会给你们带来伤害。其成功与否最终取决于他自己,而不是你;成功或是失败也是基于他的价值观,而不是你。世界上有许多郁郁寡欢的律师、医生和经理;也有许多过得幸福、充实和体面的文员与清洁工。职业体面并不等同于人生成功。你可以在任何工作中感到快乐或是悲伤;而其中的关键因素便是你在多大程度上相信这就是你想要的生活。这些老生常谈的道理,却被太多人在实践中所忽视。
控制住持续联系孩子的冲动,不要时刻监视孩子的生活和学习,也不要过问他或她一天中的生活细节。
在现代科技发达的今天,追踪孩子的一举一动变得既容易又诱人。你可以通过隐藏摄像头观察孩子;可以追踪孩子访问过的网站;可以坚持要求他定期通过手机报告状况;甚至可以安装 GPS,像对待囚犯一样,随时查看孩子的确切位置。你可能会对自己说,这样的监控是为了向孩子展示你对他的关心。但将心比心,如果你被这样持续监控,你又将作何感想?如果有人——也许是你深爱的丈夫或妻子——在监视、记录并评估你所有的私人活动,你又会怎么想?这样的监控所传递的信息其实是:「我不信任你。」
而这种不信任感并不仅仅源于以上监控方式。传统的持续不断且刨根问底的问询同样糟糕。一个信任孩子的父母不会要求对孩子的一切刨根问底。每个人都有隐私,有保留秘密的权利,有在不被指指点点的情况下进行尝试的权利,那些试图侵犯隐私的质问只会带来谎言。
搬到一个所有年龄段的孩子都可以在户外自由玩耍的社区,在那里父母和孩子更好地了解彼此。
作为一名信任孩子的父母,你对孩子确实负有一些重要的责任。你不能亲手去驾驶孩子的船,甚至不能教授驾驶技巧,但你仍然可以为孩子提供学习驾船的池塘。而这个池塘就是你选择的生活环境。
房地产经纪人告诉我们,年轻家庭在寻找第一套房子时,最关心的往往是当地公立学校的质量,这通常以标准化考试成绩和升学率来衡量。但如果你是一位信任孩子的父母,这不应该是你的主要关注点,你应该更加的关注社区的质量。
如果孩子们想要自由地探索和玩耍,就必须要有一个自由而安全的环境。即使他们生活在别墅与庭院之中,若是没有成群的孩子共同玩耍,也无法得到成长。寻找到一个各年龄段的孩子都在一起玩耍、探索,且没有成年人监督的社区后。你的孩子便会想加入他们,并从中得到成长。如此累积下去。孩子越多,年龄范围越广,对其中任意一个孩子来说,户外玩耍就越安全、越有吸引力。你常常能在那些房子普通、住户不富裕、不看重学校成绩、孩子们能够自由在公共空间中玩耍的社区找到这样的环境。
除此之外,还需要寻找一个父母自己也会花时间在户外、结识其他父母与其孩子的社区。了解邻里是确保社区安全的最佳方式,也是了解潜在危险的方法。父母的友谊网络也能提供了分享生活经验和观察孩子的机会,使他们更加了解儿童发展,从而学会更加信任自己的孩子。此外,在孩子面前出现的其他成年人,将可能成为孩子们可敬的榜样。无论你和你的伴侣(如果有的话)是多么优秀,你的孩子都需要在现实生活中认识其他成年人,以发展他们对「成年」的概念,并激发他们对未来的遐想。
与社区里的其他父母共同合作,创建一个孩子们可以自主交友和玩耍的安全场所。
如今,要找到具备这些特点的社区并不容易。即使找到了这样的地方,局限于现实中的种种困难,你也可能无法居住在那里。因此,你需要主动尝试将目前所居住的地方营造成这样一个社区。去主动结识社区中其他的父母,聚集起来讨论各自遇到的问题。只需你主动迈出这一步,大部分父母都将跟上你的脚步。这不仅能够促进各个家庭之间的友谊,更能够加深孩子间的联系,让他们更多的参与到户外运动中去。
如果你认为为了安全起见,孩子们玩耍时需要有成人在场监护,你还可以与其他父母合作开发属于你们的游乐场,并轮流监护孩子的安全。随着越来越多的孩子参与到户外玩耍中去,你可能将改变自己的看法,认为成人监管不再是必要的,这种改变需要一步步来。
记住,作为一名信任孩子的父母,你与其他父母的会面并不只是为了给孩子创造 「玩耍的约会」;你与他们应当创造出一种和睦的邻里关系,让孩子们可以找到自己的朋友,按照自己的选择自由地玩耍。你也可能会与其他家庭共同的郊游、度假或是露营,在这些时候,你的孩子可以在相对自由的环境中与他人玩耍,而你则能够享受其他成年人的陪伴。
当我还是纽约市的一名大学生时,我曾在一个叫做克林顿青年中心的地方担任「监管员」。这个中心是由基督教青年会(YMCA)与基督教女青年会(YWCA)设立的,作为那些负担不起「真正」青年会的孩子们的免费替代选择。它位于贫民窟的一座破旧建筑中,但对当地的孩子们来说,这里却是一个避风港。青年中心有一座体育馆,各种二手的艺术工具,还有一些免费向孩子们开放的房间。孩子们也能够在建筑外的街道上自由玩耍,由于人数众多,这里的活动相对安全。放学后,通常只有两名成年人在场(主监管员和当时仅 19 岁的我),而孩子们可能多达 100 人。我们虽然被称为「监管员」,但实际上监督的工作很轻。我们所做的只是处理不时发生的紧急情况,与前来攀谈的孩子们热切交流。有时,我还会带一群小孩子去中央公园,参观动物园或在草地上自由玩耍。
来到中心的孩子们——几乎全部都来自所谓的贫困家庭——在这里表现得非常好。他们善于自我管理,互相帮助。得益于这所机构的自由与开放。年长的孩子能够通过与年幼的孩子互动,认识到责任感,而年幼的孩子则能够通过观察和与年长孩子玩耍,习得生活技能。你甚至可以看到有年长的孩子在帮助年幼的孩子做作业——这并非因为有成年人安排他们做辅导,而是因为他们发自内心的想要帮助他人。
(在大学时,我还有另一份工作,即作为一小群富家孩子的「玩伴」。这些孩子都住在东区,年龄相仿。而与克林顿青年中心的孩子们形成鲜明对比的是,这些孩子非常难缠。我仅忍受了 5 个星期便辞去了那份工作。他们不断地试图挑战我,最终他们赢了。我记得当时非常希望能把这些孩子送到克林顿青年中心,让他们从那些「贫困」孩子身上学点礼貌。)
在今天的所有社区中,我们都需要一个,像克林顿青年中心一般,让孩子们能够找到彼此,自由玩耍,适应一种流传下来的讲礼貌的儿童文化,并习得责任感。克林顿青年中心并不是由研究儿童发展的哲学家们所设立的,而是由清楚孩子们的需求与欲望的人设立的,他们意识到,不需要大量的资金,就能够做到这些。
考虑传统学校教育的替代方案。
正如我在之前的几篇文章中所描述的,传统学校正在侵犯学生自由发展、习得责任感与自主权的机会。学校已经演变成一种文化意义上的野兽,吞噬着孩子及其家庭的自由。我们越来越习惯于将所有儿童问题交给学校系统来处理,尽管它显然无法尽数解决这些问题。你很难在将孩子送到传统学校后继续当一名信任孩子的父母,只是因为学校体系已经成为了灌输「不信任」的工具。本博客的许多读者已经在寻找传统学校教育的替代方案,在我的下一篇文章中,我将讨论其中的一些选择。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
------------
校园霸凌:专制学校的悲惨代价
原文:School Bullying: A Tragic Cost of Undemocratic Schools | Psychology Today
反霸凌法律法规只有出自学生之手才有效。
发布于 2010 年 5 月 12 日
假设你 15 岁,或者 13 岁,或 11 岁,出于某种原因——你无法控制的原因——你被你的同学当作一个轻蔑和羞辱的对象。对你来说,学校如同地狱。别人叫你「biao子」「j货」「d妇」;或者「同性恋」,「娘娘腔」,「渣滓」;或者更下贱的词语。同学故意在走廊上撞你,把你的书从你手里打掉。午饭时没有人和你坐在一起,谁跟你坐在一起,谁就会被骚扰,直到他们不再和你坐在一起。这些霸凌者不是那些在漫画里常见的外表粗鲁、没人喜欢、偷别人午餐钱的坏孩子。不,这些霸凌者是那些受欢迎的孩子——运动员、啦啦队员、时髦的孩子。不仅是孩子,还有老师或者其他大人,这些孩子都能得到他们的喜爱。
不管你对学校有什么看法,也不管你在学校受到什么样的对待,你都必须按照法律规定去上学。“少数人”的父母有能力送他们去其他私立学校,或者说服学校董事会让他们在家里就可以接受足够的教育,但你不属于他们。你别无选择。
如果你是成千上万受到霸凌的孩子之一,你会怎么做?你可能会忍受痛苦,变得坚强,勉强活下去。你可能是唯一一个知道自己受了多少苦的人。你可能会想过自杀;你甚至可能幻想用暴力来报复学校,因为整个学校似乎都是你的敌人。如果你像其他孩子一样,这样的想法仅仅停留在幻想中。但是偶尔,在一些特别脆弱的人身上,绝望或者愤怒有时会以暴力的形式爆发出来,发泄对象要么是自己,要么是学校,只有到了这个时候,校园霸凌才会受到社会的关注。
Helen Smith 在她的书《伤痕累累的心》中,讲述了一个 13 岁女孩 April Michelle Himes 自杀的故事。她住在华盛顿州的里奇兰市:「在学校,同学们叫她胖子,朝她扔东西,把她推来推去。他们造谣并嘲笑她,说她在胸罩里塞纸巾。她曾试图自杀,她的父母让她接受了精神病院的住院治疗,并寻求咨询,但无济于事。在规定的 180 天的上课时间里,她缺席了 53 天。她被告知,她必须返回学校,否则逃学委员会可能会把她送到少年拘留中心。她觉得更好的选择是:走进卧室,用皮带吊死自己。……在过去,她本可以就这样辍学,但现在,像她这样的孩子却被强制教育困住。」
在我的家乡马萨诸塞州,那里经常有学校霸凌和自杀的事情流传。几年前,一个 11 岁的男孩 Charles Joseph Walker-Hoover 上了头条,因为他受不了学校的霸凌而上吊自杀。他的学校在斯普林费尔特,是所“好”学校。后来,又有一个 15 岁女孩 Phoebe Prince 被同学霸凌了几个月后上吊自杀。她是爱尔兰移民,就读于南哈德利富裕社区的公立学校。
Walker-Hoover 自杀后不久,Prince 也自杀了,民众的愤怒情绪爆发了。这促使马萨诸塞州议会采取行动,他们一致通过了反霸凌法案,然后由州长签署,当即成为法律。全州的人都想做点什么,不让 Charles 和 Phoebe 的死白费。于是他们制定了这条法律。
对于立法者一致通过这项法案、州长大张旗鼓地签署这件事,我并不感到惊讶。考虑到当时的情绪氛围,他们可能别无选择。任何反对的人都会被视为对悲痛的父母缺乏同情,对霸凌行为态度软弱。但这项新的法案并没有解决霸凌问题。
为什么反霸凌立法无法解决霸凌问题
根据反霸凌法,学校的每个员工——包括食堂员工、清洁工、校车司机以及教师和行政人员——都必须向校长报告他们看到的任何霸凌事件,校长则有义务进行调查并给予相应的纪律处分。此外,该法还要求马萨诸塞州的每个在校学生,从幼儿园到 12 年级,每年都要参加「反霸凌课程」。这些表面上的事,你用不着深挖就能看到其中的问题。
这个法律第一个问题是,很多时候——也许是大多数时候——工作人员无法判断某个行为是友好玩笑还是真正的霸凌。这在大学校尤其如此,因为一个工作人员不可能认识所有人。在朋友之间开玩笑是青春期正常、健康的一部分,尤其是对男孩来说。最好的朋友可能会反复用听起来很可怕的名字互相叫。对很多男孩来说,这就是他们拥抱的方式。
如果食堂员工听到有孩子管另一个孩子叫了几次「loser」,然后,根据法律,他必须汇报,校长也必须调查。这会让校长很忙,也会让很多完全正常、善良的孩子陷入麻烦。这就像对武器的零容忍政策,导致孩子们因为上学带指甲刀而被停学;或者像对性骚扰的零容忍政策,导致一个三年级男孩亲吻一个小女孩的脸颊而被停学。这是对孩子在学校行为自上而下控制;这又一项要求,让学校感觉更不自由,更像监狱。
这个法律还有另一个问题,就是会让霸凌者更容易向成年人隐藏霸凌行为。据报道,现代的霸凌者已经导致了很多孩子自杀,他们在成年人面前假装清白,掩饰自己的恶行。这就是为什么当老师和校长被告知性骚扰时,他们常常不相信受害者或受害者的父母。他们看不见霸凌的发生。在他们看来,被指控的学生是学校里最优秀的孩子,所以他们很快就断定投诉者一定是心理有问题,然后他们建议投诉者去接受治疗。即使有了法律,受害者也很难得到公正的对待,因为他们只有自己的话来证明自己被霸凌了,而霸凌者有一群人为他们说话;而后者的话往往会更有说服力。
这个法律第三个问题是,它会加剧学生和教职工之间的对立。学生觉得在教职工面前必须更加注意自己的言行,以免违反新的言论规范。教职工因为有义务举报学生的任何不当言论,所以会让学生更加敌视他们。因此,学生向老师或校长举报骚扰行为,会被视为通敌,甚至比平时打小报告更严重;而且,敢这么做的学生,会受到更多的霸凌,情况甚至比现在更糟。
这个法律的另一部分,即要求学生每年参加反霸凌课程,又如何呢?新课程,新教学大纲,新的一套考试——这些已经是我们的文化对学生面临问题的一种本能反应。事实上,在过去二十年里,包括美国在内的很多国家都尝试过各种反霸凌的学校项目和课程,并且进行了很多效果评估,检验它们是否有效。到目前为止,没有一个项目被证明是非常有效的。
对这类结果研究的两篇主要综述已经发表,两者都得出相同结论,没有证据表明这些项目有正面效果[1]。在最好的情况下,这些项目可能会使霸凌行为略有减少;在最坏的情况下,它们可能会使霸凌行为略有增加。不仅是反霸凌项目和课程,其他一些从上而下的,旨在改变青少年的行为的项目和课程,也面临同样的情况。比如,一个很有名的叫做 D.A.R.E. 的项目,设计的目的是让孩子们对毒品不感兴趣,但是多次研究都证明它是无效的,甚至三年前有一篇美国心理学会发表的文章把它列为了那些可能带来负面影响而不是正面影响的干预措施之一。[2]
校园霸凌的根源
霸凌经常发生在这样一类人身上:他们没有政治权力、被别人自上而下地统治;他们因为法律或经济的原因,无法脱离这一处境。比如说,监狱里就经常发生这种情况。被霸凌的人无法逃脱,也无法通过法律途径来对抗霸凌者。他们可能会向狱警和监狱长举报,但狱警和监狱长不知道该相信谁,而且他们可能觉得隐藏霸凌对他们更有利,而不是公开宣扬和公开处理。最近我读了陈桂棣和吴春桃合著的《中国农民调查》,它讲述了上世纪中国农民的生活:农民无法离开土地,就容易被地方小官僚自上而下地掌控,那些擅长威胁别人的霸凌者就会上位。我们是否应该对至少有一些学生对强制禁锢和独裁统治的反应,与囚犯和这些农民的反应相同而感到惊讶呢?
在我们文化中,对学校的最美好的想象是,教师和校长都是无比善良、充满爱心,且拥有智慧的成年人,擅长教育和照顾孩子,能帮助他们克服困难。但实际上,老师和校长都是普通人,和世界各地的人一样,有各种各样的弱点。他们中的大多数人确实是善良的,但远非无所不知或全知全智。作为一个国家,我们很早就认为,没有任何一种独裁是好的或有利的。要有一个公正的社会,人民必须有权利和责任去管理自己的事务。这是我们国家的根本原则,如果我们的孩子要接受民主教育,那么我们的学校,也就是孩子们生活的重要场所,岂不是应该成为民主的典范吗?
要消除学校里的霸凌和弥漫的不公平感,只有一种办法,那就是彻底改变学校的管理方式。如果我们的孩子必须在学校中接受教育,那么他们就应该在学校的运作中有实质性的发言权。如果他们没有这样的发言权,那么学校和监狱无异,我们可以想象学生会有和各地囚犯一样的各种反应。
我长期参与了一所学校的工作,那里的学生和教职工相互合作,每个人都有一票,共同制定学校的所有条例。这些条例是通过一个司法机制来执行的,不同年龄层的学生都可以担任陪审员。这所学校和其他任何学校一样,也有潜在的霸凌者(谁不可能成为霸凌者呢?),但是它的民主治理在霸凌行为尚未形成伤害之前,就已经非常有效地遏制了它。
正是因为学生们拥有权力,他们会对学校产生归属感,并有着保持学校和平的既得利益。他们的法律权力激发了一种责任感,这让他们不仅利用学校的立法和司法系统,还借助同伴压力和友好说服的手段来促进和平与正义。在这所学校,教职员工和学生之间没有“我们与他们”的对立。他们携手合作,建设一个人们可以自由无惧的社区。我说的不是一所想象中的学校。我说的是一所真实存在了 40 多年的学校,并且已在世界各地多次被复制。
-----------
现在,你对此有何看法?……从某种意义上说,这篇文章给大家提供了交流的平台。无论我们是否认同,你的疑问、想法、故事和观点,都受到我和其他读者的尊重。文章的原网址 Psychology Today 不支持评论,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)。
-----------
附注
[1] K. W. Merrell et al. (2008), How effective are school bullying intervention programs? A meta-analysis of intervention research. School Psychology Quarterly, 23, 26-42; and J. D. Smith et al. (2004), The effectiveness of whole-school antibullying programs: A synthesis of evaluation research. School Psychology Review, 33, 547-560.
[2] Lilienfeld, S. O. (2007). Psychological treatments that cause harm. Perspectives on Psychological Science, 2, 53-70.
拒绝上学:犯罪,心理障碍,还是人权?
School Refusal: Crime, Mental Disorder, or Human Right? | Psychology Today
怎么看待拒绝上学,取决于人们怎么看孩子、怎么看人权
发表于 2020 年 2 月 23 日 | 审稿人:Kaja Perina
哪里有强制学校教育,哪里就有拒绝上学问题。全国各地,都有相当多孩子抵触上学,想方设法旷课。从法律角度来看,拒绝上学是一种犯罪,长时间不接受强制学校教育,即使在今天,也经常被视为犯罪。孩子可能会因不上学被送进少管所。父母如果不愿或不能强迫孩子上学,他们就有麻烦了。这些父母如果没有办法在家教育孩子,也缺乏提供其他合法学习方案替代学校教育,则可能面临逮捕或者他们的孩子被带走。
然而,不出所料,心理学家倾向于认为拒绝上学不是犯罪,不需要惩罚,而是一种心理障碍,需要被治疗。然而,当阅读有关拒绝上学的心理学文献时,有些「治疗」方式,总是让我不禁想到这是一种变相惩罚。
心理学家描述和尝试治疗拒绝上学的一般方式
如果你在心理学学术期刊的数据库中,输入「拒绝上学」作为关键词,你将找到很多讨论这个话题的文章。从这些文章中随便挑出几篇来看,你都会注意到很多重复的信息。这些文章通常都以一种声明开头,指出孩子不上学是有害的。他们引用的统计数据表明,辍学的孩子在未来的生活中会遇到各种问题。文章将上学描述为「正常发展路径」,从而暗示不上学的孩子将变得反常、异常。
接着,典型的文章会以或多或少客观的方式定义「拒绝上学」(有时使用大写字母)。主要症状是孩子每月至少缺席学校若干天,并且没有请假,尽管父母和其他成年人都试图让孩子返校。此外,定义通常还包括一个情绪成分,通常是与孩子拒绝上学相关的焦虑。实际上,一些临床医生使用学校恐惧症这一术语来替代「拒绝上学」。
在定义了拒绝上学之后,心理学家接着将其作为一个诊断类别来处理。至少目前,它并不是美国精神病学协会诊断手册中的正式的精神疾病,也没出现在世界卫生组织的诊断手册中,但它常被当作正式的疾病来对待(例如 Elliott & Place, 2019)。在文章中,人们经常会遇到「患有拒绝上学症的患者」这样的表述,好像逃学是类似麻疹这样的疾病,有人「患有」或者「未患」。它不是一种行为,而是一种疾病。要是这样,那我素食主义的妻子就是「患有拒绝肉类症」的人了。当然,临床医生通过指出「拒绝上学的人通常会感到来自学校的大量焦虑」来合理化他们将其作为疾病的观点;我稍后会再讨论这一点。
对拒绝上学原因的研究得出了多种多样的结论。学校人员通常将原因归咎于父母或家庭环境,或孩子内在的某种遗传问题,这或许并不奇怪;而父母和孩子自己则常将其归因于校内发生的事情(例如 Ingul 等人,2019年)。学校通常认为父母过于宽容、过于严格、过度保护或保护不足,甚至未能提供适当的道德指导。相反,父母和拒绝上学的孩子最常将其归因于诸如教师的关照缺失、霸凌行为(来自教师或学生)、被不公平对待、不被信任、缺乏自由活动空间;或归因于接连不断的考试和作业带来的压力与乏味无趣。参与这些讨论的心理学家常常承认所有这些因素,都可能导致拒绝上学,但他们的「治疗」方案往往聚焦于孩子和家庭身上,而不是学校。
针对拒绝上学的治疗手段涵盖了所有典型的心理治疗和药物治疗。最常见的治疗方法似乎是认知行为治疗,其目的是改变孩子对学校的想法,并减少孩子对于学校环境中引起恐惧的敏感度;同时,也常用药物来减轻焦虑(例如 Elliott & Place,2019) 。另一种方法,以家庭问题为中心,涉及到家庭治疗。
在少数情况下,心理学家在得到父母的许可后,采用了住院治疗。例如,Ozger Oner 及其同事(2014)描述了一个八岁女孩的案例,她因为「害怕老师、校长和其他孩子」而拒绝上三年级。治疗方案包括住院,让她在医院接受治疗,并由治疗师陪同下强制逐渐增加她在学校的时间。三周后,直到她愿意去学校,她才被允许回到父母身边生活(我想知道她是否真的被治愈了,或者她只是觉得上学比住院更不遭罪)。
###「拒绝上学」与「相信世界公正」的关系
再来谈谈造成拒绝上学的原因——由一项有趣的研究检验了「相信世界公正」(Belief in a Just World,缩写即 BJW)与拒绝上学之间的关系(Donat 等人,2018年)。这个研究通过问卷调查受访者认为「世界是多么公平,以及人们是否得到了他们应得的」的程度,来测量他们的 BJW 观念。(译注:即相信善有善报,恶有恶报的程度。)大量心理学文献中通常用「世界公正谬误」或「受害者有罪论」这些术语来讨论这一观念,这是一种倾向,即人们倾向于责怪那些贫穷的人,或者那些患病或遭受其他不幸的人,应为他们自己的状况负责。如果世界是公正的,那么他们所处的状况必定是因为他们自作自受,或者无能。通过这种方式思考,人们即使看到其他人觉得不公正的事情,也能维持他们对公正世界的信念。
一些研究——这是 Donat 研究的跳板——表明,相信公正世界在心理上具有适应性。持有这一信念的人不太可能像其他人那样因为看到不公正而感到不安,因为他们不将其视为不公正。公正世界信念甚至可能帮助他们处理自己生活中的困难,因为这种信念可能会让他们认为,他们所遭受的任何痛苦最终都会为他们自己带来好处。[在这我得插一嘴,高度的 BJW 可能对个人的心理舒适度有好处,但对整个社会来说并非如此。如果我们都相信世界是公正的,正如它现在的样子,我们仍然会有奴隶制和___(请填空)。]
那么,Donat 和他的同事发现了什么呢?拒绝上学的孩子们相比于那些不拒绝上学的孩子,对公正世界的信念要弱一些。这个结果并不令人惊讶。如果你相信自己在学校受到了不公正的对待,那么你很可能会认为这个世界是不公正的。因此,如果你认为这个世界不公正,你大概率不会觉得,现在对自己不好的事情,最终会对自己有利。所以,你认为世界不公正的想法会加深你对学校不公正的看法,这两种信念相互强化。
Donat 从这项研究中得出的结论是,拒绝上学儿童的一个潜在问题是他们不相信世界是公正的。Donat 和几乎所有人一样,首先假设,尽管学校生活中要克服一些困难,但这对孩子好,也很必要。他由此提出,相信公正世界的孩子认识到学校对他们有益,而缺乏公正世界信念的孩子看不到学校对他们有好处。因此,如果孩子在相信世界是公正的环境中成长,我们就不会有拒绝上学的问题。哇!(他没有提到我们仍然会有奴隶制。)
拒绝上学作为一项基本人权
经常阅读我的博客和文章的读者们,你们肯定猜到了我要说什么。事实是,强制学校教育是不公正的。这是非自愿的囚禁,与童年的本质和儿童的天性背道相驰,孩子在生理上就渴求自由玩耍、在探索中学习。而且,强制学校教育对于正常发展来说并非必要。无数选择自主教育的家庭反复证明了这一点(关于一些证据,参见 Gray, 2013, 2017)。
许多家庭之所以选择非学校教育,或为自主教育所设计的学校,是因为他们的孩子拒绝上学(Gray & Riley, 2013)。自主教育通常费用较低,远比标准公立学校或少管所、精神病房收费低。我在之前的文章中提到过一个实验。在这个实验中,学校给拒绝上学的男孩们安排了一个单独房间。在那里,他们可以自由活动,只要他们来学校,不在街上闹事。这些孩子既没有上课,也没有作业。但是,为了观察效果,他们在为期四个月的实验前后都进行了考试。结果显示,他们的成绩进步超出了正常上课的学生。这个实验显示,当孩子可以控制自己的生活和教育时,他们能够取得显著进步。
有一位临床心理学家,与我所见略同,她叫 Naomi Fisher。她最近在英国心理学会的期刊 The Psychologist 上发表了一篇文章,题为《学校已经过时了》。在文章的开头,她这样写道:
「在我作为临床心理学家的职业生涯早期,我接触过一些停止上学的年轻人。我理解这是由焦虑驱动的拒绝上学行为。我设计了分级暴露方案(译注:graded-exposure,一种治疗方法,通过一步一步增加患者感到焦虑的事物,以让患者逐步适应。),并写信明确反馈,在我看来,成功的结果应该是返回学校。这似乎是合理的做法。有个叫 Nina 的女孩不想回去。当我明确我的观点时,她和她的家人就脱节了……他们不再来了。……当我继续工作,在不同环境下与儿童接触时,我越来越对自己的观点感到不舒服。对一些孩子来说,学校是一个积极的地方,问题确实是焦虑本身。但对另一些孩子来说,学校本身就是一种痛苦的经历,在那里他们感到无法学习,也无法做自己。有个男孩给他妈妈展示了一张笼中动物的图片,并说:『这就是我在学校的感觉』。假设学校本身不存在问题,并将问题推到孩子身上,我对这种做法感到不安。有哪些环境可以替代学校?它们会如何影响孩子的心理?」
接着开头,Fisher 继续描述了她对自主教育的发现,以及她对这一主题的研究者的采访。我们需要更多像 Naomi Fisher 这样的临床医生——那些愿意真正倾听孩子的人,他们愿意质疑这个要求每个孩子都必须以相同、标准且强制的方式接受教育(或假装接受教育)的制度。
大多数处理拒绝上学问题的临床医生将其视为心理障碍,是因为它通常与严重的焦虑相关,而严重的焦虑本身就是一种障碍。儿童在学校经历痛苦、折磨和不公正时感到焦虑和恐惧,这并不令人意外!事实上,对于许多定期上学的学生来说,学校是一个巨大的焦虑源。实际上,有三分之一的在校学生在某个时点遭受的焦虑程度足以被临床诊断为焦虑症(这里),并且在研究中询问他们焦虑的来源时,绝大多数人都指出是学校(这里)。
在另一篇文章中(这里),我总结了研究结果,表明在学校上课期间,自杀和自杀未遂的比例远高于学校假期。在一本名为《疤痕之心》的书中,Helen Smith 描述了一个拒绝上学的 13 岁孩子的案例,她被给予选择:要么回到学校,要么进入少管所。用 Smith 的话说,「她决定更好的选择是进入她的卧室,用皮带上吊自杀。……在过去,她本可以选择退学,但现在像她这样的孩子被强制教育所困。」多么遗憾这个女孩没有被提供在家教育或自主教育学校的选择,那里的每个孩子都可以以自己的方式学习,而且几乎听不到欺凌的事情(参见这里)。
或许,至少在一定程度上,拒绝上学的孩子们是勇敢的。拒绝上学不仅仅需要认识到这个世界是不公正的,以及你在学校受到的待遇是不公正的,它还需要勇气,特别是当你所看到的不公正被周围的每个人视为正常且合理,认为这是必须忍受的东西时。想想那个包办婚姻的时代,年轻女性将要嫁给谁,只由她的父亲决定。在某些情况下,拒绝遵从父亲的命令是一种犯罪,在其他情况下是一种心理障碍。有时,女性因此被送进精神病院。在每个人都认为去学校是必要的,不去学校要么是疯狂的要么是犯罪的假设下,说出「不,我不去」的话需要勇气。
----------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today《今日心理学》 不支持评论了,但你可以在我的脸书主页上找到这篇文章并留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
Donat, M., Gallschütz, C., & Dalbert, C. (2018). The relation between students’ justice experience and their school refusal behavior. Social Psychology of Education, 21, 447-475.
Elliott, J. G., & Place, M. (2019). Practitioner review: School refusal: developments in conceptualization and treatment since 2000. Journal of Child Psychology and Psychiatry, 60, 4-15.
Gray, P. (2013). Free to Learn: Why unleashing the instinct to play will make our children happier, more self-reliant, and better students for life. Basic Books.
Gray, P. (2017). Self-directed education—unschooling and democratic schooling. In G. Noblit (Ed.), Oxford research encyclopedia of education. New York: Oxford University Press.
Gray, P., & Riley, G. (2013). The challenges and benefits of unschooling according to 232 families who have chosen that route. Journal of Unschooling and Alternative Learning, 7, 1-27.
Ingul, J. M., Havi, T., & Heyne, D. (2019). Emerging school refusal: A school-based framework for identifying early signs and risk factors. Cognitive and behavioral practice, 26, 46-62.
Oner, O.,et al., (2014). The inpatient treatment process for severe school refusal, Klinik Psikofarmakoloji Bülteni—Bulletin of Clinical Psychopharmacology, 24, 176-179.
学校是为了夸耀,而非学习
原文:Schools Are Good for Showing Off, Not for Learning | Psychology Today
这里解释了为何存在教育差距,以及为何这种差距在不断扩大
发布于 2013 年 9 月 19 日 | 审稿人:Matt Huston
假设你在读高中或者在读大学。突然,有一位魔法仙子冒出来,让你做出以下选择:(1)你能学好这门课讲授的材料,但你会拿个低分(比如 D)。(2)你根本学不会这些材料,但你能拿个高分(比如 A)。你会怎么选择?诚实一点。
几乎所有学生(除了几个桀骜不驯的)都会毫无犹豫地选择第二个选项。学生都是理性的。他们知道学校是为了拿成绩的,而不是学习。如果他们需要了解课堂的材料,他们总可以自己学习,这可比在学校学习高效多了。然而,假如成绩单上多了个碍眼的 D,那可就永远无法抹去了。选择第一个选项简直是愚蠢。只要读到高中,所有学生都知道这点。
学校是为了夸耀,而非学习。让孩子入学,便是让他们置身于一系列竞赛之中——比谁最厉害,谁的总成绩最高,谁在标准化考试上成绩最好,荣誉拿得最多,进入最高级的先修课,考上最好的大学。对于这些成绩和一轮轮马戏圈子,我们不仅当作学生的指标,更是家长自己的指标。我们会用种种办法,或是话外之音,或是直言不讳,向朋友亲戚炫耀这些指标。
所有这一切与学习无关。说实话,我们也知道。我们几乎很少考虑,孩子是否在学校学到东西了;我们只关心成绩。家长比孩子更觉得选项一比选项二更愚蠢。只要可能,我们应该禁止他们作出选项一。
如果学校的目的是学习,而非夸耀,我们会采取更为不同的设计。我们会设置一些场所,让学生追随自己的兴趣,学习他们想学的东西,尝试不同的职业路线,为他们渴望的未来做好准备。所有人会在不同的时间,做不同事情,因此没有比较的基准可言。人们会在想学习阅读的时候学习阅读,而如果他们希望得到帮助,我们也会施以援手。我们会关注合作,而非竞赛。这正是一些民主学校里所实施的,这些学校的目的是学习而非夸耀,而事实证明,这样的学校是非常有效的。
我们指导,学习有一个特点,即学校用以激励表现的压力,是会抑制学习的。大量心理学实验显示,各种形式的比赛和评估,对于那些知道怎么做好一项任务的人,能让他们比平常做得更好,然而对不太懂的人,则会起反作用。
比如,在一项多年前开展的研究中,心理学家观察了在大学球池里玩魔力八号球友谊赛的人。[1] 一开始,他们站在远处观察,所以玩家不知道有人观察他们,之后他们靠近玩家,并非常刻意地观察,显示出他们在衡量玩家的表现。结果是那些没有被观察时已经玩得很好的玩家,在知道有人在评估他们后,表现得更好了;但那些还在学习怎么玩的初学者,在有人评估后表现得更差了。很多类型的任务都是如此——无论是智力型,体育型,还是劳动型。评估和竞赛让炫耀更为容易,但这种压力阻碍了学习。然而,随着我们不断尝试促进学校学习,我们一直在增加压力,结果还奇怪,为什么怎么做都行不通。
关于美国里贫富家庭出身的孩子之间的教育差距,已经有详备的叙述。有意思的是,随着在学校里表现良好的压力不断增加,这种差距也在不断扩大。实际上,有一项研究(刊登于纽约时报)显示,比较来自不同财力家庭的孩子,两者在标准化测试上的成绩差距, 从1960 年到现代,增加了 40%。
我确信,教育差距的成因中有很多因素,但有项因素是我希望你们仔细考虑的。假设那些来自经济条件更好的家庭的孩子,在家里学会很多学校会考到的知识。在学校中考试和持续评估的压力之下,他们会表现得更好,因为他们已经掌握了考试涉及的知识。他们习惯了这种思考方式。那么再假设,来自经济条件较差的家庭的孩子,在家里没怎么学会学校会考到的知识。他们一开始就在考试上表现很差,因为他们并没有一开始学到那些知识。持续不断的测试与评估带来极高的压力,再加上考试失败的尴尬与耻辱——他们便很难在学校学习那些别人已经在家里学会的知识。
宿命论地,学校的失败会引诱他们相信,他们自己是愚蠢的,这又导致他们在心理上以至于物理上放弃整个过程。换句话说,正是这种高压力的环境,在那些已经掌握知识的人,和没有已经掌握知识的人之间,撕裂出一条天堑,导致学校里教育差距年年都在扩大。随着保持优良表现的压力增加,天堑还在不断加深。
如果我们真心希望减小教育差距,我们必须本着学习而非夸耀的目的来设计学校。
现在,你对此有何看法?……从某种意义上说,这篇文章给大家提供了交流的平台。无论我们是否认同,你的疑问、想法、故事和观点,都受到我和其他读者的尊重。文章的原网址 Psychology Today 不支持评论,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
关于孩子自然的学习方式,以及孩子学习的最佳条件,更多信息请参见《玩耍精神》。
参考文献
[1] Michaels, J. W., Blommel, J. M., Brocato, R. M., Linkous, R. A., & Rowe, J. S. (1982). Social facilitation and inhibition in a natural setting. Replications in Social Psychology, 2, 21–24.
科学革命与民科精神
原文:Scientific Revolutions and the Spirit of Amateurism | Psychology Today
达尔文、爱迪生、爱因斯坦和古道尔在取得他们最重要的成就时,都还只是业余爱好者。
发布于 2024 年 1 月 28 日 | 审稿人:Hara Estroff Marano
在我上一篇文章中,我从四个方面区分了专业人士和业余爱好者:(1)专业人士以此为生,业余爱好者为之而生;(2)专业人士在既定边界内工作;业余爱好者则自由探索;(3)专业人士在懂,业余爱好者在学;(4)专业人士力求把情感从思考和行动中剥离出去,业余爱好者则不这么做。现在,我将通过一些例子,继续探讨业余精神在科学领域的重大贡献。这些例子证明了我在上篇文章中提到的业余精神的种种优势。
在 19 世纪之前,所有科学基本上都是业余科学
科学活动自古就有,其历史与人类一样悠久。每个孩子本质上都是一个小科学家,他们喜欢探索、实验、验证假设,努力理解周围的世界及其功能。就像今天一样,我认为在人类历史上,一些孩子在成长过程中从未失去对世界的好奇,他们因为好奇心未曾消逝,继续「做科研」。
然而,把科学当作一种职业则是近现代的事情,这一概念在 19 世纪才首次出现。第一个正式的,专门用于科学研究和教学的实验室,在 1826 年于德国成立,主攻化学领域(Atkinson & Blanpied, 2008)。在美国,第一个致力于科学研究和教学的实验室是哈佛大学的杰斐逊物理实验室,建立于 1870 年代初。而第一个明确支持科学研究的美国大学是约翰斯·霍普金斯大学,成立于 1876 年(Atkinson & Blanpied, 2008)。
在 19 世纪之前,科学并不是一种可以谋生的职业,人们不会像选择从事医学、法律或神学那样「涉足」科学。那时候没有培养科学家的学校,也没有给科学家颁发证书的体系,科学家的工作更是少之又少,几乎没有报酬。无论是欧洲的老牌大学还是美洲的新兴大学,它们的主要任务只是传授那些被认为是知识的内容(主要是古文),而不是创造新知识。所以,如果按照今天对专业科学家的定义——即获得认证并以此为生的科学家来看,那个时代根本没有专业科学家。
那时的科学家更像是业余爱好者和充满好奇心的探索者,比如哥白尼、伽利略、开普勒和牛顿,他们有时会提出一些看起来非常疯狂或是有亵渎之嫌的想法。要想投入大量时间去进行这种探索,你必须是富裕家庭出身,或者有其他赚钱的工作,或者有觉得你的想法很有趣的人资助你。
在美洲殖民地,第一个因科学发现而声名鹊起的人是本杰明·富兰克林。他是电学研究的先驱,发现了雷其实就是电。现在我们都知道他是推动美国革命的政治家,但其实他早年就因为自己作为一名业余科学家的成就而闻名。在那个阶段,他依靠自己的印刷和报纸出版业务来支持自己的生活和科学探索。
业余爱好催生科学突破的四个例子
即使在 19 和 20 世纪,许多伟大的科学成就也是由那些未经官方认证、非职业的科学家完成的。在我之前的文章中,我曾论述过一个观点:作为业余爱好者,你不会受到专业的限制和信仰的束缚,也不会被老板的要求限制。你可以任由自己的灵感(如果是艺术领域)或好奇心(如果是科学领域)引导你前行。这样做产生的成果可能毫无价值,也可能创造出后人誉为天才的作品(如果你足够优秀或幸运)。以下是四个我认为「因民科而卓越」的科学案例。
查尔斯·达尔文与自然选择进化论
如果我真的要找一个偶像的话,那我会选查尔斯·达尔文。他对无数植物和动物的细致观察和记录,结合他努力将这些事实融入一个统一大理论的才华,最终促成了自然选择进化理论。这个理论现在已经成为整个生物学的基础。现在,几乎所有生物学家都会同意费奥多西·多布然斯基在 1973 年的那句经典之言:「只有在进化论的阳光下,生物学中的一切才显得合理。」
那么,在达尔文革新生物学的时候,他是什么身份呢?他并不是生物学家。在 19 世纪上半叶他做出那些开创性工作的时候,生物学家这个职业还不存在。他出身于一个小康家庭,父亲是医生,原本希望他能继承自己的衣钵,因此推他去学医。但查尔斯对医学讲座提不起兴趣,对手术更是避之不及。
他从小就喜欢亲近自然,收集各种标本,这份热情在他读医学院时依旧没有减退,甚至影响了他的医学学业。最终,他父亲不得不接受查尔斯不适合当医生的事实,便鼓励他去当牧师(尽管家里信教信得不诚),因为他认为这样查尔斯既能稳定生活,又能获得一定的声誉,而且不用太辛苦,还有时间做自己喜欢的事。然而,这条路同样没能引起查尔斯的兴趣,他在神学课程中也没有坚持下来。
查尔斯的转折点在于 22 岁那年,他因为对植物、动物和地质构造的深厚知识获得赏识,被聘为 HMS Beagle 号的自然学家。这次著名的 Beagle 号航行从 1831 年到 1836 年持续了五年,主要是在南美洲海岸及其附近的岛屿。在航行期间,达尔文记录了大量的观察笔记,收集了无数的标本。这些资料,及他回国后的进一步研究和收集,为他后来提出统一全球生命体系的理论打下了坚实的基础。
托马斯·爱迪生与科技新时代
托马斯·爱迪生,生于 1847 年,从小就是个问题少年。他八岁开始上学,但只坚持了三个月就被退学了。老师给他带回家的一张纸条上写着,这孩子「脑子昏昏沉沉」,「愚笨得像根木桩,简直教不了」。放在今天,他可能会被诊断为有注意力缺陷多动障碍(ADHD),需要服药治疗。
爱迪生之后就没再回过学校。虽然名义上是他母亲接手了他的教育,实际上,他自己主导了自学之路。不久之后,他发现了法拉第的《电学实验研究》,并对电的潜力产生了浓厚兴趣。
爱迪生不仅热衷于摆弄和实验,他还有着非凡的商业头脑。12 岁时,他就通过在火车上售卖报纸和其他商品,赚取了和成人相当的收入,并用这些钱购买电气和化学实验的设备。两年后,他自己创办了一份报纸,在火车上销售。接着,他又陆续开展了其它商业活动,最终赚够了资金,建立了自己的发明实验室。从此,他的发明生涯便一发不可收拾。爱迪生成为了美国历史上最多产的发明家,拥有超过一千项专利,包括留声机、电影摄影机、电灯泡和碱性电池的早期版本。
阿尔伯特·爱因斯坦与理论物理学的革新
阿尔伯特·爱因斯坦,生于 1879 年,对传统学校教育并不感兴趣。在谈到自己的学校教育经历时,他曾这样写道:
「为了考试,我们把知识强塞到脑子里,也不管喜欢不喜欢。这样做的恶果是,期末考完,一整年里谈到科学我就犯恶心。」
在他的自传中,他还补充说:
「现代教育方法,竟然还没有把研究问题的神圣好奇心完全扼杀掉,真可以说是一个奇迹;因为这株脆弱的幼苗,除了需要鼓励以外,主要需要自由;要是没有自由,它不可避免地会夭折。认为『用强制和责任感就能增进观察和探索的乐趣』是一种严重的错误。」(爱因斯坦,1949 年)
虽然阿尔伯特·爱因斯坦小时候接受过正规教育,后来还在苏黎世的联邦理工学院取得了大学学位(1901 年),但他确实是自学成才的。他自己回忆,学校的教育对他帮助不大,反而有些分散他的注意力。他从小就对数学情有独钟。12 岁那年,他已经能够独立研究高等数学的书籍,并且自创了一种毕达哥拉斯定理的新证明方法。
然而,他的学业成绩平平无奇,从理工学院毕业后,他有好几年连一份讲师的工作都找不到。为了谋生,他在一家专利局找到了一份助理审查员的工作。这份工作的好处是,它为他留出了大量时间,让他能够继续追求对理论物理学的兴趣。1905 年——这一年也被称为他的「奇迹年」——他发表了四篇划时代的论文。这些论文不仅标志着理论物理学自牛顿以来最大的进步,甚至还推翻了牛顿物理学的某些理论。
他的四篇论文分别阐述了光电效应的理论,解释了布朗运动,提出了狭义相对论,并从这一理论推导出了质量与能量的等价关系。爱因斯坦之所以能够取得如此成就,主要得益于他浓厚的好奇心和丰富的想象力,这些都建立在严谨的数学基础之上,而不是依赖于当时常规物理学的「先验」假设。他任凭自己的想象力和数学计算带领他探索,哪怕这意味着打破传统的界限。他把自己的工作称作「思维游戏」。
成名之后,他先是在苏黎世大学,后来在普林斯顿大学担任理论物理学教授。作为教授,他继续为理论物理学领域做出贡献。他不仅是一位受人尊敬的教师,还是一位深受推崇的哲学家和公共知识分子。然而,他再也没有达到 26 岁那年在专利局作为民科时的辉煌。
简·古道尔与野生动物研究的新道路
简·古道尔在二十几岁时,勇敢地开启了对非洲野生黑猩猩的研究,这项工作开创了先河。当时她只有高中文凭,之后又简单接受过秘书培训。她从小就对动物充满爱心,曾养过狗、小马和乌龟。她小时候读过《人猿泰山》和《杜立德医生》的故事,梦想着能去非洲,亲眼看看书中描述的动物。1957 年,23 岁的她到肯尼亚探访一位朋友,那里她命中注定般地遇见了著名的古人类学家路易·西摩尔·巴泽特·李奇。李奇后来不仅帮她在当地一家自然历史博物馆找到了工作,还安排她在坦桑尼亚的贡贝溪保护区研究野生黑猩猩。李奇认为,她没有接受过正规的动物行为训练,这反而是一个优点,因为她可以带着一种开放的心态去观察。(信息来源:国家地理杂志。)
经过不懈的努力,简·古道尔找到了一群黑猩猩,并通过模仿它们释放善意的信号,逐渐获得了它们的信任。她不是把每只黑猩猩都当作整个种群的代表,而是像认识人类一样,逐一了解它们的个性。她给这些黑猩猩取了名字,而不是用数字编号,并且打破了当时的常规,用拟人的方式描述它们的行为。她记录了它们的情感、喜怒哀乐和性格上的不同。她的描述让读者能清晰地看到,黑猩猩与我们有多么相似,它们之间又有多么不同,正如人与人之间的差异一样。
近年来,古道尔一直是动物权益和野生动物保护的坚定支持者。我之前曾提到,那些因为热爱而非金钱参与的业余爱好者,往往会因为他们的热情而成为活动家。古道尔正是这样的例子。利基曾准确预见,天真但聪明、充满热情和勇气的年轻古道尔,是开展野生亲缘动物研究的理想人选。
最后的思考
我觉得有个很值得注意的现象,那就是我这里提到的所有对科学有重大贡献的人士,他们的热情都是从童年时期开始培养的。童年应该是玩耍、探索、找到自己喜欢做什么的黄金时期。然而,不幸的是,在现代社会,无论是在学校还是其他成人主导的环境中,我们对孩子的控制过于严格,几乎没有给他们足够的时间和机会去发现并追求自己的兴趣。在其他地方(这里),我也分享了一些来自我个人研究的证据。这些证据显示,在今天这个世界上,那些在非强制教育环境中成长的年轻人,往往能够培养出自己的热情所在,并在成年后成功地将这些兴趣转化为职业。
我一直欢迎大家分享自己的想法和问题。虽然 Psychology Today 现在不再接受本站的评论,但你们可以在另一个平台上给我留言。
参考文献
Atkinson & Blanpied (2008). Research universities: Core of the US science and technology system. Technology in Society, 30, 30-48.
Beals, G. (1997). The biography of Thomas Edison. Available at https://www.thomasedison.com/biography.html
Clark, R. W. (1977). Edison: The man who made the future. New York: Putnam’s Sons.
Einstein, A. (1949). Autobiography. In P. Schilpp, Albert Einstein: Philosopher-scientist. Evanston, IL: Library of living philosophers.
强制教育系统的七大罪行
原文:Seven Sins of Our System of Forced Education | Psychology Today
强制教育妨害孩子教育自己
发表于 2009 年 9 月 9 日|审稿人:Ekua Hagan
在我上一篇帖子中,我做了一件让我不那么舒服的事情。我重复了几遍:「学校即监狱。」 我为此感到不适,因为学校占据了我人生的一大部分,而我认识的许多人也是如此。
和我认识的大部分人一样,我在公立学校接受教育,长达十二年。我的母亲曾在公立学校执教多年。我的至亲——同父异母的姐姐,也是公立学校教师。我有很多亲近的朋友和堂兄弟姐妹都是公立学校教师。我怎么能说这些善良的人——他们热爱孩子,并且全身心地帮助孩子——竟参与了一个囚禁儿童的系统呢?
我上一篇帖子下的评论也说明,我用监狱指代学校的说法,也让其他人感到了不适。
我发现,有时候,就算让我和别人都不舒服,我也得说出真相。再怎么巧舌如簧,也掩盖不了血淋淋的真相,学校——任何在美国或其他国家常见形式存在的学校,就是监狱。法律规定,一定年龄范围内的人类(基本上是 6 岁到 16 岁),必须在那里花费很大一部分时间,在那里他们被他人要求必须完成任务,而命令必须得到遵循。对于制定这些他们必须遵从的规则,他们没有多少发言权。监狱——根据常见的一般定义——是任何非自愿监禁并限制自由的地方。
现在你可能会争辩,我们熟识的学校,是良善且必要的;但你无法否认,学校即监狱。否定学校即监狱,就是在说我们并没有义务教育系统。若非如此,那就得在语义上说明,监狱的含义与常识不同(因此不能用来修饰学校)。我认为,在任何严肃的辩论中,要实事求是地使用词语。
有时候,人们会用「监狱」这个词来做比喻,用来指代他们必须遵守规则或者做那些没意思的事的地方。类似地,有些成年人会认为他们的工作是监狱,或者他们的婚姻是监狱。
但这不是监狱一词的字面含义,因为这些例子中的限制是自愿的,而不是非自愿的。在美国和其他民主国家里,强迫人在他们不想工作的地方工作,或者与他们不想结婚的对象结婚,是违反法律的。
然而,强迫孩子上学并不违法;实际上,如果你是家长,而孩子不想上学,不强迫孩子上学反而违法(我知道有些家长有足够资源以选择其他的学校教育,或者提供家庭教育,让州政府和孩子都可以接受,但这在现代社会不是常态;而很多州和国家的法律极其反对这种选择)。
因此,尽管有些可悲的工作或婚姻像是监狱,但学校通常就是监狱。
还有一个词是我觉得值得大声疾呼的:强制教育。就像监狱一词一样,这个词并不悦耳。但,如果我们有义务教育,那么我们就会有强制教育。义务这个词,如果有任何意义的话,那便指的是被义务的人对此毫无选择的余地。
一个问题亟待辩争:强制教育——以及紧随其后的儿童监禁,是好是坏?大多数人会觉得,总的来说——好事一桩;但我觉得,说一千,道一万,它就是件坏事。我会概述一些原因,并列出了所谓的强制教育系统「七大罪行」:
-
仅凭年龄来剥夺自由。在我的价值观中,以及长期以来民主思想家支持的价值观中,剥夺任何人的自由都是错的,除非有正当理由。我们必须在法庭上证明,成年人犯了罪或对自己或他人构成严重威胁,才能对其进行监禁。然而,仅仅因为年龄,我们就把儿童和青少年关进学校。这是强制教育中最露骨的罪行。
-
(强制教育)一方面滋长耻辱,另一方面助长傲慢。迫使人去做自己不想做的事情并非易事。我们不再像过去那样使用教鞭(来鞭策学生),而是利用一个持续测试、评分、排名的系统,让孩子在其中与同龄人竞争。由此,我们利用并扭曲了人类的耻辱和傲慢,这一情感结构,为的是激励孩子们去完成任务。如果孩子们的表现不如同龄人,就会让他们感到耻辱;而如果表现更好,他们可能会自满。一些孩子会因此从教育中心理上失去兴趣,成为课堂小丑(并不太糟糕)、霸凌者(不好)、毒品滥用者和毒品贩子(非常糟糕)。而那些因为获得 A 和荣誉而感到极为骄傲的人,则可能会变得傲慢,鄙视那些成绩不好的人;从而轻视民主的价值和程序(这可能是最糟糕的影响)。
-
阻碍合作和养育的发展。我们天生就是社会型动物,天生善于合作。孩子天生想帮助他们的朋友,即使在学校里,他们也试图这么做。但这种合作驱动力,和基于竞争的学生排名和分级体系相抵触。要是一个学生给另一个学生提供太多帮助,就会被认为是作弊。帮助他人甚至可能会伤害自己——抬高别人的分数,降低自己的排名。一些学生透彻地理解了这一切——他们无情,但是能成功。此外,正如我在之前的文章中所辩论的那样(尤其是 2008 年 9 月 24 日的帖子),在学校中出现的强制年龄隔离促进了竞争和霸凌,抑制了养育的发展。在人类历史上,孩子和青少年通过与年幼的孩子互动学会关心和帮助他人。年龄分级的学校系统剥夺了他们这样的机会。
-
阻碍培养自我责任感和自主能力。本博客中一系列文章的主题之一是,孩子们在生物学上倾向于对自己的教育负责(介绍见 2008 年 7 月 16 日的帖子)。他们通过玩耍和探索的方式,学习社会和物理世界的知识。他们思考自己的未来,并采取措施为之做准备。通过把孩子们限制在学校和其他成人指导的环境中,并用作业填满他们的时间,我们剥夺了他们承担这种责任所需的机会和时间。此外,我们强制性的学校教育系统时而暗示时而明示:「好好读书,读出来什么都会有的」。相信这种信息的孩子可能会停止对自己的教育负责。他们会误以为,别人已经帮他们想好了成功的必由之路,所以他们不必去想。如果他们的生活并不太顺利,他们会觉得自己是受害者:「我的学校(或父母或社会)辜负了我!所以我才过的这么烂」。
-
将学习与恐惧、厌恶和枯燥联系起来。对许多学生来说,学校引发了与学习相关的强烈焦虑。刚学习阅读、比其他人慢一点的学生在面对读书时会感到焦虑。几乎每个认真参加考试的人都会感到焦虑。失败的威胁和与失败相关的羞耻感会在某些人中引发巨大的焦虑。在我教授统计学的大学——即使是精英大学,大部分学生都患有数学焦虑症,显然是因为他们在学校受到了与数学相关的耻辱。心理学有一条基本原则——焦虑会抑制学习。在玩乐的状态下,学习能起到最好的效果,而焦虑会抑制玩乐的状态 。学校教育的强制性将学习变成了工作。老师们甚至干脆把学习叫作「工作」:「你必须先完成工作才能玩。」因此,本来生理上渴望的学习变成了苦差——孩子会尽可能地避免学习。
-
抑制批判性思维。据说,教育的雄心壮志之一,是促进批判性思维。但是,不管教育者们说得多么好听,但大多数学生——包括大多数「优等生」——学会了避免批判性地思考自己的学业。他们谙熟此道——在学校里的任务就是在考试中取得高分,批判性思考只会浪费时间、干扰学习。为了得高分,你只要搞清楚老师想听到什么,然后说出来。我听过无数的大学生和高中生对此头头是道。我在大学中为促进批判性思维付出了很多努力;我开发了一套旨在促进批判性思维的教学系统,撰写了有关批判性思维的文章,并在学术会议上进行了多次演讲。我将在未来的一两篇博客文章中探讨这个话题。但是,说实话,作为贯穿教育体系的主要激励因素,评分系统是一种强大的阻力,阻碍学生们在教室中坦率地讨论和批判性地思考。我们教师负责评分的体系中,很少有学生会批判或甚至质疑我们提出的观点;而如果我们试图用评分来引导学生们批判,那只会产生虚伪的批判。
-
减少技能、知识和思维方式的多样性。通过强制所有学龄儿童按照相同的标准课程学习,我们减少了他们尝试其他路径的机会。学校课程只代表了对我们社会很重要的一小部分技能和知识。在当今时代,没有人可以学习所有需要了解的内容。为什么要强制每个人学习相同的一小部分内容?当孩子们自由学习时,如我在瑟谷学校所观察到的那样,以及其他人对非学校教育者的观察,他们会采取新颖、多元且不可预测的路径。他们会努力钻研自己抱有热情的领域,成为专家,然后通过追求自己的兴趣找到谋生的方式。被强迫按照标准课程学习的学生没有太多时间追求自己的兴趣,许多人汲取了这一教训:自己的兴趣并不重要,重要的是考试成绩。一些人会克服这一点,但是太多人做不到。
我在此列出的「罪行」,并不是什么新闻。我与许多教师攀谈过,他们早已了然强制教育的这些有害影响,许多人还非常努力地试着与之对抗。
有些老师在学校系统允许的范围内,尽可能地让学生感受自由和游戏的氛围,许多老师试图减少学生失败的耻辱感,减轻他们的焦虑感;大多数老师尽力克服困难,让学生之间合作并互相关怀,尽管系统本身带来阻力;许多老师尽力允许并培养学生的批判性思维。
然而,这个系统却与他们背道而驰。可以说,在我们的学校系统中,教师并没有更多的自由来按照他们的意愿教学,就像学生没有自由按照他们的意愿学习一样。(但是教师不像学生,他们有退出的自由;身陷囹圄的不是他们。)
我必须补充一点,那就是,人类,尤其年轻人,具有超强的适应力和机智的头脑。许多学生想出很多办法,克服强制学校教育带来的负面影响,而专注于正面影响。他们奋起反击,与七大罪行抗争,尝试找到合作、玩乐、互相帮助、克服羞耻感的方法;收敛不合时宜的骄傲;反对霸凌;进行批判性思考;尽管学校中存在着众多阻力,但仍然花些时间专注于自己真正的兴趣。
但是,要做到这一切,同时还要满足强制教育的要求,需要付出极大的努力,许多人都没有成功。至少,学生必须在学校里庸碌地浪费时间,服从各种命令,这大大减少了他们本可以用来自我教育的时间。
我已列下强制教育的「七大罪行」,但我竭力遏制冲动,不把它们叫作「七宗罪」。还有更多的「罪」。愿你们集思广益,为这份清单添砖加瓦。
最后,还有一件事,我并不觉得学校得被废除,然后什么也不提供给孩子。虽说孩子自己教育自己,但我们成年人有责任提供环境,让他们以最佳方式进行自我教育。这是我下一篇文章的主题。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
社交玩耍:民主的摇篮
原文:Social Play and the Genesis of Democracy | Psychology Today
在玩耍中,孩子们逐渐明白,他们就是成年人。
发布于 2009 年 3 月 4 日
我们都重视民主。作为公民,我们希望孩子在成长过程中,能充分理解并坚守民主的价值观。我们深知,实行民主并非易事。民主意味着自由,同时也意味着责任。在自由和责任之间找到微妙的平衡,需要通过实践获取的智慧。在民主社会里,人们享有自由,但他们也必须遵守规则,与他人携手合作,尊重个体间的差异,并认识到自己的需求和权利并不比其他人的更重要。那么,孩子如何才能学习并践行这些价值观呢?
我们可以肯定的一点是,孩子在学校里,至少在大部分人熟知的学校里,是学不到这样的价值观的。人们只有在实践中体验到这些价值观,看到它们在现实生活中的作用,才能真正学会。但在学校,孩子接触到的却是专政,而非民主。孩子被法律强制要求上学,而在学校里,他们必须遵守自己并没有参与制定的规则。他们可能在公民课上被要求记忆一些关于民主价值观的知识,但因为他们并没有亲身体验过这些价值观,这样的课程可能会让他们感到虚伪。如果幸运的话,他们可能会从善良的教师那里体验到慈爱,但那其实是一种仁慈的专政,而非真正的民主。
孩子们无法从成人独断独行的活动中领悟民主价值观。然而,在与其他孩子自由嬉戏的过程中,他们却能真正体验并领会到这些价值观。在这样的环境中,他们受平等对待,必须对所发生的事情发表意见,如果想要得到接纳,他们必须尊重他人的权利。在我过去的文章中,我曾经主张,玩耍是促进孩子推理(2008 年 12 月 4 日)和锻炼身体技能(2009 年 1 月 1 日)的自然方式。现在我要说,玩耍还是教孩子如何以民主方式和睦相处的自然方法。
我曾在讨论玩耍定义的文章中强调过(2008 年 11 月 19 日),玩耍不是随意的行为,它总有其内在结构,这种结构可以用规则来明确。即便是最不拘小节的玩耍,也有其规则约束。比如,孩子在嬉戏打闹时,都会遵守哪种程度的肢体接触是可以接受的规则。这种玩耍的首要原则就是,你不能真的伤害对方。在扮演角色游戏中,孩子会建立一套复杂的规则,规定每个人应扮演什么角色,如何扮演,以及可以使用哪些道具。研究这类玩耍的学者注意到,孩子在讨论和协商规则上所花费的时间,甚至比实际玩耍的时间还要多。对于正式的游戏,如棒球,有官方规则,但在随意的比赛中,玩家总会根据自己的需求和欲望调整规则——「任何打入那个暴脾气的邻居家的球,都自动算出局。」所有这些规则,明确了玩耍的流程,我们可以将其称作游戏规则。
然而,比游戏规则更为重要的,是另一套适用于所有社交玩耍的高级规则。这些规则使得社交玩耍得以实现,它们规定了如何与他人共游的原则。为了区别于游戏规则,我把它们叫做社交玩耍的元规则。这些规则,从本质上说,就是民主原则。现在,我尽可能地清楚地列举如下:
-
在选择、制定或修改游戏规则的过程中,每个参与者都应拥有发言权。
-
在不触犯游戏规则或侵犯他人权利的条件下,应允许每个参与者按照他们自己的方式参与玩耍,表达他们自己的个性。
-
对每一个参与者,都应尊重对待,视之为与他人平等的存在。
在社交玩耍中,这些规则之所以具有影响力,并不是因为有任何人把它们当作道德原则在宣扬,而是因为玩耍的实际运行需要它们。如果有人违反了这些规则,或者过分地违反了,游戏就会分崩离析。让我来解释一下。
玩耍的本质是自愿,人们选择去做,而非必须去做。在任何形式的玩耍中,最基本的自由就是选择退出的自由。这一点人人都懂。如果有人被强迫留在游戏中,那他就不再是玩家,而是受害者。选择退出的自由,是推动社交玩耍必然走向民主的关键。
在玩耍和生活其他部分中,总有些人想要发号施令。比如,在「家家酒」游戏中,Betsy 这个小霸王命令 Jill 和 Jamie 他们要扮演什么角色,要用什么道具,要如何参与这个虚构游戏。虽然 Jill 和 Jamie 比 Betsy 小,他们可能有自己的想法。如果 Betsy 坚持自己的方法,一意孤行,Jill 和 Jamie 可能就会选择退出游戏。他们会去做其他事情。独自留下的 Betsy,就会从这次经历中学习到宝贵的一课。下次,她不会那么霸道了,她会提出建议,但也会愿意让步。
同理,在棒球游戏中,霸道的 Benjamin 可能坚持要全程担任投手,理由是他投得最好。但他队伍里另外三个人也想试试投球。他们如此渴望,以至于如果不给他们机会,他们可能会退出这场比赛。如果 Benjamin 不退一步,他很可能就会失去半支队伍,游戏就此打住。稍有经验的玩家自然会明白这个道理。没人真的需要开出退赛的威胁,每个人都明白,要想游戏持久,就必须让大家乐在其中。这就是为什么每个人都要对规则和其他所有决定有话语权。这也是为什么每个人都需要得到平等的尊重。玩家间的平等,和所有民主原则里的平等一样,并不在于人人都一样。相反,它是尊重每个人的不同需求和愿望所达成的平等。
注意,在这样的野球游戏里,维持比赛继续并让两队的人都开心的目标,比赢得比赛的目标更重要。玩家们可能会说他们的目标是赢,也可能每次队伍得分或者打出一支安打时都会欢呼,但你若留心观察,就会发现真正的目标并不是赢。真正的目标是玩得尽兴,让人快乐,通过让所有人开心来让游戏继续下去。你并不总是让最好的投手一直投下去,如果其他人也想试试的话。你会轻轻地投给小 Nicky,他还只是个新手,你知道如果你全力以赴,他连一点机会也没有,也玩不出乐趣。你会全力对待经验丰富的 Henry,一方面是想让他出局,另一方面也是因为你知道,轻松地投球对他来说是侮辱。在真正的游戏中,和少儿棒球联赛或其他成年人主导的活动相比,每个玩家都必须顾及到所有人的心情,尽量让他们都开心。这才是游戏继续下去,大家都开心的途径。
我不想把孩子想象得过于理想。并非所有孩子都能从玩耍中轻松掌握民主的奥义,也不是所有的玩耍都是纯粹的民主。欺凌的孩子依然存在,同样也有被欺凌的孩子。但社交玩耍,比我们所知的任何力量,都更能帮助人们克服自身的欺凌冲动,并帮助被欺凌的孩子变得更加果敢。
令人痛心的是,今天的孩子们在没有成年人监督的情况下进行真正的社交玩耍的机会,比我们小时候还要少。这种损失不仅加剧了儿童肥胖和抑郁,我怕,这也使得孩子们更难以充分理解和欣赏民主的价值。在玩耍中,我们学会如何平等地协商我们的需求,并且把其他人也视作平等的存在。在玩耍中,不管我们多大年纪,我们都明白我们自己就是成年人;没有更高的权威可以解决我们的问题。这就是民主的艰难课题。
-----------------
参见新书《自由学习》
----------------
部分学校开始像监控囚犯一样跟踪学生
原文:Some Schools Now Track Students Like Prisoners | Psychology Today
学校使用跟踪设备监控学生,却少有人表示不满
发布于 2012 年 11 月 14 日
今年秋季,圣安东尼奥市的开学季引发了一波新闻热潮,焦点集中在 John Jay 高中和 Anson Jones 中学推行的新式学生证上。这些学生证内置射频芯片,使校方能够实时监控学生在校园内的一举一动。这一做法引起了少数家长和学生的强烈不满,他们震惊地发现,学校竟然采用了跟踪牲畜和监狱囚犯的技术来监控学生。
媒体的关注焦点主要集中在 John Jay 高中二年级学生 Andrea Hernandez 身上,她大胆地拒绝佩戴这种新式学生证。她以宗教信仰为由,称这是「野兽的记号」,同时还提出了一个看似不同寻常的观点——她拥有所谓的「隐私权」。[1] Hernandez 的抗议行为显然给校方带来了不小的麻烦,于是校方也开始对她采取各种刁难措施。他们威胁说,如果不佩戴新学生证,她将无法使用学校食堂和图书馆,无法购买课外活动的门票,甚至(这简直令人难以置信)无法参与返校节国王和王后的评选投票。
尽管遭受威胁,Hernandez 仍然坚持拒绝佩戴跟踪芯片。为此,副校长 Ray Galindo 向这位女学生的父母发出了一份措辞严厉的声明:「如果现在允许她拒绝接受跟踪,那么等到学校全面实施位置监控系统时,她将面临比仅仅失去返校节投票权更为严重的后果。...我强烈建议你们接受这个解决方案,以免影响你们孩子的正常学习。正如我们之前讨论的那样,一旦我们开始全面实施这项政策,拒绝佩戴身份识别卡的学生将会承担相应的严重后果。」[2]。
John Jay 和 Anson Jones 既非首创,也不是唯一使用追踪技术监控学生的学校。[3] 早在 2005 年,加利福尼亚州的一所小学就曾尝试实施类似项目,但在美国公民自由联盟的威胁下最终放弃。2010 年,宾夕法尼亚州下梅里恩学区采取了更为激进的措施,在学校发放的笔记本电脑中植入间谍软件,每 15 秒将摄像头画面传回学校服务器,不仅监控学生在校行为,甚至延伸至家中。当一名学生因「家中不当行为」受到校方处分时,此做法引发了巨大争议。同年,德克萨斯州休斯顿的斯普林学区和毗邻的圣达菲学区也开始追踪学生行踪。在奥斯汀的九所学校中,被控旷课的学生甚至被强制要求如同假释犯般随身佩戴 GPS 追踪器,并定期向「导师」汇报。而圣安东尼奥的「学生定位项目」一旦全面实施,将会追踪 112 所学校近 10 万名学生的一举一动。
尽管这些做法引起了少数学生、家长以及美国公民自由联盟的不满,但大多数人似乎并不以为意。他们认为,这种做法与我们已经习以为常的监控手段相比,并没有太大的突破。
长久以来,我们社会形成了一种共识:必须通过法律强制儿童接受学校教育,而在学校里,他们的一举一动都要受到严格监管,必须严格遵从校方的指令。学生们失去了自由活动的权利,他们的行动被铃声所支配,只能按照学校规定的路线移动。就连用餐时间和地点都由学校做出安排,上厕所也需要申请许可,且不得在那里逗留过久。体育活动也是被强制安排的,每周固定时间在体育教师的指挥下进行,学生们必须按照教师的要求来锻炼。阅读内容也不由学生自主选择,而是由学校指定。言论自由在校园里是不存在的,学校竭尽全力控制学生的思想。校内的公告和学生报纸的文章都必须经过校方审核。在课堂上,学生的观点会根据与官方立场的接近程度来评分。一旦学生被指控犯错,他们没有任何正当程序可以遵循——没有审判,没有法律途径,一切由校长决定。至于投票权?哦,当然了,学生们是可以投票的——为了选出返校节国王和王后!不过,如果他们犯了什么重大过错,比如拒绝佩戴跟踪设备,那就连这点权利也会被剥夺。
当被问及 John Jay 高中和 Anson Jones 中学实施学生跟踪系统的反响时,学区发言人 Pascual Gonzales 表示:「家长和学生的反对声音微乎其微。」他进一步解释道:「学生们已经习惯了被监控的环境。」事实上,John Jay 高中安装了 200 个监控摄像头,而 Anson Jones 中学也装有约 90 个。[4]
我对此表示赞同。这有什么好大惊小怪的?学校本就是座监狱,学生早已是囚犯;这些跟踪设备不过是让学校更轻松地完成它设计之初就该做的事罢了。
我认为,之所以有人对跟踪系统感到不安,是因为他们不愿承认学校实际上就是监狱。当这个令人不快的事实被如此赤裸裸地摆在眼前时,他们就会感到不适。他们宁愿相信学校是民主的堡垒;学生把上学视为特权,而非刑罚;老师对学生的「要求」只是建议,而非命令。但我要说,让我们抛开这些虚伪吧。不如我们干脆给所有小囚犯都戴上跟踪设备,顺便再给他们穿上黑白条纹的囚服,在这些机构周围的围栏上加装盘绕的铁丝网。更进一步,我们干脆不叫它们学校了,不如改称「教育营」吧。
或者,我们也可以选择信任孩子。我们可以为他们提供教育机会,而非强制性的指导。我们可以创建这样的学校:孩子们可以自由选择是否去上学,还能自主决定参与什么活动。一些人知道这是可行的,而且效果显著,因为我们亲眼目睹过。自由确实行之有效。然而,大多数人并不相信这一点。
----
那么,你怎么看?学校是否就像监狱?它们应该成为监狱吗?考虑到当今学校的现状,你认为引入追踪设备会带来实质性的改变吗?这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
----------
参见新书《自由学习》
----------
附:如果你想深入了解本文相关的观点,可以参考以下文章:
学校如何伤害学生?Kirsten Olson 列举了几种途径
参考文献
[1] Huffington Post Education. http://www.huffingtonpost.com/2012/10/08/texas-school-district-rep_n_1949415.html
[2] http://rt.com/usa/news/texas-school-id-hernandez-033/
[3] Houston Chronicle, Oct 11, 2010. http://www.chron.com/neighborhood/spring-news/article/Tracking-devices-…
[4] www.wired.com/threatlevel/2012/09/rfid-chip
标准化测试与教育的毁灭
原文:Standardized Testing and the Destruction of Education | Psychology Today
研究表明,我们测试得越多,学生的兴趣就越低
发布于 2022 年 11 月 17 日 | 审稿人:Hara Estroff Marano
在过去几个世纪或更长的时间里,我们所知道的学校教育从来都不是好的教育 手段。它依赖于强制。它以错误的假设为前提,即:假设每个人在其发展过程中,可以且应该以相同的方式,在同一时间学习同样的东西。它使人们逐渐失去内在好奇心,削弱了人们了解世界的本能欲望,使学习变成了苦差事。但在几十年前,学校教育并不像今天这样糟糕。
在其他文章中(例如 此处 ),我拿 20 世纪 50 年代我上小学时的学校教育,与今天的学校教育进行了对比。那时上学最大的优势是:耗时更少。当时(在美国)的学年平均比现在短了 5 周(此处)。每天上学的时间平均要少半个小时。在小学,这一天通常包括一个小时的休息时间和一小时的午餐时间,对我们大多数人来说,这是额外的休息时间。此外,当下午放学的铃声响起时,学校的一天就结束了。小学几乎没有家庭作业,中学的家庭作业也比现在少得多。
因此,我们有很多时间进行自我教育,在我们成长的现实世界里,游戏、探索、爱好、家务和业余工作。此外,学校的课程本身往往更加多样化,更有创造性,更符合孩子们真实的兴趣和需求。这是因为老师在课堂上有很大的自主权,而且大多数老师——当然不是全部——都是聪明、有爱心的人,他们能看到孩子们在课堂上的实际需求和兴趣,并相应地调整课程。
「危机中的国家」
是什么改变了这一切?因素有很多,但最重要的因素是联邦政府对教育的兴趣日益增长,这导致了标准化程度的提高和灵活性的降低。
与苏联冷战期间,美国的决策者开始担心美国在数学和科学上落后于苏联,而这会让美国陷入危险。事实证明,这是杞人忧天;我们并没有落后,但这种担忧极大地影响了我们对学校教育的思考。我们开始认为学校教育是国防的重要组成部分,这也促使联邦官员想要控制学校教育。
这种担忧不是针对武器储备这种狭义的国防,而更是针对经济实力这种广义的国防。其他国家,尤其是某些亚洲国家,似乎正在逼近我们,官员们担心我们可能会失去经济和军事上的主导地位。据说,其他国家之所以取得进步,是因为他们的教育制度更为严苛。因此,他们培养出了更优秀的科学家和技术人员,以及更多愿意努力工作的人。
这一切在1983年达到了顶峰,在总统 Ronald Reagan 和教育部长 Terrel Bell 的要求下,美国国家教育卓越委员会出版了一本名为《危机中的国家:教育改革的必要性》的书。从一开始就预料到,这份报告对全国学校的教学质量提出了严厉的批评。该报告的主要作者 James Harvey 写道:“学校出现了越来越多的平庸者,这威胁着我们国家和民族的未来。”为了解决这一问题,该报告建议:除了其他改革外,各学校还应提高标准,并开设更多必修课,尤其是数学、科学和英语。
许多州已经在为公立学校提供部分资金支持。而这份报告中导致这些州开始加强对学校的控制。为了获得拨款,当地学区必须达到州政府规定的某些「标准」。人们普遍认为,当地学校董事会和各位教师是不可信的。学校需要置于更集中的控制之下。随后,国会的一项法案首次赋予联邦政府对学校课程的直接控制权,联邦政府开始介入学校。
有教无类法案
2002年,在两党的支持和总统 George W. Bush 的强烈要求下,国会通过了《有教无类》(NCLB)法案。该法律规定,为了获得一批新的联邦拨款,以补充州和地方学校的财政,各州必须满足某些要求。其中最重要的是,每个州都需要定期进行标准化考试——每所学校都要进行相同的考试——如果考试成绩逐年没有提高,或者达到「优秀」分数的学生人数太少,学校和教师就会被判定为不合格。
在 NCLB 之前,教师可能用不同的方法来评估学生的进步。他们可能会在评估时考虑学生不同的性格、兴趣和天赋。但如今,所有学生都用同样的方法来衡量,所有老师都根据学生在这些指标上的得分来评估他们的进步。
当然,这意味着教师将开始应试教学,不需要考试的科目将被取消或减少,与考试无关的创造性活动将被取消,休息时间将被减少或取消,与备考有关的家庭作业将增加。许多最优秀的老教师将辞职,因为他们的经验、智慧和判断不再受到尊重。自2002年以来,这一切确实一直在发生。(对低年级教学的有关影响,请看这里。)2015 年,在奥巴马总统的领导下,国会用《让每个学生都成功》法取代了 NCLB,该法案在一定程度上修改并放宽了对各州的要求,使目标更加现实,但没有改变评估学生、教师和学校的标准化测试的要求。
PISA考试在教育衰落中的作用
经济合作与发展组织(OECD)启动国际学生评估计划(PISA)仅两年后,NCLB 就获得通过,这绝非巧合。这是一套专注于数学、科学和阅读的测试,对所有参与国家的15岁儿童进行。从2000年开始,每三年进行一次测试,每次测试都会有更多的国家报名参加。
每三年才公布一次的结果出炉时,一些国家会经历「PISA冲击」,因为相对于其他国家,它们的分数较低,这导致他们的学校需要更加严格和标准化。例如,2010年公布的结果显示:中国(更具体地说,是中国的某些工业化地区)名列前茅,而美国远远落后。美国教育部长 Arne Duncan 称之为「警钟」,人们纷纷呼吁要改革教育体系,以效仿中国和其他得分高的东亚国家(Zhao, 2012, p 20)。人们没有意识到的是,中国式教育对孩子的创造力、社交能力和心理健康产生了严重影响。
值得注意的是,美国标准化考试的两位主要批评者,是赵勇和 Kyung Hee Kim 。赵勇在中国长大,现在是堪萨斯大学的教育学教授; Kyung Hee Kim 在韩国长大,现在在威廉和玛丽教育学院担任教授。东亚学校侧重于让学生为高风险考试做准备,两人就此写过大量文章,论述这种做法的严重影响,并警告人们不要在美国效仿他们的做法。
例如,赵勇(2009、2012、2014)用大量证据证明:美国的创新和创造力得分较高,而中国得分较低,这是美国学校相对宽松的结果;中国学校僵化死板,控制过度,与此相比,美国学校允许孩子张扬个性。我在之前的一篇文章中回顾了赵勇的一些想法和证据。我现在转向 Kim 在一篇最近的学术文章中提出的一些想法和证据(Kim, 2021)。
Kim 关于以考试为中心的学校教育后果的结论
最受关注的 PISA 分数是科学、数学和阅读。但该测试还包括一些旨在评估创造力和学生学习兴趣的项目,以及询问教师教学方法的项目。在 2021 年的文章中,Kim 描述了她基于 2015 年 PISA 测试数据所做的一些分析。具体细节可参阅原文,而以下是她的三个主要结论:
\1. 数据显示,在不同国家,学科测试得分,与学习兴趣和创造力指数之间,存在很强的负相关性。例如,Kim 发现,在科学测试中得分最高的国家,往往在学习科学的兴趣上得分最低(r = -.50),在创造力和自我激励的综合指数上得分最低(r = -.90)。毫无疑问,如果你让学生为了考试得高分而「学习」,你就扼杀他们对这门学科可能产生的兴趣,也让他们更不容易就这门学科展开创意性思考,因为这样可能会挑战创制了课程和考试的权威者。
\2. 在美国,与经验丰富的老教师相比,新教师(执教年限相对较短的教师)在课堂上使用创造性方法,或征求和讨论学生想法的可能性,明显更小。Kim 认为,比起在这个体系中工作了较长时间的教师,新教师更容易接受以考试为中心的教学模式。在她看来,这预示美国教育的未来不妙。
随着时间的推移,学校教育越来越以考试为中心,而美国的创造力标准评估分数也不断下降(参见这里以获取有关这方面的更老数据)。在这个时代,国家取得经济成功特别需要创造力和创新,而我们的学校体系却在抑制而不是增强这些能力。
因此,这里的结论并没有指向推广标准化测试,以及缩小学校的教育重点范围。作为一个国家,如果我们想保持经济强国和创新领导者的地位,我们就需要增强老师和学生的灵活性,为他们提供更多自我指导的机会,而不是更少。
--------
现在,你对此有何看法?……从某种意义上说,这篇文章给大家提供了交流的平台。无论我们是否认同,你的疑问、想法、故事和观点,都受到我和其他读者的尊重。文章的原网址 Psychology Today 不支持评论,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)。
参考文献
Zhao, Y. (2012), World class learners: Educating creative and entrepreneurial Students.
Zhao, Y. (2009), Catching up or leading the way: America education in the age of globalization.
Zhao, Y. (2014). Who's afraid of the big bad dragon.
Kim, K. H.(2021). Creativity crisis update: America follows Asia in pursuing high test scores over learning. Roeper Review, 43 (1), 21-41
成年后非学校教育者的调查 II:走进大学之路
原文:Survey of Grown Unschoolers II: Going on to College | Psychology Today
没有上过小初高学校教育的人,能否踏入大学,并在那里有所建树?如果可以,又是怎么做到的?
发布于 2014 年 6 月 17 日
他们能上大学吗?若能,他们又是如何进入并适应大学的?能否完成学术任务?能否适应紧张的课程安排?一提到「非学校教育」这一概念,人们不禁就会这样问。在本文中,我将引用一些过去接受过非学校教育,后来却走上了正规大学教育道路的成年人的观点,来回答这些问题。
这是我和 Gina Riley 最近开展的「成年后的非学校教育者」调查项目的第二篇文章。第一篇文章给出了非学校教育的定义,并总结了我们研究的方法和数据发现。如需了解更多,可参考之前的文章。
与大多数普通人不同,大多数非学校教育者并不把上大学、拿文凭或者在大学里得高分当作衡量人生成败的标尺。我们也这样看。本研究中之所以提及大学,仅仅是想了解那些有意选择上大学的人的经验。这个问题不是空穴来风,因为很多考虑是否接受非学校教育的人,会因为担心这会断了上大学——从而走向某些还是需要大学文凭作垫脚石的职业路——的念头而犹豫。
为了了解他们的大学生活,我们在问卷的第五题提出:「请简述您所体验过的正规高等教育,如社区大学、普通大学或研究生院。您是如何在没有高中毕业证的前提下,成功进入大学的?您又是如何从非学校教育模式转型,适应更为正式的教育环境?请列出您已经取得或正在攻读的各类学位。」
在这系列文章里,我把学校教育定义为离开家门,去学校接受教育,在家上学则是指在家里由父母监管或施行的课程教学,非学校教育则指那些既没被送到学校,也不是在家上学的情况。从法律和其他角度来看,非学校教育被认为是在家上学的一种分支——在下面的引述中,一些回应者把「在家上学」当作涵盖性术语,非学校教育就包括在内——但为了避免混淆,我这里指的是狭义的在家上学,不包括非学校教育。关于非学校教育更详细的定义,请参考前一篇文章。
前文已经提到,75 名参与我们调查的成年后的非学校教育者中,有 62 人(占总数的 83%)曾经或正在接受某种形式的高等教育,其中 33 人(占 44%)已经完成或正在攻读学士学位或更高。其他 29 名选择接受高等教育的人,大多数是因为需要获得与他们职业兴趣有关的专门知识或资质,并不一定需要学士学位。另外,根据前文的数据,攻读学士学位的可能性和之前是否上过学呈反比关系:在从未上过学的这一组里,有 58% 的人攻读了学士学位,而在其他两组里,这一比例分别是 44% 和 29%。具体细节请回头参考前一篇文章。
在这个从未上学的群体中,不仅有最高比例的人后来获得了学士学位,还有最高比例的人没有接受任何形式的高等教育。确切地说,在这 24 名回应者中,有 14 人继续攻读了学士学位,6 人则没有选择任何形式的高等教育。后者普遍的看法是,他们为了学习自己想知道的东西或追求自己的职业目标,根本不需要走正规教育这一条路。比如,一位写道:「我将在我的一生中继续非学校教育。我认为实习和学徒制是非学校教育进入传统职场的自然延伸。如果我对某个领域产生了兴趣,并觉得大学可能是个不错的资源,我会考虑一下,但我仍然认为这是非学校教育旅程的一部分,对我来说,就是跟随好奇心走到哪里都行。」另一位则直言:「作为一个成年人,我意识到非学校教育让我明白,其实不用上大学也能过得很好。」
我之前也提到,对于参与这项调查的人来说,要想读大学,最常见方法就是先去社区大学上几门课,一般从 16 岁开始,然后用这个成绩单去申请大学。33 名回应者中有 21 人是这么做的。他们大部分人连个正式的高中文凭都没有就直接去了大学,但也有 7 人说他们通过考试拿到了 GED 证书,还有 3 人通过在线课程拿到了高中文凭。
绝大多数去上大学的回应者表示,在学术方面并没有遇到什么困难。事实上,大多数人都觉得自己在学术上有优势,主要原因就是他们有极高的自我驱动力和出色的自我管理能力。
要准确地传达这些回应者在大学里的经历,最直接的办法还是用他们自己的话来说。这篇文章的后半部分主要是调查中选出来的引用。这些引用都相当能代表整体情况,除了两个人提到了他们在不上学和追求高等教育方面遇到的困难,这部分内容会在本系列的第四篇文章里进一步讨论。从整体样本中凸显出的主题有:(1)对这些不上学的孩子来说,进大学一般都不是什么大问题;(2)他们通常能很顺利地适应大学的学术氛围;(3)大多数人觉得,因为他们自我驱动力强,所以在学术上有优势;(4)最常见的抱怨则是大学同学缺乏动力和求知欲,大学社交生活受限,以及在个别情况下,课程或评分制度带来的限制。
为了保护回应者的隐私,我仅用性别、填写问卷时的年龄,以及他们非学校教育的程度来标识他们。同时,我也删掉了可能泄露身份的信息,特别是他们所上大学的名字。下面样本中女性的比例较高,这也反映了回应我们调查的人中,女性比男性多(详情见前文)。我引用的陈述主要来自在上大学前几乎没有接受过学校教育或在家上学的人,并按照他们从未接受过 K-12 阶段的学校教育或在家上学的情况来排序。
20 岁,未接受小初高的学校教育或在家上学。这位 20 岁的女士已经获得了学士学位,并找到了一份她认为理想的戏剧制作工作。她在 13 到 16 岁间上了一些社区大学的课程,然后转入她所在州的一所四年制大学,学士课程仅用两年零三个月完成,毕业时还以最高荣誉获得学位。她写道:「我适应得非常好。由于之前没有上过学,与同龄人相比,我没有感到疲惫,反而视角更为新颖。基础学术技能(如写作、研究等)我很快就掌握了……时间管理上稍有挣扎,但最终找到了保持有序的方法。」
21 岁,未接受小初高的学校教育或在家上学。这位年轻人正在加拿大一所选拔性很强的大学攻读哲学专业的第三年,即将申请荣誉学位,并有意继续攻读哲学硕士学位。他解释如何被录取时写道:「我预约了招生部的人,询问作为非学校教育者需要怎么申请。我简单介绍了自己、我的成就和我的教育方式,他读了我写作范本后说,『我看不出你为什么不能来这里』,然后递给我入学申请表。」
关于适应情况,他写道:「开始有点不适应一些入门课程对许多观点一带而过的做法,这让我难以忍受。主要是因为涉及材料的深度,我发现自己在 4000 级课程(译注:高难度本科生课程)里取得了最好的成绩,也做了一些最出色的工作。我一直都是以充满激情的方式进行学习,不愿在一个想法走到头之前停下。」
24 岁,未接受小初高的学校教育或在家上学。这名女士从一所高度选拔的文科学院获得了学士学位。她写道:「与我的同学相比,我从老师那里获得了极大的启发。在[已删除学院名称],老师们也必须是他们研究领域的实践者。因此,我与那些身兼教师、演员、作家、导演、翻译等多重身份,且在专业领域里活跃参与的人一起工作。有如此丰富知识的人在我身后指导我,简直是一次革命性的体验。这不是我觉得之前一直缺少的,也不是我早些时候就希望拥有的,但确实是激励我度过大学四年的东西。」
在她大学生涯的某个时点,她被要求主持一个学生会议,以向一门课程的教师提供反馈。她写道:「我发现人们希望老师告诉他们该怎么想。『我希望他在我们读《麦克白》时告诉我们该怎么想,』有人这样说。『我希望他告诉我们在我们写《黑暗之心》的论文时想要我们做什么,』等等。我从来没有想过去请别人告诉我在读某个东西时应该怎么想。」
她还写道,对她来说,大学最大的弊端是缺乏正常的、年龄混合的社交生活——与学生以外的那些人交往。为了实现这一点,她加入了当地的唯一神教派教会,并在还是学生的时候担任了宗教教育者。
24 岁,未接受小初高的学校教育或在家上学。这名女士目前是一名全日制英语硕士研究生。她写道:「16 岁那年,我开始上社区大学,每一秒都非常享受。我觉得自己不需要适应什么。第一节心理学课后,也是我第一次需要在课堂上做笔记,我立即回家开始整理我的笔记。我一直持续这种抽空学习的状态,直到 18 岁。社区大学接受了我自己制作的文凭和成绩单,父母也签了字。我将自己的兴趣和活动变成了成绩单上的『课程』,还列出了过去 4 年我读过的书。」
「当我开始寻找一个四年制大学进行转学时,我决定不参加 SAT 考试,这对我选择学校有一些影响。有一所学校甚至因为没有 SAT 成绩,就拒绝打开我的申请。尽管我给他们写了一封详述过去三年在大学层面取得的成功的信。最终,我选择了一所允许我首学期以非全日制生身份注册,然后无需提供 SAT 成绩就能转为全日制的大学。」
29 岁,未接受小初高的学校教育或在家上学。这名女士以高等荣誉毕业于一所精英私立女子学院,后来还攻读了硕士学位。她写到:「除了接受我,他们还让我进入了大一的荣誉课程。进入正式学校,尤其是荣誉项目,我确实感到有点不自在。我花了很多时间学习和做作业,远比我的同学多。在大一的第一个学期前半段取得全 A 之后,我开始稍微放松了一些,意识到我之前工作太过努力了。因此,我学会了像同学们一样通过临考死记硬背来学习。我依然取得全 A,但几乎没有什么负担。最终,我找到了平衡——真正投入到我感兴趣的材料,对不感兴趣的东西则死记硬背。这并不难;主要是让我非常感慨,庆幸我之前一直没有上学。」
「我在大学里绝对经历了一次(社交)转变。我不喜欢参加大学生联谊会派对,痛痛快快地喝酒之类的,所以在大学的第一年或前两年,我有点孤单,朋友不多。在大学的最后一年,我终于开始喝酒和参加家庭聚会,因此我『融入』得更好了,『朋友』圈也扩大了。我意识到,这就是大学里其他人如何社交的,但这对我来说感觉有点不对劲,不真诚,也不能建立持久的关系。走出学校后,我恢复了我一直以来的社交方式,瞧,其他人也都是这么做的。我通过工作,参与的剧院,其他朋友以及咖啡店认识了朋友。」
29 岁,未接受小初高的学校教育或在家上学。这名女士在某大学获得了美术学士学位。她写道:「我确实有高中文凭。没有它,挑战可能更大。但对我来说,过渡过程在逻辑上非常简单。尽管我是在完全没有学校教育的环境中长大的,但我母亲还是在加州把我们的家注册为一所私立学校,所以从纸面上看,我在这个系统中很『正常』。」
「16 到 19 岁期间,我在社区大学读非全。后来,我转到了一所四年制学校,在那里学习了三年,并在 22 岁时以高等级别获得了美术学士学位。我热爱大学生活——它是我年轻时代最专注和最有成就感的阶段之一!刚开始上社区大学时,我比其他学生年轻,原本担心会感觉跟不上,但实际并没有。我不喜欢考试,直到今天仍然对考试感到很多焦虑,但在大多数方面我都表现优秀,并以高绩点毕业。」
「在成长过程中,我明白我们并不符合常规,这有时会引发孩子们和成年人的质疑。尽管我妈妈极其自信,我还是会担心我是否具备在『现实世界』成功的实力。大学时,我在生活中直面未知,最终树立起了自信。」
30 岁,未接受小初高的学校教育或在家上学。这名男士从 16 岁开始就读于当地的一所州立学院,后来转至一所小型、有选拔性、具有前瞻性的私立学院,完成了生态保护和生物学的学士学位。之后,在一所州立大学获得硕士学位,并在另一所州立大学的博士项目里完成了一年学业,因严重疾病而暂停学业。关于适应性,他表示在学术工作上没有遇到困难,但不满评估制度带来的限制。他写道,「即使是在[省略学院名称]这样一个没有硬性要求的环境中,我也感觉受到了压抑,比如说,为了迎合教授的偏好而避免自己在专业内的独立思考,几乎排除经验性学习的正式学术偏见,以及过于强调有形的学术产出而非学习和应用过程。研究生阶段的问题更加严重,不仅教育模式更为结构化和正规化,而且低层次的教育机会也更少。」尽管如此,他仍计划在疾病得到控制后重返博士项目,因为他致力于恢复和维护生物多样性的职业生涯。
32 岁,未接受小初高的学校教育或在家上学。这名女士现在是一名母亲,正计划对自己的孩子实施非学校教育。她写道:「我上了一门急救医学课程,并做了几份零工,同时研究大学选择,最终确定了心仪的学校,并开始了申请流程。由于我整理了一份作品集,并通过了大学面试,所以得到了一部分本科教育的奖学金。没有正式的文凭也没让我觉得申请大学特别困难,因为我有 SAT 成绩和我妈多年来记录我们非学校教育经历所准备的高中成绩单。我记得大学前一两年非常不安分,因为我觉得核心课程对我来说并不具挑战性,非常渴望能开始主修和辅修课程。大学生活很有趣,但让我震惊的是,大多数其他学生除了学习和派对外,几乎没有做其他事情。我自己支付四年学费,在上课的同时通常至少还要做两份工作,以确保能按时毕业。读了两年大学后,我在当地报社的创意部门找到了一份全职工作,毕业后我继续在那里工作。」
35 岁,未接受小初高的学校教育或在家上学。这名女士先后在一所小型前卫学院获得文学士学位,然后又获得硕士学位。她写道,「整个大学生涯里,即使对我来说不那么理想或令人兴奋的课程,看到那些不做作业的同学,我都会感到不满。我觉得,我的教育背景让我时常思考:『如果你不打算参与,那你来这儿干嘛?』这让我非常恼火。因为我始终是自己选择追求教育的,虽然这个选择意味着我不得不修一些我并不感兴趣的课程,但我还是清楚自己来这里的目的。随着时间的推移,我逐渐明白,那些让人困扰的同学,他们与学习和教育的关系,与我截然不同。」
19 岁,二年级之后未接受小初高的学校教育或在家上学。这名年轻女士在二年级时被诊断出阅读障碍,因在学校不快乐而被带出学校。作为一名非学校教育的接受者,她按照自己的节奏和方式学会了阅读。后来,她又被检测出有其他学习障碍,但这些并没有阻碍她。在非学校教育的最后两年,她上了社区大学的课程,然后转入一所有选拔性的私立文科学院的学士学位项目。她写道,「我入读了[省略学院名称],刚刚完成了大一。整个学年里,我的 GPA 保持在 3.9,并计划在秋季回到那里继续学习。
「我觉得非学校教育实际上让我比大多数同龄人更好地为大学做好了准备。因为我已经有丰富的自主学习经验,知道如何激励自己,管理时间,以及在没有大多数传统学生习惯的结构性指导下完成任务。当大多数同龄人都在挣扎,不能按时完成任务时,我却始终能掌控自己的学业,因为我一直是一个独立的学习者。我知道如何自己解决问题,以及何时需要寻求帮助。虽然一开始我确实遇到了一些适应问题,但那完全是因为我的学习障碍造成的。到了学年末,我克服了困难,表现出色。我目前正在[省略学院名称]攻读英语文学士学位,之后计划继续攻读图书信息科学硕士学位。」
24 岁,二年级后未接受小初高的学校教育或在家上学。这名男士比大多数其他人更需要克服一些困难,才能进入社区大学,作为进入一所有选拔性的州立大学本科项目的垫脚石。但他在学术上适应得非常好。他写道:「起初,我并不想上大学。2005 年从家庭教育/非学校教育毕业后,我在一个健身房卖了两年的会员卡。最终,我意识到需要上大学,于是就去了一所当地的社区大学。因为没有高中文凭,入学确实很困难。我必须去县教育局办公室,获取一份『在家上学完成证明』,以证明我确实完成了 12 年级的学业。历经一堆繁文缛节后,他们接受了这份证明。由于我从未参加过 SAT、ACT 或其他标准化大学入学测试,所以在选课之前,我必须进行一个分班测试。这一切解决后,我就成了一个普通的学生。
「我继续从[省略学院名称]毕业,获得了副学士学位和 4.00 的 GPA。然后,我进入[省略大学名称],也以 4.00 的 GPA 获得了学士学位。最近,我刚刚在[省略大学名称]完成了硕士学位。」
24 岁,二年级后未接受小初高的学校教育或在家上学。这名女士从一所大型州立大学获得了文学士学位,她写道:「从非学校教育转入『学校』确实需要一个适应期,但你也有一个巨大的优势:那就是还没有对学校感到厌倦和反感。学习仍然是你期待的事情。」她接着说,她几乎全都是 A 的成绩,然后获得了法学院的全额奖学金,并补充说:「我并不是在吹嘘,而是想证明非学校教育是行之有效的。在我们整个非学校教育期间,我们受到了朋友、亲戚和陌生人的诸多非议。所以现在,我很高兴有这些资历来证明,非学校教育不仅是一种合法的教育方式,而且在我看来,是更受推崇的教育方式。」
26 岁,二年级后未接受小初高的学校教育或在家上学。这名女士毕业于一所选拔严格的文科学院,成绩优异。她写道:「我转变的过程对我来说是困难的,不是因为学术问题,而是因为感觉自己被体制困住了。大学这个小圈子让我感到压抑,我总是处在一种崩溃边缘的状态,十分挫败,即使是被告知应该选哪些课,什么时候选,都让我很不舒服。作为一个多年来一直自己做决定的人,我觉得别人假设我不知道自己准备好接受哪个层次的学习,是对我一种不尊重。花了我大部分的第一学年时间,我才逐渐接受这一点,也记得这也是我自己的选择,随时都可以改变。我从来没有像很多人那样热爱大学,也从未觉得像在大学之前或毕业后那样自由。」她后来进入了一个与医学相关的研究生学校,并报告说,因为临床工作的真切实在,这是一个更好的经历。
35 岁,四年级后未接受小初高的学校教育或在家上学。这名女士获得了一所高度选拔的文科学院的学位,她写道:「我申请了八所大学,并在 1995 年全部被录取……我参加了所有八所大学的面试;对大多数学校来说,我是他们的第一个『在家上学/非学校教育』申请人。几所大学在面试结束后立即告诉我,我被录取了,就在他们告诉我我『出奇地』能说会道、很聪明之后。我确实参加了 SAT 和 ACT,并且表现得非常好,这可能弥补了没有成绩单的不足。」
「过渡相对容易,尽管我有点想家。我觉得大学很像非学校教育——你选自己感兴趣的课,大部分工作都是自己完成的,负责按时完成和提交。你真的要对自己的教育负责!」
「我从[省略学院名称]获得了计算机科学和数学的双学士学位。这证明了一点:我从来没有接受过五年级以后的正式数学培训,但最终却成了微积分 1、2 和 3 的助教。大学三年级之前,我从来没有拥有过自己的电脑,但主修了计算机科学,在那里我编写了大量的计算机程序,并且编程了我自己的机器人。」此人后来获得了护理学学士和硕士学位,成了一名护士执业者,调查时正在考虑返回学校攻读博士学位。
32 岁,七年级后未接受中学的学校教育或在家上学;之前则是学校教育和在家上学的混合。这名女士在填写调查时,已经从一所常春藤大学获得了学士学位,是一名正在家庭自主教育自己孩子的母亲,也是一名瑜伽教练和正在接受瑜伽治疗培训的学生。关于大学录取和对大学的适应,她写道:「当我 15 岁的时候,我想上社区大学课程。当时,在家上学学生的双重入学并不普遍,所以我被告知需要获得 GED 证书才能被允许入学。尽管我认为这让我的父母感到失望,但拥有这张证明我完成了某种高中教育的文凭还是有所帮助的。话虽如此,我现在拒绝参加标准化考试(因为我认为它们不能衡量智力或者学生究竟学到了什么),所以我在试图转入四年制大学之前,已经完成了我的副学士学位(有些学校会接受两年制学位来代替 SAT/ACT 成绩)。我于 2003 年 从[常春藤联盟大学]以心理学学士学位毕业。我认为家庭自主教育帮助我适应了大学;我已经习惯于随心所欲地学习,所以选一些自己感兴趣的课程似乎很自然。家庭自主教育也奉行一个前提,那就是如果孩子有目标,他们会学习任何为了实现它而需要的东西。比如说,我不喜欢数学,但我知道为了毕业我需要学习它。所以,我就是这么做的。」
---------------
正如我在关于这项研究的第一篇文章中所指出的,我们在解读这份调查结果时必须持谨慎态度。由于我们无法强迫人们参与这项研究,因此这里的样本是一群选择参与的成年自主学习者。他们很可能是最满意自己经验、最渴望分享的那一部分人。然而,至少我们可以得出这样的结论:上大学对自主学习者来说是绝对可行的选项。那些想上大学,并采取必要步骤以进入大学的人,进入大学或在大学里表现优秀并无特别困难。更进一步说,这个相对多样化的样本中响应的相似性,暗示着某种共通的经验基础。那些后来上了大学的成年自主学习者,都有自己明确的原因,不想在大学里浪费时间,相较于他们在学校接受教育的同学,他们似乎更努力,取得更多成就,并普遍觉得由于之前能够掌控自己的生活和学习,而感到有优势。
--------------
关于我们调查的这一方面,你有什么看法或问题?你有哪些愿意分享的自主学习经验或大学经验,无论是正面还是负面的?这个博客是一个讨论平台,无论是我还是其他读者,都非常重视你的观点和见解。我一贯更倾向于你在这里发表你的评论和问题,而不是私下通过邮件和我交流。因为在这里发表,你不仅是在和我分享,也在和其他读者分享。我会阅读所有评论,并尽力回答所有严肃的问题,如果我能说些有用的话。当然,如果你有些话真的只适合你和我之间交流,那就给我发电子邮件。
----------------
关于教育自决的人类本性,请参见《自由学习》。
对成年后的非学校教育者的调查 III:职业生涯
原文:Survey of Grown Unschoolers III: Pursuing Careers | Psychology Today
选择不接受小初高学校教育的人,将来会从事什么样的职业?
发布于 2014 年 6 月 21 日
我和同事 Gina Riley 近期进行了一项针对成年后的非学校教育者的调查,这是四篇文章系列中的第三篇。本文探讨了这些完全或部分跳过小初高、自主学习的人的职业选择。简而言之,我们发现他们中的大多数人最终选择了与童年玩耍时发展出的兴趣和激情相关的职业;他们中的大多数人选择了对自己来说更有意义、更令人激动且快乐的职业,而不是那些可能更赚钱的职业;有很高比例的人选择了创意艺术领域的职业;相当一部分人(包括一半的男性)选择了 STEM(科学、技术、工程和数学)领域的职业。绝大多数人选择了自己当老板的职业道路。
在继续阅读之前,如果你还没读过的话,我建议你回顾一下这个系列的第一篇文章。它介绍了我们研究中对非学校教育的定义,描述了我们的调查方法和分析手段,提供了 75 位符合条件且参与调查的成年非学校教育者的年龄和性别分布,根据非学校教育的时间长短将他们分类,并展示了一些按这些分类的统计发现。
你可能也想回头看看这个系列的第二篇文章,它主要讲的是 33 名选择攻读本科及以上学位调查对象的大学生活。这篇文章描述了他们是如何在没有普通高中文凭或成绩单的情况下进入大学,以及他们在学术和社交方面如何适应大学生活。
现在,在这个系列的第三篇文章里,我将更详细地介绍这些青年人(年龄中位数为 24 岁)选择的职业道路。这些信息主要来自调查问卷的第四个问题:「你现在是否有工作?如果是,你是做什么工作的?你目前的工作是否与你小时候/青少年时作为非学校教育者的兴趣/活动相符?如果相符,请具体说明。」我们还进行了一次简短的后续调查,询问他们所做的带薪工作是否能自给自足,以及他们目前的职业抱负。正如第一篇文章中提到的,尽管这项调查是在经济困难时期进行的,但绝大多数参与者都有工作且能够自食其力。现在,我要谈谈他们选择的工作职业类型的一般性结论。
他们选择的职业,正是他们童年兴趣的延续。
根据我们的分类,58 名(占 77%)参与者明确表示,他们童年的兴趣和活动与现在的职业事业息息相关。这一比例在始终未接受学校教育的 24 名参与者中最高(21/24 = 88%),但在其他两组中也相当高(详情见本系列第一篇文章的表格)。样本中包括那些从小就涉足艺术或音乐的专业艺术家和音乐家;那些在童年游戏中就开始培养技能的计算机技术员和程序员;还有户外爱好者,他们找到了拥抱他们所热爱的自然的谋生方式。
以下是我个人最喜欢的三个例子——我喜欢它们是因为这些都是学校课程所忽略的职业类型,也是那些不在学校却有时间和自由去追逐梦想的勇敢青年可能会从事的职业。
• 成为马戏团演员,创办一家马戏团,然后成为一名大帆船的水手长。我们的一位参与者,一位始终选择非学校教育的 26 岁女性,这样写道:
「三岁那年,我就梦想成为马戏团演员。五岁时,我参加了课外马戏课程。一直到 17 岁,我都在不断训练,表演马戏。从 19 岁到 24 岁,我和我最好的朋友共同经营我们自己的现代马戏团。在此过程中,我克服了强烈的恐高症,成为了高空秋千表演者,并学到了许多关于索具的知识,以确保自己在空中的安全。」
「随着马戏生涯的结束,我尝试了许多新事物,最终全心投入到大帆船航海中。在海上工作的体验非常迷人,几乎每天都能运用到我在马戏团学到的技能,比如平衡感、手眼协调能力,甚至还有如何在狭小空间里与人和谐相处。」
「我目前是一名大帆船的索具工/水手长。……水手长的工作在不同船只上有所不同,但在训练船上,我的任务包括船只的维护、培训和航行操作。我负责检查、保养、修理船上的索具、帆、甲板和船体。此外,我还要参与驾驶船只,海上长时间轮班领航,向公众普及船只的历史知识,对实习生进行帆船操控和船只维护的教育。」
「我希望能够驾驶大型帆船环游世界。我正在攻读美国海岸警卫队的 100 吨级船长执照,这会让我有资格指挥 100 总吨及以下的船只。美国海岸警卫队颁发的执照根据船只的大小和运行区域来分类,所以这是我迈向更大型船只执照的第一步。」
• 荒野航空摄影师。这位 21 岁的年轻人,在读完一年级后就离开了学校,他开始了一项生意,专门从空中拍摄野外景观的艺术照片。他这样写道:「在自由自在的成长环境中长大真是太棒了!我参与了许多户外活动,包括冬天滑雪、夏天远足和露营。如果不是这样成长,我不确定能否把我真正热爱的三件事——户外活动、飞行和摄影——融合到一起开展事业。」他还提到,15 岁那年他就开始了自己的摄影生意,同年还开始了滑翔伞运动。对滑翔伞的兴趣引发了他对固定翼飞机飞行的关注,最终他将这三个爱好结合起来,创立了自己的事业。
• 著名电影导演、制片人和编剧的助理(从 18 岁开始)。一位 20 岁的年轻男士,除了上过幼儿园和九年级(仅为尝试一年,成绩优异后便离开了)外,他一直在进行非学校教育。他对电影的热爱从小就开始了。11 岁时,他就和朋友们一起在 YouTube 上制作视频。16 岁开始在社区学院学习大众传播,18 岁时正在申请电影学院,恰好有机会在家乡参与一部大型电影的制作,担任制作助理。他的表现得到上司的认可,他们告诉他:「如果你能来洛杉矶,我们会让你继续参与这部电影。」结果,他与那位著名导演建立了密切联系。在接受调查时,他正在洛杉矶,参与另一部重大电影制作的更高级别工作。在回答是否能财务独立的问题时,他答道:「非常可以。」他的最终目标是自己导演电影,他正在努力实现这一目标。
• 「自雇的博学者。」许多参与者表现出了随兴趣变化而改变职业生涯的准备,乃至渴望,就像儿童在生活中所表现的那种随心所欲。其中一个极端例子是我们调查中年龄较大的一位参与者,当时 39 岁。他经历了混合学校教育和非学校教育直到十年级,然后彻底离开高中。之后,他获得了机械工程学士学位,并过上了他所称的「自雇的博学者」生活。他写道:「作为一名博学者,我现在所做的与我一直以来的所作所为大体相同(我大多数时候无视了传统学校教育,即使我被迫去上学);我做任何引起我注意的事情。生活就是关于学习、成长,并与那些也想学习和成长的人分享你的发现。」
他多年来担任过的职务包括但不限于:一家医疗制造公司的研发顾问;临床催眠治疗师;神经语言程序学的高级从业者;社区学院辅导服务主任;野外生存、急救和丛林技巧专家;PADI 潜水教练;武术教练(功夫、柔道和截拳道);以及两本童书的作者(目前正在撰写一个睡前故事新系列)。
他们更看重有趣且有意义的职业,而不是那些可能更挣钱的工作。
这个概括跟之前提到的「职业是童年兴趣的延续」有很大的交集。非学校教育的孩子们通过玩耍、探索和观察真实世界来找寻自己的热情。长大后,他们会将这些热情转化为职业追求,或者发掘新的兴趣。有些人表示,他们成年后的生活跟当初的非学校教育生活没太大区别,依旧是在玩耍、探索和学习。面对我们关于经济独立的问题,许多人回答说,他们只有节俭地生活才能自给自足,但他们宁愿过简朴的生活也不愿在自己不感兴趣的工作上赚更多的钱。
以上四个案例就很好地体现了这个概括。接下来是另外三个例子,这些职业反映的不仅仅是童年时的具体活动,更是一种从童年开始萌芽的理想或社会责任。
• 绿色和平组织的活动家和社区组织者。这位女士当时 28 岁,是我们调查中受教育程度较高的参与者之一。她在公立学校读到 13 岁,之后便拒绝再上学,因而开始非学校教育。小时候,她沉浸在艺术中,同时对「革命和野生动植物」也兴趣浓厚。我怀疑,她拒绝上学本身就是她革命精神的表现。后来,凭借自己作品集获得的一笔可观奖学金,她进入了艺术学院,并在那里教授艺术多年。不过,她后来改变了职业道路,投身于另一个热衷的领域,成为了一名全职的绿色和平组织活动家、筹款人和管理者。当被问及如何维持生计时,她回答说:「是的,我有一份适度的薪水。我选择这份工作并非因为其薪酬最高。对我来说,更重要的是投身于能够造福社区的事业。」
• 一家环保且承担社会责任的建筑公司的创始人。这位女士在接受我们调查时 30 岁,从未正式上过学,一直到 13-14 岁都是在家上学,随后开始了完全的非学校教育。她写道:「我是这家建筑公司的创始人兼员工。公司的经营理念,正是我少年时期在非学校教育中培养的种种兴趣和活动的直接反映——例如,在工作场所推广民主、环境保护、建筑施工、以及项目管理和协调。」
「我还是一家小型非营利组织的主席。这个组织致力于通过制定技术指南,支持建筑行业使用替代材料。我负责我们的技术指南项目,并与我们在全球的多元化支持团队进行协调。我对法规和政策制定的兴趣,以及推广使用环保替代材料的承诺,都与我年轻时接受非学校教育阶段所追求的兴趣和项目紧密相关。」
「我在过去三年里完成了一系列实习……期间,我学习了可持续发展农业、自然建筑、社区建设和冲突解决……」
「非学校教育的主要优势在于,它帮助我清晰地了解自己,使我能够打造出对我而言有意义的成年生活。我从未觉得自己停止过非学校教育——我仍然像年轻时一样,不断地学习。15 岁时,我研究显微镜和核粒子;而现在,我研究非营利组织的章程和建筑规范,或者是为马拉松做训练。我今年 30 岁,已经有 20 年时间在练习如何经营我的生活,激发自己实现目标的动力,创造性地思考解决问题的方法,以及寻找自己感兴趣的事物。我发现,与那些『受学校教育』的同龄人相比,自己始终处于有利的位置……」
• 专注于非机动交通设计的城市规划师。此人 30 岁,从幼儿园到高中一直接受非学校教育,自认为是性别酷儿(gender queer),不愿被界定为男性或女性。在完成了本科学位课程后,此人从事了多份反映其兴趣的工作,包括规划、管理和城市发展等领域。这些工作包括:在一个小城市担任助理城市规划师、在一所常春藤联盟大学的公共卫生部门担任行政助理;为一个自行车交通项目担任研究助理(研究生时期);在一家低收入住房非营利组织担任项目协调员;以及在一座大城市的交通局担任研究。这位人士写道:
「我打算在自行车步行交通规划,或人因工程(human factors engineering)方面开创职业生涯。……我的兴趣往往是心血来潮,强烈而短暂。这一点,我在 16 岁左右就察觉到了。那时,我开始寻找那些能让我几个月换一次项目的职业道路。17 岁时,我接触到了城市设计,这个领域在过去十年里,成了我众多短暂兴趣的纽带。城市设计这个主题,和我青少年时喜爱的一些事情息息相关,像是舞台布景设计、模型制作、纺织设计和生态学。但直到我从我长大的农村地区搬到大城市后,我才真正明白我对设计感兴趣的本质。自那以后,我的路虽然曲折,但总体上是直线前进的。我在社区学院学习过建筑预科和制图,在大学深入学习建筑和城市设计,还在本科时写了一篇关于越南和匈牙利后社会主义城市规划政策的论文。我还在一个镇级规划办公室工作过,直到我开始研究生学习,我才对我现在专注的领域——非机动交通和旅游质性研究(qualitative research )——产生了浓厚的兴趣……」
有很高比例的人选择了创意艺术领域的职业。
正如我在第一篇文章中提到的,根据我们的分类,75 名调查参与者中有 36 人(占 48%)正在从事我们归类为创意艺术的职业。这一类别包括了美术、手工艺、摄影、电影、戏剧和写作。值得注意的是,在始终接受非学校教育的 24 名参与者中,有 19人(占 79%)正在从事这类职业。始终接受非学校教育的参与者更倾向于选择创意艺术领域职业,与其他参与者相比,这一观察结果在统计学上非常显著(用卡方检验得出的 p 值小于 0.001——回顾本系列第一篇文章中的表格)。对于始终接受非学校教育的群体中创意艺术家集中度较高的原因,我可以进行一些推测,但说实话,你的猜测和我的一样准。下面,作为示例,是三位从事此类职业的参与者的例子。
• 一家大型剧院公司的制作经理。这位 29 岁的女士,她从小学到高中都是非学校教育,后来取得了戏剧艺术学士学位。她写道:「我是一名职业艺术家,也是[纽约一家主要剧院公司]的制作经理。我觉得我成长的方式直接影响了我现在的工作。孩提时代学到的东西——追求新思维、新兴趣、新知识,用创造性的方式解决问题,积极参与社区等——都极大地帮助了我。实际上,这些正是我至今仍在做的事情,只不过现在是在成年人的生活环境中。组织策划、灯光设计、舞蹈、制作,这些正是我小时候和青少年时期一直在做的事情。」
谈到经济独立,她写道:「在纽约生活确实不容易,但自 2008 年大学毕业以来,我一直经济独立。我找工作从未遇到困难。我偏爱实验性表演,并与众多艺术家合作。虽然我的收费不高,但我愿意投入到那些我认为有趣且值得信赖的项目中。」
• 纺织艺术家/手艺人兼企业家。这位 21 岁的女士,从小学到高中都是非学校教育,没有接受过高等教育。她写道:「我是一名自雇的艺术家/手艺人,我在网上和本地销售产品。我现在做的正是我小时候感兴趣的事!我一直在制作东西,我热爱我的工作。」在回答关于经济独立的问题时,她写道:「是的,我在 19 岁时实现了经济独立,一直保持到现在(现在 21 岁)。对我来说,谋取更好的生活很重要,看到我的收入每年都在稳步增长,我感到非常自豪。作为一个接受非学校教育的成年人,我感到事业成功的压力,因为人们怀疑我能否做到,同时我也想向我的弟弟妹妹展现我们这样的生活是怎样的。」
• 自雇的钢琴和小提琴教师,有志于成为演奏家。这位 28 岁的女士,10 岁前在家上学,之后便开始非学校教育。在回答调查时,她有两份工作。一份是她维持了大约十年的自雇网页设计师。另一份,对她来说更重要的工作,是自雇的钢琴和小提琴教师,她已经做了大约七年。关于后者,她写道:「这是我的职业道路,我完全是自己打造的……我目前有 31 名学生。我教授一对一的私人课程,包括曲目/歌曲、理论、听力训练、音乐史、作曲、技巧、表演,并分享我对音乐的热情。我热爱我的工作!」
在回答关于经济独立的问题时,她写道:「是的。我经营着自己的生意,收入足以让我在[某市]这样昂贵的地区过上舒适的生活。『赚取足够的生活费』对我来说非常重要。但我理解『赚取足够的生活费』的方式是:自己负担生活费用,有能力购买对我重要的东西。最重要的是,要以一种让我感到快乐的方式来做到这一点。」
在总结回答我们的职业问题时,她写道:「我热爱我目前作为音乐教师的职业,但我也有志于作为乐队成员的第二职业道路。我在这支乐队中弹贝斯并担任主唱,下周我们将进入录音室录制一张全长专辑,这张专辑的制作费用是通过 Kickstarter 活动筹集的。……我们正朝着这张唱片的目标努力,计划在 2014 年进行巡演,并正在考虑一家唱片公司的合作提议。」
有很高比例的人是创业者。
正如我在这一系列的第一篇文章中提到的,如果参与者创立了自己的企业,并且以此为生或正朝这个目标努力,我们就将其归为创业者。这一类别与创意艺术领域有很大的重叠,因为许多人的生意就是出售自己的创意艺术品或服务。总的来说,根据我们的分类,有 40 名参与者(占 53%)是创业者。在始终非学校教育的群体中,这一比例最高,达到 63%,但在不同群体间的差异并未达到统计学上的显著性。上文提到的一些案例也是创业的例子。
研究工作满意度的社会学家发现,对人们来说最令人满意的工作和职业,通常是那些有很大工作自主性的。我们的研究清楚地表明,回答我们调查的非学校教育者选择的职业,在这方面非常突出。他们大多数是为自己工作,或者在能够自己作主的工作环境中。这并不令人意外:选择放弃自上而下的学校教育(在那里只能当下属,做别人指派的工作)的人,通常在职业中也会选择放弃这种模式。
有很高比例的人,尤其是男性,选择了 STEM 领域的职业。
起初,我们并没有考虑按职业进行分类,看看有多少人从事 STEM(科学、技术、工程和数学)领域的工作。但在第一篇文章的评论中有人提出这个问题后,我们决定这样做。我们采用了美国国家科学基金会发布的 STEM 定义,这个定义比一些其他定义更为广泛,不仅包括自然科学、技术、工程和数学,还包括社会科学。但是,我们只将那些在该领域进行研究和/或使用社会科学的技术进行应用工作的社会科学家纳入统计。就像我们在其他分析中所做的那样,Gina 和我首先独立分类,然后交换意见,通过讨论解决分歧。
总的来看,根据我们的分类,75 名参与者中有 22 人(占 29%)从事 STEM 职业。我们根据性别进行了细分(排除了不愿意按性别分类的参与者),发现在样本中,58 名女性中有 13 人(占 22%),16 名男性中有 8 人(占 50%)从事 STEM 职业。尽管样本中男性的数量相对较少,但这种比例上的差异在统计学上是显著的(卡方检验的 p 值为 0.030)。显然,与一般人群中的情况一样,男性选择这类职业的比例高于女性,这一趋势在非学校教育者中也存在。
我们样本中的 STEM 人员大多从事工程或计算机技术领域,但也包括了一位考古学家、野生生物学家、数学和科学教师、情报分析员,以及四名从事医疗技术各个方面的专业人士。
在接下来的最后一篇关于我们调查的文章中,我将探讨成年非学校教育者对他们的自学经历的整体评价。他们喜欢和不喜欢非学校教育的哪些方面?他们的社交生活是怎样的?他们会让自己的孩子进行非学校教育吗?有没有人后悔选择非学校教育?如果有,他们的遗憾是什么?
--------------
关于我们调查的这一方面,你有什么看法或问题?你有什么自学经历或相关的职业经历——无论是积极的还是消极的——愿意分享吗?这个博客是一个讨论平台,无论是我还是其他读者,都非常重视你的观点和见解。我一贯更倾向于你在这里发表你的评论和问题,而不是私下通过邮件和我交流。因为在这里发表,你不仅是在和我分享,也在和其他读者分享。我会阅读所有评论,并尽力回答所有严肃的问题,如果我能说些有用的话。当然,如果你有些话真的只适合你和我之间交流,那就给我发电子邮件。
----------------
想了解更多关于自主教育的人类本性,请参考《自由学习》一书。
非学校教育的益处:一项大规模调查的报告(上)
原文:The Benefits of Unschooling: Report I From a Large Survey | Psychology Today
对于非学校教育者而言,不上学带来了哪些益处?
发表于 2012 年 2 月 28 日 | 审稿人:Ekua Hagan
2011 年 9 月,也就是五个月前,我发表了一篇文章(点击这里查看),介绍了非学校教育运动,并邀请非学校教育家庭参加我们组织的问卷调查。这份问卷——在 Pat Farenga 的 Learning Without School 网站和 Jan Hunt 的 Natural Child Project 项目网站上进行投放——目的是了解非学校教育家庭的一些基本信息,比如孩子的年龄和性别,父母的工作情况,每个孩子接受传统学校教育、在家上学以及非学校教育的经历等。同时,我们还请受访者描述他们在家如何进行非学校教育,是什么让他们选择走上非学校教育这条道路,以及在他们眼中,非学校教育对他们家庭中造成的最大挑战,以及带来的最大益处是什么。我与同事 Gina Riley(亨特学院特殊教育部的兼职教授)共同分析这些数据,并准备在一个教育期刊上发表报告。
在这个博客的一系列报告中,我打算以更为随性的方式来分享调查结果。在这篇开篇报告中,我会首先向大家呈现一些关于参与调查的家庭的基本情况,然后我们会深入到他们对非学校教育的理解,和他们认为非学校教育带来的益处上。在接下来的报告中,我会专注于他们选择非学校教育的经历,以及非学校教育带来的最大挑战。我在这里可以做一件更正式的学术论文中做不了的事,就是引用大量问卷中的原话。许多回答者都很擅长写作,他们用文字淋漓尽致地展现了对非学校教育的热情。
谁参与了这次调查?
总共有 254 个家庭参与了这次的调查。然而,对于其中 23 个家庭来说,最年长的孩子还没有到我们设定的入学年龄(我们设为 5 岁),因此我们决定不将这些家庭纳入主要分析的范围。这样,我们的样本就变成了 231 个非学校教育家庭。其中,186 个家庭来自美国,19 个家庭来自加拿大,其余 26 个家庭来自其他各国,主要是欧洲国家。来自美国的调查参与者分布在 34 个不同的州,加利福尼亚的最多(23 个),其次是纽约(14 个)和俄勒冈(10 个)。
在这 231 个家庭中,48 个家庭只有一个孩子,104 个家庭有两个孩子,51 个家庭有三个孩子,其余的家庭有四个或者更多孩子。在大部分家庭中(220 个),填写调查问卷的是妈妈;在九个家庭中,填写问卷的是爸爸;在两个家庭中,填写问卷的是一个已经成年的非学校教育的孩子。从我们收到的问卷来看,大部分(209 个)家庭都是双亲家庭,父母(或者一个亲生父母和一个继父母)都住在家里。有 21 个家庭是单亲妈妈填写的,还有一个家庭是单亲爸爸填写的。
关于职业,大约一半妈妈自认为是全职家庭主妇(往往有兼职工作),其余的职业类型比较均衡,有的从事专业工作,有的自主创业,还有一部分是其他类型的工作。大部分爸爸都是全职工作,他们的职业类型也分布相对均匀,有专业工作者、自主创业者和其他工作。
应该强调的是,本次调查并不是从所有非学校教育者随机采样的。相反,这些回答者都是通过某种方式找到这个调查表,并花时间填写调查,并通过电子邮件发送给我的。可以预料的是,这些人是最热衷于非学校教育的一群人,他们最愿意分享他们的经历。我在这里所做的一般性观点,只针对这个回答者群体,不一定适用于所有非学校教育者。
调查参与者如何定义非学校教育?
在我早些时候发布的关于这项调查的文章中,我将「非学校教育」定义为简单的「不去学校」。我进一步解释说:「非学校教育的家庭不会送孩子去学校,也不会在家里模仿学校的教学方式。更具体来说,他们不为孩子设定课程方案,不要求孩子完成特定的作业,也不会通过考试来评估孩子的学习进度。反之,他们给予孩子自由,让他们追求自己的兴趣,用自己的方式学习实现兴趣所需的知识。同时,他们还以各种方式为孩子的学习提供环境背景和支持。生活和学习并非发生在真空中,它们都存在于特定的文化环境中,非学校教育的父母们帮助孩子接触和理解这样的环境。」
在调查中,我们设置了一个问题:「请简述一下你们家如何理解非学校教育。作为父母,你们承担着教育孩子的哪些责任?[我现在只想了解一些大概的情况。我可能会在后续的调查中询问更多细节。]」
所有的回答者都在强调:孩子应当掌握自己的教育权,教育与生活密不可分。尽管如此,他们对父母角色的描述方式却各不相同。我们将这些回答有些随意地分成了三类——简单地称它们为类别 1、2、3——这主要看他们如何描述父母在引导或激发孩子学习上的主动参与程度。我需要特别强调,这些类别和父母在孩子生活中的参与程度无关,仅仅和他们在孩子教育中的主动参与程度有关。[参见尾注 1]
根据我们的分类,有 100 个回答(占 43%)被归入了第一类。这些回答最大程度地强调了孩子的角色,并没有提及父母会专门为了孩子的教育进行哪些活动,除了对孩子的需求和指引作出响应。比如,一位回答者这样写道:「对我们来说,非学校教育就等于在学习和生活中享有自由。我们摒弃了对学校的既定观念和规定,相信孩子能自主地走好自己的教育路。他们想体验的一切都有它的价值。我们相信他们。」另一位则写道:「对我们来说,非学校教育就是没有课程、没有计划、没有时间表,也没有设定目标。完全由孩子决定他们想学什么、怎么学,以及什么时候学。」
根据我们的分类,有 96 个回答(占 42%)可归入第二类。这些回答跟第一类回答的差别在于回答中出现了父母刻意引导或激励孩子的教育。举个例子,有一个第二类回答是:「对我们来说,非学校教育是为孩子创造资源丰富的环境,让他们能够自然学习,充分发展热爱。我们希望我们的生活中充满联系——彼此之间的联系、我们的兴趣和热情的联系,以及我们快乐生活的联系...作为家长,我是孩子的伙伴和引导者,我的经验更丰富,能帮他们获得一些材料,接触一些人,这是他们难以获得的。我会找一些我觉得他们会感兴趣的事情,地点,人物,并向他们介绍,但我并不会强迫他们,而如果他们不感兴趣,我也不会感到被拒绝或沮丧...」
最后,有 35 个回答(占 15%)被归入第三类。在某种程度上,这些回答可能被看做是介于非学校教育和所谓的「轻松在家上学」的中间体。这些父母似乎为孩子规划了一些比较具体的教育目标,并且有意识地为实现这些目标付出努力。比如,一位属于这类的回答者写道:「我们认为,大部分时候,我们应该鼓励女儿探索她感兴趣的主题,作为父母,我们有责任为她提供学习的机会...我通常会要求她每天都去学习新的东西,或者去做新的事情,或者是有教育意义的事情(我也会解释给她听,为什么每天都学习新东西是一件多酷的事情!)。」
对于这些家庭来说,非学校教育的益处是什么?
最后一个问题是关于益处的:「对于你们家来说,非学校教育的最大益处是什么?」。对于这个问题的回答是最长而且最通畅的。最常提到的益处主要有以下几类:
-
**对孩子有学习的益处。**大约有 132 个受访者(占总数的 57%)提到了这个方面的益处。他们说,相比在学校或在家上学环境,在非学校教育环境中,他们的孩子学得更多,更高效,更主动,学习的材料更有意义。很多人说,由于他们的孩子可以对自己的学习做主,他们的好奇心和积极性没有受到损害。
-
**对孩子有情感和社交的益处。**大约有 116 个受访者(占总数的 50%)提到了这个方面的益处。他们说,相比在学校或在家上学环境下,他们的孩子要更开心,压力更小,更有自信,更友好,更善于社交。很多人提到社交的益处;他们的孩子可以和社区里各个年龄段的人交流,而不仅仅是和他们同年龄的孩子,这是他们在学校是无法做到的。
-
**家庭亲密度。**大约有 131 个受访者(占总数的 57%)提到了这个方面的益处。他们写道,由于非学校教育,他们可以有更多的时间作为一家人聚在一起,一起做他们想做的事,没有因为作业或学校问题产生的矛盾,使得家庭关系更和谐。
-
**家庭从学校时间表中解放出来。**大约有 84 个受访者(占总数的 36%)提到了这个方面的益处。他们说,摆脱学校时间表的束缚让他们的孩子和全家人都可以按照自己的节奏来生活,可以进行其他情况下无法进行的旅行。有些人还提到,由于日程安排的自由,他们的孩子可以找到工作或参与社区项目,这在他们必须在白天上学的情况下是不可能的。
在文章剩余部分,我将从问卷回复中摘录 33 段话,来说明学校教育的益处。我无论如何转述,都没办法更好传达出这些非学校教育的观点和热情。考虑到很多读者可能不会把所有的引述都读完,我想在此(而非文章末尾)说一下,我欢迎你们的评论和问题。你有没有任何非学校教育的经验?你觉得非学校教育有可能适合你的家庭吗?如果你要对非学校教育的家庭做调查,你想问什么问题?这个博客是一个讨论平台,无论是我还是其他读者,都非常重视你的观点和见解。我一贯更倾向于你在这里发表你的评论和问题,而不是私下通过邮件和我交流。因为在这里发表,你不仅是在和我分享,也在和其他读者分享。我会阅读所有评论,并尽力回答所有严肃的问题。当然,如果你有些话真的只适合你和我之间交流,那就给我发电子邮件。现在,让我们继续读下去……
关于非学校教育益处的引言摘录
每一条引言都出自不同的调查问卷。
-
「唉呀,我能列出的益处能写上一大串呢!我们能有更多的共处时间,争吵少了,看着女儿沉醉在她主动追求的事情中,她得到了充足的睡眠,不再感染在学校里易得的病毒。我们可以一起探索博物馆和社区的其他资源,每天都可以作为一家人进行交谈,早晨不再匆忙,没有家庭作业,没有必须参加的学校活动,没有烦人的学校社交环境,午餐不必打包,每天不用填表和回信,没有筹款活动。看到我们的女儿对自己是谁以及她正在做的事感到满意,我们不再因为考试/分数/老师的意见而担忧,把原本用于学费或教材的钱花在她真正想学的东西上。但最大、最主要的益处,还是我们的家庭关系。现在我们真的有时间相互陪伴,比起以前,这真的有天壤之别!学校不仅仅让[我们的孩子]忙个不停,它更是让整个家庭感到压力重重。」
-
「我看到的孩子们充满了快乐,对学习充满了热爱,他们富有创造力,能够自我驱动,热情洋溢,充满活力,富有思考力,善于提问,富有好奇心。兄弟姐妹间的关系也非常和睦。我们全家的感情十分紧密,共度的时光也非常多。我们有能力去体验和探索这个世界。」
-
「哇塞,益处太多了…终生的好奇心,家庭的亲密,我的孩子们走进学术和职业生涯时的非凡成就,还有在这个不断地告诉我们『我们的价值只取决于我们的外貌或我们所拥有的物质财富』的世界里,坚持做自己带来的那种力量。每个周末,当我的大学生孩子回家,我的生物学家女儿下班回家的时候,我都能看到这一切。他们在晚餐后坐在餐桌旁,讨论他们自己的,也许有点小众,但却无比投入的兴趣,他们开怀大笑,充满亲昵。然后,他们虽然已经长大成人,但仍会合力去完成一个项目,这样的合作已经成为他们多年来的纽带。时间悠然,他们最终会在阳台上聚集,虽然依依不舍,却依旧在谈笑风生中制定着新的计划,享受着欢声笑语。我无法想象有什么能比这更丰富的财富了。」
-
「我们更喜欢把家庭放在生活中心,而不是过着一切以学校为中心的生活,这就是我们选择非学校教育的最大收获。家里的夜猫子可以任性晚起,早起的百灵鸟也可以尽情欢唱。我们不用被学校的作息时间牵着鼻子走,我们的孩子可以随时随地学习,不用被规定在每 50 分钟里只学一门课。我们非常庆幸,能在这样一个可以自由享受非学校教育的时代和环境里生活。」
-
「另一个大益处就是,我的孩子们对学习和生活充满了热情,这份热情从来没有被传统学校扼杀过。所以我们没有经历过其他父母那样,为了睡觉时间和作业而进行的那种权力争斗。因为理想中的亲子关系,应该不受权力影响。我可以真心说,我们避免了那些不愉快,我们愿意作为一家人待在一起,不是因为被迫,而是出于享受和相爱。还有什么能比这更好呢?」
-
「看孩子们自然地学习,按照自己的节奏,而不是强制他们。看他们因为没有被期待去迎合和跟从,而保有丰富的创造力和想象力。看他们投身于我都无法想象的主题,并产生深深的兴趣。」
-
「当我和那些孩子在校的朋友们待在一起时,我被他们的生活是如何围绕着学校转的所震惊。为了准时上学而让孩子早点睡,准备午餐,为了完成作业而早点回家,为了第二天的学习整理所有的物品。围绕着这些事情产生的争吵和压力实在是太让人头疼了。仅仅因为我们没有严格遵循日程表,也不用时刻催促大家跟上,整个人生都大不一样了!」
-
「孩子们能深度钻研他们热衷的话题,把自己的时间都投入到感兴趣的事物上……他们有机会参与到生活中,学会实实在在的生活技巧,和各年龄层次的人交往。他们不用浪费时间在无尽的复习、枯燥的作业上,或是被迫做超出或低于他们实力的事情,或者被那些他们不熟悉的成年人牵着鼻子走。他们能按照自己的想法去做事,了解自己,去塑造真正的自我。」
-
「整个世界,以及世界上所有美好的机遇,都是我的孩子们的乐园。我和我丈夫深信,如果我们的孩子们现在就拥有探索和追求自己兴趣的自由和机会,当他们长大需要工作的时候,他们就更有可能确切地知道他们想做什么,他们会觉得自己的职业和成年生活都充满意义和乐趣。」
-
「看着我们的女儿放松自我,享受生活,这让我们无比欣慰,尤其是在经历了过去几年繁重的学校生活之后。从学校及其束缚中解脱出来,自由地生活,这对我们所有人来说,都是一种解放。」
-
「看着我家孩子如鱼得水般地学习。我见证了我的五岁女儿自己教自己读书写字。这真是太神奇了,就像她是一位电码译员一样。」
-
「最大的收获就是看到我们的女儿们的创造力如泉涌般涌出,她们面对问题时能独立思考,她们的聪明才智,以及她们对于询问问题、了解世界的真诚热望。此外,看着她们认识到犯错误是成长和学习的重要一步,这使她们看待错误的态度更加积极,更愿意尝试新的事物,这一点也很重要。」
-
「信任!这条非学校教育的道路让我学会了信任自己的直觉,同时也信任我的孩子们能分辨出什么对他们最好。没有任何人的生活是完美无瑕的,但错误就像一面镜子,让我们看清我们如何走错,并指引我们如何根据现有的知识来做决定。」
-
「益处多得数不过来:最重要的是,学习变得像呼吸一样自然而必要,而不是只在某时某地完成的活动。此外,我们还可以享受充足的陪伴时间,深入了解彼此。我们可以随时出行,这在女儿们开始参加击剑比赛时尤其有用——我们无需担心因为上学放学的问题)。女儿们自己掌控着学习的过程,即使偶尔会有疑虑,但到成年时,她们都已经知道如何去探索她们感兴趣的事情,因为她们过去一直在这样做。女儿们始终保持着好奇心,并且可以尽情发挥。她们不受学校教科书的束缚,可以自由地阅读我们认为是『真正』的书籍。女儿们自己学会了如何合理安排和优化时间和精力去完成事情。我们不仅可以自由学习,而且还可以找出最适合我们的学习方式,这可能会随着时间的推移和学科的改变而改变。我们无需请求才能去洗手间,如果想要的话,我们可以一边吃东西一边阅读。」
-
「他依然保持着三四岁时的那份好奇心。他认为生活充满了趣味,他有信心去做他想做的任何事。」
-
「对我们的孩子和我来说,压力大大减轻了……我们可以按照我们自然的节奏去睡觉吃饭……孩子们可以按照他们自己的节奏去学习,以最适合他们的方式,学习他们选择的知识和技能,因此他们开始热爱学习!」
-
「自由![我的孩子们]能够自由地生活,独立地成长。他们有机会去发掘自我,找出自己的乐趣与兴趣所在;他们有时间去学习和尝试很多有趣事情,而这些事情是在学校上学的孩子没时间做的;他们免受了学校里的霸凌和老师的欺压;他们有一群在家自学的朋友,这些朋友都很友善,乐观积极,有趣且善于探究。」
-
「[我儿子]压力减轻了,他变得快乐,这是最大的收获。我意识到,一味地让他继续上学,只会抑制他的创造力和热情。他想工作赚钱,现在他有了自由去以有价值的方式参与到社会中,而不是整天都被困在教室里。」
-
「我把我的儿子救了回来。学校想给他贴上一些他并没有的『标签』……他其实就是个极富创造力而且极其敏感的孩子,他的存在就是无价之宝。他很擅长与人交往,无论走到哪都能交到朋友。他现在还和学校的朋友保持联系。非学校教育对我们来说是一种解脱,我儿子(跟我)的压力都减轻了很多,他可以追求自己的热情,发挥创意,自主思考。他现在的阅读能力比在学校时更好了。」
-
「一个例子是关于『控制』。我家小妹妹就是一个爱争权夺利的主,她总能把任何事变成一场对控制权的斗争。通过让她自己选择和负责自己的学习,我们的关系变得更融洽,她也更专注于学习,而不是争斗。我们已经有很多其他的事情去争论了,比如她是否会刷牙,是否会穿适合天气的衣服等。」
-
「我有时候觉得,我在回答的问题就像在问呼吸的益处一样。我们不需要去拘束、假设、评判、指导或者焦虑地评价。我们只需要享受与彼此相处的时光。我的儿子可以过一种专注于他当前所爱的事情的生活。」
-
「我喜欢看着我的孩子们成长、学习、提问。我喜欢没有必须抽出时间『上学』的烦恼,我也喜欢可以跳过课程选择和规划。我看着其他的在家自学的孩子,对他们的压力和担忧感到同情。(我的孩子学得够吗?我们选对了课程吗?在家自学到底要花多少钱?)我看到那些传统的在家自学的家庭,他们总是因为自己给自己制造的压力而感到筋疲力尽。他们是否明白,他们的孩子会自然而然地学会许多事情呢?」
-
「最大的收获就是我们和孩子们的关系变得更紧密。我们从未经历过那些所谓的『典型』青少年烦恼或者叛逆期。我觉得那些都不正常。如果你好好打造家庭氛围,让大家互帮互助,关注开了学习,那么大家和谐相处、享受彼此陪伴就是水到渠成的事情!学校在隐秘地挑起父母和孩子的矛盾,破坏亲子关系,而这种关系在学校本应茁壮成长。如果孩子们可以自由地享受生活、去探索和追求他们的兴趣,他们会更加快乐。如果人们是快乐的,他们会更好地相处,更愿意合作、相互激励、共同学习,从而变得更强大、更健康。所有这些都反映在我们的婚姻生活和整个家庭关系中,包括兄弟姐妹之间的关系。我深信,孩子们一定会有所收获,而且成效会非常惊人!不过我没有料到的是,我们和孩子的关系与那些把孩子送去学校的家庭相比,差别竟然这么大。」
-
「看着孩子们对学习的兴趣越来越浓厚而非越来越淡薄,看到他们不是在考试后就『丢弃』所学,而是在日常生活、玩耍中应用他们的知识,这种情景让人振奋。」
-
「我们每天都过得开心、充实,这就是最大的益处。我们的生活几乎没有压力,因为我们的所有选择都是我们认同的,我们这样过着我们想要的生活。我们与孩子关系非常亲密,这种关系的基础是爱,互相信任和尊重。作为一名教育者,我看到我的女儿拥有卓越的批判思考能力,我的很多成年大学学生都远不能及。我的女儿活在真实的世界中,学习在真实的世界中,她非常热爱这样的生活。有生如此,夫复何求?」
-
「看着我已经长大的孩子,我看得出他们的动力都很足。相比我差不多大的时候,他们更加活跃开朗,愿意交友。他们的生活是他们根据自己的兴趣和天赋打造的。这让我深感满足。而且,我们的联系非常深厚,这来自我们从他们童年开始就不断积累的共同经历。」
-
「我看见我儿子的兴趣爱好蓬勃发展。他们都很快乐,善于表达,充满自信,对自己的项目都引以为豪。他们对世界的了解,比他们在校的同龄人要广泛得多。他们的思维方式自由开放,不自我否定,不自我设限,这些是他们在校的同龄人常有的问题。他们的想象十分大胆。」
-
「我的女儿们充满创造力,富有艺术才华,相比那些对学校教育感到疲惫的同龄人,她们更喜欢大学生活。她们思维开放,有科学精神,同时也很有道德原则。」
-
「非学校教育挽救了我两个孩子的自尊,原因各异。[我的儿子]在学校被冠以『坏孩子』的标签,如果他继续在学校混日子,学校带给他的伤害会让他在上高中的时候就开始用酒精和毒品来逃避现实。当我们让他离开学校,他的自尊慢慢回来了,我们之前那种亲密、信任的关系也重建了。[我的女儿]被诊断为有学习障碍,有人告诉我她永远达不到同龄人的阅读水平,她总会需要特别的帮助。让她离开学校,让她按照自己的节奏学习,让她免于一生都觉得自己笨的困扰。」
-
「非学校教育并不是能够解决所有不快和困难的灵丹妙药,我们不能将其过度简化或浪漫化。我们的女儿们也有像所有青少年一样的问题和挣扎。她们非常聪明,受过良好的教育,但我想如果她们去上学也会是这样。我觉得最大的区别是,她们比我们在他们这个年纪的时候更了解自己。她们可能更接近他们真正想过的生活。这一直是我们的希望,如果这真的实现了,那这就无比值得了。」
-
「孩子们是最有发言权的人。作为父母,孩子的快乐就是我们所追求的一切。如今,他们也有了自己的孩子,并同样选择了非学校教育。他们每天都在面对着与他们自己童年时期截然不同的生活。」
-
「我看到的是和孩子们之间的和谐、快乐和信任,这些都超越了我对于父母和孩子关系的所有预期。我看到了女儿真实的自我:她的自信、她的好奇、她对生活的热爱,这些都是我觉得如果在学校里可能会被磨灭的特质。看着她专注于她热爱的事情,对我们所有的成年人都是一种启示,她是我见过最能专注于某件事的人。只要是她感兴趣的事情,她能够持续数小时去做——她所追求的东西从来都不是『艰难』或『努力』,所以我可能没能准确地表达出来。(我敢说如果她在学校,她可能会被误认为有 ADHD。)」
-
「我看到的是女儿的快乐,她的好奇心,她对探索的热爱,还有她的自由。我看到的是我们作为一个家庭的自由,我们之间的合作关系,以及我们之间始终如一的信任。」
尾注
在这篇文章的初稿中,我曾将回应者描述他们非学校教育实践的方式划分为「激进非学校教育」、「温和非学校教育」和「轻松在家上学」这三个类别。然而,有读者指出,这些标签——尤其是「激进非学校教育」——在非学校教育社区中的含义,与我们分类的含义有所不同。因此,我将这些标签更改为了更为简洁的 1 类、2 类和 3 类。——彼得 · 格雷
非学校教育的挑战:一项大规模调查的报告(下)
原文:The Challenges of Unschooling: Report III from the Survey | Psychology Today
非学校教育者面临的最大挑战:勇敢地面对社会规范。
发布于 2012 年 4 月 11 日 | 审稿人:Ekua Hagan
去年秋季,我和 Gina Riley 调查了 232 个孩子年龄在 5 岁以上的「非学校教育」家庭。本文是该调查的三份报告中的最后一篇。
在第一份报告中,我介绍了调查方法,提供了参与调查的家庭的一些基本信息,并概述了他们对非学校教育的定义及其带来的益处。
在第二份报告中,我探讨了这些家庭选择非学校教育的各种路线,包括他们之前在传统学校教育和在家上学的经历,对孩子自然学习方式的观察,以及那些论述过自然教育的作家的影响。现在,在这最后一份报告中,我将探讨调查家庭在非学校教育中所面临的挑战。
对于初次接触这个话题的读者,这里简单介绍一下。进行非学校教育的家庭,不会把孩子送去学校,在家里也不进行学校那样的教学活动。具体来说,他们不会给孩子定制课程,不要求孩子完成特定的学习任务,也不用考试来检测孩子的学习进度。他们让孩子自由探索自己的兴趣,用自己的方式学习知识、追求兴趣。同时,他们也会以多种方式为孩子的学习提供环境支持。关于非学校教育家庭如何实践这些理念,以及他们认为非学校教育对孩子和家庭的好处,如果你想了解更多,可以回去看看第一份报告。
这份报告基于我和 Gina Riley 对调查问卷第 7 题的定性分析。该题为:「对你的家庭而言,在非学校教育中最大的挑战或障碍是什么?」
在分析的第一步,我们将回答中提到的挑战分为几个明显不同的类别。其中提及最多的类别是「社会压力」。它包括来自亲戚、朋友、熟人甚至陌生人的负面评价和批评,以及非学校教育者感到需要反复向不理解或不支持的人解释他们的选择。共有 106 个家庭(占 232 个家庭的 46%)在回答第 7 题时提到了这类挑战。实际上,对于其中 57 个家庭而言,「社会压力」是他们唯一提到的挑战。
父母在克服自己根深蒂固的「学校式」教育观念上遇到的困难,是第二频繁提及的挑战,我们将其标记为「父母思维的去学校化」。这一类别包括父母在非学校教育理念与他们习惯性的思维和反应之间的冲突,而这些思维和反应方式可能会破坏非学校教育的理念。共有 95 个家庭(占 232 个家庭的 41%)在回答第 7 题时提到了这个挑战。在下文中,我将通过引用一些示例来更清楚地说明这一类别。许多受访者同时提到了这个类别和「社会压力」类别,有些父母提到了两者之间的联系。尽管采用非学校教育的父母清楚地看到这种教育对孩子大有裨益,但是他人的批评有时也会唤醒旧有的、符合社会规范的思维方式,让他们以为已经克服的恐惧重新浮现。这些恐惧可能导致父母开始试图控制孩子的学习过程,如果不加以制止,就会破坏非学校教育的实践。
这两个频频提及的挑战类别都与社会规范的力量有关。我们是社会动物,很难做出有悖于他人眼中常态的行为。在文化发展的历史长河中,一些有害的习俗或仪式之所以能持续数百年,部分是因为违反规范所伴随的耻辱感或想象中的耻辱感。例如中国上层阶级的缠足和许多其他文化中的割礼。即使人们知道这些做法是有害的,他们仍然照做,因为不这样做会让家庭显得「与众不同」,从而被视为异类。学校教育是我们这个时代最主要的文化仪式。大多数人根深蒂固地相信,它既是正常的,也是必要的。要对抗这种观念,不仅需要克服他人的负面评判,还要克服自己内心深处被学校灌输的评判。
其他类别的挑战比例远低于前两类。这些类别包括「时间/职业/收入」(父母无法在在家照顾孩子的同时追求自己的职业、挣更多钱或有足够的个人时间),有 45 个家庭提到;「找朋友」(为孩子找到合适的玩伴或找到有共同教育理念的人),有 18 个家庭提到;「法律问题」(因为法律或规定使得非学校教育不合法或难以实行),有 15 个家庭提到。虽然在北美只有 5% 的家庭提到了「法律问题」,但在欧洲这一比例为 33%(15 个家庭中的 5 个),在法国则高达 75%(4 个家庭中的 3 个)。
这篇文章的后半部分包含了一些从问卷回答中挑选出来的引文,用来说明各类挑战。我知道并非每个人都会看完所有的引文,所以我想在这里提一下,欢迎大家提出自己的看法和问题。如果你是非学校教育家庭的一员,你是如何处理调查中提到的这些挑战的?或者你遇到了什么其他挑战?如果你不是非学校教育家庭的成员,你还有什么关于非学校教育的问题,希望这个系列的报告能回答?这个博客是一个讨论平台,无论是我还是其他读者,都非常重视你的观点和见解。我一贯更倾向于你在这里发表你的评论和问题,而不是私下通过邮件和我交流。因为在这里发表评论,你不仅是在和我分享,也在和其他读者分享。我会阅读所有评论,并尽力回答所有严肃的问题。当然,如果你有些话真的只适合你和我之间交流,那就给我发电子邮件。
现在,继续阅读。这些引文是对非学校教育家庭所面临的障碍的生动陈述。
说明「社会压力」类挑战的引文
-
「迄今为止,最大的挑战是应对他人。这个观念是如此的激进,我认为人们(尤其是家庭成员)很容易批评它。我厌倦了总觉得需要等到我的孩子成年,才能最终说『看,一切都没问题!』」
-
「最大的挑战是要克服违背社会规范的恐惧,还有应对那些对我们选择持批评态度或不支持的远房亲戚。」
-
「直到现在,我们还没告诉我丈夫的家人我们正在进行非学校教育。我们担心他们会感到恐慌,觉得有必要干预。我们不想为自己或孩子制造这样的紧张气氛。」
-
「回答那些不理解的人,包括一些在家上学者的问题。比如,你孩子上几年级了,用的是什么教材,独生子女怎么社交等等。」
-
「我认为我们面临的唯一真正挑战,就是处理其他人(特别是陌生人)的偏见和误解。当我们说我们在家教育孩子时(因为提到『非学校教育』通常会招致困惑的眼神),他们会想象我家客厅里摆着一排小书桌。他们还以为我们没有社交生活。每次在公共场合遇到人们说这些话,真的让人非常非常疲惫。此外,电视上有时会播放关于非学校教育的节目,观众可能会以为那就是我们的生活方式(这些节目通常夸大其词,通过剪辑将我们描绘成忽视孩子的、无知的父母)。我已经厌倦了回答像『嗯,艺术和音乐还行,但数学呢?』或者『你的孩子将来怎么在现实世界里生存?』这样的问题。我并不总想成为非学校教育的代言人,尤其是当我只是想去超市买东西时!但我似乎常常发现自己不得不在这种场合下解释这些问题,有时真的让人身心俱疲。」
-
「我想,作为基督徒,我们面临的是被贴上懒惰父母的标签。人们通常认为非学校教育就是不管孩子,将其视为错误甚至罪恶,这在基督教社区中尤为严重。他们认为上帝喜欢秩序。但讽刺的是,耶稣可能就是非学校教育出来的。」
-
「我们最大的挑战来自双方的大家庭。他们对在家上学持反对意见,对非学校教育更是强烈反对。我们不得不和他们断绝来往一年多。现在他们看到[我们的女儿]『还好』。」
-
「我最大的难关是优雅地应对与公立学校有关的朋友和其他人的交流。我有不少朋友是老师或与学校有关联,他们曾经认为(现在有时仍然这样认为)我们这么做就是蔑视他们和他们的努力。」
-
「我的大多数朋友和家人的怀疑和公开反对,给我带来了巨大压力,让我们家与之前的社交圈子隔离。我学会了不提非学校教育,因为我的很多老朋友都不支持我的在家上学的决定,而我曾在他们面前提过非学校教育的几个人,他们都吓坏了。」
-
「我女儿的父亲和继母非常反对我们的做法,甚至把她赶出家门,因为他们认为她会给其他孩子树立坏榜样。」
-
「我的婆婆甚至不再关心她的孙子孙女,不愿理解我们所做的事情以及原因,因此他们基本上失去了一位祖父母。」
-
「当我们第一次发现非学校教育,并真正开始探索其理念时,我很激动地想和家人、朋友分享。但我很快意识到,大部分人都不能(不愿?)理解,有些人甚至完全持反对态度。我已经学会用更接近学校的方式来表达我们的非学校教育,这样别人更能接受,觉得我们之间还能有所共鸣。」
-
「应对那些完全不懂非学校教育的人所发表的无知或自以为是的评论,真让人疲惫不堪。」
-
「别人,不管是朋友的朋友,家人,还是我们在公共活动中不得不打交道的人……他们质疑我们的孩子,审问我们,挑战、审视我们的动机。因为我们没有让孩子在传统学校学习国家标准课程,他们指责我们自私,或指控我们忽视孩子。类似的事时有发生,搞得我们心里也开始打鼓,感到害怕。」
-
「最大的挑战来自于他人的看法。找到支持我们的人很难,特别是身边的人。我们的支持主要来自线下的一些会议和网上的社群……别人不理解、看不起我们正在做的事情。大多数人都局限在学校的思维定式之中,认为孩子不上学就不可能成才。他们认为像校园欺凌和做毫无意义的工作是通往『现实世界』的必经之路,而他们眼中的『现实世界』不过就是无聊、可怕、毫无乐趣可言的。」
-
「我们已经放弃和家人讨论这个话题。以前,熟人和陌生人的看法困扰着我们,但现在我有了证据,证明我们的教育方式是有效的……但仍有人鸡蛋里挑骨头,比如说她错过了舞会,或者她不像其他『青春期女孩』。一个十几岁的孩子表现得像个研究生,在别人眼中似乎是不正常的,好像我们得为她的『与众不同』负责。」
-
「我儿子最讨厌跟那些反对的人解释我们做什么不做什么,絮絮叨叨没完没了。」
-
「只要你做一些非主流的事情,你就不得不成为它的代言人。我并不想成为非学校教育的典型代表,也不希望我的孩子扮演这样的角色,但似乎别人的期望如此。」
说明父母需要摆脱学校思维来高效实践非学校教育的引文。
-
「我儿子天生就懂得如何自学,但我们(我和丈夫)却需要摆脱很多旧思维!」
-
「想到孩子们能『逃避』做数学、拼写练习、家庭作业,不用强迫学习『他们将来会需要的东西』时,我们心里难免有些抵触。看到他们花大把时间在无结构学习上,哪怕明明看得出他们的确在高效学习,心里那股认为他们学得不够扎实的念头还是难以平息。某种程度上,我们甚至嫉妒他们不必像我们当年那样,忍受单调乏味、迷茫挫败,还有『社会化』(同龄的不良少年的影响),他们可以真正专注享受学习的乐趣。」
-
「最主要的挑战是克服我自己的担忧,担心他们学得不够。我需要不断地让自己摆脱学校思维。媒体,还有家人(堂(表)兄弟姐妹、奶奶、阿姨们)总在暗示我,孩子们应该按照学校的进度掌握某些知识。我必须不断提醒自己,他们总是在学习新事物,他们有着对学习的美妙热爱,他们不需要被别人的时间表束缚。」
-
「哦,防止传统观念侵蚀我的思想是一大挑战:『电视有害!』『电脑有害!』『孩子五岁就应该会读书!』『电子游戏会让孩子变得暴力!』虽然你亲眼看到这些事情在现实生活中根本没有发生,但听到这些言论一次又一次地重复,很难不担心。」
-
「对于我这种来自学术界的人而言,最大的障碍可能是我自己的学校经历,或者更确切地说,是让自己摆脱学校思维,并放弃这种信念:认为『好妈妈』应该提供无尽的『教育』机会,否则孩子就注定平庸。我学会了在生活的每个角落发现学习的机会,明白了学习根本和教学没有关系。」
-
「避免强迫孩子去做我认为对他们好的事。这种做法从来没有好结果,而且破坏了非学校教育中固有的信任。这背后其实是出于担心:怕自己犯下了大错,怕孩子们得不到他们需要的。虽然这种担心明显是无稽之谈,但在最初的几年里,它还是经常无缘无故地出现。不过,随着时间的推移,随着女儿逐渐长大并证明她们自己是非常能干、热衷于学习的人,这种担心渐渐消失了,因为好处已经显而易见。」
-
「最大的障碍就是让我自己摆脱学校思维。尽管我一直想要关注孩子们的兴趣所在,我却很难放手不去寻求他们学习的直接证据(书面作业、项目等)。」
-
「我发现自己的心里还有一些隐秘的角落,藏着过去的恐惧和成见。现在,我的儿子 6 岁了,他的小伙伴们都开始阅读了。我发现自己感到焦虑不安,随后又对自己有这些感觉感到自责。但现在,我正在学会如何应对这些情绪——让它们自然涌现,意识到这只是过时的、基于恐惧的反应,然后让它们慢慢平息,看着我儿子如何用他的创造力探索他的世界。」
-
「我得不断提醒自己,也让我丈夫来提醒我,这条路其实是行得通的。我自己曾是一名教师,这种方法完全不同于大学里教我们如何教育孩子的方式!」
-
「对我来说,最大的挑战是克服那种自认为做得还不够的感觉——那些我焦虑地插手,试图让孩子们学点什么的时刻。我很快就后悔了。现在,随着时间的推移,孩子们学到的东西让我每天都感到惊喜。」
-
「我发现,我迄今为止遇到的最大难题都是自找的……有时一切似乎太顺利,我就会怀疑这里面一定有问题。我是不是太懒了?天哪,那些练习册怎么办!自己的学校经历让我们很容易相信『有教益』的东西不可能有趣;如果又好玩又轻松,那肯定没啥教育价值!我之所以会质疑我们选择的道路,只是因为我没见过任何人在家上学,更别提非学校教育了。」
-
「事实上,最大的挑战是我自己!我得跳出自己的老路子,很多时候都是如此。无论是担心他们玩电子游戏的时间过长,还是担心『那大学怎么办?』,有时真的很难建立信任!但我最后总能想通,只要和我的任何一个孩子聊聊,就足以打消最顽固的怀疑论者的疑虑;他们口齿伶俐、富有同情心、积极参与,我不会改变他们任何一点,也不会改变我们选择的道路(除了也许一开始就不必去学校!)。」
-
「我们根深蒂固的旧观念,才是最大的挑战。来自亲朋好友的非议和指责,反而比我们脑海中挥之不去的陈腐想法更容易应对。」
说明时间/事业/收入方面挑战的引文
-
「钱、钱、钱、钱、钱。我不得不一直工作,有时候比别人还多。大多数时候,我在家做自由职业(我是作家)来填补收支差距。后来,我丈夫失业了,我就开始全职接自由职业的活,有时还需要到现场工作。有一年特别难熬,我在一个非盈利组织全职工作,一周有三天在家,两天需要去现场。那段日子非常艰难,虽然我的孩子们表现还不错,但我自己几乎累垮了。此外,我的孩子们的社交生活很大程度上依赖于我的努力,开车送他们参加活动是一回事,但要真正融入他们的圈子,就得父母下功夫。当我工作时,我就无法做到这些,这意味着他们错过了一些机会。」
-
「最大的挑战是钱——有太多想做、想看、想探索的事情,但资源有限,无法全部实现。不过,这也是生活的一部分,我们需要在单一收入家庭的限制下,在工作的父母不在家的时间里,寻找各种方法和替代方案,以满足需求、愿望和好奇心。」
-
「时间——努力平衡工作和『父母的个人时间』。」
-
「因为孩子们无时无刻都在我身边,作为妈妈的我很难有属于自己的时间。」
-
「我们面临的最大挑战是如何安排好时间,因为家里孩子多,兴趣各异,要让每个孩子都能走自己的路,实在不易。」
说明交友方面挑战的引文
-
「我们面临的主要问题是社交活动需要出远门,这挺累人的。要想找到和我大女儿年纪相仿的孩子,我们得去更远的地方。」
-
「由于我们的儿子是独生子,而邻里的其他孩子都上学和参加课后班,我们不得不想办法让他有机会和其他孩子一起玩。他很喜欢和小伙伴们在一起。在我们找到几个本地(或附近)的非学校教育/在家上学社区并加入其中之前,要给他找到经常玩耍的伙伴确实挺难的。另外,因为我和丈夫都在家工作,忙的时候要平衡工作和照顾孩子,确保每个人和每件事都得到足够的关注,这也是一大挑战。」
-
「我们住在乡下,孩子们想和当地人交朋友真是不容易。」
说明非学校教育面临的法律挑战的引文
-
[来自芬兰,那里哪怕是不上学的孩子也得参加考试。]「每次公立学校的考试日快到时,我们就开始紧张。那时候,我们通常会切换到『教师主导』的方式,努力教孩子一些应试技巧。」
-
[来自英国] 「我们遇到的问题主要是跟市政会沟通,让他们认识到我们的教育方式是有根据的。有时候,我也会突然感到不安,担心他们会突然来查看,要求我们出示『证据』。」
-
[来自法国] 「我们最担心的是年度检查。这里每年都有严格的监管,我们必须证明我们选择的、与学校不同的教育方法和理念是合理的。」
-
[来自法国]「我们面临教育部门的严格监管,他们不认可在家上学,更别提非学校教育了。我们不得不隐藏自己的做法(这等于违法),或者迫于无奈放弃非学校教育的原则。按照法国法律,16 岁的孩子必须在每个学科都达到一定水平。如果完全采用非学校教育,很难确保孩子 16 岁时能达标。」
-
[来自北卡罗来纳州]「我必须从孩子 7 岁开始每年为他进行一次标准化考试。我担心这会影响我坚持非学校教育的决心,因为州政府会对我们进行监督。」
-
[来自新罕布什尔州]「我们面临的最大挑战是州对非学校教育的要求。尽管新罕布什尔州的要求相对容易并且合理,但在一年中我们总有一种负担,感觉『应该找方法在作品集里加入这个或那个科目』。实际上,几年前我和我儿子曾三次在新罕布什尔州议会大厦外游行,以阻止一项立法的通过,该立法要求所有家庭教育者除了作品集外还必须参加标准化考试!我儿子在自己 14 岁时开始狂热地写作,不久后写成了一本完整的书稿,他最近给报纸写了一封信,表达了州要求如何侵犯了他自由学习的权利,因为他必须不管愿不愿意都要涉及某些『科目』。」
尽管有如此多的挑战,没有一个回复者对他们的非学校教育决定感到后悔。想了解他们不后悔的众多原因,请回顾报告一和报告二,了解非学校教育的益处以及引导他们走上这条路的经历。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
用科学研究来说明:暑假后返校对学生的严重危害
原文:The Danger of Back to School | Psychology Today
儿童的心理健康危机在暑假明显减少,而在上学期间则有所上升。
发表于 2014 年 8 月 7 日 | 审稿人:Matt Huston
想象一下,在一份工作中,老板严密管理着一切。你被明确告知要做什么、怎样做、何时做。你必须粘在自己的座位上,直到老板说你可以离开为止。你的每一项工作都要接受评估,每天都要与其他员工的工作进行比较。很少有人信任你自己的决定。就业研究表明,这不仅是最乏味的就业环境,也是最有压力的就业环境。过度的管理让人抓狂。
小孩子也是人,他们和成年人一样,也会对过度管理、对自由的严格限制,以及源源不断的、不请自来的评价有所反应。上学往往就像我刚才描述的那种噩梦般的工作;更糟糕的是,这是孩子们无法辞退的工作。无论他们有多么痛苦,除非他们有开明的父母,有办法、有知识、有意愿让他们摆脱这种生活,否则他们都必须继续忍受。算上家庭作业,孩子的学习时间往往比全职工作的父母还要长,而且孩子在学校的行动自由远不及父母在工作时的自由。
19 世纪末 20 世纪初,许多人开始关注童工对儿童成长和福祉的不良影响,于是通过法律禁止雇佣童工。但现在,我们有了学校,上学相当于一份全职工作——一份心理压力大、久坐不动的全职工作。对此,孩子没有报酬,也无法获得真正工作所带来的独立感和自豪感。
在其他地方(例如这里),我提供了证据,它们表明:孩子,尤其是青少年,在学校的幸福感低于他们常去的任何其他地方。而且,随着学校教育时间的增长,以及校外自由时间的减少,几十年来与之相关的是年轻人心理精神疾病的发病率急剧上升,其中包括重度抑郁症和焦虑症。
现在是八月份,我们开始看到「返校」广告,我在思考儿童的心理健康与上学之间的关系。我意识到,反映这种关系的一个指标可能是:每个月学龄儿童心理急诊室就诊的次数。在夏季,当(对于大多数孩子来说)学校放假时,这些就诊次数会减少吗?
在对已发表文献进行了相当广泛的搜索后,我只找到了一组公开可用的数据——这是一篇在线文章,讨论了 Connecticut 儿童心理中心中,儿童心理急诊的就诊情况(此处)。文章的主要观点是,近年来这类就诊数量急剧增加,急诊室的等待时间也变得更长。而且,文章中的一个交互式图表显示了从 2000 年到 2013 年每个月的急诊就诊次数。即便是匆匆一瞥,也能明显看出,每年夏季的就诊次数都会下降,学年开始后又会上升。
为了量化这一现象,我计算了 2011 年至 2013 年三年间,每个月平均的就诊次数。这只统计了那些非常严重,以至于需要在中心过夜的就诊(即使统计上那些不太严重的就诊,也会得出同样的总体结论)。以下是数据:
来源:Charlie Hoehn,已授权
和我预测的一样,七月和八月是儿童精神急诊就诊次数最少的月份。实际上,这两个月的平均就诊次数相加(每月 70 次)不到全学期月份平均就诊次数的一半(一年内排除六月、七月和八月,剩下九个月中,每月平均 142 次)。六月份,尽管还有一些上学的日子(具体天数随调休而变化),就诊次数也较低,但没有七月和八月那么低。有趣的是,这与我的假设不符,九月的就诊次数也相对较低,与六月相当。九月在学校相对轻松,可以看作是一个热身月;真正的考试、繁重的作业和成绩单还没到来。可能需要几周的时间,学校的压力才真正显现出来。
有人可能会争辩:心理健康问题的严重性在不同季节有所不同,反映的是气候对心理健康的影响,而不是学期。然而,当我们观察其他月份时,这种论点就站不住脚了。儿童精神健康急诊就诊率最高的月份是五月。五月在康涅狄格州通常是气候宜人的月份,但五月可能是学校最艰难的一个月:期末考试在五月,论文的截止日期在五月,结束剩余课程的冲刺期在五月。
必须承认,这些数据仅来自一个儿童心理健康中心。我非常希望找到更多数据来检验这个假设。如果你知道有这样的数据,或者你有动力去你所在社区的儿童心理健康中心进行一些研究以获取这些数据,请告诉我!同时,如果你是学龄儿童的家长,正在考虑「返校」事宜,请记住:现有证据强烈表明,学校对儿童的心理健康有害。当然,对他们的身体健康也有害;大自然并没有设计孩子们整天被困在一个被严密管理的、久坐不动的工作中。
---------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
--------
补充
由 Scott Noelle 提供的数据另一种解读是:
2022 年 8 月 15 日添加注释:关于儿童心理健康崩溃与学年关系的最新信息,请参阅此处。
孩子玩的越来越少,精神障碍越来越多
原文:The Decline of Play and Rise in Children's Mental Disorders | Psychology Today
现在的孩子比过去更焦虑、更抑郁,事出有因。
发表于 2010 年 1 月 26 日 | 审稿人 Lybi Ma
来源:Inara Prusakova/Shutterstock
过去的 50 到 70 年,美国年轻人的抑郁和焦虑率一直稳步上升。根据一些评估,今天符合重度抑郁症和/或焦虑症诊断标准的高中生和大学生人数,至少是半个世纪或更久以前的五到八倍。这种精神病理学的增加并不是诊断标准改变的结果;即使测量手段和标准不变,它仍然成立。
圣地亚哥州立大学的 Jean Twenge 领衔的一项刚刚发布的研究表明,这一代年轻人的抑郁、焦虑和其他精神疾病在急剧上升,这是最新的证据。[1] Twenge 和她的同事们利用了明尼苏达州多相人格量表(MMPI)这一工具的长期数据。这是一份用于评估各种精神障碍的问卷,早在 1938 年,我们就对美国各地的大学生进行了大样本测试,而 MMPI-A(用于较年轻青少年的版本)则对早在 1951 年的高中生样本进行了测试。结果与使用各种指数的其他研究一致,这些研究也表明在过去五年或更长时间里,儿童、青少年和年轻人的焦虑和抑郁急剧增加。
我们通常觉得历史总是进步的,但是,若以年轻人的心理健康和幸福来衡量进步与否,那么我们一直在退步,甚至能退步到上世纪 50 年代初。
我就想问,为什么?
心理病态的增加似乎与更广泛意义上的实际危险和不确定性无关。这些变化与经济周期、战争、人们经常谈论的影响儿童心理状态的任何其他类型的世界事件无关。在大萧条、二战、冷战以及动荡的 20 世纪 60 年代和 70 年代初期,儿童和青少年的焦虑和抑郁发生率远低于今天。比起当今世界实际是怎样的,这些变化似乎更多地与年轻人看待世界的方式有关。
年轻人越发感到无法掌控自己的命运
我们知道,焦虑和抑郁与人们对自己生活的掌控感或缺乏掌控感有显著的相关性。认为「我命由我」的人,比起认为「我命由天」的人,更不容易感到焦虑或抑郁。你可能会认为,过去几十年来,人们的生活掌控感应该有所增加。我们预防和治疗疾病的能力已有实质性的进步;限制人们因种族、性别或性取向选择的旧有偏见已经减少;人们的平均财富也比过去几十年来有所增加。然而,数据显示,年轻人秉持「我命由我」信念的比例,在几十年间已经急剧下降。
对控制感的标准衡量工具是 Julien Rotter 在 1950 年代后期开发的一种问卷,称为内外控制点量表。问卷包括 23 对陈述。每对中的一种陈述代表对内部控制点(由个人控制)的信念,另一种陈述代表对外部控制点(由个人外部的环境控制)的信念。做测试的人必须决定每对中哪种陈述更真实。例如,以下是一对陈述:
-
(a) 我发现,许多事命中注定。
-
(b) 我不喜欢听任命运安排,倒不如自己做主,采取明确的行动。
在这个实例中,选 (a) 代表外部控制点,而 (b) 代表内部控制点。
多年来的许多研究表明,那些在 Rotter 量表的内部得分较高的人比那些在外部得分较高的人生活得更好。[2] 他们更可能得到理想工作,照顾好自己,并在社区中发挥积极的作用,也不太会变得焦虑或抑郁。
几年前,Twenge 和她的同事们分析了许多以前使用 Rotter 量表的研究结果,这些研究涵盖了 1960 年至 2002 年的年轻人。[3] 他们发现,在这个时期,平均分数发生了显著的变化——对于 9 到 14 岁的儿童以及大学生——量表结果从内部控制点转向了外部控制点。事实上,变化如此之大,以至于 2002 年的平均年轻人在外部控制点的得分甚至超过了 1960 年代 80% 的年轻人。在这 42 年期间,Rotter 量表上的外部控制增长与抑郁和焦虑的上升趋势呈现出相同的线性趋势。
[更正:Twenge 及其同事用于 9 至 14 岁儿童的控制中心数据来自 Nowicki-Strickland 量表,该量表由 Bonnie Strickland 和 Steve Nowicki 开发,而不是 Rotter 量表。他们的量表与 Rotter 的类似,但经过修改,可用于儿童。]
有理由认为,外部控制的增加(以及内部控制的减少)与焦虑和抑郁症的增加有因果关系。当人们认为他们对自己的命运几乎没有或没有把握时,他们会变得焦虑:「随时都可能发生可怕的事情,我无能为力。」当焦虑和无助感变得过于强烈时,人们会变得抑郁:「试也没用;反正会失败。」
向外在目标转变,背离内在目标
Twenge 的理论是,焦虑和抑郁的代际增加与从「内在」目标转向「外在」目标有关。[1] 内在目标是与个人自身发展有关的目标,例如在自己选择的事业上精益求精、发展有意义的人生观。而外在目标与物质奖励和他人的看法有关。这些目标包括高收入、地位和美貌。Twenge 引用的证据表明,当今年轻人,普遍来说,更多关注外在目标,更少关注内在目标。例如,大一新生年度调查中显示,当今大多数学生认为「经济上的富裕」比「发展有意义的人生观」更重要——而在上世纪 60、70 年代,情况正好相反。[4]
向外在目标的转变,可能与控制点的外移有直接的因果关系。我们对实现外在目标的个人控制力,远不如实现内在目标时的控制力。通过个人努力,我完全可以明显提升我的技能,但这并不能保证我能致富。我可以通过灵修或哲思,找寻人生的意义,但这并不能保证我会更具吸引力,或得到他人的赞誉。如果我的情绪满足来自于「内在目标」的进步,我就能控制自己的情绪健康。但如果我的满足感依赖于他人的评价和奖赏,那我对自己情绪状态的控制就会大大减弱。
Twenge 认为,从内在目标转向外在目标的转变,代表了整体上向物质主义文化的转变,这种转变通过电视和其他媒体传播。从出生起,年轻人就被广告等海量信息轰炸,这些信息都暗示,幸福取决于美貌、人气和物质财富。我猜,Twenge 的观点至少部分正确,但我将提出一个更深层的原因,我认为这个原因更重要、更基本:我们可以假设,外部控制点、外在目标、焦虑和抑郁的代际增加,主要是因为,同比以前,自由玩耍的机会减少了,学校教育的时间及其重视程度增加了。
自由玩耍的减少可能导致控制感和内在目标的减少,以及焦虑和抑郁的增加
如我在这里和这里所指出的——以及其他人在最近的畅销书中所指出的[5]——孩子们玩耍和探索的自由,在没有直接的成人引导和指导的情况下,近几十年来已经大大减少。自由玩耍和探索历来是孩子们学习解决自己的问题,控制自己的生活,发展自己的兴趣,并在追求自己的兴趣方面变得能干的方式。这是我以前许多文章的主题。(例如,参见《玩耍的价值》系列文章。)实际上,玩耍,在定义上,是由玩家控制和指导的活动;而这种玩耍,在定义上,是指向内在而非外在目标的
通过剥夺孩子自由玩耍的机会,始终让孩子处于成人的监控之下,我们正在剥夺他们学习如何控制自己生活的机会。我们可能认为,我们正在保护他们,但事实上我们正在减少他们的快乐,减少他们的自我控制感,阻止他们发现和探索他们最喜欢的事业,并增加他们患焦虑、抑郁和其他疾病的几率。
强制学校教育如何剥夺年轻人的个人控制感,引导他们追求外在目标,并助长焦虑和抑郁
来源:Oko Laa/Shutterstock
过去半世纪乃至更久以来,随着自由玩耍减少,学校及其类似的活动(如课外辅导和成人指导的体育活动)在人们眼中的地位持续上升。如今,孩子在学校每天要待的时长、每年要待的天数、一生中要花费的年数都是史无前例的。对测试和成绩的重视程度也前所未闻。在学校之外,孩子们在成人的指导和保护下,被照顾,被排名,被评判,被奖励的时间也比以往任何时候都要长。在所有这些环境中,是成人在掌控一切,而非孩子们自己。
一上学,孩子就能很快领悟到:他们自主选择的活动,他们对自身能力的评价,都不重要。真正有分量的,是老师的选择和评判。老师的想法并非总是可预测的。你可能刻苦学习,但因为没能精准把握老师的要求,或者没能猜中考题,依然可能得个低分。在大多数学生看来,课堂上追求的不是真才实学,而是好成绩。如果让他们在深入学习一门课程和拿到 A 之间做选择,大多数学生会毫不犹豫地选择后者。这一现象在教育过程的每个阶段都存在,至少在研究生阶段以前是如此。这并不是学生的错,这是我们的错。我们就是这样设定的。我们的教育制度,不断地进行测试和评估,年复一年,强度只增不减。这一制度明显地将外在的奖励和目标,替代了内在的动力。这制度诞生在世界上的每一天,都在有意制造焦虑和抑郁。[6]
在学校这个地方,孩子也没法选择与谁交往。孩子们被赶进陌生的空间,强制和另一些孩子待在一起。他们必须在这些空间中度过白天中大部分时间。在自由玩耍中,感到被骚扰或欺负的孩子可以直接退出,找到另一群更合得来的人;但在学校里,他们无法这样做。无论霸凌来自其他学生还是教师(这并不少见),孩子通常别无选择,只能每天面对那些人。
有时候,结果会很惨烈。
几年前,Mihaly Csikszentmihalyi 和 Jeremy Hunter 对 6 到 12 年级的公立学校学生在学校的幸福指数进行了一项研究。[7] 来自全国 12 个不同社区的 33 所不同学校的 828 名参与者,每人一周内都佩戴了一款特殊的手表,这款手表被设定在早上 7:30 到晚上 10:30 之间的随机时间发出信号。每当信号响起,参与者都要填写一份问卷,记录他们当时在哪里,做什么,以及他们当时的幸福或不幸福的程度。
幸福指数最低的时候,很显然,就是孩子在学校的时候,而最高的幸福指数出现在他们离开学校、与朋友交谈或玩耍时。与父母在一起时的幸福指数处于这个范围之间。周末的平均幸福指数有所提高,但是从周日的晚些时候开始,由于想到又要开始一周的学校生活,幸福指数就会骤降。
作为一个社会,我们遵循一种固有模式——孩子必须在他们最不愿待的地方,花费越来越多的时间。这一信念的代价巨大,尤其损害了孩子的快乐和心理健康。
是时候重新思考教育了。
另有出路
任何考察过瑟谷类型的民主学校和非学校教育经历者的人,只要扪心自问,就明白我们还有别的出路——一种倡导自由、玩耍、自主探索的教育。为了教育孩子,完全不必逼疯他们。一旦不再逼迫年轻人,他们就会获得自由和机遇,也就能进行自我教育。他们乐于这样做,并在此过程中发展内在价值观、个人自制力和情绪健康。这是本博客整个系列文章想要传递的核心要义。整个社会都应该对此及时给予重视。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
[1] Twenge, J., et al., (2010). Birth cohort increases in psychopathology among young Americans, 1938-2007: A cross-temporal meta-analysis of the MMPI. In press, Clinical Psychology Review 30, 145-154.
[2] For references, see Twenge et al. (2004).
[3] Twenge, J. et al. (2004). Its beyond my control: A cross-temporal meta-analysis of increasing externality in locus of control, 1960-2002. Personality and Social Psychology Review, 8, 308-319.
[4] Pryor, J. H., et al. (2007). The American freshman: Forty-year trends, 1966-2006. Los Angeles: Higher Education Research Institute.
[5] Examples of such books are Hara Estroff Marano's A Nation of Wimps and Lenore Skenazy's Free Range Kids.
[6] Consistent with this claim is evidence that the more academically competitive the school, the greater is the incidence of student depression. Herman, K. C., et al. (2009). Childhood depression: Rethinking the role of school. Psychology in the Schools, 46, 433-446.
[7] Csikszentmihalyi, M., & Hunter, J. (2003). Happiness in everyday life: The uses of experience sampling. Journal of Happiness Studies, 4, 185-199.
足够好的父母是最好的父母
原文:https://www.psychologytoday.com/us/blog/freedom-learn/201512/the-good-enough-parent-is-the-best-parent
如果金凤花女孩体验过各种父母,她会选足够好的父母。(译注:金凤花姑娘喜欢不冷不热粥,不软不硬的椅子,总之是「刚刚好」的东西,所以后来美国人常用金凤花姑娘来形容「刚刚好」)
发布于 2015 年 12 月 22 日 | 审稿人:Ekua Hagan
如果我们把养育等同为照顾孩子,那么,最好的父母策略,不是严加管教,不是放任自流,而是遵循中道。如果她尝试了三种不同的粥、椅子和床后,还尝试了三种父母,金凤花女孩会选遵循中道的父母。如果大多数孩子有得选,他们也会这样选。
最近,我初步通读了 Bruno Bettelheim 的《足够好的父母》(A Good Enough Parent,初版于 1987 年)。虽然我并不认同他所有观点——太精神分析,不太对我胃口。而且,我认为他有点低估儿童的推理能力。不过,我同意书中大部分内容。
「足够好父母」的概念来自 Donald Winnicott,一位英国精神分析师和儿科医生。Bettelheim 借用了这一概念,但没有全盘照搬。Winnicott 的研究聚焦在母亲,术语用的是「足够好的母亲」。Bettelheim 则把这一概念扩展到父母,并且将它以通俗的方式解释清楚,落到实处,更能让普罗大众理解。[不过,具体还需见底部关于 Bettelheim 生平的说明]。
这篇推文的灵感就来自 Bettelheim 写的这本书。接下来要说的观点,可能与他的观点不尽相同,但也相当接近。它们是 Bettelheim 的想法,我对它们进行了加工。和 Bettelheim 差不多,我认为,足够好的父母有以下特点:
足够好的父母并不苛求自己完美,也不期望孩子完美。
序言里,Bettelheim 写道:
「为了使孩子拔节生长,人们不该试图成为完美的父母,同样,人们不应该期望自己的孩子变得完美,或是尽可能完美。完美非常人可及。自己追求完美,就难以宽容他人的不完美,甚至对孩子也这样,然而,只有这种宽容,才能使良好的人际关系成为可能。」
期待完美不是什么好事,一旦这么做,一切不完美都会被放大,即使有些不完美,人们其实无能为力。追求机器的完美大概是件好事,因为机器的缺点可以被更正。但作为父母,为了成为完美的父母而苦苦挣扎,就不是什么好事。因为人类的一些不完美无可避免,毕竟人类境况如此(译注:即人类的普遍状况)。事实上,我们很难想象完美的人是什么样子。
养育孩子时要求完美,甚至仅仅追求完美,都更有可能导致责备。完美主义者的脑回路一般这样:一旦出现问题,那就是某人有问题。事情一旦不对劲,追求完美的父母就会责备自己,或他们的孩子。这么做毫无益处,所有互相责备的家庭都很痛苦,而不幸恰恰起源于责备。
循着相似的道理,Bettelheim 在结尾写道:
「现代人总是错误地认为,问题不该发生,一旦发生就得归罪到某人身上;这在家庭内造成了无尽痛苦,困境继而加深,有时甚至使婚姻和家庭是否应当存在受到质疑。中国古谚『家家有本难念的经』也是这个道理。」
足够好的父母并不担心自己不完美。他们会努力做一些事情,但是很清楚自己并不会总是如愿,对于这一点,他们会劝慰自己。足够好的父母明白,甚至爱也不是完璧无瑕;爱有时也会变化无常。Bettelheim 也说:「几乎所有的爱都有多重面向,正如我们对孩子的爱带有恼怒、挫败、失望,孩子感受我们的爱也是如此」足够好的父母欣然接受这种人类境况。 足够好的父母明白,大自然创造的孩子相当有韧性。此言非虚,不然人类就不可能繁衍至今。只要父母不把事情搞得太糟(有时即使他们这样做),孩子成长的结果就「还可以」,而「还可以」就足够(好)了。
足够好父母尊重自己孩子,并试图平等地理解他们
足够好的父母不以生出、创造、塑造孩子自居。他们认为孩子已是完整的人,他们明白这时要做的,是去了解他们。他们明白,父母与子女的关系是双向的,虽然有时不完全是。这种关系是平等的,对于双方同样重要,都应该收获幸福,都有机会创造自己的目标,并努力实现它们(只要这种努力不伤害他人)。另一种意义上,这是一种不平等的关系。至少在孩子小的时候,父母更高大、更强壮、更聪明(我们希望如此)、更善于推理;而且,父母控制着孩子赖以生存的资源。这种不平衡的关系要更好发挥作用,足够好的父母就得努力去了解孩子,以便理解孩子的需求和愿望。
通常,儿童不像成年人那样善于讲道理或有逻辑地辩解,因此,父母期望孩子总是为他们的行为提供充分理由,其实并不公平。当父母试图与孩子争论,往往会导致口诛笔伐和羞辱,这就破坏了理解和支持的本心。
Bettelheim 这么说:
「成年人论证能力出色,掌握更多相关事实,父母便可能自我感觉占理,但孩子只会单纯觉得,他的想法被贬低得体无完肤。因此,孩子感觉到自己被大道理压倒了,这种体验,压抑且无助。说服远远不是这样。除非冲突双方至少有一方能够认真考虑对方的观点,否则不可能有令人满意的解决方案。因此,足够好的父母会审视孩子的动机,试图理解他的想法,欣赏他的愿望,以便理解他(孩子)希望得到什么,以及为什么和怎么样。」
为了说明尊重且试着去理解孩子很重要,Bettelheim 举了一个孩子和父母冲突的例子,和学习成绩有关,这个例子到现在甚至成了更普遍的现象(比起作者时代)。我稍稍改编了这个例子以适应行文。假设,你孩子不做作业,不听老师的话。然后老师把你叫去学校面谈,这时,如果你是追求完美的父母,你会觉得自己因孩子的表现蒙羞,甚至以他为耻。你会笃信,这些问题不该有,并且觉得老师的话句句针对自己,这可能让你回家后训斥责备孩子,仅仅为了维护自己的面子,而毫不关心孩子是否真正需要帮助和理解。
相反,如果你仅仅想做个足够好的父母,并且从未幻想能变得完美,你就会把问题看作是需要解决的事情,而不是灾难,更不会找机会去责备、羞辱。解决问题的第一步,就是从孩子的角度看问题。这时,你尊重孩子,那么你就不会苛责他,不会认为是他哪里有必须改正毛病。孩子可能不能清楚地陈述自己行为的原因,甚至可能他自己都没意识到,但这不代表他做这些事情完全没道理,这些动机也不一定就出于恶意。 很可能,孩子的这些行为,在学校里受到追捧。这些行为可能是孩子在宣告独立,这种愿望其实有益孩子身心健康。
这里我们又可以引用 Bettelheim:
「我们做父母的要用孩子的眼光看问题,举个例子,孩子会想用不做学校作业来坚持个性,可能是因为他害怕如果都听别人的,他就会成为傀儡。这么想,我们对他的态度就会完全不同,就不会再认为他不做作业,是因为懒或没能力。」
像这样思考,就能引导家长和孩子积极合作,磨合关系,并在这一过程中找到解决方案。还有什么办法可以向孩子和其他人证明,他不是傀儡,并且同时让他的作业达到及格线?或者,在家里,能不能有一些替代方案来教育孩子,而不会减损他对自己生活学习的掌控?最重要的是,尊重孩子,能促使家长尝试从孩子的角度看问题,可行的解决方案便应运而生,这会让孩子倍感支持而非挫败。即使没有找到完全令人满意的解决方案,孩子至少会理解,父母支持他,而不是反对他。
足够好的父母更关心孩子的童年经历,而不是孩子长大后的将来。
所有父母都会担忧他们孩子的未来,这很自然。我们都希望孩子长大后成为善良、有道德、幸福、健康的人,能照顾自己也照顾他人。但足够好的父母知道,孩子的未来仅由孩子负责,无关父母。只有孩子要决定他或她的生活目标和实现途径,父母无权干涉。父母要做的,仅仅是确保孩子有个令人满意的童年。
足够好的父母明白,要帮助孩子走向光明未来,他们能做的就是给孩子的童年提供令人满意的条件。在和父母的联系中倍感安全的孩子,不觉得自己被掌控,而是感觉到被支持、被信任也因此变得真诚,在足够好的环境中玩耍、学习、探索(包括有很多机会交朋友和与家庭以外的其他人互动),这样的孩子,最终他们自己就能大展宏图。[这我说的,不是 Bettelheim。] 足够好的父母理解这一点,所以他们才专注于现在,而不杞人忧天。幸福的童年通常就意味着幸福的未来;不幸的童年则意味着未来的不幸。
足够好的父母会满足孩子的所需所想,但止步于此。
[这主要是我的观点,不过我强烈认为 Bettelheim 也是这么想的。] 孩子们来到这个世界,天生就想尽可能为自己做事。他们就这样不断迈向成年。足够好的父母直觉上就理解这一点,所以允许孩子自由地承担风险,为自己做力所能及之事。足够好的父母允许孩子犯错和失败,因为他们知道,错误和失败是学习的必经之路。他们提供帮助,只会是补完和支持孩子自己的努力成果,而不会完全接管任务。育人的目标是使孩子能为自己做更多的事,帮助孩子争取独立,而非干预。
足够好的父母的主要工具:有意识地自省、成熟和同理心。
足够好的父母从不盲从「专家」建议,或者最新育儿潮流,也不关心别人怎么评价他们的育儿方式。他们往往从熟悉孩子的亲戚朋友那里找寻建议,这些人至少比专家更了解他们孩子。他们的目的是帮助孩子实现所需所想,不是为了追求大家的认可,觉得他们是最棒的父母,也不是为了避免批评。为了知道如何最大限度地支持孩子,足够好的父母努力理解他们,这么做需要的主要工具就是:有意识地自省、成熟(比如耐心)和同理心。
像早前说的,父母和孩子的关系既平等又不平等。父母更渊博、更擅长做事、比孩子成熟。本来就感到不安的孩子,要是他们发觉父母也无力处理生活琐事,他们会更为不安。这告诉我们,成熟很重要。足够好的父母明白不能半途而废,这样父母和孩子的关系才能正常维持。父母要做的就是理解孩子;但孩子并不非得理解父母。这是因为,父母曾经都是孩子,只要回忆自己的童年,就能助益理解孩子;但孩子不可能当过父母。
Bettelheim 这么说:
「童年的记忆会让我们更有耐心、更善解人意;我们会对孩子有所了解——尽管孩子很顽劣,但他现在承受的和我们曾经承受的别无二致,我们对孩子的爱便会恢复,因为在他身上,我们看到了自己的曾经。足够好的父母努力从他们的成人视角和截然不同的孩子视角来评估和应对问题,并合理利用二者来指导行动,同时,他们也认可,孩子还不成熟,只能从他的角度看问题。因此,足够好的父母,除了相信孩子做事是因为此刻他确信这是他能做的最好的事情,也会问自己:『到底是什么才会让我像我的孩子此刻的行为那样行事?而如果我感到被迫这样做,怎么样才会让我感觉好些呢?』」
Bettelheim 认为儿童只能从自己的角度出发,我并不完全同意。我见过一些孩子,即使还很小,但也对父母的想法有非凡的洞察力。当然,我也同意他的这点:理解对方的观点必须是父母的责任而不是孩子的责任。
任何关系想要成功,同理心是关键,足够好的父母知道他们必须率先运用同理心,因为父母要理解孩子,肯定比孩子去理解父母更容易。Bettelheim 也说:「成人要理解儿童,同理心尤为重要,它要求人们互相平等对待——不是在知识、理智或经验方面,也无关成熟与否,这种平等在于,能够触动我们的所有感受。」父母对孩子的感受的理解,以及父母对这些感受的尊重,是帮助孩子的第一步。
足够好的养育方式就足够好了,足够好的父母对此深信不疑。
养育过程中,比起不太自信的父母,自信于自己养育方式的父母会更加耐心、处变不惊,也少些焦虑,也因此让孩子安全感满满。如 Bettelheim 所言:「孩子往往没有安全感,他自己也知道,这不取决于他的能力,而依赖于他人的善意。而这,来自父母的可靠……成为足够好的父母因此有了另一个条件——坚信我们就如我们这般行事(不会错)。」
在他书的结尾,Bettelheim 补充道:「虽然我们并不完美,但只要都爱我们的孩子,并尽力为他们的幸福着想,我们确实是足够好的父母。这种智慧,这种真理,可以抵制愚蠢,防止我们仅仅从自己的角度考虑孩子的所作所为。他所做的许多事情主要跟他自己有关,而与我们和我们所做的关系,仅仅只是间接的、次要的。」
最后一点关涉谦逊的价值。足够好的父母明白,孩子的世界并不以父母为中心。孩子的行为动机,很难说就是为了取悦或伤害父母,他们的动机,其实往往和他们想要在世界中找到自己的位置有关。如果我们是足够好的父母,就不会为孩子担待太多,也不会责备他们;我们只是专注于理解和帮助,在孩子需要帮助时尽所能及。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
关于孩子如何确立成长道路,父母又如何提供帮助,更多信息请参见《玩耍精神》。
关于 Bettelheim
「unschooling mom」发表的评论颇有洞见,在其促使下,我对 Bettelheim 的生平作以下补充。他 1903 年出生在奥地利,是犹太人,1938 年德国接管奥地利后,被关进了纳粹集中营。获释后,他移民到美国,最终成为芝加哥大学的心理学教授。至少有两个事情,让他的声誉有所贬损。他声称自己获得了维也纳大学的博士学位,现在被认为是谎言。他还提出了一个理论,认为自闭症是母亲冷漠的结果,事实则证明,这大错特错。当我说我喜欢 Bettelheim《足够好的父母》中的观点时,并不意味着我同意他所有著作,也不意味着我钦佩他性格的所有方面。有好想法的人也有些坏想法,这很正常。
重读 Holt 著作《孩子如何学习》的喜与悲
原文:The Joy and Sorrow of Rereading Holt’s "How Children Learn" | Psychology Today
此处总结了 John Holt 关于儿童学习的绝妙洞见
发表于 2017 年 12 月 26 日 | 审稿人:Jessica Schrader
来源: HoltGSWLLC, 经许可引用
几年前,我和 Gina Riley 做了一项调查,主要对象是反学校教育家庭,当问及哪些作家对他们的这样的选择影响最大,John Holt 每每被提及,232个家庭中,超过一半的家庭提及了他(参见这里或这里)。1985 年,Holt 因癌症去世,年仅 62 岁。然而,现今他的影响力仍存。
Holt 逝世后,我的同事 Pat Farenga 一直在处理 Holt 的一些遗产。 Holt 所著《孩子如何学习》最近出版了五十周年纪念版,责编就是他。我认为,这本书是 Holt 最重要的作品。我读第一版还是在几十年前,那时,我还没有开始研究儿童学习,对这本书的体会也不深。现在重读这本书,百感交集:「太正确了,太精妙了,太悲伤了。」这种悲痛,不仅因为这些真理和绝妙看法只为少部分人领略,还因为,比起 Holt 在世时,学校教育每况愈下。如今的学校教育愈发善于制造焦虑,愈发肆意浪费年轻人的时间,愈发侮辱他们的智力,愈发阻碍深度学习和理解。
不过,我仍保持乐观, Holt 若还在人间,也会如此。只有让儿童主导学习才能学得最好——虽然懂得这点的人还不多,但肉眼可见地在增长。越来越多的家庭选择让孩子离开普通学校 ,进行自主教育。越来越多的家长发现孩子的闪光点,并决意倍加呵护,直至熠熠生辉。长此以往,我认为临界点就会到来,辍学率会急剧攀升。我们称作标准学校教育的体系会变得鸡肋,并逐渐泯灭消亡,取而代之的是一个个学习中心,目标仅仅是将儿童自然学习方式最优化(参见此篇,或此篇)。
来源:John Holt / 共享创意条款
Holt 对儿童学习的洞见一二
Holt 对孩子观察细微,理解深刻。要是他不研究孩子,转而研究某种动物,他就是一位博物学家了。他观察孩子自由的自然状态,要我说,甚至是「野生」状态,这种状态下,不存在教师和教室的禁锢,也不存在实验室和实验员的精心设计。这项工作,长期被发展心理学家或教育学学者忽视。他主动接近亲朋的小孩,观察他们玩耍,看他们自由探索。除此之外,他还在观察儿童课间休息时的表现。种种观察,都让他对儿童学习有了明确的深刻结论。此处是些总结,即《孩子如何学习》的摘录。
- 孩子不想为了以后大展宏图而学习。孩子想现在做事情,做其他孩子做的事,在「做」中「学」。
学校教孩子技能知识,以期在未来派上用场,虽说具体何时不得而知。与之相反,孩子关切的是当下,并非未来。孩子想要现在就做事:做自己想做的事情,这其实也能为未来做足准备,虽说这不是重点。重点是让孩子做事,其他观点都是附加推论。
孩子擅长学习,因为他们不觉得自己是在学习;他们认为自己在做事。他们试图参与完整而有意义的活动,比如说他们身边的活动。他们不惮于尝试。别人会走路,那么孩子也会想走路。但一开始孩子并不是很擅长。但他们会每天不断尝试,他们会走得越来越好。别人会说话,那么孩子也会想说话,但他们一开始并不清楚声音和意义的联系。每句话在他们听起来都像是胡言乱语,但对于孩子来说,他们在说话(Holt 在 75 页上这么说)。他们逐渐提高,因为孩子仔细聆听每句话,逐渐习得重复声音的发音及其含义,将其用在自己的话语里,并且越来越贴切适当。
当孩子长得更大后,他们会持续地参加身边的活动,在不同的时间以不同的方式,选择并开始做他们想做的事情。孩子开始阅读,因为他们看到别人也在读,而且如果他们开始阅读,就会发现阅读是享受故事的途径。孩子不会先通过学习如何阅读而成为读者;他们会直接开始读。他们会阅读他们认识的符号。在翻页时,他们会逐字背诵记过的小册子中的单词;或者他们会翻开一本陌生的书,想到什么就说什么。我们可能不会把这叫做阅读,但对孩子来说这就是阅读。随着时间流逝,孩子将认识特定的单词,即使在新的上下文中,并开始推断字母与声音之间的关系。以这种方式,孩子的阅读能力不断进步。
走、说、读——几乎所有人都在自己的文化中养成这些技能,因为它们无处不在。其他技能则需要挑拣,多半出于我们的兴趣。Holt 提过一个六岁小女孩的例子,她喜欢用电子打字机(六十年代的家什)打字。她打字飞快,但毫不[在意](https://www.psychologytoday.com/us/basics/attention) 她打出的字母顺序混乱。可能整篇文档都是乱的,久而久之,她才意识到她打出的文件和成年人不一样——没法读。于是她开始注意到不同按键之间的区别,注意纸上出现的字母,她变得仔细而不追求速度。不久,她打出的文档也文从字顺。
我们大多认同,孩子在学走路、学说话、学读书、学打字;但是孩子并不觉得。孩子蹒跚学步、牙牙学语、认出指示牌上的「停」、敲击触动键盘,这些活动并非学习;他们只是在做事,尽管一开始磕磕绊绊,但做着做着便渐入佳境。
我同事 Kerry McDonald 最近写了篇文章,完美诠释了这一点——讲她那爱烘培、还没上学的小女儿(点击此处)。用 Kerry 的话说,「当人们问她长大后想做什么,她回答得轻描淡写:『面包师,但我已经是面包师了。』」
- 孩子的学习是从整体到部分,而不是从部分到整体。
孩子学习必然是这样,因为孩子看到别人这么做,他们便有动力也这么做。当然,他们的动机是做整件事,而不是从整体抽出的一部分。他们的动机是说出有意义的句子,而不是音素。没有人会说音素。他们的动机是阅读有趣的故事,而不是背诵字母和音素的关系,也不是钻研视觉文字。正如 Holt 反复指出,学校里最大的错误之一,就是把任务分解成各部分,并试图让孩子把这些部分从整体中抽离出来练习。这样一来,我们就把本来有意义的、激动人心的东西变成了无意义的、[无聊的](https://www.psychologytoday.com/us/basics/boredom)。孩子做着真实的、有意义的、完整的事,自然而然地便掌握其中的组成部分(例如,字母—音素关系)。
- 孩子通过犯错、注意并纠正来学习。
孩子看到别人做事,就会想模仿,有时,孩子会仅仅为了把事情做好而做事。他们并不担心现在做不好眼前的事,但是,他们也不会对自己和专家的差距视而不见。因此,整个步骤是,孩子莽撞地开始做事,但随着下一次重复,他们做得越来越好。如 Holt 所言,「还很小的孩子似乎本能上就有某种匠心。我们往往忽视这种匠心,因为孩子的操作不熟练,原材料也很粗糙。但是,你要是见过小孩子痴痴地抚平一个沙滩蛋糕或拍打和塑造一个橡皮泥派的样子,就会明白(这种匠心)。」而且(第 198 页),「只要他们没有被诱惑或霸凌,他们就会想把他们正在做的事做得比以前更好。」
作为成年人,我们总是忍不住纠正孩子,指出他们的错误,认为我们在帮助他们学习。但根据 Holt 的观察,我们这么做,实际在贬低孩子,告诉他或她做得不对(本可以做得更好)。这样做,孩子会感到被审判,因而焦虑,从而使他或她对尝试东西失去了勇气。我们可能会导致孩子远离我们想要支持的活动。当孩子第一次开始一项活动时,孩子不能担心错误,因为这样做会使活动无法开始。只有孩子知道,他或她何时准备好关注错误并进行纠正。
Holt 指出,我们不需纠正孩子,因为他们非常善于自我纠正。他们不断地调整自己的计划,以自己的方式改进工作。作为例子,Holt 描述了他对一个小女孩的观察,她大声朗读故事时,读错了些单词,但马上,重读时,她便纠正了自己的错误,因为她弄清楚了怎样才说得过去。如 Holt 所言(第140页):「单凭自己,不急不躁,她就能发现并纠正大部分错误。」
- 相比观察成年人,孩子通过观察年长的孩子会学得更好。
Holt 指出,幼儿很清楚他们的能力不如成人,这可能是羞耻和焦虑的来源,即便成人本意并非如此。他写道(第 123 页),**「什么都能做好的父母不一定是孩子的好榜样;因为这会让孩子有时觉得,既然他们永远不可能像他们父母一样好,就没必要去尝试。」**他说,这就是为什么儿童通过观察比自己大些的儿童会比观察成人更好。作为例子,他描述了(第 182 页)稍小的男孩,通过观察更大点、经验丰富的男孩来自然有效地提高他们的垒球技能,这些男孩比他们强,但还没有强到不可企及。这一观察与我对年龄混合游戏的价值的研究结果非常吻合(见这里和这里)。
- 幻想为孩子提供了一种手段,让他们能够做一些还无法实现的事,并从中获得学习经验。
许多心理学家,包括我,都论述过幻想的认知价值,因为,它实际上构成了人类思维的最高形式——假设推理的基础(例如这里),但是 Holt 对于幻想有一种别样的洞见;它提供给孩子一种别样的「做」事方式,这种方式不基于现实。和 Holt 针锋相对的 Maria Montessori 及其门徒,认为孩子的幻想必须被克制,因为这会让孩子逃避现实。Holt 极力批判这种观点,断言:「儿童使用幻想并不是为了逃离这个世界,而是为了更好地融入这个世界。」
小孩子并不能开卡车,但他可以在幻想中当卡车司机。孩子会用自己的玩具卡车模拟真实卡车的行为。他能学到很多关于卡车的知识,乃至一些驾驶技巧。Holt 指出,玩想象游戏的孩子,通常会以身边成人为模仿对象。他们会假扮爸爸妈妈,卡车司机,货车司机,飞行员,医生,老师,警察等等。玩耍时,他们会尽可能逼真地建立他们对成人角色的认知。不少人类学家告诉我,任何地方的孩子都会做想象游戏。比如在狩猎采集部落,小男孩会一边跟踪蝴蝶和鼠类,用自己的小箭头击打它们,一边想象自己是抓捕大猎物的勇猛猎手。他们在练习当猎手,同时也在锻炼真正捕猎所用的技能。这可比目标设计练习带劲多了。
关于幻想的这个论点,同样证明了 Holt 的主要论点,即孩子做现在想做的事并从中学习,而非为了未来而练习。在幻想中,孩子无法无天,只做自己想做的事。
- 儿童建立心智模型并将新信息融入模型来理解世界。
孩子与世界互动时,他们的小脑瓜在不断转动。他们会不断尝试理解事物。Holt 和其他人一样(包括最有名的皮亚杰),都认为,儿童是实实在在的科学家,他们设想出直觉(假设),然后测试这些直觉,并根据经验接受、修改或拒斥这些直觉。不过这么做的动机得处于孩子的真心;它不能被强加。为了说明这点,Holt 描述了一些案例,这些案例中,儿童自由地“拨弄”平衡木和钟摆,通过持续的探索,孩子学到了更多关于平衡和钟摆作用的自然规律,这样学习,比照本宣科地教导的孩子学得更好。
孩子经常使用旧有的心理模型来帮助他们理解新的活动,这些模型一般来自以前的活动。Holt 举了一个很好的例子:一个男孩喜欢火车,对火车了解有加。这个男孩开始对阅读感兴趣时,他会注意到印刷的句子就像一列火车,有前端和后端,朝着某个方向行驶。他把开头的大写字母称为「引擎」,把结尾的句号称为「车夫」。当然,这个模型对这个男孩来说是一个独特的、实用的模型。某些方面,它帮助他把对火车的热爱转化为对阅读的热爱。但这种模式必须来自于男孩自己。如果是老师强加给他的,可能会让他觉得很做作,会颠覆他自己对句子的理解。如果老师试图用句子和火车之间的这种类比来教那些对火车没有特别兴趣的孩子,那就太傻了。
教学何以干扰儿童学习
当 Holt 写下《儿童如何学习》的第一版时(1967 年发表),他仍在探求为师之道。当他重新修订这本书,准备出第二版时(1983 年),他校正了多处,表明他与日俱增的信念——除非是为了回应学生明确的求助,任何形式的教育都是错误的。例如,他在 1983 年的补充之一(第 112 页)如此说道:「当即使没有询问,我们还在教学时,我们实际上是在说,『你不够聪明,不知道那些你应该知道,也没有能力去学习。』」在几页之后(第 126 页),他补充道:「学习中的独立精神,是学习者所能拥有的最宝贵的财富,我们这些想要帮助孩子在家里或学校学习的人,必须学会尊重和鼓励这种精神。」
孩子天然就抵制被动教育,因为这破坏了他们的独立性和对自己的能力的信心,即在他们需要的时候,自己能想出办法并寻求帮助。此外,没有一个老师——当然也没有一个在有几个孩子的教室里的老师——能够进入每个孩子的头脑,了解这个孩子当时的动机、心理状态和热忱。只有孩子能接触到这一切,这就是为什么孩子在被允许完全控制自己的学习时学习效果最好。或者,正如孩子所说,当他们被允许完全控制他们自己的行为时。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
不幸的焦虑型教育各有各的不幸
原文:The Many Shades of Fear-Based Parenting | Psychology Today
幸福的家庭教育都信任孩子,不幸的家庭教育各有各的不幸。
发表于 2019 年 3 月 25 日 | 审稿人:Ekua Hagan
长期以来,我一直在这个博客和其他地方提倡我所说的「信任型教育」。信任孩子的父母会给孩子尽可能多的自由,让他们自己做决定。他们相信孩子的直觉、判断力和从错误中学习的能力。信任型父母不会试图给孩子的领路;他们相信孩子会引导自己的发展。当孩子们需要帮助时,他们提供支持,而非指指点点,通过帮助来孩子实现他们自己的目标。
信任型教育对父母和孩子而言,都是最自然且最轻松的教育方式。民族学家发现,这种教育方式在狩猎采集文化中十分普遍(这里和这里)。现在,我们文化中的许多家庭,特别是那些参与自主教育运动的家庭,已经采用了这种教育方式,并写下了它的乐趣和好处。我自己对在信任型父母陪伴下长大的年轻人的研究也证实了这一点(例如这里和这里)。信任型父母不会对生活焦虑,他们也不会无端地担心孩子的生活。信任型父母对孩子的能力有信心,这种信心会成为一种自我实现的预言。
正如我十年前左右写道的那样(这里),信任型教育会让孩子明白:
「你很有能力。你有视野,有头脑,能想出办法。你知道自己的能力和局限性。通过自主的游戏和探索,你将学到你需要知道的东西。你的需求很重要。你的意见很重要。你要为自己的错误负责,我们也信赖你会从中吸取教训。社交不是意志与意志的对抗,而是相互帮助,这样所有人都能得到他们需要和最渴望的东西。我们支持你,而不是反对你。」
我现在再做个补充:你的生活是你的,不是我的,去享受生活吧。
信任型教育的敌人是焦虑,不幸的是,如今,焦虑在我们的社会中肆虐。它之所以猖獗,并非因为世界确实比过去更加危险,而是因为我们的社会走进了自己吓自己的怪圈。我们担忧,如果我们不经常看管我们的孩子,陌生人会把他们抢走,如果他们在学校得不到全「优」,完成所有适当的课外活动,进入一流的大学,我们的孩子就会无家可归,或者以其他方式在生活中失败。
焦虑型教育方式对孩子是不幸的,而且不幸的焦虑型教育各有各的不幸。至于具体是哪一种不幸往往取决于父母的观念特点,也取决于父母的性格和收入。以下是一份清单。
“随时空降”的直升机型教育
「直升机型教育」一词至少在过去 30 年(这里)里一直被用来形容过度保护孩子的父母,更普遍地说,是过度介入孩子生活的父母。典型的直升机型父母,在听到我支持信任教育的论点后,很可能会说(我也听过一些人说):「我不是不信任我的孩子,而是不信任这世界上的其他人。」他们相信危险无处不在,所以他们时时刻刻都在保护和劝告孩子。
在之前一篇文章中,我描述了研究人员如何通过问卷调查来识别直升机型教育,并发现这种教育方式至少与子女成年后糟糕的应对技能之间存在相关性。这些父母很难放手,即使他们的孩子已经成年,部分原因可能是他们的孩子实际上似乎需要额外的帮助,因为他们养成了之前所有直升机型教育造成的无助习惯。这些父母依然想知道他们成年子女生活的所有细节,并在后者追求高等教育或职业生涯或开始建立自己的家庭时主动提供建议。
“扫清一切”的扫雪机型教育
扫雪机型父母不会只像直升机一样在子女头上盘旋,帮助子女克服生活中的障碍,而是粉碎障碍。这是极端的保护型教育ーー更确切地说,是以金钱、权力和厚颜无耻为主题的教育。这些父母利用他们的财富、地位和膨胀的特权为他们的孩子扫清道路。他们的大部分努力都是为了让他们的孩子进入并通过最精英的大学,或者是最有声望且收入最高的职业,因为这些父母非常看重成功的外表。
这些父母雇佣家教帮助孩子完成课程,聘请辅导员为孩子写大学申请书,贿赂愿意给孩子做某种诊断的医生,以便让孩子在学校得到额外的帮助,向大学捐赠大量资金以换取孩子被录取的机会,并且打电话给老师,甚至教授和雇主,要求为孩子提供额外的特权。
在极端情况下——正如校园蓝调行动:美国大学招生丑闻中所发现的那样——这些父母不惜花费数万美元贿赂考试监考人员和大学教练,通过欺骗和撒谎来让他们的孩子进入选定的大学。这些父母也尽其所能地向孩子隐瞒他们扫雪机式的努力,以免让他们知道自己的「成功」并非是自己的功劳(这里),从而蒙受耻辱。他们扫雪的目的不仅仅是为了清理道路和打开大门,而且也是为了增强孩子们的自尊心
“不停灌输”的喷油机型教育
这是我刚刚发明的一个术语。虽然听起来不怎么好,但我也想不到更好的词。也许你有更好的建议。虽然喷油机不像直升机或扫雪机一样都是交通工具,但至少还带个“机”字。
喷油机型父母并不关心为孩子消除障碍,他们更关心的是给孩子灌输所谓的动机和态度,他们认为这些动机和态度是驾驭这个可怕世界所必需的。尤其是,他们深信生活本质上就是竞争,就像比赛,要么赢要么输。为了赢,你就必须想要赢得比赛,并且知道该如何竞争。
会有许多父母这样想,这并不奇怪。我们的整个教育系统,从设计上来说,就是为了让孩子们一直竞争。每个人都在同一条赛道上,为同一个目标奔跑,那些落在后面,或者在其他赛道上徘徊的人都会被当作「失败者」。推而广之,许多人在成长过程中都觉得生活就像学校一样,是一场竞争,有些人是赢家,有些人是 Loser。我甚至听到父母们认真地争辩道,学校的主要价值在于教会孩子们竞争。
据我所知,关于喷油机型教育的最佳研究,是 Hilary Friedman 十年前为博士论文所做的一项研究,随后出版了一本书,名为 Playing to Win(我在这里评论了这本书)。Friedman 对父母的动机来源很感兴趣,他们鼓励孩子参加竞争性活动,然后投入大量资金,用于课程费和报名费,并投入大量时间和精力,让孩子参加各种活动,鼓励他们努力赢得比赛。这些父母期望这项投资的回报是什么?
为了找出答案,Friedman 花了 16 个月的时间采访了 95 个不同家庭的父母,一些案例中还采访了孩子。她选择的家庭给孩子报名了三项完全不同的竞技活动——足球、国际象棋和舞蹈。每个案例中,孩子都在上小学。
简而言之,她发现,大多数父母投入这些金钱、时间和精力,并不是因为他们的孩子喜欢这项活动,也不是因为父母希望他们的孩子成为这方面的专家。选择哪种活动本身就相当随意。对父母来说,重要的是这项活动的竞争性。他们相信这些竞赛能在孩子身上培养出一系列的态度和技能,Friedman 把这些统称为「竞争性儿童资本」,这些都会在未来的竞争中帮到他们,比如进入名牌大学,获得高薪工作,获得晋升等等。
这些父母的主要目标是让他们的孩子内化获胜的信念,并获得某些能帮他们「卷」赢的整体技能,比如坚持和抗压的能力。为此,如果他们赢了或提高了排名,许多父母就会奖励他们的孩子现金或物质或款待(比如去迪士尼乐园),远远超出竞赛本身的奖励,但如果孩子输了他们就一毛不拔。父母的目标是强化获胜的信念。
当 Friedman 问孩子他们喜欢这项活动哪里时,他们经常谈到结交和结识朋友,以及他们因获胜而得到的奖励,很少谈到对活动本身的热爱,甚至很少谈到他们从获胜中获得的任何内在乐趣。事实上,有些人甚至说,如果他们打败了一个朋友,他们会感觉很糟糕。相比之下,根据 Friedman 的说法,没有一位父母提到结交朋友是让他们的孩子参加这些活动的原因。
这些父母走向了极端,但我怀疑,对竞争世界和逼迫自己追求胜利的信念,是今天如此多的父母把孩子——甚至是年幼的孩子——投入到竞争活动中,而不是外出玩耍的原因之一。信任型父母意识到,成功的真正秘诀不在于击败他人,而在于发现自己真正喜欢做的事情,交朋友,学会如何合作,而喷油机型父母没有意识到这一点。到目前为止,学习这些知识的最好地方是玩耍。
“暴力威胁”的虎妈型教育
如果说扫雪机型教育是极端版的直升机型教育,那么虎妈型教育是极端版的喷油机型教育。「虎妈型教育」是耶鲁大学教授 Amy Chua 几年前在她的著作《虎妈战歌》中创造的一个术语,用来描述她凶猛、强硬的教育方式。
显然,Amy Chua 把生活看作一场竞争,生活的目标是胜利。作为父母,她的目标是让她的孩子赢。例如,在音乐领域,她决定她的两个孩子每个人要弹奏哪种乐器(Sophia 是钢琴,Lulu 是小提琴),并使用一切可能的手段,除了身体暴力(貌似是),让她们每天练习几个小时。她的方法包括一阵阵的大喊大叫、威胁、贿赂、侮辱、羞辱和谎言(比如当她承诺将来不再练习,然后食言)。她最喜欢的方法是一遍又一遍地告诉他们,如果她们在即将到来的比赛中不及第一名,她们就会给全家人,尤其是她们的母亲带来耻辱。
Chua 确保女儿们每分每秒都要执行她选择的活动。大多数时候,她的女儿去上学、做作业、上音乐班、练习乐器(通常 Chua 会站在旁边批评她们),还会去享有盛誉的场合举行独奏会。他们必须得到所有的「优」,还要赢得学校里所有的比赛。她们不允许有任何玩耍的日子,或者在别人家过夜,或者在任何空闲时间自己玩耍或者和其他孩子一起玩耍。
Chua 的书如果是恶搞的话,应该会很搞笑,但事实并非如此。她是认真的。她称之为中国式教育,并将其作为西方人效仿的对象。然而,值得注意的是,在亚马逊上评论这本书的华裔美国人远没有其他评论者那么认可它。事实上,在我对许多评论的分析中(这里是详细描述),我发现 40.5% 的美籍华人评论者给它一星,这是最低的评价,而其他评论者只有 20.9% 给它一星。许多美籍华人评论者讨厌这本书,因为这让他们想起了自己的父母对待他们的方式,他们认为这是虐待,是终身痛苦的根源。他们强调,他们不会用这种方式抚养孩子。
我感兴趣的问题是,为什么这么多西方和非中国读者(46.6%)给这本书打了五星,为什么这本书很快就成了畅销书。这似乎对 Chua 这样的人很有吸引力,他们认为人生的目标就是胜利,而且他们也相信,如果任由孩子们自生自灭,他们就无法取得胜利。幸运的是,这些人中很少有异于常人的决心和能力来摒弃良心,这是实施 Chua 极端方法所必要的,但显然很多人希望这样做。
为什么胜利如此重要,以至于一个人愿意为了胜利而牺牲孩子的自由和快乐?我能想到的唯一答案是,对于这些人来说,不是胜利就是失败,对他们来说,没有什么比失败更可怕的了。狼爸虎妈,就像扫雪机型父母一样,似乎也很看重成功的外表,但是他们确保这种外表光鲜亮丽的方法与扫雪机型父母的方法相反。他们没有为孩子清除障碍,而是制造障碍,然后恐吓孩子克服障碍。他们不但没有助长自我价值,反而压制自我价值,让孩子们屈服。他们认为自己是孩子的训练师,而不是保护者。
正如我在对 Chua 的书评中指出的那样,我认为用虎妈这个词形容这种教育方式是不恰当的。这是对老虎的侮辱。没有老虎妈妈会这样训练她的幼崽。老虎妈妈允许它们的幼崽尽情地玩耍,因为本能告诉它们:玩耍是幼崽练习生存和茁壮成长所需的真正技能的方式。会用 Chua 的方法是马戏团里的驯虎师,而不是老虎妈妈。马戏团驯兽师让幼虎做它们不想做的事情,不是为了幼虎的最终利益。这只是一种炫耀驯兽师技能的方式。
防御型教育
我认为防御型教育是更侧重于保护父母自己而非保护孩子的教育(我的儿子 Scott 提出了这一术语,在此表示感谢)。此处的焦虑是父母对其他人指指点点的焦虑。所有人天生都不喜欢被指指点点,而防御型养育就是要减少别人对他们管教孩子的非议。我对面临这样问题的父母抱有深深的同情。如果你身边所有人都反对你的做法,即使你内心相信自己是对的,你也很难推行下去。
很多父母告诉我,他们已意识到:如果继续这样的防御式教育,他们永远都不可能成为自己心目中的理想父母。他们的说法是,「我知道我的孩子已经够大了,可以独自走去学校,或者自己去公园玩,但我害怕如果我真的这样,别人会说我忽视管教——比如我的亲戚邻居,甚至是警察。」或者是,「我知道我孩子上学上得难受,转向家庭教育或者上面向自我教育的学校会更好,但要真的做了,我自己的父母兄弟姐妹会怨恨我的。」
在我们对非学校教育家庭的研究中(这里)Gina Riley 和我发现,那些父母反映的最大挑战是:顶住他人对他们选择不去学校的或明或暗的批评。有些父母克服了障碍,但对许多人来说,这并不容易。我相信,还有更多的父母无法克服这一障碍。如果不是因为害怕别人的批评,或者更普遍的担心违反文化常规,会有比现在更多的信任型父母,更多的家庭让他们的孩子脱离强制教育,我是这样想的。这就是为什么 Let Grow 正在努力扭转社会对父母给予孩子独立漫游和玩耍自由的负面评判,也是为什么自主教育联盟正在努力将自主教育常态化。
注意事项
可能是出于我自己的防御本能,为了解决我预期读者会反映的批评,我想要用几个说明收尾。
Source: Olimpik/Shutterstock
首先我要说清楚我不是盲目乐天派,在这里大言不惭一切都没什么好怕的。危险的确会存在,而且父母也的确会担心这些危险,并想要保护孩子不受伤害,这都是自然的。有些人承受着更大的危险,比如你很穷,肤色也比较黑,你承担的危险就比富有的白人更多。但如果父母对危险过分恐惧,甚至要阻遏孩子的发展,让他们欢乐不再,并剥夺他们发展应对真正危险的能力的机会,父母就是在害孩子。教育孩子在现实中有诸多危险,并启发他们发展出应对危险的方法,这是有益的,但自以为在保护孩子,实则剥夺孩子权利,剥夺他们玩耍和发展应对真实危险的技能的机会是有害的。
其次,我要澄清的是,我所说的“信任型教育”并不是指完全放任的教育方式。作为父母,我们有义务让孩子明白:自己和他人有相等的权利,而且我们的孩子无权干涉他人的权利。有一些我们都必须遵守的规则。通常,在信任型家庭中,孩子们会自然地理解并遵守这些规则,部分是通过父母的良好榜样;但情况并非总是如此,在孩子没有理解规则时,父母也需要强制执行这些规则。
最后,我恳请读者不要认为这篇文章是在责备父母。父母,尤其是母亲,已经承受了太多的指责。事实上,这是问题的一部分。除了少数例外(特别是极端的扫雪机和狼爸虎妈),我相当同情那些成为有些或所有社会压力的牺牲品的父母,这些压力甚至导致了他们各种错误的教育方式,就像我在这里列出的一样。我们需要的不是更多的责备,而是更多的启蒙,这正是我们试图通过 Let Grow 和自主教育联盟所致力的。
你是否同意我的这些想法?还有什么其他糟糕的父母教育方式需要加入到这个列表中?这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
最基本的自由是退出的自由
原文:The Most Basic Freedom Is Freedom to Quit | Psychology Today
只有学生能自由离开学校,学校才能算作道德清白的机构
发布于 2013 年 4 月 29 日
我们喜欢从积极的角度考虑人权,所以我们经常讨论那些让我们得以接近期望的权利:投票的权利,自由集会的权利,言论自由的权利,以及选择通往幸福路径的权利。然而,我在此提出一个容易引起争议的观点,即最基本的权利——使其他权利成为可能的权利——是退出的权利。
退出常常会唤起负面的意味。从小到大,我们经常听别人说「退缩者永无胜利,胜利者永无退缩。」我们应该克服困难,坚持到底。不过,我很喜欢这句话的一种改编,是我不知何时听到的:「退缩者永无胜利,胜利者永无退缩。但未尝胜利也未尝退缩者,则是愚者。」
如果把思想从竞赛的泥潭中解放(的确,弃赛是打不赢网球比赛的),转而考虑人生更长远的目标——活下去,避免伤害,寻得幸福,用符合个人价值观的方式来生活,和与我们互相尊重的群体共同生活——那么我们便会发现,退出的自由对于这些目标至关重要。这里,我所讨论的自由,是远离损害我们福祉的人群和局面的自由。
在狩猎采集者游群(band)中,退出的自由是和平、平等和民主的基础。
我思考退出之自由的关键价值,是从前几年研究狩猎采集者游群社会时开始的。这些社会没有警察、监狱等强迫个人服从规则的正式手段,但这些社会的生活却非常有序而和平。他们的重要价值观是平等(没有人是天生比其他人更优秀或更有价值的,而且也没有首领或老板之类的人),分享(食物和物质资料会在游群成员之间平等分享),自治(无论老少,无论何时,人们都有做出自己选择的自由)。(关于这些观察的记录,请见这篇文章)。为什么强者不会剥削或奴役弱者,为己所用?是什么让人们互相关心,即便彼此并无关联?
用不同角度解释,这些问题有不少很合理的答案。但我认为,终极答案便是退出的自由。人类学家屡屡指出,狩猎采集游群是高度流动的。为了追随猎物和可食植物,游群会不断迁移,然而个人以及家庭也会在不同游群之间迁移。因为狩猎采集者不占有土地,他们所占有的个人财产也不超过个人所能携带的容量,此外每个人在不同游群都有朋友亲戚,所以他们总有游走的自由。如果有人感觉在当前所在的游群里受到了压迫,并且发现游群内部没有解决这一压迫的办法,那么他便能迅速地收拾行李,径自出走,或是加入其他游群,或是和一帮朋友建立自己的游群。
如同世界各地的人类一样,狩猎采集者也是互相扶持以求生存。没有人能独自生存,至少不能独自长久生存。然而,在一个人们可以自由来去的世界,你必须友善待人,否则他们可以一走了之。你不能强迫他们为你工作,否则他们便可以一走了之。你不能欺骗、霸凌、贬低他们——否则他们会离去。如果你想要构建众望所归、众志成城的游群以最大化生存的可能,你必须从其他游群成员的视角考虑事情,并努力让他们高兴;在意见不合时,你必须与他们妥协,而且如果有一天你有幸捕到猎物而他们没走运,你必须分享食物。
狩猎采集者以通过共识来做决策而闻名。如果某个行为会影响整个游群,他们必须把事情说清楚,并基本达成一致,之后才能行动。这时候共识是什么意味呢?共识仅仅指的是所有人都跟从决策;他们可能不是完全同意,但他们不会因此而出走游群。所以,对于狩猎采集游群而言,民主决策,并不是清高道德哲学的结果,而是需求的产物。为了生存与发展,游群需要凝聚一心;为此,你的决策不能过度侵犯,以至成员退出。
退出的自由是现代国家里民主和人权的基础。
我们不是狩猎采集者,迁徙更为困难,但我们仍然可以迁徙,甚至在承受无尽压迫之时,跨越国家之疆界(润)。统治者惯常压迫人民的国家,往往通过制定法律束缚人们离开,从而让这些统治者有恃无恐地行其所愿。
1917 年俄国革命两个月后,新上台的政府出台法律,限制向外国移民。这便是康米政权终结任何民主可能性的开端。其他康米国家也如法炮制,比如现在朝鲜就是如此。对于无法离国的人民,政府可以肆意凌虐。如果人民可以离去,政府必须想办法让人民愿意扎根,否则巧妇难为无米之炊。最先离开的人,往往是能力最强最有价值的人。
退出的自由是婚姻和谐的基础。
退出原则不仅在社区和国家层面适用,而且在家庭的层面也一样。大量研究显示,家庭暴力和离婚自由之间有极强的负相关性。相比临近的农业社区,在狩猎采集者游群里,丈夫打妻子的现象更加少见。同样,主要的原因是退出的自由。如果丈夫欺凌她,狩猎采集游群中的女性可以离开,也终将离开。女性可以回到她父母所在的游群,或者去往她的亲戚朋友所在的游群,与此同时婚姻也自动终止。如果她有孩子,孩子想跟她一起走,他们可以走。因为游群里所有人共享食物,而女性和男性都会采猎,女性并不在经济上依赖丈夫,正如丈夫也不依赖于她一样。
所以,假如你是狩猎采集者游群里的男人,而你不想让妻子离开你,你必须好好对待她。在原始的农业社会里则有所不同,因为这些社会中男人占有土地,所以离开男人的女人没有办法靠自己生存。因此,女人必须尽力忍受残暴的丈夫。
显然,在现代社会里,对抗家庭暴力的主要力量是法律和经济上的离婚自由。如果离婚是违法的,那么丈夫打妻子就会很常见。如果离婚不违法,但对大部分女人来说太过昂贵,丈夫打妻子仍然会存在。只有当女人法律上和经济上都有离开丈夫的自由,丈夫大妻子的现象才会消退。这种效应最新的例子是西班牙。在 2005 年,西班牙修改法律,让离婚变得更容易,而针对女人的家庭暴力现象显著减少。这种减少不仅要归因于离婚,而且是因为那些不希望失去妻子的男人,开始更友善地对待她们。
从前,故事和歌曲会歌颂那些无论男人多坏,她都始终「对男人忠贞不渝」的女人。而因为她的爱与奉献的伟大力量,男人最终会醒悟。然而说实在的,相比妻子无论如何都会待在他身边的情况,妻子有可能离开他们的时候,男人才会变得更好。
退出的自由是雇员与奴隶的分界线
工作同样适用这条原则。如果你是雇佣者的所有物,或者法律上规定你不得辞职,或者经济上你无法离职,种种原因导致你无法放弃这份工作,那么你的雇佣者便能肆意虐待剥削而毫发无伤。如果你能一走了之,那么为了继续获取你的服务,你的雇佣者必须好好对待你。在法律和经济上有退出的能力,是保持雇佣者与雇员之间平等关系的力量。没什么神秘的。
孩子不能自由地离开学校,那么,代价是什么呢?
通常上,孩子是最常受虐的人群,不仅因为他们年幼弱小,而且是因为他们不像成年人一样有退出的自由。人类学家告诉我,狩猎采集文化里可不是这样的,因为那里的孩子几乎和成年人一样可以自由退出。受家长不公对待的儿童,可以搬到不同的小屋和其他会对他好的大人一起住。他们甚至可以搬到不同的游群。几乎所有人都喜欢孩子,每个孩子都会得到整个游群的照顾,因此孩子不是负担。即使是非常年轻的孩子,若家长或者照顾者不善对待,他们也可以离去,或者由他人带走。在我们的社会里则不是这样,针对儿童的家庭暴力是严重且猖獗的问题。
但我现在想讨论另一种暴力,即我们强迫儿童就读于学校的暴力。如果学校是强制的,那么根据定义,学校即监狱。监狱是其中的成员被强迫进入的地方,且他们没有选择自己的活动、空间和同伴的自由。儿童不能从学校一走了之,也不能离开刻薄的老师,放弃压迫而毫无意义的作业,或者可恶的同学。对于一些孩子来说,唯一的出路——唯一真正的出路——就是自杀。Helen Smith 在她的书《划伤的心》中写道:「学校规定必须出席 180 天,而她已经缺席了 53% 的天数,她被告知她必须回到学校,或者在逃学小组面前出席,并被发配到青年拘留中心。她认为,更好的办法是回到她的卧室,用皮带吊死自己。过去,她本可以直接辍学,但现在她这样的孩子被强制教育困住了。」
关于校园霸凌,学生不满,无聊,犬儒主义,已经说了太多太多。没人找到解决之道。没人能找到解决方法,除非我们给予孩子退出的自由。解决这些问题的最终方法,是根除强迫。
Source: Basic Books,已授权
如果儿童有了真正离开学校的自由,那么为了延续自身,学校必须变成对孩子友好的地方。儿童喜欢学习,但和我们所有人一样,他们厌恶被强迫,指手画脚,不断评判。他们喜欢用自己的方式学习,而不是其他人强迫他们的方式。像所有机构一样,只有他们服务的人不向监狱服刑者那样,他们才能成为道德清白的机构。如果学生有退出的自由,学校必须赋予他们其他的基本人权,比如对影响他们的选择有发言权,有自由言论的权利,有自由集会的权利,以及选择他们自己的幸福之路的权利。这样的学校,跟我们现在称之为「学校」的阴沉机构完全不一样。(更多信息请参照《玩耍精神》。)
-----------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
儿童自我教育的天然环境
原文:The Natural Environment for Children’s Self-Education | Psychology Today
从这几个方面看,瑟谷学校很像狩猎采集游群。
发布于 2008 年 9 月 3 日
本博客的一大主题,是我们天生具备自我教育的优越本能。我们有观察、探索、玩耍、交谈的本能,这些能力让我们增进技能、丰富知识、建立价值观,以让我们在物理世界和社会世界之中顺利生存成长。我们经常利用这些能力,其过程也充满快乐。这些教育本能,是人类祖先作为狩猎采集者生活数千年,并接受自然选择而塑造的(参见 8 月 2 日的博文)。我们因此应该能预期,最能发挥这些技能的环境,应该就是狩猎采集游群,或者复刻了狩猎采集游群某些特征的现代环境。
在过去四十年里,瑟谷学校证明了,人类自我教育的本能,足以构建现代社会教育的基础。在这所学校里,儿童和青年随心所欲地探索、玩耍、交谈——没有成年人引导或指指点点——而他们成年毕业走上社会,也能做出一番事业(参见 8 月 13 日的帖子)。我花了不少时间观察瑟谷学校,以理解那里的学生如何学习,我也调研了人类学文献,以理解狩猎采集社会中的儿童和青年如何学习。这些研究让我相信,瑟谷学校作为教育机构的成功,是因为这所学校复现了狩猎采集游群中,对自我教育最为重要的因素。
这里,我会逐项说明自我教育的天然环境中最重要的因素。人类学家报告道,这些因素在他们所研究的狩猎采集游群中均有出现 [1],而根据我的观察,瑟谷学校也都具备这些因素。
玩耍探索的时间与空间
基于玩耍和探索的自我教育,需要大量自由时间——做任何想做的事的时间,没有权威者施加压力、决断或侵犯。这些时间会用来交友、琢磨想法或材料、梳理、感受无聊并克服无聊,发展激情。在狩猎采集游群里,成年人对儿童和青少年的要求很少,因为他们明白,年轻人需要自我探索玩耍,才能成为可靠的成年人。瑟谷学校也是如此。
自我教育同样需要空间——游荡、逃离、探索的空间。理想情况下,这块空间应该包含了个人所在文化的所有必要领域。狩猎采集社会的成年人,相信他们的孩子能够聪明地判断自己能逃离多远,能躲避潜在危险的地方。在瑟谷学校,儿童同样是受到信任的。他们可以探索学校周围的森林、田野、小溪,而只要告诉别人他们去哪里,他们就能想走出校园多远就走多远。
自由混龄
孩子在与人交往的过程中学习良多。如果像在学校那样把孩子按年龄分隔,我们便让孩子无法接触那些会让他们受益颇多的人。在狩猎采集游群和瑟谷学校里,儿童和青少年常常自发组成年龄差别极大的小组进行玩耍和探索。
在混龄群体中,小孩子从大孩子那儿习得技能、信息、想法、灵感。在这种群体里,小孩子能做很多对他们来说太危险或复杂的事,如果他们自己做这些事,或者只跟年龄相仿的人在一起做,那是做不了的。大孩子同样从混龄的互动中受益。他们会学习如何领导,如何养育。他们习得对他人的责任感。他们会向小孩子解释知识,而他们自己的知识也会得到巩固与扩展。自由混龄对于自我教育太过重要了,我会未来写上两三篇文章来讨论这个话题。
能接触到有知识有爱心的成年人
在狩猎采集游群中,成人世界和儿童世界并无分隔。儿童会看见成年人的活动,并将其融入他们的玩耍之中。他们听见成年人的故事,成年人之间的讨论和争辩,而他们会从种种耳闻之中学习。每当他们需要成年人的帮助,或者碰到了其他孩子解决不了的问题,他们能随便找个游群中的成年人。所有成年人都会关心他们。事实上,大部分成年人都是他们的叔叔婶婶。
同样,在瑟谷学校,成年人和儿童能自由交际(学校一共有 10 名全职员工,大约 200 名学生,从 4 岁到 19 岁都有)。学校里没有哪个地方是员工可以去而学生不能去的。学生能随意倾听任何成年人之间的讨论,观察他们在做什么,而如果他们愿意也可以加入。无论需要何种帮助,学生都可以找随便一位员工。无论是需要坐在膝上,需要倚靠着哭泣的肩膀,还是需要个人建议,或者自己找不到答案的技术问题,孩子知道哪位成年人最能满足他的需要。学校里的成人并不是孩子真正的叔叔婶婶,但他们也很像。他们了解所有的学生在所有成长过程的状态(不像普通学校里,老师只与一小部分学生相处一年),看着他们成长,并以此为荣。由于学校的员工每年都需要经过全体学生的投票重新选举,他们必然是那些喜欢孩子且受到孩子喜欢的人。
能接触设备
为了学会使用文化中的工具,人们需要接触这些工具。狩猎采集者的孩子们玩刀子、挖掘棍、弓箭、陷阱、乐器、独木舟以及他们文化中其他重要的器具。在瑟谷学校,孩子们可以接触到我们文化中最普遍使用的各种设备,包括电脑、木工设备、烹饪设备、美术用品、各种运动器材以及许多堆满书籍的墙壁。
自由交换想法
对智力发展最好的环境,是人们可以自由分享观点、没有审查、不必担心被排斥的环境。根据人类学家的报告,狩猎采集者在信仰上一点也不教条,甚至在宗教信仰上也是如此。人们可以毫无畏惧地说出自己的想法,对于对团体有影响的观点会进行无休止的辩论。瑟谷学校也是如此。学校刻意避免关联任何特定的宗教或政治意识形态。所有的观点都是可以讨论的。在这样的环境中,观点是用来思考和辩论的,而不是用来记忆并在考试中复述的。学校的首席哲学家 Daniel Greenberg 将学校描述为「观点的自由市场」。一些孩子在家里可能听不到太多关于政治或宗教讨论,而他们会在学校听到这些讨论,并且他们会听到每个问题的各种观点。
免受霸凌
若要能自由探索玩耍,人必须感到安全,远离骚扰和霸凌。狩猎采集游群和瑟谷学校都具备这种自由。根据人类学家的说法,狩猎采集文化中紧密的人际关系、混龄群体以及非竞争而平等的精神氛围,都有效地防止了严重的霸凌行为。如果有年长或体格较壮的孩子欺负年幼或体格较弱的孩子,其他人会介入并迅速制止。瑟谷学校也是如此。此外,在瑟谷学校,学校具有民主制定的规则和司法制度,各个年龄段的孩子们都可以参加,这些都有效地防止了严重的霸凌行为。觉得受到骚扰或霸凌的学生,可以「举报」违规者,让他们在司法委员会前出庭,这个委员会由各年龄段学校成员组成。这与许多传统学校的情况形成鲜明对比,在那里霸凌是一种生活方式。在那里,举报霸凌的学生会被认为是告密者或搬弄是非者,而老师可以逍遥法外,因为他们制定规则而不受规则约束。
沉浸于民主过程
狩猎采集游群和瑟谷学校以截然不同的方式实现了民主。狩猎采集游群没有酋长或「大人物」为群体做决策。相反,所有的群体决策都需要经历长时间的讨论,直到关心此事的绝大多数人达成一致意见。任何人,包括孩子,都可以参加这些讨论。瑟谷学校通过正式的民主程序进行管理,包括学校会议上的讨论和投票,选择参加会议的每位学生和教职员工都有平等的投票权。身处民主过程中,让每个人都具备一种责任感,从而激发教育动力。如果我的声音有份量,如果我对团体的行为和运作有实际的发言权,那么我最好仔细思考并明智发言。我不仅要对自己负责,还要对我的社群负责,所以这是个很好的理由让我去学习对我的社群有意义的事物。
--------
总而言之,我的观点是,在天然的学习环境中——在我们作为狩猎采集者的漫长历史中一直存在,并在瑟谷学校得到再现的环境中——人们(a)拥有大量自由时间和空间去玩耍和探索;(b)可以与不同年龄段的人自由交往;(c)能够接触到与文化相关的工具和设备,并自由地使用和探索这些器材;(d)可以自由表达和辩论他们想要表达和辩论的任何观点;(e)免于霸凌(包括免于被成年人任意使唤);以及(f)在团体的「决策」过程中拥有发言权。
这与传统学校的环境有多大的不同啊。多么讽刺:在传统学校里,我们剥夺了孩子们天然学习环境中的所有元素,然后还试图教给他们一些东西!
----------------
参见新书《自由学习》
---------------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
当今教育的真正问题?孩子们讨厌学校——原因在这里
原文:https://www.alternet.org/2014/10/real-problem-education-today-kids-hate-school-and-heres-why-0
以下是对彼得·格雷(Peter Gray)关于他的书《自由学习:释放玩耍的本能为何能让我们的孩子更快乐、更自立、以及在生活中成为更优秀的学生》(Free to Learn: Why Unleashing the Instinct to Play Will Make Our Children Happier, More Self-Reliant, and Better Students for Life) 的问答。该书论证,当学生能够自由地玩耍、探索和自学时,他们学得更好。
1. 你能简要说明一下您写这本书的动机吗?你写到你的儿子在传统学校学习时遇到困难。
我不会说我的儿子在传统学校学习时遇到了困难,至少不比其他人更困难。相反,我更愿意说是他发现自己在学校里无法自由地追随自己的兴趣,提出自己的问题,以自己的方式解决问题,并诚实地表达自己的想法。他觉得这侵犯了他的人权。当他最终说服了我和他的母亲时,我们找到了截然不同的学校——一所真正为自我导向学习提供环境的学校。最终,这段经历促使我改变了研究方向。我开始专注于研究孩子们在拥有自由和可以提升能力的环境时,如何主要通过自由玩耍和探索来自我教育。我写这本书是因为我逐渐相信,我们的社会正在通过剥夺孩子们玩耍和探索所需的自由,阻碍他们的社交、情感和智力发展。
2. 你在书中提到,对孩子自由逐步剥夺,不仅妨碍了学习,实际上还增加了他们的心理、情感和社交障碍。人们对此有关注吗?家长们注意到了吗?为什么大家没有更强烈的反应?
在没有成人指挥的情况下,孩子玩耍和探索的自由逐渐减少,这在过去 50 到 60 年间逐步发生。与这种逐渐减少相伴的是儿童焦虑、抑郁和其他心理障碍的逐渐增加。由于变化缓慢,人们未必能察觉到。然而,随着时间的推移,变化是非常显著的。按照同样的标准,今天儿童和青少年的焦虑症和重度抑郁的发生率是 1950 年代的五到八倍。当人们发现自己的孩子感到抑郁或焦虑时,往往会将责任归咎于自己作为父母的失职,而不是剥夺了孩子自由的社会环境。或者他们会认为这只是童年或青春期的正常现象,因为它非常普遍。
3. 在教育讨论中,人们常常谈论贫困与不当育儿之间的关系,以及这对孩子在学校失败的影响。然而,有趣的是,你提到过于担心孩子教育的父母可能对孩子的成长造成更大的伤害。你对此有何看法?
研究人员发现,中产阶级和上层阶级家庭的儿童和青少年中,焦虑、抑郁、药物滥用和普遍的愤世嫉俗情绪的发生率非常高,尤其是那些父母带着孩子从一个成人主导的活动奔向下一个活动,并坚持要求孩子在学校取得高分和荣誉的家庭。这些年轻人把生活看作是一系列要跳过的圈,这些圈是由他们生活中的成年人设置的。他们没有把生活看作是一场由他们掌控的快乐冒险。他们没有找到自己的激情并去追求。这是非常令人悲哀的发展趋势。
4. 你认为教师不允许学生主导自己的教育,一部分是不是在于他们不相信自己能从学生身上学到东西呢?教师的目标应该是什么?他们是否应该有「向学生学习」而非「向学生传授知识」的愿望呢?
对于这个问题,我不责怪教师。问题在于体制本身。鉴于我们学校的结构,要让学生在学校里掌控自己的教育是不可能的。要做到这点,我们需要从头开始,重新设计学校,让大人成为助手而非管理者。尽管如此,我认为教师还是能通过在制度允许的范围内尽可能的灵活,尊重学生,并同意学生在现行制度允许的范围内追求自己的兴趣带来一些改变。不幸的是,即使是最开明的教师,现在也比以往任何时候都更难走这条路。他们的工作越来越被定义为设法提高学生的标准化考试分数。现在几乎没有人关心学校里真正的学习——现在关注点都集中在考试成绩上。
5. 有些学生声称他们喜欢学校及其结构化的环境——他们可能是那些几乎毫不费力就能取得优异成绩的「专家」学生。他们是与众不同吗?还是他们在压抑着某些东西?
研究表明,总体而言,学生在学校中的幸福感远低于其他经常身处的环境。然而,确实有些学生声称他们喜欢学校。我认为,其中有许多是学会了享受学校竞争的人。他们对自己的高分、表扬和其他因表现良好而获得的奖励感到高兴。尽管如此,即使是这些学生,在进一步追问时,也会对学校里的实际学习表现出怀疑态度。他们会承认自己掌握了一套技巧,能够揣摩并满足老师的要求。我还要补充一点,许多学生说他们喜欢学校,是因为那里可以见到他们的朋友。孩子们真的很需要朋友;因为学校是孩子们唯一可以见面的地方,所以他们才喜欢学校。如果孩子们有机会在校外与朋友玩,他们将会更喜欢后者。
6. 你谈到人类有一种「自然」状态,这种状态在狩猎采集社会中得到了最好的体现。你您将农业归咎为从狩猎采集社会向工业社会转变的起点,在这种社会中,孩子们通常不喜欢上学,再加上我的延伸思考,成年人通常也不喜欢工作。如果我们「天然」倾向于生活在一种孩子可以自我教育、成年人可以生产自己所需的社会中,为什么我们会偏离那种社会?农业是否纯粹是个错误,它滚雪球般地演变成了当今的社会?
我们在进化史上的大部分时间都是狩猎采集者,因此从这个意义上说,狩猎采集的生活方式对我们来说比现在的生活方式更自然。然而,我们也是适应性非常强且富有创造力的物种。不难想象,大约 12,000 年前,世界各地的人类开始逐渐向农业转变的原因和过程。富有创新精神的人开始意识到,如果他们播种植物,并挖沟引水灌溉,就可以增加作物的产量。最终,这导致了全面的耕作、土地管理、动物驯化等。当然,这也导致了土地所有权、等级制度(因为拥有土地的人对没有土地的人拥有权力)以及分层治理体系的出现。最终,形成了一个孩子必须被训练服从权威,以求生存的世界。这形成了旨在压抑孩子意志而非培养孩子意志的教育体系。我们的学校就是在几个世纪前的这种背景下形成的。现代学校制度的早期发展者在其著作中明确指出,学校的目的是灌输和训练服从;他们公开说学校管理者有瓦解学生自我意志(wills)的责任。请记住,在那个历史时期,「任性(willfulness)」和「罪恶」几乎被视为同义词。
7. 你在结论中提到,你相信「最终,强制体系将会消亡」。随着社会越来越糟糕——更多的腐败、更多的不平等、更多的仇恨(结果是,越来越少的狩猎采集社会价值观)——你为什么认为这会实现呢?
实际上,我不认为我们的社会正变得越来越糟。事实上,即使在我的一生中,我们也在实现更多平等,更少腐败和降低暴力方面取得了巨大进步。如今,无论是理论上还是实践中,社会越来越多地承认不同种族、性别和性取向的人享有平等的人权。正如斯蒂芬·平克 (Stephen Pinker) 在他的著作《人性中的善良天使》 (The Better Angels of Our Nature) 中所记录的,历史表明,全球各种形式的暴力在持续下降,人类的宽容度在增加。当然,我们还有很长的路要走,当今社会存在的种种不公和暴行显而易见,且令人痛心;与此同时,我们正在进入一个重视创造力和主动性的历史时期,工作场所中,不再盲目推崇机械的规则执行和死板的遵从。但我们的教育系统尚未跟上这些趋势,这也是许多人开始认为现行教育制度压抑、且有碍于当今社会健康教育发展的原因。我相信,这种改变会随着越来越多的人离开传统学校体系而发生,而这一趋势会越来越快。
8. 你的儿子现在怎么样了?他上过瑟谷学校吗?——你在书中提到了那所迷人的学校,它允许孩子们自由活动、自我教育并通过准备毕业论文获得学位。
是的,我的儿子在 10 到 18 岁期间一直在瑟谷学校就读。之后他上了大学,并且在那里表现得很好,尽管他认定大学的很多时间都是浪费。他通过阅读未指定的书籍自学到的比完成作业学到的更多。后来他作为一名计算机专家工作了一段时间。现在,他很高兴地成为了一名瑟谷学校的员工。
重点学校对学生造成的巨大心理创伤
所谓的“顶尖学府”通过学业压力对学生造成极度精神痛苦
作者:彼得•格雷 发表于2021.6.15 外网链接| Reviewed by Hara Estroff Marano
原文:The Toxic Consequences of Attending a High-Achieving School | Psychology Today
在这个时代,家长为了把孩子送进重点学校而大显神通。有些家长到郊区买高价学区房,有的愿意花高价送孩子到私立重点就读,另外有些家长聘请辅导教师帮孩子提分,以谋求优质公立学校的名额……很大程度上,中产阶级及以上的家庭更愿意在这方面花大价钱。
可这些家长们不知道,他们正引导着孩子走向失败——不仅是学习的失败,更是人生的失败。如果这些家长们能了解真相,审慎行动,那么,他们会对重点学校避之不及,搬出学区房,省下天价学费和课外辅导的钱,转而用在更快乐的家庭活动上面。在这篇文章中,我将援引众多科学研究,揭示这些真相。其中最重要的是 Suniya Luthar 及其同事在过去二十年完成的研究。
重点中学学生中焦虑、抑郁、药物滥用的比例远高于普通中学的学生
在上世纪九十年代,Luthar 着重研究贫穷对于青少年心理健康的影响。她发现,城市低收入家庭中的青少年焦虑,抑郁,药物滥用的水平更高。她的一位学生挑战她:这些问题真的都是贫穷导致的吗?于是,她对城郊的富人区家庭开展了类似的研究。令人惊讶的是,她发现“富贵子弟”中焦虑、抑郁、药物滥用(包括酒精以及毒品)的水平,甚至要高过低收入家庭中的青少年 (Luthar & Latendresse, 2005)。
在后续研究中,Luthar 团队发现,对青少年精神问题影响最严重的并非是「贫穷本身」,问题出在重点中学的教育上。他们发现,重点中学的富裕学生承受着精神伤痛 (Ebbert et al., 2019),而且,不仅是富裕学生,家庭条件较差的学生也同样备受折磨。这一问题的关键因素,是学生内心中,自我价值的认知,与学习成绩和校外活动成果,关联到了什么地步。
在一次对九所重点中学(包含公立与私立)的研究中他们发现,重点中学学生临床焦虑与抑郁的水平是国家青少年平均水平的六到七倍 (Luthar, Kumar & Zillmer, 2020)。他们还发现,与那些难以获取人身安全和基本生存条件的贫穷学生不同,重点中学学生面临着持续的巨大心理压力。这正是他们焦虑抑郁的根源。
重点中学对学生造成的伤害可能持续终身
纵向追踪研究表明:重点中学对学生造成的精神创伤,从学生时期直到毕业以后,经久不绝。一项研究表明,重点中学的毕业生在临床意义上的酒精成瘾以及药物成瘾比例,要比同龄人高二到三倍,甚至在他们毕业多年后也是如此 (Luthar, Small, & Ciciolla, 2018)。有一项长期研究从 1960 年左右开始,这项研究表明:择优录取的重点学校学生,比起与他们家庭出身完全相同,但却在普通学校的学生,在毕业后的 10 到 50 年间,各方面表现更糟糕 (Gölner et al, 2018)。普通中学学生,比起择优录取的重点中学的学生,不仅仅心理更加健康,赚的钱也更多,甚至更可能拥有高社会地位。
负面的学业压力来自于家长、老师、同辈,但从根本上来自于自己的内心
许多调查和采访表明:重点中学学生痛苦的根源正是学校造就的无休止的压力。学习成绩要出色,课外活动要出彩。多么沉重的期望。如此一来,稍逊于杰出者为失败。长辈同侪一致坚信,学校推崇的多方位优秀,是进入名门大学的必由之路,更是一份薪资优渥,地位崇高的工作的敲门砖。力有所不及,则为渣滓。
「如果我的成绩单有个 B(而不是全 A),我这一辈子就完蛋了」,我曾经听一个学生亲口这样说。我在之前的文章里也说过(这篇 以及这篇),指望挤进名校便事业顺利,生活美满,是不太现实的,纵向追踪研究已经完全打破了这个幻想。一旦控制家庭背景的因素,比如父母收入,个人能力,进入哪所大学根本不重要。但这项研究被忽视,而信念仍然如同大行其道。
在多变量实验中,Luthar 团队分别研究了家长,教师和同辈对于学业压力的作用 (Ebbert et al., 2019; Luthar, Kumar, & Zillmer, 2020)。
就家长而言,研究人员发现那些强调「外界价值」而非「内在价值」的父母更可能给孩子带来痛苦。外界价值包括成绩、奖杯、荣誉、财富、地位等等社会承认的奖励。而内在价值则包括人生的意义、尊严、对他人的帮助以及真挚的友谊。研究也发现,那些感到「是自己的成就赢得了父母的爱与尊重」的年轻人更加痛苦。
研究人员发现,无论是以好成绩为目标对学生施压的教师,还是那些对所有学生不管不顾的教师,都会对学生造成伤害。理想的教师不应该只关心学生成绩,也应该把学生当作实在的人来关心。
就同辈而言,在“内卷”的环境中成绩不好的学生会被嘲笑,成绩优秀的学生会被嫉妒。这样的环境会阻碍真挚友谊的萌芽,也阻止了同辈之间的鼓励和支持,而这两者对青少年来说是至关重要的。不仅如此,竞争环境也助长了(软性)霸凌以及作弊。
在这样悲剧的环境中,重点学校的学生们会一步步“内化”压力。他们会在自己的内心深处制造一个最为苛刻的批评家,不断刺激自己:「如果我做不到最好,那么我就是废物一个。」这时,他们会开始折磨自己,或者开始幻想 ,尝试或真的去自杀。我们这个社会对学习成绩的强调已经陷入了癫狂,这一点在重点中学里得到了最为深刻的体现。
----
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
Ebbert, A.M., Kumar, N. L., & Luthar, S. S. (2019) Complexities in adjustment patterns among the “best and the brightest”: risk and resilience in the context of high achieving schools. Research in Human Development, 16, 21-34.
Göllner, R., Damian, R. I., et al. (2018). It’s not only who you are but who you are with: high school composition and individuals’ attainment over the life course. Psychological Science, 29, 1785–1796.
Luthar, S., Kumar, N., & Zillmer, N. (2020). High-achieving schools connote risks for adolescents: problems documented, processes implicated, and directions for interventions. American Psychologist, 75, 983-995.
Luthar, S., & Latendresse, S. J. (2005). Children of the affluent: Challenges to well-being. Current Directions in Psychological Science 14, 49-53.
Luthar, S. S., Small, P. J., & Ciciolla, L. (2018). Adolescents from upper middle class communities: Substance misuse and addiction across early adulthood. Development and Psychopathology, 30, 315–335.
玩耍的价值 I:玩耍的定义给人以启示
原文:The Value of Play I: The Definition of Play Gives Insights | Psychology Today
退出的自由是玩耍定义中不可或缺的要素。
发表于 2008 年 11 月 19 日 | 审稿人:Ekua Hagan
对于我们人类而言,玩耍有很多重要作用。它是儿童发展身体、智力、情感、社交和道德能力的手段。它是建立和维护友谊的手段。此外,它还提供了一种精神状态,不论成人还是儿童,这种状态都特别适合进行高级推理、富有洞察力的问题解决,以及各种创意活动。
这篇文章是我计划发表在《玩耍的价值》系列中的第一篇。本期的主题是玩耍的定义。对于玩耍价值的理解,就蕴含在其定义之中。
这篇文章主要是关于玩耍的定义要素,但在列举这些要素之前,我认为有三大要点值得牢记。第一点:玩耍的所有要素都与动机和心态有关,而不是行为本身的外在形式。两个人可能在扔球、敲钉子或者在电脑上打字,但他们之中可能只有一个在玩耍,另一个却不是。要判断哪个人在玩耍,哪个人不在玩耍,你需要从他们的表情和行为细节,推断出他们为什么要这么做、他们在做什么,以及他们对此的态度。
第二点:玩耍并不一定是全有或全无。玩耍可以与其他动机和态度混杂在一起,比例可以从 0% 到 100%。纯粹的玩耍在儿童之间比在成人之间更常见。在成人世界,玩耍经常混杂着其他与成人责任相关的动机。这就是为什么在日常对话中,我们倾向于谈论孩子们的「玩耍」,而成人则会将「玩耍的态度」或「玩耍的精神」带入他们的活动。我们从直觉上认为玩耍是程度问题。当然,我们没有仪器来测量这些东西,但我估计我写这篇博客的行为中大约有 80% 都是玩耍。
第三点:玩耍并不能简单地用某个单一的要素来定义。相反,它由许多要素融汇而成。在我之前研究并撰写这个主题的人已经描述过许多这样的要素;但我认为它们可以在深入汇总为以下五点:
-
玩耍是自主选择且自我导向的。
-
玩耍是一种手段比目的更重要的活动。
-
玩耍具有结构或规则,这些规则并不出于身体或物理的必要,而是源自玩家的想法。
-
玩耍富有想象力,非比寻常,从某种程度上说,它脱离了「现实」或「严肃」的生活。
-
玩耍需要一种积极、机敏,但无压力的心态。
一项活动,越是全面涵盖这些要素,大多数人就会越把它看作玩耍。 所谓「大多数人」,我指的不仅是研究玩耍的学者。甚至年幼的孩子们也大都知道用「玩」这个字去称呼富含这五大要素的活动。这些要素似乎捕捉到了我们对玩耍的直觉。我们要注意,所有这些要素都与参与者在活动中的动机或态度相关。
下面我将逐一阐述这些要素,并通过指出每个要素对思考玩耍目的的一些启示,对它们稍做延伸。
- 玩耍是自主选择和自我导向的;玩家总是可以自由退出。
首要的是,玩耍是自由的表达。玩耍是人们想要做的事情,而不是被迫做的事情。对自由感到欣喜若狂,这就是玩耍的快乐。玩耍并不总是伴随着微笑和欢笑,微笑和欢笑也不总是玩耍的标志;但玩耍总是伴随着一种「对的,这就是我现在想做的事情」的感觉。玩家是自由的主体,而不是别人游戏中的棋子。
玩家不仅可以选择玩或不玩,而且还可以在玩耍过程中主导自己的行动。正如我将在下面论证的,玩耍总是涉及到某种规则,但所有玩家都必须自愿接受这些规则,如果规则发生变化,那么所有玩家都必须同意这些变化。这就是为什么玩耍是所有活动中最民主的一种。在社交型游戏中(涉及多个玩家的玩耍),一名玩家可能会暂时成为带头人,但这只是在其他所有玩家的意愿下。带头人提出的每一条规则都必须至少得到其他所有玩家的默许。
玩耍中的终极自由是退出的自由。一个感觉受到强迫或压力参与某项活动,无法退出的人,并非玩家,而是受害者。退出的自由为社交型游戏中发生的所有民主过程提供了基础。如果一名玩家试图欺负或支配别人,别人就会退出,游戏就会结束;所以想要继续玩耍的玩家必须学会不欺负或支配他人。不同意规则变更的人同样可以退出,这就是为什么玩耍中的带头人必须得到其他玩家的同意才能更改规则。开始感觉在玩耍中无法满足自己的需求或愿望的人会退出,这就是为什么孩子们在玩耍中学会关心别人的需求,并努力满足这些需求。正是通过社交型游戏,孩子们学会了如何在不靠教导来满足自己的需求,同时满足他人的需求。这可能是任何社会中人们可以学到的最重要的一课。
关于玩耍是自主选择和自我导向的这一点,被很多试图控制孩子玩耍的成年人忽视了,或许他们根本不知道这一点。成年人可以和孩子一起玩耍,在某些情况下,甚至可以成为孩子玩耍的带头人,但这需要至少和孩子们一样敏感地关注所有玩家的需求和愿望。因为成年人通常被视为权威人物,孩子们在成年人带领下玩耍时,往往感觉无法退出或不同意所提议的规则。因此,当成年人试图引导孩子的玩耍时,结果往往是许多孩子根本不觉得在玩耍。当孩子感觉受到强迫时,玩耍的精神消失了,所有这种精神带来的好处也随之消失。学校里的数学游戏和成人带领的运动,对于那些觉得自己必须参加,并且没有准备好接受成人制定的规则的孩子来说,并不是玩耍。对于自由选择这些游戏的孩子来说,成人带领的游戏可能很棒,但对于那些没有选择的孩子来说,这些游戏可能会让他们感觉像在受到惩罚。
对于孩子们的玩耍而言,成人的玩耍意识同样如此。研究表明,那些在工作中拥有很高自由度的成年人,可以自主安排何时以及如何完成工作,往往会将工作视为玩耍,即使(事实上,尤其是)工作很困难。相反,那些必须按照他人的意愿完成工作的人很少将工作视为玩耍。
- 玩耍是一种手段比目的更重要的活动。
在某种意义上,我们的许多行为是「自由」的,因为我们不觉得是别人迫使我们做这些事情,但在另一种意义上并不自由,或者至少在我们的体验中,并没有感受到它们是自由的。这是因为这些行为是我们为了实现某个必要的、非常渴望实现的目标而感觉必须去做的事情。为了不痒,我们挠痒;为了不被吃掉,我们看到老虎就跑;为了考出好成绩,看枯燥的书;为了钱,做一份无聊的工作。如果没有痒、老虎、考试或金钱需求,我们就不会去挠、逃、学习或做无聊的工作。在这些情况下,我们并没有在玩耍。
在我们为了实现与活动本身无关的某个目标或目的而参与某项活动时,这项活动就不是玩耍。在我们不玩耍时,我们最看重的是行动的结果。行动只是达到目的的手段。当我们不玩耍时,我们通常会选择最短、最省力的方式来实现我们的目标。以非玩耍、目标导向的大学生为例,她会为了达到想要的「优」,每门课程都尽量少学习,并且她的学习目标直接关注于考试成绩。对她来说,与这个目标无关的任何学习都是浪费精力。
然而,在玩耍中,一切都恰恰相反。玩耍是主要为了其本身而进行的活动。玩心大起的学生喜欢进行主题研究,而对考试并不那么关心。在玩耍中,关注重点在手段而非目的上,玩家并不一定寻找最容易实现目的的途径。想想猫咪捕猎老鼠与猫咪戏耍老鼠的区别。前者会选择以最快的方式杀死老鼠。后者会尝试各种捕捉老鼠的方法,效率并不都很高,每次都会放掉老鼠,以便再次尝试。捕猎的猫喜欢结果;玩耍的猫喜欢手段。(当然,老鼠对此一无所知。)
玩耍通常也有目标,但这些目标都被看作是玩耍的内在部分,而不是参与玩耍活动的唯一原因。玩耍的目标相对于达到它的手段来说是次要的。例如,在建造游戏(有趣地建造某物)中,总是以玩家心中的物体为目标。但请注意,在这种玩耍中,主要目标是创造,而不是拥有。孩子们堆砌沙堡时,如果有个成年人过来说:「你们现在可以歇手了,我会为你们做好沙堡。」孩子们会很不高兴,因为这会破坏他们的乐趣。他们是被过程而非成果所激励。同样,玩竞技游戏的儿童或成年人的目标是得分和获胜,但是,如果他们真的在玩耍,那么激励他们的是得分和努力获胜的过程,而不是分数本身或赢得比赛的地位。如果有人宁愿通过作弊而非遵守规则来获胜,或者通过某种绕过游戏过程的捷径获得奖杯和赞扬,那么这个人并没有在玩耍。
可以通过问成年人一个问题来检测他们的工作在多大程度上是玩耍:「如果我能够在不做现在这份工作,还能获得一样的报酬、一样的加薪前景、一样的认可、一样的为世界做贡献的感觉,我会辞职吗?」如果这个人迫切地想辞职,那么这份工作就不是玩耍。这个人越不甘愿辞职或者干脆不辞职,这份工作就越接近玩耍。这是这个人喜欢的事情,无关任何外在回报。
玩耍之所以是创造力和学习的理想状态,一个原因是因为思想专注在手段上。由于目的被认为是次要的,恐惧感消失了,玩家觉得可以自由地吸收新的信息来源,并尝试新的行动方式。
- 玩耍受心中的规则指导。
玩耍是自由选择的活动,但并非无规则的活动。玩耍总是有结构的,这种结构源于玩家心中的规则。这一点实际上是刚才关于玩耍中手段重要性的观点的延伸。玩耍的规则就是手段。玩耍就是按照自选规则行事。这些规则不像物理学的规则,也不像生物学本能那样基本上是自动的。相反,它们往往需要有意识地牢记,并加以遵循。
例如,建造游戏的基本规则是,你必须以一种可以制作或描绘出某样具体物品或设计的方式来处理所选材料。你不会随意乱堆积木;你要根据心中所想创造的形象,有意识地进行堆放。即使是外人看来非常野蛮的打斗游戏(如打闹和嬉戏)也受规则约束 。 例如,在打斗游戏中,一贯的规则是,你模仿真实打斗的一些动作,但并不会真正伤害对方。你不会用尽全力推撞(当你比对方更强壮时);你不会踢、咬或抓。打斗游戏比真正的打斗要受到更多控制;它往往是一种锻炼自我约束的活动。
规则最复杂的玩耍是研究者常说的社会戏剧性玩耍——在玩耍中扮演角色或场景,比如孩子们「过家家」,或假扮结婚,或假扮成超级英雄。这里的基本规则是,你必须遵守你自己和其他玩家对你所扮演的角色的共同理解。如果你在一场「过家家」游戏中扮演宠物狗,那么你就必须像狗那样四足着地行走,像狗那样汪汪叫,而不是说话 。如果你扮演的是神奇女侠,而你和你的玩伴认为神奇女侠从不哭泣,那么即使在摔倒受伤时,你也要忍住不哭。
为了说明社会戏剧性玩耍的基于规则的性质,俄罗斯心理学家 Lev Vygotsky 谈到了两个真实的姐妹——分别七岁和五岁——有时候会玩扮演姐妹的游戏[1]。作为真正的姐妹,她们很少思考她们的姐妹关系,也没有一致的相互行为方式。有时她们相互欣赏,有时争吵,有时互不理睬。但是,当她们玩「姐妹游戏」时,她们总是根据她们对姐妹应该如何表现的共同刻板印象来行动。她们穿着相同,说话相似,总是关爱彼此,谈论她们自己和其他人的区别等。扮演姐妹比成为姐妹需要更多的自控、心智努力和遵循规则。
具有最明确规则的玩耍类别是所谓的正式游戏,例如跳棋和棒球,它们有精确的规则,并形成语言,将解释规则时的歧义减少到最少。这些游戏的规则通常由一代玩家传给下一代玩家。我们社会中的许多正式游戏都是竞争性的,正式规则的一个目的是确保同样的限制适用于所有竞争者。正式游戏的玩家,如果他们是真正的玩家,必须在游戏期间将这些规则作为自己的,并愿意遵守。当然,除了「官方」组织的游戏,玩家通常会根据自己的需求修改规则,但每一项修改都必须经过所有玩家的同意。
在这里,我想强调的主要观点是,玩耍的每种形式都需要很好的自控能力。在不玩耍时,孩子们(成人也是如此)可能根据他们的生物需求、情感和心血来潮行事;但在玩耍时,他们就必须遵从自己和玩伴们认为恰当的方式。玩耍之所以吸引玩家,让他们着迷,正是因为它是按玩家自已发明或接受的规则而组织的。
在研究玩耍的学者中,最坚定地强调玩耍以规则为基础的要素的人是 Lev Vygotsky,我刚刚提到过他关于姐妹扮演姐妹的例子。Vygotsky 在 1933 年初次发表的,关于玩耍在儿童发展中的作用的一篇论文中,就「玩耍是自发且自由的」与「玩家必须遵从规则」两者之间的冲突做出评论 :
「……两者之间的冲突在于,在玩耍中,儿童接受最小的约束一一她可以做她最想做的事情,因为玩耍让她快乐——同时,她又遵从规则,学着遵从最大的约束,因此放弃自己想要的东西,因为臣服于规则和放弃冲动行为实际上构成了通往获得玩耍最大快乐的道路。玩耍不断激发孩子的需求,让他们违背自己的即时冲动。每时每刻,孩子都面对着『游戏规则』与『如果她完全自发行动她会做什么』之间的冲突……因此,玩耍必不可少的特征就是——意愿规则……规则取得了胜利,因为它是最强烈的冲动。这样的规则是内在规则,自我约束及自我决定的规则……通过这样的方式,孩子的最大目标可能在玩耍中实现,这些目标在明天可能会变成她的真实行为和道德的基本准则。」[1]
当然,Vygotsky 认为,孩子对玩耍的渴望如此强烈,以至于它成为学习自我控制的动力。孩子会抑制那些违反规则的冲动和诱惑,因为他追求的是玩耍之中更大的快乐。根据 Vygotsky 的分析,我想补充一点,孩子接受并渴望游戏规则,仅仅是因为如果规则变得太难以接受时,他或她可以随时退出。孩子们心中知道了这一点,冲突就变得不重要了。他们真实生活中的自由并不会被游戏规则限制,因为孩子可以选择在任何时候退出游戏。这也是为什么退出的自由在玩耍的定义之中如此重要。没有了自由,游戏的规则将会变得不可忍受。被要求在真实生活中像神奇女侠那样将会非常可怕,但在玩耍之中——你可以随时离开的国度——却能带来极大的快乐。
与 Vygotsky 一样,我认为玩耍对我们这个物种的许多价值中最重要的是学会自我控制。自我控制是人类本质的核心。我们通常说,当人们不能遵守社会公认的规则,而是冲动地遵循他们的即时驱动和突发奇想时,他们的行为更像「动物」,而不是人类。在任何地方,要生活在人类社会中,人们必须根据有意识的、共享的关于什么是合适的精神概念来行事;而这正是孩子们在玩耍中不断练习的。在玩耍中,孩子们从自己的愿望出发,学习做人的艺术。
- 玩耍富有想象力,非比寻常,从某种程度上脱离了现实。
Vygotsky 指出,玩耍的另一个明显的悖论是,玩耍既严肃又不严肃,既真实又非真实。在玩耍中,人们进入一个位于现实世界中的领域,使用现实世界中的道具,通常是关于现实世界的,玩家称之为真实的,但在某种程度上又在精神上与现实世界区分开来。
「想象力」或「幻想」在社会戏剧游戏中最为明显,玩家在其中创造角色和情节,但在人类所有其他形式的玩耍中也都存在一定程度的想象力。在粗暴的玩闹中,战斗是假装的,而不是真实的。在建造游戏中,玩家说他们正在建造一座城堡,但他们知道这是一个假城堡,而不是真正的城堡。在有明确规则的正式游戏中,玩家必须接受一个已经建立的虚构情境,这为游戏规则提供了基础。例如,在现实世界中,主教(象)可以选择任何方向移动,但在象棋的幻想世界中,他们只能沿对角线移动。
玩耍的幻想方面与其基于规则的本质密切相关。因为玩耍发生在一个幻想世界中,所以它必须受到玩家心中规则的约束,而不是自然法则。在现实中,人们只有在有真正的马出现时才能骑马;但在玩耍中,只要游戏的规则允许或规定,就可以随时骑马。在现实中,扫帚只是扫帚,但在玩耍中,它可以成为一匹马。在现实中,象棋的棋子只是一小块雕刻过的木头,但在象棋中,它是可以是象或车,具有明确的移动能力和限制,这些都无法从雕刻的木头本身看出。虚构的情境决定了游戏的规则;游戏进行的实际物理世界是次要的。通过玩耍,孩子学会掌控世界,而不仅仅是被动地对其做出反应。在玩耍中,孩子的心理概念占主导地位,孩子将现实世界中可用的元素塑造成符合这一概念的形式。
各种形式的玩耍都有「游戏时间」和「休息时间」,尽管这对某些玩耍形式来说更为明显。游戏时间是虚构时间。休息时间是暂时回归现实的时间——也许是为了系鞋带,去洗手间,或纠正没有遵循规则的玩伴。在游戏时间里,人们不会像莎士比亚笔下的哈姆雷特在舞台上假装谋杀继父时那样说:「我只是玩玩而已。」
有时候成人会对儿童在玩耍时表现出的认真以及拒绝承认自己只是在玩耍感到困惑不解。他们担心儿童无法分辨幻想与现实,而这种担心其实亳无必要。我儿子 4 岁的时候,经常假扮超人,扮演的时段有时候会超过一天。在这样的时段内,他会坚决否认自己只是在扮演超人,这让他的幼儿园老师非常担心。我向他指出,他从来没有从真正的高楼上跳下,或者拦截真正的火车,因此当他最后脱下披风,宣布游戏结束时,他就会知道自己真的只是在玩,这一切也只让他稍感安慰。告诉他们玩就是玩,会去掉魔法咒语,让游戏时间自动变成休息时间。
人类天性的一个惊人事实是,就连 2 岁大的孩子都知道真实与假扮之间的不同。一个 2 岁大的孩子,在杯子里盛满想象的水,倒在布娃娃的身上,然后说:「哦哦,娃娃都湿了」,他知道布娃娃并不是真的被打湿了。想要教这么小的孩子这样细微的概念,比如假扮,是不可能的,但是他们依旧能理解它。显然,思维的虚构模式,以及区分这种模式与真实摸式的能力,是人类天生就具备的。这种与生俱来的天赋其实是人类天生的玩耍能力的一部分。
在成人的玩耍中,玩耍的幻想元素通常不像在儿童玩耍中那么明显,或者说不那么完整。这也是成人的玩耍不那么典型和纯粹的理由之一。但是,我想说,在成人的活动中,幻想占据了很大一部分,它还是我们判断哪些活动是玩耍的直觉的主要因素。设计房屋的建筑师设计的是真实的房屋,但他在设想房屋构造的时候加入了大量想象,想象人们可能会怎样使用它,想象如何让它与他心中某些美学观念一致。在房屋建成之前,设计师在心中的图纸上建造了一栋虚构的房屋,这个说法也是合情合理的。
写这篇博客对我来说近乎玩耍,对此,我不仅考虑到了这项工作的自由感、享受过程的乐趣,以及我欣然接受的写作规则,还考虑到了其中涉及到相当程度的想象力。我没有编造事实,但我是在编造串联它们的方式,我在想象你可能会如何回应我写的内容。有时我的幻想甚至更进一步,我想象我提出的观点会对社会产生一定的积极影响。所以,在这,幻想推动着我,就像它推动着一个孩子建造沙堡或假装成超人一样。部分幻想可能最终变成现实,但这并不影响其作为幻想本身。
- 玩耍需要一种积极、机敏,但无压力的心态。
最后的这一玩耍要素是从其他四个要素自然而然地得出的。因为玩耍涉及到对自己行为的有意识控制,关注过程和规则,所以需要一个积极、机敏的头脑。玩家不仅仅是被动地从「环境」中吸收信息,或者是条件反射地对刺激作出反应,或者是根据习惯自动行事。此外,由于玩耍不是对外部需求或强烈生物需求的回应,所以玩耍的人在很大程度上不受到压力或紧张情绪的影响。并且,由于玩家的注意力更多地集中在过程而不是结果上,所以玩家的思绪不会被失败的恐惧分散。因此,玩耍时的头脑是积极、机敏的,但并不紧张。玩耍的心理状态被一些研究人员称为「心流」。注意力集中在活动本身,自我和时间意识减弱。思绪沉浸在游戏的观念、规则和行动中。
关于玩耍的心理状态这一点,对于理解玩耍作为一种学习和创造性生产方式的价值非常重要。许多心理学实验反复表明,机警但无压力的玩耍心态正是创造力和学习新技能的理想状态。这些实验通常不被描述为关于玩耍的实验,但将它们解释为玩耍实验也无可厚非。实验表明,强烈的表现压力(导致非玩耍状态)可以提高在对个人来说心理上容易或习惯性的任务上的表现,但会降低需要创造力、有意识的「决策制定」或学习新技能的任务上的表现。相反,任何减轻个人对结果的关注,增加个人因任务本身而享受任务的事物——也就是说,任何增加玩耍性的事物——都会产生相反的效果。
强烈的表现压力通过将注意力集中在目标上,降低了关注手段的能力,从而抑制创造力和学习。在有压力的状态下,人们往往会回到本能的或者习惯性的做事方式。这种应对压力的方式在许多紧急情况下是适应性的。当老虎追你时,你会使用已经学会的逃跑或躲藏的方法;这可不是尝试新方法的好时机。任何领域的专家通常可以在有压力的状态下表现良好,因为他们可以依靠自己学过的、习惯性的应对方式,而不需要学习新东西或创造性地行动。他们可以关注运用已成为习惯的行动,以实现最佳结果。
当我们通过不断评估学生的作业来迫使他们在学校表现优秀时,我们让他们进入了一种非玩耍、以目标为导向的状态,这可能会激励那些已经知道怎么做的人表现出色,但会抑制那些还不知道怎么做的人的尝试和学习。压力加大了专家与新手之间的表现差距。然而,即使是专家,如果要达到更高水平的专业技能,也必须在他们擅长的领域进行玩耍。在某些领域,如艺术和论文写作,无论一个人有多少经验,都需要创造力,而在这些领域,爱玩的人总是表现得最好。
当一项活动变得非常容易、习以为常,不再需要有意识的精神努力时,它可能会失去作为玩耍的地位。这就是为什么玩家要不断提高游戏难度,或者改变游戏,或者不断提高成功的标准。游戏只有在需要积极、警觉的头脑去完成时才算是游戏。
这个关于玩耍的扩展定义对你来说有道理吗?它是否符合你在日常生活中思考玩耍的方式?我是真想知道答案。为了我自己的工作,我想确保我使用的玩耍概念与人们在日常话语中津津乐道的玩耍概念相吻合。我非常期待听到你对此的看法。
正如我所说,接下来的几周,我将详细阐述玩耍对于儿童和成人的各种作用,并不时参考我在这篇文章中提供的玩耍定义。敬请期待。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
Lev S. Vygotsky, “The Role of Play in Development,” in M. Cole, V. John-Steiner, S. Scribner, & E. Souberman (Eds.). Mind in Society: The Development of Higher Psychological Processes, 92-104. (1978, original essay published in 1933).
玩耍的价值 II:玩耍如何增强推理能力
原文:The Value of Play II: How Play Promotes Reasoning | Psychology Today
玩耍可以增强我们的想象力,从而提高解决问题的能力。
发表于 2008 年 12 月 4 日
二十年前,一对英国研究人员报告了一系列实验,实验表明,在玩耍的情境下,非常年幼的儿童可以解决他们在严肃情境下似乎无法解决的逻辑问题。
他们测试的问题是三段论,是最早由亚里士多德提出的古典逻辑问题。三段论要求推理者将两个前提中的信息结合起来,以判断一个特定结论是真是假,还是无法确定(无法由前提确定)。如果前提与现实一致,三段论通常很容易,但当前提与现实相悖时(与现实相矛盾),其难度就提高了。在英国研究人员进行这些实验时,人们普遍认为,解决与现实相悖的三段论需要的推理能力,是小孩子完全不具备的。
以下是研究人员使用的一种与现实相悖的三段论示例:
「所有猫都会『汪汪』叫」(大前提)。
「Muffins 是一只猫」(小前提)。
「Muffins 会『汪汪』叫吗?」
先前的研究——包括著名的瑞士发展心理学家 Jean Piaget 的研究——表明,10 或 11 岁以下的儿童通常无法正确解决这样的三段论(也就是说,他们无法给出逻辑学家认为正确的答案)。当英国的研究人员用严肃的语气向年幼的儿童提出这样的三段论时,孩子们的回答符合 Piaget 和其他人的预期。他们说,「不,猫会『喵喵』叫,不会『汪汪』叫。」他们表现得好像无法思考与现实世界经验不符的前提。但是,当研究人员用一种轻松的语气,用表明他们在谈论「假想」世界的措辞提出同样的问题时,年仅 4 岁的孩子很容易解决这些问题,甚至很多 2 岁的孩子也能解决这些问题![1] 他们说:「是的,Muffins 会『汪汪』叫。」
想想看:在玩耍中,4 岁的孩子轻松解决了他们在 10 到 11 岁左右才能解决的逻辑问题!
玩耍的心态如何引导幼儿找到三段论的「正确」答案
Piaget 和他那个时代的其他哲学家、心理学家通常在两种推理之间划清界限——「具体」推理和「抽象」推理(Piaget 称之为「假设演绎」推理)。他们认为,第一种推理依赖于对所思考条件的直接、具体、先前的经验,而第二种推理依赖于具有数学基础的形式逻辑,可以应用于问题,而不考虑个人对问题具体内容的经验或缺乏经验。一些哲学家和心理学家进一步认为,几乎所有人都会自然发展出具体推理能力,而抽象推理需要西方学校提供的特殊培训。还有一些人,包括 Piaget 在内,认为抽象推理确实是自然发展的,但通常直到儿童大约 11 岁时才显现出来。根据 Piaget 的说法,年幼的孩子不能解决与现实相悖的三段论,因为他们缺乏抽象推理的能力。但 Piaget 错了。
如今,包括我在内的许多(如果不是大多数)发展和认知心理学家都不同意一个观念,即具体推理和抽象推理之间存在区别。我们认为,所谓的抽象推理,其实就是将看似抽象的问题转化为具体问题的心理转换,也就是说,将问题转化为另外一种问题,是个体在现实世界中曾遇到并解决过的。这些心理转换涉及到想象力,甚至年幼的孩子也具备这种能力。从这个角度来看,人类进行的所有推理都是具体的;只是对于有些问题,在将它们转化为具体形式时,需要更多地运用想象力。[2]
人类的玩耍活动,从定义上讲,包含了想象力(参见我 2008 年 11 月 19 日的文章)。玩耍让我们自然地思考事物「可能是」什么样子,而不仅仅是它们现在「是」什么样子。在玩耍的心态下,任何人都可以轻松地想象并思考一个世界,人们可以在其中飞翔,时间机器可以将我们带到过去,或者所有的猫都会汪汪叫。年幼的孩子们是玩耍的大师,因此,他们能在玩耍的背景下解决与现实相悖的三段论,实属意料之中。
为什么 11 岁的孩子可以在严肃的情境中解决与现实相悖的三段论,而 4 岁的孩子则需要一个充满趣味的情境?我认为答案与年龄差异在推理能力上的差异关系不大,更多的是与他们理解研究者提问目的的差异有关。4 岁的孩子误解了研究者的目的。他们认为,当成年人用严肃的语气向他们提问时,他们需要给出严肃的答案,关于现实世界的真实答案。所以,他们相应地回答——「猫不会『汪汪』叫。」另一方面,11 岁的孩子,尤其是上过学的 11 岁孩子,意识到这个问题和现实无关,而是一个逻辑测试,所以他们接受了与现实相悖的前提,并给出了研究者想要的答案。他们意识到这是研究者玩的一个游戏,与虚构世界而非现实世界有关。而 4 岁的孩子只有在研究者通过语气和措辞明确表示这是一个游戏时,才能认识到这种游戏般的特质。
研究人员发现,其他文化中没上过学的成年人在进行反事实推理时会「失败」,就像我们文化中的幼儿一样。过去,这被解释为一种证据,表明学校教育对抽象思维的发展是必要的。但我猜想,这些成年人在这类问题上「失败」的原因与我们文化中的幼儿一样;他们误解了问题的意图。我敢打赌,如果研究人员以一种富有趣味性的方式向没上过学的成年人提出相同的问题,他们也能轻松解决。
我的核心观点是,玩耍能自动引发假设推理。它使我们思考虚拟世界,那里一切皆有可能,并让我们去推理这些可能性,而不仅仅局限于目前真实存在的事物。这种形式的玩耍促进了对事先规划至关重要的思维方式,这种思维不仅对所有理论科学至关重要,而且对所有事先规划也至关重要。在这种规划中,我们必须设想可能发生的事件,并思考如何应对这些事件。
请不要从这个简短的讨论中得出错误的结论。我并不是在主张,从教育角度来说,有意识地引导孩子们进入玩耍状态以提高他们的推理能力是个好主意,就像研究人员在实验中所做的那样。孩子们会自然地玩耍,而正是通过自然的玩耍,孩子们才能锻炼推理能力。那些被认为可以提高他们推理能力的老师操纵下玩耍的孩子,很快就会学会抵制这种操纵。从长远来看,只有自主选择、自我引导的玩耍才是真正的玩耍。孩子们会通过他们自己选择的玩耍方式来锻炼推理能力;我们不能替他们这样做,也不应该尝试这样做。正如我在之前的文章中所提到的(例如,2008 年 9 月 30 日的文章),我们需要做的就是为孩子们提供一个可以安全、自然地与不同年龄群体的其他孩子一起玩耍和探索的地方。他们会自己处理好剩下的事情。
一个让大学生解决经典洞察问题的趣味实验
下面是另一个实验例子,展示了玩耍心态在提高解决问题能力方面的作用。这次实验的对象是大学生,问题是一个经典的洞察问题,被称为「蜡烛问题」。在这个任务中,实验对象被给予一小蜡烛、一盒火柴和一盒图钉,并被要求将蜡烛固定在布告栏上,使蜡烛能够点燃并正常燃烧。他们只能使用给定的这些物品。解决问题的关键在于意识到可以将图钉从盒子里倒出来,然后将盒子钉在布告栏上,作为一个架子来放置蜡烛。在典型的测试情境中,很少有人能解决这个问题。他们没有意识到图钉盒子除了用作容器以外,还可以有其他用途。
在实验中,一些受试者在面对蜡烛问题之前观看了一段滑稽喜剧片段,而另一些人观看了一部严肃的电影,还有一些人则没有观看任何电影。结果发现,观看滑稽喜剧的受试者解决问题的成功率大大提高了。[3] 研究人员的解释是,愉快的心情拓宽了思维,从而导致洞察力。我的解释与此类似,但强调了玩耍的作用。我认为滑稽喜剧让受试者进入一种充满玩心的状态,正是这种玩心,而非仅仅是快乐本身,导致了思维方式的拓展。在玩耍中,我们经常以新的方式看待物品和信息。在严肃的心态下,无论我们是否快乐,我们都无法想象一个图钉盒可以成为一个架子;但在充满玩心的状态下,这种想象力就轻而易举地涌现了。在玩耍中,我们经常想象物品不是它们原本设计的样子。在玩耍时,扫帚可以成为马,顶针可以成为主教,图钉盒也可以轻易成为一个架子。
我认为,玩耍在我们这个物种中的主要目的之一,就是促进我们运用想象力来解决问题。我们似乎是唯一一种能以富有想象力的方式思考的动物。想象力为我们的创新能力、创造力和事先规划的能力奠定了基础。我相信,我们巨大的玩耍能力和渴望,在进化过程中,部分原因是为了促进我们发明、创造和规划的能力。当我们充分让孩子们自由玩耍时,我们为他们提供了锻炼和发展这些能力的机会。当我们在工作和家庭生活中保持轻松的玩心时,我们为自己提供了解决可能棘手问题的环境。
-------------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
-------------
参考文献
-
Dias, M. G., & Harris, P. L. (1988). The effect of make-believe play on deductive reasoning. British Journal of Developmental Psychology, 6, 207-221.
-
I elaborate on the idea that "abstract" thought is really just concrete thought coupled with imagination in my textbook, Psychology, 5th edition (2007), pp 348-351.
-
Isen, A. M., Daubman, K. A., & Nosicki, G. P. (1987). Positive affect facilitates creative problem solving. Journal of Personality and Social Psychology, 52, 1122-1131.
玩耍的价值 IV:自学新技能的自然方式
原文:The Value of Play IV: Nature’s Way of Teaching Us New Skills | Psychology Today
玩耍的教育力量源于它的无关紧要。
发布于 2009 年 1 月 1 日
从生物学进化论的角度来看,玩耍是一种本能的方式,确保年幼的哺乳动物(包括幼童在内)实践并熟练掌握一些技能,以便在各自的生活环境中生存并繁衍。早在一百多年前,德国哲学家、博物学家 Karl Groos 就提出并发展了这种玩耍实践理论,他在两本书里都呈现了相应的证据——《动物的玩耍》(1898 年)和《人类的玩耍》(1901 年)。
动物幼崽通过玩耍来练习生存技能。
Groos 在他对进化和玩耍的思考上超越了他的时代。他理解了查尔斯·达尔文的著作,并对本能有着更为深刻、现代的理解。他认为,动物,尤其是哺乳动物,必须不断变化,学会利用自己的本能。哺乳动物幼崽出生时就具备生物动力和倾向(本能)做出某些行为。但是,为了提高效率,这些行为必须不断实践、改进。根据 Groos 的说法,玩耍本质上是一种练习其他本能的本能。在《动物的玩耍》(第 75 页)中,Groos 写道:「动物不需要被告知去玩耍,因为它们年幼而天性爱玩,它们有一段特殊的年幼时期以供玩耍,因为只有这样,它们才能用个体经验弥补遗传上的不足,以面对生活中即将到来的各种挑战。」结合他的理论,Groos 根据发起玩耍的技能种类将动物玩耍分类,包括运动玩耍(跑步、跳跃、攀爬、在树上荡秋千等)、狩猎、格斗和护理玩耍(假装照料婴儿)。
Groos 对玩耍的生物学目的的解释,让我们更好地理解动物世界之中的玩耍模式。首先,它解释了为什么动物幼崽比成年动物玩得更多:它们玩得更多,是因为它们需要学习的地方更多。它还解释了为什么哺乳动物比其他动物玩得更多。昆虫、爬行动物、两栖动物及鱼类出生时就具备了一些相当固定的本能,它们的生活方式决定了它们不需要学习太多就能生存,并且目前很少有证据能够说明它们也会玩耍。而另一方面,哺乳动物的本能则更为弹性多变,必须要通过玩耍提供的机会不断学习及实践才能增补和塑造。
Groos 的理论还解释了不同种类的动物之间的玩耍差异。在哺乳动物中,灵长类(猴子和猿类)是灵活性和适应性最强的一类,它们需要学习的东西最多,因此它们是所有动物中最爱玩的。而在灵长类动物之中,又数人类、黑猩猩和倭黑猩猩(一种与黑猩猩和人类密切相关的猿类)需要学习的东西最多,它们是最喜欢玩耍的物种。同样,在哺乳动物中,食肉动物(包括犬科和猫科动物)通常比食草动物更喜欢玩耍,可能是因为猎取食物比吃草需要学习更多技能。除了哺乳动物之外,唯一一种能够被观察到经常玩耍的动物就是鸟类了。最喜欢玩耍的鸟类是鸦科(乌鸦、喜鹊和渡鸦)、猛禽(鹰及其近亲)和鹦鹉。它们的寿命都很长,与其他鸟类相比,它们的脑体比例更大,让它们在社交生活中游刃有余,并且能轻松获得食物。
玩耍的目的是促进技能学习,这有助于我们理解不同物种在玩耍类型和玩耍数量上的差异。在很大程度上,你可以通过了解一种动物必须具备哪些技能才能存活及繁殖,从而预测它们会玩什么。狮子幼崽和其他捕食者的幼崽会玩跟踪和追逐的游戏;斑马、小羚羊和其他被狮子等捕食的动物会玩逃跑和闪躲的游戏(参见关于追逐游戏和运动的文章);小猴子会玩在树枝间荡秋千的游戏。在雄性动物为争夺雌性而互相斗争的物种中,雄性幼崽比雌性幼崽参与的打闹游戏更多。至少在某些灵长类动物中,雌性幼崽(而非雄性幼崽)会进行大量的寓教于乐的抚养游戏。
人类孩子通过玩耍练习各种技能,包括他们文化中独特的技能。
在《人类的玩耍》一书中,Groos 将对于动物玩耍的理解延伸到人类。他指出,人类比其他任何物种都更有必要学会不同的技能,这些技能取决于他们发展的独特文化。因此,他认为,自然选择使得人类孩子产生了强烈的内驱力,去观察长辈的活动,并将这些活动融入他们的玩耍中。每个文化中的孩子都会玩耍那些对所有人来说至关重要的活动的一般类别,但他们在每个类别中的具体玩耍形式受到周围活动种类的影响。当孩子们自由时,他们会比其他任何物种的幼崽玩耍得更多,也会以更多样化的方式玩耍,因为他们需要学习的东西更多。
与 Groos 的理论一致,孩子们的玩耍方式促进了人类在各个领域必须发展的技能:
• 和所有哺乳动物一样,我们需要强壮身体,并学会协调运动,因此,我们会参与许多体育游戏,包括追逐和混战,这些游戏与其他哺乳动物的玩耍方式非常相似。然而,在许多其他方面,我们是独一无二的,而我们的玩耍也反映了这种独特性。
• 我们是语言动物,所以我们有语言游戏,教会我们说话。
• 我们是智人,是有智慧的物种,我们能够理解世界,因此我们会玩探索游戏,它将探索和玩耍结合在一起,提高我们的理解能力。
• 我们是依赖建设而生存的动物——包括建造庇护所、制造工具、帮助我们交流及迁移的装备——所以我们有许多建设型游戏教我们建设。
• 我们是一种高度社会化的物种,需要与他人合作才能生存,所以我们有许多形式的社交游戏,教我们协作、抑制自己的冲动,让我们被社会接受。
• 我们是富有想象力的动物,可以想象出根本不存在或不在眼前的事物。所以,我们有幻想游戏,可以培养和锻炼我们的想象力,并为逻辑性思维的发展提供基础。
这些我用粗体表示的术语,并不是指互不相容的玩耍(游戏)类别,而是指玩耍可以发挥的各种功能。任何一种玩耍都可能同时具备这些功能。活泼的户外团体游戏可能同时是体育游戏、语言游戏、探索游戏、建设游戏、社交游戏和幻想游戏。玩耍,以其所有形式结合在一起,赋予我们完善的功能,让我们成为真正的人类。(关于这些观点的拓展,请参阅关于各种玩耍如何符合人类生存需求的文章。)
同样与 Groos 的理论一致的是,跨文化的玩耍研究表明,孩子尤其喜欢参与他们所在文化中最受重视的活动。采猎文化中的孩子会玩狩猎和采集游戏,使用成年人在这些文化中使用的工具。农耕社会的孩子会玩养殖动物和种植作物的游戏。在现代西方文化中,孩子们会玩涉及阅读和数字的游戏,如果他们生活在重视这些的环境中,他们还会玩计算机和其他现代技术工具,这些都是当今的工具。
在 Groos 的基础上,我想补充的是,孩子不仅会对周围成年人中最推崇且最受重视的技能产生兴趣,而且对社会前沿的新技能更感兴趣。正因为如此,孩子通常比父母更快学会使用新技术。从进化论的角度来看,这绝非偶然。从遗传学的本能来看,孩子意识到他们需要学习的最关键技能是那些将来越来越重要的技能——他们这一代人的技能,这可能与他们父辈那一代人的技能有所不同。新生事物吸引力的价值在现代尤为明显,毕竟,需要掌握的科学和技术更新得非常快。
玩耍的本质让它在锻炼技能方面得心应手。
从定义上讲,玩耍是一种心理上脱离现实世界的活动。它是为了自身而进行的活动,而不是为了达到某些真实而严肃的目标,如食物、金钱、奖励、赞美或给某人的简历增光(请参阅关于玩耍定义的帖子)。当我们为玩耍的孩子提供这些奖励时,我们就把他们的玩耍变成了不再是玩耍的东西。因为玩耍是为了自身而进行的活动,而不是为了追求游戏之外的某个具体目标,所以人们常常认为玩耍是轻浮的,无关紧要的。但这里有一个美妙的悖论:玩耍的巨大教育力量恰恰在于它的无关紧要。
玩耍为教育这一严肃目的提供服务,但玩耍者并非故意进行自我教育。玩耍者只是为了玩耍的乐趣而玩耍,而不是为了其他目的;教育只是一个副产品。如果玩耍者是为了一个严肃的目的而玩耍,那么玩耍的很多教育力量就会丧失。
正因为玩耍的孩子并不操心他们的未来,也不会因为失败遭受现实世界的任何后果——也就是说,正是因为游戏的无关紧要,孩子们在玩耍时并不害怕失败。由于他们玩耍时并不在寻求成人的赞扬或奖赏,他们的行为并不会受到评价的困扰。恐惧和对评价的担忧会让人的思绪僵化,这对于执行熟悉的行为模式是有帮助的,但对于学习新的行为或思维新的观点则大相径庭。在没有对失败和他人评价的担忧下,玩耍的孩子可以全心全意地去提升他们正在玩耍的技能。他们努力做好,因为做好是游戏的内在目标,但他们知道如果失败了,不会有真实世界的严重后果,所以他们敢于实践,敢于在学习中冒险。他们不需要把部分精力用来去琢磨某个外部评判者在寻找什么。他们可以根据自己的准备情况来指导自己的活动,而不是被别人选择的方式所束缚。
除了无关紧要之外,另一个使玩耍非常适合技能培养的方面是其重复性。你是否注意到大多数玩耍形式都涉及大量重复?比如猫玩弄老鼠,一次次地放走再去捕捉;婴儿咯咯的学说话,反复模仿相同的音节,有时稍作改动,像是在练习发音;学步的小孩子反复走同一条线路;小孩子阅读娱乐时,反复读同一本熟悉的小书。许多有规则的游戏,比如捉迷藏、棒球或者问答游戏,都会有重复的动作或流程。但这种重复从来不是死板的。
因为每一次重复的行动都源于玩家的内心,每一次重复都是一种创新。如果这次的动作和上一次完全一样,那是因为玩家想要它一样,并且尽力让它一样。更常见的是,每一次「重复」的动作都会以某种规律性的方式和上一次的动作有所不同,玩家会有意识地改变行为,以适应游戏或尝试用新的方式完成同样的事情。这种重复的副产品是新技能的完善和巩固。
在传统的学校环境下,孩子在玩耍中自然掌握的技能反而变得难以掌握。以阅读为例。很多年前,我看着我弟弟在上学前通过他自己的玩耍学会了阅读,后来我又看到我儿子做了同样的事情。在瑟谷学校,这个我曾在早前的文章中描述过的民主学校,许多孩子通过玩耍在各个年龄阶段学会了阅读,有时甚至完全没意识到自己在学习。在这个混龄社区,没有正式的阅读课程,孩子学习阅读,是因为阅读是他们社交环境中一个重要的部分。他们看见别的孩子在阅读,听他们讨论读过的书,于是他们也想读书。他们玩的游戏涉及到书面文字。有成年人和青少年给他们读故事。他们愿意一遍遍听同样的故事,直到背下来,然后他们会模仿着「读」熟悉的故事,直到他们假装阅读变成真的阅读。
让我们把这种情况与在常规学校学习阅读相比,对很多孩子来说,这样的学习过程非常痛苦,会对他们对阅读产生终身的刻骨铭心的阴影。设想一下,对于那些因各种原因在学习阅读方面比班上其他孩子稍慢的孩子,这会是怎样的一种感受。阅读成为了衡量他们自我价值的尺度,成为他们焦虑和羞愧的源头,这些负面的情绪不仅使得学习阅读变得十分痛苦,而且使得学习过程异常艰难。但是,如果孩子被允许通过自我指导的玩耍,以他们自己的节奏来学习阅读,那么阅读就能成为并且始终保持生活中的一大乐趣。同样的道理也适用于其他技能。即便是投掷球,在学校里被教导时可能都会变得困难,产生羞愧感,而在玩耍中自然学习则不存在这个问题。
玩耍是大自然赋予我们学习生活技能的方式。然而,我们的教育系统却愚不可及地把玩耍变成了所谓的「课间休息」,这无疑是对玩耍的轻视和边缘化。又把学习变成了所谓的「工作」,究其定义,即那些孩子不愿意去做的事情。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
-------------------
玩耍的多样性与人类生存需求相契合
孩子们在玩耍中掌握他们最赖以生存的技能。
发表于 2008 年 10 月 1 日
从进化的视角来看,玩耍的首要目的是教育。玩耍是大自然巧妙设计的一种方式,旨在确保年轻的哺乳动物能够练习并掌握生存所需的各种技能。我们可以通过了解一种年轻哺乳动物必须掌握的技能,来准确预测它会进行何种玩耍。例如,年轻的狮子和老虎等食肉动物会玩耍潜行、追逐和扑击的玩耍;而年轻的斑马等易被捕食的动物则会玩奔跑、躲避和逃跑的玩耍。年轻的猴子则会孜孜不倦地玩互相追逐和在树枝间灵活攀爬的玩耍。而人类幼儿——作为需要学习最多知识和技能的物种——其玩耍方式的多样性和复杂性远远超过任何其他物种的幼崽。
这是「人类玩耍的教育价值」系列的第一篇文章。在这篇文章中,我想要阐明的核心观点是:人类玩耍的普遍形式——那些在任何人类文化中都能观察到的玩耍形式——与人类在任何地方都必须发展的各种生存和发展技能相当契合。从进化的角度来看,这种巧妙的契合绝非偶然,而是自然选择的结果。
首先需要说明的是,我接下来列举和描述的玩耍类型并非彼此完全独立的范畴。你所观察到的任何一种具体玩耍很可能融合了多种类型的特点。不过,我想你会在这个列表中认出我们习以为常的儿童玩耍种类,因为它们无处不在。在阅读这篇文章时,我希望你不要把玩耍视为理所当然;请仔细思考一下它对儿童成长的非凡价值。
运动玩耍
所有或几乎所有的哺乳动物幼崽都会进行运动玩耍,比如嬉戏奔跑和跳跃,人类幼儿也不例外。世界各地的人们都需要学会控制自己的身体,快速有效地在空间中移动,避免摔倒,并从难以避免的跌倒中恢复过来。正如我在本博客的上一篇文章中提到的,幼儿平均每天花六个小时进行玩耍性行走——纯粹为了乐趣而走路。在这个过程中,他们成为人类普遍技能——双腿行走的专家。在掌握行走之后,接踵而来的是奔跑、跳跃、攀爬、荡秋千,以及——根据环境和文化的不同——游泳、骑自行车、轮滑、滑冰、翻筋斗,以及各种其他体验运动快感的方式。儿童,乃至成年人,做这些事情纯粹是为了快乐,但在这个过程中,他们获得的技能可能在未来多次挽救他们的生命。
粗野嬉闹玩耍
粗野嬉闹玩耍与运动玩耍有诸多相似之处。这种包含玩闹性追逐和打斗的玩耍方式不仅深受人类儿童喜爱,其他哺乳动物也乐此不疲。作为哺乳动物,我们都需要强健的体魄来应对日常生活和突发事件。粗野嬉闹玩耍恰好可以增强力量,提高协调能力,锻炼耐力。儿童不会主动选择举重或跑圈来保持身材,因为那样做既单调又费力。相反,他们更喜欢互相追逐,或是摔跤、玩假想的击剑,直到尽兴疲惫为止。如果条件允许,他们每天都会反复进行这样的玩耍。这种玩耍的乐趣是无可比拟的!
纵观世界各地的文化,男孩和女孩参与追逐玩耍的程度大致相当,但在嬉戏打斗方面,男孩的参与度普遍高于女孩。对于不细心观察的成年人来说,嬉戏打斗有时会被误认为是真正的打斗,然而只要仔细观察,两者的区别就会变得一目了然。事实上,我们完全可以说嬉戏打斗与真正的打斗截然相反。在真正的打斗中,目的是伤害对方或迫使对方退缩。而在嬉戏打斗中,参与者有意识地模仿打斗动作,同时避免伤害对方或让对方感到不快。一些研究者认为,除了单纯的体育锻炼外,嬉戏打斗的一个主要作用是帮助儿童学会自我约束,尤其是帮助男孩学会如何与其他男孩和睦相处。嬉戏打斗是男孩之间建立友谊的方式之一,我们可以将其视为男孩们表达亲密的独特方式。关于这个有趣的话题,我将在未来的文章中作更深入的探讨。
语言玩耍
作为语言型动物,我们通过语言玩耍来学习说话。幼儿学习语言无需他人教导,而是通过玩耍自然习得。语言玩耍的最初阶段是发出类似语言的声音。大约 2 个月大的婴儿开始发出重复的、绵长的元音音调,如「噢-噢-噢」、「诶-啊-诶-啊」。到了 4 或 5 个月左右,这种咕咕声逐渐演变为咿呀学语,婴儿开始将辅音和元音组合在一起,如「巴-巴-布-巴-嘎-哒-哒-哒-巴哒哒」。这种咕咕声和咿呀学语无疑是一种玩耍。它只在婴儿心情愉悦时出现;它有一定的结构;它是自发的;它不是为了获得什么——纯粹是为了玩耍本身。这些特征使它成为真正的玩耍。随着时间推移,婴儿的咿呀学语越来越接近其母语的发音,到一岁左右,孩子会说出第一个词,并可能以玩耍的方式反复重复这个词。
随着孩子们成长,他们开始尝试简单的语法结构。多年前,Ruth Hirsch Weir 在进行博士论文研究时,记录并分析了她儿子 Anthony 在 28 到 30 个月大时的「婴儿床语言」。这种语言出现在 Anthony 独自在婴儿床中时,显然不是为了交流,而纯粹是一种玩耍行为。Anthony 的部分婴儿床语言让人联想到外语自学教程中常见的那种有规律变化的重复短语。以下是一个例子【摘自 Weir 的著作《婴儿床中的语言》】:
「什么颜色?毯子是什么颜色?拖把是什么颜色?杯子是什么颜色?...不是黄色的毯子,是白色的。不是黑色的,是黄色的。不是黄色,是红色。」
在这段话的前半部分,Anthony 正在玩味他新掌握的询问物品颜色的能力,并巩固他对颜色词的理解。在后半部分,他继续使用颜色词,但重点转向了否定和纠正。
语言玩耍不仅发生在孩子独处时,也会在与他人的类似交流中出现。著名发展心理学家 Jean Piaget 在他的著作《童年的玩耍、梦想和模仿》中举例说明了他与 3 岁女儿之间的一段对话:
「那是什么?」(她问,看着一张图片)——「这是一个牛棚。」——「为什么?」——「这是牛的房子。」——「为什么?」——「因为里面有牛,你看到了吗?」——「它们为什么是牛?」——「你没看到吗?它们有角。」——「它们为什么有角?」……如此等等。
这里的女儿几乎可以肯定不是在问问题以获取信息,而是在玩乐地通过运用她新发现的提问能力,并引出父亲的回应来享受互动。所有曾与小孩子相处的人都经历过类似的对话。这些对话可能令人沮丧或愉快,这取决于我们是视为严肃的问题,还是看作是语言上的玩耍。
随着进一步的发展,孩子的语言玩耍可能包含双关、押韵、头韵以及故意的语法扭曲,这些都帮助孩子巩固对语言声音、词汇、语法和意义的理解。仔细聆听任何小孩子的语言玩耍,无论是独自一人还是在假对话中,你都会发现许多练习的例子,这些构建对孩子来说是充满乐趣的挑战。
探索性玩耍
作为智人,我们是这个世界上最具智慧的动物,能够洞察周遭事物的本质。正是这种能力,赋予了我们探索性玩耍的天赋,它巧妙地融合了玩耍的乐趣和探索的好奇心,帮助我们深入理解所处的环境。令人惊叹的是,新生儿甫一降生,就已经展现出对新奇事物的偏爱,他们更倾向于注视从未见过的图案,而非当天早些时候已经接触过的。仅仅数周之后,婴儿就开始将身边可触及的物品放入口中。这种行为与小狗相似,通过口腔来探索世界。到了 5 到 6 个月大时,婴儿逐渐过渡到人类独有的观察方式——灵活运用手和眼睛协同探索。若在一个 6 个月大婴儿的触手可及之处放置一个新奇物品,她会本能地拿起它,放在眼前仔细观察,挤压、摩擦、翻转,在双手间传递,摇晃它,用它敲打其他东西,以及用各种方式与之互动。这些看似随意的行为,实则是婴儿了解物品特性的最佳途径。
我们降生于世,就如同天生的小科学家,与生俱来地渴望理解周遭的一切。无需他人指引,我们自然而然地探索和学习环境,这种倾向伴随我们终生,并随着年龄增长而变得越发深入和复杂。只有当有人试图将这种自然的探索过程强制变成一种任务或工作时,这种与生俱来的学习热情才可能受到抑制。
建构性玩耍
人类之所以能在地球上生存并繁衍,很大程度上得益于我们建造事物的能力。从最基本的庇护所、工具,到复杂的通讯设备、交通工具,都体现了这种能力。正是基于这一特性,我们发展出了建构性玩耍,这种玩耍能够培养和锻炼我们的建造能力。在建构性玩耍中,孩子们会努力将脑海中的想象变为现实。例如,当一个孩子在沙滩上堆砌城堡、用积木搭建宇宙飞船,或者画一只长颈鹿时,他们实际上就在进行建构性玩耍。
在很多情况下,孩子们在建构性玩耍中制作的物品,实际上是成年人在日常生活中使用的「真实」物品的微缩版或仿制品。以狩猎-采集社会为例,孩子们会在玩耍中制作小型的茅屋、弓箭、吹筒、渔网、刀具、弹弓、乐器、挖掘棒、木筏、绳梯、臼杵和篮子等。通过这样的玩耍,他们逐步掌握了建造的技能。等到长大成人,他们就能够制作出精巧实用的真正物品,为生活所用。
建构性玩耍的范畴不仅限于物质层面,还延伸到了词语和声音的创造领域。无论是成年人还是儿童,世界各地的人们都在玩耍中创作故事、诗歌和音乐。在我们当今的文化背景下,孩子们通过玩耍创造的事物种类更是丰富多样,包括计算机程序、文学作品,甚至是用自创符号系统编写的秘密代码。这些例子充分说明,建构性玩耍既可以是动手的,也可以是动脑的,它融合了手工技能和智力活动。
扮演与社会戏剧性玩耍
人类是极具想象力的生物,我们能够思考当前不存在的事物,这就是为什么我们会有幻想玩耍或扮演玩耍——它们培养了我们的想象力。在这类玩耍中,孩子们会为自己虚构的世界设定一些规则,然后按照这些规则进行合乎逻辑的玩耍。通过这种方式,他们实际上在锻炼的是与成年人相同的能力——思考当下不存在的事物。正是这种能力使我们能够规划未来,也让科学家能够建立理论来解释或预测现实世界中的现象。
人类是高度社会化的物种,我们的生存离不开与他人合作。为此,我们发展出了多种形式的社交玩耍。这些玩耍不仅教会我们如何合作,还帮助我们学会控制冲动,使自己的行为符合社会规范。其中,一种被称为社会戏剧玩耍的扮演玩耍形式尤为重要。在这种玩耍中,儿童们会共同编造复杂的情节,并扮演各种角色。这种玩耍的意义远不止于激发想象力。通过角色扮演,孩子们学会了如何根据共同认可的行为准则来塑造自己的行为。例如,在过家家玩耍中,扮演妈妈、爸爸或宠物狗的孩子必须按照大家对这些角色的共同理解来行事。这要求他们克制冲动,深思熟虑,确保自己的行为为他人所接受。在后续的文章中,我会进一步探讨玩耍如何锻炼自我控制能力。事实上,培养自我控制可能是人类各种玩耍最为重要的普遍功能。
在社会戏剧玩耍中,儿童正在磨练协商的艺术。无论是决定角色分配、道具使用,还是确定剧情发展和表演方式,所有参与者都需要达成一致。事实上,这是所有社交玩耍的基本原则——每个人都必须同意。如果有人对决定不满而退出,玩耍就无法继续。由于玩耍的欲望强烈,保持其他玩伴愉快的动机也就随之增强。这一点在所有社交玩耍中都适用,但在角色扮演玩耍的谈判过程中表现得尤为明显。让同伴保持愉悦,使他们愿意陪伴我们并在生活中给予支持,无疑是人类最宝贵的生存技能之一。儿童在社交玩耍中不断练习这项技能。
规则明确的游戏
人类是善于遵守规则的动物,我们能够恪守契约,遵循明确的、获得社会认可的规则。因此,我们创造并参与正式游戏,这些游戏教导我们如何遵循明确的规则。
规则是所有玩耍的核心要素。在玩家心中,规则为各种形式的玩耍构建了框架。以玩闹式的打斗为例,其基本原则是不对对方造成实际伤害——不踢、不咬、不抓挠,如果你比对方更强壮,也不会使出全力。在建构性玩耍中,一个基本原则是你必须努力呈现出你心中构想的物体,而不是毫无目的地涂鸦或随意堆砌积木。在角色扮演玩耍中,普遍规则是你必须根据大家对你所扮演的人物或动物行为的共同理解来行动。在这些玩耍形式中,规则大多是隐含的,虽然未明确表述,但参与者都心照不宣。而在正式游戏中,规则是明确的,即以清晰、明确的方式陈述,使旁观者能够一致判断规则是否得到遵守。所有竞技性游戏都有这样的规则,因为这对保证比赛的公平性至关重要,但许多非竞技性游戏也不例外。舞蹈和像跳绳这样的合作游戏(例如目标是让绳子和跳跃者尽可能长时间保持运动的那种)就是有明确规则的合作游戏的典型例子。
人类社会的正常运转,无论在哪里,都离不开明确和隐含规则的约束。比如,在一次合作狩猎中,每个参与者都需要清楚自己的任务和行动时机,这些都是明确的规定。除此之外,为了维护社区和平,人们还需要遵守相关的规章制度。同时,无论是口头约定还是书面合同,这些社会契约都需要严格履行。而这些至关重要的社交能力,往往可以通过正式游戏得到培养和锻炼。
---------------
当儿童拥有自由玩耍的空间、充足的玩耍时间,以及各个年龄段的玩伴时,他们会以多种方式尽情玩耍。在这个过程中,他们自然而然地学习到人类生存所需的各项基本技能,包括身体协调、语言表达、思维能力、社交能力、自我控制和遵纪守法。这些技能是无法通过直接教授获得的。我们唯一能做的,就是为儿童创造条件,让他们通过进化赋予的愉快玩耍方式自主学习。我们的职责是确保儿童有充足的时间和机会去玩耍,剩下的就交给他们自己了。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
信任型养育:它的式微与复兴的可能
原文:Trustful Parenting: Its Downfall and Potential Renaissance | Psychology Today
我们能通过复兴信任型养育来完成一个历史周期吗?
发表于 2009 年 9 月 16 日 | 审稿人: Ekua Hagan
养育,本质上和所有的人类行为一样,都需要结合其所在的文化背景来理解。养育风格源自更广泛的文化价值观,并且促进后者的延续。
在我上一篇文章中,我讨论了狩猎-采集者的游戏型养育方式。那篇文章是系列文集的一部分,此系列讨论了狩猎-采集者们如何「游戏」化地对待一切社会活动。 我使用游戏一词来指这种平等对待他人,而非区分上下级的态度。在系列文集中,我把狩猎-采集者们的关于政府、宗教、生产活动及养育的游戏性态度与另一类态度做了对比,后者更基于支配关系,且在更晚(相较于狩猎-采集文化)出现的文化中占统治地位。
没人可以在游戏中支配别人的行为;所有的玩家,在游戏规则限定的范围之内,都有自由选择权,并且制定游戏规则时应该考虑所有人的意见。游戏型养育风格就是这样:它要求父母不得支配孩子的行为,反之应给予子女最大的自由,这样孩子们每时每刻都能自己做主。游戏型养育风格的父母允许子女自己做主,因为他们相信孩子们的直觉和判断。
本文中,我使用术语信任型养育,而非游戏型养育,来描述狩猎-采集者们的养育风格,是因为这样含义更明确。信任型养育并不衡量孩子们的发展程度,也不尝试引导发展方向,因为他们相信孩子无需外界引导。他们并不引导孩子的发展,而是在被需要和请求时,通过帮助孩子达成其目标来提供支持。本文旨在:说明为何信任型养育对狩猎-收集者们如此有效,为何它在农业及工业社会被指示型养育取代,以及为何如今信任型养育复兴的时机可能已成熟。
信任型养育很适合狩猎和采集的生活。
正如我曾在先前文章中指出的,狩猎-采集者们重视一种侧重于个体自由及平等的价值观,这种价值观能促进合作、分享、主观能动性和创造力,而在一种不存在财产积累,也没有长期储备食物的世界中生存,需要上述行为与能力。狩猎和采集者们本身经常需要创造性地思考和决策;只有自愿这么做的人才能有很好的表现。这种狩猎-采集的生活方式也需要自己做主。在一种需要长时间讨论以取得共识从而做出群体决策的社会中,在所有人都有发言权的情况下,每个人都必须有自由和能力去表达自己的想法与愿望。 信任型养育是培养理想狩猎-采集者的理想方法。
信任型养育把与狩猎-采集者们需求一致的信息传递给孩子们:「你很有能力。你有视野,有头脑,能想出办法。你了解你的能力和不足所在。通过自主的游戏和探索,你将学到你需要知道的东西。你的需要应该被重视。你的意见也算数。你要对自己的错误负责,我们也信赖你会从中吸取教训。社交不是意志与意志的对抗,而是相互帮助,这样所有人都能得到他们需要和最渴望的东西。我们支持你,而不是反对你。」
狩猎-采集者们的经验告诉我们:这样长大的人通常会变得能干、好合作、民主和快乐,并成为其所属社会的重要一员。他们自愿为所属群体做贡献,并且带着一种游戏精神去这么做,而不是被迫如此。许多年前,一群人类学家曾总结如下:「成功的觅食者……应该是自信的和独立的,并且从小就是这样被教出来的。」
随着农业的进步,养育方式从信任型逐渐转向了指示型和支配型。
发明于一万多年前的农业极大地改变了人类的生存条件。农业的价值自然在于其能在占用更少的土地的情况下,较之于狩猎和采集,生产更多的食物并养活更多的人口。然而代价却是施加在人类自由上的沉重枷锁。
土地所有制和财产积累伴随农业而来,保留和保护个人财富的需求也随之产生,而这种需求有时要用暴力手段满足。值得注意的是,农业使单纯的体力劳动初步出现。狩猎和采集需要主观能动性、技巧、智力、创造力和游戏精神,而农业中的许多劳动步骤是固定的,劳动者不需要额外训练就能掌握。农业也使家庭的规模增大;随着家中增丁添口,孩子们也必须干活——务农和照顾其他儿童——以帮忙养活他们自己和兄弟姐妹们。而狩猎-采集者们所追求的平等自由的理想,则渐渐分崩离析。
农业为支配关系和不平等提供了条件。不占有土地的人——包括儿童和几乎所有女性——变得依附于土地占有者。地主们成为了贵族和主人,没有土地的人便成了仆人和奴隶。最后,世界上绝大多数地区都沿此走向了封建社会:只有少数能成为贵族和主人,绝大多数则是仆人和奴隶。这些变化毫无意外地引发了社会价值观的巨变。例如,游戏化和平等的宗教变得极其严肃和等级森严,传递着服从而非自由的讯息。((详见于 2009 年 6 月 18 日的文章)。显而易见,养育方式也会随着上述的变化而改变。
狩猎-采集者们为了生存,需要变得独立自主,然而大多数狩猎-采集者的子孙后代生存的前提是服从。所以,养育的目的也就成了培养服从和恭顺的孩子。狩猎-采集者们的养育旨在提高独立性和积极性,然而生活在早期农业社会及封建社会的人们的养育压抑了上述品质。一个达成此目的的常见做法是体罚。干活少的孩子会挨打。对父辈或其他「主人」不敬的孩子会挨打。成年女性和仆人也经常受此待遇。
许多研究都表明经济民生与养育方式之间存在某种关联。例如,一项于五十余年前发表的大型统计研究显示:一个社会常用的养育方法倾向服从性而非自主性的程度,与其对农业(而非狩猎或采集)的依赖水平高度相关。[2]
若要说工业发展带来了什么影响,那就是孩子们的积极性和自主性被进一步打压。早期工业社会,甚至比农业社会更甚,需要大量密集劳动力,并且其中相当大一部分是儿童。孩子们和大人一样,要在糟糕的环境中苦干良久,而且儿童常常因分心而挨打。大多数人仍然依附于「老爷」,但现在「老爷」不再是地主,而是工厂老板。
我们可以合理地猜测早期农业和工业社会的家长们是为了子女好,所以才试图把孩子们揍到听话。当服从为生存必需时,你的确需要抑制个人意志并且学会无条件服从。但是这种养育方法从来就不完美。所有人从天性上来说都有主见、有创造力并且喜欢游戏。狩猎-采集者遵循的才是自然之道。你无法完全抹杀一个人的天性。这就是为何反抗和起义屡禁不止,哪怕有性命之忧。人类不能被驯化成蚂蚁。
现代社会的境况促成了一种指令-保护型的养育方式。
如今大部分,或至少是许多人都反感揍到孩子听话的做法。当下,孩子们的主动性、创造力和自主性得到了广泛的重视。在现在这个世界,我们发现仅有服从是不够的。无技能劳动力在减少并被机器代替,且人们必须变得创新自主,以此设法适应社会。狩猎-采集者的价值观念也常被今人关注与推崇。
但是我们还没有在社会层面上复兴狩猎-采集者的信任型养育方式,而是用一种新的指令性养育方式——指令-保护型——取代了封建和早期工业社会先辈们的指令-支配型养育方式。因为诸多原因,我们渐渐认为童年是十分脆弱的发展阶段。专家们总在照顾孩子的注意事项上喋喋不休。在我们的认识中,孩子们已经失去了自主决策的能力;他们必须被带在身边小心呵护,直到他们可以自立的那一天。
我们被告知必须要保护儿童远离一切危险,也就是要限制他们的游戏和探索。我们必须保证孩子们的健康,而他们身边的一切都是潜在的传染源。我们必须让他们远离图谋不轨的大人,这些坏人可能潜藏在每一个角落。我们也不能让他们被同龄人或者更大的儿童、青少年带坏。我们不能看着他们犯傻;我们经常听到消息说,由于生理原因,孩子们,特别是青少年,都是傻瓜。我们一定要不断给予他们越来越多空洞的表扬,以维护他们脆弱的自尊心 。做到这一点需要我们参加他们的游戏(游戏也需要我们安排好),并给他们加油打气,也需要我们规划好他们的人生以防止他们摔跟头。同时,我们必须保护他们的未来。为了这么做,有人说我们可以逼孩子在一个教育系统上耗上更多年、每天花更多功夫,哪怕这个系统被他们厌恶,并且无法解决他们真正的需要和诉求。
用上述举动和满心善意,今天,我们成功剥夺了孩子的自由,且程度不亚于封建与早期工业社会的父母们。我们不打孩子,但作为他们的供养人,我们使尽了其他办法来控制他们的人生。
复兴信任型养育需要什么?
许多父母想使用更信任孩子的养育方法,但发现这么做很难。焦虑之情很强烈且时刻在脑中盘旋,并且这种焦虑并非无根之木,没法被彻底摆脱。可怕的意外的确会发生;坏人确实存在;不良的同龄人影响很坏;儿童和青少年(包括其余年龄段的人)一定会犯错;而且失败的滋味很糟糕。我们从本性上来说也是循规蹈矩的人。不从众真的很难,还可能会被其他的父母们指指点点。然而特立独行的人确实存在,并且越来越多,乃至可能会改变主流做法与观点。
在接下来的两三篇文章中,我会着手解决上文中标黑的问题。我将讨论我儿时经历的信任型养育、今天信任型养育面临的挑战和对应的解决方案。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
[1] Devore, Murdock & Whiting (1968). In Richard B. Lee & Irven DeVore, Man the Hunter, p 337.
[2] Barry, Child, & Baron (1959), "Relation of Child Training to Subsistence Economy," American Anthropologist, 61, 51-63.]
不请自来的批评是创造力的大敌
原文:Unsolicited Evaluation Is the Enemy of Creativity | Psychology Today
不被控制也不被评判的创造力才能茁壮成长。
发布于 2012 年 10 月 16 日
在我上一篇文章中,我提到了一些证据,这些证据显示在过去二三十年里,随着孩子们的生活(无论在学校内外)越来越受到成人的控制和规范,他们的创造力也在逐渐减弱。现在,我还要分享更多的证据,这些证据表明,自由——包括免受不请自来的评价的自由——是创造力蓬勃发展的关键要素。
纵向研究显示,那些在教育方式上较为宽松和开放的父母,其子女的创造力发展要优于那些管得多、爱评判的父母所养育的孩子。在一项 1970 年代至 1980 年代的经典研究中,研究人员 David Harrington、Jeanne Block 和 Jack Block 调查了 106 名学龄前儿童(3.5 至 4.5 岁)父母的育儿理念和方式。等到这些孩子升入六年级和九年级时,研究人员又请他们的老师根据多个与创造力相关的特征对孩子进行评价。[1]
当孩子们还在幼儿园时,研究人员在实验室观察了父母与孩子互动时的控制程度,并让父母通过 Q 分类法描述自己的教育风格。以下几条陈述被认为是非控制性、非评判性的教育方式:
-
我尊重孩子的意见,并鼓励他们表达自己的想法。
-
我认为孩子应该有时间思考、做白日梦,甚至无所事事。
-
我让孩子自己做很多决定。
相比之下,以下几种说法代表了控制性、评判性的教育风格:
-
我不允许孩子对我发火。
-
我努力避免让孩子和观念或价值观与我们不同的其他孩子或家庭接触。
-
我不允许孩子质疑我的决定。
多年后,教师对孩子们创造潜力的评估包括以下几个方面:
-
搞活动创意多。
-
充满好奇心,喜欢探索,渴望体验新事物。
-
很有趣,容易吸引人注意。
-
在做事时非常投入。
-
力求独立自主。
-
自立自强,充满自信。
研究结果极其显著。教师的评价显示,那些由不施加控制、不带评判的父母抚养的孩子,在青少年时期的创造潜力远超那些由更多控制和评判的父母抚养的孩子。
对评价的预期会抑制创造力
在布兰迪斯大学进行的多项实验中,心理学家 Theresa Amabile 探讨了哪些因素可能促进或抑制创造力。在这些实验中,她常让参与者——不论是儿童还是成人——创作一些创造性的作品,如拼贴画、俳句或短篇故事。[2]完成后,她会让一个专家小来评估这些作品的创造性。虽然创造力难以明确定义,但似乎并不难以被发现。评委们虽然是独立评分,但他们给出的评价却高度一致。通常,那些既原创又令人惊喜,同时又能给人以满足感、意义,富有条理的作品,被认为是具有创造性的。原创但缺乏条理的作品则不被视为具有创造性。
在实验里,Amabile 有时会告诉一部分参与者,他们的作品将由专家小组评审其创造性。对于一些人,她还会说他们的作品将参加一个比赛,最有创意的作品将会获得奖励。而另一些参与者则完全不知道有关评审或创作表现可能带来的任何后果。
实验结果非常一致。在众多实验中,那些创作出最有创意作品的参与者通常是那些不知道自己的作品会被评审的人。他们只是自由地去耍,不关心评价或奖励。
在重体力的任务中,比如举重,或是在单调乏味的工作中,比如数豆子,我们在被评价的情况下通常表现得更好。但在需要创造力、新见解或学习新知识的任务中,如果不被评估——只是自由玩耍,没有压力,也不怕失败——我们的表现反而更佳。评估往往能激励我们努力工作——因为我们都希望给评估者留下好印象——然而,单靠努力是不足以激发创造力的。加倍努力,并不能让人变得更具创造性。要真正发挥创造力,你需要放松自我,让潜意识的心理过程得以充分发挥,这些过程能够带来新奇的联想和创意。这些潜意识过程在你玩耍而非刻意追求赞誉或其他奖励时,发挥得最好。
两种截然不同的心理状态:轻松玩耍与压力引发
在研究情绪对任务表现影响的众多研究基础上,心理学家 Barbara Fredrickson 提出了她所说的「积极情绪拓展与建构理论」。[3] 她的理论认为,积极情绪能扩展我们的感知和思维,使我们能够发现先前未曾察觉的事物,并以新颖、创造性及实用的方式整合思想和信息。相反,她指出,消极情绪会使我们的感知和思维变窄,主要集中在引发这种情绪的刺激上,比如可怕的老虎、讨厌的敌人、评审者或失败的负面后果。
这两种感知和思考的方式各有其用处,它们都是自然选择的结果。在没有直接生存威胁的情况下,我们会花心思去提升自己和身边的人——学习新知、创新、探索新方法、互帮互助。而在面临直接威胁时,我们则会本能地动用智慧应对这些威胁。比如,如果有老虎追你,你最好还是用那些你已经熟练掌握的逃生技巧,而不是去尝试一些新奇但可能失败的方法。因为创新总有失败的风险,所以在失败无法承受的情况下,我们的生理机制会自动压制创造力。
在学校里,评估不请自来,而且后果会很严重,它就成了一种威胁。这种评估会让思维变得狭隘,抑制了「积极建设」的过程。它阻碍了新的学习、新的见解和创造性思维的发展——这本应是学校教育旨在推动的。
我对 Fredrickson 的理论持肯定态度,但我更喜欢称其为「玩耍的拓展与建构理论」。研究表明,能够拓展和促进成长的积极心态,实际上源自于玩耍。玩耍的本质是我们不怕失败,愿意自由尝试新颖和创造性的方法。在玩耍中,我们让想象力与逻辑交织。
因此,随着学校越来越重视考试和评估,孩子的创造力逐渐减弱也就不足为奇了。对于那些认真对待学习的学生来说,连续不断的测试和评估形成了持续的压力。学生的注意力都集中在如何应对这些压力上:我该怎么通过这次考试?我该如何让老师满意?在这样的环境下,保持创造力确实非常困难。
----------------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
------------
参考文献
[1] Harrington, D. M., Block, J. H., & Block, J. (1987). Testing aspects of Carl Rogers’s theory of creative environments: Child-rearing antecedents of creative potential in young adolescents. Journal of Personality and Social Psychology, 52, 851-856.
[2] Amabile, T. (1996). Creativity in context: update to the social psychology of creativity, Boulder, Colo.: Westview Press. Also, Hennessey, B., & Amabile, T. (2010). Creativity. Annual Review of Psychology, 61, 569-598.
[3] Fredrickson, B. L. (2001), “The role of positive emotions in positive psychology: The broaden-and-build theory of positive emotions,” American Psychologist, 56, 218-226. Also, Fredrickson, B. L. (2003), “The value of positive emotions,” American Scientist, 91, 330-335.
玩耍的价值 III:孩子们如何面对生活的挑战
原文:Value of Play III: How Children Confront Life's Challenges | Psychology Today
在那最恶劣的环境中,纳粹死亡集中营,孩子们仍在玩耍。
发表于 2008 年 12 月 16 日
孩子们强烈的玩耍欲望并非为了给他们提供「课间休息」或「娱乐」。这种欲望的产生有着更为严肃的目的——帮助他们生存。在人类的历史和史前时期,玩耍一直是孩子们在自己的文化中获得生存技能、价值观和知识的主要途径。孩子们玩耍并非为了逃避生活的现实;他们在玩耍时面对生活的现实。通过这种方式,他们对现实有了更深入的理解——无论是身体上的,还是智力上的,或是情感上的。
在此博客的前几篇文章中,我已经描述了玩耍如何锻炼和培养孩子的语言、推理、运动、制造以及与他人相处的能力(特别参见 2008 年 10 月 1 日的文章)。我在那里描述的玩耍方式,并不与我们心中孩子们在健康环境中快乐玩耍的形象相悖。但是,玩耍不仅仅只适应于健康的环境。玩耍还帮助孩子们面对并处理他们自己和我们的世界中存在的各种恐怖,无论这些恐怖事物在哪里。
我们总希望把孩子们想象得天真无邪。在一个理想世界里,如果成人们全都天真无邪,孩子们也许也会如此。但世界并不理想,如果孩子们在成长过程中被保护得过度,对他们必须适应的环境毫无认知,那他们会对这个环境缺乏应对的准备。难怪孩子们会抗拒好心的成年人的保护,挣脱那些本意是让他们待在田园般游乐场的束缚,不管何时何地,他们都会尝试出去,去体验真实的世界,并将这些体验融入到他们的游戏中。他们,而不是我们,知道什么是对他们最好的。
我所知的最震撼的证据,关于孩子们通过玩耍来接纳即使是他们环境中最恐怖的事情,可以在 George Eisen 二十年前出版的一本引人注目的书《大屠杀中的孩子与玩耍》中找到。这里有两个概念,它们处于任何人情感范围的两个极端:「纳粹大屠杀」和「孩子与玩耍」。在 Eisen 的书名中看到这两者相邻令人震惊。然而,正如 Eisen 在整本书中向我们解释的那样,被囚禁在纳粹犹太人隔离区和集中营的孩子们确实在玩耍——尽管时间很短,直到他们被谋杀。他们之所以玩耍,并不是因为他们对周围的恐怖事物毫无察觉。他们也不是通过玩耍来否认那些恐怖事物或转移注意力。相反,他们以一种能帮助他们理解、面对并在可能的程度上有效应对那些恐怖事物的方式玩耍。Eisen 的证据来自日记和对幸存者的采访。
在犹太人隔离区,这是被送往劳动和灭绝营地之前的第一阶段,成年人试图为他们的孩子保留一些他们在此之前所熟悉的天真玩耍的影子;但孩子们自己却玩起了适应周围环境的游戏。他们玩战争游戏,玩「爆破掩体」、「屠杀」、「夺取死者衣物」以及反抗的游戏。在维尔纽斯,犹太儿童在玩「犹太人与盖世太保」游戏,在这个游戏里,犹太人会制服他们的折磨者,用自己的步枪(棍子)打败他们。
甚至在灭绝营,那些仍然有足够力气四处走动的孩子们也在玩耍。在一个营地里,他们玩起了一个叫做「挠尸体」的游戏。在奥斯威辛·比克瑙,他们互相挑战去触摸电围栏。他们玩「毒气室」游戏,这个游戏中,他们把石头扔进一个坑里,然后尖叫着模仿人们临死的声音。他们编了一个叫做 klepsi-klepsi(意为偷窃)的游戏,这个游戏是根据营地的日常点名而设计的。一个玩伴被蒙住眼睛;然后另一个人会走过来用力打他的脸;接着,蒙眼布被取下后,被打的那个人必须根据面部表情或其他线索猜出是谁打了他。要在奥斯威辛生存下来,人们必须成为撒谎的专家——例如,偷窃面包,或者知道某人的逃跑或反抗计划——但同时不能露出破绽。Klepsi-klepsi 似乎是为了练习这种技能。
在玩耍中,无论是我们喜欢幻想的甜蜜游戏,还是 Eisen 描述的那种游戏,孩子们都会将现实世界的种种带入虚构的背景,让他们可以安全地直视现实,面对现实,体验现实,并练习应对现实的方法。有人认为,暴力游戏会导致成年人暴力;但实际上,恰恰相反。成年世界的暴力会让孩子们恰当地去玩耍暴力的游戏。除此之外,他们还有什么办法可以在情感、智力和身体上为现实做好准备呢?以为我们可以通过控制孩子们的游戏和他们的学习来改变世界,这种想法是错误的。如果我们想改变世界,我们必须去改变世界;孩子们也会跟着改变。孩子们必须,也会为他们必须努力生存的真实世界做好准备。让我们努力让这个世界真正地,而不是假装地变得更美好。
----------------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
---------------
对成年后的非学校教育者的调查 IV:他们怎样看待自己的非学校教育经历?
原文:What Do Grown Unschoolers Think of Unschooling? IV in Series | Psychology Today
多数人对自己的非学校教育经历感到满意,但也有少部分人感到遗憾。为什么?
发表于 2014 年 7 月 12 日
这是 Gina Riley 和我近期进行的调查的最后一篇报告。调查对象是 75 位成年人(年龄在 18 至 49 岁之间,中位年龄 24 岁),他们在小初高学龄期间没有接受传统的学校教育。这些「非学校教育者」不去学校上课,也不像在家上学的孩子那样,被要求在家进行学校式的学习。他们没有固定的课程安排,不必出席必修课,也没有学业评估测试。虽然父母和其他人可能会提供帮助,但这些孩子的教育主要由他们自己掌控。
有人将非学校教育称为「在生活中学习」。这些非学校教育的孩子在日常生活中成长,并在此过程中学习。他们的人生没有经历过「学生时代」。在玩耍、工作和交流中,他们自然而然地学习。他们也会有意识地学习,解决现实生活中的问题,为未来的生活做好准备;但是,对于非学校教育者来说,这种有意识的学习永远是他们自己的选择,由他们自己主动进行。
在这个系列的第一篇文章中,我介绍了调查方法,列出了部分参与者在开始非学校教育之前最后一个学年的情况(其中 24 人从未接受过学校教育),并对调查结果进行了统计汇总。在第二篇文章中,我深入探讨了他们在非学校教育之后的高等教育经历;第三篇文章则描述了他们的职业追求。总的来说,这些文章中展示的结果表明,参与我们调查的成年非学校教育者在追求高等教育和职业发展方面并未遇到特别的困难。他们更倾向于从事艺术和符合国家科学基金会定义的 STEM 领域的工作,并且很多人已经开创了自己的事业。现在,在这篇文章里,我将详细阐述调查对象对自己非学校教育经历的主观看法。
绝大多数参与者表示,如果他们有孩子,会考虑让孩子接受非学校教育。
他们对调查问卷第 9 题(也是最后一题)的回答,可能就是他们对非学校教育感受的最佳体现:「如果你打算要孩子,你会选择让他们接受非学校教育吗?原因是什么?」
其中一位参与者没有回答这个问题。在其余 74 位参与者中,有 50 人(占 67%)的回答被我们解读为是明确的「肯定」:他们一定会让自己的孩子接受非学校教育,除非孩子明确表达出对其他教育方式的偏好,或是特殊情况的阻扰。其中包括 8 位的回答者,他们已经有了孩子,孩子也到了学龄,正在接受非学校教育。他们选择让孩子接受非学校教育的理由,与他们对自己非学校教育经验优势的描述非常相似。
另有 19 人(占 25%)的回答表明他们可能会考虑非学校教育,但同时也会权衡其他的教育选择,比如更加进步或民主的替代学校。只有 5 人(占 7%)明确表示或倾向于「不会」选择非学校教育。其中,两人对自己的非学校教育经历感到非常不满(后文将详细介绍);另一位虽然认为非学校教育对自己很有效,但对她的弟弟来说效果并不好,因此她认为非学校教育只适合那些极具自我驱动力的人;还有一位更喜欢像瑟谷这样的民主学校,因为它们能提供更强的社群感;最后一位在军队工作,更倾向于像蒙特梭利这样半结构化的学校环境,这样孩子可以学会遵守规则,包括一些看似由他人武断设立的规则。
大部分非学校教育者对自己的社交生活感到满意,并且很看重与不同年龄段朋友的交往。
在家上学者和非学校教育者经常会被问及他们的社交生活。很多人认为,不在学校上学的孩子难以结交朋友,不懂得如何与同龄人相处,长大后会在社交方面表现得很笨拙。我们也提出了有关社会化的问题,即使这些问题可能会让人感到无语。调查问卷的第6题是:「你小时候的社交生活怎么样?你是怎样认识其他同龄孩子的?你作为一个非学校教育者(unschooler)时的社交经历,和你现在的社交经历有哪些相同和不同之处?」
我们对这个问题的答案进行了分类,结果显示,在 75 位参与者中,有 52 位(占 69%)明确表示他们对作为非学校教育者的社交生活感到满意。剩下的 23 位中,9 位描述了「不佳」的社交生活,另外 14 位表达了复杂的感受。社交生活不佳的人主要谈到了社交孤立——我稍后会详细说明。而对社交生活有复杂感受的人,通常是在描述寻找志同道合的朋友的困难——这些困难可能与非学校教育有关,也可能并无关系。(并非所有在校学生都能轻松找到合适的朋友。)
大多数参与者似乎在认识其他孩子和交朋友方面并没有遇到太多困难。在这 75 人中,有 41 位(占 55%)表示,他们的本地在家上学(homeschooling)小组是结交朋友的重要渠道。32 位(占 43%)说,参加各类课后活动——比如舞蹈、戏剧、体育和美术课——帮助他们结识了其他人并交到了朋友。许多人还提到,通过教会或宗教组织、社区或志愿者协会,以及男孩女孩俱乐部(Boys and Girls Clubs)、4H 和童子军等青少年组织,他们也结交了朋友。从事兼职工作的青少年则通过工作结识了其他人。有 8 位参与者特别提到,「不返校营(Not Back to School Camp)」是他们与其他非学校教育者建立长久友谊的地方,他们通过网络在营期结束后继续保持联系。还有些人说,他们的家庭非常爱交际,积极参与社区活动,因此也通过家庭结交了不少朋友。
虽然我们没有专门询问混龄的情况,但 51 位(占 68%)参与者提到,不上学让他们有机会与不同年龄的人交往和交朋友。很多人谈到了与年龄较大或较小的朋友交往的特殊价值。有些人指出,在学校之外的真实世界中,人们必须学会与不同年龄的人相处,因此,至少在这个方面,非学校教育者(包括在家上学者)的社交生活比学校中只与同龄人交往的孩子们更加正常。
一位 19 岁的女孩,她的社交生活特别丰富。她写道:「我在教堂、社区、体育场或各种兴趣班中交到了朋友。无论是商店、邮局还是公园,我都能交到朋友。我交到的朋友来自各行各业,涵盖各个年龄段和不同的社会、经济背景。我们家里一直都是各种人碰头的地方:无论是饥肠辘辘的孩子们来吃饭,还是我妈妈的朋友或兄弟们遇到困难需要暂住的地方,或者只是想在周末远离烦恼的人,我们家都欢迎他们。有时我们会为 20 人做饭,有时只为我们自家人做,生活因此而丰富多彩。在不同情况下见到的不同人,让我对人有了更深的了解。我学会了怎样辨别真正的朋友,并且大多数时候能区分真挚的友谊和短暂的交往。我最好的朋友包括一位热爱舞蹈、心灵手巧的 15 岁女孩,一位正在失明但志向远大的同龄男生,以及一位正在享受退休生活的年长女性。这些朋友让我获得了一些只和同龄人在一起是无法得到的独特视角,我认为是这样。」
下面这个回答被我们归为社交生活不佳这一类。这是一位对自己非学校教育的其他方面都相当满意的加拿大女性写的:「我的社交生活不太理想,主要是因为我们的居住环境。那是一个很小的镇子,有很多偏僻小镇的典型问题,比如酗酒、吸毒和贫困等。回想起来,我意识到大部分与我为邻的孩子都是在糟糕的环境中长大的,他们不了解还有其他的生活方式,但我当时并不明白这些,我是悲惨的。等我成了青少年,我们搬到了另一个省份,我发现自己很难融入当地的在家上学社区,而且最后我也对此并不感兴趣。即使从非学校教育的角度来看,我们家的家庭文化也很不同,所以社交通常都会让我和他人互相造成文化冲击。」
参与者们最看重的是非学校教育给予他们的自由,以及随之而来的个人责任感。
问卷的第 7 题是:「对你来说,非学校教育的主要优势是什么?请回顾你的经历,综合过去和现在的感受,回答这个问题。你认为非学校教育如何帮助你长大?」
大多数参与者都非常热情地谈论了非学校教育的优势。几乎所有人都提到了非学校教育赋予他们的自由,这种自由让他们能够发现并追求自己的兴趣,以自己的方式进行学习。大约 70% 的人还表示,非学校教育让他们成长为自我驱动、自我管理、负责任的人,能够主宰自己的生活。同样比例的人提到了,作为非学校教育者,他们所获得的学习机会是他们若在学校接受教育可能无法享有的。
许多人还谈到了自己平稳过渡到成年生活。非学校教育比学校教育更像成年人的生活。在这个背景下,相当一部分人也谈到了他们在职业生涯上的提前起步(在前一篇文章中有讨论)。他们能够专注并在某些领域成为专家,如果他们在学校上学,这是无法实现的。
一些人还描述了非学校教育是如何让他们更了解自己,发现自己的热情,以及如何在这个世界上发挥自己的个性。在这个背景下,有些人明确写道,他们学会了珍视与众不同的自己,克服了与众不同所带来的恐惧。不过,另有一些(一直接受非学校教育的)人在成长过程中根本就没有体会到这样的恐惧。
将这些回答与我们之前在类似问题上向非学校教育家庭的家长(主要是母亲)所做的调查结果进行比较,非常有趣(参见之前的调查)。在那次调查中,家长们提到非学校教育的两大优势分别是:孩子的学习优势和家庭关系的亲密。在那项研究中,有 57% 的家长报告称,非学校教育在某种程度上改善了他们孩子的学习;同样比例的家长表示,非学校教育使家庭成员能够更多地相处在一起,更和谐地生活(因为没有了学校安排或家庭教育课程的带来的冲突和紧张)。
与之前调查中的家长不同,这次调查中只有 18 位参与者(占 24%)提到,非学校教育让他们与家庭成员的相处时间增加、关系更亲密或生活更和谐。这与我在其他地方表达的观点非常吻合(比如在这里),即孩子们——无论他们对父母的需要和爱有多深——在很多方面都更倾向于向成人世界迈进,超越他们的原生家庭。我认为这就是为什么在本次调查中,许多参与者自发提到了家庭外的跨年龄友谊,以及他们如此注重培养独立和责任感的原因。家长有时会忘记,孩子们的生物使命是超越他们的原生家庭;这个家庭仅仅是他们人生旅程的起点。在这方面,值得注意的是,对非学校教育感到不满的三位参与者的主要抱怨是,他们的父母将他们隔离起来,阻止他们探索家庭或家庭所在的封闭小圈子以外的世界。
这里随机选取了两个对第7问的回答,以展示参与者如何描述非学校教育的优势:
• 一位 37 岁的女性,她在一年级后就离开了学校,写道:「我小时候就感受到的非学校教育的优势,按重要性排序是:1)能按需睡觉,睡足觉,2)有时间做我想做的所有事(比如读书、建造树屋、编织、编排戏剧、骑车、玩游戏、探索树林里的小路、游泳、烘焙、手工制作等等),3)能够工作挣钱,而不受学校时间的限制。现在回想起来,我认为这些都是很大的优势,甚至比我当时意识到的还要多!非学校教育还培养了我最真正的才能——做事有始有终。我能把事情做完。它让我能够『跳出固定思维框架』,现在我能制定计划并付诸实施,乐于在遇到障碍时找到解决方法,并享受自身能力所带来的积极成果。非学校教育如何帮助我成长?嗯,在很多方面,我从一开始就已经以成年人的身份生活,自己负责自己的思考和行动,所以根本没有经历什么突然的转变。」
• 一位 28 岁的女性,之前只进行过一些有课程安排的在家上学,后来转为非学校教育,她写道:「我小时候很开心,因为我有很多时间去玩耍和娱乐。我可以把更多时间花在自己喜欢的事情上,而不是被迫去做我不喜欢的事情。现在作为成年人,我觉得我有时间去探索自己的兴趣,不用被迫参与活动、接受知识和观念,所以我逐渐开始喜欢这些。例如,我从小就自发阅读了很多经典书籍,如果这些书被强加给我,我可能就不会去读它们了。……我从经典书籍中学到了很多,这些都不是在课堂上被别人(带偏见地)教给我的。关于成长为成年人,我学会了直率和独立。我从来没有被强迫去接受性别角色,更没有与此相关的束缚,也没有和同龄女孩一样有不安全感,或是被限制。因为我懂电脑编程,痴迷《星际迷航》,我思维逻辑清晰,行事果断。我敢于直言不讳(虽然这些年来我学会了更多的圆滑),并且我非常独立。我不认为我们的生活有我们想象的那么多限制。」
非学校教育中最常被提及的劣势是要处理他人对此的看法。
调查的第8题是:「对你而言,非学校教育的主要劣势是什么?请从你童年时的感受和现在的感受两方面来回答。你认为非学校教育在你成长为成年人的过程中有没有带来任何障碍?」
在 75 位参与者中,有 28 位并未指出任何劣势,而其他大部分人都认为,与优势相比,这些劣势微不足道。
根据分类,最常见的不利因素是他人的看法——有 21 位(占 28%)的参与者提到了这一点。有趣的是,这也是我们之前对非学校教育的孩子家长进行研究时最常被提及的劣势,当时有 46% 的参与者提到了这一点(详见此处)。在之前的研究中,与孩子相比,父母似乎更苦恼于处理他人的看法。这并不奇怪,因为批评和怀疑更常针对父母而非孩子,父母也更感到对非学校教育的决定负有责任。本次研究中一个典型的评论是:「小时候,我不得不一直解释我们家为什么选择非学校教育,这真是特别烦人。这不是常见的选择,会让人觉得新奇,给我们带来不便。」
排在第二位的不利因素是:一定程度上的社交孤立,这被 16 位(占 21%)的参与者提到。这主要是因为他们身边没有其他非学校教育的孩子,而且和上学的孩子交流也有难度,因为他们的时间安排紧凑,生活方式也不同。例如,有人写道:「对我来说,非学校教育的主要劣势是,13 岁之后我周围就没有其他非学校教育的孩子了……我青少年时期最亲密的朋友,都是在 NBTSC**(不返校营)**认识的,但他们住得很远。」这个分类里还包括了两三个抱怨缺少约会机会的人。
只有 8 位参与者(占 11%)将学习不足作为一个不利因素。其中只有 3 人尤其认同这一点,而这 3 人恰恰也是对他们的非学校教育体验最不满的(后文会具体说明)。剩下的 5 人普遍认为,学习上的不足是一个较小的问题,当他们有需求时可以再学。他们觉得自己最欠缺的科目,不出所料,是数学。(作为一名曾多年教授社科统计的大学教授,我可以证明,很多在大学前已经学了 12 年数学的人也抱怨自己数学不好,并且确实有这个问题!)
3 名参与者对自己的非学校教育经历非常不满,并抱怨父母疏忽大意。
在 75 位参与者中,只有 3 位表示,对他们而言,非学校教育弊大于利。深入了解这三个案例有助于我们理解在哪些情况下非学校教育并非一个好选择。在这三个案例的家庭中,母亲的心理健康状况不佳,父亲则不参与教育。这三位参与者都感受到了社交孤立、知识匮乏、遭受歧视,感觉因为非学校教育和家庭环境而显得「古怪」。其中两位参与者认为,他们的孤立部分是因为父母坚持原教旨基督教信仰。以下是对每个案例的简要概述。
一位在英国长大的 26 岁女性参与者写道:「我不支持非学校教育,因为我认为这是一种让精神状态不佳的父母在不需要积极参与融入社会的情况下抚养孩子的简便方法……因为我母亲的精神健康问题,她很难交友,通常也不喜欢参加社交活动等。我认为这是她选择让我们接受非学校教育的主要原因。」她接着说,在非学校教育的岁月里,她感到极度孤立,几乎没有学习任何东西。她后来接受了高等艺术教育,并成为了一名艺术教师,但这并非出于她对艺术的兴趣或喜欢教学,而是因为她觉得自己别无选择。在回答关于非学校教育劣势的问题时,她写道:「我的非学校教育经历完全是负面的。我成年后,因为被认为『古怪』和从事低地位、低收入的工作,我受到欺凌。我还很难找到长期男友,虽然我有吸引力、聪明,但很少有人愿意和一个对自己的成长方式(未接受正规教育)心怀不满的人交往。」
第二位参与者,一位 35 岁的女性,在三年级之前接受基督教家庭教育,之后转为非学校教育。这不是一个深思熟虑的决定,而是无奈之举:因为她母亲的心理和身体状况不佳,让她无法继续在家上学。她还提到,她的母亲不让她上学是为了「控制我们接触到的信息类型,包括性教育、科学或健康等,以及控制我们与人的交往。」她和其他两位一样,从未有机会选择自己的教育方式。她觉得自己被剥夺了上学的机会,而不是觉得能避开学校是一种特权。成年后,她主要在打零工,如清洁或油漆,但在调查时正在攻读工业设计专业的学士学位。在回答关于非学校教育的缺点时,她写道:「缺点是没有基本知识和社交技能的基础!我也不太喜欢和人相处,更喜欢独处,可能是因为我孤单且无人监督地成长,也可能只是我的性格,我也说不清楚。小时候,我最主要的感受是自己哪里都不合群,总是成为邻里之间的『怪人』,总是错过成长的重要时刻,经常感到孤独。这是一种非常孤单孤独的生活,考虑到严肃的宗教教育背景,这感觉相当压抑。我现在也觉得,我所学到的更多是宗教知识,而不是对我后来生活中有用的东西。」
第三位参与者,29 岁的考古学博士候选人,描述了她的母亲原本想让她接受基督教教育,但因为和浸信会学院的员工发生冲突,在她四年级时把她从学校带走。她母亲本想用基督教课程进行家庭教育,但因为自身的抑郁症而未能实施。她这样写道:「母亲个人与抑郁的斗争,导致她无法打理家务和监督我的家庭学习,这成了转向非学校教育的原因。」她还写道:「依我看,我之所以被『非学校教育』,仅仅是因为我母亲无法忍受我上公立或私立学校的焦虑——在那里可能会有其他非基督徒对我产生『负面影响』。她需要我在家帮忙做家务,照顾她,因为她是一个无法正常工作的抑郁患者。她宁愿让我从 9 岁到 18 岁过着社交孤立的生活,也不愿让我接受世俗教育。我的父亲其实不想让我接受家庭教育或非学校教育,但他从未采取行动,任由母亲为所欲为。」关于她的社交生活,她写道:「作为一名非学校教育者,我的『社交』生活只限于与父母、兄弟、偶尔的远亲以及去杂货店或生病时看医生的互动。」
这位参与者对她的非学校教育并不全然持负面看法。在回答关于优势的问题时,她写道:「现在回想起来,如果当初在学校,同时还得面对家里那种不正常和虐待的环境,我可能会做出一些不好的社交选择,那会对我以后的生活产生长期影响。所以,虽然在家被孤立地生活很痛苦,也让我受了很多创伤,但比起其他选择,我觉得这样还是更好些。我有很多时间独处,沉思。我自己悄悄练习冥想。这种独立和反思的习惯帮助我长大,尤其是在摆脱我母亲控制的影响这方面。」她在回答之前的一个问题时还写道:「作为一名非学校教育者,我是一个自驱的学习者,我的许多工作现在都需要自我驱动的学习——无论是我的博士论文研究,还是发展教学方法。」
在回答关于非学校教育的劣势时,她这样写道:「从成年人的角度回顾,最主要的劣势是,社交孤立让我父母肆无忌惮的虐待和忽视我。在我接受非学校教育期间,我遭受了严重的虐待和忽视。缺乏正规教育使我在成长的过程中自信心受损。我总感到不值;我仍感觉自己在某种程度上遭到了永久性的伤害,就像是被关在笼子里没有受到正规教育的怪人。我之前的非学校教育经历没有提供足够的数学和科学知识,以供我接受正规大学教育。为了通过 GED 考试,我不得不自学。我还必须自学补习数学和科学基础知识,才能跟上大学入门级别的课程。」
需要补充的是,在整个调查中,唯一一个谈到宗教对成长影响的参与者,对原教旨主义也持有非常负面的看法。她的父母在她 15 岁时成为极端的基督教原教旨主义者。她写道:「那时,我成了照顾年幼兄弟姐妹的全职看护。在那种亚文化里,人们希望我结婚生孩子,而不是追求职业生涯,所以认为进一步教育是没必要的。……自从父母成为原教旨主义者之后,我们几乎完全与宗教团体外的人断绝了往来。我们的交往主要围绕着照看孩子、做家务和参加宗教聚会,几乎没有时间进行正常的社交活动。」尽管如此,这位女士后来成为了一名非常成功的作家,并表示她会选择非学校教育方式教育自己的女儿。她不反对非学校教育,但对于她在家中因父母的转变而经历的社交和心智上的隔离,她深恶痛绝。
最后的思考
虽然我们的样本相对较小,但调查结果显示,如果全家人,包括孩子们,都支持非学校教育,如果父母心理健康且快乐,如果父母与更广阔的社会保持联系,并帮助孩子参与这个世界,那么非学校教育可以非常成功。即便这些条件没有完全满足,非学校教育也能很好地运作。在这样的环境中成长的孩子能够掌控自己的生活,并在寻找和追求幸福的道路上得到家庭的支持。但如果家长有问题,或者家庭隔离社会文化而非融入,或者孩子本人更愿意去学校,那么非学校教育可能会导致孩子的怨恨,甚至理所当然地让孩子感受到被虐待和忽视。
最后,我们要向参与这项调查的所有人表示感谢!这份问卷相当长,你们中很多人对每个问题都作了详尽而深入的回答。我们非常感激你们愿意分享自己的经历,从而让我们有所收获。
--------------
这篇文章标志着我们在这个博客上关于成年后的非学校教育者调查系列报告的结束。对我们的调查结果,你还有什么疑问或感想吗?关于非学校教育,有哪些尚未涉及的问题你希望我们探讨?如果你是一名成年非学校教育者或一位非学校教育的家长,这些发现与你的经历是否相符?这个博客是一个讨论平台,无论是我还是其他读者,都非常重视你的观点和见解。我一贯更倾向于你在这里发表你的评论和问题,而不是私下通过邮件和我交流。因为在这里发表,你不仅是在和我分享,也在和其他读者分享。我会阅读所有评论,并尽我所能回答所有严肃的问题。当然,如果你有些话真的只适合你和我之间交流,那就给我发电子邮件。
--------------
关于教育自决的人类本性,请参见《自由学习》。
爱因斯坦、马克·吐温和其他 48 位名人对学校的看法
原文:What Einstein, Twain, & Forty Eight Others Said About School | Psychology Today
「我在班上排名垫底。」——托马斯·爱迪生
发表于 2011 年 7 月 26 日 | 审稿人: Ekua Hagan
纵观历史,自柏拉图以来,有识之士都大声反对强制教育的僵化影响。以下是 50 位这样的人的语录,这些语录部分来自我自己的阅读,但大部分来自其他各种网站。
阿尔伯特·爱因斯坦
-
现代教学方法,竟然还没有把研究问题的神圣好奇心完全扼杀掉,真可以说是一个奇迹;因为这株脆弱的幼苗,除了需要鼓励以外,主要需要自由;要是没有自由,它不可避免地会夭折。认为用强制和责任感就能增进观察和探索的乐趣,那是一种严重的错误。
-
为了考试,我们把知识强塞到脑子里,也不管喜欢不喜欢。这样做的恶果是,期末考完,一整年里谈到科学我就犯恶心。
-
在真理和知识方面,任何以权威者自居的人,必将在上帝的嬉笑中垮台!
柏拉图
- 用外力强迫接受的学问是不能(在心灵中)常住的。
庄子
- 赏罚利害,五刑之辟,教之末也。
马克·吐温
-
我从未让学校教育妨碍我的学习。
-
肥皂(译者注:文明化的代表)和教育不像大屠杀那样突如其来,但从长远来说,它们更致命。
-
我们在学校学不到什么,教育就是什么。
-
首先,上帝创造了白痴。这是为了练手。然后,他创造了校董会。
奥斯卡·王尔德
-
现代教育的整个理论一无可取。还好,在英国,教育根本不会产生任何影响。如果它产生了影响,那将对上层阶级构成严重的危险,并可能导致暴力事件。
-
教育是一件可敬的事,但要时刻牢记,没有什么值得知道的事是教得会的。
-
那些没学习能力的人都去当老师了。
温斯顿·丘吉尔
-
我对学校深恶痛绝。那不是人过的日子,整天焦虑。每到期末,我就掰着手指头过日子,盼着放假回家。
-
我一直喜欢学习,但不喜欢上课。
伍迪·艾伦
- 我讨厌在学校里度过的每一天,也后悔在学校里的每一刻。
多莉·帕顿
- 我痛恨学校。直到现在,我一看到校车就颓丧。造孽!
乔治·萧伯纳
-
在这个世界上,对无辜的人来说,没有什么比学校更可怕了。
-
我们所谓的教育和文化,大多数时候只不过是用阅读代替经验,用文学代替生活,用过时的虚构代替当代的现实。
法利·德昂
- 只要你不喜欢,你学什么都无关紧要。
托马斯·爱迪生
- 想起来我和学校也不对付。我在班上垫底。
亨利·大卫·梭罗
-
教育经常做什么?拗曲作直。
-
比起实验生活,难道直接去生活不是更好的学习方法吗?
伯特兰·罗素
-
人生而无知,却不愚蠢;乃是教育令人愚蠢。
-
教育是智力发展和自由之思的死对头。
本杰明·富兰克林
- 这位饱学之士能用九门语言叫出马,但是他却蠢到带来了一只奶牛来骑。
亨利·路易斯·孟肯
- 校长一般而且必须是个笨蛋。一个聪明人怎么会从事如此愚蠢的职业。
乔治·萨维尔,哈利法克斯侯爵
- 教书之傲往往使人忘乎所以,自以为是而不自知其愚顽。
斯大林(emmm,强制学校教育支持者)
- 教育是把武器,谁把它牢牢掌握在自己手中,教育就为谁服务。
诺曼·道格拉斯
- 教育是国有复读机制造工厂。
保罗·卡尔·费耶阿本德
- 最好的教育是让人们免疫系统化的教育企图。
西奥多·罗斯福
- 一个人,没上过学,他可能会偷辆货车;但要是上过大学,他偷的就是整个铁道公司了。
H. H. 蒙罗
- 但是,天呐,你得先自己教育他。你不能指望一个男孩在上过好学校之后就不再凶狠了。
罗伯特·弗罗斯特
- 教育就得到处闲逛,直到被逮到。
吉尔伯特·基思·却斯特顿
- 教育就是这么一个过程,你受某个你不认识的人的教导,学一些你不想知道的东西。
拉尔夫·瓦尔多·爱默生
- 我付钱给校长,教育我孩子的却是他的同学。
爱丽丝·詹姆斯
- 我有没有受过教育,说不定没两样。
海伦·碧雅翠丝·米奇
- 谢天谢地,我从未被送进学校;那将磨掉我的创造性。
玛格丽特·米德
- 我奶奶想让我接受教育,所以她让我避开学校。
威廉·哈兹里特
- 任何人只要通过了正规的传统教育阶段,而且没有被它愚弄,可能会认为自己死里逃生。
劳伦斯·彼得
- 教育是一种获得更高等级偏见的方法。
安·沙利文(我向她致敬)
- 我开始怀疑所有精心设计的特殊教育体系。在我看来,它们似乎是建立在这样一种假设之上:每个孩子都是必须被教才会思考的白痴。
爱丽丝·杜尔·米勒
- 常常,我们先切断源头活水,然后再用人为的手段取代其自然功能,这是教育的常见现象。例如,我们先抑制了孩子的好奇心,然后,当他缺乏学习的天然兴趣时,他会因为学业困难而得到特殊的辅导
弗洛伦斯·金
- 已经学会阅读的孩子出现在学校里(很恐怖),就像已经做了防腐处理的尸体送到了殡仪馆——有些人要担心失业喽。
埃玛·戈尔德曼
- 我们在教育中的一举一动都想让孩子不做自己。这必然会导致这个社会的个体之间彼此疏远、不断对抗。
爱德华 M. 福斯特
- 授之以鱼,永远都不会教会我们知识,只让我们知道鱼怎么吃。
威廉·约翰·伯奈特
- 如果我们的学校还这么烂,也许我们应该宣布:教育破产了,把钱还给人民,让他们自己接受教育并创办自己的学校。
约翰·厄普代克
- 学校这个地方,是你在家里呆不下去,又还没那么快进厂之前去的地方。
罗伯特·巴泽尔
- 常常犯错,信誓旦旦,此即如假包换的 MBA(工商管理学硕士)。
罗伯特·M·哈钦斯
-
校园中的三大行政问题:学生的两性关系、校友运动会、教职员工的停车问题。
-
大学生用一张毕业证书(羊皮纸)来掩盖脑袋空空。
阿尔伯特·哈伯德
- 你大可把孩子留在学校,但这不能让他学会思考。
马克斯·莱昂·福尔曼
- 在美国,人们只对教育能省就省。
菲利普·K·狄克
- 接受教育的麻烦在于时间成本太高;它占据了你最好的时光,而毕业后,你突然发现,早点去银行工作才更好。
大卫·P·加德纳
- 很多被认为是教育的东西根本不是教育,而是仪式。事实是,我们正在接受教育,尽管我们知之甚少。
伊凡·伊里奇
-
公立学校已经成为世俗社会的教会。
-
我们共同认识到,上学的义务限制了学习的权利。
马歇尔·麦克卢汉
- 学校系统……是个把孩子们投入进行加工的同质化漏斗。
蒙田
彼得·德鲁克
- 当一门学科完全过时时,我们就把它作为必修课。
C. C. 科尔顿
- 考试叫人害怕,准备的再好的人也会害怕,因为蠢人可能会问的东西完全有可能令人咋舌。
保罗·西蒙
- 当我回想起我在高中学到的那些废话,我现在还能思考真是个奇迹。
约翰·杜威
- 美国人爱这么干——要是我们发现教育系统的基础有问题,我们就再讲一个故事、再造一个梦想。
佚名(我最喜欢的历史人物)
-
要是没人初中就辍学,那谁来当大学生的老板啊!
-
公立学校关押孩子,这些孩子由老师照管,老师怕校长,校长怕校董,校董则怕家长,家长又怕孩子,而孩子谁也不怕。
-
创造型人才总那么叛逆。他或她幸存于一场名为教育的创伤。
-
你总是能认出(tell)哈佛毕业生,但你跟他也没法说(tell)太多话。
朋友,没错,确实,这些名人名言的选择带有倾向性!我故意选了那些抱怨强制性标准教育系统的引言。不过,这儿有一个挑战留给你们。也列出这么长的引言列表,但是得是支持强制教育系统的,然后,请你看看引用的作者是否与这些富有创造力的作者排名接近。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参见新书《自由学习》
如果医学第一原则也是教育第一原则呢?
原文:What If Medicine’s First Principle Were Also Education’s? | Psychology Today
如果公立学校需要证明他们利大于弊呢?
发布于 2016 年 9 月 10 日
Primum non nocere,首要之务便是不可伤害。在成为医生的途中,大部分医学学院的学生必须宣誓。这一宣誓取材自古老的希伯克拉底誓言,旨在声明学生理解了医学的首要原则是「不可伤害」。当然,大部分医疗手段必然伴随一些伤害;所以,这条原则实际上指的是,对于所有可能对病人造成的伤害,必须斟酌这些伤害预期的收益,而且必须要具备足够的证据说明利大于弊。
如果我们的强制学校教育系统,必须对所有的孩子提供证明,表示这一系统是利大于弊的?比如小 Suzy,她今年五岁了。她所在的州规定,Suzy 必须上幼儿园;她和她家长对这一决定都毫无决定权(除非家长可以提供家庭教育,或者能负担得起其他手段,来满足州的义务教育要求)。如果州政府在让小 Suzy 入学之前,必须证明,他们强制她进入的学校,是对她利大于弊的呢?
如果州政府必须这么做——如果他们必须履行「不要伤害」的誓言——那么我们所知道的学校将会土崩瓦解。一场突如其来的教育革命将席卷而至,有如久旱逢甘霖。其实,即便降低要求,只需要证明我们提供的学校教育,对于平均水平的孩子,或者大部分孩子,是帮助多于伤害的,整套学校系统也会崩坍。
强制学校教育是对儿童和家庭生活的粗暴入侵,其伤害已叙述详备。
有时候,强制学校教育的辩护者,会使用我称之为「良药苦口」的辩护。他们认为,虽然强制教育不甚快乐,但这对人的长期福祉是必要的。先暂且不管大部分药只消几秒便能吃下,而强制学校教育要耗上 11 年(甚至在某些州要花 13 年)。也暂且不管没有任何证据说明,相比更好吃且更便宜的安慰剂,强制学校教育对儿童能带来更大益处。我所考虑的安慰剂就是非学校教育,或者说是民主自由的学校教育,这些教育中,是儿童主宰他们自己的生活和学习,并且能在需要的时候,得到关心他们的成年人的帮助,整个过程毫无胁迫。
如果学校教育是药的话,这种药根本通不过 FDA 认证。没有证据证明,学校教育比我提到的安慰剂具备更多好处,但学校教育招致巨大伤害的证据罄竹难书。这里只是一部分已有记录的证据:
-
有一项大规模研究有大量校区的数百名学生参加。该研究使用经历采样方法,说明了相比其他学生经常置身的场景,他们在学校是更不开心的。[1] (译注:在这个研究中:学生带着电子表,每天 7:30 - 22:30 随机总共问八次学生状态如何)
-
教师辱骂学生是家常便饭。在一项研究中,64% 的中学生都报告称,自己有过教师辱骂导致的压力症状。[2] 另一项研究表明,将近 30% 的男孩在幼儿园就遭受了教师的辱骂,并且这一比例还逐年上升。[3] 一项对成年人的调查指出,与学校经历有关的回忆中,有将近 50% - 60% 在他们自己看来,是心理创伤。[4]
-
一项研究让 150 名大学学生描述他们人生中最负面的两次经历——对他们的发展有负面影响的经历,而结果中最常见的经历(占比 28%)是和学校教师打交道的痛苦经历。[5] 另一项研究采访了一些成年人,讨论他们学校教育中体会过的积极学习经历,很少人能说出这种经历,但很多人都回忆起了负面经历,这些经历阻碍了他们的进步,而非促进进步。[6]
-
小学开学两个月后的孩子的头发皮质醇水平,要比开学两个月前高得多。[6] 皮质醇水平是慢性压力的生理指标,而慢性压力会严重影响孩子的发育和健康。
-
一项由美国心理学会组织的大规模全国调查(相关链接)表明,美国的青少年比起成年人更经常感到压力过大,并且学校是他们压力的主要来源(比例为 83% )。同样在这项研究中,27% 的青少年报告称其在上学期间经历过「极度压力」,相比只有 13% 报告称暑假期间经历过这种程度的压力。
-
在儿童医疗中心,紧急精神健康问题所致的住院率(那种因为严重崩溃或试图自杀而住院的问题)在上学期间是暑假的两倍多(来源)。
不仅如此,还要想想学校系统浪费了多少儿童青年的时间。如果你不信,那便可向你本地学校的校长获得许可,来「跟随」学生一天——待在学校一天,像学生一样做事。我知道有一些成年人这么干过——其中还有几位老师——他们无不惊诧于这样一天竟是如此无聊呆板,浪费时间,他们根本没有按自己意愿做事的自由。没有人想重现这一噩梦。相信我,儿童和青年并不比成年人更善于忍耐无聊;他们只是没得选。
非侵入式教育可替代强制学校教育
为了治病,那些智慧而勤奋的医生,会尽可能选择非侵入或者侵入性小的方法,而不会选择侵入性极强的方法,比如手术或毒素,这些方法会破坏身体的完整性,产生痛苦,导致失能,甚至丧命。而强制学校教育是侵入极强的教育模式。非侵入式的替代方案则是自主教育,如非学校教育或民主/自由教育。根据目前研究而言,相比强制教育,这些教育模式在让年轻人为成年生活做准备上一样有效,且对儿童生活与家庭生活的破坏性更小。[8]
然而教育体制对此选择充耳不闻。有些人从侵入至深的强制教育获益,就像那些从手术获利颇丰的医生一样。他们不想知道,还存在更便宜,侵入更少的方式,可以解决他们处理的医学问题。我曾两次与同事一起向大型教育研究基金会申请基金,以研究标准学校教育(公里和私立)相较于自主教育的长期短期影响。这两次申请都被拒绝了,没有任何解释,也没有再次申请的鼓励。请允许我自吹自擂,我从事研究已有不少时间,也审查过不少基金申请。我知道这两次研究提案,相比这些组织支持的其他研究,在设计上更加健全,而且对于儿童福祉和国家未来都更为重要。在我看来,各种迹象依然是昭然若揭,教育体制就是不希望有人问出这个大问题:我们目前自上而下的强制教育系统,相比非侵入的自主教育,能更有效地产出高能力,高生产力,找到好工作的快乐成人吗?
想想一下,如果有一个基金会,支持了这样一个设计良好的研究,而其研究结果不容置辩地说明,非侵入的方法相比那些侵入性强的方法,效果相当甚至更好,那会发生什么?他们能怎么为这么一头百万公司职业衣食所系的教育巨兽辩解?大学教育系不必存在了。老师也不需要那么多了——只需要很少一些老师,因其技能和知识而受自主学习者请教,而不是因为「教学资格证明」。教科书没有必要存在;因为没有消费者被强制要求购买这种书,这些书会变得更便宜,其质量也必须提升。
教育革命终将到来,但这种革命并不会在教育体制内发生。教育革命的火种,是越来越多的人用力所能及的法律手段,让孩子远离这套侵犯至深的系统。随着时间推移,越来越多人加入这一行列,越来越多的人会了解到,有一群人是远离强制学校教育而成长的,并会发现非侵入式的教育是可行的。铁幕终将崩解,教育体制终将堕入尘埃,终将灭绝。吾望得身在世间,目睹此刻之降临。敢求众人成全,让此事成就。
---------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
也请看:《玩耍精神》、self-directed.org(以找到自主教育的盟友);并在脸书上关注我。
Source: Basic Books,已授权
参考文献
[1] Csíkszentmihályi, M., & Hunter, J. (2003). Happiness in everyday life: The uses of experience sampling. Journal of Happiness Studies, 4, 185–199.
[2] Irwin A. Hyman & Donna C. Perone (1998). The Other Side of Student Violence: Educator Policies and Practices That May Contribute to Student Misbehavior. Journal of School Psychology, 36, 7-27.
[3] Brengden, M., Wanner, B., & Vitaro, F. (2006). Verbal abuse by the teacher and child adjustment from kindergarten through grade 6. Pediatrics, 117, 1585-1598.
[4] A. G. McEachern, O. Aluede & M. C. Kenny (2008). Emotional abuse in the classroom: Implications and interventions for counselors. Journal of Counseling and Development 86, 3-10.
[5] J. M. Branan (1972). Negative human interactions. Journal of Counseling Psychology, 19, 81-82.
[6] K. Olson. Wounded by School. Teachers’ College Press, 2009.
[7] Children’s hair cortisol as a biomarker of stress at school entry Groeneveld et al (2013). Stress: The International Journal on the Biology of Stress, 16, 711-715.
[8] 研究的证据和参考请见: P. Gray (2016). Mother nature’s pedagogy: How children educate themselves, pp 49-62 in H.E. Lees & N. Noddings (Eds.), The Palgrave international handbook of alternative education.
---------
是什么让这些家庭接受了「非学校教育」?报告(中)
原文:What Leads Families to “Unschool” Their Children? Report II | Psychology Today
232 个家庭为何相信孩子的自主学习能力
发布于 2012 年 3 月 26 日
我在 2011 年秋季对非学校教育家庭进行了调查,撰写了三篇报告,本文是其中的第二篇。在第一篇报告中(链接),我介绍了调查方法,提供了调查家庭的一些基本信息,并总结了他们对非学校教育的定义及其带来的好处。[在那篇报告中,我提到有 231 个家庭参加了这项针对 5 岁及以上孩子的调查。现在我需要纠正一下,实际上是有 232 个家庭参与了。在最初的统计中,我们不小心漏掉了一个家庭。]
对于初次接触这个话题的读者,如果你还没有读过第一份报告,那这里简单介绍一下。进行非学校教育的家庭,不会把孩子送去学校,在家里也不进行学校那样的教学活动。具体来说,他们不会给孩子定制课程,不要求孩子完成特定的学习任务,也不用考试来检测孩子的学习进度。他们让孩子自由探索自己的兴趣,用自己的方式学习知识、追求兴趣。同时,他们也会以多种方式为孩子的学习提供环境支持。关于非学校教育家庭如何实践这些理念,以及他们认为非学校教育对孩子和家庭的好处,如果你想了解更多,可以回去看看第一份报告。
第二份报告中,我的目标是:描述参与调查的家庭是如何走上非学校教育之路的。这份报告基于我和同事 Gina Riley 对调查问卷第 6 题的定性分析,该题内容如下:
- 请描述:你们的家庭是怎样接受你们现在实践的非学校教育理念的。特别是:(a) 这是否和你的孩子在学校的具体经历有关?如果有,请简述这些经历。(b) 有没有特定的作家影响了你们?如果有,请给出这些作者的名字以及他们的作品最吸引你的地方。(c) 在实行非学校教育之前,你是否尝试过在家上学?如果有,是什么原因让你从在家上学转向非学校教育?
以下是我们的主要发现:
决定让孩子离开学校
在回答问题 6a 时,232 个家庭中有 101 个表示,在开始非学校教育之前,他们至少有一个孩子曾在学校就读,并且,孩子在学校的经历促使他们把孩子从学校中解放出来。这些家庭的解释中,有 38 个家庭特别提到:学校规则的僵化或课堂的专制是他们选择解放孩子的原因;32 个家庭提到了学校浪费光阴、学习效果微不足道、或孩子感到无聊、丧失好奇心或学习兴趣衰退;还有 32 个家庭提到了孩子不快乐、焦虑或受到欺凌的情况。【注意:这里以及报告中其他地方的数字并不精确,因为它们来自于对书面语言的解读。】
以下是对问题 6a 的部分答案摘录(姓名已删除):
课堂规则过于严格/教育方式过于专制:
-
「学校校长曾威胁要因为[我儿子]带『武器』去学校而起诉他。这个所谓的『武器』,其实就是一罐彩条喷雾。」
-
「我看到孩子们因为好奇心强和爱说话而受罚,然而我认为这是大多数孩子的天性。」
-
「我们对孩子在学校的学习方式越来越失望。比如说,理解数学理解得很快的孩子也必须承受繁琐的『写出计算过程』,即使他们能直接心算出答案。我们的女儿因此感到枯燥乏味,对学习失去了兴趣。她因没做完家庭作业而被罚站,尽管她的成绩很好,第一次 MCAS 考试还考了满分。」
-
「当我 5 岁的孩子因为不认识字母而可能要在幼儿园留级时,我意识到这是错误的,因为每个孩子的学习速度都不一样。」
-
「我们受够了孩子们被贴上标签,受够了他们疲惫不堪,带着愤怒回家。他们不再是我们记忆中那些可爱的孩子。把他们都从学校带回家后,他们又恢复了『人样』。」
-
「我们的大女儿在上学第一天就被告知:必须经允许才能上厕所和吃饭。她告诉我们,她不愿意这样做,几天后,我们决定与学校协商,让她退学回家。」
孩子在学校中无聊/浪费光阴/对学习失去兴趣:
-
「把孩子们送进公立学校后,我清楚地感觉到,按别人定好的课程学习只会起反作用,甚至让孩子们开始『厌恶』学习(这对我们来说完全不能接受)。」
-
「我们很不喜欢大儿子所在的一流公立学校。6 岁的孩子每晚要做 1 小时的家庭作业(阅读理解和数学练习),实在太过分了!对他来说这些作业太简单,他很反感,每晚都拖拖拉拉、很不情愿,这样侵占了我们的家庭时间和休息时间,我们也感到烦恼。」
-
「我经常在教室帮忙,看到了很多很多浪费光阴的情况:我的孩子们只能坐着,什么也不能做。」
-
「到了五年级,在我们把儿子带出学校的那一年,学校已经在破坏他天生的好奇心和对学习的热情。他在学校花了太多时间,然后回家还要做家庭作业。他问我,『妈妈,我的时间在哪里?』这让我心都碎了。」
-
「我们发现,随着家庭作业和课程项目的增多,我们成了学校安排的奴隶,即使在放学后和周末也是如此。此外,我们发现我们的大儿子正在失去对学习的热爱,我们的第二个孩子也没有时间追求她的热情和天赋——表演艺术。」
孩子在学校中的不快乐/焦虑/遭受欺凌:
-
「学校对整个家庭来说都是一场灾难。家庭作业、社交问题、缺乏体育锻炼、缺少家庭时间、纪律问题……我几乎是在强迫孩子们去他们极度讨厌的学校。」
-
「我大儿子学会阅读比学校标准要慢,这种挫败感让我开始探索其他不上学的选择,但当时我并未采取行动。后来他上了三年级,作业多得不得了。虽然成绩还不错,但看他那么沮丧,我感觉这不对劲。他在学校待的时间比他爸上班还长,这到底图个啥啊?」
-
「我家大女儿因为考试焦虑(那时候刚实施《不让一个孩子掉队》法案),在学校吃不下饭,被噪音和气味搞得心烦意乱,上课也心不在焉。小女儿则开始觉得无聊,不愿意参加课堂活动。大女儿在学校一直不开心,我本以为她会慢慢适应,可是她没有。最后事情到了临界点,我决定将她们从学校中解放出来。虽然我没有具体计划,但我知道我能比学校做得更好。我不想再让她们待在一个让她们那么难过、给我们家庭带来那么多压力的地方。」
-
「我家大女儿极其讨厌去学校,我们全家都很痛苦。由于对在家上学缺乏了解(更别提非学校教育了,连在家上学在印度都不常见),甚至有误解,我们一直没意识到这是个可行的选择,直到绝望迫使我们开始考虑这个方案。」
-
「学校的教职工屡屡忽视其他孩子对我儿子的身体和精神攻击。在忍受了两年后,我儿子终于还手推了一个欺凌他的同学,结果他自己反而惹上了麻烦(虽然好几个老师都看见那孩子怎么欺负我儿子的,但他并未受到处罚)。学校一再使我儿子陷入失落,对我的请求和要求改变的呼声置若罔闻。然后他们召开了一个会议,讨论如何『处理我的儿子』,而不是他们能为他做些什么……我直接告诉他们,这种会议我不参加……」
-
「我家大女儿很早就在学校失去了对学习的兴趣。最终她甚至连数学都不做了,成绩从班上最好变成了最差。这都是因为有个数学老师总是嘲笑她,让她感到自卑。」
-
「二年级刚开始时,一天晚上,我女儿告诉我,她的朋友被同学用言语威胁(使用的词语是『你死定了』),还被推到墙上,并被告知:对方的表哥会来找她麻烦。我听了非常震惊,这种事竟然发生在 8 岁的孩子身上。更让我无法接受的是,当我向我女儿的老师反映这件事时,老师竟然不认为这有什么大惊小怪的。我绝不希望我的孩子接受并麻木地认为“如此恐怖、缺乏爱心和不友好的对待他人”是正常的!我希望我的孩子们知道,还有一个更充满爱和关怀的世界存在,因此我们开始了在家上学。」
-
「当我们刚开始让大儿子接受在家上学时,他只有 11 岁,他因为学校的经历受到了很大的情感伤害。但令我们震惊的是,他的性格在短短一两个月内就迅速恢复了。」
从在家上学到非学校教育
在问题 6c 的回答中,232 个家庭里有 110 个家庭表示,他们在转向非学校教育之前尝试过在家上学。大多数家庭提到,他们之所以转变,是因为孩子对家庭课程产生了抵触,家庭因为课程带来的压力而感到不快,或者父母发现孩子通过自己的主动探索学到的东西比通过强加的课程要多。下面是一些说明了这些原因的例子:
-
「最初,我们用Oak Meadow课程在家进行传统教育。我一开始很喜欢『玩耍式教学』的感觉,就像小时候一样!我乐在其中,买各种教材和书籍,规划我们的『课程』。但经过了几周后,我就只能翻阅课本,试图找到些还与主题有关的,吸引人的内容,一些不会让我们俩都打瞌睡的东西,可惜找不到。一次,当孩子在数学练习中流泪时,我意识到:还有更好的方式。我开始质疑为什么我儿子现在就必须学这个东西,然后意识到,其实根本没这个必要。」
-
「我们从传统在家上学转向非学校教育,因为当时 5 岁的孩子完全拒绝任何形式的严格管理。我只要在他面前摆放一些资源,让他自由探索,他的学习效果就会翻倍。对他来说,非学校教育是唯一有效的方式。」
-
「最开始,我为大儿子准备了一整套的家庭学校环境。我以为只有这样他才能学习,但这让我们俩都很有压力,每天的课程都让人害怕。渐渐地,我开始让步,发现越让步孩子越能成长。最终,我们抛弃了固定课程和严格的时间表,慢慢过渡到了非学校教育。」
-
「在一开始,我们提供了很多练习册,但女儿对此不感兴趣,这让我们逐渐转向非学校教育。任何像是命令的东西她都会回避,我们不想要这样的关系。」
-
「我原本不打算在家复制学校的模式,但刚离开学校那段时间,我还是不自觉地让孩子们做些类似学校的活动……但后来我亲眼看到,也深刻感受到,让孩子们自己选择的事情,比我强迫他们做的要有意义得多,也更让人愉快,而且更长久。」
-
「简直太糟糕了。我们总是发生冲突,我不仅要负责让他完成作业,还要教他学习。我们俩都承受了太大的压力,都很痛苦。」
-
「最开始,我尝试了古典教育方法,就像在家开学校一样,有课桌、作业纸、评分等。但一个月后,我们俩都变得很痛苦。」
-
「我们尝试过在家进行传统的学校教育,但效果很差——我们只是把我儿子在公立学校的问题搬到了家里。我们尝试了很多不同的教学方法,但都觉得不对劲。每当我放任他自由时,我们俩都更快乐。同时,我也研究了很多在家上学的方法,每当我读到非学校教育的内容时,我都会想『这对他来说一定管用,我敢肯定。』但我还是不敢完全信任这种方式,所以我们就这样假装在进行在家上学。当我另外两个孩子自学阅读时,我终于意识到,『啊,这真的可行』。」
决定进行非学校教育的其他原因
有影响力的作家
在回答问题 6a 时,大部分家庭提到了一些影响深远的作者,对他们选择非学校教育起到了很大的作用。其中,最多人提到的是 John Holt(有 127 位受访者提及),他曾经是一名教师,后来在诸如《孩子怎样失败》和《孩子怎样学习》等书中批判了强制学校教育,并倡导自主教育。Holt 还创造了非学校教育这一术语,并创办了第一本专门介绍非学校教育的杂志《无学校的成长》。他的工作至今仍由 Holt 协会继续,该协会由 Pat Farenga 领导。
另一位被频繁提及的作者是 John Taylor Gatto(52 位受访者提及)。他曾是纽约州年度最佳教师,但认为不论怎样改变教学方式,强制学校总是弊大于利。因此,他离开了教育界。Gatto 随后撰写了《扼杀我们的智慧:强制学校的隐秘课程(Dumbing Us Down: The Hidden Curriculum of Compulsory Schooling)》、《不同的教师:解决美国学校危机(A Different Kind of Teacher: Solving the Crisis of American Schooling)》和《大规模教育武器:一位教师穿越强制学校黑暗世界的旅程(Weapons of Mass Instruction: A Schoolteacher's Journey Through the Dark World of Compulsory Schooling)》等作品。
第三位被频繁提及的作者是 Sandra Dodd,有 39 位受访者提到了她。她运营着一个专注于非学校教育和育儿的活跃网站,是《非学校教育大全》一书的作者,并推广了一种称为「激进非学校教育」的方法。许多提到她的受访者对她的思想和影响深表敬意。其他频繁被提到的作者还包括 Alfi Kohn、Grace Llewellen、Mary Griffith、Dayna Martin、Naomi Aldort、Ivan Illich、Jeanne Leidloff、Raymond & Dorothy Moore、Jan Hunt、Pat Farenga、Joyce Fetteroll、Rue Kream 和 Susan Wise Bauer。
除了这些特定的作者,很多人还提到非学校教育相关网站、会议或演讲的重要影响。还有许多人提到,他们身边已经成功实行非学校教育的朋友或熟人也给予了他们很大的启发。
没有经过学校教育,直接决定接受非学校教育
在参与调查的家庭中,有 86 个家庭从孩子出生开始就选择了非学校教育,未有在家上学或学校教育的传统经历。其中一些家庭表示,甚至在孩子出生前,他们就基于自己的生活理念决定采用非学校教育。约三分之一的家庭提到,孩子上学前的育儿经验促使他们选择非学校教育。这些家庭中有的实施了「亲密育儿」或「自然育儿」,非学校教育的选择似乎自然而然地成为了这种育儿方式的延伸。例如,一位妈妈这样写道:
- 「我的大女儿从出生开始就特别需要照顾,就像 William Sears 博士所说的『那种总是想被抱在怀里的婴儿』。从第一天起,我就学会了根据她的需求行动,刚开始真的很难,因为要放弃我以前的生活方式!我了解到了亲密育儿这个好主意,并将其融入我的生活,从此一直让她引领我们的方向。我的第二个和第三个孩子都是自然分娩,这让我更坚信我也可以控制孩子们的教育——或者说,我们可以一起来,让他们带头,我在旁边支持他们。」
在参与调查的 232 个家庭中,将近三分之一的家长提到,他们自己在学校的负面经历影响了他们让孩子接受非学校教育的决定。这些家庭中许多家长在孩子进入学校之前就直接选择了非学校教育。例如,其中一名家长这样写道:
- 「我自己的学校经历可能对我做出这个决定有所影响。在上大学后,我发现之前的小初高学校教育实际上完全没必要,简直是在浪费时间……我的小初高时期是我一生中最不快乐的时光。」
一些选择非学校教育的家长曾是教师或教育顾问,正是基于这些经历,他们决定采取非学校教育。以下是这类家庭中两位家长的观点:
-
「当我们的大孩子到了上学年龄,那时候,我丈夫在一所小型高中任教。处理那些不适应学校系统的孩子让他眼界大开。看到那么多学生在这个阶段就已经失去了对学习的热情,他感到非常痛苦。这些孩子要么学会了迎合系统,要么彻底放弃尝试。他们中几乎没有人还对学习充满热情。」
-
「我曾是公立学校的老师。总体来说,我喜欢教书,喜欢和孩子们在一起。但我也逐渐看到了教育系统的种种弊端。当我的孩子们快到上学年龄时,我意识到:我不想让他们成为这些错误的受害者。」
----------
综上所述,回答我们调查问卷的人们选择非学校教育的途径有很多种。通常,这个决定是由以下几个因素共同作用而成的:(a) 重视自由和尊重个体差异的生活观念;(b) 观察孩子们在校内外的学习和情感体验;(c) 反思自己在学校的负面经历;以及 (d) 从作家、演讲者、网站以及其他非学校教育家庭的经验中获得的知识。我下一篇文章将是关于这项调查的第三份报告,在那里我会重点讨论这 232 个家庭在非学校教育过程中遇到的主要挑战。
-----
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
少即是多:为什么学校要少教数学
原文:When Less Is More: The Case for Teaching Less Math in School | Psychology Today
这个实验里,教得少的孩子学得多
发表于 2010 年 3 月 18 日 | 审稿人:Jessica Schrader
在 1929 年,纽约 Ithaca 的校区主管,向其他城市的同僚发出挑战。「什么,」他问,「是能从小学课标里删去的?」他抱怨道,随着时间推移,新学科越加越多,但没什么是从课标里删去的,结果上学日要满满上一天课程,根本没时间深入思考。那时候人们还认为,孩子不应该把所有时间花在课业上——他们应该有玩耍的时间,做家务的时间,和家人在一起的时间——所以,那时候人们有理由认为,只要课表里加了新东西,就应该有东西被删去。
接受挑战的主管中便有 L. P. Benezet,他是新汉普郡曼切斯特地区的学校主管。他的回复是一份骇人的提议:「删掉算术课!」。Benezet 之后又讨论道,低年级学生在算术上花的时间都是徒劳无功的,甚至会起反作用。他写道:「我注意到一个现象有些年头了,提早引入算术,会钝化甚至毒害儿童的推理能力。」他认为,所有的算术操练,让儿童把常识和数学算术分了家。结果是,他们虽然能做出教过的计算题,但他们不理解他们为什么做这些题,也无法在实际问题中应用计算能力。他认为,如果推迟教授算术——最好是推迟到七年级——儿童能更轻松地学习算术,同时更能理解。[1]
想一想。现在,每当我们听到孩子在学校学不会课程,教育局就会大张旗鼓,坚称我们必须多教这些课。如果 X 学科上 200 小时的教学没什么用,那么就教 400 小时。如果儿童学不会一年级教的东西,那我们就在幼儿园学习。如果他们在幼儿园学不会,那我们就再在入园之前教学。然而,Benezet 的看法与这些意见相左。如果我们花了很多时间精力,而孩子仍然在低年级学不会数学,为什么还浪费这些时间精力呢?
Benezet 提出这个骇人提议后,又开展了一个骇人的实验。他要求,曼切斯特里一些最穷街区学校的校长和老师,在低年级停止教授第三个 R*。他们不再教授算术——不再教授加减乘除了。他选择这些最穷的街区,是因为他知道,如果他在更富有的街区这么干,那些高中大学毕业的家长会抗议的。作为妥协,为了安抚不希望那么激进的老师,Benezet 设立计划在六年级教授算术。(译注:3R 即 Reading, wRiting, aRithmetic,阅读、写作和算术)
作为计划的一部分,他要求低年级教师把以往教授算术的那部分时间,花在新的 R 上——朗诵(Recitation)。他指的是「说英语」,而不是「一字不差地重复教科书或老师的话。」孩子需要讨论他们感兴趣的话题——他们体会过的经历,看过的电影,任何东西,只要触发真诚而活跃的沟通与讨论就可以。他认为这么做会提高他们的推理能力和有逻辑地沟通的能力。他还要求教师让学生练习测量和计数,保证他们有和数字打交道的实践经验。
为了衡量实验结果,Benezet 请来波士顿大学的一位研究生,让他对接受实验的曼切斯特孩子,在六年级于不同的时间开展测试。结果非常显著。他发现,这些实验班的孩子在刚上六年级时,比其他孩子在数学应用题上表现更好——这种问题需要把数学知识、常识、对数字和测量的理解结合起来。这些孩子可是一点都没接受过算术教学。当然,六年级刚开始时,在按照普通教学方式设定,需要使用填鸭式算法的加减乘除计算问题上,他们的表现稍显落后,但六年级结束时,他们在计算问题的表现上已经跟上其他人了,而且应用题的表现仍然遥遥领先。
作为概括,Benezet 说明,这些仅在六年级学了一年算术的孩子,跟那些接受了数年算术训练的孩子,在标准计算问题上能力相当,并在应用题上远远胜过。更引人注目的是,这些仅学了一年算术的孩子,都是来自最穷的街区的——这些地方之前的考试结果都是最差的。为什么几乎没有教育家听说过这个实验?为什么 Benezet 没有被尊为公共教育的天才?我不禁深思。[注:Benezet 的工作,是 Tammy 在我 2 月 24 日的帖子下留言之后,我才注意到的,谢谢,Tammy。]
Benezet 之后数十年,教育家一直不断争论,在学校教授数学的最好方法是什么。新数学,乃至新新数学等理念陆续出现,而没一个方法能奏效。这里背后的原因有很多,其中有一个原因是,教小学数学的人都不是数学家。他们都身患数学恐惧症,就跟社会中的大部分人一样。毕竟,他们自己也是学校系统的产物,而学校系统有一件事做得特别好,就是在经受过这套系统的大部分人身上,根植关于数学的长久恐惧与厌恶。老师用填鸭式的方法教数学,这是他们唯一掌握的教学方式,之后他们便祈祷,别有什么聪明自大的学生会问他们「为什么要这么干?」「有啥用?」。学生当然会从他们身上习得这种恐惧,并学会避免提出这种问题,甚至不愿思考这种问题。他们学会了愚蠢。按 Benezet 的看法,接受学校数学教育的人,是被毒害的人。
Patricia Clark Kenschaft 是蒙特克莱尔州立大学的一位数学教授。她在 2005 年发布的一篇文章描述了她参观小学,与老师讨论数学的经历。在参观新泽西州一所小学的过程中,她发现,在她见到的 50 位教师中,没有一个人知道怎么求长方形的面积。他们会教乘法,但他们都不知道乘法能用来求长方形的面积。他们最常见的猜想是把长度和宽度加起来得到面积。他们推辞不知道的理由是,他们不需要教长方形面积:这是课标后面才安排的。但 Kenschaft 认为,他们搞不懂乘法是用来求长方形面积,这一事实说明了他们并不知道乘法是什么,有什么用。她还发现,虽然老师知道两位数乘法的方法,并能教给学生,但没有人能解释算法的原理。
Kenschaft 参观的学校恰好位于一个很穷的街区,那里的孩子大部分是非裔美籍,因此一开始她以为,这所学校的老师一定是最差的,所以她推理道,这就是黑人比白人在数学测试上成绩更差的原因。然而,她之后参观了富人街区的一些学校,发现这些学校的老师的数学知识同样可悲。她总结道,在学校没人能掌握多少数学,并且「似乎富人区孩子高分的原因,不是因为老师教得好,而是因为儿童自己开展的非正式『家庭教育』。」[注:我 Kenschaft 文章的参考来自 Sue VanHattum,她开了个很不错的博客,名叫 Math Mamma Writes。]
现在,小学教授数学似乎是弊大于益。因此,我赞同 Benezet 的看法。我们应该停止教授数学。
-----
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
[1] L. P. Benezet (1935/1936). The teaching of Arithmetic: The Story of an Experiment. Originally published in Journal of the National Education Association in three parts. Vol. 24, #8, pp 241-244; Vol. 24, #9, p 301-303; & Vol. 25, #1, pp 7-8.
[2] Patricia Clark Kenschaft (2005). Racial equality requires teaching elementary school teachers more mathematics. Notices of the AMS, 52, #2, p 208-212.
为什么信任型养育和孩子自由式微了?
原文:Why Have Trustful Parenting & Children’s Freedom Declined? | Psychology Today
儿童发展的教学模式干扰了父母对孩子的信任
发表于 2009 年 9 月 16 日 | 审稿人:Ekua Hagan
在最近的帖子中,我一直在讨论信任型养育的衰落和指令-保护型养育的兴起。信任型的父母相信:孩子能够自己玩耍和探索,自己做决定,从自己的错误中吸取教训。在漫长的人类历史中,当我们都是狩猎采集者的时候,信任型养育占主导地位,它很好地满足了狩猎采集者对独立、负责和自信的人的需求,采集者之间保持着平等和个人自由的精神。在农业和土地所有权被发明之后,以及在工业社会兴起后,基于平等和自由的社会制度屈服于基于等级权力结构和奴役的社会制度。主要的养育方式从信任型转变为指令-专制型,目的是强迫孩子在田地或工厂里劳动,训练他们服从领主或主人。(请参阅 2009 年 7 月 16 日的帖子了解这段历史的摘要)。
近代以来,随着对童工需求的减少和民主价值观的复兴,指令-专制型的养育方式,即经常殴打孩子以驱除其任性的养育方式,已日渐式微。有一段时间——在 20 世纪 50 年代和 60 年代左右达到顶峰——信任型养育似乎经历了一次重生,但从那以后的几十年里,信任型养育被一种新的指令型养育所取代,我称之为「指令-保护型养育」。
指令-保护型的养育
不像指令-专制型父母那样,强迫孩子屈服、在田地或工厂里劳动,指令-保护型父母引导孩子的行为并限制他们的自由。更确切地说,他们这样做是因为他们担心孩子的安全和他们的未来,他们相信,自己做的决策比孩子本人更好。
信任型父母认为孩子有韧性、有能力,而指令-保护型父母则认为孩子脆弱无能。信任型父母认为孩子最好的发展方式是在自主的环境中玩耍和探索,而指令-保护型父母则认为孩子在遵循大人为他们精心设计的道路时发展得最好。
在上周的文章中,我引用了 Hillary Clinton 关于她在 20 世纪 50 年代的童年所经历的自由的论述,我也描述了我和朋友在同一时期的小学时代所享受的自由和信任。Clinton 和我并不是今天唯一对过去几十年儿童自由度下降感到遗憾的成年人——这种下降伴随着儿童肥胖、抑郁症和自杀的急剧上升。最近在英国和美国进行的几项调查显示,许多成年人对自己的孩子在成长过程中缺乏自由感到悲伤。[1]然而,大多数人觉得他们不能让孩子有这样的自由。他们认为世界已经发生了变化,现在的孩子需要更多的保护和大人的引导。
在过去几十年里,出现了哪些社会变化,导致人们认为现在的孩子比过去更需要成人的引导和保护?我相信,要全面回答这个问题,需要描述社会中众多相互关联的变化。以下是我认为最相关的几点:
邻里关系的衰落与儿童户外活动的消失
上世纪 50 年代,我还是个孩子,大多数人——无论是成年人还是孩子——都认识自己的邻居。这在一定程度上是因为许多妇女白天在家,与其他人建立了友谊,但那时男人在家的时间也比现在多。平均而言,那时的工作日没有现在这么长,人们周末都会呆在家里。如今,外出工作已成为男女成人生活的主要内容,大多数成年人的友谊是在工作中形成的,而不是在邻里之间。由于孩子不是工作世界的一部分,他们与父母不在一个朋友圈里。这导致父母不确定邻居的品行,而即使在家,邻居通常也不会注意别人家的孩子。因此,与过去相比,邻里关系似乎不那么安全,也许事实也是如此。
当一些父母不让他们的孩子在邻里自由地玩耍的时候,对于那些可以在户外玩耍的孩子来说,邻里变得不那么吸引人了,因为很少有小孩愿意自己一个人玩。对于孩子来说,户外或其他任何地方最大的吸引力永远是其他孩子。户外活动的孩子少了,附近的安全也会变差,因为人多才有安全感。这是一个恶性循环:在户外玩耍的孩子少了,意味着户外的吸引力和安全性都不如以前,进而导致户外玩耍的孩子更少。为了让邻里再次成为儿童户外自由玩耍的好去处和安全场所,必须采取措施打破这个循环。
地方性养育常识衰退,全球性恐惧网络兴起
与今天相比,过去的大多数成年人更了解他们的孩子。那时的家庭往往比现在要大,大家庭往往住在同一个镇上共度时光。当成年人有了自己的孩子时,他们已经有了很多与孩子相处的经验。他们对儿童发展有切身体会。他们知道儿童的能力,知道游戏和冒险对儿童的重要性,因此当他们有了自己的孩子时,他们往往会对自己的孩子充满信任。他们同时还是其他父母社交网络的一部分——结交朋友,分享孩子的故事。他们可以看到,邻居的孩子可以自由玩耍,他们的孩子成长得很好,过得也不错。社区和大家庭是分享有关儿童和育儿常识的地方。
随着家庭规模的减小、亲属关系的疏远以及邻里关系的衰落,今天的成年人在组建家庭之初,往往很少有与真正的孩子接触的第一手经验,甚至是第二手经验。他们对孩子的看法和信息往往来源于他们从专家和媒体中读到或听到的内容,而这些信息是有偏见的。
专家通常会撰文提醒人们注意危险。危险是他们的专业领域,而新闻每天都在报道某个地方的某个孩子发生的可怕事情。今天,数以百万计的孩子在没有成人监护的情况下到户外玩耍,回家后变得更健康、更聪明、更有责任感,这并不是新闻,但今天某个地方有一个孩子被绑架、溺水或被汽车碾压,媒体就会迅速将这一消息传遍全州,甚至全国或全世界,这取决于报道有多么耸人听闻。父母获得的信息并不真实反映统计数据,它滋养了每个父母最糟糕的恶梦。
未来的不确定性增加
现在的世界似乎没有几十年前那么稳定,许多传统的谋生方式已经消失,而我们无法预测未来会有哪些工作,或者需要哪些工作技能。因此,父母对子女未来的担忧远超过去。如今,许多父母将童年视为一段建立履历的时期。孩子们不能只顾自己出去玩和探索,因为这在履历中并不重要。不知何故,父母们认为,如果能让孩子们有出色的履历,在各种考试成绩取得高分,并进入最负盛名的学校,就能保障孩子们的未来。当然,他们错了;不过,这种观念持续至今。
现实情况是,在充满不确定性的时代,防止失业的最好办法,恰恰得靠人们通过自己的自主体验培养出来的品质,而不依赖父母和老师的监督。不确定的时代需要自我负责、独立思考、自我激励、自我主张、灵活性、创造力和想象力。这些特质是由信任型养育培养的,而指令-保护型养育则会抑制这些特质。
学校系统的权力不断增大,需要遵守的学校要求日益严格。
在导致指令-保护型养育兴起和儿童自由度下降的因素中,最重要的因素或许是学校干预儿童和家庭生活的权力持续增大。
学校是违背孩子意愿、将其束缚的地方,并时常要求他们完成看似毫无意义,但确实是毫无意义的任务。在学校,孩子们大部分时间都不能自由地探索和玩耍,这种情况一直存在。何其讽刺: 在学校,本应是教育的场所,但探索和游戏,这些在我们的生物进化中为了教育而存在的活动,在学校却被禁止了。
上世纪 50 年代,学校对自由也有所限制,但没有今天那么严重。我们每天 9 点上学,下午 2 点半或 3 点放学,之后就自由了。我们没有家庭作业,至少上小学时没有。即使在校期间,我们也比现在上小学的孩子更自由。午餐时,我们有整整一个小时的时间,有些人走路或骑自行车回家,其他人在校园或附近的社区自由玩耍,没有监督。我们还有早间休息时间;有些老师看到我们坐立不安,就会在教室里给我们额外的课间休息时间,只要不太粗暴或吵闹,我们可以玩任何想玩的游戏。老师们不以学生的标准化考试成绩作为考核标准,因此老师拥有更大的自由度,可以根据学生的实际需求和个性来调整教学方法和内容,以更好地满足学生的学习需求和期望;当然,有些老师并不像其他老师那样聪明或善良,对此我们也无能为力。
如今,学年更长了,旷课的处罚更重了,校内活动也比过去受到了更严格的控制。孩子们不断地考试,如果成绩不达标,整个家庭都会陷入困境。
如今,学校体系不仅局限于校舍和教室里的时间,它还深入到人们的家庭,控制着家庭的生活。例如,学校有暑期读书清单,父母必须确保他们的孩子阅读这些书。学校会布置家庭作业,通常要求父母在家庭作业单上签字,这样老师就能看到父母作为执行者参与其中。当孩子在学校表现不佳或考试成绩不理想时,学校会定期召集父母开会。父母在家里扮演一种类似老师的角色,推动和指导孩子完成学校要求任务。本该寓教于乐的家庭旅行和其他探险活动,往往因为孩子作业太多,或必须参加学校举行的课外活动而被迫中断。在这种情况下,你很难成为一个值得信赖的父母;你必须与学校体系抗争,才能做到这一点。
儿童发展和育儿教学模式的兴起
随着学校教育日益渗透于儿童和家庭的生活,它逐渐主导了人们对儿童发展和教育的观念。在学校,学习由大人引导,而非由孩子主导。学校中的学习被视为按部就班、沿着既定路径进行;你必须先学习 A,然后才能学习 B。在学校里,孩子的伙伴都是同龄人;孩子无法通过与年长的孩子一起玩耍来学习技能,也无法通过与年幼的孩子一起玩耍来培养责任感。在学校中,自发的游戏和探索被视为对教学计划的干扰,需要加以控制。大部分关于儿童的心理研究都是在学校进行,而且都集中在与学校相关的问题上。这也是为什么很少有关于儿童游戏或自主学习的心理学研究,也几乎没有关于不同年龄段的儿童之间进行互动研究的原因之一。不足为奇的是,这些研究所产生的儿童发展理论和模型与我们学校体系的假设完美契合。
学校教育的主导地位导致儿童心理学家和包括父母在内的整个社会,奉行一种扭曲人性的儿童发展模式。在整个人类历史上,儿童主要是在不同年龄段的游戏和探索中向其他儿童学习(正如我在之前的许多文章中所讨论的那样)。儿童学习的都是他们想学的东西,而不是某人列出的下一个学习目标。但现在,我们有了这样一种观念:学习是有顺序的,应由成人指导;儿童的适当伙伴是其他同龄儿童(他们从这些儿童身上学到的东西最少);自发的游戏和探索在很大程度上是浪费时间,尤其是对学龄儿童而言。一些发展心理学教科书把学龄前阶段称为「游戏时期」,这暗示了:在 5 岁以后,儿童不再以游戏为主要活动形式。
在许多校外活动场所和家庭中,儿童的教学模式已经深入人心。游乐场不再是孩子自由玩耍的地方,而是由成人带领的辅导和教学场所;在那里,孩子们按年龄分开,就像在学校一样。在家里,许多父母已经默认了这种教育模式,把自己定义为孩子的老师。他们寻找 「教学契机」,购买益智玩具,为了传授特定课程而与孩子「游戏」和交谈。难怪现在的亲子互动常常遭受着孩子的白眼!再好也不过是随便回应一下。
随着时间的推移,学校系统在社会中的地位和影响力不断增强,人们对儿童发展的内在概念也越来越符合学校教育的模式;而无论是在学校还是在学校之外,孩子都变得越来越缺乏自由,受到越来越多控制,越来越少有自发的冒险。不按照既定模式塑造的孩子会被诊断为 ADHD,并通过药物来使他们顺从于规定的行为方式。
怎样才能让那些相信自由、探索和游戏价值观的开明父母,以及希望以信任的方式抚养孩子的人,摆脱这股已经成为洪流的趋势呢?既然有这么多的力量在反对信任孩子,今天还有谁能以信任的方式养育孩子呢?如果你已经逆流而上,请描述一下你是如何做到的。在下一篇文章中,我将就我们这个时代如何以信任的方式养育孩子谈一些自己的看法。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。无论我们是否赞同,你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)。
参考文献
[1] 有关此类调查的示例,请参见:Clements, R. (2004), "An investigation of the status of outdoor play," in Contemporary Issues in Early Childhood, 5, 68-80; and see O'Brien, J., & Smith, J. (2002), "Childhood transformed? Risk perceptions and the decline of free play," in British Journal of Occupational Therapy, 65 (3), 123-128.
为什么强制学校系统应该从这个世界上滚蛋
自主教育应该替代强制学校教育的四个原因
原文:Why Our Coercive System of Schooling Should Topple | Psychology Today
发布于 2016 年 12 月 20 日
有人说我是疯狂的乐观主义者、乐天派、浪漫的理想主义者。否则我怎么会相信我们现在的强制(胁迫)学校系统会崩溃?在多数人的认识里,如今的学校教育系统坚不可摧——它占据了孩子们更多的时间,吞噬了更多的公共资金,雇用了更多的人,它的管理部门的行政级别也越来越高。但是,我依然相信它将在未来十年左右的时间里崩溃,一开始可能会比较缓慢,然后会加速崩溃。为什么这么说呢?以下是四个原因(改编自 Alliance for Self-Directed Education):
1. 学校的强迫对儿童的危害越来越明显。
几十年前,学校还让人可以忍受,主要是因为学校没有占用太多学生的时间。青少年在放学后、周末、暑假有充足的时间来追求自我兴趣。但是逐年来学校越发侵入孩子和家庭的生活,且破坏愈发严重。学期越来越长(比起 20 世纪 50 年代平均长 5 周)。要求出勤的时间变长。家庭作业的量增加了,特别是小学的家庭作业。休息时间缩短了,甚至被取消。有趣味的活动,比如艺术课和音乐课,从课程表中消失已经成为常态,取而代之的是作业和考试准备活动。教师偏离课标的自由越来越少,而学生在标准化考试中取得高分的压力越来越重。
孩子们在学校度过的时间,加上他们写作业的时间,已经比家长花在全职工作上的时间长了。而比起一般成人做的工作,学校的工作更沉重,也更容易引起压力。一个世纪以前,我们一致认为全职童工是儿童虐待,所以我们取缔了它;但现在,学校生活和全职童工别无二致。
学校教育冗长、枯燥、而又压力重重,在此之下不计其数的孩子已然崩溃,越来越多的人已经意识到这点。“学校教育是一段温和无害的经历”已经不足为信,学校致病的证据罄竹难书。下面只是罪恶的冰山一角:
-
一项涵盖了来自不同学区的数百名学生的大型研究,利用经验取样法(译注:在这个研究中:学生带着电子表,每天 7:30 - 22:30 随机总共问八次学生状态如何),发现学生在校时是最不开心的。[1]
-
教师辱骂学生是家常便饭。在一项研究中,64% 的中学生都报告称,自己有过教师辱骂导致的压力症状。[2] 另一项研究表明,将近 30% 的男孩在幼儿园就遭受了教师的辱骂,并且这一比例还逐年上升。[3] 一项对成年人的调查指出,与学校经历有关的回忆中,有将近 50% - 60% 在他们自己看来,是心理创伤。[4]
-
一项研究中采访了许多成年人,询问他们在学校教育中积极的,最棒的体验。很少有受访者能想出类似经历,反而有很多人回忆起了干扰而非支持他们成长的负面经历。[5]
-
小学开学两个月后的孩子的头发皮质醇水平,要比开学两个月前高得多。[6] 皮质醇水平是慢性压力的生理指标,而慢性压力会严重影响孩子的发育和健康。
-
一项由美国心理学会组织的大规模全国调查(相关链接)表明,美国的青少年比起成年人更经常感到压力过大,并且学校是他们压力的主要来源(比例为 83% )。同样在这项研究中,27% 的青少年报告称其在上学期间经历过「极度压力」,相比只有 13% 报告称暑假期间经历过这种程度的压力。
• 目前,20% 的学龄男孩被诊断为注意力缺陷及多动症 ,即 ADHD,这种“疾病”在很大程度上是因为不能适应枯燥的学校生活,其中大多数人都接受了强效药物的治疗以使他们适应(来源)。
说“标准学校教育是受国家认可(甚至是授权)的虐待儿童的方式”,这并不是没有道理的。越来越多的人开始意识到这一点,这也是为什么越来越多的人在想方设法让他们的孩子离开学校。(有关标准学校教育的危害,请参阅此处。)
2. 有越来越多的证据表明,儿童与青少年可以在离开强制学校的情况下自学成才。
夏山(一所推行自主教育而闻名的寄宿学校,由 A.S. Neill 建立)已经在英国运作了将近一个世纪。萨德伯里山谷(一所推行自主教育而闻名的全日制学校,由 Daniel Greenberg 等人建立)已经在马萨诸塞州运作了将近半个世纪,很多学校也在效仿它。「非学校教育」指的是一种家庭教育方法,不强加课标,让孩子追求自己的兴趣。这个方法由教育家和哲学家 John Holt 提出,如今已经有 40 年了。
在过去的几十年间,成千上万背景相异的年轻人,通过这些途径进行自我教育,不少后续研究表明,他们过着很好的生活。如果他们选择继续接受传统的高等教育,他们并没有遇到明显的困难,而且他们在社会所重视的各行各业都取得了成功。成年后,他们反馈道,自主教育让他们能培养自己的兴趣(进而成为职业),同时有益于培养责任感,主动性,创造性,好奇心,批判性思维,与各种人平等沟通的能力这些品质。[7](笔记:在之前的许多帖子中,我已经详细阐述了自主教育的生物学基础,以及它为何如此有效的原因,但对于简明的定义和解释,请参见 这里和这里。)
近年间,随着人们逐渐意识到自主教育所取得的成功,加之学校的胁迫性所造成的日益严重的毒害,让越来越多家庭开始选择了自主教育。他们所取得的成功,也将被更多人看到。最终,量变引起质变,充满胁迫的学校将会无人问津,人们普遍要求把公共资金用于学习中心和其他支持自主教育的设施,最终,所有的家庭,无论收入如何,都会选择自主教育。
3. 与过去相比,现在的自主教育更容易进行了
自主教育也比过去更容易实现。随着更多家庭选择自主教育,整个社会文化对自主教育的接受度不断提高。为了自主教育而设计的学校和学习中心越来越多,进行自主教育的在家上学者也一直在增加。随着自主教育越来越普遍,随着包括教育部门在内的越来越多的人知道年轻人正走在这条路上,并看到他们的成功,这让阻碍自主教育的社会障碍不断减少。
自主教育越来越容易的另一个原因在于技术。今天,任何人只要有电脑和网络,基本上就可以获得全世界的信息。不论想学什么学科,自主学习者几乎都可以找到相关的文章、视频、讨论组,甚至是在线课程。他们可以获取信息,并与世界各地有着相似兴趣的专家和新手分享想法。普通学校的学生必须按照学校规定的方式学习;但自学者可以找到与自己特定的兴趣和学习风格相匹配的科目和学习方法。自学者不受学校课程的缓慢节奏所拖累,在他们想要用更多时间思考、深入研究他们所追求的特定内容时,也不会被催促。
4. 经济形态的发展使得自主教育所培养的技能更受青睐。
谋生方式的变迁,决定了胁迫学校教育所灌输的技能愈发无用,而自主教育所锻炼的技能愈发宝贵。我们不需要能记住大量信息并背出来的人:我们有谷歌搜索来代替。我们不需要很多人去完成指定的重复而无聊的任务:我们有机器人来代替。
社会持续渴求这样的人才:能够批判地,有创意地思考,创新,问出无人想到的问题,为工作带来道德价值,充满激情与目的感。而自主教育中无时无刻不在锻炼这些能力。然而胁迫性学校要求贯彻相同课标,并用奖惩制度而非由衷兴趣驱动学生。因此,热烈的兴趣追求,深刻的知识理解,真诚的目标责任感等品质,注定与强制学校里的大部分学生无缘。他们只会关心如何忍受学校的紧箍咒。
------------
「好吧,」我曾听到有些人这样说,「这些都是我们的强制学校教育系统应该滚蛋的好理由;但它真的会滚蛋吗?」是的,它会,因为它真的已经快完蛋了。事实上,学校越来越令人讨厌,很大程度上正是因为人们越来越多地认识到我们的学校失败了。愚蠢的是,现在我们正在通过做更多无用功来尝试修复学校系统。但这不能永远持续下去。革命将至,不是因为强制学校系统的当局开窍了,而是因为越来越多的家庭成为高压教育体制的受害者,他们会意识到自己有一个选择ーー一个不错的选择ーー而且他们会做出选择。
但不要坐等社会变革发生;让我们亲手推动。让我们发起一场有组织的运动,告诉人们这个选择以及如何去实现它。这就是这个新非营利组织ーー自主教育联盟的目的,我已经参加其中,也许你也愿意加入。
-----------
*此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
也请阅读:《玩耍精神》、self-directed.org(以找到自主教育的盟友);并在脸书上关注我。
参考文献
[1] Csíkszentmihályi, M., & Hunter, J. (2003). Happiness in everyday life: The uses of experience sampling. Journal of Happiness Studies, 4, 185–199.
[2] Irwin A. Hyman & Donna C. Perone (1998). The Other Side of Student Violence: Educator Policies and Practices That May Contribute to Student Misbehavior. Journal of School Psychology, 36, 7-27.
[3}Brengden, M., Wanner, B., & Vitaro, F. (2006). Verbal abuse by the teacher and child adjustment from kindergarten through grade 6. Pediatrics, 117, 1585-1598.
[4] A. G. McEachern, O. Aluede & M. C. Kenny (2008). Emotional abuse in the classroom: Implications and interventions for counselors. Journal of Counseling and Development 86, 3-10.
[5] K. Olson. Wounded by School. Teachers’ College Press, 2009.
[6] Groeneveld et al (2013). Children’s hair cortisol as a biomarker of stress at school entry. Stress: The International Journal on the Biology of Stress, 16, 711-715.
[7] See research studies reported in: (a) American Journal of Education, 94, pp 182-213; (b) Other Education: The Journal of Educational Alternatives, 4, 33-53; and (c) Book by Greenberg, D., & Sadofsky, M. Legacy of Trust: Life after the Sudbury Valley School Experience; and (d) book by Greenberg, D., Sadofsky, M., & Lempka, J. The Pursuit of Happiness: The Lives of Sudbury Valley Alumni.)
对孩子,父母应当少作为
原文:https://www.psychologytoday.com/us/blog/freedom-learn/202205/why-parents-should-do-less-their-kids
孩子想要自立。父母应当放手。
发布于 2022 年 5 月 30 日 | 审稿人:Ekua Hagan
几十年来,各种各样的「砖家」一直在呼吁父母为孩子做更多事情。父母被敦促加大对孩子说话的频率(对学龄前儿童每天 211,000 个词 ,即使没什么话可说),玩耍的频率,带他们去想去的地方,当他们的闹钟和日历,为他们选择课外活动,还要盯着他们,以确保他们不受身体或心理伤害,确保他们做功课,等等。难怪这么多人认为带孩子是件苦差事。
其实不必如此。
放手的好处
在不远的过去,父母让孩子们自己照顾自己。(见这里)。孩子们和同龄人玩,自己或与朋友一起旅行(通常是骑自行车或步行),做或不做家庭作业并学会处理后果,学会照顾自己的安全,自己想办法从心伤中走出来。其结果是他们通常比今天的年轻人更自立、有弹性、情绪上更健康(见这里和这里)。
敦促父母为他们的孩子做更多事情的呼吁确实不少,然而越来越多的研究指出了放手的好处。这些研究大多支持放养的养育方式,这意味着允许和鼓励孩子对自己的生活持有更大的自主权,为自己做更多的事情。这类研究,包括纵向研究和横向研究,表明自主性支持会使儿童和青少年变得更快乐、更自立、更自主,在为人处世和情绪上处理能力更好(参见,Duineveld et al, 2017; Joussemet et al., 2005; Obradovic et al., 2021)。为孩子做得太多会导致习得性无助。
所以,少即是多,为孩子做得少更利于孩子发展。这对你也有好处。例如,在德国进行的一项研究表明,在新冠封锁期间,当父母鼓励他们的孩子在一天的大部分时间里自我管理时,孩子们会更加满足,父母也是如此(Neubauer et al, 2021)。这在大量不同家庭中得到了长期验证。
如何让孩子们减少依赖
如果你的孩子已经过于依赖你们,你得要循序渐进地改变。也许可以先问问他们想为自己或为家庭做些什么。也许你为他们做的事情,他们更愿意自己做。然后再逐步过渡到成长中的关键性事件,一次一件也行,尝试目前为止没做过的事。根据年龄,这些事情可以是自己铺床,打扫自己的房间,自己洗衣服,自己设定闹钟并按时起床参加预定的活动,步行或骑自行车去学校或其他地方,自己搞定学校作业,以及帮做家务,如做饭和洗碗。你可能需要降低评判标准,因为你的孩子,至少在一开始,不会完全按照你的方式去做,而且可能做得不好,但这对于你的孩子培养的能力和自豪感以及你为自己增加的时间来说,非常值得。
儿童天生希望变得越来越自立和能干(参见这里和这里),但如果我们坚持为他们做一切事情,就会使他们失去这种愿望。随着孩子年龄的增长,我们应该期望他们以多种形式为家庭的幸福做出贡献。这对家庭中的每个人都有好处,特别是对孩子本身。
现在,我希望你看看这段令人惊叹的小视频(歌曲《I Will Survive》,由 Lenore Skenazy 填词),鼓励你放飞你的孩子,对你和他都好!
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
Duineveld, J. J., Parker, P. D., Ryan, R. M., Ciarrochi, J., & Salmela-Aro, K. (2017). The link between perceived maternal and paternal autonomy support and adoles- cent well-being across three major educational transitions. Developmental Psychology, 53, 1978–1994.
Joussemet, M., Koestner, R., Lekes, N., & Landry, R. (2005). A longitudinal study of the relationship of maternal autonomy support to children’s adjustment and achievement in school. Journal of Personality, 73, 1215–1236.
Neubauer, A. B., Schmidt, A., Kramer, A. C., & Schmiedek, F. (2021). A little autonomy support goes a long way: daily autonomy-supportive parenting, child well-being, parental need fulfillment, and change in child, family, and parent adjustment across the adaptation to the COVID-19 pandemic. Child Development 92, 1679-1697.
Obradovic, J., Sulik, M., & haffer, A. (2021). Learning to let go: parental over-engagement predicts poorer self-regulation in kindergartners. Journal of Family Psychology, 35, 1160–1170.
为什么我们应该停止按年龄分隔儿童:第一部分
原文:Why We Should Stop Segregating Children by Age: Part I | Psychology Today
儿童通过在近侧发展区中玩耍来学习。
发表于 2008 年 9 月 9 日 | 审稿人:Matt Huston
如今我们对待儿童最奇怪的一种做法——且在我看来也是最有害的——就是将儿童按年龄分隔为互不来往的群体。这种做法不仅出现在学校里,而且在校外环境中也越来越普遍。这样一来,我们剥夺了孩子自我教育的重要组成部分。
在历史上,按年龄划分的教育方式之盛行,与流水线的生产方式之盛行几乎发生在同一时间。这里暗含的类比显而易见。分级制的学校系统把孩子们当作流水线上的产品,以相同的速度从一个工位(年级)移动到另一个工位(年级)。在每个工位上,一个工厂工人(老师)为产品(孩子)添加一些新的组件(知识单元)。在流水线的末端,工厂吐出一批批全新、成熟的成年人,他们都按照制造商(专业教育者)的规格要求制造。
当然,每个有过或了解过孩子的人,包括在我们这种分年级的学校里工作的每个人,都知道这种将儿童发展看作流水线生产的观念是完全错误的。孩子们不是顺从的产品,我们无法为他们添加组件。孩子不是需要逐步按照某种顺序组装的不完整的成年人。孩子本身就是完整的人,他们不断地要求自己生活的自主权,尽管我们让他们经历了种种,他们还是坚持学习自己想学的知识,练习自己想练习的技能。我们无法阻止他们。如果我们顺应他们的意愿,而不是与他们对抗,我们所有人都会过得更好。
在之前的文章中,我描述了在没有成人指导或催促的情况下,孩子能够自学的环境。特别是,我讨论了在狩猎采集游群中曾经发生的自我教育(发表于 2008 年 8 月 2 日)以及如今为自我教育而设计的学校,尤其是瑟谷学校中的自我教育(发表于 2008 年 8 月 13 日和 2008 年 9 月 3 日)。这些环境都有个显著特点,即孩子们会经常与各个年龄段的人互动。人类学家们认为,自由混龄是狩猎采集者儿童自我教育的关键;Daniel Greenberg 作为瑟谷学校的创始人之一,他长期以来也一直认为,自由混龄是瑟谷学校自我教育的关键[1]。
几年前,Jay Feldman(当时是和我一起工作的研究生)和我在瑟谷学校进行了一些关于混龄互动的研究,目的是(a)确定学校里发生了多少混龄现象,(b)找出混龄发生的场景,以及(c)找出混龄互动促进学生自我教育的潜在途径。
在有得选的情况下,孩子们会花相当多的时间与年龄比自己大或小的孩子互动。
瑟谷学校常年保有大约 170 至 200 名学生,年龄从 4 岁到 18 岁不等,有时甚至还有更大的。学生可以随时在校园内自由活动,与他们喜欢的人互动。学校足够大,如果学生们愿意,他们可以只与年龄相差一两岁的其他学生互动。但他们并没有这么做。我们在分析定量研究中发现,超过 50% 的学生在学校与年龄相差超过 2 岁的其他学生进行了社交互动,而 25% 的互动发生在年龄相差超过 4 岁的学生之间 [2]。在游戏中,混龄现象尤为频繁。所有类型的积极游戏,相比不涉及游戏的对话,更容易出现混龄现象。
在接下来的几期博客中,我将讨论混龄环境对自我教育的各种益处,并用我们在瑟谷学校的观察作为例子 [3]。有个明显的益处,同时也是本文剩余部分的主题,就是:
混龄使得年幼的孩子能够参与那些,他们独自或仅与同龄人一起无法完成的活动,并从中学习。
20 世纪 30 年代,俄罗斯发展心理学家 Lev Vygotsky 提出了一个他称之为「近侧发展区」的概念,其定义为孩子独自或跟其他具有相同能力的人一起无法完成,但跟其他技能更高的人一起可以完成的活动 [4]。Vygotsky 认为,当孩子们在近侧发展区与技能更高的其他人互动时,他们学得最好。自 Vygotsky 时代以来,教育学教授们经常用 Vygotsky 的概念来描述成人教师和年轻学习者之间的互动,但我认为,这一概念更适用于孩子们之间自然发生的混龄互动。
举个例子(我在其他地方也使用过这个例子),想象一下两个 4 岁孩子尝试玩掷接球游戏 [5]。他们既不能把球掷得足够直,也不能很好地接住球,所以这个游戏毫无乐趣,根本玩不起来。现在想象一下一个 4 岁孩子和一个老练的 8 岁孩子一起玩掷接球。年长的孩子可以通过跳跃和扑捉来接住年幼孩子乱投出来的球,并且玩得很开心;同时,年长的孩子可以把球扔到年幼孩子伸出的双手里,让后者体验到接球的快乐。因此,掷接球是一个在 4 岁儿童的近侧发展区内的游戏。在只有 4 岁儿童的年龄隔离的环境中,他们无法进行掷接球游戏;但在包含 8 岁和 4 岁儿童的混龄环境中,每个人都可以玩掷接球。
在瑟谷学校,一天中的任何时候,你都可以发现年幼的孩子与年长的孩子一起玩游戏,而这些游戏是他们与同龄人在一起玩不了的。这些游戏包括智力游戏和运动游戏。他们一起玩不是因为有人要求他们这样做,而是因为他们想要这样做。年幼的孩子被年长者的活动和个性所吸引,而年长的孩子也喜欢与年幼者互动的机会。
这里有个关于近侧发展区中智力游戏的例子。在我们观察到的几个场合中,7 岁或 8 岁的孩子与年长的孩子和青少年一起玩复杂的纸牌游戏。仅凭 7 岁和 8 岁的孩子自己,没法玩这样的游戏的。他们无法保持足够长时间的注意力,无法记住规则,甚至无法让手中的牌保持直立,以免被别人看到。他们之所以能和年长的孩子一起玩这些游戏,是因为年长的孩子能帮助他们保持在正确的轨道上,在必要时提醒他们需要做什么,有时还给他们一些策略提示:「集中注意力。」「试着记住哪些牌已经出过。」「在打出一张牌之前要想清楚,这样你就不会出一个别人可以拿走的牌。」注意力、记忆和预先计划是我们通常所说的智力的要素。在玩纸牌的过程中,他们只是为了好玩,年长的孩子在不经意间帮助年幼的孩子发展他们的智力。
Vygotsky 的概念还帮助我们理解年幼的孩子在瑟谷学校是如何学会阅读的。那些不会阅读或阅读能力不强的孩子,经常和阅读能力强的孩子一起玩涉及文字的游戏(尤其是电脑游戏)。擅长阅读的孩子会大声朗读其他孩子无法阅读的内容,而在这个过程中,不会阅读的孩子们逐渐成为了阅读者。
混龄还使年幼的孩子能够参与一些嬉戏冒险,这些活动如果独自或只和同龄人一起进行可能过于危险。那些本应害怕独自进入树林的孩子,如果和了解树林的年长孩子一起,就会感到安全。同样,对于刚开始学习爬树的小孩来说,如果有大孩子在树下指导他们如何爬树,并准备好在他们摔倒时接住他们,那么他们会觉得在较低的树枝上尝试攀爬很安全。
当你还小,只和同龄的孩子在一起时,可能的活动范围受到你们年龄段的知识和能力的限制;但是和年长的孩子们合作,你能够做的事情几乎没有限制!
--------
在接下来的几篇文章中,我将介绍更多混龄教育环境的益处,包括对于年长孩子和年幼孩子的益处。
-------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
-
Greenberg, D. (1992). Sudbury Valley's secret weapon: Allowing people of different ages to mix freely at school. In D. Greenberg (Ed.), The Sudbury Valley School experience, 3rd ed. Framingham, MA: Sudbury Valley School Press.
-
Gray, P. and Feldman, J. (1997). Patterns of age mixing and gender mixing among children and adolescents at an ungraded democratic school. Merrill-Palmer Quarterly, 43, 67-86.
-
Gray, P. and Feldman, J. (2004). Playing in the Zone of Proximal Development: Qualities of Self-Directed Age Mixing Between Adolescents and Young Children at a Democratic School. American Journal of Education, 110, 108-145.
-
Vygotsky, L. (1978). Interaction between learning and development. In M. Cole, V. John-Steiner, S. Scribner, and E. Souberman (Eds), Mind and society: the development of higher psychological processes. Cambridge, MA: Harvard University Press.
-
Gray, P. The value of age-mixed play. Education Week, April 16, 2008.
为什么我们应该停止按年龄分隔儿童:第二部分
原文:Why We Should Stop Segregating Children by Age: Part II | Psychology Today
大小孩子一起玩耍,比同龄更具趣味性,竞争性也更低。
发表于 2008 年 9 月 17 日 | 审稿人:Ekua Hagan
在漫长的人类历史中,玩耍几乎总是在混龄环境中进行,也就是大小孩子都在一起玩耍。为服务于教育目的而演化出的玩耍的生物学基础,是在孩子们几乎从未按年龄分隔的环境中形成的。研究狩猎采集群体中玩耍的人类学家报告说,一个典型玩耍小组的年龄可能从 4 岁到 12 岁,或从 8 岁到 17 岁。
当我们观察年龄分隔环境(如学校操场)中的玩耍时 —— 在这里 6 岁的孩子只能和其他 6 岁的孩子玩,12 岁的孩子只能和其他 12 岁的孩子玩 —— 我们正在观察现代社会的非自然产物。在年龄分隔环境中研究儿童玩耍,就像在笼子里研究猴子一样;我们正在观察在非自然限制条件下的行为。笼子里的猴子比野生猴子表现出更多的侵略性和支配行为,同样,在年龄分隔环境中的儿童与混龄环境中的儿童相比也是如此。
在我上一篇文章中,我描述了混龄玩耍的好处,它使年幼的孩子们能够参与那些,对他们个人或仅与同龄人一起进行而言过于困难的活动,并从中获得学习机会。在这篇文章中,我将解释混龄玩耍和同龄玩耍之间的一些质的差异。
我的主要观点是:混龄玩耍比同龄玩耍更少竞争,更具创造力,更有助于练习新技能。
混龄玩耍无关竞争
简而言之,混龄玩耍比同龄玩耍更好玩。当年龄相仿的孩子们一起玩游戏时,竞争心态可能会干扰游戏的趣味性。在我们当前这个过于强调各种获胜和比较的文化中,这一现象尤为明显,这种文化强调通过竞争和分级的学校系统来决定谁更优秀。
相反,当年龄差距较大的孩子们一起玩游戏时,焦点会从「击败」对方转向寻求乐趣。年长、个头大、技能更高的孩子打败年幼的孩子并不能获得什么荣誉感,而年幼的孩子也不指望击败年长的孩子。因此,他们更愉快、更轻松地进行游戏,修改规则,使所有参与者都觉得既有趣又富有挑战性。
闹着玩的心态能够促进创造力、尝试和学习新技能,而严肃的心态往往会抑制这些发展,使人退步回到已经掌握得很好的技能上(这一点将在未来的文章中进一步阐述)。
我对混龄玩耍的系统性研究主要在瑟谷学校进行。正如我之前的文章中提到,这所学校的 4 岁至 18 岁的学生一整天都可以自由地与其他人互动。
在从瑟谷学校毕业的几年后,Michael Greenberg 写了一篇描述学校里混龄足球比赛的文章。以下是我从他的文章中引用的一大段文字,非常生动地展示了混龄玩耍的价值。
「有人说,『我们来踢足球吧』。此刻想玩的人都来到了球场。有 6 岁的孩子,有 10 岁的孩子,有 18 岁的青年,好像还有一名工作人员或是想加入的家长。球场上有男孩和女孩。」
「在选择队伍时,人们会有意识地努力均衡两边的实力。...这通常意味着一支队伍会有一个额外的『大孩子』,他的球踢得很好,而另一支队伍会有一群 6 岁的小孩子挡在他的面前。人们希望两支队伍实力均衡,因为他们是为了好玩而玩的。一场实力悬殊的比赛并不好玩...」
「比赛是由那些想玩的人参加的,他们可以玩多长时间都可以。总是会有一些人很看重获胜,但同龄人之间的表现压力很小。大多数人并不真正关心谁赢。」
「你可能会觉得他们并没有很努力地去玩好这个游戏,但事实并非如此。只有付出努力和挑战自己,玩耍过程才会有趣。这就是人们首先发展出像足球这样的游戏的原因。毫无目的地四处跑动会让人感到无聊,但是在尝试将球踢进两个由试图阻止你的人守卫的门柱之间时四处奔跑——这令人兴奋。」
「像我们在[瑟谷学校]这样进行体育运动的人们,所学到的关于生活的教训,比那些严格、注重表现的体育运动所能教授的要深刻得多。他们学会了团队协作——不是『我们对抗他们』那种团队协作,而是一群具有不同天赋的不同年龄的人组织起来,共同进行一项活动的团队协作——也就是生活中的团队协作。他们学会了卓越,不是『我就是明星』那种卓越,而是为自己设定一个标准,并竭尽全力达到它的那种卓越。」
「我现在 23 岁了,踢了很多年足球。每次我试图踢球时,总有三个 8 岁的孩子围着我,要我试着表现得比他们更好实在有点蠢。我认为那些 8 岁的孩子们忙着追赶比他们高出三英尺的孩子,根本不用担心成为最好的 8 岁孩子。」
「就像在现实生活中一样,在这个游戏中,唯一重要的标准是你自己为自己设定的。你所学到了一条深刻的真理,即我们彼此之间的差异如此之大,以至于同辈压力和价值比较毫无意义。如果你 11 岁,只能和其他 11 岁的孩子一起玩,那么你很难领悟到这个解锁卓越意义的深刻真理。」
「[你还会]学会负责和克制。在多年来玩足球、篮球这样的剧烈运动中,从未出现过超过轻微擦伤或瘀伤的伤害。人们穿着常服进行这些运动,而没有使用通常所需的标准防护装备。」
「当穿着护具的人频繁受伤时,这该如何解释呢?因为在一种兵营式的、以表现为导向的运动(或生活)观中,确保不伤害别人不如赢得比赛重要。所以,无论你谈论多少关于『体育精神』,或者你穿了多少安全护垫,人们还是会受伤。当你将运动(或生活)视为一种有趣、令人兴奋的过程,作为一种出于纯粹的快乐和美感而去做的事情时,那么不伤害别人,不损害他们享受同样过程的能力,就成为了优先事项……」
「参与一项通过团队协作、追求个人卓越、责任和克制,将不平等的身体冲突转化为寻求有意义体验的平等灵魂共同结合的活动,是我一生中最深刻的体验之一。我相信这对其他人也有类似的影响。」[1]
在我们对瑟谷学校的系统观察中(如前一篇文章中所提到的),Jay Feldman 和我记录了许多与 Michael Greenberg 描述相符的混龄游戏。例如,在一个情景中,Feldman 观察到一个高大的 15 岁男孩与一群身材较矮的 8 至 10 岁孩子一起打篮球。这个年长的男孩很少投篮,但在对手队伍的一群小男孩试图从他那里抢走球时,他花了很多时间快乐地运球。然后,他会将球传给他的唯一队友(8 岁),并鼓励他投篮。
通过运球和传球而不是投篮,这个年长的男孩使得比赛不仅对年幼的孩子们充满乐趣和挑战,同时也为他自己带来了乐趣。当没有人足够高来挡住你的投篮时,投篮实在是太容易了,因此并不好玩。但是在一群试图抢走球的矮个子中运球却非常有趣;这是一种提高运球技巧的有趣方式。
以下是另一个例子,引用自我们的一篇文章,说明了混龄运动游戏富有创意、轻松愉快的特点:
「在一场混龄的夺旗游戏中,一个队伍,叫大人队,有三个青少年和一个 11 岁的孩子,另一个队伍,叫群众队,由十个 4 至 8 岁的孩子和一个 12 岁的孩子组成。Larry(4 岁)经常跑过界线,被 17 岁的 Sam 抓住,这个过程包括了许多在模拟战斗中挠痒痒和抱起 Larry 的动作。
把 Larry 放下后,他会欢快地跳回自己的一方,而不用去坐牢。大人队中的一个或多个人经常跑进群众队的领地,不是去追逐旗子,而只是在一群小孩子追逐他们的时候四处跑动。似乎没有人过于关注获胜,但当群众队最终夺得旗子时,他们欢呼雀跃。」[2]
同样,当玩家年龄差距较大时,相比与年龄相仿的玩家对局,棋牌类游戏也会以更富有创意、非竞争性的方式进行。Feldman 观察到了许多国际象棋游戏,恰好在他进行研究时流行。
实力相当的玩家之间的比赛往往相当严肃;玩家们看上去都想赢。而实力悬殊的玩家之间的比赛,通常年龄差距较大,游戏更富有创意,氛围轻松愉快。为了让游戏更有趣,年长的玩家通常会以某种方式自我设限,例如故意陷入困境,并经常向年轻玩家指出更好的棋路。这些年长的玩家似乎在利用这类游戏尝试新的玩法,而他们尚未准备好在严肃的比赛中尝试这些玩法。
我见证过的一些最具创意和欢乐的游戏实例,包括青少年和年幼儿童共同参与的幻想游戏。以下是我不久前观察到的一个场景的描述:
「我坐在瑟谷学校的游戏室里……假装在读一本书,但偷偷观察着一个引人入胜的场景。一个 13 岁的男孩和两个 7 岁的男孩,正在创作一个纯粹为了自己娱乐的奇幻故事,其中涉及英勇的角色、怪物和战斗。」
「小的孩子看着黑板,欢快地喊着接下来会发生什么,而那个 13 岁的男孩是一位优秀的艺术家,他把这些想法转化成一个连贯的故事,并在黑板上快速地画出场景,几乎是跟着年轻孩子描述的速度。游戏持续了至少半个小时,这是我给自己允许观看的时间,然后我离开了。」
「我很荣幸能欣赏到这样的艺术创作,我知道,这是单靠 7 岁的孩子无法完成的,也几乎肯定是单靠 13 岁的孩子无法完成的。我观察到的 7 岁孩子们无拘无束的热情和想象力,再加上他们玩伴那位 13 岁孩子先进的叙述和艺术能力,为这次创意爆发提供了恰到好处的化学反应底物。」[3]
混龄可以成为匹配能力的一种手段
本文最想的的,是能力不对等的时,人们进行游戏的价值。尽管如此,我得补充说明,能力相对对等的人之间,自主选择的游戏也是同样有价值的。
总体而言,年龄相近的孩子,相较年龄不同的孩子在能力方面要更为相似,但事情不总是如此。在一个混龄环境中,在某个领域的活动中超过或落后于同龄人的孩子可以在年长或年幼的孩子中找到能力相当的伙伴。在攀爬方面笨拙的孩子可以和年幼的孩子一起在岩石和树上攀爬,不会觉得自己总是落后于别人,这样可以提高她的攀爬能力。那些才华横溢的 11 岁吉他手,他们的音乐才能超过了同龄人,可以和与他们水平相当的青少年一起即兴演奏。
Feldman 观察到了瑟谷学校的一些学生在某些能力上超过了同龄人,并经常与年长的孩子一起玩耍。一个例子是 12 岁的 Randy,他是一位出色的国际象棋选手,参加比赛并拥有官方排名。在学校里,他唯一的国际象棋同龄对手是 Jack(17 岁)、Elana(17 岁)和 Ken(18 岁)。他通过与这些年长学生的比赛来衡量自己的进步。他可能在与同龄人和年幼儿童的比赛中练习新的招式,但测试自己棋艺时会和与大上五六岁的学生对局。
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
参考文献
-
Greenberg, M. (1992). On the nature of sports at S.V.S. and the limitations of language in describing S.V.S. to the world. In D. Greenberg (Ed.), The Sudbury Valley School experience, 3rd ed. Framingham, MA: Sudbury Valley School Press.
-
Gray, P. & Feldman, J. (2004). Playing in the Zone of Proximal Development: Qualities of Self-Directed Age Mixing Between Adolescents and Young Children at a Democratic School. American Journal of Education, 110, 108-145.
-
Gray, P. The value of age-mixed play. Education Week, April 16, 2008.
为什么我们应该停止按年龄分隔儿童:第三部分
原文:Why We Should Stop Segregating Children by Age: Part III | Psychology Today
对小孩子而言,大孩子是最好的榜样,最佳的助手,也是最好的老师。
发布于 2008 年 9 月 24 日
我们成年人有时会过分地高估自己,觉得自己是孩子最佳的榜样,向导和教师。然而,孩子对同龄人的兴趣,其实远超于他们对我们的兴趣。孩子尤其关注并愿意向那些比他们稍大一些,发展稍微超前一些,但又不至于超前太多的孩子学习。孩子被比他们大的孩子吸引,大孩子又被青少年所吸引。对他们来说,成年期还遥不可及,因此并不引起太大关注。这就是为什么,混龄的互动对孩子自我教育至关重要。
在我之前的两篇文章中,我着重讨论了混龄玩耍的价值。我描述了这种玩耍中,小孩子如何得以挑战自我,做到他们在只和同龄人玩耍时无法做到的事情;我还描述了混龄玩耍往往比同龄玩耍更富有创造性,竞争性更低,更利于尝试和探索。现在,我要通过描述混龄的孩子们在玩耍之外的其他互动方式,来说明混龄的孩子们是如何促进自我教育的。和以前一样,我的例子主要来自于我在瑟谷学校的观察。这所学校的学生年龄从 4 岁到 18 岁,他们一整天都可以自由地交流互动。
小孩子总想模仿大孩子。
在一个阳光明媚的早晨,我在学校操场边坐着,看着两个十岁的女孩子游刃有余、若无其事地在滑梯上正着走下来。一个六岁的小女孩看得比我还要入神,然后她也爬上滑梯,开始试着在滑梯上走起来。这对小女孩明显是个挑战。她弯着膝盖,双手伸到滑梯两侧,一旦失去平衡就能立刻抓住滑梯的边缘。我还看到,那两个大女孩站在滑梯旁边,神色紧张地看着小女孩,如果小女孩要是摔下来,她们准备好随时扶住她,但又尽量不让这个动作看起来太明显。其中一个大女孩说:「你不一定非得这么做,可以直接滑下来。」但小女孩坚持不懈,一步一步慢慢走下来,当她成功走到底部时,脸上洋溢出骄傲的笑容。不久之后,那两个大女孩开始爬附近的一棵树,小女孩也紧随其后。小女孩显然是在努力去做大女孩们轻易就能做到的事。
这只是我观察到的小孩子模仿大孩子行为的众多例子之一。孩子在观察大孩子和青少年进行策略游戏、阅读、操作电脑、高难度运动等活动时,会受到他们影响,从而激发自己去尝试这些活动。在我们研究学校里的孩子如何以及为何学习阅读的过程中,有些孩子告诉我们,他们想要阅读,是因为他们羡慕那些正在阅读并讨论他们所读内容的大孩子。正如一名学生所说:「我也想有他们那种魔力,我也想加入那个俱乐部。」
小孩子并非盲目地去模仿大孩子。相反,他们会观察、思考他们所看到的,并把他们学到的东西以他们自己的方式应用到自己的行为中。因此,即使是大孩子的错误、不健康的行为也能对小孩子产生积极的影响。小孩子会不停地讨论他们对周围大孩子的行为的喜好。负面榜样也能像正面榜样一样给小孩子提供帮助。「我不会像 X 那样做,因为我看到他那样做会遇到很多麻烦。」
孩子从大孩子间的谈话中也能学到大量知识,哪怕他们并没有直接参与其中。通过听取大孩子间的言语和想法——这比他们自己的要复杂得多,但又没有超出他们的理解范围——小孩子可以丰富自己的词汇和思维。
大孩子也会从小孩子身上得到启示。
不只是小孩子,瑟谷学校的大孩子和青少年在混龄的环境中,也能开阔他们的视野。他们会受到小孩子的玩具和行动的启发,坚持进行在同龄环境中可能早就放弃的活动,例如玩积木、粘土、蜡笔和画笔等。因此,他们中的许多人在这些活动上技艺高超。学校培育出了许多成功的创意艺术家,我猜测混龄环境在其中起了很大的作用。
大孩子很善于帮助和指导小孩子,部分原因是他们并不会过度帮助或过度指导。
小孩子在需要帮助或建议时,通常更愿意去请教大孩子,而不是成年人,哪怕他们可以轻易地找个成年人来帮忙。我认为这背后有许多原因,但有个主要原因,我觉得,是控制。
寻求帮助或建议的孩子并不想放弃他们对局面的控制。他们不想得到任何超出他们所要求的帮助,并且他们想要自己决定是否接受所提供的帮助。因为成年人更可能被视为权威人士,所以比起大孩子,拒绝成年人的帮助或在建议超过自己需要时,挑战他们的意见会更加困难。而且,根据我自己的观察,大孩子比成年人更少在小孩子不需要的时候提供帮助或建议。大孩子并不担心求助者的长期发展,也不在乎自己是否能展现出作为优秀导师和引导者的形象,所以他们只提供被求助者所需要的帮助,这正是小孩子想要的。
举个例子,在 Jay Feldman 的研究中,有一次 5 岁的 Sue 让 8 岁的 Anne 帮她在做手链时穿针引线。Anne 完成请求后,Sue 就自己继续忙碌,而 Anne 也没有再提供额外的帮助,尽管 Sue 在使用织布机时一直遇到问题,也出了不少差错。如果 Sue 找的是个大人帮忙,可能大人会继续陪在她旁边,帮她完成更多步骤,这样一来,Sue 自己完成工作的自豪感就会没了。很明显,虽然这个任务对 Sue 来说有难度,但她并不想要过多帮助,所以找 8 岁的孩子求助是更稳妥的选择。
这是一个宝贵的教训,让我们大人知道该如何给孩子提供帮助和建议:别提供超过被求助者请求的帮助或建议!这个道理其实也适用于对大人的帮助和建议。我知道在我求助时,我并不是在寻找一个监督者,我只是希望得到我所请求的帮助,剩下的我希望自己来做,哪怕这意味着我可能会出更多的错。帮助太多反而会让我失去自由、自控和玩耍的感觉。
大孩子教小孩子往往效果出奇地好,一个重要原因就是他们跟小孩子的差距并不大。
Daniel Greenberg 在他关于瑟谷学校的一本书中谈到了这个观点,他写道:「孩子喜欢从其他孩子那里学习,因为这往往更容易。孩子作为老师,对学生的困难有更切身的理解,因为他们自己也刚刚经历过。他们的解释通常更简单,更实用,压力也更小,评价也更少。」[2]
解释不仅更为简单,由于来自年龄相近的人,也更容易挑战和质疑。这些解释更容易被看作是一种待深思的观点,而不是不可动摇的真理。理解来自思考,而不是盲目接受。以下是来自 Jay Feldman 观察的一个例子:
8 岁的 Ed 向 14 岁的 Arthur 抱怨,有两个男孩总是取笑他,叫他不喜欢的名字。Arthur 告诉 Ed,他可以向学校的纪律委员会投诉。Ed 回应说:「他们有言论自由。」Arthur 想了一下,回答说,言论自由意味着他们有权利说那些话,但 Ed 也有权利选择不听。Ed 听后思考了一下,说:「好吧。」[3]
注意这个例子,Ed 觉得自己跟 Arthur 是平等的,所以他挑战了 Arthur 的意见,这种挑战引出了新的想法。而且,这次对话真是简洁明了,一针见血。
大孩子给小孩子讲解事情时,也能增进自己的理解。
每个做过老师的人都知道,我们在教别人的时候,往往比被别人教的时候学得更多。把我们的想法用别人能理解的言语表达出来,并且需要深思可能的反对意见,这些过程都会让我们对原本以为已经了解的东西有更深入的思考。往往这会帮助我们得到比之前更全面的理解。在混龄环境中,不仅仅是大人,孩子们也可以通过教学来学习。
在上述例子中,14 岁的 Arthur——作为「老师」,在他们的谈话中可能学到的东西和 8 岁的 Ed——作为「学生」,一样多。Ed 对 Arthur 的挑战让 Arthur 更深入的思考并进一步解释他的观点,这可能是他以前没想过的。他们两个可能都从这次谈话中对学校的民主体制有了更深入的理解。
再举一个例子,设想一下一个大孩子和小孩子在一起玩国际象棋或者其他策略类游戏,同时在游戏中教给小孩子一些策略。当大孩子告诉小孩子,走 A 比走 B 更好的时候,小孩子会问:「为什么?」回答这个问题时,有经验的棋手不能只依赖于他们从以往的棋局中积累的直觉,而必须给出一个清晰的理由。她必须把她的隐性知识转化为显性、明确的知识,这样做会让她成为更好的棋手。这种情况在每个可以自由提问的知识交流活动中都会出现。
大孩子在帮助小孩子的过程中,他们的同情心和照顾他人的能力得到了发展。
与小孩子交往中得到的认识和理解比起来,道德上的进步可能更重要。要想成为负责任、有道德感的人,孩子们不只需要有被别人照顾的体验,他们也需要学会去关心和照顾他人。研究表明,无论是男孩还是女孩,他们对于比自己小几岁的孩子都比对待同龄的孩子要体贴得多。小孩子似乎能唤醒我们所有人内在的照顾他人的本能。在肯尼亚的一项研究中,家中照顾年幼兄弟姐妹的男孩在同龄人之间的行为要友善得多,相比那些没有这种机会的男孩,他们的攻击性行为要少得多。[4]看来,通过与小孩子的互动,照顾他人的本能得以增强,一旦增强,它就会延伸到对待同龄人的行为上。
在瑟谷学校的观察中,每天都能看到很多大孩子在照顾小孩子的场景。比如,大孩子给坐在他们腿上的小孩子讲故事,帮助小孩子找到丢失的东西,修好他们弄坏的玩具,以及在日常生活中对需要帮助的小孩子伸出援手。最有意思的场景之一是,一个大孩子因为小孩子对一个更小的孩子不够好而指责这个小孩子。比如,在一个场景里,我们看到一个 10 岁的女孩跟三个 6 到 8 岁的女孩解释为什么他们应该让一个 4 岁的小女孩加入她们的游戏。「你们被排挤在外,会有什么感觉?」她说。还有一次,我们看到一个 17 岁的男孩批评一个 13 岁的孩子,他以不友好的态度拒绝了一个 8 岁的男孩想和他一起玩游戏的邀请。我们听到的这些批评,如果由大孩子说出来,要比成年人说出来的效果要更好。
------
把这篇文章和前两篇放在一起看,我得出了以下结论。一个混龄环境可以:(1)让小孩子有机会参与到他们和同龄人单独做不了的活动中;(2)推动非竞争性的、富有创意的玩法,这对于孩子学习新技能来说是最理想的;(3)使那些在某些领域超过或落后于同龄人的孩子找到与自己水平相当的伙伴;(4)让小孩子能从大孩子的活动中找到灵感,反之亦然;(5)让小孩子在接受帮助和建议时不放弃自己的自主权;(6)让大孩子通过教导别人来学习;(7)让大孩子通过帮助小孩子来锻炼他们的同情心和照顾他人的能力。当我们在学校和其他地方按年龄把孩子们分隔开,我们就剥夺了他们享受这些好处的机会。我们就是在拿走他们用自然、愉快的方式从彼此中学习的机会。
----------
此时此刻,你对这一切有什么看法?……这篇文章,从某种意义上来说,也为所有人提供了交流的平台。你的疑问、感悟、故事、观点都会被我以及阅读这篇文章的所有人尊重,无论我们是否赞同。文章的原网址 Psychology Today 不支持评论了,但你可以在我的脸书上留言……关注我之后,我们可以讨论更多有趣的话题。(当然,鼓励大家在这篇文章下面的评论区里发言——译者注)
-----------
参考文献
[1] Feldman, J. (1997). The educational opportunities that lie in self-directed age mixing among children and adolescents. Ph.D. dissertation, Department of Psychology, Boston College, 1997.
[2] Greenberg, D. (1987). Free at last: the Sudbury Valley School. Framingham, MA: SudburyValley School Press.
[3] Gray. P. & Feldman, J. (2004). Playing in the zone of proximal development: Qualities of self-directed age mixing between adolescents and young children at a democratic school. American Journal of Education, 110, 108-145.
[4] Ember, C. R. (1973).Feminine task assignment and the social behavior of boys. Ethos, 1, 424-439.
尽责性与在线教育
由技术驱动的教育正在要求更高的尽责性,而非智商
在线教育,如可汗学院,被誉为一场重大创新,有望彻底革新高等教育和基础教育,为学生提供更优质的教学,同时降低成本。这是一个有趣的想法,值得尝试。但总的来说,我对大规模开放在线课程(MOOC)持相当审慎的态度:它们似乎明显印证了 Amara 定律「我们往往高估一项技术短期内的影响,而低估其长期影响」。而且,它们普遍没能很好地发掘互联网的潜力(我所见过的 MOOC 都无法提供像 Bret Victor 的《抽象阶梯》那样出色的学习工具,差距至少在十倍以上)。
我感兴趣的一个问题,是 MOOC 可能带来的长期影响。通常情况下,变革不会让所有相对位置或比例保持不变——有人会获益匪浅,有人却只能略微受益。在我看来,在线教育不太可能平等地降低所有成本,或者在提升教育质量方面对所有学生产生同等效用。
那么,在线教育能带来哪些差异呢?来自 90 年代关于「数字鸿沟」的旧理论曾预言,机会将更多地青睐中上阶层的白人学生;但另一方面,支持者却津津乐道那些弱势群体的故事:譬如非洲村庄里的女孩,也能通过手机接受优质教育。由此观之,在线教育反倒有望化解教育不公。完全没有接受教育和接受真正教育之间的鸿沟将会消失,贫穷的循环将被斩断。当互联网无处不在,比优质学校教育更为普遍之时,通过互联网提供的优质教育将产生平等化效应(精英们不会比以前更好,而非精英现在有机会获得成为精英的先决条件)。
影响教育成败的因素
或许可以探究是什么让一个人在教育上取得成功,并审视在线教育对其产生的影响。粗略而言,抛开环境因素,在教育中取得成功的影响因素包括:
-
智商/g
智商显然能预测很大一部分的教育成功(讽刺的是,智商测试仅包含学业问题),因为一个人越聪明,学习任何事物就越容易,更不用说学校作业了。
-
尽责性(大五人格模型中的一个维度;关乎勤奋、毅力与努力)
如果一个人智力不足,无法轻松理解知识并顺利通过考试,他仍可以选择努力学习:多做练习题,主动寻求帮助等。成功不会一蹴而就,但勤能补拙。智力水平和勤奋程度这两大因素合计,与学业成就的相关系数约为 0.7。聪明勤奋者方能登上巅峰,反之愚钝懒惰之人注定平庸无为。
-
其他
其余相关因素包括:社会经济地位、文化背景(如是否出自东亚文化圈)以及其他难以量化的变量,例如特殊的人生际遇,或是一位鼓舞人心的良师益友等环境因素。
(学校硬件设施,如建筑、教材等的质量并非影响学习成绩的决定性因素。它们充其量只能作为反映学生家庭背景、学习能力等因素的间接指标,几乎无法预测学习成绩或学位获得情况。这也解释了为何增加教育经费往往收效甚微,而相关的自然实验也证实了投入与产出之间的回报率极低。如今,在互联网时代,海量的数字化教科书、论文和二手书唾手可得,而且没人会给别人送一台五年前的旧电脑,再质疑获取知识的途径存在问题,已经有点好笑了;我们早已远远超越了当年最具天赋和上进心的自学者,如拉马努金所面临的障碍。)
尽责性
有关智商的研究已经非常成熟,相关文献可以追溯到近一个世纪前。大量研究表明,智商与许多积极的人生结果密切相关。相比之下,「尽责性」这一概念则相对鲜为人知。为了说明在探讨影响学习和发展的关键因素时,为何尽责性可以与智商并驾齐驱,我们有必要在此补充一些相关的背景资料。
1991 年一项著名且被频繁引用的元分析,即 Mount 与 Barrick 的“The Big Five Personality Dimensions and Job Performance: A Meta-Analysis”发现,即便在控制了智商、教育等显而易见的因素之后,尽责性与多项工作表现测量指标之间仍存在相关性(约 0.2;可能达到 0.31),这一结果在 1996 年的后续调查中得到了进一步证实。尽管尽责性与智商的相关性本就较弱(但可能并非完全无关),然而它与在医学院取得成功、成为优秀教师、在拼字比赛中获胜,以及各种教育成就密切相关(Noftle & Robins 2007; Poropat 2009; Hsu & Schombert 2010; Chamorro-Premuzic & Furnham 2008; Grigsby 2015)。尤其在在线教育领域,尽责性可能是决定成败的关键因素(Elvers et al 2003)。在控制了智力因素后,它与教育资历相关;与未曾入狱相关,并预测未来的犯罪记录;在社会经济地位和终身收入水平等方面存在显著关联,其影响力甚至超过了智商( 总结),与职业地位的相关性也几乎与智商不相上下(并且能预测就业)。与智商类似,尽责性与保持苗条身材、减少身心疾病、长寿等健康因素紧密相连(无论是儿童还是成人;参见 Bogg & Roberts 2004, Hampson & Goldberg 2006, Turiano et al 2013)。与「生活质量」(0.4)和「幸福感」(0.25)相关(Steel et al 2008, “Refining the relationship between personality and subjective well-being”)。 一些研究表明,尽责性与离婚率、社会经济地位以及长寿也有一定关联;或者简单地说,几乎与长寿相关的每一种行为都有关联(参见Roberts & Bogg 2004)。进一步分析终身收入,在一项针对天资聪颖的儿童的研究中(类似于 SMPY 研究结果),Gensowski et al 2011 发现对于这些智商超群的孩子而言,尽责性对其一生收入(通常为 285 万至 428 万美元)的影响甚至超过了智商(尽管仅略高于外向性),而这种影响并非完全来自教育水平的提高。粗略查看第 45 页的图表数据,从尽责性的第 10 百分位到第 90 百分位,个人终身收入可能会增加 1,121,869 美元左右。(值得一提的是,目前有一个更为流行的「毅力」人格概念,它与尽责性十分相似,但更强调长期视角和较少反馈,而它可能与 GPA、军校毕业率和拼字比赛表现的相关性略高一些。因此,任何「坚毅」的益处都可以视为尽责性的体现。)此外,与经验开放性并列,尽责性是创造性科学家最主要的人格特征之一(其重要性甚至超过了内向性格!)。
智商和尽责性之间存在一个关键差异:提高智商是一项棘手且往往无法完成的任务,但有微弱的证据表明,尽责性可以通过尝试更具挑战性的任务来提高。(这里存在一个可笑的悖论——培养做艰苦乏味工作的能力本身就需要付出艰苦乏味的努力,那么一个人该如何迈出第一步呢?)有意思的是,与智商会随年龄增长而稳步下降不同,尽责性却会随年龄增长而稳步提高,这一发现令人倍感欣慰。正如 Richard Hamming 在其《你和你的研究》一文中所指出的那样:
让我们来谈谈内驱力这个话题。你会发现,几乎所有取得杰出成就的科学家都拥有超乎寻常的内驱力。我曾与天才科学家 John Tukey 在贝尔实验室共事 10 年,亲眼见证了他非凡的内驱力。一次,我惊讶地得知 John 竟然比我还小几岁。显然,他是个不折不扣的天才,而我不是。
我怒气攻心,冲进 Bode 的办公室说:「像我这个年纪的人,怎么可能达到 John Tukey 那样的知识水平?」Bode 悠然地向后靠在椅子上,双手枕在脑后,微微一,说道:「Hamming,如果你也像他那样多年如一日地孜孜不倦,你的知识也会多到让你惊讶的。」我羞愧至极,简直是马上溜出了办公室!
Bode 的意思是:「知识和生产力就像复利。」如果两个能力相当的人,一个比另一个多付出 10% 的努力,那么从长远来看,前者的成果将是后者的两倍还多。知道的越多,学的越多;学的越多,能做的越多;能做的越多,机会越多——这很像复利。我就不说具体的倍率了,但增长的速度绝对是惊人的。假设两个人的能力相当,其中一个能够日复一日地多投入一小时思考,日积月累,他一生的成就将远远超过另一个人。
我将 Bode 的话铭记于心,此后的几年里,我更加发奋图强,成果也随之倍增。虽然不愿在妻子面前提起,但我为了钻研,的确常常疏忽了她。要想取得非凡的成就,就不得不忽略一些旁枝末节,这是毋庸置疑的。
更聪明地工作
说到内驱力,爱迪生曾说过:「天才就是 99% 的汗水加 1% 的灵感。」这话虽有夸张的成分,但它的道理很简单:持之以恒、脚踏实地的努力,能让你走得很远,远得惊人。再加上一点额外的、明智的努力,这才是关键所在。
这就是问题所在;内驱力用错了地方,你将一事无成。我常常纳闷,为什么我在贝尔实验室的好些朋友,明明和我一样殚精竭虑,有的甚至比我更加勤奋,事业上却不如我这般成功。问题就出在内驱力使用的方向性上。只是一味地埋头苦干还不够——必须学会运用智慧来引导我们的努力。
或者引用一些《哈利·波特》同人文中的话:
[哈利:] 「如果不是 Ravenclaw,我会去哪儿呢?」
[分院帽:]「咳咳。『Ravenclaw 聚集聪明孩子,Slytherin 容纳邪恶之辈,Gryffindor 满是渴望英雄的人,而 Hufflepuff 则是那些真正埋头苦干者的归宿。』这显示出一定程度的尊重。你深知在决定人生成就时,尽责性与原始智力同样重要,你相信如果你有朋友,你会极为忠于他们,你并不害怕你选择的科学问题可能需要几十年才能解决……」
在线教育的影响因素
在线教育如何影响它们——减少对该因素达到一定水平的需求,任其自然,还是增加对该因素的需求?
-
智商似乎可能朝着任何方向发展:
-
任何影响大致可能相互抵消,或许在某种补偿机制中,学生仅以达到特定掌握程度或表现为目标,而更好或更差的方法只会改变他们在去玩电子游戏之前需要投入多少时间。
-
可能会对学生的智商提出更高的要求,因为先进的技术手段能够有效消除学习过程中那些琐碎耗时的「绊脚石」,如削铅笔、点名等,从而为纯粹的学习过程争取更多宝贵时间。消除了外部环境的障碍和差异后,学生之间的区别就主要体现在他们与生俱来的智力水平上,即智商的高低。学生将以自己的速度完成学习,直至达到各自的智力极限;即便是深受欢迎的 Sal Khan 的教学视频,也无法让智力欠缺的学生解答复杂的薛定谔方程。
心理测量学研究指出,如果成功消除了社会经济因素对教育的影响,为所有儿童创造优质平等的成长环境,那么遗传因素对智力的影响力必然会相对提高。当每个孩子都拥有充分发展的理想环境时,他们之间智力发展的差异主要源自遗传因素的差别!假设智商差异是遗传差异和环境差异的共同产物,一旦我们将环境因素的影响降为零,即排除了所有的环境差异,剩下的智商差异就将完全取决于遗传因素。
-
它可能会降低我们对智力的依赖。因为在线教育将催生一个课程市场,只有最清晰、最有洞察力、最易于理解的课程才能脱颖而出。相比之下,普通教师在课堂上即兴发挥的讲解或阐述,往往不如那些世界一流讲师经过数月甚至数年打磨的课程那样透彻、优质。
但「人人都能通过教育获得成功」这个想法未免有些乌托邦;由此引出一个问题:如果在线教育降低了对智力的要求,那么什么特质或外部条件会成为学业成就的最佳预测指标?如果我们对大脑能力的依赖减少了,那么学习的动机和对知识的渴求可能就显得尤为重要。结合前文提到的共同产物的观点,我们可能会观察到:
-
-
尽责性将成为教育成败的关键因素。与线下教育相比,在线教育很可能会提高对学习者尽责性的要求。
这一问题已多次被提及,并与自律和时间管理的困难有关。这与我在网课和有在线作业的课程(如计算机科学课,出席不是必须的,编程项目或作业通过线上提交)中的亲身体会如出一辙。就算作业并不很难,坐下来专心学习或完成作业对我来说也是个挑战。笔记本电脑上的种种诱惑总在分散我的注意力:为了避免干扰,全神贯注地学习,我不得不跑到计算机实验室,使用那里又旧又笨重的 Solaris 机器。其他经历就更具戏剧性了:有一次 CS 考试要求在电脑上独立完成,配有内置测试套件,运行后就能获得准确分数。这意味着哪怕花上好几个小时(其实也没那么难),就能拿到满分,而我当然也正是这么做的。可当老师展示成绩分布时,我惊讶地发现,居然和普通的 CS 考试没什么两样:不少人没得满分,甚至还有人不及格!
-
其他因素太过繁杂,难以预测,故此按下不表。
不得不指出的是,个人的社会经济地位很大程度上取决于智商和尽责性这两个高度可遗传的因素,由此我们可以预见,在线教育平台并不会成为促进各群体之间机会平等的有效工具。一些观点认为在线教育或慕课(MOOC)可以减少收入差距,但这似乎是建立在一种经典的社会科学模型所主导的世界观之上的。这种观点预设了所有个体之间并无先天的认知差异,认为人人生而平等,同样聪明、有耐心、勤奋好学,而我们观察到的种种不平等现象必定源于原有的环境差异或所受的歧视,获得学习机会和教育资源的途径才是问题的关键,只要人人都能平等接受教育,就一定能够缩小贫富差距。然而事实并非如此。因此,倘若有研究发现,慕课的主要受众其实是那些原本就接受过良好教育、拥有较高社会经济地位的群体(Hansen & Reich 2015),是他们足够聪明且有意愿去主动寻求进一步深造的机会,这一点也就不足为奇了。
相关研究现状
2009 年美国教育部(DoE)进行的一项大型元分析显示,在线教育研究的普遍情况是:许多研究质量较低或并非随机对照试验(这并不令人意外),但在高质量研究中,在线学习略胜于常规课堂,而混合式课堂则优于纯在线和纯线下课堂 (参见 Zhao et al 2005 & Bowen et al 2012 的类似结果)。学生的年龄似乎影响不大,尽管元分析显示,从本科生到研究生和职场人士,在线教育的优势有所减弱。这一元分析结果与我们的初步认知相符:在线教育若能带来更好的学习体验,学习成绩的小幅提升意味着,部分学生获益明显,而另一部分损失轻微;而融合在线学习和面授指导优势的混合式教学,能够弥补学生尽责性的不足,让更多学生兼得两者之长;相比之下,完全自主的在线学习因缺乏必要的监督和指导,可能影响最终的学习成果。在学习的持续性方面,在线课程面临更高的辍学率,这一问题在大规模开放课程(MOOC)中尤为突出。但考虑到传统大学教育的学位完成率也仅为 60% 左右,二者确实难以简单比较。然而,即便是教学设计完善的正规在线课程,其辍学率仍高于面授课程(例如 Xu et al 2011)。而 Patterson 2014 报告称,根据关于使用承诺装置以克服拖延症的研究,斯坦福大学 MOOC 中使用时间追踪软件 RescueTime 的参与者「在课程上多花费了 24% 的时间,课程成绩提高了 0.29 个标准差,且完成课程的可能性增加了 40%」。
此外,也有一些学术研究直接考察人格因素,比较在线与离线的表现,并收集人格数据。我目前了解到以下几项相关研究:
-
“Procrastination in Online Courses: Performance and Attitudinal Differences”, Elvers et al 2003;结果:
该研究发现,网课班和面授班学生在拖延程度、考试成绩和学习态度等方面并无明显差异。不过,进一步的相关分析表明,网课学生的拖延问题与期末考试成绩和学习态度呈显著负相关,但在面授班学生中却未发现这种相关性。这一结果在一定程度上解释了,为何不少旨在提升教学效果的网络课程,最终在学习成效上与传统面授课相比并无优势。
背景:
既然拖延症是网课的一大难题,教师就有必要甄别出最容易陷入拖延的高危学生,继而为其「对症下药」,提供有针对性的干预措施。Watson (2001) 和 Schouwenburg & Lay (1995) 考察了自我报告的拖延程度与人格五大维度之间的关联,结果一致发现,拖延行为与低尽责性密切相关。Watson 还发现拖延症和神经质人格存在显著关联。Schouwenburg 和 Lay 的研究则表明,神经质的某些方面(而非全部)与拖延表现有一定联系。
学生们说了什么?他们的分数有何不同?
在学期末的一项调查中,学生被问及是否因为在课程中容易落后而产生厌学情绪。线上课程的 21 名学生中,有 19 人表示他们不喜欢这门课,原因是很容易跟不上课程进度。而线下课堂的 23 名学生中,仅有 13 人将「容易跟不上」列为不满意该课程的理由。然而,拖延行为与课堂表现和学习态度之间的关联程度,在线上课程中显得更加突出。对于线上学生而言,拖延行为可以有效预测他们在该课程五次测试中的每一次表现;但对于线下学生来说,拖延行为与他们在各次测试中的表现并无明显相关性。
最后,引文总结了这一切:
教学理论表明,在线讨论、小组写作项目和对学习表现的即时反馈等教学活动,应该能够带来更好的学习成果。因此,在线课程中学生的课堂表现应优于传统的讲授式课堂,因为在线教学通常包含上述活动,而传统课堂往往缺乏这些教学环节。但实际情况却鲜有如此。Russell (1999) 综述了 300 多项研究,发现传统面授课程与远程教育(包括函授课程、在线课程和电视课程)的教学效果并无显著差异。一个可能的解释是,本研究观察到,与传统课堂相比,在线学习中拖延行为对考试成绩的负面影响更大。在线教学中本该促进学业表现的额外活动,可能的确收到了成效。然而,在线学习中拖延行为导致的学习减损,可能抵消了这些活动带来的积极影响。如果能减少学生拖延,在线教育的优势或许会得到更充分的彰显。
-
Irani et al 2004, “Personality type and its relationship to distance education students’ course perceptions and performance”:采用 MBTI 的非随机案例研究
-
Kim & Schniederjans 2004, “The role of personality characteristics in web-based distance education courses”:在其 140 名学生的样本中,对于在 Wonderlic PCI 成功量表「对工作的承诺」(即长期坚守岗位,不表现出不可靠、不负责、冲动、缺乏条理或毅力等行为)和「学习取向」(即个人愿意投入精力获取知识、技能和行为,学习新方法和流程以提高工作效率,对自我提升感兴趣,寻求学习新事物和创新的机会,积极主动参与培训)维度得分较高的学生,在线教育效果最佳。但遗憾的是,这两个维度与「尽责性」并非完全等同。
-
Schniederjans & Kim 2005, “Relationship of Student Undergraduate Achievement and Personality Characteristics in a Total Web-Based Environment: An Empirical Study”;与 Schniederjans 2004 的研究类似,对 260 名学生进行了调查。研究发现,尽责性在统计学上具有显著意义,此外,经验开放性、神经质和宜人性也具有统计学意义,但外向性则没有。(然而,这两项研究似乎都没有涉及任何效应量,也没有说明尽责性是否比其他因素更具预测作用;这可能是由于我无法完全理解所提供的部分统计数据。)
-
Bassili 2006, “Promotion and prevention orientations in the choice to attend lectures or watch them online” 只测量了神经质和开放性两个特质,因此无法为我们提供任何关于尽责性的信息。
-
Bishop-Clark et al 2007, “The effects of personality type on web-based distance learning”;很遗憾,用的是 MBTI
-
Berenson et al 2008, “Emotional Intelligence as a Predictor for Success in Online Learning”;相关性研究,他们将尽责性与其他项目合并为一个「说服力」指标,结果表明该指标与更高的在线学习成绩呈正相关。
-
Bolliger & Avgerinou 2009, “Student Satisfaction with Online Courses Based on Personality Type”;只是一个摘要(而且用的是 MBTI)。更值得注意的是,我们能否从满意度、幸福感或享受程度的调查中获得有价值的结论尚不明确:Nemanich et al 2009 通过一项准实验发现,在传统课堂环境中,学生的享受度与考试成绩呈正相关,但在在线教学模式下,这种相关性却大幅降低。
-
Avgerinou 2010, “Teacher vs. student satisfaction with online learning experiences based on personality type”:采用了 MBTI,但并未详细报告研究的具体信息和数据。
-
Abzug 2010, “E-conscientiousness and e-performance in online undergraduate management education”;并非使用标准问卷测量尽责性,而是根据学生在线上课程中的活动表现来评估(这种绩效测量方式与 Hedengren & Stratmann 2012 提出的项目无应答(item non-response)法类似)
-
Chahino 2011, “An exploration of personality type success in online classes”,研究使用 DISC 人格评估而非大五人格或 MBTI 量表,结果表明 DISC 测试结果与在线学习成绩无显著相关。
-
Mellish 2011;相关性研究;采用了 MBTI;对象为 102 名在线学生(其中 83 名女性)。研究发现,各人格类型的学生分布较为平均(没有设置线下对照组),但并未发现明显的人格特质与学习表现之间的相关性。
-
Varela et al 2012, “Online learning in management education: an empirical study of the role of personality traits”;线下与线上的准实验比较:
为检验假设 H2,研究者对学习效果和尽责性进行了回归分析。结果表明,尽责性能够解释不同组别的学习差异(β=4.11,SE=1.41,p<.05)。进一步地,研究者分别在面对面学习样本和在线学习组中进行了回归分析。尽管面对面组的回归系数未达到统计显著性(β=3.49,SE=2.01,p>.05),但在线组的回归系数却呈现出更强且具有统计显著性的效应量(β=4.59;SE=1.96,p<.05)。研究结果与假设 H2 的预期相吻合,证实了相比面对面学习情境(R2=0.040),尽责性在在线学习环境中(R2=0.079)对学习差异的解释力更强。
-
Ellis & Howard 2012, “The Effects of Gender and Dominant Mental Processes on Hypermedia Learning”:MBTI,无线下组
-
Yang et al 2012, “The impact of social capital and personality traits on students’ e-learning experience”;这项研究虽然没有采用随机化或对照组的方法,但其在网络营销课程中得出的结果值得关注:「与普遍观点相悖,他们发现尽责性特质并不影响学生的在线学习体验,而社交取向特质则产生了积极影响。此外,当社会资本更加丰富时,社交取向特质的积极作用会更加显著。」
-
Punnoose 2012, “Determinants of Intention to Use eLearning Based on the Technology Acceptance Model”;研究对象为泰国的硕士研究生。虽然这项研究没有探讨任何与学习成绩相关的因素,但确实发现尽责性与学生对课程的态度存在一定的相关性。
-
Keller & Karau 2013, “The importance of personality in students’ perceptions of the online learning experience”:「当前研究考察了大五人格维度与五种特定的在线课程印象(参与度、职业价值、总体评价、焦虑/沮丧和对在线课程的偏好)之间的关系。研究结果表明,在几种在线课程印象中,尽责性是预测个人看法最为一致的人格维度。」不过,这项研究并未记录任何学生的成绩或考试分数。
-
Fariba 2013, “Academic Performance Of Virtual Students Based On Their Personality Traits, Learning Styles And Psychological Well Being: A Prediction”;对自愿选择在线学习的学生进行调查,结果表明学业成绩与神经质存在较强的负相关,与尽责性、外向性和开放性也存在一定相关,但程度较弱。
-
Shih et al 2013, “The Relationship Among Tertiary Level EFL Students’ Personality, Online Learning Motivation And Online Learning Satisfaction”:「外向性和尽责性是影响大学 EFL(非母语英语教学)学生在线学习动机和满意度的两个关键人格特质。」(但该研究未直接评估学业成绩,也未对比在线和线下教学模式。)
-
Santo, S.A.: “Virtual learning, personality, and learning styles”. Dissertation Abstracts International Section A, Humanities & Social Sciences, 62, pp. 137 (2001)
-
Zobdeh-Asadi, S.: “Differences in personality factors and learners’ preference for traditional versus online education”. Dissertation Abstracts International Section A: Humanities & Social Sciences, 65(2-A), pp. 436 (2004)
-
Randler et al 2014, “The Influence of Personality and Chronotype on Distance Learning Willingness and Anxiety among Vocational High School Students in Turkey”:问卷调查,未发现任何显著的相关性;问题未涉及学业成绩或成功。
因素变化
现在,我们排除了因素 #3,因为无法将其推广到总体情况。因素 #2 暗示着尽责性与成功之间的相关性将会增强。尽管在我看来,更可信的结果是因素 #1 会降低对智力的要求。不过,为了谨慎起见,我们不妨假设智力要求保持不变。由此可以推导出以下论点:
-
以在线教育模式呈现的学习内容,需要与课堂教学同等的智力水平才能理解。
-
相比课堂教学,以在线教育模式呈现的学习内容需要学生具备更高的尽责性
-
假设不存在其他影响因素;那么
-
能够学习在线课程的人口比例会更低。
用数学方法可以长篇大论地证明一个显而易见的结论:对于某个特定的静态群体 Z,满足 IQ + (C+1) 的人数必然少于仅满足 IQ + C 的人数,因为同时满足智商(IQ)标准和尽责性(C)标准的人,必然少于或等于满足智商标准的人。因为 P(智商∧尽责性) ≤ P(智商),任何两个事件同时发生的概率都小于等于其中任意一个事件单独发生的概率,这就是合取谬误。对于正态分布的特征如智商而言,选拔标准每提高一点,符合条件的人数就会大幅减少。即使假设智商和尽责性两个特征高度正相关(实际并非如此),要在这两项指标上都超出平均值两个标准差,符合条件的人口比例也会低于 1%。具体计算公式见附录。
(这里有一个重要的注意事项,即我们的前提条件确实需要用到智商和尽责性的绝对值。如果只有相关性数据,我认为可能会出现这样的情况:智商与教育成功的相关性保持不变,尽责性的相关性上升,而总人口中获得成功的比例也同时上升。例如,如果在线教育降低了对尽责性的要求,但对智商的要求降低得更多,那么根据我们的综合推理,更多人将获得成功。但在预测成功时,尽责性将比智商更重要。)
现在,让我们深入探讨主张 #2。前面提到的第一项关于在线教育注重尽责性的研究(Elvers 2003)尤其值得关注(参见脚注中的引文)。根据这项研究证明在线教育成绩与尽责性密切相关的证据,主张 #2 很可能是正确的。然而,研究也发现在线学生与线下学生的平均成绩并无差异,这表明结论 #4 是错误的。运用否定后件推理,我们自然会质疑假设 #1,正如人们所希望的那样!即便假设 #1 并非完全正确,它在很大程度上也可能是对的。如前所述,计算机化的教育可以通过更好的呈现方式等途径,大幅降低教育与学生原始智力的相关性(正如可汗学院最狂热的拥趸所言)。不过,线上班级和线下班级成绩的一致性表明,在线教育虽然降低了对智力的要求,但同时也提高了对尽责性的要求,两者相互抵消。
这种在尽责性和智力之间的交易意味着什么呢?
-
首先,它意味着混合式学习的效果可能介于在线教育和线下教育之间:部分在线教育在尽责性方面的要求,可能不如完全在线教育那么高。
即使你必须强迫自己去上课,但如果学习过程不会过度消耗你的意志力/尽责性,学习仍然会更轻松。(比方说,在线下课堂教学中,你可以选择不带电脑,但在线上教育中这几乎是不可能的!)我预计非强制性教学的效果处于中等水平,就像在线教育中频繁设置强制性截止日期只能起到有限的帮助一样。
-
此外,如果仅仅一门课程因缺乏尽责性而受到如此大的影响,那么当越来越多的教学内容转移到线上,要求学生完全依赖在线学习来完成整个学期的课程时,会带来什么后果呢?
随着学生耗尽所有的意志力而精疲力竭(参见 Baumeister & Tierney 2010, Willpower),我们会看到学习成绩与尽责性的相关性进一步上升吗?(打个比方,你可能可以将一个重物举过头顶 10 次,但如果同时让你举起 10 个重物,你很可能全都举不动。)这种尽责性与学习效果的权衡,似乎不仅局限于单一课程,而是会扩展到所有学科。
潜在后果
那么,将学习结果过度依赖学生的尽责性是件坏事吗?我认为是的,有几点原因。一些直接来源于前面提到的交易,还有一些是我对未来后果的推测:
-
我们没有充分的理由特别偏爱尽责性,将其视为对「好」人的额外奖赏。到底应该重视尽责性还是智力,取决于这种偏好会带来什么后果,比如我们更需要精英阶层具备怎样的心理品质。
尽责性并非一种「美德」,一个人的大脑是否倾向于尽责,并不能说明其道德水平的高低,正如高智商相比低智商在道德上并无优劣之分。尽管存在民间心理学和道德说教,但大五人格特质与智力一样,在个体一生中相对稳定,同样受到遗传因素的影响。心理学界正在逐步揭示人格特质背后的神经机制,就像此前对智力所做的研究一样。一个人不可能通过「努力变得勤奋」而真正提高自己的尽责性(这本身就是一种循环),就像不能奢望靠后天努力提高智力一样。
即便尽责性或许与精神病态等问题特征无关,我们也不能就此忽视其他人格因素的作用。Varela 等人(2012)发现,线上表现与外向性的子维度「合群性」呈负相关。「合群性」指个体不愿参与社交活动的倾向,而不仅仅是在社交场合表现内敛。那么,从道德的角度看,缺乏「合群性」究竟是好事、坏事还是中性的?从实践的角度看又当如何评判?
-
正如已经观察到的那样,学校系统偏爱那些尽职尽责的学生,并且压制学生的创造力。我们真的需要让这种状况变本加厉吗?想象一下,这种做法会如何扼杀那些极具创新潜力、有望成为未来科学巨擘的天才少年——他们往往不愿被强迫去完成一些规定的苦差事。我们都听说过爱因斯坦、达尔文、荣格等大科学家,他们要么鄙视学校教育,要么选择对其视而不见,而更多通过自学来完成学业。Simonton 在 1994 出版的 Greatness: Who makes history and why 一书估算,这类先例绝非个案,而是占据了研究样本的 60%。(尽责性对取得科学成就固然必要,但过分强调则适得其反。)
如果我们袖手旁观,任凭对尽责性的要求被改变,还说这必然是好事,因为它正在发生,我认为我们就犯了「现状偏差」的错误。Bostrom 的「逆向测试」在此提供了一个有益的思路:我们凭什么认为当前对尽责性的要求恰到好处?我们还可以做个「双重逆向测试」:假设某个外星人或技术突然插手我们的教育体系,使其更加侧重智商。这时,如果有人想出一个简单的办法,又把重心转移回尽责性上,我们会欣然接受他们的解决方案吗?我怀疑无论哪种情况,对于这个重要问题,我们都给不出任何令人信服的答案。
值得注意的是,正态分布或钟形曲线有一个鲜为人知的特点:平均值的微小变化可能会在尾部产生出人意料的巨大影响。在一般人群中,平均智商每变化 1 分,在 160+ 等高智商人群中就可能引起相当大的波动。我们可以通过观察不同标准差下罕见程度的变化来理解这一点:距平均值 2 个标准差是 22 分之 1,3 个标准差是 370 分之 1,4 个标准差是 15787 分之 1(是 3 个标准差的 42 倍),5 个标准差是 1744277 分之 1(是 4 个标准差的 110 倍)。某些智力测验常用的标准差是 15 分,因此 3 个标准差大约对应 145 的智商,这大致是诺贝尔奖级别的科研或数学成就所要求的最低智力水平。有趣的是,在极度恶劣的环境中,碘盐等一些干预措施可以对智商产生惊人的巨大影响——平均智商最高可提升 15 分。这意味着,如果某种假设的干预手段能让一个群体的智商标准差从 85 提高到 100,那么其 145+ 高智商亚群的比例将从平均值的 4 倍标准差变为 3 倍——这一亚群的数量将增加 42 倍,即 4200%!(Scrimshaw 在 1998 年的一项碘影响的荟萃分析中,的确发现了整个钟形曲线的整体移动;不仅如此,碘盐对女性的益处大于男性,因此可能产生了不容忽视的影响……)
对于任何一个学术体系而言,其影响不言而喻:如果它不得不以牺牲成员的平均智商为代价,来换取更高尽责性的研究者,这可能会大大减少该体系中最杰出研究人员的数量。
-
在线教育更重视尽责性的这种交易结果,既非刻意设计,也未被设计者所意识到,完全是偶然且不受欢迎的。若一个偶然的交易恰好是最理想的,那不是太不可思议了吗?未免也太凑巧了吧!
此时正适合应用「现状逆转测试」:假设在线教育并没有导致这样的交易,但一名可汗学院的员工擅自做了一些改动,其唯一目的就是让可汗学院的分数更能反映尽责性(比如你若未尽责每周登录完成练习,学习进度就会被清零)。你会赞同这种改动吗?再假设在线教育反而降低了对尽责性的要求(可能因为服务会时不时在你手机上弹出简单练习题);这种情况下,你还会赞同那员工的改动吗?如果面对刻意的沿着交易曲线的转变,你都不赞同,那你怎能赞同一个偶然导致的转变呢?
-
在线教育的低廉成本可能具有不可抗拒的吸引力,并成为一个「更糟就是更好」的案例。人类教师的成本高昂,而且可能还在不断攀升(不管是由于沉重的退休金负担、教育领域的扩张和收益递减,还是鲍莫尔成本病等原因)。这引发了一系列应对之举,例如废除大学终身教职、大量聘用兼职教师、抨击工会,以及对在线教育等自动化教学方式兴趣的增长。削减开支的举措已经启动。即便在线教育的质量不如传统教育,我们可能也别无选择,只能接受这样一场教育领域的「圈地运动」。这种转变可能具有经济效益,也可能没有(如果公共部门能够将损失转嫁到尚未组织起有效抵制的民众身上,也许是由于意识形态的分歧)
-
当前,受教育程度最高的群体正日益垄断美国经济增长的成果,收入增长主要流向高学历人士,尤其是硕士及以上学位的持有者。因此,任何可能导致这一群体数量下降的因素,似乎都将加剧教育回报的不平等。经济整体财富的增长,真的值得付出如此代价吗?人们渴望的不是绝对财富的提升,而是相对收入的提高——收入分配更加公平的社会,民众的幸福感往往更强。 (类似的问题也出现在全球化、外包等「低成本」举措中。在那些领域,答案同样发人深省。帕累托改进并不意味着所有人的处境都变好,只是没有人的状况变坏而已。但这忽略了人性中对排名和地位的重视——这无疑是一种与现实相悖的假设。)
这种趋势还会引发哪些连锁反应?
这一惊世骇俗的事件尚未终结,仍在发酵蔓延;它还未被世人洞悉。电闪雷鸣需要时间,星光也需时日传递,事件已经发生,却仍需时日才能被察觉和传颂。这一举动所带来的影响,远比最遥远的星辰更加深远难测——然而世人却是这一切的始作俑者。
外部链接
-
“Distance Learning in Higher Education: Evidence from a Randomized Experiment”:2019 年,Cacault 等学者的研究表明,与课堂面授相比,通过直播方式在线听课会导致基础薄弱学生的学习成绩下滑,而成绩优秀者则能从中受益,取得更好的表现。
论真正的努力
原文:On Really Trying · Gwern.net
动机的真正极限在哪里?
2009-06-23——2016-09-16;笔记;可信度:不高;重要性:9;反向链接;参考文献
学生:一个人如何才能实现他的自我?我对这个话题知之甚少。
Yasutani:首先,你必须坚信自己能做到。这种信念会激发决心,而决心又会产生热情。但如果你缺乏信念,如果你认为「也许我能做到,也许做不到」,或者更糟的是,「这超出了我的能力!」——那么无论你打坐冥想多久,你都无法开悟。[1]
当我偶然间看到这句引言时,我立即联想到 Eliezer Yudkowsky 在一篇名为早期科学的失败的 beisutsukai 文章中关于寻找量子力学继承者的讨论,两者之间的相关性给了我很大启发。
我本想撰写一篇文章,探讨一个引人深思的现象:尽管我们在理性层面上意识到当前许多理论必定存在缺陷,甚至能相当准确地指出哪些理论可能有误,但我们却无法像面对明确的异常现象或悖论、或是拥有后见之明的优势时那样,以同等的热情在心理上挑战这些理论。在 Eliezer 的故事中,学生们认识到量子力学是错误的;同样,一个掌握了经过充分验证且与量子力学相矛盾的观察结果的人也明白它是错误的(你可以根据语境将「量子」替换为「经典」)。这些人将比一群固守传统量子力学观点的学者取得更出色的成果。
然而,我的这些想法始终未能完全凝聚成一篇完整的文章。
「——整整三十多年啊,」Jeffreyssai 教授感慨道。「爱因斯坦没有看透,薛定谔没有看透,就连冯·诺依曼也没有看透。」他转身离开黑板,面向全班学生。「我想请你们思考:他们为什么会失败?」
Brennan 不慌不忙,刻意稍作停顿以展现自信,并答道:「老师,是因为缺乏实际的动力。」
「曼哈顿计划,」Brennan 进一步解释道,「从一开始就有明确的技术目标:在战时开发一种威力巨大的武器。但是,早期科学家们在量子物理学上的错误认知并未对当时的技术发展造成直接影响。他们虽然感到困惑,却并不急需一个答案。此外,整个科研体系会为他们扫清一切障碍,全力支持他们解决遇到的问题。曼哈顿计划想必就是这样运作的—— Taji,你了解这方面的情况吗?」
Jeffreyssai 教授轻笑了一声。「竞争者,别太刻意揣摩我更想听什么。你最初的回答更接近我的预期;而你后面那番貌似贝叶斯式的补充反而偏离了重点…… Brennan,我心里想的其实是,早期科学家们认为花三十年解决一个问题是可以接受的。他们整个科学研究体系都建立在『终将获得真理』这一理念之上。一个错误的理论最终会被淘汰——等到下一代学生熟悉新理论的时候。俗话说,『工作会自动膨胀填满所有可用时间』。但事实上,如果人们对自己的思考速度有更高要求,完全可以在远短于三十年的时间里产生重要的思想。」Jeffreyssai 突然用力拍了一下 Brennan 椅子的扶手。「告诉我,如果有人向你扔了一把刀,你需要多长时间躲避开?」
— 他们并没意识到自己正在寻找一个更好的理论。
这个故事中的学生们拥有一个独特的优势:他们明确知道自己是从一个错误的理论出发,而不仅仅是怀疑或持有「可能存在比当前理论更好的理论」这样一个笼统的科学哲学原则。这种认知在心理上给予了他们以下几点优势:
-
愿意为新的发现而放弃来之不易的见解和理论
-
避免了将全部时间和精力耗费在修补旧理论上。
我回想起过去尝试解决问题时(比如逻辑谜题),当我确信存在一个正确答案时,比起不确定问题是否有解时,我的积极性和效率都要高得多。
对于那些认为我在附和 Brennan 的人,我想简单说明:虽然我在这里确实呼应了他的观点,但我的立场有所不同,因为我不认为这仅仅是「训练」的问题
我想,如果你绑架那些伟大的早期科学家,给他们必要的实验数据,再给他们几个月时间来提出新理论(否则就把他们拖出去处决),那么他们也能和这些学生一样出色地完成任务。关键在于有足够的动力。
这并不是关于是否具备进行范式转换能力的问题;如果你想,这是关于能否意识到现在就需要一次范式转换的问题,而且你就是那个需要去完成它的人。然而,要说服整个科学界接受这一点并非易事;毕竟,大多数新范式最终不都是以失败告终吗?
摘自《班级项目》:
Jeffreyssai 教授缓缓扫视着眼前这群越发困惑的学生,然后开口道:「下面是你们的任务。你们已经学习了量子力学和广义相对论,这代表了早期科学的最高成就,也是目前公众所能了解的科学极限。现在,我要求你们五人独立工作,在一个月内提出正确的量子引力理论。」
通常在这种情况下,我会说:「我马上就要揭晓答案了。因此如果你们想自己尝试解决这个问题,现在就是最后的机会。」但是在这种情况下,即便是历史上最杰出的统计学家们也未能独立解决这个问题。因此,如果你还不知道答案,我也不期望你能独自弄清楚。当然,如果你依稀记得一些线索,但不是完整的答案,你可以试一试。又或者,如果你认为当今时代能为你提供足够的支持,你也可以尝试一下。毕竟,我已经给了你们莫大的帮助——我提出了一个精确的问题,并且告诉你们答案是存在的。
https://www.lesswrong.com/posts/KipiHsTA3pw4joQkG/timeless-causality
https://www.coordinationproblem.org/2010/04/neurological-freaks-and-the-drive-to-excel.html
Claude Shannon 曾跟我分享过他童年的一个小故事。有一次,他被一个拼图难住了。他哥哥路过时对他说:「你知道吗,我可以给你点提示。」
他哥哥就只说了这么一句话。
然而,就是这样简单的一句暗示,却足以帮助 Claude 解开了那个难题。关于这个暗示最棒的地方……是你随时都可以给自己这样的暗示。
Kaggle 比赛中有个现象总是让我觉得特别有趣:在排行榜长期保持不变后,如果某个团队突然取得重大突破,常常会引发多个互不相关的团队迅速复现同样的突破——有意思的是,这些团队甚至不知道率先突破的团队是如何做到的。
让我们回溯到 1974 年末至 1975 年初的秋季。当时我们正在举办一个研讨会,我们结识了 Peter Blatman,他向我介绍了 Ralph Merkle 的工作。这段经历在《公钥密码学的前十年》一文中也有所提及。Blatman 告诉我,Merkle 一直在研究一个问题:如何在一个不安全的信道上与素未谋面的人进行安全通信。这个问题我其实已经思考了很长时间,我坚信这是不可能实现的,并且也说服了 Blatman 相信这一点。但是,这次谈话之后,我又开始重新审视这个问题。因此,我认为 Merkle 在这个领域扮演了至关重要的角色。
事后证明,Merkle 当时可能已经找到了解决方案,只是他看待问题的角度与我不同。Merkle 当时正在上 Hoffman 教授的课,Hoffman 要求每个学生在学期初就提交一份学期论文的提案。Merkle 提交了一份关于他的密钥交换系统的论文提案,但 Hoffman 并不理解其中的内容。Hoffman 让 Merkle 重写,可他仍然无法理解。最终,两人都感到沮丧,Merkle 退出了这门课。就这样,Hoffman 错失了一个机会,本可以让 Merkle 和 Hoffman 的名字,而不是 Diffie 和 Hellman 的名字,成为这个领域的知名人士。尽管如此,Merkle 仍然坚持研究这个问题,最终写出了一篇论文,大约五年后以《不安全信道上的安全通信》为题发表在 1978 年的 CACM(美国计算机学会通讯)上。这篇论文之所以没有更早得到重视,部分原因是 Ralph Merkle 并不擅长写作表述。我记得看过一份草稿,大约有一百页,非常难以阅读。……以上就是我所谓的「前史」的全部内容。之后,我们花了几个月时间深入思考这个问题,并在 1975 年 12 月写了一篇论文,最终发表在 1976 年全国计算机会议上。我们很早就完成了会议投稿,必须在圣诞节前或 1 月 1 日左右提交。随后,我们立即广泛地分发了预印本,我给了一份给布拉特曼,他又转交给了 Merkle。Merkle 多年来一直在这个问题上孤军奋战,突然发现有人能理解他的想法,顿时如获至宝。于是,Merkle 迅速与我们取得了联系。他打电话给我,因为我住在伯克利,并给远在斯坦福的 Marty Hellman 寄去一份副本。
—「Whitfield Diffie 关于公共钥匙加密技术发展的访谈」, 1992
Baker 和他实验室的博士后研究员 Minkyung Baek 敏锐地捕捉到了一个机遇。尽管他们无法获得 DeepMind 团队解决蛋白质结构问题的具体代码,但他们认识到这个难题是可以攻克的。更为关键的是,他们对 DeepMind 的整体解决方案有了大致的了解。John Moult,马里兰大学帕克分校生物科学和生物技术研究所的教授,同时也是 CASP 竞赛的组织者,回忆道:「即便在那个时候,David 就已经在说,『这是一个存在性证明。DeepMind 已经向我们证明了这类方法是切实可行的。』」Moult 补充说,「对他来说,这就足够了。」
—「DeepMind 蛋白质 AI 代码未公开,这个实验室实现了自己的版本:谷歌子公司破解生物难题却未即时共享,华大团队奋起直追」
在西雅图担任统计学家后,George Dantzig 于 1939 年给 Neyman 写了一封信。Dantzig 被 Neyman 的论文深深吸引,随后获得了在伯克利大学担任助理的机会。这段时期发生的一个故事已经成为了学术界的佳话:
我在伯克利的第一年,有一天我迟到了,匆匆走进 Neyman 教授的课堂。黑板上写着两道题目,我想当然地认为是布置的家庭作业,就把它们抄了下来。几天后,我向 Neyman 教授道歉,说完成作业花了较长时间,因为这些题目似乎比平常要棘手一些。我询问他是否还需要这份作业。他让我把作业放在他的办公桌上。我有些迟疑,因为他的桌面堆满了文件,我担心我的作业会永远淹没在这片纸山中。
大约六周后的一个周日清晨,八点左右,我和妻子 Anne 被一阵急促的敲门声惊醒。来者是 Neyman 教授。他兴奋地冲进来,手里挥舞着一叠纸,激动地说:「我刚刚为你的一篇论文写了引言。你快看看,我好立即把它送去发表。」有那么一刻,我完全摸不着头脑他在说什么。长话短说,那天黑板上的两道题,我误以为是家庭作业而解决的问题,实际上是统计学中两个久负盛名的未解之谜。这是我第一次意识到这些问题的非凡之处。
[摘自 Albers 1994, 《更多数学人:当代对话》]
–《统计学家的奇闻轶事》, E Bruce Brooks 2001
Bill Atkinson 的一项卓越成就(如今我们已习以为常,鲜少引起惊叹)是实现了屏幕上窗口的重叠效果,使「顶层」窗口能够裁切「下层」窗口。Atkinson 让这些窗口能够自如移动,宛如在桌面上整理纸张,上层窗口的移动会令下层窗口显现或隐藏。值得注意的是,计算机屏幕上的像素实际上并无层次之分,看似被遮挡的窗口并不真实存在于底层。要营造窗口重叠的逼真效果,需要运用「区域」这一复杂的编程概念。Atkinson 孜孜不倦地攻克这一技术难题,源于他误以为在参观 Xerox PARC 时目睹过类似功能。事实上,PARC 的工程师们从未实现过这一壮举,他们后来向 Atkinson 表示,对他的成就深感敬佩。「我深刻体会到了无知者无畏的力量。」Atkinson 感慨道,「正因为不知其不可为,我才得以将其付诸实现。」他全身心投入工作,以至于某天清晨,他精神恍惚中驾车撞上一辆停泊的卡车,险些丧命。Jobs 得知消息后立即赶赴医院。当 Atkinson 恢复意识时,Jobs 关切地说:「我们都很担心你。」Atkinson 强忍痛楚,挤出一丝微笑回答:「别担心,我还记得『区域』。」
—史蒂夫·乔布斯, Walter Isaacson, 第 158 页
- 「在希伯来大学,[Dantzig 的传奇故事]的主角变成了 Avinoam Mann。」–Daniel Moskovich
- 「在普林斯顿,这个故事自然而然地被冠到了 Jack Milnor 头上。结果就是著名的『Fary-Milnor 定理』,该定理研究关于结点曲线的总曲率(有一篇发表在《数学年刊》上的论文为这个传说增添了几分真实性……)」 –Igor Rivin
- 「我听说的版本是这样的:Milnor 有一天上课迟到了,他把黑板上写的几个问题抄了下来,误以为那是老师布置的家庭作业。在随后的一堂课上,他说:『那份作业真是太难了!我只解出了其中两道题。』殊不知他误打误撞地解决了几个长期未决的数学难题。」 –Jonas Meyer
- 「Paul Cohen 曾经宣称,Bergman 核函数就是被 Bergman 本人以这种戏剧性的方式意外发现的。」 –Dan Ramras
- 「关于 Huffman 编码的趣闻,我听说是这样的:在一门信息论课程中,Huffman 面临两个选择:写一篇学期论文或参加期末考试。他选择了写论文,结果在这篇论文中发明了一种查找最优二进制编码的算法,这就是后来广为人知的 Huffman 编码。」 –Peter Shor
–MathOverflow
- Ron Graham, 第105页:
哈佛大学数学家 Persi Diaconis 曾多次与 Graham 合作,他这样评价 Graham:「Ron 是一位非常杰出的数学家。他总是乐于帮助正在奋斗的学生或同事,他从不会丢下你不管。他是个天才,而且难能可贵的是,他是个平易近人的天才。」
Diaconis 还回忆起一次令人难忘的经历。那次他正在做一个关于他和 Graham 共同研究的学术报告。当他以「这个问题至今仍未解决」作为结束语时,坐在听众席中的 Graham 突然起身,当场给出了一个解决方案。在场的观众无不为之震撼,随即爆发出热烈的掌声——这对于通常较为理性克制的数学家群体来说,可谓是一次罕见的情感流露。
Benoit Mandelbrot, 第 224–226 页
MP:克莱因群和有理函数迭代一直被视为高度专业的数学领域。您是在什么时候、出于什么原因开始涉足这些领域的?
Mandelbrot:这要追溯到 1976 年。当时我读了 Hadamard 为庞加莱撰写的一篇精彩悼文(这篇文章很快就会收录在美国数学会出版的一本关于庞加莱的著作中,我强烈推荐大家阅读)。这篇悼文让我意识到,我的研究应该突破线性不变分形的限制,而这正是我此前一直专注的领域。实际上,克莱因群和基于反演的群的极限集也属于分形范畴;后者可以被称为自反演分形。我在 1977 年出版的《分形》一书中,在最后时刻补充提到了这个即将展开的自相似分形的拓展研究。随后,我开始了实际工作,主要是通过计算机模拟来获得「亲身实践」的直观认识。很快,我就取得了突破性进展,发现了一种用于构造自反演极限集的明确算法。更令我惊讶的是,在进一步深入研究后,我发现自己居然解决了一个悬而未决了整整一个世纪的问题。
- 第 258 页:
约翰·冯·诺依曼曾在苏黎世联邦理工学院聆听波利亚的授课。波利亚回忆道,有一次自己在课上讲解一个猜测,尽管他相信其正确性,却未能证明。不久后,年轻的冯·诺依曼举起手表示他已经想出了证明。他走向黑板,清晰地讲解了证明的思路。波利亚承认冯·诺依曼的证明是正确的,同时他也坦言:「从那以后,我对冯·诺依曼心生畏惧。」
- Robbins, 第 291-292 页:
我的统计学事业始于海军时期,并以一种偶然的方式展开。当时,我正在一间屋子里看书,恰巧听到附近两名海军军官在讨论有关轰炸精确度的问题。他们的对话引起了我的注意:「我们向一个机场投放了很多炸弹企图将其摧毁,但由于炸弹落点是随机的,重复攻击同一区域 17 次并无太大意义,一次就已足够。」他们在考量炸弹落点随机性的基础上,试图确定需要多少炸弹才能摧毁约 90% 的区域。他们还猜测某些研究小组可能采取的方法是向地板上抛掷扑克筹码,以测量其覆盖区域。听到此处,我不由得停下手中的书,开始思索这个问题。经过一些推算后,我走向那两位军官,向他们提出了解决方案。然而,由于我并未参与与战争相关的研究,他们无权与我讨论这个问题。因此,我将自己的解决思路写成简要备忘录,寄给了其中一人。这份备忘录最终吸引了某个进行相关研究的数学小组的注意。尽管如此,由于我没有权限接触机密信息,他们如何理解我的想法而不会泄露机密内容成了个难题。(而事实上,我那时不该知道的是关于诺曼底登陆的计划。)幸运的是,我的工作引起了 Marston Morse 的关注,他确保我的备忘录辗转到达了正确的部门。不久之后,《数理统计年鉴》的编辑 S. S. Wilks 邀请我审阅由 Jerzy Neyman 和 Jacob Bronowski(《人类的升起》的作者)共同撰写的关于同一主题的论文。我建议拒绝发表他们的论文,认为「这是一项不太成功的尝试,旨在解决一个若用正确方法处理其实相对简单的问题」,并附上了我的解决方案。Wilks 回复道,由于 Neyman 是该论文的作者之一,他必须予以刊发,但他也希望我能撰写一篇关于自己方法的文章。因此,在欧洲战争结束后,《年鉴》的一个期刊中先刊登了 Neyman 和 Bronowski 的论文,随后便是我的文章,其实质上是说:「请忽略前面的论文,看看这才是正确的解决方案。」这次编辑促成了我在统计学领域的首次发表。然而,即便是在当时,我也未料到自己将成为统计学家。那时的工作,与其说是统计学,不如说是概率论中的基础研究。
–《数学家:人物传略和访谈》 2008 (ISBN 978-1-56881-340-0), Albers 编著
三维直觉的运用产生了一个颇为有趣的结果:低维拓扑学的发展路径与数学其他分支有着显著差异。在这个独特的领域中,人们期望能够「看到」结果,而一旦某个结果或部分结果被「看到」,就无需再进行深入讨论。我并非想要批评这种方法。事实上,我本人在这个领域也曾「看到」过几个结果,并且坚信它们与其他数学成果同样可靠。有一次,在一场学术研讨会上,一位世界顶尖的低维拓扑学家正在阐述一项重要发现。突然,听众中另一位知名拓扑学家打断发言,表示他无法理解演讲者是如何完成某个步骤的。演讲者闻言面露痛苦之色,仰望天花板沉思良久,至少有一分钟之久。随后,那位听众忽然恍然大悟,脱口而出:「哦,原来如此,我竟然没想到这一点!」演讲者顿时如释重负,继续他的演讲,为成功向听众传达这一关键点感到欣慰。这,就是数学中的真理。
–「某种信条」; Vaughan Jones (《数学的真理》, 1998), pg 216-218
我们近期报道了去年 12 月国际象棋经典赛闭幕晚宴上的一场别具一格的比赛。在伦敦斯特兰德大街的辛普森餐厅,主办方按照惯例安排了一场经典赛选手对阵来宾的车轮战。大多数桌子都配备了一两位棋艺精湛的棋手,他们的职责是给予指导而非直接指挥。其中一桌阵容尤为豪华,汇聚了政界和学界的多位翘楚:曾获英国 14 岁以下女子冠军、现任影子财政部首席部长的 Rachel Reeves 议员;芝加哥大学著名纳米技术专家 Vinayak Dravid 教授;印度高级专员 Rajesh N Prasad;伦敦市长 Boris 的胞弟、议员 Jo Johnson ;以及 Frederic Friedel。为他们出谋划策的是国际象棋界的传奇人物加里·卡斯帕罗夫……比赛结束后,一些参与车轮战的大师暗示卡斯帕罗夫可能在比赛中提供了过于慷慨的指导。然而,卡斯帕罗夫坚决否认了这一说法。他解释道:「在关键的牺牲之前,我只说了一个字:『哇!』Fred 立即行动起来,与 Rachel 一起分析局势,他们在不到一分钟的时间里就共同想出了这步妙棋。」随后,卡斯帕罗夫回顾了上文提到的他 1996 年在拉斯帕尔马斯与 Anand 的对局,阐述了他当时的一个重要领悟:在恰当的时机向棋手传递哪怕是最微小的信息,都可能对局面走向产生决定性影响。他说:「如果当时允许 Fred 在关键时刻进来示意『就是现在!』,我肯定能想到并下出 20.g4 这步棋!」诚然,往往只需要一个小小的提示——『就是现在!』——就足以改变整盘棋局的结果。
–《国际象棋作弊史(四)》, Frederic Friedel 2000
……在黑板上推导定理时,维纳凭借其过人的直觉……跳过了众多步骤,以至于当他写出最终结果时,学生们早已无法理解整个证明过程。一位备受挫折的学生……心翼翼地询问维纳是否可以向全班展示另一种证明方法。……维纳愉快地回应道,「当然可以」,随即着手推导另一个证明,但又一次全程在脑中进行。几分钟的寂静过后,他仅仅在黑板上的答案旁画了个勾,让全班同学依旧云里雾里。
–F. Conway and J. Siegelman, 《信息时代的黑暗英雄》 (New York: Basic Books, 2004), pg83 (这则轶事已经被讲过很多次了,关于维纳,我相信其他一些数学家也是如此)
……S 代表秘密;你可以永远守口如瓶——
前提是世上没有比你更聪明的人。
–Edward Teller, 「Atom Alphabet」
在破译密码的过程中,最为关键的信息莫过于确认所阅读的内容并非毫无意义的乱码。密码制作者常用的一种迷惑手法是在有效信息中掺杂一些无法破译的内容,即一些不具统计显著性的随机字符组合。类似地,当我们研究诸如原子反应和原子爆炸这样的自然科学问题时,最大的可公开信息就是确认它们的存在性。当一位科学家着手解决一个他确信有答案的问题时,他的整个心态都会为之一变。仅凭这一点,他就已经在通往答案的道路上前进了一半。
基于这一认识,我们可以毫不夸张地说,关于原子弹的唯一秘密——本可以保密,却被毫无顾忌地透露给公众和所有潜在敌人的秘密——就是它可能被制造出来这一事实。只要将一个如此重大的问题摆在科学界面前,并确认其有解,那么考虑到科学家们的智力和现有实验设施的广泛分布,在世界上任何地方,这项任务的准独立完成都只是时间问题,最多不过几年。
–强调由我添加; pg124-125, Norbert Wiener, 《人类对人类的利用》
维纳的判断是准确的:只要获知原子弹可以制造,就有可能通过查阅公开发表的文献来发明一枚原子弹。pg 39–40, MacKenzie & Spinardi 1995
即便没有专门的核武器相关出版物,仅凭基础物理学知识也能推断出许多关键信息。早在 1946 年,就有报道称一位「中西部高中物理教师」仅利用 Smyth 报告中的公开信息,就成功计算出了原子弹的尺寸(Friendly 1946, p. 3; see Smith 1970, p. 84)。此后,更有报道称「普林斯顿和麻省理工学院的本科生仅依靠非机密文件,就草拟出了基本可行的原子武器设计方案」(Harvard Nuclear Study Group 1983, p. 219)。甚至在核武器实验室中,那些尚未获得安全许可的科学家们也完成了类似的设计(Hersh 1991, p. 155)。
时至今日,他 1964 年的经历——那年他被征召参与五角大楼一项代号为「第 N 国计划」的机密行动——突然变得前所未有地紧迫而令人不安。这项计划旨在解答一个看似简单的问题:两个非专业人士,仅凭智慧而无法接触机密资料,能否破解「核武器的奥秘」?古巴导弹危机后,军备竞赛的讨论中弥漫着焦虑情绪。当时只有英国、美国、法国和苏联掌握核武器技术:美国军方迫切希望通过严守核武器制造的秘密,来阻止核扩散——无论是扩散到第五个、第六个还是「第 N 国」,这也是该计划名称的由来。如今,这种忧虑再度浮现:随着基地组织卷土重来,朝鲜局势失控,还有诸多「不稳定国家」传出核武器传闻,我们至少还抱有一线希望——不是随便什么人都能掌握制造原子弹的技术。然而,40 年前的事实却令人深思:普通人确实做到了。
……他们将在军事机密与公开信息的灰色地带中工作。他们会在利弗莫尔国家实验室有一间办公室,但无权进入那些管制区域:他们被禁止查阅机密资料,但与此同时,他们所产出的任何内容——无论是速写本上的图表还是便签上的随手记录——都将自动被列为绝密。由于他们设计的核装置显然不会真正制造和引爆,他们必须遵循一套神秘而精确的程序来验证他们的工作进展。他们需要详细地在纸上阐述想要测试的设计部分,然后通过一名指定的实验室工作人员将其传递到利弗莫尔的管制区域。几天后,他们会收到结果——但他们永远不知道这些结果是来自实际测试还是理论计算。最终,在 1966 年底,也就是项目开始两年半后,他们完成了任务。Selden 回忆道:「我们撰写了一份简明的文件,用工程术语精确描述了我们提议制造的装置及所需材料。内容极其详尽,以至于街角的普通机械加工店都能按图索骥制造出来。」
然而,令人煎熬的是,就在他们认为 Dobson 和 Selden 取得突破性成果的那一刻,他们却被蒙在鼓里,无法确定自己是否真的成功了。在接下来的两周里,军方并没有立即向他们透露结果,而是安排他们在华盛顿的高层机构进行巡回汇报,并在各个国防和科研部门接受质询。这些拥有最高安全许可的询问者被要求避免提出可能泄露机密信息的问题。据 Selden 回忆,询问者大致分为两派:「一派人一直坚持认为,设计这样的炸弹应该极其困难;另一派则认为这简直是轻而易举——甚至高中生都能在车库里完成。」如果这两位物理学博士后真的成功了,他们的成果似乎介于这两种观点之间——「一个直截了当的技术问题,但涉及一些相当深奥的物理学原理」。最终,在利弗莫尔国家实验室举行的告别汇报会上,脾气古怪的爱德华·泰勒也出席了。会后,一位名叫 Jim Frank 的高级研究员将他们拉到一旁。Dobson 回忆道:「Jim 说,『我猜你们一定很想知道结果如何。』」他们毫不犹豫地回答是。Frank 告诉他们:「如果真的制造出来,它会产生一个相当惊人的爆炸。」他们追问爆炸的威力有多大。Frank 回答说:「与广岛原子弹的威力在同一量级。」
德国在二战期间的核武器研发计划[一直是一个充满争议的话题](https://cdn.preterhuman.net/texts/religion.occult.new_age/occult.conspiracy.and.related/Rose, Paul Lawrence - Heisenberg and the Nazi Atomic Bomb Project.pdf)。争议的焦点在于,德国物理学家是否如表面所呈现的那样,在道德层面上有所偏差并应当受到谴责。这个计划的进展曾受到一个重大计算错误的阻碍:他们错误地估计需要数吨铀才能达到临界质量,而实际上只需 5-10 公斤。然而,事态在 1945 年 8 月 7 日出现了戏剧性的转折。当被盟军俘虏的德国科学家们得知广岛遭受原子弹轰炸后,根据 Farm Hall 的录音记录,这一信息,海森堡就在短短一周内(到 8 月 14 日)找出了自己的计算错误。他重新得出的结论是需要 14 公斤铀。尽管这个数字仍比实际高出一倍,但相较于此前认为的数吨,已经切实可行得多。
简而言之,虽然仅仅观察他人骑自行车并不能让人掌握骑车的技巧,但它确实证明了骑车是可行的。知道兄长姐姐已经学会骑车,可以鼓励年幼的弟弟妹妹们不会因初期的失败就认定这项任务难以完成。
……二战期间,英美物理学家(包括从欧洲大陆逃难而来的科学家)对开发核武器的难度估计过于乐观,甚至可以说是过度自信。然而,他们的法国、德国或苏联同行似乎并不普遍持有这种观点。在 1945 年之前,德国和苏联政府并不确信这项任务值得投入与美国相当的资源(参见 Holloway 1981; Goldschmidt 1984, p. 24)。三位一体试验、广岛和长崎的核爆炸有力地证明了这项任务并非不可能完成。这一证明(加上对苏联的潜在威胁)解释了为什么苏联在 1945 年突然将核计划从一个适度的研究项目升级为全力以赴、最高优先级的国家工程(Holloway 1981)。
如我们所见,1952 年英国的核试验虽然对法国不构成直接威胁,但却通过表明开发原子弹比预想的更为容易,间接推动了法国的核武器计划。同样,1964 年中国的核试验向其他发展中国家展示,原子弹不再为高度工业化国家所特有。此外,对早期氢弹设计可行性的严重质疑,曾一度延缓了美国从原子弹向氢弹的转型(Bethe 1982)。相比之下,此后所有的氢弹研发计划都能够自信地推进,确信其目标基本可以实现。正如一组武器设计者在另一语境中所言(Mark et al 1987, p. 64),「仅仅知道[某事]是可能的,即使不确切了解具体方法,也能[极大地]集中注意力和努力。」
https://www.lesswrong.com/lw/g75/psa_please_list_your_references_dont_just_link/87f1?context=3
成功科学家的一个关键特质是勇气。一旦你鼓足勇气,坚信自己能够攻克重大难题,你就真的能做到。反之,如果你怀疑自己的能力,那么几乎可以肯定你将无法成功。
勇气正是 Shannon 最为卓越的品质之一。他的主要定理就是最好的例证。当他想要创造一种编码的方法却不知从何着手时,他大胆地制作了一个随机代码。尽管随后陷入困境,他却提出了一个看似不可能的问题:「一个平均的随机编码会有什么表现?」接着,他证明了平均编码的性能可以任意优秀,因此必然存在至少一个出色的编码。除了一个拥有无限勇气的人,还有谁敢于作出如此大胆的思考?[12]
这正是伟大科学家的特质;他们具有非凡的勇气。即使面对难以想象的困境,他们依然勇往直前;他们始终保持思考,永不停歇。[13]
愤怒;积极;自负
愤怒。科学家的另一个缺点是易怒。然而,愤怒并非科学家处理问题的正确方式。幽默可以,愤怒则不可。愤怒往往使人误入歧途。你应该顺应并配合现有体系,而不是一味与之对抗。
积极。你应该着眼于事物的积极面,而非消极面。我已经举了几个例子,还有很多类似的情况。通过改变看待问题的角度,我成功地将表面上的缺陷转化为优势。再举一例。我是个自负的人,这一点毋庸置疑。我知道大多数人休假写书时都无法按时完成。因此,在我离开之前,我向所有朋友宣称,等我回来时,这本书一定会完成!是的,我一定会完成它——如果没完成就回来,我会觉得很丢脸!我利用自己的尊严,迫使自己按照预期行事。
自负。我夸下海口,这样就必须有所作为。我多次发现,就像陷入绝境的老鼠,我居然能爆发出惊人的能力。我发现,即使毫无头绪,说「好的,我会在星期二给你答案」通常会有好结果。到了周日晚上,我就会绞尽脑汁思考如何在星期二前完成任务。我经常将自尊置于危险境地,有时也会失败,但正如我所说,就像那只走投无路的老鼠,我常常会惊讶于自己出色的表现。我认为你需要学会利用自己。你需要知道如何从不同角度看待情况,以增加成功的可能性。
人类的自欺行为极为普遍。人们有无数种方法来扭曲事实,欺骗自己,将事物粉饰成另一副模样。当你问「你为什么没有做某事」时,人们总有一千个借口。纵观科学史,通常有 10 个人同时准备就绪,而我们只奖励第一个成功的人。其他 9 个人会说,「我也有这个想法,只是没有付诸实施」等等。借口总是很多。为什么你不是第一个?为什么你没有把事情做对?不要找借口。不要欺骗自己。你可以对别人说任何借口,我不介意。但对自己,要保持诚实。
利用缺点
[参考 Rubin 2014] 如果你真想成为一流科学家,就必须了解自己,包括你的弱点、优势和严重缺陷,比如我的自负。你如何将缺点转化为优势?[34] 当你人手不足,无法转向亟需开展的方向时,你该如何应对这种情况?
我再次强调,通过研究历史,我发现成功的科学家们改变了看待问题的角度,使原本的缺陷变成了优势。
然而,这些考题显得有些过时,过分侧重于欧几里得、牛顿理论以及数学物理练习题——诸如要求考生推导一个在圆柱上旋转的球体的运动方程,或是解决基于热力学中卡诺循环的问题等。这些题目要求考生能够快速准确地操作数学公式,或许体现了一些小聪明,却并非真正的洞察力。它们甚至不需要坚持不懈的毅力;数学优等生考试要求的证明不能过于冗长或复杂;因此,考生们学会了寻找那个隐藏的解题窍门。在一次数学优等生考试中,一位顶尖学生——那年的最优等毕业生——注意到一个能力较弱的考生迅速解决了一道让他绞尽脑汁的题目。他意识到「一定有诀窍」,于是重新审视题目,最终自己也找到了解法。J. J. Thomson 大胆地指出,数学优等生考试所培养的个人素质,使其成为了绝佳的训练方式——但针对于律师行业而言。
–《了解无限的人》
在数学研究中,计算机更常见的作用是帮助发现数据中的有趣模式,而数学家们则基于这些模式提出猜想或假设。Billey 表示:「通过在数据中寻找模式并加以证明,我获得了巨大收获。」威斯康星大学的 Jordan Ellenberg 教授指出,利用计算机验证猜想在所有可检验的情况下都成立,并最终确信其正确性,「能够给你提供心理支持,这种支持对于实际完成证明所需的工作至关重要。」Ellenberg 本人就利用计算机发现猜想,然后手动构建证明。
https://www.wired.com/wiredscience/2013/03/computers-and-math/all/
杨-米尔斯理论(也称非阿贝尔规范理论)诞生于 1954 年,是描述基本粒子相互作用的少数几种可能方式中最晚出现也最难理解的一种。Erick 向我介绍了这个理论的基本定义,但他也坦言,没有人真正了解这个理论会带来什么结果,甚至许多最负盛名的资深粒子物理学家对此也感到困惑不已。(这些顶尖学者包括 Dick Feynman, Shelly Glashow, Abdus Salam 和 Steve Weinberg。)如今,似乎没有哪位资深物理学家愿意讨论这个理论了;他们对此的无知和困惑实在是难以启齿。然而,仍有一位勇者始终没有放弃对杨-米尔斯理论的探索,他就是诺贝尔奖得主 Tini Veltman。1971 年,他和自己最杰出的研究生、后来同样获得诺贝尔奖的 Gerard ’t Hooft 一起,终于破解了这个难题。值得一提的是,据我所知,没有人声称完全理解 ’t Hooft 那篇论文的细节。我们都是从 Ben Lee 那里学会了这个理论。Lee 综合了自己的研究洞见(在这类理论中,重整化常数不依赖于基态的选择),俄罗斯学者此前未受重视的成果(Fadde’ev 和 Popov 关于量子化和费曼规则的工作),以及 ’t Hooft 论文中传达的一个简单而鼓舞人心的信息:这个问题是可解的。(真是令人惊叹,一旦你确信问题有解,解决它就会变得容易得多!)
《归属的困境》 by H. David Politzer; Nobel Lecture, December 8, 2004
乍一看,这似乎就是全部内容了。然而,仔细研读他们的论文后,却发现了一些令人不解的地方。根据作者的说法,他们能够在单个处理器核心上,仅用几个小时就完成了整个计算过程。但粗略估算表明,计算 36 万亿对密钥之间的最大公约数理应需要数年时间,而非几小时。
那么,他们是如何做到这一点的呢?作者在脚注中暗示,他们采用了一种渐近快速算法作为计算核心,这使得计算时间几乎降到了线性水平。然而,他们并未向读者透露具体的算法细节,可能是为了防止被人滥用。尽管如此,在论文发表后的短短几个月内,就有后续研究详细讨论了各种相关方法。这些研究不仅提出了快速算法(参见这篇和那篇论文),还展示了如何利用 GPU 使得暴力破解方法变得可行(参见另一篇论文)。
这或许给我们上了一课:如果你想保守秘密,最好不要到处炫耀。
「比赛中,我确实会陷入疯狂状态,」他带着苦涩的微笑说,眼中流露出困惑和无奈。「我也说不清为什么会这样,但事实就是如此。」
然而,这种疯狂是有规律可循的,Robič 和他的团队对此了如指掌。在一场为期一周的常规赛中,大约到第二天,他的言语就会变得断断续续。到第三天,他会变得好斗,有时甚至偏执。他的短期记忆消失殆尽,情绪也会失控,不住地哭泣。到最后几天,幻觉开始出现:他会看到熊、狼和外星人在路边徘徊;地上的沥青裂缝仿佛重新排列成了密码信息。有时,Robič 会突然从自行车上跳下来,与路边的「阴影人物」对峙,结果发现那不过是路边的邮箱。在 2004 年的一场比赛中,他甚至看到自己被一群嚎叫的、骑着马的黑胡子男人追赶。
「圣战者,向我开枪,」他解释说。「所以我骑得更快。」
他的妻子是一名护士,补充道:「我第一次去参加比赛时,我没有准备好见他。我们几乎快分手了。」
DVD 开始播放,瓦格纳的音乐在房间里回响。我们看到一系列超现实的画面,暴力与诡异的平静交织在一起,仿佛库布里克的电影场景。聚光灯下的 Robič 在暴雨中穿梭于黑暗之中。他气喘吁吁地对一个面无表情、身着军装的男人说着什么,那人被认出是他的团队领导。Robič 像婴儿一样蜷缩在比利牛斯山区的公路上,原来是他骑着骑着就这么睡着了,直接从车上摔了下来。午夜时分,Robič 在一个不知名的法国村庄的十字路口徘徊,挥舞着双臂,对救援团队大喊。一名困惑的宪兵匆忙来,用法语问道:「出什么事了?」我瞥了一眼 Robič,发现他也目不转睛地盯着屏幕。
…在过去的两年里,40 岁的 Robič 几乎赢得了他参加的每一场比赛,包括最近两届超级自行车最大的赛事,即 3,000 英里的 Insight Race Across America (RAAM)。2004 年,Robič 在 24 小时计时赛中以 518.7 英里的成绩创造了世界纪录。去年,他做得更好,继 RAAM 胜利之后,六周后在 Le Tour Direct 中取得了胜利,这是一场 2,500 英里的比赛,赛道由经典的环法自行车赛路线设计而成。Robič 在 7 天 19 小时内完成了任务,攀登了大约 140,000 英尺,相当于攀登珠穆朗玛峰的近五次。「这真是令人难以置信,」两届 RAAM 独揽冠军 Pete Penseyres 说,「我无法想象这么短时间能完成两场大型比赛。心理部分太难了。
Le Tour Direct 的联合组织者 Hans Mauritz 说:「对我来说,Jure 在另一个星球上。他可以死在自行车上并继续前进。
然后出发。除了比赛,Robič 每年训练 335 天,记录约 28,000 英里,或大约绕地球一圈。
然而,Robič 并不是仅具有运动天赋。他不经常是最快的竞争者(他通过每天睡 90 分钟或睡更少来弥补),也不具备任何生理天赋。在极少数情况下,当他允许自己在实验室接受测试时,他产生能量和运输氧气的能力与许多其他超耐力运动员相当。他获胜的原因最基本:他拒绝停止。
在考虑 Robič 经历时,三个事实很清楚:他几乎不知疲倦,他偶尔会发疯,前两个事实以某种方式联系在一起。问题是,如何实现?他失去理智是因为把自己逼得太远,还是因为他失去了理智而把自己逼得太远?Robič 是老问题的最新体现,也许也是最有趣的体现:当人体被推到其耐力的极限时会发生什么?突破点在哪里?当你越过终点线时会发生什么?
……[RAAM] 的获胜者,能够在九天内以超过 13 英里的平均时速,每天骑行 350 英里完成比赛。 不过,最值得关注的不是获胜者,而是近 50% 未完成比赛的人,已经达到了生理极限的他们就像散架了一样累倒在地。
……[RAAM 竞争对手]的最终崩溃发生在两耳之间。参赛者会忍受一轮又一轮的疲劳引起的幻觉和情绪变化。比赛中容错率很小,过去三年 RAAM 发生的两起致命事故都强调了这一点,这两起事故都涉及汽车。乘坐跟随车或露营车的后勤人员会尽其所能提供帮助。对于 Robič 来说,他的支持人员充当第二个大脑,由六名训练有素的斯洛文尼亚士兵组成。它与其他船员相似,因为它提供食物、补充水分、指导和鼓励。但有一个重要的区别。这是第二个大脑,而不是 Robič 的大脑掌控。
……他的系统很简单。在比赛期间,Robič 的大脑可以控制音乐的选择(通常是传统的斯洛文尼亚进行曲和 Lenny Kravitz 的混合)、食物选择和上洗手间时间。第二个大脑决定其他一切,包括休息时间、用餐时间、食物量甚至平均速度。除非 Robič 询问,否则他不会被告知剩余的里程,甚至不会被告知比赛还剩多少天。
「如果他不知道,那最好是,」Stanovnik 说。「他只负责骑——就这样。」
…在所有决策中,Stanovnik 都根据他多年来形成的经验法则进行管理:当 Robič 感到筋疲力尽时,当他如此疲惫和睡眠不足时,他觉得自己可能真的要死在自行车上,实际上这多花了他 50% 的能量。
…在这个双脑系统中,Robič 的精神崩溃是值得注意的,且是过程中不可或缺的一部分:可喜的证据证明其他限制因素已经被消除,并且最大的压力已经牢牢地放在最后一个环节上,即 Robič 的思想。虽然他的长期记忆似乎没有受到影响(他可以回忆起每年的路线地标),但他的短期记忆会消失。Robič 将在 5 分钟内重复相同的问题 10 次。他的思想完全留于当下。
「当我累的时候,Miran 可以带我到边缘,」Robič 感激地说,「直到我用尽所有力气。」Robič 可以被推到 50% 限制之外多远?「90%,也许是 95%,」Stanovnik 若有所思地说。「但那可能是不健康的做法。」
有趣的是——或者令人不安的是,取决于你如何看待它——一些研究人员正在发现证据,证明 Stanovnik 的经验法则可能是正确的。最近的大量研究使人们越来越支持疲劳的起源和控制部分(如果不是大部分)在大脑和中枢神经系统内部。这项新研究为老教练的陈词滥调增添了新的话术:你只是觉得自己累了。
——然而,研究人员早就注意到神经系统疾病与运动潜力之间存在联系。在 1800 年代后期,法国先驱医生 Philippe Tissié 观察到恐惧症和癫痫可能对运动训练有益。几十年后,德国外科医生 August Bier 测量了一名精神障碍患者的自主跳远,并表明它与现有的世界纪录相比它的表现很不错。这些类型的运动似乎违背了内在肌肉极限的概念,Bier 指出,这是通过「强大的精神刺激和同时消除抑制」而实现的。
1989 年,当加拿大研究人员发表一项名为「珠穆朗玛峰 II」的实验结果时,关于以肌肉为中心的模型问题再次出现,在该实验中,运动员在高海拔舱中进行剧烈运动。尽管运动员的乳酸浓度仍然很低,但他们还是筋疲力尽。疲劳似乎是由其他原因引起的。
1999 年,南非开普敦大学医学院的三位生理学家开始进一步研究。他们在 62 英里的实验室骑行研究中让一组骑自行车的人筋疲力尽,并通过电极测量他们在疲劳极限下使用的腿部肌肉的百分比。他们推断,如果标准理论是正确的,那么身体在接近疲惫时应该招募更多的肌肉纤维——这是对疲惫、虚弱的肌肉的自然补偿。
然而,研究人员观察到的结果却大出意料。随着骑行者逐渐接近极度疲劳状态,他们体内活跃的肌肉纤维比例不增反降,最终仅有约 30% 的肌肉纤维保持工作状态。有趣的是,尽管运动员主观上认为自己已经竭尽全力,但实际上他们的大部分肌肉却处于休息状态。这一发现不禁让人产生疑问:是否是大脑在有意识地限制身体的输出?
「就好像大脑在捉弄身体,以拯救它,」开普敦小组负责人 Timothy Noakes 说。「如果你仔细想想,这很有意义。在疲劳中,我们只觉得自己快要死了。疲劳所代表的实际生理风险基本上是微不足道的。」
……研究人员认为,疲劳与其说是一个客观事件,不如说是一种主观情绪——大脑聪明、自以为是地试图吓唬你停下来。因此,克服疲劳的方法是回馈:通过对大脑撒谎、分散大脑的注意力甚至激怒大脑以此愚弄大脑。(也就是说,心理游戏永远无法克服基本的体能不足。正如 Noakes 所说,该机构始终拥有否决权。)
……该理论似乎也可以解释一种体育现象,其中超耐力赛事已经从被认为具有医学危险性转变为接近常规的危险性。夏威夷的铁人三项赛——2.4 英里游泳、112 英里自行车骑行和马拉松长跑——是 1980 年代耐力赛的极致,但现在已被 Ultraman 超越,它的长度是 Ultraman 的两倍多。曾经默默无闻的冒险赛车类型,包括像 Primal Quest 这样的 500 多英里的荒野比赛,现在已经发展到每年 400 多场赛事。超级马拉松运动员,定义为参加超过官方马拉松距离 26.2 英里的跑步项目的人,现在仅在美国就有大约 15,000 人。基本物理学没有改变,但我们的可能性认知却发生了变化。像 Robič 这样的体育文化已经找到了一种调整及集中掌控的方法。
……「我的内驱力无处不在,」Robič 说。「如果现在你看着我,想知道我是不是不能上山,即使你在开玩笑,我也会这样做。然后我会再做一次,也许还会再做一次。」他指着斯托尔山(Mount Stol),一座白雪皑皑的巨人蹲伏在他上方 7,300 英尺处,像月亮一样遥远。「三年前,我对这座山很生气。我在两个月内爬了 38 次。」
Robič 继续详细地介绍了他的动力燃料来源,包括他疏忽大意的父亲、持续接近贫困的处境(三年前,他沦落到向农民朋友要食物)以及由于斯洛文尼亚面积小而缺乏大型赞助商的支持。(「如果我住在奥地利,我会成为百万富翁,」他不以为然地说。还有一个圣经风味的心理转折:一个同父异母的兄弟是未婚时生的,名叫 Marko,与 Jure 的年龄相差无几。Robič 说,他的父亲很喜欢 Marko,以至于这位老人让他继承自己餐厅的一部分,并让 28 岁的 Jure 乞求他们给自己洗碗的工作。
「我一生都在流浪,」他说。「我有一种感觉,我不够好,无法成为那个好人。所以现在我在做自己擅长的某件事,我想通过这件事向所有认为我是某种失败者的人证明。这些感觉一直存在于我心中。他们是我力量的来源。」
……Robič 谈到了他接下来的计划。谈到了他的妻子,她的工作支持了他们,还谈到了他们的儿子,他开始走路了。他谈到了他将如何努力在 6 月创下连续三次赢得 RAAM 的记录,以及他如何希望比赛官员不会通过增加强制性休息站作为对最近的死亡事件做出的反应。(「那将不是一场真正的比赛,」他说。几个月后,他将进行标志性的 48 小时训练,其中他连续骑行 24 小时,整夜保持清醒,接着继续进行 12 小时的锻炼。
–《没能杀死我的终将使我更强大》,纽约时报
另请参阅 Diane Van Deren; Nickademus de la Rosa; David Goggins; 自由单人攀岩者
「别告诉我你不能做。你不想做。这是可以理解的;向你刚认识的陌生人要钱真是太疯狂了。但不要将您不愿意做的事情与不可能做的事情混为一谈。如果你想去,就大声问他们,『谁愿意给我钱去参加下一次研讨会?』不想就坐下。」
……他咽了咽口水,仔细想了想。我不知道如果他坐下来会发生什么;我想说的是,研讨会负责人会说,「你做出了一个诚实的选择」,然后走开,但也可能不会。毕竟,这是关于钱的。但是这并没有发生,推销员盖伊用颤抖的声音说,「有人会给我钱去参加下一次研讨会吗?
一阵漫长而令人尴尬的沉默后有人伸手拿他的钱包。「我会给你 10 美元。」
这打破了僵局。接下来,一位女士打开她的钱包说:「我还有 20 美元。瞧,一旦开始询问,整个房间都开始掏现金,直到他有足够的现金,全部捐完,然后砰,他进来了。然后下一个想去但甚至比推销员 Guy 更是经纪人的人站起来问,下一个人不得不走到大厅里,向 est 员工和志愿者要现金,这更尴尬,但他们明白了。
那天每个想去的人都拿到了现金。(很多人仍然坐着没动,或者只是说「不」。)
我既被激怒又开悟。因为这笔现金显然都花在了 est 的利益上——但那家伙关于合理努力也是绝对正确的。我们生活在一个随大流的束缚文化中,我们经常将它们视为硬性限制——「我不能做得更多,」我们说,「我已经尽了最大的努力。」但事实并非如此。这只是我们当时愿意做的认为是对的事情。
当我跑步到岔气时,我真的认为我已经投入了 100%。但事实是,我讨厌跑步,我讨厌锻炼,我把自己大约 20% 的精力投入其中。如果我被一头熊追赶,突然间我会在我内心找到新的储备。虽然我讨厌数学作业,并认为我勉强做的半小时真的是数学作业的负担,但我会忘记我会花多少小时来记住 PAC-Man 模式。
在那之后,我意识到自己真正的极限在哪里——它们就在那里。也许我可以停止告诉自己和别人我已经尽力了。我并没有尽力。甚至没有接近。我只是做了我认为合理的事情。
有时你不需要合乎情理.
–《论合理努力》, Ferrett Steinmetz
我一直认为,一个能力尚可的人,如果首先制定一个好的计划,并切断所有会分散他注意力的娱乐或其他事情,把执行该计划作为他唯一的研究和事业,那么他就可以在人类中做出巨大的改变,成就伟大的事业。
https://www.lesswrong.com/posts/GuEsfTpSDSbXFiseH/make-an-extraordinary-effort
https://www.lesswrong.com/posts/fpecAJLG9czABgCe9/on-doing-the-impossible
https://www.lesswrong.com/posts/PBRWb2Em5SNeWYwwB/humans-are-not-automatically-strategic
「以 Rodney Mullen 为例。他真是个天才,「她说。Mullen 不是科学或医学界的人物。事实上,他是一位传奇的滑板手,以发明以前似乎不可能完成的令人兴奋的技巧而闻名。其中之一实际上被称为「不可能」。「他执行这些违背常理的动作,拍摄下来,并发布在 YouTube 上,」Kim 说,「不可避免地,几周内,有人会给他发一个剪辑说:这孩子比你做得更好。他把他所拥有的一切都给了这个技巧,他从他所有的经验中汲取灵感,而这个孩子在几周内就学会了。因为这个孩子知道这是可以做到的。Rodney 作为一种连接。他打破了怀疑的障碍。」
场景:我在办公时间做了 3+ 个小时的代数问题。
助教:解决方案涉及矩阵
我:<意识到答案>
场景:朋友请我帮忙解决一个我不知道答案且有难度的计算机问题。
朋友:我尝试了许多方法,但都没起效。
我:好,你可以只做 A 方法吗?似乎它会有效。
朋友:……是的,那行得通。
平庸的无能
原文:Ordinary Incompetence · Gwern.net
无能是常态;大多数从事某项任务的人(即使有绩效激励或花费无数时间从事该任务)可能仍在犯一些基本错误,这些错误可以通过指导或刻意练习来纠正。
2021-06-04 完成;确定性:日志;重要性:5;反向链接;相似内容;参考文献
一头为 10 次战役驮过包袱的骡子在尤金亲王手下也不会因此成为更好的战术家,必须承认,这是对人性的侮辱,许多人在一个本应受人尊敬的职业中变老,却没有取得比这头骡子更大的进步。
腓特烈大帝,《关于战术的思考》[1]
-
心理学:
-
Thorndike 1921 关于经验和专业知识之间较低的相关性
-
《人类能力范围》,Wechsler 1935(在有绝对表现指标的情况下,如跑步速度,约 1000 名健康正常人的样本将仅跨越约第 3 个百分位?)
-
刻意练习,例如 Chamblis 1989(不充分,但必要,且经常需要)
-
《一般智力因子(g)为何重要:解析日常生活的复杂性》,Gottfredson 1997;《将日常生活视为智力测试:智力及其环境的影响》,Gordon 1997
-
《比你想象的还要蠢》(关于美国成年人的识字能力;另请参阅《McNamara 的愚行》)
-
-
游戏:
-
《为胜利而战》,Sirlin 2006
-
《超过 95% 的水平其实并不怎么样》/《愿意显得愚蠢》,Dan Luu;《一本书的门槛》
-
星际争霸:Gheed 的《工人快攻:跌落青铜》」系列文章(续篇二/续篇三/续篇四/续篇五/续篇六/续篇七/续篇八/续篇九/续篇十/续篇十一)
-
国际象棋:Tyler Cowen 的《我的青少年国际象棋教师生涯》(附:他的写作心得);Joseph Wong 的《普通人需要多长时间才能在国际象棋上「炉火纯青」?》;Anderson et al 2016 年的研究《以完美为基准评估人为失误》;《秒的秘密生活:世界国际象棋锦标赛背后的智囊团》;Viswanathan Anand 的访谈
-
围棋:AlphaGo Zero 论文;Choi et al 2021 年的研究《人工智能如何提升人类决策能力?基于 AI 围棋程序的实证研究》
-
田径:《不断超越:「表现革命」如何改变田径运动及其他领域》;《追求卓越:顶级运动员和歌手都有教练,你是否也需要一个?》;《争分夺秒:打造更强大的奥运健儿》;Maynard et al 2022
-
光环:《精通战争艺术:游戏模式如何影响光环中的技能提升》,Huang et al 2013
-
-
经济学:
-
《Nicholas Bloom 谈管理、生产力和科学进步》;《来自 The Profit 的教训》
-
《为什么管理实践在不同公司和国家之间存在差异》,Bloom & Van Reenen 2010
-
《管理真的重要吗?来自印度的证据》,Bloom et al 2012;《管理干预能持续多久?来自印度的证据》,Bloom et al 2020
-
《管理作为一种技术?》,Bloom et al 2017;《为什么我们低估了称职的管理?》
-
《咨询服务对中小企业的影响:来自墨西哥的随机试验证据》,Bruhn et al 2018
-
《管理培训是否有助于企业家发展新企业?来自新加坡的实地实验证据》,Kotha et al 2019;《创业决策的科学方法:来自[意大利]随机对照试验的证据》,Camuffo et al 2019
-
《为新公司消除增长障碍:来自对两百万在线企业的创业培训实验的证据》,Jin & Sun 2021
-
《零售业的管理者和生产力》,Metcalfe et al 2023
-
《开展业务:连锁所有权与生育诊所绩效》,La Forgia & Bodner 2024
-
《创造「美国式」商业方式:来自美国二战的证据》,Giorcelli 2024
-
-
《智商、交易行为与表现》,Grinblatt et al 2012
-
《超越蓝图:组织运营知识如何赋能与疏离员工》,Huising 2019
-
《可靠性、可维护性与风险》附录(工业任务中的人为失误:即便是最简单的任务,失误率似乎也难以低于 1/10,000——引用的最低失误率是 1/100,000,对应「浴缸注水过满」这一情形)
-
-
《为何程序员不会……编程?》,Jeff Atwood
-
物理学:
-
牛顿力学:David Hestenes 展示了物理系学生中亚里士多德式朴素物理学观念的顽固存在,这表明他们所学到的仅仅是《猜老师的密码》;关于使用的测试,请参见 Halloun & Hestenes 1985 和 Hestenes et al 1992
-
量子力学:《量子力学概念调查的设计与验证》,McKagan et al 2010
-
-
另请参阅:《恐怖主义并不有效》、《论拥有足够的袜子》、《局部最优与贪心选择》、《非常规小团体的惊人效能》、《心理深度的错觉》
高效学习的间隔重复
通过间隔效应实现高效记忆:可以广泛使用的文献综述、使用技巧、适用范围及其裨益。
间隔重复是有数百年历史的心理学方法,常用于高效记忆以及技能练习。与尝试去死记硬背相反的,通过间隔性的复习,人复习时长的增加,软件的计划安排,使得记忆效率更高。间隔重复虽然节奏较慢,但更加稳扎稳打,所以实现了更高的效率,便可以扩展到记忆成百上千的内容(相比之下,死记硬背的内容几乎转瞬即忘),因此对于外语和医学学习尤为有用。
我回顾了这种方法的适用范围与相关的大型研究文献,以及测试效应(大部分材料截止到 2013 年),可用的软件工具和使用方式,以及关于它的各种想法和观察。
计算机技术最富有成效的领域之一就是弥补人类的弱点。计算机精通算数,因为这是人类力有未逮之处1。计算机要记住 TB 量级的数据,因为人类忘性大。计算机能制作最好的日程表,因为人类总要查看今天要做什么。不过即使我们记不清楚东西,记住哪里能参考到也够用了。从头到尾阅读一本手册或教科书的意义并不是记住里面的一切知识以备万一,而是之后能记住「什么在里面」以便检索(快速浏览之后,你便能掌握用于搜索某个主题的正确关键词,来应对深入了解此话题的需要)。
这样的神经辅助工具2是有不少,但总有更多可以发掘出来。这些工具值得上下求索,因为它们价值连城:铲子比你的手要有效得多,但电铲 比两者都要强上几个数量级——虽然它需要培训和专业知识才能使用。
间隔效应
「练习能让你受益匪浅,
若其时机适当地分散。
你若想当个蠢驴笨蛋
那就一口气做完,
你能记住的少得可怜。」
Ulrich Neisser3
我目前最喜欢的神经辅助工具,是利用间隔效应的软件。间隔效应在认知心理学中有数百年历史,这些软件借此在学习或记忆方面能比传统学习方法取得更好的效果;唉,但这种效应还不为人知4。
间隔效应实质上是说,如果你有一个问题「你学到的这个随机序列中的第五个字母是什么?」,而你只能学习它 5 次,那么如果你把 5 次机会分散到很长的一段时间——天、周、月,那么你对答案「e」的记忆将会最强。而集中在一两天内草草学习 5 次则是最不明智选择。你可以把「遗忘曲线」想象成一张放射性半衰期的图表:比方说,每次复习都会使你的记忆力提高 50%,但复习在早期并没有起到多大作用,因为记忆并没有衰退太多!(为什么生物学水平上间隔效应有效?在动物模型中,集中学习和间隔学习存在明显的神经化学差异。间隔学习(间隔大于一小时)能助长神经元连接强度的长期增益效应,而集中学习没有此效果5。但是这种差异的原因还是悬而未决的问题;请参阅记忆痕迹或者睡眠学习的概念。)遗忘曲线的图形表示:
Stahl et al 2010; CNS Spectrums
更好的是,我们都知道主动回忆是一种种远胜于单纯被动接触信息的学习方法。6间隔也可以扩展到海量信息;身为赌徒和金融家的 Edward O.Thorp 在他还是一名物理研究生的时候就利用了「间隔学习」,「以便能更久且更努力地工作」7,还有 Roger Craig 在 2010-2011 年的智力竞赛节目「Jeopardy!」中创造了多项记录,归功于使用 Anki 记忆了许多 >200,000 张关于以前问题的卡片8;后来的「Jeopardy!」获奖者 Arthur Chu 也使用了间隔重复9。医学院的学生 (由于他们在医学院期间需要记住大量的事实材料而成为 SRS 的主要人群) 通常拥有数千张卡片,特别是如果使用预制的牌组 (由于标准化课程和普遍缺乏制作自己卡片的时间,预制牌组更适合于医学)。外语学习者可以很容易地累积到 10-30,000 张卡片;一个 Anki 用户报告了一副超过 76.5 万张自动生成卡片的牌组,里面装满了各种来源(「Youtube 视频、视频游戏、电视节目等」)的日语音频样本。
一图胜千言;假设这里有一个人有条件多次复习一条给定的信息 (假设他很忙碌)。通过观察我们所记内容的保留率可以看到,短期内的突击记忆非常有用,然而,未经锻炼的记忆衰退得非常快,倘若拉长该记忆的间隔,那么记忆效果要好得多:
《连线》(杂志)(出自 Wozniak?);集中 VS 间隔(可代替的图表)
如果我们观看一段可视化了记忆衰退的视频《随机重复 VS 近期重复 VS 间隔重复》,结果会更加惊人。
如果你这么棒,你为什么没钱
大多数人认为编程在概念上很好理解,但动手实践就难乎其难。10
当然,学生们选择的正是后一种策略(死记硬背)。他们在考试前一晚临时抱佛脚,一个月后就什么都记不起来了。那么为什么要这么做呢?(我自己也不幸置身其中) 为什么间隔重复如此不受欢迎,甚至对于稍有尝试的人也是如此?11
Scumbag Brain 表情包:考试前一晚死记硬背的时候什么都知道/一个月后什么都忘了
因为死记硬背在某种程度上确实有它的功用。但有得必有失:你用现在的强记忆换取以后的弱记忆。(非常弱12。)考试通常全是新材料,虽偶尔会有旧问题,所以死记硬背是有回报的!这就是它的可恶之处——总的来说,虽然死记硬背的记忆寿命和质量都不如间隔重复的功效,但死记硬背能立即收效13。因此,死记硬背虽说有些短视,但也算是理性的对策。甚至 SRS 软件也承认其功用,并提供一定程度的支持14。(但正如人们可能预期的,如果进行连续而渐进的测试,那么所学知识寿命也更长15;我不知道这是否因为这种测试是一种变相的、偶然间形成的间隔重复系统,还是学生或受试者只是为了应对小风险的考试而学习表现不同。)除了这种短期集中的优势之外,人们还常忽略间隔重复的优势,以及有着认为短期记忆的成效会持续存在的主观“错觉”1617(参见:Son & Simon 201218, Mulligan & Peterson 2014, Bjork et al 2013, Deslauriers et al 2019); from Kornell 2009 的对 GRE 词汇的研究(重点添加):
在整个实验中,对于 90% 的参与者来说,间隔比集中更有效,然而在第一次学习之后,72% 的参与者认为集中比间隔更有效……当他们确实考虑间隔时,他们经常有这样的错觉:「集中学习比间隔学习更有效」,即使事实是相反的 (Dunlosky & Nelson, 1994; Kornell & Bjork, 2008a; Simon & Bjork 2001; Zechmeister & Shaughnessy, 1980)。
正如人们所预期的那样,如果测试效应和间隔效应真实存在,那么那些本就自我测试并在考试前用功学习的学生往往会有较高的 GPA。19 如果我们将问题解释为测试,那么一对一辅导显著优于常规教学,这不会令我们惊讶,而且受辅导学生回答的问题数量高要出几个数量级20。
当然,从长远来看,这种短视观点并不是一件好事。知识建立在知识的基础上,不是与学习无关的琐事。Richard Hamming 在《你和你的研究》一书中回忆到:
可以看到,大多数伟大的科学家都有澎湃的干劲。我在贝尔实验室与 John Tukey 共事了十年。他便是干劲很足的人。我加入实验室约三四年后,有一天我发现 John Tukey 其实年龄竟比我小一点。John 是个天才,而我显然不是。我怒气攻心,冲进 Bode 的办公室说:「跟我差不多大的人怎么能像 John Tukey 那样知道这么多?」他靠在椅子上,把双手放在脑后,微微一笑,说道:「Hamming,如果你像他那样努力工作那么多年,你的知识也会多到让你惊讶的。」我羞愧至极,简直是马上溜出了办公室!
Bode 的意思是:「知识和生产力就像复利。」如果两个人的能力大致相同,而其中一个人的工作量比另一个人多 10%,那么前者的产量将是后者的两倍多。知道的越多,学的越多;学的越多,能做的越多;能做的越多,机会越多——这很像复利。我不想给你一个利率,但这是一个非常高的利率。如果两个人拥有完全相同的能力,那么一个日复一日多花一个小时思考的人在一生中的工作效率将会大大提高。我把 Bode 的话放在心上;几年来,我花了更多的时间努力工作,并发现,事实上我可以完成更多的工作。
知识需要积累,而间隔重复搭配上抽认卡很适合辅助积累,即使有数千张卡片和前置概念,所有知识仍然能稳定地复习。
间隔重复关注长远,这或许可以解释为什么显式的间隔重复很不普及:很久才能收获回报,而且这种回报很反直觉,却需要当即付出自律的代价,然而这个代价却很实在。(请参阅双曲贴现。)而雪上加霜的是,确定何时进行下一次复习很困难——最好的时机是你即将忘记知识的时候,但这样就进退两难:如果即将忘记知识,又怎么能记住要复习它呢?你只记得去复习知道的知识,但知道了又不用去复习了!21
这个悖论的破局之道是让计算机处理所有的计算。我们要感谢赫尔曼·艾宾浩斯细致得令人发指的研究,不过现在我们可以给计算机编程来计算遗忘曲线以及最需要复习的卡片集合22。这就是间隔重复软件背后的逻辑:一遍又一遍地问同样的问题,但每次询问之间间隔不断增加。一开始每隔几天问一次,使用者很快就会记得挺清楚。然后间隔扩展成几周,然后是几个月,然后是几年。一旦记忆形成并存储到长期记忆中,只需要偶尔复习一下就很硬朗23——我很清楚地记得我四五岁生日时用纸板做过大恐龙,或者用盒子做隧道,尽管我最多就一年回忆一两次。
文献综述
但是不要轻信我的话——不随他人之言!要用科学说话。当然,如果你真的相信我的话,你可能只想阅读间隔重复的使用方法和各种花式应用,所以我建议你直接跳到这里。其他人,我们从头开始:
背景:测试有效果!
「把课文阅读二十遍之后背诵,效果不如把课文阅读十遍,并且时不时尝试背诵,记不住了就翻阅一下。」——The New Organon,Francis Bacon
测试效应是广受承认的心理学现象,表明了单纯测试记忆的行为就会增强记忆(无论是否有反馈)。既然间隔重复的本质就是在特定的日子进行测试,我们便能得出测试比普通复习或者学习有更好的效果,而且不仅适用于记忆随便一个日期。下列是一些有关论文:
-
Allen, G.A., Mahler, W.A., & Estes, W.K. (1969). “Effects of recall tests on long-term retention of paired associates”. Journal of Verbal Learning and Verbal Behavior, 8, 463-470
进行一次测试,一天之后的记忆强度相当于学习 5 次;与集中回顾相比,间隔可以提高保留率。
-
Karpicke & Roediger (2003). “The Critical Importance of Retrieval for Learning”
学习斯瓦希里语词汇的实验中,学生遵循不同的流程,有的接受测试,有的学习,有的两者都做;学习阶段各组得分相似。研究人员要求学生预测他们能记住的词汇所占比重 (所有小组的预测的平均值是 50%)。一周后,接受测试的学生记住了大约 80% 的词汇,而没有测试的学生记住了大约 35%。一些学生测试或学习的时长比其他学生更久,然而一旦记忆成型了,收益递减便如影随形。学生们报告说,他们很少测试自己,也很少测试已经学过的内容。
总结:同样,与学习相比,测试可以改善记忆。而且,没有学生知道这一点。
-
Roediger & Karpicke (2006a). “Test-Enhanced Learning: Taking Memory Tests Improves Long-Term Retention”
学生在读完文章 5 分钟、2 天、1 周后就文章阅读理解接受考查(没有反馈)。5 分钟之后考查,学习材料完胜测试,但其他时刻后就不一样了;然而学生认为,无论何时接受考查,学习都胜过测试一筹。1 周之后,测试成绩为 60%,而学习为 40%。
总结:与学习相比,测试更能改善记忆。所有人(老师&学生)“觉得”恰好相反。
-
Karpicke & Roediger (2006a). “Expanding retrieval promotes short-term retention, but equal interval retrieval enhances long-term retention”
一般科学散文理解;摘自 Roediger & Karpicke 2006b:「两天后,初次测试比重复学习的记忆效果更好 (68% 比 54%),一周后再观察,测试比重复学习仍有优势 (56% 比 42%)。」
-
Roediger & Karpicke (2006b). “The Power of Testing Memory: Basic Research and Implications for Educational Practice”
文献综述:有 7 项1941 年之前的研究证明测试可以提高保留率,而在 1941 年之后的研究也有 6 项。另见综述 “Spacing Learning Events Over Time: What the Research Says” & “Using spacing to enhance diverse forms of learning: Review of recent research and implications for instruction”, Carpenter et al 2012。
-
Agarwal et al 2008, “Examining the Testing Effect with Open- and Closed-Book Tests”
与 #2 一样,从长远来看,更纯粹的测试形式(也就是开卷测试而非闭卷测试)表现得更好,学生对于哪种测试更有效果上是受蒙蔽的。
-
Bangert-Drowns et al 1991. “Effects of frequent classroom testing”
有 35 项研究在学期中展开各式测试。对这些研究进行元分析,发现 29 例发现测试有好处;5 例发现有坏处;1 例结果为无效果。元分析发现,即使只测试一次,也会带来巨大的好处,之后回报就会递减。
-
Cook 2006, “Impact of self-assessment questions and learning styles in Web-based learning: a randomized, controlled, crossover trial”;医生(住院医师)带着问题学习的话,最终得分更高。
-
Johnson & Kiviniemi 2009, “The Effect of Online Chapter Quizzes on Exam Performance in an Undergraduate Social Psychology Course”(「这项研究考察了基于掌握学习理论的每周强制阅读测验对于提高考试和课程表现的有效程度。能完成阅读测验与更好的考试和课程表现有关。」);另见 McDaniel et al 2012。
-
Metsämuuronen 2013, “Effect of Repeated Testing on the Development of Secondary Language Proficiency”
-
Meyer & Logan 2013, “Taking the Testing Effect Beyond the College Freshman: Benefits for Lifelong Learning”; 证实测试效应在老年人中与年轻人有相近的效应量
-
Larsen & Butler 2013, “Test-enhanced learning”
-
Yang et al 2021, “Testing (Quizzing) Boosts Classroom Learning: A Systematic And Meta–Analytic Review”
(可能有人会忍不住反对,称测试只能对某些学习风格有效,也许只对语言型学习风格有效。这种判断尚未得到证实,主要是因为学习风格的实验研究质量不高,而且对于学习风格本身是否存在这一点,现存证据还众说纷纭24)
学科
上述研究经常使用词-释义对或者单词表作为研究材料。测试效应推广到其他领域效果如何?
测试有益学习的材料:
-
外语词汇 (eg. Karpicke & Roediger 2003, Cepeda et al 2009, Fritz et al 200725, de la Rouviere 2012)
-
GRE 材料 (比如词汇题,Kornell 2009); 关于一般科学话题的文章 (Karpicke & Roediger, 2006a; Pashler et al, 2003)
-
百科问答 (McDaniel & Fisher 1991)
-
小学和中学的课程,如传记材料和科学 (Gates 1917;由 Spitzer 193926 和 Vlach & Sandhofer 201227 分别研究)
-
Agarwal et al (2008): 简答测试对于教科书段落效果拔群
-
历史教科书;一开始使用简答题而不是选择题可以更好提升保留率 (Nungester & Duchastel 1982)
-
LaPorte & Voss (1975) 也发现测试效应下保留率比选择题或再认题高
-
Duchastel & Nungester, 1981: 在测试 6 个月后,测试在回忆一段历史文本上比学习效果更好
-
Duchastel (1981):对于阅读理解历史段落,自由回忆比简答题和选择题有决定性优势
-
Glover (1989):通过自由回忆自我检测比再认或填空题效果更好;主题是花朵各部分的名称
-
Kang, McDermott, and Roediger (2007):散文文章;一开始进行简答测试,在 3 天后的选择题和简答测试中成绩都很优异
-
Leeming (2002): 测试应用于学习两门心理学课程:心理学导论 & 记忆/学习主题;“心理学导论上(测试与学习效果为)80% 与 74%;学习和记忆主题上(测试与学习效果为)89%比80%”28
这些材料涵盖了相当多的所谓「陈述性」知识。将测试拓展到其他领域则更加困难,测试往往会沦为「频繁得做很多分析,而不做大局分析」,或者「进行很多琐碎练习」,或者所拓展领域中类似的行为。
第三个问题与第二个问题有关。我们提倡通过测试学习,但这种方式是否适合主题复杂的课程呢?例如斯宾诺莎哲学、莎士比亚喜剧或创意写作。当然在这类课程中,我们同意大部分形式的客观测试都是水土不服的。但我们也相信,广义上的测试效应思想仍然适用——学生应该持续思考课程主题内容并接受挑战,而不仅仅参加期中和期末考试(即使考试是写论文)。在一门斯宾诺莎的课程中,老师每周给学生安排阅读材料和引人深思的论文问题。这便是体现迁移恰当理论的每周「测试」(尽管是带回家做的考试)。持续测试要求学生持续投入到一门课程中,而不是天天划水,直到期中考试或期末考试临近才开始学习。29。
缺点
测试确实已知有一些缺陷:
-
对回忆能力的干扰——回忆已测试项目的能力,会削弱回忆未测试的类似项目的能力。
大多数/所有研究都是在实验室环境下进行的,而且干扰并不显著:
总而言之,虽然各种类型的回忆干扰是真实存在的(也相当有趣),但我们不认为回忆干扰能否定测试增强学习的观点。这种干扰最坏也只是在一定程度上削弱测试效应的正面效果。然而测试的正面效果之明显,大多数情况下都能超过相对微小的干扰影响。
-
多项选择测试可能会意外地导致“负面暗示效应”,也就是有一些内容测试者已经知道是错的,但在测试中包含这些内容后,测试者却很容易认为它们是对的。
如果能快速反馈正确答案,负面暗示效应就会减轻很多,甚至被消除(参见Butler & Roediger 2008 “Feedback enhances the positive effects and reduces the negative effects of multiple-choice testing”. 解决方法:不要用选择题;反正选择题的测试能力比自由回忆或者简答都差。
这两个问题似乎都不太严重。
间隔效应(分散练习)
测试的时机至关重要。上文中,我们注意到学完知识之后测试是有些好处,但是同样数量的测试分散到不同时机进行,更能实现间隔效应或者间隔重复。有上百个研究涉及间隔效应:
-
Cepeda et al 2006 这篇综述对 184 篇文章共计 317 个实验做了总结;其他综述包括:
-
Ruch 1928, “Factors influencing the relative economy of massed and distributed practice in learning”
-
Crowder 1976, Principles of learning and memory
-
Dempster 1989, “Spacing effects and their implications for theory and practice”
-
Delaney et al 2010, “Spacing and testing effects: A deeply critical, lengthy, and at times discursive review of the literature”
-
Donovan & Radosevich 1999, “A meta-analytic review of the distribution of practice effect: Now you see it, now you don’t”
-
Greene 1992, Human memory: Paradigms and paradoxes
-
Janiszewski et al 2003, “A meta-analysis of the spacing effect in verbal learning: Implications for research on advertising repetition and consumer memory”
-
Pavlik & Anderson 2003, “An ACT-R model of the spacing effect”
-
Balota et al 2006, “Is Expanded Retrieval Practice a Superior Form of Spaced Retrieval? A Critical Review of the Extant Literature”
-
Carpenter et al 2012, “Using Spacing to Enhance Diverse Forms of Learning: Review of Recent Research and Implications for Instruction”
他们几乎一致地发现,若最终测试/测量在几天或几年后进行的话,间隔测试优于集中测试30,尽管其中机制并未知晓31。除了前面提到的研究外,我们还有:
-
Peterson, L. R., Wampler, R., Kirkpatrick, M., & Saltzman, D. (1963). “Effect of spacing presentations on retention of a paired associate over short intervals”. Journal of Experimental Psychology, 66(2), 206-209
-
Glenberg, A. M. (1977). “Influences of retrieval processes on the spacing effect in free recall”. Journal of Experimental Psychology: Human Learning and Memory, 3(3), 282-294
-
Balota et al 1989, “Age-related differences in the impact of spacing, lag and retention interval”. Psychology and Aging, 4, 3-9
大量研究文献都在探究“什么样”的间隔安排是最好的,以及如此安排所反映出的记忆性质:是间隔固定不动好,还是间隔逐渐变大好?这对于理解记忆以及建立记忆模型都非常重要,同时也有助于将间隔重复融入课堂(比如Kelley & Whatson 2013年研究使用的安排是10分钟学习/10分钟休息,将同样材料重复三次,其意图是促使材料进入长期记忆?)但是对于实践来说,这个研究方向不是很有趣:总的来说,很多研究众说纷纭,但给出的安排效率虽有差异,也不算显著。大多数现存材料都模仿 Supermemo, 使用了间隔变大的算法,所以没什么好担心的; Mnemosyne 的开发者 Peter Bienstman 说,尚不清楚更复杂的算法能否有助益32, Anki 开发者担心重新实现 Supermemo 的专有算法太难也太复杂,却看不到显著成效,同时 SM3+ 算法为了极尽优化可能造成更多错误。所以他们也有同感。
如果有人感兴趣,有 3 项研究发现固定间隔比递增间隔更好:
-
Carpenter, S. K., & DeLosh, E. L. (2005). “Application of the testing and spacing effects to name learning”. Applied Cognitive Psychology, 19, 619-63633
-
Logan, J. M. (2004). Spaced and expanded retrieval effects in younger and older adults. Unpublished doctoral dissertation, Washington University, St. Louis, MO
这篇论文很有趣,因为洛根发现,一天之后测试,使用递增间隔复习的年轻人表现要差得多。
-
Karpicke & Roediger, 2006a
撇开固定间隔的问题与递增间隔的问题不谈,有更多通用研究指出间隔学习相对集中学习的好处,见下面的列表:
-
Cepeda et al 2006 (大综述,本页中其他地方用到)
-
Karpicke & Roediger 2006a
-
Rohrer & Taylor 2006. “The effects of over-learning and distributed practice on the retention of mathematics knowledge”. Applied Cognitive Psychology, 20: 1209-1224 (参见 Rohrer & Taylor 2007, Rohrer et al 2005)
-
Seabrook et al 2005. “Distributed and Massed Practice: From Laboratory to Classroom”
-
Keppel, Geoffrey. “A Reconsideration of the Extinction-Recovery Theory”. Journal of Verbal Learning & Verbal Behavior. 6(4) 1967, 476-486
一周后,集中复习者从 5.9 正确 → 2.1;间隔复习者从 5.5 → 5.0。(请注意,通常的观察是集中学习最初更好,后来变得更差,正确率是最初的一半不到)
-
Bloom & Schuell 1981, “Effects of massed and distributed practice on the learning and retention of second-language vocabulary”
在两个高中组记住 16 个法语单词四天后,间隔组还记得 15 个,集中组还记得 11 个。
-
Rea, Cornelius P; Modigliani, Vito. “The effect of expanded versus massed practice on the retention of multiplication facts and spelling lists”. Human Learning: Journal of Practical Research & Applications. Vol 4(1) Jan-Mar 1985, 11-1834
培训后立即进行测试,结果间隔组(70% 正确)比集中组(53% 正确)表现更好。这些结果似乎表明,间隔效应适用于学龄儿童,至少适用于学校通常教授的一些材料。35
-
Donovan & Radosevich 1999, “A meta-analytic review of the distribution of practice effect: Now you see it, now you don’t”:
根据多诺万和拉多塞维奇对间隔学习研究的元分析,间隔效应的效应量]为 d = 0.42. 这意味着接受间隔练习后的平均记忆效果,优于约 67% 集中练习者的记忆效果。这个效应量不容小觑——在教育研究中,即使效应量低到 d = 0.2 都认为是“足够显著”,而高于 d = 1 的效应量则少之又少。36。
例如,在 Donovan 和 Radosevich (1999) 的一项元分析中,随着任务的概念难度从低(如旋转追视)到平均(例如单词列表回忆)再到高(例如拼图),间隔效应的效应量急剧减少。根据这一发现,对于许多数学任务来说,间隔练习的好处可能会变得微不足道。37 (注:旋转追视是用于测试手眼协调和运动技能学习的测试,受试者需要用指示物追踪旋转圆盘上的圆点)
Donovan 的元分析指出,在使用更好方法的研究中,效应量虽然变小,但仍然不容小觑。
-
Bahrick, Harry P; Phelphs, Elizabeth. “Retention of Spanish vocabulary over 8 years”. Journal of Experimental Psychology: Learning, Memory, & Cognition. Vol 13(2) April 1987, 344-349; 这篇研究初始训练之后的间隔特别长,很有意思
Harry Bahrick 和 Elizabeth Phelps (1987) 研究了 50 个西班牙语词汇在 8 年之后的保留情况。受试者被分成三组。每个人练习七到八次,间隔几分钟,1 天或 30 天。在每个环节中,受试者都会进行练习,直到他们可以一次性完美回忆出单词列表…8 年后,无延迟组的人能记住 6% 的单词,延迟 1 天组的人能记住 8% ,30 天组的人平均能记住 15%。每个人都参加了选择题测试,其中再次观察到了间隔效应。无延迟组得分为 71%,一天组得分为 80%,30 天组得分为 83%。
…Bahrick 和他的同事们改变了练习的间隔和练习量。练习环节之间有间隔 14 天、28 天或 56 天的,总共进行 13 或 26 次练习。他们测试了受试者在训练后一年、二年、三年和五年的记忆。有一次观察到,当练习环节间隔较长时,在每个练习环节中达到标准所需的时间稍长一些,但同样,这一小投资在几年后产生了回报。测试是在练习后一年、两年、三年还是五年进行的并不重要——56 天组总是记住最多的,28 天组次之,14 天组记忆最少。而且影响是比较大的。如果每 14 天练习一次单词,你需要的练习次数是每 56 天练习一次时的两倍,才能达到同样的表现水平!
-
Pashler et al, 2003; “Is Temporal Spacing of Tests Helpful Even When It Inflates Error Rates?”
测试之间的长间隔必然意味着你经常会回答错误;有人认为答错就会削弱学习效果。尽管短期内过多的错误的确会降低准确性,但长间隔的力量足以让他们仍然获胜。
-
间隔重复在患病人群中的研究:
-
让阿尔茨海默病患者进行短期复习的研究;间隔时间以秒和分钟为单位,在物体位置教学或日常任务方面取得了一定成功 38:
-
Camp, C. J. (1989). “Facilitation of new learning in Alzheimer’s disease”. In G. C. Gilmore, P. J. Whitehouse, & M. L. Wykle (Eds.), Memory, aging, and dementia (pp. 212-225)
-
Camp, C. J., & McKitrick, L. A. (1992). “Memory interventions in Alzheimer’s-type dementia populations: Methodological and theoretical issues”. In R. L. West & J. D. Sinnott (Eds.), Everyday memory and aging: Current research and methodology (pp. 152-172) -
-
-
针对创伤性脑损伤患者的研究; Goverover et al 2009, “Application of the spacing effect to improve learning and memory for functional tasks in traumatic brain injury: a pilot study”
-
和多发性硬化症患者的研究; Goverover et al 2009, “A functional application of the spacing effect to improve learning and memory in persons with multiple sclerosis”
-
-
数学39:
-
乘法 (Ria & Modigliani 1985)
-
遍历数列排列 (Rohrer & Taylor 2006)on
-
计算多面体体积 (Rohrer & Taylor 2007)
-
初级微积分 (Revak 199740 但也有一篇相关文章说明对微积分 I 无效) 和代数 (Mayfield & Chase 2002, Patac & Patac 2013; 可能没效果, Sutherland 2013)
-
-
医学 (Kerfoot & Brotschi 2009, Shaw et al 2012; Kerfoot 2009, 是 Kerfoot et al 2007 两年后的跟进研究。Kerfoot 有其他一些 相关研究; Gyorki et al 2013) ;在手术方面 (Moulton et al 2006, “Teaching Surgical Skills: What Kind of Practice Makes Perfect? A Randomized, Controlled Trial”, 微血管缝合的间隔重复实践;Spruit et al 2014)
-
心理学导论 (Balch 2006, “Encouraging Distributed Study: A Classroom Experiment on the Spacing Effect”41. Teaching of Psychology, 33, 249-252)
-
8 年级美国历史 (Carpenter, Pashler, and Cepeda 2009)
-
用自然拼读法学习阅读 (Seabrook et al 2005)
-
音乐 (Stambaugh 2009)
-
生物 (中学生物;Kelly&Whatson 2013)
-
统计 (初步内容;Maas 等人于2015年)
-
记忆网站密码 (Bonneau & Schechter 2014, Blocki et al 2014, Blum & Vempala 2017)
-
可能不是澳大利亚宪法 (Colbran et al 2015 年)
间隔效应的通用性
我们已经看到,间隔重复在各种学术领域和媒介上都是有效的。除此之外,间隔效应还在下列领域有效:
-
「跨物种 (例如,老鼠,鸽子和人类[或苍蝇或大黄蜂,和海蛞蝓,Carew et al 1972 & Sutton et al 2002])」
然而,生效的领域是有限的。Cepeda et al 2006:
[Moss 1995,回顾了 120 篇文章]得出的结论是,较长的 ISI 有助于学习言语型信息(例如拼写50)和运动技能(例如镜画实验);在每种情况下,超过 80% 的研究都显示出分散练习有效果。相比之下,只有三分之一的智力技能(例如,数学计算)研究显示分散练习有效果,一半的研究显示分散练习没有效果。(注:镜画实验是指实验时,被试注视平面镜内的图形。用描绘笔学习画下画板上的图形)
…[Donovan 和 Radosevich (1999)] 低严格性研究中的低复杂性任务(如旋转追视、打字和翻转钉子)效应量最大,并且保留间隔不影响效应量。Donovan 和 Radosevich 只研究了 ISI 和任务领域之间的互相影响。值得注意的是,任务领域降低了分散练习的效果;根据任务领域和间隔的不同,ISI 的增加要么增加了效应量,要么降低了效应量。总体而言,Donovan 和 Radosevich 发现,间隔更长的分散练习在自由回忆、外语和言语辨别等言语型任务中产生的效应量更大,但这些任务也显示出反 U 函数,即非常长的间隔产生的效应量较小。相比之下,打字、体操和音乐表演等技能型任务中,递增间隔的效应量较小。
从体操和音乐表演等技能可以看出,测试效应和间隔重复有一个重要特点:两者只能维持记忆强度或技能水平的现状,而无法令其进一步提升。如果有人开始复习时是有小有水准的业余爱好者,那么复习之后,他仍然只是小有水准的业余爱好者。Ericsson 介绍了「提升」和精进所专所必需的概念:刻意练习51。摘自「刻意练习的作用」:
有种观点认为,只要进行足够练习——无论练习形式如何——便能得到上佳表现。这个观点由来已久,也争议颇多。Bryan 和 Harter 在一系列针对摩尔斯电码操作员的经典研究(1897, 1899) 中,注意到技能习得存在平台期,也就是技能练习者很长一段时间内似乎无法进一步提升。然而,长久努力之后,练习者将能重组其技能,跨越平台期……面对继续精进的需求,即使是极富经验的摩尔斯电码操作员,经由刻意练习也能备受鼓舞,大幅提升其表现。对于更一般的领域, Thorndike (1921) 观察到很多成年人即使常常执行一些任务,他们在这些任务上的表现远称不上个人最佳水平。比如,一些成年人明明能把字写得又快又清楚,他们平常却没有这个水准。……对于[优化学习和提高成绩],有一个前提条件广为提及,也就是练习者须有动机执行此项任务……练习者需能当即获知详尽反馈,以及练习结果……缺乏足够反馈,高效学习无从谈起。即便练习者干劲十足,进步也微乎其微,尤其是准确性上……与游戏相比,刻意练习 是高度结构化的,其目标明确,就是提升表现。刻意练习中会制定具体的任务来克服缺点,并会仔细监控表现,来找出进一步提升的线索。我们认为刻意练习需要投入努力,其本质不是令人愉快的。
运动技能
应该指出的是,关于间隔重复多大程度上适用于运动技能,不少综述相互矛盾;Lee & Genovese 1988 认为有好处,而 Adams 1987 和更早的综述相反。区别可能在于,Shea & Morgan 1979 显示了(随机/间隔安排计划有益于)简单的运动任务,而 Wulf & Shea 2002 显示复杂的任务,即受试者已经在他的极限下操作的任务,则没有受益。Stambaugh 2009 提到了一些不同的研究:
情景干扰假说(Shea 和 Morgan 1979,Battig 1966 [技能的习得中的「促进和干扰」])预测阻塞条件将在练习(习得)后立即展现出更好的表现,但随机条件在延迟保留率测试中表现更好。这一假设在实验室运动学习研究中基本一致(如 Lee & Magill 1983, Brady 2004),但在运动技能的应用研究方面不太一致(结果好坏都有,如 Landin & Hebert 1997, Hall et al 1994, Regal 2013)和精细运动技能(Ollis et al 2005, Ste-Marie et al 2004)。
一些支持间隔重复的研究(摘自 Son & Simon 2012):
可能甚至在认知研究和间隔效应的实证工作之前,间隔学习的好处已经在一系列运动学习任务中显现出来,包括迷宫学习(Culler 1912 )、打字(Pyle 1915 )、射箭(Lashley 1915 )和投掷标枪(Murphy 1916 );(见 Ruch 1928 对从间隔学习中获益的运动学习任务进行了更广泛的回顾;也见 Moss 1996 关于运动学习任务的最新综述)。因此,与认知文献一样,运动领域的分散练习研究早已确立(见 Adams 1987 综述;Schmidt & Lee 2005 综述),大多数兴趣都集中在改变运动技能的学习试验的间隔对学习和练习技能的保留率的影响。Lee & Genovese 1988 对有关分散练习的研究进行了综述和元分析,他们得出的结论是,大量练习往往会抑制即时表现和学习,而学习是在练习环节之后的某个时间段内被评估的。他们的主要发现是,和认知文献一样,间隔练习后的学习比集中练习后的学习相对更强(但这里也有些批评:见 Ammons 1988 ;Christina & Shea 1988 ;Newell et al. 1988)......最广泛引用的例子可能是 Baddeley & Longman 1978 关于如何最佳地教邮递员打字的研究。他们让学习者每天练习一次或两次,每次练习的时间长度为 1 或 2 小时。研究的主要结果是,当学习者处于最分散的练习状态时,他们用最少的累计练习时间就能达到打字的表现标准。这一发现为间隔练习对加强学习的好处提供了明确的证据。然而,正如人们所指出的(Newell et al. 1988;Lee & Wishart 2005),还需要考虑的是,从开始练习到达到标准的总时间(天数)在最分散的条件下要长很多....同样的基本结果在此后的几十年里被反复证明(见 Magill & Hall 1990 综述;Lee & Simon 2004),并且在各种各样的运动任务中,包括不同的羽毛球发球(Goode & Magill 1986年),步枪射击(Boyce & Del Rey 1990),预先建立的技能,棒球击球(Hall et al. 1994),学习不同的逻辑门配置(Carlson et al. 1989; Carlson & Yaure 1990),自动取款机的新用户学习(Jamieson & Rogers 2000),以及解决课堂作业中可能出现的数学问题(Rohrer & Taylor 2007; Le Blanc & Simon 2008; Taylor & Rohrer 2010)。
- Culler, E. A. (1912). “The effect of distribution of practice upon learning”. Journal of Philosophical Psychology, 9, 580-583
- Pyle, W. H. (1915). “Concentrated versus distributed practice”
- Lashley 1915, “The acquisition of skill in archery”
- Murphy, H. H. (1916). “Distributions of practice periods in learning”. Journal of Educational Psychology, 7, 150-162
- Schmidt, R. A., & Lee, T. D. (2005). Motor control and learning: A behavioral emphasis (4th ed.). Urbana-Champaign: Human Kinetics
- Lee, T. D., & Genovese, E. D. (1988). “Distribution of practice in motor skill acquisition: Learning and performance effects reconsidered”. Research Quarterly for Exercise and Sport, 59, 277-287
- Ammons, R. B. (1988). “Distribution of practice in motor skill acquisition: A few questions and comments”. Research Quarterly for Exercise and Sport, 59, 288-290
- Christina, R. W., & Shea, J. B. (1988). “The limitations of generalization based on restricted information”. Research Quarterly for Exercise and Sport, 59, 291-297
- Newell, K. M., Antoniou, A., & Carlton, L. G. (1988). “Massed and distributed practice effects: Phenomena in search of a theory?” Research Quarterly for Exercise and Sport, 59, 308-313
- Lee, T. D., & Wishart, L. R. (2005). “Motor learning conundrums (and possible solutions)”
- Lee, T. D., & Simon, D. A. (2004). “Contextual interference”
- Goode, S., & Magill, R. A. (1986). “Contextual interference effects in learning three badminton serves”. Research Quarterly for Exercise and Sport, 57, 308-314
- Boyce, B. A., & Del Rey, P. (1990). “Designing applied research in a naturalistic setting using a contextual interference paradigm”. Journal of Human Movement Studies, 18, 189-200
- Hall et al 1994, “Contextual interference effects with skilled baseball players”
- Carlson, R. A., & Yaure, R. G. (1990). “Practice schedules and the use of component skills in problem solving”
- Carlson, R. A., Sullivan, M. A., & Schneider, W. (1989). “Practice and working memory effects in building procedural skill”
- Jamieson, B. A., & Rogers, W. A. (2000). “Age-related effects of blocked and random practice schedules on learning a new technology”
- Le Blanc, K. & Simon, D. A. (2008). “Mixed practice enhances retention and JOL accuracy for mathematical skills”. Poster presented at the 2008 annual meeting of the Psychonomic Society, Chicago, IL
- Wymbs et al 2016, “Motor Skills Are Strengthened through Reconsolidation”
- Dayan & Cohen 2011, “Neuroplasticity subserving motor skill learning”
- Landin et al 1993, “The Effects of Variable Practice on the Performance of a Basketball Skill”
在这一点上,有趣的是注意到交错可能对有心理成分的任务也有帮助:根据 Hatala et al 2003,Helsdingen et al 2011,Huang et al 2013,XBOX*光环:Reach*视频游戏玩家在技能比赛中的进步率从分布中很好地预测了:每周玩 4-8 场比赛的玩家,在每场比赛的技能进步,高于玩更多(分散)的玩家 ;但每周的进步速度低于打更多(集中)的比赛的玩家 。(另见 Stafford & Haasnoot 2016.)
总结
另一个可能的反对意见52是,间隔重复从本质上阻碍了各种抽象学习和思考,因为相关的材料没有放在一起回顾——从而能比较、推理——而是分散到几天或几个月的间隔。Ernst A.Rothkopf 说:「间隔是回忆的朋友,却是归纳的敌人」(Kornell & Bjork, 2008, p. 585)。根据一些早期的研究53,这似乎是合理的,但我知道的最近的 4 个研究都直接检验了这个问题,这些研究都发现间隔重复有助于抽象和一般回忆:
-
Kornell & Bjork 2008a, “Learning concepts and categories: Is spacing the ‘enemy of induction’?” Psychological Science, 19, 585-592
-
Vlach, H. A., Sandhofer, C. M., & Kornell, N. (2008). “The spacing effect in children’s memory and category induction”. Cognition, 109, 163-167
-
Kenney 2009. “The Spacing Effect in Inductive Learning”
-
Kornell, N., Castel, A. D., Eich, T. S., & Bjork, R. A. (2010). “Spacing as the friend of both memory and induction in younger and older adults”. Psychology and Aging, 25, 498-503
-
Vlach & Sandhofer 2012, “Distributing Learning Over Time: The Spacing Effect in Children’s Acquisition and Generalization of Science Concepts”, Child Development
-
Zulkiply 2012, “The spacing effect in inductive learning”; 其中包括:
-
Kornell & Bjork 2008 研究的复现
-
Zulkiply et al 2011
-
Zulkiply & Burt 2012, “The exemplar interleaving effect in inductive learning: Moderation by the difficulty of category discriminations”
-
目前在同行评议中不出名的论文
-
-
McDanie et al 2013, “Effects of Spaced versus Massed Training in Function Learning”
-
Verkoeijen & Bouwmeester 2014, “Is spacing really the ‘friend of induction’?”
-
Rohrer et al 2014: 1, 2; Rorher et al 2019: “A randomized controlled trial of interleaved mathematics practice”
-
Vlach et al 2014, “Equal spacing and expanding schedules in children’s categorization and generalization”
-
Gluckman et al, “Spacing Simultaneously Promotes Multiple Forms of Learning in Children’s Science Curriculum”
综述总结
总结要旨就是:
-
测试是有效的,其负面因素也可以忽略
-
递增间隔大致与(长)固定间隔效用上基本相同,甚至更好,但递增更省事,而且是默认设置
-
测试(以及间隔)对于智力性、偏重使用事实与语言的领域非常有效,但在许多低级领域可能仍然有效
-
这项研究偏好那些强制用户尽可能多地调用记忆的问题,现将这些问题按偏好程度降序排列如下:
-
自由回忆
-
简短回答
-
选择题
-
填空题
-
再认
-
-
研究文献很全面了,大多数问题都已经得到了回答——相信你能找到。
-
间隔重复最常见的错误是
-
编写糟糕的问题和答案
-
认为间隔重复有助于学习新知,而非维护保持已学内容54, (很难从卡片学知识,但如果你已经学到知识了,那么设计抽认卡来测试弱点就容易多了)
-
使用
当然不一定就用 SuperMemo;免费的替代方案有很多。我个人喜欢Mnemosyne(主页)因为它是自由软件,而且有Ubuntu Linux的版本,使用简便,有免费的移动端应用,开发已久,非常可靠(我从 2008 年就开始使用它了)。但 SRS 软件 Anki也很受欢迎,它的优势在于功能更丰富、社区更大、更活跃(可能对东亚语言材料支持更好,移动端应用质量更高,不过移动端是专有软件)。
有了软件,那要用它做什么呢?事实上,这个问题出乎意料地难以回答。这就像「空白页面的暴政」(或空白维基);我既然手握这股力量,这力量像机械魔像一样永不遗忘,又能随我心意让我记住一切——那我要记住什么呢?
添加多少卡片
虽说一心坚持以待功效显现已属不易,但难关还是在于决定什么知识足够有价值,需要制卡。做了一张卡片之后,在 3 年的时间里,复习这张卡片大约总共需要「30~40 秒」。理论上估计长期的复习耗时则有些繁杂。考虑一张问答卡片,每日卡片所需时间的公式为 Time = 1⁄500 × nthYear−1.5 + 1⁄30000。到了第 20 年,每天花费的时间就是 t = 1⁄500 × 20−1.5 + 1⁄3000 分钟,或者 3.557e-4
分钟。这是每天平均花费的时间,所以要想计算年均时间就将其乘以 365。假设我们想知道一张卡片在 20 年内需要多少复习时间。每日卡片所需时间每年都会变(记住,复习实践的图线类似指数衰减),所以对于每一年都要运算一次公式,之后求和;用 Haskell 语言写就是:
sum $ map (\year -> ((1/500 * year**(-(1.5))) + 1/30000) * 365.25) [1..20]
// 1.8291
总共是 1.8 分钟。(看起来数很小,但用户第一年花在复习上的时间就很少,而且用户复习时间下降得很快55)比如根据一位 Anki 用户 muflax 的统计数据,他的平均每张卡片复习时间为 71 秒。但假设 Piotr Wozniak 估计得太乐观了,或者我们不善于编写抽认卡,所以干脆把这个数字翻倍为 5 分钟。这是个关键的经验法则,可以用于决定什么知识要学,什么知识可以忘:如果纵观你的一生,某个知识点会让你花超过 5 分钟去查询,或者不知道这个知识点会让你损失 5 分钟,那么用间隔重复来记忆它就是值得的。5 分钟就是琐碎知识和有用知识的分界线。56(也许有几千张抽认卡满足这个 5 分钟规则。没关系。间隔重复能处理成千上万张卡片。参见下一章节。)
在较小程度上,可能有人好奇,着急的时候,应该间隔学习和集中学习一起用吗?目标考试或者截止日期多近的时候就不能用间隔重复了?这很难比较,因为要找到这个临界点,需要详细的指标进行比较,但对于集中重复,记忆后有 50% 机会记住所记忆的知识的平均时间似乎是 3 至 5 天。57,因为在这段时间里会有 2 到 3 次重复,想必一个人在回忆一个知识时会比 50% 做得更好。5 分钟和 5 天似乎是一条很好记住的经验法则:「如果你在 5 天内就需要知识,或者知识价值低于 5 分钟,就不要使用间隔重复。」
超负荷
间隔重复新手常常会添加太多内容——比如很琐碎的,或者他们完全不关注的内容。但他们很快就会遇到博尔赫斯之作《博闻强记的富内斯》中的诅咒了。如果不是真心想学习软件中的材料,他们很快就会停止每天复习——因此复习会越积越多,更加令人沮丧,所以他们就干脆放弃。起码通过锻炼改善身体健康时,没有什么数字会精确而糟心地说明你落后了多少,而且从这项技术中似乎看不到收益——看起来就像无聊的抽认卡复习。
添加什么
Mnemosyne 的经典用法是记忆一些学术知识,比如地理、元素周期表、外语词汇、圣经或古兰经中的韵文、或者是浩瀚无边的医学知识。但我发现,除此之外,Mnemosyne 也很适合记忆每日一词58和[维基词典]((https://en.wikipedia.org/wiki/Wiktionary)中的词,值得记忆的名言59,生日等个人信息(或者车牌号,我以前老是记不住)之类。这些用法都很平常,但对我来说很有价值。卡片丰富多样,我每天复习时也饶有趣味。我的 Mnemosyne 里有各式各样的问题——我一会判断一段 Haskell 代码语法是否正确,一会拼读韩国谚文,然后听答案录音,一会在地图上试图找出乌克兰,一会欣赏 A.E. Housman 的某篇诗,之后又读 LessWrong 名言帖子中的名言,如此种种。其他人的用途又有百般不同;有用来是记忆学生的名字和脸的(三个例子 1 2 3),简单而实用,令我印象深刻,当然学习音符的用法也不错。
工作量
平均而言,当我学习新主题时,我每天会增加 3-20 个问题。结合我个人的记忆水平,我通常每天复习大约 90 或 100 张卡片(卡片总数超过 18,300)。复习只需要不到 20 分钟,还可以接受。(我预计实际上复习时间会更长一些,因为刚一开始学习新话题时,我还在发展卡片格式化方针,而且我也没有完备的分类系统,当然现在看我已经设计好系统了——所以我时不时就要停下来编辑卡片分类)
如果我最近没学什么新东西,复习数量会按指数方程下降,所以每日复习数量会缓缓减少。比如在 2011 年 3 月,我没学什么东西,所以从 2011-03-24 到 2011-03-26 这段时间,每日安排给我的复习数量为 73, 83, 74; 之后,复习数大约就下探到 60 多,然后再过一两周,大概下降到 50 多,这样一直到复习数变动平稳,抵达最低值,每年慢慢缩减。(我不知道这个最低是多少,因为我不添加新卡片的时间都不长)。到了 2012 年 2 月,每日复习数量是 40 多张,有时候是 50 多张,但总体上复习量还在缩减。复习量下降是真实可感的,甚至可以与原始的遗忘曲线做类比,只要让 Mnemosyne 2.0 用明年每天复习的卡片数量作图即可,即直到 2013 年 2 月(假设不添加新卡片,每天都复习等):
每天预测的卡片数量变化很大,但明显在减少
如果 Mnemosyne 不使用间隔重复,想要不落下这 18,300 张抽认卡的进度,非常困难。但 Mnemosyne 使用了间隔重复,跟上进度就简单多了。
18.3k 的卡片量也不至于大跌眼镜。许多用户都有一些牌组,其卡片数都在六千到七千左右,Mnemosyne 开发者 Peter Bienstman 的卡片超过八千五百张,Patrick Kenny 超过两万七千张,Hugh Chen 有个牌组有超过七万三千张卡片,在 #anki IRC 频道中,有人告诉我一个用户的牌组包含超过 20 万张卡片,以至于触发了 bug。 20 万张可能有点多,但对于正常人来说,比这少一些的卡片也是有可能的——将 SRS 牌组与一些记忆壮举比较很有趣,如记忆《失乐园》,或者记住约 80000 字的《古兰经》穆斯林 ‘hafiz’ ,或者更严格的 ’Hafid‘,背诵《古兰经》和 100,000 条圣训的人。其他形式的记忆则更为强大。60(我怀疑间隔重复在少数有充分证据证明的「超忆症」案例中涉及到了,Jill Price:阅读 《连线》,她对于未加准备的内容的记忆力与常人无异,同样容易遗忘,并没有可观测的解剖学差异。她的超忆症仅限于记忆「她的个人历史和某些类别,如电视和飞机失事」;此外,她是一个有强迫症特征的收集狂,记录了超过 5 万页的详细日记,这可能归咎于童年创伤,以及她将日常事件与过去事件不自主地关联起来的倾向。Marcus 说,其他超忆症的例子与 Price 相似。)
何时复习
应该在什么时候复习呢?早上?晚上?随便什么时候?证实间隔效应存在的研究没有控制复习时机这个变量,所以从某种意义上说,答:复习时机无关紧要——如果什么时候复习确实重要,那么研究中受试者复习的时机不同,间隔效应的效果也应该有显著差异。
所以什么时候方便就什么时候复习。这种便捷性让人更容易坚持,而锲而不舍比任何短期的提升远胜百倍。
要是对这个答案不满意,那么一般来说,复习应该在睡前进行。这与记忆巩固有关,已知睡眠对记忆转换成长期记忆有重要影响,而且睡眠对于睡前一段时间学习的材料强化其记忆,并且能提升创造力:有实验表明,如果老鼠的睡眠遭到打断,即使总体睡眠时间或睡眠质量保持一定,老鼠的记忆形成也受到阻碍 61。所以睡前复习值得推荐。(其他精神活动若是在睡前进行也有所提升;比如说,dual n-back)。 睡眠改善记忆的的一种可能机制,是睡前复习提升了未来需要复习或者测试的期望,因而睡眠中就会促进记忆巩固;由此观之,如果复习后立即睡觉,期望会大于选择早餐时复习,之后一天经历了许多事情,都忘了复习过卡片这回事的情形。(参见 Hartwig & Dunlosky 2012 对于学习时机和 GPA 的关系的研究)神经元增长也可能有关;来自 Stahl 2010 :
我们对正常人类记忆形成的神经生物学取得了新进展,表明学习不是单一的事件,而是一个过程,随着时间慢慢推进。16,17,18,[Squire 2003 Fundamental Neuroscience],20 因此,随着时间的推移重复学习的学习策略能够提高学生的记忆力就不足为奇了。20,21,22,23,24,25,26
…每天都有数以千计的新细胞在这个区域产生,尽管其中许多细胞在产生后的几周内就会死亡。31有证据表明齿状回神经元的存活率在动物学习时有所加强。学习效果好的动物比学习效果差的动物保有更多的齿状回神经元。此外,在测试 2 周后,动物在一段时间内以离散的间隔时间进行训练,记忆效果优于将同样信息一次性回顾,或者叫「集中训练」。目前尚未确定具体上何种机制将神经元存活与学习联系起来。一种理论认为,优先存活的海马神经元是那些在学习过程中以某种方式被激活的神经元。16-2062 在一段时间内分散学习或能更有效地促进神经元存活,因为由此一来,改变基因表达和蛋白质合成的时间加长了,而这些过程能够提升参与学习过程的神经元的寿命。
…编码阶段是在警觉的清醒状态下展开的,而为了记忆由编码阶段转移到巩固阶段,必须减小此时对记忆形成的干扰。17,18 适合这种转移的一种时段是睡眠期间,特别是非快速眼动睡眠期间,此时海马体可以与其他大脑区域交流而不受新经验的干扰。32,33,34 也许这可以解释为什么在一夜休息后会做一些决定更好,也为什么睡眠不足的情况下通宵学习,可能让你在一个小时后通过考试,但一天后却记不住材料。
前景:抽认卡拓展
现在暂且抽身片刻。我们所有大大小小的抽认卡,究竟在帮我们干什么?为什么要为「anent」这个单词以及许许多多其他单词制作抽认卡对呢?我只把词查一下也行啊。
但相比于把知识熟记在心,临时查询知识更耗时。(先忽略之前讨论的 5 分钟规则)把这件事放在计算机科学的情景中抽象地考虑便会发现,记忆还是查询的问题,涉及算法和优化领域中的经典概念——时空权衡. 我们所权衡的是查找时间和有限的脑容量。
考虑一下已经给出的那种事实数据作为例子——我们可能在哪天需要知道檀香山或奥斯汀的年平均降雨量,但要记住所有首都的年平均降雨量则需要太多空间。英语单词有数百万个,但实际上超过 10 万个就太多了。更令人惊讶的是程序性知识。计算机中时空权衡的一种极端形式是用预先计算的常数代替计算。取一个数学函数,并为每个可能的输入计算它的输出。这样的输入到输出的查找表通常都非常大。想想看,对于介于 1 和 10 亿之间的所有可能的整数乘法,这样的表中会有多少个卡片。但有时查找表的规模非常小(如二进制布尔函数),或者比较小(如三角函数表),或者大但还能用上(彩虹表通常从 GB 开始,很容易达到 TB)。
给定无限大的查找表,查表便可以「完全」取代加法或乘法的技能。无需计算。此时时空权衡达到了空间一侧的极端。(为达到时间一侧的极端,只要把乘法或加法定义为不知道任何计算细节的缓慢计算,如乘法表——类似于每次想要计算 2+2 时,必须掰 4 根手指。)
假设我们是想学乘法的小孩。乘法不是一条具体的原子事实,所以 SRS 和 Mnemosyne 就派不上用场了,这么说对吗?其实,从空间与时间的取舍来看,我们可以解构乘法的步骤性,而将其部分分解成原子事实,我们很容易写出脚本或者宏,以来生成随机卡片(比如说 500 张),要求计算 AB 乘以 XY 的值,并将其导入 Mnemosyne. 63
不过,你想要做什么?是更善于计算两数相乘(两个数根据需要生成),还是记住 500 个不同的乘法问题(记忆化)?根据我自己的经验,若有多张卡片仅有微小差异,大脑很快就放弃死记硬背,而对于每张卡片单独解决问题——此时这也正是我们想要练习的。恭喜;你实现了不可能之事。
从软件工程的角度看,修改或改进卡片的需求总是会有的,而 500 段用于练习乘法的纯文本卡片颇有些难更新。所以「动态卡片」的概念就横空出世了。要在 Mnemosyne 中实现,可能是增加新的 HTML 标记,比如<eval src="">
,让 Mnemosyne 把 src 参数输入 Python 解释器,并等待解释器将问题文本和答案文本包在元组里返回。之后像普通卡片一样展示问题文本,待用户思考一番,并查看答案,给作答评分。Anki 中则支持使用 Javascript, 只要在 HTML 中加入 <script>
标签即可(目前只能在卡片模板直接嵌入,但也许能默认导入一些 Javascript 库),这样便能实现语法高亮,从而随心所欲地创作动态卡。
因此,对于乘法,动态卡将生成 2 个随机整数,输出类似于 x * y = ?
的问题,然后输出结果作为答案。每隔一段时间,你就会遇到新的乘法问题,随着你越来越擅长乘法计算,乘法问题出现得越少——这也是应当的。另一个数学方面的想法是生成公式或程序的多个变体(其中一个选项正确,其他选项则有隐秘的错误)(译者注:即多选);我对我的编程抽认卡是手动实现了这一点的(特别在我做练习时出错的情况,这个错误意味着有个细节需要我做几张抽认卡),但生成变体完全可以自动化。kpreid 描述了他的一个工具:
我已经编写了一个程序(是网页的形式),这个程序会生成「破损公式」,属于特化的动态卡。程序中有公式的生成器以及破损公式,运行时每次展示一些同类公式(比如∫ 2x dx = x^2 + C),但其中一个公式是破损的(比如∫ 2x dx = 2x^2 + C)。
此方法适用于可以生成随机问题或拥有大量样例的问题。可汗学院显然实现了类似动态卡的功能,将大量(算法生成的?)问题编入课程的小模块,并跟踪技能的保留情况,以便决定何时对该模块进行进一步复习。比如,你可能正在学习围棋,对学习死活棋很感兴趣。这些都是可以由计算机围棋程序生成的,也可以从像 GoProblems.com 这样的地方获取。对于大量范式,围棋是旋转不变的——无论棋盘朝向如何,好的一着棋都是一样的,由于棋盘没有规定方向(就像国际象棋一样),所以好棋手应该做到无论棋盘如何白发,他都一样擅长——所以每个具体的例子都可以用另外三种方式反映出来。或者可以编写动态卡来测试「阅读」棋盘的能力,只要有像 GNU Go 这样的围棋程序说,最好的一步棋没有因为增加的噪音而改变,动态卡就会拿出每个示例棋盘/问题,并添加一些随机的棋子。
这样学习收获颇丰。编程语言可以这样学习——学习 Haskell 的人可以对 Prelude 模块或 Haskell 教科书中的所有函数,使用 QuickCheck 为这些函数生成随机参数,并将该函数及其参数输入 GHC 解释器 ghci
,看看结果是什么。围棋以外的其他游戏,如国际象棋,可能会奏效(一个现实中的例子是 Chess Tempo & LiStudy,还有查看 Dan Schmidt 的例子;或 Smash Brothers)。相当多的数学知识。如果动态卡可以访问互联网,它可以从RSS 源或只是一个网站拉下新的问题;此功能在外语学习环境中非常有用,每天都会带来一个新的句子要翻译或另一个练习。
可以借助 NLP 软件来编写动态抽认卡,这些卡能测试各种知识:如果有人混淆了动词,便在程序中输入制卡模板,如 “$PRONOUN $VERB $PARTICLE $OBJECT % {right: caresse, wrong: caresses}” ,这个模板会产生诸如 “Je Caresses le chat” 或 “Tu caresse le chat” 之类的抽认卡,测试时判断变位是否正确即可。(其中卡片的动态性有助于避免记住了特定的句子而不是变位)实现通用性极强的动态卡可能会很困难,但像模板这样的简单方法或许够用了。Jack Kinsella:
我希望有动态的 SRS 牌组可供学习语言(或其他学科)。这种牌组会统计用户复习了多少句应用了特定语法规则的句子,或者某个词汇的形式,例如词汇的单数/复数/第三人称变化/与格形式。动态 SRS 牌组会在每次复习时给用户呈现新鲜例句,避免用户记住特定答案,而促使用户应用语法规则,真正重温这个过程。此外,这些牌组能带来新意,用户也不致厌倦;变换例句中不紧要的词汇,牌组还可以提供潜移默化的词汇学习机会。这样的系统具有多层次的复习轮换,不仅可以防止过拟合学习,还可以增加每分钟学习的知识总量,这样的效率值得我投入其中。
即使这些东西看起来像是「技能」而不是「数据」!
流行度
截至 2011-05-02:
| 指标 | Mnemosyne | Mnemododo | Anki | iSRS | AnyMemo |
| :--------------: | :----------------------------------------------------------- | :----------------------------------------------------------- | :----------------------------------------------------------- | :------------------------------------------------------: | :----------------------------------------------------------: |
| 首页 Alexa 排名 | 383k | 27.5m | 112k | | 1,766k64 |
| ML/论坛成员 | 461 | | 4129/215 | 129 | |
| Debian 安装量 | 164 | | 364 | | |
| iPhone 评分 | 未发布65 | | 193 | 69 | |
| 安卓安装量 | | 100-500 | 10-50k | | 50-100k |
SuperMemo 不适用这些评分,但在软件发布的 20 年里,SuperMemo 已经售出了数十万份:
Biedalak 是 SuperMemo World 的 CEO, 该公司销售并授权沃兹尼亚克的发明。现在,SuperMemo World 只雇佣了 25 名员工。风险投资并没有青睐,公司也没有搬到加州。2006 年,SuperMemo 的销量约为 50,000 份,多数售价不到 41 美元(共计 302006 美元)。盗版估计有更多。66
似乎可以放心地估计,Anki、Mnemosyne、iSRS 和其他 SRS 应用程序的市场份额加起来不到 5 万名用户(考虑到多次安装的用户、安装并放弃它的用户等可能有一些出入)。很少用户从 SuperMemo 迁移到那些新程序上,所以简单地将两个五万相加,便能合理地得出结论,SRS 的全球用户量大约在 10 万左右(但可能在 10 万以下)。
我该何去何从?
无所归依,说真的。Mnemosyne/SR 等软件只是我最喜欢的工具之一:它基于科学发现的著名效应67,并优雅地利用这个效应68,而且很有用处。SR 软件践行了启蒙运动的理想,即以理性改善人性,克服人类缺陷;SR 的思想具有数学上的严谨性,因而极富诱惑力69。环视当下,「自我改善」共日新月异受人嘲弄,阴郁消沉纷引常人拥趸,日常生活之中,仍有此例,以证仍有拾级而上之人,实在可喜。此例比起爱迪生反反复复研发灯泡,尚显新奇有趣。
另见…
在使用 Mnemosyne 的过程中,我编写了许多脚本来生成有规律的卡片。
-mnemo.hs
输入任何用换行符分隔的文本(比如诗),并生成所有可能的挖空;即,一首诗有 ABC 三句,于是生成 3 个问题:BC/ABC,A_C/ABC,AB/ABC
-
mnemo2.hs
和上面原理大体相同,但限制更多,主要针对较长文本,这种文本用mnemo.hs
处理后,由于排列组合会生成太多问题;mnemo2.hs
会生成一小部分问题:对于 ABCD,生成 CD/ABCD、A__D/ABCD 和 AB/ABCD (把 2 行挖空,这样循环往复直到文本列表末尾)。 -
mnemo3.hs
适用于生成针对日期或名称的问题。输入「巴拉克·奥巴马 %47% 岁」 ,提出问题:「巴拉克·奥巴马 7/47岁」,「巴拉克·奥巴马 4/47 岁」等等。
-mnemo4.hs
适用于长列表。如果你想记住美国总统的名单,自然会写出这样问题:「谁是第三任总统?/托马斯·杰斐逊」,「托马斯·杰斐逊是第__任总统。/3」,「约翰·亚当斯之后是谁?/托马斯·杰斐逊」,「詹姆斯·麦迪逊之前是谁?/托马斯·杰斐逊」。
注意,如果对每个总统都这样生成卡片,也就是有卡片正反两个角度提问总统在列表中的位置(总统 -> 位置,位置 -> 总统),也有卡片问之前的总统,之后的总统,注定会有重复的信息。mnemo4.hs
拿到列表后,是自动生成卡片的。为了更加通用,措辞会有些奇怪,但是比全部手打要强多了!(源代码的[注释](https://en.wikipedia.org/wiki/Comment_(computer_programming)里有样例输出)
现在读者可能会很好奇我的 Mnemosyne 数据库是什么样子的。我经常使用 Mnemosyne,截至 2020-02-02,我的牌组中有 16,149 张(活跃)卡片。好奇的读者可以在 gwern.cards
(52M; Mnemosyne 2.x 格式) 上找到我的卡片和媒体。
多年来,Mnemosyne 项目一直在收集用户提交的间隔重复统计数据。截至 2014-01-27 的完整数据集可供任何想要分析它的人下载。
外部链接
-
Michael Nielsen: “Augmenting Long-term Memory”; “Using spaced repetition systems to see through a piece of mathematics”; “Quantum computing for the very curious”; “How can we develop transformative tools for thought?”
-
“Teaching linear algebra” (with spaced repetition), by Ben Tilly
-
“A Year of Spaced Repetition Software in the Classroom”; two years; seven year followup; cf “Easy Application of Spaced Practice in the Classroom”
-
AJATT table of contents -(使用 SRS 学习日语)
-
用于编程的 SRS:
-
“Janki Method: Using spaced repetition systems to learn and retain technical knowledge” (Reddit discussion); SRS problems & solutions
-
“Memorizing a programming language using spaced repetition software” (Derek Sivers; Hacker News)
-
“Chasing 10X: Leveraging A Poor Memory In Engineering”; “Everything I Know: Strategies, Tips, and Tricks for Anki”
-
“Remembering R—Using Spaced Repetition to finally write code fluently”
-
“QS Primer: Spaced Repetition and Learning” -(talks on applications of spaced repetition)
-
与课程相比判断其价值:
-
支持课程: “Why Forgetting Can Be Good”, by Scott H. Young
-
反对课程: “Spaced repetition in natural and artificial learning”, Ryan Muller 作
我自己的观察是,设计优良的课程可以有效地实现间隔重复,但即使课程能实现这点(大多数都没有),如果它没有计算机化,这样的课程无法适应用户个人情况。
-
-
Bash 脚本 可用于生成单词抽认卡(能处理多个网上词典,能添加多条例句;图片和音频也可添加)
-
词汇选择:
-
“Diff revision: diff-based revision of text notes, using spaced repetition”
-
“A vote against spaced repetition”; “How Flashcards Fail: Confessions of a Tired Memory Guy”
-
“Learning Ancient Egyptian in an Hour Per Week with Beeminder”
-
SeRiouS: “Spaced Repetition Technology for Legal Education”, “SeRiouS: an LPTI-supported Project to Improve Students’ Learning and Bar Performance”, Gabe Teninbaum (video presentation)
-
“The role of digital flashcards in legal education: theory and potential”, Colbran et al 2014
-
[“Why We Should Memorize Poetry]”
-
“Making Summer Count: How Summer Programs Can Boost Children’s Learning”, McCombs et al 2011 (RAND MG1120)
-
“Factors that Influence Skill Decay And Retention: a Quantitative Review and Analysis”, Arthur et al 1998
-
“On The Forgetting Of College Academics: At ‘Ebbinghaus speed’?”, Subirana et al 2017
-
“Total recall: the people who never forget; An extremely rare condition may transform our understanding of memory” (obsessive recording & reviewing demonstrates you can recall much of your life if you live nothing worth recalling); “The Mystery of S., the Man with an Impossible Memory: The neuropsychologist Alexander Luria’s case study of Solomon Shereshevsky helped spark a myth about a man who could not forget. But the truth is more complicated”
-
Anki Essentials, Vermeer
-
“No. 126: Four Years of Spaced Repetition” (Gene Dan, actuarial studies)
-
“One Year Anki Update” (biology grad school)
-
“How To Remember Anything Forever-ish”: an interactive comic (Nicky Case)
-
“The Overfitted Brain: Dreams evolved to assist generalization”, Hoel 2020
-
“Relearn Faster and Retain Longer: Along With Practice, Sleep Makes Perfect”, Mazza et al 2016
-
“Replication and Analysis of Ebbinghaus’ Forgetting Curve”, Murre & Dros 2015
-
“Learning from Errors”, Metcalfe 2017
抽认卡资源
-
「 人们不是通过使用计算器学会了计算,但却因此忘记了算术 。」Perlis 1982↩︎
-
列出其他神经辅助工具很难。这是一个有趣的想法,但正如 externalism 的支持者 Andy Clark 所发现的那样,比起明确将神经义肢或大脑的一部分,与任意你喜欢或觉得有用的工具分开来定义;我们更容易感觉到外在论是有意义的。想想铅笔和纸是不是神经义肢:显然,这和刚学写字的孩子不同,他必须在脑海里仔细构思单词,然后一个接一个地写下来,但对于一个一生都在写作的成年人来说,情况就不那么一样,他已经可以不假思索地涂鸦或写下想法,甚至可能会对写下的东西感到惊讶。
我喜欢这个定义:「神经义肢是任何你不需要进一步思考, 就可以快速使用其结果的东西」。所以在一个经典的例子中,当 Otto 需要去什么地方时,他从来不会想「我是一个迷糊到需要将位置记录在笔记本上的健忘症患者,所以我必须查询这个位置」——他会直接去查询位置。如果当它缺失时会使人感到迷失、迟钝、愚蠢或无知,那我就能认为它是一个好的心理捷径(heuristic)。
按照这个标准,我只能想到几个工具,可以使我不假思索地使用他们:
- 快捷键设定,例如窗口管理器的快捷键,特别是谷歌搜索的快捷键;有时,XMonad 窗口管理器的提示符不知为何会卡住。这时候我 必须 重新启动 XMonad,因为我什么都要谷歌搜索,并且按键习惯太过于根深蒂固,用不了快捷键是无法忍受的。就像用不常用的那只手写字一样。
-谷歌日历和 PredictionBook:我将大量"正在做"、"将要做"或"定期做"的任务放入谷歌日历或 PB 中,想来很是难以置信。我已经把很多习惯或想法外包给这两个程序了,对此我习以为常。如果其中任何一个程序消失了,我都会惊恐万分——正在发生事有哪些,哪个观点被证伪,什么机会大门敞开了(或关上!),而我突然一无所知?
- 印象笔记,出于类似的原因;我关于一件事的记忆已经不像是类似「章鱼的视力基准太高了,所以只对高清电视或超高清电视有反应;这一篇文章我在猎户座杂志上读到的」,而是变成了像「章鱼 电视 印象笔记」这样的东西,如果我想知道章鱼和电视是怎么一回事,那么,我必须在印象笔记中查找它。对我来说,Mnemosyne 也扮演着类似的角色,但因为那有间隔重复,记忆本身会更清晰。
-我的网站 Gwern.net;我说过很多次了,有些事如果你当面问我,或许我不能直接说出有关的看法,但我已经写在了我的网站上。(Evernote/Mnemaste 是神经义肢的一种更极端的形式。)一位评论者曾经写道,阅读我的网站 Gwern.net 感觉就像在我的脑海里爬来爬去。这个描述比他意识到的更正确。
-
如 “Retrieval practice and the maintenance of knowledge”, Bjork 1988 中引用的↩︎
-
来自 “Close the Book. Recall. Write It Down: That old study method still works, researchers say. So why don’t professors preach it?”; The Chronicle of Higher Education
两本心理学杂志最近发表的论文表明,这种策略是有效的,这是来自一个数十年的研究的最新发现。当学生自学时,「主动回忆」——例如,背诵、抽认卡和其他自测——是将某件事铭刻在长期记忆中最有效的方式。然而,许多大学教师对这项研究只略知一二…
来自 “The Spacing Effect: A Case Study in the Failure to Apply the Results of Psychological Research” (Dempster 1988), whose title alone summarizes the situation (see also Kelley 2007, Making Minds: What’s Wrong with Education - and What Should We Do About It?):
第二,它[间距效应]非常稳健。在许多情况下,将材料通过两个间隔呈现大约是两个集中呈现的效率的两倍(例如,Hintzman, 1974;Melton,1970),和它们之间效率的差距随着重复频率的增加而增加(Underwood, 1970)…
早在 1885 年,当艾宾浩斯发表他关于记忆的开创性工作的结果时,间隔效应就已为人所知。以他自己为测试对象,艾宾浩斯发现,对于一个 12 个音节的序列:在立即连续重复学习 68 次后,在第二天额外重复 7 次之后,就有可能实现无误的朗诵。然而,如果我们把这些重复分散在三天内,只需要 38 次重复就能达到同样的效果。在此和其他相关发现的基础上,艾宾浩斯得出结论:“对于任何相当数量的重复,在一段时间内适当地分布它们肯定比在一次集中它们效果更好”(Ebbinghaus, 1885/1913. p. 89)
Son & Simon 2012:
此外,即使大家承认了间隔的好处,改变教学实践也被证明是非常困难的。Delaney 等人(2010)写道:「据传闻,高中教师和大学教授似乎是以线性方式授课,没有重复,并且给出了三到四次割裂的考试。)(第 130 页)。聚焦于数学领域,人们可能会期待一个非常容易回顾和分隔的方案,Rohrer(2009)指出,数学教科书通常以无间隔、非混合的方式呈现主题。甚至在更早的时候,Vash(1989)曾写道:「教育政策制定者非常清楚,[间隔练习]比[集中练习]效果更好。然而,他们不在乎。这样不整洁。因为,它不能让教师在教完一个单元后,迅速掸去手上的灰尘,有一种“好了,这就完成了”的美好感觉。」(第1547页)。
- Rohrer, D. (2009). “The effects of spacing and mixing practice problems”. Journal for Research in Mathematics Education, 40, 4-17
- Vash, C. L. (1989). “The spacing effect: A case study in the failure to apply the results of psychological research”. American Psychologist, 44, 1547 (a comment on Dempster’s article?)
来自 Psychology: An Introduction:
在间隔效应的一个实际演示中,Bahrick, Bahrick, Bahrick, & Bahrick (1993) 表明,如果练习环节的间隔很长,记忆外语词汇的能力就会大大提高。例如,「再培训课程安排在 56 天内间隔 13 次复习的结果与 14 天内间隔 26 次的保留率相当。」换句话说,如果学习课程分散在四倍长的时间段内,受试者可以只花一半的学习时间。
- “Synaptic evidence for the efficacy of spaced learning”, Kramar et al 2012 (“Take your time: Neurobiology sheds light on the superiority of spaced vs. massed learning”):
学习活动有一个基本特征,那便是间隔重复比集中练习更优越。接下来,我们来看看一个出乎我们意料的时间规则,这个规则将在成年大鼠海马体切片中产生长期增益效应(LTP)。如果间隔 1h 或更长时间,使用 θ 短阵快速脉冲刺激(theta burst stimulation,TBS)连续刺激 CA1 区可显著增强先前饱和的长期增益效应,但当使用较短的时间间隔时则不起作用。我们分析 F-肌动蛋白发生增加的突触,以确定哪些突触被增强了,分析表明,用延迟的θ序列(theta trains)来获得的长期增益效应,涉及到让那些「错过了」第一轮刺激的突触也被招入参与进来。单突触谷氨酸敲除实验(通过基因编辑让一个突触失活)证实,在基线条件下,成人的海马体中只有不到一半的突触被激发出可塑性,这表明各个突触之间的内在差异性要求重复呈现信息才能最大化地增强它们之间的连接。最初发生变化的的突触发生局部扩散后,更晚些才发生膜插入事件,这两个事件让我们得以提出,重复应该要有较宽的时间间隔。因此,这里描述的突触机制为学习中知之甚少、无处不在的一个方面提供了一种神经生物学解释。
- 有很多研究表明,主动回忆的效果最好。参考一篇最近的研究成果,“Retrieval Practice Produces More Learning than Elaborative Studying with Concept Mapping”, Karpicke 2011 (covered in Science Daily and the NYT):
教育工作者过于依赖鼓励精细学习的学习活动,而要求学生提取和重构知识的学习活动则较少使用。在这里,我们表明,在有意义的学习中,提取练习比基于概念图的精细学习更有效果。在科学教育的不同领域中提取练习的优势普遍存在。我们是通过测试试题来观察提取练习的优势,需要对这些试题进行评估理解并要求学生进行推理。即使当标准测试涉及创建概念图时,提取练习的优势也会显现出来。我们的发现支持这样一种理论,即提取练习是通过提取这一行为本身的特殊机制而不是通过其精细学习的过程来促进学习。提取练习是促进科学概念学习的有效工具。
来自 “Forget What You Know About Good Study Habits”. New York Times;
认知科学家并不否认死记硬背可以在特定的考试中取得更好的成绩。但是匆忙塞满大脑就像是快速塞满一个低廉的手提箱,大多数学生很快就学会了——它能够将刚塞入的东西保留一段时间,然后几乎所有的东西都掉了出来….当神经行李箱被小心逐步地打包时,它会把里面的东西保留得更久很久。数十项研究发现,今晚学习一小时,周末学习一小时,一周后再学习一次:这种所谓的间隔可以提高长期记忆力,而不需要学生在尽量在一个整体上全面得投入努力或付出更多的注意力。
「遗忘是学习的朋友」,Dr. Kornell 说:「忘记一件事可以让你在下次看到它时有效地重新学习。」
这就是认知科学家将测试/测验本身视为一种强大的学习工具,而不仅仅是能力评估的原因之一。提取想法的过程不像从书架上拿出一本书;它似乎从根本上改变了信息随后存储的方式,使其在未来更为可及。
在罗迪格博士自己的一个实验中,他和现在普渡大学的杰弗里·卡皮克让大学生在很短的学习时间内学习阅读理解测试中的科学类文章。当学生们在背靠背的课程中学习同一材料两次时,之后立即进行测试。他们表现非常好,然后开始忘记这些材料。但是,如果他们只学习了一次文章,并在第二节课上就做一次练习测试。在两天后,甚至一周后的测试中,他们都表现得非常好。
- The Mathematics of Gambling, Thorp 1984, “Section Two: The Wheels”, Chapter 4, pg43-44:
那是 1955 年的春天。我在加州大学洛杉矶分校(UCLA)读完了第二年的物理研究生课程后,便转行去研究数学。我每周上课学习 50 到 60 小时,通常还包含周末的时间。我读过关于学习的心理学知识,以便能够更长时间、更努力地工作。我发现「间隔学习」效果很好:学习一个小时,然后休息至少十分钟(淋浴、用餐、喝茶、跑腿等)。一个星期天下午 3 点左右,我来到合作公寓的餐厅饮茶暂憩。我满脑子都是物理方程式,我的几个好朋友正围坐在一起聊天。
- 来自 Final Jeopardy: Man Vs. Machine and the Quest to Know Everything, by Stephen Baker, pg 214:
他将项目汇总起来,分类别对他进行了测试,评估了他的优势(科学,NFL足球)和劣势(时尚,百老汇演出),然后指导他去准备最可能有回报的比赛。为了修补他知识中的这些漏洞,克雷格使用了一个名为 Anki 的免费在线工具,该工具为数百个研究领域提供电子抽认卡,从日语词汇到欧洲的君主列表。用克雷格的话说,这个项目基于对“遗忘曲线”的心理学研究,帮助人们发现他们知识中的漏洞,并确定他们需要对哪些领域知识进行复习的频率,以将其牢记在心。例如,在遍历世界各国首都的过程中,系统很快就会了解到像克雷格这样的用户了解伦敦、巴黎和罗马,因此它可能会花更多的时间来加强例如哈萨克斯坦的首都。(哈萨克斯坦的首都会是什么?「阿斯塔纳」,克雷格在一瞬间说道。「这里过去是阿拉木图,但他们把它搬了。」)
[Chu:] …《Jeopardy!》是针对普通电视观众的,所以他们不会问那些毫无意义、晦涩难懂的问题…所以我使用了一个叫 Anki 的程序,它使用了一种名为「间隔重复」的方法。它会记录你在哪些方面做得好或不好,并促使你学习你不太掌握的抽认卡,直到你对某一特定学科有了一个基本的知识基础,而我只是为那些特定的东西制作了抽认卡。我记住了世界上所有的首都,并且有了抽认卡,每天都在用,就没那么难了。我记住了美国各州的别名 (在维基百科上有),记住了关于 44 位美国总统的重要基本事实。我真的很关注这些。但还有更多的东西要知道。我了解《Jeopardy!》里有些事情我并不知道。例如,每个人都嘲笑体育——但我也知道,[体育线索]在 Double Jeopardy 和 Final Jeopardy 中出现的可能性最小,而且非常重要。因此,我决定,只要能找到有价值的线索,就不要过分担心,只要认识到不认识就好。以上便是我的准备过程。
-
Alan J. Perlis, “Epigrams in Programming” (1982)↩︎
-
Web developer Persol writes in August 2012:
> 实际上,几个月前我写了一个能实现对这些困难问题进行[间隔重复]的网站。网站上大约有4000名用户已经通过了一个完整的复习环节…正如猜测的那样,问题是我无法让人们养成使用它的习惯。没有即时反馈。每 4000 人中只有不到 20 人能坚持两个复习环节以上…此外,应该至少有 18 个参赛者。这是我[当时制作的](https://www.gwern.net/docs/spaced-repetition/2012-persol-srssitecomparison.pdf)列表。似乎很少有人能成功。大约一个月前,我关闭了这个网站。自由参赛者不计其数,他们没有太大的烦恼。除非你找到一种有效的方式将其“游戏化”,否则我不会建议再开一个这样的网站。
>
>…~ 4000 人完成了一个课程。比 4000 次尝试还多……我只是无法确定哪些用户是随机注册的机器人,哪些用户第一个复习环节都没完成。
>
> - 已尝试次数:很多(但仍不确定)
> - 已完成 1 个复习环节:~4000
> - 已完成 > 1 个环节:~20 [0.5%]
- “Play it Again: The Master Psychopharmacology Program as an Example of Interval Learning in Bite-Sized Portions”, Stahl et al 2010:
> 自从艾宾浩斯以来,大量的研究已经证实了一个朴素而重要的事实:除非以某种方式对新信息进行复习,否则新信息的保留率会迅速下降。这种没有进行重复导致知识遗忘的现象,有一个现代例子是对心肺复苏(CPR)技能的研究。该研究表明,心肺复苏技能在培训后的一年内将被迅速遗忘。截至培训结束后第三年,只有 2.4% 的医生能够成功地进行心肺复苏术。[6](https://www.gwern.net/docs/spaced-repetition/1985-mckenna.pdf)另一项最近对医生进行的研究表明, 参加培训的医生被评为非常好或优秀,他们的平均知识得分从辅导前的 50% 增加到辅导后的 76% 。[7](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2517967/)然而,在 3 至 8 天后,分数的增长只有一半,而且令人难以置信的是,在 55 天,根本没有可测量的、在[统计学上]显著的知识保留率。在后续的关于继续医学教育项目的知识保留的研究中,我们得出 7 个类似的结果。1 [Stahl SM, Davis RL. [*Best Practices for Medical Educators*](https://www.amazon.com/Practices-Medical-Educators-Stephen-Stahl/dp/1422500497/?tag=gwernnet-20). Carlsbad, CA: NEI Press; 2009]
>
>…这可能是因为有指定阅读材料的讲座对老师来说是最容易的。此外,医学的学习很少在听完一节课或第一次阅读新材料后立即进行测试,然后在几天或几周后再次测试,因此这种方法导致的低保留率可能不会被广泛认可。[4](https://www.gwern.net/docs/www/pdfs.semanticscholar.org/191557c35430cc1408868f124af48e4a6c9f80fc.pdf)难怪那些没有启用或加强实践策略的正式医学教育会议对实践和医疗保健结果的影响相对较小。[8](http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.556.6124&rep=rep1&type=pdf),[9](https://www.gwern.net/docs/spaced-repetition/1998-davis.pdf),[10](https://www.gwern.net/docs/spaced-repetition/1995-davis.pdf)
- 关于死记硬背的一项研究表明 “Cramming: A barrier to student success, a way to beat the system or an effective learning strategy?”, Vacha et al 1993,总结:
> 通过检查166名大学生的每周学习日记,来验证填鸭式学习是一种无效的学习策略这种假说。所有学生完成了一份学期末问卷,以调查他们的学习习惯。学生被分为以下几种学习模式:理想、自信、热情或死记硬背。与假设相反,研究结果表明,填鸭式学习是一种有效的方法,在使用课后随笔考试和主要研究论文的课程中最为普遍。填鸭式学习者的成绩与使用其他的学生一样好,甚至更好;学生在大学里呆的时间越长,填鸭式学习的可能性就越大。填鸭式学习者比大多数学生学习的时间更长,并且和其他学生一样对他们的课程感兴趣。
请注意,没有衡量长期保留率的指标,这表明只关心成绩的人是理性选择填鸭式学习的[↩︎](https://www.gwern.net/Spaced-repetition#fnref13)
-
Anki 有它的死记模式以及 Mnemosyne 2.0 有一个填鸭式插件。当 SRS 没有明确的支持时,总是有可能通过人为地降低分数来「玩弄」算法,因此 SR 算法认为您很蠢,需要做大量的复习。↩︎
-
“Examining the examiners: Why are we so bad at assessing students?”, Newstead 2002:
> [Conway, Cohen & Stanhope (1992)](http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.56.6901&rep=rep1&type=pdf)研究了心理学课程中呈现的信息的长期记忆。他们发现,在某些类型的信息,特别是那些与研究方法有关的信息,比其他类型的信息更容易记住。但在后续分析中,他们发现使用的评估类型对记忆有影响。从本质上说,通过持续反馈与评价的材料比通过考试来评价的信息更容易被记住。
- Stahl 2010:
> 例如,简单的复习可以让学习者重新体验所有的材料,但实际上,这样的长期保留率很低。[25](https://pdfs.semanticscholar.org/6698/bf91c9333faa0d333a800254b8063230d4f4.pdf),[26](https://www.gwern.net/docs/www/www.pashler.com/77a5d5b695ed619b5815a3a0b00300eec93ae4ed.html),[35](https://www.gwern.net/docs/spaced-repetition/2006-roediger.pdf)为什么学生要继续学习原始材料?当然,如果别无他选,那么复习是一个必要的手段。另一个答案可能是,重复学习原始材料误判了学生对未来记忆能力的信心,因为他们觉得他们现在明白了,而他们和他们的导师可能没有意识到,许多研究表明,在这种形式的重复之后,延迟测试的保留率很低。
- From Kornell et al 2010:
> 与「集中学习辅助引导」这一假说相反,在间隔条件下,最终测试的表现结果始终如一且相当优越。然而,绝大多数参与者认为集中学习比间隔重复更有效,尽管他们是在参加测试**之后**才做出判断的。
>
> …对自己记忆和认知的判断,即元认知判断,通常基于流畅感(例如,参见 [Benjamin, Bjork, & Schwartz, 1998](http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.118.1497&rep=rep1&type=pdf);[Rhodes & Castel, 2008](https://www.gwern.net/docs/www/castel.bol.ucla.edu/853adb133392924818abd8bc050d526177227570.pdf))。因为在学习过程中,集中学习自然会带来流畅感,并提升短期学习任务的表现,所以学习者经常认为间隔学习比集中学习效果差,即使他们的成绩显示出相反的结论(Baddeley & Longman 1978; Kornell & Bjork, 2008; Simon & Bjork, 2001; Zechmeister & Shaughnessy, 1980)。例如,在 Kornell 和 Bjork(2008)的实验中,平均而言,超过 80% 的参与者认为集中学习的效果等同于或比间隔学习更有效,而只有 15% 的参与者在集中条件下的表现实际上比间隔条件下的更好。
>
> …这种错觉在诱导条件下表现得很明显。然而,与之前的研究相反,在重复学习过程中,参与者对间隔的评分高于对集中的评分(例如,参见 Simon & Bjork, 2001; Zechmeister & Shaughnessy, 1980)。这一结果可能是因为习惯化的过程而发生的:研究一幅画总共花了 6 次演示和 30 秒的时间,可能会变得效率低下,毫无意义。因此,基于流畅度的元认知评分似乎出现了一个转折点:随着流畅度的增加,元认知评分会增加到一定程度,但随着流畅度的不断增加,编码或提取变得过于容易,元认知评分可能会开始下降。
>
>…在他们的研究之前,Kornell 和 Bjork(2008)坚信,这种归纳学习将从集中中受益,但他们的结果显示相反。我们毫不气馁,仍然坚信间隔比归纳学习更有利于重复学习,特别是对于老年人来说,考虑到他们的情景记忆总体下降。目前的结果再次与我们的预期不符。如果我们的直觉是错误的,尽管我们多年来一直在证明和赞扬的间隔效应——包括 Robert A. Bjork 贡献的大约 40 年的价值——普通学生的直觉,肯定也是错误的(正如参与者元认知评级的不准确所表明的那样)。也许,我们是错觉的受害者,认为让学习变得简单就能让学习变得有效,而不是认识到,间隔其实是一种值得的困难([Bjork 1994](https://www.gwern.net/docs/spaced-repetition/1994-bjork.pdf)),它能增强归纳学习以及重复学习,即使年入高龄。
- 来自 Son & Simon 2012:
因此,虽然间隔法也许促进学习,但就学习时间而言,人们认为它效率相对较低。我们之后就会讨论到,这种低效感也许能解释为何间隔重复没有更流行。有趣的是,也是这份研究中(Baddeley & Longman 1978; 另见 Pirolli & Anderson 1985 和 Woodworth & Schlosberg 1954 [Experimental Psychology])有证据表明「徒劳无功」是存在的。也就是每天练习时间超过一定小时数(大约 2 小时),所学没有提升,与通常想法相反。这些结果和上面提到的处理不足理论有关,对于直观理解间隔效应的机理十分重要:单纯就是累了。根据认知心理学方面的文献,这些数据也与过度学习的概念吻合,过度学习就是长时间连续学习在短期内很有益处(甚至感觉很好),这种益处很快就消失了(Rohrer et al. 2005; Rohrer and Taylor 2006)... 比如上文描述过 Baddeley 和 Longman 的研究(1978),其中邮政工作人员有的集中时间练习打字,有的间隔开来练习,之后反馈他们对训练的满意度。结果表明,虽然间隔练习学习效果最好,但也是最不受喜爱的。类似的,Simon & Bjork(2001)发现对于运动技能练习任务,集中练习更受偏好。
>
> - Baddeley, A. D., & Longman, D. J. A. (1978). [“The influence of length and frequency of training session on the rate of learning to type”](https://www.gwern.net/docs/spaced-repetition/1978-baddeley.pdf). Ergonomics, 21, 627-635
> - Pirolli, P., & Anderson, J. R. (1985). [“The role of practice in fact retrieval”](https://www.gwern.net/docs/spaced-repetition/1985-pirolli.pdf)
- “Study strategies of college students: Are self-testing and scheduling related to achievement?”, Hartwig & Dunlosky 2012:
> 以前的研究,如 Kornell 和 Bjork(*Psychonomic Bulletin & Review*, 14:219-224, 2007)以及 Karpicke,Butler 和 Roediger(*Memory*, 17:471-479, 2009)的研究,都调查了大学生对各种学习方法的使用情况,包括自测与重读。这些研究证明,一些学生确实使用了自测(但主要是为了监控记忆)和重读,但研究人员没有评估使用这些方法的个体差异是否与学生的成绩有关。因此,我们调查了 324 名大学生的学习习惯以及他们的大学平均成绩(GPA)。重要的是,这项调查包括关于自测时的题目,学习时间的安排,以及学生常用的或认知研究所推荐的策略清单。自测和重读的使用都与 GPA 呈正相关。学习时间的安排也是一个重要因素:表现不佳的人比表现优异的人更有可能深夜学习;学习的集中(相对于间隔)与总体上使用较少的学习策略有关;所有学生里,尤其是表现不佳的学生,都受到迫在眉睫的截止日期的驱使。因此,自测、重读和学习安排在现实世界的学生成绩中发挥着重要作用。
(另见 [Dunlosky et al 2013](https://www.gwern.net/docs/www/www.indiana.edu/eb039769d64115a2bf4786fe6eb275f9d30f374f.pdf)。)请注意,自测的相关性不包括抽认卡,这一结果令作者和我都感到惊讶。与睡眠的联系很有趣,鉴于更强的记忆形成与在良好的睡眠前学习之间的[假设联系](https://www.gwern.net/Spaced-repetition#when-to-review),如果你在深夜临时抱佛脚,你很难获得良好的睡眠(与较低的成绩相关),但如果你在晚上合理安排时间来突击(及时睡个好觉),你可以更好地形成记忆
另见 [Susser & McCabe 2012](https://www.gwern.net/docs/spaced-repetition/2012-susser.pdf):
> 实验室研究表明,在总体学习时间相同的情况下,通过多次分散地学习材料比通过一次集中学习材料更有利于长期记忆(即**间隔效应**)。当前的研究走出实验室,去调查大学生是否知道间隔学习的优势,他们在自己的学习中使用它的程度,以及哪些因素可能影响间隔学习的使用。一项基于网络的调查结果表明,参与者(*n*=285)意识到间隔研究的好处,并且与现实情况相比,在理想情况下会使用更高水平的间隔。然而,自我报告时使用的间隔是中等水平的,类似于集中和其他几种学习方法,排名远远低于常用的方法,如重读笔记。他们认为,分配学习时间的重要因素包括即将到来的考试的感知难度、要学习的材料数量、考试在课程成绩中的权重,以及材料的价值。此外,元认知自我调节水平和提炼学习法的使用与较高的间隔学习率相关。
- Analytic Culture in the US Intelligence Community: An Ethnographic Study, Johnston 2005, pg89:
> 为了调查教学互动的强度,[Art Graesser 和 Natalie Person 1994](https://www.gwern.net/docs/spaced-repetition/1994-graesser.pdf) 比较了在教室和辅导环境中的提问和回答。他们发现,课堂上的学生群体每小时提出大约 3 个问题,而教室里的任何一个学生每小时都会提出大约 0.11 个问题。相比之下,他们发现,在个别辅导课程中,学生每小时提出 20-30 个问题,并要求他们每小时回答 117-146 个问题。回顾技术型教学中所迸发的互动强度,发现学生的反应水平更加活跃。[J. D. Fletcher, *Technology, the Columbus Effect, and the Third Revolution in Learning*.]
尽管 Graesser & Person 1994 年也发现问题的绝对数量并不一定重要,这表明[边际收益递减](https://en.wikipedia.org/wiki/Diminishing_marginal_returns)或者可能是问题问得不好[↩︎](https://www.gwern.net/Spaced-repetition#fnref20)
-
「SuperMemo 基于这样一个理念:你所学到的东西,一定有个理想的时机,来让你重新练习。练得太多会浪费你的时间。太久没练会导致你忘记材料,以至于必须重新学习。合适的练习时机就在你即将忘记的那一刻。不幸的是,这一时机对每个人,每一条信息来说都是不同的。想象一下,在一堆成千上万的抽认卡中,有哪些是你现在应该练习的。它们是哪几个?」Gary Wolf, “Want to Remember Everything You’ll Ever Learn? Surrender to This Algorithm”, Wired Magazine↩︎
-
「别搞错了:计算机处理的是数字,而不是符号。我们通过将一项活动算术化的程度来衡量我们的理解(和控制)。」Perlis, ibid.↩︎
-
这种指数级的增长就是间隔重复程序处理卡片的持续输入的方式:如果卡片安排在固定的时间间隔,就像每隔一天,那么复习很快就会变得不现实——我在 Mnemosyne 有超过 18000 个项目,但我没有时间每天复习 9,000 个问题!↩︎
-
见 2008 元分析, “Learning Styles: Concepts and Evidence” (APS press release); 来自该文总结:
> …为了证明最优的学习效果,需要学生接受所谓适合他们学习风格的教学,实验必须揭示学习风格和教学方法之间的一种特定的互动类型:对某一种学习风格的学生,那些证明最有效的教学方法,对其他学习风格的学生来说,往往没那么有效。
>
> 我们对文献的回顾揭示了充足的证据。这表明,当问到儿童和成年人时,他们会流露出对信息呈现方式的偏好。也有大量的证据表明,在对于不同类型的思考和处理不同类型的信息时,人们有着不同程度的特定能力。然而,我们发现几乎没有关于上述互动模式的证据,这被认为是用于验证学习风格的教育应用的前提条件。虽然关于学习风格的文献很多,但很少有研究使用能够测试学习风格应用于教育有效性的实验方法。此外,在那些确实使用了适当方法的研究中,有几项发现了与流行的网格划分假说完全相反的结果。
>
> 因此,我们认为,目前并没有足够的证据支持将学习风格评估纳入普通教育实践。因此,有限的教育资源最好还是采用那些有充分证据基础的教育实践法,而这些做法的数量正在增加。但是,鉴于缺乏对学习风格的方法良好的良好研究,得出「所有可能的学习风格都经过测试,并发现不足」的结论是错误的;许多研究根本就没有进行过测试。
-
Fritz, C. O., Morris, P. E., Acton, M., Etkind, R., & Voelkel, A. R (2007). “Comparing and combining expanding retrieval practice and the keyword mnemonic for foreign vocabulary learning”. Applied Cognitive Psychology, 21, 499-526.↩︎
-
来自 Balota et al 2006, describing Spitzer 1939, “Studies in retention”:
> Spitzer(1939)在一项研究中纳入了一种延时提取的形式,旨在评估六年级学生学习科学事实的能力。令人印象深刻的是,Spitzer 测试了爱荷华州超过 3600 名学生,包括当时 91 所小学所有的六年级学生。学生们阅读了两篇文章,一篇是关于花生的,另一篇是关于竹子的,并接受了多项选择测试,一共有 25 题,以评估他们的知识(比如「竹子属于哪一科植物?」—)。 Spitzer 总共测试了九组,既控制了测试的时间(立即进行或在各种延迟之后进行),也控制了学生接受的相同测试的数量(一到三次)。 Spitzer 没有合并集中复习或等间隔的复习的情况,但他至少有两组按不断增加间隔时间的复习安排进行了测试,其中测试之间的间隔是通过时间的推移(以天为单位)来分隔的,而不是通过干预待学习的信息来分隔。例如,在其中一组中,第一次测试立即进行,第二次测试在第一次测试后 7 天进行,第三次测试在第二次测试后 63 天进行。因此,本质上,这组人是间隔安排在 0-7-63 天的上进行测试的。Spitzer 将递增间隔组的表现与阅读原始文章 63 天后接受单一测试的一组进行了比较。在第一次(立即)测试中,递增间隔组正确回答了 53% 的问题。在 63 天和之前的两次测试之后,他们的分数仍然是令人印象深刻的 43%。63 天后,单一测试组只正确回答了原始项目的 25% ,使递增间隔组获得了 18% 的保留优势。这是相当令人印象深刻的,因为这一巨大的好处在 63 天的保留间隔后仍然存在。与 21 天后进行单次测试的组相比,间隔安排在 0-1-21 天的测试组中发现了类似的有益效果。当然,这项研究没有将测试与间隔或递增间隔的效果分开,但结果确实清楚地表明,使用递增间隔的重复测试程序可以获得相当大的学习和保持能力。Spitzer 的结论是「…考试是一种学习手段,不应该只被认为是衡量学生成绩的工具」(656 页,斜体)
- “Distributing Learning Over Time: The Spacing Effect in Children’s Acquisition and Generalization of Science Concepts”, Vlach & Sandhofer 2012:
> 间隔效应描述了一个强有力的发现,即当学习活动在时间上间隔开,而不是立即连续呈现时,长期学习会得到促进。对间隔效应的研究主要集中在记忆过程,而不是其他类型的学习,如学到和概括新的概念。在这项研究中,小学早期儿童(5-7岁;*N*=36)按照三种时间表之一接受科学课程:集中、成群和间隔。研究结果表明,时间间隔课程对简单概念和复杂概念都有较高的泛化性能。间隔学习时间表促进了几种类型的学习,加强了间隔效应对教育实践和课程的影响。
-
另见 Balch 2006, who compared spacing & massed in an introductory psychology course as well.↩︎
-
Roediger & Karpicke 2006b again.↩︎
-
Balota et al 2006 review:
> 如果受试者回答错误或遗漏,则不会给予任何反馈或更正。[Landauer & Bjork 1978](https://www.gwern.net/docs/spaced-repetition/1978-landauer.pdf) 发现,在课程结束时的最后一次测试中,递增间隔的安排比等间隔的测试的记忆表现更好,而等间隔测试又比最初的集中测试更好。因此,尽管集中测试在知识获取时表现出几乎没有错误的现象,但在课程结束时给出的最终测试中,其他两个方法产生了更好的保留率。然而,递增间隔与等间隔的学习安排相比,他们的差异相当小,约为 10% 。在对 Landauer 和 Bjork(1978)最初实验的后续研究中,几乎都发现,尽管会有例外,但实际上,间隔复习安排(无论是等间隔的还是递增间隔)在稍后给出的最终测试中比在呈现后立即给出的集中提取测试产生更好的保留率(例如,Cull, 2000; Cull, Shaughnessy, & Zechmeister, 1996)。例如,在 Cull 等人(1996)的实验 3 和 4 中,安排在 5-5-5 的集中测试时间上表现得与等间隔测试一样好,但其他大多数实验已经发现,任何方式的间隔安排测试(等间隔或递增间隔),在延迟测试上,都比集中安排测试的表现更好。然而,在 Landauer 和 Bjork 有意思的发现中的另一个部分「递增间隔是否比等间隔更有利于长期保留」仍然是一个悬而未决的问题。Balota , Duchek 和 Logan(出版中)提供了对相关证据的充分考量,并表明充其量是混合的,大多数研究人员没有发现两种测试时间安排之间的差异。也就是说,在课程结束时,等间隔与递增间隔复习的最终测试表现没有明显差异。
Cull, for those curious (Cull, W. L. (2000). [“Untangling the benefits of multiple study opportunities and repeated testing for cued recall”](https://www.gwern.net/docs/spaced-repetition/2000-cull.pdf). *Applied Cognitive Psychology*, 14, 215-235):
> Cull(2000)在一系列的四个实验中比较了递增间隔与等间隔复习,这些实验旨在模仿学生遇到的典型教学或学习方法。他研究了测试与简单地重新研究材料、反馈和各种保留间隔对最终测试表现的作用。结对关联的配对词(不常见词与常见词的配对,比如 bairn-print)的呈现方式类似于学生们经常用来学习词汇的抽认卡技巧。在某些实验中,试图提取要学习的信息的时间间隔从几分钟到几天不等。有趣的是,在四个实验中,Cull 没有发现任何证据表明,递增间隔比均匀间隔更有优势(即没有[显著的]扩大提取效果),尽管这两种条件都产生了比集中学习更大的优势。他的结论是,任何类型的分布测试,无论是递增的还是等间隔,都可以成为教师为学生提供的有效学习辅助工具。
- The Balota et al 2006 review offers a synthesis of current theories on how massed and spaced differ, based on memory encoding:
> 根据编码变异理论,记忆测试的表现取决于测试时可用的上下文信息与编码时可用的上下文信息的重叠程度。在集中学习时,上下文信息要素在呈现中的时间相对波动得较少,因此当测试的上下文信息强烈重叠于在两个集中呈现期间编码的相同上下文信息时,这种条件下,即时记忆测试中表现最佳。相反,当项目之间有间隔时,在学习过程中的信息呈现时间发生波动,因此,编码多个唯一上下文的可能性增加。由于延迟测试也会允许上下文的波动,因此最好对多个独特的上下文进行编码(如间隔展示形式),而不是对单个编码的上下文(如集中展示形式)。
Storm 等人在 2010 年做了 3 个阅读理解实验:
> 在一周后的一项测试中,递增间隔增强了记忆,但只有在连续提取之间的任务高度干扰段落记忆的情况下才会如此。这些结果表明,学习者从递增间隔提取练习中获益的程度取决于要学习的信息容易被遗忘的程度。
- 来自 Mnemosyne’s Principles page:
> Mnemosyne 的算法与 SuperMemo 早期版本中使用的 [SM2](http://www.supermemo.com/english/ol/sm2.htm) 非常相似。有一些修改处理了早期和晚期的重复,也为间隔增加了少量且健康随机性。SuperMemo 现在使用 SM11。然而,我们有点怀疑较新的 SM 算法的巨大复杂性是否提供了统计上相关的好处。但是,这是我们希望通过收集数据来查明的事实之一。我们只会根据常识或数据告诉我们有统计上相关的原因,以便修改我们的算法。
- Balota et al 2006:
> Carpenter and DeLosh (2005, Exp. 2) 最近研究了集中、递增(1-3-5)和等间隔(3-3-3)条件下的「看人脸记名字」的学习。这项研究还涉及到习得阶段的学习、研究和测试程序。Carpenter 和 Delosh 发现间隔有很大的影响,但没有证据表明递增间隔比等间隔练习更好。事实上,Carpenter 和 Delosh 报告称等间隔条件比递增间隔条件有可靠的益处。
- Balota et al 2006 again:
> Rea 和 Modigliani(1985)在三年级课堂环境中测试了递增间隔提取练习的有效性。在不同的条件下,学生们被要求学习新的乘法问题或拼写单词。问题或单词被视听呈现一次,然后按照 0-0-0-0 的集中组或 0-1-2-4 的递增间隔组进行测试,其中涉及对旧项目进行测试或学习新项目的间隔。在给定项目的每一次测试试验之后,都会再次完整地呈现该项目,这样学生们就会得到关于他们所学内容的反馈。在学习阶段,拼写单词和乘法事实的成绩都达到了 100%。在一项即时最终保留测试中, Rea 和 Modigliani 发现,相比集中组,间隔组在所有项目,即数学和拼写,都表现优异。他们提出,和其他人一样,间隔与向来有高成功率的扩展记忆提取安排相结合,比集中提取练习的记忆保留率更高。然而,与 Spitzer 的研究一样,Rea 和 Modigliani 没有测试适当的等间隔条件。因此,他们发现在三年级时,间隔提取优于集中提取,这可以简单地反映出间隔练习相对于集中练习的优越性——换句话说,间隔效应。
-
Balota et al 2006; >1 在心理学里很罕见,参考 “One Hundred Years of Social Psychology Quantitatively Described”, Bond et al 2003↩︎
-
Rohrer & Taylor 2006↩︎
-
Balota et al 2006:
> …在某些情况下,已经证明了信息的长期记忆保留需要几天时间(例如 Camp 等人, 1996)。例如,在后一项研究中,Camp 等人采用了一种递增间隔提取方法来训练 23 名轻度至中度 AD 患者,让他们参照日程表作为记住进行各种个人活动(如服药)的线索。在确定受试者是否会自发使用日历的基本阶段之后,通过反复问受试者这样一个问题来实施间隔提取训练:「你打算如何记住每天要做什么?」以递增时间间隔。结果表明,20/23 的受试者确实学习了这一策略(即看日历),并在 1 周内保持了下来。
- 不过,Rohrer & Taylor 2006 提醒我们,关于许多其他的数学研究:
> 例如,在 Donovan 和 Radosevich (1999) 的一项元分析中,随着任务的概念难度从低(例如旋转追视)到平均(例如回忆单词列表)再到高(例如拼图),间隔效应的规模急剧下降。根据这一发现,对于许多数学任务来说,间隔练习的好处可能会减弱。
- 这项研究的特别之处在于,它不仅使用了高素质(聪明且积极)的大学生(美国空军学院),条件相对可控——两组都有相同的家庭作业(所以测试效应相等),但像 Rohrer & Taylor 2006/2007 一样,分布有所不同:
> 实验组和对照组的课程主题、教科书、讲义、阅读作业和评分作业(测验、家庭作业和参与点除外)完全相同,不同的是教学大纲中的家庭作业列表。给对照组每日安排与当天在课堂上与所展示主题相关的家庭作业。Peterson(1971)称这是数学作业布置的垂直模型。实验组则按照分布式组织模式布置作业,这种模式结合了对当前主题的练习和对以前涉及过主题的强化。在分布式模式下,大约 40% 给定主题的问题在首次引入当天就布置,另外 20% 的问题将布置在下一课上,其余 40% 的问题将布置在随后的课上(Hirsch 等人,1983)。在 Hirsch 的研究和本研究中,在最初的家庭作业之后,代表特定主题的问题在第 2、4、7、12 和 21 课重新出现。因此,实验组第 1 课的家庭作业只有一个主题;第 2 课和第 3 课的家庭作业由两个主题组成;第 4 到第 6 课的家庭作业由三个主题组成。随着新主题的加入,这一模式得以延续,并应用于所有非考试、非实验室课程。如表 1 和表 2 所示,两组都布置了相同的家庭作业问题,只是作业模式不同。由于分布式练习模式的性质,随着学期的推进,实验组的家庭作业在学期初包含的问题(相对于控制组)较少,问题的数量也随之增加。在本学期晚些时候,实验组的家庭作业包含更多的问题(相对于对照组)…USAFA 定期收集学习时间数据。每次考试后,一大批学员(至少占课程总人数的 60% )匿名报告为准备考试所花费的时间(以分钟为单位)。两组花在学习上的时间大致相等(见表 5)。根据描述性数据显示,对于实验组和对照组来说,第三次考试的学习时间比任何其他考试的学习时间至少多 16%。期末考试的学习时间比任何一小时考试的学习时间至少多 68%(参见表 5)
>
> …该处理在第一次考试中产生的效应量(F2)为 0.013,在第二次考试中为 0.029,在第四次考试中为 0.035,对期末课程百分比成绩的影响为 0.040。虽然效果似乎很小,但实验组在每一种情况下都比对照组得分高。第一次、第二次和第四次考试的平均差异为 5.13 个百分点,这对实验组的学生来说意味着大约三分之一的字母成绩的优势。此外,由实验组获得的较高的最低分数可以指示分布式练习法用于消除极低分数(参见表 3)…奇怪的是,分散练习法并没有对期末考试成绩产生[统计上]显著的影响。造成这种差异的一个可能原因是 USAFA 的政策,即免除表现最好的学生参加期末考试。在 16 名免考学生中,有 11 名来自实验组,只有 5 名来自对照组。
- Balch 2006 总结:
> 两个心理学导论班(*N* = 145)参加了一个平衡的课堂实验,该实验展示了间隔效应,通过类推,证明了分散学习的好处。在听了两次集中或分散呈现的单词后,参与者回忆了这些单词,并对他们回忆的方案进行了评分,他们可靠地记住了更多分散学习的单词而不是集中学习的单词。在多项选择题测试中,测试后的分数平均约为测试前的两倍,表明了在传达内容方面的练习的有效性。学生的主观评分表明,该实验有助于说服他们相信分散学习的好处。
-
Commins, S., Cunningham, L., Harvey, D., and Walsh, D. (2003). “Massed but not spaced training impairs spatial memory”. Behavioural Brain Research 139, 215-223↩︎
-
Galluccio & Rovee-Collier 2006, “Nonuniform effects of reinstatement within the time window”. Learning and Motivation, 37, 1-17.↩︎
-
有关许多儿童方面的应用,请参阅前面的部分;之前未被引用的是 Toppino 1993, “The spacing effect in preschool children’s free recall of pictures and words”; 但 Toppino et al 2009 在年轻人的间隔重复中增加了一些有趣的限定词:
> 在有意学习时,学前儿童、小学生和大学生在图像的自由回忆中表现出间隔效应。当学习只是次要方面,并且在列表呈现过程中使用了一个需要很少语义加工的浅加工任务时,年轻人仍然表现出间隔效应,但儿童总是不能做到这一点。然而,当使用精心设计的语义加工任务时,儿童在非刻意学习中确实表现出间隔效应。
-
另一项先前未发表的研究:Glenberg, A. M. (1979), “Component-levels theory of the effects of spacing of repetitions on recall and recognition”. Memory & Cognition, 7, 95-112.↩︎
-
另请参阅 Kornell et al 2010; Simone et al 2012 显示间隔的好处,但在 56-74 岁的受试者中效果减小,类似于 Jackson et al 2012 和 Maddox 2013↩︎
-
Mammarella, N., Russo, R., & Avons, S. E. (2002). "Spacing effects in cued-memory tasks for unfamiliar faces and nonwords". Memory & Cognition, 30, 1238-1251↩︎
-
Childers, J. B., & Tomasello, M. (2002). "Two-year-olds learn novel nouns, verbs, and conventional actions from massed or distributed exposures". Developmental Psychology, 38, 967-978↩︎
-
著名「10,000 小时定律」的数字可能并不像 Ericsson 和 Malcolm Gladwell 等宣传者所暗示的那样真实或重要,因为与时间对抗的专业知识具有很高的方差,来自体育运动的结果显示了更少的时间投资(见 Hambrick’s corpus,会将「刻意练习」削减到一定的规模,Ericsson 荒谬地否认了基因的强大作用和拥有天赋的必要条件,但「刻意练习」帮助天赋之人的洞悉与领悟可能是真实的。一个人也许可以做到 3000 小时,而不是 1 万小时,但一个人不会通过无意识的重复或不重复来做到这一点。↩︎
-
Gentner, D., Loewenstein, J., & Thompson, L. (2003). “Learning and transfer: A general role for analogical encoding”. Journal of Educational Psychology, 95, 393-40↩︎
-
来自 Kornell et al 2010:
> 当要学习的项目不完全重复时,间隔的好处似乎会减少或消失([Appleton-Knapp,Bjork,&Wkins,2005](https://www.gwern.net/docs/spaced-repetition/2005-appletonknapp.pdf))…许多研究表明,集中而非间隔可以促进归纳学习。这些研究一般采用相对简单的知觉刺激,便于实验控制 [Gagné,1950](https://www.gwern.net/docs/spaced-repetition/1950-gagne.pdf);[Goldstone,1996](http://cognitrn.psych.indiana.edu/rgoldsto/interrelated/interrelated.html);]Kurtz&Hovland,1956](https://www.gwern.net/docs/spaced-repetition/1956-kurtz.pdf);[Whitman J.R.,&Garner,W.R.(1963年)。“Concept learning as a function of the form of internal structure”. *Journal of Verbal Learning & Verbal Behavior*,2,195-202])。
-
高错误率——表明一个人实际上并没有在一开始就学习卡片内容——似乎与间隔效应的失败有关;这里有一些证据证明当人们还不了解材料的时候,他们自然会选择集中学习。↩︎
-
20 年是这样的(请注意科学记数法):
[0.742675,0.27044575182838654,0.15275979054767388,0.10348750000000001,7.751290630254386e-2,6.187922936397532e-2,5.161829250474865e-2,4.445884397854832e-2,3.92305555555e-2,3.5275438307530015e-2,3.219809429218694e-2,2.97.2.1740583401051353e-2,2.0995431241707652e-2,2.0342238287817983e-2]
↩︎ -
需要排除一种情况,就是知识单单知道就很有用,虽然不常用到——就像知识金字塔中的一块砖。参见 Wolf 文中第三页:
> 如果我们能说服自己记住并不重要,遗忘的问题可能不会让我们如此痛苦。也许我们学到的东西——单词、日期、公式、历史和传记细节——其实并不重要。事实是可以查到的。这就是互联网的作用。说到学习,真正重要的是事物如何结合在一起。我们掌握故事、图式、框架和范例;我们排练行话;我们在知识中畅游。
>
> 这个想法非常令人欣慰,只可惜它是错的。「那些批评死记硬背的人——他们如果读到每个词都需要拼读出来,他们怎么想?」Robert Bjork 问道,他是加州大学洛杉矶分校(UCLA)心理学系主任,也是杰出的记忆研究人员。Bjork 指出,毕竟孩子们是通过大量练习才能流畅读出每个词的,而每次我们进入新的领域,我们又变成孩子了。「记忆是逃不掉的。」他说,「一开始总需要记住事物的名字。我们都要经历这关。把这关快速了结很重要。」人脑的联想能力是个奇迹,但为了能作出联想,就必须向记忆加载数据。
-
参见 Stephen R. Schmidt 的网页 [“Theories of Forgetting”](http://frank.itlab.us/forgetting/mtsu_forgetting/#II. Decay Theory),其中在展示不同研究中遗忘曲线的对数图线时引用了「Woodworth & Schlosbeg (1961)」。↩︎
-
这样巧妙地解决了这样的邮件列表毫无用处的问题(「谁能看过一次就学会单词?」)。↩︎
-
如此利用 Mnemosyne, 我不仅学习了名言后能用上 ,而且还有了本流水账;几天前我在一篇文章里用上了 3 到 4 句恰切的引言,这便归功于数月数年前我把他们输入到 Mnemosyne 中了。↩︎
-
众所周知,任何说一门语言的人理解的单词都比他们将使用或能够显式输出的单词多得多,他们的「阅读词汇量」超过了他们的「写作词汇量」;不太为人所知的是,在许多问题上,一个人即使感到不确定和无知,也能以远远高于随机的速度进行猜测,这使得心理学家有必要采用强迫选择范式。更不为人所知的是认知记忆)或「内隐记忆」(implicit Memory)的能力;这种记忆可以应用于识别图像或文本或音乐、打字、解谜等。Andrew Drucker 在 “Multiplying 10-digit numbers using Flickr: The power of recognition memory” 一书中使用视觉记忆来计算 9883603368 × 4288997768 = 42390752785149282624;他引用 Standing 1973 作为先例:
> 在一项被广泛引用的关于识别记忆的研究中, Standing 向参与者展示了为期 5 天多达 1 万张的照片,每张照片曝光时间为 5 秒。然后测试了他们的熟悉度,基本上如上所述。参与者显示出 83% 的成功率,这表明他们在经历磨难的过程中已经熟悉了大约 6600 张图片。其他志愿者接受了较小集合的培训,即选择 1000 张生动图像,成功率为 94% 。
人们有时会看到人们争辩说,一些东西是不安全的、不可猜测的,或者免于可能的安慰剂效果,因为它涉及太多的对象,无法明确地记忆,但正如这些例子所表明的那样,识别记忆可以很快发生,并存储惊人的大量信息。这可以用于认证(例如,见 [Bojinov 等人在 2012 发表的研究](https://www.usenix.org/conference/usenixsecurity12/technical-sessions/presentation/bojinov)、[Hacker News](https://news.ycombinator.com/item?id=4266115)、[讨论](https://news.ycombinator.com/item?id=8952341))和消息,因为认知记忆可以被用作一种安全沟通系统。双方可以共享一套 20,000 张照片(10,000 对);要发送信息,请信使花 5 天时间挑选 10,000 张照片;然后要接收,请他识别他在 10,000 对照片中的每一张中看到了哪张照片。受试者不仅不知道二进制信息是什么或什么意思,他甚至不能描述它,因为他不记得照片了!
在 80% 的准确率下,我们甚至可以使用[香农定理](https://en.wikipedia.org/wiki/Shannon's_theorem)计算出可以委托给信使的信息比特数;计算得出上限为 5.8 kb:如果 *p* = 0.2(基于 80% 成功率)。那么 10000 / (1 − (*p* × log2 *p* + (1 − *p*) × (log2 (1 − *p*)))) = 5807.44。
所以我们看到 [Frank Herbert](https://en.wikipedia.org/wiki/Frank_Herbert) 终究是对的:发送信息最安全的方式是通过[使魔信使](http://dune.fandom.com/wiki/Distrans)!(其缺点是内建认知记忆会严重衰退;见 [Landauer 1986](https://www.gwern.net/docs/www/www.cs.colorado.edu/a32bb08e2e08259223443a3c6b0d4f7d3e514f50.pdf) 调整后的估计数)。[↩︎](https://www.gwern.net/Spaced-repetition#fnref60)
> 我有多相大约一年了。(不再是这样了,我的记忆力被扼杀了。)…主要是 Anki 复习。我发现我可以做大约 2-3 天的复习环节,然后会撞上一堵不可逾越的墙。我连一张新卡都学不会,脑子一团浆糊,直到多睡了 3 个小时。然而,这会重置我的适应能力。整个影响在普通人身上没有那么明显,但也不是很明显。但是,当你已经有一个内核时,增加睡眠会更容易。在最初的睡眠剥夺之后,我没有注意到任何其他严重的精神障碍。
-
最近的一项综述请见 Philips et al 2013.↩︎
-
想必有人会把所有卡片都评个高分,比如 5 分,以免某天突然要应付 500 张卡片。↩︎
-
数字小的更好。↩︎
-
「对于Mnemosyne 2.x,Ullrich 正在开发官方的 Mnemosyne iPhone 客户端,同步会很容易。」↩︎
-
参见 第 4 页, Wolf 2008:
> 间隔效应是在实验室中发现的傲人成果之一,而且它对专业教师甚至都不易察觉,因此饶有趣味。就在 Neisser 发表了成果同一年里,Robert Bjork 与贝尔实验室的 Thomas Landauer 合作,发表了两个实验的结果,这两个实验中有 700 个本科生参加。Landauer 和 Bjork 探究了增强记忆的最佳练习时机。他们的研究结果令人印象深刻:学习某件事的最佳时机是在你即将忘记它的那一刻。然而,也许正如 Neisser 预测的那样,这项发现在现实世界中是无用的。
-
当我第一次了解到 SuperMemo 的时候,我已经上过一堂认知心理学的课,对艾宾浩斯的遗忘曲线相当熟悉——所以我对 SuperMemo 方法论的反应就像赫胥黎的那句话一样:「竟没想到这个,实在是太愚笨了!」↩︎
-
另请参阅 page 7, Wolf 2008
> 然而现在,当我咧开嘴笑着向围观者挥手时,在我看来,他的方法中冰冷的理性可能只是表面现象,当与真正的奖励联系在一起时,即使是无情的系统也能产生某种发自内心的吸引力。将极端记忆的成就沿着遗忘曲线重新投射出来,在未来,我们将知道得更多,将这种未来与我们今天用于学习的几分钟联系起来,沃兹尼亚克找到了一种方法,将他的气质与他的记忆结合起来。他正在让未来变得引人注目。他不仅试图学习很多东西,而且还试图用一种乌托邦式的狂喜来温暖学习过程本身。
技术圣战实为协调难题
原文:Technology Holy Wars are Coordination Problems · Gwern.net
围绕平台选择和版本升级的争论之所以如此激烈,并非因为人们喜欢挑刺,而是因为这些选择将影响整个技术生态系统。某个平台可能通过网络效应获益并避免「比特腐烂」,同时却会通过「比特蔓延」微妙地破坏其他平台。
2020-06-15–2020-07-09 ; 已完成 ; 可信度: 较高 ; 重要性: 3 ; 反向链接
计算机领域中长期存在的圣战现象,比如 Python 2 向 Python 3 迁移过程中的激烈争论,并非源于人们的心胸狭窄或对冲突的热衷,而是因为这本质上是一个协调问题:关键不在于让每个人都做出明智的决定,而在于让所有人做出一样的决定。一个看似不流行的平台所面临的表面问题,实际上可能是人们试图协调使用不同平台的未明言努力的一部分:主导平台能够享受强大的网络效应,例如由于众多用户的持续使用和维护而减少比特腐烂。与此同时,它还会对其他平台施加一种镜像效应,即比特蔓延,导致这些平台逐渐被忽视并开始衰败。
比特蔓延的直接负面影响不仅使早期采用者失去潜在的网络效应,更严重的是,顽固分子的存在大大降低了新技术或新事物的价值,甚至可能导致早期采用者的处境每况愈下,日常生活变得更加艰难。考虑到顽固分子从社区中获得的巨大利益,采用者往往将顽固分子的行为视为一种寄生且不道德的行为。而顽固分子则否认自己有任何道德义务,并对采用者为增加采用率而采取的手段(如在缺乏正式管控的情况下采用非正式手段,比如霸凌)感到愤慨。
这种迫切需要决出一个胜者的心态,以及选择胜利或失败一方所带来的巨大技术上的好处或代价,解释了圣战中(只是表面上的)不成比例的能量、仇恨和难以妥协的态度。
也许,如果我们能够明确地将圣战理解为一个协调问题,我们就能避免最糟糕的过度行为,并利用这方面的知识来更好地管理诸如编程语言迁移等事务。
沉默的狗:圣战不存在的地方;选择至关重要;网络效应
无论你为极客们打造何种交流平台,不管是 Usenet、FidoNet、论坛、Twitter、Github、Hacker News、Reddit 还是其他任何平台,早晚都会爆发圣战——那些永无休止的争论。这些争论往往围绕着技术 A 或 B 的优劣展开,争论者甚至会认为使用另一种技术的人不仅头脑简单,而且反社会,简直是在亵渎所有美好和纯粹的事物。在计算机领域,这种周期性出现的「圣战」现象在 Jargon File 中被定义为:
网络论战……Danny Cohen 的一篇题为「论圣战与和平呼吁」的论文,使「大端」和「小端」这两个术语在关于字节序(最低位优先/最高位优先)的争议中广为人知,其标题本身就颇具讽刺意味。
历史上著名的「圣战」包括:ITS 对阵 Unix、Unix 对阵 VMS、BSD Unix 对阵 System V、C 语言对阵 Pascal、C 语言对阵 FORTRAN 等。到了 2003 年,当时流行的争议则是 KDE 对阵 GNOME、vim 对阵 elvis、Linux 对阵 [Free|Net|Open]BSD。而经久不衰的争论则包括 EMACS 对阵 vi。[1]
……区别「圣战」与普通技术争议的特征在于:在「圣战」中,大多数参与者都试图将个人价值观和文化偏好伪装成客观的技术评估。之所以会出现这种情况,恰恰是因为在真正的「圣战」中,双方的实质性差异往往相对较小。
**沉默的狗:圣战不存在的地方。**我们或许还能举出更多例子。比如,在互联网普及之前,曾爆发过协议战争;随后,20 世纪 90 年代轰轰烈烈的游戏机大战中,人们对 SNES 和世嘉创世纪的优劣进行了无休止且常常激烈的辩论(接着是 N64 对阵 PS1,PS2 对阵 Xbox...)。再往后 20 年,社交媒体领域有 Usenet、Slashdot、digg、Reddit、Hacker News、Twitter 和 Mastodon 之争,加密货币界则有比特币、以太坊(以及门罗币、Zcash 等)的角逐。我们还应该注意到,有些事物并不会引发圣战:比如在 grep 这样的工具中选用哪种字符串搜索算法,个人偏好 FPS 还是 RPG 类型的电子游戏,或是该购买多大容量的硬盘、多少核心的 CPU[2] 等。这些话题可能偶尔会引发讨论,但往往会以理性且富有成效的方式进行,这与圣战截然不同。这种现象也不仅仅是「品牌忠诚度」的体现——有无数拥有忠实追随者的品牌并未引发圣战,即便有人讨论,大多数人也只会耸耸肩,得出「品味无可争辩」的结论。
选择至关重要。技术圈的「圣战」真的只是极客们的一场无聊游戏吗?表面上看,争论确实常常是一种消遣。然而,这显然不是全部原因。这些争论往往演变成令人不快的口水战,不仅无人能从中获得乐趣,反而会让所有参与者心怀怨恨。与 ESR 的观点相反,这些技术差异通常相当显著。(即便是他自己举的例子,如 ITS 与 Unix、C 与 Pascal 或 Emacs 与 vi 之间的对比,都体现了截然不同的技术理念。)Armin Ronacher 指出,为了推动技术升级(如从 Python 2 到 3 的转换)而造成的「情感困扰」,似乎与其带来的直接收益不成正比,难以与随之而来的种种纷争相称。他对此感到困惑,只能将「圣战」解释为人们享受「共同受苦」并站在「道德制高点」上的心理,但这种解释显然不够充分(毕竟,为什么人们要主动选择受苦呢?)。尽管 Ronacher 没有深究这个问题,但他无意中透露了一个颇具启发性的观察:「实际上很少有项目足够庞大,能够让第三方分叉后依然存活下来。」[3]
网络效应。有什么不同?某些技术因用户规模扩大而愈发珍贵,另一些则可能因此贬值——基础设施是指那些随使用人数增加而变得更加实用的事物,而应用程序则往往适得其反。所谓的「圣战」(犹如政治辩论)总是围绕着具有网络效应的基础设施或平台展开,其中潜在的连锁反应通常比表面影响更为深远。尽管人们可以选择「分叉」,但「退出」这一选项往往只是表面文章:你选用的操作系统、编程语言或二进制编码方式不仅影响自身,也牵动他人,这是一种相互作用。因此,「发声」成为唯一的选择。人们会为自己钟爱的大型多人在线游戏(MMO)争论不休,却不会为单机纸牌游戏如此热衷,这是因为如果一款 MMO(或任何多人游戏)吸引不到足够的玩家,就无人可玩。即便是两个邻家孩子为游戏主机争论,如果他们能就哪款主机最佳达成一致,也能从中受益,因为这样他们就可以轻松共享游戏、存档和游戏杂志。你的选择对他人而言举足轻重。
相较而言,你如何使用这些技术对他人的影响则相对较小。举例来说,一旦你选定了 Microsoft Excel 而非 VisiCalc 或 Lotus-1-2-3 作为电子表格工具,你在这些表格中填写的具体内容对他人的重要性就远不如你成为 Excel 用户这一事实本身。
(互联)网络效应
数组索引到底应该从 0 开始还是从 1 开始?我提出的「从 0.5 开始」这个折中方案却被毫不留情地否决了,我觉得他们连认真考虑都没有。
Stan Kelly-Bootle(著名计算机幽默作家)[4]
不择手段也要扩大网络。 假设我使用 Python 3,如果我能说服其他人放弃 Python 2 而使用 Python 3,那么无论 Python 3 的改进对他们来说是否真的重要,或者我的理由多么站不住脚,我的处境都会好得多。[5] 选择最流行编程语言的程序员仿佛走在一条被上帝眷顾的康庄大道上:各种库唾手可得,那些使用小众语言的程序员日常碰到的 bug 在这里神奇地销声匿迹,文档总能完美解决他的需求,还附带随取随用的代码片段,API 返回的数据格式恰到好处地契合他的默认数据结构,功能强大的 IDE 会自动补全代码,Stack Overflow 上堆满了解决各种小问题的妙招(这些小问题几乎成了工作之余的趣味游戏),因为在这个世界里,一切都是最好的安排……[6] 诚然,在显性和隐性知识上需要投入巨大的个人和集体资源(甚至要学会为特定工具重塑思维模式),但一旦跨过这道门槛,后面的日子就会过得舒心如意。与之形成鲜明对比的是,那些冒险选择非主流路线的人很快就会领教到:他们不得不自己编写大量库,许多标准的规范粗糙不堪,操作系统或 API 设下了诸多隐形陷阱(随时准备给你致命一击),几乎找不到可靠的参考资料或值得请教的同行,琐碎的问题接踵而至,让人应接不暇(他们越是勤勉地提交 bug 或补丁,就越陷入这个无底洞)。在最黑暗的时刻,他们的信念开始动摇,不禁自问:莫非自己钟爱的语言并非世界上最卓越的编程语言?
不仅是零和博弈,更是负和博弈。平台的正面网络效应是显而易见的。然而,有人可能认识到这些效应的存在,却认为它们还不足以激发如同圣战般的狂热竞争。因此,我们有必要探讨一个更为微妙的问题:一个平台的成功如何通过争夺共享资源而间接损害其他平台。
比特腐烂
永远处于变化之中;没有银弹;常用者兴,弃用者衰
永远处于变化之中。「比特腐烂」这个术语生动地概括了此类平台所面临的网络效应问题。程序的「腐烂」并非源于它们在存储介质上的变化,也不是单纯因为时间流逝而产生了缺陷(当然也有例外,如千年虫问题)。实际上,比特腐烂发生在程序周围的环境发生变化时。这种变化可能表现为:API 修改了某个字段名;或者字段名保持不变,但其含义已经改变;又或者某个不起眼的功能因为其他地方的变动而失效,直到你的程序像往常一样调用它时才发现问题;还可能是版本号更新导致其他部分无法正常工作,因为它们依赖于旧版本且不确定新版本是否安全;或者你需要安装一个特定程序,但这需要升级现有程序(从而可能影响成千上万的其他程序);又或者系统备份使用的密钥悄然过期、存储空间耗尽,或者未能及时更新以备份新增的服务器。依赖关系和系统交互的隐蔽性意味着我们往往不自觉地走上了「最小阻力路径」,因为我们甚至没有意识到存在这样一条路径,或者正在被某种方式所束缚。(「你说『字节不总是 8 位』是什么意思‽」)我们必须积极对抗比特腐烂:如果你真的想避免建立过多的依赖关系,就需要采用一些策略,比如混沌工程,或者有意使那些超出预期可靠性的服务崩溃。
没有银弹。 诸如类型系统等技术解决方案可以通过精确定位危险变更来帮助缓解比特腐烂,但总有超出类型系统范畴的情况,而唯一真正的端到端测试就是终端用户。[7]
常用者兴,弃用者衰。 避免比特腐烂没有捷径可走:只有经常使用的才能得到良好维护。广泛应用的程序之所以能够避免比特腐烂,与其说是因为它们拥有本质上优越的设计,不如说是得益于围绕它们形成的生态系统:破坏性变更会立即被最先体验的用户发现(从而使其他用户免受影响),或者这些变更根本就不会发生(因为开发者事先进行了测试和检测,或充分意识到了后果,又或者仅仅是因为这些变更首先破坏了他们自己的系统!)。此外,每个人都会调整自己的程序以适应流行的程序,而非反其道而行之。通过这种方式,程序及其生态系统不断更新焕新,避免了比特腐烂——就像活体组织通过不断更新来避免腐烂(细菌等引起的分解)一样。
比特蔓延
我们都有足够的力量去忍受他人的不幸。
François de La Rochefoucauld,格言第 19 条
衰亡的系统「比特腐烂」,成长的系统「比特蔓延」; 「拥抱,扩展,消灭。」; 甲之比特蔓延,乙之标准化。
衰亡的系统「比特腐烂」,成长的系统「比特蔓延」。 「比特腐烂」的反面是我们可称之为比特蔓延的现象:由于时间和精力有限,一个成功避免比特腐烂的系统必然会经历「比特蔓延」。在这个过程中,其他程序开始「比特腐烂」,因为它们越来越依赖于该系统,默认其存在,并且仅在该系统环境下进行测试。这种扭曲逐渐蔓延到整个技术生态系统。在一个严重比特蔓延的环境中,尝试用非主流方式完成任务就像在 La Brea 沥青坑中挣扎,而非在「图灵沼泽」中摸索,这种环境不可避免地会将新程序推向主导系统。它演变成一个技术黑洞,扭曲周围的「空间」;一旦程序积累了足够多的隐式和显式依赖,它就越过了「事件视界」,再也无法脱离(因为从头重写程序反而更简单)。由于替代方案未被采用,它们也就得不到维护。这意味着,随着比特蔓延的扩散,那些试图以曾经有效的方式与旧程序交互的人会发现,尽管他们的程序本身没有改变,却遭受了比特腐烂。所有既往的投资都面临风险,在不知不觉中逐渐贬值。[8](这揭示了系统的两种进化策略:要么简单到无人想要替换,要么复杂到无人能够替换。)
「拥抱,扩展,消灭。」——这是一种著名的技术策略。GCC 的整体架构和 Linux 内核有意破坏内部二进制兼容性是两个典型案例,而 systemd 似乎正在成为第三个。
Richard Stallman(RMS)解释了为何不采用模块化组件反复处理输入这种看似合理的方式来设计 GCC。他认为,这种精心设计的架构会使 GCC 变得过于容易修改——敌对方可能会提供闭源的前端或后端,从而损害自由开源软件(FLOSS)的传播。相反,如果 GCC 的结构使得闭源修改几乎无法维护,那么这些修改就不得不开源。无论这种观点是否有道理,不可否认的是,GCC 确实没有遭受太多「安卓化」的影响。与之相对的是,非 GPL 许可的高度模块化 LLVM 编译器不得不从零开始。(然而,LLVM 在工业界和学术界的广泛采用也凸显了这种「要么按我的方式,要么走人」策略的代价。)
Linux 内核开发者为其不支持私有模块的立场辩护。他们认为,通过仅支持那些被纳入 Linux 源代码库的模块(这些模块必须采用自由/开源软件许可证),他们能够自由地修复 bug、解决安全漏洞,甚至重写整个内核。从长远来看,这种做法带来的好处远胜于为了避免破坏多年前发布且此后一直未经修改的不透明二进制模块而冻结一切的做法[9]。然而,这种观点在 GPU 和 Android 等行业中并不受欢迎。为了应对这一挑战,谷歌付出了巨大努力,不仅为 Android 维护了一个永久的 Linux 内核分支,还为下游供应商创建了一个专门的稳定应用二进制接口(ABI)。此外,谷歌还约每隔几年就会重写一次相当于其整个代码库的内容。
第三个例子(仍在进行中)可能是 systemd 在 Linux 中的蔓延(历史):这个最初只是引导脚本的替代品,如今已渗透到从桌面环境到音频守护进程的方方面面;越来越多的操作只能通过 systemd 来完成。那些曾经可以独立运作并与其他工具兼容的组件,现在都默认用户只使用 systemd,并将其功能专门定制为适配 systemd。systemd 已经根深蒂固到难以清除的地步:移除它会导致太多功能失效,甚至那些表面上与 Linux 启动无关的功能也不能幸免。它甚至已经「感染」了 Solaris 和 FreeBSD。设想一下,某人突然发现自己的关键脚本被 systemd 破坏,这并非他的过错,然而他又无法在不损坏系统的情况下移除 systemd。最后一个不含 systemd 的操作系统版本已是多年前的产物,使用它不仅会导致许多其他程序无法运行,还会带来严重的安全隐患。如果这个人因为种种原因而厌恶 systemd,我们也就不难理解他为何会选择在电子游戏中寻求慰藉了。而对于 systemd 的狂热支持者来说,仅仅让 systemd 成功还远远不够——其他人必须失败。
**甲之比特蔓延,乙之标准化。**比特腐烂和比特蔓延本身并非非黑即白,它们既不完全有害,也不全然有益。[10] 世界在不断变化,这种变化往往出于正当理由,而比特腐烂正是这种变化不可避免的副产品;然而,当变化源于不当原因时,随之而来的比特腐烂就会产生负面影响。要对抗比特腐烂,就需要持续投入资源维护程序,但有时候顺其自然,任其发生可能更为明智;过分追求向后兼容和维护遗留系统可能会造成重大失误(比如 Makefiles 在明显是个错误的情况下仍保持对制表符的敏感,仅仅因为创建者过于担心影响他区区几十个用户,又或者微软 Windows 为了兼容运行所有 DOS 程序而背负的沉重包袱,不管这些程序有多么问题百出)。
比特蔓延在强行推广劣质技术时确实会带来负面影响,但它同时也是技术融合和标准化的必经之路。要抵制比特蔓延,整个技术社区需要不断投入资源探索替代方案并加以实施,但有时候顺其自然,将精力集中在更重要的事情上可能更为明智。举例来说,如果将字节定义为 8 位这一概念通过比特蔓延逐渐在整个生态系统中普及,这未必是件坏事——毕竟,让软件生态系统完全不依赖于字节大小,去兼容那些使用 7 位(更不用说 48 位)字节的老旧系统,究竟能带来多大的实际价值呢?
平台的兴衰
一切残酷行为皆源于软弱。
全面战争:最好永不发动,但一旦开始——就必须取胜!;糟糕的妥协只会让所有人都不满意; 战争,以其他形式进行
全面战争:最好永不发动,但一旦开始——就必须取胜! 然而,比特腐烂/比特蔓延却产生了意想不到的后果,它极大地提高了个人选择的风险,将其转变为一场胆小鬼博弈。
一个平台越是全面,将他人拉入麾下就越发重要。这不仅是为了享受正面外部性带来的红利,更是为了防止比特腐烂和竞争对手的比特蔓延。[11] 由此衍生出技术圣战的等级制:字节序 > 操作系统 > 编程语言 > 编辑器 > 桌面环境……最终沦为貌似严肃实则玩笑的争论,诸如应该用制表符还是空格。(这也解释了为何某些圣战会偃旗息鼓。人们不再争论 Emacs 和 vim 孰优孰劣,并非因为达成了共识或其中之一退出了舞台,而是因为两者如今都已沦为小众编辑器,它们更多地面临着来自 Visual Studio Code、Eclipse 或 Sublime Text 等巨头的共同威胁。[12])真正举足轻重的不是胜利者的优点几何,而是必须有一个胜利者:「更糟就是更好」——只要 JavaScript 程序员数量够多,就能把一根面条或 NodeJS 推着绕赤道转上十二圈。(老实说,到现在为止,让其他所有系统都切换字节序所带来的不兼容性、转换开销、数据损坏和编程难题,难道不是早已远远超过了选择大小端字节序中较差者作为标准可能带来的任何想象得到的劣势了吗?)
**糟糕的妥协只会让所有人都不满意。**Python 2 和 Python 3 的并存就是一个典型例子。两个版本都拥有庞大的用户群,可能会无限期地并存下去。然而,这种状态对整个 Python 社区来说都是一个持续的痛点。它不仅没有实现规模效应(两个半社区的总和远不如一个统一的社区),还给所有 Python 使用者带来了额外的复杂性和潜在的错误风险。开发者们不得不确保正确安装多个版本,并时刻谨慎地使用恰当的版本。更为棘手的是,Python 2 因此获得了一种隐性优势,能够在其他系统中造成「比特蔓延」。这些系统不得不为兼容 Python 2 而做出调整,而非反过来。这实际上是 Python 2 用户在被动地享受一种补贴,可以说是在「收取」过去 Python 程序员(讽刺的是,其中许多人正是 Python 3 的支持者)创造的知识产权的「租金」。在这种情况下,Python 2 的用户缺乏动力去学习 Python 3 的新特性。他们可以安于现状,因为他们的程序不会轻易过时。但这种表面上的安逸实际上带来了三重代价:错失 Python 3 带来的新机遇(这点在讨论网络效应时常被忽视)、造成比特蔓延,以及分裂 Python 社区。更不公平的是,这三重代价几乎全部由其他人而非坚持使用 Python 2 的人承担!尽管难以精确计算,但考虑到库/工具维护者与可能数以百万计的下游用户之间的巨大差异,这种成本与收益的比率可能在数量级上存在巨大差距。因此,Python 3 的开发者对这种状况感到不满是完全可以理解的。[13]
战争,以其他形式进行。考虑到这些因素,难怪争论可能变得不那么文明,有些人甚至会诉诸霸凌或向所有人许下空洞承诺:毕竟,这里的利害关系可能相当高,即使不是生死攸关,也会对一个人的生活质量产生重大影响。尽管如此,这种分散且无组织的口水战和霸凌行为是不明智的;即便它有效,或许还能找到正当理由,但历史经验表明,自发的口水战几乎从未奏效,只会造成破坏。人们应该「保持友善,至少在你能协调一致地表现出不友善之前」。
解释技术圣战
这解释了为什么某些技术领域会出现圣战而其他领域不会,为什么这些争端会持续存在,为何最相似的群体之间往往会爆发最激烈的冲突(这不是源于「自恋」,而是出于实用主义考虑,因为他们在争夺相同的稀缺资源)[14],为什么这些争论如此缺乏理性且难以化解,为什么参与者感到不得不诉诸霸凌和情感伤害,为什么这些争论确实至关重要,以及它们通常会如何演变。
比特蔓延确实是一个真实存在的现象,但它带来的成本和收益分布并不均衡。这种影响通常程度适中,主要作用于选择有限的特定用户群体。对这些用户而言,不做选择反而比做出任何选择都更为不利。然而,没有任何机制能够强制整个社区做出统一选择,即使在某些情况下,做出一个选择比选择具体哪一个更为重要。
基于这种观点,我们可以探讨一些减轻比特蔓延带来负面影响的方法。
协调迁移
诉诸公共精神;经济激励?;有意地中心化以解决协调问题
这种协调问题并非计算机领域独有。没有企鹅愿意成为第一个跳下冰山的——但鱼儿不会自动送上门来。与其进行临时升级,或是诉诸口水战、宣传攻势和霸凌那些有不同需求或可以理解地只顾自身利益的人,难道没有更好的方法吗?
诉诸公共精神。 一个更好的方法是提高人们对成本的认识。升级或替代方案真的有必要吗?如果确实有必要,那么像 Armin Ronacher 这样的坚持者应该以理性的方式了解他们的行为所造成的成本,而不是对他们怒气冲冲,或在网上用虚假论点霸凌他们。
**经济激励?**既然需要进行升级,我们可以考虑采用经济手段:设立基金来支付维护者进行过渡的费用,或在必要时资助一个分支项目(一旦过渡成为既定事实,且现状开始向相反方向产生渐进式变化时,可以将项目归还给原维护者)。在这种情况下,保证合同可能是一种有效的社会技术手段(为维护者支付的升级成本低于总体收益,因此符合卡尔多改进)。另一种方式是公开承诺在特定日期进行过渡,类似于 Python 2 被宣布终止支持的做法。
有意地中心化以解决协调问题。从比特蔓延的角度来看,那些试图通过竭尽全力改进模块化并尝试同时支持多个生态系统来达成和解的努力,实际上是一种自我毁灭的愚蠢行为:找到一个进行转型的「制高点」可能是最有效的单一策略,而且它会自然而然地执行。(这种策略可能看起来有些不光明正大,但在处理协调问题时,善意反而可能造成伤害。)一个生态系统越是遵循「只此一途」的原则,协调就越容易。以 Go 语言 为例,它可能不是一种卓越的编程语言,但大家都在使用(并强制他人使用)的 gofmt
工具不是很好吗?它以某种方式统一格式化 Go 代码,从而将 Go 程序员从「自由」的束缚中解放出来。
事实上,也许我们应该重新审视「终身仁慈独裁者」或项目维护者的真正角色。他们的职责不应该是日常的项目维护或组织工作,而是作为一个最终权威,引导社区走向一个新的、更好的平衡状态——这种角色越是谨慎使用,就越显得珍贵。
非常规小团体的惊人效能
本文探讨了「场域群智」(scenius)现象的案例,即那些竞争激烈且沟通紧密的小团体如何产生出乎意料的重大影响,并常常能够发掘那些不知何故被前几代人忽视的唾手可得的机会。
2021-05-14 完成;可信度:日志 ;重要性:6;反向链接;相关内容;参考文献
纵观进步的历史,很大程度上可以被视为对这些小团体的群体传记研究(prosopography):
-
Kim 2018 年的研究《编织社区:创业早期的人力和社会资本》(量化社会传播/创新的同伴效应:Ravelry 网站上的编织群体与新颖的编织设计)
-
Paul Graham 的《创造者的品味》
-
Alex Danco 的《天使投资的社会补贴》
-
Kevin Kelly 的《场域群智,或集体天才》
-
Pavlogiannis 等人 2018 年的研究《使用进化图论构建任意强度的自然选择放大器》(《广场和兔子洞》)
-
艺术:
-
《黑猫》杂志,H. P. Lovecraft 与业余出版社,他们能够结识像邓森尼勋爵这样的偶像,最终导致了克苏鲁神话的诞生
-
Francis Ford Coppola/George Lucas+Marcia Lucas 等人与独立电影制作/新好莱坞以及《星球大战》的创作(《星球大战秘史》)
-
数学:利沃夫学派的苏格兰书与酒馆(Wieschenberg 1999);Kürschák/Eötvös 数学竞赛与 Középiskolai Matematikai és Fizikai Lapok;Paul Erdős;Douady & Mandelbrot 集
-
游戏:
-
《Flash 游戏如何塑造了视频游戏产业:Flash 虽已落幕,但其对现代游戏玩法的影响将永存》,作者 Jonas Richner(为何基于 Flash 技术的网页游戏能在全球范围内迸发出如此强大的创意,并获得广泛欢迎,甚至在中国也不例外?Flash 游戏生态的蓬勃发展源于多方面因素:集成编程环境大大降低了入门门槛;小型游戏便于快速迭代;大量优秀范例可供借鉴;开发者之间的相互欣赏和良性竞争推动创新;普遍认为游戏总有提升空间;全球范围内有大量拥有充足空闲时间的人才投身其中;像 Newgrounds 这样的游戏平台通过精选游戏培养了一批见多识广、要求严格的用户群,这些用户能为热门游戏带来海量流量,从而形成了人才招募、良性竞争、用户反馈、持续改进的正向循环。)
-
《经典俄罗斯方块的革命:年轻一代如何利用互联网掌握下落的方块》;《GeoGuessr 游戏中令人喜爱的统治者:Tom Davies 成为了这款谷歌地图猜谜游戏的偶像》
-
重剑剑术(重剑 2.0:Eric Sollee/Johan Harmenberg)
-
《攀岩的成功告诉了我们关于经济增长什么:机器不是提高生产力的唯一引擎》;《攀岩和创新经济学》(尽管 Alex Honnold 有些不同意)
-
Jeff Cooper 的现代手枪技术
-
《一个人通向保龄球中心的惊人旅程》;《打破保龄球的人:Jason Belmonte 的双手技术让他成为局外人。然后它让他成为最伟大的人——并永远改变了这项运动》(视频)
-
速通(《为什么游戏玩家比科学家更擅长发现欺诈?》;速通记录随时间的改进;特别是工具辅助速通,比如暴力破解《Breakout》)
-
《越来越好:「表现革命」如何来到体育界——以及更远》;《个人最佳:顶级运动员和歌手都有教练。你也应该有吗?》;《快 1/100 秒:打造更好的奥运会运动员》;《通过飞镖研究人类完美的极限:为什么运动员似乎总是一代比一代更强?原因并不总是你想象的那样。》
-
-
《Imre Festetics 和摩拉维亚羊毛育种者协会:孟德尔被遗忘的「研究网络」》, Poczai et al 2014
-
技术:
-
《更好的饮食:2020 年的厨房看起来大多与 1960 年相同。但我们在其中所做的事情已经发生了巨大变化,几乎完全是向好的方向——这要归功于烹饪创新文化》
-
《YouTube 知识传播革命》, Samo Burja (Drosos & Guo 2021);《为什么录制的古典音乐质量能如此提高?》
-
骇入:warez scene/crack intro, demoscene, phreaking, hacking (‘APT stands for Advanced Persistent Teen’–Bulgarian virus factory, AOL, mIRC, Runescape, Neopets etc.)
-
政治:
-
另见:《创新的起源:社会传染?》、《时机技术:媒体实验室的教训:不断尝试(但越来越少)》(创业公司作为分布式 Thompson 采样)、《互联网社区设计作为多层优化》、《计算硬件与深度学习》、《版权死重损失》、《局部最优与贪婪选择》/《普遍的无能》、Bloom 的两个标准差/学徒制
你是否注意到,自 20 世纪 90 年代以来,网上的业余动画和插画作品质量有了惊人的提升?
不仅是最顶尖的作品更加出色,我详细,无论是平均数、中位数还是众数,都有了显著提高。造成这种现象的部分原因很容易理解:比如如今的硬盘可以存储高分辨率图像,网络也能轻松传输而不会花费太多;再比如 Gimp、Photoshop 等曾经的高端工具,通过盗版、自由开源软件或免费软件的形式变得人人可用。此外,还有一些可能不为非艺术家所熟知的技术进步,如适用于绘画的经济实惠、高精度的触控板。然而,我认为仅凭这些因素,似乎还不足以解释作品在复杂度和上色技巧方面所取得的巨大飞跃。
我认为这种现象很大程度上源于社交机制——我观察到,许多「数字原生代」艺术家似乎非常依赖在线社区来学习。他们研究 .PSD 等原始文件来了解创作过程,观看创作直播或「快速素描」的视频(有时会录下来供日后参考),参加各种正式和非正式的比赛,争取赢得社区的认可(这是不是所谓的「模仿欲望」?)。他们紧跟流行文化,从中汲取灵感,创造出不断变化的艺术风格。他们会在 DeviantArt 或 Tumblr 等平台上分享所有作品,获取即时反馈(尽管这些反馈可能比较粗浅)。他们拥有海量的现成素材库,可以通过临摹来学习,或直接将其融入自己的创作中。借助 Patreon 和 Skeb.jp 等双向市场委托网站,他们甚至可以靠艺术创作全职工作……这些方法虽然不一定能激发创作出神圣的视觉艺术作品的灵感(尽管我们确实看到了起源于 Pixiv 帖子的漫画和轻小说的兴起),但无疑有助于培养熟练的技艺。
音乐领域似乎也经历了类似的变革,以 SoundCloud 和 YouTube 等平台为核心形成了新的生态系统。
这种现象与国际象棋的发展颇为相似:尽管这些活动在互联网时代之前就已存在,但当今的竞争环境和在线社区极大地加速了它们的发展进程。我想到的另一个视频游戏例子是,最近我读到一篇讨论,其结论指出 YouTube 上的视频教程和比赛在过去几年里推动了 NES 版《俄罗斯方块》的进步,这种进步程度甚至超过了游戏发布后的前二十年左右。总的来说,工具辅助、速通或视频游戏破解等领域,都因互联网的兴起和小型专业团队的协作而获得了巨大的发展动力,这些团队都专注于「提升数据指标」。
亚文化社会的忧郁
The Melancholy of Subculture Society · Gwern.net
互联网连接了小群体,同时也带来了大团体的解体;这究竟是好还是坏呢?虽然有利有弊,但还是有点令人感到遗憾。
如果您翻阅一些关于互联网的陈旧书籍——你知道我指的是哪些,那些引用罗兰巴特并讨论多人即时虚拟类游戏中性别越轨行为的书籍——为数不多的仍然相关的批评之一是担心互联网团结小群体的同时进而分裂更大的群体。
独自上网
您可能还记得这是应用于互联网的*独自打保龄球*论文;它在 20 世纪 90 年代末获得了一些关注。其基本思想是:随着时间的推移,电子娱乐设备变得越来越复杂和便宜,直到20世纪80年代和90年代,它们已经遍布全球并吞噬了几代儿童;这些设备比传统的极客产品更有害,因为它们通常最好单独使用。花几个月的时间独自掌握“超级马里奥兄弟”对于正常成长来说是一种糟糕的方式。
然后就没有了
4到5人的《龙与地下城》聚会,(由一位地下城主带领),这种社交活动逐渐被经典的街机游戏所取代,在这种社交活动中,人们通过激烈的对决和相互竞争来享受乐趣;然而,街机游戏本身也被卧室里闪烁的家用游戏机所取代,在那里,一个人独自沉浸在《最终幻想VII》的世界中。随着图形真实度的提高、有更符合人体工程学的控制器的引入,以及真正具有挑战性的人工智能技术的应用,趋势表明,手变得不再必要,越来越多的玩家现在都是独自玩游戏。
批评者说,也许互联网的兴起缓解了这种令人痛苦的趋势——这种趋势一开始不利于连接,但后来终于有了足够的剩余计算能力和带宽,使得大规模连接成为主流。
在PC上玩大型多人在线角色扮演游戏MMORPG不仅比单人角色扮演游戏(RPG)更加令人满意和具有社交性,而且在《光环》比赛中击败人类玩家比击败外星人工智能更加令人满足。事实上,机器最终将人与人之间连接起来,而不是仅仅连接人与机器。因此,我们被迫学习一些基本的社交技能,以维持必要的人际关系。最终,我们不再退回到自己的小世界中,不再与外界隔绝。
欢迎来到NHK!
但是,批评者继续说,情况仍然不太好。我们仍然彼此疏远。联网机器的兴起仍然促进了退出和隔离。它呈现出了蛰居族这一幽灵般的存在——那些尽可能在物理世界中消失的人。当然,这是一个日语术语。他们比我们的未来还要早5年(或者也许有人应该说,were?)。Gibson 早在2001年已经写道(https://www.theguardian.com/books/2001/apr/01/sciencefictionfantasyandhorror.features),(参见还有他的[“闪亮的泥球”]短文):
在我们其他人看来,日本人似乎在时间线上比我们提前了几步。日本人是新技术的领先采纳者,这一点对于我撰写科幻小说的研究至关重要。如果你像我一样相信所有文化变革本质上都是技术驱动的,那么你就会关注日本人。他们已经这样做了一个多世纪,实际上在面对我们过去所说的‘未来冲击’(https://en.wikipedia) .org/wiki/Future_Shock)——即对快速变化的适应——方面,他们确实走在了我们前面,尽管现在这已经成为我们所有人生活中的一种常态。
吉布森还讨论了“手机女孩”和短信文化;这种文化大约在2005年左右真正开始在美国显现1——比如翻盖手机(Sidekicks)(https://en.wikipedia.org/wiki/Danger_Hiptop)、推特等。你可以用手机做任何事情:订餐、工作、阅读和写小说、维持一个活跃的“社交”生活以及在社交地位上产生羡慕(“她的手机更小巧,而且她的手机挂带上有更多收藏品!天哪!”)……你只需通过发送数字信息,就能完成任何事情,无需与人面对面。”(而且这还是在一个拥有世界上最难以数字化的书写系统之一的国家中实现的!2 语言生来并不平等3.)
蛰居族放弃了所有的个人接触。他们不会去当地的酒吧闲逛,也不会在大家为家乡队伍加油时大口喝啤酒。蛰居族不会在扶轮社或与狮子会、哑剧团、退伍军人或骑士团闲聊八卦。他们不做这些事情。他们不工作,也不和朋友一起出去。
“御宅族”(otaku),新世纪的终极爱好者,他们的孤独与无所不能之间存在着矛盾:他们拥有的是一种悖论性的存在,既感到孤立无援,又在自己的小世界里拥有全能的力量。这种存在反映了个人关注范围极端狭窄所带来的内在荣耀与恐惧。
威廉·吉布森,“闪亮的泥球” (TATE 2002)
那么他们每天醒着的 16 个小时都在做什么呢?
## 选择退出
但对我们来说,最好不要知道职业级运动员为了在某件事上取得如此出色的成绩而做出的各种牺牲……当我们看到这些牺牲的实际事实时,我们会感到厌恶:不识字的篮球天才、服用兴奋剂的短跑选手、注射牛激素至崩溃或爆炸的防守截锋。我们宁愿不去深究运动员在赛后采访中所发表的那些令人震惊的空洞和原始言论,也不去考虑他们这一类人的精神生活需要经历怎样的匮乏,似乎只有这样才能理解那些伟大运动员的思维模式。请注意那些深入挖掘职业运动员私生活的报道是如何费劲地寻找他们全面人格生活的证据——包括他们对运动之外的兴趣、活动以及价值观的体现。我们忽略了一个明显的事实:这种努力其实是徒劳的闹剧。这是因为当今顶级体育竞技的现实要求运动员必须早早地、全身心地投入到某一领域的卓越追求中。苦行僧般的专注。几乎将人的生活其他所有方面都融入到一个特定的才能和追求之中。他们接受了一种生活方式,这种生活方式的狭窄程度类似于儿童的世界……就像,网球运动员迈克尔·乔伊斯作为一个人,尽管在某些方面受到了极大的限制,但他在网球领域是完整的……对乔伊斯来说,22岁的他已经没有机会去尝试其他任何事情了;他已经投入太多,深陷其中。我认为他既幸运又不幸运。他会说他是幸福的,并且是真心的。祝他一切顺利。
大卫·福斯特·华莱士,[“弦理论”](https://web.archive.org/web/20160515043816/https://www. esquire.com/sports/a5151/the-string-theory-david-foster-wallace/)(July 1996 Esquire)4
他们并不沉迷于我们的文化——他们正在参与他们自己的亚文化。这是御宅族自然发展的过程。他们在艾泽拉斯上战斗,或者热衷于追求他们的同人志"事业",或者……互联网连接并统一了许多亚文化,不论是好是坏。对于每一个慈善或有益的亚文化(例如,自由软件),就有一个利弊参半的(如魔兽世界),还有一个完全有害的(例如,饮食失调的粉丝 ,儿童色情)。
批评者想要表达的核心观点是,人生短暂,本质上是一场零和游戏。我们每天有三分之一的时间用于睡眠,再有三分之一的时间用于谋生,最终所剩无几。要真正提高效率,我们不能将精力分散投入到多种文化之中——我们无法既在主流文化中取得真正的成功,同时又在例如机械模型这样的领域里投入足够的努力,以至于能够被称为一个御宅族。尝试同时涉足两个领域的人,要承担学习和参与两边的开销的同时,却实际上得不到任何益处。(他在“正常人”的社会评价中会受到负面影响,并且由于时间和不想过度投入的限制,他的“爱好”也难以取得显著成就。)5
御宅族和蛰居族认识到这种困境,他选择——拒绝正常的生活!他选择了自己的亚文化6,拒绝了更广泛的文化生活。这是一个简单的比较优势问题;在小池塘里做大鱼比在大池塘里做大鱼更容易。7
更大的屏幕
你是否曾经从一个比现实生活更加美好的梦中醒来,以至于你希望能够再次入睡,回到那个梦中?对一些人来说,《魔兽世界》就像是一个他们不需要醒来的梦——一个比现实世界更好的世界,因为他们的努力在那里确实得到了回报。
Half Sigma,“状态、手淫、被浪费的时间和魔兽世界” (2006)
EVE Online在游戏界中是独一无二的存在。自2003年5月首次上线以来,玩家们一直在同一个在线宇宙中的同一个大型服务器上进行游戏。我们不仅深知失败的严重后果,还懂得如何因持久和坚持不懈而获得成功的回报。当每周末有超过60,000人在这个平台上进行交易、策划和相互竞争时,它吸引了某一类玩家。《EVE Online》不是一个追求快速解决方案的游戏。我们享受创造持久价值的过程,无论是建造虚拟的太空船,还是培养现实生活中的友谊,这些都汇聚成了庞大的帝国和永恒的遗产。我们这些参与游戏的玩家都明白,一个人真的可以在我们的世界中产生巨大的影响。
Mark 'Seleene' Heard ([V邪恶的老鼠](https://en.wikipedia.org/wiki /Sean_Smith_(外交官)) 悼词,2012)
随着越来越多的人选择退出,主流文化受到了损害。8文化开始分裂成碎片。这种脱节可能是深远的;一个美国的动漫迷与一个日本动漫迷(他们的种族、文化、宗教、语言都不同...)之间的共同点,可能比他与一个参与福音派基督教亚文化的美国人之间的共同点还要多。实际上几乎没有共同点——我们这两位同胞可能甚至无法在像治理或进化这样的客观问题上达成共识!
这些差距已经够多了,“美国”或“法国”文化在哪里?这种文化认同需要几个世纪的时间才能融合——正如法国的发现所述,法国直到20世纪才开始说法语,而汉族中国仍在融合和同化其众多的少数民族和边远地区。当然,美国的情况则简单得多,因为其初始的定居者人数不多,他们能够轻易地将原住民排除在外。
国家认同在新兴亚文化的冲击下支离破碎。最后,批评家看到了这一进程的自然终点:民族主义的长夜像重担一样从活人的思想中卸下,国家变成了地图上的一些线条,你遵守的一些法律。没有人特别关心。极客认为,“Meh:这里,加拿大、伦敦、日本、新加坡——只要联邦快递能送到我这里,有良好的互联网连接,有什么区别呢?'(而且,对技术有倾向的人并不是唯一这样想的。[9](https://gwern.net/subculture#fn9))
你可以自己做个测试。告诉自己:“我现在居住的国家是对我这样的人来说世界上最好的国家;如果我被放逐,我会非常不快乐。”如果你的内心回应是:“为什么?美国有什么特别的?它并不是特别的经济自由或政治自由,也不是唯一的文明英语国家,也不是最富有的10……”那么,你就是在走向选择离开的道路。
这个悖论是这样运作的:互联网通过让成员逃离至更小的亚文化群体来打破更广泛的文化。而批评者认为这很糟糕。他们喜欢更广泛的文化11,他们同意Émile Durkheim关于原子化的观点,并举出像韩国这样的例子,他们内心深处,真的对诸如[兽人爱好者](https://en .wikipedia.org/wiki/Furry_fandom)和乳胶爱好者这样的群体感到不安。他们只是单纯地不喜欢那些异类。
#但我可以得到更高的分数!
未来,每个人都会扬名世界15分钟。
我们换个角度来看。
单一栽培
讽刺只有在紧急情况下才有效。如果长期使用讽刺,它往往会变成那些被限制或困住的人的声音,他们已经适应了甚至开始享受他们的束缚或限制。
刘易斯·海德,酒精与诗歌:约翰·贝里曼和酒鬼说话12
一个人无法选择不参与文化。“没有来自无的观点”。在很大程度上,我们就是我们文化的产物——我们的所有物、我们的文化模因综合体、我们的习惯和厌恶的对象都是文化的产物。你始终是某一种文化的一部分。
假设全世界只有一种文化,没有亚文化。这种文化的首要痴迷之处将是……我们就称之为“金钱”吧。人们对金钱有着绝对的痴迷——如何赚钱、获取金钱、金钱贬值等等。更重要的是,一个人的地位完全取决于他一生中赚了多少钱;在实际中,还有一些打破平局的考量因素,比如你赚钱的速度、你是在什么环境下赚钱的(每个人都更钦佩在经济萧条时期成为亿万富翁的人,而不是在好时期成为亿万富翁的人,就像我们更钦佩在寒冷阁楼里写作的小说家,而不是舒适的学者一样),等等。
这并非一个不切实际的设想:随着人们投入的努力,一个主题会逐渐丰富和复杂化,从而实现自我发展。金钱就是一个很好的例子,它能够吸纳70亿人的集体努力和关注——事实上,很多人已经这样做了。
但这对人们有什么影响呢?我可以告诉你:普通人将会很痛苦。如果每个人都真心实意地相信这种文化,他们就必须如此。那么,他们在钢琴弹奏、烹饪、编程或任何形式的艺术或学术追求方面的才能都将被贬低,变得毫无价值。世界变得太大了——它过去不是这样的,人们对正在发生的事情感到如此无能为力[13](https://gwern.net /subculture#fn13) :
“社会由这样一群人组成,他们不能设计、建造、修理,甚至无法操作他们生活中所依赖的大部分设备……在这个复杂的世界里,人们面临着对他们来说完全无法理解的非凡事件和功能。他们无法对自己直接经历的人为现象给出充分的解释。他们无法形成一个连贯的、理性的整体画面。”
在这种情况下,每个人都会,也确实必须,基于信任接受许多事情。他们理解世界的方式主要是基于信仰,而非科学。在科技社会中,我们每天的经历中只有一小部分可以用科学来解释。这就像是一个刚出生的婴儿,它接收到的许多感官信息并没有形成清晰的整体。有许多事物是孩子不能理解的,或者即使在学会说话后,他们也不能成功地向其他人解释清楚。从这个角度看,现代社会的公民在这方面比孩子更不幸。他们永远无法完全理解他们感官所报告的复杂世界,也无法将这些信息组织成有意义的整体……14
除非标记的方式几乎与人数一样多,否则你无法在上面留下标记。15
换句话说:女性足够受够了将自己与媒体形象相比较。如果你想要预见这个未来,想象一下每个人都是一个讨厌自己身体的厌食症青少年——永远如此。在当代第一世界,人们死于饥饿,但不是因为食物短缺,而是因为骄傲。
我们都珍视社会尊重。我们需要知道有人对我们评价很好。我们是群居的猴子;被排斥就等于死亡。
杰龙·拉尼尔(Jaron Lanier):“我假设一个促进文明的力量是感知到多重的、重叠的地位层级。我在帮助奥克兰的帮派成员重新融入社会的工作中观察到这一点很有帮助。当存在多重的、重叠的地位层级时,人们更有可能不去与他们地位链中的上级发生冲突。而且,当单一的地位层级在人们的生活中被严格地强加,他们越有可能彼此发生冲突。美国成功的一部分原因就在于如何评估某人的地位时存在的这种困惑。”
史蒂芬·平克(Steven Pinker):“这是一个深刻的观察。有研究表明,当人们被限制在一个啄食顺序(等级制度)中时,暴力更为常见,他们的所有社会价值都取决于他们在那个等级制度中的位置。然而,如果他们属于多个重叠的群体,他们总能在其他地方寻求价值的肯定。例如,如果我在开车时做了些愚蠢的事,有人对我竖起中指并叫我混蛋,这并不是世界末日:我心想,我是哈佛大学的终身教授。另一方面,如果我在街上的男人中的地位是我生活中唯一的价值来源,我可能会怒路症发作并拔出枪来。现代性包含了许多事物,很难将它们一一区分开来。但我怀疑,当你没有被限制在一个村庄或部落,而是可以在广阔的世界中寻求你的命运时,这正是因为这个原因而成为一种平息冲突的力量。”16
想想你认识的那些人。他们中有多少人能在纯粹的经济层面上“竞争”?有多少人能在经济上与那些站在金字塔顶端的人相比而不觉得自己是彻底的失败者、悲惨的失败者?这样的人并不多。我想不出我认识的人中,有谁不会因此而感到至少有些不快的。他们中有些人相当富裕,但与同领域的亿万富翁相比,这简直是天壤之别。虽然无法证明这种亚文化的说法是绝对正确的(或许文化的碎片化会削弱可能的社会地位),但当我观察简单的模型时,这个版本在我看来是合理的17,并且能解释一些深刻的趋势,比如一夫一妻制18。
亚文化让你自由
如果你将自己与他人进行比较,你可能会变得自负或怨恨,因为总会有人比你更优秀或更差。享受你的成就和你的计划。无论你的事业多么卑微,都要保持对它的兴趣;这是在不断变化的时代中真正的财富。
Max Ehrmann,“Desiderata”
艺术家、亿万富翁、诺贝尔奖科学家和慈善家能够在社会中平起平坐、和睦相处的社会对我们的精神健康至关重要!如果我是程序员,我就不需要与70亿人以及数百名亿万富翁竞争以获取自尊。我只需要考虑计算机领域。更好的是,我可能只需要考虑函数式编程社区,或者仅仅是Haskell 编程社区。再举一个例子:如果我决定致力于英文维基百科亚文化,而不是美国文化,我就不再需要在精神上处理3亿个竞争对手和威胁;我只需要处理几千人。19
这是一个更易管理的部落。它的人数更接近于邓巴数字, 这一部落在网上同样适用20.。即使我在维基百科的底层,那也没关系。只要我知道我自己的位置!我不必非得是富有的精英才能快乐;一个工匠大师就很满足了21 ,猫 也可以审视国王。
离开一种文化,加入一种亚文化,是猴子思维应对现代世界的一种方式。
成长
我常常必须言不由衷,这叫做外交辞令。
弗兰克·赫伯特·斯蒂尔加的 沙丘弥赛亚
我有一个理论来解释为什么很少有老年人是蛰居族或御宅族。
我认为他们已经屈服于所谓的习得性无助 :他们一生中一直在忍受着走在拥挤街道上的恐惧和压力22 ,并且对周围所有的人一无所知——不知道他们可能构成的威胁(https://qwantz.com/index.php?comic=1896)23,,也不清楚他们与自己的关系。他们的心理已经变得扭曲,以至于这种困扰不再影响他们;他们已经适应了这种精神负担4.。(正如预期的那样,年轻人更容易因为群体而感到疲惫5。剩余的心理错位是通过那些小型社会组织来处理的,这些组织正是普特南在《独自打保龄》中所哀叹的正在消失的社交形式。这种解决方案和过去一样有效。但年轻人现在有了其他选择,不再被迫接受这种古老的从众行为。)
压力是一个重要的问题。你可以问问灵长类动物学家,他们会告诉你的。社会压力缩短了寿命。处于社会底层的猴子活得不如它们应该活的那么久;像皮质醇这样的激素会损害身体26。处于社会顶层的猴子可能也不会活得太久,但至少它能看到自己的死亡。疯癫与乡村无关;它与城市有关27,可能是由于压力或低度感染28。
特别,就像其他人一样
我以为日本的每个人都必须待在那里。于是我转向我爸爸,问他:“你知道现在这里有多少人吗?” 他说因为[棒球]体育场已经满了,大概有五万人……我只是那个巨大拥挤体育场里的一个小人物,那里人太多了,但只是整个人口的一小部分。直到那时,我一直以为我,我不知道,是个特别的人。和家人在一起很有趣。我和同学们玩得很开心。我去的学校里到处都是最有趣的人。但那一晚,我意识到那不是真的。我们上课时做的所有我认为有趣和酷的事情,可能在日本的其他学校也都在发生。我的学校一点都不特别。
慢性压力 特别有毒。如果压力是由社会秩序中不明确的、极其低下的地方造成的,那么现代人就会不断地遭受这种压力,他的健康也会因此受到损害。
考虑到这一点,很明显,从大文化中分离出来可以带来大文化永远无法提供的益处。大文化永远无法将我需要了解的人数减少到几百人或几千人;它永远无法让我在事物的计划中拥有一个直观的位置。70亿,甚至3亿,都太多了。
但亚文化可以做到这一点。亚文化可以知道我的名字,并因我在一个更大的文化中最多只是难以理解、最糟则是微不足道或令人反感的成就而拍拍我的背。亚文化可以消除这种社会压力。
如果我们进一步想下去呢?如果我们选择了一个在线的亚文化,并且我们从不外出呢?那么所有的压力都会消失;如果一个人不走在街上,就不会被附近的陌生人打扰。
##“胜利者就是你”
你说得对,珍妮,我不知道如何关心我灵魂的救赎。有些人被召唤,其他人则尽力而为。
我接受它,降临在我身上的事情是公正的。
我并不假装自己拥有睿智长者的尊严。
无法用言语表达,我选择了我现在的家。
下棋的能力是绅士的标志,而下好棋则是浪费生命的标志。
从很多人的显露偏好来看,工作对他们来说是最重要的,但俗话说,人临终时,没有人希望自己在办公室度过更多的周末; 二郎的寿司之梦 是令人钦佩的,还是可怕的?特别是二郎的两个儿子的待遇以及他与自己妻子的微乎其微的关系让人停下来思考。说起二郎,值得注意的是世界著名导演宫崎骏[起风了](https://en.wikipedia. org/wiki/The_Wind_Rises)的主角也叫二郎,说到宫崎,有他的儿子[宫崎五郎]的一些有趣的言论 ](https://en.wikipedia.org/wiki/Goro_Miyazaki)30:
对我来说,宫崎骏是“零分父亲,满分导演”。我父亲几乎不在家。因此,我小时候,母亲不得不代替父亲的角色。我父亲每天半夜才回家,那时我已经睡着了。他在这方面总是很认真——显然,无论多晚,他都会确保回家。但几乎每个周六和周日他仍然在工作。因此,从我记事起到现在,我几乎没有机会和他说话。他总是等我睡着后才回来,而我八点去上学时他还在睡觉。所以,我上小学的时候,上学前我常常去卧室看看父亲在不在。我父亲全身心地投入工作。他不仅不照顾孩子,也从不干家务。所以都是我妈妈在干。我妈妈也是一名动画师,但在我弟弟出生,我刚上小学之前,我父亲换了工作,他的工作比以前更忙了。所以,结果是,为了抚养孩子,我妈妈不得不放弃当动画师。
对于一位伟大的艺术家来说,也许可以证明这些成本是合理的。但对于其他人来说……?
各个领域都存在一个现象,即洛特卡定律,它是指每位作者发表论文数量的指数幂律:大多数人发表的论文很少,但少数人发表的论文很多。几十年后,西蒙顿提出了“等概率规则”,即总体上,没有哪位科学家的平均命中率比其他人高;巨大的性能差异仅仅源于伟大的科学家发表了大量作品。(人们会想到高斯未发表的笔记本,据数学史学家翻阅后发现,其中包含了后来许多数学家发现的数学发现,或者美国逻辑学家查尔斯·桑德斯·皮尔士的笔记中隐藏的宝石。)因此,洛特卡定律也适用于实际的发现:大多数人只有少数发现,但少数人却做出了远超过他们应该做的更多发现。[查尔斯·默里(政治科学家)](https://en.wikipedia.org/wiki/Charles_Murray_(political_scientist)在《人类成就》一书中指出,“伟大”艺术家或科学家(根据有多少不同的教科书或百科全书认为他们足够重要而提及)的图表显示——无论你如何尝试重新计算或调整——都存在与洛特卡定律所预测的那样,许多小人物和少数几个普遍人物之间存在极大的不平衡,这很奇怪,因为该分布看起来与仅基于智商、辛勤工作或财富的伟大毫无相似之处。这其中有一部分是网络或马太效应,但最简单的解释是,伟大需要多种特质:一个人必须既聪明又勤奋,同时也不极度贫穷……其中许多特质都符合正态分布或类似分布,当要求增多时,剩下的就是一个快速缩小的分布——就像洛特卡定律所描述的那样。
在任何领域,要做出伟大的工作,其中一个要求就是一个人必须有动力——一个人必须认为自己的工作或领域“至关重要”。如果一个人蔑视将一生奉献给研究一套任意规则的细枝末节,而这些规则的掌握对任何其他事物都没有用处,那么就很难成为国际象棋大师。我相信这可能会导致专业知识的悖论,即胜者的诅咒:最有可能达到世界级水平的人,往往也最有可能被自我欺骗或严重误判其价值。许多领域的“大师”都声称他们的领域是独一无二的,这当然不可能是真的,或者对他们来说是独一无二的满足,这似乎不太可能,因为任何人都可以体验到的生活商品都很少。《恐龙漫画》在谈到世界级小提琴家从很小的时候就开始学习小提琴的话题时,问道 :“一个六岁的孩子知道一个三十岁的人想做什么吗?”
在象棋中,人们可以看到这种现象:各种象棋人物都在吹嘘象棋在经济领域的适用性,但却没有证据;或者声称象棋适用于政治,尽管这种类比充其量只是牵强的,而且无论如何象棋也不如围棋这样的游戏;或者他们寄希望于象棋训练能转移到像智商这样的能力上,尽管过去60年来所有这样的“远距离迁移”尝试——甚至是更合理的尝试,如早期丰富环境或(大多数)营养补充剂或[双 n回]——都失败了,而且所引用的象棋研究要么方法上值得怀疑,要么相互矛盾。象棋真的是值得花一生去追求的吗?世界象棋冠军马格努斯·卡尔森在2010年初说了些有趣的话:
卡尔森:“我不知道[我的智商是多少]。反正我也不想知道。这可能会成为一个令人讨厌的意外。”
SPIEGEL: “为什么呢?你才19岁,就已经是世界排名第一的棋手。你一定非常聪明。”
Carlsen: “而这正是可怕的地方。当然,对于棋手来说,能够很好地集中注意力是很重要的,但是过于聪明也可能成为一种负担。它可能会阻碍你。我深信英国人John Nunn 从未成为世界冠军的原因就是他太聪明了……15岁时,Nunn开始在牛津大学学习数学;他是过去500年来最年轻的学生,23岁时他获得了代数拓扑的博士学位。他的头脑里装着太多东西,简直太多了。他强大的理解力和不断求知的渴望使他分心于象棋。”
SPIEGEL: “你的情况有所不同吗?”
Carlsen: “是的。我就是一个普通人。我父亲比我聪明得多。”
我们能将这种思考方式排除在亚文化之外吗?那些成为“御宅族”的人仅仅是愚蠢的国王吗?这就是知识的诅咒:知道的人不做,不知道的人却做了。
可怜鬼的同情
东急手创馆的秘诀在于那里提供的所有商品最终都倾向于达到光玉土球(hikaru dorodango)的地位,即使不是完美。经过长时间精心护理,用那些精心进口的鞋类护理产品仔细擦亮的皮鞋,最终成为一个独立的宇宙,一个充满光泽且深度无限的概念球体。
正如一个生活得足够安静、足够孤独的人生,也会成为另一种完美的球体。
Gibson, 闪亮的泥球
客观地看,社会有很多弊端31。对于那些还没有融入社会、不太适应社会的人来说,成为“蛰居族”是一种合乎逻辑的折中反应。他们有自己的理由,我们甚至可以将这些理由与科学结果联系起来。
如果有人真的更喜欢自己的亚文化,这种亚文化能让他们获得精神上的舒适和身体健康,那么其他人又有什么权利干涉并把他们拖入主流文化呢?建立大型同质文化需要付出巨大的努力,甚至需要付出身心的流血牺牲。它们的好处并不明确,其理由也显然是为自身利益服务的。也许我们应该优雅地接受“国家”文化不可避免的分裂,学会在一个真正的多元文化世界中运作。我们每个人都有自己的一席之地,在尊重(尽管不理解)所有其他亚文化的同时,与他们共存。
……我认为他既幸运又不幸。他会说他很幸福,这是他的真心话。祝他一切顺利。
大卫·福斯特·华莱士,《弦论》
另请参阅
-
“我窗前的地球”, Takashi Murakami (Little Boy 2005)
-
现实被打破:为什么游戏让我们变得更好以及它们如何改变世界, McGonigal 2011 / 规则的乌托邦:论技术、愚蠢和官僚主义的秘密乐趣,Graeber 2015
[1] 当然,2005 年之前,美国人都在使用短信和手机;我的意思是 2005 年,大约两年的时间,当它们成为文化的一部分时,它们变得流行,短信服务开始出现,它们与“[Web 2.0](https://en.wikipedia.org/ wiki/Web_2.0)',十几岁的女孩会把所有的时间都花在互相发消息上,等等。
[2] 关于自然语言的复杂性:ASCII——大多数英语的书写语言——可以用一两页来指定;其他流行的欧洲语言只需要几页。像韩语 hangul 这样的字母脚本也同样被紧凑地指定(尽管 Hangul 的音节组成意味着 Unicode 必须指定一个大的字母表——尽管明确且绝对有限——的 [ 11,172](https://www.unicode.org/versions/Unicode6.0.0/ch12.pdf)音节)。
相比之下,Unicode 开发者希望纳入中文/日文表意文字(在 Unicode 1.0 中“仅”限于 20,940 个,其中一些不是真实的)的愿望意味着,《[Unicode] (https://en.wikipedia.org/wiki/Unicode)标准,第 5.0 版》长达1,472 页——在这个点上,完整的印刷版停止了。为了不用过多的位数来编写这些表意文字,Unicode 6.0 试图将字符数限制在 75,960 个——结果导致了持续数十年之久的争议,被称为汉字统一。这场争议也鼓励了许多其他编码的创建(维基百科列出了 8 或 9 种)。一个外人可能会认为,Unicode 解决方案的复杂性以及任何竞争对手在CJKV使用或“字符失忆”等现象中未能击败它的失败,都表明这些书写系统确实与数字表示不兼容。(顺便提一下,以简洁和技术写作见长的出版商 O'Reilly 已经出版了一本关于处理 CJKV 文本的书籍,《CJKV 信息处理,第二版》(CJKV Information Processing, Second Edition),该书共有 912 页。)这些问题造成的一个有趣的例子是“一键欺诈”操作者用来注册银行账户的方法;来自“[解剖一键欺诈]”(https://www.andrew.cmu.edu/user/nicolasc/publications/TR-CMU-CyLab-10-011.pdf):
通过黑市,以30,000至50,000日元的价格就可以获得欺诈性银行账户(参考:黑市山本网)……利用日本的书写系统,设立欺诈性账户相对容易。银行账户内部使用假名(片假名),这与大多数名字和名词使用的字符汉字不同。因此,可以创建模糊的账户名称。例如,“白井市烘焙俱乐部”和“白石美津子”(一个人的名字)的发音完全相同,因此会有相同的账户持有人信息。通过注册为非盈利组织,欺诈者可以很容易地绕过大多数身份验证,随后使用个人姓名进行欺诈性转账。以这种方式创建账户的成本远低于50,000日元。
[3] 有些人喜欢相对主义地争辩说,所有自然语言具有相同的复杂性,这样的比较是毫无意义的或无知的(或种族主义)。这是错误的。儿童学习不同自然语言的速率不同(例如,丹麦语与克罗地亚语);这对他们的教育有实际影响(为什么爱沙尼亚和芬兰——语言高度相似且拼写规则——在PISA上的排名如此之高,而更富有和健康的瑞典语芬兰少数民族得分却较低?)。以语法性别为例来说明;英语几乎没有性别之分,当一位说英语的人学习法语时,男/女性别以及与之相关的拼写和词尾差异可能会让他觉得这是多余的复杂性。他是对的。性别规则,特别是记忆每个单词的性别,是任意的,不传达任何意义。它们是随机的——压缩算法会对它们感到棘手。
我们可以进行一个思想实验(无需明确诉诸于算法信息论);设想一个法语变种,它类似于法语,但其中存在第二个性别系统,比如有20种不同的性别(以及相应的拼写和词尾),并且对于《法兰西学院词典》(https://en.wikipedia.org/wiki/Dictionnaire_de_l'Académie_française)中的50,000个单词,一个随机数生成器 决定每个单词的性别。根据定义,随机数生成器的输出是不可预测且不可压缩的。对于法语变种,法语使用者所能做的就是记忆50,000个性别指示,如果他们想要说正宗的法语变种。显然,法语变种比法语更复杂——所有法语变种使用者所要做的就是快乐地忘记他们记忆的成千上万的二十进制性别。(如果这在直觉上不够有说服力,那么就将性别的数量增加到图尤卡语的140种,或者50,000种,或者语言中单词的数量;性别规则会极其复杂,语言中没有任何简化。)
[4] 另请参阅 Wallace 关于 Tracy Austin。
[5] 考虑一下Paul Graham的文章“为什么书呆子不受欢迎”:
我认为,这就是问题的根源。书呆子有两个主人。他们当然想受欢迎,但他们更想变得聪明。而在美国中学这种竞争激烈的环境中,受欢迎并不是你可以在业余时间做的事情……
……书呆子们没有意识到这一点。他们没有意识到受欢迎需要付出努力。一般来说,一些非常苛刻领域之外的人没有意识到成功在多大程度上取决于不断的(尽管通常是无意识的)努力。例如,大多数人似乎认为绘画能力是一种天生的特质,就像身高一样。事实上,大多数“会画画”的人都喜欢画画,并且已经花了很多时间去做这件事;这就是为什么他们擅长于此。同样,受欢迎不是一种你有或没有的东西,而是你自己创造出来的东西。
[6]亨利·法雷尔([“对于每一个新的极客文化,一个极客层次结构”](https://web.archive.org/web/20120326064946/http://tpmcafe.talkingpointsmemo.com/2008/06/18/ im_happy_that_clay_is/)),讨论 Clay Shirky 的大家都来了 ,同意 Shirky 和我的观点,即互联网正在降低小团体的成本,从而鼓励它们的使用,但不同意它们可以成为较大团体的“替代品”:
因此,例如,当贫穷的学者嘲笑富人的“庸俗”品味时,他们半意识地试图提高自己拥有的那种文化资本(他们自己定义的“好品味”)与富人拥有的那种经济资本(金钱)之间的兑换率。
这有助于我们更好地思考群体之间的地位关系。你可以把群体看作是为其成员提供文化、社会和(有时)经济资本的。但是有些群体提供的资本比其他群体更有价值。这就是说,他们生产的资本类型可以比其他群体生产的资本类型更容易地兑换成其他类型的资本。例如,精英《魔兽世界》玩家群体的成员在将自己的地位资本兑换成经济资本方面将比精英高尔夫球手群体的成员面临更大的困难(无论你作为暗夜精灵盗贼有多好,你都不太可能通过代言赚到数百万)。同样地,正如克莱所说,你不太可能在《纽约时报》上被报道……我怀疑有三个主要的影响[由廉价群体产生]……第二——当混乱稳定下来形成某种相对稳定性时,兑换条件将发生[重大]变化。一些群体将比过去表现得更好,而一些群体则更糟。互联网的到来提高了许多极客文化形式的相对地位——像BoingBoing这样的网站在文化上扮演着非常重要的角色。同样,互联网也允许网络草根挑战并部分取代民主党政治内部等级制度中的现有群体(如DLC)。但请注意,这并不是逃避文化等级制度;这是对现有交换等级制度的重新排序。这种重新排序往往具有吸引人的特点(在新技术解放的新世界中,每个人都可以有效地创建自己的地位等级,在那里,他们(由于掌握了毛毛虫绒毛计数或一维)
……克莱可能更关心《魔兽世界》里发生的事情,而不是职业高尔夫,而且从自己是《魔兽世界》高手的事实中获得快乐。但他也可能发现,很难将自己的《魔兽世界》实力转化为其他类型的资本。如果他想要组织一场由一流《魔兽世界》玩家参加的比赛,为自己最喜欢的慈善机构筹款,他几乎肯定筹到的钱会比他能招募到一流职业高尔夫球手时筹到的钱少得多。新群体的激增可能会使相对地位的游戏变得复杂,但肯定不会取代它们。
[7] “我十五岁时,生活一团糟。我在现实世界中是一个无名小卒。然而,一旦我能够在网络世界中创建自己的角色,我就可以成为任何人或任何人,并且游戏的进展变得立竿见影且令人欣喜。在现实世界中取得成功是一个非常艰巨、漫长、有时甚至充满风险的过程。很难向一个十几岁的男孩解释他可能需要等待十年才能不再对自己的生活地位感到如此不安全。” —Waygook 对[“估计有 190 万韩国人患有网络成瘾”]的影响(https://web.archive.org/web/20101206023012/http://www.thewaygookeffect.com/2010/11/estimated-19 -百万韩国人-with.html)。西方式的学校教育(普遍强制实行年龄隔离的机构)似乎几乎是有意加剧青少年的痛苦;另请参阅蝇王,约翰·泰勒·加托[美国教育的地下历史](https://en.wikipedia.org/wiki /The_Underground_History_of_American_Education),以及 Paul Graham 的 “为什么书呆子不受欢迎”。
[8] 日本再次成为我们的榜样。 Spike Japan审视[卡拉OK的衰落](https://spikejapan.wordpress.com/2011/03/06/kyushu-postscript-a-haikyo-杂记/),并通过对日本公民的时间调查将其与“原子化社会”联系起来,调查显示“与家人交谈”、“做运动”等活动大幅减少,甚至“照顾老人”等活动也大幅减少'。
[9] 考虑[“全球新精英的崛起”](https://www.theatlantic.com/magazine/archive/2011/01/the-rise-of-the-new-global-elite/308343/ ),《大西洋月刊》,其作者发表社论:
然而,对我们这个时代来说更为重要的是,今天的富人也不同于昨天的富人。我们光速发展的、全球互联的经济催生了一个新的超级精英阶层,这个阶层在很大程度上是由第一代和第二代富人组成的。它的成员们勤奋工作、受过高等教育、经常乘坐私人飞机,他们认为自己是残酷、激烈的全球经济竞争的理所当然的赢家——因此,他们中的很多人对我们这些不太成功的人持有一种矛盾的态度。也许最值得注意的是,他们正在成为一个跨国界的同僚社区,彼此之间的共同之处比与本国同胞的共同之处还要多。无论他们的主要住所是在纽约还是香港,莫斯科还是孟买,今天的超级富豪们越来越多地形成了一个独立的国家。
[10] 当然不是按国民生产总值计算,这仅对政府有意义,而是人均;也就是说,在我们的日常生活中,真正重要的指标。
[11] 尽管人们对“美好的旧时光”(那时人们晚饭后同时在相同的三个电视网络上观看相同的一小撮节目……)的怀念之情应被以下事实所抵消:许多人正拼命逃离这种亚文化。
[12]第90页;正如“迈克尔·克罗格,克服讽刺:查克·帕拉尼克的窒息的创造性和破坏性力量”
[13] 生物圈2号实验的参与者由于营养(传统)饮食和日常农业劳动,出来时体重减轻,健康状况得到改善;但令人震惊的是,他们报告说自己的心理健康状况也大大改善;在纳尔逊和邓普斯特(Nelson & Dempster)1996年撰写的《生活在太空:生物圈2号封闭初期的结果,火星封闭生态系统的早期试验台》一书的第7.7节(“人类作为封闭生态系统中的参与者”)中(前者是参与者):
……两年封闭实验的一个较为微妙但重要的结果,与生活在小型生物圈系统中的人类维度有关。如前所述,生物圈2号的设计部分是基于认识到创造一个美丽的地方很重要,因为这个系统不仅是功能性生命支持系统,而且是机组人员在居住期间所处的“世界”。第一任务的八名生物圈成员中的每一位都报告说,他们意识到自己与这个世界的联系越来越紧密。这个世界如此之小,以至于每一个行动都被视为对其功能产生或多或少的影响。没有“匿名”的行动——反馈循环几乎是即时的。人们也不能错误地认为系统中某一部分的行动不会在其他地方产生后果。
在一份仍在体验生物圈2号内部生活现实的论文中(Nelson和Alling,1993),其中的两名成员这样表达:
我们在过去十九个月内在这个封闭系统中的个人经历极其令人满意。作为我们这个小世界的一个不可或缺的部分,既要负责维护它,又要从它的支持中获益,这既令人满足又充满挑战。它改变了我们对人类在所有封闭系统中角色的看法,无论是像生物圈2号这样的人造系统,还是像生物圈1号这样的自然封闭系统,即我们地球的生物圈。我们与我们的生物圈建立了一种伙伴关系,通过利用我们自己的资源,以及借助外部广泛的科学家和工程师网络,并使用旨在协助创造所需环境条件的技术,来增强生物圈的福祉。这种努力中出现了一种新的和谐,因为我们的日常经验证实了这样一个事实:我们依赖生命系统生存,同时,生态系统也依赖我们的努力来最大限度地提高生产力和维持整体健康。在一个小的封闭生态系统中,“我们的生物圈的健康等于我们的健康”这一等式变得极为明显。
[14] 自主技术:失控的技术 (1989),兰登·温纳
[15] 活动家 Julian Assange,[“2007 年 6 月 16 日星期六:每个人但没有人想拯救世界”](https://web.archive .org/web/20071020051936/http://iq.org/#Everyoneandnoonewantstosavetheworld)
你必须满足你内心的本能,否则你将与自己的性格产生冲突。只有当我们的内在与我们的基本性格不产生冲突时,我们才能发现生活的意义。要运用你拯救世界的本能,需要你拯救你所感知到的世界。作为现代人,受过教育且见多识广,你感知到的世界是无比庞大的,这与你祖先所生活的山谷世界相比是让人无力的,因为在那个世界里,你的情感得以塑造,拯救10个人就等于拯救了“世界”的10%的人口。
实现你的角色时存在困难。你感知到的世界如此广阔,以至于你无法想象你的行动能产生有意义的改变。
[16] “暴力史”:Edge 大师班 2011
[17] 我们可以更正式地扩展这个论点。社会“地位”,无论它是什么(像时间一样,它很难定义,但它至关重要,每个人都理解它),通常被认为是一种地位商品:“其价值主要是(如果不是完全)由其他人对其相对于替代品的可取性排名的函数。”如果我们将其想象成一个书架,我们可以看到如果我们将一本书移到最左边的位置,我们就会迫使其他所有书向右移动。书架可能没有装满,在这种情况下,我们可以将所有书向左移动,但不会太多,我们很快就用完了空隙。如果我们想将书更向左移动,我们能做的就是彻底摧毁书架。这与许多其他商品不同,比如经济财富——我们总是可以“让蛋糕变得更多”。这种徒劳使社会地位看起来像是一个零和游戏——我们所能做的就是重新洗牌地位,而不是增加它,不像常规的经济场景,它们可以是并且经常是正和游戏。但至少地位不是一个负和游戏——对吧?这是一个重要的问题,因为地位影响了许多重要的那些很难被买到的事情,比如增加寿命(公务员等级,以及诺贝尔奖如果不是奥斯卡)。
金钱的一个有趣之处在于,尽管我们经常在讨论功利主义时将其用作效用的同义词(“欧米茄给你在一个盒子和两个盒子之间进行选择;第一个盒子有一千美元……”),但这并不正确。在数量较少时,金钱是效用的一个很好的近似值,但随着数量的增加,每增加一美元,对所有者来说效用的增加就越来越少。你的第一个一百万美元会对你的幸福产生巨大的影响,你的第二个一百万美元就没有那么大的影响了,以此类推。也许比尔·盖茨并没有考虑到他的净资产波动甚至达到数亿美元。因此,当这个细节出现时,我们说“效用与财富呈对数关系”,以表达每一美元的价值都比前一美元少的观点。(另见范围不敏感性和韦伯-费希纳定律。)递减回报意味着你可以仅仅通过转移美元来改变一个群体的净幸福/效用。然而,仅仅通过转移美元并不能改变净美元!
举一个冗长的例子来说明:假设我们有1000美元和100个人,每美元的效用是基本的自然对数。如果我们把1000美元都给了一个人,那么这个人有1 × ln(1000) = 6.9个效用单位,其他人没有钱,效用为负无穷(他们一无所有,非常不开心),总效用为负无穷;如果我们稍微公平一点,给每个人1美元,然后把剩下的900美元给一个人,他有1 × ln(991) = 6.8个效用单位,其他人有99 × ln(1) = 0个效用单位,总效用为6.8个效用单位。如果我们现在给每个人5美元,把剩下的500美元给一个人,他有1 × ln(505) = 6.225个效用单位,其他人有99 × ln(5) = 159.34个效用单位,总效用为165.56个效用单位——相当大的改进!如果逻辑上每个人都得到相等的金额(10美元),我们发现总效用已经变成了100 × ln(10) = 230.26个效用单位,这是在我们这个小群体中可能达到的最高值。
事实上,有很多证据表明人们的效用函数在财富方面呈对数型,也有全球性的普遍证据表明经济不平等使人们不快乐,这也是为什么即使日本人或斯堪的纳维亚人在许多指标上更贫穷,但他们比美国人更快乐的一个主要因素(例如参见伊斯特林悖论)。将这一简单模型应用于现实世界的政策建议有点困难,因为经济不平等可能通过财富集中在少数人手中(例如盖茨的巨额慈善事业)和保留拼命工作的激励(因为减少经济不平等的通常机制涉及[累进税制](https://en.wikipedia.org/wiki/Progressive_tax and redistribution)和再分配的形式),来促进经济增长,而经济增长意味着未来可能会有更多的财富可供分配,这可能证明目前放弃效用增加是合理的。
现在我们回到地位的话题。我们已经概述了金钱如何优于地位;并且我们刚刚看到,为了在任何特定时间最大化效用,我们想要重新分配金钱。我们不能简单地说“地位效用是对数型的”,因为没有像“效用单位”或“美元”这样的“地位单位”可以重新分配(尽管有人提出了类似的概念,比如科幻作家科里·多克托罗的基于Whuffies的后稀缺社会),因为地位更多的是序数 而非基数。(我们语言中常见的区别强调金钱不是地位:“暴发户”、“乡巴佬”、“暴发户”/“新钱”、“暴发户”、“社交攀附者”、“新贵”等。人们可以通过向富人经常光顾的机构捐款来尝试购买地位,但这将花费不菲。)我们可以尝试做的是想象比较拥有更多或更少地位种类的情况,并询问它们在总效用上有何不同。
再次想象我们有100个人,假设他们可以选择1种或2种地位。我们可以称它们为“科学”或“艺术”地位——科学家不在乎他们在艺术家中排名第50,还是排名第一,但他们确实在乎自己是第10名科学家而不是第1名,反之亦然。此外,假设一个人有可能改变想法。基于这种设定,很明显,由于他们可以选择他们拥有的更多地位,所以拥有第二种地位对他们来说并不会更糟。如果一个人发现他在艺术家中排名第五,但在科学家中排名第六,他可以切换自己的身份为“艺术家”,从而变得更好;如果情况相反或他两者排名相同,那么他的处境也不会比以前更糟。由于他在拥有两种地位的情境下,至少和之前一样好,甚至更好,他会更喜欢有两种地位的系统。如果你问他是否更喜欢三种地位,同样的逻辑也适用:如果他在第三种地位上排名高于前两种,他就会切换并变得更好,否则他不会切换,也不会变得更糟。以此类推。这与对数折扣很好地配合:我们将原来的1-100排名分成50-100和另一个50-100,总和增加了:sum (map log ([50..100] ++ [50..100])) → 438.35,这比sum (map log [1..100]) → 363.74要大。
有人可能会反对这个论点,认为这是在暗中引入全新的书架,然后惊呼“现在有更多的空间把书移到左边,因为我可以把一半的书放在原书架的左半部分,另一半放在新书架的左半部分!太神奇了!”这实际上是在说正确的计算方法是sum (map log ([1..50] ++ [1..50])) → 297。
在某种程度上,我们争论的是一个相当深刻的问题:等级制度在现实世界中是如何相互作用的?如果一个亚文化分离出来,他们是否会创造自己的等级制度,其中最高层次的人和其他等级制度中的最高层次的人一样重要?宫崎骏作为现存最伟大的动画导演所获得的效用是否和史蒂文·斯皮尔伯格或马丁·斯科塞斯从他们自己的导演地位中所获得的效用一样多?连线 杂志指出,与大约70亿在世的人相比,维基百科上关于在世的人的文章有604,174篇,这表明“著名”的人大约每1万人中有1个。就名声而言,现代生活似乎进展顺利,这使我认为,名声可以进一步传播。
我个人的观点是,这些亚文化的形成是自上而下的,而非自下而上,因为没有人能够无所不知。如果这一观点正确,那么这些争论就是成立的。既然我们无法重新分配地位本身,我们必须选择次优的方案:我们必须创造或允许人们追求尽可能多的地位种类。明白这一点后,明智的人会摒弃对别人的轻蔑,避免妄加评判。
北冥有鱼,其名为鲲。鲲之大,不知其几千里也;化而为鸟,其名为鹏。鹏之背,不知其几千里也;怒而飞,其翼若垂天之云。
......蜩与学鸠笑之曰:“我决起而飞,抢榆枋而止,时则不至,而控于地而已矣,奚以之九万里而南为?”......斥鷃笑之曰:‘彼且奚适也?我腾跃而上,不过数仞而下,翱翔蓬蒿之间,此亦飞之至也。而彼且奚适也?’”此小大之辩也。
......小知不及大知,小年不及大年。奚以知其然也?朝菌不知晦朔,蟪蛄不知春秋,此小年也。楚之南有冥灵者,以五百岁为春,五百岁为秋;上古有大椿者,以八千岁为春,八千岁为秋。此大年也。而彭祖乃今以久特闻,众人匹之,不亦悲乎?—第一章 of the *Chuang-tzu.
[18] 为什么一夫一妻制在过去的一千年里能够盛行——为什么不允许多妻制 (polygyny)、多夫制(polyandry)、两者都多配偶制(polygamy),甚至全面的多爱关系(polyamory)?为什么在这方面要限制自由,限制得如此严厉以至于社会愿意为此杀人?我发现一个吸引人的解释是,婚姻——性——可能是社会鼓励形成更优化的多重地位层次而非单一地位层次的例子。大致概括一下,这些替代方案似乎归结为多妻制(多夫制非常罕见),而多妻制似乎与那些除了暴力和狩猎外几乎没有其他获得地位途径的社会相关,而一夫一妻制则鼓励男性为伴侣进行经济竞争;相关的是 Roy Baumeister 2010 年的《男人有什么优点吗?》(Is There Anything Good About Men?)(摘要)(https://www.amazon.com/There-Anything-Good-About-Men/dp/019537410X/) (summary,尤其是 Henrich 2012 年的评论,“一夫一妻制婚姻的谜题”(“The puzzle of monogamous marriage”)(强调内容):
人类学记录表明,大约85%的人类社会允许男性有多个妻子(多妻制婚姻),而且无论是从经验角度还是进化论角度来看,绝对财富的巨大差异都应当促进多妻制婚姻的普及。然而,一夫一妻制婚姻已经在欧洲普及,并且最近在全球范围内普及,即使绝对财富差异已经扩大。在这里,我们提出并探讨了这样一个假设:由于一夫一妻制婚姻的规范和制度在促进群体间竞争成功方面具有群体利益效应,因此受到文化进化的青睐。通过抑制同性竞争和减少未婚男性群体的大小,一夫一妻制规范降低了包括强奸、谋杀、袭击、抢劫和欺诈在内的犯罪率,同时也减少了个人虐待行为。通过缓解对年轻新娘的竞争,一夫一妻制规范(i)减少了配偶年龄差距,(ii)降低了生育率,(iii)减少了性别不平等。通过将男性的努力从寻找妻子转向父爱投资,一夫一妻制规范增加了储蓄、儿童投资和经济生产力。通过增加家庭内部的亲缘关系,一夫一妻制规范减少了家庭内部冲突,降低了儿童忽视、虐待、意外死亡和凶杀案的发生率。这些预测通过使用来自人类科学各个领域的证据进行了检验。
[19] 这一点似乎不是我原创的。 Eric S. Raymond 在 [“极客性技巧:如何变得性感”](http://www.catb.org/~esr /writings/sextips/sexy.html)建议失恋的极客获得:
社会地位。现在,这部分变得有趣了——因为即使在不明显的环境中,女性也能察觉到这一点。在某种地位等级中成为阿尔法男性会改变你的肢体语言、性激素水平和汗水的气味。女性会猛烈地追求具有这些特质的男性——问问任何摇滚明星就知道了。
Cathy:“或者问问Eric。他最近的声名鹊起确实增加了他受到的女性关注——包括我。”
但对女性的感受器来说,具体的社会地位等级并不是那么重要。它可能来自社区保龄球联赛,也可能来自世界超级大国的政府。或者它可能是某个知名程序的开发者社区。她闻到的是成功,而不是特定种类的成功。事实上,这种效应在人类行为中如此重要,以至于男性实际上会建立各种奇怪的地位等级,以便有机会成为顶尖人物,即使他们事先知道顶尖人物不会带来多少权力或财富奖励。俱乐部和有组织的爱好就是这样。直到 20 世纪 90 年代末,黑客文化本身纯粹就是这样。从根本上说,这些都是本能地建立在性选择游戏之上的。
[20] 例如,2011年的一项研究“Modeling Users’ Activity on Twitter Networks: Validation of Dunbar’s Number”(《在推特网络上模拟用户活动:邓巴数字验证》(https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0022656) )查看了超过3.8亿条推文,这些推文形成了超过2500万次对话,构成了一个包含超过170万用户的整体社交网络。他们查看的是用户回复给谁的某种平均指标:
......…这个数量对应于每个个体每条外出边的平均权重,其中T代表数据聚合的时间窗口。我们在数据集中测量了这个数量,如图2A所示。数据显示,这个数量在100到200个朋友之间达到最大值,与邓巴的预测一致(见图2A)。这一发现表明,尽管现代社交网络帮助我们记录了所有我们遇到和互动的人,但它们无法克服限制稳定社会关系的生物和物理约束。在图2B中,我们绘制了kiout(即相互连接的数量),作为入度数量的函数。尽管入度数量继续增加,但kiout在200到300之间达到饱和。这种饱和表明,在这个点之后,系统进入了一个新的阶段;新的连接可以被相互建立,但速度比之前慢得多。这可以归因于我们与一些没有保持积极关系的联系人之间的虚假交流。
2011 年的一项脑成像研究(Online social network size is reflected in human brain structure;BBC 报道)发现了更直接的相关性:
……个人参与这些网络的程度差异很大,原因尚不清楚。在这里,我们通过展示个体在基于网络的社交网络服务上声明的朋友数量的定量变化,可靠地预测了右侧颞上沟、左侧颞中回和内嗅皮层的灰质密度,从而展示了这种差异性的生物学基础。这些区域先前分别与社会感知和联想记忆有关。我们还进一步表明,此类在线友谊网络规模的变化与更亲密的现实世界社交群体的大小在统计学上显著相关。然而,我们确定的大脑区域与在线社交网络规模特别相关,而杏仁核的灰质密度则与在线和现实世界社交网络的大小都相关。总的来说,我们的发现表明,一个人的在线社交网络规模与社会认知中涉及的大脑结构密切相关。
[21] 熟练的蓝领工人经常对自己的工作感到非常自豪,并且对自己的生活感到满意,以至于让白领工人感到羡慕(例如,电影《办公空间》[(Office Space)(https://en.wikipedia.org/wiki/Office_Space)],以及马修·克劳福德[(Matthew Crawford)(https://www.amazon.com/Shop-Class-Soulcraft-Inquiry-Value/dp/1594202230)]的著作《工匠之魂:对工作价值的探索》(Shop Class as Soulcraft: An Inquiry Into the Value of Work)(https://www.amazon.com/Shop-Class-Soulcraft-Inquiry-Value/dp/1594202230))。保罗·福塞尔(Paul Fussell)(https://en.wikipedia.org/wiki/Paul_Fussell)的《阶级:透过美国地位系统看世界》[(Class: A Guide Through the American Status System)(https://www.amazon.com/Class-Through-American-Status-System/dp/0671792253)]中的长篇章节对我来说非常真实:
高等劳动阶级的特殊焦虑是担心地位丧失或降低:你以身为高级木匠为荣,并希望全世界都清楚地了解你与劳工之间的区别。中等劳动阶级的特殊焦虑是害怕失业。而低等劳动阶级,则有一种根深蒂固的感觉,觉得自己可能永远赚不到足够的钱或足够的自由来拥有和做他们想做的事。高等劳动阶级所从事的工作诱惑他们坚持自己是真正的“专业人士”,就像大城市里的“清洁工”一样。一位邮递员告诉斯特兹·特克尔他为什么喜欢自己的工作:“他们总是说,‘邮差来了。’……我觉得这是全国最受尊敬的职业之一。”从事护理工作的劳动阶级女性从不厌倦地强调自己的专业性,同样的情况也发生在她们成为空姐的女儿身上,空姐是她们最喜欢的高等劳动阶级职业。虽然军官们,因为他们都害怕老板,可能比高等劳动阶级更接近中产阶级,但他们越是坚持自己是“专业人士”,就越显得地位低下,自从越南战争后他们名誉扫地,以及随后对自己社会地位的焦虑,这种坚持变得越发机械。一位军官的妻子说:“有些人喜欢称医生、律师等为专业人士。所有[军队]军官都是专业人士。”然后,这里有一个明显的逻辑偏差:“还有谁能比把一生都奉献给保卫国家的人更专业呢?”
但高等劳动阶级是相当聪明的,或者至少说是精明的。因为通常他们的工作不会受到密切监督,所以他们有自豪感,有独立的信念,对那些没有他们那么成功的人有些蔑视。正如社会学家E.E.利马斯特斯(E.E. LeMasters)在他们的书中称他们为“蓝领贵族”(1975),他们对中产阶级的蔑视就像贵族从另一个方向看待他们一样。一个高等劳动阶级的人说:“如果我的儿子想一辈子都戴着该死的领带,向某个老板鞠躬,那是他的权利,但上帝啊,如果他喜欢,他也应该有权利靠自己的双手过上诚实的生活。”利马斯特斯说,和其他贵族一样,这些人“已经登上了他们社会世界的顶峰,不需要花费时间和精力去‘向上爬’。”他们在其他方面也是贵族,比如他们对赌博的热爱和对猎鹿的喜好。事实上,他们用鹿角装饰室内,在这方面,他们的住所与苏格兰贵族的庄园相似。高等劳动阶级也像贵族一样,正如奥尔特加·加塞特所指出的那样,“他们倾向于把游戏和运动作为生活的中心”,以及他们对女性的非浪漫态度。因为他们不担心选择正确的地位象征,这些人可以非常放松,没有自我意识。他们可以做、说、穿、看起来像他们想要的任何东西,而不会有过多的羞耻感,这种羞耻感属于他们更优越的中产阶级,羞耻感在很大程度上是一种资产阶级的情感。Jilly Cooper认为,约翰·加尔文是中产阶级的先知,而卡尔·马克思是劳动阶级的先知,即使他们中的大多数人并不知道这一点。
…...高等劳动阶级的人很好。正是在中等和低等劳动阶级中,人们开始展现出一些可能会被视为冒犯的特征。这些人对自己的工作感到不满,通常是因为他们受到严密的监督和管制,通常像对待不听话的孩子一样对待他们。“这就像军队一样,”一名汽车组装厂工人说。“不,情况更糟……你去上个厕所都需要通行证。”安德鲁·莱文森(Andrew Levison)在《工人阶级的大多数》(1974)一书中邀请我们想象,如果总是在工头的注视下工作会是什么样子,“工头这个角色在中产阶级社会中是完全没有对应的。有薪水的专业人员确实有上司,但无法想象教授或高管需要带医生的病假条来说明自己缺席一天,或者需要证明他们上厕所的次数。”中等和低等劳动阶级之所以被这样认为,是因为他们在凡勃伦(Veblen)所发现的“人对人的强制利用”中扮演受害者的角色。(施加强制,而不是被迫接受强制,是更幸运的人的特权:经理、教师、作家、记者、神职人员和电影导演。)事实上,监督的程度往往比单纯的收入更能作为阶级的标志,这表明整个阶级体系更多地是对自由价值的认可,而不是对纯粹金钱价值的宣告。你的工作受到上级监督的程度比你从工作中带回家的钱数更能准确地表明你的真实阶级。因此,高中教师比终身制大学教授“低”。教师有义务每周向主管校长或“课程协调员”提交“教学计划”,从而承认自己的从属地位。而教授则不需要向任何人报告,因此他的阶级地位更高,尽管教师可能更聪明、更有礼貌、更富有。(在公立学校,
[22] 《孤独的力量:没有他人在身边时我们能做得更好什么》(https://archive.boston.com/bostonglobe/ideas/articles/2011/03/06/the_power_of_lonely/?page=full)由莱昂·内伊法克(Leon Neyfakh)撰写,发表于《波士顿环球报》(The Boston Globe)(2011年3月6日)
独处也会产生一些与直觉相反的效果:哈佛大学心理学系的亚当·韦茨(Adam Waytz),是卡西奥波(Cacioppo)的一位前学生,最近完成了一项研究,指出那些与他人有社交联系的人很难认同那些与他们距离较远的人。研究表明,花一定的时间独处,可以让我们不那么封闭,更善于共情——换句话说,就是更好的社交动物。
这引发了一个有趣的思考。还有什么比压力或恐惧更能破坏同理心呢?
[23] 或者,正如托马斯·卡莱尔[(Thomas Carlyle)(https://en.wikipedia.org/wiki/Thomas_Carlyle)]所说(迈克尔·J·迪,(结论) (https://www.amazon.com/CONCLUSIONS-Michael-J-Dee/dp/B001F2XZOK/) 1917):“人与人之间最终的问题就是‘我能杀了你,还是你能杀了我?’”
[24] 内法赫 2011:
伯鲁姆发现,被告知身后的人正在做不同任务(即识别声音而不是看图片)的参与者,在记忆图片方面做得更好。换句话说,当他们认为自己是唯一一个做这项任务的人时,他们会形成更牢固的记忆。
...……伯鲁姆提出了两种可能的理论来解释她和吉尔伯特在研究中的发现。第一种理论引用了社会心理学中一个广为人知的概念,即“社会惰化”,它表明如果人们认为他们可以依靠他人来弥补他们的不足,他们往往就不会那么努力。(例如,如果两个人拉一根绳子,他们每个人拉绳子的力度都不会像单独拉时那么大。)但伯鲁姆更倾向于另一种解释,即与他人共享经历本身就是一种分心,因为它迫使我们花费精力去想象另一个人正在经历什么以及他们对此有何反应。
“人们往往会相当自动地参与到思考他人想法的过程中,”伯鲁姆在采访中说。“当我们与他人在一起时,我们在某种程度上是同时处理多项任务的,而当我们只是独自体验时,我们则不是。”
这或许能解释为什么独自看电影和与朋友一起看电影感觉截然不同:坐在电影院里,身边没有其他人,你不需要猜测别人对这部电影的看法;你也不会期待在回家的路上与朋友们讨论这部电影。你可以将所有的精神集中力放在屏幕上发生的事情上。
[25] 再次引用 Neyfakh 2011:
特别是青少年,他们的性格尚未完全形成,已经显示出从与他人独处中受益,部分原因是这种独处允许他们进行某种程度的内省——并摆脱自我意识——这增强了他们的认同感。伊利诺伊大学人类发展学教授里德·拉尔森(Reed Larson)在20世纪90年代进行了一项研究,在该研究中,配备有寻呼机的青少年被要求在不规则的间隔中写下关于他们与谁在一起、正在做什么以及感觉如何的问题的答案。也许并不令人惊讶的是,他发现他的样本中的青少年在独处时,报告的自我意识要少得多。“他们想待在卧室里,是因为他们想避开别人的目光,”他说。
青少年独处时并不一定更快乐;毕竟,青春期可能是特别难熬的时段,很难脱离群体。但是拉尔森发现了一个有趣的现象:平均来说,他样本中的孩子在独处一段时间后的感觉比独处之前更好。此外,他发现,在非上课时间中,有25%到45%的时间独处的孩子,在一周的研究期间往往比他们的社交活动更为活跃的同龄人拥有更多的积极情绪,他们在学校中更成功,也不太可能自我报告抑郁情绪。
[26] 这是“阿尔杰农定律”的一个很好的例子,它是将没有免费的午餐的原则应用于生物学和进化论上。压力反应使身体为冻结、战斗或逃跑做好准备,并自由提供其他生理上的增强;那么为什么进化没有将这种高性能状态设为默认设置呢?因为它是以一个人的长期健康为代价的。
[27] 伊恩和乔尔·戈尔德,善待我的推特,《边缘》杂志2010年年度问题:互联网如何改变你的思考方式?:
我们最终会面临疯狂。几十年来,精神病学已经认识到,大都市——事实上,任何规模的城市——都会滋生精神病。尤其是精神分裂症,作为纯粹生物性精神疾病的范例,随着城市规模的扩大,其发病率也越来越高,即使这座城市不过是一个村庄。这并不是因为一般的精神疾病在城市中变得更加普遍;也不是因为精神病患者倾向于涌向城市或留在城市中。在我们为自己创造从真正的朋友到几乎陌生人的更大社交群体的过程中,我们是否正在为精神疾病发病率上升的致病性虚拟城市奠定基础?或者脸书和推特会让我们更接近亚里士多德意义上的朋友,他们可以作为抵御他人疯狂制造力量的心理预防?无论互联网对我们的内在生活产生什么影响,很明显,在改变我们外在生活的结构——与他人的生活交织在一起的生活——方面,互联网可能比我们所想象的更有力地塑造我们的思想。
诗意够了吧;这里有一些关于城市风险因素的硬数据,这些数据来自欧洲对精神分裂症的分析(“丹麦精神分裂症家族史、出生地和出生季节作为风险因素:复制和再分析”(https://www.cambridge.org/core/journals/the-british-journal-of-psychiatry/article/family-history-place-and-season-of-birth-as-risk-factors-for-schizophrenia-in-denmark-a-replication-and-reanalysis/9B8827470526D52591F800144888AC7F)):首都使你的精神分裂症风险增加230%(超过两倍!);住在郊区会使风险降低到173%;人口超过10万的城市将风险“仅仅”降低到158%,以此类推,直到人口为1万至2万的小城市,风险增加122%。(这些数字已针对通常的风险因素进行了调整,如父母年龄、性别和[家族史](http://www.med.mcgill.ca/epidemiology/courses/EPIB591/Fall 2010/Class 5 - 15 Sept/Mortensen -- NEJM 1999.pdf),但显然没有针对智商或社会经济地位进行调整;换句话说,风险可能来自基因-环境相互作用,这种相互作用导致了精神分裂症。)2010年对20项人口调查的荟萃分析发现,一般的关联较弱,但与抑郁症的关联较强。因果关系一如既往地不明确:精神分裂症具有高度遗传性,而比调整[家族史](https://en.wikipedia.org/wiki/Family_history_(medicine)更复杂的方法表明,因果关系可能是相反的,城市吸引了容易患精神分裂症的家庭(Sariaslan等人2014年)。这是一个棘手但仍有趣的话题。
值得注意的是,在迫害妄想、宗教妄想、夸大妄想和躯体妄想这四种“妄想”中,只有迫害妄想在美国20世纪有所上升;在这几种妄想中,哪一种是你认为会受到城市环境和人群鼓励的?
如果我们从另一个角度来看,我们会期望自然环境有助于康复或至少有助于提高精神表现;而这确实是我们发现的:
前一项[实地研究]包括野外背包旅行和非野外度假条件,以及参与者继续他们的日常活动的对照条件。后一项研究包括城市环境、自然环境和被动放松条件。恢复的多方法评估包括情感状态、认知表现的自评,以及在后一项研究中,还包括生理指标。两项研究获得的收敛自评和绩效结果均表明,与自然环境中的体验相比,其他条件产生的恢复效果更大。
One一项[功能性磁共振成像(fMRI)](http://sa.indiaenvironmentportal.org.in/files/City living.pdf)研究发现,城市居民在解决难题时感到压力时,杏仁核的活动增加;那些仅在城市长大的人也显示出与杏仁核相关的另一区域 ——扣带皮层的影响(主流媒体报道)。自然光照在医院和学校中显示出许多好处,这是对城市所有建筑内部的有趣评论。或者考虑2009年泰勒的研究,通过实验验证了[调查结果](https://ajph.aphapublications.org/cgi/content/abstract/94/9/1580:自然环境对注意力问题有积极的影响 (New York Times)。
17名7至12岁的儿童被专业诊断为ADHD[(注意力缺陷多动障碍)(https://en.wikipedia.org/wiki/Attention_deficit_hyperactivity_disorder)],他们通过个人引导的20分钟步行体验了三种环境——一个城市公园和两个其他维护良好的城市环境。这些环境的体验间隔一周,治疗顺序随机分配。每次步行后,使用数字广度向后测量了儿童的注意力集中程度……患有ADHD的儿童在公园散步后的注意力集中程度比市中心散步后(p = 0.0229)或社区散步后(p = 0.0072)更好。效应大小 相当大(分别为d = 0.52和0.77),与最近报道的甲基苯丙胺制剂相当。
即使是少量的自然景观也有帮助;泰勒等人在2002年"自然景观和自我约束:来自城市内部儿童的证据" 发现,在随机分配到仅有几棵树而不是没有树的公共住房的女孩中,注意力和自我约束的得分有了高度[统计学意义上的]显著提高,这是对早期研究发现在类似的随机分配高层公共住房中注意力的好处 的后续研究。(之前提到的调查的一个有趣的推论是,同一作者对这些数据的后期分析发现,如果儿童经常在绿色和开放的环境中玩耍(如足球场或宽阔的草坪),而不是在绿树成荫或室内或人造的户外环境中玩耍,他们的症状往往会较轻(Science Daily 描述)。Berman等人2008年发表的《与自然互动的认知益处》(“The Cognitive Benefits of Interacting With Nature”)发现,在公园中散步50分钟后,工作记忆和注意力得分比在周围城市中有所提高。进一步阅读:
-
[“绿色运动对身心健康的影响”](https://www.greenexercise.org/pdf/IJEHR 绿色运动 (Pretty et al 2005).pdf), Pretty et al 2005
-
“社区绿化与身心健康的关联:步行、社会一致性和当地社会互动可以解释这些关系吗?”,杉山等人 2008
-
“什么是改善心理健康的最佳自然剂量和绿色运动?一项多研究的元分析”, Barton & Pretty 2010
-
“在户外自然环境中参加体育活动是否比在室内进行体育活动对身心健康有更大的影响?系统回顾”, Coon 等人 2011
-
“基于锻炼、自然和社交互动的举措可以改善临床人群的情绪和自尊”,Barton 等人2012 年
-
“与自然互动可以改善抑郁症患者的认知和情感”,Bergman et al 2012
-
“在绿色城市地区生活你会更幸福吗?面板数据的固定效应分析”,White 等人 2013
-
“搬到绿色和绿色程度较低的城市地区对心理健康的纵向影响” Alcock et al 2013
-
“接触社区绿色空间和心理健康:来自威斯康星州健康调查的证据”,Beyer et al 2014
-
“绿色与精益办公空间的相对优势:三个现场实验”,Nieuwenhuis 等人 2014
-
“利用遥感将马萨诸塞州小学的学生表现与学校环境的‘绿色’联系起来”,Wu等人 2014
-
[“森林浴(吸收森林气氛或森林浴)的生理效应:来自日本 24 个森林实地实验的证据”](https://www.ncbi.nlm.nih.gov/pmc /articles/PMC2793346/), Park et al 2009 / [“高山村山区森林浴或森林浴的生理效应”](https://www.u-ths.ac.jp/wp-files /2014/04/kiyou2013-5.pdf),Kondo 等人 2013
-
“空置绿化对社区成年人心理健康的影响:整群随机试验”,South et al 2018
-
[“公共绿地对急性心理生理应激反应的影响:对实验性和准实验性证据的系统综述和元分析。”](https://gwern.net/doc/psychology/nature/2019-mygind. pdf),Mygind 等人 2019
人们会想到非洲大草原和“进化适应环境”。)
[28] Cochran et al 2000 建议:
精神疾病的季节性和地理性变化也类似地表明存在感染性原因。精神分裂症和严重抑郁症在冬季和春季出生的婴儿中更为常见,大约高出10%,而这正是呼吸道感染较为常见的时期83,[84]。精神疾病与城市化程度的地理关联早于20世纪社会,并且与高密度生活状况相吻合,无论具体情况如何;因此,城市生活与精神疾病之间的关联很好地符合了感染性原因[85, 86].
[29] 我无法找到这方面的任何来源,或 2010 年之前的引用;这很可能是杜撰的。尽管如此。
[30] 我还想起了动画导演鹤见和哉在2001年说过的话(呼应了庵野秀明——他恰好在《起风了》中为二郎配音(巧合?)——评论他自己的父亲和《EVA》角色碇源堂):
Tsurumaki在Otakon小组讨论会上说:“坦白说,我很高兴美国人喜欢我的作品,但《新世纪福音战士》的电视剧和电影、《他和她的故事》以及《FLCL》基本上是为日本观众制作的。所以当我听说它们在美国观众中广受欢迎时,我感到非常高兴;但与此同时,我也感到有些尴尬。”当PULP问他这是什么意思时,Tsurumaki说:“例如,在《新世纪福音战士》中,我认为碇真嗣这个角色只会被这一代的日本粉丝所理解。但当我发现美国人也理解他这种类型的角色时,我很高兴——或者更确切地说,很震惊。”我很感激导演对我们隐含的投信任票,但我不知道经常被人谈论的日本文化独特性是否强大到足以抵消青少年叛逆这一普遍事实,更不用说哥伦比亚中学枪击案等事件的全球报道了……Tsurumaki说,Gainax 的大部分作品也针对“倾向于比较软弱,并且与家庭有问题”的观众群体——Gainax的导演就是这种人。“一代人以前——也许现在也是——日本有很多家庭的父亲都是工作狂,很少回家。他们脱离了自己孩子的生活。我自己的父亲就是这样,直到最近我才有机会和他相处。我和Hideaki Anno是同一类人。这可能影响了我创作的动画类型。”
[31] 文明本身也是值得怀疑的;新石器时代的农民比他们的狩猎采集者同行们生活状况要糟糕得多,疾病缠身,营养标准更低,定居的村庄与减少的自由度有关。
[31] “武士正变得柔和:日本对硬件而非软件的偏好正在减弱”,《经济学人》:
日本长期以来都在制造广受欢迎的视频游戏软件——问问马里奥兄弟就知道了。然而,其计算机制造商在培养独立软件业务方面做得很少。东京大学的Kazuyuki Motohashi教授表示,相反,他们将程序免费捆绑在机器上,向客户灌输软件价值不高的观念。他们还锁定了客户,让客户难以转向竞争对手,而且代价高昂、手续繁琐……据INSEAD商学院表示,尽管其他地方的软件公司增长了15%,但自2008年以来,日本软件公司已经损失了20%的市场价值。在软件支出占GDP的比例方面,日本排在第35位,与沙特阿拉伯大致相当……日本本土的软件行业面临着几个障碍。该国缺乏风险投资、活跃的股市以及具有技术知识来培育初创企业的天使投资者。Netyear公司的创始人Fujiyo Ishiguro表示,日本的大型、缓慢的企业往往会扼杀小鱼小虾(初创企业)。Netyear是一家网络营销软件公司(也是日本为数不多的上市公司女性高管之一)。目前,硬件是王道。当日本理化研究所和富士通在6月推出世界上最快的超级计算机时,报纸欢呼雀跃。但Ishiguro女士表示,向无形的转变是不可避免的。
教育和学习无关
一些唾手可得的事例表明,教育系统并非以优化学习为宗旨。
Greenspun
https://washingtonmonthly.com/features/2007/0709.careycascadia.html:
然而,在另一所大学,情况则……截然不同,「难度更大」。首先,她的教授似乎从不直接讲解任何内容。相反,他总是提出一些看似含糊其辞的问题,然后让学生们「自己去查资料,找出答案」。即使在忙了一整天卖爆米花后,她也不敢逃课,因为她是一个研究小组的成员,大家共同探讨棘手的难题,她不想辜负团队的期望。她确实感到收获颇丰,但始料未及大学学习竟会如此繁重。
不过,Hayley 在卡斯卡迪亚学院(毗邻华盛顿大学)的求学经历,充分体现了该校的比较优势,这一点有确凿的数据支撑。尽管该校学生入学时的学术背景通常不如华大新生,但他们中那些毕业后继续在华大深造的卡斯卡迪亚学子,成绩优于其他学生。再也找不到比这更有力的证据,来证明学生在卡斯卡迪亚受到的教育更加优质。
事实上,其他教学质量评估指标也证实了卡斯卡迪亚是美国首屈一指的社区大学。权威教育杂志《华盛顿月刊》根据备受推崇的「学生参与度社区大学调查」数据,首次发布了全美顶尖两年制大学排行榜(详见「美国最佳社区大学」)。卡斯卡迪亚不仅在总排名中位列第二,在与学业成绩和毕业率关联最为密切的「积极协作式教学」评分上更是高居榜首。
卡斯卡迪亚非同寻常的成就令人瞩目,但其成功秘诀并非高额资金投入,该校的人均教育经费与一般社区大学相仿,仅为华盛顿大学的一半。卡斯卡迪亚的卓越表现也并非源于某种其他教育工作者不知道的神奇公式。事实证明,不过多解释、而是让学生通过小组合作探究答案的教学模式,正是被证实最有助于学生学习的有效方法,这一点已经得到数十年研究的支持。然而,绝大多数四年制学院和大学却并未采用这种方式教授本科生,他们过于依赖于陈旧而低效的教学方法,尽管没人认为那些方法真正行之有效。
遗憾的是,这里存在一个问题:事实证明,古老的教学模式并不适合大多数本科生。单调乏味的讲座很难调动学生的积极性,也无法推动他们投入到有难度的动手实践中,而这恰恰是真正掌握大学课程的关键。培养教授的博士项目几乎没有涉及教学理念或方法的指导,而是专注于培养某个狭窄学术领域的专才。教授的聘任和晋升完全基于他们的科研能力,而非教学水平。
极具洞察力的观察家意识到,盲目扩张一套不适合本科教育根本宗旨的体系是一个错误。1963 年,加州高等教育系统的缔造者 Clark Kerr 在哈佛大学发表了一场振聋发聩的演讲。他直言不讳地指出「一流的教师队伍导致对本科教学的忽视」是一个「残酷的悖论」。他进一步解释道,对科研的重视和对教学的投入「并不像我们最初设想的那样协调 … 德国的洪堡模式假定教学必然能因科研而全面受益,但事实并非如此。」Kerr 敏锐地洞悉,其他人后来也逐渐认识到,这种偏差最终导致了「本科教育政策的荒废」。
20 世纪 70 年代,高等教育的大规模扩张趋于平稳。与此同时,一批研究者开始探索和定义优于当时大多数本科生所接受教育的教学方法。其中最著名的要数 Arthur Chickering 和 Zelda Gamson 在 1987 年发表的一篇开创性论文《本科教育良好实践的七项原则》(Seven Principles for Good Practice in Undergraduate Education)。他们综合了多年来认知科学和教育研究的成果,勾勒出了有效教学的基本原则:学生越是积极投入到学习中,就越能够掌握知识,培养关键技能。本科生在解决问题、开展原创研究、合作学习,并得到教授和同学及时反馈时,收获最大。相比之下,被动的、缺乏互动的讲座式教学无疑是最糟糕的教学方式。
一个重要公共机构存在明显缺陷,众所周知却长期被忽视,这种情况并不多见。但在高等教育领域,这恰恰是一直在发生的事情。Clark Kerr 在 1963 年提出的观点今天依然发人深省。Chickering 和 Gamson 的七项教学原则发表于 20 年前,如今卡斯卡迪亚学院的成功实践已经证明,这些理念不仅在个别课堂行之有效,更可以在全校推广。然而,低质量的教学现象仍普遍存在。正如哈佛大学前校长 Derek Bok 最近指出的那样,「大学虽然给学生带来诸多益处,但远没有尽到应尽的责任。」大学肩负着传道授业、探求真理的使命,却拒绝采用已被证实行之有效的教学方法,这种讽刺现象既令人痛心,影响也极为深远。
改变这一现状绝非易事。新建高校的机会不多,既有院校也不能全盘推倒重来。同时,我们没有理由相信高等教育机构会主动变革。
然而,有一个被证实能够让许多大学校长重视并迅速推行改革的方法,那就是改变他们在市场中的声誉。U.S. News 的大学排名虽然存在严重缺陷,但其影响力却不容小觑。当该杂志将校友捐赠率纳入排名因素后,全国各地如雨后春笋般涌现出数百个呼叫中心,在晚餐时间骚扰民众要求捐款。如果学校的声誉取决于教学质量的评估标准,高等教育领导者们就不得不做出他们数十年来竭力回避的艰难抉择。衡量四年制大学教学卓越性的可靠指标确实存在,但目前只有大学管理者才能接触到这些数据。学生和家长需要先了解这些信息,才能推动学校进行改革。华盛顿应当要求这些信息向所有人公开。
https://philip.greenspun.com/teaching/universities-and-economic-growth:
在 11 世纪,教授讲课是非常必要的。除了讲课,还有什么方法能将知识从一个人传播给 100 个人呢?印刷成本高昂,工序繁琐。让修道士手抄 100 本教科书,在经济上根本行不通。
大学还引入了一项重要的质量控制机制:学生协会根据教授的教学水平、吸引学生的数量以及是否准时上课,来决定教授的薪酬。
过去,学生去教室听课和完成课后作业是理所当然的事情。那时学生的住处可能没有暖气,去教室上课仅仅是为了取暖也无可厚非。1088 年的学生没有电视、收音机、互联网、电子邮件、即时通讯、手机等娱乐设施,学生去听课很可能只是为了在课堂上寻求一些娱乐消遣。
在那个年代,学生完成作业只能在图书馆或者家中,而这两个地方都没有电视、电子游戏、电子邮件等让人分心的事物。
这如何改变了上课的方式?我们仍然有讲座和家庭作业,就像 1088 年一样。试想,还有什么行业能够在完全不融入过去 1000 年中一些技术的情况下生存发展呢?
技术的改进使得传统的大学教学方法效果大打折扣。学生在温暖舒适的公寓里,睡个懒觉似乎比去听课(或者看《早安美国》)更有吸引力。而坐在课堂上的学生,手里拿着可以浏览网页、收发短信、玩游戏、跟同学分享照片或视频的电子设备,也很难全神贯注听讲。
在现代化的宿舍里完成作业更是困难重重,电视、互联网、YouTube、即时通讯、电子邮件、电话和电子游戏无处不在,诱惑着学生们分心。在这种大环境下,能够在大学四年的学习生涯中受益最多的,往往不是那些最有天分的学生,而是那些能够养成良好学习习惯的学生。
尽管让员工在家办公可能节省开支,但没有公司愿意完全依赖这种方式来完成工作。公司之所以愿意花费大量资金租赁商业办公场所,就是为了创造一个受干扰较少的环境,让员工在此度过每天的大部分时间。
犹他州一所初创的盈利性计算机科学大学──Neumont 大学向我咨询如何规划学校发展。由于他们不知道这些想法有多不可行,因此采纳了我提出的大部分建议。他们的学生多来自中产阶级家庭,不需要长时间的暑假参加父母安排的欧洲旅行,也无需在冬季休一个月的假去加勒比海游玩。学校只是简单调整了授课时间,从周一到周五,朝八晚五,全年授课,学生就可以在约两年半内获得计算机科学学位,比传统大学少花一年半时间,也就减少了一年半向父母要钱的时间。
Neumont 还采用了项目制学习模式。尽管该校新生的 SAT 成绩和高中成绩远低于犹他大学新生,但 Neumont 的教学成果更胜一筹。相比之下,在犹他大学修完传统的「讲座+作业」的计算机科学课程的毕业生,年龄要比 Neumont 毕业生大 1.5 岁,起薪更低,就业机会也更少,尽管犹他大学拥有更优秀的生源和 150 年的历史积淀。
https://philip.greenspun.com/blog/2007/08/23/improving-undergraduate-computer-science-education/:
讲座怎么样?如果你需要向 100 个人广播一些信息。在 1865 年,印刷成本高昂,电话、电视和互联网尚未出现,讲座可能是向众多听众传播知识的不二法门,尽管人类的阅读速度是听觉的三倍。相比之下,到了 2007 年,教师只需给学生发送电子邮件或提供网页链接,便可轻松地给 100 个人共享资源。
-
大量研究表明,长时间的讲课往往效率奇低。美国联邦航空局规定,飞行学校的授课时长不应超过 20 分钟左右。
-
学生学习收获最大的,其实是在实验和项目中。一所将实践项目作为教学核心的大学,已迅速跃居美国本科工程院校之首(https://www.olin.edu/)。
-
工程师成长的关键,在于参与一系列规模不断递增的项目,而非机械地完成每周的作业或一个大项目的零散部分。
-
计算机科学本科所学的一切,都可纳入涵盖完整工程周期的项目予以传授——比如布置开发飞行模拟器的任务,同时在其中教授物理和微积分的知识。
-
在互联网时代,将授课与评分分离不仅有意义,而且易于实现。教师可以设定标准,但学生最终是否达标,则交由他人来评定。
https://philip.greenspun.com/teaching/undergrad-cs https://philip.greenspun.com/teaching/teaching-software-engineering
暑假对学生的学习会造成严重的负面影响,而低收入家庭的孩子受到的冲击尤为严重 https://www.rand.org/pubs/monographs/MG1120.html https://www.rand.org/content/dam/rand/pubs/monographs/2011/RAND_MG1120.pdf:
暑假期间,许多学生的知识和技能都退步了。暑假结束后,学生的学习表现平均比春季学期末倒退了一个月之久。然而,这种「平均」退步并非每个学生都会经历。暑假学习退步对低收入家庭的学生影响更加显著。尽管所有学生在暑假期间的数学成绩都有所下滑,但低收入家庭学生在阅读能力方面的损失更大,而高收入家庭学生的阅读能力则可能有所提升。最令人忧虑的是,暑假学习损失会产生累积效应;久而久之,低收入家庭学生和高收入家庭学生在暑期学习进度上的差异会对成绩差距产生相当大的影响。
Cooper, Harris, Kelly Charlton, Jeff C. Valentine, and Laura Muhlenbruck, with Geoffrey D. Borman, Making the Most of Summer School: A Meta-Analytic and Narrative Review, Monographs of the Society for Research in Child Development, Vol. 65, No. 1, Malden, Mass.: Blackwell Publishers, 2000
Cooper, Harris, Barbara Nye, Kelly Charlton, James Lindsay, and Scott Greathouse, “The Effects of Summer Vacation on Achievement Test Scores: A Narrative and Meta-Analytic Review,” Review of Educational Research, Vol. 66, No. 3, Fall 1996, pp. 227-268.
Cooper, Harris, Jeffrey C. Valentine, Kelly Charlton, and April Melson, “The Effects of Modified School Calendars on Student Achievement and on School and Community Attitudes,” Review of Educational Research, Vol. 73, No. 1, Spring 2003, pp. 1-52.
我们参考 Cooper, Nye, et al (1996) 的工作,采用计算机参考文献数据库关键词检索、梳理相关文献列表,并借助校外时间(out-of-school-time, OST)领域教育研究专家的方法开展文献搜索。Cooper, Nye, et al (1996) 通过对 1975 年至 1994 年发表的研究进行广泛的元分析,系统总结了暑期学习损失的早期证据,为后续研究提供了坚实的基础。他们使用的关键词包括:summer loss, summer vacation, summer break, summer intercession, summer school 和 summer variations,在 ERIC(Education Resources Information Center,教育资源信息中心)和 PsychLIT 等计算机参考文献数据库中进行搜索。
我们确定 Cooper, Nye, et al (1996), Heyns (1978, 1987) 以及 Entwistle & Alexander 1992 的研究是暑期学习损失领域的奠基之作。我们搜索了引用这些文章的后续研究。谷歌学术共索引了 294 篇引用 Cooper, Nye, et al (1996) 研究的文献;我们对其他几篇关键文献也进行了类似的搜索。我们审阅了引用这些关键文章的每一篇索引文献,评估其是否符合纳入标准:(1) 研究对象是幼儿园至八年级的学生;(2) 测量了学业领域的暑期退步。
我们还搜索了 1994 年以来发表的文章。搜索的数据库包括 ERIC、JSTOR、ISI Web of Knowledge 和 Google Scholar。我们尽可能使用「词库词」。如 “summer programs”,并与 “loss”, “slide” 或 “gap” 等关键词配对;ERIC 数据库分别检索到 41 篇、47 篇和 29 篇相关文献(共 117 篇)。通过 Google Scholar,我们发现 69 篇文献同时包含 “summer program” 和 “academic achievement” 及一系列与 loss 相关的关键词,其中 23 篇发表于 2000 年至 2010 年间。JSTOR 索引了 38 篇与 “summer loss” 相关的文章;ISI Web of Knowledge 用于查找 2000 年以来发表的 19 篇文章。我们通过审阅文章摘要,判断其是否包含暑期学习损失的信息或评估,以及是否符合纳入标准。第二章将更加详细地探讨暑期学习损失的程度、累积效应,以及在不同学科和年级间的差异。
著名的 RAND 公司在今天发布的一项研究表明,学生在暑假期间出现的知识和学习技能流失,会随着时间推移在其教育生涯中不断累积。这进一步拉大了低收入家庭学生和高收入家庭学生之间的成绩差距。
该研究证实,参加夏季学习项目可以有效阻断学生的学业退步。那些参与夏季项目的学生,往往比没有参加同类项目的同龄人在学校表现得更加优异。
…「现有研究越来越清楚地表明,对许多弱势学生而言,传统的每学年 180 天、每天 6 小时的学校教育模式远不能满足他们应有的教育需求。」华莱士基金会社区项目主任 Nancy Devine 指出,「这项备受期待且恰逢其时的 LAND 报告《让暑期更有意义》证实,所谓『暑期学业退步』现象对低收入家庭学生的影响格外严重。报告指出,尽管开展高质量的夏季学习项目颇具挑战,但却是一条值得探索的发展路径。」
然而,McMullen 和 Rouse 在 2012 年发表的论文 [《全年学校教育对学业成绩的影响:强制学校日历转换的证据》](https://www.elon.edu/docs/e-web/academics/business/economics/faculty/rouse/2011-02-14 The Impact of year round schooling.pdf) 则表明,单纯重新安排假期可能并不奏效(这一结果与间隔重复理论的解释相悖):
2007 年,北卡罗来纳州韦克县的 22 所学校从传统学年制转为了全年学制,将 180 天的教学时间平均分布到整个年度。这项研究利用这一自然实验来评估全年学制对学生学习成绩的影响。我们构建了一个多层次固定效应模型,以区分全年学制的影响与其他学校、家庭和个人因素的混杂影响。研究结果表明,全年学制对普通学生的学业表现基本没有影响。此外,当我们按种族对数据进行分类分析时,也没有发现任何种族群体能够从全年学制中受益。
…支持全年学校(YRS)日历的人士认为,YRS 有利于学生发展,因为它能够减轻漫长暑假带来的学习损失问题。倡导者进一步指出,学业的长期中断尤其不利于家境贫困、学习成绩不佳的学生,因为他们在暑假期间更难获得额外的学习机会(Von Drehle, 2010)。大量关于暑期学习损失的文献也支持这些观点。研究表明,学生的学业表现在暑假期间往往会停滞不前。对于成绩落后和弱势学生而言,离开学校环境时,学习成绩常常出现下滑(Cooper et al 1996; Jamar 1994;Alexander et al 2007)。有五项研究发现,到初中毕业时,社会经济地位差异所导致的学业成就差距,有近三分之二可以用暑期学习损失的影响来解释。然而,我们必须认识到,YRS 能否有效应对暑期学习损失,很大程度上取决于人力资本积累的过程本身。本文提出的简单模型表明,只有当学习损失随着放假时间的延长而加速,或者学习收益存在递减规律时,YRS 才能真正改善学业表现。换言之,即便弱势学生比富裕学生在暑假期间损失更多人力资本,如果人力资本积累过程不满足特定的非线性特征,YRS 也无法缓解这个问题。假如 YRS 的主要功能是补救暑期学习损失,那么它的效果应该不会超过已有研究所揭示的暑假对学业造成的负面影响——这种影响很少超过学生成绩标准差的 0.1,而且通常接近于零(Downey et al 2004; Cooper et al 1996)。
我们的研究是对一系列主要来自经济学以外领域的文献的补充,这些文献 Cooper et al 2003 的元分析中得到了很好的总结。该综述得出的普遍共识是,全年制教育对学生学业成绩的影响总体上微乎其微。但也有证据表明,修改后的学年日历确实有利于改善成绩不佳、家庭经济条件差学生的学习表现。McMillan (2001) 使用北卡罗来纳州的横截面数据得出了类似的结果。然而,早期研究的主要缺陷在于未能解释学生和学校选择的非随机性。这些研究没有充分控制学生和学校的特征,也没有尝试同时控制不可观测的学生和学校异质性。因此 Cooper 总结道:「如果政策制定者认为现有研究设计太过缺陷,不值得信赖,而选择对其视而不见,我们也很难提出异议(第 43 页)。」 …… 最近,Graves (2010) 使用加州详细的学校纵向面板数据,估计了多轨全年制学校日历对学业成绩的影响。通过纳入学校固定效应和基于学校的时间趋势,Graves 在一定程度上缓解了对全年制学校实施过程中存在非随机选择的担忧。与之前大多数关于 YRS 的研究结果相左,Graves 发现与传统学校日历相比,学生就读多轨全年制学校的学业成绩要低 1 到 2 个百分点。遗憾的是,由于缺乏学生个体层面数据,她无法控制学生进入 YRS 的选择性,也无法估计不同族裔学生受到的影响。
…表 6 中 (c) 列和 (f) 列的模型结果讲述了一个截然不同的故事。与 (a), (b), (d) 和 (e) 列所示的结果(即 YRS 对数学和阅读测试成绩的水平和增长有显著的积极影响)恰恰相反,(c) 和 (f) 两列的估计值表明,YRS 实际上对学生的数学或阅读成绩没有影响。这些模型中几乎所有估计系数的绝对值都接近于零,而且在所有增长模型中还略有负值。这些模型得出的主要结论是:如果没有控制学校层面不可观测到的异质性,评估结果就可能严重高估 YRS 对学生学业成绩的影响。这一发现与以下假说一致,即全年学校往往设立在高成长、很可能也是高成绩的地区。
家庭作业都是在浪费时间吗?《我们在浪费孩子的时间给他们布置过多作业吗?》
我们采用一种识别策略,最大限度地消除了学生和教师未观测特征的影响,由此考察了家庭作业对美国八年级学生数学、科学、英语和历史考试成绩的影响。值得注意的是,如果不控制这些因素的影响,对家庭作业效果的估计就会产生选择偏差。通过分析整个样本数据,我们发现数学家庭作业对数学考试成绩有显著且统计学上有意义的积极影响。然而,额外布置的科学、英语和历史家庭作业则被证实对其相应学科的考试成绩影响甚微,几乎可以忽略不计。
将美国军事和情报部门在外语能力方面的严重匮乏,与遍布美国的通晓各种外语的普通民众,以及美国陆海军过去在外语教育上的辉煌成就进行对比,呈现出的确实是一个令人扼腕叹息的故事。曾几何时,美军会从新兵中选拔具有语言天赋的人才,给他们提供每天 8 小时、每周 6 天的强化训练,持续一年之久;对于跟不上训练进度的人,则会毫不犹豫地予以淘汰。就这样,美军源源不断地培养出了所需数量的出色中文和日语人才。如今,要再度用同样的方式培养阿拉伯语、波斯语和阿塞拜疆语人才,除了需要克服不愿投资未来的心态,还可能面临缺乏愿意每天 8 小时、每周 6 天、持续一年甚至更长时间刻苦学习语言的自律志愿者这一问题,但除此之外,并无任何实质障碍。
https://harpers.org/archive/2007/02/0081384/
公立学校教师和监狱狱警的处境非常相似。狱警的首要任务是防止囚犯越狱,其次是维持囚犯的基本生存,避免他们自相残杀。除此之外,狱警不愿与囚犯有太多接触,因此放任囚犯在狱中建立自己的社会等级。据我所知,囚犯建立的社会是扭曲的、残暴的、无所不在的,处于社会最底层的囚犯日子非常不好过……如果我能重返 13 岁,给年少的自己一些人生建议,我最想告诉他要睁大眼睛看看这个世界。虽然当时我并没有真正意识到,但我们生活的整个环境就像一块毫无真实感的木糠蛋糕。不只是学校,整个城镇都弥漫着一种虚假的气息。人们为什么要搬到郊区?还不就是为了养育孩子!难怪郊区生活如此乏味和了无生机。整个郊区就是一个巨型婴儿养育场,一个专门为哺育下一代而人为打造的城镇。至于学校,则是这个虚幻世界中用来围困学生的牢笼。表面上学校是用来教书育人的,但其实学校最主要的目的是把学生圈在一个地方,让他们老老实实待上一天中的大部分时间,如此一来,成年人就可以安心工作了。我并不反对把学生集中管理起来,因为在现代工业社会,让孩子们四处乱跑确实会造成诸多麻烦。我感到不安的是,(a) 学生并不知道自己身处囚牢,(b) 而看守他们的居然就是其他囚犯。学生被迫花 6 年时间死记硬背一些毫无意义的知识,生活在一个由愚昧无知、盲目追逐的「巨人」统治的荒诞世界里,可悲的是,我们还美其名曰这一切都是天经地义的事。如果学生胆敢对这种洗脑式的超现实教育提出质疑,就会被贴上「不合群」的标签。
–Paul Graham,《为什么书呆子不受欢迎》
间隔重复
间隔重复在学校教育体系中并未得到有意识的运用,顶多算是无心插柳,或凭借原始的经验直觉偶尔沾边。尽管求学过程中学生要记忆大量知识(有些学科如外语学习几乎完全依赖记忆),而间隔重复的有效性已经被几个世纪的科学实践反复证实。
学校作息
对于任何青少年而言,学校作息时间的安排都有悖常理——最需要晚起的群体反而被迫最早起床——这一点清楚地表明,优质教育其实只是公立教育体系的次要目的。
https://www.overcomingbias.com/p/do-larks-repress-owlshtml
去随便问问大学生就知道了:许多人对早八的课避之不及。如果你是一个习惯早起的人,可以 8 点半或 9 点去转转早八的课堂,看看有多少学生在努力保持专注,又有多少人昏昏欲睡,相比之下在下午的课堂上你很难看到学生趴在桌上打盹的景象…… https://www.overcomingbias.com/p/do-larks-repress-owlshtml#comment-443555
在我们学校,对于 7:40 这一令人难以接受的早读时间,官方通常有两种解释:
-
学生要去参加下午较早时段安排的课外活动,如体育运动,早课时间若推迟,他们就得翘课参加。
-
学生更愿意早点放学,以便腾出时间去做兼职打工。
在我看来,这两种理由都非常卧槽。
https://www.overcomingbias.com/p/do-larks-repress-owlshtml
单相睡眠模式是相当不自然的(artificial):https://historycooperative.org/a-short-history-on-sleep-before-the-industrial-revolution/
原始人的睡眠并非是单相的:https://web.archive.org/web/20110101132820/http://blog.myzeo.com/forum/polyphasic-sleep-experiment-discussion/evolutionary-sleep-more-polyphasic/
在自然环境中,我们会恢复到双相睡眠状态:https://www.jdmoyer.com/2010/03/04/sleep-experiment-a-month-with-no-artificial-light/
睡眠不足是难以弥补的:http://www.futurepundit.com/archives/007378.html
晚睡的孩子比较聪明:https://www.quora.com/Are-night-owls-generally-more-intelligent-than-other-people (所以早起上学的时间表伤害了那些本可以从学校教育中受益最多的人) https://www.dailymail.co.uk/sciencetech/article-1173028/How-night-owls-cleverer-richer-people-rise-early.html
睡眠不足有严重危害:http://ngm.nationalgeographic.com/print/2010/05/sleep/max-text
较晚的早课时间有助于提高成绩:https://news.bbc.co.uk/2/hi/uk_news/education/8579951.stm 降低辍学率,节省开支(!),赢得家长的支持,等等:《推迟高中早课时间能帮助困倦的青少年》,并且有助于改善学生的情绪、健康和睡眠质量:https://jamanetwork.com/journals/jamapediatrics/fullarticle/383436
相关研究:6 至 7 岁的儿童每天睡眠时间最好在 9 小时以上。
相当持久的昼夜节律变化:https://www.thefreelibrary.com/Sleepy+teens+haven%27t+got+circadian+rhythm.-a0134623686 https://www.sciencenews.org/article/sleepy-teens-havent-got-circadian-rhythm
TODO:http://blog.myzeo.com/back-to-school-sleep-college-edition/ 上写了什么?
一项新研究显示,许多中产阶级儿童到了六年级,在学校期间的睡眠时间已经少到了可能影响白天注意力和学习能力的地步。
特拉维夫大学心理学家 Avi Sadeh 及其同事指出,这种状况是多重因素共同导致的。随着年级升高,从二年级到六年级,孩子们入睡时间往往越来越晚,但早课时间却维持不变,每天仍需早起。
研究人员认为:「我们的研究表明,年龄较大儿童的睡眠模式可能与其生理需求不符。这意味着他们有可能长期处于睡眠不足状态,面临健康风险。」
更值得关注的是,Sadeh 团队发现,在二、四、六年级学生中,近 20% 存在严重睡眠问题,但通常未被孩子和家长察觉。本研究将睡眠障碍定义为:孩子入睡后,夜间经常醒来,清醒时间占夜间总时长 10% 以上;或者每晚醒来 3 次及以上,每次至少持续 5 分钟。
一项研究发现,随着年龄的增长,儿童的实际入睡时间越来越晚,而这与他们预定的就寝时间无关。《发展心理学》5 月刊登载的一篇文章指出,六年级学生入睡时间比二年级学生晚一个多小时,比四年级学生晚大约 25 分钟。有意思的是,所有年级学生的睡眠质量,如夜间醒来次数和每次睡眠时长,都非常接近。
https://www.findarticles.com/p/articles/mi_m1200/is_21_157/ai_62685139 https://www.sciencenews.org/view/generic/id/487/title/Grade-Schoolers_Grow_into_Sleep_Loss
浅睡眠与糖代谢能力下降和糖尿病风险增加有关:https://www.sciencenews.org/view/generic/id/9302/title/Sleep_disruption_and_glucose_processing
睡眠不足与儿童肥胖密切相关(小学阶段):https://www.findarticles.com/p/articles/mi_m1200/is_20_172/ai_n27458933 https://www.sciencenews.org/article/too-little-sleep-may-fatten-kids
睡眠障碍,如睡眠呼吸暂停,则会导致儿童智商偏低、学习成绩较差:https://www.findarticles.com/p/articles/mi_m1200/is_11_170/ai_n26705324 https://www.sciencenews.org/view/generic/id/7729/title/Sleep_disorder_tied_to_brain_ills_in_kids
3 月 15 日,一项发表在《睡眠》杂志上的研究报告指出,持续的睡眠不足,哪怕程度适度,也会在短短几天内削弱人的警觉性和其他心智能力。睡眠学专家 Hans P.A. Van Dongen 指出,更值得注意的是,那些睡眠略有不足的人,通常意识不到自己的思考能力正在下降,也不会感到特别困倦 https://www.thefreelibrary.com/Sleep+debt+exacts+deceptive+cost.+%28Behavior%29.-a0100110931 https://www.sciencenews.org/article/sleep-debt-exacts-deceptive-cost
《就业市场报告:早起?每日早课时间对学习成绩的影响》, Edwards 2012:
本文使用了 1999 年至 2006 年北卡罗来纳州威克县所有中学生的数据,研究上课开始时间对学生学业表现的影响。… 学校之间的开始时间差异主要源于校车调度安排,而校内开始时间的变化则受到学生人数增长的驱动。研究发现,早课时间每推迟 1 小时,学生在数学和阅读标准化测试中的成绩就会提高 3 个百分点。考虑到开始时间可能与测试成绩的其他决定因素相关,作者进一步利用学校内部不同年份的数据进行分析,结果表明成绩提升了 2 个百分点。这一正向效应在不同的模型设定和变量来源下都十分稳健。早课时间延后 1 小时,对学生成绩的促进作用,与父母受教育程度提高 1 年所产生的影响大小相当。
推迟早课时间对学生学业成绩的积极影响是长期和持续的。在控制了高中固定效应后,研究发现八年级推迟一小时上课与十年级考试成绩的提高幅度相当。… 早课时间调整对八年级学生的影响最为显著(相比六七年级学生,他们更有可能已进入青春期,早起对他们的影响更大)。… 上课晚的学生出勤率更高,每周用于完成家庭作业的时间也更充裕。… 本研究跨度七年,在此期间,该学区的在校生人数从 22 所中学的 20530人 增长到 28 所中学的 27686 人。
关于推迟早课时间在执行中可能遇到的现实挑战,可参考:https://www.ithacacityschools.org/ 前人研究成果综述见:http://www.icsd.k12.ny.us/redistricting/startend/starttimesummary.pdf
政策概述:http://www.icsd.k12.ny.us/redistricting/startend/starttimesummary.pdf 部分已经推迟早课时间的学校名单:http://www.icsd.k12.ny.us/redistricting/startend/StartTimeChanges-v3.pdf
该学区 9-11 年级学生在 1995-2000 年间的总出勤率均有统计学显著提高。其中,9 年级学生的进步最为突出——推迟早课时间后,他们的日均出勤率从 83% 升至 87%。这一变化纯属偶然的概率不足千分之一。
…鉴于获取「干净数据」存在诸多障碍,这项分析耗时将近一年之久。通过对比学生在早课时间调整前三年(早课时间上午 7:15)和调整后三年(早课时间上午 8:40)的成绩,最终发现学生整体成绩略有提高,但差异并无统计学意义。这项耗时且繁复的数据分析得出一个结论:仅以字母成绩为主要指标来比较和评估教学改革成效,可能是任何试图评估改革效果的学区都会面临的难题。
…明尼阿波利斯高中生每天晚上仍比早课时间提早 1 小时的学生多睡 1 小时,换言之,每周多睡 5 小时。这一发现印证了医学研究者的结论,即几乎所有青少年在晚上 11 点左右都会感到困倦。这也消除了人们的顾虑和猜测,证明推迟上课并不会导致明尼阿波利斯的学生在校夜晚睡得更晚。
http://www.cehd.umn.edu/CAREI/Reports/summary.html#SchoolStart,摘自执行总结
[摘要] 20 世纪 90 年代初,医学研究发现青少年的生物睡眠-觉醒模式有别于儿童和成年人。基于这一发现,1997 年,明尼阿波利斯公立学区七所综合高中将早课时间从 7:15 推迟至 8:40。本文考察了这一变化带来的显著益处,如出勤率和入学率提高,学生在课堂打瞌睡减少,自我报告的抑郁情绪降低。文章简要讨论了政策意义,但也承认这在美国各地学区是一个充满争议的敏感话题。
…[第 10 页] 实行推迟上课前,许多家长和管理者担心学生会借此在上学日晚睡一小时。然而,数据表明并非如此。学生仍在同一时间就寝(约 23:00 前 15 分钟)。从生物学视角看,这一发现合理,因为夜间生理节律可能导致学生在 23:00 左右感到困倦,与他们早起时间无关。由于推迟上课,明尼阿波利斯学生每个上学日比 7:30 上课的同龄人多睡约一小时。
…[第 12 页] 学校早课时间在 8:30 或更晚的学生,在关于抑郁情绪的调查问卷中,自我评分明显低于早课时间更早的学生(p 值范围从 <.05 到 <.001)
类似地,在衡量白天困倦程度、课堂上努力保持清醒,以及做作业时瞌睡感等指标上,早课时间较晚的学生也取得了显著更优异的成绩。例如,这些学生自述,因睡过头导致上课迟到、在上午或下午的课堂上打瞌睡、考试时感到困倦的频率大幅降低。他们还表示,使用电脑、阅读或学习时,感到昏昏欲睡的情况也明显减少。
…推迟早课时间所带来的诸多益处,在城市和郊区的学生群体中如出一辙,尽管他们的经济条件存在差异,但实际取得的学习成绩却十分接近。这一发现再次印证了这样一个观点:如果青少年时期对睡眠的需求增加,以及高质量睡眠带来的各种裨益,本质上是人体发育过程中的一种生理现象,那么上述研究结果也就不足为奇、顺理成章了。因为生物规律与个人的社会经济地位并无必然联系。
《彻夜未眠:失眠的科学》, New Yorker:
Roenneberg 指出,年龄对个人的作息时间类型有很大影响。幼儿通常属于「早起型」,他们喜欢在晨光熹微时就起床,让父母感到非常头疼。青少年则多为「晚睡型」,这就是为什么高中校园里总能看到一群行动迟缓、没精打采的「学生僵尸」。Roenneberg 建议高中可以将第一节课的早课时间适当推迟,他援引相关研究表明,采取这一举措的学校,学生的学习表现、积极性和出勤率都得到了显著提升。(明尼苏达州的一个学区在将早课时间改为较晚后,成绩排名前 10% 的学生平均 SAT 分数竟大幅提高了 200 多分,连美国大学委员会主席都惊呼这一结果「实在是太不可思议了」。)但 Roenneberg 也指出,面对这些积极变化,许多教师和学校管理者却常常持抵触态度,宁愿相信学生的问题无法改变。
从儿童到成年,人都要经历一段特殊时期,那就是青春期。一般认为,青春期的结束标志是骨骼停止生长的时间点(骨骺闭合;女性约 16 岁,男性约 17 岁半)。但青春期真正结束的时间(大约 19 岁)却难以明确界定,通常需要从生理、心理、社交、智力等多方面的变化来综合判定。青春期有一个显著特点,似乎有用不完的精力,可以熬夜到很晚还不困,第二天却能睡到日上三竿才起床。我们通过研究人的「时间型」,观察到在 20 岁左右,人的睡眠时间会出现一个突变。由此,我们提出这一变化可以作为判断青春期结束的第一个生物学标志。
https://www.cell.com/current-biology/fulltext/S0960-9822(04)00928-5
「大多数研究都表明,青少年平均需要 9 小时 15 分钟的睡眠。」Emsellem 博士说,「但从孩子们在校期间的实际睡眠时间来看,他们远远没有达到所需的睡眠时长,两者之间存在巨大差距。」
青少年的生理特性可能要为这种睡眠问题负一部分责任。青春期时,孩子的身心发育进入一个空前的高速成长阶段,这需要充足的睡眠时间作为保障。
此外,青春期还有另一个值得关注的变化:一种名为褪黑素的荷尔蒙能让人产生困意,而随着青少年年龄增长,这种激素在晚上分泌的时间也越来越晚。
芝加哥拉什大学医学中心的睡眠研究专家 Stephanie Crowley 表示,正是由于褪黑素分泌时间的推移,青少年往往要到深夜才会感到困倦,想入睡。
「与 10 岁的孩子相比,他们可能会在看电视时在沙发上睡着,而 16、17 岁的青少年则更有可能熬夜到很晚。」Crowley 解释道。
…然而,Emsellem 指出,这种睡眠作息模式只会让青少年的状况每况愈下,而不是好转。
「即便你在周末早晨睡懒觉来弥补」,她说,「但这样做反而会导致你在周日晚上 10 点或 10 点半更难入睡。于是在新的一周,你又重新开始了睡眠不足的恶性循环。」
https://www.npr.org/2011/05/16/136275658/late-to-bed-early-to-rise-makes-a-teen-sleepy
这 18 项研究是在不同背景下进行的。5 项研究只在上学日进行,3 项研究在周末或暑假期间进行,还有 2 项研究同时涵盖了上学日和非上学日。8 项研究没有明确说明具体时间。
…在儿童和青少年群体中,年龄与总睡眠时间(total sleep time,TST)的关系受到睡眠记录方法的显著影响。研究发现,采用实验室多导睡眠检查的研究比使用活动记录仪的研究呈现出明显更强的相关性(对比的 z 统计量:-7.92;P < .0001)。同样,记录时间也会影响年龄与 TST 的关系。在上学日进行的研究比在非上学日进行的研究显示出更强的相关性(对比的 z 统计量:-7.60;P < .0001)。研究结果表明,总睡眠时间随年龄增长而减少的现象仅出现在上学日。而在非上学日,从儿童期到青春期末,总睡眠时间基本保持稳定。
《健康个体从童年到老年的定量睡眠参数的元分析:在人类一生中发展规范性睡眠价值》 2004
鉴于最近一项关于学生睡眠情况的研究结果,战地学校决定从今年秋季开始,将学校上下课时间推迟 30 分钟。大量专家和研究表明,青少年在夜间需要更充足的睡眠,才能在早晨成为高效的学习者。明尼苏达州圣保罗应用研究与教育改进中心主任 Kyla Wahlstrom 指出:「从进入青春期直到青少年后期,控制困倦的脑内化学物质褪黑素通常在晚上 11 点到早上 8 点期间分泌。」
https://www.kptv.com/story/15084456/battle-ground-schools-let-students-sleep-in/
最新睡眠研究发现,许多青少年普遍存在睡眠不足问题,这既与学校开学时间过早,也与青少年时期睡眠模式的改变有关。一项利用美国空军学院两次课表调整和新生随机分配课程及教师的研究,确定了学校开始时间对学业成绩的因果影响。研究结果表明,学校早课时间推迟 50 分钟,能显著提高学生成绩,效果大致相当于教师水平提高一个标准差。
[《学习还是睡觉?以睡眠为代价进行额外学习的学业成本》](https://sleepdoc.com/pdf/study or sleep.pdf), Gillen-O’Neel et al 2012:
这项跟踪研究旨在探究青少年睡眠和学习时间的每日变化,与他们第二天在学业上遇到的问题之间有何关联。研究对象为 535 名九年级学生,平均年龄 14.88 岁。他们分别在 9、10、12 年级连续 14 天每天填写日记。结果显示,不管一个学生通常每天学习多长时间,如果他为了额外学习而减少睡眠,第二天就会更难理解课堂所教内容,完成作业或考试时也更可能遇到困难。随着学生升入高年级,他们牺牲睡眠时间来学习的情况愈发普遍,这种负面影响也日益加剧。
…高中阶段的学生会花费更多时间在与同龄人交往和打工上(Shanahan & Flaherty, 2001; Wight, Price, Bianchi, & Hunt, 2009)。与此同时,随着高中学业的推进,学生面临的学业压力也在不断增大,通常需要投入更多的时间和精力(Eccles, et al 1993)。因此,许多高中生最终会面临学习时间不规律的问题。他们经常会遇到需要占用大量时间用于学习或完成学校作业的晚上。
-
Shanahan, M. J., & Flaherty, B. P. (2001). Dynamic patterns of time use in adolescence. Child Development, 72, 385-401
-
Wight, V. R., Price, J., Bianchi, S. M., & Hunt, B. R. (2009). The time use of teenagers. Social Science Research, 38, 792-809
-
Eccles, J. S., Midgley, C., Wigfield, A., Buchanan, C. M., Reuman, D., Flanagan, C., et al (1993). Development during adolescence: The impact of stage-environment fit on young adolescents’ experiences in schools and in families. American Psychologist, 48, 90-101. doi: 10.1037/0003-066x.48.2.90
…对高中生而言,牺牲睡眠时间用于学习可能格外不合适,因为从总体来看,高中年龄段的青少年普遍长期处于睡眠不足的状态(Carskadon, 1990)。尽管最佳睡眠时长因人而略有差异,但大多数青少年每晚需要刚好 9 小时多一点的睡眠时间(Wolfson & Carskadon, 1998)。然而,一项调查显示,仅约 9% 的高中生每晚睡眠时间能够满足所需的 9 小时(National Sleep Foundation, 2006)。四分之一的高中生每晚睡眠时间勉强维持在 8 到 9 小时之间,而绝大多数高中生(62%)的睡眠时间都不足 8 小时(National Sleep Foundation, 2006)。
-
Carskadon, M. A. (1990). Patterns of sleep and sleepiness in adolescents. Pediatrician, 17, 5-12.
-
Wolfson, A. R., & Carskadon, M. A. (1998). Sleep schedules and daytime functioning in adolescents. Child Development, 69(4), 875-887. doi: 10.2307/1132351
-
National Sleep Foundation. (2006). Sleep in America poll. Retrieved February 18, 2011, from http://www.sleepfoundation.org
…纵观整个高中阶段,青少年生理所需的睡眠时间是恒定不变的,但学生实际的平均睡眠时间却逐年递减(Carskadon, Acebo, & Jenni, 2004)。初三学生每晚平均睡眠 7.6 小时,到高一时减少到 7.3 小时,高二时下降为 7.0 小时,到高三则跌至 6.9 小时(National Sleep Foundation, 2006)。由此可见,高中生入学时的睡眠时间就已经低于其所需水平,而这种睡眠不足的状况还在整个高中阶段持续恶化(Fukuda & Ishihara, 2001)。
-
Carskadon, M. A., Acebo, C., & Jenni, O. G. (2004). Regulation of adolescent sleep: Implications for behavior. Annals of the New York Academy of Sciences, 1021, 276-291. doi: 10.1196/annals.1308.032
-
Fukuda, K., & Ishihara, K. (2001). Age-related changes of sleeping pattern during adolescence. Psychiatry and Clinical Neurosciences, 55, 231-232
...这种学习时间和学业问题之间的棘手关联在高三变得更加显著。无论第二天是否有考试,学习时间[增多]和学业问题[增多]之间都存在关联,因此这并非仅仅是复习备考难考试的结果。我们原本以为,在学习上额外付出的夜晚可能不像学生想象的那么有效(Pilcher & Walters, 1997)。但出人意料的是,在额外学习的夜晚,学生第二天的学业表现反而会下降。不过,一旦将额外学习放在青少年睡眠不足的大背景下来审视,这个惊人的发现就不难理解了。正如其他研究所示,我们的结果也表明,额外的学习时间每天都在压缩青少年的睡眠(Adam et al 2007)。学习和睡眠之间的这种权衡取舍从初三就开始出现,到高中后期愈发严重。我们的中介分析结果表明,在额外学习的夜晚,睡眠时间的减少正是导致第二天学业问题增多的根本原因。
-
Adam, E. K., Snell, E. K., & Pendry, P. (2007). Sleep timing and quantity in ecological and family context: A nationally representative time-diary study. Journal of Family Psychology, 21, 4-19. doi: 10.1037/0893-3200.21.1.4
-
Adam, E. K., Snell, E. K., & Pendry, P. (2007). Sleep timing and quantity in ecological and family context: A nationally representative time-diary study. Journal of Family Psychology, 21, 4-19. doi: 10.1037/0893-3200.21.1.4
《青春期总睡眠时间严重下降》, Leger et al 2012:分析了来自 2011 年 HBSC 跨国调查的 9,251 名 11 至 15 岁儿童(男孩占 50.7%)的数据。结果发现,从 11 岁到 15 岁,儿童的总睡眠时间显著下降,在上学日从 9 小时 26 分钟降至 7 小时 55 分(p<0.001),周末的下降幅度较小,但仍有统计学差异(从 10 小时 17 分降至 9 小时 44 分,p<0.001)。此外,睡眠剥夺的比例也随年龄增长而显著上升,从 11 岁的 16.0% 增加到 15 岁的 40.5%(p<0.001)。自我报告睡眠时间严重不足的儿童比例也出现了类似的增长趋势(11 岁:2.6%,15 岁:24.6%,p<0.001)。
[《青少年睡眠和流体智力表现》](http://jtoomim.org/brain-training/fluid intelligence and sleep.pdf), Johnstone et al 2010; 摘要:
流体智力涉及新颖问题的解决,它很可能容易受到睡眠质量不佳的影响。这项研究考察了青少年的睡眠状况、流体智力水平和学业成绩三者之间的关系。研究对象为 217 名年龄在 13 至 18 岁之间的青少年(平均年龄 14.9 岁,42% 为男性),他们都是 9 至 11 年级的在校学生。研究假设流体智力在青少年睡眠质量和学业表现之间起中介作用。参与者通过在线问卷自我报告睡眠情况、完成流体智力测试(包括字母集和数字序列两个子任务),并提供自评学业成绩。研究发现,总睡眠时长与流体智力和学业成绩均无显著相关(p>0.05);然而,睡眠困难(如入睡困难、睡眠无法带来充分休息)却与流体智力和学业成绩存在显著相关(p<0.05)…
《弗吉尼亚州东南部两个相邻城市的青少年车祸率不同,高中早课时间不同》, Vorona et al 2011
美国弗吉尼亚州弗吉尼亚海滩市的高中早课时间比切萨皮克市早 75 到 80 分钟。我们假设,弗吉尼亚海滩青少年的交通事故率会高于切萨皮克青少年。2008 年,弗吉尼亚海滩和切萨皮克青少年司机的事故率分别为每千人 65.8 起和 46.6 起(p<0.001),2007 年则分别为每千人 71.2 起和 55.6 起。弗吉尼亚海滩青少年司机在早高峰时段发生事故的时间比切萨皮克早一小时,这与两地高中生上学通勤时间的差异一致。弗吉尼亚海滩和切萨皮克的交通拥堵数据不能解释两地事故率的差异。根据我们 2008 年的研究结果,我们估计如果弗吉尼亚海滩的事故率能接近切萨皮克的水平,每年可以预防 16 起交通事故的发生。我们的研究没有评估事故的严重程度。未来的研究可以探讨弗吉尼亚海滩较早的高中早课时间是否也与车祸造成的伤亡率上升相关。
…高中过早的早课时间可能会导致青少年睡眠不足,并增加他们卷入交通事故的风险。一项研究发现,早课时间是决定青少年起床时间的主要因素。最新研究表明,将高中早课时间推迟 30 分钟,青少年在工作日晚上可以额外睡 45 分钟,嗜睡现象也随之减少。此前的数据显示,青少年的早起时间与他们的早睡时间无关。Danner 和 Phillips 的研究证实,推迟高中早课时间可以减少青少年车祸事故发生率。肯塔基州列克星敦的一项研究发现,将高中早课时间推迟 1 小时,随后 2 年青少年车祸事故下降了 16.5%。
\3. Carskadon MA, Wolfson AR, Acebo C, Tzischinsky O, Seifer R. Adolescent sleep patterns, circadian timing, and sleepiness at a transition to early school days. Sleep 1998;21:871-81
\10. Hansen M, Janssen I, Schiff A, Zee PC, Dubocovich ML. The impact of school daily schedule on adolescent sleep. Pediatrics 2005;115:1555-61.
\11. Knutson KL, Lauderdale, DS. Sociodemographic and behavioral predictors of bed time and wake time among US adolescents aged 15 to 17 years. J Pediatr 2009;154:426-30.
\12. Owens JA, Belon K, Moss P. Impact of delaying school start time on adolescent, sleep, mood and behavior. Arch Pediatr Adolesc Med 2010;164:608-14.
\13. Danner F, Phillips B. Adolescent sleep, school start times, and teen motor vehicle crashes. J Clin Sleep Med 2008;4:533-5.
TODO:这类青少年车祸中有多少是致命的?
《早起晚起与教育成果:云雀在高中时比猫头鹰更有优势》, Preckel et al 2013:
...研究对象:来自德国五所高中九、十年级的 272 名学生,以及其中 132 名学生的家长。研究数据来源于学生在课堂上完成的自我报告问卷和标准化认知能力测试,以及家长在家中填写的调查问卷。为考察生理节律类型对学业表现的独立影响,研究者采用分层线性回归模型进行了统计分析。通过计算学生自评节律类型与睡眠、饮食、用药等行为指标的相关性,以及与家长评定节律类型的一致性,研究验证了节律类型测量的有效性。
研究发现:在控制认知能力、尽责性、思考欲望、成就动机和性别等因素后,夜型作息仍然能显著负向预测学生的总平均绩点、理科绩点和语言学科绩点。数据表明学生自评与家长评定的节律类型高度一致,且与学生的实际作息行为密切相关。
…近期研究通过统计学方法证实,作息时间类型与学业表现之间存在显著关联:夜猫子型的人学业成绩往往较差,而早起型的人学业成绩则普遍更优(如 Giannotti, Cortesi, Sebastiani, & Ottaviano, 2002; Kirby & Kirby, 2006; Randler & Frech, 2006,至于元分析,请见 Preckel, Lipnevich, Schneider, & Roberts, 2011)。一般来说,与其他年龄组相比,儿童有更高的早起倾向。青少年阶段常表现出作息时间推迟的现象(Carskadon, Wolfson, Acebo, Tzischinsky, & Seifer, 1998; Crowley, Acebo, & Carskadon, 2007),在 20 岁左右达到「晚睡晚起」的顶峰(Roenneberg et al 2004)。50 岁以后,早起倾向会迅速增加(Diaz-Morales & Sorroche, 2008; Roenneberg et al 2007)。关于性别差异,多项研究综述指出,女性似乎比男性更偏向于早起(见 Kerkhof, 1985; Tankova, Adan, & Buela-Casal, 1994 的综述)。最近一项元分析也证实,性别对早起倾向有微弱但显著的影响,支持了上述观点(Randler, 2007)。
…大量研究一致表明,夜猫子型的作息习惯会对学业表现产生显著的负面影响,而早起型的作息习惯则有助于取得更好的学业成绩。这一规律不仅在中小学生群体中得到证实(Giannotti, Cortesi, & Ottaviano, 1997; Giannotti et al 2002; Randler & Frech, 2009),在大学生群体中也同样适用(如 Besoluk, 2011; Besoluk, Onder, & Deveci, 2011; Randler & Frech, 2006)。Preckel 等人(2011 年)的元分析进一步量化了这种关联:尽管相关系数较小,但晨型作息与学业成就呈现显著的正相关(r = .16,基于 13 项研究),夜晚型作息与学业成就则存在显著的负相关(r = -.14,基于 6 项研究)。
…习惯晚睡晚起的学生很可能会在一周内积累睡眠债(Gau & Soong, 2003; Gau et al 2004)。这是因为尽管夜猫子学生比喜欢早起的学生晚睡,但在学校统一的作息时间表下,所有人都必须在同一时间起床。结果,倾向于晚睡的学生白天会感到更加困倦,而日间困倦本身就与学业成绩下降有关(Kirby & Kirby, 2006; Meijer, 2008)。
…Klein (2004) 对以色列 850 名 7 至 9 年级学生的调查发现,从早晨到下午,学生的学业表现水平逐步提高。类似地,Wahlstrom (2002) 开展了一项为期 4 年的纵向研究,考察了 7 所综合高中将早课时间从 7:20 推迟至 8:40(上学总时长不变)对学生的影响。研究表明,学生每天晚上多睡 1 小时,日间嗜睡状况得到缓解,出勤率有所提升,成绩也略有进步,但并不显著。美国其他州的学区实施了相似的早课时间调整,结果一致且始终正面(Fairfax County School Board Transportation Task Force, 2008)。然而,受限于社会工作时间的安排以及学生参加课外活动的需求,推迟早课时间在现实中往往难以实现。
《卧床多睡一小时「提高学生考试成绩」:一项允许学生多卧床一小时的学校实验提高了考试成绩,并降低了缺勤率》, The Telegraph 21 Mar 2010 (TODO followup):
英格兰北泰恩赛德郡的蒙克西顿中学原本每天早上 9 点开始上课,但作为一项试验,学校决定将首节课推迟到 10 点。…校长 Paul Kelley 在接受《星期日泰晤士报》采访时说:「虽然目前只有初步数据,但已经能看出调整早课时间的好处。学生的迟到率下降了 8%,长期缺勤率降低了 27%。与 2009 年 1 月相比,我校今年 1 月的 GCSE 数学和英语成绩也有了显著提升。」…Foster 教授及其他研究者发现,青少年的生物节律使他们天生偏好晚睡晚起。他们的大脑可能要到 10 点才能完全进入工作状态,比成年人推迟 2 到 4 小时。研究还指出,最复杂的课程内容应该安排在下午进行,因为那时学生的思维最为敏捷。
《睡眠不足影响小学教育》 (另见 http://timss.bc.edu/timss2011/ ):
在青少年睡眠不足问题最为严重的国家中,除了新西兰、沙特阿拉伯、澳大利亚、英格兰、爱尔兰和法国外,学业表现优异的芬兰也赫然在列…研究人员发现,一些地区的趋势与预期大相径庭。亚洲国家的学生在数学测试中表现最为出色,Minnich 先生指出,这一成绩往往与学生长时间学习,在课后班埋头苦读密不可分。「人们或许会认为,他们肯定会疲惫不堪,」他说道,「然而,当我们审视这些学生的睡眠状况时,发现他们并未像其他国家的学生那样,饱受睡眠不足之苦。」……不仅如此,学生的睡眠问题还会随着年龄增长而发生显著变化。韩国低年级学生的睡眠不足程度在全球最低,但到了中学阶段,他们所面临的睡眠问题却成为世界上最为严重的。
《昏昏欲睡的青少年的科学:学校的时间表让他们脾气暴躁、冲动、缺乏幽默感》, New Scientist
那么,关于青少年睡眠模式的事实究竟如何?社会又应当如何适应他们的这些需求?与其他哺乳动物一样,人类的睡眠时间生物学会随着年龄的增长而发生变化。大量研究已经证实了这一点。进入青春期后,入睡和起床时间都会相应推迟。女性会持续到 19.5 岁,男性则会持续到 21 岁,之后趋势开始逆转。到 55 岁时,我们醒来的时间大致回到了青春期之前,平均比青少年早醒来两个小时。换句话说,对青少年而言,早上 7 点起床相当于 50 多岁的人凌晨 5 点被闹铃叫醒。这种现象的确切原因尚不清楚,但可以发现其与青春期荷尔蒙的变化以及随年龄增长荷尔蒙分泌减少有关。不过,生物学原因只是问题的一部分。父母对孩子就寝时间采取更加宽松的态度,普遍忽视了睡眠的重要性,再加上电视、DVD、电脑、游戏机、手机等的普及,这些都会让人保持清醒,侵占本该用于睡眠的宝贵时间。
…布朗大学青少年睡眠研究领域的先驱 Mary Carskadon 的研究表明,青少年需要每晚约 9 小时的睡眠,才能保持充沛的精力和良好的学习成绩。我最近在英国利物浦的一所学校实地考察发现,许多学生在上学日每晚只睡 5 小时。不出所料,老师们反映学生上课时常打瞌睡。大量研究有力地证明了睡眠的重要性,表明睡眠在巩固记忆、提升解决复杂问题的创新能力等方面起着关键作用。睡眠不足会导致压力荷尔蒙皮质醇水平升高,还会对冲动行为、共情能力、幽默感和情绪产生负面影响。
《在安慰剂对照的交叉研究中,褪黑激素治疗对青少年睡眠时间和嗜睡的影响》, Eckerberg et al 2012:
近几十年来,青少年睡眠失眠的现象在全球范围内显著增加,主要原因是昼夜节律相位延迟。我们开展一项研究,探讨在下午服用小剂量褪黑素是否能够提前青少年的睡眠时间。我们招募了 21 名 14-19 岁、在上学期间难以入睡的学生,进行了为期 5 周的随机双盲安慰剂对照交叉试验......事后分析显示,与安慰剂学校周相比,在服用褪黑素的学校周,学生报告的入睡时间明显提前(p<.005),睡眠时长也显著延长(p<.05)。在最后一周服用褪黑素后,与基线周相比,学生平均入睡时间提前 68 分钟,平均睡眠时长延长 62 分钟。唾液检测结果表明,与安慰剂组相比,褪黑素组早晨褪黑素水平降低(p<.001),夜间升高(p<.001),提示褪黑素可能促进了睡眠相位提前。在服用褪黑素期间,学生报告夜间醒来次数减少(p<.05)、白天困倦减轻(p<.05)、夜间困倦加重(p<.005)。我们得出结论,每天下午 [4-6:30] 服用小剂量褪黑素,可以提前青少年睡眠时间,使他们在校期间更加清醒和警觉,即便他们在周末仍保持不规律的睡眠习惯…仅有两名参与者在服药 1 小时后感到疲劳[副作用],一名参与者偶尔出现头痛…在研究结束时的简短问卷调查中,21 名参与者中有 20 人对「你从这项研究中获益了吗?现在能更早入睡吗?」的问题回答「是」,1 人回答「不确定」。
另外有趣的是:
在暗光褪黑素初始释放时间(dim light melatonin onset, DLMO)前约 5 小时服用 3 mg 剂量的褪黑素效果最佳,而在 DLMO 前 2-4 小时服用 0.5 mg 剂量则是最理想的方案(Burgess et al 2010)。早在 1991 年,Dahlitz 等人就发现,对于延迟睡眠相位障碍(DSPD)患者,在其惯常入睡时间前 5 小时连续数周服用褪黑素,可以让睡眠时间提前 1 小时以上(Dahlitz et al 1991)。一项近期的元分析进一步证实了这一结果,该分析纳入了 9 项比较褪黑素与安慰剂疗效的随机对照试验(PL; Van Geijlswijk et al 2010)。其中 4 项研究以儿童为对象(Smits et al 2001, 2003; Van Der Heijden et al 2007; Weiss et al 2006)。然而,目前尚无一项研究纳入青少年群体,据我们所知,关于褪黑素治疗青少年 DSPD 的对照研究仍是一片空白。
…如今,人们普遍达成共识:在合适剂量和服用时间的情况下,褪黑素是一种安全的治疗方法(Arendt et al 2008)。不过,一些人可能仍然担心褪黑素在儿童和青少年中的长期使用,因为众所周知,它在动物体内参与调节繁殖的季节性变化(Srinivasan et al 2009)。然而,褪黑素对性腺的作用在不同物种间存在差异(Scherbarth & Steinlechner, 2010)。一项最新的安慰剂对照研究发现,长期使用褪黑素治疗后,包括睾酮和雌二醇在内的激素水平并未出现与治疗相关的改变(Wade et al 2010)。目前唯一一项针对青春期前儿童发育情况的随访研究(Van Geijlswijk et al 2010)表明,连续使用褪黑素 3.1 年后,青春期的发育过程似乎并未受到干扰。
…与安慰剂组相比,学生们报告在褪黑素干预期醒来时感到的困倦程度更轻,并且在早晨时段的警觉性也有[统计学上的]显著提高。如前文所述,这可能是由于褪黑素分泌时相提前和睡眠欠债减少的共同作用。然而,对于下午警觉性的改善,可能只能归因于睡眠欠债的缓解。这一结果与此前的一些研究不谋而合(Kayumov et al 2001; Nagtegaal et al 1998)。睡眠时长与学业表现之间的整体关联已得到广泛证实(Wolfson & Carskadon, 2004)。有研究指出,日间嗜睡对学习不佳的影响甚至超过睡眠不足(Anderson et al 2009),因此本研究最重要的发现可能就是上学日学生警觉性的提升。
https://www.northjersey.com/news/222120551_High_schools__early_starts_deprive_students_of_crucial_sleep.html/?page=all:
美国教育部国家教育统计中心的数据显示,大约 40% 的美国公立高中在早上 8 点前就开始上课,只有 15% 的学校在 8:30 或更晚才开始。这些过早的课表往往是由于课外活动和校车接送的后勤安排导致的。在同一辆校车需要分别接送高中、初中和小学生的学区,青少年学生通常被安排在最早的班次。
…美国国家睡眠基金会指出,研究表明,与大多数儿童和成年人相比,青少年体内的褪黑激素分泌高峰出现得更晚。褪黑激素水平升高会促进人们入睡,而青少年分泌延迟导致他们难以早早就寝。Carbone 表示,高中生每晚需要 8 至 9 小时的睡眠时间。然而,据 2010 年发表在 Journal of Adolescent Health 上的一项研究显示,高中生中只有 8% 的人能睡够这么长时间。研究发现,平均每个学晚,有 10% 的青少年只睡 5 小时,23% 的人只睡 6 小时。「许多学生会说,『我只睡 6 小时,但感觉良好』,」Carbone 说,「但大量研究表明,他们的身体实际上并不好。」
《较晚的早课时间与改善青少年的睡眠和白天任务执行能力有关》, Boergers et al 2014:
方法:高中寄宿生(样本量 197 名,平均年龄 15.6 岁)分别在学校将早课时间从早上 8:00 推迟到 8:25 前后完成了学校睡眠习惯调查问卷。结果显示,早课时间推迟后,学生在校期间晚上的睡眠时长平均增加了 29 分钟,睡眠时间达到或超过 8 小时的比例从 18% 翻了一番多,升至 44%。其中,低年级学生和调整前睡眠时间较少的学生受益更多,睡眠时长增幅更为明显。此外,较晚的早课时间还带来了学生白天犯困、抑郁情绪和咖啡因摄入量的显著下降。然而,当学校作息时间恢复到调整前的早起时间后,学生的睡眠时长也随之回落到了原来的水平。
…在美国,慢性睡眠不足在青少年中已经几乎达到流行程度。研究表明,青少年睡眠不足可能会导致一系列健康问题,包括因疲劳驾驶引发的车祸、肥胖、心血管疾病以及代谢功能紊乱等。睡眠不足的青少年更容易出现情绪低落、难以控制行为冲动,注意力不集中,记忆力下降,执行任务的能力也会受损。不出所料,睡眠不足还会对学业成绩产生负面影响,表现为迟到和旷课增多,学习积极性下降。
-
Eaton DK, McKnight-Eily LR, Lowry R, et al. “Prevalence of insufficient, borderline, and optimal hours of sleep among high school students-United States, 2007”. J Adolesc Health. 2010;46: 399-401.
-
Dahl RE. “Biological, developmental, and neurobehavioral factors relevant to adolescent driving risks”. Am J Prev Med. 2008;35(3 suppl):S278-S284.
-
Hasler G, Buysse DJ, Klaghofer R, et al. “The association between short sleep duration and obesity in young adults: a 13-year prospective study”. Sleep. 2004;27:661-666.
-
Cappuccio FP, Taggart FM, Kandala NB, et al. “Meta-analysis of short sleep duration and obesity in children and adults”. Sleep. 2008;31: 619-626.
-
Gangwisch JE, Malaspina D, Babiss LA, et al. “Short sleep duration as a risk factor for hypercholesterolemia: analyses of the National Longitudinal Study of Adolescent Health”. Sleep. 2010;33:956-961.
-
Verhulst SL, Schrauwen N, Haentjens D, et al. “Sleep duration and metabolic dysregulation in overweight children and adolescents”. Arch Dis Child. 2008;93:89-90.
-
Pasch KE, Laska MN, Lytle LA, et al. “Adolescent sleep, risk behaviors, and depressive symptoms: are they linked?” Am J Health Behav. 2010;34:237-248.
-
Carskadon MA. “Sleep’s effects on cognition and learning in adolescence”. Prog Brain Res. 2011;190:137-143.
-
Fredriksen K, Rhodes J, Reddy R, et al. “Sleepless in Chicago: tracking the effects of adolescent sleep loss during the middle school years”. Child Dev. 2004;75:84-95.
-
Curcio G, Ferrara M, De Gennaro L. “Sleep loss, learning capacity and academic performance”. Sleep Med Rev. 2006;10:323-337.
-
Wolfson AR, Carskadon MA. “Understanding adolescents’ sleep patterns and school performance: a critical appraisal”. Sleep Med Rev. 2003;7:491-506.
-
Perkinson-Gloor N, Lemola S, Grob A. “Sleep duration, positive attitude toward life, and academic achievement: the role of daytime tiredness, behavioral persistence, and school start times”. J Adolesc. 2013;36:311-318.
青少年普遍存在慢性睡眠不足的问题,这是由多种复杂且相互关联的因素导致的。其中既有昼夜节律等生理因素的影响,也有家庭作业、打工、课外活动和使用电子产品等外部环境的干扰。进入青春期后,孩子们的生物钟节律会从「早睡早起型」转变为「晚睡晚起型」,同时他们自身的睡眠驱动力也在减弱,这两大变化使青少年很难在较早的时间入睡。然而,青少年的最佳睡眠时长仍为每晚 8.5 至 9.5 小时,这一需求并未随着青春期的到来而明显改变。这意味着,一个普通的青少年如果晚上 11 点才能入睡,那他们第二天早上最好 8 点左右再起床,才能获得充足的睡眠。可现实是,美国大多数高中的早课时间都安排在早上 8 点之前,这与青少年的作息规律存在很大的矛盾,是导致他们普遍睡眠不足的重要原因。
- Cain N, Gradisar M. “Electronic media use and sleep in school-aged children and adolescents: a review”. Sleep Med. 2010;11:735-742. 14. Knutson KL, Lauderdale DS. “Sociodemographic and behavioral predictors of bed time and wake time among US adolescents aged 15 to 17 years”. J Pediatr. 2009;154:426-430. 15. Carskadon MA, Acebo C, Jenni OG. “Regulation of adolescent sleep: implications for behavior”. Ann N Y Acad Sci. 2004;1021: 276-291. 16. Carskadon MA, Harvey K, Duke P, et al. “Pubertal changes in daytime sleepiness”. Sleep. 1980;2:453-460. 17. National Sleep Foundation. Sleep in America Poll. Washington, DC: National Sleep Foundation; 2006. 18. Wolfson AR, Carskadon MA. “A survey of factors influencing high school start times”. NASSP Bull. 2005;89:47-66.
人们已经意识到青少年睡眠不足会付出沉重代价,由此开始寻找一些可以改变的因素,比如推迟学校早课时间。大量研究对比了上午 8 点之前和之后上课的中学和高中,结果发现过早上课会导致诸多不利影响,如睡眠时间减少、白天更容易犯困、注意力难以集中、旷课率升高、学业成绩下滑,以及发生交通事故的风险增加。
- Wolfson AR, Spaulding NL, Dandrow C, et al. “Middle school start times: the importance of a good night’s sleep for young adolescents”. Behav Sleep Med. 2007;5:194-209. 20. Dexter D, Bijwadia J, Schilling D, et al. “Sleep, sleepiness and school start times: a preliminary study”. WMJ. 2003;102:44-46. 21. Carrell SE, Maghakian T, West JE. “A’s from ZZZZ’s? The causal effect of school start time on the academic achievement of adolescents”. Am Econ J. 2011;3:62-81. 22. Edwards F. “Early to rise? The effect of daily start times on academic performance”. Econ Educ Rev. 2012;31:970-983. 23. Vorona RD, Szklo-Coxe M, Wu A, et al. “Dissimilar teen crash rates in two neighboring southeastern Virginia cities with different high school start times”. J Clin Sleep Med. 2011;7:145-151.
面对这些发现,尽管采取行动的学区还不多,但越来越多的学区已经开始尝试推迟早课时间,并系统评估其对学生的影响。一项针对某学区 18000 多名高中学生的大型研究显示,在开学时间从 7:15 推迟至 8:40 后,尽管学生就寝时间并未延后,但上学日的实际睡眠时长却增加了近 1 小时。另一学区将高中早课时间从 7:30 推迟到 8:30,即延后 1 小时,学生报告睡眠时间达到 8 小时的比例从 37% 升至 50%。最近,一所私立高中仅将开学时间从 8:00 推迟到 8:30,短短半小时的改变使学生平均就寝时间反而提前了 20 分钟,上学日睡眠时长增加了 45 分钟,报告睡眠至少 8 小时的学生比例从 16% 大幅升至 55%。除了睡眠时间的增加,推迟早课时间还带来了其他多重益处,包括辍学率下降、标准化阅读和数学测试成绩提高、抑郁症状发生率降低,以及车祸率的下降。近期研究还表明,推迟中学生的早课时间同样有积极成效,如上学日睡眠时间增加、白天困倦和迟到减少,在电脑注意力测试中表现更佳。这些证据有力地支持了推迟学校早课时间这一举措,对于促进学生的身心健康发展和学业表现大有裨益。
- Wahlstrom K. “Accommodating the sleep patterns of adolescents within current educational structures: an uncharted path”. In: Carskadon MA, ed. Adolescent Sleep Patterns: Biological, Sociological, and Psychological Influences. Cambridge, England: Cambridge University Press; 2002. 25. Wahlstrom K. “Changing times: findings from the first longitudinal study of later high school start times”. NASSP Bull. 2002;86:3-21. 26. Danner F, Phillips B. “Adolescent sleep, school start times, and teen motor vehicle crashes”. J Clin Sleep Med. 2008;4:533-535. 27. Owens JA, Belon K, Moss P. “Impact of delaying school start time on adolescent sleep, mood, and behavior”. Arch Pediatr Adolesc Med. 2010;164:608-614. 28. Lufi D, Tzischinsky O, Hadar S. “Delaying school starting time by one hour: some effects on attention levels in adolescents”. J Clin Sleep Med. 2011;7:137-143.
《睡眠限制会恶化青少年的情绪和情绪调节》, Baum et al 2014:
…招募了 50 名 14-17 岁的健康青少年,开展了一项为期三周的睡眠干预实验。实验包括基线期、睡眠限制期(每晚睡眠 6.5 小时,持续五晚)和健康睡眠期(每晚睡眠 10 小时,持续五晚)三个阶段,采用随机交叉平衡设计。受试者在家中通过自我报告和活动记录仪监测睡眠情况。每个阶段结束时,青少年及其父母填写情绪和情绪调节问卷。为排除受试者预期对结果的影响,研究还评估了多动/冲动程度,因为先前研究表明青少年多动/冲动不受睡眠限制的影响。研究采用 Wilcoxon 符号秩检验比较两种实验条件下的结果差异。结果显示:健康睡眠期间,受试者平均每晚比睡眠限制期多睡 2.5 小时。与健康睡眠相比,睡眠受限时,青少年自我感觉更焦虑、烦躁、困惑和疲劳,活力降低(p 值在 0.001-0.01 之间)。父母和青少年还报告,睡眠不足会加重叛逆、易怒的情绪,降低情绪管理能力(p < 0.05)。但两组间抑郁和多动/冲动的得分没有明显差异(p > 0.05)。
《组织学校以提高学生成绩:早课时间、年级配置和教师分配》, Jacob & Rockoff 2011
本文介绍了三项组织改革措施,最新证据表明,这些措施有望以相对较低的成本,显著提高幼儿园至高中阶段学生的学习成绩:(1) 推迟初高中学生的学校早课时间;(2) 改变目前小学和初中分设的学校结构,采用幼儿园至八年级「一条龙」的学校模式;(3) 在分配教师岗位时,着眼于尽可能提升学生成绩(比如,让教师连续多年执教同一年级以积累经验;或者让教师专注于自己最擅长、最有成效的学科)。我们经过谨慎估算,延后学校开学时间的收益成本比为 9:1,推行学校结构改革的收益成本比高达 40:1。
…任何为人父母者都深有体会,叫醒一个正酣睡的青少年有多么困难。清晨叫醒孩子困难重重,越来越多的证据还表明,在早上开展教学同样充满挑战。研究发现,最早的学校早课时间会导致弱势学生的学业表现每年下降约 0.1 个标准差,相当于让教学效力处于第 16 个百分位的老师替代普通教师授课。看来,适当推迟学校早课时间,有助于改善学生的睡眠质量,克服学习过程中的生理障碍。
…学校的早课时间普遍安排在清晨。国家家庭教育调查(NCES 2001)显示,大约一半的中学在早上 8 点或更早就开始上课,而 8 点半或之后才开始的不到四分之一。高中的开始时间则更早。Wolfson & Carskadon 2005 对公立高中进行随机抽样调查,发现超过半数高中的早课时间在早上 8 点之前。当年堪萨斯州三分之二的高中不晚于早 8 点开始,99% 以上不晚于 8 点半。再看纽约市 2010-2011 学年的情况:约 10% 的高中在 7 点半或更早开始,而 80% 以上不晚于 8 点半。
…青少年时期,生物钟会发生显著变化,他们的内在作息时钟会推迟就寝和起床时间(参见 Carskadon, Vieira, and Acebo 1993; Crowley, Acebo and Carskadon 2007; Wolfson and Carskadon 1998)。Carrell, Maghakian 和 West (2011) 指出,青少年的褪黑素水平在早上 7 点左右达到峰值,而成年人则在凌晨 4 点达到峰值。因此,在早上 7 点叫醒一个青少年,就像在凌晨 4 点叫醒一个成年人一样有悖常理。理想状态下,面临早起上学的青少年应该早点睡觉。然而,大量研究表明,过早的早课时间会导致青少年睡眠时间减少(如 Dexter, Bijwadia, Schilling, and Applebaugh 2003; Hansen, Janssen, Schiff, Zee, and Dubocovich 2005; Wolfson and Carskadon 2003)。明尼苏达州的一项新研究发现,早课时间在 8:30 开始的学校,学生们报告比早课时间在 7:25 或 7:15 的学校学生多睡了约一小时(Wahlstrom, Davison, Choi, and Ross 2001)。另一项调查则显示,高中生在上学夜晚的睡眠时长,比周末或暑期平均少了两小时(Hansen et al 2005)。
…关于早起上课对学业成绩影响的最有力证据,来自 Carrell 及其同事 (2011) 最近一项对美国空军学院一年级学生的研究。这些学生无法自主选择课表,在两年研究期内,他们被安排在早上 7 点到 8 点 50 分之间不等的时段上课。更重要的是,有别于多数高中,空军学院所有大一新生修读相同课程,参加统一的标准化考试,为研究提供了一致、客观的成绩评估标准。Carrell 及其同事 (2011) 发现,那些在 8 点前就开始上课的学生,不仅在第一节课表现不佳,而且所有课程成绩都更差。影响程度相当显著,早课时间每推迟一小时,成绩就提高 0.15 个标准差。作为参照,美国黑人和白人学生之间的成绩差距约为 1.0 个标准差。
…近期有两项研究与中小学教育环境的关系更为直接。一项关于初中开学时间的最新研究利用了北卡罗来纳州威克县阶梯式公交系统的变化。由于招生人数的快速增长和学区范围的调整,该地区许多初中的开学时间都发生了变化,部分学生被安排在早上较早的时段乘坐校车,而另一些学生则在较晚时段。Edwards (2011) 的分析表明,如果早课时间推迟一小时,学生的阅读测试成绩可以提高 0.03 到 0.10 个标准差,数学测试成绩可以提高 0.06 到 0.09 个标准差。弱势学生的受益程度几乎是优势学生的两倍,而且这种积极影响会一直持续到高中阶段。在对北卡罗来纳州威克县的研究中,Edwards (2011) 估算,如果让所有学生在上午 9:15 开始上课,每个学生每年需要额外花费大约 150 美元。假设学生在 K-12 阶段总共就读 13 年,累计下来,总的交通成本将增加 1,950 美元。
…芝加哥公立学校的一项高中生研究给出了一些新的见解。Cortes, Bricker 和 Rohlfs (2009) 考察了芝加哥高中生在上午和下午课程中的表现差异。在芝加哥,学校通常不晚于早上 8 点开始,但学生经常迟到。研究人员发现,与其他时段相比,学生在第一节课的缺勤率每年大约高出 6 天。此外,学生在第一节课的成绩和测验分数也明显偏低。例如,如果数学课被安排在第一节,学生在年终标准化数学考试中的表现会系统性地更差;同样,如果英语课被安排在第一节,学生在英语考试中的表现也会较差。
…Hinrichs (2011) 对明尼阿波利斯 1997-1998 学年学校作息时间调整的细致分析,却为这一问题提供了一些相悖的证据。当时,明尼阿波利斯和附近几个郊区把高中早课时间从 7:15 推迟到了 8:40,而圣保罗等其他郊区则维持 7:30 的早起时间不变。Hinrichs 发现,与那些一直坚持较早开学的地区相比,推迟了早课时间的地区,学生的出勤率和 ACT 考试成绩并没有发生变化。
…为了量化学习成绩提升带来的经济效益,我们采用了 Krueger (2003) 的研究方法。数据显示,考试成绩每提高 1.0 个标准差,未来收入就会增加 8%。我们参考了 Current Population Survey (2008) 的年龄-收入曲线,并假设实际工资和生产率每年增长 1%。通过计算学生考试成绩提高 0.175 个标准差所带来的收入提升的现值(贴现率为 4%),我们得出结论:如果学校将早课时间推迟一小时,每个学生未来收入的现值预计将增加约 17,500 美元。
《人类青春期睡眠时间、昼夜期相位和夹带相角的纵向评估》, Crowley et al 2014:
这项研究纳入了 94 名青少年,其中 38 名(21 名男孩)在基线评估时 9-10 岁(简称「小组」),56 名(30 名男孩)在基线评估时 15-16 岁(简称「大组」)。受试者完成基线评估后,在接下来的 2.5 年里每隔六个月接受一次随访评估。每次评估期间,受试者先在家连续佩戴腕式活动记录仪至少一周,以记录其自主选择的睡眠时间,随后到实验室测量暗光褪黑素初始释放时间(dim light melatonin onset, DLMO)相位,作为内源性昼夜节律的标志。研究者从活动记录仪数据中提取了工作日和周末的睡眠开始时间、结束时间,以及两者的差值。时相角定义为 DLMO 与工作日睡眠开始或结束时刻之间的时间间隔。结果显示,两组受试者随年龄增长,其睡眠开始时间(包括周末和工作日)、周末睡眠结束时间以及 DLMO 时相都呈延迟趋势。工作日睡眠结束时间在小组有提前趋势,而大组在 17 岁以后则呈延迟趋势。小组的周末-工作日睡眠结束时差随年龄增加,大组这一差值在 17 岁以后减小… 总的来说,本研究提示青少年的昼夜节律和自主选择的睡眠时间随年龄增长而延迟,但上学期间工作日的起床时间会提前,高中毕业后这一时间又会延迟。
…青春期(第二个十年)的过渡常伴随着睡眠/觉醒行为向晚间延迟的转变。全球各地的调查研究表明,随着年龄增长,青少年在学校日和非学校日的就寝时间都变晚了,在非学校日或假期的起床时间也变晚了[1-7]。使用动作记录仪(生物钟监测仪)估算睡眠的横断面和纵向研究也支持这些发现[8,9]。随着青少年年龄的增长,他们倾向于「夜间型」的作息[10]。这种转变似乎与青春期发育有关[11,12]。对美国学生来说,这种睡眠行为的延迟往往与最早的早课时间同时发生,这减少了许多人在上学日的睡眠机会。针对青少年睡眠时长的横断面和纵向研究反映了这一情况,显示总睡眠时间随年龄增长而持续减少[1,9,13-19]。学年期间工作日睡眠不足的情况,通常通过周末睡懒觉来弥补,主要是通过延迟起床时间[1,4,20,21]。在为数不多的报告青少年睡眠/觉醒时间纵向模式的研究中,有两项研究了青少年早期(约 10-13 岁)的情况[2,9]。Laberge 及其同事报告说,根据父母的反馈,加拿大青少年在四年内,学校日和周末的就寝时间都有延迟,周末的起床时间也有延迟。Sadeh 及其同事在一组青少年(基线年龄 9.9 至 11.2 岁)中进行了为期 3 年的跟踪研究,使用动作记录仪发现了类似的与年龄相关的入睡时间延迟。这种睡眠时间的变化可以预测自我评估的青春期发育评分的变化。Andrade 及其同事[20]报告了巴西青少年(12-16 岁)的自报周末起床时间延迟(平均延迟 34 至 39 分钟)。然而,这项测量仅进行了一年。在这一年里,工作日和周末的就寝时间以及工作日的起床时间并没有改变。最后一项纵向研究关注了从高中到大学的过渡[23]。Urner 及其同事使用动作记录仪估算了瑞士学生在高中(17 至 19岁)和 5 年后上大学时的睡眠/觉醒模式。他们发现,在进入大学后,上学日的就寝时间、起床时间和中间睡眠时间平均分别延迟了 34、52 和 44 分钟,但非上学日的睡眠时间没有变化。总的来说,先前的纵向研究主要集中在青春期早期[2,9]或晚期[23],而唯一一项关注相对较广年龄范围的纵向研究,仅跟踪了青少年一年的时间[20]。
《睡眠大衰退:美国青少年睡眠时间的变化,1991-2012 年》, Keyes et al 2015:
方法:使用了 1991-2012 年「监测未来」项目的数据,对 1973-2000 年出生队列的美国青少年进行全国代表性年度横断面调查,样本量为 272077 人。调查询问青少年每周睡眠 7 小时以上的频率,以及睡眠不足的频率。研究通过构建年龄-时期-队列模型对数据进行分析。
结果:在过去 20 年中,美国青少年的睡眠时间总体呈下降趋势;其中 1991-1995 年和 1996-2000 年之间的下降幅度最大。
https://www.washingtonpost.com/national/health-science/blue-light-from-electronics-disturbs-sleep-especially-for-teenagers/2014/08/29/3edd2726-27a7-11e4-958c-268a320a60ce_story.html http://op-talk.blogs.nytimes.com/2014/08/27/how-students-can-get-more-sleep/?_php=true&_type=blogs&_r=0
https://www.newyorker.com/science/maria-konnikova/the-walking-dead
《将教育与青少年生物学同步:“让青少年睡觉,晚点上课”》, Kelley et al 2014
2013 年,时任美国教育部长的 Arne Duncan 在推特上呼吁:「让青少年多睡会儿,推迟学校开学时间吧。」本文综合了过去 30 年来睡眠医学和昼夜节律神经科学领域的重要研究成果,深入探讨了学校过早上课对青少年学习和健康的种种不利影响。文章首先概述了青春期生物钟节律的变化如何导致青少年的睡眠模式发生改变,进而得出结论:根据青少年的作息规律调整教学时间,不仅可以大大提高学习效率,还能显著降低健康风险。随后,文章进一步梳理和分析了教育学、睡眠医学和神经科学领域的相关研究,充分论证了推迟学校早课时间所带来的诸多裨益。在研究其他旨在改善学习效果的教育干预措施时,文章也简要探讨了推迟早课时间在实施过程中可能遇到的问题。最后,作者从实践和政策的层面,深入分析了引入与青少年生物节律相协调的科学化延迟早课时间所产生的积极影响和深远意义。
…青春期的生物学变化决定了青少年需要 9 小时的睡眠时间,并且起床和入睡时间相对较晚,这一现象在其他哺乳动物中也有发现(Hagenauer et al 2009; Rüger et al 2012)。在青春期高峰阶段,这两大生物学变化叠加在一起,导致青少年每个上学日都会损失 2-3 小时的睡眠。对年长青少年而言,早上 7 点的闹铃无异于让 50 多岁的老师凌晨 4 点半起床。如果学校的课程安排未能适应青少年生物钟的这种变化,他们就会长期、慢性地陷入无法弥补的睡眠不足。如此严重的睡眠匮乏会给正值身体和神经系统敏感发育期的青少年带来生理、代谢和心理上的损害(Hansen et al 2005; Giedd 2009; Giedd et al 2012; Sawyer et al 2012; Sørensen et al 2012; Foster et al 2013)。
-
Hagenauer, M. H., J. I. Perryman, T. M. Lee, and M. A. Carskadon. 2009. “Adolescent Changes in the Homeostatic and Circadian Regulation of Sleep.” Developmental Neuroscience 31 (4): 276-284. doi:10.1159/000216538
-
Rüger, M., M. A. St Hilaire, G. C. Brainard, S. B. Khalsa, R. E. Kronauer, C. A. Czeisler, and S. W. Lockley. 2012. “Human Phase Response Curve to a Single 6.5 h Pulse of Short-Wavelength Light.” The Journal of Physiology 591 (1): 353-363. doi:10.1113/jphysiol.2012.239046
-
Hansen, M., I. Janssen, A. Schiff, P. C. Zee, and M. L. Dubocovich. 2005. “The Impact of School Daily Schedule on Adolescent Sleep.” Pediatrics 115 (6): 1555-1561.
-
Giedd, J. N. 2009. “Linking Adolescent Sleep, Brain Maturation, and Behavior.” Journal of Adolescent Health 45 (4): 319-320. doi:10.1016/j.jadohealth.2009.07.007
-
Sawyer, S. M., R. A. Afifi, L. H. Bearinger, S. J. Blakemore, B. Dick, A. C. Ezeh, and G. C. Patton. 2012. “Adolescence: A Foundation for Future Health.” The Lancet 379 (9826): 1630-1640. doi:10.1016/S0140-6736(12)60072-5
-
Sorensen, K., A. Mouritsen, L. Aksglaede, C. P. Hagen, S. S. Mogensen, and A. Juul. 2012. “Recent Secular Trends in Pubertal Timing: Implications for Evaluation and Diagnosis of Precocious Puberty.” Hormone Research in Paediatrics 77 (3): 137-145. doi:10.1159/000336325
-
Foster, R. G., S. N. Peirson, K. Wulff, E. Winnebeck, C. Vetter, and T. Roenneberg. 2013. “Sleep and Circadian Rhythm Disruption in Social Jet-lag and Mental Illness.” Progress in Molecular Biology and Translational Science 119: 325-346. doi:10.1016/B978-0-12-396971-2.00011-7
…睡眠-觉醒周期是由两个因素相互作用而产生的:一是 SCN 起搏器形成的昼夜节律,它主导我们的警觉状态;二是内稳态睡眠周期,它随着清醒时间的延长而加重我们的睡意,又随着睡眠时间的增加而逐步消退这种睡意。这两个看似对立的过程相互制衡,确保我们在白天保持清醒,夜晚酣然入睡。然而,它们的相互作用还会产生一个颇具矛盾性的现象——「觉醒维持区」(Dijk and Czeisler 1995; Shekleton et al 2013)。这个时期通常出现在正常入睡前的几个小时,恰恰是许多青少年睡眠困难的主要原因之一。傍晚时分,内稳态周期带来的睡意往往较低,难以完全抵消昼夜节律驱动的警觉性,导致人在入睡前的几个小时内难以入眠。青春期的生物钟会发生推迟,延后入睡时刻,使得「觉醒维持区」更加靠后。
-
Dijk, D. J., and C. A. Czeisler. 1995. “Contribution of the Circadian Pacemaker and the Sleep Homeostat to Sleep Propensity, Sleep Structure, Electroencephalographic Slow Waves, and Sleep Spindle Activity in Humans.” The Journal of Neuroscience 15 (5): 3526-3538.
-
Shekleton, J. A., S. M. Rajaratnam, J. J. Gooley, E. Van Reen, C. A. Czeisler, and S. W. Lockley. 2013. “Improved Neurobehavioral Performance During the Wake Maintenance Zone.” Journal of Clinical Sleep Medicine 9 (4): 353-362. doi:10.5664/jcsm.2588
…睡眠的稳态调节机制也随之发生改变,睡眠压力的积累变得更为缓慢。这意味着,人们需要更长的时间才能达到启动睡眠所需的临界阈值,这也导致了入睡时间的推迟。这就是包括青少年在内的我们无法轻易选择比平常更早入睡的原因所在——大脑在那段时间仍在促进清醒状态。睡眠倾向时间的这些生物学变化,是与学校早课时间发生冲突的根本原因。大脑不允许学生早睡,但学校早课时间却要求青少年在他们的昼夜节律周期中过早醒来(或被叫醒),这就系统性地压缩了青少年的睡眠时间,导致了严重而持续的睡眠不足问题。反过来,睡眠时间不足和慢性睡眠剥夺等睡眠紊乱问题,会对认知功能、情绪和身心健康产生负面影响(Lockley et al 2004)。
- Lockley, S. W., J. W. Cronin, E. E. Evans, B. E. Cade, C. J. Lee, C. P. Landrigan, J. M. Rothschild, et al 2004. “Effect of Reducing Interns’ Weekly Work Hours on Sleep and Attentional Failures.” The New England Journal of Medicine 351 (18): 1829-1837.
…近期的一篇综述引用多项研究表明,睡眠不足与免疫功能受损、代谢紊乱、糖尿病、高血压、焦虑、抑郁和肥胖等多种健康问题密切相关(Luyster et al 2012)。该综述得出的总体结论是,每晚睡眠时间少于 6 小时可能会危害身心健康。一项新近发表的巧妙实验进一步支持了这一结论。研究人员比较了受试者连续一周每晚睡眠 5.7 小时(实验组)和 8.5 小时(对照组)的情况下,睡眠不足对人体的负面影响。结果发现,实验组有 711 个基因因睡眠不足而表达上调或下调,睡眠不足对人体昼夜节律相关基因的表达具有高度显著影响(Möller-Levet et al 2013)。
-
Luyster, F. S., P. J. Strollo Junior, P. C. Zee, and J. K. Walsh. 2012. “Sleep: A Health Imperative.” Sleep 35 (6): 727-734. doi:10.5665/sleep.1846
-
Möller-Levet, C. S., S. N. Archer, G. Bucca, E. E. Laing, A. Slak, R. Kabiljo, J. C. Lo, et al 2013. “Effects of Insufficient Sleep on Circadian Rhythmicity and Expression Amplitude of the Human Blood Transcriptome.” Proceedings of the National Society of Sciences of the United States of America 110 (12): E1132-E1141. doi:10.1073/pnas.1217154110
…大量研究表明,睡眠不足和长期睡眠剥夺也会对青少年产生显著影响。一些针对青少年的研究发现,睡眠问题会导致他们出现沟通障碍、注意力下降、认知能力减弱、不自主入睡、运动能力下降、冒险行为增多,以及情绪模式改变,尤其容易引发抑郁情绪(Millman 2005; Knutson et al 2007; Hagenauer et al 2009; Foster et al 2013; de Souza and Hidalgo 2014)。考虑到青少年的睡眠时长在休息日和工作日的差异大于其他任何年龄段,且他们需要比成年人更长的睡眠时间,上述现象并不令人意外。此外,其他研究指出,睡眠时间不足会全面地损害青少年的学习和学业表现(Curcio, Ferrara, and De Gennaro 2006),包括学业成绩欠佳和长期记忆编码能力较差(Carskadon 2011)。这些有关青少年睡眠问题的研究结果,与表 1 所总结的成年人睡眠问题研究结论一致(Foster and Wulff 2005; Wulff et al 2011)。
…其他证据也表明,青少年长期严重睡眠不足会影响他们的警觉性和表现。数据显示,青少年司机在早晨发生事故的概率达到峰值(Czeisler 2009),这在老年司机中很少见。这一现象说明,在生物钟紊乱的状态下醒来,且没有得到充分休息,会显著影响驾驶能力。肯塔基州的一个学区将学生早课时间推迟一小时后,学生普遍反馈睡眠时间增加了一小时,而不是因此熬夜更晚。这一举措对 17-18 岁学生驾驶员在上学日的交通事故率影响显著:全州事故率上升了 7.8%,而该学区的事故率却下降了 16.5%(Danner and Phillips 2008)。这一发现在弗吉尼亚州也得到了证实(Vorona et al 2011)。纵观全局,在现代社会中,睡眠不足和剥夺已经达到了流行病的程度。最近一项关于工作/学习日程与生物节律差异的综述量化了不同年龄段的睡眠不足状况(Foster et al 2013)。一项大规模国际调查(样本量约 15 万)对受访者的时间类型偏好进行了评估,结果显示夜猫子类型在青春期迅速增加,且女性较男性提前,这与青春期早发同步。这种偏好在成年初期(平均起始年龄为 20.2 岁)开始缓慢逆转,此时作息时间类型再次提前,起床时间也随之变早(Roenneberg et al 2004)。研究还发现,当不受到学业干扰时,青少年工作日的睡眠时间与周末基本一致(Hansen et al 2005; Jenni, Achermann, and Carskadon 2005)。睡眠时间下降的原因体现在工作日和非工作日的睡眠时长差异上。这一差异在青春期后期接近三小时(图 1)。周末是无法弥补如此巨大的睡眠缺口的。简单计算一下就明白了:如果工作日每天少睡三小时,周末每晚需要额外睡 15 个多小时才能补回来,这无论生理上还是现实中都是不可能的。
…一项针对西班牙 12-16 岁学生的研究发现,夜型人群的学业表现明显逊于其他作息类型(Escribano et al 2012)。在德国,相比朝型学生,夜型高中生显著更频繁地依赖咖啡、可乐、酒精和尼古丁等物质来调节睡眠(Preckel et al 2013)。巴登-符腾堡州的一项研究也发现,夜型人群在高中会考(Abitur)中的得分(是德国大学入学参考的标准)明显更低(Randler and Frech 2006)。此外,还有研究指出,夜型青少年可能面临更高的身心健康风险(Giannotti et al 2002; Hsu et al 2012)。这些发现与青少年群体的其他研究结果一致,即睡眠不足会快速导致神经行为表现下降(Möller-Levet et al 2013),且青少年时期心理健康问题的诊断率较高(Wulff et al 2011)。以昼夜节律睡眠障碍(ICSD-II)中的延迟睡眠期型为例,其在美国 15-24 岁青少年和年轻人中的患病率高达 7-16%,超过 290 万例(Kelley and Lockley 2013)。
…将教育开始时间与青少年的生物节律相协调,是解决青少年在校期间普遍存在的慢性睡眠不足问题的最直接有效的方法。天文时间数据和国际研究表明,10 岁孩子的生物唤醒时间约为 06:30,学校早课时间应为 08:30-09:00;16 岁青少年的生物唤醒时间约为 08:00,学校早课时间应为 10:00-10:30;18 岁的生物唤醒时间约为 09:00,学校早课时间则应为 11:00-11:30(Kelley and Lockley 2013)。遗憾的是,此前关于推迟学校早课时间的研究大多采用了 09:00 之前的时间,远低于实际所需的调整幅度。即便如此,这些小幅度调整也已显示出积极效果,促使众多研究者呼吁进一步推迟学校早课时间(如 Hansen et al 2005; Jenni, Achermann, and Carskadon 2005; Czeisler 2009; Giedd 2009; Hagenauer et al 2009; Foster et al 2013)。在有力研究证据的推动下,一些教育机构已经开始执行延迟早课时间的政策,也有组织和个人积极倡导学校作息时间的系统性改革。综合相关研究,Kirkby, Maggi 和 D'Angiulli (2011)指出,推迟早课时间不仅有助于改善睡眠、健康和学习状况,而且就组织成本而言,其潜在回报是巨大的。Jacob & Rockoff 2011 也得出类似结论,认为适度延后早课时间这一研究充分的举措,能显著提高学习效果,且几乎不会带来额外成本。
…在北卡罗来纳州韦德县的一项研究中,由于校车运营时间安排的改变,研究人员得以比较不同学校因早课时间不同而产生的效果差异(Edwards 2012)。通过分析大样本数据(样本量超过 4000),研究发现,早课时间推迟一小时,学生在全州范围内的数学测试成绩显著提高了两个百分点,阅读成绩也有类似变化。这项研究有两个引人注目的发现:一是对原本成绩处于较低水平的学生而言,成绩提高更加明显;二是 8 年级学生成绩提高了两个百分点,这一效果在两年后的 10 年级仍然存在。在基于睡眠科学的首批大规模研究之一中,明尼阿波利斯公立学区的七所综合高中将早课时间从 07:15 调整到 08:40(Wahlstrom 2002)。研究使用了政策实施前后超过 5 万名学生的数据,近期在另外三个州的学校中得到重复验证(Wahlstrom et al 2014)。学生自我报告的结果表明,他们喜欢这一变化。与另外两个类似学区的学生相比,推迟上课后,他们每天多睡了一小时,同时在出勤率、学习成绩、课堂表现和情绪等方面也有所改善。与多数研究不同的是,该评估涵盖了大量变量的数据,其中包括来自家长的详细反馈。家长们对推迟早课时间持非常积极的态度,92% 的人表示喜欢这一改变,认为孩子更容易相处,家人有了更多交流时间(CAREI 2002)。在美国空军学院的一项引人注目的案例研究中,研究者考察了三年间 18-19 岁新生的学业表现,这期间每年开学时间都在 07:00 到 07:50 之间变动(Carrell, Maghakian, and West 2011)。学院采取随机分配学生至授课教师和班级,在任一天,只有部分学生在较早时间上课,其他人则拥有更多自主安排时间(样本量为 6165)。研究发现,个体学生的课程开始时间越晚,他们在整门课程的总体表现就越优异。学生成绩提高的显著程度相当于教学质量提升了 1 个标准差。有趣的是,被安排在 08:00 之前上课的学生,不仅在第一节课表现欠佳,当天所有课程的表现都不尽如人意。此外,早课时间每推迟 1 小时,学生成绩提高 0.15 个标准差,效应不容小觑。研究者将这一变化与美国黑白人学生之间 1 个标准差的成绩差距相比较,以彰显推迟早课时间的影响力。
…目前,一些学校和大学已经尝试将早课时间推迟到上午 10 点或更晚(例如伦敦大学传媒、艺术与设计学院的早课时间为 10:30),但大多数还没有展开系统的正式研究。新西兰的一项研究表明,同一所学校里 16 岁以上、10:30 开始上课的学生,与 9 点上课的 14-15 岁学生相比,后者报告的睡眠不足更多、起床困难更大(p<.001),且在工作日早 7 点后起床的比例也显著更低(p<.0001)(Borlase, Gander, and Gibson 2013)。土耳其萨卡里亚大学每天分两个时段授课(08:00-14:50 和 15:00-21:50),学生的学业表现因上课时段和个人作息类型而异。该校大多数考试安排在 09:30 进行,研究发现教学和考试时间都会影响学习成绩:晚睡晚起型学生在第二时段表现更优异,而在早上考试时发挥欠佳(Bes ̧oluk, Onder, and Deveci 2011)。值得一提的是,Shekleton et al 2013 意外地发现,学生在上午较晚时段(WMZ)的整体表现优于清早。这些研究数据启示我们,探讨适合青少年的校园作息时间上限,对于优化教学效果和促进学生全面发展具有重要意义。亚洲等地教育系统在晚间较早时段授课所取得的显著成效,也证实了直到晚上 8 点可能都是青少年高效学习的黄金时间。适度延后早课时间并合理安排课程表,有望让学生以更健康、更优异的状态投入学习,值得教育工作者深入研究和科学施行。
《在美国推迟早课时间:经济分析》, Hafner et al 2017:
研究问题:
-
如果美国各州都将学校早课时间推迟到早上 8:30,这对经济会产生什么影响?
-
全美各州统一将早课时间调整为 8:30,这项政策的成本效益如何?
大量研究表明,推迟学校早课时间有助于提高学生的学习成绩,改善他们的身心健康,并提升公共安全水平。尽管这些好处有案可稽,但美国社会对于推迟早课时间的做法仍存在普遍反对意见。反对者主要担心早课时间推迟后,可能需要调整校车线路等,由此导致交通运输成本大幅增加。本研究旨在评估一项政策实验,即全美各州学校都统一推迟到 8:30 上课,这会带来什么经济影响。研究人员将深入分析这一政策在全州范围内的经济效应,以判断其经济可行性。
这项研究采用创新的宏观经济建模方法,评估了美国 47 个州推迟学校开学时间后的经济表现变化,包括学生学业成绩提高和交通事故率下降带来的效益。研究的成本效益预测表明,推迟学校早课时间是一项经济有效的全民策略,有望对公共健康和美国经济产生重大影响。从政策角度来看,研究结果证实,推迟学校早课时间这一政策变革实施后,在相对较短的时期内即可获得显著经济效益。
主要发现
-
一项研究表明,将学校早课时间推迟到 8:30,是一种经济有效且惠及全民的策略,能够从整体上改善公众健康水平,为美国经济创造可观收益。
-
研究指出,推迟早课时间的长远利益将大大超过前期的投入成本。仅仅两年后,美国经济就能额外获得 86 亿美元的经济效益,足以抵消推迟到 8:30 上课给每个学生带来的成本。
-
研究预测,10 年后,推迟早课时间为美国经济贡献的收益将达 830 亿美元,15 年后更是高达 1400 亿美元。在所研究的 15 年间,推迟上课平均每年可为美国经济增加 93 亿美元。
-
值得注意的是,该研究采用了十分保守的成本效益预测方法。一些难以精确量化的因素,如睡眠不足导致的自杀率上升、肥胖增加、心理健康恶化等问题,并未纳入考量范围。由此推断,推迟早课时间为美国各州创造的实际经济效益很可能还要高于预期。
《上午 8:30 上课还为时过早吗?上午 10 点早课时间改善了 13-16 岁学生的健康和表现》, Kelley et al 2017 (quasi-experiment):
虽然大量研究已经证实了推迟学校早课时间的种种益处,如学生出勤率提高、考试成绩进步、睡眠时长延长等,但很少有研究将早课时间推迟到上午 9 点以后。本文介绍了一项针对 13 至 16 岁学生的研究,考察了上午 10 点开始上课的实施情况和效果。研究在英国一所公立高中开展,历时 4 年,采用前后前(ABA)设计。第 0 年(基线)早课时间为 8:50,第 1、2 年(干预期)推迟至 10:00,第 3 年(回归期)恢复到 8:50。研究以全校学生为样本,采集学生健康状况(因病缺勤率)和学业表现(全国统考成绩)两项指标。结果显示:10 点上课两年后,学生患病率大幅下降逾 50%(p<0.0005,效应量 Cohen's d=1.07);改回 8:50 上课,患病率又反弹上升 30%(p<0.0005,Cohen's d=0.47),抵消了先前的改善效果。10 点上课还使全国统考中取得良好进步的学生比例提高了 12%(p<0.0005),相当于超出国家标准 20%。这些发现表明,将高中早课时间推迟到 10 点,能够显著降低学生患病率,大幅提高学习成绩。10 点这一时间较 8 点半更晚,或许更契合青少年昼夜节律推迟的生理特点,尤其适合晚睡型学生。这一举措几乎没有任何代价,却能产生可观效益。
《340 万个现实世界的学习管理系统登录显示,大多数学生经历的社会时差与表现下降相关》, Smarr & Schirmer 2018:
个体内在生物钟节律与社会环境要求的错位,即社会时差(SJL),会导致学习和注意力下降。目前,我们还没有办法全面评估不同时间安排导致的 SJL 对大群体学习表现的影响,更难以判断哪些个人会因此受到最严重的负面影响。为了探索在线学习系统作为分析 SJL 影响的工具的潜力,我们以美国东北伊利诺伊大学 14894 名学生两年的登录数据为样本,研究了 SJL 对大样本群体整体学习状况的影响,同时也关注其对每个个体的具体影响。通过将个人日常活动节律与已知生物节律规律进行验证,我们发现大多数学生平均承受超过 30 分钟的 SJL,SJL 幅度越大,学业成绩就明显越差,生物节律偏晚的人群尤其容易受到影响。我们的研究表明,在线学习记录可以用于描绘 SJL 在个人和群体层面的影响模式,有助于深入分析不同人群特征,为优化课程时间安排、最小化 SJL 对学习的负面影响提供决策参考。
《全天的学业成绩:来自随机课程表的证据》, Williams & Shapiro 2018:
这项研究加深了我们对学校课程时间安排如何影响学业成绩的认识。我们重点关注了三个与课程安排相关的因素:学生疲劳程度、授课时间以及教师授课安排。研究利用美国空军学院五个学年的随机排课数据进行分析,这所学校采用标准化的成绩评定规则,且不同课表结构差异明显。通过分析超过 18 万个学生-课程的学习结果,我们发现了连续上多门课导致学生出现认知疲劳的因果关系证据。即使是同一门课,仅因为之前课程安排的不同,学生的预期表现也可能相差高达 0.15 个标准差。在其他条件相同的情况下,学生在下午的表现优于清晨。我们还注意到,教师重复授课有助于提高教学质量。不同能力水平学生呈现的异质性效应表明,总体学习成绩的提升是有可能实现的。合理优化课程安排,其效果相当于将教师教学水平提高三分之一个标准差。重新规划学生的日常课表,是一项很有前景且可能成本较低的教育干预措施。
《时序和学校时间的相互作用可以预测学校的表现》, Goldin et al 2020:
大多数青少年的作息节律类型非常偏晚,而学校往往要求他们一大早就开始上课,这种时间错位可能会影响他们的身心健康。本研究考察了个人作息节律与学校早课时间的交互作用对学习成绩的影响,对象是 753 名阿根廷学生,他们被随机分配到早上(07:45)、下午(12:40)或晚上(17:20)开始上课。尽管学生的作息节律会在一定程度上适应早课时间,但这种适应并不足以完全抵消上学时段差异的影响。研究发现:(1)对于上午上学的学生,作息类型偏早的学生各科成绩都比偏晚的学生好,数学成绩的差异最为明显;(2)到了下午,作息节律早晚的学生之间的成绩差异消失了;(3)作息偏晚的学生在晚上上课时表现更佳。综上所述,这些结果表明,当学校作息时间与青少年的生物节律相匹配时,学习成绩就能得到提高。
AI 导师将受到文化的掣肘
又名:Puntas Arenas(注:智利南部城市)的公牛
原文:AI tutors will be held back by culture - by Henrik Karlsson
巴勃罗•毕加索,《公牛》中创作的石版画,1945-1946年
随着新一代人工智能的崛起,为每个孩子配备专属导师这一由来已久的梦想突然变得触手可及。然而,尽管这一前景令人振奋,每当我看到那些宣称 AI 将彻底变革教育的人们欢欣鼓舞的样子,我总会不由自主地想起 Bruce Chatwin 在《巴塔哥尼亚迷梦》一书中讲述的那个关于公牛的故事。
这是一个由一位心怀怨愤的老妇人讲述的故事,描绘了 20 世纪 60 年代智利政府在 Puntas Arenas 建立示范农场的荒诞尝试。为此,农业部不惜重金从国外引进了一头优质种公牛,意图改良当地牛种:
哎呀!那头公牛的遭遇简直让人哭笑不得。农业部费尽周折从新西兰引进了这头优质种公牛,先是空运到圣地亚哥,然后又转运到 Punta Arenas。在那里,伴随着冗长而华丽的演讲(鬼知道他们夸夸其谈了些什么),它被郑重其事地移交给了所谓的示范农场。然而,你猜怎么着?这头公牛存活了多久?仅仅三天!它最终成了餐桌上的食物。
同样地,我有种预感,我们很快就会对 AI 导师在教育系统中带来的所谓「变革」感到极度失望。
Punta Arenas 示范农场真正缺乏的核心要素并非一头种公牛;而是有效利用种公牛所必需的文化素养和管理能力。他们之所以需要引进新的种公牛,只因原来的那头早已被工人吃掉了。
的确,身处高成长性文化环境并具有强烈学习动机的人们,将能够充分利用 AI 导师来加速自身的进步。然而,那些无法接触这种文化环境的人,可能会把这些系统仅仅用作消遣工具,甚至借此逃避工作。
如果我们希望提升互相帮助、共同提高技能的能力,当前的关键挑战在于探索如何让更多人接触到高成长性文化。
AI 导师的现状
若想了解 AI 导师的最新水平,不妨观看 3 月 14 日的这段视频。在视频中,可汗学院的创始人萨尔曼·可汗演示了一个基于 GPT-4 开发的系统。
在这段视频中,可汗将 AI 模型用作一位采用苏格拉底式问答法的智能导师。在解答数学题时,他向 AI 导师求助,通过 AI 提出的引导性问题和给出的提示,逐步理解并重新构建问题,最终使解决方案变得清晰明了。不仅如此,可汗还与 AI 就美国历史、熵和中国长城等多个主题展开了开放式的深入对话。
虽然 GPT-4 有时会产生不符合事实的「幻觉」答案,但这类 AI 模型的进步速度比预想的还要快。目前,GPT-4 在大多数大学考试中的表现已经跻身前 10% 的水平。
AI 技术的迅猛发展让人应接不暇。就在 Khan 演示这个 AI 辅导系统仅仅 9 天后的 3 月 23 日,OpenAI 就与 Wolfram 达成合作,推出了一款新插件,为 GPT-4 增加了执行多种复杂任务的能力,例如:
这种通过对话与信息进行流畅互动并加以塑造的方式非常高效。最近几天,我一直在使用这个系统来深化对图论的理解。我会提出诸如「我们对网络拓扑结构与创新率之间的关系有何了解?」这样的问题,并让 GPT-4 运用图论知识回答。它帮助我将模糊的直觉转化为更精确的概念,同时理解「同配性」「树状图」等专业术语,使我能够更有针对性地检索学术文献。我还让 GPT-4 编写 Python 代码来模拟各种与社交网络图相关的场景,从而通过动手实践直观地理解网络的动态特性。
虽然这个系统还不能完全取代教科书(我仍在使用教科书),但与两周前相比,我浏览和理解材料的速度有了明显提高。更有趣的是,这种学习方式是完全开放的:我还能用这个工具来改进我的园艺水平。
人工智能辅导系统的潜力与教育心理学家 Benjamin Bloom 提出的「两个标准差问题」有关。根据 Bloom 的研究,如果将一名学习成绩处于中等水平的学生从普通课堂中抽出,并为其提供一对一的个性化辅导,该学生的成绩将提高两个标准差(即 2-sigma),达到同龄人中的前 1%。
Bloom 绘制了这张简洁明了的图表,展示了采用不同教学方式下学生成绩的分布情况。这张图表看起来似乎是基于严谨的数据分析,而不是凭直觉绘制的。
最新研究对辅导效果有了更为现实的估计。一项元分析发现,辅导的效应量为 0.36。尽管这一数值低于早期的估计,但仍然表明辅导能带来显著的效果:足以将一名学生的成绩从中等水平(第 50 百分位)提升到更高水平(第 64 百分位)。José Rincon 在其文献系统综述中得出以下结论:
- 总体而言,辅导整体上可能无法达到 Bloom 提出的「两个标准差」(即极大幅度的进步)的水平。[. . .]
- 然而,高水平的辅导者和高质量的教育软件很可能能够实现「两个标准差」甚至更大幅度的进步。
在我最近的一篇文章中,我研究了杰出人物的童年经历,发现了一个常见模式:他们都接受了大量的一对一辅导。在我调查的对象中,约 70% 都曾接受过家庭教育,或由父母、亲戚、家庭教师和导师进行个性化辅导。这很可能是他们能在个人发展上取得长足进步的关键原因。
正如 J.S. Mill 的父亲在他离家时所告诫的那样:「你会发现,[那些没有接受一对一辅导的]同龄人的知识不及你丰富。但是,[. . .] 你不应该为此感到骄傲。这仅仅是因为你运气好。」
那么,如果我们现在能够为每个人提供个人导师,会带来什么样的变化呢?
文化的引力
利用 GPT-4 作为我的私人导师确实加快了我的学习进度,但这主要是因为我对所研究的问题充满热情。然而,如果将这类系统引入学校,我怀疑大多数孩子是否能够充分利用它们来显著提升自己的进步速度。毕竟,他们普遍缺乏这样的动力,而且他们所处的文化环境也并不鼓励他们这么做。(我敢打赌,即便在学校引入这些辅导系统,到 2028 年美国在 PISA 测试中的成绩增幅也不会超过 5%。)
我们所浸染的文化环境在很大程度上塑造了我们的品位、欲望、动机和信念等诸多方面——如果你只接触过与自己文化背景相似的人,你可能会低估文化的影响力。我第一次深入体验另一种文化是在将近二十岁时,那时我搬到了马尔默。由于过于天真,我没有意识到房租如此便宜的原因是这栋房子被一个街头帮派控制着。我在一个小得如同茶杯般的村庄里长大,完全没有准备好面对在帮派文化中成长的儿童会如此迅速地接受暴力。你会看到十岁的孩子在街上朝路人发射烟花,训练自己不畏惧伤害陌生人;十二岁的孩子在洗衣房里向我炫耀他们的枪支。而我喜欢读书的习惯却让他们感到困惑不已。
在美国,研究显示家庭拥有的电视机数量与学业成绩呈负相关。我认为,这种现象更多地反映了不同社会文化群体之间的差异,而非电视机本身的影响。事实上,真正让人们困在难以实现理想的人生道路上的,是文化环境,而不是家中的电视。
让我们回顾一下我此前提到的那些在智力或艺术领域做出卓越贡献的人:他们的成功不仅得益于专业导师的指导,更重要的是,他们成长于一个普遍重视并积极追求特定领域卓越成就的环境中:
这些孩子经常与杰出的成年人互动,并且得到了他们的认真对待。比如,当伯特兰·罗素 5 岁时,他不相信地球是圆的,他的祖父母没有轻视他的想法,反而请来了教区的牧师,用理性说服他纠正这个误解。
成年人对这些孩子寄予厚望,认为他们有能力理解复杂的主题,因此邀请他们参与深入的对话和有意义的工作,相信孩子们能够迅速成长并具备能力。
约翰·冯·诺伊曼,这位匈牙利物理学家,曾负责开发氢弹和第一台数字计算机,并以发明博弈论为夜间消遣。在他还没上学之前,他的父亲就已经让他参与银行的管理讨论中。
这种独特的文化环境和由此塑造的社会角色,很可能深刻影响了这些杰出人物日后的动机形成和发展方向。
如果你身处一个不太重视智力成长的亚文化中(这种情况在我们让青少年身处其中的大多数青年文化中普遍存在),那么你就很难获得社会激励来充分利用辅导等机会以追求卓越。在这样的文化氛围中,智力成长并非获得社会地位的关键;它既不是你所渴望的,也不能带来安全感,更无法为你提供一个稳定且被社会认可的角色。有些人虽然在学校里身处这样的文化环境,但仍能突破限制,这通常是因为他们的家庭文化重视个人成长。然而,大多数人还是会被这种文化环境束缚住。
拓展高增长文化
换言之,随着辅导成本降低,教育的主要瓶颈已经转向了文化塑造。
我们能否找到方法,让更多人接触到高成长性文化?是否有办法让更多人在成长过程中,置身于像 J.S. Mill、Pascal 和 Bertrand Russell 那样丰富的文化环境中?
在影响学校设计的教育学文献中,这个问题还没有被认真探讨。然而,我们可以从人类学、互联网社区管理、武术传承、小型实验学校、各种社会场景和工作环境等领域获得宝贵的见解。事实上,我们完全有可能有意识地营造高成长性文化,而软件技术更是为这种文化的推广提供了便利。尽管如此,这个领域仍然存在许多有待解决的问题。(如果读者有兴趣,我可以写一篇文章分享我对这个设计问题的理解。)
文化和辅导系统是相辅相成的关系。人工智能辅导系统越强大,那些能够支持学习的文化就越显得珍贵。(相比之下,教学和辅导系统则是可以相互替代的,这意味着未来十年传统教学的价值可能会逐渐降低。)这为我们提供了一个难得的机会,让我们可以将资源从那些人工智能系统能够自动化的领域(比如教学)转移到一个更具雄心壮志的项目上——那就是构建更加优质的文化基础设施。
我要澄清一点:我并不是说 AI 导师或其他类型的软件可以完全代替人类。我们大多数人仍然需要他人的支持和群体的力量来激励自己追求卓越,并在我们所从事的项目中找到意义。然而,在不久的将来,我们将能够减少在基础辅导上投入的宝贵人力时间;相反,我们可以更高效地运用情感劳动,为彼此提供支持。
教育系统可能会缓慢地接纳这种可能性。但其他领域将会更快地采纳。
诚挚地,
Henrik
在线学徒制
原文:Apprenticeship online - by Henrik Karlsson
最根本的学习情境是,一个人通过协助另一个真正知道自己在做什么的人来学习。
——Christopher Alexander,《模式语言》
人类在进化过程中形成了一种能力,能够习得他们所生活的社区中普遍应用的技能。
如果这个观点是正确的,或者至少十分接近事实,那么教育的目标就应该是确保尽可能多的人能够融入到具有专业技能的社区中。我们应该尽可能地将学习者从学校环境中解放出来——在那里,能力不足的人被同样能力不足的人包围,并因此相互模仿——并进入生产性的环境中。
纵观历史,这种方式的学习一直是主流。我的祖父母生活在他们未来需要适应的成人环境中,可以直接观察和模仿那些已经驾轻就熟的人。然而,随着现代化如同一台巨大的离心机,开始将传统社会中原本融为一体的各个方面分离开来,儿童通过单纯模仿来学习的方式变得不再可能。他们被按年龄分组,无法接触到办公室、工厂、作坊和商店等场所,而这些恰恰是他们日后成为成功成年人所需要掌握技能的地方。
那么,我们是否可以回归到前现代的状态?我们是否能够建立一个系统,让新手重新融入实践社区——但规模更大?
这本质上是一个架构问题,可以这样表述:「我们如何设计工作空间,使新手能够大规模地进入——并且能够轻松地观察到指导有经验从业者的知识?」
并且,我们如何才能在不妨碍正在进行的工作的同时实现这一目标呢?
纵观历史,我们所能建立的工作环境在这方面一直存在局限性。这些环境对高效社区能吸纳的新手数量设置了一个相对较低的上限。以 17 世纪初开创巴洛克艺术流派的 Peter Paul Rubens 为例,他的画室里只能容纳少数几名学徒。试想一下,如果有数百名学徒会是什么情景!缺乏经验者的需求会让 Rubens 应接不暇,导致无法专注创作,甚至可能将他的工作室变成一所学校!
一幅描绘老虎哺育幼崽的习作,出自 Rubens 画室一位不知名的学徒之手。
从 18 世纪开始,为了扩大宝贵知识的传播范围,各国逐渐采用了专门化的学习环境。这就是我们今天所熟知的学校——一个将学习者与他们试图掌握的实际环境隔离开来的封闭场所。通过打破学徒与师傅之间的直接联系,学校体系使得特定知识能够更广泛地传播。
然而,学校教育的知识传递速度令人沮丧地缓慢,学习成果又容易快速流失。更值得关注的是,它还引发了各种心理问题,如心理失调和厌学情绪。这似乎表明,让人长时间端坐在排列整齐的座位上研读书本的学习方式,与我们这个天性倾向于通过体验来学习的物种并不相符。
我们面临着一个两难抉择:是选择有效但难以大规模推广的学徒制,还是选择效果不佳但可以扩大规模的学校教育。我们无法兼得两者的优点。在这种权衡下,社会最终选择了学校。
然而,曾经迫使我们做出这种权衡的限制正在被突破。如今,我们不再需要将初学者与他们需要掌握的环境分隔开来。在当前的技术发展阶段,我们有能力设计这样的工作环境:新手可以在其中通过实践来学习,更重要的是,他们能在富有经验的实践者指导下学习。我们能够创造数字化的互动空间,让专家与大量新手共处,从而重现前现代时期的知识传承方式。
人类天生寻求文化
此刻是 8 月底的清晨 6 点 37 分,我正坐下来写作。我和三岁的孩子在我们改造成学习室的旧马厩里。薄雾正从窗户的缝隙中渗入。当我翻阅笔记时,她在一旁静静地观察着我。随后,她站起身,找到一个小型计算器,在桌上的笔记中翻找了一会儿,然后开始按键。
「独角兽吃人」,她突然大声说道,「就像麦子」。
如果我们将两岁半的儿童与黑猩猩和猩猩进行比较,会发现在使用工具和独立解决问题的能力上,他们基本旗鼓相当。然而,在观察他人并模仿其行为这一方面,人类儿童表现出显著的不同。人类能够迅速吸收和内化周围环境中的各种技能,这一独特能力是其他灵长类动物无法企及的。
一些文化充分利用了人类与生俱来的模仿倾向,将其作为唯一的学习方式,完全摒弃了所有传统教学手段。Alan Howard 在研究南太平洋 Rotuma 岛居民时发现,他们对儿童如何获得能力的认知模式与西方社会有着本质的不同。Rotuma 人不谈论抚养孩子,而是采用了一种类似于 Fiske 所描述的「寻求文化」的理念。在 Rotuma 人看来,儿童并非需要被培养或依赖成人指导的个体,反而更像是一种具有特殊本领的动物。这些孩子能够凭借直觉嗅出文化中有价值和有用的内容,并主动吸收这些元素。Rotuma 人深信,人类与生俱来的模仿本能足以使儿童自然成长为成年人。有意识的教学行为反而不被鼓励。
在研究现代狩猎-采集社会时,Suzanne Gaskins 和 Ruth Paradise 发现,民族志记录中几乎找不到这些社会存在主动教学的案例。(这一观点出自《童年学习的人类学》一书。)这一结论总体上是正确的。我所了解的少数例外情况包括:因纽特的母亲会向幼儿指出亲戚,并期望孩子能说出恰当的称谓;一些生活在热带雨林的群体会展示有毒蘑菇,以教导孩子们哪些不能食用;在哈扎人中,女性初次月经来潮时会被带到丛林中学习有关魔法和神话的知识。除此之外,在所有其他情况下,学习都是通过潜移默化、观察和模仿来完成的。如果我们将当代狩猎-采集社会视为人类进化环境的一个参照,这似乎表明我们很可能已经适应了这种学习方式。
我们在大多数农业社会中都能观察到类似的现象,尽管并非普遍存在。Meyer Fortes 于 1938 年对加纳种高粱的农民的描述,同样适用于我的祖父母——20 世纪 30 年代的瑞典农民:
在 Tallensi 社会,成年人的行为世界对儿童来说是完全开放的,没有任何隐瞒或禁忌。儿童积极而富有责任感地参与到社会结构、经济体系、仪式和意识形态体系中。[…] 因此,无需强迫儿童参与经济和社会活动。他们对此充满热情。
20 世纪 30 年代,Taleland 地区的育儿理念与 Rotuma 人的观点如出一辙。他们认为,塑造儿童学习成果的关键并非正式教育内容,那反而不那么重要。真正起决定性作用的是儿童所处的文化环境。儿童与卓越榜样相处的时间越长,学习效果就越显著。正如 Judith Rich Harris 所论证的,同龄群体就是一切。
这是我祖母邻居——一位矿工——在自家谷仓里亲手打造的教堂风琴。我祖母经常去他那里串门,在耳濡目染中学会了金属加工技术。
这恰恰与我在 20 世纪 90 年代在瑞典乡村长大时,成年人所持的教育理念截然相反。他们过分关注内容——课程和规章制度——却完全忽视了他们无意中营造的文化,而这种文化又反过来塑造了我们:那就是校园文化。
事实证明,这种模式并不十分成功。
学习的结构性制约因素
我们需要沉浸在我们想要学习的技能中。
要做到这一点,环境必须经过精心设计。我们必须能够在有意义的情境中观察到这些技能的实际应用。理想的学习环境应该像一个透明的盒子,而不是一个黑匣子;我们应该能够观察其内部运作而不破坏它。Rotuma 岛的孩子们能做到这一点;而我却无法做到。
Gaskins 和 Paradise 指出:
尽管通过观察进行学习无疑是人类共有的特征,但我们认为,某些文化由于其对儿童期和学习过程的独特理解,创造了能够最大化这种学习机会的环境,并更多地将其作为文化传承的关键工具。
在那些成年人不倾向于直接教学的文化中,人们常常会调整自己的工作方式,使之更加透明易懂:例如,Aché 的猎人会放慢脚步,以照顾经验尚浅的动物追踪者;Mayan 的篮子编织者会坐在地上工作,方便女儿们近距离观察。这种做法可以比作「透明箱」式的教学方法。
在现代职业教育中,我们常常目睹与「实践学习」理念背道而驰的现象。尽管职业教育明确倡导「在实践中学习」,但实际上,工作场所的学习往往悄然摒弃了这一模式,转而采用说教式的教学方法。诚然,培养良好的学习习惯并帮助新手掌握有效的技能训练方法是很有价值的,但过分强调理论教学而忽视实践和实际操作机会往往会适得其反。教育者没有让新手自由接触和探索工作环境,信任他们模仿学习的本能,反而通过严格的课程设置来控制知识的传授。这种做法不仅效果不佳,而且很可能迅速演变成一场卡夫卡笔下才有的噩梦。你是否有过类似的经历?我二十出头时在一家医疗器械工厂担任质量控制员,曾被要求连续四个晚上——准确地说是从晚上 7 点到次日凌晨 7 点 20 分——在一间没有窗户的房间里,阅读如何正确洗手的冗长说明。
在与外界隔绝的密闭房间里学习,这就是所谓的「黑箱」教育方法。
这是我亲身经历过的最糟糕的例子,当然不能代表当今职业培训的普遍状况。然而,程度较轻的类似问题在工作场所培训的相关文献中却屡见不鲜。
Lave 和 Wenger 的经典著作《情境学习》中引用了 Hannah Marshall 对 20 世纪 70 年代肉类切割工的一项研究。研究发现,学徒们大部分时间都在进行理论学习。而实践培训则是在一个模拟的「超市」环境中进行的。他们被教授的内容包括如何磨刀,然而讽刺的是,在过去 70 年里,超市一直都是将钝刀送到工厂进行专业磨刀的。更令人不解的是,当学徒们通过磨刀老师的认证后,却被安排到超市的包装机旁工作。换句话说,他们被安排在一个根本无法观察到有经验的肉类切割工具体工作的岗位上。
要让学徒有效学习,教育者必须在某种程度上放手。他们不应该通过讲课和固定课程来控制知识传递,而应该着重确保学徒能够真正接触到工作环境,分配适当的任务,并相信学徒能从实际情况中汲取知识。
这本身就是一个棘手的问题。为了获得接触机会,新手必须与专家共处,同时又不能妨碍工作进行。如果处理不当,让新手自由地观察并参与专家的工作,很快就会耗尽专家的注意力,使工作难以开展。
这就是所谓的专家注意力稀缺问题。
开源领域充分体现了这一现象。开源运动不仅在促进代码获取方面发挥了重要作用,更在传播软件开发所需知识方面贡献卓著。虽然研究一个代码库并不完全等同于被邀请进入 Rubens 的画室,但它为编程新手提供了一个在现代经济其他领域罕见的学习机会。许多人,包括 Twitter 的创始人 Jack Dorsey 在内,都表示他们的编程技能得益于观察经验丰富的程序员如何在开放的代码库中解决问题,并积极参与其中。然而,这种知识的广泛传播却是以项目维护者承担额外负担为代价的。
Nadia Eghbal 在她的著作《公共领域中的工作:开源软件的创造与维护》中写道:
在我与[热门 GitHub 仓库的]维护者交谈时,我听到他们表达了一种真实的矛盾心理:他们希望鼓励新人参与开源项目,但又感到难以亲自承担这项工作。维护者们实在没有精力去引导每一个对项目略有兴趣的人。
无论他们多么努力工作,大多数人「仍然感到有种力不从心的状态」。
在为新手提供学习机会和确保工作效率之间,始终存在着一种微妙的平衡。要使学徒制真正发挥作用,我们需要设计一种独特的架构。这种架构不同于传统肉店的模式,它应该让新手能够观察专家的工作;同时又有别于 GitHub 的做法,能够避免专家被过多的关注需求所干扰。
这涉及两个关键点:为新手提供学习机会,以及为专家创造高效的工作环境。那么,这样的架构应该是什么样子?我们如何创造一个空间,让新手和大师能够在大规模环境中和谐共处?
在现实世界中,我们能够将学习带回生产环境的能力是有限的,我们可以摒弃最糟糕的学校教育失败模式;研究传统工作坊的组织结构和文化规范;尝试将新手分成更小的群组,以免他们的数量对专家造成压力。
另一方面,在数字世界中,几乎所有曾经限制我们的束缚都已被打破。
这并不意味着我们应该放弃在现实世界中建设更优质的学习机构和基础设施的尝试。但新兴的数字工具极大地拓展了我们的选择范围,而我们迄今为止还未充分发挥它们的潜力。
社交媒体:一种新型架构
如果我们将我们在网络上活动的空间比作房间,那么这些虚拟建筑的设计自由度远远超过了物理世界中的实体空间。
我们能够创造同时容纳数百万人的虚拟空间。这些空间的可见范围可以精确控制——例如,只对 YouTube 直播主开放,或仅允许 Clubhouse 房间主持人邀请的小群体打开麦克风。在这个虚拟世界里,新手观摩专家时可以随心所欲地操控时间:暂停、回放、反复研究难点,或者快进略过冗余内容。他甚至可以通过「分叉」创造一个平行宇宙,在那里自由拆解大师的作品,通过「破坏」来深入理解其运作机制。在 Twitter 上,拥有大量粉丝的用户可以借助他人的点赞来筛选出最精彩的评论和问题,避免了亲自处理海量回复带来的精疲力竭。我们既有像 Twitter 这样倾向于加剧观点极化的算法,也有如 Pol.is 这般致力于消除分歧、凝聚共识的算法。
在数字领域,那些曾经阻碍专家和新手共存的限制已大大减轻。过去,学校是进行大规模教育的唯一可行途径,但如今我们不应再让这种思维方式束缚我们的创新。
然而迄今为止,在线教育的运作模式仍如同这些限制依然存在。这就像我们仍在使用 QWERTY 键盘布局一样——这种布局原本是为了降低打字速度,以防打字机卡住。同样地,我们也将过时的限制强加于我们的学习环境之中。我们只是在数字空间里复制了传统学校的模式。
Balaji Srinivasan 提出,将物理世界中不必要的限制简单地照搬到数字领域的做法,可以称为「照搬式教育」。这与从根本上重新构思并打造真正适应数字环境的解决方案形成了鲜明对比:
Balaji Srinivasan:让我们来想象这样一个演变过程:首先是一张纸,然后是扫描仪,最后是数字文本文件。这展示了从实体到数字化再到数字原生的转变。在这个过程中,扫描仪扮演着桥梁的角色,将实体内容转化为数字形式。我们再来看另一个例子,从面对面会议,到 Zoom 视频会议,再到虚拟现实。Zoom 就像是一个数字化工具,它把线下活动搬到了线上。而虚拟现实则代表了完全的数字原生形式。你能理解我的思路吗?
Tim Ferriss:我完全明白。
Balaji Srinivasan:让我再举一个金融领域的例子。从实物现金,到 PayPal 或其他金融科技产品——这些本质上就是金融世界的「扫描仪」,它们将现金交易数字化。而加密货币则更进一步,它彻底重塑了底层系统,是纯数字化的货币形式,没有任何实体载体。
在教育领域,尤其是高等教育,我们也观察到了类似的演变。最初是传统的实体大学,然后出现了像 Udacity 和 Coursera 这样的在线教育平台。这些都是非常成功的公司,估值已达数十亿美元,但本质上它们只是把大学课程搬到了网上。而现在,我们正站在一个极其有趣的未知领域的边缘:真正的数字原生教育究竟会是什么样子?
这片新兴的学习领域广阔无垠,尚待探索。然而,一个值得关注的重要趋势正在显现,那就是沉浸式学习的回归。这种学习方式曾是前现代世界的特征,如今正从边缘地带重新焕发生机。这无疑是一个令人振奋的信号。为了推动这一趋势,我们需要构建一个基础设施,使更多人能够在线上向技艺精湛的社区「拜师学艺」。
要想对这种学习模式有一个具体的认识,让我们把目光投向开源领域。
开源项目中的大规模学徒制
开源社区在许多方面就像一个透明的玻璃盒子,新手可以清晰地观察和研究其内部运作机制。任何人都可以自由查看代码,阅读问题日志。你可以分叉代码并亲自动手实践,将其作为模块来扩展程序,甚至可以将其拆解,以更深入地感受其内在逻辑和运作方式。
然而,开源平台的设计初衷并非为了促进学习。像 GitHub 这样的主流平台缺乏必要的工具来应对大量经验不足的开发者参与项目的情况,也无法有效地帮助这些新手快速上手和学习,更不用说保护项目维护者免受过多关注带来的压力。
要让学徒制在大规模环境中发挥作用,我们需要一个更完善的中介层。这个中介层是学徒和大师之间交流互动的媒介。例如,代码仓库本身就是一种中介:它们可以分支、复制,并在一系列提交记录中保存了完整的历史。另一种中介是项目维护者使用的自动化机器人,用于回答常见问题或处理合并请求。随着下一代神经网络技术的发展,超越 GPT-3 的水平,我们很可能会看到更多类似导师的智能机器人出现,从而扩大一对一指导的可及性。
Nick Cammarata @nickcammarata:
@julianrdcosta 不得不说,这个领域在教育方面已经取得了巨大突破,而这甚至是在毫无刻意为之的情况下实现的。我曾花费数月时间与 GPT-3 探讨我想学习的话题,发现每分钟的学习效率远胜于阅读大多数书籍,然而这完全不是 GPT-3 原本设计的用途。
下午 1:25 · 2021 年 1 月 5 日
视频直播是第三种较为新颖的中介方式,它让学习者能够实时观摩代码开发过程,为新手提供了一个更加清晰直观的学习环境。开发者甚至可以更进一步,通过 Replit 等工具分享他们的实际工作环境,而不仅仅是屏幕内容。在这种环境中,新手不仅能实时观察专家的操作,还可以随时参与编码实践,理想情况下不会干扰到专家的工作。例如,学习者可以在观看编程教程时随时暂停,尝试自己解决问题,然后继续观看专家的解决方案进行对比。在实时项目中,新手可以通过即时创建分叉来开辟一个「平行空间」,在其中自由测试想法或仔细研究正在构建的代码,之后再无缝回到主工作区。与此同时,专家仍在专注工作,对周围发生的各种探索活动毫不知情。
中介层也可以由人类协调员构成。开源学徒制可以通过群组式课程来组织,这与 Lambda School 等机构的做法类似,但独特之处在于它围绕实际工作项目而非虚拟课堂展开。具体而言,课程提供者与一个热门代码库合作,负责为学徒提供入门指导,作为回报,他们可以将该代码库用作学习平台。课程协调员通过解答新手疑问、分配适当任务、审核代码提交请求以及推荐学习资源等方式提供协助,从而保护代码维护者的宝贵精力。代码维护者则通过分享屏幕、适时给予反馈、进行每日问答等方式,换取部分课程收入和免费劳动力。对学徒而言,他们不仅能够深入接触专家社区,还能在未来求职时展示自己对重要项目做出的一系列有价值贡献。
学徒制的资金可通过课程费用或收入分享协议来解决,这种方式可能比传统教育更加经济实惠。这是因为学徒在学习过程中就能创造价值,而且由于获得更好的指导,他们的能力提升也更快。在 Web3 的环境中,提供免费的学徒服务,甚至给学徒支付学习薪酬,可能更具意义。这样做的目的是快速扩大熟练开发者的数量,从而提升整个生态系统的价值。
以上只是一些初步的构想。开源领域将成为尝试和发展新型教育模式的理想试验场,但这并非终点。随着扩展学徒制所需技术的日益成熟,我们有望在越来越多的领域重新引入沉浸式学习。在遥远的未来,所有的学习,甚至从童年时期开始,都可能再次以沉浸式的方式进行。
三岁的癌症研究员
这篇文章我已经写了一个月了。通往马厩的小路上,蘑菇长得竟和我女儿的腿一般高。近几周来,她对癌症产生了近乎痴迷的兴趣。在她的绘画中,癌症被描绘成黄色的、参差不齐的形状,洒得纸上到处都是。
这就是阅读本文时需要考虑的大背景。我最终思考的问题是:为什么没有办法让她充分发挥这种热情?为什么她不能趁着当前的兴趣高涨,加入到一个生产性的研究团体中,在热情消退之前抓住机会,通过观察、模仿和实践来学习和成长呢?
让一个三岁的孩子进行癌症研究,这种想法介于乌托邦式的理想和 Monty Python 式的荒诞喜剧之间;但这确实是一个值得我们为之努力的愿景。随着我们的技术体系日益成熟,我们应该致力于让更多的人参与到富有成效的环境中来,赋予他们在现实世界中施展才能的尊严。
如果你觉得这篇文章很有见地,我还写了一篇后续文章。在那篇文章中,我将视角拓展到整个社会层面,探讨了非正式知识传播的话题:
非凡人物的童年生活
让我们做更多这样的事情
发布日期:2023 年 2 月 6 日
19 世纪 90 年代的弗吉尼亚·伍尔夫和她的妹妹凡妮莎
让我们从一个显而易见但常被忽视的道理谈起:若想精通某事,应深入研究该领域的最高成就。比如,想提高写作水平,就得多读伟大作家的作品。
然而,这并非父母在考虑教育孩子时的常规做法。他们更倾向于效仿周围的其他父母,把重要的决策交给教育机构。但如果我们深入研究那些最高成就,又能学到什么呢?
在思考这个问题时,我列出了二十个名字,如冯·诺依曼、托尔斯泰、居里夫人、帕斯卡等,这些选择基于一个标准:一个普通瑞典人能想起他们的名字,并觉得这是一位天才。这份名单对我来说,初步描绘了育儿领域中的卓越成果。我买了几堆传记来阅读和做笔记。为了尽量减少样本偏差,我又反思是否有不符合这些传记中模式的杰出人物,结果确实有,所以我又额外买了一些传记。
这种情况持续了过长的时间,已经到了不健康的程度。
我选取了不同领域的代表人物,如作家(弗吉尼亚·伍尔夫、列夫·托尔斯泰),数学家(约翰·冯·诺依曼、布莱斯·帕斯卡、艾伦·图灵),哲学家(伯特兰·罗素、勒内·笛卡尔),以及作曲家(莫扎特、巴赫),力求样本具有多样性。
在这篇文章中,我将详述在浏览了 42 本传记之后,让我印象深刻的几种模式。我将从普遍的模式讲起,逐渐过渡到较为少见的模式。
非凡的人物成长在非凡的环境中
在我研究的群体中,超过 95% 的案例都支持了这一点。
人类这种裸猿,是极度社会化的动物,会不自觉地从周围人那里吸收价值观、思想、技能和欲望。因此,那些最终成就非凡的人,他们在成长的关键时期,往往都是被一群同样非凡的成年人所环绕。
弗吉尼亚·伍尔夫从未正式上过学校。她的父亲,莱斯利·斯蒂芬,是一位编辑、评论家和传记作家,他和家教共同教育了弗吉尼亚及其姐妹。尽管女儿对他有「复杂的憎恶」,他的社交地位却非常高,能够邀请亨利·詹姆斯、托马斯·哈代和阿佛烈·丁尼生勋爵等文坛重量级人物来家中与孩子们共进晚餐并交流。莱斯利·斯蒂芬曾描述他的朋友圈,弗吉尼亚就是在这样的环境中长大的:大部分有名望的文学人士……聪明的年轻作家和律师,大多持有激进的观点……我们常在周三和周日晚上聚在一起,边抽烟边喝酒,讨论宇宙和改革运动。」每到夏天,当他们前往赫布里底群岛度假时,莱斯利还会带上一些画家和哲学家,他们会在夏季别墅中进行创作,而孩子们则在外面玩耍。
在我阅读的众多传记中都有体现,这些父母都极力营造了一个丰富的知识环境。正如我在《首先塑造我们的社交网络,随后它再塑造我们》一文中所述:
米歇尔·蒙田的父亲特意雇用了一些能说流利拉丁语的仆人,这样做是为了营造一个古典文化氛围,让蒙田从小就以拉丁语为母语。约翰·斯图尔特·密尔的童年大多在父亲的书桌边度过,他帮助父亲写经济学论文,还经常跑到杰里米·边沁家借书和讨论思想。
布莱斯·帕斯卡也是在家中由父亲教育成长的。他的父亲选择不教他数学,因为父亲埃蒂安对数学有着近乎病态的热爱。他担心数学会让帕斯卡忽视那些回报不那么直接的领域,比如文学,这种担心有点像现代父母害怕孩子沉迷抖音。帕斯卡只能自学数学。当家人发现少年帕斯卡已经自己推导出几个欧几里得的定理时,全家便搬到巴黎,让父子俩有机会参与梅森的数学沙龙。这样做的初衷,是为了营造一种文化氛围,而不仅仅是单纯的教育。
在我调查的样本中,至少有三分之二的人是在家里接受教育的,通常到 12 岁左右,由父母或家庭教师教育。其他人则在学校接受教育,其中以耶稣会学校为主。
这些孩子们生活中不乏与杰出的成年人的交往,并且得到了他们的认真对待。比如,当伯特兰·罗素 5 岁时,他不相信地球是圆的,他的祖父母没有嘲笑他,反而请来了教区的牧师,希望用理性的讨论让他改变这一错误的看法。
成年人对这些孩子抱有很高的期望,他们认为孩子们有能力理解复杂的主题,因此邀请他们参与严肃的对话和有意义的工作,相信孩子们能够迅速成长并具备能力。
约翰·冯·诺伊曼,这位匈牙利物理学家,曾负责开发氢弹和第一台数字计算机,晚上还把博弈论当做消遣来发明。在他还没上学之前,他的父亲就已经让他参与到银行的管理讨论中。
在一些较为正式的晚宴上,通过与商务来访者的交流,以及父亲在银行业务中的处理方式,我们逐渐了解到建立商业联系和管理银行的诀窍。这些话题总是会被讨论,就像学校课程一样,都会从父亲如何通过授权给合作伙伴和员工来管理活动的角度进行分析。
根据我的经验,让孩子们在你工作时旁观,这既有益但也会让人感到疲惫。约翰·斯图尔特·密尔的父亲在撰写《英国印度史》十卷本期间,允许 3 岁的约翰·斯图尔特每次遇到未见过的希腊词时打断他的工作(他当时正在阅读古典文学作品)。他认为,抚养孩子和从事学术工作同样重要。
并不是所有成就非凡的人物都那么幸运。像拉马努金和迈克尔·法拉第这样的人物,尽管成长环境不理想,仍然崭露头角。但他们也是非凡环境的产物,只不过需要他们自己去开拓这种环境。他们是怎么做到的呢?
首先,他们通过阅读书籍自学成才。然后,随着技能的提高,他们开始主动联系那些非凡的人物,试图说服他们把自己纳入他们的圈子。拉马努金就曾给许多英国数学家发信,直到 G.H. 哈代意识到这位从印度来信的年轻人不是在胡说八道,而是一个天生的天才,于是把他带到了剑桥。此外,拉马努金小时候家里曾接待过大学生,他可能也从他们那里得到了一些指导。
法拉第出生在 19 世纪初的伦敦贫民区,他在学校接受的教育不到一年,后来成为了一名装订工的学徒,这与本杰明·富兰克林的经历颇为相似。他的师傅乔治·里包不仅是个有知识的人,更关键的是,他提供了让法拉第接触书籍的机会。在阅读了艾萨克·沃茨的《心智的提升》这本书后,法拉第开始积极参加科学讲座,并认真记笔记。他把汉弗莱·戴维的一系列讲座整理成书,亲手装订后送给了戴维。戴维对这份礼物颇感欣赏,后来在一次实验中眼睛受伤之后,他收法拉第为实验室学徒。
换句话说,书籍到某种程度上可以替代社交环境,但最终,直接与非凡人士的接触才是关键。从小就能与这些人接触,极大地增加了你受他们影响的机会。
他们有充足的时间到处闲逛,并主要依靠自主学习
占比 ~95%
英国诞生了很多才华横溢的跨学科科学家和学者,他们有时被誉为博学者。这些人中最近的包括伯特兰·罗素、阿弗烈·诺夫·怀特海、J.B.S. 霍尔丹、J.D.贝尔纳和雅各布·布罗诺夫斯基等。罗素曾指出,培养这样的才子,需要一个童年时光,在这段时光里,孩子们基本上不受传统观念的束缚,可以自由地发展和追求自己的兴趣,哪怕这些兴趣看起来古怪或不同寻常。
——卡尔·萨根
这种远离同辈压力的自由,对罗素来说无疑是真实的。他大多数时间都是与其他孩子隔离开来,独自生活在祖父母的贵族大宅里。很多传记作者对此表示遗憾(想象一下,如果罗素能够进入学校学习,他可能会更加才华横溢!)
罗素的孤独生活,也是清闲的。他的祖母是他的监护人,罗素在自传中提到:「她总担心我学习过度,因此把我的上课时间安排得很短。」
他一天中「最宝贵的时光」,都是独自在彭布罗克山庄的花园里度过的。这座花园「似乎还记得曾经的辉煌,那时外国大使在这里踱步,王子们赞叹它整齐的花坛」,但现在,花园日益荒废,灌木丛生,小径被覆盖,原本整齐的树篱已长成树木。
在孤独中,我常在花园里游荡,一边寻找鸟蛋,一边思考时间的流逝。根据我自己的回忆,童年时期的重要印象,往往在玩耍间隙突然浮现,而且从不会告诉大人。我觉得,青少年时期的闲逛非常重要,因为在没有外界干扰的情况下,这些看似短暂实则重要的印象才能形成。
罗素的童年似乎颇为忧郁,弗吉尼亚·伍尔夫也是如此。伍尔夫在给去寄宿学校的哥哥托比的信中感叹道:「你每天晚上坐在火旁,抽着烟斗,和斯特雷奇等人闲聊,轻松获取的知识,我却只能独自一人从书本中艰难地挖掘。」
然而,沉浸于无聊之中似乎是非凡人物传记中的一个常见现象。很多人在童年时因为监护人的决定或因病卧床(如笛卡尔)而与其他孩子隔绝。这种情况引出了一个有趣的假设:与孩子们过多地社交,可能并不利于智力的发展。(我不打算验证这个假设!)
这些传记中还有一个共同的主题,那就是最终让他们声名鹊起的研究领域,几乎像是无聊过度引发的一场狂野幻觉。他们常常会被一种内心深处涌现的痴迷所淹没。
莫扎特在父亲的严格教导下学习钢琴和小提琴,但他个人创作的乐曲却是独立完成的。
关于帕斯卡,我们之前提到过,他在业余时间自学数学,甚至独立完成了几个欧几里得的数学证明。
艾伦·图灵,在寄宿学校成长的他,似乎也自学了大量数学知识(他在十五岁时就推导出了反正切函数,那时他还未接触到微积分!)尽管他在学校中被排挤,面临老师们的反对,因为他们认为他的兴趣「不够广泛」。
另一个例子是麦克斯韦,这位苏格兰数学家通过一系列方程统一了电和磁的理论。他的成就如此卓越,以至于奥地利物理学家玻尔兹曼赞叹:「是神写下了这些符号吗?」
詹姆斯·克拉克·麦克斯韦在 19 世纪 30 年代的苏格兰西南部,米德尔比庄园的格伦莱尔乡村别墅中长大,那里相对与世隔绝。麦克斯韦从小就对几何学充满了兴趣,在接受正式教育之前,他就已经自学发现了正多面体。他的父母曾试图为他聘请家教,但一次因为家教打他的头,他愤而跑到湖中,直到家教被解雇才肯上岸。在他的童年前十年里,他没有接受家教,而是与母亲一起读小说,和父亲讨论农场的改进,爬树、捣乱,以及探索田野、森林和各种动植物。
让我总结一下上文。为了营造孩子们的环境,父母付出了很多心血——请来了有趣的客人,建立了图书馆,还把机器带回家拆解——但孩子们有大量的时间去自由探索这些环境中激发出的兴趣。
可以合理推测,他们每天在正规学习上花费一到四个小时,其余时间则投入到自定的项目中。与今天的孩子们不同,他们几乎没有娱乐方式,因此经常感到无聊,除非他们找到了让自己的心智保持忙碌的方法;他们一生的事业往往就是从这种无聊中孕育出的智力迷恋。
他们接受了大量的一对一辅导
他们所有人都或多或少接受过辅导,其中大约 70% 在成长过程中,每天至少接受一个小时的辅导。这个数据是我根据相关信息做出的推测。
谈到正规教育,辅导是其中一个关键环节。有些人(例如约翰·斯图亚特·密尔)几乎通过这种方式完成所有的正规学习,而其他人则将其作为学校教育的补充(例如阿尔伯特·爱因斯坦,他在校外有好几位专注于数学的家教)。埃里克·霍尔在一系列精彩的文章(这篇,这篇还有这篇)中探讨了为什么我们再也没有培养出像爱因斯坦那样的天才,他特别强调了「贵族式辅导」是最关键的因素。在这里,埃里克不仅指传统意义上的辅导,还包括了孩子与有能力的成人之间更为随意的交流。
他写道:
贵族式辅导并不追求具体的成绩指标。在历史上,这通常是指雇用一位在某领域内有深厚造诣的成年家教,他会和孩子或青少年共同生活,并花大量时间进行教学和讨论,不仅传授知识,还激发学生对各学科的兴趣和参与。
辅导的重要性,在其更狭窄的定义中,即积极指导某人,与一个被称为布鲁姆二西格玛问题的现象有关。这个概念是由教育心理学家本杰明·布鲁姆在 20 世纪 80 年代提出的,他发现接受辅导的学生
...表现得比那些通过常规教学方法学习的学生高出两个标准差,也就是说,接受辅导的学生的平均表现超过了对照班级中 98% 的学生。
简而言之,如果教学内容能针对个别学生量身定制,那么这种教学就能更好地适应他们的思维方式。这样一来,普通学生在接受辅导后,很可能在一百人的班级中名列前茅。当然,事情实际上比这更复杂(如果你想深入了解,我推荐你阅读 Nintil 对这方面研究的系统综述),但辅导的效果确实是真实且显著的。与传统的讲座相比,辅导是一种更可靠、更快速的传授知识的方式。
当我还是一名教师时,我遇到过一些学生很喜欢捣乱,以至于在班上很难学到东西。为了确保他们不掉队,我会对他们进行一对一辅导。尽管这些孩子存在深层次的情感问题,但我发现,单独辅导他们的进展速度通常是整个班级的 2~4 倍。
如果你每天能投入 1~4 小时,就可以更早、更深入地探索知识。尤其是对于那些格外有动力和天赋的孩子,这样做还能为他们提供更多自由探索的时间,让他们自主学习,培养有意义的人际关系。
但是,传记中提到的许多家教并没有特别激励人心。比如,列夫·托尔斯泰的家教就是一个典型的老派教师:
接下来,我们开始写作课。我因为想念妈妈而不停流泪,泪水把纸弄湿了……我的家教卡尔非常生气。他让我跪下,说我这是在故意找借口和「耍小聪明」(他经常用的说法),还威胁要用尺子打我,命令我道歉。但我哭得太厉害,一句话也说不出来。
这段描述出自托尔斯泰 23 岁时写的小说《童年》,据说这段对他真实生活中的家教弗里德里希·罗塞尔的描写是准确的。尽管有评论者指出,亨利·特罗雅在他的传记中对罗塞尔描绘得更为亲切。
罗素也曾遭到几位家教和女教师的虐待。正如我之前提到的,麦克斯韦幸运地避开了这种遭遇。
但也有家教能与学生建立深厚的联系,让学习变成一种共同的智力追求。
约翰·冯·诺依曼的父亲对他们的讨论非常热情。例如,如果他们讨论的是机器织布,他会立刻去找一台雅卡自动织布机来研究。
玛丽·居里的父亲在他们公寓里搭建了一个实验室,让他们可以一起研究化学。
至于莫扎特的父亲,他不仅是孩子们忠诚的家教,还对音乐怀有深深的热爱。
弗吉尼亚·伍尔夫的一位家教,古典学者兼女权活动家的珍妮特·凯斯,对伍尔夫非常重要,以至于在凯斯去世将近 40 年后,伍尔夫还为她写了讣告。
在自传中,这些鼓舞人心的家教通常被特别强调,比那些虐待或平庸的家教显得更重要。这可能反映了作者对他们的感情,而不一定是这些家教真正促成了他们的成就。当然,我认为这种评价是对的。根据我的经验,帮助他人迅速成长需要建立一种深刻而细腻的联系。家教可能会要求严格,期望你全力以赴,但如果这种严格不是建立在尊重的基础上——如果他们没有表现出真正相信你能做得比你想象的更好——那么严厉就会变成压迫。我认为,在托尔斯泰或罗素的例子中,那些专制的家教在塑造他们长期的发展轨迹上并没有起到重要作用。
认知学徒
他们中大约 90% 在某个时候开始了学徒生活,其中约 30% 在 14 岁之前就已经开始。
约翰·斯图尔特·密尔每天早饭后都会和父亲散步。在他的《自传》中,他写道:
我父亲需要大量并且持续的锻炼以保持健康,他习惯在早餐前沿着通向霍恩西的绿色小径散步。我总是陪着他,我的童年记忆中,绿色的田野和野花总与我每天向他汇报我前一天读过的内容混合在一起。据我记得,这种汇报更多是出于自愿,而非被强制的。我阅读时会在小纸条上做笔记,然后在早晨的散步中向他讲述这些内容;我读的主要是历史书,比如罗伯逊、休谟、吉本的作品,但我最喜欢的,那时候甚至很长时间以后,都是沃森的《腓力二世和三世》。[…] 在这些关于我读过的书的频繁讨论中,他会抓住机会向我解释文明、政府、道德和心智培养等方面的知识和观点。他还要求我用自己的话重新表述这些内容。此外,他还让我阅读并向他口头报告许多我本不会主动阅读的书籍。
这些对话实际上是一种认知学徒。通过学徒方式学习是培养技能最有效的方法之一,但如果学习的是认知技能,就需要找到办法让思维过程变得可见,这样学徒才能模仿。
詹姆斯会边思考边说话,以此展示推理的模式,并让约翰·斯图尔特尝试重现他的思考过程,模仿这些思维模式。他逐渐给约翰·斯图尔特安排更复杂的任务,比如要求他总结和阐述一些书籍或观点。他通过提问来指导约翰·斯图尔特,帮助他解决问题,这种方法被称为支架。他还会提供指导和反馈,帮助约翰·斯图尔特提高。
(不过,詹姆斯似乎只能在散步时这样做。当他试图在书房里教导儿子时,可能因为环境更加正式,他采用的教学方法就不那么有效了——他会重复地用指令教育约翰·斯图尔特,未能提供实际示例或展示他想传授的技能,这最终导致了很多痛苦和挫败感。)
在散步时,詹姆斯会等约翰·斯图尔特自己努力解决问题,并深刻体会到难题的困难程度之后,才开始讲解:
他总是让我自己去探索答案,以此激发我思考的能力。只有当我完全感受到问题的难度之后,他才会提供解释。
起初,这些任务都是编造的,比如故事摘要之类的。但约翰·斯图尔特在十几岁时,散步中的活动已经涉及到了真正的智力工作。
他在十三岁时做出了第一个重要的贡献。当时,詹姆斯刚写完《英属印度史》,决定就里卡多的政治经济学理论撰写一篇教育性论文。
在写作这本书的过程中,詹姆斯·密尔充分利用了与儿子建立的师徒关系。他开始大声思考这个新领域——政治经济学——「并每天阐述部分主题」,然后要求约翰·斯图尔特第二天提交一份书面总结。约翰·斯图尔特已经相当擅长这个任务,但由于这是一项全新且严肃的工作,任务依然艰巨。他们会在散步时细致审查约翰·斯图尔特的总结,「他需要一次又一次地修改,直到文字清晰、准确且几乎完整」。也就是说,约翰·斯图尔特将他的思考具体化,父亲则不断指正并提供反馈,直到儿子对政治经济学的理解与他达到一致。詹姆斯还安排约翰·斯图尔特与经济学家里卡多一起散步。
当一切准备就绪后,詹姆斯·密尔对儿子的笔记进行了润色,并将其汇编成书《政治经济学要素》。这本书在约翰·斯图尔特十五岁那年出版。
这种智力上的学徒期,在许多传记中都能看到。在他们的青少年时期——有时甚至更早——未来的杰出人物通常会向某个领域内的佼佼者学习。
罗素在他二十多岁时与怀特海合作,怀特海是当时世界上最著名的哲学家和数学家;帕斯卡与他的父亲共事;法拉第成为了戴维的助手;欧拉得到了伯努利家族几位杰出数学家的指导。
到了这个阶段,他们不仅仅是在学习,实际上已经开始从事真正的智力劳动了。
他们天资非凡
我们必须承认一个重要因素:这些孩子不仅接受了非凡的教育,他们本身也天资非凡。
埃里克·霍尔在他关于天才教育的文章中提到,辅导的作用远大于天生的智力和其他遗传因素。我认为这种说法有些过头了:
Erik Hoel @erikphoel
如果我们有一千个约翰·冯·诺伊曼的克隆体,他们在麻省理工学院的新生中并不会显得更加突出,也不会显得平庸。
2022 年 10 月 25 日下午 7:26
29 点赞 3 转发
埃里克的这种说法听起来比实际更极端(毕竟麻省理工学院是一所选拔严格的学校),但根据我们所观察到的,他预测的结果是极不可能发生的。
在这篇论文中提到的许多人一样,约翰·冯·诺伊曼的天赋也是非同寻常的。他六岁时就能脑中快速计算出八位数的除法结果。我自己也很用心地教导我的五岁孩子,但我看不出他在未来十二个月内能达到这样的水平。
著名数学家乔治·波利亚曾这样回忆冯·诺伊曼上大学时的事情:
我在苏黎世指导一个高级学生研讨班,冯·诺伊曼也在其中。有一次,我讲到一个尚未证明的定理,我说这可能很难解决。冯·诺伊曼起初没说什么,但五分钟后他举手了。我叫他上来之后,他走到黑板前,开始写下证明。从那以后,我就开始敬畏冯·诺伊曼了。
如果我们克隆冯·诺伊曼,并且出于某种原因将克隆体随机分配到美国的各个家庭,这些克隆体中很少有人能得到像原来那位冯·诺伊曼那样的教育。其中一些可能会因为不良的家庭环境而受到影响。但如果其他大约 950 名冯·诺伊曼同时决定去麻省理工学院,那将是一幕壮观的景象。他们也许不是「我同时发明计算机、博弈论和氢弹」那样的天才水平,但肯定也不会是普通的麻省理工学生。而且,谁知道呢,如果有 950 个冯·诺伊曼同时在同一个校园里,也许还能激发出他们改变世界的非凡才能。
那些在特定领域如数学中表现卓越的人,他们的天赋尤为明显。但在其他领域也能看到相同的现象。例如,理查德·瓦格纳最初是由他的拉丁语老师教授钢琴的,但因为理解不了音阶而放弃了。后来,瓦格纳通过听剧院音乐并自己抄写谱子来学习。当他觉得自己的天赋已经达到极限时,他找到了作曲家克里斯蒂安·戈特利布·穆勒,说服母亲让穆勒教他作曲。当时瓦格纳只有十三岁。两年后,他就能够将莫扎特的第九交响曲改编成钢琴曲。
我见过不少才华横溢的音乐家,但这样的事几乎从未发生过。
这并不意味着他们独特的教育方式不重要,或者说这种方式不值得我们去效仿(无论这对你和你孩子的生活是否适用)。能够接触到出色的榜样,并得到专注、个性化的教育,这对人的成长有着革命性的影响。在某些情况下,比如约翰·斯图尔特·密尔,他的卓越技能很可能主要是教育的成果,而非天生的才华。
如果你愿意,你也可以做到。
打造一个非凡的环境,提供尽心尽力的辅导和学徒机会,这确实不容易。我相信,只要你下定决心,一定能做到。不过,像追求所有卓越事物一样,这会需要你做出很大的牺牲,特别是时间上的牺牲。当然,如果你不想这样,也完全可以。
但其实,并不是所有的事都需要牺牲。这更多的是一种看待孩子的态度:认为他们有能力,渴望做有意义的事,应该让他们参与重要的讨论。我们可以学着这样看待他们,但这需要一种细微而深刻的观念转变,这种转变背离了我们通常如何看待孩子的方式。当我读这些传记时,感觉就像是结识了新的同辈。他们的生活方式对我产生了影响,逐渐地,我也提高了自己的追求。
在约翰·斯图尔特·密尔的传记中有一个动人的场景:当约翰·斯图尔特准备开始他的社会生活时,他的父亲第一次告诉他,他接受的教育…有些特别。他将会发现,和他同龄的其他人相比,他知道的要多得多。但是,他的父亲告诉他,对此不应感到骄傲,因为他只是比较幸运而已。
我们应该让更多人拥有这样的幸运。
亲切的问候,
亨里克
Christopher Alexander 的以学习为中心的建筑理念
原文:Christopher Alexander's architecture for learning
2022 年 3 月 17 日,建筑师兼数学家 Christopher Alexander 去世。Alexander 的学术影响力远超建筑和城市规划领域,他推动了现代软件开发中的几个核心观念,比如维基(wiki)、敏捷(agile)和面向对象编程。但他的主要贡献还在乡土建筑上,这种建筑没有建筑师参与,房屋是由居住其中的人逐渐建造的。
Christopher Alexander 正在建造「美」的遗产
为了纪念他,我想趁此机会思考一些他的观点,它们对我影响至深:建筑如何释放社会中的学习潜力。我们如何才能确保所需的知识代代相传?
知识代代相传根本上要满足三个条件。首先,年轻人要接触到他们将要熟悉适应的环境,以便通过模仿来学习。其次,对于难以学习模仿的技能,需要刻意的指导。最后,为了在情感上加以援助,我们需要房屋,以便孩子在家庭中寻求庇护,父母在忙碌时得到帮助。
这些观点并不新颖,至少学校会尝试后两项。更引人注目的是 Alexander 要如何彻底解决它们。他提倡的不是新型学校,而是一系列的建筑模式,将这些功能巧妙融入到社会结构中。接触环境、刻意指导和安全的家庭环境将无缝融入生活的方方面面,形成「彻底去中心化的教育系统」,以至于「同城市结构融为一体」。
这一理念的核心是他称之为学习网络的模式。
Alexander 在 1977 年的经典著作《建筑模式语言:城镇·建筑·构造》 中最为清晰地阐述其学习理念,这本书由他与 Sara Ishikawa 和 Murray Silverstein 合著。
这是一部独特的巨著:像《选择你的冒险》一样,教你如何构建现代化中世纪城邦。
它的涵盖范围和细节令人叹为观止。连同其配套作品《建筑的永恒之道》和《俄勒冈实验》,这套著作共 1912 页,包含 253 个建筑「模式」。每个模式描述「一个在我们环境中反复出现的问题,然后阐述解决该问题的核心方法,使你能够以无数种方式应用这个解决方案,每次应用都独一无二」。这些模式涵盖了从宏观到微观的各个方面——从如何将世界各国划分为城邦并纳入世界联邦,到如何防止杂草从石墙中生长,以及如何选择合适的颜色(红色、黄色和棕色!)来营造温馨的室内氛围。
这些模式大多源自对历史上各地的细致观察,这些地方运转良好,充满活力——Alexander 及其学生是在做一种本土民间建筑的民族志研究。
书中最基本的教育模式 (18:学习网络) 源自天主教神父、历史学家 Ivan Illich ,他以批判体制化的看护而闻名。Illich 曾提出要彻底颠覆学校这个体制化看护及其弊病的典型,转而引入学习网络。Alexander 采纳了这一理念,并将其转化为设计模式。他的做法类似于面向对象编程中从类创建对象的过程:他通过引用数页的原文,创建了 Illich 理念的一个实例,然后着手修改。我稍后会详细讲解他是如何修改的,但首先让我们看看 Alexander 及伙伴们从 Illich 那里继承了什么。
学习网络模式的基本思想源于一个重要观察:我们所掌握的大部分知识并非通过正规教育体系——如学校——习得,而是简单通过生活学到的。我们吸收周围的文化,阅读博客获取信息,观看 YouTube 的教学视频,与朋友交流来理解事物。大部分知识以这种方式传递给我们,不是通过课程,而是以去中心化的网络,连接着其他人及其创造的事物。
Alexander 指出,通过有意识地设计基础设施和服务来促进这些连接的增长,我们可以创造一个「生活即学习」的社会。通过精心打造适当的基础设施,我们可以激发甚至释放学习潜能。
他引用 Illich 的话指出,我们的目标并非「通过学校实现社会控制」,而是「为学习提供全面的资源网络,促进自愿的社会参与。」
这种模式与现代社会教育模式的主要区别在于:网络模式中的学习是自愿的,而在学校模式则是强制的。这种从强制到自愿的转变,重塑了整个(学习的)设计理念。我们不再试图主导学习,而是致力于消除学习障碍。正如我在其他文章中论述的,我们必须激活学习系统。
那么,Illich 和 Alexander 的观点有何不同?区别在于他们促进自愿学习的方式。Illich 强调建立参考图书馆和服务系统,让人们能够获取工具、信息、导师,以及志同道合的同伴。而 Alexander 更关注鼓励人们开放式协作的环境,使他们的知识惠及他人。
显然,孩子需要接触成人世界。成年人身教而非言传的把价值观和生活方式传给孩子。孩子以实践和模仿来学习。如果孩子的教育仅限于学校和家庭,无法接触现代城市各种「神秘的」宏伟事业,那么孩子就无法真正理解成人意味着什么,更不可能去亲身模仿成年人。
– Christopher Alexander,模式 57:城市中的孩子
孩子若无法在社区中自由活动,他们追求兴趣和建立人际关系以促进学习的能力将被严重制约。要获得这种自由,很大程度上取决于社会文化。二战后的德国,儿童允许在遭轰炸的城市废墟中探索——这段经历至今让导演 Werner Herzog 回味无穷。20 世纪中叶的 Glasgow,城市里的孩子会自发组成大型游戏团体(有时人数竟多达数千!),猎杀吸血鬼,追踪「弹簧脚杰克」和「灰衣女士」,组建「儿童民兵」,潜入墓地探险。很有可能,这些今天看来完全不可想象的活动,教会了他们许多组织和集体行动的知识。
毫无疑问,在废墟和墓地中,确实有相当一部分儿童会遭受身心创伤,甚至丧生。因此,不考虑其他因素,降低年轻人在社区活动中的风险并非不合理。
在现代城市中,汽车是一大安全隐患。为应对这一问题,Alexander 提议修建儿童适用的专用自行车道。这些车道在必要时会通过隧道或天桥以穿越马路,但基本会远离机动车。它们会穿过城镇中「通常难以触及的功能区和边边角角:报社印刷厂,接收牛奶的装瓶站,码头,门窗制作车间,餐饮街后的小巷,墓地。」
这样,城市就可以再次向孩子敞开怀抱。
在每个领域,我们都要确保活动的多元融合,以实现知识的广泛传播。以大学为例,Alexander 认为,要防止其成为与世隔绝的象牙塔。相反,大学要像其他工作场所一样,融入城市并公开运作(模式 43:市集式大学)。也许学者会在咖啡馆和公共图书馆聚会,或在住宅区实验室。在这里,孩子们可以像观察垃圾清运工和警察一样,亲眼目睹研究人员繁育小鼠、做脑部扫描或原子裂变实验。
令人欣喜的是,这种公开协作的理念正在线上蓬勃发展。各知识领域的直播活动日益增多。实践社区在 Discord 等平台上兴起,人们在此分享学习资源,公开协作项目,与专家交流。此外,越来越多的研究者公开工作笔记,让大众一窥他们的研究进程(参见这里、这里、这里和这里)。有些独立研究者甚至将参与公共论坛作为其主要研究策略。
几周前,我与目前专注长寿研究的独立研究员 José Ricón 交谈时,询问普通的匈牙利青年如何才能参与抗衰老研究。José 答道:「他们只要谷歌一下就行了。」(Ricón 编写的长寿 FAQ 也是很好的入门资料。)在浏览通俗易懂的资料后,你可以深入阅读这些资料中引用的论文(可以通过 Sci-Hub 获取)。随后,你可以在 Twitter 上关注这些论文的作者——观察他们如何讨论,翻阅他们过去的对话,甚至向他们提问。
因为许多重要研讨会都在线上,所以普通的匈牙利青年也可以轻松潜入这个圈子,注册参与研讨,聆听最新研究成果和行业动态,发现有待解决的问题。Ricón 就是这样进入这个领域的。当然,仍有一些障碍需要克服——比如,如何获得繁殖小鼠的实操经验?如何使用 PCR 仪器?——但我们确实看到,越来越多的青年在涉足这个领域。清晰的路径已经形成。
那么,这种开放性如何实现呢?
Alexander 提出,要为那些那些临街家庭研讨会提供便利(模式 157:家庭研讨会):
[这种模式]把研讨会从后院爱好转到了公共领域。在这里工作的人会看到街上的景象,他们也暴露在路人的视线中。而路人则了解到某些社区的特质。特别是孩子,会因为这种接触变得更活跃。根据工作的性质,这种公开接触可以通过店面、装卸材料的车道、户外工作台或小型会议室等......
然而,并非所有知识都能通过沉浸学习获得。有时,我们需要拜师学艺来加速成长,接受严格的训练——比如,小提琴老师要求我们数小时练习音阶,军事训练中的模拟战斗,或是数学教授在黑板上演示解题过程,引导我们掌握必要的思维方法。
(这种学习方式应被视为对前述方法的补充:现实中的实践提供了学习的基本架构和驱动力。但刻意指导可以帮助我们突破工作中的瓶颈。)
因此,为了促进在社会中的学习,需要让人们轻松、实惠地得到课堂的支持,教练和老师的指导。同时,还需要提供多样化的支持体系,因为每个人的需求和目标都不尽相同。
Christopher Alexander 在描述所需的基础设施时,将大学比喻为市场(模式 43)。他所指的主要并非经济意义上的市场,而是真实的实体市场——摊位林立,小贩众多,充满各种气味和叫卖声,蜿蜒的小巷连接着各个商铺,繁忙的氛围渗透到周围的城市。学习者应该自由探索这个市场,寻找帮助其更快实现目标的支持体系。
早期的大学正是这样组织的。Alexander 写道:
在中世纪,大学最初就是由一群教师组成,他们因独特的知识和见解而吸引学生。这些大学是遍布城市的思想市场,人们可以在其中寻找对自己有意义的学问、思想。
为帮助学习者获得培养技能的针对性环境,我们需要在线上线下实行去中心化的交流。我们应该鼓励教师走出校园,深入城市(模式 85:店面学校),推广学徒制(模式 83:大师与学徒)。我们的责任是将人与人、人与所需资源连接起来。用 Illich 的术语来说,我们要扮演起「网络管理者」、「教育引导者」和「技能示范者」的角色:
网络管理者主要专注于建立和维护通往资源的途径,而教育引导者则帮助学生找到最适合自己、最快达成目标的学习路径。比如,如果一名学生想向中国邻居(一位技能示范者)学习粤语口语,教育引导者可以评估学生的熟练度,并选择最适合其天赋、性格和学习时间的教材和学习方法。对想成为飞机机械师的人,他可以推荐最佳的培训地点。对希望找到志同道合的伙伴讨论非洲历史的人,他可以推荐书籍。
当人们联系起来,他们可以在彼此的家中、配备特殊设备的图书馆或简单的店面学校中会面,由于没有行政开销和特殊的建筑要求,其运营成本可以远低于大型机构。这样,我们就可以打造丰富多样、去中心化的学习服务生态系统,满足人们各式各样的目标需求。
至此,我们已经接近于构建了完整的教育体系——唯一欠缺的就是情感支持和后勤保障。
……在大多数儿童由单亲或夫妇照料的社会中,父母需要在工作或社交时有人看护孩子。...这反映了成人的看法。但事实是,儿童也有同样迫切的需求未得到满足。他们渴望接触父母外的其他成年人和同龄人,他们与其互动的环境不仅要有「学校」、「幼儿园」和「游乐场」,也应该丰富多彩、微妙复杂,具有家庭生活般的多样性和情感深度。
——Christopher Alexander, 模式86:儿童之家
为满足这些需求,Alexander 提议在每个社区设立宽敞、自由的儿童之家,作为孩子们的聚集地。这里应配备两到三名核心成年工作人员;但它不应只是一个机构,而应该是真正的家,至少要有一位成年人住在这。它不设固定的开放或关闭时间,而是始终存在。
与传统学校不同,儿童之家不应隔绝周围环境。它的设计应使行人自然而然地穿过,而非绕过,从而紧密融入城市肌理(模式 101:建筑通道)。理想情况下,它可以与咖啡馆、小商店或其他社区设施合作运营,吸引更多人的参与。
以儿童之家(以及他们的家庭)为基地,孩子们可以探索城市,观察周围的世界——也许可以骑行穿过玻璃隧道参观研究实验室!——或参加课程、学习技艺。之后,他们可以回到这个安全的港湾,在这里玩耍、交谈,并得到倾听。
Alexander 的所有设想都蕴含着深刻的人性。他希望我们的城市能够按照人的本质来塑造,而不是强迫人们去适应城市。这种构想虽然带有乌托邦色彩,却并非遥不可及——每一个具体的模式都很简单,可以自下而上地逐步实现。事实上,我们确实能够,而且正在塑造我们所生活的世界,至少在我们周围的环境中是如此。
Christopher Alexander 正在移动墙体,以感受他正在建造的房间的比例。
2022 年 3 月 22 日,第五天的夜晚。当我写下这最后几行文字时,《模式语言》一书摊开在地板上,我的两个女儿正在夏日小屋里沉睡。不知该如何结束,我合上笔记本电脑,走上露台去看看她们。今晚繁星清晰可见。四岁的小女儿从床上垂下一只手臂,指尖恰好触及地板。「Alexander 已经离我们而去」,我在一张纸上匆匆写道,将纸贴在窗户上。「他再也不能学习,不能成长了。」
然而,我们仍活在他的模式中——我能看到这些模式正在塑造我的女儿们。
远处,一盏尾灯在山谷中闪烁着红光。传来一声低沉的喇叭声。我揉皱纸张,走进屋内,躺在女儿们身边。
(如果你喜欢这篇文章,给它点个赞就是对我最好的回报。这不仅能帮助其他人发现这篇文章,也会让我感到很高兴。)
瑞典的民众教育:比你想知道的要多得多
原文:Popular education in Sweden: much more than you wanted to know
在瑞典海滨长大的我,只需步行五分钟就能到达四个开放式学习场所——这还不包括图书馆和青年中心。这种布局颇具 Christopher Alexander 的设计理念。
其中一个学习场所是一座废弃的教堂,我和朋友们将其改造成录音室;我们获得了一个学习协会的资助,亲自动手进行了翻修。在另一个场所,我向一位来自蒙彼利埃的法国侨民学习法语。我们还组织公开讲座——有一次,令我们自己都大吃一惊的是,我们竟然成功邀请到了时任联合国秘书长潘基文在 Uppsala 进行演讲。我还和一群人一起研究苏联电影,令人不安的是,其中相当一部分人会在放映前唱《斯大林颂》。
离开瑞典后,我才意识到并非每个人都能如此成长。我非常怀念那段时光。事实上,如果整个瑞典即将毁于一旦,而我只能拯救一样东西,我可能会选择保留 folkbildningsrörelsen(民众教育运动)。
Folkbildningsrörelsen:这是我们对一种独特教育运动的称呼,它包括自组织学习小组、资源中心、创客空间、公开讲座和促进个人发展的免费静修活动。
虽然其他国家也有类似的活动,但规模都远不及瑞典。
为了更好地理解 folkbildningsrörelsen 的广泛性,不妨这样想象:瑞典的人口大约相当于纽约市。如果纽约市的每个居民都能像我成长的瑞典小镇那样享有同等数量的免费资源中心,那么曼哈顿的景象将会是这样的:
我原本计划绘制整个纽约的地图,但画了如此多的小圆点后,我的手开始酸痛,最终只完成了曼哈顿最南端的一小部分。
在每个交叉口附近,都有几个房间,你可以进入其中,领取一些钱,用于购买书籍或获取所需的工具。(实际上,这些城市中的资源中心往往集中在较大的场所,但这幅图仍然真实反映了瑞典 7.5% 经常参与学习协会活动的人口的日常生活。)
从个人经历来说,我参与过的这些空间给人的感觉更像是小众网络论坛,而非传统学校。虽然也有一些令人讨厌的人、怪人和另类分子,但我们能够进行超越学校范围的深度交流。当我进入大学后,研讨会反而常常让我感觉像是在演戏。在我们那些往往破旧不堪的建筑里(就像在网络社区中一样),我们并没有把所做的事情视为学习。
我们只是在全身心地投入自己感兴趣的事物。
这一切是如何开始的呢?
在 19 世纪,当这些教育机构及其资金支持体系开始建立时,主要的推动力来自德国的 Bildung(教育)传统。
从词源上看,Bildung 意味着按照上帝的形象(das Bild)塑造自己。在这里,上帝应被想象成一个极具自制力的超然存在——能控制自己的情绪,心智和情感和谐统一,并愿意承担个人道德责任。可以想象成伯特兰·罗素,只是不那么无神论,而且坐在云端。
就是这个样子。
最初,Bildung 带有浓厚的资产阶级色彩,仿佛散发着粗花呢西装和皮革肘部补丁的气息。但在 19 世纪初,Johann Heinrich Pestalozzi、N.F.S. Grundtvig 和 Johann Friedrich Herbart 等思想家找到了向农民和普通工人推广 Bildung 的方法——一种平民化的 Bildung,在瑞典语中称为 folkbildning。这就是在瑞典扎根的传统:一场旨在让普通民众也能按照伯特兰·罗素形象塑造自己的运动。
folkbildning 在英语维基百科页面上被译为 popular education(民众教育)。这个翻译并不十分准确。「民众教育」一词带有强烈的政治色彩——维基百科页面提到「阶级、政治斗争和社会变革」——这与当今北欧国家的实际情况并不完全吻合。虽然学习协会源于各种民众运动(自由教会运动,随后是戒酒运动和劳工运动),这些运动涵盖了不同的政治立场。而且,正如我们将看到的,他们发展出的学习体系很快就超越了最初的政治目标。
为农民打造智力殿堂
自 17 世纪以来,瑞典就兴起了各种民众教育运动。其中最引人注目的莫过于被称为「读者」的群体。这些人不仅为农民组织阅读课程,还秘密创办了图书馆。然而,拥有强制性阅读教育体系的国家当局,出于对自由阅读可能引发社会动荡的担忧,对这些「读者」进行了迫害。
到了 19 世纪,民众教育运动逐渐发展成为一股不容忽视的社会力量。这一变革始于民众高等学校 (folkhögskolor)的诞生。这种新型教育机构首先出现在丹麦的 Ryslinge。1851 年,Christen Kold 在那里创办了一所学校,其理念源自 N.F.S. Grundtvig 的构想——一种面向底层民众的高等教育机构,不设年级划分,以讨论为主要教学方式。
民众高等学校多坐落于风景优美的地区,这并非为了给城市居民提供一处浪漫的休闲胜地,而是为了贴近他们的主要服务对象——农民。在《北欧的秘密》一书中,Andersen 和 Björkman 指出,民众高等学校是类似于 Robert Kegan 的所描述的自我发展之地。这些学校致力于为生活在简朴小型社区中的人们创造条件,帮助他们培养在现代社会中游刃有余所需的知识和心理素质。为此,学校特别注重讨论、实用技能培养和情景模拟训练。
瑞典最早的民众高等学校——Hvilan、Önnestads 和 Herrestad——创办于 1868 年,比丹麦晚了 17 年,看似与丹麦的这一运动并无关联。
这些学校组织角色扮演活动,让工人和农民模拟委员会会议等政治过程中的复杂环节。结果是,当他们获得投票权并开始大举进入政坛时,工人代表的表现竟然超越了上层阶级的代表,这让许多曾经反对民主的人大跌眼镜。这些人原本认为,民主会导致一群「未开化的平民」涌入政坛。有趣的是,政府办公室里那些习惯于评判政治代表专业水平的秘书们,给予这些早期的工人代表高度评价。
在全盛时期,农村地区有 10% 的年轻人选择就读民众高等学校。Andersen 和 Björkman 认为,这培养了一批分布广泛的关键人群,他们掌握了在复杂社会中游刃有余所需的智力和情感技能。他们认为,这可以解释北欧国家的惊人转变:从 1850 年代欧洲最贫穷的地区,到 80 年后跃升为世界上最幸福、最平等、几乎最富有的社会。我认为这有些夸大了民众高等学校的作用——但它确实揭示了普及教育对广大民众产生的深远影响。
而这仅仅是个开端。
民众教育的蓬勃发展
民众高等学校在将公共教育转变为强大社会力量的过程中发挥了关键作用。「民众教育」在不断传播。
然后,在 1902 年,中学教师 Oscar Olsson 想出了让这一理念广为传播的方法。他当时看上去就像正在经历一场疫情封锁的最后阶段。
此前,Olsson 曾赴美考察,亲身体验了 Chautauqua 运动的盛况。这场融合了演讲、表演和宗教元素的教育盛会被西奥多·罗斯福称为「美国最具代表性的事物」。回国后,Olsson 开始思考如何将这些理念本土化,以便将其带到他位于 Lund 的 Good Templar(国际善良圣殿骑士组织,国际禁酒组织)传播禁酒主义。
经过深思熟虑,Olsson 创造了一种斯堪的纳维亚式的简约版 Chautauqua,他将其命名为学习圈。这种学习形式体现了平等理念,成员们自主选举组长,以文学作品为基础,通过自由讨论的方式获取知识。这个构想虽然简单,却如同优秀的网络梗一样具有强大的传播力。更重要的是,它成本低廉。5 到 20 人的小组可以在家中聚会,自主选择学习材料,为工人阶级提供了一种经济实惠的教育方式。
三年后,瑞典议会的一项决议进一步推动了这一教育模式的发展。议会投票通过了为购书提供补助的提案,条件是这些书籍必须向公众开放[1]。
学习圈能够取得成功的另一个关键因素,在于其对群体共同进步的专注。作为禁酒运动的产物,学习圈的理念既不同于工会追求集体力量,也不同于个人主义的自我提升,而是鼓励人们通过自我完善来更好地服务他人。这种注重共同进步的理念似乎为运动提供了持续的动力。同时,它还促进了社会资本的积累,形成了紧密而高度信任的人际网络。
学习圈的广泛传播
学习圈的模式从「Good Templar Order」迅速扩散到各类民众运动中,逐渐充实了公共藏书库,为瑞典公共图书馆系统奠定了基础。
学习圈的成员主要是工人阶级或小农。因此,与民众高等学校相似,学习圈在为这些群体应对 20 世纪日益增长的政治权力做准备方面发挥了关键作用。农场工人、矿工和码头工人不仅学习政治和社会问题,还涉猎会计、法律、文学、数学等各个领域,为将来可能掌管国家做全面准备。他们利用周末时间建造学习场所,成立全国性的学习协会以筹集资金。他们非常认真地致力于成为「小伯特兰·罗素」。
这并非一个传统的教育系统,而是一种释放我所说的学习系统的尝试。与传统教育试图控制人们学习内容不同,folkbildningsrörelsen(民众教育运动)为人们提供了自主学习所需的资源。这些运动为学习生态系统的形成创造了条件。
1950 年,瑞典共有 30,000 个活跃的学习圈,平均每 200 人中就有一个。现代瑞典国家的几位重要缔造者,如 Gunnar Sträng 和 Torsten Nilsson,都是在这个蓬勃发展的民众教育生态系统中成长起来的。
20 年后的 1970 年,学习圈的数量激增至 300,000 个,活跃成员占到了全国人口的 10%。
此后,学习圈的绝对数量一直在这个水平上下浮动,时至今日仍有 7.5% 的人口积极参与其中。
当这场运动达到顶峰时,其最初的政治抱负已经有所减弱。这种减弱部分源于资金问题:为了获得国家拨款,各协会不得不放弃对课程内容的政治控制权。国家和协会都曾争夺课程的控制权,但双方都无法完全压倒对方,因此在某种程度上达成了类似于 Westphalian 和约的和平,将控制权让渡给了学习者自身。
随着学习圈的去中心化,其差异性和多样性也随之增加。
退休妇女们开始组建学习圈,共同学习陶艺制作。一些学习圈则是为那些对 H 日(1967 年瑞典从靠左行驶改为靠右行驶的日子)感到焦虑的人设立的。白领工人羡慕蓝领有自己的协会,于是也开始组建属于自己的学习圈——尽管他们更偏好课堂学习而非讨论小组,主要学习会计和如何实际运营一个协会。大学则以协会的形式成立附属机构,用于播放公开讲座并吸引学生到语言学校学习。有趣的是,仔细观察后发现,许多所谓的学习圈实际上是想获得廉价排练场地的乐队。
学习圈的实际运作方式
如今,要开一个学习圈,你需要:
-
加入一个学习协会,
-
了解如何汇报你的学习情况,
-
提交表格记录参与者人数和学习时长,
-
获得与你付出努力成正比的财务支持——约每人每小时 2 美元——这笔钱通常用于租用场地,也可用于购买教育材料、工具或服务。
在我离开瑞典之前,我管理过三个学习圈。每年的文书工作只需要大约 30 分钟。其中两个是读书俱乐部。将其注册为学习圈让我们获得了会议室的使用权。有时,当我们邀请研究人员来讨论他们的想法时,我们可以用学习资金支付他们的火车票。当我们想学习一些更实用的技能时,我们会用这些资金购买服务——比如聘请一位录音工程师,在我们录制音乐时现场指导我们。
诚然,这个系统中存在一些资金浪费,有人可能会质疑用纳税人的钱资助读书俱乐部是否合乎道德。但总的来说,我观察过的 40 多个学习圈比起我曾工作过的公立学校,每花一分钱所获得的学习效果都要更好。
我也无法想象生活在一个找不到学习圈活动场所的城市里。在这些地方,你可以随时下到地下室,看到人们整天进行各种有趣的讨论和项目。当我发现自己身处一个只有咖啡馆和酒吧可以坐下来交谈的城市时,我会感到一种强烈的压抑感。
民众教育能否成为公立学校教育的可行替代方案?
一个理想的教育体系应当实现三个目标:首先,它应该让所有渴望学习的人在人生的任何阶段都能获取所需的学习资源;其次,它应该让那些愿意分享知识的人能够找到想要向他们学习的人;最后,它应该为那些想要向公众提出问题的人提供机会,使他们的观点能够得到关注。
– Ivan Illich
1971 年,当 Ivan Illich 发表《去学校化社会》这一对学校教育的尖锐批评并呼吁建立自愿学习网络时,瑞典的学习圈已经发展成为与他设想相似的模式。这种模式是「一种不强制任何人学习,但为所有想学习的人提供可用资源和志同道合的伙伴的服务体系」。学习圈「帮助那些希望分享知识的人找到愿意向他们学习的人」。他们是自愿参与的,不受政府控制。
民众教育本质上应该是自由和自愿的,不受政府控制。这种自由自愿的民众教育工作使得每个人都能基于自身经验、兴趣和学习方式来寻求知识,不受成果要求的限制,也没有排斥机制。这种方法鼓励对话、参与和质疑,没有预设的框架。
– 瑞典政府法案 1997/98:115:5
Ivan Illich 关于将教育从学校中剥离的社会理念很容易被人误解,认为是一位被剥夺神职的天主教神父的胡言乱语,他决心恢复基督教的巅峰状态(若你好奇,那是公元一世纪)。然而,瑞典的实践经验是否证明了他的想法其实可行?在现代社会中,一个非强制性的学习体系是否能够成为主流教育的基础架构?
观察瑞典当前的民众教育现状,这种教育模式更像是一种自我提升的途径,而非我们维系文明所需知识的全面传承。最受欢迎的科目多与艺术和手工相关——人们组建乐队、学习房屋修缮、编织和园艺。外语学习也很受欢迎。但明显缺乏 STEM(科学、技术、工程、数学)领域的深入学习(尽管高中水平的传统学科,包括 STEM 科目,仍然很受欢迎)。
这场运动为何被业余爱好者主导的两种理论
这场运动的早期参与者更注重正式技能的培养。是什么导致了这种转变?一种理论认为,早期成员是特立独行者,随着运动规模的扩大,他们最终在数量上被业余爱好者所超越。这是一个不可避免的、「永无止境的九月」。(译注:Eternal September,指一段自 1993 年 9 月开始的时期,自那时起新用户的涌入持续地降低了 Usenet 乃至更多互联网上的行为、言论的水准。)
另一种理论解释了为何民众教育在 1950 年后变成了一个业余项目。战后繁荣时期恰恰是学校最终确立其地位的时期,成为证明就业能力的唯一可接受方式(Gustav Möller 可能是最后一位主张教育等社会服务应通过自愿组织而非直接由国家提供的重要政治人物,他在 1946 年输掉了社会民主党领导权的竞争,败给了 Tage Erlander)。随着 Erlander 和他的门生 Palme 的崛起,出现了建立「强大国家」(det starka samhället)的推动——这包括增加学校教育以及加强对高等教育的国家控制。学历证书,尤其是工程学位,变得备受推崇。在一个只有经过认证的学习才被视为合法的社会中,自主学习就沦为一种消费行为。
大多数人更倾向于追求自我实现,而不是学习记账或财务管理——如果没有职业前景的承诺,甚至连一个由工人掌控的乌托邦的希望,你去学这个简直是「疯上加疯」。
这种模式的其他局限性
除了在 STEM 领域表现不佳外,瑞典模式还存在其他一些局限。目前,这种模式主要局限于 13 岁以上的人群。我认为,未能让年幼儿童参与其中是一个错失的机会。将民众教育运动与在家上学相结合是一条值得探索的有前景的道路。
另一个需要改进的领域是教学方法。民众教育运动非常重视基于讨论的学习,这种方法虽有诸多优点,但现在常常被用在不适合的场合。一些最有效的学习方法(如情景模拟和案例研究、刻意练习、间隔重复、学徒制和一对一辅导)很少被采用。当然,这一点对传统学校同样适用。
为 Illich 主张保持学习自愿性的观点辩护,我们可以看到,在强制教育出现之前,各阶层的人都在学习高级技能。「读者」在农民中普及了识字能力[2],工人自学会计和法律知识……天哪,就连那些宏伟的大教堂都是由自学成才的人建造的。
学习基础设施自下而上的成长
纵观历史,随着人们对更高级技能的需求增加,各种新型学习服务应运而生——罗马帝国的贵族私人教师,中国的科举考试,文艺复兴时期更加系统化的学徒制,中世纪的行会,以及古腾堡印刷术之后出现的文法学校和价格低廉的识字教材。工人和农民愿意在周末和晚上辛勤劳作以建造可供学习的会所,这表明 20 世纪上半叶的瑞典正在全力构建一个更为先进的教育体系。然而,这一进程戛然而止。在时间、资源和合法性方面,他们败给了公立学校。
假如他们没有停下脚步,继续建设和创新,今天这种源自民间的教育替代方案会是什么模样呢?
当然,我们无法准确预测这种假设性的历史会如何发展。但如果我们能从瑞典的经验中得出任何结论,那就是它可能会比现在更加与众不同,也更加有趣。
而这个答案,我们仍有机会去探索。
(如果您觉得这篇文章有价值,您能做的最小回报就是给它点个赞。这不仅能帮助其他人发现这篇文章,也会让我倍感欣慰。)
致谢
本文的最终呈现得益于以下几位的宝贵意见,谨按照采纳他们建议所付出的努力程度排序致谢:Johanna Wiberg、tracingwoodgrains、Matt Smith,以及来自 LessWrong 的 Justis Mills。
参考文献
本文是对多本书籍和文章的综述,其中部分为瑞典语文献。此外,我还依靠记忆对各大学习协会的主页做了一些调查。
-
Gösta Vestlund 著 Folkuppfostran, folkupplysning, folkbildning(《民众教育、民众启蒙、民众培养》)(瑞典语)
-
Per Sundgren 和 Anders Burman 编 texter från Esaias Tegnér till Sven-Eric Liedman(瑞典语)
-
Petros Gougoulakis 和 Michael Christie 合著 Popular education in times of societal transformation—A Swedish perspective
-
Thomas Björkman 和 Lene Rachel Andersen 合著 The Nordic Secret
-
维基百科条目学习圈
-
维基百科条目民众教育(瑞典语:Folkbildning)
-
Henrik Berggren 著 Underbara dagar framför oss
[1]
这些补贴是瑞典模式能够比 1970 年代芝加哥郊外兴起的、受 Ivan Illich 启发的学习交流项目发展得更为广泛的一个原因。没有补贴的情况下,美国的学习交流项目在达到大约 15,000 名成员时,因成功带来的管理成本飙升而难以为继,最终被自身的「成功」扼杀。然而,补贴并非成功的唯一原因:Olsson 设计的模式更为精简,有效降低了行政管理的复杂性。
[2]
在瑞士,联邦政府正式要求各州实施强制学校教育前的 45 年,瑞士就已被认为基本消除了文盲(这可能意味着部分州已提前实施了强制学校教育政策)。
英格兰的识字率发展情况如下:
值得注意的是,这类统计图中的文盲率通常是通过分析教会档案中的签名来确定的——能够签出自己的名字,即使是像三岁孩童那样,也被视为具备识字能力;而仅能画个 X 则被认为是文盲。尽管这种衡量方法并不十分精确,但它在一定程度上反映了我们今天所理解的识字能力。有趣的是,签名能力及其所代表的相关技能的普及速度相当快——在 19 世纪 80 年代学校教育成为强制性要求之前和之后,这种普及速度同样迅猛。
与孩子进行苏格拉底式对话
原文:Socratic dialogue with kids - by Henrik Karlsson
Abstraction Blue, Georgia O’Keeffe, 1927
前不久,我在 YouTube 上看到了一段视频,视频中 Michael Strong 正在和一位 10 岁的小女孩 Alana 讨论机会成本这个概念。Michael 与孩子们探讨复杂话题的能力让我叹为观止,我从未见过有人能像他那样擅长此道。于是,我向他请教了他是如何做到的。
Michael 的职业生涯始于 20 世纪 80 年代,当时他为 Mortimer Adler 工作。Adler 最广为人知的身份是《如何阅读一本书》的作者。他发起了一个名为「Paidea 计划」的项目,旨在复兴古希腊的教育理念——将教育视为文化熏陶(希腊语 παιδεία,即 Paidea)。Michael 受聘在公立学校组织苏格拉底式研讨会。在此后的四十年里,他一直在深入探索这一主题,不断发展苏格拉底式教学实践,并创办了一系列学校。这些学校致力于营造一种独特的文化氛围,以促进个人的全面发展。
在 Michael 与 Alana 的一段视频中——这是他自女儿四岁起记录的数百段对话之一——Michael 让 Alana 朗读一篇经济学论文中关于机会成本的定义:
「经济学家所说的某个资源的机会成本,是指该资源在其他可能用途中能产生的最高价值。」
Alana 读完后,Michael 问道:「这个概念好理解吗?」
「好理解。」
「那么,如果有人问你什么是机会成本,你会怎么解释?」
Alana 思考片刻,然后说:「比如说,你本来想买一个 Twist 巧克力,但发现士力架更便宜。这时你可能会选择买士力架,因为你觉得它更划算。」
显然,Alana 的回答与她刚读过的专业定义并不相符。面对这种情况,我通常会想打断孩子,重新解释这个概念——这也是我与六岁的女儿 Maud 交谈时会做的事。我可能会变得焦躁不安,像个典型的父亲一样,忍不住开始长篇大论地讲解。
然而,Michael 并未表现出丝毫焦躁,也没有采取说教的方式。相反,他不断地提出问题「如果你今晚打算去看电影——你知道看电影的总花费会是多少吗?」为 Alana 设置思考实验「假设你有两个选择:明天[工作]赚取 30 美元,或者去看电影,花 20 美元买票,再花 10 美元购买零食......」并专注地倾听她的推理过程。这样的互动持续了 20 分钟,最终 Alana 通过自己的思考,对机会成本的理解达到了与经济学家相当的水平。
在我与 Michael 交谈时,我询问他如何克制住直接讲解的冲动。我告诉他,在观看视频的过程中,我能清楚地感觉到自己的脉搏在 10 到 15 分钟后开始加快。「我对信息无法立即传达过去的挫败感如此强烈!」
「嗯,你观察得很准确,」Michael 说道。「不过,关于你说的信息没有传达这一点——我并不认为我在做的事是把信息从我脑子里传输到她脑子里。」
「那你究竟在做什么呢?」
「我只是在努力理解她的思维方式。当她的回答与我的理解不一致时,我会觉得很有意思。这让我想要弄清楚她是如何看待这个问题的。她是怎么想的,才会得出这样的答案?我对此非常好奇。所以我会提问,深入探索她的想法。在这个过程中,随着她努力表达得更准确,她的思维方式往往会发生变化,逐渐形成一个更好的认知模型。但是引导她得出正确答案并不是重点。那不是我的工作。我的工作是倾听。我的工作是搞清楚她在脑子里是如何构建这个世界的模型,而不是教导她。」
总之,这是我今年在与孩子沟通方面学到的最宝贵的经验。
学习系统
原文:The Learning System - by Henrik Karlsson
试图控制复杂系统的效果往往不如让其自我组织。这一点在多个领域都得到了印证:例如,市场经济通常比计划经济运作得更为高效;具有生物多样性的生态系统比单一物种的环境更具韧性和适应力。
如果我们将这种思路应用到教育领域呢?
事实上,我们的世界正是依靠着一个庞大的、去中心化的知识网络在运转,尽管这个网络常常不为人所察觉。
这个深不可测的知识网络由无数细微的实践知识(know-how)构成,这些知识大多是人们在生活中跌跌撞撞、互相观察、体察事物运作规律中积累而来的。它可能是东德修理工头脑中的隐秘知识,懂得该贿赂谁(以及如何贿赂)才能获得西德的零部件。它可能是 1947 年诺贝尔奖得主 Gerty 和 Carl Cori 的学生们所习得的独特思维方式和行为准则,这些学生中有六位后来也摘取了诺贝尔桂冠。它甚至可能体现在你两岁的孩子正在习得的当地方言中。
正是因为这种知识难以量化,甚至难以察觉,我们往往没有给予它应有的重视。在讨论学习及其改进方法时,我们常常将注意力局限于可见的知识传播渠道——即学校和大学。然而,尽管这些机构举足轻重,在知识的传承和再生产过程中,正规教育系统实际上只扮演了次要角色。
正如 Lester Thurow 在其著作《教育与经济公平》中所阐述的:「绝大多数实际工作技能,都是在人们获得一份入门级工作并在相应的晋升阶梯上占有一席之地后,通过非正式的在职培训习得的。」
事实上,几乎所有实践知识(knowhow)的传承,都依赖于这种非正式的学习过程——在工作中掌握职业技能,在朋友圈中习得社交能力,在家庭中学会语言。可以说,正规教育仅仅是这座庞大知识冰山露出水面的一角;它是一个由非正式秩序支撑的正式体系。尽管教育体系无法脱离这些分散的知识传播渠道而独立运作,但却往往忽视它们的存在,甚至与之争夺资源。
正如 James Scott 所观察到的:
一个社会或经济体系越是高度规划、严格管控或正式化,就越可能依赖于那些被正式体系忽视,却又不可或缺的非正式过程。这些非正式过程是正式秩序单凭自身无法创造和维持的。
在本文中,我将聚焦于冰山的主体部分——创造和传播知识的去中心化过程。为了将其与传统教育系统区分开来,我称之为学习系统。我们能否利用这个系统来更高效地传播有用的知识呢?
为了阐明从这一视角看待知识再生产问题的意义,我将提出几项策略建议。然而,这些建议本身并非重点。重点在于培养从这一新角度审视学习的习惯。适合的策略会因不同社区而有很大差异。
去中心化的知识再生产
所有在社会中自发传播、而非由上级强制推行的知识,都是通过学习系统进行传播的。
界定教育系统和学习系统之间的界限并非易事,这个界限有些模糊。一端是被动地坐在教室里的学生,另一端则是在维基百科上自主探索、不知不觉中深入学习的人。然而,这两者之间存在着诸多中间状态。借用 Ivan Illich 的术语,我们可以通过区分友好型和操纵型学习环境来划分这条界限:
[操控型]的机构通常采用复杂且代价高昂的运作模式,其中大部分精力和资源都用于说服消费者:离开了该机构提供的产品或服务,他们将无法生存。相比之下,[友好型]的机构则倾向于构建网络,鼓励并促进客户主动发起的交流与合作。
教育系统试图通过强制出勤来操纵知识的传播。这种强制可以通过法律直接实施,也可以采取更隐蔽的方式,即通过操纵生活环境,使得那些选择自学——也就是只依靠学习系统获取知识的人——难以过上体面的生活。
另一方面,学习系统则显得亲和友好。人们主动寻求它的帮助:他们搜索 YouTube 上的讲座,参加读书俱乐部,寻找导师,进入充满活力的工作环境。它满足的是人们自己的需求,是一种完全自主的行为。
学习系统往往展现出惊人的效率。以过去五年为例,数百万人几乎完全在正规教育体系之外,掌握了加密安全令牌推动新软件设计的概念;其中数万人更是获得了实现这些设计的实际技能。这种知识传播的规模和速度着实令人赞叹。
然而,不受约束、去中心化的知识传播并不必然导致有益知识的广泛传播。历史上有诸多重要知识消失的案例——例如西北格陵兰的极地因纽特人失去了制作皮艇的能力——或是一些不良规范和做法反而广为流传。我们也屡次看到,有些人拒绝学习可能挽救他们生命的知识。
1841 年,一份英国议会委员会的报告揭示了一个令人震惊的事实:某些公民竟然从未听说过伦敦这座城市。当一位委员会成员在街头遇到一群工人阶级出身的男孩,询问他们是否知道英国女王是谁时,得到了一个令人啼笑皆非的回答。
「知道,先生,」那些男孩回答道,「她的名字是 Albert 亲王。」
当时,识字能力在上层阶级中已经相当普及,并逐渐在中产阶级中扩散,但尚未在工人阶级中普及。
这种知识的匮乏可以被视为一种学习系统失灵(这个概念可以类比于市场失灵,即分散的市场无法以最优效率配置资源)。从某种意义上说,大众教育的兴起是这种学习系统失灵的一种应对之策。
在英国及其他国家,强制学校教育的引入旨在纠正人们认为存在于学习系统中的低效问题。原本还在学习系统上的时间被划拨给了正规教育,使得知识传播可以被集中控制。学校为课程设计者提供了一个渠道,让他们能够传授他们认为至关重要的知识。
换言之:强制学校教育是对去中心化学习系统的一种干预。
这种干预对原有系统产生了怎样的影响?
对复杂系统的干预
在复杂系统中进行干预常常会带来意想不到的后果。例如,为了阻止芽蛾破坏云杉而喷洒杀虫剂,却同时杀死了芽蛾的天敌,反而使未来的虫害爆发更加严重。又如,实施租金管制的初衷是维持住房的可负担性,却导致建筑业发展放缓,使人们更难迁往经济生产力更高的城市,进而导致失业率上升、经济不平等加剧,同时抑制创新和降低生育率。
这类干预的根本问题在于它们限制了系统自组织的能力。通过将控制权从系统自身转移到负责控制的中央权威,干预措施削弱了系统自主调节以适应环境变化的能力。最终,系统失去了自由适应的能力。
适应能力的核心在于能够根据新环境做出改变。当我们限制了一个系统自我组织和适应的能力时,产生的成本往往难以被察觉,也难以与阻碍这种能力的干预联系起来。例如,农村地区的「绝望死亡」现象表面上与城市的租金管控毫无关联,杀虫剂似乎也不太可能是引发害虫大爆发的原因。
要避免这类问题,我们需要采取另一种方法。我们需要的是能够利用系统自我组织能力的干预措施,而不是与之对抗。我们需要旨在清除自组织系统遇到的障碍的干预。通过清除障碍,我们可以增强系统自己承担负荷的能力。
在林业领域,利用系统意味着培育具有足够韧性的生态系统,使其能够自行控制云杉芽虫的数量,防止其泛滥成灾。
在经济学领域,这种思路体现为某种形式的凯恩斯主义:有别于苏联式的计划经济,它通过充分利用市场自身的优势来纠正市场失灵。具体措施包括打破垄断,利用自由市场竞争来抑制市场形成赢家通吃格局的趋势;采用碳排放权等价格机制,迫使市场内化其外部性。换言之,这种方法旨在激励系统自我调节并突破其固有局限。
如果我们将这种系统思维应用于知识再生产领域,会呈现怎样的图景呢?学习系统本质上是一个自组织实体,能够通过调整自身结构来适应新环境。例如,在文艺复兴时期建立正规学徒制,创办大学,以及在现代社会构建在线学习社区。然而,在当代推动学习发展的过程中,我们往往以牺牲适应性为代价。这导致学习系统曾经发展出的诸多结构,如学徒制等,逐渐衰落。
我们能否设计一些干预措施来增强学习系统,使其能够更好地克服自身的缺陷?虽然我不确定,但这个问题似乎很有研究价值。让我简要列举几种可能的措施。
为学习系统赋能
我们不应该从「某些人应当学习什么?」这个问题出发,而应该从「学习者为了学习想要接触什么样的人和事?」这个问题出发—— Ivan Illich
如果我们想要为学习系统赋能,让它承担起我们赋予教育的部分责任,我们必须首先反思为什么系统的自然纠正机制会失效。为什么学习系统无法再现维持文明所需的知识?它曾经是我们唯一的知识传播方式,而如今却似乎不再够用。到底是什么在阻碍它发挥作用?
关于现代世界中学习系统可能变得不够适用,有两点值得我们深入思考。首先,知识的本质已经发生了根本性的变化。在前现代社会中,知识通常是能直接从日常观察中获取到的,且能迅速带来回报,比如打猎或修补衣服等技能。然而,现代世界中的知识往往更加抽象,学习所带来的满足感也被大大延迟了。那些有趣且能激发内在动机的事物不一定就是最有用的,这导致了激励机制的失衡。结果就是,我们可能会错误地分配自己的时间和精力。
其次,现代化进程犹如一股离心力。快速发展导致社会各个领域日益分离——尤其是家庭与工作、儿童与成人之间的界限变得更加明显——这促使社会走向高度专业化。老年人被安置在养老院,工作年龄的成年人忙碌于办公室,儿童则按年龄被分到不同班级。这种分离使得知识难以在不同群体间传递;儿童无法像前现代社会那样,通过与成人一起工作来自然习得知识;他们也失去了与老年人共同生活所能获得的更为开阔的人生视角。
那么,我们该如何克服这些学习障碍呢?
\1. 激励不足。 首要问题在于激励机制。例如,由于缺乏接触知识工作环境的机会,儿童可能无法理解培养深度读写能力的重要性。尤其是在那些很少看到父母阅读的家庭中成长的孩子,可能会倾向于学习一些表面上有趣但实际价值较低的技能,比如在《我的世界》游戏中种植虚拟蘑菇。这可能会导致他们在未来的就业市场中处于不利地位。
我不确定这个问题是否真如人们所说的那么严重。但假设它确实如此,我们该如何激励那些缺乏动力的人去追求本身并不吸引人的事情呢?
最直接的激励方式就是对你想要推广的行为给予奖励。举例来说,与其强制要求所有人识字,不如给每个通过高中识字测试的人约 2 万美元的奖励。那些有能力自学的孩子可以直接获得这笔奖金,而其他人则可以请求父母教导,或者与老师签订协议以分配这笔奖金,从而既资助了自己的教育,又获得了奖励。这基本上就是 web3 中流行的边学边赚模式:如果人们缺乏内在动力去关注你认为重要的事物,你就付钱激励他们关注。
(当然,如果仅仅实施自主学习和奖金制度,而没有其他配套支持,对某些群体来说可能会导致糟糕的结果:我稍后会详细讨论这一点。)
尽管这个简单模型存在诸多局限性,但它具有一个显著优势:不会破坏现有的学习系统。与其既成本高昂又忍受争议地替换整个系统,不如利用激励机制来增强学习系统的效果。这种方法创建了一个奖励机制,让系统能够自我组织以解决问题。考虑到人们需求和能力的多样性,如果激励得当,学习系统可以通过提供丰富多样的学习机会来满足这些不同需求。学习者可以自由寻找适合自己的工具和导师。有些人可能会喜欢像 3blue1brown 这样的在线教育资源;而其他人则可能选择加入学习小组或自己独立学习。
\2. 隔离的社会。 年龄隔离本质上是一个网络问题——社会网络中的节点之间缺乏有效连接,阻碍了知识的高效传递。儿童(可以比作知识储备有限的节点)失去了直接接触经验丰富的成年人节点的机会,只能通过书本和讲座等媒介从远处学习。然而,许多复杂的知识无法通过这种低效的连接方式传递——现实世界的复杂性和非线性特征难以仅仅通过线性的文字来表达——这使得儿童失去了宝贵的学习机会。
要使学习自然而然地、卓有成效地发生,关键在于获得接触知识的机会。Ivan Illich 早在 1977 年就指出,未来教育机构的使命「必须是为学习者提供便利:即便无法直接进入,也要让他们能够透过窗户窥见控制室或议会的内部。更为重要的是,这些新型机构应该成为学习者无需任何资格证明或背景就能自由进入的渠道,成为公共空间,让学习者有机会接触到超出其当前视野的同辈和长者……」
这种接触方式的问题在于存在一个根本性的矛盾:如何在让新手有机会向专家学习的同时,又不影响专家的工作效率。如果工作场所中新手过多,他们对指导的需求会占用专家大量精力,导致生产效率大幅下降。这种权衡并不意味着我们必须像现在这样完全将新手排斥在外。事实上,特别有天赋的年轻人完全可以比现行法律允许的年龄更早地进入生产环境,从而从中受益。但我们不能简单地给予新手无限制的接触机会。
然而,我们能做的是构建更完善的基础设施。通过利用现代通信技术,我们可以让更多人接触到有价值的人际网络,而不会对专家造成过大压力。我们可以设计新型的架构,使专家和新手能够在更大规模上和谐共处。我在之前的一篇文章《在线学徒制》中对如何实现这一目标进行了初步探讨。
去中心化自治组织(DAO)为我们呈现了一种新型组织形式的生动范例。这类基于区块链技术的组织通常采用开放准入制,并奉行在公共场所工作的理念:任何人都可以加入 Discord 讨论群,参与对话,寻找贡献机会。就在今年11月初,我撰写本文时,看到了 Liminal Warmth 发布的一条推文,介绍了一个新成立的 DAO——其雄心勃勃的目标是竞拍购得一份美国宪法原件。对于我这样对 DAO 和互联网文化了解有限的人来说,能够潜伏在他们讨论宣传策略和处理各种法律问题的频道里,无疑是一次难能可贵的学习经历。我深感即便有专门的大学课程讲授DAO(如果真有这样的课程),恐怕也难以让我获得如此丰富的实践知识。令人惊叹的是,短短 72 小时内,该组织就从 Discord 上约 100 名成员,迅速壮大为一个筹集了逾 4700 万美元的庞大资金池。然而,颇具讽刺意味的是,他们为拍卖会制造了如此大的轰动效应,以至于最终竞价远远超出了他们的预期:他们最终只拿下了第二名。
如果我们将学习责任从学校分散到社会各处,就可能需要创造新的激励机制来促进有用知识的传播,同时必须投资建设相关基础设施,使新手更容易接触到我们希望他们掌握的学习环境。否则,我们可能会面临令人不安的学习系统崩溃,导致大量人群无法获得维持有尊严生活所需的知识。
此外,我们可能还需要为年轻人提供普遍的经济支持。年轻人和技能欠缺者通常在经济上较为脆弱,因此相较于社会最优水平,他们在学习上的投入往往不足。鉴于知识具有正外部性,它应该至少部分由集体出资。外部性是国家资助教育的一个重要理由,即使在资源被分散到整个学习系统的情况下,这一论点依然成立。
对于那些成长环境中缺乏优秀榜样,以及存在学习障碍的人群,我们需要提供额外的支持。如果完全将学习责任去中心化,可能会对这些群体造成不利影响。去中心化必然会导致差异性增加。因此,我们需要建立一个「高通滤波器」机制,既能保留差异性带来的积极影响——比如让天赋异禀的孩子在自主学习中更快成长,让有特殊兴趣的孩子能够及早专攻——同时又能降低潜在的负面影响。
从边缘向中心重塑学习体系
总结一下:
-
存在一种可以称之为去中心化学习系统的机制。
-
教育是为了纠正这个系统(无论是感知到的还是实际存在的)缺陷而进行的干预。
-
过度干预往往会破坏这一潜在的系统,因此应该作为最后的手段使用。
-
可能存在某种方法可以释放学习系统的潜力,就像经济学释放市场潜力一样。
-
这种方法可能会带来令人振奋的结果。
从系统的角度审视知识再生产这一问题,能让我们发现全新的解决方案。本文所概述的几种可能性(如开放直接接触的权限、提供激励措施和经济支持)仅仅是最直观明显的初步构想,很可能还不是最佳方案。事实上,这个领域构想的空间是极其广阔的。
举个例子,Christopher Alexander 曾 构想过另一种潜在的设计方案:
不同于固定场所的强制性学校教育模式,我们应该采取更加灵活多元的方式来分散学习过程,通过在城市中各种场所与各种人群的接触来丰富学习体验。这些学习资源可以包括:各类工作坊,在家授课或带领学生游览城市的教师,愿意指导年轻人的专业人士,年长孩子教导年幼孩子,博物馆,青年旅行团,学术研讨会,工业讲习班,老年人等。将这些多样化的学习情境视为学习过程的核心骨架;对它们进行全面调查,详细描述,并将其发布为城市的「课程目录」。然后,让学生、儿童及其家庭和社区自主选择组合这些学习情境,构建属于自己的「学校」,并使用由社区税收筹集的标准教育券按需付费。在此基础上,建设新的教育设施,以进一步拓展和丰富这个学习网络。
探索教育领域的全部可能性,最有效的方法可能是跳出现有体制的框架,从基层开始。这必然是一个复杂而又充满活力的有机过程。
诸如瑟谷学校、Web3 领域的学习实验、致力于将学习融入日常生活的在家上学模式、敏捷学习中心 以及开源社区中创新的学徒制模式等多种尝试,都能逐步帮助我们从边缘向中心重塑学习体系。
通过循序渐进的方法,我们可以探索如何在不过度依赖中央调控的情况下,弥补去中心化和自主学习模式的不足。这将为我们营造一个更加丰富多样、充满活力的学习服务生态系统。
(如果您觉得这篇文章对您有所启发,不妨给它点个赞,这是一种简单而有意义的回馈方式。这不仅能帮助更多人发现这篇文章,还能给我带来莫大的鼓舞。)
致谢
本文能够不断完善,得益于多轮宝贵的反馈,特别要感谢 Gunnar Zarncke 和 Justis Mills 的悉心指导。当然,文章如有不足之处,责任在我。要知道,在他们开始提供建议之前,这篇文章还远未成型呢。
分层知识结构中的个人优化间隔重复
原文:Optimized, Individualized Spaced Repetition in Hierarchical Knowledge Structures - Justin Skycak
作者:Justin Skycak 发表于 2023 年 10 月 5 日
在像数学这样有层级的知识体系中应用间隔重复是复杂的,这主要是因为高阶主题的复习会对低阶主题产生「涓滴效应」,从而使得这些主题相关的复习排期也需要改变,当然这些重复可能过早,不能算作一次完整的复习,因此需要适当地折算其效果。为了应对这一挑战,我开发了一个名为部分隐式重复 (Fractional Implicit Repetition, FIRe) 的模型。这个模型不仅考虑了隐式的「涓滴」复习,还通过巧妙选择复习内容,让某个主题的隐式复习能连带完成其他待复习主题(就像多米诺骨牌那样),从而显著减少了所需的总复习次数。更为关键的是,该模型能够根据每个学习者在不同主题上的表现,动态调整间隔重复的节奏,在学习者能力和主题难度这两个相互制约的因素之间找到最佳平衡点。
据我所知,当前关于确定最佳复习间隔的数学模型研究,仅限于独立的类似抽认卡的学习任务场景。然而,许多学科实际上是由高度关联的「问题解决」知识构成的复杂体系。
那么,在这种高度关联的问题解决知识体系中,我们该如何有效利用间隔效应(即进行间隔重复)?乍一看,这似乎只需对传统的 Anki 抽认卡系统做一些简单调整即可:
-
一方面,我们可以轻松地将传统的记忆型抽认卡升级为解题练习:不再在每张卡片上使用固定的问题和答案,而是只标注主题名称,然后从该主题的问题库中随机抽取一个问题。如果你能正确解答这个随机问题,就视为「成功回忆了卡片内容」。
-
在这个过程中兼顾知识点的先后顺序也很简单:只有在成功掌握了所有前置知识后,才能引入新的主题。(在将新主题正式纳入间隔重复牌组之前,你还需要完成一个专门的学习单元。在这个单元中,你将在充分的指导和支持下,主动学习并展示你对新问题解决技巧的理解和应用能力。)
然而,魔鬼藏在细节里,尤其是在更新重复规划时,层级结构带来了显著的模型复杂性:例如,对于高级主题的重复应该「涓滴」,以更新那些被隐式练习到的基础主题的重复规划(同时要适当折扣,因为这些复习通常发生得过早,在效果上不能完全算作下一次正式复习)。
为了克服这个障碍,我在 Math Academy 开发了一个部分隐式重复 (Fractional Implicit Repetition, FIRe) 模型。这个模型不仅考虑了隐式的「涓滴」重复,而且还
-
通过巧妙选择复习内容(包括新课程),使其隐式的重复能像多米诺骨牌效应一样连锁「触发」其他待复习内容,从而最大限度地减少所需的复习次数,并且
-
针对每位学生在每个具体主题上的学习情况,对间隔重复过程进行个性化调整。这一过程需要权衡学生能力和主题难度这两个相互制约的因素——学生能力越强,整体学习进度越快;而主题难度越高,学习速度则相应放缓。
这个模型是在 2019 年至 2022 年间经过深入研究与开发而成的成果。尽管具体的实施细节属于专有技术,但我可以在这里分享一些核心理念。目前,该模型的基本组件已经相当稳定(尽管我每年仍在持续改进)。
重复压缩
一个对间隔重复的常见批评是它需要的复习量太大了。这种批评在使用间隔重复学习互不相关的抽认卡时可能成立,但在数学学习中,我们可以利用数学学科的特殊性来规避这个问题。
与孤立的抽认卡不同,数学是一个层次分明、高度关联的知识体系。当学生解决一个高级数学问题时,他们实际上在潜移默化中练习了许多基础数学技能。换言之,在数学领域中,高级技能往往包含了众多基础技能。
因此,当学生需要进行复习时,这些复习任务通常可以被压缩成一个规模更小的学习任务集。这个精简的任务集能够隐式包含(即重复练习)所有待复习的内容。我将这个过程称为重复压缩(repetition compression)。
为了更好地阐述这个概念,让我们看一个具体的乘法例子,即将两位数 39 乘以一位数 6:
要完成上述乘法运算,我们必须对一位数字进行乘法运算,并将一位数字加到两位数字之上:
-
首先,计算 6 × 9 = 54。我们将 5 进位,在结果的个位写下 4。
-
然后,计算 6 × 3 = 18,再加上进位的 5,得到 18 + 5 = 23。我们将 23 写在结果的十位和百位。
换句话说,「两位数乘以一位数」这个运算实际上包含了「一位数乘法」和「一位数与两位数的加法」这两个基本运算。
我们可以通过下面的包含图来可视化这种关系。包含图与前置知识图类似,但有一个重要区别:这里的箭头表示一个较简单的主题被一个更高级的主题所包含。(需要注意的是,被包含的主题通常是前置知识,但并非所有前置知识都会被完全包含。)
现在,假设一个学生需要复习这三个主题。由于知识间存在包含关系,他们实际上只需要复习「两位数乘以一位数」这一主题。当完成这个复习时,学生也在练习了这些技能,从而隐式重复了其包含的主题。
总的来说,知识之间的包含关系越多,实际需要的复习就越少。而数学恰恰是一个存在大量包含关系的学科!
学习效率
在物理学中,光速是一个不可逾越的界限。它代表了任何物质能够达到的理论最高速度,是一个宇宙常数。
在间隔重复的领域中,我们也有一个类似的概念:理论最大学习效率。从理论上讲,如果我们拥有一个结构良好、内容紧密关联的知识体系,我们就有可能无需刻意回顾之前学过的内容,就完成所有的间隔重复。
为了更直观地理解这一点,我们可以想象一系列逐层包含的主题:第一个主题完全包含在第二个之中,第二个又完全包含在第三个之中,第三个进一步包含在第四个之中,以此类推。
每当你学习一个新主题时,所有相关的下级主题都会得到隐式重复。理想情况下,如果你总能找到新的主题来学习,唯一需要进行显式重复的情况就是当你反复尝试却无法掌握某个新主题时。
与此相对的是理论最小学习效率的概念。这种情况等同于使用独立的抽认卡,或者说是一组没有任何内在联系的知识点。
在这种情况下,任何知识点都无法从其他知识点获得隐式重复。每次复习都必须显式进行。
值得注意的是,「知识结构图并不需要完全或几乎完全地相互包含,就能使其最大学习效率接近理论极限」。即使大多数知识点之间没有包含关系,少量的包含关系也能显著提高整体学习效率。
部分隐式重复(FIRe)
在介绍了重复压缩的概念后,让我们进一步探讨通过包含图实现部分隐式重复 (fractional implicit repetitions, FIRe)。
FIRe 将传统的间隔重复扩展到具有层级结构的知识体系中,在这种体系中:
-
高级主题的重复练习会通过知识间的包含关系,隐式「涓滴」到相关的基础主题,并且
-
频繁获得隐式重复的基础主题会适当降低这些重复的权重(因为它们通常发生得过早,在效果上不能完全算作下一次正式重复)。
具体实例
让我们用一个具体例子来阐述这个概念。请回想一下,「两位数乘一位数」这个技能实际上包含了「一位数相乘」和「一位数加两位数」这两个基础技能。
假设你成功通过了「两位数乘一位数」的重复练习,这次成功的练习不仅仅惠及这个特定技能,它还会「反哺」到「一位数相乘」和「一位数加两位数」这两个基础技能。这是因为你刚刚证明了你仍然熟练掌握这些基础技能。
相反,如果你在「一位数加两位数」的重复练习中失败了,这次失败不仅影响这个特定技能,还会「连带影响」到「两位数乘一位数」这个更复杂的技能。毕竟,如果你连一位数加两位数都做不到,你就更不可能完成两位数乘一位数的计算了。同理,如果你在「一位数相乘」的重复练习中失败,也会产生类似的连锁反应。
重复流的可视化
请注意,重复流(repetition flows)可以延伸很多层——不仅仅是直接包含的主题,还有被包含主题所包含的「二阶」主题,然后是被二阶主题包含的三阶主题,以此类推。
在视觉上,得分像闪电一样向下流经知识图。
罚分像生长的树木一样向上流经知识图。
部分包含
FIRe 还自然地处理部分包含的情况,在这种情况下,只有一个较简单主题的某些部分在一个高级主题中被隐式练习。这在更高等的数学中更常见。
例如,在微积分中,高级积分技巧如分部积分要求你计算各种数学函数的积分,如多项式、指数函数和三角函数。但其中一些函数可能只出现在分部积分问题的一部分中。所以,如果你完成了一次分部积分的重复练习,你应该只获得对每个部分包含主题的一部分重复练习。
下图中,我们用数字权重标注主题间的包含关系,表示学习高级主题时涉及各个基础主题的程度。你可以将每个权重理解为:从高级主题中随机选取一个问题时,它包含某个基础主题内容的概率。
FIRe 通过这种部分包含,将重复流延伸到多个层级。最终结果是:
-
重复练习沿着完全包含关系构成的「主干」畅通无阻地传递,
-
同时沿着从主干分支出去的部分包含关系逐渐衰减。
手动设置包含权重
由于包含权重需要手动设置,为知识图谱中每对主题都设置明确的权重是不切实际的。我们的系统包含数千个主题,如果列出所有可能的主题对,权重矩阵将包含数千万个条目。那么,我们该如何设置这些庞大的权重数据呢?
事实上,我们并不需要明确设置矩阵中的每一个权重。只需要为满足以下条件的主题对设置权重即可:
-
权重有一个非平凡的值,
-
无法通过重复流推断出权重,
-
两个主题在前置知识图中的距离较近。
并且我们假定,除了在重复流中隐式计算得出的权重外,其他所有权重均为零。这一假设基于以下理由:
-
权重的大小反映了隐式重复所产生的学习效果。为了使隐式重复能够有效减少显式复习的需求,它必须与足够显著的学习效果相关联。
-
如果重复流能够推断出某个权重,那么手动设置该权重通常不会改变结果(除非手动设置是为了纠正重复流可能错误推断的值)。
-
如果两个主题在前置知识图中相距较远,即使它们之间存在完全包含关系,其权重对减少复习需求的影响也不会太大。这是因为当学生学习到更高级的主题时,他们已经对较基础的主题进行了大部分必要的显式复习。
值得注意的是,满足上述条件的权重通常分布在直接相关和关键的前置知识连接上,而这些连接的数量与主题总数呈线性关系。这一特点使得手动设置包含权重变得可行:只需为每个直接或关键的先决条件分配一个权重即可。
值得注意的是,在知识图谱中,即使某些主题之间的直接关联或关键前置知识的关联强度低至零,也是常见现象。这种情况通常出现在学习某个主题时,学生只需对其前置知识有概念性的理解,而不必精通到能够独立解决相关问题的程度。
因材施教,适应学生个体差异和主题特性
学习能力的个体差异是一个广为人知的事实。研究表明,学生之间在学习速度和记忆保持能力上存在显著差异:有些学生学习快、记忆久,而另一些则学习慢、遗忘快(例如,Kyllonen & Tirre, 1988; Zerr et al., 2018; McDermott & Zerr, 2019)。同样,不同主题的学习难度也各不相同:简单的主题往往学习速度快、记忆持久,而困难的主题则需要更长的学习时间,且更容易被遗忘。
因此,每个学生在每个主题上的学习速度都是由学生个人能力和主题难度这两个因素共同决定的。这两个因素是相互影响的:学生的高能力会加快整体学习进度,而主题的高难度则会减缓学习速度。从这个角度来看,我们可以将学生在特定主题上的学习速度化为以下两个因素的比率:
-
学生能力带来的学习加速
-
主题难度导致的学习减速
「学生-主题学习速度」这一指标用于调节间隔复习过程的进度。
-
举个例子,假设一个学生在某个主题上的学习速度是标准速度的 2 倍,那么他在这个主题上完成的一次复习就会被系统认为相当于完成了两次标准的间隔重复。
-
同样的道理,如果一个学生在某个主题上的学习速度是标准速度的 0.5 倍,那么他在这个主题上完成的一次复习就只会被系统视为完成了半次标准的间隔重复。
在部分隐式重复算法中,也会考虑「学生-主题学习速度」这一因素。学习能力较弱的学生通常难以在复杂主题上获得隐式重复的学习效果——他们更难理解「我之前学过的内容是我现在学习内容的一个特例(或组成部分)」这种关系。
因此,当需要放慢某个主题的间隔重复进度时(即当该学生在这个主题上的学习速度低于标准水平时),最佳策略是取消所有即将到来的隐式重复得分,转而强制进行显式复习。换句话说,这个主题将不再接收原本应该从更高级主题「涓滴」的隐式重复得分。
根据学生在特定主题上的学习速度来决定是否需要强制进行显式复习是合理的。这是因为当某个主题的间隔重复过程变慢时,通常表明该主题对学生而言相对较难掌握。
此外,我们需要认识到,虽然诸多因素可能影响学生的学习速度,如天资、遗忘速率、兴趣或动机水平,以及学习时的疲劳程度或注意力分散等,但这些因素的重要性最终取决于它们对学生实际表现的影响。因此,每个学生的个人学习曲线可以仅根据其观察到的实际表现进行适当调整。
间隔重复模型的宏观结构
从宏观角度看,我的间隔重复模型结构可以概括如下:
$$\begin{align*} repNum &\to \max \left( 0, \phantom{,} repNum + speed \cdot decay^{, failed} \cdot netWork \right) \ memory &\to \max \left( 0, \phantom{,} memory + netWork \right) (0.5)^{ , days , / , interval} \end{align*}$$
-
repNum:学生在特定主题上成功完成的间隔重复轮数。
在以下定义中,「重复」指的是在适当时间进行的成功复习。
-
days:自上次重复以来经过的天数。
-
- interval:第 repNum 次重复和第 repNum+1 次重复之间的理想间隔天数。
-
- memory(记忆值):表示学生在距离上次重复一段时间后的记忆保留率期望。记忆值会随时间逐渐衰退,当记忆值降至某个阈值时,就需要进行下一次重复。另外,如果重复的时间过早(记忆值仍然较高),系统会相应降低该次重复的权重。
-
speed(学习速度):根据学生在特定主题上的表现来衡量其学习速度。这个参数决定了学生在间隔重复学习过程中进步或退步的快慢。
-
failed(失败标记):重复失败记为 1,通过则为 0。
-
- netWork(净效用):衡量学生在一次重复中产生的实际学习效果。重复通过时,netWork 为正值;失败时为负值。
在成功的重复中,完成质量越高,netWork 的正值就越大;在失败的重复中,表现越差,netWork 的负值就越大。
如果重复比预期间隔提前进行(即 memory 记忆值仍然较高),netWork 的数值会相应减少。
注意,在高级主题上的成功练习也会算做对其包含的较简单主题的隐式练习;同样,在较简单主题上的失败也会对以其为基础的更高级主题产生负面影响。
-
decay(衰减值):当学生在复习中失败时,此参数表示其在间隔重复学习过程中后退速度与前进速度的比值。
decay 衰减值是一个从 1 开始的正数,它随着重复的时间远远超过理想间隔而增大,即随着记忆严重衰退而增加。
引入衰减值的目的是为了模拟严重的知识衰退现象,例如广为人知的「暑假滑坡」。在这种情况下,上学年末期学习的内容可能在暑假期间被严重遗忘,以至于在新学年开始时需要更频繁地复习,甚至需要完全重新学习。
针对后续问题的一些回应澄清
在这篇文章于 2024 年 7 月在 HackerNews 上引起关注后,我收到了一些很好的后续问题。以下是我想要说明的关于上述方法的一些要点。如果您还有任何这里未解答的问题,欢迎联系我。
学习者首先通过精通学习的方式接触新主题,也就是说,在他们已经了解并掌握了前置主题之前,不会学习新主题。只有在复习阶段,我们才会进行所有涉及隐式「消除」重复的操作。
**学生并不是简单地记忆答案。**每次的问题都是不同的,虽然测试相同的概念或过程,但不允许学生简单地记忆答案。
这种学习策略是否仅适用于数学,还是也能应用于其他领域的概念学习?
这种策略之所以强大,在于它充分利用了数学知识结构的层次性和高度包含性。任何具有密集包含关系的知识领域都应该能够采用这种策略。然而,如果某个知识领域缺乏紧密的包含关系,那么你能够通过隐式方式「消除」的复习量就会大大受限。
如果学生在学习新主题时,发现自己忘记了某个必要的前置知识,会怎么样?
对此,我们有理论和实践两方面的保障措施。为了便于解释,让我们假设主题 A 是主题 B 的前置知识。
理论保障
如果你有可能在近期忘记 A,那么你现在就会收到一个针对 A 的重复提醒。这意味着你需要立即复习 A(如果可能的话,通过学习更高级的主题来「隐式消除」这个复习需求;如果不可能,我们就会给你一个针对 A 本身的显式复习)。
总的来说,如果某个重复到期,我们不会一直等待出现「隐式消除」的机会,以免你在等待过程中遗忘。我们会直接判断「看来现在无法隐式消除这个复习需求」,然后给你一个显式复习。
实际保障
假设由于某些原因,复习的时间安排略有偏差,导致学生在学习 B 内容时,对先前学过的 A 内容遗忘得比预期更多。即便如此,他们也不会完全忘记 A,而且可以相对轻松地重新温习。通常,这种温习机会就蕴含在 B 的内容中。举例来说,当你学习解决 ax+b=cx+d 形式的方程时,讲解过程中必然会全面回顾如何解 ax+b=c 这类方程。
即便在其他情况下,这种回顾可能不那么详尽,如果你对 A 内容记忆模糊到难以理解 B 的解释,你随时可以回顾学习 A 时的内容进行复习:「嗯,B 中的这部分内容看着眼熟,但它涉及到A,我忘了 A 的某些步骤…好,让我看看 A 的课程…啊对了,我想起来了,就是这么做的。现在回到 B。」而后,在解决 B 中的问题时,你对 A 的刷新记忆会得到进一步巩固。
在最糟糕的情况下,如果学生彻底忘记了 A,以至于无法通过查看参考资料来复习,我们还设有一套补救机制,可以为他们显式提供针对 A 内容的额外练习。在 B 的课程中,我们会追踪前置知识的应用情况,所以如果学生在 B 的学习中「遇到瓶颈」(即连续两次未能通过课程,且第二次没有任何进步),我们就会针对学生卡住的前置知识启动补救性学习任务。
但是,我们是否可以设想,即使子概念和父概念形成了层级关系,回答子概念也不一定能激活父概念?
这正是我们需要明确区分「前置知识」和「包含关系」的关键所在。我承认,我本应在文章中更详细地解释这一点。的确,前置知识并不总是会被自动激活。如果你在前置知识图上应用 FIRe 方法,并将前置知识等同于包含关系,那么你会得到大量错误的重复得分的涓滴。
事实上,我们在早期就遇到了这个问题。解决方案是我必须运用自己的领域专业知识,手动构建一个「包含图」。这项工作量巨大,与手动构建前置知识图同样繁琐。你可以将前置知识图理解为一个「前向」图,它展示了你接下来可以学习的内容;而包含图则是一个「后向」图,它显示了你在学习后续主题时,如何将获得的知识回溯应用,从而为早期学习的主题赋予得分。
手动构建包含图确实是一项令人头疼的工作。我花费了大量时间仔细审视每个主题,不断问自己这样一个问题:「如果一个学生能够解决『后续』主题的问题,我们是否可以合理地认定他们已经真正掌握了前置主题?」诚然,为了使学习过程顺利进行,学生需要预先学习先前置知识,这一点是不言而喻的。但是,这个前置知识是否真的代表了我们确信学生正在练习的核心技能呢?」研究结果表明,在许多情况下答案是「否定的」——但也有相当多的情况是肯定的。而且,这些肯定的情况足以对学习效率产生巨大影响,前提是我们能够充分利用它们。
每当我们推出新主题或调整现有主题时,我都需要更新包含图。要完成这项工作,必须对图中所呈现的知识领域有深入的专业理解。(通常情况下,我们的课程总监负责管理前置知识图,而我负责管理包含图。)
这种方法有任何学术研究成果吗?对间隔重复系统(SRS)的这种改进是否有效?它对哪类学生有帮助?如果确实有效果,效果有多显著?
这种方法的核心理念是使间隔重复在数学等领域变得切实可行。如果没有这种方法,间隔重复将难以实施,因为学习者很快就会被海量复习任务压得喘不过气来,导致无法在学习新知识方面取得任何进展。
更为重要的是,间隔重复不仅使这种学习方式切实可行,还在确保充分复习的前提下将复习量降到最低,从而让你能够突飞猛进。
目前,我们 Math Academy 尚未发布正式的学术研究成果。然而,如果你想要一些更具体的学习效率证据,可以上网查阅更多关于我们在 Pasadena 开展的原创校内项目的信息。在这个项目中,我们的六年级学生从预代数起步,到八年级结束时就能掌握全部高中数学课程(包括代数1、几何、代数 II 和预微积分)。不仅如此,他们还在八年级学习 AP 微积分 BC 课程并参加相应的 AP 考试。
在采用传统人工教学时,学生们的 AP 考试成绩就已经相当不错了。但自从我们开始使用自动化系统(其中包含了前面提到的间隔重复系统)后,AP 微积分 BC 考试的成绩更是显著提升。绝大多数学生都顺利通过了考试,而且在通过的学生中,大部分都获得了满分(5 分制中的 5 分)。值得一提的是,那一年还有四名与我们 Pasadena 学校项目无关的学生,完全脱离课堂环境,仅依靠我们的系统学习 AP 微积分 BC。结果除了一人,其他全都在 AP 考试中拿到了满分 5 分(剩下那位也取得了 4 分的优异成绩)。
一些看似不可能的事情竟然开始发生了。例如,有些学习动力极强的六年级学生,从预代数课程中途开始学习,却在短短一个学年内就完成了通常需要整个高中阶段才能学完的数学课程(包括代数 I、几何、代数 II 和预微积分),甚至开始学习 AP 微积分 BC。有趣的是,当 Math Academy 的创始人 Jason 和 Sandy 第一次看到一个六年级学生接到 AP 微积分 BC 的作业时,Jason 惊呼道:「这是怎么回事?我们的模型出问题了吗?为什么这个孩子会接到微积分的作业?他去年秋天才刚开始学预代数啊,这完全说不通。」但经我调查后发现,这竟然是真的——这个孩子确实在一个学年内就完成了全部高中数学课程。
如果你对此感兴趣,可以查看以下链接:mathacademy.us/press、相关 Reddit 讨论、我在 X/Twitter 上分享的故事,以及该故事的后续。
再次声明,我明白这些并非正式的学术研究。但目前我们正全身心投入创业,产品开发上有太多事情需要处理,以至于我们根本没有时间进行学术研究,连整夜安眠都成了奢望。
如果不做这些改进来减少复习量,间隔重复真的就无法有效实施吗?
我一直在使用 Anki 这款软件来学习和记忆大量数学知识。虽然它并非完美无缺,我也很希望能有一个有向无环图式的学习系统来更好地组织知识,但根据我的经验,基础主题一旦被充分理解,往往会被系统自动推迟很长时间才进行复习。这意味着我可能一年都不会被要求回顾某个基础主题或问题。这种间隔重复的机制似乎有效地避免了重复卡片过多导致的学习负担,让学习更加高效。
然而,有时当我遇到一个较为深奥的知识点时,却发现自己已经遗忘了相关的基础知识,这种情况会让人感到沮丧。因为我不得不直接应对这个高级主题,而无法从最基础的概念(即这个主题的「祖先」知识点)开始,循序渐进地复习一系列相关的前置知识。
诚然,只要我能每天坚持使用 Anki,即使只花 10 到 20 分钟,我就不会忘记任何基础知识。这凸显了持续学习的重要性。然而,如果我中断使用 2 到 3 个月,再重新回到我的卡片组,我可能就会面临前面提到的问题,有时甚至不得不手动搜索相关的基础知识点来进行复习。
你提出的这些观点确实很有道理。我认为,间隔重复的可行性,主要取决于我们如何定义「重复」这个概念。如果你把对一个主题进行一次简单快速的练习就视为一次重复,而且你学习的主题数量不多,学习进度也不会太快,那么这种方法确实如你所说是可行的。
然而,值得注意的是,Math Academy 是基于一个不同的理念设计的:
-
我们的课程体系涵盖了海量的学习主题(以我们的 AP 微积分 BC 课程为例,就包含了 300 多个主题——而这仅仅是一门课程而已;如果学生在完成第一门课程后继续在我们的平台上学习更多课程,他们很容易就能积累起需要维持的数千个主题)
-
每次复习都包含多个关于该主题的问题(初次学习时,一个课程任务大约包含 10 个问题,之后的复习任务则通常包含 3-5 个复习问题)
-
学生平均每 20 分钟左右就能掌握一个新主题(以我们的 AP 微积分 BC 课程为例,整个课程预计需要约 6000 分钟,这已经包括了复习、测验等在内的所有时间。具体计算为:6000 分钟 ÷ 300 个主题 = 每个主题平均 20 分钟)
让我们用一些简单的估算来说明我们系统的运作方式:假设你每天学习 3 个新主题(相当于一小时的学习时间),每次复习大约需要回答 4 个问题。那么,根据粗略估计,你很快就会达到这样一个学习状态:
-
12 个关于昨天所学内容的复习问题,
-
再加上 12 个关于上周首次复习内容的复习问题,
-
再加上 12 个关于两周前第二次复习内容的复习问题,再加上 12 个关于一个月前第三次复习内容的复习问题,
-
再加上 12 个关于几个月前第四次复习内容的复习问题,
-
...
这意味着每天需要复习 60 个问题,远远超出了你在每次一小时学习中能够全部用于复习的时间,导致学习新知识的进度完全停滞。
因此,至少在我们的教学场景中,原始的间隔重复并不可行——除非我们采取措施大幅减少复习量(比如使用部分隐式重复和重复压缩),否则学生将会被海量的复习任务彻底淹没。
当然,我理解你提出的观点,即如果中断学习 2-3 个月后重新开始,确实需要一些复习。Math Academy 的学生如果休息一段时间后重新学习,也会遇到类似的情况。但我们解决这个问题的方法是建议他们重新进行一次诊断性测试,以更新他们的知识状况。本质上,这个过程就是将他们的「知识边界」适当回调,使他们能够从一个合适的起点重新开始,然后顺利地采用我们的标准学习方法继续学习。
(根据我的经验,这正是教师在暑假结束后应该做的——你意识到学生已经遗忘了大量知识,所以你让他们参加一个新学年初的知识评估,然后基于评估结果开展教学。)
参考文献
Kyllonen, P. C., & Tirre, W. C. (1988). Individual differences in associative learning and forgetting. Intelligence, 12(4), 393-421.
McDermott, K. B., & Zerr, C. L. (2019). Individual differences in learning efficiency. Current Directions in Psychological Science, 28(6), 607-613.
Zerr, C. L., Berg, J. J., Nelson, S. M., Fishell, A. K., Savalia, N. K., & McDermott, K. B. (2018). Learning efficiency: Identifying individual differences in learning rate and retention in healthy adults. Psychological science, 29(9), 1436-1450.
本文是 The Math Academy Way(2023 年 10 月草稿)的一部分。 引用格式: Skycak, J., advised by Roberts, J. (2023). Optimized, Individualized Spaced Repetition in Hierarchical Knowledge Structures. In The Math Academy Way (Working Draft, Oct 2023). https://justinmath.com/individualized-spaced-repetition-in-hierarchical-knowledge-structures/
二语习得的五个假说
1. 习得与学得的区别
下述所有假说中,习得与学得的区别最为基本。它指出,成年人提高第二语言能力,有两种泾渭分明且各自独立的方式。
第一种方式是语言习得,类似儿童发展第一语言能力的过程,虽说不尽相同。语言习得是一种潜意识的过程;语言习得者通常并不意识到自己正在习得语言,只知道他们在使用语言进行交流。语言习得的结果,即获得的能力,也是潜意识的。我们通常意识不到已习得的语言规则。相反,我们对正确性总有一种「感觉」。符合语法的句子听起来或者感觉上就是对的。并且我们对错误异常敏感,即使我们并不知道违反了哪条规则。
其他描述习得的方式包括内隐学习、非正式学习和自然学习。在非专业语言中,习得就是「不费力地学会」一种语言。
培养第二语言能力的第二种方式是通过语言学得。从今以后,我们将使用术语“学得”来指代对第二语言的有意识的知识:知道规则,意识到规则,并能够谈论它们。在非专业术语中,学习是对一门语言的「了解」,大多数人称之为“语法”或“规则”。一些同义词包括正式的语言知识,或显性学习。
一些第二语言理论家认为儿童是习得的,而成年人只能学得。然而,习得-学得假说声称,成年人也能习得,即「自然」学会语言的能力不会在青春期消失。这并不意味着成年人在第二语言上总能达到母语水平。这确实意味着成年人可以接触到儿童使用的相同的自然“语言习得装置”。正如我们稍后将看到的,在成人中,习得是一个非常强大的过程。
纠错对潜意识习得几乎没有影响,但被认为对有意识的学得有作用。纠错被认为可以帮助学习者归纳或“找出”规则的正确形式。例如,如果一个把英语作为第二语言的学生说「我每天都去学校」,老师通过正确地重复这个句子来纠正他或她,学习者应该意识到/s/结尾是第三人称而不是第一人称,并改变他或她对规则的有意识的心理表征。这似乎是合理的,但还不清楚纠错在实际实践中是否有这种影响(Fanselow,1977;Long,1977)。学习
来自儿童语言习得的证据证实,纠错不会在很大程度上影响习得。布朗和他的同事们已经证明,父母实际上只纠正了孩子语言的一小部分(偶尔会出现发音问题,某些动词和脏话!)。他们从他们的研究中得出结论,父母更关注孩子所说的话的真实意思,而不是形式。例如,Brown、Cazden 和 Bellugi(1973)报告说,一句话如下:
Her curl my hair
“这样的错误语法并未被纠正,因为事实上,这句话描述的事情是正确的”(第 330 页)。另一方面,
Walt Disney comes on on Tuesday
被更正了,尽管它的句法是正确的,因为 Walt Disney 实际上是在周三出现在电视上的。布朗等人得出结论认为,似乎是“真实意思具有价值;而不是语法主要支配着父母的外在语言强化--这使得这样一个培训计划的通常产品是一个说话高度规范但并不明显真实的成年人;这一事实变得有点自相矛盾”(第 330 页)。
习得与学得的区别可能不是第二语言学习所独有的。当然,我们在学校“学习”我们的第一语言的一小部分(例如,对大多数人来说,是兔/免的区别),在其他领域也有类似的区分(例如,参见Reber,1976;Hall,1959 年;以及d‘Anglejan的评论,1978)。
2. 自然顺序假说
近年来语言习得研究中最令人兴奋的发现之一:语法结构的习得是按照可预测的顺序进行的。特定语言的习得者往往较早习得某些语法结构,而较晚习得其他语法结构。个别习得者之间的一致性并不总是 100%,但在统计上有明显的相似之处。
就自然顺序假说而言,英语可能是研究最多的语言,而在英语的所有结构中,词法学(morphology)是研究最多的。Brown(1973)报告说,将英语作为第一语言的儿童往往比其他儿童更早习得某些语法语素(grammatical morphemes)或虚词(functions words)。例如,进行式标记ing(如"He lives in New York")复数标记/s/("two dogs")是第一批习得的语素之一,而第三人称单数标记/s/(如“he livesin New York”)和所有格/(“John‘shat”)通常是较晚获得的,出现时间从六个月到一年不等。de Villiers和de Villiers(1973)横向证实了布朗的纵向结果,表明布朗发现的那些儿童更早习得的部分是他们更容易接触到的。换言之,对于所研究的语素,难度顺序(difficulty order)与习得顺序(acquisition order)相似。
布朗的结果发表后不久,Dulay和Burt(1974,1975)报告说,将英语作为第二语言习得的儿童在语法语素方面也表现出“自然顺序”,且无论他们的第一语言是什么。儿童第二语言习得顺序与第一语言习得顺序不同,但不同的第二语言习得者群体表现出显著的相似性。Dulay和Burt的结果已经得到许多研究者的证实(Kessler 和 Idar,1977;Fabris,1978;Makino,1980)。Dulay和Burt 使用了布朗最初调查的14个语素中的一个子集。Fathman(1975)用她的口语产出测试--SLOPE测试证实了儿童第二语言习得的自然顺序的真实性,该测试探测了20种不同的结构。
在 Dulay 和 Burt 的工作之后,Bailey,Madden和Krashen(1974)报告了成人受试者的自然顺序,这个顺序与儿童第二语言习得中看到的非常相似。正如我们稍后将看到的,这种自然顺序只有在某些条件下才会出现(或者更确切地说,它只有在某些条件下才会消失!)一些研究证实了成年人语法语素的自然顺序,包括Andersen(1976),他使用作文,Krashen,Houck,Giunchi,Bode,Birnbaum和Strei(1977),使用自由交谈,克里斯森(1979),也使用自由交谈。使用SLOPE测试的成人研究也证实了这一自然顺序,并扩大了数据库。Krashen,Sferlazza,Feldman和Fathman(1976)发现了与Fathman(1975)的儿童第二语言顺序相似的顺序,Kayfez-Fuller(1978)也用SLOPE检验报告了一种自然顺序。
如上所述,第二语言的习得顺序与第一语言的习得顺序不同,但有一些相似之处。Krashen(1977)的表 2.1 列出了第二语言的平均顺序,并显示了第一语言顺序的不同之处。这一平均顺序是对许多语法语素习得的实证研究进行比较而得出结果
表2.1。英语作为第二语言(儿童和成人)语法语素习得的「平均」顺序
虽然英语是学得最好的语言,但它不是唯一学过的语言。关于其他语言习得顺序的研究开始出现。Bruce(1979)和van Naerssen(1981)尚未发表的关于俄语作为外语的论文证实了自然顺序假说在其他语言中的有效性。
我们将在后面讨论自然顺序假说的教学意义,但我应该指出,自然顺序假说的含义并不是说我们的教学大纲应该基于这里讨论的研究中发现的顺序,也就是说,我不建议先教授ing和然后教授第三人称单数/s/。事实上,在我们的目标是语言习得的所有情况下,我们都会找到理由拒绝语法排序。然而,我们将在完成理论基础后再处理这一问题。
(a) 过渡形式
支持自然顺序假说的研究只显示了成熟或结构良好的结构出现的顺序。其他研究揭示了语言习得者在通向精通之路上所有可行的道路。(有关评论,请参阅Dulay,Burt和Krashen,在印刷中。Ravem,1974;Milon,1974;Gillis和Weber,1976;Cancino,Rosansky和Schumann,1974;Wode,1978和Nelson,1980;是这一领域的一些第二语言研究。)这里也有惊人的一致性--习得者在提高过程中会犯非常相似的错误,称为发展性错误。例如,在习得英语否定时,许多第一语言和第二语言习得者都会经历一个阶段,在这个阶段他们会把否定标志放在句子之外,比如:
No Mom sharpen it. (摘自Klima和Bellugi的(1966)
儿童母语习得研究)
and Not like it now. (摘自拉维姆(1974)对儿童的研究
L2习得)
一个典型的后期阶段是在主语和动词之间放置否定标志,如:
I no like this one. (Cancino*等人*(1975)儿童二语习得研究)
and This no have calendar. (摘自舒曼(1978a)对
成人二语习得)
在达到正确的形式之前。
英语中*wh-*疑问句习得的可预测阶段包括**wh-**词出现在句子的前段部分,否则该词将保持正常的不可倒置形式,例如:
How he can be a doctor? (Klima和Bellugi,1966年,儿童L1
习得)
and What she is doing? (Ravem,1974,儿童二语习得)
直到后来,习得者才开始颠倒句子的主语和动词。(详细评论可在 Dulay等人的著作中找到。)
已经为其他语言和其他结构描述了过渡形式。无论习得者的第一语言是什么,特定目标语言的习得阶段似乎惊人地相似(尽管特定的第一语言可能会影响特定阶段的持续时间;参见 Schumann,1979)。这种一致性被认为反映了自然语言习得过程的运作,而自然语言习得过程是我们所有人的一部分。(关于当前关于自然秩序假说的一些问题和争议的讨论,见Krashen,1981。)
3. 监察假说
虽然习得与学得的区别声称成人可以通过两种不同的方式进行二语习得,但它没有说明它们在二语习得中是如何相互作用的。监察假说假设习得和学习是以非常特殊的方式相互作用的。通常情况下,习得会「促使」我们使用第二语言,并对我们的流利程度负责。学得只有一个功能,那就是作为监视器或编辑者。只有在习得的系统“产生”之后,学习才会发挥作用,并改变我们的话语形式。这可能发生在我们说话或写作之前,也可能发生在(自我纠正)之后。图2.1对此过程进行了建模。
图 2.1. 第二语言生产中的习得与学得。
有意识的学习只能作为「监视器」使用,它可以在说或写之前或之后改变所获得的系统的输出。正是后天习得的系统启动了正常、流畅的言语。
监控器假说暗示形式规则或有意识的学习在第二语言表现中只起到有限的作用。随着过去几年的研究进展,这些限制变得更加清晰。第四章回顾的这项研究有力地表明,第二语言表达者只有在满足三个条件时才能使用有意识的规则。这些条件是必要的,但不是充分的,也就是说,即使所有三个条件都满足了,表达者也可能没有充分地有意识地利用他的语法。我在这里列出了这些情况,并作了简要描述。我们将在第四章中更详细地讨论它们:
(i) 时间: 为了有效地思考和使用显性规则,第二语言表达者需要有足够的时间。对于大多数人来说,正常的对话不会有足够的时间来思考和使用规则。在交谈中过度使用规则可能会导致麻烦,即说话风格犹豫不决,对谈话对象所说的话无动于衷。
(ii)聚焦形式: 要有效地使用监控器,时间不够用。表达者还必须专注于形式,或思考正确性(Dulay and Burt,1978)。即使当我们有时间的时候,我们可能会如此投入到我们正在说的事情中,以至于我们没有注意到我们是如何说的。
(iii)知道该规则:这是一个非常艰巨的要求。语言学告诉我们,语言的结构极其复杂,他们声称只描述了最知名语言的一小部分。我们可以肯定的是,我们的学生只接触到了语言总语法的一小部分,而且我们知道,即使是最优秀的学生也不会学习他们接触到的每一条规则。
图2.1中所示的生产模式的证据最初来自于自然顺序假说的研究。(确认该模式的证据也来自其他方面的研究,例如,见Bialystok和Frohlich,1977,1978a,1978b。)这些研究与这一概括是一致的:当我们在看似“无监控”的情况下测试受试者时,我们看到了语法语素的自然顺序,即儿童(第二语言)难度顺序(类似于习得顺序;Krashen,1977),在这种情景下,受试者专注于交际而不是形式。在这种情况下,我们看到了语法语素的自然顺序,即儿童(第二语言)的难度顺序(类似于习得顺序;Krashen,1977)。当我们给成年受试者进行满足三个条件的测试,即纸笔“语法”类型的测试时,我们看到的是“不自然”的顺序,不同于儿童的二语习得顺序或难度顺序。对这一结果的解释是,由于成人第二语言习得与儿童(第二语言)习得相似,自然顺序仅反映了习得系统的运作,没有意识到语法的干扰。当我们把人们放在满足这三个条件的情况下,当他们有时间专注于形式,并知道规则时,错误模式就会改变,反映出有意识的语法的作用。
事实似乎是,不自然的秩序是某些语素排名上升的结果,这些语素是后天获得的、更“容易学习”的项目。当以英语作为第二语言的表达者被置于他们能够并确实监控的情况下,我们看到第三人称单数语素和常规过去时的排名上升,这两种语素都是后期习得的,在表 2.1 中排名较低,但在句法和语义上都相对简单。(见Larsen-Freeman的研究,1975,在第四章的表4.1中描述;和Brown的研究,在第四章的注释4中描述。)
因此,使用意识监控器的效果是允许表达者使用尚未学会的词汇。然而,正如我们将在第四章中看到的,大多数监控器用户只能使用某些特定单词;监视器在语法的某些部分上比其他部分做得更好。具体地说,它似乎更好地处理在两种不同方面可以被描述为“简单”的规则。首先,不需要复杂的移动或排列的规则;语法简单的规则。从这个意义上讲,简单的规则包括限定词法,比如英语中的第三人称单数,或者法语中的de+le=du缩写。在这个意义上的困难规则包括英语wh-疑问句规则,该规则要求将疑问词移到句子的前面,主助词倒置,在某些情况下在正确的位置插入do。由于其语义属性,规则也可能很容易,也可能很难。英语冠词系统很容易正式描述--人们只需在名词前插入the或a,有时什么都不加。但是它的语义很难描述(例如,参见Hawkins,1978)。
综上所述,使用监控器会导致自然顺序中“后期习得”的项目排名上升,即表达者已经学习但尚未获得的项目。只有某些项目可以提升等级,但是,当监控器使用较多时,这种等级提升足以扰乱自然秩序。(正如第四章所讨论的,在某些新获得的语素中有可能出现微小的变化,这些变化不足以扰乱自然秩序;这可以被称为“轻量化”监控器的使用。
正如我们将在第四章中看到的,鼓励使用明显的监控器并非易事。实验表明,任何不是真正的语法测试的东西都不会以任何力量带来有意识的语法。Keyfetz(1978)在SLOPE测试中发现了口语和书面语的自然顺序,表明单纯使用书面语不足以导致非自然顺序。Houck,Robertson和Krashen(1978a)让成人受试者(大学水平的国际学生)修改他们自己的书面输出,并且仍然为校正后的版本找到了一个自然顺序。Krashen,Butler,Birnbaum和Robertson(1978)发现,即使当ESL学生在写作文时有充足的时间,并在指示下非常「小心」,使用监控器的效果也令人惊讶地轻微。现在最好的假设是,对于大多数人,甚至是大学生,需要一个真正的离散点语法类型的测试,才能满足监控器使用的所有三个条件,并鼓励大量使用有意识的语法。
(a) 监控器使用的个体差异
我们在成人第二语言习得和表现上看到的一些个体差异可以用有意识监控器的不同使用来解释。对案例的研究表明,表达者可能有三种基本类型(Krashen,1978;Stafford and Covitt,1978;Kounin和Krashen,1978)。
(i) 监控器过多使用者
这些人一直在试图监控,表达者不断地用他们有意识的第二语言知识检查他们的输出。因此,这样的表演者可能说话犹豫不决,经常在说话过程中自我纠正,而且过于关注正确性,以至于他们不能真正流利地说出任何东西。
过度使用语法可能有两个不同的原因。过度使用首先可能源于表演者接触第二语言的历史。许多人是纯语法教学的受害者,根本没有机会掌握大量的第二语言,可能别无选择,只能依赖于学习。另一种类型可能与个性有关。这些过度使用的人有机会习得,而且实际上可能已经习得了大量的第二语言。他们只是不信任这种后天获得的能力,只有当他们“只是为了确认”而参考他们的监控器时才会感到安全。
(ii) 监视器过少使用者
这些表达者没有学习过,或者如果他们已经学习了,即使在条件允许的情况下,他们也不愿使用他们的有意识的知识。「过少使用者」常不受纠错的影响,只能通过对正确性的“感觉”(译者注:俗称的“语感”)(例如,“听起来是对的”)进行自我更正,并且完全依赖于所获得的系统。
Stafford 和 Covitt(1978)指出,一些过少使用者对有意识语法的价值“光说不做”。他们的研究对象“我”认为,人们需要有意识的规则才能「正确地」说话,而且“语法是每种语言的关键”。然而,“我”自己在讲话或写作中几乎没有使用任何有意识的规则。
(iii) 最优监控器使用者。
我们的教学目标是培养出最佳的用户和表达者,他们在适当的时候和在不干扰交流的情况下使用监控器。许多最优秀的用户不会在普通对话中使用语法,因为这可能会干扰他们。(一些非常熟练的表演者,如一些专业语言学家和语言教师,也许能够在会话中使用大量的有意识知识,例如Rivers,1979,但这是非常不寻常的。我们可能会认为这些人是 1978 年 Yorio 之后的「超级监控器用户」。)然而,在写作和有计划的演讲中,当有时间时,最优用户通常会做出他们所能进行的任何修正,以提高他们输出的准确性(例如,参见Krashen和Pon,1975)。
因此,最优监视器使用者可以使用他们学得的能力作为他们习得的能力的补充。一些还没有完全习得第二语言的最佳使用者,他们在讲话中偶尔会犯一些小错误,他们可以如此成功地使用他们的有意识语法,以至于他们经常会在写作中产生母语的错觉。(这并不意味着有意识的学习(学得)可以完全弥补不完整的习得。一些未学到的规则是可以学习的,而另一些则不是。最佳用户能够通过有意识的学习来填补“部分”空白,但不是全部空白。
##4.输入假设
由于两个原因,我们将花费更多的时间来研究这个假设,而不是其他的假设。首先,这些材料大部分都是相对较新的,而其他假设已经在几本出版的书籍和文章中进行了描述和讨论。第二个原因是它的重要性,既有理论上的,也有实践上的。输入假说试图回答可能是我们这个领域中最重要的问题,并给出了一个对语言教学的所有领域都有潜在影响的答案。
重要的问题是:我们如何习得语言?如果监视器假说是正确的,即习得是中心的,而学习更多是边缘的,那么我们的教育方法论的目标应该是鼓励习得。那么我们如何习得的问题就变得至关重要了。
这一部分安排如下:在给出任何支持证据之前,我将首先提出输入假设。接下来是对第一语言和第二语言习得研究的证据的描述。然后,我们将简要介绍应用语言学研究中的证据,这将在第五章中进行更详细的讨论。
(a) 假设的陈述
让我们首先重申我们如何习得的问题:鉴于自然秩序假说的正确性,我们如何从一个阶段进入另一个阶段?如果习得者处于“第四阶段”,他如何才能进入“第五阶段”呢?更广泛地说,我们如何从代表当前能力的i阶段过渡到i+1阶段,即下一阶段?输入假说提出了如下主张:从阶段i到阶段i+1的一个必要条件(但不是充分条件)是习得者理解包含i+1的输入,其中“理解”意味着习得者关注的是信息的意义而不是形式。
换句话说,只有当我们理解了包含“稍微超出”我们现在的结构的语言时,我们才会习得。这怎么可能?我们如何理解包含我们尚未习得的结构的语言呢?这个明显的悖论的答案是,我们不仅调用语言能力来帮助我们理解。我们还利用上下文,我们对世界的知识,我们的非语言信息来帮助我们理解针对我们的语言。
输入假说与我们在第二语言和外语教学中惯用的教学方法背道而驰。正如 Hatch(1978a)所指出的,我们的假设是,我们首先学习语言结构,然后练习在交际中使用它们,这就是获得语言流利的过程。投入假说则正好相反。它说我们首先通过“追求意义”来获得语言流利性,结果,我们获得了语言结构!(有关第一语言习得的讨论,见MacNamara,1972。)
因此,我们可以将输入假设的第(1)和(2)部分陈述如下:
(1)输入假说与习得有关,与学得无关。
(2)我们通过理解包含超出我们当前能力水平的结构(i+1)来洗习得语言。这是在上下文或非语言信息的帮助下完成的。
输入假说的第三部分指出,输入必须包含i+1才能对语言习得有用,但它不一定只包含i+1。如果习得者理解输入,并且有足够的输入,将自动提供i+1。换言之,如果成功交流,则提供i+1。正如我们稍后将讨论的那样,这意味着最佳输入甚至不应该试图故意瞄准i+1。我们都熟悉刻意覆盖i+1的教学大纲。有一个“当天的结构”,通常老师和学生都认为课程的目的是教授或练习特定的语法项目或结构。一旦这个结构被“掌握”,教学大纲就会进入下一个。输入假说的这一部分暗示,这种刻意提供i+1的尝试是没有必要的。正如我们稍后将看到的,甚至有理由怀疑它可能是有害的。
因此,输入假设的第(3)部分是:
(3) 成功交流时,或输入内容被理解且足够多时,会自动提供i+1。
输入假说的最后一部分指出,流利的口语是无法教授的。相反,它会随着时间的推移自行“出现”。4根据这一观点,教授口语的最好方法,也许是唯一的方法,就是简单地提供可理解的输入。早期的发言会在习得者感觉“准备好了”的时候到来;然而,这种准备好开口说话的感觉对于不同的人来说,到达的时间略有不同。此外,早期讲话在语法上通常不准确。随着习得者听到和理解更多的信息,精确度会随着时间的推移而发展。因此,输入假设的第(4)部分是:
(4) 口语能力会突飞猛进,而它并不是直接教授的。
(b) 支持该假说的证据
儿童母语习得
输入假说与已知的「照顾者语言习惯」非常一致,即父母和其他人在与年幼儿童交谈时所做的修改。对我们来说,照顾者语言习惯最有趣也可能是最重要的特点是,它不是刻意教授语言的尝试。相反,正如克拉克(Clark, 1977)指出的那样,照顾者修改说话方式是为了帮助理解。照顾者会说得更简单一些,努力让孩子明白他们的意思。
我们感兴趣的第二个特征是,我们发现,尽管照顾者说话在句法上比成人说话简单,但它与孩子目前的语言能力水平是「大致匹配」的,而不是“精准匹配”的。换句话说,照顾者的语言并不是精确地调整到每个孩子的水平,而是随着孩子的进步而变得更加复杂。粗调的很好的证据来自Cross(1977)和Newport,Gleitman,and Gleitman(1977)的研究,他们报告说,输入复杂性和儿童语言成熟度之间的相关性虽然是积极的,而且往往是显著的,但通常不是很大。对这一发现的一种解释是,照顾者并没有准确地瞄准i+1。它们提供给孩子的输入包括i+1,但也包括许多已经获得的结构,以及一些没有获得的结构(i+2、i+3等)。孩子可能还没有准备好。换句话说,照顾者不提供基于语法的教学大纲!(有关粗调的更完整的回顾,请参见Krashen 1980,1981。)
关于我们的照顾者语言习惯的第三个特点是“此时此刻”原则。众所周知,照顾者谈论的主要是孩子能感知到的东西,以及眼前环境中的东西。与孩子们的谈话更有可能涉及房间里和现在正在发生的事情(“看到球了吗?”)而不是不在房间里的和不是最新的(“我们明天在楼上做什么?”)。正如Newport等人(1977)指出的那样,这是一个时下的约束--「此时此地」原则反映了照顾者和儿童的共同兴趣。
虽然没有直接证据表明照顾者语言习惯确实比未经修改的输入更有效,但输入假说预测,照顾者语言习惯将对孩子非常有用。首先,它是可以理解的,或者期望它是可以被孩子理解的。“此时此地”功能提供语言外支持(上下文),帮助孩子理解包含i+1的话语。正如MacNamara(1972)指出的那样,儿童不会先习得语法,然后再使用它来理解。孩子首先理解,这有助于他习得语言。
正如前面所讨论的,粗略调整的照顾者讲话涵盖了孩子的i+1,但并不完全集中在i+1上。输入假说的第(3)部分声称这是最优的。粗调在儿童第一语言习得中有以下优势:
(1)确保i+1被覆盖,不会猜测每个孩子的i+1是什么。另一方面,刻意瞄准i+1可能会失手!
(2)粗调的输入可以同时为多个孩子提供i+1,只要他们理解所说的内容。精细调整的输入即使准确(即,即使“命中”i+1),也只会使其i+1与输入中强调的内容完全相同的孩子受益。
(3)粗调的输入提供内置审查。我们不需要关心孩子是否“掌握”了一个结构,孩子是否注意到了当天的输入,或者我们是否提供了足够的信息。使用自然的、大致调优的输入,i+1将反复出现。
换句话说,如果第(3)部分是正确的,如果在有足够的沟通和理解的情况下,总是提供i+1,则照顾者不必有意担心语言结构。
这一定是件好事!将语法排序的责任加到为人父母的角色上会使亲子沟通变得不那么自发,也会变得更加困难。
(ii) 第二语言习得证据:简单编码。
输入假说同样适用于第二语言习得。首先,如前所述,第二语言习得者,无论是儿童还是成人,也是「习得者」,就像儿童习得第一语言一样。此外,根据假说(2),第二语言和第一语言都有一个自然的习得顺序,所以我们也可以讨论第二语言习得者的i + 1。第三,第二语言习得者也可以理解儿童能够理解的修改后的输入。
此修改后的输入有三种类型。外国人谈话的结果是母语者与不能完全掌握他们语言的人所做的修改(例如,参见 Hatch,Shapira和Gough,1978年的一些很好的例子)。教师话语是课堂上的外来语,是课堂管理和讲解的语言(当它是第二语言的时候)。第三个简单类型是中介语交谈,也就是其他第二语言习得者的言语。
虽然这些简单的编码和照顾者语言习惯(Long,1980;Freed,1980)之间有一些不同之处,但也有重要的相似之处。就像照顾者语言习惯一样,外国人谈话和教师谈话中的修改不是为了语言教学,而是为了交流,以帮助第二语言习得者理解所说的话。第二,已有的研究表明,外国人话语和教师话语的自然程度大致与习得者的水平相适应,而不是细调(Freed,1980;Gaies,1977;综述见 Krashen,1980);较高级的第二语言表现者倾向于获得更复杂的输入,但熟练程度与输入复杂性之间的相关性并不是很完美(Freed,1980;Gaies,1977;回顾,Krashen,1980);更高级的第二语言表现者倾向于获得更复杂的输入,但熟练程度与输入复杂性之间的相关性可能并不强。
外国人谈话和教师谈话可能并不总是满足「此时此地」原则,但乐于助人的母语人士和教师会找到其他方法来让输入变得容易理解。除了语言上的改变,他们还利用了习得者对世界的知识,当然,这比儿童获得母语时掌握的知识要多。此外,教师还使用教学辅助工具,如图片和真实情境(参见第三章中的讨论)。
输入假说预测这些简化的语言将对第二语言习得者非常有用,就像照顾者语言习惯被认为对儿童有用一样。(有关支持这一假设的一些初步病史数据,请参见Krashen,1980,1981。)输入假说还预测,与直接针对i+1的精细调整的输入相比,自然的、可交流的、大致可调的、可理解的输入有一些真正的优势,换句话说,就是旨在教授一天结构的课堂练习。
反对语法教学大纲的案例在第三章中有更详细的介绍,但这里有一个简短的总结。这些论点与反对给孩子提供微调输入的论点非常相似:
(1)所有学生可能不在同一阶段。对于许多学生来说,“今天的结构”可能不是i+1。另一方面,通过自然的交流输入,可以为每个人提供一些i+1。
(2)在有语法大纲的情况下,每个结构只出现一次。如果一个学生错过了,缺席了,没有注意,或者只是没有足够的练习(输入),这个学生可能不得不等到明年(届时所有的结构都会被复习!)。另一方面,粗略调整的可理解输入允许自然复习。
(3)语法大纲假定我们知道习得顺序。当我们依赖于可理解输入,依赖于粗略调整的自然交流时,就不需要这样的假设。
(4)最后,语法大纲和由此产生的语法焦点严重限制了可以讨论的内容。很多时候,如果我们的根本动机是练习一种特定的结构,那么讨论或阅读任何真正感兴趣的东西即使不是不可能,也是很困难的。换句话说,语法上的关注通常会阻碍使用第二语言进行真正的交流。
如果这些论点是正确的,它们意味着当我们的目标是习得时,我们不应该试图沿着自然顺序或任何其他顺序进行教学。(当目标是有意识的学习时,这不一定是正确的;参见第四章。)
(iii) 第二语言习得的证据:静默期和母语影响。
输入假说与第二语言习得中的其他发现和假说也是一致的。其中一个可以称为“静默期”,这是儿童第二语言习得中最明显的现象。
人们经常注意到,在自然的、非正式的语言环境中获得第二语言的儿童在第一次接触第二语言后的几个月里可能很少说话。输出通常由记忆的语言组成,整个句子就像是一个单词一样学习。例如,Hatch(1972)报告说,保罗,一个 5 岁的以英语为第二语言的中国人,在他来美国的头几个月里并没有真正使用“创造性”的语言。他唯一的输出是记住的句子,比如
Get out of here.
It's time to eat and drink.
他显然是在没有真正理解其组成部分的情况下把它们作为一个整体来学习的(例如,如果在另一个句子中使用「out」或「time」这个词,他可能不会理解)。这种背诵的句子可能对保罗非常有用,无论是在课堂上还是在操场上。7 当“真正的”语言开始出现时,它看起来非常像母语的习得过程,有一些简短、简单的句子,比如
This kite.
Ball no.
用输入假说来解释静默期是很简单的--孩子通过听,通过理解他周围的语言来建立第二语言的能力。根据输入假说,通过听和理解培养了足够的能力后,口语能力就会自动产生。我们应该注意到,关于儿童习得第二语言的案例(另见 Hakuta,1974;Ervin-Tripp,1974)一致认为,他们可能需要几个月的时间才能开始说话,而且说出的句子并不完全正确。正如我们将在第三章中看到的那样,这一发现具有重要的教学考虑。
成年人和正规语言课上的儿童通常不被允许有静默期。他们经常被要求很早就使用第二语言,在他们获得足够的句法能力来表达自己的想法之前。根据 Newmark(1966)首次提出的假说,在“准备好”之前被要求进行创作的表演者将依赖于母语规则,即他们在说第二语言时会使用第一语言的句法规则。
更正式地说,如习得者需要i+1来表达自己的意思,但尚未获得i+1,则习得者将为i+1(第二语言的一条规则)掺入一些母语规则。使用的母语规则可能与第二语言i+1非常相似,但也可能在某些方面有所不同。当母语和第二语言规则不同时,所产生的错误通常被称为“扰乱”。但根据Newmark的说法,这根本不是扰乱;这不是母语干扰第二语言表现的结果,而是缺乏知识的结果--尚未习得表达所需的第二语言规则。
(iv) 第二语言规则使用的利弊。
用一些母语规则代替一些i+1既有好处也有坏处。然而,好处是短期的,而坏处似乎相当严重。
一个明显的优点是,母语规则的使用允许表达者在获得相关的i+1规则之前,“超越他的能力”,以满足二语交际的实际需要。当使用的母语规则与第二语言中的规则(“正迁移”)相同时,表达者似乎得到了免费的东西。即使母语规则与第二语言规则不同,人们可能会争辩说,说出来已经很好了,因为通常情况下,尽管形式不正确,他仍然可以传达自己的观点。
另一个好处是,使用母语所允许的早期产出也有助于带来输入--它允许表达者更多地参与对话,这可能意味着更容易理解的输入,因此也就意味着更多的第二语言习得。
然而,返回母语中采选(近似)表达也有真正的坏处。首先,母语规则可能与第二语言规则不同,如上所述,可能会导致错误。有意识地使用监控器可以在某些情况下记录并修复这些错误,但不是所有情况,因为正如我们已经看到的,监控器使用的限制是严格的。因此,母语规则的使用要求监控器时刻保持警惕,而且如此产生第二语言形式上正确的句子是一种笨拙的方式。(请注意,根据理论,监控器对此类错误的纠正不会产生获取或永久更改。它不会根除母语规则,即使在很长一段时间内有效地做到了这一点。真正的习得只来自可理解输入。)8
在第二语言表现中使用母语规则可能还有另一个严重的坏处。即使母语规则类似于实际的第二语言规则或过渡形式,也不清楚这些规则是否有助于习得者的进步--它们可能不会在发展序列中取代“真正的”第二语言规则。在Krashen(1982)中,我讨论了习得需要在i和i+1之间进行比较的假设(Clark和Andersen,1980;Lamadella,1979)。情况可能是,i和i+1之间的“语义距离”不能太大--i和i+1只能有很小的差别。我假设,过渡形式可能有用,因为它们可以临时充当i,帮助减少i和i+1之间的距离。
例如,如果英语中的目标规则是否定的(i+1,通过输入呈现给系统),则中间形式no+v(由创造性构建系统内部提供)可能更接近成熟的否定形式。因此,习得者可以在i处使用no+v,而不是否定的更原始形式(例如no+S)。
如果过渡性形式可以暂时充当i,那么下一个问题是母语规则,即使它们恰好与第二语言规则或过渡性形式相似,是否也可以执行这一功能。答案可能是“不”。例如,说西班牙语的人在习得英语的过程中通常有很长的一段时间,他们在英语否定中使用no+v,这一结构类似于英语作为母语和第二语言的过渡形式(Schumann,1979)。可能的情况是,早期的no+v性能是母语规则的使用,而后来的no+v性能是真正的中间形式。可能的情况是,只有后者才能帮助系统“向前发展”。
综上所述,母语规则的使用被认为是“在表达中需要尚未习得的第二语言规则”时退回到母语知识的结果。它可能会暂时有助于交流,但在第二语言方面可能不是真正的进步。Newmark认为,“扰乱”的真正解决办法不是针对两种语言之间的对比点进行训练(Newmark和Reibel,1973,第239页)。演练最多使人学会,正如我们所看到的,这只是一种短期的学习方法。真正的解药“就是治愈无知”(Newmark,1966,第81页):真正的语言习得。只有当习得者获得可理解的输入时,才会发生这种情况。
(v) 应用语言学研究。
输入假说与所谓的“方法比较”实验的结果也是一致的。几位学者和一批学者试图通过简单的比较直接确定哪种教学方法是最好的。使用两种不同方法学习第二语言和/或外语的学生群体在长期和短期学习中都进行了比较。我们将在第五章详细介绍这项研究,但我会事先陈述我自己的结论。我阅读的研究比较了更常用的方法(与语法翻译或认知编码相比的音频-语言)如下:
(1) 「演绎」教学法(先规则后练习,如语法翻译、认知编码等)比成人听力教学略有提高。这些差异在统计上通常是显著的,但并不是很大。显然,学生们使用这些方法中的任何一种都会取得一些进步。
(2) 对于青少年而言,没有可测量的差异。
我以这种方式解释了这种未能找到巨大差异的原因:这些研究中比较的方法都没有提供太多可理解输入!此外,输入假说预测,提供大量可理解输入的方法将比任何较旧的方法做得更好。
有几种较新的方法可以做到这一点,例如Asher的全身反应法(Asher,1966,1969)和Terrell的自然方法(Terrell,1977)。在这些方法中,课堂时间致力于提供可理解输入,重点是信息而不是形式,学生在自己决定“准备好”之前不会用第二语言表达。在过去十年里,证实这种“输入法”优越性的报告一直出现在专业文献中(例如,Asher,1972;Gary,1975;Postovsky,1974;更详细的内容见第五章)。(然而,对可理解输入的关注并不是新方法成功的唯一原因;参见下面关于影响的讨论,以及第三章和第五章。)
由于本书的大部分内容是关于第二语言习得理论(第三章、第四章和第五章)的含义,因此这一部分确实应该推迟到以后。然而,我忍不住要在这里简要说明一个含义,因为在我看来,输入假说的含义对我们所有对语言习得感兴趣的人来说都是真正令人兴奋的。最重要的是,输入假说预测教室可能是第二语言习得的绝佳场所,至少达到“中级”水平。对于初学者来说,课堂可以比外部世界好得多,因为外部通常提供给初学者的可理解输入很少,特别是对于年长的习得者(Wagner-Gough和Hatch,1975)。在教室里,我们每天可以提供一小时的可理解输入,这可能比外面对初学者所能做的要好得多。在谈到情感过滤之后,我们会对此做更多的阐述。
5. 情感过滤假说
情感过滤假说阐述了情感因素与第二语言习得过程的关系。情感过滤的概念是由Dulay和Burt(1977年)提出的,它与在情感变量和第二语言习得领域所做的理论工作以及本章之前涉及的假设是一致的。
过去十年的研究已经证实,各种情感变量与第二语言习得的成功有关(Krashen,1981)。大部分被研究的人可以归入以下三个类别之一:
(1)动机 动机高的表达者通常在第二语言习得方面做得更好(通常,但不总是,“融合的”
(2)自信 拥有自信和良好自我形象的表达者在第二语言习得中往往表现得更好。
(3)焦虑: 低焦虑似乎有利于第二语言习得,无论是以个人焦虑衡量,还是以课堂焦虑衡量。
在几个地方,我假设这些态度因素与习得而不是学得相关,因为当使用交际型测试时,这些态度因素与第二语言成绩的关系往往更强,这些测试利用的是后天习得的系统,而不是学习的系统,当参加测试的学生在“习得丰富”的情况下使用了语言时,即大量可理解输入的情况下,这些态度因素往往与第二语言成绩有更强的关系。
情感过滤假说通过假设习得者的情感过滤器的强度或水平不同,捕捉到情感变量与第二语言习得过程之间的关系。那些对第二语言习得态度不佳的人不仅会寻求更少的输入,而且他们也会有很高或很强的情感过滤--即使他们理解了信息,输入也不会到达大脑中负责语言习得的部分,也不会到达语言习得装置。那些态度更有利于第二语言习得的人不仅会寻求和获得更多的输入,他们的过滤也会更低或更弱。他们会对输入更加开放,而且会“探索更深”(Stevick,1976)。
图2.2所示的“情感过滤”假说声称,情感的影响是“在”语言习得机制之外的。它仍然认为“输入”是第二语言习得中的主要原因变量,情感变量起着阻碍或促进输入到语言习得装置的作用。
过滤假说解释了为什么习得者有可能获得大量可理解输入,但却短暂(有时甚至很短)地停留在本族语水平(或 “fossilize”;塞林克,1972年)。出现这种情况,是因为情绪过滤。
图2.2. “情感过滤” 的运行机制
Dulay和Burt(1977年)提出的“情感过滤”旨在阻止将输入用于语言习得。具有最佳态度的习得者(见正文)被假定具有“低”情感过滤器。鼓励低过滤的教室是那些促进学生低焦虑,使学生“不再处于守势”的教室(Stevick,1976)。
这幅图景丝毫没有削弱情感变量在教育方法论中的重要性。情感过滤假说暗示,我们的教学目标不仅应该包括提供可理解的输入,还应该创造一种鼓励低过滤的情景。正如第五章所讨论的,有几种方法就是针对这一点的(例如,咨询式学习和“建议百科”)。
输入假说和情感过滤的概念对语文教师有了新的定义。有效的语言教师是在低焦虑的情况下提供输入并帮助理解的人。当然,很多老师多年来都是这样看待他们的任务的,至少在专家告诉他们不是这样之前是这样的!
为语言习得提供输入
在这一章中,我们走出了从理论到实践的艰难一步。在这之前,我来给读者提一下第一章的主要观点:我认为理论只是几个可能的决定性因素之一,我们还要考虑方法和材料。这些理论猜想需要进一步的研究及教师和学生的经验来证实(尽管有些启示确实有经验上的证实)。「理想」状态是研究人员和实践者同时在理论和应用中相互学得(和习得)。
在这一章中,我们将讨论实践的一个方面:我们该如何鼓励潜意识习得?这是一个重要的问题,因为第二语言习得理论的主要含义是:以习得为中心。因此,我们在教学上需要鼓励语言习得。
这一部分首先简要讨论了输入假说对语言课堂的现有职能和潜力的一些影响,以及语言课堂与非正式环境相比的局限性。接着,我们讨论实际说和写的输出所能做出的贡献。正如第二章所解释的,假设语言习得是通过输入,即听和读获得的(而非输出即说和写)。不过输出在鼓励习得方面确实起到了间接作用。
本章的主要内容是描述什么是「优质输入」,列出一些优质输入所应具备的特征。在接下来的几章中,我们将讨论有意识的语言学习如何适应教学形式,在最后一章中,我们将检查一些常见的语言教学方法和非正式学习环境的一些方面,看看它们在多大程度上帮助提供了本节讨论的输入和第四章讨论的学习类型。
本次实践的目标是提供一个框架,帮助我们发现材料和方法对学生起了什么实际作用。这有望帮助我们弥补现有教学的不足,并提供对现有的材料技术进行补充改进的方法。
A. 第二语言课堂的潜力
我们经常听说,你必须「住在国外」才能真正精通第二语言,而且非正式的现实世界环境总是优于课堂或正式环境。正如我们在第二章中看到的,有几项研究似乎支持这一论断。然而,其他研究表明,课堂毕竟是有帮助的。我试图通过假设“真正有争议的是可理解输入存在与否”来解决这个明显的冲突。当课堂是可理解输入的主要来源时,它就是有益的。当习得者在课外拥有丰富的输入来源,并且当他们足够熟练地利用它(即至少理解一部分)时,课堂就没有显著效用。
因此,非正式环境的真正优势在于它提供了可理解输入。然而,如果我们使第二语言教室里充满对习得最有利的输入,很有可能我们真能比非正式环境做得更好,最差也得中级水平。正如我们在第二章中提到的,社会很少为年长的二语学生提供可理解的输入。正如 Hatch 和她同事们所指,成人的输入在语法上更复杂,包含更广泛的词汇,更复杂的主题,通常更难理解。这只是一个简单的反映,成人的世界比孩子的复杂得多,我们对成人理解能力的期望值要高得多。
对于成人初学者来说,课堂可以比非正式环境做得更好。在第二语言课堂,我们有可能每天提供整整 40-50 分钟的可理解输入,这将促进语言习得。在非正式环境中真正的初学者,特别是如果他或她缺乏口语应用(conversational management)和猜测体会意思(negotiation of meaning)的能力(参见本章后面的讨论;还有 Scarcella 和 Higa的研究,即将出版),可能需要几天甚至几周的时间才能从所听到的接二连三的语言中「挑选」出那么多可理解输入。初学者根本听不懂他周围的大部分语言。它将是噪声,不能用于习得。
因此,第二语言课堂的价值不仅在于语法教学,而且在于更简单的「教师谈话」,即可理解输入。只要这门课的重点是提供可理解输入,学生就能有效地在课堂上急速达成至少中等水平。
B. 课堂的局限性
尽管我对第二语言课堂充满热情,但有几个方面是课外世界明显出类拔萃的(或者是对课外世界的一些「改进」,这是一个令人着迷的替代方案,我们稍后会讨论),特别是对于中级水平的第二语言学生来说。首先,很明显,外部世界可以提供「更多」输入。生活在讲这种语言的国家可以上一整天的第二语言课程!然而,正如我们前面提到的,要使非正式环境发挥任何作用,输入语言必须是可理解的。因此,随着习得者的进步,非正式环境将会越来越有用,也会越来越容易被理解。
其次,正如许多学者指出的那样,学生在第二语言课堂上能接触到的话语范围是相当有限的,无论我们把它做得多么「自然」。教室根本不可能与外界的多样性相匹配,尽管我们肯定可以超越我们目前的限制。
课堂可能永远无法完全克服其局限性,也不必如此。其目标不是作为外部世界的替代品,而是把学生带到一个可以开始利用外部世界进行进一步习得的地步,达到可以开始理解校外使用的语言的地步。它通过两种方式实现:一是提供输入,让学生在语言习得方面有所进步,这样他们至少在一定程度上能理解「真正的」语言;二是让学生拥有对话的能力,也就是说,通过给学生提供管理对话的工具让学生能够在能力不达完美的情况下完成有限的对话。在接下来的讨论中,我们回到这两个重要问题上。
C. 输出的作用
在形容输入的最佳特征之前需要处理的第二点是:输出的作用。最主要的是:说话在语言习得中的作用。1*
输入假说提出了一个对某些人来说似乎相当了不起的主张——我们不是通过练习说话,而是通过理解输入,通过听和读来达成口语流利。事实上,从理论上讲,不说话就能习得语言。Lenneberg (1962) 在母语习得中证明了这一点,他描述了一个患有先天性构音障碍的男孩的案例,这是一种外围语言器官的障碍,他永远不能说话。当 Lenneberg 对这个男孩做测试时,他发现这个孩子能够很好地听懂英语口语。换句话说,他在没有练习输出的情况下就获得了「能力」。这个孩子在 8 岁时接受了测试,无法直接判断他缺乏输出这一点是否减缓了他的语言习得。很有可能的是,如果他能够说话,他习得语言的速度就会更快一些,因为说话可以对习得做出「间接」的贡献。
输出对语言习得有一定的贡献,但不是直接的:简单地说,你说得越多,就会有越多的人跟你说话!因此,语言习得者的实际说话会影响直接向你输入的人的「数量」。
这也会影响针对习得者的输入的「质量」,对话伙伴经常试图通过调整他们的讲话的难度来帮助你理解(「外国人谈话」)。他们通过看你是否听懂了所说的话来判断需要调整多少,还通过听你说话来判断。一个说第二语言的人犯了很多错误,口音不好,而且犹豫不决的人,通常比一个看起来有能力且流利的人更有可能得到更多调整后的输入。
对于语言习得来说,参与谈话可能比「偷听」更有效。在会话中,第二语言习得者对话题有一定程度的控制,可以向对方示意谈话中的理解困难,等等。换句话说,他可以管理和调节输入,使其更容易理解。偷听就没有这样的控制!但是,为了参与对话,每个参与讨论的人肯定至少要说一些,有一些输出。以上即说话的间接贡献。
1. 「对话」与语言习得
一些学者认为「参与对话」是语言习得的主要原因。根据上面的讨论,我们可以看出,这在某种意义上是正确的。然而,「对话」本身并不是第二语言习得中的决定因素。这是习得输入的一种方式,也是一种非常好的方式。然而,从理论上讲,不参与对话也很有可能习得语言。2
图 3.1 说明了输出对语言习得的间接,但通常相当大的贡献。
图 3.1 输出如何间接促进语言习得。
可理解输入是语言习得进步的原因。之所以能够输出,是因为先习得了能力。
人们「说话」的同时,也鼓励了「输入」(别人对他们说话)。这是对话。
2. 输出和学习
正如第二章所建议的那样,输出可以在帮助语言学习方面起到一定程度上的作用,即使不是必要的。输出有助于学习,因为它提供了纠错的空间。当第二语言使用者说或写时,他或她可能会犯错误。错误纠正被认为有助于学习者改变他或她对语法的理解或修改语法的适用背景。(参见第二章对假设 (1) 的讨论。)
因此,我们可以将「输出方法」与这里提倡的输入方法进行比较。我们能不能主要鼓励输出,很少或没有输入,并纠正所有错误来教授语言?这样的技巧,除了让人抓狂外,还十分依赖于学生学习语法的能力。
这并不是说纠错完全没用,有意识学习也没有价值。有意识学习是可以发挥作用的,纠错在某些情况下可能是有用的。我们稍后再谈「学以致用」的问题。
到目前为止,读者已经看到了足够多的「稍后讨论」,现在是时候转到本章的主要部分,即对于第二语言习得最佳输入的描述。本介绍所做的承诺可以指望得到兑现。
D. 最优习得输入的特征
在这一部分,我将尝试着提出一套要求,任何针对潜意识语言习得的活动或材料都应该满足这些要求。对这一组(可测试的 testable)特征的预测是:完全满足这些特征的活动将鼓励以最快的速度习得。如果一项活动不满足其中任何一项,可能会导致零习得,或者很少习得。(对于很少习得的情况,「一点点满足」,多半会是这样,即使对于「语言习得装置」应该很强大的成年人来说,语言接触都可能只产生一点点习得。)
下面描述的特征不是「加权的」。我们不会试图声称一个比另一个更重要,尽管这样的说法可能会被提出。我将把这一点留给将来以改进。此外,这里也没有试图通过经验证据来「支持」这些结论。它们源于第二章提出的假设——第二语言习得理论,正是这些假设得到了实证证据的支持。换句话说,我们在这里是对理论做出推断。这并不意味着这些特征不能作为预测(predictions)和进一步检验;事实上,正如我在第一章中讨论的那样,它们应该得到应用语言学研究以及教师和学生的直觉的证实。
我们分别讨论每个特征,展示每个特征对方法、材料和非正式输入的不同方面做出的预测。在这些描述之后,我将试图指出一些新的可能性,并强调一些被忽视的传统输入来源的重要性(第五章)。
1. 最优输入是可理解的
这显然是最重要的输入特征。这相当于声称,当习得者不理解信息时,就不会进行习得。换句话说,难以理解的输入或「噪音」将无济于事。
假设「可理解性」是基本的、必要的(但不是充分的)要求,就会得出几个似乎是正确的预测。它解释了为什么一个人仅仅通过听收音机几乎不可能获得一门第二语言或外语,除非习得者会说一种非常相近的语言。一个只会说英语的人,例如,在收音机里听到波兰语,什么也得不到,因为输入的只是「噪音」。3
这一要求也解释了教育电视节目在教授外语方面的明显失败。输入内容根本无法理解。我自己的孩子多年来忠实地看着 Ville Allegre 这样的节目,学到的东西和我差不多:他们可以用西班牙语从一数到十,还能认出像 casa 和 mesa 这样的几个单词。可理解性要求预测,一般来说,作为一名语言教师,电视在某种程度上会比广播更成功,但即使是电视,在开始阶段也是不够的。Ervin-Tripp (1973) 指出,聋人父母的听力障碍儿童不会从电视或广播中习得语言,这一观察结果与要求一致。
这一特点也解释了为什么孩子有时无法学会家庭语言。我自己的情况,我认为,是相当典型的。我的父母在家里说了很多年的意第绪语(Yiddish),偶尔会互相说(讲秘密),还经常和我的祖父母说。尽管如此,除了几个短语和套路外,我和姐姐都没能学会意第绪语。另一方面,在许多家庭中,孩子们在成长过程中确实说着家庭语言和社区语言。关键似乎是家庭语言是否指向孩子,换句话说,是否试图使语言「可理解」。我们通过旁听听到的是令人费解的语句。它涉及的主题不容易确定,也往往超出了我们的经验范围。专门对我们说的意第绪语会被简化,与我们更相关,因此更容易理解。
可理解性要求做出的另一个预测是,「随意交谈」或「自由对话」不是语言教学。换句话说,仅仅作为一种语言的母语者本身并不意味着一个人就有资格成为该语言的教师。有意识和广博的语法知识也不能使一个人成为一名语言教师。相反,一个好老师的决定性特征是,无论他或她的目标语言能力如何,他或她都能让非母语人士理解输入的内容。这就自然而然地引出了另一个话题,即教师如何让输入变得可理解。
(a) 如何辅助理解
如果我们对“可理解性是习得最佳输入的重要要求"这一假设是正确的,那么”如何帮助理解“则是第二语言教学的一个非常核心的问题。事实上,对输入可理解的要求表明,第二语言教师的主要作用是帮助输入内容变得可理解,为成人做「外部世界」不能或不愿做的事情。
教师帮助理解基本上有两种方式,语言的和非语言的。研究表明,说话者在语言上有许多事情可做,以使能力较差的说话者更容易理解他们的演讲。Hatch (1979) 总结了语言学方面的输入简化,它似乎可以促进理解。这些特征包括:
(1) 较慢的速度和更清晰的发音,这有助于习得者更容易识别单词之间的边界,并有更多的时间来理解;
(2) 多用高频词汇,少用俚语,少用习语;
(3) 简化句法,使用短句。
这些特征和其他特征似乎在不同类型的简化原则中或多或少是共同的,如照顾者式讲话(caretaker speech)、外国人式谈话( foreigner-talk)和教师式谈话(teacher-talk)(另见 Krashen,1980),它们显然有助于使输入语言更容易理解。有相当多的经验证据表明,依据这些简化原则的语言比母语的语言要“简单”得多,而且,正如第二章所提到的,有证据表明习得者的语言水平与输入语言的复杂性之间存在一定的相关性:更高级的习得者往往希望得到更复杂的输入。
这是否意味着教师在与学生交谈时应该有意识地简化他们的语言呢?他们是否应该考虑放慢语速,使用更常用的词汇,更短的句子,不那么复杂的句法和更少的嵌入等?有时候有意识地涉及这些「规则」可能有所帮助,但当我们专注于试图被理解时,似乎会自动做出这些调整。Roger Brown 在评论有关第一语言习得中监护人话语(caretaker speech)的研究时也得出了类似的结论。对于想知道如何在最短的时间内「教」孩子语言的父母,他给出了以下建议:
相信您的孩子能理解比他(她)能说的要多,最重要的是,要寻求交流……没有一套教如何与孩子交谈的规则比得上你潜意识就知道的(规则)。如果你专注于沟通,其他一切都会随之而来。(Brown, 1977, p. 26.)
正如我在几个地方 (Krashen, 1980, 1981) 所说,同样的情况可能适用于语言教师。如果我们把重点放在理解和交流上,我们就能满足最佳输入的句法要求。
当我们把教师从讲究语法的责任中解放出来时,其他责任就变得更重要了。一个是确保输入确实可理解。对于是否理解的检查,除了强调它的重要之外,我没别的可说了。要理解检查,可以从偶尔直接地问「你们明白了吗?」,也可从学生的语言和肢体反应得知。
教师的另一个主要任务是提供鼓励理解的非语言手段。在我看来,以实物和图片等形式为初级课堂提供语言外的支持并非花里胡哨,而是教师鼓励语言习得的工具中非常重要的部分。在早期的第二语言教学中,实物和图片的使用与教学者在帮助母语习得时「着眼于具体实在的教学法(here and now)」相对应,因为它们都有助于习得者理解「稍微超出」他们能力的信息。
好的教师还会利用学生对世界的了解,通过讨论学生熟悉的话题来帮助理解。当然,讨论或阅读一个完全陌生的话题会使信息更难理解。然而,让输入内容过于「熟悉」是有危险的。如果这条信息被完全理解,它将不会引起任何兴趣,学生就很可能不会参与。我们希望学生把注意力集中在信息上,必须有一些信息,一些学生真正想听或读到的东西。这一要求可能最难满足,我们将在下面讨论特征 II.5 时对其进行更多的说明。
正如刚才所指出的,理解是语言习得的必要条件,但这还不是充分条件。理解输入语言而不习得是很有可能的。这可以发生在以下几种方式:首先,很可能输入不包含 i+1,也就是它不包含「稍稍超出」学生理解能力的结构。其次,在许多情况下,我们在理解时不使用句法——我们通常可以通过词汇和非语言信息的组合来获得信息。最后一种情况,「情感过滤」可能「被唤起」,抵触情绪可能会导致习得者即使得到符合i+1的输入 ,也不会进一步习得。
2. 最优输入是有趣的、相关的
最佳输入将习得者的注意力集中在信息上,而不是形式上。更进一步说,最好的输入是如此有趣和相关,以至于习得者甚至可能「忘记」消息是用外语编码的。
创造符合这一特点的材料来提供输入似乎是一项简单明了的任务,但我的观点是,实际上,这一要求并不容易满足,业界也不认为它是显而易见的。向一个目标、兴趣和背景与老师和彼此不同的同学展示和讨论感兴趣的话题是非常「困难」的。我还声称,输入对相关性和兴趣的要求并没有被广泛认可,因为有太多的材料不符合这一要求。
很容易想出一些可理解但普遍认为无趣且不相关的输入作为例子。其中最明显的例子是句型操练和大多数对话式练习。实验表明,在句型的前几次重复之后,学生就很少或根本不再注意含义了 (Lee, McCune, and Patton, 1970),同样的结果很可能也适用于死记硬背的对话。基于类似的理由,语法练习也不能作为习得的输入。诚然,这些练习的目标不是「习得」,我们也有必要检查一下它们是否满足第二语言课程的其他要求。然而,它们仍惨淡地失败了。
不太明显的是「有意义的练习」在最佳输入要求中的失败。「有意义的练习」与「机械练习」的区别在于前者要求涉及真正的意义 (Paulston,1972)。然而,由于有意义的练习旨在提供对特定语法结构的练习,因此也很难建立在真正相关或有趣的信息交换中,例如:
What time does he get up in the morning?(他早上几点起床?)
What time does he get up in the morning?(他早上几点起床?)
充其量,这样的信息对语言班的成员来说没什么意思。我相信教师也没法将真正有趣或相关的信息嵌入在如此基于日常的句子中。
其他一些没有达到真正相关性的很大一部分输入类型是大多数外语学生在第一节课中被指定完成的阅读作业。一般来说,这些被指定的读物和学生们平时用母语阅读的东西几乎没有相似之处。
在读者觉得我过于挑剔和不公平之前,我必须说,在我看来,在高中或大学提供的标准美国外语课程中,兴趣-相关性的要求几乎不可能满足,特别是当这样的课程被作为必修课时。在ESL(第二语言的英语教学)的情况下,满足这种要求要容易得多,因为对语言的需求被ESL意识到了。例如,在主要由移民组成的班级中,输入的内容通常包含大量对学生在“外部”生存有用的信息。为外国学生开设的大学ESL课程通常包括学习技能、学术英语、大学生活入门,甚至是有用的学术技能。ESL教师经常正式或非正式地担任朋友和顾问,因此提供了大量真正相关的输入。
3. 最佳输入不必按语法排序
在以习得为导向的材料中,我们不应该有意识地考虑在输入中包含 i+1。输入假设的第 (3) 部分声称,当输入是可理解的,当含义被成功接收时,在大多数情况下,i+1将自动出现。9
这一要求可以以一种含蓄的形式来表述。(3) 可以改写为:没有必要故意包括 i+1,因为它会自然发生。更直白地说就是:甚至不要试图包括 i+1会更好一些。 第二章简要介绍了反对刻意进行语法排序的论点,这里将对其进行扩展。
-
如果我们按语法顺序教学,每节或几节课都集中在一种结构上,就等于假设班上每个人都有相同的 i+1,即每个人的语言能力都处于同一水平。因为习得率存在个体差异(情感过滤的强度和获得的可理解输入量不同),所以班里的所有学生都处于同一水平的可能性极小。假设无序但自然的(可理解)输入将包含丰富多样的结构,那么只要有足够的输入(我们回到下面的数量问题)每个人都会有 i+1。
-
当我们试图呈现一个「微调」的语法学习顺序时,我们通常只会将每个句型结构或语法规则呈现一次。(通常有「复习」课程,也有回顾的尝试,但是复习通常不会贯穿整个教学活动——它的目标通常是「提醒」规则,并为应该已经「内化」的规则提供一些额外的练习。10)第一次没学会的学生怎么办?传统复习是一种提醒,但往往无济于事。在传统的外语学习中,就像在美国一样,学生甚至可能得等到第二年才等到这一条语法再次出现。无序交流输入包含内置复习。我们不必担心是否错过了今天的进行时,它将再次成为输入的一部分……再来一次。如上所述,假设有足够的可理解的输入,那么可理解的输入就保证了我们的自然复习和回顾。
有些读者可能会觉得我是在虚空打靶。可以说,一些以语法为基础的课程,尽管语法结构的进度是按部就班的,但确实也提供了 i+1 的输入。虽然可能存在「今日新学语法」,但并不是每句话都包含这一语法。例如,如果课程的重点是进行时,课堂输入和阅读材料中也会使用其他时态。
表面上看可能是这样,但这种方法确实存在一个问题。着重语法时,交流起来「总是」让人痛苦,总是缺乏真正有趣的输入。教师和材料编写者都把注意力集中在特定结构的「语境化」上,而不是交流观点上。
正如我的同事 Steven Sternfeld 向我指出的那样,这里提倡的与「语境化」有着根本的不同。语境化涉及到为语法规则或词汇的呈现创造一个「现实的」上下文。教师心目中的目标是学得或习得语法或单词。而这里提倡的是,老师和学生都应以交流想法和信息为重点(译者按:反而应轻视语法规则)。
这一反对意见可以概括为以下几点:
-
以语法为基础的教学大纲的方向降低了可理解输入的质量,扭曲了沟通交流的焦点。老师们会关心他们是如何说话的,阅读选择的目的将是包括 x 个 y 语法结构的例子以及一定的词汇样本,这肯定是枯燥和呆板的保证。
-
还有一个问题是语法序列试图猜测习得的顺序。几年前,我提出 (Krashen et al., 1975),自然顺序假说的一种应用是按照自然顺序构建「自然教学大纲」。后来我的立场变了。正如 Fathman (1979) 所指出的,自然顺序假说的实际意义可能在于,它教会了我们:语言习得过程是潜在的。现在在我看来,我们不应该试图按照第二章表 2 所给出的顺序(或按照任何其他语法顺序)进行教学。
按照可理解输入理论,只要提供i+1(及许多其他结构),可理解输入将自动遵循自然顺序。
现在我们总结一下自然输入(健康食物的均衡饮食)相较步调一致的语法教学大纲(类似单一甚至多种维生素疗法)的优势。11
(a) 违反语法大纲的情况
| 交流性输入(自然地包含 i+1,输入充足) | 语法教学大纲(有意提供 i+1) |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
| 1. 最终会为所有学生提供 i+1| 1. 所有学生可能不在同一阶段。对于许多学生来说,这一天的句式结构可能不是 i+1。 |
| 2. 自然而广泛的复习。 | 2.每个结构只显示一次。(有关「复习」的讨论见正文。)|
| 3. 师生都有意着重于思想交流。| 3.着重语法可能会阻碍真实、自然的交流。|
| 4. 不假定我们知道习得顺序。| 4. 假定我们知道习得顺序。|
4. 最优输入的数量必须充足
由于缺乏数据,很难说在第二语言习得中需要多少可理解/低过滤输入才能达到给定的熟练程度。然而,我们现在所知道的足够多,能够自信地表示,业内人士严重低估了达到中等或中等水平的第二语言习得熟练程度所需的可理解输入的数量。
有关量的理论论证源于前面的讨论。我假设,如果满足两个条件,自然的交际输入可以为所有的学生提供 i+1
(1) 输入不受人为限制(如限制语篇类型)
(2) 供应充足。
显然,五分钟的演讲或一段阅读,几乎不可能包含某个学生的 i+1。我的建议是,与其更细致地针对学生的需要「过度个性化地」教学,增加可理解输入的量则要容易得多。同样,如果足够的话,应提供 i+1,并反复提供。
如上所述,我们没有足够的数据来自信地说明需要多少输入才能达到给定的阶段。然而,这些文献确实为我们提供了足够的信息来陈述一些最初的假设。下面,我们将简要考察一下文献中关于想达到最初的「说话准备就绪」阶段和更高水平意味着什么。
(a) 初始准备说话的输入量要求
需要多少输入才能结束「沉默期」?需要多少输入才能使第二语言习得者利用习得的能力产生话语?
Asher 的全身反应教学(译者按: Total Physical Response 后简称TPR教学法,是一种通过目标语言指令配合身体动作的教学方法)是一种要求学生服从第二语言发出的命令的方法,通常带有「完全身体反应」(例如站起来),这让我们对最初的口语准备需要多少输入有所了解。
正如我们将在第五章中看到的,TPR 法的主要优点可能是它能够提供集中的、可理解的输入。Asher 在几篇论文(在第五章回顾)中指出,通过TPR 法学习的学生通常在约 10 个小时的TPR 输入后准备好开始用目标语言进行输出。12
非正式语言习得研究呈现了一幅乍一看似乎不同的图景。儿童非正式第二语言习得中的「沉默期」可能长达六个月!在这段时间里,除了例行公事和一些模式外,孩子在第二语言中可能会产生很少的东西。与 Asher 观察到的十个小时可能就足够了相比,「自然」沉默期的长度更长,这可能是因为儿童在自然环境中接受的大量输入可能是无法理解的。正如本章前面所述,「正式指导」的主要优势可能是它有可能在早期阶段提供可理解输入,使习得者能够开始利用自然环境。儿童非正式第二语言习得的长时间沉默期可能进一步证明非正式环境在早期阶段效率低下。13
(b) 提高熟练程度的输入量要求
对于提升到更高能力水平所需的低过滤/可理解输入的数量,我们更是知之甚少。我们可以从美国外事服务学院的计划表中得到一些想法,该表估计了成年英语使用者达到 FSI 2+ 级所需的课时(2+ 被定义为「最低专业水平和工作专业水平之间」,Diller, 1978, p. 100)。根据外事服务学院的估计 (reproduced in Diller, 1978),像德语、法语和意大利语这样的欧洲语言需要大约 720 个小时的课时才能使「普通」学生达到 2+ 水平,而更具「异国情调」的语言(如阿拉伯语、韩语和汉语)则需要 1950 个小时的课堂时间。14
然而,这些数字可能代表的是上限。它们是以「课堂时间」为基础的,通常采用传统方法,这大概不会带来最优输入。换句话说,我们可以做得更好。
「要多少输入?」这仍然是一个经验性的问题,一个很可能可以通过研究充分回答的问题。更确切地说,我们想知道:「需要多少低情感过滤/可理解输入,学生才能获得足够的第二语言能力,才能利用非正式环境继续提高?」尽管我们目前缺乏数据,但我现在似乎清楚的是,我们没有充分利用可用的教学时间来提供可理解的输入,如果我们更多地关注输入,我们将能够激发出更快(且更舒适)的第二语言习得。
在结束这一节之前,我应该指出,我的建议并不是什么新鲜事:与 Newmark (1971) 一样,我建议泛读精读辩论中的「泛读」一方是正确的,学生从理解意义的阅读和阅读大量材料中获益更多,而不是从 Newmark 所说的对困难段落的「密码分析解码」中获益。相较专注于听力理解练习,学生从参与对话及大量对话中获益更多。
我们现在转到鼓励语言习得的程序应该包含的另外两个特性。
E. 其他鼓励习得的特性
1. 不能让学生处于抵触状态
「处于戒备状态(on the defensive)」这个短语来自 Stevick 的名著《记忆、意义和方法》。对我来说,它的意思是,方法和材料不应该是对学生能力或先前经验的测试,不应该只暴露弱点,而应该帮助学生习得更多。
更笼统地说,我们讨论的是将情感过滤保持在「低水平」,即确保学生对输入的内容持开放态度。情况可能是这样的,如果我们使用「符合」输入假说的程序,其满足最优输入的所有其他特征,那么我们最终得到的输入,以及随之形成的课堂教学方法,也将满足这一要求,并有助于将过滤保持在较低水平。在本节中,我将尝试概述几个这样的一般程序和实践。
首先,我很抱歉在这个问题上喋喋不休,如果我们专注于提供可理解输入,且输入的重点是信息而不是形式,这本身就会导致低水平情绪过滤。如果讨论的话题很有趣,而且可以理解,那么通常与语言课相关的大部分「压力」就会「消失」,焦虑就会降低,习得就会产生。正如前面提到的,我认为一个理想的目标是,学生在某种意义上「忘记」输入的信息实际上是用另一种语言编码的。
其次,只要我们不要执着于过早的输出,我们就能够使学生在「准备好开口」之前保持低过滤状态。语言教师(和学生)将第二语言习得的进步与流利的口语(「你会说法语吗?」)联系在一起,这样做的合乎逻辑的结果是,我们希望我们的学生从一开始就交谈。我个人的观点是,在学生通过可理解输入建立足够的能力之前,强迫学生及早输出,可能是语言课最令人焦虑的事情!虽然一些学生可能想要尽快交谈,但另一些学生在建立更多能力之前可能会感到不够自信。换句话说,沉默期的长度是可变的(见注 12);Asher 的十小时估计可能是「平均水平」,但不是板上钉钉的。一个安全的程序就是不强迫输出,让学生自己决定什么时候开始说话。
与输出意愿密切相关的是错误和纠错问题。第二语言习得研究清楚地告诉我们,错误是不可避免的,而且在早期阶段会大量出现。为了给读者一个估计,在皇后学院进行的一项实验中,我们发现,在进修课的分级考试中,ESL 学生的作文中大约每五个单词就有一个错误 (Krashen et al., 1978)。成绩较好的学生平均每十个单词就有一个错误,最不熟练的学生每两个单词就有一个错误!一定会提高过滤的一个方法是尝试纠正错误,特别是在开始阶段,特别是在口语方面!不幸的是,纠错是业界对错误的典型反应,在我看来,这是一个严重的错误。这是一个错误的原因有几个。这里我们关注的可能是纠错中最严重的缺陷,那就是它对情感过滤的影响。
纠错会立即让学生产生抵触心理。它鼓励学生采取一种尽量避免错误、避免困难结构且专注形式而非内容的策略。它可能会扰乱整个交流焦点。在我常用来说明输入假设在课堂教学中的应用的演示中,我深切的感受到的了这点。在我替 Steven Sternfeld 出席的演讲中,我告诉观众,我将给他们上两节外语课(我通常使用德语)。对于第一节课,我只是随便聊聊,说「我现在要给你上一节德语课,但首先让我告诉你一些关于德语的东西,等等。」这完全是用德语完成的,对于那些从未接触过德语的观众来说,几乎完全听不懂。第二节课大概是这样的:
这是我的鞋。(指向鞋子)
这是我的手。(指向手部)
这是我的头。 (指向头)
这是头。(在白板上画个头)
这是一双眼睛。 (画眼睛,举起两根手指)
这是一张嘴。(画张嘴)
这是一根烟。(画根烟)
你们能给我递根烟吗? (走向班级成员,做出吸烟手势,指着自己)
```(译注:这整段话都是德语)
第二课的重点是,这堂课是相当容易理解的,虽然可能不是很有趣。这要归功于简单的语言,语言外的支持等。还有试图通过画一个有趣的头和要一支烟来降低过滤。在这节简短的课程之后的讨论中,我解释了这些事情,并声称,如果在一段时间内给人们提供这种输入,他们自然而然就会开口说话。很有趣的是观众的反应:这是一种解脱。讲座结束后,有几个人走过来对我说:「当你说要给我们上语文课的时候,我很紧张,我怕你来找我,我就得说点什么,我会弄错的。」这告诉我,语文课即使在专业语文教师中也会引起恐惧,其中一个原因是我们对早说的执着和对待错误的态度。为什么要让学生受苦于连我们都不愉快的流程呢?
关于纠错这个话题还有更多要说的,它有一些优点,也有其他缺点,我们稍后在课堂上讨论有意识的学习时会深入这一话题。这里需要说的是,纠错不是提高第二语言能力的基本机制;根据理论,我们是通过可理解的输入获得的。由于过度使用纠错对习得有如此大的负面影响,而且纠错对语言习得没有直接的好处(见第二章,假设一的讨论)。一个安全的流程就是,在交流中完全消除纠错,这一方法在 Terrell 的自然教学法中得到了极大的成功。学生没有纠错也会进步,甚至可能进步得更快,因为输入会「抵达」,过滤会更低,学生会放下抵触心理。
### 2. 提供可以帮助学生获取更多输入的工具
我们的责任远不止于语言课堂。15 事实上,正如我刚才所说,我们的任务是为学生提供所需的工具,让他们在没有我们的情况下继续进步。我们需要提供足够的输入,这样他们才能获得必要的语言能力,从而开始利用非正式的环境,即外部世界。换句话说,他们需要对第二语言有足够的了解,这样他们才能理解大部分非课堂语言。然而,培养他们到如上的能力还不够。
即使我们成功地把我们的学生带到这个阶段,他们在外部使用语言时也会遇到问题。他们仍然不能理解他们听到的大部分输入,即使是调整后的。他们会发现自己无话可说,会犯各种错误。如果我们只专注于提供纯粹的“语言学(linguistic)”能力的输入,我们将会有这样的学生,他们避免与母语者接触,担心听不懂别人跟他们说话,还会在交谈时会遇到真正的问题,包括回想单词时痛苦的沉默、困惑和误解带来的尴尬等。
我想这是在美国外语教学的典型情况。经过两年的指导,甚至愿意与说自己所学语言的人交谈的学生都是很少见的!解决这个问题的办法是给我们的学生提供他们需要的工具来克服这些困难,使他们**有交谈能力。**通过给他们管理对话的方法,我们可以帮助他们达到“尽管能力不足也能够参与对话的程度”来持续进步。我们可以帮他们对“找不到合适词汇、也不能完全理解”的必然做好准备,我们可以帮助他们确保能**继续获得可理解输入。**
学生需要哪些工具来管理对话,从而继续获得课堂外的输入?换句话说,我们怎样才能帮助我们的学生在能力不够完善的情况下进行对话呢?
Scarcella (即将推出)表示,至少有两种方式可以帮助习得者获得更易理解的输入:帮助控制输入**数量**的设备和帮助控制**质量**的设备。前者将帮助习得者获得更多输入,后者将帮助使输入变得可理解。
会话技能(conversational competence)属于输入数量类,包括开始会话的方式(问候)和保持会话的方式(例如,礼貌常识)。Scarcella 的受试者 Miguel 是一位 21 岁的以英语作为第二语言的人,尽管他只有一般的“语言学”能力,但他相当熟练地掌握了这些会话技能的工具,正如以下简短的摘录所显示的那样:
Miguel:Hi! How are ya?(嗨!你好吗?)
NS:Okay.(好的。)
Miguel:What's new?(有什么新鲜事吗?)
NS:Not much. Had a test today.(不是很多。今天做了个测试。)
Miguel:Oh that's too bad. What test?(哦,那太糟糕了。什么测试?)
Miguel 通过使用几个精心挑选的例句,能够发起和保持对话。然而,像 Miguel 这样的第二语言者并不能作为标准,因为研究表明,对于会话技能,第二语言习得者往往存在令人惊讶的严重差距(见下文)。
有各种方法可以用来使输入更容易理解,从而控制输入的质量。也许最明显的就是向母语人士寻求帮助,「让母语人士用话语工具……解释对话的某些部分」(Scarcella,p.5)。这些方法涉及到从发现有问题的单词,然后重复,如
NS:Salvador Dali also put out a cookbook because he is a great expert on cuisine.(Salvador Dali 还出版了一本食谱,因为他是一位伟大的烹饪专家。)
Miguel:(looking confused): Cookbook?((看起来很困惑):食谱?)
NS:(picking up a cookbook): Recipes from Maxime's, places like that.((拿起一本食谱):Maxime‘s 的食谱,诸如此类。)
(Scarcella, p. 5)
诸如「什么?」或「我不明白」之类的话。
Scarcella 还指出,输入的质量可以通过使用「反馈暗示」来改善,“反馈暗示”使母语使用者得知对方是否跟得上对话。这些线索包括语言暗示,如“嗯”,“是的”,以及非语言暗示,如在适当的时间点头和眼睛凝视行为。
最后,还有一些会话策略可以避免难以理解的输入,包括将对话主题引向更容易理解或更熟悉的方向等方式。Scarcella 的受试人 Miguel 在这方面相当在行,如下所示:
“``”
NS:... I like classical music too--Beethoven, Schubert--you know that kinda stuff.(我也喜欢古典音乐--贝多芬、舒伯特--诸如此类的东西。)
Miguel:You play the piano?(你弹钢琴吗?)
Joe:Yeah.(是的。)
Miguel:Me too.(我也弹。)
F. 「传授」会话技能
了解会话技能的组成部分是一回事,培养学生的会话技能则是另一回事。这里需要问的问题是会话技能是学得的还是习得的。
我认为,对于“所有会话技能都是可被学得的(learnable)”这一假设,这里有很多很好的反对论据(另见即将出版的Scarcella中的讨论)。首先,它太复杂了。正如 Scarcella 指出的那样:
「大多数语篇的规则和策略都非常复杂,主要表现在词汇、语音和韵律特征、非语言交际特征和句法特征等方面。此外,所有这些特征都可能因社会环境的不同而有所不同。例如,有些问候语在某些情况下是合适的,但在另一些情况下就不合适。它们有时被大声喊出,有时只是轻轻问候。在任何特定情况下,合适的问候语取决于各种因素。这些包括:被问候的人,一天中的时间,地点和互动,在场的其他人,以及预期的互动类型(愉快的,蔑视的,等等)。(第10页)。
其次,即使学生设法学习了一些会话技能的规则,它们也不会总是在需要的时候出现:在没有监控(Monitor-free)的情况下。
最有可能的是,会话技能的大部分方面必须是习得的。最初的假设是,它们的习得方式与语法一样,是通过可理解的输入获得的。满足本章提出的要求也需要会话技能的习得,考虑到课堂在时间和语篇方面的局限,这是一项非常困难的任务。
但是,可以直接教授一小部分会话管理工具,它们既可以作为规则,也可以作为背诵的例句,只要它们易于学习(参见关于学习的部分,以便遵循)。例句包括开始对话的、表示暂停和请求帮助的措辞(Scarcella,p.11)。此外,近年来还引入了大量的课内和课外趣味活动来培养会话技能。
我在这一部分的主要观点是,会话技能为学生提供了管理会话所需的工具,因此是教学的重要组成部分,因为它有助于确保语言学习发生在课堂外,并在教学计划结束后持续。我们的责任不会随着学期的结束而结束:事实上,在我看来,语言教学的目的是为学生提供他们需要的东西,这样他们就可以在没有我们的情况下取得进步。
附注
1如第二章所详述,言语输出可以来自三种不同来源中的任何一种。首先,我们可以运用习得能力(acquired competence),如第二章中的情绪监控假说所示。根据输入假说,这种输出需要一段时间才能得到发展。另一种方式是通过记忆的模式和程序(memorized patterns and routines)(参见Krashen和Scarcella,1978)。第三种方式是大量使用母语结构,如第二章所述。后两种言语产生方式是“无能力执行(performing without competence)”(借用R.Clark的术语)。使用这些方法,第二语言使用者可以非常迅速地“学会说话”,而且很显然,有一些技巧帮助了他们,即使帮助他们的只是些很局限机械的例句。(参见第二章,Krashen and Scarcella,1978和Krashen 1981中的讨论。)
2这就提出了一个有趣的问题:参与对话对于真正成功的第二语言习得是否“确实”是必要的?也许会是。会话不仅是获得可理解输入的有效手段外,还提供了其他一些真正的优势,这些优势将在本章的阐述中变得愈加清晰。Scarcella (即将出版)指出,“交际能力”有很多方面可能不是单靠观察和输入就能获得的(参见本章后面的讨论)。此外,Scarcella 指出,真正的对话需要“高度的个人参与”,也就是 Stevick (1976)所说的“深度(depth)”和较低的情感层面的过滤。
在对科幻文学的评论中,Hatch(1976)指出了几个例子,在这些例子中,作者认为通过收听广播获得人类语言是可能的。然而,即使是这些作者似乎也明白,通过听无法理解的输入来获得语言是一种超能力,只有某些拥有不同的、明显是更优越的“语言习得设备”的外星人才拥有这种超能力。
4有一些通过电视学习第二语言的轶事。例如,Larsen-Freeman(1979)引用了一个说德语的人通过电视获得荷兰语的案例。这一点都不奇怪,因为荷兰语的输入对于一个说这种密切相关语言的人来说是可以理解的。请注意,我并不是说从电视上习得语言是「不可能的」。我只是说,可理解的输入对于习得是必要的,电视对初学者来说提供的可理解的输入很少。中级水平的学生可能会从电视甚至广播中获益良多。
老师帮助学生理解「超出理解」的结构的另一种方法是强调词汇。伊夫林·哈奇(Evelyn Hatch)和我近年来都提出了增加词汇量的论点(Hatch,1978a;Krashen,1981),我认为我们的论点是相似的。虽然词汇知识可能不足以理解所有信息,但毫无疑问,词汇量的增加有助于习得者更多地理解所听到或阅读的内容(参见Ulijn and Kempen, 1976; Macha, 1979, on the role of vocabulary in reading comprehension)。因此,更多的词汇应该意味着更多的可理解输入,更多的语法习得。这一“新观点”与早先的立场有很大不同。语言教师的任务是限制新词汇的引入,以便专注于语法学习。现在我们说词汇学习实际上将有助于语法的习得。
然而,这一立场的实际影响对我来说并不清楚。我们是否应该为了增加可理解的输入量而孤立地教授词汇?不幸的是,很少有研究直接回答如何最好地习得词汇,以及最重要的是如何保持词汇记忆的问题。教师们有一些共识,认为词汇应该在语境中教授,而不是通过死记硬背列表来教授(参见 Celce-Murcia 和 Rosenzweig,1979,关于几种技巧),但甚至可能根本不应该直接教授词汇!情况可能是这样的,如果我们提供足够的可理解的输入,词汇习得实际上就会自动进行。
让我以非正式实验的形式重申这一建议:给出 10 分钟的学习时间(等车等),哪种活动对对长期记忆词汇感兴趣的语言习得者更有用?
(1)轮流学习词汇列表,使用记忆卡片或类似技术。
(2)仔细阅读包含“新词”的故事(语境化)。
(3)为了快乐而阅读,只试着理解信息,只有在新单词似乎对意义至关重要或当获得者对其意义感到好奇时才查找新单词。
方法(3)依靠可理解的输入,以足够的频率提供新词汇,并帮助习得者确定词义。在方法(3)中,并未有意识地关注词汇,而只关注意义。我们对此的预测(希望?)是,真正重要的词会自然地重新出现,其含义会通过上下文变得越来越明显。偶尔浏览字典或教师偶尔给词下释义也是有可能帮助习得者的。
6 例如,南加州大学的美国语言学院在为外国学生提供英语作为第二语言的同时,还开设了一门打字课程。
7 可能会有更多的机会为大学级别的第二语言习得者提供最佳输入,我们将在第五章中讨论这一点。
8 对于一些语法监控爱好者(Monitor users)和语言学家来说,虽然很奇怪,但单是清晰的语法信息就足够有趣并且相关,因为习得者「相信」这将帮助他们提升语言能力。在这种情况下,语法形式就是信息。如果一门关于目标语语法结构的课程是用目标语教授的,并且学生也是“分析型(analytic)”的,那么这门课程就会成功。(见Krashen,1980和第五章中的评论。)
9 有例外情况,即i+1可能不存在可理解输入的情况。有时,对话主题受限制。或是在许多工具性语言使用中,熟悉一些常规和模式可能就足以成功沟通(例如,与加油站服务员、办事员等打交道)。这些情况下i+1可能不存在。
10 在我的解释中,「内化」似乎是指对最初学习的规则的一种随后习得,即认为学习“导致”了随后的习得。根据第二章提出的第二语言习得理论,这种情况不会发生。我已经在几篇技术论文(Krashen,1977)中讨论了这一点,并将在后面的部分回顾这一点。
11 我脑海中浮现的另一个比喻是“霰弹枪”与“单发子弹”。前者命中目标的机率更高。
12 Varvel (1979) 描述了正规教学(Silent Way methodology)中持续时间相当长的静默期,表明在语言课上成年人静默期的持续时间可能有相当大的个体差异:
“有一位来自台湾的女士,几个星期后在课堂上仍然明显沉默不语。她从不说话,当被叫到时,她只会低声回答,只说需要说的话。但很明显,她是班上最专心的学生之一,对正在做的事情很清楚,似乎很喜欢上课。她对学习什么和如何学习也有积极的态度,从来没有人强迫她积极参与。
「然后在开学第九周的一天,她坐在前排,一整个小时都在以积极的方式参与。从那时起,她继续以更有限的方式积极参与,有时帮助别人,也得到别人的帮助…」(第491页)
虽然这名学生保持沉默可能还有其他原因,但这个例子表明,沉默期应该得到尊重,一些学生就是比其他学生更晚做好发言的准备。
13 在可理解的输入量相同的情况下,由于其他原因,儿童在第二语言习得中的静默期可能会比成年人的平均静默期长。我在这里想说的是,如果儿童听到的可理解输入占比更多,那么儿童第二语言习得的静默期就不会那么长。
14 请注意,如果我们假设一个在自然环境中的二语习得者每天收到大约两个小时的可理解的输入,720 个小时相当于大约一年的「国外」经验。这里假设课堂时间=可理解的输入,最然这在 FSI 图表所基于的传统方法中可能不成立。然而,这与民间普遍认可的观点是一致的,即在国外学习一年就能在欧洲语言方面取得相当程度的流利。
15 本节中包含的材料只是我从与 Steven Sternfeld、Robin Scarcella 和 Batyia Elbaum 的讨论中学到的总结。我不仅感谢他们的信息和启发,也感谢他们的耐心。
相信自我欺骗
我曾提到过与一位名义上的正统犹太教妇女的对话。她极力维护自己相信上帝的说法,但实际上似乎根本不相信上帝。
当我询问她认为相信上帝会带来什么好处时,我引入了 Tarski 的祷文——这实际上是一系列无限的祷文,其中一个具体例子是:
如果天空是蓝色的
我希望相信「天空是蓝色的」
如果天空不是蓝色的
我希望相信「天空不是蓝色的」
「这不是我的哲学观点,」她对我说。
「我并不认为是,」我回答道。「我只是在问——假设上帝不存在,而且这是已知的事实,那么你是否还应该相信上帝?」她犹豫了。她似乎真的在努力思考这个问题,这让我感到惊讶。
「所以这是一个反事实的问题……」她慢慢地说道。
起初,我以为她难以想象一个没有上帝的世界,因为她深深依恋于一个存在上帝的世界。
然而,现在我怀疑她之所以难以想象上帝存在与否会给世界带来什么不同,是因为她所有的思考都围绕着她对上帝的信仰,而她用来模拟世界运作的因果关系网络中并没有将上帝作为一个节点。因此,她可以轻易回答「如果我不相信上帝,世界会有什么不同?」,但无法回答「如果没有上帝,世界会有什么不同?」
当时她没有回答那个问题。但她确实给出了一个与 Tarski 祷文相悖的例子:
她说,「我相信人性本善,尽管现实可能并非如此。」
我试图解释,如果你说「人性本恶」,这表示你相信人性本恶;如果你说「我相信人性本善」,这表示你相信你认为人性本善。所以,说「人性本恶,但我相信人性本善」意味着你实际上认为人性本恶,但你相信自己认为人性本善。
我向她引用了一段话:
如果存在一个表示「错误地相信」的动词,它就不会有任何有意义的第一人称现在时陈述式。
—Ludwig Wittgenstein[1]
她微笑着回应:「是的,我相信人性比实际上更善良。我只是觉得应该这样向你表达。」
「我觉得奶奶应该好好检查一下你,Walter,」Nanny 说。「我觉得你的脑子就像一团被扔下的毛线球,全都乱成一团了。」
—Terry Pratchett, Maskerade[2]
我可以写下这样的话:「好吧,我猜她并不认为她的推理在经过深思后应该保持一致,」但我仍然难以真正理解这一点。
我能看出她话语中的模式,但我无法在情感层面上理解她背后的思维。我可以想象自己置身于吃婴儿的外星人和第三代 Kiritsugu 夫人的处境,但我无法想象成为她是什么感觉。或者也许我只是不愿去想象?
这就解释了为什么聪明人只有有限的时间(以主观上花在思考宗教上的时间来衡量)来成为无神论者。如果你很聪明,花了大量时间思考和捍卫自己的宗教信仰,却仍然无法摆脱黑暗面认识论的束缚,那么过了某个临界点,你的思维就会变得如同 Escher 的画作一样扭曲难解。
(另一个让她陷入沉思的时刻——我提到这个是以防你有机会用到——是当她谈论相信有某个存在关心你的行为对错是件好事时。当然,她并不是在谈论实际上存在一个关心你行为对错的上帝,这个观点并不属于她的宗教信仰——
我对她说:「但我关心你的行为对错啊。所以你的意思是,这还不够,你还需要相信有某种超越人性的存在关心你的行为对错?」这让她陷入了短暂的沉默,因为她显然从未从这个角度思考过这个问题。这只是我们非常规思考工具箱中的一个标准应用而已。)
后来,在某个时候,我问她如果确定没有上帝存在,她会不会做出任何不同的选择,这次她回答说:「不会。」
「所以,」我难以置信地说,「无论上帝存在与否,这对人们应该如何思考或行动都没有任何影响?我想即使是一位拉比听到这话也会觉得匪夷所思。」
她的宗教信仰现在似乎完全演变成了对信仰本身的崇拜。就像早期的虔诚信徒可能相信一个无所不见的天父会拯救他们,她现在相信对上帝的信仰本身就能拯救她。
在她说「我相信人性比实际上更善良」之后,我问道,「那么,当人们的行为达不到你的期望时,你是否总是感到惊讶?」这时出现了一阵长时间的沉默,然后,她慢慢地说:「嗯……当人们……达不到我的期望时,我会感到惊讶?」
当时我并不理解她为什么会有这样的停顿。我本意是想暗示,如果她经常被现实所失望,那么这就是持有错误信念的一个弊端。但她似乎反而对不感到惊讶这一可能性感到震惊。
我现在意识到,她整个哲学体系的核心就是她相信自己在进行自我欺骗,而她对他人的估计实际上是准确的这一可能性,威胁到了她围绕「我从相信人性本善中受益」这样的信念构建的黑暗面认识论。
她已经将旧有的神明偶像从宝座上移除,取而代之的是对曾经为捍卫这些偶像而创造的「黑暗面认识论」的明确崇拜;她崇拜的是自己试图自我欺骗的行为。尽管这种尝试已经失败,但她却毫不知情。
因此,人类理性的象征性守护者们(他们的座右铭是:「自伊壁鸠鲁时代以来,一直在搅局你们疯狂的小派对」)现在必须与对自我欺骗的积极崇拜作斗争——人们开始崇拜信仰所带来的假想好处,而不是上帝本身。
这实际上解释了我自己之前并不真正理解的一个事实——为什么当人们谈论自我欺骗很容易时我会感到恼火,以及为什么我会写整篇文章论证,刻意选择相信天空是绿色的比人们想象的更难以逃避现实。
这是因为——虽然你不能简单地选择相信天空是绿色的——但如果你没有意识到这一点,你实际上可以欺骗自己,相信你已经成功地欺骗了自己。
既然你真诚地期望获得你认为来自自我欺骗的好处,你就会得到与成功实现自我欺骗所带来的相同类型的安慰剂效果。
因此,通过到处解释自我欺骗有多难,我实际上是在直接针对人们从「相信自己已经成功欺骗自己」这一信念中获得的安慰剂效果,并针对这种新型宗教——它只崇拜对上帝的崇拜,而不是上帝本身。
我不禁想知道,这场思想战役是否会产生一系列新的理由,不是为信仰本身辩护,而是为对信仰的信仰辩护,称其为一件好事?人们会声称从崇拜自己的崇拜中获得巨大的好处吗?我们是否必须再次应对「对信仰的信仰的信仰」和「对崇拜的崇拜的崇拜」这样的概念?还是聪明的有神论者最终会放弃这种论证路线?
我希望我能相信没有人会去相信「对信仰的信仰的信仰」这种荒谬的概念,但哲学中的僵尸世界论证比这更加复杂,而其支持者仍然没有放弃它。
别以为你能骗得了自己
原文:Don’t Believe You’ll Self-Deceive
我并不是想针对 Kurige,但我认为,如果你在 Less Wrong 这样的理性主义论坛上发表以下言论,你就得预料到会受到一些质疑:
我意识到的一件事,有助于解释我在与大多数其他基督徒交谈时感受到的差异,那就是在某个时候,我的世界观发生了重大转变,从盲目信仰转向了类似奥威尔式双重思想的状态。
「如果你知道这是双重思想……
……你怎么还能相信它?」我忍不住想这么问。
我选择相信上帝的存在——这是一个深思熟虑、有意识的选择。然而,这个决定对上帝是否真实存在绝对没有任何影响。
如果你知道你的信念与现实无关,你怎么还能坚持这个信念?
当我们意识到「我的地图说『天空是绿色』,但这个想法与现实毫无关联」时,难道不应该立即产生一个直觉性的认识:「哦,等等,天空实际上并不是绿色的」吗?
然而……事实似乎并非如此简单。
这个困惑的一部分原因可能在于我之前对摩尔悖论(「正在下雨,但我不相信它在下雨」)的解释——人们在自我反思时,往往会错误地将附加在某个引用信念上的积极情感误认为是对该信念的实际认同。
但另一部分原因可能只是——与我最初想要表达的愤慨相反——从「反映现实的地图会说『X』」到实际相信「X」,这个逻辑跳跃实际上并不容易实现。解释心智如何构建认知地图与现实之间的对应关系需要一定的努力,即使这样,要让这个理解深入到直觉层面,可能还需要更多的工作。
我现在意识到,当我写下「你不能通过意志力使自己相信天空是绿色的」这句话时,我不仅仅是在客观地陈述既有事实。我也在试图灌输一个可能自我实现的预言。
反复告诉自己「我不能玩弄双重思想的把戏!在内心深处,我会知道这不是真的!如果我知道我的认知地图与现实没有必然联系,那就意味着我根本不相信它!」这可能是一个明智的做法。
因为这样一来——如果你哪天真的想要尝试欺骗自己——「但我知道这并不是真的!」和「我不能欺骗自己!」这些想法总会立刻浮现在脑海中;这样,你确实会更难成功地欺骗自己。你更有可能在直觉层面上理解,仅仅告诉自己 X 是真的并不能使 X 成为现实:因此,X 真的确实不成立。
如果你不断提醒自己不能随意选择相信天空是绿色的——那么你在某种程度上就不太可能成功地欺骗自己;无论是真正相信这个谬误,还是陷入摩尔悖论、对信念的信念,或对自我欺骗的信念。
如果你一直这样告诉自己,在内心深处你终将明白——
如果你不断提醒自己,即使面对一个精心构建的虚假认知地图,你也会清楚地意识到它与现实没有任何必然联系,因此,不管这个地图看起来多么逼真,你都无法真正相信它——
如果你不断告诉自己,一旦你在元认知层面上意识到这个认知地图并不反映现实,你的反思性一致性就会发挥作用,使你停止在具体事物层面上的错误信念——
那么当真正的考验来临时——你可能,确实,会失败。
在面对故意的自我欺骗时,你必须坚信自己无法成功欺骗自己!
告诉自己这种尝试注定失败——它就真的会失败!
这是积极思维的力量,还是消极思维的力量?无论如何,这似乎都是一种明智的预防措施。
双重思想(选择拥有偏见)
原文:Doublethink (Choosing to be Biased)
奥勃良的指间突然出现了一张长方形的报纸碎片。这张纸片在温斯顿的视线中停留了约莫五秒钟。那是一张照片,毫无疑问就是那张照片。它是琼斯、亚伦森和卢瑟福在纽约参加党内活动时的另一张复印件,正是温斯顿十一年前偶然发现后立即销毁的那张。这张照片只在他眼前闪现了一瞬,随即消失不见。但他确实看到了,这一点毋庸置疑!他竭尽全力,痛苦地试图扭动上半身挣脱束缚。然而,他发现自己动弹不得,连一厘米都无法移动。一时间,他甚至忘记了刑具上的刻度盘。他唯一的愿望就是再次用手指触摸那张照片,或者至少能再看一眼。
「它存在!」他声嘶力竭地喊道。
「不,」奥勃良冷静地回答。
他走到房间另一头。
对面的墙上有一个记忆洞。奥勃良掀开栅格。那张脆弱的纸片无声地被温暖的气流卷走,瞬间在火焰中化为乌有。奥勃良转身离开墙边。
「灰烬,」他淡淡地说道。「连能辨认的灰烬都不是。只是尘埃。它不存在。它从未存在过。」
「但它确实存在过!它就是存在!它存在于记忆中。我记得它。你也记得它。」温斯顿激动地反驳。
「我不记得它,」奥勃良断然否认。
温斯顿心如死灰。这就是双重思想。他感到一种致命的无助。如果他能确定奥勃良在撒谎,那似乎还不那么可怕。但奥勃良很可能真的忘记了那张照片。如果是这样,那么他已经忘记了自己否认记得它,也忘记了忘记这个行为。怎么能确定这只是一个简单的骗局呢?也许那种疯狂的精神错乱真的会发生:这个念头彻底击垮了他。
—George Orwell, 1984[1]
如果自我欺骗能让我们获得幸福,我们该如何看待这一点?如果单纯地消除偏见反而会让我们——不要太惊讶——变得不快乐,那又该怎么办?也许,真正的智慧应该是一种二阶理性,即明智地选择何时保持理性。这样,你就可以决定哪些认知偏见应该主导你的思维,从而最大化你的幸福感。
撇开道德因素不谈,我怀疑人的心智中是否真的能出现如此荒谬的错位。
所谓的二阶理性意味着,在某个时刻,你会对自己说:「现在,为了让自己快乐,我要不理性地相信自己会中彩票。」然而,我们并不能如此直接地控制自己的信念。你无法仅凭意志就让自己相信天空是绿色的。你可能会相信自己相信了这一点——不过我刚才指出了这其中的差异,这可能让你更难做到这一点了。(不用谢!)你甚至可能相信自己很快乐并成功地进行了自我欺骗;但实际上,你既不会真正快乐,也不会真正实现自我欺骗。
要使二阶理性真正理性,你首先需要一个准确的现实模型,以推断理性和非理性行为的后果。如果你随后选择成为一阶非理性的,你就需要忘记这个准确的认知。然后还要忘记自己曾经忘记过。我并不想犯下从虚构证据中推广的逻辑谬误,但我认为奥威尔很好地推测了这条路径最终会通向何方。
在你真正摆脱偏见之前,你无法洞悉保持偏见会带来什么后果。然而,一旦你清除了这些偏见,再想进行自我欺骗就为时已晚。
另一种选择是盲目地决定保持偏见,对可能产生的后果毫无认知。这绝非什么二阶理性,而是一种蓄意的愚蠢行为。
如果你对自己的驾驶技能抱有不理性的乐观态度,你会在他人提心吊胆时无忧无虑。你不必忍受安全带带来的不适。你可能会快快乐乐地度过一天、一周、一年。然后突然发生车祸,余生都在幻肢瘙痒难耐却无法抓挠的痛苦中度过。或者从脖子以下全身瘫痪。又或者直接丧命。这些结果虽然不是必然的,但都是可能发生的。那么,发生的概率有多大呢?除非你清楚地认识到自己真实的驾驶水平,否则你无法理性地权衡利弊,也就无法准确评估自己面临的风险。同样,如果你不了解[忽视概率](https://en.wikipedia.org/wiki/neglect of probability)等认知偏见,你也无法做出理性的权衡。
无论你在幸福的无知中度过多少时光,只需一个错误就足以毁掉一个人的一生,远远超过你在愚蠢的道路上所获得的那点蝇头小利。
我给予有志成为理性主义者的人的一条重要建议是:「不要自作聪明。」此外,「要倾听内心那些微弱但挥之不去的疑虑。」如果你对某事一无所知,你就不知道自己不知道什么,也不知道自己有多少不了解的地方,更不知道自己需要了解多少。
所谓的二阶理性并不存在。我们能做的只是盲目地一跃,而这一跃可能会让我们坠入熊熊燃烧的熔岩坑,也可能不会。一旦你知道了这一点,再想装作无知就为时已晚。
然而,人们往往忽视这一点,因为他们不知道自己不知道什么。未知的未知是无法察觉的。他们不去关注地图上的空白区域,反而将其视为对应着一片空旷的领土。当他们考虑盲目跳跃时,他们在记忆中搜寻危险,却在这张空白的地图上找不到任何燃烧的熔岩坑。既然如此,为何不跳呢?
我曾亲身经历过,尝试过这样做,结果被烧伤了。所以,不要自作聪明。
我曾经对一位朋友说,我怀疑人们过高地估计了愚蠢带来的幸福。她却严肃地摇了摇头,说:「不,并非如此;真的不是这样。」
或许世界上确实存在一些无知却快乐的人。也许他们比你更幸福。但生活本就不公平,嫉妒那些你无法拥有的东西并不会让你变得更快乐。我怀疑,绝大多数阅读《克服偏见》的读者即使想要,也无法达到「愚昧的幸福」。那条路对你而言已经关闭。你无法重新变得无知,无法忘记你已经知道的事情,也无法对你所见的视而不见。
对你来说,愚昧的幸福之门已经紧闭。除非你真的遭受脑部损伤,否则你永远无法获得这种幸福,甚至即便如此也未必能够得到。你应该思考,这种愚昧的幸福是否真的是最理想的——是否是人类能够追求的最大幸福——但这已经不重要了。那条路对你来说已经关闭,如果它曾经开放过的话。
现在你唯一的选择,就是追求一个理性主义者所能达到的幸福。我认为,这种幸福最终可能会证明更为深刻。人生有两种道路:一种是有限的,另一种是开放的;有些是可以懒散度日的平台,有些则是需要不断攀登的高山。虽然攀登需要付出更多努力,但最终登顶的高度也会更高。
此外,生活中不仅仅只有追求个人幸福这一件事;你的决定可能还会影响到他人的幸福。
但这些讨论其实已经无关紧要了。当你意识到自己有选择的时候,实际上你已经别无选择了。你无法对已经看到的事物视而不见。回头的路已经关闭。
摩尔悖论
[摩尔悖论](https://en.wikipedia.org/wiki/Moore's Paradox)是指「外面在下雨,但我不相信它在下雨」这种说法的标准术语。在此感谢 MetaFilter 网站用户 painquale 的提示。
在阅读了 Less Wrong 网站上的一些评论后,我觉得自己对摩尔悖论有了更深入的理解。用户 Jimrandomh 提出:
许多人无法区分不同层次的间接性。对他们来说,「我相信 X」和「X」是同一回事,因此,认为相信 X 有益的理由也就成了 X 为真的理由。
我认为这种说法并不准确——即便是相对年幼的儿童就能理解错误信念的概念,这需要在心理上为「地图」(认知)和「领土」(现实)设置独立的类别。但这一观点指向了一个类似的想法:
许多人可能并不会有意识地区分「相信某事」和「认可某事」。
事实上,在日常用语中,「我相信民主」意味着你认同民主的理念,而不是你相信民主确实存在。由此可见,「相信」这个词实际上有多重含义。我们可能正在面对一个导致思维混乱的模糊词语(或者它可能只是反映了人们本就存在的认知混乱)。
让我们回到最初的例子:「我相信人们比实际上更好」。在这个例子中,她想出了一些认为人性本善会带来好处的理由——比如对健康有益等。既然她现在对「相信人性本善」这个概念产生了一些积极情感,她就通过内省这种温暖的感觉得出结论:「我相信人性本善。」换句话说,她错误地将附着在这个信念上的积极情感,视为她真的相信这个观点的证据。然而同时,现实世界似乎表明人们并不那么善良。于是她说出了「我相信人们比实际上更好」这样自相矛盾的话。
这在某种程度上几乎是一个诚实的错误——因为人们从未被明确教导如何判断自己是否真的相信某事。这就像车库里的龙的寓言;那个说「我的车库里有一条龙——但它是隐形的」的人,没有意识到他预期看不到龙这一事实,恰恰表明他实际上持有一个(准确的)没有龙存在的心理模型。
人们并没有接受过如何识别自己是否真正相信某事的训练。这不像是他们在高中时就被教导过:「真正相信某事的感觉——也就是将那个陈述纳入你的信念体系中——就是它看起来就像是世界的本来面目。你应该能够识别这种感觉,这是真实的(未被引用的)信念,并将其与那些你认识到只是一种信念(意味着它被引号括起来)但对其抱有好感的情况区分开来。」
这种解释很大程度上使得摩尔悖论在现实生活中的表现不那么令人费解,并提供了另一种解释机制,说明为什么人们可能同时持有正确和错误的观点。
同样,Kurige 写道:
我相信有一位上帝——并且他已经在我们心中注入了一种是非观念,通过这种观念我们能够评判周围的世界。我也相信一种道德感已经通过进化被编程到我们的基因中——这种道德感很可能是源于远古时期倭黑猩猩群体形成元政治联盟的结果。这两种信念并不矛盾,但难点在于如何调和这两者。
我猜测,Kurige,你已经决定你有理由支持这个被引用的信念,即上帝已经在我们心中注入了一种是非观念。同时你也有理由支持科学的结论。这两种观点看起来都像是值得加入的好阵营,对吧?这两组信念都有其好处?你通过内省发现你对两种信念都感觉良好?
但你并没有这样说:
「上帝在我们心中注入了一种是非观念,同时一种道德感也通过进化被编程到我们的基因中。这两种现实状态并不矛盾,但难点在于如何调和这两者。」
Kurige,如果你正在阅读这段文字,你应该立即大声读出上面这段话。这样做是为了让你能注意到,这种表述似乎至少稍微更难接受——请留意这种主观感受上的差异——在你开始费力地重新进行合理化解释之前。
这就是「有理由支持两种不同信念」与「你对单一世界、单一事物本质的心理模型」之间的主观差异。
不,原来,我欺骗了自己
原文:No, Really, I’ve Deceived Myself
最近我与一个人交谈……很难准确描述她。表面上,她是一个正统的犹太教徒。极为聪明,同时又熟知一些反驳她所信奉宗教的考古证据,以及那些宗教人士耳熟能详的浅显反宗教论点。比如,她知道 Mordecai、Esther、Haman 和 Vashti 这些人物并不存在于波斯的历史记录中,相反,有一个相应的古波斯传说,讲述的是巴比伦神祇 Marduk 和 Ishtar,以及与之对立的埃兰神祇 Humman 和 Vashti。尽管知道这一点,她仍然庆祝普珥节。她是那类极具智慧的宗教人士,多年来在自身矛盾中不断思索,反复阐释和调整,直到他们的内心世界变得如同 M. C. Escher 的画作一般复杂难解。
大多数这样的人会假装自己睿智过人,不屑与无神论者对话,但她却愿意花几个小时与我交谈。
正因如此,我现在至少多理解了一件关于自我欺骗的事情,这是我之前没有明确意识到的——那就是,你其实不需要真的欺骗自己,只要你相信你已经欺骗了自己就够了。我们可以称之为「相信自欺欺人」。
这位女士在高中时期认为自己是个无神论者。但她当时决定,要表现得像是相信上帝的样子。然后——她真诚地告诉我——随着时间的推移,她开始真正相信上帝了。
据我观察,她对这一点的认知完全是错误的。在我们整个谈话过程中,她反复说「我相信上帝」,却从未说过「上帝存在」。当我询问她为什么信教时,她从不谈论上帝存在会带来的后果,只谈论相信上帝会带来什么好处。她从不说「上帝会帮助我」,而总是说「我对上帝的信仰帮助了我」。当我向她提出「如果一个人只是想要了解真相并观察我们的宇宙,甚至不会将上帝作为一个假设」时,她表示完全同意。
据我所见,她实际上并没有欺骗自己去相信上帝的存在或犹太教的真实性。甚至远远不是这样。
然而,我认为她确实相信她已经成功地欺骗了自己。
所以,尽管她并没有因为相信上帝而获得任何实际好处——因为她实际上并不相信——但她真诚地相信自己已经欺骗自己相信了上帝,因此她真诚地期待能够获得她认为与欺骗自己相信上帝相关的好处。我想,这可能会产生与真正相信上帝几乎相同的安慰剂效果。
这或许可以解释她的行为:面对我的质疑,她热切地捍卫自己相信上帝的说法,却从未提及「哦,顺便说一下,上帝确实存在」,甚至对上帝是否真实存在这个问题似乎毫无兴趣。
单重思想
原文:Singlethink
我清晰地记得自己成为理性主义者的那个关键时刻。
这个转折并非发生在阅读《别闹了,费曼先生》或其他关于理性的著作时;对于这些书中的观点,我只是觉得理所当然。真正的旅程始于你发现现有方法中的重大缺陷,并萌生一种动力,去改进,去创造新技能,超越书本中那些有用但不够完善的技能。
在我人生第一阶段即将结束时,十五岁的我正沉浸在一段愉快而又略带自负的童年回忆中。那么遥远的记忆已经变得模糊;我脑海中有一个画面,但具体年龄记不清了。我猜我大概六七岁,事情发生在夏令营期间。
事情是这样的:一个十几岁的男性营地辅导员让我们这群小男孩排成一列,然后提议玩一个游戏:站在队尾的男孩要从我们的双腿之间爬过去,我们则在他经过时打他的屁股,然后轮到下一个站在队尾的八岁左右的男孩。(也许是我已经失去了儿时的天真,但我不禁要质疑这个游戏的动机……)我拒绝参与这个游戏,结果被罚到角落里坐着。
这段童年回忆——拒绝参与打人和被打的游戏——在我心中一直象征着,即便在那么小的年纪,我就已经拒绝从伤害他人中获得快感。我不愿意以自己挨打为代价换取打别人的机会;不愿意用承受伤害来换取施加伤害的权利。我拒绝参与这种两败俱伤的游戏。
然而,在我十五岁那年,我突然醒悟到事实并非如此。我当时拒绝参与,并不是出于对双输局面的原则性反对。虽然我很早就接触到了「囚徒困境」这个概念,但绝不可能是在七岁时就理解了。我拒绝纯粹是因为不想受伤,而被罚站在角落是我愿意付出的、避免受伤的代价。
更为关键的是,我意识到我其实一直都知道这一点——真实的记忆一直潜藏在我意识的某个角落,我的内心曾瞥见过它,但随即便匆匆移开了目光。
在我理性之路的第一步,我捕捉到了这种感觉——将其归纳为一种主观体验——并对自己说:「原来这就是将一个不愿面对的真相推到意识角落的感觉!从现在起,我要警惕每一次这样的行为,并彻底清理我内心的所有角落!」
我将这种心智锻炼方法命名为单重思想,灵感来自奥威尔的双重思想概念。在双重思想中,你先是忘记某事,然后又忘记了自己已经忘记。而在单重思想中,你能察觉到自己正在遗忘,随后便能重新记起。你的头脑中每次只保持一个不自相矛盾的想法。
「单重思想」是我创造的第一个全新的理性思考技巧,这是我在书本上从未读到过的。我不确定它在学术界是否具有原创性,不过幸运的是,这并不是必要条件。
哦,顺便一提,十五岁的我很喜欢给事物取名字。
确认偏见的可怕深度似乎无穷无尽。虽然不是真的无限,因为人脑的复杂性毕竟是有限的,但它深邃得让人感觉仿佛无穷无尽。你不断发现(或从书中读到)大脑用新的机制来回避某些事物。
但我年轻的自己用那第一把心智扫帚,清理了不少思维的死角。
理性的论证
原文:https://www.readthesequences.com/A-Rational-Argument
你是一名竞选经理,最近刚刚受聘于绿党候选人 Mortimer Q. Snodgrass,为其竞选 Hadleyburg 市长效力。身为竞选经理,在阅读一本关于理性思维的书时,一个问题始终萦绕在你的心头:「如何才能构建一个无懈可击的理性论据,证明 Mortimer Q. Snodgrass 是 Hadleyburg 市长的最佳人选?」
对不起,办不到。
「什么?」你惊呼道,「但如果我只用有效证据来构建推理框架呢?如果我引用的每个事实都尽我所知是真实的,并且符合贝叶斯法则下相关证据的标准呢?」
对不起,还是办不到。从预设论证结论的那一刻起,你就已经注定失败了。
今年,《Hadleyburg 号角报》向所有市长候选人发送了一份调查问卷,其中包含 16 个问题,如「你能用风的所有颜色作画吗?」和「你曾吸食过毒品吗?」不幸的是,《号角报》的办公室在调查结果发布前被一颗陨石摧毁了。这着实令人遗憾,因为你支持的候选人 Mortimer Q. Snodgrass 在 16 个问题中有 15 个都胜过了他的竞争对手。唯一的难点在于第 11 问,「你现在是,或者曾经是,一个超级反派吗?」
因此,你很想把这份问卷作为你的竞选宣传材料公布……当然,得跳过第 11 问。
这就已经越过了理性和合理化之间的界限。选民将无法再仅凭已知事实做出判断;他们必须考虑「选择性展示信息」这一额外要素,并以此推测存在被隐藏的证据。
事实上,当你在决定是否公布问卷之前,先考虑这份问卷是否对你的候选人有利,这时你就已经越界了。「什么!」你可能会抗议说,「难道竞选团队还要公布对自己候选人不利的事实吗?」但是,请设身处地地为仍在选择候选人的选民想一想——为什么要把有用的信息筛查掉?若是出于纯粹的好奇心,从证据出发,正向推演,去寻找未知的候选人,而非先确定候选人,再逆向寻找支持的论据,你是不会如此行事的。
所谓「合乎逻辑」的论证,是可以从其前提中自然推导出来的。让我们看一个「不合逻辑」的论证例子:
-
所有矩形都是四边形。
-
所有正方形都是四边形。
-
因此,所有正方形都是矩形。
以上三段论的推理过程,即便其前提和结论都恰好正确,也无法掩盖其不合逻辑的本质。区分「合乎逻辑」与「不合逻辑」的推理很重要。即便结论正确,我们也不应为「不合逻辑」的推理开脱。一方面,这可能会影响之后我们如何根据新的证据来调整信念;另一方面,粗心大意的思维习惯一旦养成,就难以改变。
最重要的是,以上三段论作为一个真正的解释来说是不成立的。的确,所有的正方形确实都是矩形,但原因并非是因为两者都是四边形。我们可以把这种论证称之为虚假三段论——其表面理由和真实理由是不一致的。
在政治竞选中,如果你真心希望为支持的候选人提出一个诚实而理性的论点,那么只有一种方法:
-
在接受任何人雇佣之前,先全面收集各个候选人的相关信息。
-
制定一份评估清单,用于判断哪位候选人最合适。
-
按照这份清单上的评估标准逐项打分。
-
主动联系评估结果最佳的候选人。
-
主动请缨担任其竞选经理。
-
当他们需要竞选宣传材料时,直接把你的评估清单打印出来。
唯有如此,你才能构建起一条理性的论证链,其最终结论是依据其上的论证逐步正向推导而成的。无论实际上是什么决定了你的最终结论,那都应该是你如实写在前面论证中的唯一内容。
规避你信念中的真正弱点
原文:https://www.readthesequences.com/Avoiding-Your-Beliefs-Real-Weak-Points
几年前,我九十多岁的曾祖母去世了。她衰弱的过程漫长而残酷。我从未真正了解过她这个人,但在我遥远的童年回忆中,她会给家人做饭;我记得她做的鱼丸,她的面庞,也记得她对我慈祥和善。葬礼上,那位多年照顾她的叔祖父致辞。他强忍泪水,说上帝一点一点地带走了他的母亲:先是记忆,然后是言语,最后是她的笑容。当上帝连她的笑容都带走时,他便知道母亲时日无多,因为这意味着他的母亲已经所剩无几。
他的这番话让我困惑不已。这样的遭遇发生在任何人身上都可怕得难以想象,因此我没有料到叔祖父会将其归因于上帝。一般来说,犹太教徒会刻意回避思考「上帝允许悲剧发生」所隐含的逻辑推论。根据犹太教教义,上帝始终维护着宇宙运转,并安排世间的一切;但人们往往只愿在好事发生时,才会从信仰中作出如此推论。当一个女婴降生时,人们会说「这是上帝的旨意!」,但对于流产、死产和婴儿猝死,却不愿去想「这也是上帝的旨意」。如此一来,便能塑造出一个极为片面的仁慈上帝形象。
因此,当我听闻叔祖父说,他的母亲日渐衰弱是上帝蓄意安排的结果时,我很吃惊。这与我所理解的宗教教徒自我欺骗的常理不符。
如果当时我能注意到自己的困惑,或许就能成功预见此事出人意料的后续发展。没过多久,我的叔祖父脱离了犹太教。(据我所知,在整个大家族中,他是除我之外唯一一个脱离了犹太教的人。)
[现代正统犹太教](https://en.wikipedia.org/wiki/Modern Orthodox Judaism)与我所知的任何其他宗教都截然不同。我都不知道该怎么向那些从未被迫研习过《米书拿》和《革马拉》的人解释。这个宗教有质疑的传统,但其方式……这么说吧,一位拉比在每周布道时,指出创世七日与宇宙大爆炸至今有 137 亿年之间的矛盾,这事儿一点都不奇怪——因为他自认有一套非常巧妙的解释,牵涉到圣经的另外三处引文、一段《米德拉什》的解读,以及一篇他从《科学美国人》上读来、一知半解的文章。正统犹太教允许你指出各种不一致和矛盾,但这只是为了把这些矛盾强行解释过去。谁的解释最复杂,谁就能得奖。
这里的确有探究的传统。但人们的探究仅仅是为了辩护。他们只会去挑战自己有信心自圆其说的观点。
在现代正统犹太教,很少有人强调盲目信仰的美德。你可以有疑问,但不能让这些疑问成功动摇你的信仰。
我推测,绝大多数受过教育的正统犹太教徒都曾在人生的某个阶段质疑过自己的信仰,但其过程多半如下:「怀疑论者指出,《妥拉》所述的上帝七日创世,在科学上是不准确的。但是,对于当时聚集在西奈山下的以色列部落民众们来说,即便向他们展示科学真相,他们能理解吗?他们甚至有表达『十亿』这个概念的词语吗?将七天创世的故事视为一个隐喻似乎更合理——上帝首先创造了光,这代表了宇宙大爆炸……」
这真的是犹太教信仰最经不起推敲的部分吗?继续阅读《妥拉》,你会发现上帝为了说服一个非民选的法老释放奴隶,竟然杀死了埃及所有的头胎男孩;从逻辑上讲,上帝完全可以直接将这些奴隶传送出埃及。每个正统犹太教徒都熟知这个故事,因为他们每年都要在犹太教堂里完整诵读整本《妥拉》。这一事件还有一个重要的相关节日——「逾越节」(Pesach),这个名字就来源于上帝在杀死埃及所有的头胎男孩时,「跳过」了犹太人的家庭。
现代的正统派犹太教徒大多是善良文明的人,其文明程度远超《旧约》的几位编撰者。就连古代的拉比都比这些人更文明。在逾越节晚餐的仪式中,有一个环节是要求人们从杯中取出十滴酒,每滴代表十灾之一,以此强调埃及人所遭受的苦难。(当然,你应该对埃及人遭受的苦难表示同情,但不应过度同情到站起来大声抗议:「这是不对的!这么做是错误的!」)这反映出一个耐人寻味的对比——拉比们比《旧约》的编撰者更为仁慈,能够意识到这些灾难的残酷。然而,在那个年代,科学还不够发达,因此拉比们可以思考经文中那些令人不快的内容,而不必担心这会彻底动摇自己的信仰。
你甚至不会质疑此事是否有损上帝的形象,因此也不需要急着辩解说「上帝的行事方式神秘莫测!」,或是「我们的智慧不足以质疑上帝的决定!」,又或是「如果是上帝,杀害婴儿也可以接受!」这部分问题根本就不在思考范围之内。
我觉得,受过教育的宗教信徒之所以能够维持信仰,是因为当他们产生怀疑时,会下意识地小心挑选,仅仅质疑自己信仰中最稳固的部分——他们有把握能够为之辩护的部分。此外,通过在这些最稳固的部分反复演练标准辩词,还能使其感到信念更加坚定。
比如说,面对像「科学不是说宇宙只是原子在毫无意义地随机碰撞吗?」这样的质疑时,通过反复演练预先准备好的辩护词,可能会让人感觉特别良好,因为这样可以证实宇宙的意义所在,其意义更是由造物主所赋予,诸如此类。这远比想象一位不识字的埃及母亲在她遇害儿子的摇篮旁痛哭要轻松得多。如果有人在质疑自己的犹太教信仰时,会主动联想到后者,那就说明这个人是真的在质疑,恐怕也不会再继续信仰犹太教多久了。这里的重点不仅仅是想要批判正统犹太教。我相信,对于「杀死头胎」这件事,肯定存在不少解释和辩护,说不定能找出十来种说法。我的重点是,在自我质疑时,人们更倾向于针对那些有现成辩词以慰己心的有力论点,而非直面最脆弱、最不堪一击的部分。同样,人们往往在得到第一个令人安心的答案后就停止思考,而非继续深入批判。本文的标题,比起「规避你信念中的真正弱点」,或许用「不去主动思考信念中最令人痛苦的弱点」会更贴切。
宗教之所以能持续保持其影响力,很大程度上是因为人们会刻意回避思考自己信念中真正的弱点。我认为这并非后天训练使然,而是一种本能反应。人们不去思考自身信念真正的弱点,正如人们不会用手触摸滚烫的炉灶——因为那样会很痛苦。
为了做得更好:当你开始怀疑自己最珍视的信念时,请闭上眼睛,清空思绪,咬紧牙关,然后刻意思考那些最令你痛苦的问题。不要只是重复那些能用标准辩词反驳、让你自我感觉良好的常见质疑。要问问自己,那些与你意见相左的聪明人会如何回应你的第一个辩解,以及第二个辩解。每当你发现自己对某个一闪而过的质疑心生惧意,都要把它揪回意识的最前端。要一拳打在自己的腹腔神经丛。要把尖刀直插入心窝搅动。在直面痛苦之时,仅重复以下箴言:
事实早已存在。
承认事实不会使之更糟。
回避事实也不会使其消失。
正因其为事实,我们才必须与之共处。任何虚假的事物,都不值得我们为之浪费人生。
人们能够承受事实,因为我们本就生活在事实之中。
—Eugene Gendlin[1]
(特别感谢 Stephen Omohundro 的启发。)
黑暗面的认识论
原文:https://www.readthesequences.com/Dark-Side-Epistemology
一旦说谎,真相便永远成为你的敌人。
我之前提到过一个观点,真相是相互关联的,谎言是具有传染性的。如果你从车道上捡起一块小石子,告诉一位地质学家你是在海滩上找到的——你知道地质学家对岩石的了解吗?我不知道。但我可以猜测,一个被水磨圆的石子,应该不像从火山喷发出来的熔岩滴。你知道车道上的那块石子到底来自哪里吗?万物都带有它们所在之地的印记,在这个有规律的宇宙中,谎言显得格格不入。(实际上,一位地质学家评论道,大多数车道上的小石子都是从海滩上取的,他们分辨不出车道石子和海滩石子的区别,但能分辨出山石和车道/海滩石子的区别——这就是一个例子。)
对某些人来说,某些听起来像是随意的真理——很容易被似是而非的谎言取代的真理——可能会因更多知识的关联而确定下来。对于创世论者来说,生命是由「智能设计」而非「自然选择」塑造的观点,可能更像是感情上的一种站队。可对生物学家来说,要合情合理地辩称某个生物是经过智能设计的,几乎需要对这个生物的每个细节进行歪曲。比如,要合理地辩称「人类」是经过智能设计的,你就得歪曲一些细节,包括关于人类视网膜的设计、关于人脑的结构、关于那些通过弱的范德华力而非强的共价键连接在一起的蛋白质……
或者,你也可以直接对进化理论进行曲解,这是大多数神创论者选择的路径。他们不是篡改网络中具体的节点,而是歪曲连接节点的普遍规律。
为了掩盖这一点,他们还会对科学规则进行误导,比如「理论」到底意味着什么,或者科学家说他们不能百分百确定某事时,究竟指的是什么意思。
于是,他们从篡改具体事实,发展到歪曲普遍规律,最终甚至开始扭曲科学的推理规则。想要否认人类是通过进化产生的,你必须否认进化论;而要否认进化论,就必须歪曲科学理解进化的基本规则。
但还能怎样?正如一个人类如果被放置在一个真正由智能设计创造的生物群体中,会显得格格不入;为了让这一点看起来「合理」,必须对进化的规则进行歪曲。同样,关于神创论的信念本身也不适用于科学领域——它们在一个有条理的头脑中毫无立足之地,就像你不可能在冰川上看到棕榈树一样。因此,为了让这些信念进入科学领域,必须打破那些会排斥它们的屏障。
这就引出了自我欺骗的情况。
你对自己说的谎言,在不了解任何支配思想的规则,甚至不知道存在这些规则的时候,可能看起来都足够可信。选择似乎就像挑选一种冰淇淋口味那样随意,就像海岸上的一块卵石那样没有关联……
……但随后就有人质疑你的信念,运用他们所学的推理规则。他们说:「你的证据在哪里?」
而你说:「什么?为什么我需要证据?」
于是他们回应:「一般来说,信念需要证据支撑。」
显然,这条论据就像是在另一方作战的士兵,你必须击败他。所以你说:「我不同意!并非所有的信念都需要证据。特别是关于龙的信念。当谈到龙的时候,你可以相信任何你喜欢的东西。所以,我不需要证据就能相信我的车库里有一条龙。」
而那个人说:「嗯?你不能就那样把龙排除在外。信念需要证据是有原因的。要正确绘制一幅城市的地图,你就得走在街道上,并在纸上画出与你所见相对应的线条。这可不是随意的合法性要求——如果你坐在客厅里随意在纸上画线条,地图肯定会画错,并且出错的概率极高。绘制一幅龙的地图也是如此,就像绘制任何其他地图一样。」
所以现在,关于信念为何需要证据的这个解释,同样也是一个对立的「士兵」。所以你说:「有极大概率会出错?那还是有正确的可能性,对吧?如果没有绝对的确定性,我就不必相信。」
或许,甚至你自己也开始怀疑「信念需要证据」,但它动摇了你所珍视的谎言。于是,你拒绝内心的觉醒,将冉冉升起的太阳重新压回地平线之下。
或许,你曾听过那句格言:「信念需要证据」,而且还你觉得这话很有道理,在公众场合表示赞同。可直到有人提醒你,这句话同样适用于你相信「车库里有龙」这件事,你才恍然大悟。于是你急中生智,赶紧说:「这条龙属于超越科学验证的特殊领域,不能用常规标准来判断。」
拥有错误的信念并不是好事,但它未必会造成永久的伤害——只要在发现错误后你能够及时纠正。真正危险的是执着于错误的信念,你相信这个信念应当被保护,这是一种对信念本身的信仰,无论这种信念是否真实存在。
一个必须被保护的谎言足以阻碍一个人迈向更高层次的理性思维,这绝非无伤大雅的消遣。
正如这个世界比表面看起来要复杂得多,推理也有更严格的规则,比未经训练的人想象的要更具约束力。世界是紧密交织的,它被普遍规律支配,而理性的信念也是如此。
想一想否认进化论或日心说需要付出什么代价——所有相关的事实和规律都会被拒之门外。那时你就会明白,自我欺骗的行为是如何切断对真相更深层次的追寻的。一旦你因为看到这些联系而感到威胁,就会封闭理性思维的中级和高级层面。取而代之的是,建立一个庞大的反逻辑体系,它反思维规则,并且普遍合理化那些错误的信念。
Steven Kaas 曾说:「推广不完全准确的信念就是一种破坏行为。除非你也愿意对他们造成严重伤害,否则不要对任何人这么做。」给别人一个需要保护的错误信念——让他们相信这个信念本身必须抵御任何看似威胁它的思考——嗯,除非你也愿意给他们做个前脑叶切除手术,否则不应该这么做。
一旦你说了谎,真相便成为你的敌人;与这真相相关的所有事实,所有支持真相的事物,你都必须反对,从而保护这个谎言。无论你是在对别人撒谎,还是在对自己撒谎。
你必须否认信念需要证据,然后否认地图应该反映现实领地,接着你还得否认真相是一件好事……
于是,黑暗面便诞生了。
我担心人们没有意识到这一点,或者没有足够的警觉——在我们穿行于人类的世界时,可能会遇到系统性的错误认知。
那些流传的「如何思考」的模因,那些那些看似具有深邃智慧的陈旧思想 ——它们其中一些是理性主义者提出的好建议,但也有些观念是为了保护谎言或自我欺骗而发明的:这些观念源自黑暗面。
「每个人都有权拥有自己的观点。」当你仔细想想,这句话是从哪里来的呢?它是为了保护真理而说的吗,还是为了避免面对真理而说的呢?但是人们并不会警觉地说:「啊哈!我察觉到黑暗面的存在了!」据我所知,大家并没有普遍意识到黑暗面就在我们周围。
否则还能怎样呢?无论是欺骗他人,还是自欺,那些必须被保护的谎言都会在经验因果网络中递归扩散,影响普遍经验法则的网络、推理规则,甚至是理解背后这些的规则。如果这个世界上有好的认识论,而人们又试图保护某些谎言或自欺,那么必然会出现坏的认识论,与真理对抗。在这个世界上,我们很难想象没有黑暗面的光明面。就像有阳光,就会有退缩并投射出阴影的事物一样。
请注意,这些人未必就是邪恶的人。绝大多数传播「深邃智慧」的人,与其说是心怀恶意,不如说是受到了蒙蔽;与其说是欺骗别人,不如说是自欺。我是这么认为的。
当然,我绝不是有意向你提供一种万能的反驳法,让你在听到不喜欢的认知论时,就直接说:「哦,这是在黑暗面的人编出来的。」 光明面的一条规则是:你必须直接反驳命题本身,而不是通过指责提出者的不良意图来否定它。
但黑暗面确实存在,恐惧就是通向它的道路,只需一次对真相的背叛就可能让你堕入其中。并非所有穿长袍的人都是绝地武士或伪装正义之人,还有西斯尊主,他们当中既有大师,也有不自知的学徒。保持警觉,小心提防。
至于列举一些由黑暗面催生的常见观念——不是随机的错误信念,而是错误的认知方式和那些保护认知失败的普遍防卫——那么,亲爱的读者,你们愿意尝试一下吗?
关联的真理,传染的谎言
原文:https://www.readthesequences.com/Entangled-Truths-Contagious-Lies
你们的一位远古哲学家曾得出这样的结论:一个能力超群的头脑,仅通过研究任何给定宇宙中的一个事实或人造物,就能构建或想象出那个宇宙的全貌,从它诞生的瞬间直到最终的终结……
—First Lensman[1]
如果你们中的任何一个人能够将注意力集中在一个单一的事实或小物体上,比如一颗鹅卵石,或是一株植物或其他生物的种子,即使只有短短一百年的时间,你就会开始领悟它所蕴含的真理。
—Gray Lensman[2]
我相当确信,从我们地球的海滩上随意捡起的一颗鹅卵石,并不能揭示这个地球上的大陆和国家,政治和人口。在时空中的其他行星,以及其他的 Everett 分支,也可能会产生相同的鹅卵石。然而从另一个角度来看,一颗鹅卵石的本质似乎包含了我们的物理定律。从这个意义上说,我们整个宇宙——包括所有的 Everett 分支——似乎都蕴含在那颗鹅卵石之中。(如果,正如看起来很可能的那样,不存在真正的自由变量。)
因此,一颗鹅卵石可能无法揭示我们整个地球的全貌。但是,一颗鹅卵石却能透露出极其丰富的信息。通过研究这单一的鹅卵石,你可以洞察物理定律及其所蕴含的一切。思考这些物理定律,你可以推断出行星的形成,你可以猜测这颗鹅卵石来自这样的一个行星。鹅卵石内部的晶体和分子结构是在重力作用下形成的,这告诉你一些关于行星质量的信息;鹅卵石中元素的组成则透露了一些关于行星形成过程的信息。
我并非地质学家,所以我不清楚地质学家们掌握了哪些奥秘。但我很容易想象这样一个场景:向一位地质学家展示一颗鹅卵石,并说,「这颗鹅卵石来自半月湾的海滩」,而地质学家立即回应,「我感到困惑」甚或「你在撒谎。」也许是因为岩石类型不对,或者鹅卵石的磨损程度不足以支持它来自海滩——我对鹅卵石了解不够,无法猜测可能暴露我谎言的联系和特征,而这正是关键所在。
「只有上帝才能编造出一个真正可信的谎言。」我不禁好奇,是否曾有某个宗教将这句话发展成谚语?我会(可证伪地)猜测没有:这其实是一个理性主义的观点,即使你将它套用在神学比喻中。说「万物相互关联,因为上帝创造并维系着整个世界」可能在布道时会引发一些温暖模糊的美好感觉,但当涉及到将具体的鹅卵石归属到特定的海滩时,这种说法就帮不上什么忙了。
地球上的一枚小小硬币对月球产生的引力加速度约为 4.5 × 10−31 米/秒²。这个微不足道的数值似乎佐证了一种观点:每个事件都与其过去光锥中的所有事物存在着关联。更进一步说,由于推理可以在因果网络中双向传播,认知层面的关联很容易突破光速所界定的限制。然而,如果真要有人扮演「法医天文学家」的角色,试图通过观测月球来判断那枚硬币落地时是正面还是反面朝上,那可就是一项不可能完成的任务了——毕竟,硬币对月球的影响之微小,远远比不上量子不确定性和热噪声的影响。
如果你能够这样表述:「万物都与其他事物存在着关联」或者「万事万物在逻辑推理的层面上都是相互关联的,只是这些关联的强度各不相同」,那么你就展现出了真正的智慧,而不仅仅是停留在表面的「高深莫测」。
从物理学的角度来看,每个事件在某种意义上都是其整个过去光锥中所有事物的集合体,没有明确的边界或界限。然而,那些显著的关联实际上屈指可数,它们共同编织成一个类似网络的结构。正是这种高层次的规律性,构成了我所言的「大因果网」的核心内涵。
我使用这些首字母大写的词语,多少带有一点自嘲的意味。不过,如果说真有什么概念值得用大写字母来郑重其事地强调,那么「伟大因果网」无疑应该跻身其列。
Walter Scott 爵士曾说:「当我们初次尝试欺骗时,往往会编织出一张错综复杂的网。」诚然,并非所有谎言都会失控——我们[并非生活在一个绝对公正的世界](https://www.readthesequences.com/Beyond-The-Reach-Of-God。然而,确实会有这样的情况:一个人为掩盖一个事实而撒谎,随后不得不为相关的事实继续编造谎言,如此循环往复:
「你去哪儿了?」
「哦,我出差了。」
「出差做什么?」
「这涉及与一个重要客户的机密谈判,我不能透露。」
「哦,原来如此——他们让你参与这么重要的事了?太好了!我该给你老板打个电话,感谢他重用你。」
「抱歉——他现在不在办公室……」
作为凡人,我们常常难以预想到为编造一个可信的谎言需要歪曲多少相关事实。「上帝使我怀孕了」这样的说法在过去或许更容易让人相信,那时人们对 Y 染色体的认知还很有限。如今,随着基因检测技术的普及,许多类似的谎言可能会不攻自破。多年后,一些强奸犯被定罪,虚假指控者被揭露,都是基于他们当初没有意识到可能留下的证据。一个进化生物学的学生能够在每一只追逐兔子的狼、每一只逃跑的兔子,以及每一只直接蜇人而不是礼貌发出警告的蜜蜂身上,看到自然选择的设计印记。然而,我敢说,神创论者的欺骗对他们来说听起来却是可信的。
并非所有谎言都会被揭露,也不是所有撒谎者都会受到惩罚;我们并不生活在一个绝对公正的世界中。但也并不是所有谎言都如撒谎者所想的那样安全。我想知道,如果一个贝叶斯超级智能对地球进行一次(非破坏性的?)纳米技术扫描,会有多少罪行被揭露?至少,所有在任何大脑中仍有证据存在的谎言。有些这样的谎言可能会更早被揭露,如果神经科学家们能通过神经影像技术成功构建一个真正有效的测谎仪。Paul Ekman(微小面部肌肉运动研究的先驱)如果有机会,现在可能就能识别出世界上相当一部分的谎言。
并非所有谎言都会被揭露,也不是所有撒谎者都会受到惩罚。但大因果网常常被低估。仅是人类已经积累的知识,就需要花上几辈子来学习。任何认为非神灵可以完美撒谎且无风险的人,都是低估了大因果网的复杂性。
诚实是最好的策略吗?我不知道我是否会走那么远:即使在我的伦理观中,有时保持沉默也是可以的。但与彻底的谎言相比,无论是诚实还是沉默,都涉及到较少的你不知道自己在承担的递归传播风险。
虚假辩白
原文:https://www.readthesequences.com/Fake-Justification
如今,许多已经不再真正相信基督教的基督徒,仍坚持推崇《圣经》作为道德建议的来源。对此,Sam Harris 的话是无神论者的标准回应:「你我都知道,只需五分钟,我们就可以写出一本比《圣经》更有条理、更悲天悯人的书。」同样,有人可能试图坚持《圣经》具有文学价值。那么为什么不推崇文学性远超《圣经》的《魔戒》呢?尽管 Tolkien 的道德观念也常遭批评,但至少在伦理来源方面,《魔戒》胜过《圣经》。那么为什么人们不在脖子上戴个小戒指,而是戴十字架呢?无论在文学艺术还是道德哲学上,即使是《哈利·波特》也比《圣经》优秀。如果我想再刻薄一点,我会拿《圣经》和 Jacqueline Carey 的《库希尔传》相比。
你问朋友:「在许多人根本没有笔记本电脑的情况下,你还购买一台价值一百万美元、镶满宝石的笔记本电脑,对此你能怎么辩解?」朋友回答说:「你想想这会为笔记本生产商及其广告代理商提供多少就业机会,得到工作的人们又可以拿钱去吃饭、理发等,这些都会刺激经济,最终使得许多人都有一台自己的电脑。」然而,这并不比买 5000 台「每个孩子一台笔记本电脑」设备更高效。(译注:One Laptop Per Child, OLPC,该项目由麻省理工学院媒体实验室发起,是一个旨在缩小知识鸿沟的非营利组织。他们通过生产接近 100 美元的笔记本电脑,为感兴趣的发展中国家政府提供设备,直接分发给儿童使用。)因为这不仅能为 OLPC 生产商提供就业机会,还能直接把笔记本电脑送给需要的人。
我之前曾谈到,人们常常未能寻找第三条道路。但这并不是真正的动机性停止。如果要称其为「动机性停止」,那就意味着至少先有过一次搜索。
在《最终结论从何而来》中,我提到:只有真正决定我们信念的因素,才能影响我们在现实中的准确性;只有真正驱动我们行动的因素,才能影响我们达成目标的效果。那个花一百万美元买笔记本电脑的人,心里其实在想:「哇,好闪亮。」这才是他决定购买的真正原因。无论有多少「辩解」也无法改变这一点,除非这个辩解真能启动一个全新的搜索过程,彻底改变结论。真的改变结论。大多数出于责任感提出的批判,不过是走个形式罢了,就像一党制国家的「自由选举」一样。
要真凭文学价值来为「《圣经》值得推崇」辩解,你得先对候选书籍进行一次中立的阅读,直到找出文学价值最高的那一本。知名度是挑选候选书籍的一个合理标准,因此,我想你最终会选到莎士比亚的作品、《圣经》和《哥德尔、埃舍尔、巴赫》。(否则,从数百万本书中恰好找到《圣经》作为候选,未免太巧了。)真正的难点在于「中立阅读」的部分,如果你不是基督徒,这还简单些,但如果你是基督徒……
但显然,这种事并没有发生过。搜索从未发生。将「文学价值」这一辩解强加在「我❤《圣经》」这个既定结论之上,实际上是在歪曲这一结论真实形成过程的历史,就像挂羊头卖狗肉一样。这根本不是结论最初的来源,也完全不是最初得出这个结论的真实经过。
如果你是真心实意地让你的结论接受有可能将其推翻的批评——如果这种批评确实具备如此力量——那这的确能改变你结论背后的「真正逻辑」。这会改变你的结论在不同可能性世界中的依赖关系,从而改变其适用范围或可靠性。但事实上,人们往往会高估自己真正改变自己的想法的可能性。
既然有这多人思想开放,你早该认为会有更多信念更新的案例。
让我猜猜:是的,你承认自己最初决定买那台价值百万美元的笔记本电脑,是因为觉得「哇,好闪亮」。是的,你也承认,这个决策过程跟你声称的目标完全不搭。但随后,你告诉自己,为了让更多人拥有自己的笔记本电脑,你确实应该这样花钱。然而,你偏偏找不到比买一台镶满钻石的百万美元笔记本更高效的方法,毕竟,你在给笔记本电脑商店注入资金,还能刺激经济!真是绝了!
朋友,我对这个惊人的巧合实在是大为怀疑。我非常怀疑,在这个理性又利他的标准 X 下,最佳答案居然恰好是从另一个毫不相关、站不住脚的过程 Y 里蹦出来的。如果你觉得掷骰子不大可能得出正确答案,那从其他非理性思维里冒出来的可能性又有多大呢?
你用了错误的推理,却没有犯下任何错误,这不太可能。
那是你拒绝的真正原因吗?
原文:https://www.readthesequences.com/Is-That-Your-True-Rejection
常有人会遇到我的一些超人类主义观点——比如超级智能和友好人工智能——这些观点和我关于人类理性的观点不同,听起来新奇、怪异,他们便会拒绝这些观点。
当问及缘由时,常常会听到这样的回答:「我为什么要相信 Yudkowsky (本文作者)说的话?他连博士学位都没有!」
偶尔,还有人听完这类理由后会在旁边补充:「哦,你应该拿个博士学位,这样别人才会听你的。」或者,这个建议可能就是那个一开始就不相信的人提供的:「等你有了博士学位再说吧。」
当然,拿博士学位有或好或坏的理由,但为此获得一个博士学位,绝不是个好理由。
人们对「超人类主义」命题确实产生负面反应的原因有很多,大多数其实是基于模式识别,而非语言思考:这个命题让他们匹配到「怪异的想法」、「科幻」、「末日邪教」或 「狂热的年轻人」。
因此,在感知的瞬间,观点就被拒绝了。如果事后有人问:「为什么拒绝?」,接下来就会进入寻找辩解的过程。但这种寻找未必能触及到「真正的原因」——我在这里说的「真正的原因」,并非指可能提供的最佳理由,而是指在拒绝产生的第一时间,就对历史事实(对观点的拒绝)起决定性作用的因素。
相反,寻找辩解时,他们可能会停留在这样一个看似合理的辩护事实上:「这个讲者没有博士学位。」
但当我谈论人类理性时,我同样也没有博士学位,为什么同样的反对意见没有出现呢?
更重要的是,即便我有博士学位,人们也不会将此视为应该相信我所有言论的决定性因素。相反,出于同样的原因,一开始的拒绝同样会发生;之后,寻找辩解的过程会终止在另一个原因上。
他们可能会说:「我为什么要相信你?你只是个有博士学位的普通人!这种人多了去了。等你成为领域内的知名学者,并在顶尖大学获得终身教职再来吧。」
但人们真的会相信哈佛教授随口说的奇谈怪论吗?当然不会。(不过,如果我真是哈佛的教授,的确会更容易引起媒体的关注。那些一开始就不相信我的记者——他们可能同样不愿意相信随便一个博士学位持有者——仍然会报道我,因为哈佛教授会相信这种奇谈怪论,这本身就成了新闻。)
如果你说的话对外行人听起来是错误的,而且不是随口念出一些装神弄鬼的科幻术语,比如「关于 N+2 维空间中的轻夸克编织」;而听者又是个外行,对你本人和你的领域内容都不熟悉;那么我推测普通人真正开始因学术资历扭转初始负面印象的信任阈值,大约在诺贝尔奖得主级别。简言之,你需要达到被视作「超凡脱俗」的学术资历。
据我所知,这大概就是 Eric Drexler 所经历的情况。他提出了纳米技术的愿景,但人们却说:「技术细节在哪里?」或者「等你拿到博士学位再说!」。于是,Eric Drexler 花了六年时间写出了技术细节,并在 Marvin Minsky 指导下获得了博士学位。《纳米系统》(Nanosystems)是一本很棒的书。然而,那些曾说过「等你有了博士学位再说」的人,是否真的改变了对分子纳米技术的看法呢?据我所知,似乎并没有。
同样,对于机器智能研究所(Machine Intelligence Research Institute,本文作者是该研究所的一名研究员)来说,似乎有一个普遍的规律:无论我们为提高可信度应该做什么,实际上做了之后,情况也没什么变化。「你们有做什么代码开发吗?我不想支持一个不开发代码的组织」 → OpenCog → 什么也没改变。「Eliezer Yudkowsky 缺乏学术背景」→ Professor Ben Goertzel 被任命为研究主任 → 什么也没改变。唯一似乎真的已经提高我们可信度的,还是一些名人和我们组织的关联,比如 Peter Thiel 资助我们,或者 Ray Kurzweil 加入董事会。
这对年轻的企业和刚刚起步的顾问来说,可能是一个重要的启示——潜在客户或投资人告诉你的拒绝理由,可能并不是决定性因素;在付出巨大努力之前,你应该仔细思考这一点。如果潜在投资人说:「如果你的销售增长能再快一点就好了!」或者潜在客户说:「看起来不错,但你们缺少了功能 X」,这可能并不是真正的拒绝理由。即使你解决了这个问题,结果也不一定会有实质性的改变。
这也是在争论中需要牢记的一点。我和 Robin Hanson 有一个共同的信条,那就是两个理性主义者不应该同意存在分歧:他们不应该对认识论上的分歧有共识,除非有什么东西错得非常离谱。
我怀疑,通常而言,如果两个理性主义者决定解决一个分歧,并且这个分歧在初次交流后仍然存在,他们应该预期到,真正的分歧根源要么很难沟通,要么很难暴露。比如:
-
冷门,但坚实的科学理论或数学论证;
-
冗长的推理距离;
-
可能由具象化思维产生的一种难以言表的直觉
-
从某个职业继承的时代思潮(这可能有充分的理由);
-
经验塑造的认知模式;
-
纯粹的思维习惯;
-
对特定结果的情感承诺;
-
害怕承认过往错误;
-
为了维护面子或其他个人利益而进行的深度自我欺骗。
如果所有真正的拒绝理由都能轻易摆上台面,分歧可能会非常简单地解决,以至于不会在初次交流后持续下去。
「这是我拒绝的真正原因吗?」是所有争论者在讨论中都应当问自己的问题,以便让对方更容易理解。然而,据我观察,试图直接、公开地对他人进行心理分析可能会导致交流迅速恶化。
尽管如此——「那是你拒绝的真正原因吗?」对于分歧双方来说,如果有任何建设性的方式来探讨这个子问题,谦虚地提出这个问题应该是合理的。或许规则可以是这样:你可以坦率地问:「这个简单直接的理由是你真正的拒绝吗,还是它来自于直觉 X 或者职业的时代思潮 Y?」而那些更令人难堪、排在表格下方的可能性,则应留给对方的良知,作为他们自己应当承担的责任去处理。
了解偏见可能反而有害
原文:https://www.readthesequences.com/Knowing-About-Biases-Can-Hurt-People
曾经有一次,我试图向母亲解释专家进行判断时的校准问题:「所以,当专家说他们有 99% 的把握时,实际上准确率只有 70% 左右。」话一出口,我突然意识到自己是在和母亲说话,赶紧补充道:「当然,这种怀疑精神要公平运用,包括用来审视自己,而不是只用来反驳你不同意的观点——」
母亲却说:「你没开玩笑吧?那也太棒了!以后我要常常拿这个说事!」
Taber 和 Lodge 在《政治信念评估中的动机性怀疑》中验证了六个猜想:[1]
-
先前态度效应:即使被要求客观,对某个问题态度强烈的人依然会更认可支持自己立场的论点。
-
不确认(disconfirmation)偏见:人们会花更多时间与心力去贬低与自己想法相左的论点,而不是自己所支持的论点。
-
确认偏见:当人们可以自主选择信息来源时,会优先寻找与自己立场一致的信息来源,而非与自身立场相左的来源。
-
态度极化:面对看似平衡的正反论点时,人们原有的立场反而会变得更加极端。
-
态度强度效应:态度越坚定,越容易受上述偏见影响。
-
老练(sophistication)效应:政治知识较为丰富的人,因其更善于反驳不符合自身立场的事实和论据,因此更易受上述偏见影响。
如果一个人本就不理性,知识反倒会害了他。对于真正的贝叶斯主义者来说,信息永远不会产生负面效用。但人类无法完美地实践贝叶斯;稍不留神,我们就会伤到自己。
我曾亲眼见证过,很多人在了解偏见后反倒深受其害。他们获得了更多「弹药」,用以反驳自己不喜欢的观点。这种情况——拥有太多现成的反驳「弹药」——正是 Stanovich 所说的「理性障碍(dysrationalia)」,即那些原本思维敏捷的人反倒变得愚蠢的主要原因之一。
你一定认识这样的人吧?那些明明很聪明,却因过于老练而变得更不理性的人?你觉得仅仅告诉他们一系列经典偏见,就能使得他们成为更好的理性主义者吗?
我还记得,有些人在了解过校准/过度自信问题后不久,就说出了如下一番话:「嗯,你不能相信专家,他们经常出错,这可是有实验证明的。因此,我在预测未来时,更愿意假设事物会沿着历史轨迹发展——」紧接着就陷入一连串纷繁复杂、漏洞频出且令人生疑的推论中。不知为何,当人在相信自己所偏好的结论时,这些偏见和谬误似乎变得不那么凸出了,远不如反驳他人时一般唾手可得。
我给他讲解了不确认偏见和老练效应的问题,果不其然,下次我说了些他不喜欢的话时,他立刻指责我,说我是阅历过深的老练辩手。他没有指出具体是哪句话受到了阅历效应的影响,或是哪一条论据有漏洞,只是摇头叹息,说我显然是在用自己的智慧坑害自己。他又多了一个万能反驳工具。
如果一遇到「老练的辩手」说话不合己意,就立即联想到「老练效应」,那么就连这一概念本身都是致命的。
我努力从自己的错误中吸取教训。上次讲授启发式和偏见时,我先通过合取谬误和代表性启发式(*译注:关于这两种偏见的详情,可参考:繁琐的细节)介绍了基本概念,然后再讲到确认偏见、不确认偏见、老练的论证、动机性怀疑(motivated skepticism)和其他的态度效应。我用接下来的三十分钟,从尽可能多的角度反复强调这一主题。
我想让听众对这个主题感兴趣。简单介绍合取谬误和代表性就能达到目的。但假如他们真的有兴趣了。然后呢?关于偏见的文献大多只是为研究而研究。我必须在那次讲座中严肃警告听众,否则他们可能永远都不会再听这些警告了。
现在,无论是写作还是讲演,我都会确保在谈到校准和过度自信之前,先讨论不确认偏见、动机性怀疑、老练辩手和思维敏捷之人的理性障碍。首先,不伤害!
动机性停止和动机性继续
原文:https://www.readthesequences.com/Motivated-Stopping-And-Motivated-Continuation
虽然我不完全认同快速节俭*派的某些观点——在我看来,他们有点过于乐观,把太多难题美化成了好事——但不可否认,他们往往能在各种决策理论学派中发展出最贴近心理学现实的模型。大多数实验会直接给受试者提供几个选项,让他们做出选择,然后实验结果就这样出来了。然而,节俭派认识到,在现实生活中,选项不是现成的,你得自己去创造,并且他们对此展开了研究。(*译注:Fast-and-Fruga 是一个心理学和决策科学领域的概念。这个概念的支持者认为,决策者可以通过少量关键信息(而非全面分析所有数据)快速做出高质量决策。「节俭」体现在减少信息搜索成本,而「快速」则源于简化的决策流程。)
同样,虽然很多实验会把证据直接送到面前,但在现实生活中,你必须自己收集证据,且过程往往耗时费力;你需要在某个时点判断是否已经掌握了足够的信息,可以停止搜集并做出选择。在买房的时候,你不可能正好有十套房子摆在面前可供挑选,也不会有人带着你把所有房子都看一遍再让你决定。你会先看一套房,再看一套,比较一下,调整自己的期待——重新评估离工作地点近到底有多重要,以及你究竟愿意花多少钱;你会决定接下来要看哪套房子;最终,在某个时刻,你会觉得房子看得差不多了,并做出选择。
Gilovich 对于动机性怀疑和动机性轻信的区分,揭示了一个的现象:人们对自己不想相信的结论会设更高的标准,而对自己想相信的结论则宽松许多。动机性怀疑者会问:「证据是否迫使我接受这个结论?」而动机性轻信者则会问:「证据是否允许我接受这个结论?」
我认为,在贴近心理现实的搜索过程中,存在着一种类似的偏见,我称之为动机性停止和动机性继续:当我们对选择当前「最佳」选项抱有潜在动机时,这种潜在动机会驱使我们停止搜索、做出选择,并拒绝考虑其他选项;当我们对否定当前最佳选项抱有潜在动机时,这种潜在动机则会促使我们不着急下结论,等着收集更多证据,再多想出些选项——总之,找点什么事做,而不是现在得出结果。
统计学史上有一个著名的丑闻,恰好展示了这种偏见。该领域的著名奠基人 R. A. Fisher 坚称吸烟与肺癌之间没有因果关系。他在国会作证时声称:「相关性不等于因果性。」他甚至推测,可能存在某种基因,使得携带者既倾向于吸烟,又容易患上肺癌。
Fisher 受雇于烟草公司担任顾问,这可能给了他一个潜在动机,促使他断定现有证据不足以得出结论,认为最好继续寻找更多证据。值得一提的是,Fisher 本人也是个烟民,并于 1962 年因结肠癌去世。
(针对个人的题外话:Fisher 是频率学派的支持者。相比之下,贝叶斯学派在推断可能的因果关系时更为理性。)
就像其他形式的动机性怀疑一样,动机性继续也可能伪装成理性美德。有谁会反对收集更多证据呢?我就会。证据往往代价高昂,更糟糕的是,耗时漫长,拒绝整合现有证据绝对算不上什么美德。你总是可以在日后改变主意。(这里看似有矛盾之处,可以如下解释:花一小时讨论问题,同时保持思想开放、不预设任何结论,这与等待一项耗资 2000 万美元、为期十年的研究完全是两码事。)
至于动机性停止,它出现在人们害怕第三种选择的地方,出现在你有一个论点,但不愿面对显而易见的反驳的地方;诸如此类,还有很多其他地方。当你追求一种行动方案,仅仅是因为采取行动就让你感觉良好,你就可能不愿核查这个计划实际效果如何,因为你害怕破坏你花大价钱买来的道德满足感。当你的信念与预期不一致时,你就有理由害怕收集任何新证据,这时动机性停止也会出现。
这里的启示在于,停止搜索信息这一决定(无论是暂时性还是永久性),就像搜索过程本身一样,会受到偏见和潜在动机的影响。当你停止搜索时,如果感到结论很舒心,但还有很多唾手可得的信息没有收集,就应该怀疑自己是不是在动机性停止——像是你还没有浏览的网站,一些你能想到的反驳观点的反驳观点,以及你还没闭眼计时五分钟琢磨出来的更好的办法。反之,如果证据的指向与你的期望不符,而你坚持认为还需要更多证据——尤其是哪些贵得要命、短期内根本无法获得,而不是三十分钟谷歌就能搜到的东西——以此拖着不做决定,你就该怀疑自己是否在动机性继续了。
关于谎言和黑天鹅事件
原文:https://www.readthesequences.com/Of-Lies-And-Black-Swan-Blowups
Marcus Einfeld 法官,70 岁,自 1977 年以来担任御用大律师,1997 年被评为澳大利亚的国宝级人物,2002 年获得联合国和平奖,曾是澳大利亚人权和平等机会委员会的创始主席。几年前退休,但仍常被召回审理重要案件……
…却因一系列伪证和谎言[入狱](https://en.wikipedia.org/wiki/Marcus Einfeld#Criminal_conviction)两年,而这一切始于一张超速 6 英里每小时的 36 英镑罚单。
有一种理论听起来似乎格外崇高,它声称诚实的人不擅长说谎,谎言总会在某处留下千丝万缕的痕迹,最终整个骗局会像黑天鹅事件一样戏剧性地崩塌。事实上,现实生活中确实存在一些印证这一理论的例子。然而,我们之所以听说这种情况,很可能是因为相关报道存在明显的选择性偏差。
以一当千的论证谬误
原文:https://www.readthesequences.com/One-Argument-Against-An-Army
我之前曾谈到这样一种推理方式——因其不允许哪怕一丁点反面论据存在,结果就是必须设法否认一切对己不利的观点。在这里,我要指出,当人们遇到反对意见时,往往会通过反复强调已知的支持论据,以避免动摇自己的信心。
自由邦正在讨论其邻国,西尔瓦尼亚,是否应对近期多次陨石袭城事件负责。有几条证据指向这种可能:遭受陨石袭击的城市都临近西尔瓦尼亚边境;陨石坠落前,西尔瓦尼亚的股市曾出现过异常波动;还有人曾听见西尔瓦尼亚大使 Trentino 低声呢喃「上天的惩罚」。
有人跟你说:「我觉得希尔瓦尼亚跟陨石撞击事件没关系。他们每年和我们有几十亿第纳尔的贸易额呢。」你回答道:「可是,陨石落下的城市都离希尔瓦尼亚很近,他们的股市也出现了可疑的波动,而且事后他们的大使还提到了什么『上天的惩罚』。」因为这三条论据比第一条更具说服力,你仍然认为希尔瓦尼亚脱不了干系——就定性的角度来说,你相信他们有罪,而非无罪。显然,证据的天平对希尔瓦尼亚不利。
然后又有人过来和你说:「我觉得西尔瓦尼亚跟陨石撞击事件没关系。操控小行星撞击地球太难了,西尔瓦尼亚甚至连个太空项目都没有。」你反驳道:「可是陨石落下的地方都离西尔瓦尼亚很近,他们的投资者也知道这一点,他们的大使也亲口承认了!」同样,这三个论据比第一个论据更具说服力(三比一),所以你还是相信西尔瓦尼亚难辞其咎。
事实上,你的信念变得更加坚定了。到目前为止,你已独立评估过两次证据权重,全都以 3 比 1 的比例指向西尔瓦尼亚有罪。
你与更多亲西尔瓦尼亚派的叛徒们争辩——一次又一次,成百上千次——每一次,新的论据都被以 3 比 1 的优势轻松驳倒。每一次,你都根据证据的比重调整了自己的先验判断,并愈发确信西瓦尼亚确实难辞其咎。
这种做法显然是有问题的。重复自己已知的论点,实际上是在重复计算证据。即便你是把所有证据都重复计算了一遍,那也依然是滔天大错。(想象一下,一位科学家用 50 名受试者做实验,没能得到具有统计学意义的结果,于是把所有数据重复计算了两遍。)
而选择性地只重复计算部分证据就纯属扯淡了。这让我想起儿时看过的一幅漫画,一个坏人是这样分赃的:「一份给你,一份给我。一份给你,一二份给我。一份给你,一二三份给我。」
我在上一篇文章中强调过,对理性主义者来说,即便是深信不疑且确实正确的信念,在权衡过所有证据后,有时也需降低对其确信的程度。诚然,整体证据可能仍然支持你所珍视的信念,但你依然必须把概率往下调——没错,往下。从你听到反面证据之前的水平往下调。反复强调已知的支持论据没有意义,因为你之前已经把这些都考虑在内了。
然而,在我看来,当人们面对一个新的反驳论点时,总是会本能地寻找理由维持自己原有的信心水平,这时他们往往就会使用自己已知的支持论据。我自己也得时刻警醒,避免犯同样的错误!这种反应就像用手边的盾牌格挡剑击一样自然而然。
只要巧用谬误,即便只有少许支持——哪怕只有一条论据——也能以一当千,抵挡住千军万马的反论。
合理化
原文:https://www.readthesequences.com/Rationalization
在《结论从何而来》一文中,我提出了「两盒一钻」困境:有两个盒子,其中一个装有钻石;有各种迹象和征兆可用于判断钻石在哪个盒子。我将人分为两类:好奇的探究者和能言善道的说客。好奇的探究者会记录下所有迹象和征兆,经过分析后得出结论:「因此,我估计 B 盒里有钻石的概率是 85%。」而能言善道的说客则为出价最高的人服务,他们会先写下「因此,钻石在盒子 B 里」,然后再挑选有利的迹象和征兆来支持这个结论。
第一种做法是理性。第二种做法通常被称为「合理化」。
「合理化」,多么奇怪的说法。我认为这纯属 用词不当。你不能把本来就不合理的东西「合理化」。这就好比把「说谎」称为「真实化」一样荒谬。
从纯粹的计算角度来看,以下两种方法之间存在着相当大的差异:
-
从证据出发,通过概率推演,最终得出一个可能的结论。(先记录所有的迹象和征兆,然后正向推导,根据这些迹象和征兆计算出最终概率。)
-
从结论出发,通过概率推演,筛选出明显支持该结论的证据。(先确定最终结论,然后反向推导,选择性列举支持该结论的迹象和征兆。)
究竟是哪个糊涂虫发明了「理性」和「合理化」这两个词,如此相似,却被用来描述两种截然不同心理过程?我更倾向于使用能够凸显算法差异的术语,比如「理性」和「巨大的认知黑洞」。
并非所有的改变都是进步,但所有的进步必然涉及改变。为一个既定观点做辩护是无法更加接近真相的;你也许能说服更多人相信它,但这并不会使它更加真实。要想改进信念,就必须改变信念。我们行使理性,是为了改变自身信念,使之更加准确。而合理化是为了固守既有信念;从实际效果和其反向算法来看,称其为「反理性」才更贴切。
「理性」属于正向思维过程:收集证据,权衡证据,最终得出结论。如前文所述,好奇心的探究者会采用如下正向思维算法:先收集证据,记录所有可观察到的迹象和征兆,然后正向推演,最终得出一个此前未知的概率,即盒内是否有钻石。在整个理性推理的过程中,探究者并不知道最终会得出什么结论,这正是他们保持好奇的原因。在贝叶斯方法中,先验概率等于后验概率的期望值:如果你事先就知道会得出什么结论,那你的推理实际上已经结束了。
「合理化」属于逆向思维过程,从结论出发进行反推,选择性寻找证据。你先是确定了一个固定不变的结论,之后推理的目的是为了找出有利论据,用以支持这个结论。在这个过程中,未知变量并非结论,而是用来支持结论的有利论据。
我担心传统理性主义没能让其追随者真正理解正逆向思维之间的差别。在传统理性主义看来,科学家提出一个心仪的假说,然后着手寻找实验将其证实,这并没有什么不妥。传统理性主义者会赞许道:「正是这种对自己理论的自豪感推动了科学的进步。」诚然,这确实是推动科学进步的动力。毕竟,与找到一个完全中立的人相比,找到两个立场相反的控辩双方要更容易。
然而,人人都在做的事,不一定就是对的。更好的做法是,科学家在有了心仪的假说之后,能够出于纯粹的好奇心,对假说进行检验——设计实验,推动信念走向未知的方向。
在真心不知结论为何的情况下,你很可能会对此充满好奇。好奇心是第一美德;没了好奇心,你的探究将漫无目的,探索的技能也会失去方向。
感受思维原力的流动,并确保它不是在逆流。(*译注:原文为 flow of the Force,星战梗)
结论从何而来
(*译注:原文为 “The Bottom Line”,在英语中具有「最终的决定或立场」与「最关键的事实」的双重含义,也可字面理解为「写在纸上的最后一行字」)\n原文:https://www.readthesequences.com/The-Bottom-Line
有两个密封的盒子正在拍卖,一个是 A 盒,一个是 B 盒。这两个盒子之中,有且只有一个装着一颗价值不菲的钻石。有各式各样的迹象和征兆可以判断盒内是否装有钻石,但在我所知道的线索之中,没有哪一个是完全可靠的。比如说,其中一个盒子上盖着蓝色的印章,而我知道装钻石的盒子比空盒子更可能带有蓝色印章。或者其中一个盒子表面发亮,而我怀疑——但不太确定——装钻石的盒子是不会发亮的。
现在,假设有一位能言善辩的说客,手里拿着一张纸,对 A 盒和 B 盒的主人说:「为我的服务出价吧!谁的出价高,我就说谁的盒子里有钻石;如此一来,盒子就能卖个好价钱。」于是两位盒主开始竞价。最终,B 盒主人以更高的价格赢得了这位说客的服务。
这位说客开始整理思路。首先,说客在纸的最后一行写下「因此,钻石一定在 B 盒里!」。然后,说客开始从纸的第一行开始写:「B 盒上有蓝色印章」,「A 盒在发亮」,「B 盒比 A 盒轻」,诸如此类地列举了许多迹象和征兆,但有意忽略了所有对 A 盒有利的迹象。之后,说客来到我面前,照着纸上的内容念道:「B 盒上有蓝色印章,A 盒在发亮」,等等,最后以「因此,钻石一定在 B 盒内」作结。
但是请仔细想想:当这位说客写下结论的那一刻,当墨水落在纸张上的那一瞬间,墨迹与盒子之间的证据关联就已经确定了。
不妨设想一系列平行世界——可以是 Everett 分支,也可以是 Tegmark 副本(*译注:两者均为理论物理学上多重宇宙/平行世界的假说。)——在这些世界中,钻石出现在 A 盒或 B 盒内的频率客观存在。同样,在「A 盒发亮的世界」这一平行世界子集中,钻石出现在盒 B 内的频率也是客观存在的;在「A 盒发亮且 B 盒盖有蓝色印章的世界」这个更小的平行世界的子集中,钻石出现在 B 盒内的频率同样客观存在 。
纸上的墨迹勾勒出奇特的轮廓和弯曲的线条,看起来就像是写着:「因此,钻石一定在 B 盒里!」如果你恰好懂中文,可能就会被迷惑,认为这些墨迹的形状在某种程度上暗示了 B 盒内有钻石。一边要求受试者说出印刷图片的颜色,一边给他们看写着「Green」(绿色)的图片,往往会使得受试者脱口而出「绿色」而非「红色」。在这种情况下,不识字反倒能避免被墨迹的形状所误导。(*译注:出自斯特鲁普颜色与文字实验。将受试者看到一个表示颜色的词(如「蓝」「绿」「红」),如果这个词是用与其词义不符的颜色书写(如用绿色墨水写着「红」),相较于词义与其书写颜色一致的情况,受试者必须花更长的时间辨识文字本身的颜色,且更容易出错。详见:https://en.wikipedia.org/wiki/Stroop_effect)
对我们来说,事物的真正意义在于它与其他事物之间的关联性。不妨再次设想那一系列平行世界的集合,Everett 分支也好,Tegmark 副本也罢。假设,在某一时刻——同一时刻——所有这些平行世界中,这些说客们在各自的纸张的末尾写下了结论。墨迹与盒子之间的关联在那一刻便已固定。说客们使用的是不可擦的笔。墨迹不会消退,盒子也不会变化。在那些墨迹显示「因此,钻石一定在 B 盒里!」的平行世界子集中,已经有一定比例的世界,钻石其实在 A 盒内。无论在末尾的空白处写下什么,这一既定事实都不会改变。
墨迹所呈现的证据关联已经确立,至于其含义,我留给诸位自行判断。也许有底气的盒主更倾向于聘请广告商;也许心虚的盒主会愿意出更高的价格。如果盒主自己都不理解盒子上显现的征兆和预示,那么这些墨迹便与盒子的内容物毫无关联,尽管其或许能反应盒主的财务状况和竞价习惯。
现在,假设在场还有另一个人,真心好奇到底哪个盒子里有钻石。这个人首先在纸上记下了两个盒子的所有可区别特征,然后运用自己的知识和概率法则,最终在纸的最下方写道:「因此,我估计 B 盒内有钻石的概率为 85%。」 这份笔记又能证明什么呢?当我开始追溯使得墨水如此在纸张上书写的因果链时,发现这条因果链贯穿了盒子的所有迹象和特征,并与其紧密相关;在不同的平行世界里,根据盒子特征不同,写在纸上的最终概率也会随之变化。
这位好奇的探索者所写下的字迹,与盒子所表现的迹象、征兆及盒中之物紧密关联;而说客的笔迹只能说明谁出价更高。愚昧之人可能会认为这些墨迹组成的词语读起来相似,但其含义实则有天壤之别。
作为理性主义者,其理性思考能力的高低便取决于此:到底是哪一种算法书写了你思维的最终结论。你的车在刹车时发出了金属摩擦声,但你不愿承担更换刹车的费用。你可以找各种理由,说服自己还没必要修车。但对于多个 Everett 分支或 Tagmark 世界,你最终存活下来的平行世界,其实际占比——我们以此衡量你作为理性主义者的能力高低——取决于该算法;它决定了你要为哪一种结论寻找论据。在这个例子中,实际起作用的算法是「永远不修理昂贵物品」。这个算法好就好,差就差。无论之后在这最后一行结论上方增添多少论据,都不会发生任何改变。
此文旨在提醒读者注意审视自己的思维过程,而非提供一个用于随意否定异见的万能论据。如果一心只想维持原有立场,声称「对方精通诡辩」的确是个巧妙的托词。然而,即便是世界上最能言善道的说客,也可以声称太阳正在发光,而那时也确是白天。
逐步自我更新
原文:https://www.readthesequences.com/Update-Yourself-Incrementally
政治是思维的杀手。辩论即为战争,论点皆为士兵。人们常常受到诱惑,想让所有的实验结果都能被解读为是在印证自己所支持的理论,就像是在确保一座堡垒能抵御所有可能的进攻路线。这是不可行的。在数学上也是不可能的。每一个由证据推导出来的预期,都存在一个相等且相反的反证预期。
但是,如果你所珍视的信念没有得到完美的辩护,那也没关系。假设投掷硬币在 95% 的情况下都是正面,那么 20 次中,你会有 1 次看到相反的证据。这没关系,也很正常,甚至是意料之中的,只要你有 19 个支持的观察结果来对应 1 个相反的结果。一个概率模型可以承受一两次冲击而不垮,前提是这些冲击不会持续不断地出现。
然而,人们普遍认为——尤其是在舆论场上——正论之下决不存在反例,而谬论不可能言中哪怕一例。
你会发现,有些人会仅凭一例他们认为可信的证据,就开始声称自己的理论可以对其作出「解释」,仿佛这就足以支撑整个理论了。显然,如果一个理论是错的,那就不可能受到任何证据支持,也无法解释哪怕一例事件。因此,要使一个理论成立,一条确定的证据便足以。
用一条概率性的反对论据否定一整个理论也几乎同样愚蠢,仿佛正确的理论就不可能存在哪怕一丁点反论。然而,千百年来,人类一直如此争论,企图驳倒所有反对论据,同时否认反方的论点有哪怕一丝道理。人们总是希望辩论能一边倒,习惯于自己所偏好的理论完全没有反对声音的世界。因此,允许哪怕一条概率性反论据的存在,对他们来说就是世界末日。
我知道听众里肯定有人会说:「但要想在现实世界中赢得辩论,那就一步都不能退让!如果承认反方论据的确存在,对手就会抓住这一点死咬不放——怎么能给对手留这种机会!你会输的!还有什么能比这还恐怖?」
随便吧。理性不是为了赢得辩论,而是为了决定支持哪一方。如果你已经决定要为哪一方辩护,那么在你的内心,理性的使命已经完成了——无论这使命完成的是好是坏。但是要如何决定要为哪一方辩护呢?如果站错边是一种发自本能的恐惧,哪怕只有一点点,那你最好把所有的证据都好好权衡整理。
行使理性不似行走,更像舞蹈。在这支舞中,每一步都要恰到好处,不能左右偏移。每遇到一丝支持的证据,信念就增强一分;每遇到一丝相反的证据,信念就减弱一分。是的,减弱。即使模型正确,只要不是绝对精密,你的信念有时也需向下修正。
如果碰巧有一两例个案与你的信念相悖,也不必惊慌。对于非精密理论(*译注:此处「精密」和「非精密」的说法来源于精密科学和非精密科学。)而言,概率性证据有时就是如此。(但要是一个精密理论下出现反例,那就是真的有麻烦了!)你只需稍稍减弱自己的信念强度——可以是概率值,可以是赔率,甚至只是内心一种非语言的确信程度。降低一点点就好,然后静待更多证据的出现。如果你的理论没错,支持的证据很快就会接踵而至,令概率重新走高。而如果这个理论错了,那你本就不该坚持。
非黑即白的定性思维有个弊端:任何与已有理论相悖的个案,都会让人深感认知失调,只好绞尽脑汁去解释。这种容不得一点反例的思维方式,注定无法实现渐进的认知进步,也难以客观地综合所有证据。而如果我们以概率的定量思维看问题,就会明白:一个正确的理论,总能获得比反例更多的证据支持。这时,面对不利证据,你就可以从容地对自己说:「出现了轻微的反面证据,我得将自己的信念适度调低。」。是的,调低。这不会全盘推翻你所珍视的理论——这属于定性思维。思考时,要使用定量思维。
每一例证据的预期,都会存在一力度相等、方向相反的反证预期。每当事件发生,你在根据预期调整信念强度时,其向上和向下的幅度必须是对等的。如果你认为自己已经能预料到会出现什么证据,那就说明你对自己的理论已经十分确信——概率接近 1——这就几乎没有上升空间了。另一方面,正因为你预期遭遇反面证据的可能性很小,因此,反证一旦出现,其下调幅度必须足够大,才能精准平衡另一面预期的增益。(*译注:就是说如果你对一件事的判断非常确定,最后却发现判断错了,那么这件事应极大冲击你之前作出错误判断时所使用的依据。数学上的证明可参考:https://hpmor.xyz/ai2zb_28/)你所预期的后验概率的加权平均值必须等于先验概率。
你都愿意花时间研究一件事了,却还在害怕把概率调低,这不是很荒谬吗?毕竟平均来说,每次观察都有可能导致对等幅度的信念上升或下降。
有时,反对的证据或许会接连不断地出现,支持的论据却迟迟不露端倪。你会发现自己的信念逐步动摇,不断削弱。终于,你总算意识到,证据的风向已与你背道而驰。在顿悟的这一刻,任何借口都已毫无意义。因为在这一刻,你已经放下了自己所珍视的信念。值得庆祝!快开瓶香槟,叫个披萨吧!毕竟,一直固守最初的信念,你就永远不可能变得更强大。
什么是证据筛选?
原文:https://www.readthesequences.com/What-Evidence-Filtered-Evidence
我曾讨论过这样一个困境:一位能言善道的说客,受雇向你兜售一个盒子;盒中可能有钻石,也可能是空的。这位说客指出,盒子上印有蓝色印章,而根据已知事实,装有钻石的盒子比空盒子更可能带有蓝色印章。从贝叶斯理论的角度来看,此刻你会如何反应?你是否一定要如说客所愿,无奈地以此调整自己的概率判断?
若能亲自检查盒子,自然可以自行评估所有线索。但如果你无法亲自检查呢?倘若你唯一能得到的证据只有来自说客的只言片语——受法律约束只能陈述真相,却又不将一切和盘托出——你又当作何反应?这位说客提出的每一条论据都确实构成了有效证据——你怎能无动于衷,不去调整自己相应的概率判断?在特定比例的 Everett 分支或 Tagmark 世界的平行宇宙中,带蓝色印章的 B 盒内确实存在钻石——这一事实难道就不成立了吗?根据 Jaynes 的观点,贝叶斯主义者必须始终根据所有已知证据作出判断,否则就会自相矛盾。但这样一来,只要有足够多的线索可供选择性报告,这位说客就能诱导你相信他们希望你相信的任何事。这听起来似乎不太对劲。
一个更简单的例子:一枚有偏差的硬币,要么偏向正面(正面概率 2/3,反面概率 1/3),要么偏向反面(正面概率 1/3,反面概率 2/3)。这两种情况的先验概率相等。每观察到一次正面,就有 1 比特的证据支持硬币偏向正面;每观察到一次反面,就有 1 比特的证据支持硬币偏向反面。假设我抛了这枚硬币十次,然后告诉你:「第 4 次、第 6 次和第 9 次都是正面。」现在,你认为这枚硬币偏向正面的后验概率是多少?
答案是,这个概率几乎可以是任何值,完全取决于我话语背后的因果动机——也就是说,我在报告时筛选抛掷结果的方式。
-
我或许是在按这样一种规则行事:只报告第 4、6、9 次抛掷结果,无论其他抛掷的结果如何。假设你知道了我所采用的报告规则,就能得出后验概率比为 8:1,即硬币偏向正面的可能性是偏向反面的 8 倍。
-
我可能是在报告所有正面朝上的结果,且只报告正面。在这种情况下,你能就此推断出其他 7 次均为反面朝上,后验概率因此变成 1:16,即硬币偏向正面的可能性仅为偏向反面的 1/16。
-
我也可能事先决定,只有当硬币偏向正面的概率超过 98% 时,才报告第 4、6、9 次的结果。诸如此类。
再来看看 Monty Hall 问题:
你参加一个游戏节目,面前有三扇门,分别通向三个房间。已知其中一个房间里有 10 万美元大奖,而另外两个房间则是空的。主持人请你选一扇门,你选了 1 号门。接着主持人打开了 2 号门,展示里面空无一物。现在你是否要改选 3 号门,还是坚持最初的 1 号门呢?
答案取决于主持人的行为规则。如果主持人每次都会打开一扇门,而且总是选择一扇通向空房间的门,那么你应该换到 3 号门。如果无论门后是什么,主持人都会打开 2 号门,那么 1 号门和 3 号门各有 50% 的机会藏有奖金。如果主持人只在你最初选中了有奖金的门时才会打开另一扇门,那么你绝对应该坚持 1 号门不变。
在做判断时,你不应该仅仅考虑 「2 号门为空」这一事实,还得考虑「主持人选择打开 2 号门」这一行为。许多人之所以对经典的 Monty Hall 问题感到困惑,是因为他们在更新自己的概率判断时,只考虑到了 「2 号门为空」;单看这一条,1 号门和 3 号门确实各有 50% 的机会藏有奖金。这就是为什么,贝叶斯学派强调,我们必须根据所有已知信息来进行条件概率推理,否则就可能陷入自相矛盾。
当有人说出「第四次抛掷结果为正面」时,我们要考虑的并非「第四次抛掷结果为正面」这一事实本身。如果我们想从所有可能性的平行宇宙中找出自己所身处的宇宙,使用的筛选条件并非「硬币的第四次抛掷结果为正面」,而是「有一位遵循特定发言规则的发言人,说出了『第四次抛掷结果为正面』这句话」。说出的话语本身不等同于事实;不要被词语的字面意思所误导。
大多数法律程序都基于这样一种理论:每一个案件有且仅有双方对立,以及找两个各有偏见的人比找一个完全中立的人更容易。对于任意一项证据,控辩双方总有一方会有动机提出,如此法庭便能看到案件的全貌,这就是该理论的核心。在前文「两盒一钻」的困境中,如果能有两位能言善辩的说客各站一方,虽不如一位好奇的探索者那么理想,但效果也算是接近了。然而,这仅适用于只存在两个盒子的情况。现实中的问题往往涉及多方利益,矛盾错综复杂,答案也非昭然若揭,不是靠着对立双方彼此争吵叫嚣就能轻易解决的。
务必小心,千万不要滥用「证据筛选」这一概念,将其变成一个万能论据,用来排除所有不合己意的证据,比如说:「这个论点经过筛选,所以我可以置之不理。」如果某个反论令你感到不快,这恰恰说明你对该问题很熟悉,而且关心到足以站边。你可能已经了解过自己这一方最有力的论据。你不能从某一反论中凭空推断出有自己尚未发现的新的有利证据存在。(*译注:就是说你不能用「反方肯定筛选掉了对我有利的新证据」这种想法,来自我安慰或逃避反方的论证)因此,你只能面对这些令人不适的事实本身——B 盒上的蓝色印章依然是不可忽视的证据。
但是,如果你是首次听到某个论点,而且只听过一方的说法,那么你确实应该保持警惕!从某种意义上说,没有人会真正信服自然选择理论,除非他们先花五分钟时间听听神创论者的观点;之后他们就知道自然选择理论有多坚实了。
谨防它山之石
Beware of Other-Optimizing - LessWrong
我注意到一个严重的问题:有抱负的理性主义者极大地高估了他们优化他人生活的能力。对于这个问题是如何产生的,我想我有些见解。
你读了 19 个不同的提供个人改善建议的网页——关于提高生产力、减肥、省钱。每个作者似乎都很聪明,对自己的方法充满热情,他们讲述了这个方法对他们的作用,并承诺会有惊人的效果......
但大多数建议听起来就大错特错,几乎不值得考虑。所以你叹了口气,痛定思痛,沉思着:一件事情再愚蠢,人们似乎都能对其产生疯狂、幼稚的热情。4 号和 15 号建议听起来很有趣,你也尝试了一下,但是......它们也不......怎么......样嘛,它失败得很惨。建议本身有问题,或者你有问题,无论如何,你都没有任何进步。
然后你读了第 20 条建议——更有甚者,你自己发现了没有任何网页提到过的第 20 个方法——好耶!这次的建议确实有效。
很久很久以后,你终于发现了真正的、正确的、切实有效的方法。当别人遇到同样的问题时,你可以为他们省去阅读 19 条无用建议的麻烦,直接给出正确答案。作为一个有抱负的理性主义者,你已经知道大多数人都不会听,你通常也不理会这一点——但这个人是你的朋友,你认识的人,你信任并重视他会听从。
因此,你会像同志一样把手放在他们的肩膀上,直视他们的眼睛,告诉他们如何去做。
我有过很多次这样的亲身经历。因为,你瞧,当你发现了真正有效的方法......嗯,你现在已经知道最好不要立马跑去告诉你的朋友和家人。但你必须试着告诉 Eliezer Yudkowsky。他需要它,而且极有可能他能理解。
事实上,我确实花了一些时间才明白。其中一个关键事件是,「不具名研究所」董事会的某个人告诉我,我不需要加薪就能跟上通货膨胀——因为如果我使用在线优惠券服务,我在食物上的花费会大大减少。我对此深信不疑,因为这个朋友我很信任,况且他说这话的时候信誓旦旦。于是我的女朋友开始尝试使用这项服务,没几个星期,她放弃了。
问题就出在:如果我是在某个博客上看到完全一样的使用优惠券的建议,我可能甚至都不会留意它,只是瞥一眼就过去了。即使它是由 Scott Aaronson 或一些众所周知的聪明人写的,我依然只会读一下就过去。但是由于它是一个我认识的朋友当面告诉我的,我的大脑便对其区别对待,重视有加——就好像我被告知了一个秘诀;当时的语气也的确如此。后来,我才反应过来,这仅仅是个个人建议,不然就是来自某篇博文;对我来说,这并不比任何其他聪明人写的生产力博文更加可行或更不可行。
而且,因为我遇到过很多试图优化我的人,我可以证明,我得到的建议和从生产力博客圈得到的一样广泛。但是其他人没有意识到,存在如此过量的生产力建议表明人们在哪些建议对他们有用这方面是多样化的。相反,他们看到很多明显错误的差劲建议。然后他们终于发现了正确的方法——不像其他那些不起作用的博客文章,而是有效的方法——然后,常见的情况是,他们决定用它来优化 Eliezer Yudkowsky。
不要误会我的意思。有时候建议是有帮助的,有时候它会起作用。比如「和 Bruce 一起被困在中间」——引起了我的共鸣。它可能是迄今为止我在新的 Less Wrong 上读到的最有帮助的东西,尽管这一点还有待确定。
只是,你真诚的个人建议,你发现的那个确实有用的绝佳办法,对我来说可能不太起作用。正如你随机读到的一个聪明的作者写的个人改进博客文章,对你也可能不太有用一样。
「不同的办法对不同的人有用」。这句话可能会使你感到不快;它确实给我这种感觉。因为这句话是黑暗面认识论为了躲避批评而使用的工具,其使用方式类似于「不同的人相信不同的事情」(这纯粹是胡说)。
但是,在你掌握近乎普遍适用的规律之前,有时你会发现到头来,你只是在一些表面的技巧上浪费时间,这些技巧对一个人有效,而对另一个人无效,你却不明白这是为什么,因为你不知道决定什么对谁有效的普遍法则。故而,你能做的就是牢记这一点,并愿意接受「不」的答案。
如果你有权力控制他人,你最好愿意接受「不」的答案。一般来说,权力是一种非常危险的东西,它非常容易被滥用,而你却很难意识到你在滥用它。你可以做一些事情来防止自己滥用权力,但你必须真正去做,否则它们就不起作用。OB 上有一个帖子(虽然我现在好像找不到了),讨论了「处于权力地位会降低我们同情和理解他人的能力」的相关证明。我见过一个理性主义者,他认为自己没有权力,所以无需谨慎。当他得知自己可能会令人畏惧时,他感到很惊讶......
如果他们的发现对他们有效,但是需要一点意志力加持,情况就更糟糕了。这时,如果你说他们的办法对你无效,答案清晰显见:你只是懒惰,他们需要对你施加一些压力,让你做正确的事情,他们发现的建议确实有效。
我想,有时人们是会偷懒。但是,在你假设情况如此并对他人行使权力以「让他们行动起来」之前,要非常、非常、非常小心。如果你的老板真的知道你的能力范围在哪里,只会再给你增加一些动力,而不会让你精疲力竭,把你的生活变得极度痛苦——这样的老板才是令人愉快的上司。这种能力是非常罕见的,拥有这种能力的老板千金难求。这是一种大多数人都不具备的高级的人际技巧。我肯定不具备这种能力。不要因为你的意图是好的,就以为你拥有这种技巧。不要因为你遵从「己所不欲,勿施于人」,就以为你拥有这种技巧。不要因为没有人向你抱怨过,就以为你拥有这种技巧。也许他们只是害怕。我说过的那个理性主义者——他不认为自己拥有权力和威胁,尽管对我来说这确实足够明显——他并没有意识到可能有人会害怕他。
即使当你有影响力时也要小心。当你掌握着一个重要的决定、威胁或对方需要的东西时,优化对方的诱惑似乎会一下子变得难以抵挡。
如果你愿意的话,思考一下,Ayn Rand 对客观主义者的整个恐怖统治正好可以从这个角度来看——她发现自己拥有权力和影响力,且无法抵制优化的诱惑。
我们低估了自己和他人之间的距离。不仅仅是推论性距离,还有性情和能力的距离,情况和资源的距离,未言明的知识和不易察觉的技能和运气的距离,内心图景的距离。
即使是我,也经常惊讶地发现,对我很有效的 X,对别人却不适用。但是,由于有这么多人曾试图优化我,当我被反复捶打时,我至少可以认识到这种距离。
也许被推着走对你......是有效的。也许当一个有权控制你的人开始帮助你以正确的方式重组你的生活时,你不会感到反胃。我不知道是什么让你这么做。在意志力、意志薄弱和生产力的领域,就像在其他领域一样,我并不知道深入到几乎可以包容一切的概括法则。我并未掌握「知晓一种技巧什么时候、为什么以及对谁有效或无效」的深刻关键。我所能做的就是当有人告诉我它不起作用时,我愿意接受这样的回答......然后继续寻找在任何地方都适用的更深层次的概括,等待着有一天被发现的支配规则和例外的更深层次的规律。
读书摘要:多生几个孩子的自私理由
原文:Book summary: Selfish Reasons to Have More Kids — LessWrong
2021 年 10 月 8 日
有人向我推荐了 Bryan Caplan 所著的《多生几个孩子的自私理由:为什么做个好父母比你想象的更轻松、更有趣》这本书,称其对育儿问题提供了一个有坚实科学依据的观点。我发现这本书很有价值,以下是我的一些心得体会。
太长不看: 在合理范围内,育儿方式的差异对孩子长期发展没有显著影响。所以放轻松点,也许可以把省下的精力用来多生一个孩子。
本书的核心观点是:
先天禀赋(Nature)>> 后天培养(Nurture)
Caplan 的表述虽然附带了一些限制条件,但行为遗传学一章的结论就是如此。他引用大量双胞胎研究和收养研究,试图回答以下问题:
假设你的各项指标都在量表的第 80 个百分位,并且你的家长收养了一个没有血缘关系的兄弟/姐妹,而你的同卵双胞胎兄弟/姐妹被其他人收养,那么他们的各项指标会处于什么百分位?
结果总结如下:
| 指标 | 收养的兄弟/姐妹的百分位 | 失散多年的同卵双胞胎兄弟/姐妹的百分位 |
| -------------------------------- | ---------------------------- | ------------------------------------------------------------ |
| 预期寿命 | ~50 | 58 |
| 健康(自我感觉) | ~50 | 56-65 |
| 健康(客观测量) | ~50 | 56-65 |
| 牙齿问题 | ~50 | 56-65 |
| 身高(高出平均水平 15.24 厘米) | ~50 | 高出平均水平 12.5 厘米 |
| 体重 (高出平均水平 9 公斤) | ~50 | 高出平均水平 6.8 公斤 |
| 智商(IQ) | 51-55 | 70-80 |
| 其他智力表现 | ~50 | 70+ |
| 幸福感 | ~50 | 67 |
| 教育程度 | 51-55 | 75 |
| 高中成绩 | ~50 | 71 |
| 收入 | 51-55 | 「与异卵双胞胎相比,相似度约为两倍」(符合纯遗传学预期) |
| 尽责性、宜人性 | ~55 | 「异常巨大的影响」 |
| 政治/宗教行为[1] | 56 | (未提供) |
| 政治/宗教标签 | 73 | (未提供) |
| 孝心 | ~60 | (未提供) |
还有一些指标无法简单地归入表格:
-
如果一个孩子的亲生父母没有犯罪记录,但被有犯罪记录的父母收养(相比于被没有犯罪记录的父母收养),这个孩子日后获得犯罪记录的概率会增加 1.2 个百分点(从 13.5% 上升到 14.7%)。
-
关于吸烟、酗酒和吸毒的研究结果不一。有研究显示养育环境对喝酒行为有中等到较大的影响,而另一项研究则显示没有影响。
需要注意的是,真实世界非常复杂,每组实验都有多项研究评估指标,测量的内容略有不同,整个研究领域充满了无法纳入表格的特殊情况和限制条件。比如,将大麻使用与安非他明、可卡因、镇静剂的使用分开研究是否有意义,还是这样做会导致p-hacking(p 值操纵)?再比如,根据亲生父母是否有犯罪记录来对被收养的孩子进行分组研究是否合适?说实话,我也不太确定。现实往往缺乏足够的统计效力。
但关键在于...看看那些后天教养完全失效的领域。其仅有的显著影响体现在:(a)孩子的孝心,以及(b)他们的政治/宗教标签。且这种标签并没有显著影响实际的政治/宗教行为,说白了这基本上只是口头上的敷衍![2]
(注意:以上所有内容都是关于长期影响,即对成年子女的影响。环境可能对智商、收入、犯罪率和性行为有短期影响,但这些影响在 25 岁前几乎完全消失,且对大多数指标来说,消失得更早。)
推论
如果你接受上述表格——几乎所有你在乎的指标基本上都与后天养育无关——那么接下来呢?
- 与其像其他人一样努力成为第 90 百分位的父母,不如偷个懒!做个第 10 百分位的父母吧!甚至第 5 百分位也行!(但别做到第 0 百分位:你得保持在研究范围内,即发达国家的中产阶级家庭。显然,若你虐待子女致其营养不良,他们的身体不会仅仅因为你给了他们优秀的基因就学会如何代谢营养。)
充分利用外卖和电子保姆!如果负担得起,还可以请真正的保姆或育儿嫂!别太担心孩子会出事:如今的孩子比以往任何时候都安全,1 到 24 岁期间因事故或他杀导致的死亡概率每周不到百万分之一!(0 到 1 岁期间的概率确实要高几倍。)接送兴趣班压力太大?直接砍掉孩子不喜欢的项目——短期内你们都会更快乐,而从长期来看,这些活动根本无关紧要!若孩子样样喜欢?照样砍掉一项!你减少焦虑带来的益处,绝对超过砍掉的乐趣。
注意,这里的偷懒建议是基于对长期影响的考虑。粗略来说,你做的事情几乎不会有长期影响。如果偷懒会带来短期影响,让孩子童年不快乐,那显然是有代价的,只有当这样做对你有较大的好处时才可以。孩子的短期幸福重要,但你自己的快乐也很重要!
- 好吧,养育方式对长期影响不大,那到底什么有效呢?基因!优质基因价值连城。你影响孩子基因的最强工具就是选择伴侣。「选择与你理想子女特质相符的配偶」,Caplan 如是说,「理想配偶犹如阿拉丁神灯,能实现你凭己力无法达成的愿望。」
(也许这并不会改变你的目标——我想要的孩子特质与我想要的伴侣特质基本一致,除了性别方面的因素——但明确这种思维框架很有价值。)
其他要点
书中遗传学章节凭借详实科研数据令我折服。其余内容则是一些零散的育儿建议,和我读过的其他育儿书籍类似;但我认为 Caplan 的观点比大多数人更值得关注,因此我会分享一些特别有趣的内容:
- **考虑长远。**提及「养育子女」,多数人只关注前五年或二十年:那些不眠之夜,堪比醉酒的精神耗损。当然其中不乏欢乐,但终究苦乐参半。
但人们可能没有想到之后三十年的回报:见证子女成长,含饴弄孙之乐。
请务必计入这份长期红利!
-
生育科技。 现在有很多技术可以帮助你拥有更多或不同的孩子!我们有:
-
试管婴儿(每周期 $12,000,平均需要 2-4 周期)
-
人工授精($400)
-
代孕($100,000,包括医疗费用等,比试管婴儿多 $20,000)
-
基因筛查(书中未说明,快速搜索大约 $5,000-$10,000)
-
接受捐赠的精子($400)
-
接受捐赠的卵子($400)
-
精子分选($3,000,性别准确率为 75-90%)
(书中还有关于如何拥有孙辈以及你的孩子对世界是否有益的章节,但我觉得这些内容相对常识化,因此不再详细总结。)
结论
这本书对我最有价值的部分就是上面提到的「先天与后天」表格,其中的内容占了 60% 的价值。接下来的 20% 是本帖总结的其余部分。但剩下的 20%——各种特殊情况、引文和关于孙辈的章节——或许值得您亲自翻阅原著!
[1] 我把政治和宗教放在一起讨论,因为它们在 Caplan 引用的研究中表现出完全相同的模式。老实说,这有些诡异,而且……非常有启发性。
[2] 政治党派,至少在美国,似乎是截然对立的;那么,怎么能在不改变一个人态度或行为的情况下,改变他们的标签呢?Caplan 的回答是,因为大多数人对政治的兴趣只是轻度到中度,他们几乎可以同样支持任何一方;或许那些高度活跃的政治参与者会打破这种模式,但他们的数量足够少,因此不会显著改变统计结果。我不确定,这个解释让我不完全满意,但目前我没有更好的解释。
辩论:是否应该获得大学学位?
原文:Debate: Get a college degree?
2024 年 8 月 13 日
认知状态: 战士思维。本文观点并不(必然)是我们真实的辩论立场,而是通过掷硬币选出的。我们在大约 1 小时 45 分钟内为这些立场寻找了最有力的论据。需要说明的是,在这场辩论中,我们体现出的立场和个人观点有时会有所交织。
辩论阵营: Ben 反对获得大学学位,Saul 则支持获得大学学位。(这恰好是 Saul 自己当前面临的现实抉择!)
阅读说明: Ben 和 Saul 是同时起草每轮陈述的。这意味着你所读到的 Ben 的每段陈述,都是在未看过 Saul 接下来的陈述的情况下写出来的。(这一规则不适用于后面的问答环节。)
Saul 的开场陈述
Saul Munn
首先,我认为「获得本科学位是件好事」和「获得典型的本科经历是件好事」这两种观点之间存在本质区别。我认为后者在某些方面比前者更具说服力,但在大多数情况下却不如前者有说服力。
关于「获得典型的本科经历是件好事」这一观点
-
这种现象是一个典型的 Chesterton 栅栏(译者注:即,在你拆掉栅栏之前,首先要理解它为什么在那里。换句话说,如果你不了解栅栏的初衷和功能,那么你不应该贸然拆除它)。尽管本科生的典型体验在不断演变,但人们长期以来一直在经历这种体验。
-
通常来说,维护既有的规范和制度是有益的。
-
我认为,对于一些人而言,如果没有上大学,他们的处境可能会糟糕得多。即使大学实际上变成了一种成人日托中心,我也宁愿他们待在那里,而不是成为社会的负担(比如走上犯罪道路)。
-
大学为许多问题提供了自然而然的解决方案:
-
社会化:
-
有大量结交朋友和潜在伴侣的机会
-
你必须去上课、与人交流等。
-
-
锻炼:
-
通常有免费且功能齐全的健身房
-
你需要步行去教室、食堂等地方。
-
-
有大量机会尝试各种稍微「特别」的新鲜事物——俱乐部、运动、活动、希腊式社团生活、性体验、各种课程等。
-
我认为,如果没有机会尝试这些事情,很多人会发现它们变得更加困难。许多人在上大学之前几乎没有尝试过任何新事物——大学为他们提供了一个简单的机会,在这些体验变得难以接近之前,以最小的阻力去尝试。例如,对于成年人来说,在大多数社交场合中培养一个新爱好可能显得有些奇怪——但在大学里,这就像加入一个社团一样简单。
-
再次强调——虽然所有这些类型的体验在大学之外也是可能的,但它们往往变得更加困难,不符合常规,等等。
-
关于「获得本科学位是好的」这一观点:
-
这是一个强有力的 Chesterton 栅栏。人们获得本科学位——或类似学历——已经有相当长的时间了。
-
对于社会的大多数人来说,这是一个非常容易理解的标志:
-
大多数获得本科学位的人并不是在获得本或我所看到的那种本科学位——我认为大多数是来自大型州立大学,其次是数不胜数的无名学校。
-
对于这些人,以及他们通常寻求的工作,我的猜测是,为了证明一些必要的能力,比如「我能够听从并执行指令,应对一般的官僚体系,在需要时学习新东西,在需要时与人沟通,而且不太可能有严重的心理问题,等等」——本科学位是一个相当好的信号。
-
我猜测问题的一大部分在于,尽管这个容易理解的信号很好,但人们过度依赖它了(而忽视了其他可以证明能力的信号,比如职业学校,或者高中文凭加高 GPA 之类的)。
-
-
可能有一些情况下获得本科学位并不好,但这些情况在本和索尔看来被严重夸大了,实际情况并非如此。此外,社会似乎应该给予那些能够清晰地展示大学学位所代表的基本能力的人更多机会,即使他们没有大学学位——比如高中成绩优异,或者在之前的几份工作中表现出色。
Ben 的开场陈述
Ben Pace
自主决定和掌控自己的人生
我的核心观点是自主决定是好的,而成为一个向你灌输虚假观念并剥夺你权力的腐败体系的一部分是坏的。
我认为你在人生早期的目标应该是在银行账户里攒到约 10 万美元,同时掌握一些能让你独立维持基本生活的技能。
如果你没有足够的钱可以不工作而生活 1-2 年,那么你将永远受制于就业市场,而这个市场中存在许多腐败的现象。
需要警惕的是,学术界充斥着欺诈行为,却几乎不受惩罚,科技界(如加密货币领域)也是如此。其他科技公司(如 OpenAI、优步等)同样存在大量不当行为,政府部门更是如此(在这里可以列举无数涉及民选官员的腐败丑闻,以及你能想象到的最庞大、最糟糕的官僚机构,再加上我在伯克利市政府的亲身经历)。
因此,拥有一个独立于这些机构的生活至关重要——你应该有选择「回归家庭」和「不再参与他们的游戏」的自由。
学术界及其文凭崇拜也是这些机构的一种。这些文凭通常毫无实质意义,它们传递的最大信号不过是你被录取了而已。文学教授写不出好书,哲学系认为在一次性囚徒困境中应该始终选择背叛,人工智能系没有意识到AI可能真的会威胁人类生存,物理学家在弦理论上原地踏步数十年,诸如此类。我最近读到一位诺贝尔物理学奖得主的自述,他说在做出获奖成果之后、但在获得诺贝尔奖之前的大部分职业生涯里,他的所有研究资助申请都遭到了拒绝。而那项最终为他赢得大奖的研究资助,如果放到今天,他认为也会被拒绝。
大学本身几乎不教授任何能够终身受用的技能(可参考 Bryan Caplan 的《教育的浪费》),却在这一点上对学生撒谎。我还记得毕业典礼上,一位身着庄重长袍的人在一座有数百年历史的建筑里,向我们和我们的父母宣称,我们是如何通过牛津教育从孩子成长为成年人的。但老实说,我从他们那里几乎一无所获。我所有的个人成长都来自于参观未来人类研究所(FHI),与 Jacob Lagerros 成为朋友,19 岁时组织有效利他主义全球会议(EAGx),参加认知与理性化中心(CFAR)的课程,结识 Oli Habryka,以及在 LessWrong 网站上工作。相比之下,大学只是让我感到内疚和失败,教给我的东西少之又少。
再者,如果你认同学历至上的观念,那么大多数看重学历的地方往往并非理想的工作环境。你是否考虑过在咨询公司工作?在我看来,那里的人往往缺乏生气,像是在假装懂得如何经营企业。然而,汉森的观点是,咨询公司的主要价值在于让有声望的人为组织急需的显而易见的变革背书。2012 年,他撰写了一篇名为《太多咨询》的博客文章,以下是其中的一段摘录:
我推测,大多数知识分子低估了企业普遍存在的功能失调程度。企业常常存在明显的资源错配问题,公司内部许多人都清楚问题所在及可行的解决方案。主要障碍在于,公司内许多高层人士抵制这些变革,因为他们意识到接受这些解决方案会降低自身地位。
首席执行官通常了解需要采取的措施,但缺乏资源来对抗这个阻力集团。然而,如果一家声誉卓著的外部咨询公司介入,就可能扭转这种局面。阻力集团往往能成功阻挠首席执行官的提议,却难以抵挡一位知名外部顾问的进一步支持。
为了发挥这一作用,管理咨询公司需要拥有金钱能换来的最高声望。他们还需要能够迅速在公司内部走访,倾听各方观点,并判断哪种观点更有说服力。此外,他们还需要相对不受偏见指控的影响——即他们的建议不应受到利益、关系或承诺的左右。
我认为,在大学里能学到的最实用技能当属编程,而这项技能完全可以通过私人辅导和自学来掌握,效果可能还要更胜一筹。我的大学教育主要灌输了许多算法等方面的理论知识,却从未引导我们注册GitHub账号或搭建网站。这些理论知识或许有利于在求职面试中展示自己,但如果你想证明自己的实力,不如直接着手开发有用的产品。
(我承认,对于智力水平比平均值高出约两个标准差的人来说,学习编程确实更为容易。这一点可能会削弱我的论点,但我仍然要强调,如果你的智商在 120 或 130 左右,那么你真的不应该选择上大学。)
支持上大学的一个有力理由是能够结识其他聪明人(比如我遇到了 Jacob Lagerros)。然而,你完全可以不用正式入学就出现在大学校园里。我曾去过斯坦福大学旁听课程、在食堂用餐、在空无一人的音乐厅里练习吉他、在朋友宿舍留宿,还参与过不同大学的学生团体活动。如果你想从大学获得某些特定价值,完全可以免费获取,无需接受那种愚蠢的一揽子交易——放弃自己的生活、上一堆毫无意义的课程,成为一个虚假叙事的一部分。当然,这意味着你可能无法在麦肯锡这样的公司工作。
(在这一点上,我应该指出,我支持获得大学学位的主要理由是为了移民美国或其他国家。不过,让我们暂且把这一点搁置一旁,仅从其他角度来讨论这个问题,比如一个美国公民是否应该获得大学学位。)
我认为,人们选择上大学的首要原因是为了规避风险。就像没有人会因为选择 IBM 的产品而丢掉工作一样,没有人会因为选择上大学,尤其是名牌大学,而被贴上失败者的标签、感到难堪或被父母抛弃。我认为这是大多数人的主要动机,但如果你真的想掌控自己的人生,就不应该因为这种浅薄的理由做出人生中最重要的决定。
总结如下:
-
我认为,要过上完整而有道德的人生,你不应该受制于腐败的机构——你需要有能力随时抽身而出,不被他们的文凭游戏所束缚。因此,应该专注于学习实际技能,靠自己的能力赚钱。
-
学术界和文凭制度充斥着欺骗、谎言和虚假知识。这条路的发展前景十分有限。
-
你完全可以免费获得大学教育的精华部分!我就是这么做的。大学并没有把你拒之门外(事实上,这是因为这些所谓的知识并不那么珍贵,所以他们也不屑于保护)。
-
人们选择上大学的主要原因是为了逃避为重大人生决策承担责任。不要做一个没有独立思考能力的僵尸,要做得更好。
Ben 采访 Saul
Ben Pace
嗨!嗯,我很好奇,对你来说,什么算是 Chesterton 篱笆原则的明确例子?你能举几个例子吗?
Saul Munn
好的,当然可以,让我想一下
Saul Munn
(我会故意包括一些我赞同打破的例子,也包括一些我赞同保留的例子)
-
结婚
-
在结婚之前不发生性行为
-
关心你的同龄人关心的事情
-
努力与家人保持良好关系
-
民主(在长期实行民主制度的国家)
-
专制(在长期实行专制制度的国家)
需要我继续举例吗?
Saul Munn
(我用「 Chesterton 篱笆」这个术语指代的含义,很可能与大多数人使用这个术语时所指的含义不同。)
Ben Pace
为什么不让每个人都自己做决定,在做人生选择时不考虑「 Chesterton 栅栏」原则反而更好呢?这样做会有什么问题?
Saul Munn
-
这可能会导致许多人做出与他人相同的决定——我猜想,这会因重复而浪费大量的思考资源……
-
但同时,我认为人们在某种程度上应该更多地挑战「 Chesterton 栅栏」。我的观点不是「不要挑战 Chesterton 栅栏」,而是「 Chesterton 栅栏应该让你谨慎思考」
Ben Pace
我还是想了解如果不考虑这一原则会出什么问题,我不认为你只是担心会有重复的思考过程……?
Saul Munn
是的,确实如此。
……我认为很多人在很多事情上会做出糟糕的决定,而「 Chesterton 栅栏」原则有助于防止人们无意中做出灾难性的、不可逆转的决定。
Saul Munn
如果你想要,我可以进一步解释,否则就到此为止
Saul Munn
举个例子,「无论你多么不喜欢当选者,都要尊重选举结果」这一「 Chesterton 栅栏」→在 2000 年(?)那次涉及悬挂式孔眼的选举后,人们表现得很得体
Ben Pace
我认为即使输了选举,我也能找到充分的理由不诉诸暴力并尊重政治程序,我不需要知道这是「约定俗成的做法」就能想明白。
Ben Pace
这不是一个简单的问题,但我仍然想挑战你具体描述一下,如果人们不使用「 Chesterton 栅栏」这一启发法,世界会变成什么样子。
Ben Pace
(我也在思考这个问题。)
Saul Munn
当然!给我一点时间思考。
Ben Pace
我认为遵循一个场景中既定的本地规范通常是明智之举,直到你发现明确的理由打破某个规范,而且还有关于如何打破规范的规则。
我认为这一点对时尚和不涉及规则的选择来说不太适用——如果你镇上的大多数人都在A餐厅就餐,而你想去B餐厅,我认为直接去并没有什么问题。
我认为随意破坏事物或诉诸暴力是不可取的。但我似乎听到有人说「除非你有充分理由不循规蹈矩,否则就应该循规蹈矩」。相比之下,我更倾向于「根据自己的判断选择是否循规蹈矩,而不是将其视为默认选项」。
实际上,写下这些话后,我也能理解将循规蹈矩作为默认选项的理由。(这可能是我与 Ronny 在隐私问题上最大的分歧……)
我想,如果不将循规蹈矩作为默认选项,我们可能会看到人们穿着糟糕的自制衣服,不刷牙,在肮脏的街道上开会,尝试一周不进食,以及许多其他荒唐的行为。这是因为他们虽然有新想法,但这些想法并不可取。大多数人无法独立思考所有问题,我们的思维很大程度上受到周围社会的影响。
Ben Pace
这个观点让我想说:「是的,如果你没有认真思考过这个问题,也没有多少独立思考和验证自己非常规想法的经验,更没有判断自己是否能比现有文明做得更好或更差的能力,那你确实应该上大学。但看在上帝的份上,请好好思考一下,并尝试验证你那些非常规的想法。这是你人生的黄金时期,我认为很多人其实可以做得更好。大学可能会以微妙但实质性的方式伤害大多数人(比如,过分迷信学历,忽视体制内的腐败,不理解知识、技能和学历之间的区别等)」。
……也许我应该写一篇文章,讲述「如何采取比循规蹈矩更好的非常规行为」。
Saul Munn
[我故意没看你的回复,这样我就能独立地表达自己的想法。如果你想让我看到你的回复,随时可以提醒我。]
我不太确定。这确实让我觉得需要进一步思考,但初步来看:
-
人们常常发现一些看似比现有规范更优越的事物,随后开始付诸实践。然而,这往往会引发一系列难以预料的负面后果。尽管如此,文化选择机制最终还是解决了这些问题。
-
我对自己无法清晰阐述这一观点感到遗憾和失望,但我期待能将这个问题置于思考的首位。同时,我也很想了解你上面的想法,虽然我还没来得及阅读!
Saul Munn
但我认为,如果没有默认遵循社会规范,人们可能会做出种种匪夷所思的行为:穿自制衣服,不刷牙,在肮脏的街道上开会,尝试一周不进食,以及其他各种荒唐事。这是因为他们虽然有新想法,但这些想法并不可靠。大多数人无法独立完成大部分思考,我们的思维在很大程度上依赖于周围的社会环境。
我赞同这一观点,但我认为除了这些「荒唐事」之外,还可能出现一些真正有害的行为,比如轻易终止人际关系或对他人施加身体胁迫。
Saul Munn
或者制造炸弹之类的
Saul 采访 Ben
Saul Munn
我准备了一系列问题,我会发几个,你可以选择你想回答的。
Ben Pace
你可以把所有问题都发给我,我会尝试快速回答,然后你可以针对感兴趣的部分深入提问,怎么样?
Saul Munn
哦,太好了,是的,这样更好
Saul Munn
数字对应下面的引用和相关评论/问题。
(1)
我认为,你人生早期的目标应该是在银行账户里存够大约 10 万美元……
如果你没有足够的钱可以维持 1-2 年不工作的生活,那么你将永远受制于你的就业机会……
嗯,在我看来,这种情况适用于 3-6 个月的暂停期,这段时间足以让你找到一份可以将「职业选择期」再延长 1-3 年的工作。拥有1.5万-3万美元的储蓄似乎就足够了——每月 1000 美元房租,1000 美元食物,1000 美元其他开支,1000 美元缓冲金,总计约每月 4000 美元的支出。
举例来说,你并不需要足够的钱来找到一份理想的工作——你需要的是足够的资金来获得一个相对稳定的处境,这样你才能去寻找理想的工作。
(2)
大多数看重学历的地方通常都不是适合长期发展的健康环境。
我猜你可能认为这种说法对我来说是正确的,但你是否也认为这适用于大多数上大学的普通人?
(3)
我认为通过私人家教和自主学习,你同样可以,甚至可能更好地掌握这种[编程技能]。
我觉得这种说法有点轻率,虽然可能是对的,但我很想听到一个更具体的方案。特别是关于私人家教这部分,你能详细说说吗?
(4)
然而,你可以直接去上大学,而不需要对任何事情作出承诺。
我认为这是对的,但似乎忽略了我在过去一年里经历的那种强烈的「格格不入」感。不过,也许解决的方法是克服这种感觉?
另外,我觉得这个说法绝对有点偏离主题。你怎么看?
(5)
我认为人们上大学的主要原因是为了逃避责备。
嗯,这个原因,再加上一开始就没有认真考虑过其他选择。
(6)
如果你想要自主决定并掌控自己的人生,就不应该为了这种蹩脚的理由[逃避责备]而做出人生中最重要的决定。
但是,责备还是会存在,不是吗?揭示责备的存在有时可以减轻它,但通常并不能——即使有人真心相信这一点。你会建议如何克服这种(可能巨大的)预期中的责备?
(7)
我认为,要过上完整和有道德的人生,你需要不受腐败机构的束缚——你需要能够随时离开,而不受制于他们的文凭主义游戏。
能够离开并不受制于他们的文凭主义游戏并不等同于实际离开并不参与他们的文凭主义游戏。
Ben Pace
以下是按顺序的简短回应:
-
感谢你为我的论点提供了有力的支持——如今,获得足够的收入而不必依赖于那套重视学历的大学体系变得更加容易了!
-
我有点搞不懂普通人是怎么想的。他们可能喜欢看漫威电影,这意味着他们的生活简直是在受罪。
-
现在有海量的 YouTube 视频资源,还有很多人愿意以每小时 50 美元的价格提供辅导。如今还有大语言模型、Copilot 和 Cursor 这些工具,每月只需很少的费用就能获得大量反馈和建议。你可以制作一个实用的小网站,找到需要网站的人,然后为他们制作能够推广其产品或业务的网站。我认为,通过几个月的努力,很多人就能赚到足够维持生计的钱。我和我母亲也通过一对一辅导孩子数学和英语赚到了不少钱。
-
我特别不明白你为什么想要融入,而且我怀疑你其实不应该这么做。虽然说这话我感到有些内疚,也想声明我现在是在辩论模式下,但不得不承认,融入并拥有一群好人作为自己的圈子确实很不错。关于背叛这个问题还需要多加思考,为了节省时间,我们先继续往下说……
-
没错。
-
[需要进一步思考……]
-
当然,你可以就如何在成为机构一份子的同时保护自己的退出权和理智提出论点。我猜我的观点是,如果你拥有这些权利,并且知道生活可能是什么样子,那么从一开始就选择退出,到泰国这样的好地方开始编程和写博客的生活会更好。我承认这可能是一个比较极端的立场。
Saul Munn
我有兴趣深入探讨的事项列表:
-
关于第 4 点,我对自己不融入的感受很坦然,你也应该以开放的态度面对这些感受,无论是批评、接纳还是其他反应。
-
就第 4 和第 5 点而言,我猜这是驱使人们选择上大学的主要因素之一——而且在我看来,更为关键的是,这阻碍了人们认真考虑不上大学这一选项。
-
关于第 7 点,你的论点似乎是「人们应该认真考虑不上大学,而他们认真考虑过的证明就是最终决定不去上大学。」这显然有些极端,但我是否遗漏了什么重要观点?
Ben Pace
关于偏离常规……我承认目前确实存在一些搭便车的机会。但这真的那么糟糕吗?我认为你应该谨慎且尊重地利用这种机会。如果在一所大学里有数百人这样做,那确实会引发问题。但反过来想,教育的门槛如此之高,这本身不就已经是个严重的问题了吗?我想教育系统内的大多数人都会赞同,如果人们渴望学习,教育应该是免费的,而高昂的学费恰恰说明了某些环节出了大问题。如果一个机构内的大多数人都支持你以这种方式与之互动,这强烈暗示着这种行为并不能算作是背叛该机构。
我猜这种逻辑对于「接触人群、使用设施和参加社团」可能不太适用,为这些设置一些界限是有必要的。嗯,就目前而言,我不认为 Saul Munn 这样做会有什么问题,但要将其推广为一种普遍规范还需要进一步深入思考,可惜时间不够了。
Ben Pace
对第7点觉得很有趣,但没时间详细讨论了。
Saul Munn
就目前而言,我不认为 Saul Munn 这样做会有什么问题,但要将其推广为一种普遍规范还需要进一步深入思考,
同意
Saul 的反驳
Saul Munn
所以,我认为这里的一个关键点是,我——而且我想Ben也是——认为人们应该比现在更加认真地对待是否上大学的决定。
但我也认为,人们应该思考这样一个问题:「嘿,看起来其他人都在这么做——特别是那些与我处境相似的人——我是否有足够充分的理由去反其道而行呢?」坦白说,我认为确实存在一些足够有力的理由,但很明显,大多数人并不能很好地判断哪些理由足够有说服力,哪些又不够。
(另外,我认为培养这样一种能力极为重要——即如何权衡现有规范的影响力,以及判断什么时候你的理由足以推翻这些既定规范。但我认为,攻读本科学位的阶段并非培养这种能力的最佳时机!有很多更好的、失败代价更小的环境可以让人先行锻炼这项技能。事实上,我认为本科生活常常能提供许多这样的机会!)
因此,我认为如果每个人都能从根本上思考是否应该上大学,那将是件好事,前提是他们已经具备了相当不错的推理能力,并且能够较好地判断何时适合或合理地打破常规、反其道而行之等。但在那种理想状态到来之前,我更希望人们能够盲目遵循既有规范,同时努力培养在关键时刻反其道而行之的能力。
现在,让我们把话题转回到亲爱的读者身上。
基础概率是个了不起的东西。如果你认为世界上大多数人都很愚蠢(这里的「愚蠢」指的是「无法准确判断自己何时应该反对共识,何时又应该遵循共识」),那么你就应该有一个极其清晰而有说服力的理由来解释为什么你不属于那个愚蠢的群体。我认为绝大多数人都没有这样一个清晰的理由,所以在他们找到这个理由之前,还是应该默认遵循社会共识。
从元层面来看:我认为绝大多数人甚至没有能力去评估自己的故事是否足够有说服力。这就使得门槛更高了——你首先要有充分的理由证明自己具备评估能力,然后还要有理由证明自己不随大流是正确的。
我想我可能达到了第一个门槛,但没有达到第二个。我认为大多数人两个都达不到。
我觉得这可能比标题中表达的立场稍微温和一些,不过无所谓了。
Ben 的反驳
Ben Pace
在我看来,关键问题在于 Chesterton 栅栏。你的社会将为你做大部分思考,而在大学这样的重大事项上重新做选择是有风险的。
我的第一个观点是,如果你深思熟虑,你可以找到更好的事情去做。但我猜我需要论证的是:(a)找到更好的事情有多容易,以及(b)你需要多少思考才能找出更好的事情?
我承认这有点困难,而且这里没有现成的规则。我认为如果更多人去尝试并在网上发布他们的经验法则会很好。
我有点想说:「为什么这应该比大学毕业后生活的大多数方面更难呢?找到一个社区、一个居住地和爱好等等仍然是困难的。」我认为,实际上,如果你主动寻找并愿意尝试,城市和当地大学会提供很多社交和活动的机会。我坚持认为主要的困难是金钱,你面临的主要问题是如何在寻找有趣和有价值的人的同时赚取体面的收入。我认为你可以越来越多地通过网络来实现后者——建立一个优秀的博客,在社交媒体上创建账号,发布有趣的内容,创造东西并发布相关内容,然后宣布你要去某个大城市待一周,尽可能多地见人,专注于交朋友和找人一起做项目。
我真心建议你可以尝试这种非传统的生活方式一段时间。不妨先休学一年,在某个城市尝试赚钱和结交朋友,然后再决定是继续这种生活还是选择相对安稳的道路(上大学)。如果你不想承担高风险高回报的挑战,可以选择生活成本较低的城市或国家;如果你愿意接受挑战,那么像旧金山、纽约、伦敦、波士顿这样的大城市会是不错的选择,那里机会众多,也能结识各种有趣的人。再次强调,互联网是实现这种生活方式的绝佳工具。你完全可以居住在生活成本较低的地方,需要时再乘火车或其他交通工具前往大城市。我认为,衡量一个人的人生价值应该看他创造了什么、塑造了怎样的品格,而不是生活有多轻松。
现在的主流人生轨迹就像一条河流,从中学到大学再到注重学历的公司,你可以选择随波逐流。但我希望更多人能跳出这个框架,因为我相信,如果你努力尝试不同的道路,可能会发现许多意想不到的机会。
我的建议是,从很早的年龄(大约 16 岁)就开始培养有价值的技能,争取在你必须决定是否上大学之前就能有自己的收入来源。我之所以强调编程,是因为它能带来可观的收入。但总的来说,与计算机相关的技能(如艺术设计、电子表格/数据库操作、音乐混音、视频编辑等)都相对容易学习和变现,而且通常可以在生活成本较低的地方远程工作。我认为,只要智商高于平均水平两个标准差,且责任心在 50 百分位以上的人,都有可能成功采用这种生活方式。需要明确的是,这样的人大约占总人口的 1%(2% * 0.5 = 1%),而你显然属于这个群体。我不确定在这些条件上还能降低多少门槛(遗憾的是,我的责任心并不在50百分位以上)。
总之,我尝试更具体地指出了你可以采取的另类选择,并论证了至少有1%的人(包括你和你认识的许多人)适合这种生活方式。
Saul 的结束陈述
Saul Munn
但我认为我需要论证的是:(a)找到更好的选择究竟有多容易,以及(b)需要多少思考才能找出更好的选择?
赞同——不过我还要补充,「容易」也包括「情感上的容易」,也就是说,「如果你做出不同寻常的决定,社会、家人、自己等会给你多大压力」。
我承认这确实有些困难,而且也没有现成的指南。我觉得如果更多人能探索不同的选择并在网上分享他们的经验会很有帮助。
如果这里的「探索」是指「认真考虑暂时离开学校,并深入研究如果真的这样做后会从事什么」,那么我非常赞同。我曾经写过一些(非常清晰、思路连贯但略显详细,而且非常私密的)关于我各种决定的决策文档——例如*[见下面的注释]*休学一个学期,再次休学,申请转学,以及重返校园——我把这些分享给了处于类似情况的人,他们觉得很有帮助。
[读者注意:在原对话中,(1) 休学一个学期,(2) 再次休学,(3) 申请转学,以及 (4) 重返校园每一项都附有相关的「决策文档」链接。考虑到内容的私密性,Saul 删除了这些链接。读者可以联系 Saul 私下索要副本,但请注意,如果没有先与你会面,他不太可能分享这些文档。]
我认为,实际上,如果你主动寻找并愿意尝试,城市和当地大学确实提供了许多社交和活动的机会。
这只适用于那些已经掌握了寻找这些机会所需技能的人。我认为典型的本科经历对很多人来说确实很擅长培养这些技能。
我坚持认为主要的困难在于经济方面。
我必须承认,我对大学这方面的体验可能有些片面,这是因为我来自一个比较富裕的家庭。我的祖父母能够支付我大部分的教育费用,这使得学费和其他相关开支对我来说不那么突出(尽管这些费用仍然很实在,毕竟他们的钱最终在某种程度上会成为我的)。
先休学一年,尝试赚钱并在城市里结交朋友
没错,我完全赞同这个观点。另外,也可以考虑在上完一年大学后再这样做,这样你就能同时获得不上大学和上大学的实际经历。
我一直在跟自己和朋友说,我认为大多数人在从未体验过大学生活的情况下就必须决定去哪所大学就读,这是非常遗憾的;但现在我意识到,更加遗憾的是,大多数人在既没有经历过大学生活,也没有经历过大学之外的生活的情况下,就必须决定是否要上大学。
你的人生价值应该由你创造的东西和你的品格来衡量,而不是由你的生活有多轻松来衡量。
这是个绝妙的引言,我要把它收录到我的下一个引言集中。
从学校到大学再到注重文凭的公司,这是一条顺流而下的河流。你可以选择随波逐流,但我希望更多的人不要这样做。我认为如果你努力做得更好,可能会发现很多可以利用的机会。
我非常赞同这个观点。可以参考《你在大学里被允许做的事情》这篇文章。但我确实认为大多数人可能还是应该顺着那条河流漂流大部分路程——不过他们应该(a)有意识地这样做,并且(b)可能在某个时候,认真考虑是否要改变航向。
我认为,任何智商高于平均水平两个标准差且尽责性得分高于50百分位的人都可以期望摆脱这种生活方式
我认为这是一个相当不错的筛选标准,用来判断"他们是否能够准确地区分自己正确而主流观点错误的时候,以及主流观点正确的时候"。
Ben 的结语
Ben Pace
好的,我们达成共识,认为他们应该更加慎重地考虑这个决定。(坦白说,如果我希望他们多思考这个问题,我或许应该建议他们减少思考其他事情,但既然我们在这点上意见一致,我就暂且不谈这个了。)这里涉及一个广泛的概念,即「真正思考并优化自己的人生」,这似乎是一个必要的前提条件。
是的,是的,你说服了我关于 Chesterton 栅栏理论的观点。
我猜我们的分歧并不在于一个人是否有充分理由认为自己能比整个文明做得更好(这其实是常见的情况),而更多在于「在这种情况下,风险和回报的权衡如何,以及你能多可靠地做得更好」。即便平均来说你可能比你所处的文明做得更好,但在这个问题上,风险和回报的权衡是巨大的,如果不走一条明智的道路,很可能会彻底毁掉你的人生。
举个例子,我不使用Twitter,我认为对大多数人来说这是更好的选择。这并不是出于「哇,真是狂妄自大」的想法,而是因为不难发现它会让我更加焦虑,睡眠质量下降,并且倾向于以最坏的角度看待他人。而且当我停用它6到10个月后,回来查看我错过的内容时,我发现我实际上并没有错过多少有价值的东西。
我的直觉部分来自于大学的价值已经大幅下降,所以许多有好的替代选择的人应该直接选择那些选项(比如,一个不错的创业机会,或者如果你知道自己有一个稳定且有意义的职业选择)。不过,与「干脆不上大学,直接开始工作」这个基准相比,我现在认为上大学比我最初想象的要更合理一些。
我倾向于相信「如果有更好的选择,注意到它并不难」,而不是「每个人显然都有更好的选择」。毕竟,强有力的证据是普遍存在的。
我对自己的大学经历深感厌恶。它几乎没有教给我任何有用的东西,反而一再让我感到挫败,还引导我陷入关于地位和自身重要性的虚假叙事中。相比之下,我通过从事副业项目获得了实际的技能,最终找到了一份职业。我猜想,对大多数人来说,走传统的大学道路可能仍然是值得的。但我确实认为这是一件非常遗憾的事。如果你发现其他机会,你应该果断把握,并积极追求。我认为,如果我们的社会能够让人们更容易探索和发现这些机会,让人们学习实际有用的技能(如网页设计和电子表格),而不是花四年时间竞争来展示智力,那将会更好。
调试学生
原文:Debugging the student — LessWrong
作者:Adam Zerner
2020 年 12 月 16 日
让我来为你解释什么是微分方程。假设我们有这样一个等式:
f''(x) + 2 * f'(x) = 3 * f(x)
这个等式的含义是:函数 f(x) 的二阶导数加上两倍的一阶导数,等于三倍的 f(x) 本身。
到这里你能跟上吗?不能?为什么不能?
-
要理解这个微分方程,你需要先掌握二阶导数的概念。
-
要理解二阶导数,你需要先掌握一阶导数的概念。
-
要理解一阶导数,你需要先掌握极限的概念。
-
要理解极限,你需要先掌握函数的概念。
-
要理解函数,你需要先掌握代数知识。
-
要理解代数,你需要先理解基本的算术。
换句话说,这些知识之间存在依赖关系。这就像大学课程中的先修要求一样。你必须先完成《基础生物学》,然后才能进入《高级生物学》的课程。
不过,「生物学」并不是一个独立的概念。在这里,我想强调的是,即使在更为细微的单个概念层面上,也存在着类似大学课程那样的依赖关系。
这种关系可以用下图来直观地展示:
真酷。让我们再回到微分方程的例子。在那个例子中,我直接开始向你解释微分方程,却没有先确认你是否理解二阶导数。更不用说一阶导数、极限、函数、代数运算,甚至基本的算术知识了。
我这样做合理吗?嗯,这要看具体情况。如果是在大学的微分方程课堂上,我清楚学生们都已经学过微积分,具备理解微分方程的前置知识。
但如果我是在跟街上的路人交谈呢?假设他们懂得二阶导数合理吗?显然不合理。那一阶导数呢?也不行。大多数人都没学过微积分。
极限概念呢?这虽然是高中数学课程的内容,但很多人现在已经记不清了。
函数呢?这应该更基础一些,是不是可以指望人们都记得?其实未必。我最近给一位编程新手讲解什么是编程中的函数,想用数学中的函数概念(比如高中学过的)打比方,结果发现他对这个概念也很生疏。所以,我认为最好还是先确认一下他们是否理解函数的工作原理。
代数呢?这应该基础到大家都懂吧。不过,也许也不尽然。也许他们也需要复习一下。
那么算术呢?我想到这个层面,大概可以安全地做出这样的假设了。
在我看来,成为一名优秀教师的关键之一,就是能够恰当地梳理这种知识依赖关系。如果学生无法理解你对微分方程的讲解,可能是因为他们根本不了解二阶导数,所以最好先确认他们是否理解二阶导数。如果他们不懂二阶导数,那就得看看他们是否理解一阶导数。这个过程某种程度上类似于程序员调试计算机代码。在这里,教师实际上是在调试学生的理解过程。
作为一名教育者,你无需一开始就精准定位学习者的知识水平。你可能从基础概念入手,比如解释函数的定义。如果学习者表示他们曾学过微积分但有些生疏,你就可以适当提高难度,快速检验他们对一阶和二阶导数的理解程度。这是你与学习者之间的一种互动过程,宛如一场默契的舞蹈。你们携手合作,在知识的阶梯上上下探索,直至找到合适的起点。一旦确定了起点,接下来就是循序渐进的教学过程了。
(事实上,这个过程更像是一个有节点和连接的图,就如上面 Khan Academy 的图示所示。不过,将其比喻为梯子更为简单,也更便于讨论。)
我所说的「教育者」和「学习者」是广义上的概念。举例来说,当我为你指引到最近加油站的路线时,我就是教育者,你就是学习者。我正在教你知识。这并不仅仅局限于课堂上的师生关系。
生活中充满了这样的小互动,其中一方扮演着教育者的角色,另一方则是学习者。然而,令人遗憾的是,扮演教育者角色的人常常犯一个错误:一开始就选择了过高的起点。这就像对一个普通路人直接开始讲解微分方程,而不先了解他的数学基础一样。
理论上,即使你一开始选择了过高的起点,也不是什么大问题。学习者可以直接说:
抱歉,我其实从未学过微积分。甚至高中数学我都有些遗忘了,所以我听不懂你在说什么。
这时,教育者就会意识到自己的错误,降低难度,重新寻找合适的起点。
问题在于,这种理想的教学情况在现实中很少发生。我发现,如果我表现得像上面提到的学生那样,教师通常会稍作停顿,简单回顾一下导数的概念,然后不等确认我是否理解就继续讲解微分方程的原理。这让我想起了一篇名为《想要认真倾听,就要保持好奇》的博文。似乎教师们通常都有一套固定的授课大纲,而不会努力确认学生是否真正理解了所讲的内容。这更像是一场单向的演讲,而非双向的交流。
我不确定为什么会这样。以向普通人解释微分方程为例,如果在一小时后让教师反思这个过程,他们可能会说:
嗯,是的,现在回想起来,我假设这个人懂微积分确实有些欠考虑。
但在当时,人们很容易被自己要讲的内容所吸引。
他们不知道什么是二阶导数?好的,让我快速解释一下,然后继续我原本要讲的内容。
我认为这种行为甚至不是有意识的,更像是一种本能反应。这是我最反感的问题之一,而我自己仍然经常犯这个错误。我常常事后才意识到自己犯了错,然后懊悔不已。也许对人类来说,同时记住自己要说的内容,又要考虑听众是否理解,这是一件不那么自然的事。
再次强调,我这里只是在随意推测。我不确定为什么会发生这种情况,为什么如此难以避免。但我确实强烈地感觉到:a) 这是一个普遍存在的问题,b) 这个问题很重要,因此我想引起人们对它的关注。
学校教育的危害与希望
原文:Harms and possibilities of schooling — LessWrong
作者:TsviBT
2022 年 2 月 22 日
要探寻培育新生代思维的更优方式,并充分认识到这一问题的重要性,不妨先反思现行教育体系给年轻一代带来的种种危害。资深教育家 John Taylor Gatto 在 1991 年发表的《学校教授的七堂课》一文中,以其亲身经历和独到洞见,直言不讳地揭示了这一点。
(在继续阅读本文之前,请务必先读完上述文章的第一部分《七堂课》。)
以下是另一份学校教育的危害清单。
1. 你没有思想,不要刻意表现得好像你有思想
孩子们会自然而然地专心做事,直到他们把事情做完:
摘自玛丽亚·蒙台梭利,《我的教育体系》,1915 年:[IPFS pdf 链接](https://ipfs.io/ipfs/bafykbzaceasprdysri6arqwkuhlmxrkcuq2bxmxedihlr53mmvsrreddrgv66?filename=Maria Montessori - My system of education%2C (1915).pdf)
一个大约三岁的小女孩正全神贯注地把积木块和圆柱体放入形状对应的框里。她专注的神情给我留下了极其深刻的印象。我从未见过哪个孩子能以如此「专注」的目光凝视一物品。我一直认为,小孩子的注意力总是很不稳定,喜欢不停地把注意力从一件事物转移到另一件,所以眼前的情景让我感到格外惊奇。
我没有打扰她,只是静静地看着,数着她重复练习的次数。她似乎将一直练习下去。见她要练习很长时间,我把她连同她正坐着的小椅子一齐搬到了大桌子上。她迅速地把「锁」摆放到椅子上,把「钥匙」放在腿上,心无旁骛地继续练习着,丝毫没有受到我的影响。在此期间我鼓动其他孩子唱歌,但这位小女孩依然专注于她手头上的工作,甚至在歌声停止了都没有抬头。我数了数,她总共做了 44 次不同的练习。最后她是没有在受到任何外界干扰的情况下主动停了下来。她环顾四周,满脸洋溢着心满意足的喜悦,仿佛刚从一场酣畅淋漓的美梦中醒来。
通过观察,我有了一个发现:在每个引入我的教学体系的国家和学校,这种现象在孩子们中都十分普遍,可以看作是在特定外部条件下产生的一种固定反应。每当注意力出现这种「极化」时,孩子就会发生彻底的改变:他们会变得更加平和、更加善于表达、更加智慧超群,展现出非同寻常的内在品质,仿佛唤醒了心智的最高境界。注意力高度集中时,孩子意识中原本混沌无序的东西似乎都有了清晰的形态。这些奇妙的特质在每个孩子身上都可以体现出来。
然而,学校教育往往会阻碍这一进程。教师支配着学生的注意力,学生要么必须专心听讲,要么埋头刷题,每隔一小时就被迫切换学习的地点和主题。即便在家中,他们也难逃作业和项目的束缚。学生无法真正拥有并掌控自己的注意力,反而是不得不与之斗争。尽管内心想要拒绝,但老师的要求——连同父母的期望、大学录取的压力、社会的规范,乃至对「自我」的判断——都在无形中左右着他们。
在教育中,你不仅无权决定什么才是值得花时间去做的;就算偶尔征求你的意见,也只是浮于表面,例如让你选择时事报告的话题,或是提供各种选修课,都只是做做样子。你只能被迫接受老师灌输给你的东西,因为在师生关系里,你没有话语权,不会被视为一个有组织、能思考的独立个体,没人在意你自己觉得做什么才是有价值的。师生关系总表现为学生对老师唯命是从。我记得小时候上美术课,老师看了我的画,直接从我手中抢过画笔,在我的画上涂鸦。还有一次,我想问个问题,说了声「等一下,[...]」,老师却打断我,斥责我对老师指手画脚。简而言之,你本可以用这些拿来上学的时间发展自己的思想,现在却被剥夺了这个机会。
这种状况造就了一种习得性无助感,让人无法专注于任何事情。就好像你正聚精会神地编程或写作,却在关键时刻不断地被打断,以至于忘了自己原本的思路。久而久之,你就学会了不要过于投入(全神贯注于某事,为手头的工作搭建必要却又临时的思维框架,好似驻波或简易搭建的脚手架),反正最后都不得不半途而废。你会尽量减少问题探究的深度和递归程度,减小探索未知领域的步伐。因为问题越深入,你在相关领域构建思维堡垒、激发神经可塑性的风险就越大。一旦专注的任务被打断,这种可塑性非但不能帮你顺利完成思维重构,反倒像对大脑造成了随机的损伤一样。
孩子心智的自主发展处处受阻,其结果就像是企图在一个小盒子里孕育婴儿。
2. 这个世界不属于你
2.1. 我们掌控着你活动的范围,决定着你可以去哪里。
被迫呆在一个活动范围受限的房间里,被命令道「听话,坐好,别像屁股上长刺了一样」,这种体验与被囚禁无异,而囚禁就是有害的。其他的不用说了,人们心里或许就是这样想的。
这是一幕再熟悉不过的场景:学生问「我能去上厕所吗?」,老师却回答:「你当然能去,但我不允许」或者「你当然能去,但你是想说『我可以去吗』吧?」。这绝非一个单纯的蹩脚段子(哪个蹩脚段子能在你脑海中如此挥之不去?),而是在一针见血地提醒你:面对权威,你的自由被限制,你好像被一堵混凝土墙围困着,找不到一扇随时可出的门。更讽刺的是,你竟无权提醒老师「他们正粗暴地禁锢你」。难道会有人傻到把「能」和「可以」混为一谈吗?不会吧?
摘自《死寂的禁闭室》,作者 Richards, Cohen, Chavis, 2019:
太长不看:在伊利诺伊州,成千上万的孩子被单独关在狭小的禁闭室内,动辄数小时。
在伊利诺伊州,法律规定,只有学生存在自残或伤人的安全隐患,学校才能合法使用「隔离禁闭」。但实际上,学校每天都在找法律规定外的借口把孩子们隔离 [...]
为了调查,ProPublica Illinois 和 Tribune 分析了数千份详细的案例(根据法律,这些案例是各校必须留存的)。最终的数据库涵盖了 2017-2018 学年及 2018 年 12 月初逾 2 万起案例。
「求求你开门!我发誓我会很听话的。放我出去,我保证不再吵闹,好吗?」
「我宁愿去死,也不愿遭受你的折磨。」
同样令人不安的事,也发生在康涅狄格州:《尖叫房:将残障学生隔离惩罚》,Emily Richmond,2012。想必这种情况在其他州也普遍存在。
一名 11 岁自闭症男孩在英国被单独关在小房间里长达数小时:「他曾经是那么热爱学校……但到了五年级 10 月底,他开始痛恨上学。每天我都不得不强行把他拽去学校。」
这一新闻绝没有夸大其词。
这种事在英国似乎并不罕见:惩罚室。「后来的某一周里,他被关进隔离室一次长达 22 个小时,最后完全崩溃了。那天的隔离结束时,他走出隔离室,看上去糟糕透了。他双腿颤抖,几乎说不出完整的句子。他显得筋疲力尽,心力交瘁。」
但大多数学校应该不会这样吧?事实上,这些被曝光的极端事例揭露了人们内心潜藏的这种倾向和导致这种倾向的价值观。我们支配着你活动的范围,决定你能……哦不对,是你可以去的地方。
摘自 Opie 夫妇所著《儿童在街头操场上的游戏》,1969 年:[IPFS pdf 链接](https://ipfs.io/ipfs/bafykbzacea4kvqqxv3junmlasqyl4rapis2hpjgzsdvtmvo5vyqqa6qokykxq?filename=Iona Opie_ Peter Opie - Children's Games in Street and Playground-Floris Books (2013).pdf)
太长不看:相比自由玩耍的孩子,受到约束的孩子将会表现得更暴力、更残忍。
那些专门为儿童游戏设施的场所,恰恰也是最容易观察到儿童玩耍的地方:学校操场上一望无际的沥青地面,填满垃圾、犹如牢笼般的围栏,游乐场一角摆放的秋千和滑梯。在游乐场里,孩子们或被允许、或不被允许用粉笔在地上画跳房子的图案,或是把球扔向墙壁,亦或是带着弹珠、跳绳,玩着「七叶树果实」、「劈开腌鲱鱼」、「嗨,肉贩吉米」等游戏。孩子们有时会被按年龄或性别隔离开。根据监管的严格程度,孩子们会组建帮派,实施报复,孤立他人,沉溺赌博,行贿受贿,勒索钱财,争吵不休,欺凌弱小,甚至大打出手。长久以来,小男孩们的本性已经是显而易见的了。我们在拥挤的校车就能感受到他们的好斗天性,以及他们用言语和肢体相互攻讦的反常方式。每个孩子或许都有理由觉得,在其他人面前,他必须坚持自己的立场。我们从前几代人的记载中得知,伟大的寄宿学校和其他的追随其脚步的学校限制着男孩们的自由时间,并将这种受监管的游戏列为必修课程。正如悉尼·史密斯在1810年所写,在公立学校里,每个男孩都要轮流充当暴君和奴隶,这已然成为一种源远流长的「传统」。[删节;更多学校里孩子们虐待行为的描述]
[...]这不禁让我们这些教育工作者相信,孩子们天生就具有《蝇王》式的野蛮心理。
然而,最近对猿类和猴子的广泛研究表明,它们在圈养环境下的行为与在野外大不相同,这一点或许并不令人意外。在自然栖息地中,整个族群生活的快乐至关重要,年长动物的权威备受推崇,族群成员的个性得到尊重。若是拥挤的笼舍中只关着一个物种时,一种等级制度随之形成,最强悍、最麻木不仁的个体登上了这一制度的顶层,欺凌和堕落行为变得司空见惯,每一个受虐的个体都会去迫害比自己更弱小的个体。总而言之,当低等灵长类动物生活在野外,自食其力时,它们的行为是「文明」的;相比之下,当它们被圈养起来,受到人类照料时,才会表现得最像「动物」。
我们观察孩子时发现人类似乎也有同样的特点。我们注意到,在操场上——那里正是教育学家、心理学家和社会学家聚在一起观察他们的地方——当孩子们在一起玩时,他们的游戏明显比在街头或野外时更具攻击性。在学校操场上,孩子们玩起了「你就是球」、「躲避球」、「链式秋千」和「斗牛场」等游戏。他们沉湎于「掌掴」、「指节」、「蜇刺」之类的对决游戏中,游戏的乐趣,甚至目的就在于凌驾他人、施加痛苦。在狭小的操场上,孩子们难以尽情玩「捉迷藏」、「解救者来了」、「踢罐子」之类自由活动范围更大的游戏。正如史蒂文森所言,这些能自然流露孩子们天性的游戏,正是他们「浪漫的源泉」。当我们问起孩子们在操场上都玩些什么游戏时,常常得到的答案是:「我们玩能到处惹人生气的游戏。」[删节;更多虐待性游戏的描述]
在街头巷尾或荒地里嬉戏的孩童容忍不了在狭小操场上被束缚着的玩耍。我们一度难以相信这些孩子却会在安静的地方表现得体贴入微、尊重同伴。后来我们忆起,即便那些在学校里看似令人生厌的孩子(他们在寄宿学校的表现的确粗野),到了假期相遇时,也会展现出教养十足的一面。 我们还记得听人说过,一些收容所里的犯人,甚至战时集中营中的人,他们非但没有患难与共的情谊,反倒可能以折磨狱友,让他们的生活更加难熬为乐[…]。
2.2. 我们掌控着别人,决定着你的交际圈。
学校把学生按年龄划分到不同班级。他们本可以向年长几岁的孩子讨教,或是去引导小几岁的孩子,但这永远是假想的,因为学校剥夺了学生与他们共处的机会。
2.3. 我们掌控着引导你的主动权。
在标准的学校教育中,孩子们无法融入大人的生活,与大人一起参与各种活动,去了解大人世界的种种潜规则及其存在的原因。真实的成人世界才是世界的重心,与之相比,孩子的世界不足挂齿。
摘自 Opie 夫妇所著《儿童在街头操场上的游戏》,1969 年:[IPFS pdf 链接](https://ipfs.io/ipfs/bafykbzacea4kvqqxv3junmlasqyl4rapis2hpjgzsdvtmvo5vyqqa6qokykxq?filename=Iona Opie_ Peter Opie - Children's Games in Street and Playground-Floris Books (2013).pdf)
这些纠纷的奇特之处在于,儿童们似乎总是因为玩耍的地点而惹上麻烦。19世纪,伦敦的人行道被频频投诉无法通行,原因是孩子们在上面打羽毛球以及玩击木橛游戏。斯图亚特时期, Richard Steele 报告说,皇家交易所附近到处都是不请自来的小运动员,不得不雇佣教区执事鞭打那些「玩玩具和球的淘气男孩」。即便在中世纪,那时的人们可能认为英国的每个男孩和女孩身边都有一片草地可以玩耍,但小孩也总有办法跑到被认为不合适的地方去嬉戏。1332 年,议会发现有必要禁止男孩和其他人在开会期间跑到威斯敏斯特宫区域玩耍。1385 年,忍无可忍的伦敦主教谴责了在圣保罗大教堂周围玩球的行为;1447 年,远在德文郡,埃克塞特主教也抱怨『小孩』在回廊里玩游戏,甚至在做礼拜时还『抽陀螺、击球、便士扎,甚至打网球』,他们把回廊的墙壁弄得很脏,还打碎了所有的玻璃窗。
孩子们总是乐此不疲地在熙攘吵闹、充满刺激的游乐场嬉戏,这种历史悠久的传统是否昭示着童年的苦难生活并非表象那般简单?我们看到,孩子们最大的乐趣莫过于在荒野中自由自在地游荡,但他们也并不想与成人世界完全隔绝。在某些游戏里,他们似乎抱着特定的心情,刻意吸引他人的注意力,或大声尖叫,或在人行道上乱涂乱画,或砸碎牛奶瓶,或砰砰敲门,再或妨碍他人出行。一群孩子竟能说出多达二十种需横穿马路的游戏。在这些游戏里,孩子们除了兴高采烈外还有一些连他们自己都未曾察觉的东西。没有哪个群体比孩子更深深扎根于生活的沃土。当孩子们在来车前玩起「最后过马路」游戏,驱使他们的是纯粹的顽皮,还是孩子群体中暗藏的反抗冲动?也许,那些曾扪心自问的人最能体味这个问题的分量——在一座城镇或乡村,川流不息的车辆通行的便利,真的比安居于此的居民生活的快乐更加重要吗?
就让孩子们玩去吧!
摘自 John Taylor Gatto 的 Dumbing Us Down,1992 年: [IPFS pdf 链接](https://ipfs.io/ipfs/bafykbzaceciz5uflkxrepcxxxxb4ber2pyaprdwcolm44mgebda3iy5hoegjs?filename=John Taylor Gatto - Dumbing Us Down_ The Hidden Curriculum of Compulsory Schooling (2002).pdf)
在莫农加希拉河畔的小镇,所有人都是我童年的老师。几乎每天,一列长达一英里的火车都会在镇上停靠,或加水加煤,或因一些不为人知的缘由。每当这时,身着制服的列车员便会走向我们这帮鼻涕娃,讲述铁路的故事,放任我们在车厢间奔跑嬉戏。货车、平板车、油罐车、煤车……林林总总的专用车厢,其用途我们了然于胸,就像记住敌机轮廓一般熟稔。也许有那么一年,我们会受邀踏入弥漫陈啤酒气息的守车,品鉴朴素的白面包夹香肠三明治。那些无名的铁路工人不吝赐教,如师如友,用言传身教引导我们成长,就像驾驶列车是他们责无旁贷的使命一样。
有时河面上的汽船会在河心停泊,船员划着小艇,将缆绳系在岸边的柳树枝头。这时就是小镇十二个街区里每艘破旧小船奔赴「劫掠」的绝佳时机——孩子们挤满小船,像维京海盗般挥舞船桨,有时甚至只是木棍,向「匹兹堡贝尔号」或「原始河流女王号」发起「进攻」。莫农加希拉有一种天然的礼节准则,虽然不曾明文写下,却代代相传,无需赘言。只要时间允许,大人们总会言传身教,为孩子们的成长之路指点迷津。因为大人们还有工作要忙,我们也懂事地在时间用完后心领神会地离开——即便启迪我们的时光弹指即逝,我们也感怀于心,为他们所展现的人生图景,哪怕是寥寥无几的几句话,都雀跃不已。
这个世界不属于你,而是属于大人。我们开车忙于去处理各种重要的事务,你最好别挡道。这些事情都十分重要,与你无关,去(别的地方)玩吧。
你天真地幻想自己在课堂上的活动、探索和提问,能像在工厂车间、法官法庭或艺术家工作室里一样备受重视,被严肃、真诚地对待,被视为至关重要。要我相信你简直是笑话,不过我当然会配合演下去。如果我交给你的任务荒诞离奇,怎么,难道你真的指望我是真的相信你吗?别忘了,你不过是个孩子而已。
3. 偏好伪装和双重束缚
(参见维基百科:双重束缚,感谢 Michael Vassar 提供的思路。)
齐泽克:
假设现在是周日下午。我父亲要我去看望祖母。我们先假设我父亲是一位传统的权威型长辈。他会怎么做?他大概会告诉我:「我不管你是什么感受,去看望祖母是你的本分。要对她恭恭敬敬的,等等。」我觉得这样也没什么不好,因为我还是可以选择反抗他。父亲的要求很明确。但是,一位所谓的后现代式的、不独裁专权的父亲又会如何呢?
我知道,因为我经历过。父亲可能会这样说:「你知道奶奶有多爱你,但我不会强迫你去看望她,你应该自己决定是否前往。」然而,每个孩子都明白,表面上的自由选择背后,潜藏着更大的压力。因为父亲实质上不仅要求你必须去看望奶奶,还要求你必须喜欢去看望她。他直接指示你应该怀有何种心情,这是一种更强硬的命令。
把注意力集中在我身上(尽管它本来属于你)。跟随自己的兴趣(但要记得对我们「教授」的内容保持兴趣)。你想成为一个好孩子,对吧?那你肯定也愿意遵守我们制定的规矩。这些规矩必然是正确的,否则你为何要听从呢?尽情发掘自己的独特性,但前提是不能偏离我们规定的范畴。倘若你胆敢质疑我们凌驾于你身体自主权之上的权威,但愿上帝保佑你。你最好乖乖承认,在这里『能』和『可以』有天壤之别。
更优的教育方式
许多教育弊端,只要不强求,就能够减轻甚至避免。(是的,就是这么简单。)如果孩子们不专心听讲,那也无妨,何必要同时教 20 个孩子呢?如果孩子对某些内容深恶痛绝,那么你对什么最有利于孩子的判断,就是彻头彻尾的错误。诸如此类。
教师(或称「导师」、「引路人」等)剩下的任务,就是把世界带给孩子们。蒙特梭利对此有过详尽阐述。总而言之,教学工作大有可为;但这在很大程度上尚属未知领域,因为迄今为止,除了促进学生的学习之外,教师大多不得不做很多其他事情,而教师必须学会如何让学生自主学习,这是一项充满未知挑战的精细工作。要最大限度地延长不受干扰的时段,要尽量营造开放的环境,启发孩子认识世界,顺应孩子的兴趣。要允许孩子真正像成长中的个体一样,自己塑造自己所处的环境。
其实,让学校成为家长眼中更好的选择并非难事:让孩子待到下午 5 点 20 分或更晚,有工作的父母就同时获得了托儿服务(不管出于何种原因,孩子在 18 岁前显然都需要托管照看);允许灵活弹性的接送时间;完全对来访的家长开放;让孩子们在户外尽情玩耍数小时,免得因压力而生病或情绪低落;不布置家庭作业,让孩子们有时间陪伴家人。
我与一位秉承蒙特梭利教育理念的学前教育工作者进行了交谈。他告诉我,他曾创办了一所蒙特梭利学校,但由于各种规章制度和资金问题,学校最终被迫关闭。不过,他坚信这个领域存在着广阔的市场前景。我怀疑(尽管尚未进行仔细评估),有效利他主义可能严重低估了教育投资的价值。我认为,伤害孩子会使他们长大后更有可能去伤害他人,同时也会削弱他们的创造力。如果人工通用智能(AGI)在未来十年或二十年内实现,学校教育肯定就几乎不再那么重要。但如果这一时间更长,那么给杰出的自然哲学家们更多机会来发挥才华,似乎是一个不错的资源投入方式。
如果你有兴趣讨论可能的改进措施和资金支持,欢迎通过我的 Gmail 邮箱与我联系,用户名是「tsvibtcontact」。虽然我可能不太适合承担这些任务,也没有太多精力投入,但我对此话题很感兴趣。
如何有效教学
原文:How to teach things well — LessWrong
作者:Neel Nanda
引言
本文旨在探讨如何有效地进行教学。我将着重关注那些需要事先准备和具有结构性的教学形式,如演讲和辅导,但这些理念可以广泛应用于各种教学场景。我认为,教学和阐述想法是一项极其重要的技能,然而大多数人在这方面并不擅长。通过长期的教学实践,我总结出了一些行之有效的重要理念和方法。鉴于我下周将要做一场演讲,我会先着重讨论如何做好演讲,但也会概述教学的基本概念和核心理念。随后,我会探讨如何将这些方法应用到辅导等场景,以及如何针对数学或应用理性等特定领域进行教学——这些是我有实际教学经验的主要领域。
注意:我主要关注概念和想法的教学,以及如何教导那些真正想学习和积极参与的人,因此我将围绕这些方面提出建议。
我认为,即使你并不打算投入大量时间进行教学,思考如何做好教学工作也是很有价值的——学习和教学是同一过程的两面。我发现,即使是作为一名学生,理解什么是好的教学也能够在很大程度上弥补糟糕教师的不足!
框架
本文的核心洞见在于,卓越的教学需要你深思熟虑,始终牢记教学的根本目的:学习实质上是一个信息压缩的过程。当我们接触新知识时,实际上是在接收一连串的新信息。然而,人类的认知过程并非简单地存储这些涌入的信息。学习者会接收信息流,提炼出其中的精华,将其转化为概念,然后将这些概念存储在大脑中。这一点至关重要,因为它揭示了教师的职责并非仅仅向学生灌输信息,而是引导学生理解正确的概念。信息传递只是实现这一目标的手段,而非目的本身。
在教学实践中,单纯提供信息流也常常能够奏效!优秀的学习者已经掌握了将信息流转化为概念的技能。这个过程往往是潜移默化的,学习者会吸收并记忆大量数据,随着时间推移,这些数据会在他们的头脑中自然而然地形成概念和想法。然而,这需要巨大的认知努力。一个优秀的教师会尽可能地承担这部分工作,让学生将认知精力集中在最关键的部分上。
我的基本理念是,我们每个人的头脑中都存在一个概念网络,即知识图谱。这是我们所理解的所有概念、已有的知识和直觉的集合,它们相互关联,构成一个整体。当你能够将新信息转化为概念,并将其与现有知识体系建立联系时,你就真正掌握了这个知识。这不仅意味着理解概念本身,还包括了解它在整体知识框架中的位置,以及如何实践它等等。
最后一点至关重要——如果学生离开课堂时对抽象概念有了很好的理解,却不知道何时应用这些概念,那么这与他们什么都没学到没有区别。我们只有在遇到相关触发因素时才会调用知识,因此要让一堂课真正有效,你必须在学生头脑中建立这些联系和触发机制。
我们需要牢记的一个重要区别是知识的显式(legible)和隐式(tacit)。显式知识是那些可以用明确的语言轻易表达的具体概念,比如如何进行分部积分。而隐式知识则更加模糊和直观,例如识别哪类积分适合使用分部积分——本质上是你希望学生培养的直觉。记住这个区别很重要,因为显式知识更容易传授,但你的教学目标往往是传授隐式知识(至少应该是这样!)。要很好地传授隐式知识,并尽可能使其变得显式而不失关键细节,需要相当的技巧。对这两种类型的知识,不同的教学技巧效果各异。我对剑桥数学课程的主要不满在于它过分关注显式知识,而忽视了隐式知识——也就是那些潜在的直觉和动机。
如何教学
在教学中存在两个关键问题,任何好的教学建议都必须予以考虑:
-
传达信息的方式有限
-
我所教授的想法以隐式概念的形式存储在我的大脑中,但要传达这些概念,我必须将它们转化为语言。这种语言在我的头脑中根据我的隐式知识和世界观形成概念映射,但在学生的头脑中则根据他们自身的隐式知识和世界观进行解读。这种过程常常会导致误解。
-
而且,将概念转化为语言本身就会造成信息损失,因为许多概念中的微妙之处难以用语言完全表达
-
本质上,语言只能传递显式知识,我需要找到方法来突破这一限制,以传递隐式知识。或者寻找其他信息传递渠道
-
此外,我还需要建立错误检查机制,以发现我在哪些方面没有很好地传达信息。
-
-
-
学习的一个关键环节是将新获得的知识与已有的认知结构相结合。
-
但我只能了解自己头脑中的内容,而无法直接了解学生的想法。而这两者本质上是不同的——毕竟我已经理解了我正在教授的内容!
-
这对我的教学能力构成了严重的挑战,我需要时刻关注这一点,并努力构建学生思维的模型,了解他们如何接收和理解我所传达的信息。
-
以下是我用于应对这些挑战的一些最重要工具:
-
大局观
-
学生的知识图谱是庞大的。因此,首要且最重要的部分是确定他们应该将这些想法添加到图谱的哪个部分
-
所以你应该始终强调这些想法如何融入更大的图景。我们目前正试图回答哪些问题?为什么这个想法很有趣?学生在哪里可以使用它?它有什么局限性?
-
在介绍新想法时,这永远应该是首要考虑的事情
-
-
信息优先级
-
学习是信息压缩。这从根本上意味着学生需要选择性地集中注意力。在学习新知识时,帕累托原理总是适用的——80% 的重要性存在于 20% 的想法中。
-
识别这 20% 是一项重要的认知努力,因为它并不是立即显而易见的。他们需要关注所有内容,然后再进行筛选。
-
但是,「什么是重要的」这个问题是我已经掌握的隐式知识!分辨这类知识对学生来说是高强度的劳动,但对我来说却很容易。因此,教师能做的最重要的事情就是突出什么重要,什么不重要,并告诉学生应该将注意力集中在哪里。
-
在实践中,你应该总是把「这真的非常重要」或「这些只是繁琐的细节」或「这是一个有点小众的边缘情况」这类话挂在嘴边,多多益善。
-
并且给予重要事项更多的时间占比。如果你说了一个重要的观点,把它写下来并画一个框。解释它为什么重要以及它如何融入更大的图景。给出另一种解释或一个例子。
-
如果你将教学视为信息传递——你的目标是告诉学生所有内容并希望他们自己弄清楚应该关注什么,那么这一点很容易被忽视。
-
-
另一个工具:经常进行总结,突出前一部分的要点。
- 这进一步有助于突出联系。有些想法比其他想法更容易融入他们的知识图谱,指出联系可以利用容易的联系使困难的联系变得更容易
-
我很赞同「告诉他们你将要讲什么,讲给他们听,然后告诉他们你刚刚讲了什么」这个建议,我认为这是实施这一原则的好方法
-
这背后的基本原理是学生只能记住他们听到的很小一部分。如果你做一个小时的演讲,他们可能只能保留几分钟的内容。这是学习过程中的一个基本事实,你唯一能做的就是控制他们记住什么。将他们的注意力集中在重要部分
-
这种思维方式帮助我确定什么是重要的。设置一个 5 分钟的计时器,写下你希望人们记住的所有重要内容。这些是你的演讲应该围绕的关键点!
-
你说的其他一切都应该旨在帮助这些关键点被更好地记住——突出它们之间以及与现有知识之间的联系,确保良好的信息传递,并传达关键点背后的隐式知识 。
-
-
优先排序的另一个关键技能是删减内容。如果某一部分不相关,或者它很无聊和繁琐,就把它删掉!无法谈论所有有趣的东西是很痛苦的,但你的时间有限——如果你不主动进行优先排序,你并不是在避免权衡,你只是将控制权让给了「你最后留下的东西」
- 任何参加过我演讲的人都知道我还没有内化这一教训
-
如果你从这篇文章中只记住一点,就让它是这一点——这极其重要,也是区分优秀教师和平庸教师的主要标志
-
-
理解前置知识
-
典型思维谬误的一个后果是,很容易忘记你的学生没有你拥有的所有背景!就像是人们在没有前置知识的情况下教授想法。
- 背后的想法是:你教授的想法存在于你的知识图谱中,并建立在现有想法之上——这些就是前置知识。你需要弄清楚学生是否掌握了它们。
-
一个常见的次要错误是深入深出(尝试解释所有前置知识)
-
[推理距离](https://wiki.lesswrong.com/wiki/Inferential_distance#:~:text=Inferential distance is a gap,person trying to understand it.)是一个很好的视角。一个新想法的推理距离是某人在理解新想法之前必须经历的理解新概念的步骤数。例如,要教一个小孩二次公式,他们首先需要理解多项式的概念,为此他们还需要理解代数——这是三个推理步骤。
-
一般经验法则:永远不要教授超过 2 个推理步骤的东西。刚学到的想法是不稳固的,还没有建立良好的联系。将一个新想法锚定在另一个新想法上是非常非常困难的。
-
-
这真的很难做对。前置知识要求你对他人的思维有很好的模型。一个有用的技巧通常是对目标受众中的某类人进行实践演练,并要求他们标记所有让他们感到困惑的地方。
-
此外,对于群体来说,这可能是一个难以解决的问题,每个人都有不同的前置知识。你需要在脑海中对演讲的目标受众有一个清晰的认识。
-
-
学生应该主动学习,而不是被动学习
-
学生很容易只是被动地坐在信息流中,什么都没有吸收。可这并不能实现你的目标,因为要形成联系、压缩信息并将其与他们的知识图谱相连接,他们需要投入一些认知劳动。
-
鼓励这种做法的好方法:明确告诉他们这很重要,给出练习和思考的余地,定期向听众提问并给他们一些时间思考。
- 提问有一个失败模式,即大多数人不会主动回答,或者只是走神一会儿 ——对此我没有很好的解决方案
-
此类问题在小规模环境中更容易处理,我在演讲中不擅长处理这个问题。我的主要解决方案就是保持吸引力并保持良好的节奏。
-
人们经常会走神,所以定期休息,并设置检查点「如果你没有跟上,我们正在换主题所以没关系」可以帮助纠正这种情况
-
即使是短暂的 30 到 120 秒的休息也会有帮助!我们鼓励大家起身伸展。
-
人们从来不觉得休息重要,但它们真的,真的很有帮助
-
-
-
-
举例子
-
例子是有效教学的一个非常强大的工具,人们很少充分利用它。我从未上过一堂有充足例子的课(相信我,我试过)
- 「你可以用只有例子没有内容的方式教一堂课;但你不能用只有内容没有例子的方式教一堂课」
-
为什么例子很棒:
-
例子是解决「有损信息传输」的绝佳方式——它们是与普通交流完全不同的交流渠道。即使别无他用,它们也可以用作检查错误
-
例子是传递隐式知识的好方法。我们可以旁敲侧击,将道理蕴藏其中
-
例子可以让学生意识到某些道理的客观意义,它们可以激发创新的想法,并定位它们在学生知识图谱中的位置
-
通过给学生一组激发性的例子,他们通常可以通过从例子中归纳总结来生成想法
-
例子可以弥合「抽象地理解知识」和「理解在哪里使用这些想法,以及它们应该在哪里出现」之间的间隙
-
-
如何使用它们?
-
在给出一个要点时,我经常会给出一个微型例子来为其提供上下文——例如「有时直线不足以模拟数据,如二次方程」。这应该是快速且毫不费力的,例子应该使学生不需要推理便迅速理解。
- (我不敢相信我花了 18 个帖子才得到我的第一个嵌套例子 : ( )
-
例子有时放在开头会更有价值,它可以展示一些道理并具现我们试图回答的问题。给出一个例子,然后在我们将例子泛化为概念时不断地回顾它可能会很好
-
在介绍一个复杂的想法后,举出一个长例子并说明例子的哪些部分体现了该想法
-
使用例子来说明一个想法的重要性和相关性——例如,如果向学生解释如何想出良好的规划,给出一个学生因错过截止日期而陷入危机的例子——每个人都能联系到这一点
-
-
例子包含大量信息,所以「信息优先级」的想法在这里强烈适用——告诉学生在例子中要注意什么,以及为什么它很有趣
-
-
视觉信息和图表
-
隐式知识经常以我脑海中的一幅具体图画的形式呈现——那就把它画出来!
-
这是另一个很好的替代交流渠道
-
我们的视觉记忆和处理能力往往比我们的语言能力要好得多——这对于解释那些令人困惑的复杂部分可能很有效
-
-
节奏
-
我经常陷入的一个容易犯的错误是仅给一个部分分配我说完它所需的时间。这种情况下我设想的是把想法转化为文字,然后只是读完我想出的内容。
- 这是将教学视为提供信息流的谬误!应该适当停顿时间让人们处理和压缩信息,他们需要更多时间来处理难于理解的部分,更少时间来处理浅显易懂的部分
-
这很难直观地做对——当你理解一个想法时,它可能会让你感觉理解起来毫不费力!
-
一个好技巧:做一个高层次的总结,并对每个部分的难度进行 1-5 分的评分。然后明确给这些部分更多的时间——例如添加更多直觉,重复关键思想,给出更多例子
-
注意——节奏并不意味着你说话的速度,而是关于你给不同想法的时间分配!
-
请注意,难度 =/= 重要性。如果一个部分很难,但不重要,就把它删掉。或者简要概述,解释重要的想法,然后说「不要在意细节」
-
-
另一个技巧——明确告诉学生哪些想法很重要值得关注,哪些不重要
-
如果进行实践演练(你绝对应该这样做),定期向测试听众询问能否跟上你的思路——通常情况下你会把节奏搞错
-
把握好节奏是关键——人们在慢速、容易的部分会走神,在快速、困难的部分会迷失。作为教师,你的工作是让尽可能多的人以最佳效率吸收信息。
-
我们不妨设置弹性的时间安排——我的演讲会在最后设有一个额外部分,并在有需要的时候删掉它。实时根据我现有的笔记和直觉适当调整节奏
-
-
理解问题背后的思维方式
-
当有人问一个问题时,你的默认反应是回答它。这是一种不够深思熟虑的失败!学生问问题是因为他们对某些事情感到困惑,你的目标是解决这种困惑——直接回答问题只是达到目的的一种手段。
-
这是一个重要的区别,因为学生们的问题通常是千奇百怪的。它们有时显得逻辑混乱,或者不太合理,或者提问者没抓住重点。对我来说,这表现为学生的思维说不通。回答者很难收获正面反馈,或者只是直接回答这些愚蠢的问题。但这是无效的。
- 一个相关的效应——人们常会旁敲侧击的问问题。例如,一个参加大学开放日的学生问「你读了几门 A-Level 课程?」但其实他们真正关心的是「我需要读几门 A-Level 课程才能入学」
-
你的目标应该是理解提问者当时的心理状态,他们在这种状态下提出的问题有特定的含义——一旦你做到了这一点,你通常就能直接解开他们的困惑,或回答他们真正关心的问题。
-
要做到这一点,你可以采取以下策略:提出判断性问题,尝试回答并询问「这是否解答了你的疑问?」,给出几种对他们真正想问的内容的解释并询问是否有任何一个切中要点,或者用自己的话将问题重新表述给他们。
-
在这个过程中,要特别注意的主要信号是困惑的迹象——比如问题让人感觉有些奇怪或突兀,或者某些地方明显说不通。
-
在深入探讨问题和继续演讲之间要把握好平衡——试着判断是否大部分人有同样的困惑,如果没有,就继续往下讲
-
-
-
经常这样做可以揭示教学内容知识,即了解学生常见的误解方式。收集这些信息非常有价值,因为它可以帮助你在将来识别并直接消除这些误解。
-
-
透明度错觉
-
这是典型思维谬误的一个表现——你很容易认为自己已经清晰地传达了知识,而实际上根本没有。因此,你需要付出大量努力来保持贴近学生实际情况和不断校准——因为通常一个感到困惑的听众可能在你看来并不显得困惑。
-
多提问!特别是那些能突出关键思想的问题,比如「如何完成简单的任务 X」或「这里的核心观点是什么?」
-
进行举手调查——让学生通过举手高低来表示他们的理解程度,理解清楚就举高,不太清楚就举低。这是一个很好的技巧,因为大多数人实际上会积极参与,而不像笼统地问「有人有问题吗?」或「这些内容大家都明白吗?」这类无人理睬的问题
-
-
寻求反馈并不断改进
-
教学是一项艰巨的任务。本质上,你是在尝试通过有限且易失真的交流渠道,将隐式知识传递给一个你难以完全了解的陌生思维。在这方面,没有接受过特别训练的人会表现得很糟糕
-
解决方案是定期寻求具体的、可行的反馈和校准,并切实付出有意义的努力来根据这些反馈进行调整!反馈是你更好地理解学生思维的主要途径之一。
-
一对一教学
实际上,一对一辅导和解释往往比其他教学方式更有价值!我认为,对大多数学生来说,投入时间做辅导是一个绝佳的选择——这不仅有趣,还能使教师获得不错的收入,更重要的是,你的表达能力会得到显著提升。而且,在对话中清晰阐述想法的能力是一项极其实用的技能——我在日常生活中经常运用这项技能。
一对一教学的主要优势在于,更容易激发学生的主动性,也更容易调整教学节奏和难度。本质上,就是把我在《如何从对话中学习》这篇文章中提到的所有想法颠倒过来。
-
关键技巧是让学生用自己的话复述你所讲的内容
-
这能促使他们主动思考并消化信息
-
这有助于发现他们的错误,并让你及时纠正
- 通常这样你就能识别他们的思维过程
-
这有助于你对学生的思维过程建模
-
这有助于你调整教学难度和节奏
-
如果你是辅导老师却没有让学生这样做,那你就错过了一个重要的提升学生学习效率的机会
- 这种方法在向朋友解释想法时也非常有效,尽管可能看起来有点唐突
-
-
让学生总结你所讲内容的要点或核心思想
-
鼓励学生举例,特别是典型的例子
-
在这里,理解问题背后的思维方式尤为重要。每当学生提出问题时,你都应该采用这种方法,尤其是当他们对你的回答似乎不太满意时。
教数学
-
我们往往容易忽视那些难以直接表达的信息——直觉、基础概念和学习动机。这是一个严重的错误。在数学教学中,传达这种高层次的整体认知是最为关键的部分之一。
-
每个证明都可以大幅简化。大多数证明都只包含几个核心思想,其余部分则是不断重复一些显而易见的步骤。这些「显而易见的步骤」在学生脑中不可避免地会被自动压缩,因此你应该直接跳过这些部分,只关注核心思想。
-
举例,尤其是那些能激发学习兴趣的例子,其重要性怎么强调都不为过。如果没有一个清晰、有启发性的例子作为参考,学习一个新概念会变得异常困难。
- 例子是传授隐式知识的有效途径——它们展示了在特定情境下可以做什么,不可以做什么,以及为什么这些想法如此重要。
-
经过一段时间对严谨性的学习后,你最终会形成后形式化的直觉,在这种状态下,你大多时候会依靠直觉思考,不太关注严谨性,但在必要时能够回到严谨的推理模式。数学学习中的大部分认知努力都是为了达到这一境界,一个好的老师会尽可能多地传授这种后形式化的直觉。
-
数学,尤其是纯数学,通常是将直觉形式化的过程。概率论是对不确定性的形式化研究。群论是对对称性的形式化研究。拓扑学是对连续变形(不发生撕裂或粘合的变形)的形式化研究。指出这一点至关重要。
- 找出这些联系的一个好方法是注意这个主题能让你回答哪些之前未曾解决的问题。这是激发学习兴趣的绝佳方式!
-
图表非常棒
-
通常你会开始能够运用大量隐式知识来解答某类问题,并期望通过例子来掌握这些知识。一般情况下,这些隐式知识的 80% 可以被归纳为一个明确的算法——这是将隐式知识转化为显式知识的有效方法。
教应用理性/生活建议
-
这些课程主要传授隐式知识而非显式知识,因此应采用讨论会的形式,将重点放在实践练习上。
-
要强调所有内容都具有高度的个人性和主观性——所有理念都应根据个人思维方式和具体情况进行调整。
-
将学员两两配对效果很好,能促使他们切实完成练习!
-
-
理想情况下,将隐式知识提炼为一个粗略的算法,然后交替进行步骤讲解和学生实践。
-
课程的影响主要体现在学生能够记住知识点和基本逻辑——即从内心感受到「我应该在这时运用这个概念」。这才是他们最终能记住的那小部分信息。因此,你的任务是将概念内化为这些习惯,明确地表达出来,并围绕它们设计课程结构来强化。
-
学生在课后时间进行的练习也十分重要——我们很难影响到他们练习中得到的反馈!你要强调这一点,并尽可能消除障碍。
-
给学生时间列出应用这些概念的方法,以及这些概念如何与他们的日常生活相关。
-
给他们时间设置课后行动的提醒。
-
-
让这些概念感觉可行——人们很容易认为一个想法很重要,但又觉得它很抽象。例如,认为优先排序是个好主意,但一直没有付诸实践。
-
强调这个概念如何融入日常生活和解决日常问题。
-
提供大量使用示例——这可以激发「哦!我从未想过可以这样使用」的联想。
- 这传达了何时使用这个概念的隐式知识!
-
-
强调相关性和重要性——举例说明不应用该技术会导致的糟糕情况,让学员感同身受。
结论
如果你将来打算从事教学工作,我希望这些想法能对你有所启发!即便你没有教学计划,我认为这些技能也能很好地应用于日常生活中解释事物的场景。而且,教学相长。
作为学生,我发现通常可以通过提出恰当的问题来帮助老师更有效地教学。例如,询问哪些信息最为重要,通过复述来验证自己的理解是否正确,以及询问教学动机和更宏观的认知框架。你可以培养一种敏锐的感觉——某些信息没有很好地融入你的知识结构。此外,察觉到那些阻碍学习的学生习惯,如被动接受而非主动学习,不尝试自主归纳压缩信息等,可以帮助我在忘记这些事的时候警醒!
链接总结:《行为遗传学十大可重复发现》
原文:Link Summary: Top 10 Replicated Findings from Behavioral Genetics — LessWrong
作者:ErickBall
2020 年 4 月 19 日
这是对论文《行为遗传学十大可重复发现》(Plomin et al 2016)中 10 大发现的总结。我此前曾将其作为评论发布,现在整理成完整的帖子,以便日后查阅。
作者指出,所有这些发现都具有较大的效应量,并在多项研究中得到了验证,除非下文另有说明。我注意到,作者在很多地方都大量引用自己的研究来支持这些观点。我对这些领域都不专业,所以如果他们试图将有争议的观点作为广泛接受的观点来推销,我可能无法识破。
-
认知和心理性状普遍受到显著的遗传影响。智力的遗传性约为 50%。双胞胎研究表明,同卵双胞胎的智力相关性约为 0.85,而异卵双胞胎的智力相关性约为 0.6。
-
尽管几乎所有的心理性状都具有一定的遗传性(通常为 30-50%),但没有任何一个心理性状的遗传性接近 100%。相比之下,身高等身体性状的遗传性约为 90%。
-
复杂性状的遗传性是由许多微小效应的基因共同作用的结果。例如:小鼠在开阔场地的活动倾向在 30 代内对选择压力呈现出线性反应,而非由少数几个基因控制时可能出现的明显分离现象。「全基因组关联研究」会检测覆盖基因组大部分区域的数十万或数百万个核苷酸,探测单个核苷酸多态性与特定性状之间的群体关联。研究表明,即使是最显著的单个基因变异,其影响也微乎其微(远低于方差的 1%)。
-
不同性状之间的相关性通常主要由遗传因素引起。例如,不同类型智力之间的强相关性(阅读和数学之间的相关系数为 0.76)更多地归因于遗传而非环境因素(阅读和数学能力之间的相关性约 64% 由遗传决定)。焦虑和抑郁之间的相关性完全出于遗传原因(它们受到相同基因组合的影响)。精神分裂症与双相情感障碍之间的联系也主要是遗传性的,神经质与抑郁之间也是如此。另一项发现(尚未得到重复验证)是,锻炼行为与锻炼态度之间的 0.3 相关性有 70% 是由遗传因素决定的;我认为这意味着,影响锻炼行为的大部分基因,是通过影响个体对锻炼的态度来发挥作用的。
-
反直觉的是,智力的遗传性在整个发育过程中呈线性增长(在一项双胞胎研究中,智力的遗传性从 9 岁时的 41% 增加到 17 岁时的 66%,在成年期甚至可能高达 80%)。
-
性状在不同年龄段的稳定性主要归因于遗传因素;而随年龄发生的变化则主要是环境因素导致的。那么,智力的遗传性为何会随时间而增加呢?作者提出了「遗传增强」的概念:在发育早期,基因的微小影响会随时间推移而被放大,这可能是由于基因型与环境的相互作用(儿童倾向于选择或创造与自身倾向相匹配的环境)。虽然有一些证据支持这一观点,但其影响可能因文化而异。作者似乎并未将遗传增强视为标题中提到的「重复验证的发现」之一。
-
大多数用于衡量「环境」的指标实际上都显示出显著的遗传影响。这一现象可以看作是前文提到的基因型-环境相关性的延伸。养育方式、社会支持以及一些生活事件似乎会受到孩子遗传因素的因果影响(而不仅仅是相关);这一点可以在双胞胎研究中得到证实。学校和工作环境也同样如此。这种遗传性的平均值为 0.27。然而,这一数值同样会因文化而异;在日本,养育方式受孩子遗传因素的影响比瑞典更大。甚至有研究表明,孩子的遗传因素还会对家庭的社会经济地位产生一定影响。
-
环境指标与心理性状之间的大多数关联都显著地受到遗传因素的影响。值得注意的是,基因不仅影响个体的行为表现,还会影响环境因素的测量结果。因此,我们不能简单地认为,父母的养育方式与孩子的行为之间的相关性,完全源于养育环境对孩子行为的直接影响。研究数据支持了这一观点:儿童发育指标与其家庭环境测量结果之间的相关性,在有血缘关系的家庭中(相关系数为 0.44)明显高于收养家庭(相关系数为 0.29)。这一发现揭示了一个重要事实:很多看似是养育影响造成的行为差异,实际上是父母和孩子共同的基因对行为和环境产生双重作用的结果。鉴于此,准确区分遗传因素和环境因素的影响变得尤为重要,这不仅有助于我们更深入地理解人类行为的形成机制,还能帮助我们更有针对性地制定有效的干预措施。
-
尽管生活在同一个家庭,兄弟姐妹们所经历的大多数环境影响实际上并不相同:研究发现,兄弟姐妹之间的相似性主要来源于他们共同的遗传基础,而非共同的成长环境。相较于共享环境,非共享环境对个体表现差异的影响更为显著。例如,兄弟姐妹之间的共享环境(包括就读同一所学校)仅能解释学业成就差异的10-15%。另一个引人注目的现象是,共享环境对智力的影响会在青春期后逐渐减弱。然而,具体的非共享环境因素往往难以明确识别,这可能是因为它们是由许多看似微不足道的日常经历长期累积而成的。
-
异常即常态:定量遗传学研究揭示,常见的心理障碍实际上是普通人群中遗传因素作用的极端表现。以阅读障碍为例,研究表明它具有显著的「群体遗传性」,这意味着导致阅读障碍的遗传因素与正常人群中阅读能力差异的遗传因素是同源的。这一发现与之前的研究结果相吻合,即大多数性状的遗传性是由众多微效基因共同决定的。将这些基因效应累加得到的多基因评分在人群中呈正态分布。有趣的是,严重智力障碍(智商低于 70)似乎是个例外。分析显示,它在成因上与智力的正态分布有本质区别,不存在显著的群体遗传性。
作者认为,上述研究结果之所以能够得到反复验证,是因为行为遗传学领域具有一些特有的原因,即:
-
先天与后天的争论推动了更大规模、更高质量的研究;
-
行为遗传学长期以来采用了比心理学其他领域更为先进的统计方法,部分原因在于该领域的研究往往是观察性的而非实验性的;
-
相比研究单个基因,关注遗传因素和环境因素的综合作用更能得出可靠的结论(多基因评分方法更有效);
-
该领域有更多的激励机制和数据资源支持重复研究;
-
遗传因素的效应量普遍超过心理学研究中的其他因素(例如,性别差异通常只能解释心理性状不到 1% 的变异)。
这些优势中有许多并不能轻易地推广到其他领域。
你的敌人是生来邪恶吗?
原文:https://www.readthesequences.com/Are-Your-Enemies-Innately-Evil
我们常常过于直接地将人的行为归咎于其内在固有的性情。一旦有人举止异常,我们就认定其性情必然反常,而非探究哪种真实/假想情境可能会导致这个人如此行事。我们会假定对方为异类(mutants)。*译注:mutants 还有变种人的意思,就是《X战警》里面的金刚狼、万磁王这类角色。
当有人实际冒犯到我们——做出我们不认同的行为(无论我们的看法是否正确)时,据我观察,这种一致性偏见会变本加厉。我们似乎有一种极为强烈的倾向,将恶行归咎于敌人内在固有的反常与邪恶。以下建议并非出于道德考量,而是从严格的先验概率角度出发:我们应该思考敌人认为自己身处于何种情境,使他们的所作所为并非表面看上去那么怪异。如此一来,我们所推测出来的内在性情便不会那么极端,进而降低其不可能性。
2001 年 9 月 11 日,19 名穆斯林男子劫持了四架客机,发动了一场针对美国的自杀式袭击。现在,你认为他们为什么要这么做?是因为这些人视美国为世界自由的灯塔,但他们天生就有一种反自由的异常倾向吗?
在现实世界中,绝大多数人在构建自己的人生故事时,都不会把自己塑造成反派角色。每个人都是自己故事中的主角。「敌人」自己的故事,从「敌人」自己的视角来看,是不会让「敌人」自己显得邪恶的。如果你试图揣测一些让「敌人」显得邪恶的动机,最终只会完全误解「敌人」内心真实的想法。
然而,政治是思维杀手。辩论即为战争;论点皆为士兵。一旦选定立场,就必须全力支持己方观点,竭力抨击对立面,否则无异于背刺战友。
若敌人的确本性邪恶,那便是支持己方的论据。任何对己方有利的论据,无论多么荒诞,都必须坚决拥护——否则,就是在战线上露出破绽。人人争相以最狂热的姿态谴责敌手,谁也不敢唱反调。久而久之,敌人披上了妖魔的外衣:獠牙滴着腐蚀的毒液,口吐烈焰,双翼如蝠;恶魔独角,狰狞可怖。若有人秉持事实,否定这些细节,便会被视为替敌人辩护,被打成叛徒。很少有人明白,你不是在为敌人开脱,你只是在捍卫事实真相。
如果只有基因突变的人才会犯下骇人听闻的恶行,人类的历史将是另一番景象。基因突变是极为罕见的。
抑或我们只是担心,对敌人的理解会导致谅解。讨伐基因变异的坏种要容易得多。「去死吧,十恶不赦的渣滓!」必然比「去死吧,你们这些本可能和我一样,只是成长环境不同的家伙们!」更像是一句振聋发聩的战斗檄文。手刃并非纯粹邪恶的人们可能会让你内疚。
在我看来,这反映了人们对政策辩论一边倒的深切渴望,总希望能找到一个完美无缺的最佳策略。设想一下,如果一支敌军正在入侵,或者一个疯子拿着刀向你袭来,你的选择只有两个:(a)奋起自卫或(b)坦然受死。如果选择自卫,你可能不得不伤害对方。杀死一个在另一个世界可能会和你成为朋友的人是一场悲剧。这也的确是悲剧。但是,选择躺下等死同样是悲剧。为什么一定要存在不会造成悲剧的选择?谁说最佳可行策略就必然不能有任何缺点?如果必须有人牺牲,那不如让暴力发起者付出代价,以震慑未来可能发生的暴力行为,从而最大限度地减少死亡总数。
如果敌人的性情并无异常,且根据他们对形势的认知,行使了普通一般人在当时情境下也会行使的暴力,那也不代表他们的认知准确反应了事实,也不代表他们的所作所为可以被正当化。这代表你可能不得不击毙一个自认为是英雄的人,而在他们自己的故事中,主人公将在第 80 页丧命。这固然是个悲剧,但总好过另一种悲剧。这是每个警察每天都要做出的抉择,以维护我们井然有序的小世界不至陷入混乱。
一旦准确洞察敌人的心理——真正了解了敌人内心真实的想法——这一认知不会像痛击对手那样令人快意。它不会带给你义愤填膺般的热血,不会使你对自己感到满足。如果你的洞察让你感到难以承受的悲伤,你可能正在直视世界的真相。更有甚者,准确的洞察可能会让你毛骨悚然,例如真正的精神变态者,或者那些神经系统健全,理智却已彻底被其信念摧毁的人(如山达基教徒(*译注:山达基(Scientology),也译为科学教,因其高昂的宗教费用、对信徒精神控制、有组织地骚扰攻击批评者而备受争议。)或耶稣营信徒(*译注:源自 2006 年的纪录片《耶稣营》,代指参加极端福音派基督教夏令营的人,尤其是儿童和青少年。)。
让我们开诚布公地说吧——9/11 的劫机者们并非穷凶极恶的天生坏种。他们并不憎恨自由。在自己的故事里,他们同样是英雄,愿为眼中的正道献出生命:真理,正义,以及伊斯兰的教义。劫机者如此看待自己,并不代表他们的信念就是正确的,也不代表我们就必须认同他们的行径是正当的,更不代表联合航空 93 号乘客就该袖手旁观,任其肆虐。这只意味着,如果劫机者们成长在另一个环境,他们或许能成为警官。而这,的的确确,是一场悲剧。欢迎来到现实世界。
论证对权威的屏蔽效应
原文:https://www.readthesequences.com/Argument-Screens-Off-Authority
场景1:Barry 是一位德高望重的地质学家,而 Charles 则是一个 14 岁的问题少年,他有着一长串的犯罪记录,还不时会精神病发作。Barry 对 Arthur 信誓旦旦地做出一个有悖常理的关于岩石的论断,Arthur 认为此论断有九成把握是正确的;而当 Charles 也做出同样违背直觉的论断时,Arthur 却只给出了一成的可信度。显然,在评判论点的可靠性时,Arthur 将说话者的权威也考虑在内了。
场景 2: David 就物理学提出了一个违背直觉的观点,并向 Arthur 详细解释了他的论证过程,包括相关的参考文献。Ernie 也提出了一个同样悖离常理的说法,但他的论证漏洞百出,有几处前后逻辑不连贯。David 和 Ernie 都声称,这是他们能给出的最佳解释(不仅仅是向 Arthur 解释,而是面向任何人)。听完 David 的解释后,Arthur 认为他的观点有 90% 的可能性是正确的;而对于 Ernie 的说法,Arthur 只给出了 10% 的可信度。
乍看之下,这两个场景似乎大体对称:它们都需要考虑有用的证据,不管是来自强有力的权威还是站不住脚的权威,亦或是严密的论证还是漏洞百出的论证。
现在让我们进一步假设,Arthur 要求 Barry 和 Charles 给出完整严密的技术论证,并列明所有参考文献出处。而 Barry 和 Charles 各自递交的论证质量旗鼓相当。Arthur 仔细核查了所有引文,发现它们确实能够支撑各自的论证过程。接下来,Arthur 又调查了 David 和 Ernie 的背景资历,结果发现他们的履历其实很相似——可能他们都是马戏团的小丑,也可能他们都是专业的物理学家。
假设 Arthur 完全能够理解这些技术论证(否则那些论证对他而言只是些华丽但空洞的辞藻),那么在他看来,David 的可信度应该远胜于 Ernie,而 Barry 与 Charles 之间的差距则显得微不足道了。
事实上,如果技术论证本身足够严谨有力,Barry 对 Charles 的身份优势或许根本不值一提。一个真正优秀的技术论证,应该能够消除对论证者个人权威的依赖。
同理,如果我们真的相信 Ernie 给出的论证已经是他所能做到的最好论证——包括他的全部推理过程、所有论据,以及他参考的任何权威——那么,我们完全可以忽略 Ernie 资历的任何信息。不管 Ernie 是物理学家还是马戏团小丑,都不应影响我们对论证本身的判断。(当然,这里假设我们有充分的知识背景去理解他的论证。否则,Ernie 不过是在说一些玄乎的话,我们能否「信服」,很大程度上就取决于他的权威了。)
由此可见,论证和权威之间存在某种不对称性。一方面,即便面对权威,我们仍然渴望听到有说服力的论证;另一方面,如果论证本身已经非常充分,那么论证者的权威身份几乎不会再提供任何额外信息。
(一个新手会说)权威和论证显然是本质上不同的证据类型,这种差异无法用贝叶斯概率理论那一套简洁明了的方法来解释。因为尽管两种情况下的证据强度是一样的——都是 90% 对 10%,但将它们组合起来后的表现却大不相同。我们该如何解释这一点呢?
接下来我将从概率论的角度进行技术演示,阐明如何体现二者的差异。(剩下的部分,要么相信我的权威,要么自己去查阅参考文献吧。)
假设已知条件概率 P(H|E1)=90%,P(H|E2)=9%,那么当 E1 和 E2 同时为真时,H 的概率 P(H|E1, E2) 会是多少呢?仅凭这些信息,我们无法运用概率论求出答案。求解 P(H|E1, E2) 所缺少的关键条件,不是 H 的先验概率,而是 E1 和 E2 两个事件之间是否相互独立。如果它们并非独立事件,就会影响最终概率的计算结果。
假设 H 表示「我的人行道很滑」,E1 表示「我的洒水器正在工作」,E2 表示「现在是晚上」。从洒水器启动后的一分钟开始,人行道就会变得湿滑,一直持续到洒水器停止,而洒水器每次会连续工作十分钟。因此,如果我们知道洒水器正在工作,那么人行道滑的概率就是 90%。在夜间,洒水器工作时间占 10%,所以如果我们知道现在是晚上,人行道滑的概率是 9%。如果我们同时知道现在是晚上,并且洒水器正在工作——换句话说,如果这两个条件都满足——人行道很滑的概率就是 90%。
我们可以用下面的图模型来表示这种关系:
是否是夜晚决定了洒水器是开还是关,而洒水器是否开启则决定了人行道是否湿滑。
在图示中,箭头的指向具有特殊的含义。让我们看第一个例子:
它表明,如果我们对洒水器一无所知,那么「夜晚」和「路面湿滑」这两个情况就互不相干。再看第二个例子,假设我掷出两枚骰子,并把点数相加:
如果你只告诉我第一枚骰子是 6 点,我还无法判断第二枚骰子的点数。但如果你再告诉我总和是 7 点,我马上就能推断出第二枚骰子是 1 点。
在不同的知识背景下,要判断各类信息之间是存在依赖关系还是相互独立,实际上是一个相当专业的研究课题。推荐阅读 Judea Pearl 所著的两本专著:《智能系统中的概率推理:可信推理网络》[1]和《因果关系:模型、推理与推断》[2]。(如果你只能抽出时间读一本,建议选择第一本。)
如果你懂得解读因果图,看到掷骰子的图,就能马上得出以下结论:
P(骰子 1, 骰子 2) = P(骰子 1) × P(骰子 2)
P(骰子 1, 骰子 2 | 点数和) ≠ P(骰子 1 | 点数和) × P(骰子 2 | 点数和).
仔细观察人行道湿滑的因果图,不难发现一些事实:
P(湿滑|夜晚) ≠ P(湿滑)
P(湿滑|洒水器) ≠ P(湿滑)
P(湿滑|夜晚, 洒水器) = P(湿滑|洒水器).
换言之,如果我们已经知道洒水器的状态,那么无论时间是否是夜晚,人行道变滑的概率都是相同的。洒水器的信息使得「夜晚」这个因素在判断路面滑度时变得无关紧要。
这种现象被称为「屏蔽」,而允许我们从因果图中识别这种条件独立性的标准被称为「D-分离」。
在论证和权威的关系中,因果图可以表示为:
如果某个观点是正确的,通常会有支持它的有力论证,专家们在看到这些证据后就会相应地调整自己的看法。(理论上是这样的!)
当我们发现一位专家持有某种观点时,我们会推断背后可能存在某些证据(尽管我们可能不知道具体是什么证据),然后基于这些抽象的证据来推断该观点的真实性。
然而,如果我们直接了解了论证的质量,这就在「真相」和「专家观点」之间形成了 D-分离,阻断了它们之间的所有联系路径。这是基于某些在这种情况下看似显而易见的「路径阻断」技术标准。因此,即使不查看具体的概率分布,我们也能从这个图中得出结论:
P(真理|论证, 专家) = P(真理|论证)。
这并不意味着与普通概率理论相矛盾,而只是一种更简洁的方式来表达某些概率事实。你可以从一个简单的概率分布中得出同样的等式和不等式,只是单凭直观观察会更难发现。权威和论证并不需要依赖两种不同的概率体系,正如洒水装置并非由本质上有别于阳光的物质构成一样。
在实践中,我们无法完全摆脱对权威的依赖。优秀的权威更有可能全面了解所有支持和反对的证据,并加以权衡;而相对次等的权威则可能遗漏一些关键证据,使得他们的论证缺乏说服力。这种权威的影响并非仅仅听取他们的确考虑过的证据就能消除。
此外,将论证简化为纯粹的数学表述也是一项极具挑战的任务;否则,评判论证步骤的合理性就可能取决于某些没有相应的几十年经验就难以形成的直觉。
在判断一个观点的可信度时,我们或许会稍微更倾向于相信权威人士的看法。比如在贝叶斯概率的问题上,E. T. Jaynes 比 Eliezer Yudkowsky 多了 50 年的经验,这让人觉得 Jaynes 的观点应该略微更有说服力一些。
但权威的这点可信度优势,仅仅在其他条件都相同时才能占上风。一旦出现了更有力的证据和推理,它很容易就会被击败。就像我在 Jaynes 的书中发现了一处代数错误一样——逻辑证明的力量是无可辩驳的,再权威的人也得服从事实。
一致性偏见
原文:https://www.readthesequences.com/Correspondence-Bias
所谓一致性偏见,即我们倾向于将别人的行为归因于其独特而持久的内在特质,即便此人行为完全可以用其当时所身处的特定情境来解释。
——Gilbert 和 Malone[1]
我们往往过于直接地将他人行为与其个性相关联。当看到一个人在无缘无故地踢自动售货机时,我们便认定对方是「一个脾气暴躁的人」。但当你自己作出同样的举动,却总能找到种种借口:公交晚点、火车早到、报告逾期,这台可恶的售货机还连吞了你两天的午餐钱。你会心想,换作任何人,在这种倒霉的情境下,肯定都会忍不住踢它两脚。
我们常常认为自己的所作所为不过是对所处情境的正常反应。但在有人踢自动售货机时,对方经历的种种过往不会直接写在其头顶的空气上。我们只看得见那一脚,感到莫名其妙,便以此判断对方必定天性暴躁,动辄发火。
但让我们考虑一下先验概率。在这个世界上,与晚点的公交车相比,基因突变导致易怒、进而无缘无故踢售货机的人要少得多。实际上,每个人的基因都会变异。如果我没记错的话,一般人会有二到十处体细胞突变。但对于任意 特定的 DNA 位点来说,突变发生的概率微乎其微。同理,一个人的性情,无论是哪一方面,都不太可能远远偏离常人。与之相反的情况是不太可能的。
即便明确告知行为背后的情境因素,人们似乎也很难以此调整自己的判断。当实验对象获悉,无论是支持还是反对堕胎的演讲者,都是通过随机分配来决定立场时,他们仍倾向于认为,演讲者的内心更偏向于其被随机指派的立场。[2]
用水灵来解释下雨,用物质燃烧释放出的「燃素」来解释火焰,用药物所含的「催眠力」来解释其催眠效果——这些解释看似直观。现实世界的运作机制往往更加复杂:下雨是蒸发和冷凝循环的结果;火是氧化燃烧的过程;安眠药通过与神经系统发生化学反应而产生效果。然而,机制听起来比本质更复杂,更难想到,更不易理解。因此,当某人踢自动售货机时,我们便会认为对方生性如此,生来就有踢自动售货机的倾向。
除非这个「某人」正是我们自己——考虑到当时身处的情境,我们的所作所为完全合乎情理;换作别人,在同样的情况下也一定会如此。事实上,我们往往会高估他人和自己做出相同反应的可能性——这叫做「错误共识效应」。喝酒的大学生常常会严重高估同学中饮酒人数的比例,而滴酒不沾的学生则会严重低估。另一个常见的心理倾向是「基本归因谬误」,即我们在判断他人行为时,总是倾向于将其归咎于个人性格特质;而在解释自身行为时,却会更多地将其归因为所处情境。
要解读他人行为,首先要认清一点:每个人都认为自己的所作所为合情合理。 与其思考他人先天性情中哪些异于常人的特质导致了其行为表现,不如想想对方认为自己身处何种境遇。不错,人的个性千差万别,但仅凭这些遗传特质,还不足以直接解释观察到的一切。
假设我给你一个控制器,上有红绿两个按钮。红色按钮会毁灭世界,绿色按钮能阻止红色按钮被按下。你会按哪个?答案不言自明,是绿色。如有异议,那一定是想多了。
即便如此,人们时不时地还会问我,为什么我想要拯救世界,就好像我一定是有过创伤性的童年经历之类的。但说实话,这个决定再明显不过了……如果你能设身处地于刚才假设的情境。
我的观点或许有悖于世俗,需要额外解释——为何我会笃信这些大多数人不以为然的东西?然而,一旦理解并认同了我的信念,我的反应似乎也就不足为奇了。或许我只是错误共识的受害者;又或许我高估了有多少人在设身处地时,会如我一般果断按下绿色按钮。但我敢打赌,至少有相当一部分的少数派会做出相同的选择。
大多数人在内心深处都自认平平无奇。即便是那些你所不齿的、干尽坏事的家伙,他们身上也不存在什么特殊变异。很遗憾,这些人的所作所为不需要任何基因突变。一旦洞悉这一点,你就能有所准备,不再为人世间的种种景象感到惊愕了。
拥抱问题
原文:https://www.readthesequences.com/Hug-The-Query
在理性思维的艺术中,有一条直奔主题的箴言——努力去观察与原始问题最直接相关的证据,尽可能排除其他无关因素的干扰。
莱特兄弟曾坚定地宣称:「我发明的飞机一定能飞!」如果只看他们的身份(不过是两个利用业余时间钻研物理学的自行车修理工),你可能会将这两人的权威性与凯尔文勋爵相比较,然后认为后者对此更有发言权。
但如果你要求莱特兄弟拿出详尽的计算过程,并且看懂了这些计算,同时再要求凯尔文勋爵拿出计算过程(除了表达怀疑之外,他可能根本没有做过任何计算)。此时,权威的光环就黯然失色了。
而当你亲眼目睹飞机冲上云霄,就连这些计算都会显得无关紧要,更别提凯尔文的权威地位了。
在论证时,你的论点与主题关联越直接,中间经过的推理步骤越少——也就是说,你在因果网络中观察的节点离待查节点越近——其说服力就越强。这是因果图的一个定理:相比那些能够屏蔽远端节点的近端节点,从远端节点所获信息绝不可能更多。
美国作家杰里·克利弗曾说:「你的失败并非是因为没有运用某种高深莫测的技巧,而是忽视了最基本的东西——没有盯紧目标。」[1]
讨论物理本身,胜过讨论学者的资历,同样也胜过空谈理性。莱特兄弟和开尔文勋爵,谁更理性?假如我们能检验他们的计算过程,这个问题其实无关紧要!理性主义者的美德并不能直接让飞机一飞冲天。
如果你忽视这个原则,了解更多认知偏见便会适得其反,因为这会分散你对更直接论据的注意力。以「你犯了我所知的第 182 种偏见」来反驳对方轻而易举,但要真正解决一个事实问题,必须要有接近主题的证据。就算有人出于偏见说太阳在发光,那也不会让外面变成黑夜。
正如你不可能时时刻刻做实验一样,你也不可能随时检查别人的论证过程。有时你缺乏足够的背景知识,有时对方掌握你不知道的信息,有时只是没有时间。遗憾的是,在很多情况下,我们只能去判断说话的人是否理性。在这样做时,你的内心应始终存有一种空落落的感觉,仿佛缺失了什么。
只要有机会,尽可能直面原始问题本身——贴近它,靠近它,直到能拥抱问题!
人性之恶与混乱思维
原文:https://www.readthesequences.com/Human-Evil-And-Muddled-Thinking
乔治·奥威尔亲眼目睹文明世界堕入极权主义的过程,看着一个接一个国家被征服或腐化;铁靴永远践踏在人的脸上——记住,是永远。你生得太晚,无缘亲历极权主义势不可挡的年代。一个又一个国家沦陷,秘密警察和夜半砸门大行其道,而自由世界的大学教授们还在歌颂苏联的大清洗是一种进步。这段历史对你而言恍如隔世,难以感同身受。因为,在你所处的时空里,柏林墙已经倒塌。如果那些墙石上还未刻奥威尔之名,那理应铭刻于上。
奥威尔洞察到人类的命运,竭尽全力想要扭转人类的前进轨迹。奥威尔的利器是清晰犀利的文字。他深知,语言表述的混乱必然导致思维混乱;他明白,人性中的邪恶与混乱的思维犹如 DNA 双螺旋般彼此交织缠绕:[1]
在我们这个时代,政治演讲和写作大多都在为那些无可辩护的行为进行辩护。诸如英国延续在印度的统治、俄罗斯的大清洗与流放、对日本投下原子弹等等,确实能找到为之辩护的理由,但其论据往往过于残酷,大多数人难以直面,同时也与政治党派所宣称的理念相悖。因此,政治语言不得不大量使用委婉、循环论证且模棱两可的说法。没有防卫能力的村庄遭到空袭,居民被迫逃往乡间,牲畜遭到机枪扫射,茅屋被燃烧弹焚毁:这一切都称作是为了和平……
奥威尔很清楚追求语言表达明确的目的:
只要简化英语表达,就能摆脱教条主义的桎梏。你将无法说出那些所谓必要的套话,而愚蠢言论中的愚蠢之处将会显而易见,连你自己都能察觉。
让我们的愚昧昭然若揭,甚至连自己都能看清——这正是《克服偏见》一书的核心所在。
邪恶悄无声息地潜伏在心灵的阴暗角落之中。当我们以历史的清晰视角回望过去,看到斯大林和毛人为造成的饥荒夺走数千万生命,不禁痛彻心扉。我们称其为邪恶,因为这是蓄意让无辜的生命遭受苦难和死亡。我们称其为邪恶,因为当以历史的清晰视角回顾时,我们的内心会充满厌恶。为避免遭到这天然的反对,作俑者必须压制这种厌恶。必须不惜一切代价回避清晰的认知。正如视野清晰的人倾向于反对他们所见的邪恶;人性中的邪恶,无论潜藏何处,也总是竭尽全力使人思维混乱。
《1984》明确地阐述了这一点:奥威尔笔下的终极反派是那些裁剪和修饰照片的人(源于苏联历史上的剪切和修饰)。在友爱部(Ministry of Love)的至暗时刻,奥勃良折磨温斯顿,逼迫他承认二加二等于五:[2]
「你可曾记得,」奥勃良逼问道,「你在日记里写过看,『自由就是能自由地说出二加二等于四』?」
「记得。」温斯顿答道。
奥勃良背对温斯顿,举起左手,拇指弯曲,四指伸出。
「温斯顿,你看到几根手指?」
「四根。」
「如果党说是五根呢?」
「四根。」
谈话在痛苦的喘息声中结束。表盘上的指针已经升到了 55。温斯顿全身冒汗。空气撕扯着他的肺部,他发出深深的呻吟,即使咬紧牙关也无法停止。奥勃良看着他,四根手指仍然伸着。他抽回了控制杆。这一次,疼痛只是稍微减轻了一点。
每当看到一些看上去很聪明的人,如 Robin Hanson 的同事 Tyler Cowen,认为克服偏见并不重要时,我总是感到震惊。我们谈论的是你的思维,你的人类智能。正是这种智慧将你与猿猴区分开来,创造了这个世界。你不认为思维的运作方式很重要吗?你不认为思维的系统性缺陷很重要吗?如果所有的人都是理想的贝叶斯主义者,你认为宗教法庭还会折磨女巫吗?
Tyler Cowen 似乎认为,克服偏见的行为本身就带有偏见:「我觉得 Robin 的博客正体现了这一点,也证明了偏见有时确实很有用。」我希望这只是因为他陷入了过度抽象化的思考,且想要故作聪明。难道 Tyler 真的以为,对人类生命价值缺乏敏感认知,和努力制定切实可行的方案来挽救更多生命,这二者可以等量齐观吗?
奥威尔也曾不得不与相似的论调抗争——即指出任何事物之间存在的差异,都是幼稚天真的表现:
Stuart Chase 等人几乎断言,所有抽象的概念都毫无意义。他们以此为托词,鼓吹一种政治静默主义(Political Quietism)。他们的论调是:你连法西斯主义为何物都搞不清楚,又怎能与其抗争呢?
仅仅将克服偏见视为一场与偶然错误的斗争,也许看上去还不足以振奋人心。也许没有一个明确的邪恶对手,人们就难以激起斗志。所以我们必须明确这一点:在这个世界上,但凡存在人性的丑恶,存在残暴、酷刑和蓄意谋杀,偏见必定如影相随。当视野清晰的人们对抗这些偏见时,隐藏在背后的邪恶必然会发起反击。真理的确有它的敌人。如果《克服偏见》是前苏联的一份时事通讯,每一位发帖或评论人都会被送进劳改营。
纵观人类历史,每一次伟大的飞跃都源于思想的革新。除了少数天灾,每一场重大灾难都源于愚昧和偏执。我们最后的敌人是我们自己;这是一场战争,而我们每个人都是战士。
政策辩论不应一边倒
原文:https://www.readthesequences.com/Policy-Debates-Should-Not-Appear-One-Sided
Robin Hanson 提出开设可售卖违禁商品的店铺。这一提议有诸多充分的理由:个人自由的天赋权利,官僚为自身仕途发展动辄禁止一切,立法者与常人一样存在偏见。即便如此(我回复反驳),总会有某位贫穷、单纯而又受教育程度不高的五个孩子的母亲,走进店内为自己的关节炎购买「蛇油医生牌硫酸饮料」,最终不幸身亡,留下孤儿在国家电视台前痛哭流涕。
我只是指出了一个简单的事实。怎么就有人认为这是在支持管制呢?
对于简单的事实问题(比如地球生命是否源于自然选择),我们有理由期望论证应该是一边倒的。因为事实本身只有一个版本,所谓「证据的权衡」理应如实反映这一点。实际上,按照贝叶斯理论对证据的定义,「强力证据」指的正是那种只在单方论点成立时才能找到的证据。
然而,对于涉及多重后果的复杂行动,没有理由表现出这种一边倒的特性。为什么人们会希望自己的政治辩论也是一边倒的呢?
政治是思维杀手。在政治讨论中,论点如同战场上的士兵。一旦选边站队,你就必须力挺己方的所有论点,并抨击一切有利于敌方的论点,否则就是在背刺战友。一旦陷入这种思维模式,政策辩论也将变得非黑即白——你所支持政策的种种代价与缺陷,皆为敌方士兵,必欲歼之而后快。
我们还应谨防另一种常见的思维误区:认为高明的决策就是在两个最受关注的对立政策之间折中妥协,追求绝对的平衡。一项政策的成本或收益可能本来就不平衡。如果政策问题没有优劣之分,我们就无法权衡取舍。然而,人类也有一种倾向,即否认自己青睐政策的一切成本,或否认反方政策的任何益处。因此,人们往往会夸大政策利弊的差异,认为政策的倾向性远远超过实际情况。
如果你允许商店出售被禁的商品,那么一些贫穷、单纯、受教育水平不高、有五个孩子的母亲,很可能会误购一些危及生命的东西。这是在预测可能发生的严重后果。从事实角度看,答案非常明确——任何理性的人都应该坦率地承认这个后果无可辩驳,无论 TA 在这个政策问题上持何种立场。你可能会认为,禁止交易只会抬高违禁品的价格,监管者会滥用职权,或者个人自由高于你想要干预他人生活的愿望。但是,不可否认的现实摆在眼前:如果这位母亲真的买到了危险的商品,她就是会因此丧命。
我们生活在一个不公平的世界。作为高等灵长类动物,人类对感知到的任何不公平都有强烈的排斥反应。因此,像这种无可争辩的事实常常令人备感压力。面对这种认知失调,人们通常采取两种应对方式:其一是改变对客观事实的主观认知,要么否认不公平事件的存在,要么修改历史,让它看起来十分公平。(这种心理倾向受到情感启发法和[公正世界谬误](https://en.wikipedia.org/wiki/Just-world hypothesis)的影响。)其二是改变自己的道德观念——否认那些事件的不公。
有些崇尚自由意志的人可能会说,如果你走进一家「违禁品商店」,走过那些清清楚楚写着「此处商品可能致命」的警示标语,然后买了些最终害死自己的东西,那就是咎由自取,活该倒霉。如果这种说法在道德上确有道理,那么允许售卖违禁品的商店存在就不会带来任何负面影响,它不仅会产生净收益,更是一桩百利而无一害的好事。
反方观点则认为,监管者可以接受系统培训,学会从理性角度出发,以消费者的利益为依归做决策;如果真是如此,实施监管(在他们的道德观念中)也不会有任何负面影响。
不管你喜欢与否,智力很大程度上就是在出生时抽签决定的——这是宇宙不公平到极致的例子之一,以至于很多人宁可否认事实。大量实验证据表明,智力有 60-80% 纯粹就是由基因决定的。然而,即便否认这一点,你也无法选择自己的父母、成长环境或早期教育。
我自幼就被教导,否认现实在道德上是错误的。如果我一厢情愿地幻想硫酸饮料会对我有益,那就是在做一些被反复告诫要避免的、令人不齿的事。有些人生来就身处一个特定环境——我们先不谈基因,因为基因实在是不公平得过分了——在那里,当地巫医告诫他们笃信神灵是正确的,怀疑是错误的。出于一片赤子之心,他们听信教诲,结果命丧黄泉。不似你我,他们自小所受的教育并非遵从社会习俗是一种个人选择,其后果也是由个人承受。你真以为自己很聪明,就算生于公元 500 年,也能成为一位真正的科学怀疑论者吗?没错,不管你怎么看待基因,出生就是在抽签。
说「购买危险产品的人活该受伤!」并非坚强务实之辞。这只是拒绝面对自己生活在一个不公平的世界里。真正坚强务实的态度是:「是的,硫酸确实会带来极其痛苦的死亡,不,那位五个孩子的母亲并不应该遭此劫难。但我们仍要让商店继续营业,因为这是基于成本效益的考量。」你能想象有哪位政客敢这么说吗?我也无法想象。但如果经济学家有影响政策的能力,或许他们可以私下里这样想——甚至写进学术论文里,用晦涩的术语委婉表达,以免被媒体直接引用。
我并不认为一个人因愚蠢的选择而丧命值得庆祝。我认为这是一个悲剧。帮人免于自己所作所为的后果并非永远正确,但对于死亡这一后果,我有明确的道德底线。人一死,就再也没有机会从错误中吸取教训了。
很遗憾,这个宇宙并不认同我。等一切都结束时,我们再看看谁能笑到最后。(*译注:此处疑指作者EY超人类主义/超越死亡的思想。可参考https://hpmor.xyz/ai2zb_2_ap1/)
政治是思维杀手
原文:https://www.readthesequences.com/Politics-Is-The-Mind-Killer
每当人们谈起政治话题,往往会变得头脑发热、不可理喻。这种现象背后的进化根源再明显不过,值得详述:在我们祖先生活的年代,政治关乎生死存亡,也与性、财富、同盟和声誉休戚相关……如今,当人们争论「我们」是否应该上调最低工资标准时,实际上是在根据祖先时代的生存法则行事。在那个年代,站错政治立场可能意味着丧命,而站在正确的一方则可能让你有机会置仇敌于死地!
如果你想阐述一个关于科学或理性的观点,我建议尽可能避免从当代政治举例。如果你的观点本质上与政治有关,不妨谈谈法国大革命时期的路易十六。政治是一个重要的领域,我们应在这个领域内运用理性——但在这个领域内学习和探讨理性是很糟糕的,除非所有参与讨论的人都已经具备理性思维。
政治是战争的延续。在政治辩论中,观点和论据都即为士兵。一旦选定立场,就必须坚守己方的所有论点,并攻击一切看似有利于对方的论点。若非如此,那就是在自己人背后捅刀子,给敌人送弹药。在日常工作中,作为科学家时,人们可以冷静、公正地分析问题各方面;然而一旦涉及到蓝还是绿的政治立场,同一批人也可以突然变成言听计从、高喊口号的僵尸。
在人工智能领域,尤其是在非单调推理的研究中,有一个经典问题:「所有的贵格会教徒都是和平主义者。所有的共和党人都不是和平主义者。尼克松既是虔诚的贵格会教徒,又是共和党员。那么,尼克松到底是不是和平主义者?」
作者选这个例子到底有何居心?难道是想触动读者的政治敏感神经,使他们的注意力从核心问题上转移吗?还是想让共和党人在人工智能课程中感觉格格不入,从而打消他们进入这个领域的念头?(顺便说一句,我既不是共和党人,也不是民主党人。)
为什么会有人偏要选择这样一个令人分心的例子来解释非单调推理?大抵是因为作者抵挡不住对那些可恶的绿党人狠狠冷嘲热讽一番的诱惑吧。像这样抓住机会尽情挖苦一番的感觉是如此美妙,抵御这种诱惑就如同抵御巧克力饼干一般困难。
然而,正如巧克力饼干一样,并非所有感觉美妙的事物都于你有益。
我并不是说我们应该漠视政治,也不是在主张我们要像维基百科那样坚持绝对的中立观点。但是,如果可能的话,请尽量克制住对特定群体进行尖锐批评的冲动。如果某个话题确实涉及禁止在学校课程中教授进化论一类的问题,我们大可以展开讨论——只是要注意,不要把整件事全怪到共和党身上,因为你的部分读者可能是共和党成员,他们可能会认为问题出在少数害群之马,而不是整个党派。正如维基百科的中立观点理念,无论(你我主观上认为)共和党是否真的有错,那都不重要。对于社区的健康发展和精神成长而言,比起卷入党派之争,围绕问题本身展开讨论会更好。
理性与英语
原文:https://www.readthesequences.com/Rationality-And-The-English-Language
在我讨论掌声提示光这个话题时,有位读者评论说我的文章让他们联想到了乔治·奥威尔的《政治与英语》一文。[1] 看到这样的评价,我倍感荣幸;尤其是在当时,我正好在酝酿接下来将会谈到的主题。
如果你真想了解一位艺术家对理性的见解,那就去读奥威尔的作品——他是理性主义者和作家的必修课。奥威尔不是科学家,而是作家;他的利器不是数字,而是语言;他的对手不是大自然,而是人性之恶。如果你想将一个人不经审判就关押多年,你必须换个说法,不能直白地说「我要不经审判就把詹宁斯先生关上很多年」。你必须混淆听众的思路,以防他们脑中清晰的画面激起良知的谴责。你要说,「不稳定分子应被施行替代性司法程序」。
奥威尔强烈反对极权主义,也反对为邪恶提供庇护的混乱思维——正因如此,奥威尔关于语言的著作最终成为了与费曼、萨根、道金斯等人齐名的经典理性主义文献。
「作家被告知应避免使用被动语态。」纯科学背景出身的理性主义者或许看不出上句话的问题,但任何有写作经验的人都能立即发现。我用被动语态写了这句话,却没告诉你,到底是谁在告诫作者避免使用被动语态。被动语态隐去行为主体,只留下受事者。「不稳定分子应被施行替代性司法程序」——究竟是谁在施行?所谓「替代司法程序」又是在做什么?堆砌足够多的静态名词短语,便可粉饰任何令人不快之事,仿佛从未发生。
期刊文章常常使用被动语态行文。(抱歉,应该说是部分科学家钟情于被动语态。这些文章并非凭空产生,总该有人对此负责。)「受试者被施用 Progenitorivox」比「我给每位受试大学生发了一瓶 20 片装的 Progenitorivox,叮嘱他们按时服用直至吃完」更显权威。在描述中省略科学家的存在,似乎就只剩下至关重要的客观数据。但实际上,科学家就在现场,受试者就是是大学生,Progenitorivox 也不是被「给药」,而是被亲手分发,并告知了服药要求。被动语态模糊了真实情况。
从我收到的评论来看,有人会反对说期刊论文使用被动语态不算什么大错——只要细想一番,就能意识到科学家确实存在。这似乎并不构成逻辑谬误。这就是为什么理性主义者除费曼甚和贾恩斯之外,还必须研读奥威尔。
纪实作品传递知识,虚构创作传递体验。医学能推断出人体无防备地暴露在真空中会有什么后果,但小说能让你身临其境地经历整个过程。
一些理性主义者会尝试分析具有误导性的表述,探究其中可能隐含的意义,努力构建一个合乎逻辑的解释。他们会采取宽容的态度,相信作者的用意。然而,作者所受的训练是不能给自己这种宽容。读者的理解即是你所表达的,与你的本意无关。无论你有多么巧妙的辩词,都无法与读者争辩。
作者深谙读者不会驻足思索文章深意。小说阅读是一连串第一印象的持续体验。一位理性主义作家会格外关注文字所营造的体验。当你在评估某段话的公共理性时,仔细分析词语,反复调整措辞,尝试不同解读,搜寻真实性的蛛丝马迹,那么你就已经失去了最初的印象——也就是读者实际看到的,或者更准确地说,感受到的内容。
一位小说家会立即察觉到「受试者被施用了Progenitorivox」这句话有多么不妥。这样的描述能为读者勾勒出怎样的生活画面呢?这个句子仅仅营造了一种疏离的权威感,仅此而已——读者唯一的体验就是被告知了一些看似可靠的信息。小说家会发现这些名词过于抽象,无法展现实际发生的情景——比如那位手握药瓶、努力摆出严肃表情的博士后研究员,或者那个带着紧张笑容倾听的学生。
我的观点不是说学术论文应该像小说那样写作,而是理性主义者应该清醒认识到语言能够创造什么样的体验。理性主义者必须洞悉人心及其运作方式,包括意识之流——你通过语言表达自我的那个部分。理性主义者要敏锐把握字句在实际体验中的冲击力,超越表层的命题语义。
更直白地讲:意义并不能为影响开脱!
我不在乎你能给「人工智能应该通过民主进程来发展」这类掌声提示光构建出什么理性解读。那改变不了它给听众带来非理性的影响,让人鼓掌叫好而非实事求是,更别提这种说法本身就含糊其辞、避重就轻。
奥威尔曾抨击陈词滥调对思考体验的负面影响:
当你看到台上某个疲惫的蹩脚演说家机械地重复那些老生常谈时——「野蛮暴行」、「铁蹄下的血腥暴政」、「全世界自由民众要众志成城」——你常常会有一种奇怪的感觉,仿佛面前的不是一个有血有肉的人,而是一个提线木偶……使用这种陈词滥调的演讲者,正在逐步把自己异化成一部机器。他的口中吐出恰如其分的言辞,但他的大脑却置身事外,仿佛这些都是自己精心挑选的词语……
选词的根本原则,在于让意义引领词语,而非被词语左右。散文创作最忌讳词语的奴役。思考具体事物时,我们往往先有一个无言的概念,然后才去搜寻贴切的词语,用语言勾勒脑海中的图像。但面对抽象概念,我们常常一开始就借助词语来思考。如果疏于警惕,陈词滥调就会自动浮现,主导表达过程,模糊甚至歪曲原本的意思。或许,最好尽量推迟使用词语,先在心中厘清意象和感受,然后再去寻找恰如其分的表述。
Charles Sanders Peirce 大概会赞同上一段的观点。通往真理的路径不止一条,思维方式殊途同归。
愚蠢的反面并非智慧
原文:https://www.readthesequences.com/Reversed-Stupidity-Is-Not-Intelligence
「……于是,我们在那条时间线上的人开始采取纠正措施。看这里。」
他清空屏幕,键入一连串指令。一页页报告出现在屏幕上,全是声称目击过神秘飞碟的人们,读起来一份比一份离谱。
「这是标准的混淆手法。」Verkan Vall 笑道。「我只听过几句关于『飞碟』的闲言碎语,还都是玩笑话。在那种文化里,要抹黑一个真实的故事,只要编造十个明显荒诞的类似故事就好了。」
——H. Beam Piper,《警察行动》[1]
Piper 这番话在理。就我个人而言,我并不相信这片地区潜伏着什么露出马脚的外星人。但我不信这些并不是因为飞碟邪教令人尴尬的非理性思维——至少,我希望如此。
你我都认为,飞碟邪教的出现与实际飞碟的存在完全无关。事实上,由于人类的愚昧,几乎任何观念都可能催生出邪教。这种愚昧与外星人的干预互不相关:无论飞碟是否真实存在,我们都可能会看到飞碟邪教的出现。即便真有一些藏得不太高明的外星人,飞碟邪教出现的可能性也不会因此减小。条件概率 P(邪教|外星人存在) 并不会低于 P(邪教|外星人不存在)——除非你假设那些藏得不太高明的外星人会故意打压飞碟邪教。根据贝叶斯证据的定义,观察到「飞碟邪教存在」这一现象并不能成为反对飞碟存在的证据。这一现象对任何一方都算不上证据,无论是支持飞碟存在或是反对。
这体现了一条基本原则,正如 Robert Pirsig 所言:「即便世上最愚蠢的人说太阳在发光,太阳也不会因此而熄灭。」[2]
如果有人在回答是非题时的错误率高达 99.99%,那只需将他的回答反过来,就能获得 99.99% 的正确率。要想做到如此稳定的负相关,必须付出极大的努力,收集和现实紧密相关的有效证据,并清晰地整理出其中的条理。要做到如此极致的愚蠢,反而需要超人的智力。
一辆发动机故障的汽车,无论其损坏有多严重,都不可能倒着飙出 200 迈的时速。
既然愚蠢与真理之间的负相关性都不可靠,那人性的邪恶与真理之间就更不应该存在负相关了。光环效应的反面是恶魔效应:一切负面品质都是互相关联的。如果斯大林是邪恶的,他说的每句话都应该是错的。你总不会想认同斯大林吧?
斯大林也相信 2 + 2 = 4。然而,如果你支持某个来自斯大林的言论,哪怕只是「2 + 2 = 4」这样再明显不过的真理,人们只会觉得你是在「认同斯大林」,笃定你必然站在他那一边。
这一原则可以引申出以下推论:
-
要想真正反驳一个观点,就应该直面那些来自最强大的支持者所提出的最有力的论据。与弱小的支持者辩驳毫无意义,因为即使是最有说服力的观点,也总能吸引一些论证能力较弱的追随者。要想反驳超人类主义或智能爆炸理论,就必须直接挑战 Nick Bostrom 或 Eliezer Yudkowsky 在 2003 年之后的观点。直面最具挑战性的反论才是唯一有效的论证方式。
-
有些可悲又可怜的疯子,因认识接触到某个理念而陷入精神错乱,并不能证明这个理念本身有问题。许多新时代运动的信徒都因为认识接触到量子力学而变得更加疯狂。
-
曾有人说:「并非所有保守派都很愚蠢,但绝大多数蠢人都是保守派。」这句话无论对错,作为对保守主义的批判,都显得毫不相关。无法达到如此境界的人都尚不具备理性思考政治的能力。
-
人身攻击不是有效的论证方式。
-
你应该能够在不提及「希特勒企图灭绝犹太人」的情况下,反对种族屠杀。如果希特勒没有鼓吹种族灭绝,屠杀就成了正当行为吗?
-
用 Hanson 的话说:你下意识愿意相信的事情,很大程度上取决于你是否愿意与那些以笃信此事而闻名的人站在同一阵营——而非这些事是否属实。一些人之所以不愿相信上帝不存在,并非是因为有证据支持上帝确实存在,而是因为他们不愿与理查德·道金斯或其他到处高呼「上帝不存在」的「激进」无神论者们为伍。
-
假如你的电脑突然罢工,你不能就此认定当前系统的一切都是错的,非要换个没有 AMD 处理器、ATI 显卡、Maxtor 硬盘或散热风扇的新系统不可——即便目前由这些东西组成的系统出了问题,说不定只用换掉一根电源线就能解决。
-
就算试图用金属、木头和帆布造飞行器的一百个发明家全都失败了,也不代表你得改用骨头和肉造飞行器。同理,即便上千个基于电力计算的人工智能项目最后都无一例外地失败了,也不能就此认定电力是罪魁祸首。在准确诊断出问题症结所在之前,简单地反其道而行之,很难阴差阳错地获得成功。
正义之为天平,理性之为笔记
原文:https://www.readthesequences.com/The-Scales-Of-Justice-The-Notebook-Of-Rationality
[正义女神](https://en.wikipedia.org/wiki/Lady Justice)手持天平的形象随处可见。天平具有如下特性:一端下沉,另一端必然上升。这使得事情看起来一目了然,判断轻而易举;这也经常会导致事实被严重歪曲。
人类辩论时,有一种天然的倾向,往往将讨论等同为一种斗争形式,是战争的延续,是竞技体育。对于竞技体育来说来说,你只需记录双方的得分。阵营只有两方,甲方得分必然意味着乙方失分。听众们在心中默计每一位辩手的得分。到辩论结束时,得分多的一方显然就是赢家。赢家的观点皆为真理,败者的看法必然全错。
「风险和收益判断中的情感启发式」研究了这一问题:人们在评估判断某项技术(例如核电)的利弊时,是否容易将其混淆为自己对该项技术的整体好恶。[1] 举例而言,假设我先告诉你,与其他设计相比,某种核反应堆的设计产生的核废料更少。但随后我又提到,该反应堆的稳定性不如其他设计;一旦多个环节同时出问题,发生反应堆熔毁的风险更高。
如果反应堆发生熔毁的风险更高,这似乎是反应堆的「失分点」,或者说建造反应堆支持者的「失分点”」。而如果反应堆产生的废料更少,这又成了支持修建反应堆的「得分点」。那么,这两个事实是否非此即彼呢?并不是。现实世界并非如此。在一场辩论中,持不同立场的双方可能会分别援引这些事实,来为自己的阵营辩护;但从逻辑上讲,事实本身并无立场之分,不会对任何一方有所偏袒。
从物理事实来看,某个反应堆设计具有非能动安全性(即使周围如冷却等系统发生故障,也不会打到超临界状态)(*译注:非能动安全(passively safety)在核电中一般指不依赖外来的触发和动力源,而靠自然对流、重力、蓄压势等自然本性来实现安全功能。),并不一定意味着该设计产生的废料更少,或者发电成本更低。这些都是优点,但分别都是不同的优点。反应堆会产生多少废料取决于其物理特性,又有别的物理特性使得核反应更不稳定。即便某个设计同时影响了多种因素,我们仍然需要分别评估反应堆熔毁的概率和预期每年核废料产生的总量。这是两个不同的物理问题,有着不同的事实答案。
然而,正如上述研究表明,人们往往仅凭一种整体的好坏感受来评判技术,乃至许多其他问题。如果告诉人们某种反应堆设计会减少废料产生,他们就会认为该设计也能降低熔毁发生的概率。这意味着,对于有明确事实答案的物理问题,人们会因此得出错误的答案,因为他们将多个从逻辑上来说截然不同的问题混在了一起——将客观事实等同于战场上敌对阵营的士兵,以为任何一方的士兵都可以拿来对付另一方的士兵。
如果正义女神只是在调查一个严格的事实问题,要么有罪,要么无罪,天平倒也并非完全不合适。张三要么杀了李四,要么没杀。E·T·贾恩斯(*译注:全名 Edwin Thompson Jaynes,物理学教授,大力提倡将概率论解释为逻辑的延伸。详见:https://en.wikipedia.org/wiki/Edwin_Thompson_Jaynes)告诉我们,所有的贝叶斯证据都是由各个假说之间流动的概率所组成的;除非其他假说相较之下表现得更好或更差,没有某个证据单独「支持」或「反驳」某一假说的这种说法。因此,当正义女神只需考量单一、严格的事实问题,作出非此即彼的判断时,手持天平算是得体。如果正义女神需要斟酌更为复杂的议题,就应该放下天平,抑或收起宝剑。
不是所有议题都能简化为非此即彼的对错判断。理性女神会手持笔记,将那些不偏袒任何一方的事实一一记录。
还有两条要摒弃的学校思维
原文:Two More Things to Unlearn from School — LessWrong
发布于 2007 年 7 月 13 日
Ben Casnocha 在《三件要从学校里要忘掉的事》一文中提到了 Bill Bullard 总结的三个有害的思维习惯:看重个人意见、解决给定的问题和渴求他人认可。虽然我对 Bullard 给出的替代方案不以为然,但他确实指出了一些关键问题。
学校里灌输的有害思维习惯不胜枚举,我就说两个我最深恶痛绝的。
我认为,学校教给学生的最危险的思维习惯是:哪怕你根本不懂,也要鹦鹉学舌地重复答案。认识到自己的困惑和无知,是最基本的生存技能之一,而学校教育却在扼杀这种宝贵品质。学校告诉学生,只要能在考试里正确作答,就算「学会」了。但这离真正吸收消化知识,使之内化为自我认知,相去十万八千里。学生养成了这样的习惯:吃东西就是把食物放进嘴里;考试测不出咀嚼或消化的能力,所以他们就饿着。
这个问题很大程度上可能源于学生每学期需要修三门四学分的课程。每周都要学习一章教材内容,还要完成作业。这些课程的时间安排与疯狂死记硬背简直天生一对,根本不可能在同一时期深入思考和从容消化知识。大学生不被允许感到困惑。如果他们开始说:「等等,我真的理解这个吗?也许我该花几天时间查阅相关论文,或者参考另一本教材」,他们就会挂掉那学期的所有课程。一个月后,他们对这些材料的理解会深得多,记忆也会更加持久。但期末考试后一个月已经太晚了,在大学那套荒谬的评价体系中,这毫无意义。
许多经历过这个过程的学生,遇到不懂的地方,甚至意识不到自己有困惑,或察觉出在他们的理解中的缺口。他们被训练成了无法停下来思考的机器。
我记得在哪看到过,某国学物理的人更容易成为极端宗教狂热分子。我很纳闷,不就是学个物理吗,怎么能把人变成狂热信徒?后来作者解释说,物理专业灌输的都是标准答案,学生时间久了就养成了盲从权威的习惯。
向学生灌输大量权威知识可能是危险的,尤其当这些知识本身是正确的,因为它可能削弱学生质疑权威、独立思考的能力。
那么该怎么教呢?也许可以讲授物理学的发展史,告诉学生每个理论是如何被新的正确理论所取代的?「看,这是旧理论,这是新理论。新理论通过这个实验战胜了旧理论!」如果把这个过程重复讲十遍,学生学到的思维方式是什么?他们只会觉得「新理论总是战无不胜的,物理学中每个新观点最后都会被证明是正确的」。这样并没有传授批判性思维的方法,因为你只是在用后见之明看待历史。你无意中培养了学生一种肤浅的认识:对错很容易判断,非常简单明了。只要新观点略有可取之处,那它多半就是对的。
我们也许可以尝试从历史发展的真实视角来教授物理学史,而不是站在上帝视角去评判:向学生展示当年物理学家们争论不止的各种理论,再现那些曾经被认为有道理的不同观点。
教学中可以避免直接把标准答案告诉学生,而是给他们展示一些貌似合理的物理公式,让他们自己去判断哪个才是正确的,或是设计实验来验证不同理论。这样的挑战不像让学生凭空发现问题、创立新理论那么困难,但相比被动记忆权威知识,已经是一个巨大的进步了。
如此,你就可以培养学生这样一种思维习惯:「权威的观念往往有缺陷,但要找到更好的新观点殊非易事。大部分变革尝试都可能以失败告终,尽管每一次进步都必然源于变革。」
为什么学习的同时不该记笔记!—— 三个致命的原因
原文:3 Fatal Reasons Why You SHOULDN'T Be Taking Notes When Studying - Master How To Learn
摘要
3 个原因:
-
忽略机会成本 —— 还有更多学习方法远胜于记笔记
-
行动与目标不一致
-
把「忙碌」当作「有用」。
补充信息
这里所说的「记笔记」是指自学时做笔记:写课本内容的总结,在笔记上标记重点,之后反复阅读来复习。我指的不是在课上或讲座上记笔记,总结教授或者老师的课堂内容。
标记重点:在这篇文章中,特指在笔记上标记重点,而不是在课本上标记,因为有的文献指的是这个
总结:将教科书的内容重写为你自己的简化版本。
反复阅读:反复阅读笔记来复习。
「记笔记」的文献综述
让我们再来看看这篇论文,用有效的学习技巧提高学生的学习能力。从这个表格中,你可以看到,「标记重点」、「总结」、「反复阅读」的效用均评定为「低」。
记笔记则把雷踩了个遍,因为其中有三种最无用的学习方法:标记重点、总结、反复阅读。坦率地说,记笔记完全是在浪费时间。你不必相信我的话,自己看看这篇论文的结果吧。
1. 机会成本
许多年前,我不断研究如何更好地记笔记。遇到康奈尔笔记法后,我笃定这是最佳的记笔记方法。但 …… 我从未质疑这方法本身的有效性:
我到底应不应该记笔记?
你每一次选择都要付出机会成本:选择一个机会,便舍弃其他潜在机会的最高价值。考虑到这一点,问题便不是「如何做笔记」,或「怎么记才更好」,而是「应不应该记笔记」。
在本案例中,当你记笔记的时候,机会成本就是做练习题或复习抽认卡。你放弃了其他效用高的学习方法(如间隔重复、测试练习),乃至效用中等的方法(如详尽询问、自我解释和穿插练习),而采用了效用低的学习方法,即标记重点、总结和反复阅读。「记笔记」就像在你面前摆放一堆金子,一堆银子,然而你却选择了空塑料瓶 ......显然是不值的。
注意
如果你执着于做笔记,请使用康奈尔笔记法,其笔记结构迫使你去思考和处理文本。这比通常的要点法要好(右)。
2. 南辕北辙、瞄日射月(非故意)
对记笔记本身有个问题 —— 你为什么要记笔记?「因为我想为我的考试做准备,以获得更好的成绩。」但现实是,你所做的事情对你的目标没有任何帮助(即使有也不多)。你的目标(更好的成绩)和你采取的行动(记笔记和随后的重复阅读)是不一致的;记笔记不会让你获得更好的成绩。
假设你正在学习生物学,必须了解心脏的解剖结构。你照着课本临摹,在笔记本上画出你自己的版本,认为这会帮助你学习。实际上并非如此。
虽然绘图的目的是促进生成性的处理,但学习者可能不善于绘画,进而可能会产生不相干的认知加工,浪费了有限的加工能力,却对学习目标毫无用处。
在这篇文献中,绘图只意味着将心脏的描述转化为图形表示。如果你只是把心脏从课本上临摹到你的笔记上,那就更糟糕了——这对你的目标几乎无用。无论它多么逼真漂亮,都无济于事。为什么呢?想想你的目标:希望在考试时能回忆起心室(心房、心室)的名称,记住血液流动的方向,了解背后的机制。但你正浪费时间在笔记上复制、美化心脏。你要做的是练习对目标答案的提取,而不是(对一个心脏)完善你的绘画技巧。它没有任何作用,除非是为了画画 —— 而你的笔记上现在有它。除了图形笔记,要点笔记也是如此。(请看第二部分的进一步阐述)
那什么是真正有效的?
对于概念性知识,你要通过渐进阅读来一边阅读一边学习,然后在 Anki 或 SuperMemo 中创建填空/问答题,记住所读内容。
对于图形性质的图画,使用 Anki 中的图片遮挡插件或 SuperMemo 中的图片遮挡模板。当天先测试一次,隔几天后再来一次,然后是几周后。之后,你可以来一次「头脑倾泻」:在不参考课本的情况下,纯粹凭记忆画出心脏。这么做与单纯把图形从课本抄到笔记本上截然不同。
3. 认知偏差:「水磨工夫」,以为有功
无功之劳感觉像是下功夫了,但并不有价值或者有用。多任务处理是完美的例子:在各种任务之间来回切换会让你感到忙碌和富有成效,但其实完成没有多少(高质量的)工作。做笔记也是如此。
这种感觉危害尤甚,而且难以克服,因为虚假的成就感和进步感会笼罩着你。你记了整整一个小时的笔记,看到你的劳动成果(一页又一页的漂亮笔记)摆在你面前,便感觉极佳,成果满满,着实辛苦。你认为「我已经学习了」或「我已经看过一遍材料了」,但这种感觉受到你对学习的错误判断影响,已然被全盘误导了。
用荧光笔标记重点是「水磨工夫」,写要点是(很大程度上)也是「水磨工夫」,反复阅读你的笔记也是「水磨工夫」。你抄了多少重点或是高亮了多少笔记,均不是学习效果的有效指标。学习 ≠ 无功之劳;完成任务 ≠ 完成「合适」的任务。
解决方案?
干脆不记笔记,开始用 Anki 或 SuperMemo 吧。参考上面的表格,选择效用高的方法,比如间隔重复、练习测试;或效用中等的方法,如详细询问、自我解释、穿插练习。看看我的其他文章以了解有关 Anki 或 SuperMemo 的内容。
为什么我不再向我的朋友介绍 Anki/SuperMemo?
原文:MasterHowToLearn - Why I No Longer Tell My Friends about Anki/SuperMemo
图片来源:Joshua Ness , Unsplash 平台
Eliezer Yudkowsky 的这篇《谨防他山之石》极具启发性,我建议你从「向朋友推荐 Anki」的角度来读。此文是关于提供学习建议的问题。
向世界传播「福音」
如果你深深地相信某件事情,感觉好像「如果每个人都这样做,世界就会好得多」,并试图说服其他人去做这件事,那么你会意识到,要改变别人的观点或行为几乎是不可能的。
也许你没有那么雄心勃勃地想要说服每个人,所以你从小事做起:你把你的信仰分享给你的朋友,但后来发现没有人真正关心,也意识不到重要性。用一个温和点的例子来说,就像播放你最喜欢的电视节目,他们却毫不在乎。
我对实证学习策略的信心,来自于我的个人经验和我的元学习清单。我全心全意地相信,像 SuperMemo 和 Anki 这样的间隔重复软件(SRS),是有效学习和高效学习的关键。如果你相信教育是未来,那么无论是对于个人还是集体,实证学习策略的知识就是开启这个未来的一把大钥匙。
「每天都这样做似乎很累。」
两年前,有一次我正在用 Anki 复习。有位朋友瞥了一眼,对我正在做的事情起了兴趣。
我们一边吃午饭,我一边给她简单演示。我非常热情地谈论了间隔重复基本的记忆科学以及 Anki 的操作。当然,我还给她看了那条臭名昭著的遗忘曲线:
她听到终于有可能掌握一门外语的时候很兴奋。但有一点她很困惑:
「如果我没有学过,我怎么能回忆起它呢?」
所以我解释说,目的是学习的评估(测试充当学习的手段)与考核学习的评估(检查你学到了什么)是不同的。「回想」这一行为本身就是学习过程。然后我意识到,她的困惑可能是由于对记忆的普遍误解,误认为人的记忆就像电脑内存一样:
人类遗忘、记忆和学习的功能结构与人造设备的相应过程是不同的。 [......] 我们认为我们和计算机的原理一样,我们倾向于认为,将自己暴露在信息和步骤中,这些信息或步骤便会存储(即记录)到我们的记忆中——信息会自发写入记忆里。
如果我们认为人类的记忆等同于计算机中的记忆,我们就不可能理解,从我们的记忆中提取信息会增加该信息之后的可提取性;相比之下,从计算机记忆中检索信息则对信息的状态没有影响。论记忆、遗忘和学习的共生关系
题外话:这个故事可能让你感觉我喜欢炫耀自己的知识。并非如此。我喜欢被证据说服,我以为其他人也是如此。但事实显然不是这样的。另外,我引用上述引文是为了说服读者。我没有用为了学习的评估和对学习的评估这样的短语来进一步混淆主题。
她看起来......很茫然。有点像这样:
我记得我当时非常兴奋,同时也很紧张,我甚至要斟酌用词,试图尽可能地简化这些道理。现在回想起来,我却适得其反了。
她很认真地听我说,说明她在思考并试图弄清楚,但我可以看出她仍然很困惑。而我越解释,她不知道的好像就更多 (就像在维基百科中不断点击超链接),她就越困惑,所以我就不再说话,不再让整个情况变得不舒服。下面的独白是我对她当时的想法的想象:
「他对这些东西这么热情,对自己这么自信,我觉得他是对的。」
「但我还是不太清楚他指的是什么。我确实想学习日语,然而他说的东西太令人困惑了......」
「我一开始确实很感兴趣,但我现在什么都不关心了。我干脆就假装我明白了,赶紧结束这场对话吧。」
我永远不会忘记她那时说的,
「每天这样做似乎很累。」
我当时像是说「嗯......」我之后没再问过她尝试 SRS 的进展。我想,如果她真感兴趣的话,遇到问题时她会向我寻求帮助的。不出所料,我们再也没有谈论过这个问题,我也再也没提过 Anki。
这些情况已经发生了无数次。我通常在外表上看起来平静如水,但内里却心如死灰。大家装作感兴趣 (可能是由于我很热情,看起来不感兴趣是不礼貌的),却从来没有真正花力气去使用 Anki。有些人会真的去尝试,做几张卡片,复习了几天,然后说,「我试过了,Anki 没用。」
可能是我想多了,但有时我感觉他们认为我说的东西没有价值,这像是对我的人身攻击。我知道这不是真的,它们当然是有价值的——我花了好几年时间来学习研究科学,并获得了使用 Anki/SuperMemo 的经验。可他们否定这个软件的时候,就像在否定我的知识和经验。
如何给出学习的建议?这是个难题。
#1. 没有人关心那么多,好吗?
当我第一次发现 Anki 时,我就想,「为什么我周围没有人知道这个?我得把这个分享给大家!」所以我就跟我的朋友们说起 Anki,但是没有人感兴趣。我向别人介绍过 Anki,每次都是非常令人沮丧的经历。(没想到吧,我还没说 SuperMemo呢。Anki 的学习曲线要平缓得多。Anki 都让他们觉得太难用了,如果我安利 SuperMemo,那还能成功吗?)
更新:我从来都不是一个传教士,而是碰巧有机会才跟别人讲讲 Anki ,就像这样:
在很早的时候,我的确有一次主动提起 Anki,给我最好的朋友提供些自发的建议。后来,我确实也在不少场合提到 Anki,但只是在时机合适的时候,就像上文的故事。
人们可能会对你精进技能或精通外语的方法感兴趣,但就是没有那么大的兴趣。他们当然也不希望突然进入小课堂去听学习和记忆的工作原理。
我从来不喜欢安利之后再跟进,问「Anki 怎么样?你用它了吗?」。感觉就像是传销。而且,由于大多数人甚至懒得购买和下载这个 App,他们的回答通常是:「我忘了。我之后会去试试的。」然后谈话就在尴尬中结束了。
#2. 我不确定我是否真的需要,好吗?
有时总在感叹「我想学习 X 或者我想获得更好的成绩」。你有多少次听到别人说想学习第二种外语?这就像那个一直说「我想减肥」的朋友。毕竟,他们可能只是在感叹,还没有准备好付出努力去改变。
试图说服别人使用 Anki/SuperMemo 就像试图说服你的朋友定期去健身房。你可以谈论运动/举重的好处,谈论运动后的感觉有多好,谈论你的工作效率会有多高,等等。但是,如果他们不首先尝试,什么都不管用,而且更糟的是间隔重复在短期不见效,因为使用间隔重复软件是终身的追求 (就像学习一样) :
间隔重复关注长远,这或许可以解释为什么显式的间隔重复很不普及:回报的硕果远在天边,百思不解;自律的代价近在眼前,实实在在。Gwern《高效学习的间隔重复》
#3. 你为什么如此热衷于此?
能够在 10 分钟的闲聊中,理解并意识到间隔重复软件的意义和应用的人,是非常罕见的。这与它的复杂性无关 (毕竟不是火箭科学),而是意识的问题:目前的学习方法是否存在问题,以及 Anki/SuperMemo 如何能解决这些问题。换句话说,如果我没有看到这些问题,为什么还要去改变?
我有一个朋友正在学习德语。她的笔记本上,一边抄德语词汇,另一边抄对应的英语词汇。我便给她展示了我的韩语 Anki 卡片:「看看这些美丽的图像!动图!句子卡!音频剪辑!大量沉浸式教学法!(曾用名:All Japanese All The Time (AJATT)),斯蒂芬·克拉申的输入假说!」然后我有另一个朋友,他正在为成为护士而学习。我便跟他讲 Anki的事:「用图像遮挡学解剖学!」我觉得我对他隐瞒 Anki(具体来说是图像遮挡)是错误的。在内心深处我想把这张表格拍他们脸上:
(图片来源:用有效的学习技巧提高学生的学习能力)
我在夸大其词,但你明白我的意思: 10 分钟闲聊太短,说不完意义和应用。事后看来,我所有的尝试本可以做得更好。
-
也许我太过笃信间隔重复软件,结果我表现得居高临下,全然一股「你不懂学习,得我来教你 」的气场。
-
也许是那些大胆的说法:「你将事半功倍。」(每当你听到这种说法时,有多少是真的呢?)
-
也许是这样的情况:他或她想要的只是有人倾听学习的困难,而不是一些真正的意见或建议。
这是我如何在没有去意大利便能通过非常困难的 [...] 意大利语考试——小贴士:326,538 次抽认卡复习很管用。帖子里的楼主
像许多语言教师一样,V. 从未听说过 Anki (但她知道 Reverso Context )。我向她展示了我如何学习意大利语和日语词汇。值得称赞的是,她确实下载了这个软件和一些牌组,想要自己试试。我相当肯定我离开两天后她就停止了。她声称对话是学习语言中最重要的事情。虽然我在某些方面同意,但对话不可能涵盖一门语言的所有词汇。
#4. 你的朋友需要亲自体验 Anki/SuperMemo 的魅力
这一点是上面的推论:你的朋友不理解你的炒作,因为他们没有亲自体验过 Anki/SuperMemo 的魅力。即使是 Michael Nielsen 也很难坚持使用 Anki。正如他在《增强长期记忆》中提到的:
我在开始使用 Anki 时遇到了困难。几个熟人强烈推荐它(或类似的系统),多年来我多次尝试使用它,但每次都很快放弃。现在回想起来,如果你想让它成为一种习惯,有很多障碍需要克服。
是什么让 Anki 最终「扎根」成为我的习惯?是我开玩笑启动的一个项目。多年来,我一直没有真正学会 Unix 的命令行,而我对此很沮丧。我只学到了最基本的命令。掌握命令行对编程的人来说如有神助,所以学好命令行非常值得。所以,为了好玩,我想知道是否能用 Anki 完全记住一本关于 Unix 命令行的(薄)册子。
Anki 能做到!
我选择了 O'Reilly Media 的《Macintosh 终端袖珍指南》,Daniel Barrett 著。我并不是说我真的记住了这本书的全部内容。但我确实记住了书中的许多概念性知识,以及书中大多数命令的名称、语法和选项。没记住的命令都是我想象不出什么场景下能用上的。但我确实记住了大多数我可以想象出用途的命令。最后,我大概完成了书中 60% 到 70% 的内容,跳过或略过了那些与我无关的部分。不过,我的命令行知识还是大幅增加了许多。
选择这个相当可笑但非常有用的目标,让我对 Anki 有了很大的信心。这让我很兴奋,让我明显感觉到 Anki 会让我很容易地学会那些以前对我来说相当乏味和困难的东西。这种自信反过来又使我更容易养成 Anki 的习惯。
这与 SuperMemo 的渐进阅读、Emacs 的Org mode、Vim、Obsidian、Roam Research、Arch Linux 或使用 SSD 而不是 HDD 的情况相同:你的朋友需要亲自体验这种魔力,才能被说服。这让我想起了这个 AskReddit 帖子:你能用不到 100 美元买到什么改变生活的东西?。当你看到这些评论时,你肯定会感到困惑:
弯曲的淋浴杆怎么能改变生活?
特大号的毯子?厨房里的锋利刀具?加重的毯子?垂直鼠标?改变生活?
你不认为它们能够改变生活,因为它们没有改变你的生活,但它确实改变了评论者的生活。甚至更普遍的是,你可能不理解为什么你的朋友对新的园艺技术感到兴奋,觉得刺绣很有趣,ASMR 很放松,或者火车很迷人。这和 Anki/SuperMemo 的情况一样。当然如果 Anki/SuperMemo 把他/她的成绩提高了几个数量级,其好处不言自明。
典型的 15 分钟对话是如何展开的
比如说,你的朋友很慷慨,愿意听你絮叨 15 分钟的 Anki。
\1. 5 分钟讨论当前方法(重复阅读/逐字抄写笔记)的问题
\2. 5 分钟介绍间隔重复的优越性。这是你展示遗忘曲线和 Anki 如何解决遗忘的地方。
\3. 5 分钟介绍 Anki 的基本操作:如何给卡片打分,如何用两种基本的卡片类型(填空和问答)制作卡片
根据我的经验,15 分钟是不够的,或者说,花多久都不够。说服本身就是一门艺术。我纯粹是出于利他主义才告诉别人 Anki 的。我很快就意识到劝说别人给我带来的挫折远比价值多,所以我就释怀了。
错误的直觉和偏见(关于学习)的问题是,它们是众所周知的难以纠正。了解我们如何学习:一个视觉指南
我同样存在认知偏差
我自己就不太接受别人的推荐和建议。人们有时会谈论并与我分享他们所热衷的东西。我就想,「好吧......然后呢......?」我会遵循他们的建议吗?不可能。我会做他们宣扬的那件事吗?通常不会。所以,当我在向大家传播 Anki 的福音时,我也受到了同样的待遇,我很理解。以其人之道,还治其人之身而已。我想说的是,人都很难改变自己的观点。如果你告诉我 SuperMemo/Anki 是一坨屎,我简直会气炸了。
结论
你应该停止向朋友推荐 Anki/SuperMemo 吗?我不了解你和你的朋友,所以我不能简单推而广之。那么,有什么启示呢?如果你向朋友介绍 Anki/SuperMemo,不要显得太热情 ,否则他们会吓跑的 (来源):
这是我开这个博客的原因之一:如果人们意识到我所说内容的价值,他们自然会被我的内容所吸引,所以我决定在网上分享我所知道的。也许有些人会遇见我的网站;然后有一部分人会感兴趣,并真的去试一试;然后另一部分人会发现学习的乐趣,体验到 SRS 的真正力量。
如果你想了解更多,请查看我的文章为什么 99% 的人从未学会如何学习以及如何成为那 1% 的人 (I)和 (II)。
构建更好的记忆系统
原文:https://michaelnotebook.com/bbms/index.html
Michael Nielsen 著,2022 年 11 月 23 日
我在记忆系统上投入了不少精力——我既是用户,也是研究者,还协助过新型系统的开发。记忆系统让我受益匪浅。但我也坚信,记忆系统仍有巨大的改进空间。我在下面的笔记中提出了一些改善记忆系统的主意,都不是新鲜事[1]。我估计大部分想法都不怎么样,可能需要很多迭代才能成型,或者必须依赖其他功能协助。但其中可能有一些想法,经过一些努力,会大幅改善记忆系统的质量。这些想法可以随意借鉴,将其融入你自己的系统中。
关于这些想法的由来:如果认真使用过记忆系统,并阅读过不少人类记忆的研究文献的话,这里面很多想法是不言而喻的。我并不是在说这些想法是更为重要的。有一些想法可能是新鲜而又有洞见的,如果事实如此,那么一部分功劳便要归功于 Andy Matuschak。我和他围绕记忆系统讨论了上百个小时。
预设读者:我主要是为我自己和一些朋友写这些笔记,目的是整理思绪,激发思考。不过,如果你对预设读者条件感兴趣的话:这些笔记假设你深入地使用过记忆系统(100 小时以上),并且你没有停留在学习单词之类的用途,而将其用于概念理解上。很多浅浅试用过记忆系统的人往往抱有不少误解:我在本文刻意没有澄清这些误解。我先前阐述过围绕记忆系统的设计的一些意见,我在此也不会重复。然而,有一些背景观点值得我提一句。
背景观点
我不喜欢常见的间隔重复表达:记忆系统常常被表达为「间隔重复系统」(SRS)。我自己也用过这个词。可是,间隔和重复只是完整图景的一小部分。我们所交互的系统塑造了我们的记忆和认知,这是更为高层的观点。借助精心设计的系统,我们能大幅扭转人类记忆的工作方式,并提高其方方面面。记忆系统不只是间隔和重复。
现存的记忆系统有哪里不好呢? 我在此列举几条,挂一漏万:耗时太久;会越来越无聊;不够鲜活;难以让人动情;测试不够有挑战性;社交元素不足;和生活的其他部分的关联不够紧密;记忆系统往往是为了记忆零散事实,而非练习真实的技能(比如运动技能、感知技能、社交技能、情感技能);记忆系统的卡片无法对应真实的应用场景;对于深入处理材料的支持完全不够2;人们往往过于偏向记忆事实,而不是构建抽象思考,以及发展不同的理解方式。这里面很多想法可以表述为语调更加坚定的问题:
-
如何让记忆系统编码更加深刻的理解?
-
如何提高情感的投入?
-
如何增加社交元素,让记忆成为共同参与的活动?
-
如何将记忆系统与有意义的项目关联起来?
-
如何帮助使用者掌握记忆系统的用法?
常见批评:针对记忆系统有很多常见的批评之语。比较常见的:「死记硬背不是理解」(有几分道理,但如果对记忆系统使用得当则并非如此)「我用记忆系统记的都是我不太感兴趣的」(太常见了;别用了!)「我用来记东西好在聚会显摆,不一会就觉得无聊了」(同样,别用了);「在我身上没什么用」(可能是因为你没有用好,就像用脚弹奏小提琴一样;或者是他没有记忆需求)。我虽然列出了常见的反驳,但这些问题同样是有效的刺激。有哪些方式能解决这些问题,使其不再适用呢3?
老套的改进方法:在了解记忆系统之后,很多程序员会给出三种常见的回复:「我赌机器学习可以让提问题自动化,提高效率」「为什么不把笔记系统和记忆系统整合起来呢?」「为什么不改善调度算法呢?」这些想法很是老套,我往往对此嗤之以鼻,但这不是好习惯,也是我的一个问题。尽管试图实现这些想法的天真之举没有很显著的回报,但对其反复加以深入思考,往往能产出可喜成果。我在列出下列想法时试图偏向这些想法,而不是刻意躲避。
记忆不是目的:使用记忆系统的目的是让生活更美好,而不是为了记忆而记忆。暂且将目光转向另一种工具——笔记系统。笔记系统有一个常见现象,就是为了笔记而笔记。我知道有些人可以一连几个小时讨论自己的笔记系统,但是对于使用笔记系统来改善生活的其他方面,他们并没有多大兴趣。我姑且认为记笔记可以是有趣的爱好,这也挺好,但我对这些人的动机有些不解。制作这样一套系统是自我放松吗?这样的事在记忆系统上很少见(目前如此),但其发生不难想象。
很多容易衡量的指标相对来说并不重要;很多重要的东西很难衡量。很多改良商业产品和深入学术研究的关注点是容易量化的指标。找出「最优」调度,研究记忆反馈曲线之类。这便陷入了一个典型错误,也就是关注容易衡量,但并不是很重要的东西。在我个人的记忆中,几乎所有好处都源自于:更好地消化材料;写出更好的问答;更好地将记忆系统与我的生活和创意工作关联起来。这都是难以量化的——同样,围绕这些东西撰写学术论文,或者为下一次员工表现评估设立 OKR 也很困难。但我感觉,对于真切希望改善记忆系统的人,相比冲击一个个 OKR,这些难以量化的目标反而是更好的目标。
**「如果有个干劲十足的创意天才同时也是记忆系统的专家,他手上的记忆系统会是什么样的?」**我觉得这是记忆系统相关工作的正确问题。软件设计往往关注于刚刚上手的几个小时。然而你真正期望的是,用户使用软件 1000 小时或 10000 小时的时候仍有巅峰体验。钢琴似乎是主要面向专家设计的,新手能弹钢琴只是偶然之举4。如果你按照现代软件设计的思路设计钢琴,这台钢琴会只有 8 个白键,没有黑键和踏板。弹奏简单歌曲会很容易,但也仅限于此了。我们所期望的想法,应该是上限非常高,能够带来长期提高的想法。
简单有力且上限极高的想法:使用 Anki 的 90% 的价值,来自于做出记住/忘记的二元选择,影响可变的时间安排,并就此显示问题和答案,Anki 有不少新奇部件,但基本上都无关紧要。还有什么类似这样非常有力的想法?换句话说:我在下面列举了二十几个想法。将这些想法全部探索一遍可能很有趣。但我怀疑,若要开发更好的记忆系统,只需要找出单独一个非常有力的想法,并将其挖掘到底5。
关于记忆系统的一些想法
我在制作这个清单时有些保守,这挺有趣:我希望列出「好想法」,但好想法很难「有想象力」「激发灵感」。注意到这个现象之后,我便开始在清单中添了六七个有点「蠢」的想法。
-
记忆教练:使用记忆系统是一项技能。很多人写的问题相当糟糕——这就像钢琴新手弹不出好音乐一样。想象你每个月与教练见面 90 分钟,来让他帮你写出更好的问题。你也会讨论你应该问什么问题,不应该问什么问题,这些问题如何与你的人生目标和项目关联起来。可以远程与记忆教练交流。有一种变化较大的变体是与咨询师讨论你的卡片问题,不是为了提升问题质量,而是为了咨询。与之密切相关的概念是瑜伽和冥想教师。
-
作为更广泛的教学与咨询服务的记忆教练:很多教练和咨询师提供各种各样的课程安排。你可以设定一种课程包含 30 小时的面授时间,以及 100 小时的私下练习——结课之后,学习者便能达到「记忆教练水平」,将其作为自己的一项能力。6。
-
记忆课程:上面两个想法的变体,显而易见。
-
将驾照教学手册放进记忆系统里: 最好不要局限于 Anki 的方式,而是将记忆系统嵌入到文章中,可能就像助记媒介一样。可以反过来:也许交通部应该把完成助记媒介学习作为考核标准,这可比考试要求高多了7。
-
记忆系统卡拉 OK:你会收到随机选自他人牌组的卡片并要做出回答。这个想法需要一些迭代——也许这些问题都是你的问题的变体。这可以是个很好玩的游戏。具体实践有些困难,但我感觉「思维向量」可能有帮助。
-
记忆搭档 / 记忆伙伴:就像健身房搭档,或者 Strava 好友一样。你们要一起制作牌组,一起形成记忆习惯。共享进步统计图表,休戚与共。在记忆中加入社交元素会是天翻地覆的改变,或是更好,或是更早。(注:Strava 是美国的运动社交网络,类似中国的 Keep)
-
记忆点评网:解释你的问答卡:周期性向朋友或者观众解释你的问答卡,我觉得这个习惯能够对这些问答卡形成正向压力。想象反馈如何也挺有意思。记忆点评小组也挺好。
-
1 亿美元的助记媒介:我想知道,如果像 Substack 一样,有很多收入不菲的作者来撰写助记媒介,助记媒介会是什么样。如果有一个很棒的核心团队在不断改进这个媒介呢?想象一下首席记忆官,或者首席记忆教练之类的职位。(我和 Andy Matuschak 深入讨论过这个想法)。
-
付费来进行真实测试:最简单地:付费 50 美元每小时让一个人和你一起过一遍记忆系统牌组。你需要解释卡片的答案。如果他觉得你答错了或者在说瞎话,便会督促你改正,或者帮你提升你的理解,或者至少让你认清自己的理解水平。一种变体是,如果你答错了,他们会冲你大吼 :-) 。稍微正式的变体是将真实测试与认证挂钩。
-
加入音频:我经常希望我散步时 Anki 能把问题朗读出来,让我说出答案。改变交互模式可能会提升回忆率,这很合理,验证起来应该挺有意思。
-
展示时自动变化:类似地,改变字体、颜色、边距,改变复习的时间、地点、背景噪音水平,甚至是插入笔误,这些方法可能会有好处。
-
画出答案:我发现,DALL-E 之类的系统很难用来生成插画来描述问题。这类系统更擅长画出名词短语。但是问题经常包含很令人惊奇的名词短语,而答案是常见的名词短语。这或许可以利用。我感觉,有可能补充一些夺人眼球的插画,让记忆系统更有效。
-
让问题和答案能被执行(enact):这是很困惑我的一点。Anki 的上下文完全不对。如果我在学习新的 Javascript API,我不希望借助 Anki 这个上下文里捏造的问题和答案。理想的情况下,我希望在我的文本编辑器里,看见真实用例,并能执行这个答案。这些都应该遵循正确的调度安排。我不希望只有电脑中执行的任务如此。我希望所有我希望记忆的东西都如此。
-
诊断常见的坏问题种类:我估计,如果记忆教练为数千个问题写出简短评语,之后便能利用分类器或者大型语言模型来批判并改良问题。我对基于大型语言模型的记忆教练仍然持有怀疑态度。但是如果配合一些聪明的设计,这种思路应该行得通[8]。单纯是「你应该考虑删除这个问题、『如此如此』改善」这种建议已经很有用了。
-
我们需要更进一步:在我的记忆系统中,我有成百上千种策略来编码理解。这些策略在逐年演化[9]。很多记忆系统的深度用户同样声称如此。可惜,对于互相交流这些策略,我只有很少的手段:逐个策略解释;阅读别人的例子并思考「为什么他们添加了这个问题」;告诉别人,就我的经验来说,提问题是可以提升的技能。有时候,只要知道你可以在某个方面有提高,这就很有价值了。
-
记忆系统塔罗牌:我不知道这意味着什么,我只是有次突然想到这个。我估计 Tim Hwang 会有一些有趣的想法。
-
耶稣会记什么东西。同样是不知道意思的玩意。
-
为错误埋单:练习和回忆时的错误,记忆证明方面的不足,想成是 Stickk* 的记忆版本(Stickk 是一个习惯养成网站,用户付费给第三方,并指名裁判监督自己养成习惯的进度)。
-
让记忆系统漫布身边:如何让你一边在世界漫游,一边便能轻而易举地收集问题?我很喜欢在餐馆和各种陌生场所收集问题。我在某家餐馆的菜单上找到的最好吃的东西是什么?味道如何?体验如何?一顿饭的功夫很容易添加 10 到 20 个问题[10]。
-
记忆是共同参与的活动:这只是很泛泛的直觉泵(intuition pump)*。意义很大程度上是集体共同构建的。我知道,如果我要提升我的理解,我应该讲授给其他人,或者写出来,最好是在非常活跃的平台上(比如推特)。这个平台能够提升我对我的写作的情感反馈。由此看来,有你关心的人直接参与的讨论与写作,是记忆和理解的绝佳助手。(注:直觉泵是用来辅助直觉思考的思想实验,)
-
表演你的记忆系统:相关地,有其他人在的时候,人们的表现会更加活跃。有观众在场,各种情感的强度都急剧上升——无论是高昂的情感还是低沉的情感。如果你在练习弹钢琴时弹错了一个音符,一周之后你便将其到脑后。而面对一百多个朋友在台上演奏时,如果又弹错了这个音符,你会没齿难忘。我很讨厌「在社交媒体发表你的进步」这种老套的东西,但部分原因是大部分应用都做得太糟了。我觉得 Wordle 和 Oura* (某种程度上)做得的确挺好。我打赌,可以在记忆系统上实现得更好,一部分方法是要反最佳实践而行之(从而注重用户而非增长)(注:Oura 是跟踪睡眠和健康的应用,手环跟踪数据)
-
集成谷歌地图:我有个偏见是记忆宫殿只是怪奇之物。但可能并非如此。考虑如何扩展记忆宫殿的内涵会很有趣。也许借助 VR 和谷歌街景或者其他 3d 版本的世界。基本上如下:弄明白什么是非常好的记忆宫殿,并将其创造出来。我怀疑,记忆系统与间隔重复系统之间有很多交叉。记忆宫殿基本上就是特殊的处理知识的方式。我们还能找到什么其他方式?
-
Anki 卡片的 Instagram:不知道会发生什么。我打赌有人能找到办法做出耐看诱人的卡片。可能会是兼备两者糟粕的做法。
-
答错一题就要付十万美元:如果你要接受基于 Anki 牌组的测试——而且每答错一道题就要付十万美元,你的表现会怎么样?我感觉我会答得挺好。
-
**如何将记忆系统集成到 Figma?Google Docs?推特?如何集成到一般应用上? ** 说实话,在发现我的 Anki 用法和推特用法有很多重合之后,我十分震惊。我不知道应该作何感想。有时候推特可以用来进行渐进写作。更广泛地,我感觉几乎所有应用都可以认为是记忆系统。电子游戏在关注记忆有一些还算成功的地方,但大部分其他应用并非如此。
鸣谢
感谢 Andy Matuschak,我们围绕记忆系统开展了很多激发灵感的对话;感谢 Sebastian Bensusan,他鼓励我在脚注里发散思维。
引用格式
Michael Nielsen, "Building a Better Memory System", https://michaelnotebook/bbms/index.html, San Francisco (2022).
脚注
-
我不会给出精确的数字:我可能在未来增减这个清单。
-
我怀疑这是 100 倍的效果,甚至更多。
-
我喜欢「让记忆成为一种选择」的一点是,这句话基本上没有预设取向。人们对记忆的情感很强烈:他们或是觉得他们「应该」擅长记忆,或是感到强烈的厌恶。他们对于记忆在认知中的作用也有很多误解——记忆不重要,什么东西都可以查;需要记忆的东西用着用着就能记住了;或者相反地,他们过于推崇记忆,过于依赖记忆。有些想法有几分道理,但需要很多警告,否则危害会很大。为了记忆系统能够发挥作用,人们需要建立起记忆对认知作用的正确认知,之后再根据这些认知应用记忆系统,这样很有帮助。的确:有时候,正确运用记忆系统的方法就是不用记忆系统。但有时候你可能需要非常高强度地应用记忆系统。其中的制衡之道就是建立准确、感觉强烈的内化模型。讨论记忆系统时,一个关键挑战是帮助人们形成这样的模型。
-
我对此不是很确定,似乎很可行。但我肯定小提琴是这样的(尽管我上过一些钢琴课,但从没上过小提琴课)。如果有家庭成员在学小提琴,你就知道这个乐器学起来不简单。
-
我们所有强大的思想工具都是如此。写作、字母表、数学符号:这些工具的基础都是非常认真地对待数量很少的一些强力想法。同样,对于这些工具,你可以花上数千个小时来打磨提升。我们从五岁开始教孩子写作,但没有人能够真正掌握写作。
-
显然,这里有滥用的可能。但积极的可能性同样存在。
-
为了通过驾照考试,我将加利福尼亚州的驾照教学手册做成了 Anki 卡片。通过考试后,我把这个牌组删除了。我对此很后悔,因为这意味着,在我的记忆中,很多手册里的内容都消散了。
-
我怀疑,真正的问题是,如果建议是来自另一个活生生的人类,人们会更加认真对待这个建议。如果是大型语言模型给出建议则不然。
-
有一个策略是压缩理解。这个策略我很喜欢,也是很多其他策略背后的支柱。比如:「怎么用一句话简单证明代数基本定理?」这样的问题通常需要预先问出其他十几个问题作为准备。压缩理解并不是处处都可行的,但我发现这种做法很有价值。注意,这个问题违反了另外一个重要策略,也就是警惕唯一正确答案。「澳大利亚的首都是什么?」「是堪培拉」。这样的问题本身就只有唯一答案。但大部分有意思的问题都有多个答案,这也是很有价值的。一个更好的问题是「一句话简单证明代数基本定理的两个(三个,四个 ……)版本是什么?」之后就这些证明的关系添加问题。
-
根据经验,有些人会叫道「好可怕,为什么要这样糟蹋一顿饭。」如果你这样觉得,别用记忆系统就行。如果记忆系统让你的生活更美好,那就用。
概念发现故事
原文:Discovery fiction (michaelnotebook.com)
Michael Nielsen 著,2023 年 1 月 3 日
我发现,编写概念发现故事(Discovery fiction)能帮我理解科学研究的结果。这种故事描述的是,如果让我来,我可能会如何发现这个结果——会抛出哪些问题,产生哪些想法,怎样误入歧途,如何调转方向,以及怎么一步步得到最终结果。故事的每个环节都不应该是凭空出现的,而应该是简单,近乎显然的步骤。
我写过很多概念发现故事。比如我有一条关于「发现」印度-阿拉伯数字的推特帖子。我也有另一条关于「发现」量子隐形传态的帖子。我围绕如何「发现」比特币,以及如何「发现」布隆过滤器写过概念发现文章。我偶尔会在写书或者写更长的文章时添加这种故事。比如,我的第一本量子计算书的 6.2 节(与 Ike Chuang 共同编写),解释了读者可能如何「发现」量子搜索算法。
尽管概念发现故事很像说明文,但我写这些故事的理由可能更利己一些:我想通过这些故事来加深我自己的理解。比如在上世纪 90 年代,我注意到了赛博朋克,以及 David Chaum 发明的数字现金概念,我随后开始对加密货币感兴趣。接连几年对比特币有所耳闻后,在 2013 年我想深入理解比特币了。我读了比特币的白皮书,并发现粗浅地「理解」比特币很容易。我能读懂证明步骤,但假如把白皮书拿走,我不可能靠自己重新发明一遍比特币协议,尽管我因为之前感兴趣的缘故而熟悉很多想法。我对白皮书还理解得不够好。
为了加深我的理解,我写了一篇概念发现故事,开头便是一个问题:我们怎样能设计一种数字货币呢?之后,我描述了一个简明直白的数字货币想法——显然这个想法有很多瑕疵,是那种随手一想便能得到的,也是熟悉计算机的人认真想想就能得出的。之后文章指出了这个想法显然存在的问题,并提出了简单明了的解决办法。又指出另一个显然存在的问题。又提出一个简单的解决办法。如此循环,不断改进,最终我们「发现」了比特币!这种办法非常具体地描绘了比特币中每个部件是如何被引入的,为什么要引入,以及其目的;与此同时,哪些部件并不必要也显而易见了,我们也能知道有什么其他办法。相比之下,比特币白皮书就是把各种想法混在一起,更加庞杂。
概念发现故事会比普通的介绍文章长很多。这并不出乎意料:验证问题的解决方案,比找到问题更容易[1]。根据我的经验,如果两者描述的细节程度相同的话,概念发现故事会比普通的解释文章长 2 到 5 倍。这也就解释为什么这种故事不那么流行了:乍一眼这种办法更低效,甚至太过曲折。然而对于读者和作者而言,概念发现故事的好处在于,你对答案的来龙去脉更加清楚。而且我发现,写得好的概念发现故事读起来更容易,也更快,尽管文章更长。
当然,我并不是概念发现故事的原创者。伽利略 1632 年撰写的《关于两大世界系统的对话》,尽管并不是严格意义上的概念发现故事,但也八九不离十了。我第一次有意识接触到概念发现故事,是读到 Imre Lakatos 于 1976 年写的书《证明与反对》。在这本书里,Lakatos 逐步理解了欧拉多项式以及欧拉公式。这本书不是纯粹的概念发现故事——Lakatos 是哲学家,他要用作品传递自己的理念——但已经足够接近,可以作为例子。后来,很多科学家都告诉我,他们在教学和研究里都使用了概念发现故事。我之后也了解到不少得到出版的概念发现故事。我所知的最好合集来自于 Alessandro Cosentino 写的这个 StackExchange 帖子。Tim Gowers 写过很多接近于概念发现故事的内容,其中很多可以认为就是概念发现故事——比如他关于正规子群(normal subgroup)来源的讨论。[2]收集更多这种概念发现故事,乃至编写概念发现故事的历史,应该都会很有意思。
尽管这种文体由来已久,但「概念发现故事」一词似乎是我所创造的[3]。正是因为我发现这个词非常有用[4],我才编写了这篇笔记。这个词指的是科学成果的理想化文字载体[5],其目标和科学最常用的文字载体并不一样。比如,科学论文的目标(通常)是解释一项新的科学成果的观点,其证据和论证过程。论文并不需要解释假如有人想自己完成这一发现,他应该怎么做,除非这一过程对于验证成果的正确性是有必要的。如果什么东西不在论据和论点之中,那么就没必要写在论文里。结果,很多帮助读者理解结果论证过程的路标被移除了。我这样说,并不是在批评科学论文,也不是说论文「应该」成为概念发现故事。我只是想强调论文和概念发现故事的目标非常不一样[6]。
更令人意外的是,概念发现故事跟真实的科学史其实也大相径庭。实际的研究过程往往非常复杂,其中会用到很多依赖于特定条件的知识,也会遇到不少幸运的偶然。的确,很多人读完科学史,也没搞清楚研究是怎样做的。引用 Toynbee 的话,科学史有时候看起来就像是一个个随机事实[7]。相比之下,尽管好的概念故事可以尽情取用历史——作为灵感或者有趣的插曲——但这种故事并不必忠于历史。概念发现故事唯一的任务,是构建一个令人满意的理想化故事,讲述一项发现可能的发现过程。
并非所有发现都需要概念发现故事。有时人们会做一个动机明确的实验,理解起来也很简单,而结果也非常惊人。对此我们并不需要概念发现故事!但如果有个概念理解起来弯弯绕绕,其发现的路径并不清晰,那么概念发现故事就很有用了。我的大部分工作都围绕计算机科学、设计、理论物理。这些学科都关注发现新概念和难以找到的论证。因此这些学科都很适合概念发现故事。我估计其他科学学科的需求会有很大差异。
总而言之,概念发现故事的特征包括:
-
概念发现故事的目标是构建一个令人满意的理想化故事,讲述可以怎样合理地发现某个概念;
-
概念发现故事通常以一个简单的问题开头,这个问题对于受众而言应该是自然且动机充分的。这些问题可以是「比特币具体怎么运作的?」或者「我们可以怎么发现量子隐态传输?」,能自然地吸引相应的受众;
-
概念发现故事中的论证,其步骤应该简单且自然,是目标受众应该能自行做出的,此外
-
概念发现故事的目标受众可能只有一个人:作者自己。
我写这则笔记,是为了鼓励大家撰写更多的概念发现故事,比如将其用在解释性的论文,书籍,文章中;也可以新潮一点,比如写推特,发 TikTok 或者 Youtube 视频等,以及其他等待挖掘的媒介。此外,我希望有更多论文能采用这种文体。我个人非常喜欢阅读概念发现故事,我能从中学到更多(而且更快!)。
同时,我写这则笔记,也是为了强调概念发现故事对于研究工作和创意工作的用处。这是一个很有效力的视角,可以用来加深个人的理解[8]。在 2019 年,我写了那则关于量子隐态传输的推特帖子。在此之前我围绕量子隐态传输写了三篇论文,在实验室做过第一个量子隐态传输的实验,并讲过无数次讲座。我可以打赌我非常了解量子隐态传输。然而写了那篇帖子后,我的理解又提高了不少。这的确是我对概念发现故事感兴趣的原因:它是强迫我深入理解的一个视角。解释文章只是副产物。
你可能会奇怪,如果我认为概念发现故事主要是个人理解的工具,那么我的大部分概念发现故事是否是私密的呢?我的确有一些私密的概念发现故事,但我发现公开写作是更有用的办法:公开写作——无论形式如何——也是提升我思考能力的可靠办法。公开写作能提升思考能力的原因有很多,包括:(a)如果犯错了,你会很尴尬;(b)你会用目标受众的要求来要求自己。如果你好好选择目标受众,这两点都能促进你的写作质量,以及你的思考质量[9]。如果我是为自己写作,我的文字很多时候只是将结果粗糙复述了一遍。这是有用的,但我会糊弄自己,以为我理解得比实际更好。把目标受众想得更严格点,能让我对自己更认真。
通过概念发现故事提升理解的途径,还能说很多很多。我就再说两点。首先是一种变体,多重概念发现故事,也就是撰写多篇故事,描述同一个概念可能有哪些不同的发现途径,这些故事的初始想法往往非常不一样(但并不一定)。工作量很大,但其结果可能会非常有趣——我会感到自己非常熟悉这个话题,特别是我写了三个或更多概念发现故事的时候。第二点是,我发现如果结合记忆系统,撰写概念发现故事会快乐得出人意料,我在这里有所描述。
正如其他文体一样,概念发现故事也有好坏之分。有人问过科幻小说作家 Theodore Sturgeon ,为什么 90% 的科幻小说都是垃圾。他回复道,当然有 90% 的科幻小说是垃圾:所有东西的 90% 都是垃圾。多年以前,Bret Victor 写过一篇介绍《可探索的解释》的精彩文章。在此之后,很多人尝试过撰写这种可探索的解释。正如 Sturgeon 定律所述,大部分作品都差强人意。但 Sturgeon 定律可能都言轻了。大部分尝试编写可探索的解释的人,是对这种文体感兴趣,而不是对他们所编写的内容感兴趣。当然,这种人写出的东西并不好[10]。我必须承认,对于概念发现故事,我也有关于这方面的担忧:我希望这个词能流行起来,而且有更多人会写这种故事(即便这个词并没有流行)。但我希望编写概念发现故事的人,是对写出好东西感兴趣,而不是仅仅想要尝试这种文体!
上文中,我将概念发现故事描述为一种满足了一些标准的理想化文体。当然,我并没有暗示这种故事「必须」是纯粹的。上文并不是规范的格式描述:这不是俳句或者抑扬五步格。我其实是在命名并描述一种文体,已经有少数人正在日常使用,偶尔会有更多人使用。的确,「优秀的科学论文作者」,会在论文里加入「阐明动机的话语」。大部分时候这种说法意味着他们加入了一些概念发现故事。但我想看到更多的概念发现故事、更多的人意识到它们对于提升个人理解的用处。
鸣谢
感谢 Andy Matuschak 和 Grant Sanderson,我和他们开展了很多关于概念发现故事的讨论。感谢推特上的朋友们,是你们鼓励我写出概念发现故事。本工作由 Astera Institute 支持。
脚注
-
我并不是说概念发现故事仅仅是描述某人如何发现了某个阐述清晰的问题的解决方案。的确,发现之旅最有趣的部分是发现需要被解决的问题。其起点可能是一个半生不熟的直觉,或者另外一个毫不相关的问题——所以概念发现故事除了要包含解决方案,还要涵盖发现问题的过程,甚至是问题背后的基本概念。你可以在我写的印度-阿拉伯数字的概念发现故事里看到。
-
我猜——虽然我对我自己的动机不够清晰——这是我对这种文体的兴趣经年不衰的原因。
-
我在不少地方非正式地使用了这个术语。本则笔记则对其进行延伸讨论。
-
Timothy Chow 有个想法是解决一个悬而未决的解释问题,我也觉得这个想法很有帮助。
-
我的例子都来自于科学领域(包括数学)。我估计这种文体也能应用于其他场景——如果论点或概念难以寻找,但容易验证,那么就不错——但我没有例子。我发现推广这种想法很有意思:我们怎样能「发现」简·奥斯汀或者道格拉斯·阿达姆斯的小说?这到底意味着什么?
-
当然,论文也能充当概念发现故事。我知道有些论文融入了不少概念发现故事的元素,但我不知道有什么论文的初衷就是兼为研究论文和概念发现故事的。
-
一个很有名的故事是,奥古斯特·凯库勒在梦到一条蛇咬自己的尾巴后,发现了苯的结构。拉马努金声称他的那些数学发现都来自于纳马卡尔的女神玛哈拉克希米。幸运的是我们不用亲身经历也能验证这些想法。科学论文容不下这种轶闻(除非作为点缀),但这些故事在科学史中很重要(但我不确定这有什么影响),对概念发现故事可能也很有用。
-
根据以往经验,这个技巧会被分类为「解释技巧」,尽管我会尽可能将其描述为加深理解的技巧。我觉得这有点恼火。
-
大部分设想中的受众可能都一样。但我敢打赌,如果受众选得太糟糕,最终的作品可能也会不尽如人意。一些人为了在推特上最大化参与度和影响力而写作,他们的思维能力也会下降。
-
很多思想工具的相关工作都有这个问题:这就像一堆对木工不感兴趣的人造了大把的锤子,他们也意识不到他们做的这些工具根本没用。
我的记忆系统使用方法
原文:How I use memory systems (michaelnotebook.com)
作者:Michael Nielsen
引言
初版发布于 2023 年 7 月 20 日。我将持续补充更多实践经验。这篇文章主要是我此前关于记忆系统的文章的续篇或进阶版。
你是否知道记忆系统可以用于:理解研究论文、协助撰写书籍、拓展视觉想象力、辅助数学证明、增强同理心,以及其他众多用途?
我已经将记忆系统应用于以上所有领域,甚至更多方面。大多数人通常认为记忆系统仅仅是用来学习外语基础词汇的工具。然而,我发现它的应用范围远比这宽广。它可以作为一种强大的工具,帮助我深化对陌生领域的概念理解,促进创新研究,支持艺术实践,甚至改善个人生活。
本文档详述了一些使用记忆系统的实用技巧,旨在帮助他人更充分地发挥此类系统的潜力。这里所列的每一项都是经过实践检验的方法,而非纯粹的理论推测[1]。我举例说明了在记忆系统中使用的问题和答案——主要是我日常使用的 Anki 卡片[2],而非虚构的范例。我热切期待其他记忆系统使用者分享他们在实际生活中验证过的策略。欢迎大家在本文档相关的 Twitter 讨论串中回复,交流这些策略。同时,我也希望看到其他深度使用记忆系统的人能够撰写类似的文档。就我个人而言,这样做所获得的回报远远超过付出:记录这些实践有助于我不断完善使用方法。坦白说,撰写本文的一个潜在动机是激发我在使用记忆系统时的创造力。需要说明的是,我在关于记忆系统的其他[文章]中已经描述了许多使用方法,因此本文不会重复那些内容。
Anki 是我首选的记忆系统,不过本文所述的许多方法也能轻松应用于其他记忆系统。尽管如此,我在文中常用「Anki」来泛指各种记忆系统。我没有使用任何 Anki 插件,虽然对 Anki 做过一些小改动,但具体内容已记不清,而且我认为这些改动可能并不重要,因为那时我只是在随意尝试,并非有意为之。我经常遇到一些人,他们不断地调整 Anki,却很少花心思去提高制作卡片的技巧。正如 Alan Kay 所说:「音乐不在钢琴里」。提高钢琴水平靠的是练习和学习如何更好地演奏,而不是不断调整钢琴。使用记忆系统也是如此:你应该专注于提高制作卡片的能力,而不是过分纠结于系统本身。事实上,我相信这类系统在设计上的重大突破,无论如何都将来自那些认真使用它的人。
记忆系统让记忆称为一种选择,还让我们可以选择塑造未来的自己,它是一种雕琢未来自我的方式。我在此分享的方法都是基于我对理想未来自我的构想而开发的。这有诸多含义,但最为重要的是:我努力只添加那些我真正在意的内容。诚然,有时难以判断什么是值得记忆的:我是在做一个明智的押注,相信未来的我会因为这些理解已成为自身的一部分而感到欣慰。掌握记忆系统的艺术,部分在于逐步提高这种判断能力。因此,我建议你浏览这些方法,专注于那些能引起你共鸣的部分。
唤起非凡情感体验的意象
Nightwish 是一支卓越的芬兰乐队,专长于「交响金属」音乐。据维基百科记载,他们是全球最成功的芬兰乐队。乐队的主要词曲创作者 Tuomas Holopainen 常常将科学理念巧妙地融入 Nightwish 的音乐和演出中。在 2015 年温布利体育场的一场演出中,他们以《地球上最伟大的表演》(The Greatest Show on Earth)这首长达 21 分钟的非凡曲目作为压轴。这首歌包含了著名生物学家 Richard Dawkins 的一段深刻独白,探讨了每个人类个体的非凡之处。
伴随着 Dawkins 的演讲声,镜头短暂聚焦在前排的一位女士身上。她正跟随着 Dawkins 的话语,仿佛沉浸在一种近乎狂喜的状态中。她的表情不仅展现出对所听内容的深度投入和强烈共鸣,还洋溢着幸福和放松。尽管这个画面仅有短短几秒,却给我留下了难以磨灭的印象:在我看来,她似乎同时经历着理性的升华和情感的震撼,通过对自然世界的领悟而触及到某种超越性的境界:
https://youtu.be/qrMwxe2ya5E
初次观看这段表演后,我迫不及待地与朋友们分享并讨论,尤其是这令人难忘的几秒钟画面。为了将这种独特的体验永久保存在我的记忆中,我制作了十多张记忆卡片。以下是其中的一部分[3]:
- 这张图片的出处是?
-
这是 Nightwish 演唱《地球上最伟大的表演》时的观众镜头
-
有什么图片能展现一个人同时沉浸在科学、自然世界,以及深刻的宗教体验中?
-
[上文提到的图片,此处不再重复]
老实说,我无法真正洞悉她的内心体验。如果是为他人撰写,我可能会这样表述:「我认为能展现…的画面是什么」。然而,在使用 Anki 时,我更倾向于直接陈述,因为这样能更加清晰地传达核心概念。必要的限定词通常会在后续内容中自然呈现。这种方法在创意工作中很常见,创作者往往希望快速构建大致的关联网络,努力捕捉事物的本质,之后再验证论点,补充注意事项等。
-
这位女士正在朗诵谁的独白?[图片]
-
Richard Dawkins
-
这位女士朗诵的 Richard Dawkins 独白主题是什么?[图片]
-
生命的独特性
-
这张图片出自何处?[图片]
-
出自 Nightwish 演唱会接近尾声时的场景
-
我觉得这位女士此刻的感受是?[图片]
-
[无具体答案 - 这是留给我自己去体会和思考的]
诸如此类,还有十多张相互关联的卡片。
我发现整个 Nightwish 的视频非常不同寻常,并且我已经多次观看视频和聆听这首歌。因此我想知道:我是否有必要使用记忆系统?另一方面,我相信创建卡片帮助我比原本更深入地理解我所看到的内容。我开始时只是模糊地感觉到「这真的很特别」;而制作卡片帮助我更深刻地领会到那种特别是什么[4]。事实上,反过来,这种意义已经成为我多次观看这个视频的原因之一。这是将 Anki 作为一种观察方式,或者说将 Anki 作为一种创造意义的方式。它使记忆在概念上变得更加丰富,尽管(当然)观看视频 ——甚至亲身在场——在其他方面更加丰富且更具情感吸引力。
我对许多其他描绘对我来说新奇的情感体验的视频和图像也经历了类似的过程。事实上,在同一视频的稍后时刻还有一个例子。Richard Dawkins——一个真实的、活生生的人(!)——已经走上舞台,正在朗读查尔斯·达尔文《物种起源》的结束段落。现在,常识表明你不应该让一位年长的科学家朗读科学专著来结束音乐会。但这种常识完全错误。观众成员脸上的表情非常不同寻常,又一次体验到敬畏:
我又制作了十几张 Anki 卡片,有些是关于那张图片的,有些是关于 Dawkins 的经历的,还有一些是探讨科学认知在我们生活中所扮演的角色的。
这种练习能达到什么效果呢?总的来说,它能让我更敏锐地察觉到自己正在经历一种强烈的情感体验,并尝试捕捉这种体验的某些方面。当然,我无法完全捕捉情感的全部丰富内涵——远远做不到!这更多是为了培养我的觉察能力,拓展我的欣赏范围,增强我的情感想象力和同理心。虽然我无法重现情感的全部丰富性,但至少可以做一些事情来唤起它。
这种方法的一个变体是基于电影《星际穿越》预告片中的一个静止画面:
这里的卡片有些不同。这不是我在观察一种不寻常的情感体验,而是我自己正在经历(对我而言)一种不寻常的情感体验,这种体验是由这张图片激发的。因此,我制作的卡片一部分是关于那种体验,一部分是关于视觉设计:
-
这张图片唤起了哪些感觉?[上面的图片,不再重复]
-
[没有标准答案:这是一个供人思考的问题]
-
这种并置有什么不寻常之处?[图片]
-
太空飞行与个人联系的并置
-
什么样的构图技巧能够将宏大而常显冷漠的主题(如太空飞行)与个人情感巧妙地融合在一起?[图片]
-
巧妙的拍摄角度和极远的距离,使得两者能同时呈现在画面中。
-
让我们驻足欣赏这张照片中两个看似互不相干的情感世界是如何巧妙对比的:[图片]
-
[无需回答:这只是一个引发思考的问题]
毫无疑问,我们对自己和他人的情感体验都极为敏感。这让我不禁思考,在这种情况下使用记忆系统是否恰当,也许直接依赖我们与生俱来的兴趣会更有效。虽然我在前文中已经简略提及这一点,但现在我想更深入地探讨一下。
1998 年,我在洛杉矶的街头漫步时,路过了一家摄影店。橱窗里展示着摄影师的一幅作品。这张照片显然在某个颇具声望的比赛中获得了第三名。照片中是一位身着婚纱的年轻新娘,正值她的婚礼当天。她背对着镜头,我们看不到她的脸,因为她正被年迈的父亲紧紧拥抱着。这位父亲是个亚洲男子,看上去平日里应该是一副严肃的面孔。但你能看出来:此刻他那严肃的面具已经崩裂,情感决堤,他泪流满面,正在送别自己的女儿。这是一幅令人震撼的画面,我驻足观看了也许有几分钟之久。我相信自己再也没有见过这张照片,但它在我心中留下了难以磨灭的印记。
这种深刻的情感烙印同样适用于其他触动人心的画面。无论是陌生人的经历、虚构或非虚构的故事,还是我们自身的体验,都能在我们心中留下难以磨灭的印记。我永远不会忘记意识到即将离婚时,镜中自己那震惊和悲伤交织的面容。我也永远无法忘怀教父告知我他的儿子因骑马意外身亡时,声音中那撕心裂肺的痛楚。这些经历,连同许多其他刻骨铭心的时刻,都深深烙印在我的记忆深处。
那么,进行这种记忆练习究竟有何益处?我认为,它主要在于帮助我们理解那些难以言喻却本能地感到重要的情感体验。例如,当我看到那位新娘父亲的照片时,我能够毫不费力地理解其中蕴含的情感。对我而言,这是一种极易解读的体验。然而,当我初次接触 Nightwish 的音乐或《星际穿越》的画面时,尽管本能地被打动,却又难以完全理解其中的含义。在这种情况下,制作 Anki 卡片成为了我赋予这些体验意义的一种方式,帮助我更深入地理解这些情感体验。当然,其他方式如与朋友讨论也有助于这个过程。因此,Anki 只是整个意义构建过程中的一环。尽管如此,它在让我们能够在日后重新回顾和体验这些情感方面具有独特的价值。更重要的是,这种方法还能拓展我们认知的情感体验范围,为我们的情感意识提供一个表达的出口。对我而言,这些都是无比珍贵的。
图像细致分析:通过添加图像拓展视觉想象力
我经常使用 Anki 来深化对图像的理解,并拓展自己的视觉想象力。我尤其关注那些令我印象深刻,却又难以说明其魅力所在的图像。比如,让我们来看看《指环王》电影中这张广为人知的 Frodo 特写:
和许多人一样,我被这张图像深深吸引,却难以言明其中缘由。于是,我决定在 Anki 中深入探究:
-
这张图像中的三个核心元素是什么?[图像]
-
Frodo 的面容、那只伸出的手,以及魔戒
-
这张图像如何浓缩了《指环王》的精髓?[图像]
-
它生动展现了 Frodo 与魔戒之间折磨而不稳定的关系
-
在这张图像中,谁是主体,谁是客体?[图像]
-
Frodo 和魔戒之间的主客体关系模糊不清
这个观察让我颇为自得——到底是 Frodo 在操控魔戒,还是魔戒在影响 Frodo?不过,我对这个表述还不太满意。这个想法还有提升的空间,进而可以让这张卡片更加完善。总的来说,Anki 的一个有趣之处在于它能将思考过程细化,为我们提供一个极其清晰的视角来改进思维。
-
图中暗示的手部不稳定性有什么深意?[图像]
-
它反映了 Frodo 与魔戒之间关系的不稳定性
为什么要在 Anki 中添加这样的卡片呢?某种程度上,我进行这种分析并非出于任何功利目的。我纯粹是因为热爱而为之;比起填字游戏,我更愿意沉浸在这样的思考中!我由衷地享受理解视觉文化的过程。
一个相关的问题是:为什么要用 Anki 来做这件事?毕竟,我可能会享受分析的过程,而不一定想把得出的想法都放入长期记忆。对此,我的理由也源于直觉。在成长过程中,我常被贴上「热衷科学技术的孩子」的标签。成年后,我有了一个顿悟:原来欣赏艺术也能给我带来与科技相似的认知、情感和意义体验。但我还发现,随着对视觉文化理解的加深,我从中获得的乐趣也与日俱增。将这些分析添加到 Anki 中,我感觉正在不断深化对我们视觉文化的理解。
举个例子:几十年前,我意识到艺术家们常常以独立的层次来思考。理解这一点花了一些时间和多个实例。从看到迪士尼动画师解释他们在传统手绘卡通中使用的多层动画板,到解析 Michael Bay 如何运用多层技术创造 "Bayhem"。理解这一概念后,我能更清楚地看到 Frodo 图像中的层次结构。因此,我乐于积累对视觉文化的理解,而 Anki 加速了这一过程。诚然,对很多图像我能自然而然地进行这种分析,不需要借助记忆系统。但有一类边界情况,我会发现某幅图像令人震撼,却难以明确其原因。在这些情况下,我经常会在 Anki 中添加 5 到 10 个问题,借此探索并(希望能)提升我对视觉文化的理解。
在骑健身车听有声书或外出办事时添加 3-10 张学习卡片
我发现一个令人愉快的习惯是早上一边轻轻骑健身车一边吃早餐。如果心情不错,我还会同时听有声书。有时,书中的某些内容会启发我制作 Anki 学习卡片。大多数时候我不会添加任何问题,但有时会添加几个——通常是 3 到 5 个左右。之后我常常会继续轻度运动,同时完成当天的 Anki 复习。这个习惯的一个常见变体是在外出办事时进行,比如早上步行去咖啡店的路上。
Anki 让事物更有意义;Anki 作为一种普遍(但不完整)的关注环境
哲学家 Agnes Callard 曾做出一个引人深思的观察:「Twitter 是一种关心一切的方式」。这个观点与我的亲身体验不谋而合。著名哲学家 René Girard 提出的模仿欲望理论认为,人类的欲望往往是模仿性的:我们倾向于渴望他人想要的东西。Twitter 恰好为这种倾向提供了便利,因为它让你能轻易找到人们热情讨论各种各样主题的场合。而且,一旦你参与其中,你会发现自己对那个主题越来越投入。它变得更加有趣,你开始越来越关心它。
实际上,你完全可以主动创造这种学习模式。假设你正在独自钻研某个冷门主题。就拿我最近的经历来说:过去几天,我一直在自学 DNA 纳米技术。这种独自学习的过程难免有些孤独。不过,我可以选择在 Twitter 上分享我的学习心得。我可以发布一个引人入胜的推文串,其中包含我真正感兴趣的问题和想法。随后,其他人会开始回复。很快,一个小型讨论组就形成了,几乎就像在举办一场小型学术会议。当然,如果你的粉丝数量恰到好处,这种方式会更加有效:根据我的经验,3000 到 50000 之间的粉丝数量最为理想。如果粉丝数低于 3000 左右,你可能很难得到回复(当然,这也取决于你的推文有多吸引人)。如果超过 50000,信息质量可能会开始下降:问题就变成了收到太多质量不高的回复。尽管有这些局限性,Twitter 仍然是一个绝佳的平台,可以就任何你感兴趣的话题召集一场「在线派对」或「虚拟研讨会」。反过来,这也使得我更容易对学习保持热情,并能更深入地沉浸其中。
Anki 则是,另一种以非常不同的方式,帮助你专注于任何内容的环境。
举个例子,在我开始使用 Anki 之前,我常常觉得阅读陌生领域的研究论文莫名其妙地毫无意义。我会投入大量精力阅读一篇论文,但半年或一年后再次想起这篇论文时,就会懊恼地发现自己几乎什么都不记得了,尽管当初付出了那么多努力。事实上,预料到最终会遗忘这些内容,甚至会影响实时阅读的积极性。这整个过程似乎有些徒劳无益。当然,现在你可以通过多种方式使阅读变得更有意义。你可以就这个主题授课,或者写一篇文章,又或者向一位对此感兴趣的朋友讲解。但这些方法都需要付出很高的代价。可能你的朋友们都对此不太感兴趣。而授课的成本更是极高:这既是它的优点,也是它的缺点所在。
我曾以为只有自己有这种奇怪的感受,认为这一定是我独有的缺陷。然而事实证明,这其实是一种普遍现象。我第一次强烈意识到这一点是在阅读数学家 Littlewood 的著作时。他指出[5]:「我尝试过学习自己感兴趣领域之外的数学,但每次间隔一段时间后,都不得不重新开始学习。」读到这段话让我感到欣慰:原来我并不孤单!当然,之后与他人的交流也证实了这种经历的普遍性。Littlewood 准确地指出了某种「动力」——我称之为关心或寻找意义——是这种学习的关键要素。他评论道:「有了强烈的动力,它会以某种形式传达给潜意识,而潜意识会完成所有实质性的工作,似乎永远处于待命状态。缺乏这种动力,人就会停滞不前。」
Anki 的一个奇妙之处在于:它大大降低了以这种方式「关心」的成本。部分原因是 Anki 给人一种掌控记忆的感觉。我从原本认为阅读论文毫无意义(因为几乎不会留下什么印象),转变为意识到一两年后我仍能记住论文中的大部分内容。这种长期的自我改变,这种成长的感觉,是有意义的。**Anki 提供了一个有意义的环境。**事实上,我们甚至可以进一步说:Anki 是一个创造意义的环境。它几乎是一个普遍适用的关心环境。
诚然,它所带来的意义相对肤浅。从这个角度看,它还远不是一个完整的关心环境!当然,它本身并不能产生那种源于深刻联系和意义的强烈动力!但它是一个起点,一种逐步深化与材料联系的方法。如果你渴望建立更深层的联系,你需要寻求其他途径:比如与朋友讨论,在 Twitter 或其他平台上写文章,或将其用作创意项目的素材。尽管如此,拥有一种方法来跨越初始阶段的障碍,这本身就是很强大的。
常见错误:为那些你觉得自己「应该」感兴趣的事物添加卡片
(本节改编自:https://twitter.com/michael_nielsen/status/1392129315622424578)
人们常常对我说类似这样的话:「我不喜欢记忆系统。我记住了所有这些无用的信息,结果发现它们毫无用处。」
我稍有夸张。但确实经常有人这样出乎意料地告诉我。
一种变体是:「哇,我喜欢你关于记忆系统的文章。但我一条建议都没采纳!我用记忆系统来记忆冗长乏味的、只消化了一半的、对我毫无意义的事实清单!」
这有点像用镊子当锤子……把玫瑰敲进你的花园。
千万别这么做。为一个你并不真正感兴趣的事物添加卡片,是个非常糟糕的错误。人们会告诉我:「我用 Anki 来记忆各州首府。」我便问:「你为何想要了解各州首府呢?」他们:[沉默]。
更宽泛地讲:有些人可能会想:「我应该更关注美国历史」,于是开始大量添加有关美国历史的记忆卡片。然而,他们实际上并不对美国历史感兴趣,只是认为自己应该感兴趣,结果添加了数百张毫无关联的卡片。三个月后,这些卡片就会变成一种负担,既无趣又阻碍学习进度。
这绝不是对美国历史的贬低。如果一个人确实有强烈的学习动机(而不仅仅是觉得自己应该有动机)去深入了解美国历史,那么 Anki 这类工具就会发挥很好的作用。但是,「应该」这个词至少是一个警示信号。或许你真的应该去做些其他的事情。
记忆系统在这些领域表现出色:那些我感兴趣并确信未来能从中找到意义,但目前还没有掌握足够的知识,无法顺便学会的领域。判断哪些内容值得记忆总是需要权衡取舍,而我有时也会做出错误的判断;我必须不断地、果断地进行筛选。但总的来说,这是一个很有用的原则。
当某些内容看似难以辨认时要特别留意:它们可能很奇特,但又以一种难以言说的方式令人着迷
人们常常这样批评记忆系统:「你只要专注于工作就够了,真正重要的东西自然会记住。」这种说法有一定道理,但并不全面。当我遇到一些不太理解却莫名觉得有趣的事物时,我的第六感会告诉我这里面有门道。比如我之前提到的 Nightwish 音乐会,当时我说不清楚为什么觉得有趣,但确实被吸引了。制作 Anki 卡片的过程帮助我理解了其中的原因。正如我之前所说,Anki 在你对某个领域非常感兴趣,但还没有足够的专业知识来快速吸收新信息时,特别有帮助。
创建 Anki 卡片:一种强大的思考环境
Alan Kay 有句名言:「换个角度思考,相当于智商提高 80 点」。
同样的道理也适用于思考的环境:一个强大的新思考环境往往能让你的智商提高 80 点。比如授课、与初学者交流、写 Twitter 帖子,这些都是强大的思考环境。每遇到一个新的交谈对象,都是一个崭新的思考环境。每读一本好书或一篇好论文,也都是一个新的思考环境。
能够找到可靠、随时可用、又能强烈激发思考的环境,这是一件非常奇妙的事情。
对我而言,Anki 就是这样一个思考环境。
而且,我创建卡片的方法越高明,它就越能成为一个更好的思考环境。它改变了你体验世界的方式。某些想法变得更容易产生,甚至成为可能;你在这个背景下会产生在其他情况下几乎不可能出现的想法。
Edwin Schlossberg 曾说:「写作的技巧在于创造一个让人们能够思考的环境」。更为重要的是:写作能为作者自身创造一个思考的环境。当写作技巧纯熟时,它能够使某些思考过程变得更加轻松自如。举个例子,制作 Anki 记忆卡片就是这种写作方式的一个很好的体现。
未来可能发展的框架
-
「单一概念证明法」:这是一种高级的 Anki 卡片制作技巧,旨在将定理的证明精炼为单一陈述。这种方法难度极高,通常需要先创建数十张其他卡片作为基础。我在用间隔重复系统来看穿数学概念一文中详细阐述了这种方法的具体应用实例。
-
将 Twitter 视为记忆系统
-
它不善于间隔重复
-
但它擅长创造丰富的语境、深层的意义和社交氛围,有助于形成深度记忆编码。
-
连续四天,每天围绕同一主题发布四五条推特长度的内容,你会惊讶地发现自己能从多个全新的角度思考这个问题。
-
-
将对话视为记忆系统
-
亚里士多德曾说:「我们的本质,在于我们习惯性重复的行为。因此,卓越不是一时之举,而是日积月累的结果。」Vonnegut 则告诫我们:「我们终将成为我们假装成为的人,所以我们必须谨慎选择自己想要成为的样子。」McLuhan 的观点是:「我们终将成为我们所关注的事物。」
-
对 Anki 卡片持续改进的态度。将提升卡片质量视为一个渐进的过程。
-
在首次技术会议结束后
-
在参加会议演讲期间及之后
-
在观看在线视频期间及之后
-
与人初次见面后
-
如何利用这种方法培养新习惯?
-
卡片筛选的实践经验
-
在国际象棋学习中遇到的部分挫折
-
当感到压力过大时,要懂得适时停止。这是一场持久战,不要急于求成。
-
信息并置模式(部分失败的尝试)
-
将其用作有意模糊的直觉激发工具
-
这个过程与思考密不可分
-
五卡原则
-
游戏设计卡片。另辟蹊径的策略
-
将大语言模型应用于 Anki
-
可以在此处添加的内容:原则、提示、触发事件、具体观察、触发模板,以及任何其他值得注意的事项。
致谢
在此,我要向多年来与我探讨记忆系统的诸多人士致以诚挚的谢意。特别要感谢 Andy Matuschak,他对我在记忆系统领域的几乎每一个思考层面都产生了深远的影响。
脚注
[1] 我发现那些不断产出「内容」的高产作家非常有趣——在这里我认为使用这个略带贬义的词是合理的——他们写了大量文章,讲述一个人应该采取的各种行动和使用的各种系统。如果要实践他们自己所有的建议,恐怕一天得有一千个小时才够用。
[2] 这里有两点需要说明:(1) 我是凭记忆进行引用的,因此引用的内容难免会有些不准确;(2) 出于隐私考虑,我偶尔会使用合成的记忆卡片。不过,我已尽量将这两种情况的影响降到最低。
[3] 起初,在添加这个内容时,我有些隐私方面的顾虑,因为这是一个人的个人画面。不过,经过思考,我认为在这种视频中出现的任何人可能都已经同意他们的影像被记录和广泛分享。然而,如果我收到任何相反的信息,我一定会立即将其删除,并诚恳地道歉。
[4] 与朋友讨论这个话题也有类似的效果,很难将其与记忆系统的作用区分开来。「与朋友交谈」是我们最好的自然记忆系统之一。不过,我认为制作 Anki 卡片在创造意义方面确实帮助很大。事实上,在制作这些卡片的过程中,我经常会产生一些想法,迫不及待地想与朋友分享,于是就会立即给他们发消息。
- John E. Littlewood, "Littlewood's Miscellany", Cambridge University Press (1986).
如何普及记忆系统?
原文:How to make memory systems widespread? (michaelnotebook.com)
音乐并不在钢琴里。——Alan Kay
「如果记忆系统如此强大,为什么没有更多的人使用它们呢?」作为一位协助开发记忆系统,并撰写了大量相关文章的人[1],我经常听到这个问题。这是个很好的问题。我认为记忆系统极其强大:用的好的话,这些系统使记忆成为一种选择,并极大地扩大了一个人可以做的创造性工作的范围。但是,这种强大的力量被一些障碍所掩盖。如果这些障碍能够被克服,那么记忆系统最终应该被数亿甚至数十亿的人严肃且经常地使用 [2],因为他们的收益将大大超过所需的努力。在这些粗略的笔记中,我勾勒了一些我认为应该发生的事情,以便记忆系统得到更广泛的应用。
我所说的「记忆系统」是指有时被称为间隔重复记忆系统的众多系统和媒体形式。包括 Anki、SuperMemo、Orbit、助记媒介、渐进阅读、渐进写作等。我更喜欢「记忆系统」这个名称,而不是「间隔重复系统」,因为虽然间隔重复很重要,但许多其他想法也同样重要。我认为我们尚未找到这些记忆系统的最终形态;尽管现有系统非常强大,但我相信未来的系统将包含重要的新想法;事实上,我有一种感觉,即我们尚不知道记忆系统是什么。我也使用这个术语来包括记忆宫殿等记忆系统,虽然正如 我和 Andy Matuschak 指出的那样 [3],它们在很多方面都明显不如更注重间隔重复的系统实用。但如果未来的记忆系统吸取所有这些想法以及更多的想法,我也不会感到惊讶。
想想瑜伽、篮球、冥想和舞蹈等技能练习,它们具有一些显著的特点:
-
**所有这些技能都是由小团体在几十年或几个世纪的时间内创立和积极发展的:**这些团体会一起合作,发展强大的局部传统:他们会经营冥想中心、篮球俱乐部等等。尽管独自一人也可能在这些技能上有所提高,但与一个群体或场景一起练习会带来巨大的好处。通常可以确定在每种技能练习中,与显着进步相关联的某些瑜伽教练、教练、球员、冥想导师、舞者和编舞家。虽然在简化的历史中,进步通常归因于相对较少的几个人,但实际上进步往往是由成千上万甚至数百万从业者的见解聚合而成的。
-
**技能的潜力几乎无穷无尽,而且精湛的水平绝对是可以企及的:**看看篮球、瑜伽和舞蹈的高手,哪怕是门外汉也能一眼看出他们的非凡之处。但即便如此,门外汉还是很难看清其中的精微之处。至于像冥想这样更多依赖内在体验的东西,要想观察或解释其中的奥妙可就更难了。然而,那些对冥想认真投入的人却常常反映,多年的坚持让他们在冥想这条路上走得更远。总的来说,很多技能在普通人眼中都是深藏不露的,但精湛的境界却是完全可以追求和达到的。
-
**很多的学习是集体的:**新发现可能在某地首次现身(有时不止一个地方),随后在整个文化里流传开来。有很多著名的例子,比如篮球中的三分球革命:2020 年代的 NBA 球队的三分出手次数是 1980 年代的六倍(!!)还多。但是大多数这样的发现都是微小的、渐进的改进,对专家来说司空见惯,但对外行来说却鲜为人知。有时,这些发现需要数年或数十年才能在社区中传播,甚至可能会失传。
-
**它们中大部分都很难「产品化」:**人们写书、制作视频和销售产品,以介绍舞蹈,或助人增进瑜伽技艺等。但真正能让人进步的,还是当地的文化氛围。你要打好篮球,就得找最佳球队和教练;要跳得好舞,就得和一流的编导、舞者和教练合作。如此种种,层出不穷。不同的技能,在依靠媒体和工具的程度上大有不同。当然,通过看书、与电脑对战、在网上的棋类社区学习和实战,你的棋艺可以大有长进。但要想在篮球上更上一层楼,你肯定得多和最好的团队一起打球才行。
(这篇开头我用了几个例子来说明,如瑜伽、篮球、冥想和舞蹈,最后还在不经意间提到了下棋。但这些观点同样适用于许多技能训练。下文中我还会时不时提到其他的例子,比如冲浪、小提琴、网球等,根据情况而定。在所有情况下,我说的这些都是基于自己的亲身体验——我玩过篮球,打过网球,练过瑜伽……——或者是基于和那些真正潜心钻研这些技能的人的交流和观察。)
使用记忆系统其实也是一种技能练习,与其他许多技能练习有不少共通之处。有时人们会用硅谷的逻辑来琢磨这个问题:要想让记忆系统普及开来,得创立一家怎样的公司、设计怎样的工具?需要怎样的界面、功能和宣传手段?这种想法并不完全偏颇,但更实际、更接地气的问题是:冥想、舞蹈、瑜伽和篮球怎么就那么火?炉火纯青地使用记忆系统是何等景象?我们怎么才能达到那样的水平?又应该怎么做,能让这些本事快速传开,让人们用上记忆系统就能立竿见影地受益良多?
易被忽视的一点是,在使用记忆系统方面能够达到高人的技艺是可能的。这一点常常不为那些只是稍微尝试过此类系统的人所理解;毕竟,这里没有像炫目的瑜伽动作或篮球扣篮那样显眼的技能可供展示。事实上,甚至连那些大量使用过记忆系统但未曾意识到自己用得不对劲的人,也常常无法理解这一点。我当然不会声称我是一名高手——我经常感觉自己还没有真正理解它们——但我本能地感觉这些系统能被运用得非常出色。通过与其他人的数百次交谈,我的应用水平大有长进,以至于我惊讶于一开始自己用得多么拙劣,以及我是如何取得长足进步的。这就让人自然而然地去想,是否还有可能达到更高的技能层次。
当我与记忆系统的怀疑者交谈时,我发现他们的怀疑常常来自几个方面。这里我不打算一一反驳,仅列举几点。有些人的质疑基于对记忆或记忆系统的误解,比如说: 「我根本不需要记忆系统,网上什么都能查到」;「记忆对创造工作没啥用,反而可能碍事」;「应该让自己『自然』的记忆来判断哪些事重要、哪些事不重要」;「记忆和理解完全是两码事」(这是一个错误的二分法);「死记硬背没啥好处,也没啥大不了的」(进步教育人士喜欢这么说);或者就是那些对记忆有种敏感心态的人(这在一些自觉记忆力不行但又志向远大的人当中比较常见:他们得让自己相信记忆没那么重要,这样才能维持自尊)。从这些想法中,人们往往得出一个结论,就是记忆系统没什么大用处。
第二个问题是,人们对记忆系统的运用非常粗糙,这其中的问题可以归结为三个方面。首先,有些人对记忆系统根本一窍不通,却总爱发表意见。他们可能摸摸索索用上几分钟,坚持几星期,然后就下结论:「这玩意没用。」这就像拿起小提琴拉几下就说:「这玩意拉不出好音,垃圾。」问题其实是他们自己不会用。其次,有人虽然用得多,但未必用得好。你可以一个人苦练舞蹈几千小时,也不见得能跳得好。我和一些酷爱记忆系统的人聊过天,看他们犯一些我眼里的低级错误 [5]。我觉得他们从系统中得到了些许好处(不然就不会继续用了),但用得更好的话,好处肯定会更多。许多用记忆系统时遇到的常见问题,都可以通过更巧妙的运用来解决:「我觉得好无聊」;「我开始混淆记忆和创造性工作」等等。最后,我们人类集体对记忆系统的运用还处在摸着石头过河的阶段,还没摸清怎么用,最合适的形式是什么。所以一部分挑战就是提高我们对这方面的整体了解,就像我们逐渐增强了人类对瑜伽、冥想、篮球等方面的共同理解一样。
这些批评都有一定的道理,但更多的还是初学者的浅见。拿冥想来说吧,人们对冥想有很多偏见,但是练习冥想的人一般不会直截了当地反驳这些观点。他们更倾向于告诉你:冥想的感受是说不清的,你得自己去练,慢慢才能悟到其中的奥妙。然后,就听那些可靠的人告诉你:「是啊,练这个确实很花时间,但我收获的远超付出。」换句话说,关键在于让人们感受到记忆系统真的很好用、非常有价值。这得是一种物超所值的学习方法。如果真是这样,人们会愿意挺过初级阶段,为了最后的收益。要不然,就别费劲用记忆系统了,直接去健身或者陪陪家人吧。要达到这个地步,咱们就得探索更深入、更合适的记忆系统的使用方法,找到更好的技能传授途径。再来说说另外一个方面:现在流行的瑜伽、篮球、冥想和跳舞,都是从一种强烈的文化氛围中诞生的,像是瑜伽文化、篮球文化什么的。我觉得,我们得培养一种记忆文化,加深大家对这技能的理解,找出更好的传授技巧。
因此,这些怀疑论调,我大多不打算直接辩驳。它们固然重要,我在其他地方也多有论述。但这一切都源于一个更深层次的问题:「怎样才能建立一种浓厚的记忆文化?」要实现这个目标需要哪些因素呢?我在笔记里简要地描述了一些文化元素。我深信,只有这样,记忆系统才能被广大人民所认真采纳,甚至有可能惠及数亿人。
我这里的笔记主要是给那些用得上、真把记忆系统当回事的人看的,他们不只是机械地背些词汇、基础的事实,更会用它来承载生活中的大事。这些笔记不是给那些从没认真用过,或者光想着怀疑的人看的。你如果是这样的人,但又偏要继续往下读,那你可得有被憋得慌的准备:我可是有意回避初学者可能碰到的那些问题,除非真的避不开。这就像是你跟一个根本不懂冥想的人争论冥想好处一样,没啥意思。当然了,去琢磨这些观点未尝不是一件有意思的事,但那完全是另一码事了!我现在要做的,就是琢磨怎样的记忆文化才能让记忆系统真正发挥出它的威力,怎么样才能让它流传下去。
建立一个强大的记忆文化
我有一小帮朋友,我们偶尔聚在一起聊聊记忆系统技能。我们并没有固定的聚会时间或活动(也许应该有),但我们偶尔还是会讨论下怎么用这些系统。这种体验,我真的说不清楚,就跟一个冲浪爱好者想给不懂冲浪的人解释冲浪文化一样费劲。可能得写一本书,搞个新兴记忆文化的民族志研究才行。但这谈话的感觉,对于那些曾在某个深奥领域探索过的人来说,听着还挺耳熟的。以下这个例子应该能让你感受到我们聊天时的滋味:
「哎,我现在开会都开始至少记五个问题了,出乎意料的是,这样我听得更仔细了。」
「我试过这一招!但我发现我太执着于细节,为了凑够问题数目,整个大局都忽视了。于是,我开始在每场会议结束时试着多想几个『大局问题』。有了这个想法,我反倒更能看到全局了。当然,有的演讲就是听不进去,根本谈不上什么大局。」
「对,我也有这顾虑。有的演讲索性别记。怎么避免脑子乱成一锅粥?或者怎么处理那些根本不合你兴趣的演讲呢?胡乱加问题是弄巧成拙。所以,我在想,一开始就定个问题数是不是搞错了方向。」
「对,我最近在摸索的另一招是……」。
这是一种描绘,旨在提醒你这类谈话的氛围。我已经进行了数百小时这样的对话。我猜这有点像冲浪刚兴起的时候:冲浪者分享并试验着各种各样的技巧,去芜存菁,逐步改进,摒弃许多,只为了精进冲浪技能。或者就像程序员,讨论他们在使用文本编辑器时发现的小技巧。又或像舞者探讨动作、音乐和情感的细微之处。在所有这些情况下,都有一小撮高手在一起,开发高深的知识,形成一种松散的交流网络,有一群尖端技术爱好者,痴论于他们的奥妙技巧中。这种交流既有趣,又能拉近彼此的距离,给人一种非常满足的感觉。
我当然不是在暗示,有一天所有人都会为了记忆系统而如痴如醉地讨论!不过,我们今天学冲浪的人,从早些时候冲浪者的那些谈话中,能学到许多东西。那些对话中最有价值的部分已经渗透到了现今的各种工具之中;最生动的说法、解释和实际操作都已经被浓缩、传授给新一代的冲浪爱好者,而他们也会继续传承下去。今天刚刚入门的冲浪爱好者从这样一种浓厚的冲浪文化中获益良多。
当我谈起与朋友们探讨记忆系统的经历时,实际上是在描述一种小范围、本土化的记忆文化的萌芽。记忆文化还包括像 Piotr Wozniak 那样精彩的维基 [6],Gwern Branwen 的笔记 [7],Andy Matuschak 的手记 [8],以及许多其他人所写的文章,还有很多很多。我个人的记忆经验在很大程度上也得益于其中的一些作品,正是它们使我在尝试了记忆系统好几回之后,最终被 Sasha Laundy 关于如何运用记忆系统来成为更出色程序员的笔记所打动 [9],认真地投入其中。我自己还亲自动笔或合写了许多篇文章 [10]。这一切都是正在萌芽的记忆文化的组成部分。
我想更明确地谈谈记忆系统和由一群实践者共同拥有的运用技能之间的不同。拿冲浪这个例子来说,近 70 年来,冲浪板变化颇多。但冲浪者的改变更为深刻:冲浪领域的进步主要来自社群技能的共同进步。有时候,我觉得很难把这个区别弄得十分清楚,部分原因是因为我们缺乏可以描述它的广泛使用的术语。我会不自觉地回到以前的思维模式,谈论如何改善记忆系统,其实我真正想说的是如何提升记忆文化,或者说我们记忆文化共同掌握的运用这些系统的技能。这项技能是可以变得更好,更上一层楼的,即使所用的工具一成不变。而且,就像冲浪一样,我预期最能够提高的是记忆文化中的记忆技能,远远超过工具本身。更精良、更广泛的工具其实是文化进步的结果,而不是反过来,就像现代的冲浪板其实是早期冲浪文化的产物。当然,这个问题的真相并不是单向的。但我发现许多人都倾向于认为工具主要塑造了文化。然而在这里,我觉得主要是文化塑造了工具 [11]。问题并不在于「我们怎么打造更好的系统?」而在于「我们如何更熟练地运用这些系统?」
我之前说过,记忆系统想要风靡起来,它的使用不仅要成为一门强大的本领,还得容易学会、容易传授。一旦这门本领足够强大、足够好传,就会有很多人趋之若鹜。现在的情况呢?我看主要还是一些无聊的人拿它死记硬背一些州首府之类的乏味东西,或者学一些中文和英文词汇,但学得一塌糊涂;再或者就是一些医学生,以及其他一些对记忆有高要求的学科的学生在用。学生们倒是挺能玩出花样,但用来干其他的就挺无聊了。但想象一下,如果我们摸清了怎样用这套记忆系统,让人们能够迅速学会并精通复杂的理论知识,那时候这套东西肯定会大受欢迎。当然了,我们得先提高这门本领的水平和易传授性,还有得继续琢磨。
培育一种记忆文化会是怎样的一番景象呢?
想象一下,到处都是小伙伴们自发组成的学习小组,痴迷于把自己的技能练到极致。大部分时候他们自己玩自己的,有时候三五成群地分享,偶尔还有人高调晒出自己的记忆练习。渐渐的,线上线下都会形成更紧密、更深入的圈子。现在我虽然找了找线上的小组,但大多数水平一般般,让人有点扫兴(尽管医学方面的小组还挺有意思)。不过等技能练得更溜了,大家还能办开班,培训,拍 TikTok,出书并运营 YouTube 频道。越来越多的人会把记忆系统用得出神入化,有的人可能就是玩得开心,有的人真能从中大大提高生活质量,收获远超付出。最棒的点子和使用方式还能反过来让这套工具变得更强。总之,记忆文化会渐渐地繁荣 [12]。虽然现在这些事情才刚刚起步,但空间还大得很,可以更丰富、更深入。
这里最关键的是文化的积淀。如果每个人都在不停地重新发明轮子,那么就不会有集体的进步。这就是像 Piotr Wozniak 的 SuperMemo Guru wiki 这样的共享资源如此重要的原因。这也是为什么我们需要培养一种引用和尊重前人成果的文化,鼓励人们整理书单、撰写概览、编纂书籍、整理常见问题或者类似Subreddit的维基百科。通过这些努力整理、精炼和承认的行动,我们的文化才能真正前进,而不是一遍又一遍地重蹈覆辙 [13]。
当然,这个观点不禁让人想起关于记忆系统的那篇赫赫有名的文章。那是由 Frank Dempster 于 1988 年发表的一篇文章 [14],他在文章里嗟叹,在学校里,间隔重复坐了冷板凳,还列出了九个妨碍其推广的原因。当然,学校系统当然可以自上而下地强制实施,对学生硬推他们想强推的任何体系,不管效果如何,甚至老师自己都不怎么懂 [15]。学校是可以硬塞给学生这种记忆体系,我想偶尔会有这样的情况发生。但要是在记忆文化得到更坚实的支撑后再这么干,我觉得效果才会好得多。但是,如果这种情况发生在记忆文化变得更加强大之后,我预计会出现一个更加有利的局面。到那时候,我们对如何运用记忆体系、它们到底是什么,以及如何更好地利用它们会有更深、更广的共识,还会有更多共享资源来指导怎么用。这样一来,老师和学生都能游刃有余了。
记忆练习与我前面提到的许多其他技能不同的一个方面在于,记忆基本上是内在的活动。你可以看着冲浪者冲浪、舞者跳舞或篮球运动员打球,慢慢领悟他们在做什么,学着模仿甚至超越他们。据说,杰出的斯诺克球手罗尼·奥沙利文,他小时候自学台球,就是通过反复观看前一代最杰出的球手斯蒂芬·亨德里的录像。但是,记忆练习就没那么容易模仿学习了,因为其中更多的事情是在内心发生的。当然,人们可以聊聊他们的记忆方法,分享一些工具,比如 Anki 卡片之类的。但总体来说,记忆练习可能更像是冥想,而不是舞蹈、篮球或许多其他显露的技艺。我怀疑这使得建立一个强大的记忆文化更加困难,因为这种技能本身不太显眼,所以学习起来更加困难。
记忆练习与其他技能的另一个不同之处在于,它更多是一种手段,而不是目的。人们学冲浪、跳舞或打篮球,往往是因为喜欢,享受其中的乐趣。学习本身固然有趣,对于一些记忆系统的使用者来说或许就够了。但许多人用这些记忆系统,是因为觉得它们能在生活中帮助实现其他目标。我的个人经验是,这些记忆系统在我要快速掌握某个不熟悉领域的创造性项目时,最能派上用场。(反过来,在我精通的领域里,我能够快速学习,更倾向于依赖自己天生的记忆力,不必依赖这些系统。)
记忆系统究竟该怎么用,用到什么程度呢?大多数人不打篮球也不冲浪,就算做,也多半只是玩玩而已。真当回事的人少之又少。那么,要多少人使用记忆系统呢?从长远来看,这个问题很难回答,因为社会的其他变化可能会产生重大影响 [16]。然而,在现今这个历史时刻,知识工作正变得至关重要。我觉得,至少有数亿人,甚至可能最终达到数十亿人,他们的生活会因为熟练运用记忆系统而受益匪浅。我认为这不像冲浪,而更接近阅读和写作;记忆素养可能成为一项普遍追求的宝贵品质。当然,这只是我个人的推测,只是我的直觉告诉我是这样。不过,正如我对未来的其他种种猜测一样,也许我错了!
在这些笔记中,我主要忽略了初创公司在这个领域的作用。这个角色很复杂,所以与其再写一篇文章,不如让我只写一段总结。我认为这两个进程——记忆文化的发展和创业公司的涌现——在某种程度上是天然分开的两回事。我预计人们将继续在这个领域创立公司,一些会取得适度的成功。但除非记忆文化真正壮大起来,否则我看不到会有什么大的突破。现在,可能会有极为成功的公司推动文化的发展,但我预计情况恰恰相反。特别是一些关于记忆系统的难题,得靠从业者自下而上的文化来破解 [17]。这类似于现代瑜伽的发展路径,经过多个传统的广泛发展,然后被不同的现代瑜伽「品牌」挪用。这些品牌对我们对瑜伽的理解贡献微薄,但增加了市场营销和分销渠道。换句话说,我不认为过于侧重工具和公司的方法能解决记忆系统的问题。虽然它们最终是实现规模化的必要手段,对某些人来说,也是一种控制和拥有的手段。但这不是真正的核心所在,就像冲浪的关键不在于怎么做冲浪板。不出所料,在这样的情况下,技能爱好者和公司之间可能会产生摩擦。前者可能会对侵占和篡改历史感到愤慨(「其实是我们做到了,那些所谓的先锋只是空谈,还搞了一堆不中用的系统」);而后者则为自己的市场营销和分销工作感到自豪,并努力推广这项技能。两者都必须要有,但冲突在所难免,这可能是个无法避免的局面。不管怎样,我还是会继续为记忆文化添砖加瓦。
致谢
感谢 Sebastian Bensusan 的鼓励让我写下这篇文章,同时也感谢 Sebastian 和 Andy Matuschak 对草稿的反馈。感谢 Sebastian、Andy、Kevin Simler 和其他很多人与我交流关于记忆系统的想法。
脚注
-
参见:Andy Matuschak and Michael A. Nielsen, "Quantum Country", https://quantum.country/, San Francisco (2019). 和:Andy Matuschak and Michael Nielsen, "How can we develop transformative tools for thought?", https://numinous.productions/ttft, San Francisco (2019).
-
我不知道今天有多少人会认真且自愿地使用记忆系统。我猜可能是数十万到数百万人,但这个数字可能很不准确。这也取决于如何定义「认真」和「自愿」。例如,我很难说服自己去相信 Duolingo 是个记忆系统,因为我认为它远不够严肃。
-
参见 https://numinous.productions/ttft/#two-cheers-for-mnemonic-techniques, in: Andy Matuschak and Michael Nielsen, "How can we develop transformative tools for thought?", https://numinous.productions/ttft, San Francisco (2019).
-
这种行为在 Hacker News、Twitter 和许多其他在线论坛上很常见,但并非普遍。人们推出新工具,总有一些人满腹信心地指手画脚,这些人或许只是随便用过一下,甚至可能压根不是目标用户。奇怪的是,这种情况屡见不鲜,甚至都没人觉得稀奇了。这并不意味着这些评头论足一无是处,但显然用处不大。想象一下,如果有人在 Hacker News 上发布了个名叫{小提琴」的新工具,评论可能会是:「这玩意儿听着就跟猫打架似的。」「弹了一下胳膊就酸了。」「我在上面连个简单曲子都弹不出来,严肃的音乐家才不会用它呢。」等等。
-
我也想知道自己犯了哪些基本错误。
-
SuperMemo Guru: https://supermemo.guru/wiki/SuperMemo_Guru
-
Gwern Branwen, "Spaced Repetition for Efficient Learning", https://gwern.net/spaced-repetition.
-
Andy Matuschak, "How to write good prompts: using spaced repetition to create understanding", https://andymatuschak.org/prompts/ (2020).
-
Sasha Laundy, "Using flash cards to become a better programmer, Part 1", https://sasha.wtf/writing/anki-post-1/ (2015).
-
参见:Michael A. Nielsen, "Augmenting Long-Term Memory", https://augmentingcognition.com/ltm.html, San Francisco (2018); Michael A. Nielsen, "Using spaced repetition systems to see through a piece of mathematics" http://cognitivemedium.com/srs-mathematics, San Francisco (2019); 和:Andy Matuschak and Michael Nielsen, "How can we develop transformative tools for thought?", https://numinous.productions/ttft, San Francisco (2019).
-
其中一个原因是,制造工具的公司往往强烈地希望声称他们是那个神奇秘方的发明者。然而,他们真正的贡献常常是捕捉、提炼并将某个社区的成果进行市场化。这当然有价值,但也会混淆实际的起源。
-
一个坏处:如果记忆文化足够成功,肯定会有一些骗局随之而来。新兴文化的初期,骗子一般不会太多,因为他们更愿意去那些可以赚快钱或者攫取名声的地方。现在比搞记忆系统更容易捞金的途径多了去了。但当你读到瑜伽邪教、冥想大师、专横跋扈的舞蹈和篮球教练的事情,你会觉得很不是滋味。等到有记忆领域的丑闻时,那或许就说明这行真的成功了(尽管是非常不愉快的成功)。
-
在以社交媒体为主的文化中,存在一个问题,那就是这种文化往往昙花一现,不断地重复同样的内容,而集体进步的速度极其缓慢。与此形成鲜明对比的是,学术界在这方面做得特别好:他们有关于引用和承认前人成果的严格规范。
-
Frank Dempster, "The spacing effect: A case study in the failure to apply the results of psychological research", American Psychologist, at http://augmentingcognition.com/assets/Dempster1988.pdf (1988).
-
我也有很多这样的经历。最让我印象深刻的是,我那位微积分老师不明白为何积分和微分是反过程。我并不期待世上每个人都明白这个,但这么一位微积分老师居然不懂,真是让人难以置信。不过,这样的情况可能也不那么罕见。
-
我时常听人说:脑机接口(BCI)的发烧友认为记忆系统是浪费时间。这种想法纯粹是被 BCI 迷住了眼。从长期角度看,也许这种说法有些道理;如果真看得太远,可能真的只「值得去研究」如何避免宇宙的热寂。但这种说法不靠谱:现在的记忆系统运作得风生水起,而且我们完全有办法让记忆文化和系统更上一层楼。现在的 BCI 不过是新鲜玩意儿,真正对记忆大有裨益还早着呢。从 20 到 30 年的期限来看,我觉得药物、饮食和锻炼调节可能比 BCI 更有前途。但在可见的将来,我觉得记忆系统都能打败它们。顺便提一嘴,我并不是说 BCI 不值一搞,我只是觉得那种认为其他东西都不值一提的想法很扯。有的人真觉得,「做眼前能做的事,而不是做些让你感觉自己像烂科幻片主角的事」这种看法不堪一击。
-
这方面的深入描写,可以参考 Eric von Hippel, "Democratizing Innovation" (2005).
论意志的慈善
原文:“On Volitional Philanthropy”
英国著名军事家、外交官兼作家 T. E. Lawrence 拥有一种非凡的天赋,这种天赋被他的一位传记作者称为「赋能能力」。这种能力使他能够激发他人长期潜藏但未曾意识到的才能。人们只要与 Lawrence 有过短暂接触,哪怕仅仅几分钟,生活就可能发生翻天覆地的变化。在他的影响下,人们觉醒了自己未知的潜能,开启了崭新的人生篇章。
这种奇妙的经历其实并不罕见。我们的生活中常常会遇到一些睿智的朋友或熟人,他们仿佛拥有洞察人心的能力,能够看透我们内心深处的渴望,有时甚至比我们更了解我们自己。这些人不仅能察觉到我们潜在的抱负,还能认识到我们具备实现这些抱负的能力。他们就像是为我们举起一面魔镜,清晰地映照出我们内在的潜力。在这样的启发下,我们常有的自我怀疑烟消云散,取而代之的是坚定的信念:「是的,我确实能做到这一点」。
这是一个意志的慈善的典型案例:致力于拓展人们影响世界的多元途径。
我对那些能够将这种意志的慈善行为规模化的机构深感着迷。
Y Combinator 作为一家创业孵化器而广为人知。当我的朋友们开始参与其早期项目时,我注意到他们回来后往往发生了显著的转变。即使他们的公司最终失败了,他们也变得更加真实,更具自信,更有能力去影响这个世界。这正是该项目赋予参与者的珍贵礼物[1]。因此,我将 Y Combinator 视为意志的慈善的践行者。
我在 Recurse 中心担任研究员一年。这是一个为期三个月的「程序员创意工作坊」。它没有预设的结构:参与者不会被告知该做什么。相反,他们必须自主选择项目,规划自己的学习路径。这无疑是具有挑战性的。然而,在这个过程中的摸索和选择道路的困难,恰恰是培养个人选择意识和选择责任感的关键。因此,创造这样一个空间,再次体现了一种意志的慈善的形式。
有些机构自认为在践行意志的慈善,实则不然。许多教育工作者的自我认知就是如此。在非强制学校教育中,这种说法通常成立。然而,义务教育却建立在对个人意志的根本否定之上:学生无权选择他们所处的环境、所做的事情,以及合作的对象。当这些选择权被剥夺时,强制学校教育就会削弱并束缚学生的自主意识,无论它在其他方面看似多么进步。
帮助他人培养意志这一概念似乎存在矛盾。本质上,意志并非可以赐予的,而是需要自己主动获取的。我认为,简单的「加油」式鼓励效果不大,因为它无法持久地拓展接受者的自我认知。相反,我推测关键在于一种「倾听以赋能」的方式,帮助人们发掘他们可能尚未意识到的内在潜能。然后,诚实而务实地(同时认识到自己可能会有误判)阐释自己的观察。值得探讨的是我们该如何在个人层面培养这种能力,以及如何在机构层面将其规模化。
[1] 这是一种中等效应。我认识一些创业者,他们起初被创业角色所吞噬,最终反而因此受到限制。但我所认识的大多数人都因此得到了成长。
顺便说明一下,我目前在 Y Combinator Research 工作,这可能会在某种程度上影响我的看法。不过,需要指出的是,早在 2010 年左右(如果我没记错的话),我就已经开始将 YC 作为意志的慈善的一个典范来讨论了,而这比我加入 YCR 工作要早了好几年。
运用记忆系统背诵文章段落
Michael Nielsen
2023 年 12 月 5 日
最近,我尝试借助一种记忆系统来帮助自己背诵几段我深爱的文字。我从我最为推崇的一篇文章——卡尔·萨根那篇脍炙人口的《暗淡蓝点》着手。这次体验给我带来了莫大的满足感,并因此记住了其他几段文字,包括亚伯拉罕·林肯的《葛底斯堡演说》,以及 Wendell Berry 的诗作《大自然的安宁》。
本文记录了我在这个过程中的一些观察和感悟。需要强调的是,这些仅仅是我个人的心得体会——我绝非在宣称这是每个人「都应该」去做的事情,也不是说我采用的方法就是最佳的,甚至可能算不上特别出色。我很清楚,在这类记忆技能方面,有许多人比我强得多,他们无疑掌握着一些我尚未了解的有效技巧[1]。尽管如此,我希望这些笔记能够为一些好奇的读者提供些许启发,也许还能激发他们展开相关的探索。
我假设你已经熟悉记忆系统的使用方法。我个人使用 Anki——当然还有许多类似的记忆系统,我认为它们的效果大致相当[2]。我已经在多篇文章中详细讨论过我使用记忆系统的经验:如果你对记忆系统不太了解,这里有一篇入门介绍。正如我在那篇文章中所说,记忆系统「让记忆成为一种选择」,换句话说,你不必将是否记住某事交给运气,而是可以确保自己几乎百分之百能记住;你只需决定要记住某事,系统就会确保这一点实现。从某种意义上说,本文的目的是探讨这种将记忆视为选择的理念是否可以扩展到整段文本。答案是一个有条件的「是」。这个条件源于两个原因。首先,也是最现实的原因,我进行这个实验才一个月左右:我在一年或五年后的熟练程度还有待观察。其次,记忆系统发挥的作用与我最初的预期不同。正如我们将看到的,虽然它确实帮助了记忆,但它并不像在更传统的记忆系统使用中那样起决定性作用。相反,它的作用在于帮助我加深对段落的理解;在这一点上,它表现得相当出色。
为便于后文参照,请允许我完整引用我铭记于心的三段文字——《暗淡蓝点》,《葛底斯堡演说》和《大自然的安宁》。你可以选择略读其中一段或全部,但我认为这三段文字都美得令人心醉神迷,值得仔细品读。当然,如果我不这么认为的话,我也不会花时间去记忆它们!
关于《暗淡蓝点》,有一个有助于理解的背景:Carl Sagan 在描述旅行者号航天器拍摄的一张著名的地球照片。在这张照片中,地球距离如此遥远,以至于只呈现为一个微小的光点:
以下是这段文字:
从这个遥远的角度看,地球可能并不显得有什么特别之处。
但对我们而言,这却有着不同的意义。再次凝望那个点吧。那里,是此处。那里,是家园。那里,是我们。在那上面,存在着你所爱的每个人,你认识的每个人,你听说过的每个人,以及曾经存在过的每一个人,他们都在那里度过了一生。我们所有的欢乐与苦难的总和,数千种笃信的宗教、意识形态和经济学说,每一位猎人与采集者,每一位英雄与懦夫,每一位文明的创造者与毁灭者,每一位帝王与农夫,每一对坠入爱河的年轻恋人,每一位父亲与母亲,怀抱希望的孩童,发明家与探索者,每一位道德的传授者,每一位腐败的政客,每一个「超级明星」,每一位「最高领袖」,我们物种历史上的每一位圣人与罪人——都生活在那里,生活在一粒悬浮于阳光中的尘埃之上。
地球不过是浩瀚宇宙舞台上的一个小小角落。想想那些将相帝王,他们洒下的滔滔血河,只为在荣耀与凯旋中,短暂地统治这个微尘的一小部分。想想这个像素上某一角落的居民,对另一个几乎难以分辨的角落的居民所施加的无尽残酷。他们是如此频繁地误解彼此,如此渴望相互残杀,如此狂热地仇恨着。
我们的矜持自傲,想象中的自我重要,以为在宇宙中占据特权地位的妄想,都被这苍白的光点无情挑战。我们的星球不过是浩瀚宇宙黑暗中一个孤独的斑点。在这无垠的广袤里,我们如此微不足道,看不到丝毫迹象表明会有外力来拯救我们于自身。
地球,是我们迄今所知唯一孕育生命的世界。至少在可预见的未来,我们的物种别无他处可去。造访他乡,或许可以。定居异土,尚且不能。无论喜欢与否,此刻,地球就是我们坚守的地方。
有人说过,天文学是一种令人谦卑并塑造品格的经历。或许没有什么比这张遥远的、关于我们渺小世界的图像,更能证明人类自负的愚蠢。对我来说,它强调了我们有责任更友善地对待彼此,并保护和珍惜这暗淡的蓝点——我们迄今所知的唯一家园。
下面是举世闻名的葛底斯堡演讲。这篇具有里程碑意义的演讲有几个不同的版本。我们这里采用的是被永久镌刻在华盛顿特区林肯纪念堂的墙上的「布利斯」版本,可能是最广为人知的一个版本:
八十七年前,我们的父辈们在这块陆地上建起了一个新的国家,它孕育于自由,并献身于人人生而平等的命题。
如今,我们正在进行一场伟大的内战,考验着那个国家,或任何有此信仰和主张的国家,能否长久地存续下去。 我们在这场战争的伟大战场上相遇,为了使那一国家得以存续,我们将在这片战场上找到我们最后的安息之地,——那些为此而死去的人已经这么做了,——这对我们而言是恰当的,也是适宜的。
然而,从更广泛的意义上说,我们无法在此祭奠,我们无法在此奉献,我们无法使这片土地得以神圣化;那些活着的人,和死去的人,曾在此拼搏过的,已经使它神圣化,而这一意义是我们乏弱的力量远远不能有所增减的。 世界不会注意到,也不会长久地记住我们在这儿说过什么,但它绝不会忘记那些人曾在这儿做过什么。 虽然大业尚未完竟,但那些为此奋斗过的烈士们已使这一事业进入了最后的成熟阶段,无疑,我们这活着的人应当继续投身于这一事业。 我们应当投身于那留在我们面前的伟大任务——从那些为此投入了全部热忱的逝者那里,我们将获得更多的热忱;我们将不会,绝不会使那些为此献出生命的人白白献出生命;我们将使这个国家,在上帝的庇佑下,从自由里获得新生;而那一为民所有、为民所治、为民所享的政府,也绝不会从这片土地上消亡。
最后是 Wendell Berry 的诗作《大自然的安宁》:
当我对世界的绝望与日俱增,一点点动静就会让我在夜晚惊醒,担心我和孩子们未来的人生,我就会走出去,在湖畔躺下,美丽的林鸭栖息在湖面,巨大的苍鹭在觅食。我融入大自然的安宁,这里的生灵不会用未来的忧伤虚掷生命。我置身于宁静的水畔,感到头顶白天看不见的星星在熠熠期待。一时间,我躺在大自然的怀抱里,获得了自由。
背景过程与观察
让我分享一下我在这个过程中的一些背景观察。在下一部分,我会讨论更宏观的视角。
**不要随意使用提示-续写式的完形填空:**我在处理这个问题的方法上犯了不少错误。我最初采用的方法,可能也是人们最容易想到的方法,就是在一种提示-续写的格式中使用完形填空。例如,我会设计这样的完形填空题:「问:再次凝望那个点吧。。。。」,答案是:「答:那里,是此处。那里,是家园。那里,是我们。」有时候,对于比较复杂的句子,我会使用单个短语:「问:在那上面,存在着你所爱的每个人,你认识的每个人,你听说过的每个人,,____」;「答:以及曾经存在过的每一个人,他们都在那里度过了一生」。
你可以用一种机械化的方式将《暗淡蓝点》的整篇文章转换成 Anki 记忆卡片:每张卡片的正面是一个提示性的短语或句子,背面则是一个或多个完整的短语或句子作为答案。这种方法简单直接,而且根据我的实验,它确实能够发挥作用。然而,这种方法在实践中却显得乏味且进展缓慢。其中一个主要问题是,当我在复习时答错了问题,我常常无法准确地判断自己究竟错在哪里。理想情况下,我应该能够清楚地指出自己的错误,但实际上并非总能做到这一点,因此反馈的效果就大打折扣。我发现,记忆系统中的问题最好是非常精准的——通常是简短而具体的——这样当你答错时,就能清楚地知道自己错在哪里。这种清晰的反馈能够帮助你快速学习。而对于那些又长又复杂的填空题,出错的可能性太多,难以准确定位问题所在。
这种情况促使我尝试使用非常简短的填空题,例如:「问:再次凝望那个点吧。____」;「答:那里,是此处。」这种方法的优点是能够获得非常明确的反馈。但事实证明,这也是一个错误。这就像试图通过研究 3x3 像素的小方块来理解毕加索的画作一样——无法看到全貌。结果产生了大量的问题,而这些问题大多使我与我所喜爱的文章段落渐行渐远。因此,尽管机械式的填空删除方法看似诱人,我最终意识到,仅在非常有限和特定的情况下使用填空会更加有效(下文将给出多个例子)。
基本原则:寻找 (a) 既能制作成优质的 Anki 卡片,(b) 又能最大程度深化对文章理解的问题。这是我发现的最实用的通用原则,我在这些笔记中提供的几乎所有例子都遵循这一原则。让我举三个具体的例子来说明。在葛底斯堡演说中,林肯提到要将战场的一部分奉献为「为了使那一国家得以存续,我们将在这片战场上找到我们最后的安息之地」。值得注意的是,在这里以及整个演讲中,他始终没有区分北方和南方的士兵。针对这一点,我添加了几个引发思考的问题,例如:
「问:在葛底斯堡演说中,林肯没有明确区分北方和南方的士兵。他声称所有士兵都是『为使[美利坚合众国]得以存续而献出生命』。南方的士兵是否也认为自己是为此而战?」「答:几乎可以肯定不是。」
这张卡片揭示了一个有价值的洞见。然而,它并不完美,因为我倾向于避免使用是非题或更糟糕的模棱两可的答案[3],如「几乎可以肯定不是」。我发现在复习时难以深入思考这类问题。通常,问题和答案越具体、越有意义,Anki 卡片的质量就越高。当我不得不添加是非题时,我会设定一个规则:至少再添加一个(通常是几个)能引发更深入思考的问题。比如,在这个例子中[4]:
「问:南方士兵们可能并不认为自己是在『为[美利坚合众国]的存续而牺牲生命』。那么,从更宏观的角度来看,林肯暗示他们确实如此,这种说法又如何是正确的呢?」「答:这很可能是林肯个人对他们牺牲的诠释,同时他也试图让其他人接受这种理解。」
再举一个例子,在《暗淡蓝点》中,Sagan 写道「数千种笃信的宗教、意识形态和经济学说。」这个片段的多个方面引发了我的思考。起初,「经济学说」似乎与其他两个概念不太协调,尤其是与「宗教」相比。虽然有人有时会批评资本主义或共产主义如同宗教一般,但这种批评通常较为肤浅。我开始思考 Sagan 是否在传达一些我未能领会的更深层含义。经过深思,我发现了一个特别值得注意的共同点:尽管有时可能看似并非如此,但人类对这三者都拥有相当大的主导权。因此,我添加了这样一张 Anki 记忆卡片:
「问:在『数千种笃信的宗教、意识形态和经济学说』之间,有什么重要的共同点?」 「答:我们可以选择这三者中的任何一个,它们都是受人类主导的领域。」
这种思考方式也让我产生了一个疑问:「经济系统」是否比「经济学说」更加贴切?于是我又添加了一张卡片:
「问:如何改进『数千种笃信的宗教、意识形态和经济学说』中的『经济学说』这一表述?」「答:将其改为『经济系统』。」
「问题:为什么我认为用『经济系统』比『经济学说』更恰当?」对于这个问题,我刻意没有给出固定答案,因为我希望每次思考时都能有新的感悟。这个问题并不存在标准答案。实际上,我甚至不能确定自己日后是否会始终坚持这种观点!目前,我的看法是:现实中的经济系统(而非理想化的概念)才是真正影响我们生活的根本因素。
尽管如此,在朗诵原文时,我并不会将 Sagan 的「经济学说」改为「经济系统」。但我脑海中常会闪过这样的念头:「如果这里用『经济系统』会更贴切些。」我发现,正是这种思考让我更容易记住《暗淡蓝点》这篇文章。每当我读到 Sagan 的原话时,心中暗想「用『系统』会更好!」这种微妙的触动反而加深了我的记忆。当然,你可能持不同看法!也许你认为「经济学说」更合适,或者你更喜欢「学说」与「宗教」之间的呼应。这都无可厚非——事实上,这种思考本身就是很好的记忆卡片素材。但就我个人而言,我更倾向于使用「经济系统」这个表述。
理解那些不易察觉的措辞选择:我记忆中的所有文段都包含了许多起初看来并不明显的措辞选择。然而,经过更深入的思考,往往能发现这些选择的妙处:
「问:Sagan 使用『想想那些将相帝王,他们洒下的滔滔血河』而非『帝王将相』有什么好处?」
「答:这种表达从具体的因素(将相)过渡到更抽象的因素(帝王和国家权力)。」
我们可以进一步延伸这个话题:
「问:Sagan 提到的『想想那些将相帝王,他们洒下的滔滔血河』如何与现代社会产生联系?」
「答:使用『帝王』这个古老词汇,暗示我们去思考:这种情况在多大程度上也适用于现代政府。」
再举一例,我有时会错误地回忆《暗淡蓝点》中的一句话:「对我来说,它强调了我们有责任更友善地对待彼此」,而 Sagan。实际使用的是「责任」而非「需要」。诚然,「需要」这个词有其优点:它更简短、更朴素,而且几乎承载着相同的意义。我仔细权衡了这两种选择的优劣,并补充了以下内容:
「问:相比『对我来说,它强调了我们需要更友善地对待彼此』,使用『对我来说,它强调了我们有责任更友善地对待彼此』有何优势?」「答:我特意将答案留白,作为一个挑战,让人每次都能重新思考这个问题。」
这些对个别词语的探讨看似吹毛求疵:究竟使用「需要」还是「责任」,真的那么重要吗?就单个案例而言,答案往往是「没那么重要」。从整体来看,我认为这一点极其关键。在优秀的写作中,每个词都经过深思熟虑,承载着特定的意义。在这些词语的选择中,往往蕴藏着不易察觉的细微内涵,即便是博学的读者也可能不会立刻察觉。深入理解这些选择背后的逻辑,可以帮助你更透彻地领会作者的思路。此外,实践证明,关注单个词语的问题反而能更容易记住它们。
从错误中汲取洞察: 正如先前例子所示,每当我在背诵中出错或遇到困难,都会引发我的反思:我是否真正理解了这段内容?我还有哪些不足之处?通常,问题并非出在记忆力上,而是我对内容的理解不如原作者透彻。举个例子,在测试自己关于《暗淡蓝点》的记忆时,我有时会用「他们所有的欢乐与苦难的总和」这个短语,而 Sagan 使用的是「我们的」而非「他们的」。Sagan 的选择无疑更为恰当 —— 它让读者更能感同身受,体会到文字所传达的人类共同情感。于是,我在 Anki 中添加了一个问题:
「问:『____所有的欢乐与苦难的总和』:为什么用『我们』比『他们』更好?」
「答:因为作者在讨论人类,使用『我们』能让读者更强烈地感受到共同的人性」
总的来说,同义词经常引发这类问题。以葛底斯堡演讲为例,其中提到考验着那个国家,或任何有此信仰和主张的国家,「能否长久地存续下去」。我们可以将其略微缩短为「能否长存」。通常情况下,我会倾向于使用更简洁的表达。但经过深思熟虑后,我认为「长久地存续下去」比「能否长存」更为贴切。它更强调「存续」这个概念,这正是听众应该关注的重点。同样,我们可以轻松地围绕这个话题创建 Anki 问题。
这些文本结构巧妙,作者在多处的处理都超越了我最初的想法,这种高水准实属意料之中。更让人欣喜的是,随着我逐渐领悟作者的匠心独运,朗读这些段落的体验变得越来越丰富,让我有机会细细品味作者在写作中的种种精妙安排。
在这个过程中,我逐渐意识到这远不止是简单的文本记忆。这是一段深入理解文本背后思想的旅程。伟大的文本绝非文字的堆砌,而是非凡洞察力的结晶与表达。真正的任务不是死记硬背,而是去领会林肯、Sagan 等人的思想精髓。探寻他们写下这些文字背后的缘由。从这个角度看,记忆只是一种工具,它促使我们更深入地理解产生文本的思考过程,也检验着这种理解。归根结底,我们追求的是将一种视角内化于心,在这种视角下,文本变得浑然天成,仿佛是从内心「自然流露」的话语。
这些笔记的标题和框架以记忆为重点,这也正是我最初开展这个项目时的思路。不过反思之下,这样的框架似乎并不十分恰当:因为这项工作的本质是如何更深入地理解这些伟大的文本。因此,目前的标题和框架让我感到些许不安——也许改为「运用记忆系统来消化文章段落」会更准确。然而,这些毕竟只是笔记,记录了我在这个过程中的部分思考。或许未来某天,我能以更成熟的视角重新梳理这些内容!
改进: 我还发现,寻找可以改进的地方是加深对文本理解的另一种有效方式。举个例子,Sagan 曾写道:「或许没有什么比这张遥远的、关于我们渺小世界的图像,更能证明人类自负的愚蠢。」这句话本身已经很精彩,但我认为用「显现」(illustration)替换「证明」(demonstration)会更加贴切。为此,我又增加了几个相关的问题:
「问:如何改进 Sagan 的这句话:『或许没有什么比这张遥远的、关于我们渺小世界的图像,更能证明人类自负的愚蠢』?」
「答:或许没有什么比这张遥远的、关于我们渺小世界的图像,更能显现人类自负的愚蠢。」
「问:为什么在 Sagan 的这句话中,『显现』(illustration)比『证明』(demonstration)更恰当:『或许没有什么比这张遥远的、关于我们渺小世界的图像,更能显现人类自负的愚蠢』?」
「答:『证明』(demonstration)通常暗示有一个实施证明的主体,但在这里显然并不需要这样的含义」
这些段落写得如此精彩,几乎难以找到提升的余地。虽然我发现的改进大多只是些微小之处,但我认为花时间寻找这些细节既有意义又有趣。当你朗读这段文字时,不仅能感受到愉悦与兴奋,还能在心中思索如何让它更臻完善。我要再次强调:这是一种深化你与文本之间联系的方式。
这种练习让我更深入地理解了文章的精心构建过程。在尝试改进不同作品时,我发现《暗淡蓝点》和《大自然的安宁》颇具挑战性。而葛底斯堡演说虽然是一篇非凡的作品,却相对容易找到可以改进的地方。我认为,这或许是因为演说中蕴含的是林肯多年深思熟虑的思想精华,但文本本身可能是仓促完成的。至于《大自然的安宁》,这首诗几乎难以改进——唯一明显的瑕疵在于「我置身于宁静的水畔,感到头顶白天看不见的星星在熠熠期待」这一行。我还注意到 Berry 的诗句特别容易记忆。这让我思考:也许一篇作品写得越好就越容易记住,因为每个词都经过精心挑选,承载着丰富的含义,最终形成了一个紧凑而趋于完美的表述。
**特别注重开头:**我发现这些段落的开头特别难处理,为此我花了大量精力,构思了许多问题:
「问:《暗淡蓝点》段落的首个词是什么?」
「答:从」
「问:《暗淡蓝点》段落的开篇短语是什么?」
「答:从这个遥远的角度看……」
「问:当《暗淡蓝点》段落开始时,你应该想象自己在观看什么?」
「答:[前文提到的图像,此处不再重复]」
「问:《暗淡蓝点》段落的第一句话是什么?」
「答:从这个遥远的角度看,地球可能并不显得有什么特别之处。」
诚然,有些文章的开头如此脍炙人口,以至于不存在任何问题。例如葛底斯堡演说,我已经听过「八十七年前…」无数次,以至于它不需要任何修饰。然而,这句话的后半部分确实从深入的分析和思考中获益良多。我增加了一些问题,涉及「父辈」(fathers)一词的性别倾向(我猜如今我们会用「先辈」(forebears)或类似的词);关于「在这块陆地上」(on this continent)的冗余性;关于独特的动词选择(「孕育」(conceived)和「献身」(dedicated));关于林肯使用数学术语(「命题」(the proposition));以及他选择强调的美国建国的特定方面(自由,尤其是人人生而平等的理念),以及这些如何与奴隶制问题相呼应。我没有精确计数,但总共我大约有十几个关于这个开场白的问题。
让我们重新聚焦于《暗淡蓝点》,我想提到另一个因词语选择不确定而产生的问题[5]:
「问:在『从这个遥远的角度看,地球可能(might)并不显得有什么特别之处』这句话中,选用『might』而非『may』是否有特殊考虑?」
「答:这两种用法都可以接受。不过,『might』给人一种更加含蓄和疏离的感觉,这与 Sagan 后续采用的语气更为贴合。」
总的来说,对于这类细节,我并不过分纠结于是否「绝对正确」。真正重要的是要达到一种境界,不仅能流畅表达,更要深刻理解文章的内涵。当我开始强烈感受到这一点时,就不再过分关注细微的差异,尽管我仍会将其视为激发好奇心和获得更深洞察的契机。说到这里:
**放过标点符号:**我完全不在意标点符号是否「正确」。实际上,你可能已经注意到原文段落与我上面的 Anki 问题答案之间存在各种不一致。归根结底,标点符号并不是我特别关注的意义层面。事实上,只要目标不是成为一台录音机,而是要消化吸收文章精华以便在自己的思考中运用,那么找到表达个人见解的方式就很有帮助。根据自己的理解来选择节奏、标点和措辞,正是实现这一目标的方式之一。
高层次观察: 随着时间推移,我逐渐增加了越来越多高层次的观察,通常从多个角度出发。让我举几个例子:
问:《暗淡蓝点》这段文字假定读者在看什么?
答:暗淡蓝点的图像!
问:为什么我认为林肯在撰写葛底斯堡演讲时可能有些仓促?
答:演讲的后半部分在结构上明显不如前半部分精心安排,用词也显得不够优雅。
问:能举个例子说明葛底斯堡演说的后半部分给人仓促之感吗?
答:比如反复使用「应当」(rather)和「热忱」(devotion)这样的词,显得不够优雅,还有一些本可以轻易删去的词语和短语。
问:请注意《大自然的安宁》这首诗的三段式结构,它描述了:(1)作者面临的一种困扰;(2)应对这种困扰的行动;(3)该行动带来的结果(「我躺在大自然的怀抱里,获得了自由」)。
答:[无需回答,这只是一个引发思考的提示]
当然,提出这种高层次的问题是一项开放性的任务。它源于好奇心,源于相信在作者的思考中蕴含着丰富的发现。我在这里只是简单提及,但这可能是整个过程中最有收获的部分。
记忆的整个过程
我一直在描述记忆过程的各个细节。现在我想从宏观角度谈谈整个过程。需要注意的是,虽然我是按顺序描述的,但实际操作时我会在各个步骤之间来回切换。此外,这并不(完全)是我用于记忆第一段文字(《暗淡蓝点》)的过程,而是我在记忆多个段落的过程中逐步演变而来的。
-
条件允许时,我会先找到段落的精彩录音,反复聆听几遍。这种方法非常有效:优秀朗读者的语调为文本增添了大量额外信息,就像歌曲的伴奏使记忆歌词变得更容易一样。例如,Carl Sagan 朗读《暗淡蓝点》、Gregory Peck 朗读《葛底斯堡演讲》,以及Wendell Berry 朗诵《大自然的安宁》。这三个录音我都觉得极其有帮助。
-
我会每次专注于几个句子,选取一个短语,然后学习用它来引出下一个短语,逐步构建更长的内容块。比如,我会先记住「从这个遥远的角度看……」,然后学会接上「……地球可能并不显得有什么特别之处」接着,我会继续完善为:「但对我们而言,这却有着不同的意义。」。再进一步延伸为:「再次凝望那个点吧。那里,是此处。那里,是家园。那里,是我们。」如此往复,我会不断组合这些短语,直到能够连贯地记忆 5 到 10 个这样的短语,大约 100 个左右的单词。这个过程可能需要 10 分钟,通常让人感到很有成就感,而且不会觉得枯燥。虽然这种记忆可能不会长久保持,但我正在逐步熟悉文本,这是一个预备记忆或部分记忆的阶段。
-
完成上述步骤后,我会开始进行之前提到的局部分析。我会特别注意那些令人意外的词语选择,思考作者为何如此用词。同时,我也会关注那些出人意料的语义表达,甚至思考哪些地方我可能会有不同的措辞(没错,我确实会这么想!)。这些观察都是制作 Anki 记忆卡片的绝佳素材。随着对文章理解的逐步加深,我还会不断添加一些更高层次的要点。
-
如果精力允许,我会继续分析下一组 5 到 10 个短语,采用相似的方法,对这一部分重复前面的步骤 2 和 3。
-
重复步骤 4,直到完成整篇文章的阅读。
-
在首次通读全文后,我通常会进行第二次快速阅读,方式与第一次类似。
-
接下来,我会进行大量的细读——深入分析文本,努力加深理解,同时添加 Anki 问题。这个过程涵盖了从局部用词到段落整体要点的各个层面。
-
最后,我会再次通读全文,巩固理解。
-
接下来,我会像步骤 7 那样继续深入阅读,还可能通过默写段落来测试自己。然后我会将自己写的版本与原文对比,仔细记录任何差异或困难之处。每个错误或卡壳的地方都极为宝贵,因为它们揭示了我对作者意图理解不到位的地方。这些发现为制作 Anki 问题提供了丰富的素材,涉及词语选择、文本结构和作者意图等多个方面。此时,虽然我还未能完全记住这段文字,但已相当接近了。然而,测试过程中也暴露出一个问题:我发现自己开始害怕犯错。在我看来,这种恐惧其实很不利于学习;遗憾的是,我还不知道如何克服它。
-
第二天,我会再次自我测试,默写这段文字,然后像步骤 9 那样将自己的版本与原文对比,再次分析错误和困难之处,并添加 Anki 问题。通常在这之后,我会再测试一次。虽然我可能还会有些问题,但会明显感到进步。有时我会多次重复这个再测试的过程。
-
重复步骤 10。
-
重复步骤 10。到这个阶段,我通常已能够快速、准确地默写出整段文字。更重要的是,此时我能深刻体会到这段文字已融入我的内心,我不仅能完整把握它的内容,更感受到它正从外在的知识逐渐转化为内在的理解。
这个过程并未就此终止。通过反复测试,我发现自己对文本的理解似乎永远不会抵达极限;我与文本的关系在不断深化。让我惊叹的是,我清晰地感受到自己经历了几个阶段:从最初达到不再出错的基础水平,到后来能够流畅阅读,最终达到仿佛融入文本之中的境界,在这个阶段,情感与对世界的洞见自然涌现。这些体验逐渐通过我的语调、肢体语言、节奏以及切身感受得到越发充分的展现。如前所述,我开始感受到自己触及了文本的核心,达到了一个我由衷想要表达这些内容的境界。我体验到与文本的深度交融,在这种意识状态下,文字的表达既显得精心雕琢,又仿佛水到渠成。从这个角度看,记忆系统中的问题几乎化身为一种脚手架,一种概念发现故事,目的是挖掘并内化文本背后情感和思想的统一性。
在整个过程中,延长对文本保持专注兴趣的时间至关重要。实现这一点的关键在于不断深入挖掘文本的深层含义。诚然,我并非每次都能达到这样的状态!有时我也会发现自己陷入机械式的背诵,难以真正投入其中。这一直是我在进行的个人课题;我认为,如果面对更具挑战性的公开测试,我可能会被迫更深入地理解文本[6]。可以说,在舞台上进行公开表演,比独自散步时默念文本要困难得多,也更能促进对文本的理解。
为了更好地阐释我的观点,让我们回顾一下电影史上那些伟大的独白——比如,Jack Nicholson 在《义海雄风》中那段著名的「你无法承受真相」的演说。这段台词由 Aaron Sorkin 精心打造。然而,Nicholson 必定深入钻研了这段文字,以真正领悟说出这些台词的(虚构的!)角色当时的心理状态和情感,以及他对世界的看法。「将这段话作为大制作电影中的关键独白来演绎」无疑是一项极具挑战性的考验!
(顺便一提,对于需要进行公开演讲的人来说,有一个非常普遍的建议,那就是不要死记硬背演讲稿,而应该根据提纲即兴发挥。人们常说,背诵的文字听起来会显得生硬呆板。从经验来看,我确实见过新手演讲者出现这种情况。但我仍然认为,这个建议是基于一些根本性的误解。事实上,最出色的表演往往来自于有剧本的演员。他们不仅仅是记住台词,更是将其彻底消化吸收,内化为自己的一部分,甚至在这个过程中领悟出一种情感的真实性,然后在表演中淋漓尽致地表现出来。当然,这需要一个非常优秀的剧本,以及付出巨大的努力去消化吸收。这无疑是一项艰巨的工作,但正是这样才能呈现出最为卓越的表演!)
这听起来工作量很大,事实确实如此。尽管我没有具体的统计数据,但仅仅记住《暗淡蓝点》中的400个单词就花费了我几个小时。正如前面提到的,我相信持续投入时间必将带来更多收益,因此很难准确衡量记忆所需的具体时间。更值得注意的是,虽然时间投入巨大,但理解所获得的回报却是非线性的。数学家 Littlewood 在回忆录中写道,随着年龄增长,他决定只聆听巴赫、贝多芬和莫扎特的音乐。我深深理解这种选择:反复品味深邃非凡的作品,远胜于将时间耗费在众多平庸之作上。因此,我认为将时间投入到研读 Sagan 、林肯和 Berry 的作品是非常值得的。我也坚信,通过持续练习,我的学习效率会不断提升。
事实上,可能还存在一个更深层的现象:我发现,现在无论我是否打算记忆文本,只要我专注阅读任何段落,都能注意到更多关于文本的细节。我推测,这可能是某些人比我更擅长记忆文本的原因之一:他们已经学会了以我尚未掌握的方式关注文本。这个过程正在重新训练我,使我能够以类似的方式集中注意力。虽然我的语言记忆力较弱,但在其他领域却表现出色——比如数学和科学概念、具体数据、故事主线以及人物形象等方面的记忆(在一般情况下)都很不错。这些恰好都是我特别感兴趣且充满热情的领域,因此我会自然而然地关注到许多细节;相比于理解文本,我更容易掌握这些内容。我发现 Anki 是一个很好的引导工具,它帮助我建立起对文本的深度参与,就像我能够自然形成对数学概念的透彻理解那样。
Anki 的角色:尽管记忆系统为我带来了「显著成效」,但我最终意识到,现有的记忆系统或许并非这项任务的最佳工具。诚然,我对段落所做的深入分析确实极具价值,而 Anki 为此提供了有力支持。我迫切希望能牢固地记住为什么「我们所有的欢乐与苦难的总和」比「他们所有的欢乐与苦难的总和」更为贴切,以及其他几十个类似的措辞选择。然而,尽管这些分析很有价值,Anki 呈现这些问题的方式却不够理想,因为它割裂了段落的整体语境和情感内涵。
我尝试了一种替代方法,将段落复制到 Google 文档中,然后逐步为段落添加注释——例如,对「我们的」这样的词语选择提出问题。这种方法虽然有些笨拙,但有一个显著的优势,就是让我能够很好地与整个段落保持联系。然而,随着时间推移,边缘注释变得过于拥挤且难以浏览。我发现,与其查看注释,不如简单地注意到某个词或短语被高亮显示,然后问自己注释的内容是什么,这样更有效。我对这种方法的潜力持乐观态度,但我最初的 Google 文档实验还不够完善。我认为以下几项改进(或其变体)可能会有所帮助:
-
更好的高亮显示功能,使用多种颜色来处理重叠的短语。
-
鼠标悬停时显示浮动评论的功能。
-
也许可以加入某种测试模式,以逐步揭示文本内容。
如果仅仅对比上述借助 Anki 的记忆方法与「传统」的记忆方式,我们就能获得不少启发。回想自己在校期间被要求背诵课文的经历,我大致遵循的是上述步骤中的 2、4-6、8 和 10,但对文本的深入解析却往往不够充分。通过与其他人交流,我发现这样的学习体验相当普遍。
结语:一般来说,人们认为把时间花在记忆文本上并不明智。如果这个过程仅仅是为了记忆,我也会认同这种看法。然而,我要特别指出,实践证明记忆并非最重要的收获。真正的价值在于加深了对这些我所喜爱的文本的理解。我相信这种理解将持久地提升我的写作水平。同时,它还让我更加注重自己的表达方式。这种方法之所以能带来如此显著的改变,部分是因为我发现语言和写作其实是一种很不自然的思维形式;这个过程要求我比平时更深入地分析和关注语言本身。因此,我很庆幸开展了这个项目,也计划在未来继续记忆更多段落,只是会更加用心选择。
脚注
-
顺便一提,Helga 和 Tony Noice 关于演员和其他专业人士记忆力的研究非常值得一读。这项研究对我的整体观点产生了重要影响,尤其是它强调要逐步深化对作者意图的理解这一点。
-
这里我指的是建立在间隔重复理念基础上的记忆系统。我知道有些演说家使用记忆宫殿等方法来帮助记忆文本段落。我只是简单探索过这种方法,所以不会在这些笔记中详细讨论。总的来说,我发现记忆宫殿在灵活性和功能性上远不如间隔重复系统,尤其是在理解抽象概念方面,尽管对于某些特定用途,记忆宫殿可能更为适合。因此,我将重点放在间隔重复及其变体上。
-
虽然我不喜欢模棱两可的说法,但尖锐的答案和准确的答案之间确实存在矛盾。我并不确切知道南方士兵的想法,所以我只是做出了一个(在我看来非常合理的)推断。在实际操作中,我倾向于选择一个合理但更为尖锐的答案。
-
这张记忆卡片并没有明确指出葛底斯堡演讲的背景。我也没有将它单独放在一个 Anki 牌组中。你可能会想——我自己也在思考——这是否会导致将来复习时觉得这张卡片很奇怪。我尝试过用「ga」(代表葛底斯堡演讲)和「pbd」(代表淡蓝点)等标签来标记卡片,但做得并不连贯。实际上,到目前为止,我发现我能很快认出卡片的背景。但我不确定这种方法将来会如何发挥作用。
-
顺便说一下,我就这个例子与 ChatGPT 进行了讨论,我的回答部分基于它的回应。
-
当然,这份文档也在某种程度上起到了这个作用,尽管它的要求远不如在观众面前背诵一段文字那么严格。
大量输入与间隔重复
原文:Nintil - Massive input and/or spaced repetition
2023-09-10
摘要
在某些领域和特定应用场景中,接触大量学习材料比运用间隔重复更为有效。
我曾撰写过几篇关于教育与学习的博文:主要是这两篇关于 Bloom 的两个标准差与精熟学习法的文章,以及关于间隔重复系统(SRS)的文章。
今天我注意到一个有趣的现象:一方面,我写了这些博文,并且在理论上认为 SRS 非常有价值;但实际上,我采用的学习方法却截然不同——那就是大量输入法。我在《扩展隐性知识》一文中曾简略提及这一概念。
语言学习的奇妙之处在于,对儿童来说这一过程似乎毫不费力。将大量输入与适当的上下文结合,孩子们首先会记住那些显著的词汇,然后识别整体模式,推断语法规则,最终能够流利地运用这门语言。成年人同样可以通过这种方式——接触大量带有恰当上下文的例子——在大约一年内掌握一门语言。有一个案例中,这位学习者仅用了 18 个月时间,就从零基础达到了近乎母语的日语水平。
我并非宣称我们可以用学习语言的心智结构来学习所有事物。或许语言比其他领域更容易掌握,是因为我们在语言习得方面天生就有预设机制,而在其他领域则没有这种先天优势。我想表达的是,有一个领域中这种方法(海量的有上下文的例子输入)明显有效,我们应该思考如何将其拓展到其他知识领域。
我在撰写《长寿 FAQ》时就采用了这种大量输入的方法:我先阅读了一本教科书,然后在数月内阅读了大量的论文,但并不刻意深入研读每一篇或做详细笔记,而是尝试以数量取胜,不过分深究任何特定论文。如我上文所提,"大量输入"这个概念源于语言习得领域,也是大多数人首次接触闪卡(或某种基本形式的间隔重复学习)的地方,我发现这一点相当有趣。
这种方法与 Andy Matuschak 描述的阅读量子力学书籍的方式截然相反。引用他的话:
Dwarkesh 对我的读书方式感到相当惊讶。我阅读的速度大约是每页十五分钟,而他每页只需几分钟甚至更少。更为重要的是,我在阅读过程中不断地向文本和自己提问。比如:
- 这句话是什么意思?我能用自己的话解释它吗?
- 这里哪些观点特别重要?
- 作者显然认为我应该理解这个论点为何成立——那么它为什么成立?
- 作者强调了这个细节——它为什么重要?
- 作者似乎在这里设置了一个对比——究竟是什么对比?
- 这个细节与我已有的物理学知识有何关联?
- 如果我只看这个例题的开头,我能自己完成剩余部分吗?
- 我刚才犯了个错误——我理解错误的原因吗?能解释我的误解吗?
- 当然还有:我能回忆起上一页讲的内容吗?
大量输入法的优势在于,你不必强迫自己停下来问这些问题(即强制自己放慢速度),也无需为了记笔记而放慢节奏。从我学习生物学的经历来看,这种方法对我有效的原因是,当进入一个新领域时,初学者面对着太多不确定是否重要的内容,即使是在教科书中。可能有些概念你以后再也不会遇到。在生物学领域这种情况极为常见。当你知道你正在阅读的大部分内容可能并不重要时,强迫自己做笔记和制作间隔重复记忆卡片会使学习过程变得缓慢且完全没有成就感。大量输入的方法给了你浏览、跳过内容和按兴趣探索的自由。
然而,对于任何形式化学科(数学、物理、学习新的编程语言或一般的计算机科学),我绝不会采用这种方法。在这些领域,我认为 Andy 的方法才是正确的,也是我过去一直努力遵循的方法。
原因似乎很清晰:形式化领域往往依赖于深层次的抽象塔,掌握一个层次对于进入下一个层次非常有意义,因为下一层次本质上就是前一层次被新符号重新包装的结果。这类领域接触的概念数量虽少,但它们之间的互动方式却异常丰富,人们必须能够驾驭这些互动关系,才能在相关领域产出成果。而像生物学这样的其他领域则抽象程度较低。这类领域的本质极其复杂,生物系统中各组件间的互动关系难以用那种能整齐封装在抽象中的形式化规则来清晰定义,它们总是会在某种程度上出现「泄漏」;因此在生物学实践中,人们与其说是在证明什么,不如说是在各个方向上进行摸索,然后通过具体实验来确认这些摸索的方向。
再来说说语言学习。
"Khatzumoto",AJATT(All Japanese All The Time)的作者,就是大量输入法的倡导者之一。这种方法对他非常有效,你可以在这里看到他说着非常流利的日语
我用了 18 个月时间学会了日语。2004 年 6 月,在我 21 岁这个「成熟」年龄,已经过了青春期,据说也已经过了智力巅峰期的时候,我开始学习日语。到 2005 年 9 月,我已经掌握了足够的日语能力,可以阅读技术资料,用日语进行商务交流和求职面试。到了下个月,我成功在东京一家大型日本企业获得了软件工程师的职位(太棒了!)。
我是如何做到的?通过每天 18-24 小时沉浸在日语环境中,做任何与日语相关的事情(「全日语,全时段」)。这听起来似乎投入了大量时间,但实际上我和你一样忙碌:我是美国一个小镇上大学里的全日制计算机科学专业学生,地理位置上远离日本和日本人。我要应付计算机科学的课业,打工,甚至还有一个非日本籍的「另一半」。换句话说,我也有自己的生活。
也许这个案例有些极端,但你明白了其中要点。大量输入可以与间隔重复结合使用,但关键在于你不必强制这样做。如果你的一天都围绕着某个主题,那么一周前接触的概念很可能在本周再次出现,这意味着你实际上在不知不觉中、无需刻意制作提示卡片的情况下,就在进行自然的间隔重复。事实上,在大量输入的理念中,有些观点甚至反对使用 SRS,认为它会妨碍大量输入的进程!当然,也有人支持一种折中的立场,主张两种方法适度结合。
抛开效果不谈,在 Andy 关于如何设计让阅读内容更好地留在记忆中的思考中,有一个反复出现的元素是间隔重复的强制性:你必须强迫自己坚持这个系统。那么,这种强制性能否被减轻并变得更加友好呢?为使用 SRS 建立一个合理的心理叙事是第一步:「如果我做 X,那么我将获得好处 Y」。如果你观察到其他人通过 SRS 成功获得了这些好处(Y),你就会有动力继续坚持:他们能做到,你也可以。然而在大多数领域,人们并没有这样的保证。再思考一下:如果你试图用 Anki 来记忆《细胞分子生物学》整本教材的内容,你认为这会比先通读全书然后再阅读几篇相关论文更有效吗?
因此,推荐的方法是:首先通过大量信息输入构建该领域的知识地图,让自己沉浸在这个领域中。只有在这之后,才针对性地使用间隔重复法来补充那些最终缺失的关键知识点。
《反对学校教育的依据》读书笔记
我上一篇书评标题的俗气程度飙升,这次我决定回归简洁明了的标题风格。
大约一周多前,我读完了《反对教育的依据》这本书。在阅读过程中,我发现自己与作者的观点高度一致,仅有的一些细微分歧我已在此前《脑中的大象》一书的评论中详细阐述过。这是一本极为出色的著作,我强烈推荐大家购买阅读。(译注:The Case Against Education,正式译名为《教育的浪费》)
本书的核心理念认为,目前设想的教育被极度高估了。政策上的启示是,应彻底或大幅减少对教育的补贴,并且,若无道德上的顾虑,还可考虑对其征税,以进一步提高效率。(!)
这一结论初听之下颇为意外,毕竟教育常被认为是益事,有助于人们积累人力资本(译注:指人的经验、知识等等),从而谋得更好的职位。但 Caplan 经过深入分析后指出,实际情况并非如此:许多所学内容在工作中并无用武之地。
人们或许会尝试提出各种批评,然而 Caplan 很可能已对所有质疑作出回应。Noah Smith 曾试图反驳其论点,但情况亦是如此。
有人可能会辩称,学习某一特定领域(如古梵文或拓扑代数)能让你在完全不同的领域(如批判性思维)获得广泛技能。也有观点认为,教育本身就是好的,一个受过良好教育的社会从本质上来说就是件好事。还有人可能会质疑,考虑到存在能力偏差,他的研究结果可能并不成立。
这些问题在书中都有详细的解答,所以我就不在这里一一阐述了 :-) 我会把寻找论点漏洞的工作留给那些对他的理论持怀疑态度的人。
归根结底,教育的运作机制可以用信号理论来解释:获得教育确实是有价值的——这一点你的判断没错——但其价值并不在于它教会你什么或让你成为更优秀的员工。虽然教育确实在某种程度上起到了这些作用,但其影响远不如人们通常认为的那么大。按照 Caplan 的观点,教育的作用可以大致分为 20% 的人力资本积累和 80% 的信号传递。教育之所以有用,是因为它向你未来的雇主传递了三个关键信号:尽责、智力和服从。这些信号很难通过一个短期的 MOOC 在线课程来有效传递,即使你在 MOOC 中确实学到了更多的知识。
这本书深入剖析了教育信号在现实中的作用机制,详细考察了从高中到硕士不同学历层次,以及从学习成绩欠佳到优秀的各类学生所能获得的个人和社会回报。作者的研究结果非常有趣:即便在当前环境下,对很多学生而言,本科学历都算不上一项有利可图的个人投资,更不用说硕士学位了。虽然在那些大力补贴教育的国家,情况可能有所不同,但这些国家的教育溢价较低,因此也需要纳入考虑。我认为,作者的主要结论很可能不仅适用于美国,在其他国家也同样适用。
在此,我想讨论的并非书中内容的概要,而是围绕教育的社会现实。Caplan 在书中解释了为什么他的观点尚未成为共识:为什么学术界不青睐人力资本理论。但在现实生活中,情况又是如何呢?
(I):我的拉丁语
「我们对教育持什么看法?」这个问题没什么用,因为「我们」中包含了对教育持不同观点的群体。我们需要针对不同群体分别提出这个问题。
-
普通学生:他们认为教育是就业的敲门砖。你会选择一个自己略有兴趣、且与未来职业相关的专业来学习。虽然日后可能记不住大部分所学内容,但你会获得广泛的通用技能,学会团队合作,积累相关领域的专业知识。此外,上大学已成为社会共识,如果不上大学,雇主会怎么看你?
-
优秀学生:他们的观点与普通学生相似,但他们记住的知识更多,且往往将深入学习课程内容本身视为目标。这类学生更可能成为学者。他们更重视学习过程,因为他们认为这是一种富有吸引力的智力挑战。
-
雇主(招聘面试):他们希望招到优秀员工。知名高校相关专业的学历是基本门槛,可以筛选掉大部分不合格的候选人。然后,他们会通过个人成就和项目经验来进一步评估应聘者。他们并不特别在意具体的课程内容,只要整体简历能传达正确的信息即可。
-
教授:他们的职责是教育学生,为学生提供成为学者或在就业市场取得成功所需的技能。诚然,有些课程可能没有直接的用处(如英国文学),但这能为有志于学术道路的学生提供必要的知识储备,而对其他学生来说,这些课程也能培养在校外有用的「广泛技能」。
-
文化潮人:他们认为教育固然重要,能帮助找工作,但教育本身就是目的。他们认为:没有伟大经典作品的熏陶,缺乏对艺术和音乐的欣赏能力,人生就是不完整的。这些看似无用的东西恰恰体现了人生的意义:重要的事物本身就是目的,而非实现其他目标的手段。学生应该接触这些文化领域,至少有机会培养自己的文化修养。
-
父母:他们希望教育能让孩子找到好工作,充分发挥潜力。也希望孩子能赚钱,这样就可以不再在家里蹭饭,过上独立生活。
-
政治家:教育是广受欢迎的议题。家长喜欢教育是因为它能让孩子找到工作,孩子喜欢教育也是出于同样原因。此外,支持教育还能赢得文化潮人的好感。增加教育投入是一个几乎没有人反对的话题,因此大力支持教育是政治上的明智之举。
众所周知,人们对教育的看法形形色色。我认为,这并非出于什么不可告人的动机,而是因为每个人的偏好、人生经历和面临的现实环境都不尽相同。如果说教育领域存在什么问题,那可能是人们陷入了「典型心理谬误」,即误以为所有人都应该和自己持相同观点。举个例子,一位文化潮人可能会想:「你怎么连莫奈和马奈都分不清,还敢说拉丁语已经过时没用?」然而,由于社会期望偏差(SDB)的存在,这种文化潮人很少会遇到公开的反对声音。即便有人表示「这些知识本身很有价值,但并非人人都需要」,也可能会给人留下不够重视文化的印象。在这种情况下,保持沉默往往是最明智的选择,因为你不会因此失去什么。诚然,学生们在被迫学习他们不感兴趣的科目时会怨声载道,但他们无力改变现状。等到他们离开校园,步入社会后,也就失去了继续表达这些看法的动力。
教授和优秀学生不采取这种做法,反而将智力任务视为一种有趣的挑战,这一事实可能也助长了社会期望偏差(SDB)的形成:如果大学和学校里的聪明学生和权威人物真心热爱教育(相较于其他学生而言),并努力学习课程内容,那么不了解这些内容无疑会向他人表明你不属于精英阶层。此外,在经历了教育的漫长过程,付出了大量辛勤劳动和宝贵时光之后,人们可能会希望让他人也经历同样的磨练才能获得理想的职业。这种现象类似于我们在入会仪式中所看到的情况,是一种我始终无法深入理解的奇特的斯德哥尔摩综合症。人们虽然不喜欢这些仪式,但事后却为经历过它们而自豪,并将其强加于他人。
因此,尽管教育系统如 Caplan 所说效率低下,却仍受到普遍欢迎,这一现象的持续存在是由以下因素支撑的:
-
一些人极其重视教育本身的价值。这些人往往在学术界、政府和私营部门中担任与教育相关的决策职位。
-
没有人有改变现有系统的动机
-
政府为整个系统提供资金支持
-
人们感觉教育确实能够传授一些技能(这也没错)
-
教育的确有助于获得更好的工作机会
-
控制幻觉?(教师可能高估了自己对学生的影响?)
-
对沉没成本的合理化?(我们为教育投入了这么多钱,这一定是有充分理由的!)
(II):那么穷人呢
这个问题在该书出版后已多次被提及。
该书并非专门讨论政策,而是着重强调了几个基本观点,并提出了一些解决方案——主要是削减教育经费。一旦接受了教育信号传递的一现实,人们可能会质疑:「那穷人该怎么办?」最初的回应可能是,削减经费后将以更低的成本产生同样的结果:富人仍会选择更昂贵的学校,而不太富裕的人则会选择更经济的学校,依此类推。相对排名保持不变,只是整体支出降低了。
然而,如果你认为削减经费会导致一些人完全无法负担教育费用,情况又会如何呢?在这种情况下,只有收入超过某个水平的人才能接受教育。这可能会阻碍一些有才能的人充分发挥潜力,因为他们无法通过教育来展示自己的能力。但是,我们可以从不同角度来回答这个问题:
a) 即使不采取任何措施,「削减所有人的教育经费,导致部分人无法接受教育」这种情况,对大多数个人和整个社会来说,都比「维持高水平的教育经费,让所有人都接受教育」更有益。
b) 如果这个观点被接受,那么对于那些特殊的少数情况,可以提供有针对性的、基于家庭经济状况的教育补贴。
c) 教育本质上并非高成本的事业。教育的核心要素不过是一座建筑和若干教师。一名教师就能教授众多学生。诚然,如果追求高规格,成本自然会攀升,但提供扎实的基础教育实际上并不需要太多资源。有人认为,正是公共教育体系扫除了大众的文盲,若没有它,文盲率必定居高不下。然而,这种观点并不符合事实,正如我在《非非自由意志主义者的 FAQ》中所论证的那样。事实上,大众教育的普及是社会发展的自然结果,而非国家主导的产物。
(III):教育能否被替代?
你可能不太愿意接受,但教育的终极形态很可能就像职业教育。
在这种解决教育问题的模式中,教育经费被大幅削减。设想一下这样的场景:大学纷纷关闭,教授薪资暴跌,幸存的大学也不再那么豪华。大批享有高薪终身教职的书呆子不得不转行到金融、科技和咨询行业谋生。但令人惊讶的是,这样的改革反而使社会财富增加了 2-4%。
想一想:在美国,科学家和工程师仅占全部就业人口的 5%。医生占 0.54%,护士占 1.9%。律师则占 0.77%。你可能会说某些职业确实需要非常长期的教育,但卡车司机需要吗?销售员呢?
即便对于工程类职位而言,大学教育是否能比同等时长的「在职培训」加上「一些课程」培养出更优秀的工程师,这一点仍然存在争议。我甚至敢打赌,当大学毕业生刚刚成为初级工程师时,那位从未踏入大学校门的人可能已经晋升为高级工程师了。到那时,大学毕业生能做而另一位做不到的事恐怕也寥寥无几。
让我们回到本节的核心话题:在这个假想的社会中,几乎所有人都自费接受教育(与此相应,税收也随之降低)。教育费用虽然可以负担,但内容不如现在这般丰富多彩:艺术、音乐、体育或外语等课程明显减少。许多大学已经关闭或转型为实用技能培训中心,由雇主直接参与监督,以确保教学内容实用。一些历史悠久、声誉卓著的大学虽得以保留,但规模已大幅缩减。年轻人有机会在不同工作岗位上实习多年,借此接触各种类型的工作。实习待遇因地而异:有些机构提供薪酬,有些不提供任何报酬,还有一些甚至要求实习生付费。这主要取决于实习生的经验水平和该岗位的学习曲线。
对我而言,这种做法听起来很棒——虽然我承认,在某些人眼中这可能像是一个敌托邦(dystopia)!——孩子们能够学到实用技能,有时甚至能够获得报酬;他们不会浪费太多时间,减少了死记硬背的负担和考试带来的焦虑,而且每个人都能增加收入。
Bloom 的「两个标准差」问题:系统比较精熟学习法、一对一辅导和直接教学法的有效性
Collison 提出的问题之一是:
Bloom 提出的「两个标准差」现象是否真实存在?如果存在,我们应该如何应对?
教育心理学家 Benjamin Bloom 研究发现,基于精熟学习法的一对一辅导,可以使学生成绩提高到两个标准差(!)的范围。这一结果得到了后续研究的重现。在提出「两个标准差问题」的论文中,Bloom 抛出这样的问题:大规模一对一辅导不实际,怎么能在更可行的条件下实现这样的结果?
与此相关的是,一项大规模元分析表明,采用精熟学习法的直接教学效果非常显著(Cohen d 值大于 0.5 )。「然而,尽管有大量研究证据支持其有效性,直接教学法却未能在教育实践中得到广泛接受或实施。」
要回答这个问题,我们首先需要明确直接教学法(Direct Instruction)和精熟学习法(Mastery Learning)这两个概念的具体含义。
1 本文研究范围
本文旨在全面探讨 Bloom 提出的「两个标准差问题」,并会深入分析精熟学习法和一对一辅导等教育方法,同时对基于软件的辅导系统进行综述。文章还将探讨教育研究、间隔重复以及刻意练习等主题,这些内容与本文的核心议题密切相关,通读本文后便可明了。
需要特别说明的是,本文主要聚焦于学生的考试成绩,而非教育的其他潜在益处。我不会深入探讨如何让学生维持学习动力、提升幸福感、培养创造力或成为更优秀的公民。虽然长期成功指标(如未来的收入水平)也是值得研究的方向,但遗憾的是,笔者未能找到相关的研究数据。
在讨论效应量时,请注意,除非特别说明,文中提到的效应量,是特定干预手段与学校通行教育方法的对比结果。
1.1 定义
1.1.1 两个标准差问题
几十年前,教育心理学家 Benjamin Bloom 研究发现,与传统课堂教学相比,一对一辅导能使学生的学习成绩提高两个标准差,这在教育领域代表着极其显著[1]的效应。然而,由于一对一辅导成本高昂,难以推广,Bloom 开始思考:是否有一种办法可以逼近这种效果,同时可以在较大规模的课堂中推行?对这种方法的追寻,就是他提出的「两个标准差问题」。在众多探索中,精熟学习法似乎很有前景。
1.1.2 直接教学法
根据上文提到的元分析研究,直接教学法是由教育家 Siegfried Engelmann 在 20 世纪 60 年代创立的一种教学方法。这种方法基于一个核心假设:只要满足两个条件,任何学生都能掌握任何给定的学习内容。这两个条件是:
(a) 学生已经掌握了必要的前置知识和技能;(b) 教学指导清晰明确,不存在歧义。
乍看之下,这个描述可能显得有些抽象笼统。幸运的是,美国国家直接教学法研究所提供了更为详尽的信息。
相比其他方法,直接教学法(DI)具有四个核心特点,能够保证学生能学得更快速,更高效:
精准分层,因材施教:在 DI 项目开始时,每位学生都要接受全面评估,以确定他们已掌握的技能和需要提升的领域。根据评估结果,学生会被分配到与其他需要学习相同技能的同学一起的学习小组。这种分组是基于学生的实际能力水平而非年级进行的,确保每个学生都能接受最适合自己的教学内容。
循序渐进,巩固掌握:DI 项目的课程结构经过精心设计,旨在确保学生能够真正掌握所学内容。新知识的引入是循序渐进的,每节课仅包含 10% 的新内容,给予学生充分的时间去理解和应用这些新技能,然后再学习下一组新技能。课程的其余 90% 内容则用于复习和应用已学技能,帮助学生达到熟练掌握的程度。在教学过程中,技能和概念先被单独讲授,然后再与其他技能整合,用于更复杂、更高层次的应用中。教学的每个细节都经过精心设计,以最大限度地减少学生对所学内容的误解,同时最大化教学的强化效果。
个性化教学,灵活调整:DI 的一个突出优势在于,它能够根据每个学生的学习进度进行灵活调整。如果学生在某个技能上需要更多练习,教师可以在项目框架内提供额外的指导,确保学生真正掌握该技能。相反,如果学生很快掌握了新技能并准备好学习更高水平的内容,他们可以被调整到更高级的学习小组,以便继续拓展他们的技能范围。
实践检验,持续优化:DI 项目在编写和修订方面采用了独特而严谨的方法。所有 DI 项目在正式发布之前,都会与真实学生进行实地测试,并根据测试结果进行多次修订和完善。这意味着学生所接受的教学项目已经过实践的严格检验,其有效性得到了充分证实。
直接教学法(Direct Instruction)是一种高度结构化的教学模式,甚至对教师在课堂上的用词都有严格规定。
值得注意的是,首字母大写的 Direct Instruction 与小写的 direct instruction 是不同的概念。目前有多种教学方法的名称中包含「直接教学」,例如「明确直接教学法」(Explicit Direct Instruction)。除非特别说明,本文讨论的都是 Direct Instruction。这两种方法都属于以教师为中心的教学模式,即视教师为向学生传授知识的主体,而非仅仅在学生自主探索知识的过程中提供辅助。如前所述,Direct Instruction 由国家直接教学研究所监管,而 direct instruction 则没有专门的监管机构。
1.1.3 精熟学习法
精熟学习法(Mastery Learning,ML)与直接教学法(Direct Instruction)是不同的概念,但 ML 是直接教学法的一个组成部分。ML 也是 Bloom 最初研究的教学方法之一,因此我们在本评论中也会对 ML 进行探讨。两者的一个关键区别在于,ML不要求使用脚本化的课程,而直接教学法则将其作为必要条件。
精熟学习法的核心原则其实很简单:学生必须完全娴熟掌握当前的学习内容,才能进入下一个阶段。每完成一个学习单元后,通常是每月或每周,都会对学生进行知识测试。未能通过测试的学生将参加补习课程,并再次参加测试,直到考试通过。这种方法可以采用集体形式,如 Bloom 最初提出的「为精熟而学习」(Learning for Mastery, LFM)模式;也可以采用个人形式,如 Keller 的「个性化教学系统」(Personalized System of Instruction, PSI),让每个学生按照自己的节奏学习进步。
1.2 总结
-
本文所涉及的研究文献普遍存在样本量小、非随机试验等问题,研究结果也呈现出高度的异质性。
-
总体而言,一对一辅导的效果可能无法达到 Bloom 所提出的 2 个标准差的水平,精熟学习法也不太可能带来 1 个标准差的进步。
- 然而,优秀的导师和优质的教育软件很可能能够实现 2 个标准差甚至更高的进步效果。
-
本文探讨的所有教学方法,包括精熟学习法、直接教学法、一对一辅导、软件辅导、刻意练习和间隔重复,都有不同程度上的效果,具体将在下文详细阐述。
-
这项研究涵盖了多种学科的教学,并涉及不同群体(如特殊教育与普通教育,大学与 K-12 教育)。这里报告的效应量是一个平均值,可作为总体参考,但具体情况可能会有所不同。
-
值得注意的是,相较于其他学生,这些研究的方法对基础较差的学生往往更为有效。
-
除了直接教学法(因缺乏在大学层面的有效性证据),这些方法在各个教育阶段都显示出了积极效果。
-
当明确设定学习目标和需要掌握的知识点时,这些方法的效果会显著提高。然而,几乎没有证据支持迁移学习的存在:学习或练习某一学科并不能显著提高在其他学科的表现。
-
有一些初步证据表明,这些方法之所以有效,主要归因于三个因素:增加了对学习材料的接触和重复、测试效应,以及在辅导过程中对学习表现的细致反馈。
-
然而,长期研究往往发现学习效果会随时间减弱,这种「淡出效应」可能是因为所学技能未得到持续练习和应用。
1.3 效应量
评估效应量的实际意义通常并非易事。以下是一种被广泛采用的方法:
| 效应量 | d 值 |
| ------------- | ---- |
| 微小 | 0.01 |
| 小 | 0.20 |
| 中等 | 0.50 |
| 较大 | 0.80 |
| 很大 | 1.20 |
| 巨大 | 2.0 |
然而,我们应该根据特定研究领域的特点来调整这些描述性术语。就教育领域而言,Hugues & Matthew(2019)的研究表明,一年的学校教育(从 5 年级到 6 年级)对阅读能力的平均效应量为 d=0.26,而 141 项大规模教育干预随机对照试验的平均效应量仅为 0.06。鉴于此,我将采用 Kraft(2018)提出的修订量表:
| 效应量 (E.S.) | d 值 |
| -------------------- | -------- |
| 较小 | <0.05 |
| 中等 | 0.05-0.2 |
| 较大 | 0.2-0.5 |
| 很大 | 0.5-1 |
| 极大 | 1-1.5 |
| 巨大 | >1.5 |
基于这一量表,以下是主要研究结果的概述,以及我所能找到的最具说服力的支持性研究。同时,为便于比较,我也会列出 Bloom 的相关发现:
| 教学方法 | 总体效应量 | 对弱势群体的效应量 | Bloom 效应量 | 主要参考文献 |
| --------------------------------------- | -------------- | -------------------- | --------------- | ------------------------------------------------------------ |
| 一对一辅导* | 很大 | - | 巨大 | VanLehn (2011) |
| (高质量)教育软件辅导* | 很大 | - | - | VanLehn (2011),Kulik & Fletcher (2016) |
| 精熟学习法** | 中等 | 较大 | 极大 | Kulik et al. (1990),Slavin (1987) |
| 直接教学法** | 中等 | 较大 | - | Borman et al. (2003),Stockard et al. (2018) |
* 如果导师特别优秀或教育软件质量特别高,教学效果可以达到巨大水平。
** 在传授特定领域的知识或小学阶段的基本技能时,精熟学习法(ML)和直接教学法(DI)对普通学生有较大效果,对弱势学生更是能带来极大效果。
2 直接教学法的实证依据
我在文章开头引用的元分析包含了一个文献综述,该综述指出所有先前的文献、系统性回顾和元分析均显示直接教学法具有强烈而积极的效果。这种研究结果的「高度一致性」相当罕见,甚至令人生疑。在教育研究领域,很少有方法能获得如此普遍的认可和毫无争议的好评。
借用一句网络流行语来说,直接教学法和精熟学习法就是教育的王。你可能不太认同这种方法,但就提高考试成绩而言,这确实是不容争辩的事实。
20 世纪 60 年代末,直接教学法(DI)被纳入「跟进计划」(Project Follow Through)。这是一项由美国政府资助的大规模教育研究项目,旨在长期跟踪并比较 20 多种教育干预方案在贫困社区的实施效果。全国各地的社区可以自主选择在当地学校推行的项目,其中 DI 被 19 个不同地区采用,这些地区在人口构成和地理特征上具有广泛的代表性。独立的评估机构采用多种对照组和分析方法,全面收集并评估了项目成效。最终结果令人瞩目:在所有评估指标上,唯有 DI 取得了显著的积极成效(Adams, 1996; Barbash, 2012; Bereiter & Kurland, 1996; Engelmann 2007; Engelmann, Becker, Carnine, & Gersten, 1988; Kennedy, 1978)。DI 的研发团队原本希望这一卓越成果能推动该教学法在教育界的广泛应用。然而,受到各种政治因素的影响,这一重要发现似乎只为少数学者和决策者所知(Grossen, 1996; Watkins, 1996)。
「跟进计划」中评估的部分干预方案包括(这些我此前都未曾听说):直接教学法、家长教育、行为分析法、西南实验室方案、银街方案、响应式教育、TEEM、认知课程和开放式教育。
研究表明,这些新型教育方法中的大多数实际上比传统学校教学产生了明显更差的效果。这一发现支持了一个重要观点:至少在「跟进计划」项目评估的指标上,教育方法的选择确实至关重要。特别值得注意的是,表现最差的开放式教育恰恰是一些追求创新的教师可能会认为很酷的方法:
这种方法着重培养孩子对自身学习的责任感。阅读和写作不是直接教授的,而是通过激发交流欲望来学习。这种模式的特点是灵活的课程安排、由儿童主导的选择,以及强调深度个人参与。
在这项元分析中发现的效应量约为 0.5,在社会科学研究领域,这被认为是相当显著的结果。
这项研究还分析了不同研究结果之间的变异性。由于研究方法的差异,可能会因为质量较差的研究过多而导致效果被夸大。然而,即使在控制了所有可能影响结果的因素后,这种效应仍然存在,至少研究者是这么声称的。而且这些控制变量几乎没有减弱这种效应:这似乎是一个非常稳健的现象,无论如何分析数据都会显现出来。
就元分析而言,这个结果看起来相当不错,甚至可能好得令人生疑。这让我不禁想起了 Daryl Bem 那项如今臭名昭著的元分析研究,该研究探讨了某些人是否具有预知未来的能力。事实上,如果基础文献本身质量堪忧,那么建立在其之上的元分析不可避免地会得出有偏差的结论。
2.1 对直接教学法的批评
鉴于先前的研究结果好得令人生疑,我特意搜索了一些针对直接教学法(DI)的批评。
其中一个广泛存在的批评,或者说是一个警告:大量关于 DI 的文献是由与国家直接教学研究所(National Institute for Direct Instruction,NIDI)有关联的人员撰写的,包括本文开头提到的那项元分析。然而,值得注意的是,该元分析本身并未发现 NIDI 赞助的研究与其他独立研究之间存在显著差异。
有一位教育学教授的观点值得我们关注。他承认直接教学法(DI)确实能够实现其预期目标,但同时他也提出了一个值得深思的问题:采用这种教学方法是否会导致学习环境缺乏创造力、快乐和自发性?不过,需要指出的是,该教授并未提供支持这一论点的具体证据,而且我们先前提到的元分析研究也没有涉及这些方面的测试。
教育研究者 Alfie Kohn 在他的一篇文章中对直接教学法(DI)提出了批评,他的论述从「跟进计划」的研究开始。Kohn 还指出了一个值得关注的问题:根据他引用的一些案例,尽管 DI 技术能够帮助学生很好地掌握教学材料,但可能会限制学生的深度理解能力和知识迁移能力。具体而言,这些接受 DI 教学的学生可能无法对所学知识进行更深入的理解,或将其灵活地应用到其他情境中。
Eppley 和 Dudley-Marling (2018) 的研究指出,直接教学法(DI)的相关文献存在明显不足。他们审视了 2002 年至 2013 年间发表的研究成果,得出结论认为这些文献质量普遍较低。他们声称,DI 基本上没有效果,只在极少数情况下显示出微弱的作用。然而,值得注意的是,他们似乎并未对这一结论进行量化分析,也没有采用元分析的方法。更值得关注的是,他们忽视了先前那些确实发现 DI 具有积极效果的系统性综述和元分析研究。
有效教育策略资料中心(What Works Clearinghouse,WWC)对 7 项直接教学(DI)的研究进行了审查,但其中只有一项研究被认为质量足够高,可以纳入他们的证据总结。基于这唯一一项研究,他们得出结论认为 DI 没有效果。然而,需要特别指出的是,这项研究是一项随机对照试验,其研究对象是 164 名学前水平的学生(平均年龄约 5 岁),这些学生都有学习障碍,且智商非常低(平均智商 76)。
不出所料,NIDI 专门开辟了一个网页来回应上述 WWC 的结论。然而,考虑到 WWC 审查的研究数量有限,而且他们采纳的那项研究样本极其特殊,我决定不再局限于 WWC 的结论,而是转向研究更多其他的相关文献。这样可以获得更全面、更具代表性的研究结果。
值得一提的是,上述元分析的作者之一曾与他人合作发表了一篇论文(Stockton & Wood, (2016))。在这篇论文中,他们对一个广泛接受的观点提出了质疑,即在评估证据质量时应优先考虑随机对照试验。
反对直接教学法的阵营也不乏一些经不起推敲的论点。
2.2 直接教学法元分析的质量
在这项元分析中,表 1 呈现了效应量数据,平均值约为 0.5,且围绕这个值的置信区间较窄。然而,当我们转向表 3,审视研究设计对效应量的影响时,发现采用随机试验的研究对结果有显著的负面影响,同样,根据初始分数或智商进行调整也会产生负面影响。有趣的是,样本量本身对结果的影响并不明显。
让我们尝试聚焦那些最高质量的研究,看看能得出什么结论。虽然他们提到有一个列出所有研究的附录,但遗憾的是我无法获取这些信息。
| 研究 | 样本量 | 研究重点 | 效应量 |
| ------------------------------------------------------------ | ------------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ |
| Stockard et al. (2018) | 328 项研究 | 本文讨论的元分析(作为参考) | 约 0.5 |
| Flynn et al. (2012) | 64 名受试者 | 6-12 岁寄养儿童。采用一对一辅导。随机对照试验。使用 (d)irect (i)nstruction。 | 阅读:0.29,拼写:-0.08,基础数学:0.46 |
| Cobern et al. (2010) | 180 名受试者 | 8 年级学生,比较直接教学法(DI)和「探究式教学」(inquiry-based teaching,IBL)。随机对照试验。使用 (d)irect (i)nstruction。 | 科学:0.12(相较于 IBL,差异不显著) |
| Harper (2012) | 91 名受试者 | 6-13 岁寄养儿童,教育弱势群体。采用小组(4 人)辅导。随机对照试验。使用 (d)irect (i)nstruction。 | 阅读:0.4,拼写:0.25,基础数学:0.34 |
| Borman et al. (2003) | 48 项研究 | 针对教育弱势儿童的元分析 | 0.15~0.25(在评估的 29 种学习模式中排名前三)[2] |
| Stockard (2015) | 19 项研究 | 回顾 Borman 评论后发表的 NIDI 研究。包含非随机对照试验。 | -1.1~1.13,平均值 0.35 |
| Slavin (2011) | 1 项随机对照试验,3 项匹配研究 | 多种方法的最佳证据综合 | 随机对照试验为 0.25,匹配研究最高达 1.18。所有研究对象均为弱势学生,1.18 效应量的研究对象为智力障碍学生。随机对照试验来自一篇未发表的博士论文。 |
我抽样研究了一些案例,但并非刻意挑选:一个规律浮现出来——绝大多数直接教学法(DI)研究都是以弱势学生为对象进行的。事实上,正如我们稍后在讨论精熟学习法时将看到的,教育方法对那些技能水平较低的孩子往往会产生更为显著的影响。Stockard 的元分析中引用了一项 1999 年的综述,该综述聚焦于普通教育而非弱势学生群体。然而,除了 DI 创始人 Adams 和 Engelmann 在 1996 年的著作外,该综述并未引用其他具体论文。这项综述发现 DI 的平均效应量高达 0.87,在普通教育和特殊教育中差异不大,而对成年人的效果更为显著(超过 1 个标准差)。
然而,考虑到这一效应值几乎是后来元分析结果的两倍,不禁让人对相关文献的质量产生质疑。纵观现有文献,DI 对低技能儿童确实似乎有一定影响,但这种影响可能不超过 0.4 个标准差。至于对普通儿童的影响,我们缺乏充分的研究依据。这或许是 DI 未能在普通教育领域得到广泛推广的原因之一。
3 支持精熟学习法的实证依据
可汗学院是最广为人知的大规模实施精熟学习法理念的案例。目前,一项针对该学习平台的随机对照试验正在进行中,初步结果显示这种学习方法并未产生显著影响。
Robert Slavin 主持的「最佳证据百科全书」网站致力于收集教育领域中有效方法的证据。该网站对多种数学教学方法进行了综述,结果显示这些方法在中学和高中阶段未表现出明显效果,而在小学阶段仅有有限的证据表明可能存在较大效果。(他们只纳入了五项研究,效应量范围从 -0.18 到 1.08)。
考虑到先前的讨论,这一结果可能让人感到意外。然而,一个合理的解释是,这些研究并未采用完全一致的方法。就直接教学法(DI)而言,有专门的机构明确规定了其定义和具体实施方法。相比之下,精熟学习法则缺乏明确的界定标准,难以清晰区分哪些做法属于这一范畴,哪些则不然。
精熟学习法的元分析研究可追溯至 1983 年。该领域最后一项研究由 Kulik 等人于 1990 年完成,他们发现精熟学习法对学习能力较弱的学生效果显著(效应量 d=0.61),对学习能力较强的学生也有中等程度的效果(效应量 d=0.4)。值得注意的是,在他们的研究样本中,这两组学生之间的效果差异并不具有统计显著性。该元分析涵盖了为期数周至数月不等的教育项目,包括 K-12 教育和高等教育,涉及各类学科和不同程度的精熟要求(有些精熟学习方案要求学生达到完美水平,而其他则允许学生在测试中达到 80% 即可进入下一学习单元)。与 Bloom 的研究结果一致,要求更高的精熟学习法通常能够产生更好的效果。其中,最显著的效果差异似乎出现在精熟程度为 81-90 分和 91-100 分这两组研究之间。换言之,将精熟要求从 70% 提高到 80% 并不会带来太大改变,但将其提高到 90% 或 100%(即完美精熟)则能产生显著效果。需要特别关注的是,研究结果会因学生的测试方式而呈现出显著差异,这一点我们将在后续章节中详细探讨。当仅考虑标准化测试(即非教师或研究者自行设计的测试)时,效应量非常小(仅为 0.08)。相比之下,使用研究者或教师自制测试的效应量则更为可观,达到了 0.5。若仅考虑 Bloom 设计的精熟学习项目(即「为精熟而学习」,LFM),效应量更是高达 0.59。
Cook 等人(2013)对 82 项研究进行了元分析,探讨精熟学习法在医学教育中的应用效果。研究结果显示,这种学习方法在提升学习者技能方面效果显著(效应量达 1.29),在改善患者预后方面也取得了较好成效(效应量为 0.73)。然而,由于各项研究结果存在较大差异,研究者提醒我们需要结合具体情况来解读这些发现。如果这些结果确实可靠,无疑将为医疗保健领域带来重大利好!
在评估精熟学习法效果的主流研究中,Guskey(2015)的综合评估也对这种学习方法持积极态度。大多数系统性综述和元分析都支持精熟学习法的有效性,但 Slavin([1987](https://blogs.edweek.org/edweek/DigitalEducation/slavin.1987.mastery learning reconsidered.pdf))的研究是个例外。他选取了一部分他认为质量较高的文献进行分析,结果发现精熟学习法几乎没有效果。尽管如此,后续研究继续证实了精熟学习法的积极作用。Guskey 建议读者参考[3] Kulik 等人(1990)的文章,以了解为何许多学者质疑 Slavin 综述的可靠性。在此,有必要详细阐述 Slavin 的批评观点及其他研究者的回应,我将在下一部分进行探讨。在此之前,我会先完成对其他元分析的回顾。
Summaedu.org 网站汇集了多项关于精熟学习法的元分析研究。有趣的是,Kulik 早期进行的一项元分析(1983)显示精熟学习法的效应量很小(0.05),这与 Slavin 在 1987 年论文中得出的结论相近。这项早期研究针对 6 至 12 年级学生,而研究者认为对大学生而言,精熟学习法的效果仍然显著。然而,1990 年和 1987 年的元分析所涵盖的文献并不完全一致,即便是针对 K-12 教育阶段的部分也有所不同(需要注意,1990 年的元分析旨在覆盖所有教育阶段)。1987 年的论文致力于研究各种精熟学习法的实施方式,而 1990 年的研究则聚焦于两种特定模式(个性化教学系统和为精熟而学习)。更令人费解的是,Kulik 还有另一项元分析(1987)再次表明,精熟学习法对大学之前的教育同样有效。这真是让人摸不着头脑!
那么,1983 年的那篇论文到底怎么回事?
| 研究 | 样本量 | 研究对象 | 效应量 | 涉及的教学系统 |
| ------------------------------------ | ------- | -------------------------------------------- | ----------- | --------------- |
| Bangert-Drowns, Kulik & Kulik (1983) | 51 项 | 中学教育 | 0.05 | IPI、PLAN、PSI |
| Kulik, Kulik & Bangert-Drowns (1990) | 108 项 | 涵盖所有教育阶段,但主要集中在大学 | 0.52 | PSI、LFM |
乍看之下,人们可能会认为这两项研究结果的显著差异,是因为大学阶段的教育效果明显优于其他阶段,而 1990 年的研究并未对不同教育阶段的数据进行细分。然而,事实并非如此。1990 年研究中关于大学以下教育阶段的效应量也与 0.5 左右的整体数值基本一致。这里的关键点,也是 Summaedu.org 网站在分析时所忽略的是,1983 年元分析中涉及的研究并不全然聚焦于精熟学习法,而是包含了更广泛的「个性化教学系统」。
我们的元分析最终纳入了 51 项符合全部入选标准的研究。其中,首要标准是实验班级必须采用个性化教学系统。我们将个性化系统定义为具备以下特征:课程内容被划分为章节大小的单元、课堂时间主要用于学生的个人学习,以及重视形成性评估。在大多数采用此类系统的班级中,学生可以按照自己的节奏学习课程内容,并且只有证明自己已经掌握了当前单元才能进入下一单元。不过,我们并不认为这些是界定个性化教学的绝对必要条件。我们对个性化系统的界定标准,与 Hartley 在 1978 年研究「个人学习包」时采用的标准相近。
所以就这?不完全是。因为该论文还根据是否要求学生达到精熟水平这一标准,对研究进行了进一步分类。结果显示,在采用精熟学习法的 26 项研究中,其效应量仅为 0.05。这一发现不但没有解答我们的疑惑,反而让问题变得更加扑朔迷离。
答案可以在 Kulik & Kulik(1989)的研究中找到。他们的研究同时指出,Bloom 的为精熟而学习(LFM)确实达到了预期的 0.5 个标准差的效果,而 1983 年论文中提到的个人学习包仅有 0.1 的效果。这种差异是什么原因造成的呢?最合理的解释是, IPI 和 PLAN 的运作方式与 PSI 和 LFM 存在显著差异,而且在元分析中,IPI/PLAN 的效果掩盖了 PSI 和 LFM 的效果。事实上,如果我们仔细查看元分析中的个别研究,尤其是那些效果为负的研究,就会发现它们似乎并非采用 LFM/PSI 方法。那么,是什么让 IPI 如此与众不同呢?表面上看,它与精熟学习法的定义非常相似:
个别处方教学(Individually Prescribed Instruction, IPI)由匹兹堡大学开发,基于「诊断-处方」的教学循环。教师通过安置测试将每个学生分配到特定的阅读、数学或科学单元。随后,学生使用适当的材料独立学习。教师评估学生是否已经掌握了知识,必要时会布置额外的作业。
然而,IPI 与 LFM/PSI 的一个关键区别在于:当学生无法取得进步时,IPI 会让学生重复学习相同的材料,而 LFM/PSI 则会为初次未能掌握的学生提供新的学习材料。
关于 IPI,我几乎找不到相关研究。不过,初步来看,精熟学习法似乎只有在补救性学习活动的质量足够高时才能真正发挥作用。
3.1 Slavin 的批评
Slavin 的批评并非采用元分析法,而是使用他称之为「最佳证据综合法」的方法。当研究文献中充斥着大量质量不佳的论文时,研究者必须首先进行筛选工作,剔除那些不够格纳入元分析的研究。这正是 Slavin 所采取的做法。
在探讨精熟学习法的本质时,Slavin 指出,这种方法之所以可能有效,是因为学生有更长的时间接触教学材料。然而,这对学习较慢的学生造成了一个两难困境:是应该以较浅的深度学习更多内容,还是应该深入掌握较少的内容?毕竟,教学时间是有限的。
Slavin 在审视两项控制教学时间的研究时发现,如果以「单位时间的学习效果」为衡量标准,精熟学习法的表现远逊于常规教学方法(效应量 d=-1)。这一结果表明,尽管精熟学习法可能在整体上效果更好,但其效率可能低于常规学习方法。以 Bloom 本人的研究为例,为补救性学习所分配的额外时间累计相当于每周增加一天的学习时间。因此,Slavin 强调,在研究中应该控制学习时间这一变量,因为真正起作用的可能仅仅是接触学习材料的时间,而非精熟学习法本身的任何特殊之处。然而,并非所有研究都考虑到了这一点。值得注意的是,许多精熟学习法的支持者仍然坚持,即便是在单位教学时间内,精熟学习法的效果也更为显著。
评估精熟学习法(ML)的教育效果时,一个值得关注的问题是研究人员可能会设计出偏向 ML 学生学习内容的测试,而这些测试与对照组的学习内容匹配度较低,从而导致评估结果产生偏差。例如,Anderson、Scott 和 Hutlock 在 1976 年的研究中考察了 1-6 年级学生的数学知识效应量。研究发现,教学期结束时的效应量为 0.64,三个月后降至 0.49。然而,当两组学生参加一项非研究者设计的外部数学测试时,效应量却变得微乎其微。类似地,Taylor 在 1973 年的研究中比较了学生在代数「基本必要技能」和「进阶技能」方面的表现差异。结果显示,使用精熟学习法的学生在基本技能上表现更佳,但在进阶技能上却不如对照组。值得注意的是,这项研究严格来说并未完全采用精熟学习法(每学期仅进行一次测试和纠正性反馈,而精熟学习法通常要求至少每月一次的更频繁评估)。尽管如此,在探讨「深入学习少量基础知识」与「广泛学习更多高级知识但掌握程度较浅」之间的权衡时,引用这项研究仍具有一定的参考价值。
接下来,Slavin 详细阐述了他用于筛选有效研究的标准。首先,他会排除那些仅仅比较第一年某个班级的成绩,与第二年新生班级采用精熟学习法后成绩的研究。原因是这些并非同一批学生,而且其他因素的变化也可能影响结果。其次,他会剔除未对控制组和实验组的初始能力差异进行调整的研究。第三,他会排除持续时间不足 4 周的研究。第四,他会剔除控制组和实验组各少于两个的研究。这样做是为了避免个别教师或班级可能带来的影响(需要注意的是,这些研究大多不是随机对照试验)。
在审视实际证据时,Slavin 考察了几种关于精熟学习法的主张。
在控制时间投入的情况下,精熟学习法效果更好。而且学生即使对那些未在定期评估中明确测试的概念也能掌握得更好。
然而,经过严格筛选,只有 7 项研究符合 Slavin 的质量标准(其中大多数是随机试验)。这些研究发现,中位效应量接近于 0,最大效应量仅为 0.25,而 Slavin 指出即便是这项研究也存在问题。这些研究的样本规模从最小的 6 个课堂到最大的 4 所完整学校不等,涵盖了 1 至 9 年级的数学和阅读课程。研究持续时间从 5 周到 1 年不等。值得注意的是,这些结果是基于「在相同教学时间下」这一前提的。
在控制时间投入的情况下,精熟学习法效果更好。学生准备得更好,但这种优势仅限于定期评估中明确测试的概念。
九项被认为具有充分说服力的研究显示,中位效应量为 0.255(范围在 0.18 到 0.27 之间),但这些研究在设计方法上存在异质性。一项在智利进行的大规模研究虽然被排除在外,但其效应量接近中位数。该研究还发现,对于学习成绩较差的学生,效应更为显著(0.58),而对学习成绩较好的学生则几乎没有影响。Slavin 之所以排除这项研究,是因为采用精熟学习法的班级平均社会经济地位和智商较高,且研究未对此进行调整。在那些测量知识保留率的研究中(最后一次考试后的几周或几个月),大多数结果表明实验组和对照组之间并无显著差异。
在引用的一项由 Bloom 在以色列的一位学生完成的研究中(Mevarech, 1986),对于家庭教育背景较低的学生(以父母未接受高中教育为标准),精熟学习法的效果接近传说中的「两个标准差」(效应量为 1.78);而对于父母接受过大学教育的学生,尽管也有显著进步,但效果相对较小(效应量为 0.66)。Slavin 随后分析了导致这一结果的可能原因,他提出了两个假设:首先,虽然学生是随机分配的,但教师并非如此,这可能导致某些教师表现特别出色,而其他教师表现欠佳。其次,可能是因为教师在运用精熟学习法时,过分聚焦于考试中可能出现的具体概念,而非传授更为广泛的知识。
如果不控制时间投入,精熟学习法效果更好。
有四项研究符合这一标准,它们显示精熟学习法的效应量接近于零,针对长期记忆保持的研究结果也是如此。当然,也有少数研究发现了较大的效应量,Slavin 对此进行了讨论。
Slavin 的结论是,
基于小组的精熟学习法在实践应用中的最佳评估证据显示,这种方法在研究者自制的、与教学目标密切相关的成绩测试中表现出中等程度的积极效果,但在标准化成绩测试中几乎没有效果。这一发现支持了一种「弱论断」:精熟学习法能够有效地引导师生关注特定的教学目标。然而,它并不支持「强论断」:即在相同时间内,与传统教学相比,精熟学习法在全面评估学习内容和掌握程度的测试中更为有效。值得注意的是,就连这种「聚焦课程」的论断也面临质疑,主要原因有二:首先,我们无法确定对照组教师是否也在追求与精熟学习组相同的教学目标;其次,精熟学习法在知识保持测试中未能显示出显著效果。
这些结论与早期研究者和元分析专家的观点存在明显分歧。本文回顾的 17 项研究的平均效应量不仅远低于 Bloom(1984a, 1984b)、Guskey 和 Gates(1985)、Lysakowski 和 Walberg(1982)或 Walberg(1984)所声称的约 1.0,而且没有任何一项研究达到这个水平。在这 17 项研究中,仅有 2 项(出自同一作者)的平均效应量超过了 Kulik 等人(1986)对大学入学前掌握测试研究所估计的 0.52 平均值。那么,如何解释这种巨大的差异呢?
首先,Slavin 剔除了他认为质量欠佳的研究,仅保留了先前元分析中约四分之一的研究。其次,他还纳入了未发表的研究,认为这些研究受到发表偏见的影响较小。此外,Slavin 特别对学生的初始能力分数进行了校正,这是之前的元分析所忽略的。
随后,Slavin 探讨了为何精熟学习法尽管在理论上很有吸引力,但实际效果可能并不显著。
可能的原因之一是教师未经过充分培训,或者用于补救性教学的材料质量不佳。事实上,他指出一些研究在解决这两个问题后,经过一年的教学确实观察到了积极效果;Mevarech(在与 Slavin 的私人交流中)也强调,这些教材的质量至关重要。另一种可能是,这些额外的补救性课程需要更长的时间才能产生效果:
关于学生使用个性化学习材料的学习进度研究普遍发现,最慢的学生比最快的学生需要多出 200% 到 600% 的时间才能完成同等数量的学习内容(Arlin & Westbury, 1976; Carroll, 1963; Suppes, 1964)。这远远超过了采用精熟学习法的学校可能为补救性教学提供的时间(Arlin, 1982)。
还有一种可能是,反馈应该每天提供,而不是仅通过每周测试提供。
关于精熟学习有效的原因,Slavin 对提出了新的见解。他认为,精熟学习法在某些情况下之所以有效,关键并非在于要求学生达到精熟水平或提供补救活动,而是在于对学生进行测试,并就其知识缺口提供反馈,然后继续下一个教学单元。Slavin 引用了一项对比两种教学模式(教学-评估-纠正和教学-评估)的研究。结果显示,这两组学生的表现均优于测试频率较低的对照组,但两组之间并无显著差异。这种现象被称为测试效应。
关于 Bloom 提出的「两个标准差问题」,Slavin 对其理论框架本身提出了质疑:
「2 标准差挑战」(或「1 标准差声明」)若脱离具体背景,可能会产生误导,并可能对教育研究造成潜在危害,这种影响不仅存在于精熟学习法领域,也存在于其他教育研究领域。这是因为它可能导致研究人员低估那些更实际的成果,其范围可能在个体标准差的 20% 到 50%,但是他们更加真实,容易复刻和推广。例如,如果一项教育干预措施能够每年稳定地产生 0.33 的效应量,假设将其应用于低收入阶层的学校,就有可能在 3 年内消除低收入阶层和中产阶级儿童之间典型的学业差距——这无疑是一项重大成就。然而,Bloom 等人宣称的巨大效果,可能会导致那些仅能达到 0.33 效应量的研究人员质疑自己方法的价值。
这种观点确实有其道理:我之所以选择评估精熟学习法而非其他主题,正是因为 Bloom 声称它能带来显著效果!
3.2 对 Slavin 的回应
Bloom 本人(1987)在回应中强调,在他的为精熟而学习(LFM)系统中,真正有效的精熟学习法必须包括学生之间的互帮互助,共同完成纠正性活动。然而,在 Slavin 的首次声明研究中,只有一项研究符合 Bloom 的这一定义。关于实验者自制测试和标准化测试的对比,Bloom 更倾向于前者,因为这类测试能够准确涵盖教学的具体目标。在回应的结尾,Bloom 以充满激情的语气表示:
当几乎所有儿童都有可能达到高水平学习时,剥夺他们成功学习的机会无异于对人类的犯罪。
Slavin(1987)在回顾上述批评和其他相关评论时,首先指出双方只在少数几点上达成共识。他们一致认为:LFM 对标准化测试成绩没有影响;在至少持续 4 周的研究中,精熟学习法的效果远低于 1 个标准差(不过 Slavin 倾向于采用更为严格的标准);此外,精熟学习法确实需要额外的教学时间才能发挥效果(Bloom 明确指出这是该方法奏效的必要条件)。
争议的焦点在于标准化测试是否能够有效评估学习成果。这些测试的内容范围通常超出了精熟学习小组的实际教学内容。而且,由于采用精熟学习法的教师并不了解具体的测试内容,他们难以针对性地进行「过拟合」式的教学。
在收到上述批评后,Slavin (1989)发表了一篇回应文章。据我所知,这篇文章并未引发进一步的学术讨论。Slavin 在文中回顾了其他学者(如 Kuliks、Guskey、Bloom 等)对他先前评论的看法。值得注意的是,Guskey 甚至暗示 Slavin 是在蓄意诋毁精熟学习法。然而,Slavin 表示他对这种教学方法并无异议,更强调他自己创立的「全员成功」(Success for All)教育方法也是建立在精熟学习法的理念基础之上的。Slavin 在分析中采用的标准——关注较长期(超过 1 个月)的研究结果——在我看来是合理的。事实上,导致学前教育认知收益研究失去说服力的,正是这种随时间推移而出现的效果消退现象。
最后,Slavin(1990)发表的《再次重新审视精熟学习法》一文中,对此前提到的 Kulik-Kulik-Bangert-Drowns 的回应做出了回复。值得注意的是,即便将更新的研究纳入考虑范围,如果我们采用 Slavin 的方法学标准来评估这些较新的研究,Kulik 等人的元分析得出的结论将与 Slavin 的发现保持一致。
然而,评估精熟学习法有效性的核心问题实际上是一个价值观的问题。研究发现,在研究者设计的测试中,精熟学习法确实产生了积极效果。这可以理解为,该方法能够帮助教师更好地聚焦于特定的教学目标。因此,那些认同这一价值的教育工作者有充分的理由采用基于小组的精熟学习法。尽管如此,关于精熟学习法能够全面提升中小学生学习成绩的说法,目前仍缺乏令人信服的证据支持。
Kulik、Kulik 和 Bangert-Drowns (1990) 对我此前提及的 Slavin 的研究作出了简要回应。他们指出 Slavin 的研究存在几个局限性。首先,Slavin 未能考虑精熟学习法的其他系统,他主要研究了基于小组的研究(LFM),而忽视了基于个人的研究(PSI)。其次,Slavin 的研究重点放在了大学以下的教育阶段,然而大多数 LFM 研究实际上是在大学阶段进行的。这些作者认为,如果仅限于 Slavin 所回顾的文献范围,他们与 Slavin 的观点并无实质性分歧。然而,他们批评 Slavin 的论文中竟然包含了一些没有精熟学习组的研究(!),这一点令人不解。为佐证他们的观点,作者引用了 Dunkelberger & Heikkinen (1984) 以及 Fuchs, Tindal & Fuchs (1985) 的研究。随后,这些作者分析了 11 项他们与 Slavin 都认为质量可靠的研究。研究结果显示,在考官自制的测试中,精熟学习法的效应量介于 0.36 到 0.45 之间;而在标准化测试中,效应量为 0.09。这一发现似乎与 Slavin 的结论有相当程度的一致性。
这些作者也坦诚承认:
然而,现有的研究数量不足,使我们难以对 LFM 效应量的估计充满信心。因此,我们期待看到更多关于 LFM 效果的研究,特别是它在标准化测试方面的影响。
在更多研究开展之前,研究人员应当牢记当前的研究结果:使用 LFM 学生在针对本地课程设计的测试中明显优于其他学生,而在涵盖多个学校系统和年级水平目标的标准化测试中,他们仅略微领先。目前没有证据表明 LFM 对任何类型的学生学习有负面影响。
最后,教师和研究人员应该跳出 Slavin 关注的狭小研究范围,从更全面的角度来了解精熟学习法。他们可以在更广泛的精熟学习法文献中找到更稳定可靠的效应量估计。此外,他们还可以了解精熟学习法对情感和行为的影响;精熟教学在不同条件下效果的强弱;班级中哪些学生最受精熟方法转变的影响等等。我们认为,LFM 对大学以下的考试的影响只是整个画面中的一小部分。
如今,在回顾这些内容并阅读了相关辩论后,Guskey 在 2015 年的评论中对 Slavin 的评论所做出的批评似乎极为不公平:
然而,对这项评论进行深入审视后发现,其研究采用了有效性存疑的技术(Hiebert, 1987),选择标准缺乏一致性(Kulik et al., 1990b),结果报告存在偏见(Bloom, 1987; Walberg, 1988),而且所得出的结论也缺乏充分的证据支持(Guskey, 1987, 1988)。更为关键的是,随后发表的三项更为全面且方法学更为严谨的综述(Guskey and Pigott, 1988; Kulik et al., 1990a; Miles, 2010)不仅证实了精熟学习法对广泛学生学习成果的持续积极影响,其中一项(即 Kulik et al., 1990b)更是清晰地揭示了这份早期报告的失真。
如果你想继续阅读更多有关这篇文献的历史以及早期元分析的弱点的信息,请阅读 Evans (2018) 的第 2 部分。
3.3 样本量
Kulik 元分析中的样本量是多少?论文本身没有说。但 Guskey & Pigott (1988) 对基于小组的精熟学习法的研究确实提供了样本量。大多数研究的样本都在 100 人以下;但最大的研究(每组约 200 名和约 400 名学生)仍然发现很大(最大为 0.5 和 1)影响。(其中很大一部分是我上面讨论过的智利 Cabezon 研究)。作者注意到相关文献质量低下,结论不一。
研究结果差异的另一个潜在原因可能是对教学干预方法界定不够精确,或者在实施过程中未能严格遵循原有设计。
学界对精熟学习法的本质存在诸多争议。调查数据显示,打着「精熟学习法」旗号的教育项目差异悬殊(Jones, Rowman, & Burns, 1986)。如果缺乏教学模式、学生反馈与纠错活动特点,以及学习评估具体方法等详细信息,就很难判断某项教学干预是否真正体现了 Bloom (1968) 的理念。许多研究也未能充分描述非精熟学习法对照组的具体情况。这些研究中涉及的项目和教学方法五花八门,无疑是导致研究结果不一的重要原因。
值得一提的是,这一领域的文献中有相当大比例是博士论文和会议论文。这本身并不是问题,但确实是个有趣的现象;我从未见过这样的文献构成!
3.4 最新研究
上述元分析主要关注较早的研究,我们不妨看看一些最新的研究成果,看看这些效应是否依然存在。
Jerrim 等人 (2015) 对在伦敦的 7 年级学生进行了一项数学精熟教学计划的研究,样本量超过 5000 名学生。该研究采用了随机对照试验(RCT)的方法,但结果显示没有发现显著效果(效应量 d=.06)。然而,需要指出的是,这项试验所检验的内容与早期的相关研究并不完全相同:
值得特别注意的是,数学精熟项目与此前研究的一些精熟学习法有着显著区别。例如,先前研究中许多效果显著的项目都有一个共同特征:学生在完成每个知识模块后必须参加测试,并达到约 80% 的高分要求。未达标的学生需要接受额外指导,而达标者则参与旨在深化对同一主题理解的拓展活动。然而,数学精熟项目采用了不同的方法。该项目的开发者致力于为所有学生提供「在整个学习过程中通过丰富活动加深理解的机会」。
在数学精熟项目中,班级在初次学习每个概念或程序时会投入比常规更多的时间,但即使有些学生尚未完全掌握,也不会显著推迟新主题的开始。相反,该项目的目标是让大多数学生在规定时间内深入理解核心概念,同时为有落后风险的学生提供针对性的辅导。
Vignoles 等人 (2015) 在同一研究中针对一年级/幼儿园学生的调查也得出了类似的结论。
Kalia (2005) 在印度进行了一项规模相对较小的研究,每组仅包含 30 名学生(总计 90 名),比较了基础教学、精熟学习法和其他学习方法的效果。研究报告了 1.64 的效应量。然而,我认为这项研究的可靠性值得商榷。
Miles (2010) 在其博士论文中报告了 d=0.53 的效应量,但同样样本量偏小(对照组 43 名学生,实验组 36 名学生)。遗憾的是,我无法获取该研究的原始资料进行详细审查。
4 支持一对一辅导(包括软件辅导)的实证研究
在探讨了精熟学习法之后,让我们将注意力转向一对一辅导。毕竟,在 Bloom 的研究中,这种方法取得了最佳效果。
需要特别指出的是,Bloom 的「两个标准差」论文中接受辅导的学生不仅仅是单纯接受辅导,而是通过辅导来帮助他们实现精熟学习法。更值得注意的是,根据 VanLehn (2011) 的研究,对学生的要求标准也存在差异:接受辅导的学生被要求达到更高的标准。VanLehn 的研究更全面地比较了两种计算机辅导系统和人工辅导相对于完全没有辅导情况下的相对效果。
有人可能会这样解释一对一辅导的有效性:辅导老师能够准确评估学生的能力水平,洞察他们的薄弱环节,并且总体上能够构建一个关于学生学习方式的模型,从而更有针对性地指导他们的学习。然而,VanLehn 对这一解释持怀疑态度[4]:
尽管人类导师通常能辨识出学生尚未掌握的正确知识点,但他们往往难以洞察学生的误解、错误信念和技能缺陷(M. T. H. Chi, Siler, & Jeong, 2004; Jeong, Siler, Chi, 1997; Putnam, 1987)。更值得关注的是,导师极少提出能有效诊断学生具体误解的问题(McArthur, Stasz, & Zmuidzinas, 1990; Putnam, 1987))。
当人类导师获得学生知识掌握程度的信息时,他们的教学行为会相应调整,可能会提高教学效果(Wittwer, Nuckles, Landmann, & Renkl, 2010)。然而,即便向导师提供了学生误解、技能缺陷和错误信念的详细诊断信息,他们的教学行为和效果也并未显著改善(Sleeman, Kelly, Martinak, Ward, & Moore, 1989)。
Siler (2004) 的研究进一步揭示,长期辅导同一名学生的导师,尽管有机会深入了解学生的优势、劣势和学习偏好,其教学效果并不优于那些频繁更换学生、难以深入了解每个学生的导师。简言之,人类导师似乎既难以自行识别学生的误解、技能缺陷和错误信念,也难以有效利用已提供的这类评估信息。
那么,这就是一对一辅导能达到的最佳水平吗?显然不是。
VanLehn 考察了影响一对一辅导效果的多种可能因素。他探讨了导师是否运用了复杂的教学技巧,是否为每个学生量身定制任务,是否能用丰富的领域知识来补充解释,或者导师是否起到了激励作用。然而,他发现这些因素通常并不存在,即使存在,也不会对所测量的预期学习成果产生显著影响。
VanLehn 认为,以下三点可能合理解释了一对一辅导的效果:
-
导师针对学生的错误给予反馈。他们会要求学生解释自己的思路,并指出学生错误的假设或概念。
-
导师通过提出相关问题来引导学生的推理过程。VanLehn 举了一个简单的例子:当学生回答「在真空中,高尔夫球和羽毛哪个掉得更快」这个问题时,学生给出了正确答案,但理由不够充分(仅仅是因为看过相关视频)。老师接受了答案,但继续追问原因,最终引导学生得出更合理的解释。与被动的反馈不同,这种方法更具主动性和预见性。
-
导师调节学生的行为频率,鼓励他们在学习过程中更加积极主动,增加互动。这种假设认为,这类活动能够促进更好的学习效果。例如,面对一个只是被动听讲的学生,导师可能会鼓励他做笔记,深入阅读讨论主题的相关资料,或在不理解时主动提问。
VanLehn 随后分析了几个(小样本)研究案例(涉及向医学生教授心血管生理学和基础物理学等课程)。研究比较了三组学生:未接受辅导、接受软件辅导,以及接受人类导师辅导的学生。研究结果显示,辅导确实能够显著提高学习效果。然而,出人意料的是,人类导师的辅导并未表现出比软件辅导更为优越的效果。
随后,VanLehn 对更广泛的相关文献进行了深入审视。研究发现,辅导的平均效果似乎[5]只达到了 d=0.79。尽管这个数值不完全等同于 2 个标准差的提升,但仍然代表了一个极其显著的效果。值得注意的是,高质量的软件辅导系统也能达到类似的效果。VanLehn 指出,高质量软件的关键在于能够提供非常细致且具体的反馈。然而,他也发现这种效果存在一个上限:当反馈的细致程度达到某个临界点后,继续增加解释的精细度并不能进一步提升学习效果。
VanLehn 意识到,他的研究结果与 Bloom 先前的发现存在一定差异,因此他深入探讨了可能导致这种差异的原因。首先,他考虑了辅导者的专业知识是否能够带来额外一个标准差的提升。答案是否定的,相关研究并未发现辅导者的专业知识能产生实质性的效果。随后,VanLehn 仔细分析了先前那两项发现「两个标准差」提升的研究,试图理解其中的原因。有趣的是,这些研究中的辅导者并不具备特别高超的技能。值得注意的是,正如本节开始时提到的,这些研究中接受辅导的学生是采用了特别严格的精熟学习法进行学习的。
他分析的另一项研究虽然后来被重复验证,但发现其效应量较小(d=0.52)。在相关文献中,最大的效应量为 0.82。值得注意的是,这些研究大多采用小样本,因此结果的高度变异性是可以预见的。他还指出,这些研究可能无法全面代表所有导师的情况。很可能存在一些优秀的导师未被纳入这些研究的评估范围。此外,从更宏观的角度来看,VanLehn 推测人工辅导未能显示出比高质量的软件辅助辅导更好的原因在于,普通导师往往缺乏有意识地练习和提升自身技能的习惯,也很少能从学生那里获得长期的反馈。
Bloom 报告的 d=2.0 效应量,似乎主要源于对受辅导者设定了更高的精熟标准。具体而言,受辅导者必须在精熟掌握测试中达到 90% 的得分才能进入下一个单元学习,而采用精熟学习法的课堂学生则需要在同样的测试中达到 80% 的得分,普通课堂对照组的学生虽然也参加测试,但无论得分如何都会继续学习下一单元。因此,Bloom (1984) 的文章实际上正如他本人所期望的那样,更多地展示了精熟学习法的强大效果,而非人工辅导的有效性。
近期的研究(Ma et al., 2014)进一步证实了这一总体结论:智能辅导系统的效果与人工辅导旗鼓相当。实际上,智能辅导系统的效果可能略显逊色,其效应量较小(g=0.4)[6],而且这些研究似乎不存在发表偏倚。聚焦计算机科学这一特定领域,Nesbit et al. (2014) 发现,与传统课堂教学相比,软件辅导展现出显著效果(d=0.67)。值得一提的是,他们还发现,高质量的软件辅导系统相较于最基础的计算机辅助教学,效果更为突出(d=0.89)。在这种分类体系中,Coursera 可被视为一种非常基础的系统。其他针对大学生群体的元分析研究(Steenbergen-Hu & Cooper, 2014)发现,人工辅导的效果确实优于智能辅导系统,这与 VanLehn 的结论相悖。然而,当按软件质量细分(他们将其划分为基于子步骤和基于步骤的辅导)时,研究结果又与 VanLehn 的发现不谋而合。
Kulik & Fletcher (2017) 开展的另一项元分析主要聚焦于 6 年级及以上的学生群体。(Fletcher, 2018) 的研究进一步证实,即使对于年龄较大的学生和较为复杂的学科,采用软件辅导系统仍能带来显著的学习效果提升。值得注意的是,在高等教育领域,软件辅导的效果比在中小学教育中更为显著(效应量分别为 0.75 和 0.44)。Fletcher 还强调,对于大学以下教育中常见的相对简单的学习场景,像直接教学法(DI)这样的「练习与实践」系统就能发挥很好的作用,而且成本较低。
迄今为止,效果最为显著的案例当属 DARPA(美国国防高级研究计划局)的数字导师项目。该项目旨在培训美国海军的信息系统技术人员。研究比较了为期 16 周的基于软件的课程和 35 周的传统课堂课程。在 Kulik 的元分析中报告的两次评估结果令人瞩目:效应量高达 1.97 到 3.18。更加令人惊叹的是,接受软件培训的学生在表现上甚至超越了他们的指导者!
4.1 DARPA 的研究
本节内容主要基于 Fletcher & Morrison (2012) 和 Fletcher & Morrison (2014)。
2010 年,DARPA 资助的海军数字导师(Digital Tutor,DT)系统进行了两次试验。第一次试验在 4 月进行,为期 4 周;第二次在 11 月进行,为期 8 周。整个试验过程由独立的第三方机构——国防分析研究所(IDA)全程监督。这项研究采用了随机对照试验(RCT)设计。研究人员还使用武装部队资格测试(AFQT)测量了对照组和实验组参与者的智商水平,以确保两组之间基本相当(也确实如此)。
-
4 月进行的试验采用书面知识测试作为评估手段。结果显示,接受 DT(数字化教学)方法教学的 20 名学生表现优于接受为期 10 周常规教学的 18 名学生(效应量 d=2.81),甚至超越了 13 名常规课程的指导者(效应量 d=1.25)。测试题目来源广泛,包括 DT 开发者提供的 93 道题目,授课教师提供的 76 道题目(其中 51 道为既有题目,25 道为新编题目),以及 IDA(信息发展局)提供的 5 道题目。在正式实施测试前,IDA 的四名 IT 支持人员对测试进行了评估,认为其能够有效衡量 IT 管理知识水平。
-
11 月的试验设置了四个对照组:接受 7 周 DT 教学的 20 名学生、18 名接受常规教学的学生、20 名学习约 10 周「未来的 IT」(IToF)课程的学生,以及 10 名常规课程的指导者。此次试验不仅采用了书面测试,还增加了实践考试环节,并对三分之一随机选取的 DT 和 IToF 学生进行了口试。结果再次凸显 DT 学生的全面优势:在知识测试中胜过指导者(效应量 d=1.35),在实践考试中优于 IToF 学生(效应量 d=1.9),在书面测试中远超常规教学学生(效应量 d=4.68),在口试评审中也表现出色(效应量 d=1.34)。
DARPA 的研究成果令人振奋。其效应量之大、验证方式之多样,似乎已经实现了 Bloom「两个标准差」的教育理想!更值得关注的是,与传统的精熟学习法相比,采用数字导师(DT)系统的学生仅用不到一半的时间就取得了这一成就。诚然,有人可能会质疑,知识测试和实践考试中的出色表现或许源于部分试题由 DT 系统开发者提供。然而,口试并非如此,而且所有测试都经过了外部专家的审核,被认定为公平合理。因此,尽管测试内容与 DT 教学内容的高度契合可能在某种程度上影响了结果,但我们仍有充分理由相信这项技术带来了实质性的进步。
有观点认为,鉴于样本量较小,我们不应过分重视这项研究。但我认为,我们有充分理由认真对待这些结果。首先,从统计学角度来看,如果预期效应量为 1,要达到 80% 的统计检验力,每组只需约 17 名受试者,这与 DARPA 的样本规模相当。其次,研究并非仅依赖单一测试,而是通过多项测试一致地展示了显著效果。再者,研究共进行了三次试验(2009 年的初步测试和 2010 年的两次完整试验),所有结果都得到了如实报告。最后,每次试验都包含大量问题,仅知识测试就超过百题。虽然在单个问题上可能存在偶然因素,但在如此全面的评估中,这种可能性微乎其微。
基于前期研究结果,研究人员进行了进一步的测试。他们比较了三组人员的表现:参加 16 周数字化辅导(DT)课程的学生、参加 35 周常规课程的学生,以及一组平均拥有 9 年经验的专业技术人员。尽管样本量较小,但结果仍然显著:在实践考试中,DT 课程的学生明显优于专业技术人员(效应量 d=0.85),也大幅超过了学习时间是他们两倍的常规课程学生(效应量 d=1.13)。口试结果也呈现出相似程度的优势。
总的来说,这些发现为基于软件的辅导方法的潜力提供了有力证据;值得注意的是,研究不仅评估了学生的理论知识,还通过多种方式测试了他们将知识付诸实践的能力。
4.2 开发高质量的辅导软件是一项挑战
在上述研究中,一个普遍的主题是比较高级和简单的计算机辅导系统。事实上,开发优质的辅导软件是一项艰巨的任务。若要全面探讨辅导软件的相关问题,恐怕需要撰写一篇专门的长篇综述[7]。
在一篇综述文章(Alkhatlan & Kalita, 2018)中,从设计角度深入探讨了智能辅导系统(ITS)的特征。该文指出,最优秀的人类导师的表现仍然优于最先进的软件系统,这一结论并不令人意外。这为 VanLehn 先前的研究评述增添了新的层面:尽管普通水平的人类导师可能与顶尖软件系统的平均表现不相上下,但最出色的导师却能够实现软件无法企及的教学效果。这种情况不难理解,因为一位卓越的导师完全可以为学生安排使用软件辅导系统,同时辅以其他富有成效的教学活动。
Andy Matuschak 在私人通讯中指出,开发高质量教育软件面临的主要挑战在于:开发者不仅需要具备出色的创造性问题解决能力,还要拥有相关领域的专业知识,才能将知识和解释有效地转化为优秀的软件产品。许多教育软件是由博士生开发的,但往往在完成后就被搁置一旁。即便是由 DARPA 开发的辅导系统,似乎也由于某些原因尚未投入实际应用。
5 看看其他领域
在完成了对本文核心主题的回顾之后,我们有必要看看其他相关领域,这些领域背后的证据似乎更好,看看我们应该期待什么。毕竟,如果我们知道没有其他教育干预措施的效应量超过 0.1,那么我们考虑的干预措施就不太可能那么特别。实际上,本节试图将我已经讨论过的内容置于上下文中。
5.1 教育研究的整体可靠性
对教育研究领域的整体状况有所了解,能让我们对采用大规模随机对照试验(RCT)来检验某些方法可能产生的结果形成初步预期。假设我们对精熟学习法一无所知,根据 Hugues & Matthew (2019) 的研究发现,我们应该预期它只会产生极其微小的正面效果。他们的研究表明,大多数大规模教育 RCT 往往缺乏信息(uninformative)。
那么,这里所说的缺乏信息究竟是什么意思呢?作者将一项研究定义为「缺乏信息」,是指「研究结果既无法证明相关干预措施有效,也无法证明其无效。因此,一项 RCT 是否具有信息,取决于其效应量大小以及对该效应量估计的精确程度。」
他们审查了 190 项他们认为质量上乘的 RCT,这些试验都是在 2018 年 6 月之前进行的,研究对象为 K-12 学生,并采用了某种定量的学业指标(如考试成绩)。研究发现,平均效应量为 0.06,且具有高度异质性。即便进行了子分析,也未能发现平均效果明显更强的情况;而且置信区间普遍较大。面对诸如 0.06 +/- 0.3 这样的效应量,我们该如何理解和解读呢?
研究者们发现,对各种教学方法进行综合分析得出的效应量,小于单独研究中的发现。针对这一结果,作者提出了几种可能的解释:首先,现有文献可能不可靠;其次,所采用的干预措施可能本身就缺乏实际效果;再者,干预措施的设计可能存在不足,无法有效检测潜在的真实效果。具体而言,在实际教育环境中应用的教学方法可能不如实验室条件下测试的方法那样有效。与大多数研究一样,作者们认为有必要进行更深入的研究,以揭示这一现象背后的原因。
在本研究中,作者提到了我先前讨论过的 Jerrim 等人(2015)的论文。该论文与本文献综述的研究重点最为相关,而其他提及的文献似乎既不涉及直接教学法,也不涉及精熟学习法。
那么,根据这项大规模随机对照试验综述,哪些干预措施被证明是有效的呢?我将在下文列出最具成效的干预措施,包括它们的效应量、证据质量评估以及贝叶斯因子。[8]
-
「写作质量提升计划」旨在帮助学习困难的学生提高写作水平。该计划为学生提供优秀写作范例和写作方法指导。(效应量 d=0.74,证据强度评分 2/5,贝叶斯因子 BF=10.52)
-
「蝴蝶音标教学法」致力于提升学习困难学生的阅读能力。该方法采用 6-8 人小组形式,并在课堂上持续给予反馈。(效应量 d=0.43,证据强度评分 0/5,BF=3.6)
-「代数 I 课程普及计划」通过网络课程帮助八年级学业风险学生提高代数成绩。(效应量 d=0.4,BF=154)
- 「一对一辅导」旨在提升英语成绩较差学生的读写能力。(效应量 d=0.36,证据强度评分 3/5,BF=4587)
这些项目都针对学业风险学生,与直接教学法研究类似。如果我们从表面上看,其效应量也与直接教学法研究发现的结果相近。
Cheung & Slavin (2016) 研究了影响研究效应量的因素。他们发现,最主要的两个影响因素是样本规模和用于评估学生表现的测试类型:
-
样本量:小样本研究(样本量少于 100)显示平均效应为 0.38,而大样本研究(样本量超过 2000)则显示效应仅为 0.11。
-
测量方法:采用研究者自行设计的测量工具的研究效应较大(0.4),而使用独立测量工具的研究效应较小(0.2)
-
研究设计:完全随机化的研究平均效应为 0.16,而准随机化的研究平均效应为 0.23。
-
发表状态:已发表的研究显示 0.3 的效应,未发表的研究则显示 0.16 的效应。
5.2 通过刻意练习改进的可能性
刻意练习——即长期系统性地「适当」练习某项技能——是另一个与此密切相关的研究领域。深入探讨刻意练习的理论和实践,可以帮助我们更准确地评估一对一辅导和精熟学习法可能带来的效果,从而为这些教育方法设定合理的期望值。
最新的一项元分析研究(Macnamara et al., 2014)探讨了刻意练习在多个领域的影响。研究显示,在游戏、音乐或体育等领域,练习与表现提升存在一定程度的关联,可以解释 18% 到 26% 的表现差异。然而,在教育领域,这一数字仅为 4%。另一项专门针对体育领域的元分析(Macnamara et al., 2016)得出了类似的结论。值得注意的是,在职业运动员群体中,累积的刻意练习仅能解释 1% 的表现差异。这可能是由于刻意练习存在递减的边际效益,而在精英运动员层面,遗传因素成为了决定性的区别因素。毕竟,如果每个人都在努力训练,一天中可用于训练的时间是有限的。研究还发现,运动员开始训练的年龄与其表现水平并无显著相关性。对于内部节奏型运动(如飞镖)和外部节奏型运动(如排球),刻意练习对前者的效果似乎更为显著(可以解释 41% 的表现差异)。这一结果符合逻辑,因为内部节奏型运动的随机性较小,但元分析在统计学上并未达到显著水平(p=0.08)。
在本次元分析中,Güllich (2014) 对曲棍球运动员的研究揭示了一个引人深思的现象:奥运会金牌得主的累积刻意练习时间平均为 3,556 小时(标准差 1,134 小时),而那些仅在国内顶级联赛打球但未在国际赛场上取得突破的运动员,其练习时间平均为 4,118 小时(标准差 807 小时)。令人惊讶的是,这两组运动员在练习时间上的差异并不显著。同样,Johnson, Tenenbaum 和 Edmonds (2006) 针对游泳运动员的研究也得出了类似的结论。他们发现,成就卓著的游泳运动员平均练习时间为 7,129 小时(标准差 2,604 小时),而尚未达到相似成就水平的游泳运动员的平均练习时间为 7,819 小时(标准差 2,209 小时)。这两组游泳运动员在累积的刻意练习时间上同样不存在显著差异。
那国际象棋呢?国际象棋大师的卓越表现是源于刻苦练习,还是得益于与生俱来的棋艺天赋?至少从智力这一因素来看,答案并不那么简单明了。Burgoyne et al., 2016 对业余和熟练棋手(ELO 等级分在 1311 到 2607 之间)进行的元分析显示,智力与棋艺的相关系数不超过 0.35。这意味着智力因素仅能解释棋艺水平差异的约 6%。更值得注意的是,如果我们将研究范围缩小到职业棋手,这一相关性会进一步降低到 0.14。然而,这并不意味着剩下的 94% 完全由练习决定。事实上,如果我们从更宏观的角度考虑遗传因素,情况会更加复杂。Vinkhuyzen et al., 2009 的研究表明,国际象棋技能的遗传度可能高达 48%。
刻意练习究竟能产生多大的影响呢?Burgoyne & Nye, 2019 的研究中,对一群中高水平的国际象棋选手(ELO 分在 1150 到 2650 之间)进行了分析。结果表明,刻意练习可以解释 34% 的技能差异。然而,这并不意味着刻意练习对初学者就不重要了。恰恰相反,对新手而言,练习几乎就是一切。虽然更高的智力或更好的记忆力可能让棋手更善于评估局面,但正是通过练习,棋手才能够掌握进行这种评估的基本能力。只有当一个人跨越了初学者阶段,先天才能的影响才会逐渐显现。
Ericsson (2016) 提出了不同的见解。他坚信刻意练习极为重要,但他批评 Macnamara 等人对刻意练习的定义过于宽泛。在 Ericsson 看来,只有一种非常特殊的练习才能被称为真正的刻意练习:那就是在教练或老师的指导下精心设计和实施的练习。
Ericsson 提出了一个典型案例来支持他的观点:对国家级和国际级运动员进行一对一指导。他指出,运动员与教练相处的时间与其表现呈现高度相关性(相关系数超过 0.8)。值得注意的是,Ericsson 得出这一结论的研究并未被纳入 Macnamara 等人的元分析中。在评估指标的选择上,两者也存在分歧:Macnamara 等人接受主观评估作为有效指标,而 Ericsson 则坚持应当仅使用客观指标。Ericsson 甚至声称,目前尚未发现任何可以解释个体表现差异的基因。然而,这一说法显然是不成立的,尤其是在涉及高智力要求的任务中。即便我们尚未能确定具体的基因,但运动表现的遗传率并非可以忽略不计这一事实,强烈暗示了成就很可能具有遗传基础,尽管目前我们还无法识别出具体的基因。
Macnamara 等人在 2016 年的回应中指出了 Ericsson 论点的两个问题:首先,Ericsson 自己在研究刻意练习时也采用了非客观的评估方法;其次,Ericsson 在实际研究中使用的刻意练习定义,并不如他现在所主张的那样狭窄。尽管存在这些分歧,Macnamara 等人仍然按照评估方法的类型进行了详细分析。结果显示,虽然客观评估方法确实表明刻意练习的效果更为显著,但其解释力仍然有限,仅能解释总体表现差异的不到 25%。
最后,Moreau, Macnamara & Hambrick (2018) 对认知表现提升领域的文献进行了更为全面的审视,涉及毅力、成长心态、大脑训练、刻意练习和双语能力等方面。他们的研究发现,除了刻意练习外,没有证据表明这些方法能够以任何形式提高认知表现。虽然刻意练习在某些情况下确实能够提升个人表现,但它并不足以解释为什么「在专业水平上」,个体之间会存在如此显著的差异。
5.3 通过间隔重复改进的可能性
如果前面的讨论让人感到有些悲观,似乎在暗示练习并不重要,那么关于间隔重复的研究却得出了截然相反的结论。根据 Gwern 的研究综述[9],与集中学习(也称为死记硬背)相比,间隔学习的效应量为 d=0.42(或略低于这个值),这一发现在多个领域都得到了证实。需要注意的是,这里的效应量并非比较间隔重复与完全不学习的情况。如果我们要求一个人在一周内记忆一组新的、难以记住的事实,而让另一个人利用间隔重复在一年内持续巩固这些知识。到了年底,效应量将会十分显著,因为第一个人可能已经将所学内容忘得一干二净,而第二个人却能始终保持鲜活的记忆。
6 精熟学习法为何有效?一些实验想法
假设有一种被称为「不可思议的学习方法」(The Incredible Learning Method,简称 TILM)的方法,据说能将学习表现提高 d=0.5。这自然会引发人们对 TILM 具体内容的好奇。假设 TILM 包括每天进行间隔重复和做俯卧撑。
那么,我们是否应该简单地建议孩子们为了提高学习效果而做俯卧撑呢?还是我们应该深入研究,找出究竟是什么因素使 TILM 如此有效?
在这种研究方法中,我们需要将 TILM 分解为各个组成部分,分别进行实验,或者部分组合测试,观察各种组合产生的效果。随后,我们可以进一步研究每个子组成部分在不同样本群体中的表现,或者尝试从神经科学的角度为这些效果提供解释。
对于间隔重复来说,答案可能是这一根本概念:存在遗忘曲线。这反过来也许可以用大脑的某些基本工作机制来解释。
那么,是否可以认为精熟学习法实际上就是间隔重复呢?
另一种解释是,真正起作用的可能只是学习时间增加了:假设接触概念的次数与学习效果成正比(尽管最终可能会达到一个瓶颈)。那么,学生反复学习同一材料自然会提高学习表现。如果确实如此,当我们控制指导时间这一变量时,精熟学习法可能就不会显示出独特的效果。正如 Slavin 所言:
从极端角度来看,精熟学习法理论的核心主张几乎是不言自明的。如果我们设定一套合理的学习目标,并要求每个学生都达到高水平,不论花费多长时间,那么几乎可以确定所有学生最终都能达到这个标准。
还有一种可能是,真正起作用的是测试本身。要知道,精熟学习法包含学习-测试-反馈-纠正这一完整循环。Slavin 的研究发现,仅仅进行学习-测试-反馈的循环就能取得几乎相同的效果。更有趣的是,我们还知道单纯的学习-测试模式也是有效的!这就是所谓的测试效应。
另一种可能性是,充分掌握第 N 课的内容确实能够帮助学生更好地吸收后续课程的知识。如果是这样,我们可以通过以下方式来验证这一假设:首先,对一组学生采用精熟学习法教授第一课,对另一组学生则采用传统教学方法;随后,用相同的传统方法教授两组学生第二课。如果精熟学习法确实有效,那么最初接受精熟学习法教学的那组学生在学习第二课时应该表现更出色。在我看来,这种方法才能真正验证「精熟」效果的存在。
7 结论
Bloom 指出,精熟学习法的效应量约为 1(即一个标准差),而一对一辅导的效应量则高达 2。这基本上是一个异常值案例。
尽管如此,Bloom 的研究仍然具有重要发现:一对一辅导和精熟学习法确实在一定程度上得到了实验数据的支持。令人欣喜的是,精心设计的软件系统似乎能够完全替代传统教学中的授课环节,不仅能够取得更好的效果,甚至可以达到与一对一辅导相当的水平。然而,设计这样的系统是一项极具挑战性的任务,而且教师在激发学生学习动机方面的作用可能不那么容易仅依靠软件来复制。
总的来说,这些教育方法对不同年龄段的学生和各个学科都有效,这无疑是个好消息。然而,一对一辅导、精熟学习法或直接教学法的实际效果并不如 Bloom 论文中描述的那么显著。尽管如此,不可否认的是,一对一辅导确实能带来显著效果,设计精良的教育软件也同样有效。DARPA 的案例研究更是展示了软件辅导的巨大潜力,其效果甚至超越了 Bloom 论文中的预期。
同样值得注意的是,其他教育方法同样显示出较大的效应量,因此我们不应过分偏重直接教学法或精熟学习法。这些方法的核心原则——如教学内容的明确性、持续评估、及时反馈和针对性补救——无疑是合理的,尤其对弱势儿童似乎更为有效,值得在这一群体中尝试。对于天才儿童或普遍聪明的个体,这些原则仍然适用,但其效果如何还有待深入研究。本文并未详细探讨这一问题,也未发现多少针对天才儿童的相关研究。
如果我们的目标是通过改善教育来提高整体社会技能水平,那么情况就有所不同。在这方面,直接教学法的研究证据就不那么令人信服了。其效果似乎较为微弱,可能最多只能提高四分之一个标准差。相比之下,精熟学习法在普通学生群体中表现更为出色,对大学生也同样适用。
关于各种因素对教学效果的影响,研究表明直接教学法和精熟学习法的效果会随时间逐渐减弱,但并不会完全消失。学习能力较弱的学生往往比高能力学生从中获益更多,而且效果的大小在很大程度上取决于测试的内容。精熟学习法似乎是通过针对特定测试进行过度训练而发挥作用的,这些技能未必能广泛应用于其他场景,这一点值得我们重视。与直接教学法类似,如果教学目标是让学生掌握几个核心概念,特别是对于有学习障碍的儿童来说,这种方法可能很合适。然而,这些方法是否适用于普通学生仍不确定。对于来自高社会经济地位家庭的孩子,这些方法可能难以带来显著益处。
纵观教育研究的历史,我们会发现其中充斥着许多几十年前进行的小规模、质量不高的研究,而近期的相关研究相对较少。这可能是因为研究者们正把注意力转向其他教学方法的探索。尽管如此,大多数大规模随机对照试验(RCTs)往往只显示出微小的效果,这一事实应该促使我们在面对新的教育方法时保持谨慎和怀疑的态度。
8 结语:你应该学什么?
我此前讨论了各种学习方法,但学习内容的选择同样至关重要。那么,我们究竟应该学什么呢?Bryan Caplan 在其著作《反对学校教育的依据》[10]中提出了一个引人深思的观点:技能的可迁移性实际上很低。我们往往只会精通经常练习的技能,而迅速遗忘其他不常用的知识。这个观点影响了我在研究精熟学习法相关文献时的先验认知,因此当我在 Slavin 部分中提到的那些测试出现问题时,我并不感到特别意外。
Caplan 的观点确实有其道理,这为我们改进教学方法开辟了一条新路径:假设我们将教学重点集中在最可能对学生未来有用的基础知识上,比如阅读、写作和数学。通过减少其他学科的教学时间,我们可以帮助学习困难的学生更好地掌握这些核心技能,同时也为其他学生提供更多自主学习的机会,让他们可以探索自己感兴趣的领域。我甚至建议可以让学生提前回家学习,不过这可能会引发争议。有人可能会指出,学校还承担着在父母工作时照看孩子的隐性功能,相当于一种面向大龄儿童的「托管所」。但如果父母允许孩子自由活动,且城市环境足够安全,这种顾虑就不再成为问题。这绝对值得探索。
假设直接教学法能够有效传授基础知识,那么我们是否也应该用同样的方法来教授历史和英国文学呢?某种教学方法可行,并不意味着我们就应该采用它:评估一种教育干预措施的有效性,还需要考虑我们的价值判断标准。如果我们从课程中删除历史课,让孩子们有更多时间自由玩耍,这样做会产生怎样的效果呢?
9 问题
-
为什么这些行之有效的教育方法没有得到更广泛的应用?我能理解一对一辅导成本高昂,但开发高质量的辅导软件只需一次性投入。特别是对于大规模的公共教育系统而言,筹集资金应该并非难事。精熟学习法的实施成本看似也不高。关于直接教学法,可以参考 McCullen & Madelaine (2014) 的研究作为切入点。
-
撇开具体教学方法不谈,教师的整体重要性如何?Slate Star Codex 认为教师的重要性不大。事实上,最新研究表明,在大学环境中,学生的教学效果几乎可以与教授相媲美(Feld et al., 2019)
-
按能力对学生进行分组(即分班教学或能力分组)的效果如何?这个问题同样可以参考 Slate Star Codex 的分析
-
[已删除]
-
我们需要深入探讨辅导软件的具体细节。
-
大学以下的教育通常需要十余年时间。有可能将这个过程压缩到一年内完成吗?
-
成人教育又该如何开展?当前市场上存在各种针对特定技能(如语言学习)需求的教育项目。这些项目主要采用哪些方法?效果如何?
-
我们还需要深入研究一对一辅导的具体细节。
10 更新日志
-
2019 年 8 月 1 日:修正文字错误,优化行文风格
-
2019 年 8 月 2 日:明确区分 Direct Instruction 与 direct instruction
-
2019 年 8 月 3 日:增加关于一对一辅导的相关问题
-
2020 年 6 月 21 日:可汗学院的随机对照试验结果已发表,显示无显著效果。感谢 Pablo Repetto 提供这一信息。
-
2020 年 9 月 10 日:对 Success for All 项目的评价可能需要调整。2015 年一项被该项目引用的大型随机对照试验实际显示,其效果要么很小,要么不具统计学意义。
-
2020 年 9 月 15 日:修正文字错误。感谢 Ivan Savov 指出
-
2021 年 4 月 22 日:更正章节编号
11 致谢
衷心感谢 Gwern、Andy Matuschak、Jaime Sevilla、Alex Tabarrok、Tyler Cowen、Tom Higgins、@Ed_Realist 和 Stephen Malina 为本文提供的宝贵意见和建议。
1 作为参考,男女身高分布的差异约为 d=1.5。在智商方面,2 个标准差相当于智商 100 和 130 之间的差距。
2 值得注意的是,Slavin 本人提出的 Success for All 方法在评估中也表现出色,位居前列。
3 有趣的是,在教育研究领域似乎存在一种所谓的 Slavin-Kulik 之争,涉及多个研究主题。
4 需要指出的是,尽管研究文献普遍认为导师的效果不如预期,但这并不排除存在「超级导师」的可能性。这些优秀的导师可能为学生带来显著进步,只是这种效果在现有研究中未被充分捕捉和量化。
5 然而,研究表明,对于来自低社会经济地位(SES)家庭的学生,这些教育方法的效果似乎较为有限(Dietrichson et al., 2017)
6 在小样本情况下,Hedges g 值通常低于 Cohen's d 值,但在其他方面,这两种效应量指标基本相似。
7 关于这个问题,可以参考 Slate Star Codex 博客上的这篇文章。在文中搜索「Why is it so hard to make effective teaching software」(为什么开发有效的教学软件如此困难)这一部分。
8 在统计推断中,贝叶斯因子是一个重要指标。当贝叶斯因子大于 10 时,被视为反对零假设的强有力证据。而当贝叶斯因子超过 100 时,则被认为是决定性证据。
9 尽管我在本文中没有深入讨论间隔重复系统(SRS),但对此感兴趣的读者可以参考 Gwern 网站上的这篇详细文章。另外,我还收到了一篇与此主题相关的研究论文,也可供参考。
10 关于这本书,我曾写过一篇简短的书评。
引用
在学术工作中,请按以下格式引用本文:
Ricón, José Luis, “On Bloom's two sigma problem: A systematic review of the effectiveness of mastery learning, tutoring, and direct instruction”, Nintil (2019-07-28), available at https://nintil.com/bloom-sigma/.
你应该记住什么?间隔重复你的生活
原文:Nintil - What should you remember? SRSing your life
在我的《Bloom 的两个标准差》一文的第 8 节「你应该学什么」中,我思考了一个先于最佳学习方法问题的问题。一旦一个人决定开始使用间隔重复系统(SRS),他应该用 SRS 学习什么内容?比如,一名软件工程师是否应该用 SRS 学习他选择的编程语言?当然不必:他们一直在使用这门语言。间隔重复的确有效,但你每天都在使用的知识或技能实际上已经内置了 SRS。此外,还有一些虽然你每天都会接触到、但并不能立即派上用场的知识。譬如,你会知道现任美国总统是谁,因为这个事实很难回避,但掌握这个事实对你来说毫无用处(除非你从事政策工作):你预想的任何行动方案都不会因为知道这个名字而改变(这与了解相关政策或政党不同)。
当我们进入到一个可以有意识地尝试记忆事物的领域时,会发现其中有些内容你可能并不想去记住,比如那些「于你兴趣领域相去甚远的晦涩知识」。例如,在阅读书籍时,你或许会偶然接触到「标准氢电极」的概念、丹麦议会的构成,或是日本神道教中的「御魂」。这些都是我从维基百科的「随机条目」中选取的例子。维基百科上有着 620 万篇文章,你想要全部记住它们吗?或许你有这样的理想,这无可厚非。但大多数人在记忆时都会更有选择性。
在这个「接触频率和有用程度」的二维矩阵中,另一部分则是那些处于你专业领域内、但并非日常会使用的知识。例如,我曾花时间撰写过一篇《长寿 FAQ》,并在其中比较了两项关于恒河猴卡路里限制的研究,但如今我已记不清其中的具体内容。我还写过一篇「免疫衰老」的综述,然而我现在也不太确定,究竟是 M1 型巨噬细胞发挥促炎作用,还是 M2 型巨噬细胞通常具有抗炎功能。
我们可以把这类信息归入「冷门知识」,并直接略过不学。但是,记住它们的一个重要原因是:尽管现在你可能觉得它们没什么用,但将来它们可能会派上用场,特别是在不同领域之间建立联系的时候!我就有一个这样的亲身经历:
-
随着年龄增长,体内的 NAD 水平会下降,因为 NAD 会被 CD38 等酶消耗掉(我知道 NAD 水平下降是因为被某些酶消耗,但对 CD38 本身并不了解)。
-
在另一个看似无关的上下文中,我了解到免疫系统的某些细胞会表达 CD38。
这时,我灵光一现:会不会正是免疫细胞中的 CD38,以某种方式导致了 NAD 的缺乏?查阅文献后,我发现了支持这一假设的证据。有人可能会说,即使不了解这些知识,最终还是会偶然发现那篇论文的。但事实上,正是由于记住了 CD38 的相关知识,我才能更快地建立起这一联系。
我在动笔写这篇文章时,中途停下来做了一个小实验。我重新翻阅了一本刚读完的关于 Pasteur 的书,快速浏览了一遍内容,想看看自己记忆中的内容与书中实际记载有何出入。当然,在读完这本书仅一周后,我就忘记了一些细节,比如 Pasteur 出生在一个叫多尔的小镇。忘记这点倒是无伤大雅。但我不能接受忘记这些重要事实:Pasteur 在 34 岁时就成为高等师范学院的科学研究主任;炭疽疫苗实际上是由 Toussaint 在 Pasteur 来之前,用 Toussaint 自己的方法(而非 Pasteur 认为有效且众人期望他采用的方法)研发出来的。这些事实之所以重要,各有原因:前者表明在过去的法国学术界,年轻人有可能达到顶尖高度;后者则反映了 Pasteur 在科研中的策略,这正是本书的核心论点所在——Pasteur 公开的科学形象与其私下的科研实践之间存在差异。
[1] 答案是,正如大多数营养学问题一样,情况因人而异 :)
然而,求知之路永无止境。近来,我一直在阅读有关胆固醇、饱和脂肪,以及生酮饮食相比地中海饮食是否更容易危及健康的文章[1]。回想起曾在阅读过程中无数次看到 LDL-P 和 LDL-C 这两个术语,印象多半来自研读它们定义时的记忆。假如我能将这些内容铭记于心,那该有多好!
我原以为,要记住如此纷繁的知识细节,少不了要花费大量时间去复习那些记忆卡片。但现在看来,所需时间或许并非想象中那么长。与 Andy Matuschak 讨论后,我决定开始 Anki 化我的生活,改变以往只在语言学习中运用该方法的习惯。归根结底,检验方法是否行之有效的不二法门,就是去亲身实践、勇于尝试。
反向链接
学校让人沾染上的其他21条恶习(作为100条的补充)
作者:Extraordinaritarian
这篇文章是在2022/5/26(19.25岁)首次构想的,在2022/6/7完成。
[菜单:]{.ul}
[0.预览]{.ul}
[1.简介和撰文历史]{.ul}。
[2.所有恶习的简要列表]{.ul}。
[3.坏习惯]{.ul}。
预览
预览:I 这段话相当长(英文原文超过10500单词),大部分观点可能有一定程度的联系,请不要阅读整个段落。先看下面的主要观点/总结的预览,只有不到900单词。它用[Calibri字体,黄色背景写出。]{.ul}。
[主要观点/总结]{.ul}。
[--在学校学到的最糟糕的习惯是讨厌成长,它可以有多种错综复杂的原因,并且可以在不同程度上影响几乎所有的学生。]{.ul}。
[-学校是现代刻板印象和歧视的主要促成者/引爆者!]{.ul}。
[--学校可以点燃或加剧对整个家庭概念的仇恨,这可能导致极端孤独和自杀!**]{.ul}。
[--学校教育处理知识的方式实际上可能使人们不关心人类的未来(如通过课程滞后、同行评议等),这减少了很多未来天才的内在动力]{.ul}。
[--在2021/9/30将教育解放的希望撒入大海之后,2022/5/29,我在西藏附近一个最高的地区的山顶上,用可降解的纸张写下了教育解放宣言,种了一个抗严寒的生命之树,再次撒下了希望。]{.ul}。
[--学校教育是国家层面、地区层面和朋友层面冲突的罪恶根源]{.ul}。
[-学校是悲观主义的诱导者,内则通过习得性无助,外则通过引入假环境的伪理性悲观主义。]{.ul}。
[天才是由爱培养出来的(而不是强迫),而天才的诞生也是由爱驱动的——对人类的爱,对整个世界的爱。]{.ul}。
[-通过让学生更加讨厌成长,学校实际上是在杀戮生命,把他们变成的僵尸!]{.ul}。
[- 超过75%的人喝的水比他们实际需要的少]{.ul}。
[--许多健康问题可以通过多喝水来缓解,但由于早期的便盆训练和学校教育,现在是一个没有实际水源匮乏但水摄入量不足的世界!]{.ul}。
[--饮水不足的容忍度可以持续一生,这通过早期的恐惧巩固,喝水太多可以导致不方便或羞于上厕所,该条件反射可以一直持续——包括在一个自由远程工作者中!]{.ul}。
[- 在家上学的人通常在10~14岁会产生“自己试一试弄点儿吃的”的欲望]{.ul}
[-学校通过剥夺睡眠来削减心智力量,并通过可能的终生持续的生活方式**削减身体的健康力量,如下:]{.ul}。
[1.不喜欢做饭,用垃圾食品来获得快乐]{.ul}。
[2.少喝水(见习惯1),加重效果]{.ul}。
[3.削减形成习惯的能力,并通过扭曲大脑加强拖延,使这些习惯持续一生]{.ul}。
[-强制学校教育等同于强制近视。超过9年的中国强制学校教育,70%的学生近视。]{.ul}。
[--几乎四分之三的对父母的仇恨可归因于学校教育]{.ul}。
[--学校教育导致或加剧近视的方式有以下途径:]{.ul}。
[1.过度容忍近距离工作,拒绝自然放松的需要(类似于学校习得的拒绝睡眠的机制)]{.ul}。
[2.**在近距离工作时,由于需要同时看清黑板和书本,所以要戴上完全矫正的镜片。
[3.使他们易受可变奖励的游戏的诱惑,让他们不了解大自然的力量等]{.ul}。
[-由于日托和早期学校教育,学生在年轻时(例如6-15岁)往往较少接触真正的自然。学校教育使他们对大自然的认识减少,甚至旅行可能成为零和比较或嫉妒的来源,而不是欣赏自然的来源!]{.ul}。
[--对自然的热爱一般来说可以重新发现,但不一定能完全找到]{.ul}。
[--在亚洲,学校考试孕育了一大群浪费的作弊和机器人般的产业]{.ul}。
[-每个月的29日是我的自由学习纪念日]{.ul}。
[--轻轻改变学校的想法可能弊大于利;学校是一个完整的坏系统,具有难以置信的生存能力,与其给它来一场可能加强其免疫力的流感,我们必须给它来一场埃博拉,杀死它!]{.ul}。
[-教育同理心的丧失在15至30岁的人中很常见,它可能导致这些年轻的成年人不喜欢孩子,使孩子们更难从成年人那里自由学习]{.ul}。
[--很多年轻人由于讨厌孩子,往往决定不养孩子,这不是为了终生追求什么事业,**]{.ul}。
[-学校是代沟的主要原因!这伤害了多样性!]{.ul}。
[-一些抗击学校的行为把我从(雅安)地震中救了出来!]{.ul}。
[--在自由学习中,对当地地区或国家的热爱可以得到加强或削弱,这很自然。但学校教育倾向于有意识地使我们憎恨家乡或国家,而不是憎恨整个儿童奴隶制的想法。]{.ul}。
[--在课程中增加任何东西都可能是一种净损失,而将历史纳入其中则可能威胁到我们的*文化遗产,*睡在坟墓里的人们对学校很生气!]{.ul}。
[-通过强迫学生写日记(尤其是在早期),他们可能很容易讨厌日记或所有类型的自我记录,它威胁到长期的幸福感,甚至可能导致讨厌成长。
[--学校往往使我们对自己的微小突破认识不足,或逃避它,这可能使我们失去很多灵感、生产力或甚至我们的安全和生命!]{.ul}。
[-学习未来是终生学习中非常重要的一部分,它能增强学习内驱力,对人类的爱,拓宽我们的视野]{.ul}。
[-电视上的沙发客倾向于高估犯罪和事故率,这是一个简单的刺激世界的启发式偏见;在学校教育中,在这样的伪世界中培育十年以上,所有学生都会高估现实世界中不愉快事件的率。]{.ul}
[--世界的整体暴力正在减少,残余的暴力主要是由于学校]{.ul}。
[--不铲除学校教育,世界的整体进步会慢至少一半!**]{.ul}。
[--学校教育的受害者可能会获得无助感,让他们恐惧无聊,这可能会让他们被学校伤害的大脑在生活中自然地产生恐惧想法,而不是灵感。]{.ul}。
介绍:
长期以来,我在学校周围意识到一些坏习惯或谬误,没有进一步思考或归纳。我读了很多SuperMemo Guru的段落,在sm18中大约积累了3200个元素;然而,我刚刚完成了SuperMemo中100个坏习惯的阅读,大约在2022/5/20到25。
完整的清单(100个坏习惯)是非常全面和广泛的,但缺少一些我长期以来观察到的坏习惯,所以一个想法涌现了。
2022/5/26,我开始写ADDTIONAL BAD HABITS LEARNED AT SCHOOL(学校给我们的其他恶习);然而,在我的脑子里只找到了3个想法,其他我以前思考过的想法都(一时)找不回来了。
在这一天和第二天,我有时忍不住躁动,越来越多的想法飞到我的意识中。
2022/5/26,我有了18个额外的想法。为3个想法写了921个单词。
2022/5/29,这一天是我的自由学习纪念日。
我在2022年5月11日开始纪念我的第1组月度纪念日。自由学习日(每月29日)是4个重要的日子之一,因为在2021年9月29日,我开始将自己视为自由学习者,并写下《我的觉醒》。
**轶事 : 2021/9/30,我把希望的种子(即中文、英文和世界语的《教育解放宣言》)播撒到了海里;2022/5/29(这一天)--------------我在雅安,靠近西藏,世界上最高的地区之一。在一个山顶上,我用希顶语(我会说五种语言,希顶语在中国是希望之顶的语言---希(希望)顶(山顶),表示希望的山顶。此时,我在一张可降解的纸上写下了《教育解放宣言》,把它放在土壤里,在这里种了一棵树,这棵树是当地农民所述的耐严寒植株;对我来说,它意味着孩子们的希望永远不会消失。这就像自己爬上一座山,(也类似于你所描述的一个比喻——学校教育的爬山隐喻),爬上一座自由之山,虽然伴随旧的学校教育障碍的冰冻之风,他们最终会赢。
那一天,我开始试图让自己得到2个想法,集齐20个,大自然也启发了我。
2022年5月30日,我开始整理和书写有关习惯的正文段落。
2022/6/x,我增加了一个新的习惯,现在有21个习惯了。
2022/6/7,我写完了
Ps1.[有很多语法错误和拼写错误,很抱歉]{.ul};但过度纠正这些错误也是在学校学到的坏习惯之一(见:100个习惯),请原谅。
Ps2.有很多“(见:)”, 它们包含了很多你的段落,我相信你可以找到它们。(see:addtional 21 bad habits)被写成了(see:add20),我感到抱歉,因为以前只有20个习惯。
Ps3.我在构思前渐进阅读了很多,也在写作前对100个原来的习惯做了全面的阅读,如果有些片段(我相信只有1或2个)或一些想法在很大程度上重叠了,我感到非常抱歉!但你可以有选择地增加一些想法。
坏习惯列表:
注意:我认为在学校学到的最糟糕的习惯是讨厌成长,它可能有多种错综复杂的原因,并能在不同程度上影响几乎所有学生。其他最重要的习惯以红色标注。
-
对饮水不足的容忍度
-
对做饭的讨厌
-
对某些职业的愈发性不尊重
-
无休止地滋生出诱发近视的习惯
-
对自然的感知不足
-
滋生出了浪费资源的行业
-
毫无意义的捐款——关于教育优化而不是解放的想法
-
对父母的憎恨
-
讨厌孩子(尤其是20多岁的年轻人会这样)。
10.憎恨家庭(整个概念)。
-
友谊过度同龄段化
-
憎恨自己的国家/地区而不是整个学校教育的概念
-
憎恨历史和任何过去的成长轨迹
-
憎恨日记
15.对成长的憎恨
- 对微观进展缺乏重视
17.对心系人类未来的低估值
- 孕育伪理性的悲观主义
19.有关“社会在退步”的谬思。
-
卢德主义
-
对无聊感到恐惧
正文:
对饮水不足过度容忍
水是无处不在的,而且很便宜;然而在现代社会中,超过75%的人倾向于喝得比他们实际需要的少。我几乎所有的朋友和亲戚都经常忽视这个需求,他们本能地认为多喝水会导致上厕所更快,这很不方便;这种想法是如此普遍,以至于我有时看到他们即使可以自由行动,而且厕所很近,也会少喝水——我现在只有62公斤(182厘米,最重时73公斤);我一般每天喝3升以上,在夏天或运动量大的时候,5升是很有可能的;我同意大量补水对预防感冒很有效(见:普通感冒预防)。
他们通常会对我感到惊讶,我是一个天生的严格的素食主义者,通常比他们摄入更少的盐和其他调料;我总是惊讶于他们如何能在一整天内抵抗口渴的感觉——一旦我知道水是非常重要的,我自然地根据需要喝水,根据需要上厕所,我不觉得上厕所是件羞耻的事——这是进化带来的自然需要!"。
食物的无处不在可能是现代生活的威胁之一(见:),但不仅是滥用盐和其他调料(有些会上瘾!),缺水可能使情况更糟。与其引入一些自律(也见:最佳纪律)来放弃一些食物,多喝水可能是最务实的容易实现的温和缓解措施,但该习惯总是被遗忘,偶尔被重新发现和形成。它的形成通常是在医生的建议之后!
在我们的自然平衡中,对饮水不足和饮水过度都有一定程度的容忍;在这个范围之外,人可能会感到明显的不舒服和不可忍受。在狩猎采集的社会中,除非是为了躲避敌人或实际水源匮乏,否则人类会自然喝得比他们实际需要的还稍微多一点。这种水源耐受性如何能在他们的头脑中得到巩固?
答案是学校! 日托所(或幼儿园)是以早熟的幻觉来交易天赋闻名的(见:日托所的苦难),这里的便盆训练使婴儿抗拒上厕所的需要;所以他们喝得少,以避免老师的责备或同伴的嘲笑。为了避免上厕所而少喝的习惯在成年人中是如此普遍,甚至虽然大多数工作环境都不需要比学校里40分钟的时间剥夺更严厉的纪律,我也发现即使是一些远程办公的人和有钱的富人也倾向于有意识地少喝一些水。最重要的是,学校不仅让他们形成了有害的早期概念化,这可能会持续一生,他们还破坏了他们的大脑形成有效的习惯的能力(见:理性的拖延),他们共同促成了一种情况:大多数成年人在看完医生后才知道需要多喝水!
[总结:学校将容忍更少的水凝固为一种 "先天"的条件反射,并使世界上有一半以上的人处于水不足的状态,而根本没有实际的水源不足,这产生了许多健康问题和损耗,而这些问题只需更多的水就能解决!]{.ul}。
对做饭的讨厌
对食物和创造的热爱是人类与生俱来的。不上学的人和在家上学的人通常会把喜欢的东西融合在一起,表现出对自己做饭的渴望。自己烹饪通常比在餐厅吃饭更健康,餐厅一般使用更多的调料来使他们 "上瘾",这只是一种常见的销售策略;此外,烹饪提供了很大的连贯性,使人们学习一些有关饮食的健康知识。
在家上学的孩子有很多机会在父母不在家的情况下激活对做饭的渴望和对做饭的喜爱;他们可能在10至14岁开始尝试做饭,而在学校上学的孩子可能在18岁甚至22岁以后才尝试,一些大学宿舍(如中国的大多数大学)禁止烹饪。
上学的人有更多的压力,可能会有很多瘾,垃圾食品可能 "太棒了!";买来的食物通常比自己煮的食物更 "有吸引力",除非其涉及到自我做饭的乐趣。学校极大地消除了接触做饭和热爱做饭的可能性,并引入了对垃圾食品的易感性;这可能会导致对做饭的普遍厌恶的概念——这是没用的,浪费时间,不好吃~~ 这种危险的想法可能会使人们养成终身不健康的饮食方式。
[总结:学校通过剥夺睡眠来削减心灵的力量,并通过可能的终身持续的风格来削减身体健康的力量,这包括:]{.ul}。
1.[不喜欢做饭,用垃圾食品来获得快乐]{.ul}。
2.[少喝水(见习惯1),加重效果]{.ul}。
3.[削减形成习惯的能力,并通过扭曲大脑强化拖延,使习惯持续一生]{.ul}。
对某些职业的愈发性不尊重。
世界的美丽在其千变万化,而非千篇一律。(见:多样性)。几乎每个人都是社会的生产性成员。对某些职业的不尊重在工业化前的世界已经长期存在;然而,在启蒙运动和人文主义出现后,这种不尊重在很大程度上减少了;但在普鲁士学校教育到来后,这种不尊重又重新燃起,而且变本加厉,这与之前的扩张并不相似,性质已经改变。
旧的不尊重主要是基于对人的分类——把他们当成不同层次的物种来对待,但新的(由学校造成的)是基于假的懒惰(见谬误:学生是懒惰的),人们普遍认为一些职业的人——"他们本来可以做得更好,但——他们自己选择了懒惰,他们不应该被同情!"
这种不尊重在今天可能比以前更可怕,因为人们认为——这是他们自己的选择。学校通过这些方式(可能不全面)加强了不尊重,如下:
-
引入假的“懒惰”的概念
-
对学科的依赖(见:以前的其他100个习惯),对学科和专业做了一个线性视图
-
依赖于零和游戏规则
-
依靠线性价值层次
-
学校教育让父母说:如果你不好好学习,你可能会成为xxx(xxx在某些行业中),这已经成为父母大脑中的条件反射或快速思维。
-
如果有遗漏:请写给:extraordinaritarian@outlook.com
旧时代的不尊重可以归结为时代的限制,旧社会制度的病态等,但对残疾人、胖子、女人或LGBT的刻板印象很容易随着知识的自然流入而消失,在网络甚至5G时代,所有拥有相对健康评价网络的人自然可以摆脱这些观点,其余大部分人可能只是因为——被学校教育伤害的扭曲的评价网络而继续有这样的想法! 但是,新生的不尊重像谬误一样存在,它们继续被强化,(见:谬误易传难杀),由于旧的不尊重在很大程度上被很好地压制,它们新的不尊重可能变得——表面上不严重,但严重的是,它们确实成为伤害多样性的现代返祖现象!
[总结:学校是现代刻板印象和歧视的主要促成者/煽动者!]{.ul}*
无休止地滋生诱发近视的习惯。
近视是一种现代常见的屈光状态,它是一种适应,而不是一种疾病;然而,它造成了很多不便,由于早期的怀疑、幸运和13岁时在诺基亚230的浏览器(只是一部2G手机!)上可以自由学习,我在很大程度上治愈了早期的右眼近视,并预防了左眼的近视,直到现在(成年),(见:自由学习使我一生都没有近视!——待写中);我的一个直系亲属患有1800度的近视,这真的毁了生活质量。作为一个中国人,我每天都能看到无处不在的眼镜,中国高中的近视率超过83%,大学的近视率超过90%!
近视的发展可能主要归因于过度滥用凹透镜(见:www.endmyopia.org),,)但学校也有很多害处!它培养了无穷无尽的诱发近视或恶化的习惯。
4.1 对近距离工作的容忍
学校对睡眠有伤害(见:对不良睡眠的容忍);就像描述的那样,一个自由的孩子通过本能的学习内驱力自然地学习,遇到自稳态疲劳,从而自然地上床睡觉,只有非常刺激的事件才会使他们相对晚一点上床;在近视的情况下,一个自由的孩子会在持续的近距离工作中自然地遇到不适,他们自然地移动到休息,做一些运动或去大自然中玩。人类的眼睛在进化过程中被设计为在远处观看时能正常和持久地工作,这就是为什么它 "专注"于微距时睫状肌需要收缩(见:眼睛近距离适应的危害),而默认的焦点是在远处观看。自由儿童对近距离工作的不耐受度在预防近视方面起到了很大的作用,而在大自然中玩耍的时间可以起到启发和锻炼的作用。然而,一旦学校强迫学生进行大量的近距离工作,学生就会忽略眼睛放松的需要。不舒服的感觉神经元也可能被削弱,其机制类似于习得性无助;在学校学到的对近距离工作的容忍可能导致学生抵制电子游戏的近距离工作的不适感。在家里,它使近距离工作的数量增加一倍。这种耐受性是由新皮质和我们的眼睛无法抗拒的,大多数学生表现出对近距离工作的长期适应——默认的焦点变成了近距离,以消除每次的肌肉痉挛——这就是近视的产生!
**4.2 由于需要看清黑板,在近距离工作时要佩戴全矫正镜。
负/凹透镜是一个很好的设计,可以让近视者专注于远处;但是,戴着它做近处的工作可能会有更大的伤害(见:),很多近视学生,如果没有不良医生处方的干扰,自然选择在近处工作时不戴眼镜,这样更轻松;但是,在教室里,看黑板的需要让他们必须同时看到远处和近处,他们可能很容易形成习惯,长期戴眼镜来"适应"两种情况,这使得近视不断恶化,它最是超过600度的非病理性近视的原因!
4.3 学校无休止的强化一些习惯,如对电子游戏上瘾。
近距离工作是近视的起源,就像它的字面意思一样简单。学校强化了很多情况下对近距离工作的过度滥用,我们来列举一些:
-
通过给予带来无目标,它增加了学生接触可变奖励的视频游戏、社交媒体八卦等的比率。
-
通过消除对运动的喜欢(强制运动引起的反抗),它减少了远距离的工作。
-
由于早期的社会化(我称之为 "逆社会化")和对ADHD、AsperGer等的过度判断。学生异常地越来越内向,花在外面的时间越来越少,主要在屏幕前交谈。
-
破坏睡眠,近距离工作的效果会加剧
-
更多信息,请送给:extraordinaritarian@outlook.com
[总结:学校是拖延者的工厂,是不快乐的人,也是近视的人的工厂!在中国,初中的近视率是71.1%------中国9年的强制学校教育直接包含了每个孩子70%以上的强制性风险!(如果你不学习关于近视的知识并去预防的话)]{.ul}。
[总结2:如果眼镜的危害还不是一个常识的话----]{.ul}*。
[强制学校教育等同于强制性近视!]{.ul}*
对自然的感知不足。
对大自然的热爱也是通过人类进化而根深蒂固的,并流淌在我们的血液和DNA之中。一个自由的孩子在大自然中漫游,发现一朵新的花或新的植物,这都可以是一个令人惊叹的因素,进化出早期的学习内驱力。然而,一个不到3岁的孩子在纯粹的自我探索中可能是不安全的,一个更大的年龄通常更好。但令人遗憾的是,他们中的大多数都被送到了今天的幼儿园,小学、中学......;在过去的时代——没有电话,学生们倾向于使用自然运动,如自行车或捉迷藏,以消除学校教育的不良影响;在现代,他们几乎不外出。学校教育使我们,尤其是年轻人,忽视了大自然的舒缓和乐趣的力量,甚至是其存在。
大自然是缓解压力的主要资源,远离压力是睡眠的必要条件,在终生学习中起着不可或缺的作用。大多数舒缓的音乐,甚至一些冥想的背景都是受大自然的启发;在树木茂盛的公园里散步,呼吸新鲜空气,可以让你立刻真正体会到对生活的爱。
我喜欢自主创意旅行。除非和很多朋友一起,否则我很少跟随旅行团。去年(2021/09/30),我把儿童的希望(教育解放宣言)播撒到大海,今年我把希望的种子播撒到山顶。我喜欢用我的诺基亚8.3 5G、诺基亚808 PureView等拍照。大自然给了我即时的安抚和强烈的情怀,唤醒了我的旧记忆,甚至让我更加心系人类未来。
大自然的美就像学习的美(惊叹的结晶),它们都是自组织的结构(复杂适应性系统),它们是新生的生命,宇宙的孩子。它应该也可以被自然地欣赏,而不是在学校里通过——获得一些离散的知识地理学、生物学等来欣赏。
作为一个19岁的人,我看到很多同龄人对自然的热爱减少了;坦率地说,我更多地是通过对摄影的热爱来欣赏自然,早期的学校教育可能会扼杀它,但幸运的是我的——它没有。更糟糕的是,我看到很多20到35岁的同龄人倾向于热爱旅行,但对自然的真实感受却较少——他们喜欢去经常去的景点,吃很多不健康的食物,跟随旅行团,拍摄照片来显示他们去过那里,玩一些著名的活动。我看到有些人对旅行的热爱已经被零和游戏规则和嫉妒所玷污了!
因为在我的旅行中,我倾向于享受大自然的自由接触和自由安排的时间。对我来说,即使是在当地的公园里自由探索,也比有约束的旅行团(甚至是有朋友一起玩耍的乐趣来辅助)更有趣。我也花钱少,作为一个抗衰老斗士和素食主义者,我经常只吃当地的一些健康食品;我不喜欢在一些活动和展示上花很多钱,我喜欢展示我内心的爱和发现。有一小部分朋友说我的旅行是浪费时间,尽管我在旅行中书写了丰富的文字;但我只是本能地喜欢大自然中的自由。
学校有一些不可思议的力量,他们可以扼杀早期对大自然的热爱,把对大自然的热爱变成旅行中的零和嫉妒和比较;幸运的是,有些人在一些旅行路线的真实观赏中本能地重新发现了大自然的美,但他们中的大多数都受到了一点影响。
[总结:学校使学生对自然的欣赏远不如非学校教育者,他们可能会转向旅行的社会零和比较的标准,而不是真正欣赏自然;但这种爱可以被重新发现。]{.ul}。
滋生出了浪费资源的行业
学校教育不仅在世界范围内促成了零和游戏的盛行,而且还导致了整个浪费的产业体系。这种现象在西方国家可能不那么普遍,但在亚洲,如中国、朝鲜、日本等,浪费的行业无处不在。
学校教育通过无意义的课程和考试主宰着孩子们的世界,考试已经超过了我们的大脑处理能力(见:我们的大脑能装多少知识?);然而,学校考试有一些通过的技巧,如分析过去的试卷,使用死记硬背,找到测试标准(有些是内部秘密),贿赂测试者,等等。
一些积极的学生可能已经找到了一些自学技巧来帮助测试,如主动回忆,助记法,甚至是间隔重复(但间隔重复也可能给负学习熵的材料带来毒性记忆);但其他人可能没有这么幸运,他们的头脑可能已经被学校引起的习得性无助所支配,或者他们发现一些无益的方法而放弃(因为大多数为自由学习和终生学习工作的学习方法可能不适合死记硬背,反之亦然。对于大多数贫穷的亚洲奴隶来说,他们甚至没有一点时间来寻找技巧,他们早上5点起床,晚上10点结束学校的奴役(这是中国高中奴隶的一个例子!),在晚上11/12点之前放松或做琐事,有5小时的睡眠;为了通过考试,他们不得不使用作弊方法(见:作弊),一些仁慈的老师也帮助他们。
除了简单的作弊,他们和他们的父母可能会开始一些金钱上的 "伪作弊"——放学后的补习;它主导了他们的假期和周末,补习不太倾向于无意义的lectures(见:讲座),而是注重测试技巧;那里的辅导员几乎是测试机器人,他们确实掌握了一些好的学习技巧,如一些记忆法,但大多数是专注于迎合测试和无语义记忆,甚至作弊技巧。一些机构购买了部分答案,并以高价出售。
更广泛地说,学校教育已经滋生了一群作弊系统,甚至已经演进到出售假校历和关于校历的政治欺骗。这是不争的事实;从学生的角度来看,他们可能会发现工作收入很高,或者他们对学习机器人(补习班老师)的“聪明才智”感到惊讶,他们可能会在以后加入这个行业。
大多数补习班老师都是学生时代的优等生,但优等生并不代表创造力也不能保证成功,(见:《做优等生的风险》)——他们可能会成为这样的导师,加速无意义的学校竞赛;然而,优等学生也是学校系统的幸存者,具有一定的潜力,从这种辅导中受益的学生可能会再度成为优等省,但他们没有想到他们真正想要的未来和对人类的贡献,而只是迅速关注这个辅导行业,认为它可以加速教育——他们想 : “这或许很好!”
说实话,我在完成A Level考试并获得全A的成绩后,试着在这种行业工作了大约一个月;我一个月赚了8000元,每天工作不到3小时,即使在我所在的成都(一个一线城市),这可能比大多数中国成年人的效率要高,我很惊讶于这个行业能在未来养活我,我认为我的生活有保障,但现在我对此感到很难过——这种行业会扼杀真正的学习,使其他有用的行业变得更糟。
[总结:学校教育和测试系统已经孕育了一群无用的、类似机器人的产业,尤其在亚洲。它造成了:]{.ul}。
1.[浪费社会资金]{.ul}*
2.[对终生学习真正途径的歪曲性思考]{.ul}*
3.[浪费了优等生]{.ul}*
4.[成为了其他坏习惯的加速器,如零和游戏]{.ul}。
无意义的捐赠(关于教育优化而不是解放)以及衍生想法。
陈腐的学校教育系统必须死亡。大多数人已经意识到学校教育确实很糟糕,但他们中的大多数可能不会倾向于有根除整个教育的想法(见:宣言),他们从多方面考虑如何能让学校变得更好,有些想法可能会导致他们不喜欢自己的国家或地区,而不是学校教育本身,造成不和平的想法;一些学校的幸存者很富有,他们可能会以自己的方式为更好的教育捐赠,但这些捐赠可能是完全无益的性质,或者他们可能被学校系统滥用。
20%的人拥有80%的财富,这并不奇怪,慈善事业是超级富豪的本能,他们不把钱捐给穷人、医药和所有促进人类未来的东西,而是把大量无用的钱捐给假教育改革。由于很多富人是学校教育的幸存者,这些捐赠可能更多的是对不幸的学生的一种压制,使他们获得校历更加困难,而且可能会加强不平衡的资金分配,通过另一组捐赠,再次被放大,如果学校教育在未来没有成功解放。
另外,很多思想丰富的作家往往写了很多或多或少与教育改革有关的书;如果没有充分了解学习的基本规律(见:),他们中的大多数人都会误导群众,这种机制的功能类似于上述的捐赠。
[总结:学校必须死,未来就在眼前,然而,轻轻地改革学校可能弊大于利;学校是一个完整的坏系统,具有难以置信的生存能力,与其给它来一场可能加剧其免疫力的流感,我们必须必须给它来一场埃博拉,杀死它!]{.ul}
对父母的憎恨
学校是早期家庭和谐的主要破坏者,超过73%的小学生家庭不愉快与学校有关(包括成绩、学习困难不快乐,等等)。懒惰学生的谬误是如此普遍(见:谬误:学生是懒惰的),它使父母使用一般不在推动区的策略(见:最佳推动区),加上其他学校造成的缺陷,可以导致早期失去安全感,家庭的滋润,等等。而最严重的是,抑郁症,甚至对父母产生终生的仇恨。
父母的爱在世界上本来就无处不在,大鼠在母婴分离时表现出压力和较少的学习能力,对人类来说,爱的力量要大得多;相反,对父母的恨,在强制教育前的世界里也自然而然地出现,但很少的时候,一种过度表达的不良情绪可以永远地毁掉孩子的心情。然而,不好的情绪,就像地震一样,可能是不可避免的,但它们像地震一样自然而罕见,它们主要可以归因于情绪脑、爬行脑和激素的控制。然而,学校教育出现后,家长很容易被谬误误导,被学校系统的错误伤害了孩子,甚至试图有意识地伤害孩子。(见:谬误——压力为成人生活做准备)父母可能会表达情绪,但大脑中没有真正的情绪变化!("情绪"纯粹是由理性的新皮质产生)。学校教育在世界范围内造成了父母情感表达的总体不良,从而使孩子们更经常地恨他们的父母。
对父母的憎恨不能完全否认,有些父母可能天生就有暴力倾向,但大多数都是学校教育系统的受害者;你的内在感觉是自然的,不要试图用整个理性去控制它。总之,不管你是否已经重新评估了父母的关系,都要尝试去恨学校! 把你的仇恨转移到有意义的改革斗争中去!(见:宣言)
[总结:学校可以疏远你和你的父母!它把每个人甚至是老鼠之间的父母之爱变成了仇恨!]{.ul}*。
[总结2:如果你的孩子讨厌你,请你想想,是他们还是学校有错!]{.ul}*
再加上对孩子的仇恨(下一个习惯),这种仇恨可能会加强到对整个家庭概念的仇恨(见:下一个习惯)。
讨厌孩子(特别是在20多岁时)。
我是一个19.25岁的人,我经历了12年的学校教育,在我18.75岁的时候才真正意识到学校的坏处;幸运的是,几乎在所有的年龄段的时候我都喜欢年轻的孩子,我认为他们活跃、好奇和有创造力,我讨厌学校系统,但并不确切知道为什么,我从不歧视学校教育的受害者(见:《我的觉醒》)。
尽管如此,我看到我的很多朋友在他们15到30岁时,就失去了对孩子的爱,开始嫉妒甚至讨厌孩子。很多仇恨可以这样表达:"哇,看看这些孩子,他们太调皮了,我不太喜欢他们。为什么我们都让他们学习,他们却不学;我觉得很遗憾,我没有早点努力学习,甚至我和所有的长辈都告诉他们不学,现在时代变了,他们更有钱了,父母更爱他们了,为什么他们还不愿意学?我很羡慕他们! 我甚至有点恨我的小弟弟,为什么他经常偷我的手机来搜索“无用的”「我的世界维基」?"
这些句子只是典型的,但几乎所有讨厌孩子的想法都倾向于以类似的方式形成,让我们分析一下他们是如何思考的:
-
“他们是调皮的”:他们只是有创造力,他们的学习内驱力可能仍然尚未被学校教育摧毁。
-
“他太懒了!”——这是一个常见的谬误,见:谬误:孩子们是懒惰的
-
“他甚至在小学都不喜欢学习了,小学的东西那么简单!”—— 很多人都有这样的感觉,这是一种典型的扭曲的记忆:缺乏教育同理心(见:),甚至中学时代的青少年往往对小学时代的同学失去记忆同理心!
-
“为什么我们都让他们学习但是他们就是不学习;我特别后悔小时候没有好好学习;这些孩子啊,就是我和其他大人们把这些经验给他们,他们还是不听 ”——你在小学时被遗忘的记忆的折磨,就这样,再次被他们遇到了,真是地狱一般的存在!你到底还记不记得每一次的痛苦?你是否清楚地记得小学期间的每一秒钟的痛苦?这就是他们目前所承受的,同样你的每一秒钟的痛苦也不会被大学生们所理解!你的每一秒钟都是在为你自己而战。
-
“现在时代变化了,他们的生活更加富足了,他们的父母更爱他们了,为什么他们还是不喜欢学习?我嫉妒他们!”——你知道进化是默认的吗?他们在互联网上得到更多的学习资料,他们就会学到更多的东西! 如果父母更爱他们,他们可以在自由学习的时间里学到更多的东西,这种学习能力才是你真正应该羡慕的! 但是,你可能有更多的自由学习,因为你是一个成年人或一个大学生,这也可能是嫉妒的坏习惯在学校加剧了!(见:)
-
“我甚至恨我的小兄弟,他为什么总偷俺手机查「我的世界维基」?”——童年的激情可能也被认为是调皮的,但它是有创意的! 婴儿自然喜欢使用互联网,因为这能让他们更有效地学习! 维基是自由协作构思的一个很好的例子(见:其他100个习惯),而Minecraft是探索性学习的一个很好的方式!他们喜欢维基,就像你小时候喜欢玩具或MP3等一样!
学校教育制度使我们不喜欢15岁以上的孩子(一般是我们在20岁的时候),这可能威胁到他们从成人那里自由学习(见:),加强对老师的依赖(见:语义距离悖论),失去信心等。对孩子的爱在30岁以后很容易恢复,因为他们有自己的孩子,但父母一般都被许多学校的谬误所毁,爱可能只能恢复一半。没有孩子可能是为了终生的追求,可以造福人类,这可能是很好的;但是,作为年轻的一代——我看到很多年轻人往往因为讨厌孩子而决定不培养孩子!。
[总结:由于记忆效应和学校教育,即使是青少年也会对儿童缺乏同情心。在学校里,我们没有学会爱,而是学会憎恨孩子,特别我们在20多岁的时候。对孩子的憎恨可能导致:]{.ul}。
[- 孩子们更难从友善的成人那里自由的习得知识——对于一个五岁的孩子,所有的成年人都是某一个领域的专家.]{.ul}
[-不快乐的孩子,例如:失去信心]{.ul}*
[-如果伴随着对父母或更多人的仇恨,可能会导致对家庭的仇恨(作为一个整体概念),见下文!]{.ul}*
憎恨家庭(整个概念)
学校引起的最糟糕的习惯之一可能是对家庭的憎恨,它可能源于对孩子的憎恨(见上一条),对父母的憎恨(见上上一条),或者很可能两者都有,甚至更多。对家庭的憎恨将在很大程度上减少一个人的终生幸福。
伴随着学校教育谬误衍生的社会化的副作用(见:),外向特征和交友技能也可能减弱,使学生非常非常孤独。最严重的是,伴随着无目标(见:)、习得性无助等。抑郁率会急剧上升,最不走运的人可能会自杀。
[总结:在一些不幸的情况下,学校会让一个人讨厌整个家庭的概念,这可能导致极端孤独和自杀!]{.ul}*。
交友过于同龄化
多样性是对抗偏见的最好方法。诺贝尔行为心理学家丹尼尔-卡尼曼(Daniel Kahneman)注意到,开放性是有利于长期整体准确判断的最佳特质(见:《噪音》)。不同年龄段的人有不同的大脑,年轻的大脑更具可塑性,对谬误的影响较小,而年长的大脑在记忆的稳定性(见:)和快速思考方面更有优势。有一个跨年龄段的朋友是很有启发性的;我最好的朋友(不是亲戚!)是一35岁的彝族朋友,而我是19岁,我想我从他身上学到了很多。
我看到大多数学生都有太多年龄相仿的朋友,他们害怕与年长者交谈,这可能是由于成年人失去了同理心(见),甚至是成年人讨厌孩子(见:).这种现象主要可归因于以下原因。
-
讨厌自己的孩子(见:),使他们难以从年轻的朋友那里获得灵感
-
学校的坏习惯,社会尝试的限制(见:100个习惯)。
-
课标的线性让他们更多为了年龄仅仅相差1-2岁的人上课而沟通。
-
对父母的憎恨(见:)和对成年人的普遍憎恨
-
在被学校扭曲的成人世界中,有很多长期存在的由学校引起的习惯,如嫉妒、零和比较等。
-
课程安排的线性甚至可以导致生命成长的线性,使这种习惯持续一生。
-
无尽的其他谬误
年龄是人类多样性的标志之一,如果一个青少年想了解诺基亚N系列的时代,甚至诺基亚手机的GSM时代,从一个超过25或30岁的成年人那里问可能会很自然和方便。我喜欢诺基亚的演变和现代汉字的简化过程,询问老人对我帮助很大。在1890年,平均寿命不到40岁,而在2000年变成了75岁以上,由于合成生物学和机器学习在所有抗衰老领域的加速回归定律(见:),人类的寿命将飙升——你知道长寿逃逸速度吗?与一个100岁的人交谈,了解100岁之前的事情,这将是相当鼓舞人心的,而100岁的人的生物年龄可能是60岁或更少,但日历年龄有100岁。顺便说一句,在那个时代,学校教育可能已经被我们杀死了,加入我们吧!(见:宣言)
[总结:学校倾向于让我们总是去找年龄相仿的朋友,它浪费了现代人类寿命增长带来的经验多样性的巨大来源。学校是造成代沟的主要原因!]{.ul}*。
对国家/地区而不是对整个学校教育概念的憎恨。
对家乡、城市或国家的热爱是与生俱来的,它可能会引起偏见,但这是一种自然现象,发生在所有的概念网络中——我们的世界是一个复杂自适应系统,国家和地区的出现在当地的同质性是通常的局部优化,所有好的普世观点都是自然涌现的,但如果它是基于对家乡的纯粹仇恨,从长远来看,它可能变成有害。学校往往使我们憎恨我们的国家、家乡或城市,而不是学校教育的整体概念,这可能会扼杀和谐。
关于对学习内驱力的破坏,亚洲的教育通常比西方的教育危害更大。但这并不意味着这些国家或整个州都是坏的;有些西方国家拥有更多的人口财富,也可能有坏的教育,(见:芬兰悖论等)。
在讨厌整个学校教育的概念之前,我已经讨厌中国和亚洲的教育12年了;幸运的是,我没有泛化得太远,我不喜欢一些强制性的政治思想,但我认为中国的历史和文化非常令人陶醉。但我的一些朋友已经改变了他们的观点,比如所有的中国衣服都是坏的,而且很快(相当奇怪),人类的泛化能力太有创造性了,有时甚至是极其有害的!"。
由于人们普遍认为强制性的儿童奴役的想法是理所当然的,他们可能会做很多不可思议的伤害(见:无意义的捐赠/思考等);一些对学习内驱力威胁较小的西方教育的反对者可能会认为自由给孩子带来高的误入歧途率等等,他们可能会恨他们的国家,并试图采用亚洲的方式
在自由学习中,对当地地区或国家的爱可以得到加强或削弱,这是很自然的。默认情况是爱,这从根本上保护了稳定。对当地仇恨的升级可能是一个很好的范式转变指示器,因为它是自然出现的。然而,对学校教育的仇恨可能会导致往往更偏向于普遍的仇恨;同时,学校教育本质上是政治性的,这种强迫性可能会导致更多不和谐的事情;无论当地的教育如何糟糕;我们,孩子们,需要团结起来,首先打击我们共同的敌人,教育解放宣言(见:)是为全世界设计的。
[总结:学校教育可以使我们偏向于憎恨我们的地区或国家,这可能会引起更多的冲突;由于爱国主义是相当敏感的,学校教育间接地破坏了任何友谊——学校教育是冲突的邪恶起源!]{.ul}*。
对历史和任何过去的演变轨迹的憎恨。
在必修课中增加任何内容都可能是一种净损失,对科目的憎恨与它们的重要性神秘地成正比,(见:);由于历史是一门普通课,而学校总是政治性的,历史在某些地区可能是必修课。再加上对地方/国家而不是对学校教育的憎恨(见:),学生可能会对一个一般化的概念——「历史」产生终生的憎恨。
由于历史只是过去的事件流动,学生可能讨厌任何过去的演变轨迹,这可能会减缓学习进度。学习一个领域过去的一些演变轨迹,可以为我们的探索提供很大的启示,它可以使进一步的工作本身更符合人类成长的现实。查看间隔重复的历史(见:)可以使我们更好地进化sm19的想法;然而,学校引起的对历史的仇恨可能使学生说:"哇,1985/07/31,间隔重复诞生/....hmmm,确切的日期,事件,这就像可怕的历史课!有毒!"毒性记忆会威胁到任何不相关的材料的学习。
此外,对历史的仇恨会造成以下的伤害,甚至更多:
-
随着在学校里对日记的厌恶(见:)而加剧,使他们过去的记忆丧失得更快。
-
伤害过去的文化,无处不在,这让沉睡的人们在坟墓里哭泣;如果他们能复活,我想他们一定会用核武器来毁灭学校!"。
-
损害世界的可持续发展
-
与不喜欢复习有关
-
最严重的是,对历史的憎恨会转变成对成长的憎恨**(见:),这可能会使一个人的生活变得毫无意义
[总结:学校让我们憎恨历史,加速了遗产、记忆的丧失;它阻碍了成长,甚至扼杀了成长!]{.ul}*。
对日记的憎恶
表达和记录是人类的核心本能之一,详见《沟通的乐趣》;在现代,小插件/软件很普遍,纸和笔人人都买得起,电池加速耐用,软件更多;但只有少数人定期写日记,那些喜欢简单和经常写下自己的成长和事件的人主要是用文字工作的人。我和很多人都认为写下自己的想法对成长很有帮助(参见:天才清单),但人们往往很难遵循。学校让我们默认或不自觉地讨厌日记,这可能会扼杀未来宝贵的记忆、灵感,你永远不会知道你过去的一些感受和故事是多么珍贵。
在早期的母语教学中,或者在中学的语言教学中等等,强迫学生写日记可能是一项常见的工作——这就是主要机制。
学校是让我们讨厌它,多年后,这种讨厌甚至可以是无意识的,这就是为什么人们几乎不会因此而责备学校。此外,在学校获得的对历史的讨厌(见:)可以加强它;另外,“对拼写的崇拜”导致对写作的讨厌,它也可能导致对日记的讨厌。
SuperMemo的发明者从13岁开始记录他的事件,我在18.75岁时开始记录生活,现在是19.25岁,我认为这是我一生中最大的四个生活变化之一,我永远不会忘记2021/09/24,每个月的24号成为我的成长纪念日,我月月都庆祝它。从这一天开始,我有了自己的历史。只有平凡的人,但没有平凡的人生。我是平凡的,但我的生活可以是不平凡的。
我在两个月前开始在SuperMemo中进行渐进life event,我记住了许多重要的甚至改变生活的事件的确切日期,这让我感到更加自信,内心平和,当我反省自己的成长时,轨迹变得更加清晰,清晰5倍!不是欺骗!"。
有一本日记(或life event等)可以使人感到更快乐和自信,它还可以防止许多以前的记忆丢失;一些过去的平凡的感觉可以在10年后变成极有价值的,每个人都可能有这样的经历。我们的记忆远比我们想象的要弱,许多过去的事件和感觉几乎可以被扭曲或消失,这就是虚假记忆和教育同理心丧失的源头;记忆的稳定性和可提取性在许多情况下是相反的,一些高度稳定的记忆可能不容易被唤醒,但一本旧日记的一些文字可以触发一个超过20年没有提取的老人的记忆,她可能突然感到心灵触动。**另外,由于记忆的扭曲,我们可能会否认自己的过去,否认一些成长,并根据虚假的记忆做出一些反成长的错误决定,对历史的记录可以防止我们做出错误决定。
**[总结:通过强迫学生写日记,特别是在早年,以及其他综合影响(如讨厌写作和历史),学校抑制了大多数人保持日记的渴望,甚至记录他们的成长的渴望,这可以使长期幸福感大幅下降,最重要的是,与其他坏习惯相关联,仇恨可能直接导致对成长的仇恨(见:下文),这是学校最灾难性的坏影响。
对成长的憎恨
憎恨成长是很多由学校引起的坏习惯的错综复杂的组合。我认为这个习惯是所有120多个习惯中最灾难性的5个习惯之一。而这可能是所有20个额外的习惯中最严重的一个。
我认为终生发展(包括终生学习)是世界上最快乐和有意义的事情,我喜欢生活,喜欢成长,喜欢茁壮成长,喜欢多元化发展,喜欢看世界,喜欢与世界上许多地方进行多样化的交流。在我17岁的时候,我为自己写了一些兔子定律,第一条就是:。
*我的思想不是固定的,而不是用只用一句格言来指导我的全部生活,我将用一系列成长的、不断变化的核心思想来指导我的成长,所有的规则都可能变化,进化是第1^^优先。
世界变化如此之快,每隔10年,一些领域(如医学)的知识就会淘汰50%以上的旧知识,它们不再是真的。范式迁移越来越快,跨学科和多样性的力量变得越来越重要;更重要的是,关注终生成长变得更有意义。**对生活的热爱,对成长的热爱可能是未来世界推动者的最佳指标。但学校对其造成了灾难性的伤害,这是我坚持要成为辍学者的主要原因之一(见:《?》:尚未写完),学校教育是在扼杀生命,制造僵尸,令人无法容忍!。
对成长的憎恨的原因主要可以归结为这些:
- 对日记(以及类似有关成长轨迹的记录)的憎恶
对日记的厌恶会使学生反对所有形式的记录,而这些记录可以帮助他们直观地看到自己的成长;我们的记忆能力远比我们想象的要弱,即使是偶发记忆也会逐渐消失,几乎无法恢复,除非有非常幸运的事情触发。对日记的厌恶会直接导致对成长的厌恶,便如讨厌记录成长的想法;但最关键的危害在于它的直接因缘——记录富有成效、自信和快乐的过去的可能被剥夺了,失去成长使得在学校获得的毒性记忆(见:)支配了大脑,产生了对自己实际过去的虚假的过度悲观模式;生活失去了色彩,成长逐渐消失了。
- 对历史的憎恨
对历史的憎恨可以放大到对个人历史的憎恨,这种机制以类似于对日记的憎恨的方式破坏了对成长的热爱,并且可以得到加强。更重要的是,对历史的憎恨会使一个组织(或一个学习领域)的参与者在组织中的实际成长更少;这会导致更少的青色进化型组织(见:),他们对自己的终生工作和追求的爱更少,他们对人类的未来更少,对个人成长的爱也更少。
- 所有引发同质化的习惯。
多样性主导着进化,知识进化论(见:)是一种形式,一棵树(见:)也是一种形式,同质性遏制了增长,这正是学校给我们的。
就像在学校学到的朋友过度同龄化(见:),我们有一个隧道式的视野,主要集中在同龄人身上,这让我们没有时间去看不同年龄段的人是如何成长和发展的;此外,这也会增加嫉妒(见:)。
学校也倾向于给我们提供一个社会甚至世界运行的固定机制,我们在学校学习独立的微观和宏观经济,我们学习有偏见的和课程滞后的政治;我们不学习复杂经济学,复杂自适应系统在学校不受欢迎,未来学变得没有意义,等等。同质性和固定性让我们无法思考我们的成长与世界的成长是如何联系在一起的,无目标(见:)和钝化的怀疑主义(见:)会加剧。
- 所有触发线性思维的习惯。
线性可能被认为是同质性的一个不明显的变体,但它有自己的特征。"矛盾的是,它是一种 "成长",但它只是基于可预测性的虚假成长轨迹。最好的成长方式应该是多方面的,有机的,肯-罗宾逊是对的(见:《让思维自由》);学校滋生了关于我们如何成长的线性和僵尸般的想法,我们不喜欢成长,甚至讨厌它,我们认为我们的生活很无聊。
幼儿时期的课程可以用关于成长的线性思维支配我们的大脑,这甚至可以扼杀一个4岁孩子在幼儿园形成的梦想,这种影响最迟在小学阶段肯定会出现。我们对长期成长的热爱已经变得相当薄弱,仅仅借助一个其他的习惯(如对历史的憎恨)就可以引发对成长的憎恨。
- 有关“世风日下”的想法
“世风日下”的想法(见: )可以归因于假学校环境引起的伪理性悲观主义(见: ),这种观点使我们不喜欢这个世界;当然,它可以导致自己觉得自己“自风日下”的观点——没有成长。他们可能会 "娱乐至死",并很快转变成实际不快乐的折磨,如一些基于可变奖励的游戏,和容易饱和的奖励,如不健康的食物。
关于“世风日下”的激进思想并不那么普遍,但经过多年严格的学校教育,大多数人变得低估了世界的未来增长,这种影响可能是连续的,而不是纯粹的量化和离散的。
[总结:在学校获得的最不能容忍的地震般的习惯是对成长的憎恨,它几乎是 "对生命的憎恨",而且这种憎恨有多种来源,在不同程度上几乎大多数学生都受到影响,强制学校教育必须结束(见:宣言)]{.ul}。
对微观进展缺乏重视
SuperMemo guru的一生都在推崇渐进主义(见:),最富有成效、最有意义和最快乐的生活或学习是逐步演变的,微观规则(见:)是毫不费力的规则;与其专注于大项目,不如专注于一天可能更务实和快乐。
学校的学习方法本质上是错误和荒谬的;最伴随着的坏习惯可能是无语义学习(见:)习得性无助(见:),(见:)等。对微观进展的认识不足可能是一个 "温和"的坏习惯,但也是重要的注意点。
最好的学习和巩固方式应该是专注于原子化知识(见),渐进学习自然支持这一点,(见),测试(见:主动回忆)是巩固记忆的好方法;通过专注于单独的小拼图记忆,我们几乎可以毫不费力地连贯学习;学校给我们的测试不仅是纯粹的外在评价,而且知识的安排也很糟糕,我们在匆忙中测试一大堆知识垃圾,有的是突然的快乐或悲伤的。我们失去了对自己微观成长的认识,我们也可能在成年后看到这个世界的突然衰落或成长,这只是由于早期不良的学习方式。
微观进展也在同行评议中被消灭(见:),甚至更多的自由大学仍然导致可怕的学习方式形成,我讨厌几乎所有的学校,除了那些互联网学校或民主学校。
在习惯养成、健康饮食、GTD等方面,微观进展可以产生不可思议的力量。另见:渐进生活。有时将慢性压力转化为急性压力(见:)可能是一个伟大的想法,但在一些自愿(非强制性)的变化中,渐进主义是更好的,在节食中也是去抑制(disinhibition, 见:)。写下即时想法是一个很好的习惯(见:天才清单),但学生们几乎不知道它的价值。他们也可能讨厌日记(见:),上学的人可能会在他们的大脑中失去很多想法和故事,这些想法和故事可能会在20年后变成改变生活的巨大结晶。
我写了一些关于习惯养成的即时想法,在手机里的想法,我把它们放在不同的遗忘指数和优先级的间隔重复系统中(见:),如果形成了100多个简单的习惯,可以避免一些包袱或增加一点生产力;我太有创造力了,在一些场合我甚至“忘记带我的财产”,这是很危险的。有些习惯是周期性的,它们很容易通过任务清单来解决;但有些习惯是条件性的,比如 "如果X,就做Y",用间隔的重复来巩固它的记忆是很有帮助的。这些习惯我称之为渐进习惯,其中的一个子集我称之为渐进安全,它们是拯救生命的习惯,如*"总是用两只手来驾驶自行车","如果可能的话,总是不要坐在汽车的副驾驶座位上","在去一个遥远的地方旅行之前,了解一些当地的地质情况,以便更好地准备应对自然灾害(这个习惯是在雅安的地震中形成的!)" *。对微观突破的认识和创造性地使用它们,不仅可以提高生产力,而且可以把你从死亡中拯救出来!"。渐进安全的生日(2021/11/7,每个月的7日)也是我的4个重要月度纪念日之一,与自由学习纪念日类似。
[总结:学校往往使我们不太了解微观进展,甚至否认它,这可能使我们失去很多灵感、生产力,甚至我们的安全和生命!]{.ul}。
对心系人类未来的低估值。
课程滞后是一个很大的问题,它不仅破坏了适用性,还让我们对现代世界形成了不那么顺应的模式。再加上对同行评议的伤害(见:),对唯一真理的依赖(见:)和同质化;学校可以使我们所有人都低估我们为人类创造更美好未来的可能。**天才是由爱(而不是强迫)培养的,而天才的成熟也是由爱推动的——对人类、对整个世界的爱。**学校让我们看到更少的天才,更少的美好未来。
所有新生的知识可能无法通过审查,但由于它可以触发我们的激情,它有可能改变世界,范式会一次又一次地发生转变,呈指数式沿革(在实际中可以是S型,见《奇点临近》)。对我来说,我一生的梦想(15岁以前)一直是在成年后拥有一部豪华的诺基亚安卓手机。(顺便说一下,我现在已经实现了!见:诺基亚8.3 5G),但在16年用两个月时间学会世界语后,我开始热爱这个世界,并开始思考如何能够为人类做一些有益的事情。我不确定为世界语而战是否值得,我认为如果传统语言在未来被一些 "脑电波交流"或其他未来主义的交流方式所取代,世界语可能就不完美了。于是我开始有了研究未来学的想法。事实上,"未来学"并不是一个严格的议题,我读了很多Kurzweil, Diamandis和其他人的书,关于他们在学习、哲学等方面的广泛观点,我还遇到了Ken Robinson和早期的间隔学习等想法。自由探索(见:自由学习)让我最终找到了SuperMemo.guru,并发现其学习效果如此之高,充满了惊叹和灵感。
我认为学习未来是终生学习中非常重要的一部分,事实上,"未来学"在学校教育中本来就是不相容的,它甚至不是一个定义明确的科目,但在自由学习中,没有科目问题(见:);未来学的书籍和思想总是鼓舞人心且激发学习内驱力的,你可以学习伟大人物的思想,找到很多你可能参与世界的方式;未来学的欠明确性也可能是一个优势,不同观点的矛盾让你思考,形成一个高度个性化的知识估值网络,最能在偏见或知识垄断中生存。有趣的是,你自己对未来学的定义可能都和我有所不同,人人都会这样。
利他主义确实根植于人类早期的进化,我们有与生俱来的对他人的爱和关怀,它可以被阻碍或加强,心系人类命运是一个伟大的方式。然而,学校处理知识的方式使我们对它的关心减少了,太可悲了! 顺便说一句,目前(我19岁),我认为学校教育是世界上最严重的问题之一,甚至严重程度可以比得上衰老给人类带来的疾苦。
[总结:学校通过削减他们为更美好的世界而奋斗的爱,世界滋生出更少的天才。]{.ul}*。
滋生伪理性悲观主义
"理性"是带引号的,或者叫伪理性。人类天生就有认知上的偏差。然而,偏见并不是一个严格的缺陷,(见:大脑保护现实模型),固执在人脑中根深蒂固,以使快速决策和有效的归纳。然而,学校不仅通过习得性无助(一种相当情绪化的东西)倾向于培养悲观主义的观点,而且以某种方式削弱学习内驱力。一个由校源性抑郁症患者可能在理性上意识到自己的观点,但就是无法改变(由于生物影响)。如果你读过卡尼曼的《思考:快与慢》,或噪音》(2015年后),你会知道人类通常通过启发式思考——快速思考(他称之为系统1),而不是统计性思考。一个很简单的例子是:在飞机事故发生后,人们倾向于减少飞行出游,他们认为事故的可能性很高,而实际发生率可能没有变化;几周后,由于对事故的记忆提取能力降低,他们又开始飞行出游。如果你对 "认知盈余 "感兴趣,你会注意到电视上的 "沙发土豆 "往往对谋杀和事故的发生率的预期远远高于平常。这就是学校的所作所为!看到学生们不开心的样子,高抑郁率、ADHD率(可能是过度诊断,见:)、Asperger率;即使是最理性的学生也倾向于高估世界上无所不在的这种比率,不仅是实际的受害者会这样想!"。电视沙发上的土豆看到的世界更糟糕,但行为空间对他们来说更大,但小学生却无法逃避!"。\**总结: 经过十年在这样一个虚假的世界中的培育,所有的学生都会过度估计现实世界中不愉快事件的发生率。]{.ul}**这种 "理性的"悲观主义甚至可能导致 "**世风日下的想法"。
“世风日下”的想法
学校是悲观主义的诱导者,内在通过习得性无助,在外部通过假环境的伪理性悲观主义。最终的影响就是“世风日下”的思想——它使许多学生认为社会、国家甚至整个地球都在倒退,而不是进化。世界是一个复杂自适应系统(类似于学习内驱力系统!),进化是默认的。由于摩尔定律或(见:加速回归定律),技术呈指数级增长。许多我们买不到甚至想不到的服务和东西,现在已经变成了最便宜的人的现实,根据雷的说法,基本收入即将到来(见:全民基本收入提高创造力)。不仅技术在增长,整体福利也在增长,1890年的平均预期寿命是40岁,2000年是76岁。疫苗接种和手术的发展速度令人难以置信。谋杀和自杀率实际上正在下降。如果你读过史蒂夫-平克的书,你会注意到现在的暴力有多大的减少。(事实上,所有残余的暴力和抑郁症主要是由学校教育和其衍生的结果造成的!)然而,许多人倾向于低估人类的未来,他们可能不相信奇点或指数增长,这是我们的大脑默认的,我们预估线性增长。但是,成功被学校驯化的人可能实际上认为世界正在变得更糟!这就是我们的大脑。经过多年的奴役,他们高估了世界上发生的不愉快事件的速度。他们可能会得出这样的结论:现代的增长促成了不愉快事件的增加,而不是学校!(见:缺乏教育同里心)[总结:学校倾向于培养悲观主义者,他们认为即使在21世纪,世界也会变得更糟。这种观点使他们不太享受自己的生活,他们甚至会扼杀世界的实际成长!见:下一部分]{.ul}。
反进化主义(卢德主义):不喜欢进化的思想。
学校抵消进化,不仅是通过干扰大脑(见:),而且还通过实际减缓世界的发展以及,通过培养反进化论者(或卢德分子,见:)。
学校往往使很大一部分人认为世界正在变坏(见:最后一部分),而不是归因于学校,他们可能认为现代技术促成了这一点——特别是在数学(几乎所有)和物理学等方面的毒性记忆的综合力量。他们中的很多人长期以来一直讨厌现代技术——他们甚至可能喜欢在夜里玩手机,而不是认为它是一个快乐的源泉,他们认为它是一种瘾!(而一个健康的非学校教育者可以本能地逃避可变奖励,见:)。
人们主要是低估了世界的增长(线性预测),但他们实际上是在指数增长的基础上创造了更好的世界;然而,由学校引起的卢德分子会对世界的发展造成很多限制,因为他们认为是“世风日下”!他他们不应该都受到惩罚,学校才是邪恶的!
[总结:如果不根除学校教育,世界的整体增长将慢一半!]{.ul}*。
对无聊的恐惧(第21宗罪)
该习惯是20个恶习中有的额外习惯,标题改为21个额外的恶习。
学校可能会导致徒劳的毅力(见:)和虚假的生产力;真正有创造力的人经常坐立不安,暂停片刻沉思或行走,等等。有时,无聊可以是一个伟大的灵感发生器。学校让我们不喜欢无聊,低估了它的价值,而对无聊的认知是大多数自由学习者的常识;然而,同样重要的是,学校不仅直接让我们不喜欢无聊,还间接地让我们恐惧无聊,通过诱导不愉快,如习得性无助等。
很多朋友(尤其是那些悲观的人,大多数是学校教育的受害者)往往有一种想法:他们总是愿意陷入匆忙,来避免悲观的自然思维。——一个朋友对我说,当她处于无聊的情况下,她总是想到她未来的生活会很糟糕;她的学校是一所职业学校,在价值体系上学校是被低估的。她说,即使是听音乐也会让她产生自然的恐惧感。太悲哀了! 学校造成的无助会使放松或激发灵感的时间成为地狱之源!
[总结:学校教育的受害者可能获得无助感,让他们害怕无聊,它可能在自然闲适的时间给被学校伤害的大脑痛苦的自然联想,而不是顿悟般的灵感。]{.ul}*。
达到前 5% 的水平其实并不怎么样
挤进前 5% 其实并不值得夸耀,因为这个门槛远没有想象中那么高。这可能是我最招人嘲笑的观点之一。乍一听,这种说法可能给人一种精英主义的印象。但事实上,我的观点恰恰相反:大多数人都有潜力在大多数领域达到(相对)优秀的水平。
需要澄清的是,这里所说的前 5% 指的是实际参与者的前 5%,而不是相对于所有人(事实上,对于许多活动来说,仅仅参与就已经让你超过了 99% 的人)。我也不是指在那些经常练习的人中的前 5%。这里有个「小窍门」:对于很多活动来说,如果你能在经常练习的人群中达到前 90% 的水平,就足以碾压 90% 甚至 99% 的普通参与者。
在这篇文章中,我会谈到一些具体的例子。因为我发现以往的相关论述总停留在理论层面,这使得这些讨论变成了一种类似罗夏墨迹测试的东西,每个人都能从中解读出自己想要的意思。举个例子,Scott Adams 有一篇广为人知的文章,声称成为通才优于成为专才,因为要成为「杰出人才」,你要么必须在一个领域做到「顶尖」,要么在两个领域都达到前 25% 的水平。若此言当真,确实当通才更划算。但显然,这种说法过于夸张了。实际上,即使不是「顶尖」的,在某个专业领域也能获得很大的价值。这种绝对化的论断本就站不住脚,加上整篇文章充斥着模棱两可的表述,这样的讨论往往会演变成人们重申自己原有的观点,而忽视了文章的实际内容。
就个人经验而言,在我参与过的所有能量化排名的活动中,即便是排名位于前 5% 的人也经常会犯一些显而易见、容易纠正的错误。虽然「现实世界」中的活动通常难以用百分位来准确衡量,但要达到类似段位,似乎同样不是难事。
为了深入探讨这一现象,我们首先会详细分析《守望先锋》(一款流行的多人在线射击游戏)。之所以选择这个例子,是因为我对它比较熟悉,而且它便于获取排名信息和观察玩家行为。随后,我们将探讨一些「现实世界」中的类似现象,尽管我们无法为这些实际例子提供具体的排名数据[1]。
《守望先锋》
在《守望先锋》中,即使是排名处于前 10% 或前 5% 的玩家,绝大多数人也会不断犯一些基本的、可能直接导致游戏失败的低级错误。这些错误很简单,例如在比赛计时器即将归零时,站在目标点旁边而不是目标点上,从而将可能的胜利变成必然的失败。如果你想了解更多具体的错误示例,以便自行判断什么可以被认定为「低级」错误,可以参考附加的脚注[2]。
可能解释这种现象的原因包括:
-
缺乏获胜的动机或渴望
-
能够识别自己的错误,但没有投入足够的时间来改正
-
个人天赋欠缺
-
不懂得如何发现并纠正自己的错误
在《守望先锋》中,你会经常看到(1)不关心胜负的低段位玩家,但到了前 70% 的段位,就能频繁看到玩家以各种方式表达对胜利的渴望。例如,他们会对那些被认为不在乎胜利或技术欠佳的队友怒声指责,或抱怨那些他们认为犯错导致团队失利的人。[3]除了偶尔出现的捣乱分子,我们有理由相信,那些因失败而勃然大怒的玩家通常是真心想赢的。
(2)没有投入足够时间纠正他们自己错误——这一点在某个阶段可能适用于所有正在进步的玩家。但如果你查看 50% 分位段位的中位数游戏时长,你会发现稳定保持在这个段位的玩家已经投入了数百小时(而更高段位的中位数游戏时长更长)。考虑到我们讨论的错误如此基础,对大多数玩家而言,缺乏时间显然不是问题所在。
在《守望先锋》论坛上,低段位玩家常常抱怨自己天赋不够,永远无法进步。诚然,大多数人可能无论如何练习都难以成为职业选手,但当你只需纠正像「不知道应该站在目标点上」这样的错误就能达到前 5% 的段位时,这显然与天赋无关。
虽然(4)玩家不懂得如何发现和纠正自己的错误并非唯一可能的解释[4],但我认为这是适用于大多数玩家的最合理解释。那些抱怨自己卡在某个段位(可能高达前 5% 甚至 1%)的玩家,似乎没有意识到他们其实可以通过观察自己的游戏表现,或请他人点评,来显著提升自己的水平。
《守望先锋》这款游戏有一个独特之处,就是相比大多数其他活动,它更容易让玩家发现自己的低级错误。当你在游戏中被击杀后,游戏会从击杀你的玩家视角回放你是如何死亡的,让你清楚地看到导致自己阵亡的原因。此外,《守望先锋》还会记录整场比赛,并允许你观看回放,帮助你分析胜负的原因。相比之下,在许多其他游戏中,你可能需要自己设置录制软件才能回看游戏过程。
浏览《守望先锋》的论坛,你经常会看到这样的帖子:「我实在太沮丧了!我已经玩了 1200 个小时,排名却还是只有前 90%,[此处是一些因人而异的具体游戏细节抱怨]」。几乎每次都会有人回复:「文字描述说不清,上传对战录像吧。」如果发帖者真的分享了自己的对战录像,其他玩家就会给出有建设性的反馈,只要认真采纳,就能立即提高水平。关注这些寻求帮助的玩家,你往往会发现他们不久后就能在更高的段位(如从前 90% 上升到前 60%)寻求进一步的建议。看到这些建议奏效固然令人欣慰,但令人遗憾的是,如此多的玩家没有意识到,观看自己的录像或发布录像寻求反馈,本可以为他们节省 1198 小时的沮丧时光。
有趣的是,即使是排名达到前 5% 及以上的《守望先锋》玩家,似乎也经常:
-
渴望提高
-
不寻求反馈
-
在本可以通过获取反馈快速进步的情况下缓慢提升
《守望先锋》提供了便于获取反馈的工具,然而,那些强烈表达想要进步愿望的玩家却没有充分利用这些工具。
现实生活
根据我的经验,其他游戏也存在类似现象。我认为这种现象在「现实生活」中也不罕见,尽管现实情况可能更为复杂。
现实生活中的活动往往面临一个棘手的问题:它们通常缺乏一个单一的、可量化的优化目标。另一个难点在于,相比游戏和体育运动,我们对于什么因素能使一个人在现实生活中的某项活动中表现出色,了解得还很不充分,即便是针对一个明确定义的具体目标也是如此。
相较而言,带有评分系统的游戏就容易进行优化:你可以将提高段位作为目标,而这通常可以通过提高胜率来实现。要提高胜率,你只需纠正一些常见错误,比如没有意识到应该占领目标点。对于任何特定的错误,你甚至可以合理估算它对胜率的影响,进而推算出对段位的影响。
然而,在现实生活中,如果你想成为「一名优秀的演讲者」,这个目标可能指向多重维度:你可能希望做内容丰富的演讲来帮助他人学习,或者做有趣的演讲让听众享受,又或者在知名会议上做主题演讲,还可能是希望获得每场 5 万美元的演讲邀约。这些都是不同的目标,需要采取不同的策略来实现。在这种情况下,某个具体的错误(比如在 20 分钟的演讲中花 8 分钟介绍自己)对你的目标究竟有何影响,就变得难以界定了。
此外,游戏,至少是主流游戏之所以容易优化,还有一个原因:它们通常有大量骨灰级玩家,他们会孜孜不倦地钻研最优解。这意味着,如果你想提高水平,除非你的目标是成为世界顶尖高手,否则你只需找出哪些资源对其他人有效,选择一个来学习,然后勤加练习即可。举个例子,如果你想在诸如桥牌或黑桃这样的叫牌游戏中达到前 1% 的水平(相对于所有玩家,而非「有大师分的美国合约桥牌联盟玩家」或「经常参加北美桥牌锦标赛的人」这样的特定群体),你可以通过以下步骤实现:
-
学习游戏的基本规则
-
实践应用所学知识
如果你想成为一名出色的演讲者,即使你对「出色的演讲者」有明确的定义,你也可能找不到一条清晰的进阶路径。这是因为即便是顶尖的演讲大师们,他们给出的建议也常常自相矛盾(例如,有人建议避免过分关注演讲技巧,而有人则强调要不断练习演讲技巧)。很少有人会执着地钻研并摸索出有效的方法,这就导致缺乏系统严密的提升课程。不过,这种情况也意味着你有机会迅速脱颖而出,因为真正努力提升自己的人凤毛麟角。
尽管存在上述种种限制,我仍然认为,相比于游戏或体育运动,在现实生活中的各种活动中变得相对优秀要容易得多,原因在于大多数人在现实生活中很少进行刻意练习。举个例子,假设你是本地的乒乓球高手,能在酒吧里横扫所有的业余选手。但当你挑战某人时,对方问道:「好啊,你的级别是多少?」这时你就知道自己恐怕要遭遇惨败了,对方很可能用鞋刷都能吊打你(顺便说一句,这种事确实发生在我一个朋友身上)。你可能已经超过了 99% 的人,但一个没有天赋却花时间苦练基本功的人,就能用专业发球让你无力回击,还能轻松应对你所有的进攻。然而,在大多数现实生活中的活动里,几乎没有人会投入相当于每周去乒乓球俱乐部练习两小时的刻意练习,更不用说像顶级职业选手那样每天苦练四小时了。
让我用两个具体例子来说明。2013 年至 2017 年期间,我协助 Leah 准备演讲。最初,她的练习演讲水平与大型科技会议上随机听到的演讲相差无几。在她演讲生涯的起步阶段,她为每次公开演讲都进行了约 30 次练习,其中我亲自观看并点评了一半。她的首次公开演讲(在我看来)已经远超大型知名科技会议的平均水平,此后她的演讲水平持续提升,直到 2017 年她结束了演讲生涯。
正如我们之前讨论的,这比游戏评分更加主观,也无法精确定位百分位数。但如果了解大多数人是如何准备演讲的,就不难理解为何 Leah 能够脱颖而出。在她首次参加的会议前夕,我们遇到另一位演讲者正为 40 分钟演讲发愁——他仅准备了 15 分钟内容,正绞尽脑汁填满剩余时间。这种临时抱佛脚的做法其实很普遍,而这样准备的演讲往往难以达到理想效果。
大多数人可能会认为,为一场演讲练习 30 次简直是走火入魔。但我赞同 Gary Bernhardt 的观点:如果你要在 300 人的观众面前做 30 分钟的演讲,这相当于 150 个人时的观看时间。因此,花 15 小时练习并非不合理(30 次练习实际可能不到 15 小时,因为你可以缩短部分练习时间或反复演练存在问题的片段)。值得一提的是,这种在演讲准备中被视为强迫症的练习量,与一个普通乒乓球俱乐部会员的日常训练相比,却显得微不足道。
教育学研究者或许会指摘,我给 Leah 的帮助相当蹩脚。研究表明,让外行人相互摸索改进方法是最低效的学习方式之一。相比之下,良好的指导更为有效,而一对一的专业辅导则效果最佳[5]。诚然,我的帮助确实相当蹩脚。然而,现实情况是,大多数人在演讲前最多只会练习几次,甚至有些人根本不会练习(这个结论来自我在参加会议时对演讲者的非正式调查,虽然缺乏确凿数据支持)。相比之下,Leah 的 30 次练习可以说是降维打击。尽管我们采用的方法并不理想,但这种持续的练习仍然带来了相当不错的效果。
我的写作经历也是一个很好的例子。虽然我不愿意与他人比较,但不得不说,在我开始写这个博客的头几年里,我的写作水平有了显著提升。这种进步仅仅源于我稍微花些精力去获取和采纳反馈。
Leah 几乎为我的每篇文章都审阅了一到两版草稿,并给出反馈。在最初的几篇文章中,由于我们两人都对写作知之甚少,我们常常难以准确指出问题所在。面对一些拙劣的文字或混乱的叙事结构,我们只能笼统地指出「这里看起来不对」,却无法具体描述问题或提出改进建议。这种感觉就像在没有拼写检查工具的年代,你知道自己拼错了一个词,但无论怎么改都感觉不对劲。
为了解决这个问题,我聘请了一位我非常钦佩其写作水平的专业编辑。我对他说:「我不需要你修正拼写和语法,我的写作存在一些我自己都无法察觉的根本问题,请向我解释这些问题具体是什么。」[6]我认为这种方法比我帮助 Leah 准备演讲更加有效,因为我们引入了一位堪比专业教练的人。举个例子,我们的编辑帮助我们建立了一套用于讨论文章结构问题的专业词汇,这就像《设计模式》为人们提供了讨论面向对象设计的专业术语一样,让我们能够更好地交流和改进。
回归本博客的日经主题:编程
编程与上述现实生活的例子有异曲同工之妙。尽管我们无法为编程技能赋予具体的排位或计算出精确的百分位数,但通过获取他人对你工作的反馈,你仍然可以在不付出过多努力的情况下,相对于过去的自己取得显著进步。
我发现了一个极其有用的练习方法:观看自己的编程过程。在整个工作周,我会让一个程序在后台运行,记录我的屏幕活动。到了周末,我会回顾上周的几个片段,尤其是那些感觉耗时过长的任务。在观看这些录像时,我会仔细分析时间的具体去向,思考如何改进。当我第一次尝试这种方法时,真的对自己的时间分配感到大为惊讶。
举个例子,我之前的编程习惯是这样的:先把一个新功能的所有代码都写出来,然后再整体进行测试。这种测试方式下,一旦发现 bug,我就得先确定是哪个函数出了问题,然后再去调试那个特定的函数。然而,通过观看自己的编程录像,我惊讶地发现,在实现新功能的总时间中,竟有约四分之一都花在了定位 bug 所在的函数上!如果不是亲眼所见,我根本不会意识到这一点。有了这个认识后,我改变了策略:现在我会在编写每个函数后立即测试其功能。这种方法大大缩短了调试时间,让我的编程效率得到了显著提升。
我曾花时间分析自己编程时的时间分配,结果发现了与玩《守望先锋》时类似的情况。不同的是,在编程中我不是不断犯致命错误,而是反复做一些毫无意义、浪费时间的事情。仅仅通过改掉一些坏习惯,我的工作效率就提高了至少一倍。这种提升很容易衡量,因为纠正这些习惯本质上就是在挽回被浪费的时间。举个例子,我发现当需要等待两分钟时,如果在网上随意浏览,往往会分心很长时间。于是我开始维护一个高价值任务的队列,用来填补这些空闲时间。(当然,如果我正在处理对延迟极其敏感的工作,不想切换任务,我就什么也不做,直到等待结束。)
这里有一点值得注意:重要的是要切实跟踪你的行为,而不是仅仅依靠主观猜测。当我记录人们的实际行为并与他们的主观认知对比时,经常会发现两者存在显著差异。我们通常认为在没有指标或跟踪的情况下操作复杂的软件系统是不可思议的,但却习以为常地在没有指标或跟踪的情况下管理自己,尽管我们比我们所使用的软件更加复杂且难以理解。
Jonathan Tang 曾指出,选择正确的问题对执行速度有决定性影响。我并不反对这一观点,但是将执行速度翻倍仍然是一个可观的收益,这与选择正确的问题是独立的。我认为,如何选择正确的问题这个话题很难在抽象层面上有效讨论,而提供具体例子又需要大量背景信息,可能比本文中已经很长的《守望先锋》的例子还要冗长。也许我会另写一篇文章专门探讨这个问题。
说实话,写这样一篇文章对我来说有些不同寻常。我认为,从文化层面来看,美国人,特别是在我最近居住的纽约和旧金山这样的地方,对生产力的关注可能有些过度了。然而,从个人角度来说,提高工作或家务效率的目的,并不一定是为了塞进更多的工作或家务,而是可以换取更多的休假时间,或者更多时间去做自己认为有价值的事情。
对于《守望先锋》这类游戏,我并不认为提高技术水平是一种道德义务。无论你的水平处于前 50%、90%,还是任何其他段位,只要玩得开心就行。但是,在我玩过的所有有评分或联赛/锦标赛系统的游戏中,我发现很多人一旦输了比赛就会变得非常沮丧和不快,即便他们并没有在提高技术上下太多功夫。既然如此,为什么不稍微努力提高一下,减少一些沮丧的时间呢?
一些提高技能的元方法
-
获取反馈并加以练习
- 最理想的情况是有专业教练指导,但如果没有,来自外行的反馈也可以,甚至可以自己给自己反馈(前提是你有办法记录或追踪自己的表现)
-
进行有指导的练习或有解答的练习
-
这在「传统」游戏的书籍中很常见,比如国际象棋或桥牌。
-
对于特定领域,你通常能找到一系列这样的书籍,例如,在数学领域,Springer 本科数学系列(SUMS)的书籍通常会提供带解答的习题
-
当然,这些想法并不新颖。例如,Kotov 在 70 年代出版的系列书籍《像大师一样思考》、《像大师一样下棋》和《像大师一样训练》就已经涵盖了这些观点,因为这些都是提高技能最显而易见的方法。
附录:其他最容易遭到嘲笑的想法
以下是我曾经发表过的,在当时受到最广泛嘲笑的想法:
-
在热门科技公司,程序员年薪 35 万美元或更高并非罕见(2015 年文章中提到的数字是 25 万美元/年)
-
单库(Monorepo)可能是合理的选择(2015 年)
-
我们应该预料到会出现更多 CPU 漏洞(2016 年)
-
市场机制并不能消除歧视(2014 年)
-
就某些方面而言,计算机正变得越来越慢(2017 年)
-
几乎没有实证证据支持类型系统的优势(2014 年)
-
撰写避免使用领域专业术语的技术文章是合理的做法
我关于薪酬的文章有一个独特之处:它们经常同时被指责为「显而易见到毫无意义」和「错得离谱」。我猜这些文章可能对人们产生了最大的影响——有十多个人告诉我,我的某篇薪酬文章改变了他们的人生,现在他们的年薪比以前多了几十万美元,因为他们意识到获得高薪工作是可能的。而我怀疑,我听到的反馈可能还不到因此而做出重大改变的人的十分之一。
2015 年我写第一篇薪酬文章时,更多的嘲笑来自于人们认为我写的是明显错误的内容,而不是因为内容过于显而易见。但在过去几年里,情况发生了逆转。当 Twitter 上某些圈子或 Hacker News/Reddit 社区之外的网络论坛偶然发现我的文章时,我仍偶尔会因为错误而受到一些嘲笑,但「明显错误」与「显而易见」的比例可能已经从 20:1 变成了 1:5。
自 2015 年以来,业界对单库(monorepo)的看法也经历了类似的转变。除了少数大公司的从业者外,紧跟技术潮流的人曾普遍认为单库是一个愚蠢的选择,但这种观点已经发生了显著变化。虽然这种转变不及对薪酬看法的变化那么剧烈,但也足以让我在遇到坚决反对单库的人时感到些许意外。
尽管人们对 CPU 漏洞的看法改变得相对缓慢,但在上述提到的话题中,这可能是现在受到质疑最少的一个。
关于市场无法消除所有歧视这一观点,则是人们态度改变最小的。那些坚持「所有市场都是高效的」论调的人,似乎并未被 Becker 的《歧视经济学》等学术著作或文章中列举的证据所说服。
在我撰写的文章中,关于计算机延迟增加和类型系统益处缺乏实证依据的两篇,是我最常看到被用来为某些争议观点辩护的。起初我并不确定这两项研究的结果,但它们恰好都得出了与普遍观点相反的结论(有充分证据表明,先进的类型系统确实能在实践中提高安全性,而计算机的性能也毫无疑问在各方面都有所提升,那些认为计算机变慢的人可能只是在怀旧)。我不确定这些发现是否改变了许多人的看法。然而,尽管这两篇文章直接表述了一些常见的被嘲笑的观点,但我并未因此受到太多直接的批评。我猜想,这可能是因为这两篇文章都基于实证研究,因此并没有太多可争议的地方(虽然关于歧视的文章也是基于实证研究,但它仍然招致了相当多的质疑)。
清单中的最后一个观点更具有元层面的意义:没有人直接告诉我应该使用更晦涩的术语。相反,我经常收到这样的评论:由于我没有使用专业术语,所以我对某个领域肯定了解不多。使用专业术语是一种常见的建立可信度或权威性的方式,但我并不认同这种做法。仅仅依靠权威性进行论证实际上并不能传达任何有价值的信息;而添加不必要的术语只会让那些对主题感兴趣但不想深入该领域的读者更加困惑。
这是我与许多人之间的一个根本分歧。举个例子,我最近与一位自称权威的人士进行了讨论。当我表示不同意见并建议我们各自保留观点时,他坚持认为我不可能合理地与他持不同意见,因为他是该领域的权威而我不是。事实上,我曾参与过一个与我们讨论主题非常相似的系统的形式验证工作,但我并未提及这一点,因为我不认为自己在该领域的权威地位有任何意义。如果一个人的论点如此薄弱,以至于必须依赖所谓的绝对权威,这通常意味着他们无法为自己的观点提供合理的论证。当他们把自己视为绝对权威时,这种情况就更加明显了。
我脑海中还有大约 20 个听起来可能有些荒谬的想法等待成文,但我通常会尽量避免写那些容易引起争议的内容,所以我不确定最终会写出多少篇。如果我每月写一篇文章(这频率比我最近的实际写作频率要高得多),并将涉及这些可能被嘲笑的想法的文章比例限制在 10%,那么写完我目前所有这些想法将需要 16 年的时间。
附录:有关提高的讨论
-
Skyline:达到前 1% 的水平其实并不怎么样
-
James Clear:达到前 10% 的水平其实并不怎么样
-
Josh Infiesto:达到前 20% 的水平其实并不怎么样
-
Atul Gawande:指导和反馈非常强大但被低估
在此感谢 Leah Hanson、Hillel Wayne、Robert Schuessler、Michael Malis、Kevin Burke、Jeremie Jost、Pierre-Yves Baccou、Veit Heller、Jeff Fowler、Malte Skarupe、David Turner、Akiva Leffert、Lifan Zeng、John Hergenroder、Wesley Aptekar-Cassels、Chris Lample、Julia Evans、Anja Boskovic、Vaibhav Sagar、Sean Talts、Emil Sit、Ben Kuhn、Valentin Hartmann、Sean Barrett、Kevin Shannon、Enzo Ferey、Andrew McCollum、Yuri Vishnevsky 以及一位匿名评论者提供的宝贵评论、纠正和讨论。
[1] 我选择《守望先锋》作为例子,是因为在我熟悉的活动中,它满足以下条件:
-
我对这个游戏有足够的了解,能够对其进行评论
-
我观察过很多人学习这个游戏,因此我能判断纠正某些错误或某类错误是否「容易」
-
有足够多的排位玩家可以支持我的论点
-
许多读者也会熟悉这个游戏
尽管我的游戏经验 99% 来自 90 年代的电子游戏,但我不会用它们作为例子,因为相对较少的读者会熟悉那些游戏。我也可以使用「现代」桌游,比如 Puerto Rico、Dominion、Terra Mystica、ASL 等,但参与排位游戏的人数很少,这会削弱论点的说服力(也许参与排位游戏的人比不参与的人水平差得多——这种情况不太可能,但如果不比较排位和非排位游戏之间的游戏水平,就很难证明,而这对于本文来说过于深入细节了)。
尽管有许多活动比《守望先锋》更适合用作例子,但由于我对它们不够了解,无法拿来举例。例如,Kevin Burke 在审阅本文草稿时提到,他在执教青少年篮球时也观察到了类似现象。此外,多位读者表示他们在象棋中也有相似的发现。然而,我对青少年篮球和象棋都不够熟悉,难以对这两项活动做出准确描述,尽管它们可能是更好的例子——毕竟相比《守望先锋》,可能更多读者熟悉篮球或象棋。
[2] 我刚开始玩《守望先锋》时(也就是进行那次实验的时候),最终的段位略高于 50% 分位(对《守望先锋》玩家来说,这相当于白金段位——本文将使用百分位而非段位,以免让不玩《守望先锋》的读者需要学习理解段位含义)。普遍认为,而且可能确实如此,玩《守望先锋》主要排位模式的玩家平均水平要高于只玩非排位模式的玩家。因此,我的实际水平可能比 50% 分位略高,而本文提到的所有「真实」百分位都可能高于表面百分位。
在略高于 50% 分位的水平,你会经常看到以下情况:
-
辅助(奶妈)会无脑地给满血队友治疗(毫无作用),却对身旁濒死的队友视而不见,最终导致队友阵亡。
-
敌人悄悄潜入后方,逐个击杀队友,玩家却浑然不觉,直到全队覆没。
-
玩家会将敌人打到只剩一丝血,然后突然转移目标,给了对手喘息之机,等敌人满血后再重新开火。
-
阵亡后,玩家不会等待队伍重生,而是孤身冲向敌阵,以一敌六。这种行为会贯穿整场比赛(游戏本应是 6 对 6,但在前 5% 以下的段位,一旦有人阵亡,很难再看到完整的 6 对 6 团战)。
-
玩家对角色技能一无所知,甚至连自己操作的角色技能都不了解。
-
玩家倾向于高风险低回报的打法(例如,在双点防守开局时,莱因哈特冲锋送人头的行为在前 50% 的段位很常见,但在前 5% 的段位很罕见,因为这种决策通常反映了玩家整体判断力的欠缺)。
-
玩家瞄准技术糟糕,明明只需命中一发就能击杀敌人,却连续射失四五枪。
-
当一名敌人从侧翼偷袭时,如果队伍中有一名无法逃脱的奶妈和一名拥有逃生技能的其他角色,后者往往会独自逃命,抛下奶妈送死。殊不知如果他们携手反击,在接受治疗的同时进行攻击,就能轻松击退敌人并保护奶妈。
在竞技游戏中,只要你的某一项技能不是特别糟糕,就足以让你的水平超过一半的玩家。对我来说,这个还过得去的技能是团队合作,而对其他人来说,可能是游戏的其他方面。我之所以说我的团队合作很糟糕而不是好或者一般,是因为我根本不懂得如何玩这个游戏,不了解任何角色的优缺点和技能,所以根本无法与队友有效配合。我甚至不清楚游戏模式的具体运作机制(比如在什么情况下游戏会以平局结束或进入下一轮),所以基本上就是漫无目的地游荡,尽量跟着最大的队友群移动。就这样,我的水平就已经超过了平均线。
你可能会说,既然高于平均水平,那这个人在游戏中应该算不错了。但从绝对标准来看,仅仅略高于平均水平其实相当糟糕——假设一个玩家在两个队友通过语音大喊「[敌人]在我们身后!」的时候,都没注意到整个团队被人从背后歼灭了,很难说这种水平不糟糕吧。
随着游戏时间的增加,我使用熟悉的角色时,最终达到了大约前 10% 的「真实」排名。由于排名和匹配系统的波动性,我甚至参与过排名前 2% 的对局。然而,我的瞄准和闪避能力仍然糟糕。相对于我目前的排名,我的瞄准其实比在前 50% 水平时更差,因为对手强了很多,而我只是稍有进步。在前 10% 的水平上,我的两个分身可能在开阔地带的 2 对 1 交战中都打不过大多数对手。即使我躲在掩体后只露出 10% 的身体,而对手在开阔地带,我通常也会输掉交火,所以我的瞄准能力可以说比这个段位的平均水平差了 10 倍还多。
尽管我的瞄准技术只有常人的十分之一,但我能跻身前 10% 玩家行列的「秘诀」是:深入理解游戏机制,并采取最大化胜率的策略(尽我所能)。这与将游戏视为纯粹的死亡竞赛、一味追求快速击杀的打法形成鲜明对比。要详细解释这一理念在高水平(前 10%)对局中的具体应用需要更多背景信息,所以我只举几个典型例子。这些例子能代表绝大多数前 10% 玩家经常犯的错误(当然,除了少数像我这样瞄准严重欠佳的玩家,我们通过在其他方面的出色表现来弥补这一短板)。
在游戏中,最终目标始终是取得胜利。尽管游戏模式多样,但在主要的排位赛中,都会涉及需要玩家占领或接近的特定目标点。一个常见的关键场景是:当回合即将结束时,如果你的队伍无人触碰目标点,必定会输掉比赛。然而,只要有人能触碰目标点并存活片刻(这会触发加时赛,直到双方都离开目标点后不久结束),你的队伍就有可能逆转取胜。举个具体例子:敌方有四名玩家在目标点,而你方只有两名玩家在附近——一个坦克和一个辅助/奶妈。你方的其他四名队友已经阵亡,正从重生点赶来。此时,如果你能触碰目标点并多坚持一会儿,他们就能及时赶到,很可能夺取目标点并赢得比赛。但如果你触碰后立即阵亡,他们就来不及了,最终导致失败。
假设你是一名表现在前 10% 到前 5% 水平的辅助/奶妈,游戏通常会这样结束:坦克会向目标点推进,受到攻击后,为了避免受伤就会后撤。作为辅助,你的生命值很低,一旦接近目标点就会被敌队立即击杀。但如果不去占领目标点,你们必定会输,所以你不得不冒险前进,以争取一线胜机。在你阵亡后,坦克要么会冲上目标点送死,要么在时间耗尽前都无法抵达目标点。无论哪种情况,你们很可能都会输掉比赛。
如果坦克在你阵亡前尽到了自己的职责,冲到了目标点,你就能持续治疗坦克,直到队友们赶来支援,你们就很有可能获胜。理论上,如果敌队配合得当,他们可以绕过或穿透坦克的防线来击杀你,但他们不会这么做——任何懂得这个制胜策略并且枪法够准的人,必然会晋升到更高的段位。而在你队伍中,如果有个坦克明白在这种情况下应该为辅助承担伤害,而不是反过来,他们也不会在前 5% 的段位停留太久,因为他们会赢得更多比赛,很快就会晋级到更高的段位。
即使是排名前 10%-5% 的玩家,也常常误判一个基本情况:当你处于进攻方时,应该等待队友重生以便组织团队进攻。然而,即使在排名前 10% 的玩家中,仍有四分之一到三分之一的玩家会忽视这一点,独自面对整个敌方团队。这虽然比低水平比赛中常见的一对六、二对六的情况要好,但仍然远非理想。更常见的错误是,有些玩家虽然意识到不该独自冲锋,却认为可以在等待队友的同时对敌人进行远程骚扰。这种做法看似无害,实则风险极高。特别是在面对多个能够瞬间击杀的狙击手时,或者使用需要多次攻击才能击杀敌人的非狙击类英雄时,这种行为很可能导致自己阵亡而毫无收获。在《守望先锋》中,这种行为甚至可能葬送团队的战略优势,将本应对己方有利的局面(己方有大招,敌方已用掉)变成了平衡局面(双方都有大招)——这还是最好的情况,最坏的情况是立即输掉团战。
有趣的是,在《守望先锋》的论坛上,无论是 Reddit 还是暴雪官方论坛,经常可以看到这样的抱怨:「为什么我的队友这么菜?我已经在前 [5%-10% 的段位]了,但我的队友还在不停地做一些明显愚蠢的、会输掉比赛的事情,比如[上面提到的那些]。」然而,事实是,提出这种抱怨的玩家自己也在不断犯类似的错误。因为任何能够避免这些重大失误的玩家,都会因为过高的胜率而很快超越前 5% 的段位。这也适用于我。
有人会争辩说,能达到这个段位的玩家应该很厉害,毕竟他们已经超过了 95% 的其他玩家,相对而言算是很强了。但客观来看,如果一个玩家连「应该去抢占目标点才可能赢,而不是完全不碰目标点必定输」这么基本的道理都不懂,很难说他真的厉害。《守望先锋》最基本的特点之一就是它是一个目标导向的游戏,但在前 5% 到前 10% 段位的大多数玩家却并不遵循这一点。
对于任何还没有达到前 1% 顶尖水平的玩家来说,复盘录像时总能发现许多导致失利的错误。就我个人而言,通常排在前 10% 左右的段位,回看一场势均力敌的比赛录像时,能发现数十个可能导致失败的错误(这种情况大约占输掉的比赛的 30%,另外 70% 是一边倒的惨败,不是某个简单的失误就能决定胜负的)。
纠正这些错误通常并不难,因为它们就像上面举的例子那样:一旦意识到自己在犯错,改正起来就很简单直接,毕竟错误本身就很明显。
[3] 可能有些人就是想找借口发泄对队友的不满。由于在主要的排位模式中很少遇到相同的玩家,这种情况不太容易被发现,但我认为在《守望先锋》偶尔开放的迷你排位模式中,你有时能观察到这种现象。
迷你排位模式的玩家基数比主要排位模式小得多,这带来两个明显的副作用:技能水平差异很大的玩家会被分到同一场比赛中,而且如果你多玩几局,就会反复遇到相同的玩家。
因为你会反复和同样的玩家匹配,你就会看到有些玩家一次又一次地犯同样的错误,以同样的方式导致自己输掉比赛,然后一场接一场地以同样的方式发脾气,责怪队友。
在常规排位游戏模式中,你同样会遇到玩家发脾气和责怪队友的情况。但由于通常不会频繁遇到相同的玩家,你很难判断这种行为是偶然发生,还是某人只是在经历糟糕的一天。除非你的排名极高或极低,那里玩家池较小,相近水平的玩家更容易重复遇到。然而,如果你在几周内的 15-20 场游戏中反复遇到同一批玩家,并看到他们因相同原因输掉十多场游戏,每次都伴随着完全一致的发脾气行为,你可能会开始怀疑:这些人中的一部分是否真的在寻求愤怒,他们从游戏中获得的主要是一个发泄怒火的出口。你可能也会从某些人使用社交媒体的方式中产生类似的疑问,不过那是另一个话题了。
[4] 举例来说,确实会有一些玩家因某种残疾而难以提高水平。但在我们讨论的水平范围内(前 1% 以外),这种情况相对罕见(肯定远低于 50%,我认为估计低于 10% 的游戏玩家群体也不为过)。如果我没记错,在游戏排名前 500 的玩家中,至少有一位是失聪的(这是极其不利的,因为声音提示能提供大量无法通过其他方式获得的精确位置信息)。还有至少一位法律意义上的盲人玩家达到了前 1% 的水平,以及多位因身体障碍而无法精确控制鼠标的玩家——也就是说,基本上无法瞄准的玩家——同样达到了前 1% 的水平。
人们无法进步的原因还有很多。例如,Kevin Burke 在指导青少年篮球时发现,有些孩子不愿意做那些可能会让自己看起来很傻的训练项目(比如,即便在所有人都因使用非惯用手而运球笨拙的训练中,他们也会避免学习用非惯用手运球)。我曾在一个攀岩馆里花了大量时间,那里有一位世界级教练,他经常培养出参加全国比赛的孩子,有些甚至能参加世界比赛。在他的课程中,我观察到了类似的情况——即使是那些在全国或国际赛场上具有竞争力的孩子,有时也会因为担心在同伴面前出丑而回避某些训练。面对这种情况,教练的应对之策是故意让孩子表现得极其滑稽,并告诉他们:「现在看起来傻比在全国比赛上出丑要好得多。」
[5] 需要注意的是,这里所说的「熟练教练」指的是擅长指导的人,而不一定是在该项活动中技艺高超的人。那些在某项活动中技艺精湛,但没有接受过专门的教学培训或缺乏大量教学经验的人,通常不是好教练。
[6] 如果你阅读我任何一篇文章的致谢部分,你会发现我在大多数文章中都得到了不止两个人的反馈(我真的非常感谢这些反馈)。不过我认为,从数量上来说,我收到的 90% 以上的反馈都来自 Leah 和一位专业编辑。
一位数学家的哀歌
作者:Paul Lockhart
原文:https://www.maa.org/external_archive/devlin/LockhartsLament.pdf
一位音乐家从一场可怕的噩梦中醒来。在他的梦中,他发现自己身处一个音乐教育被强制推行的社会。 「我们正在帮助我们的学生在一个日益充满声音的世界中变得更有竞争力。」教育工作者、学校系统和国家负责这个至关重要的项目。研究被委托,委员会被组建,决策被做出——所有这些都没有任何一位在职的音乐家或作曲家的意见征求和参与。
由于音乐家们习惯以乐谱的形式记录他们的想法,这些奇特的黑点和线条就构成了「音乐的语言」。如果学生想要达到任何程度的音乐能力,就必须精通这种语言;的确,如果一个孩子没有对音乐符号和理论有深入的了解,就期望他唱一首歌或弹一种乐器,那是荒谬的。演奏和聆听音乐,更不用说创作一首原创作品,都被认为是非常高级的话题,通常要等到大学,甚至更多的是研究生阶段才能涉及。
至于中小学,他们的任务是培养学生使用这种语言——按照一套固定的规则来摆弄符号:「音乐课就是我们拿出五线谱纸,老师在黑板上写一些音符,我们抄写或者把它们变成另一个调式。我们必须确保正确写出谱号和调号,而且老师非常挑剔,要求我们把四分音符填满。有一次我们做了一道半音阶的题,我做对了,但是老师却没有给分,因为我把音符的杆画反了。」
稍微聪明的教育者很快意识到,即使是非常小的孩子也可以接受这种音乐教学。事实上,如果一个三年级的孩子还没有完全记住五度圈,那是相当可耻的。「我得给我儿子找个音乐课外辅导老师教。他根本不会用心做他的音乐家庭作业。他说这很无聊。他就坐在那里望着窗外,哼着曲调,编着傻歌。」
在高年级,压力真的很大。毕竟,学生们必须为标准化考试和大学入学考试做好准备。学生们必须学习音阶和调式(Scales and Modes)、节拍(Meter)、和声(Harmony)和对位法(Counterpoint)等课程。「他们要学的东西很多,但是等到大学的时候,当他们终于听到所有这些东西的时候,他们会真正感激他们在高中所做的努力。」当然,没有多少学生真的会专注于音乐,所以只有少数人会听到那些黑点代表的声音。尽管如此,每个社会成员都能够识别一个转调(modulation)或一个赋格段(fugal passage)是很重要的,不管他们是否有机会听到一个。「说实话,大多数学生对音乐都不太擅长。他们在课堂上感到无聊,他们的技能很差,他们的作业字迹几乎无法辨认。他们中的大多数人对音乐在今天的世界有多重要毫不关心;他们只想选最少的音乐课程,然后就完事了。我想有些人就是擅长音乐的那种人,有些人就不是。不过我有一个学生,哇,她真是太棒了!她的乐谱无可挑剔——每个音符都在正确的位置上,完美的书法、升降号(sharps and flats),真是太漂亮了。她将来一定会成为一个了不起的音乐家。」
惊醒后,音乐家惊出一身冷汗,他感激地意识到,一切只是一个疯狂的梦。他安慰自己说:「当然了!没有哪个社会会把这样一种美丽而有意义的艺术形式降低到如此无脑(mindless)和琐碎(trivial)的程度;没有哪种文化会对自己的孩子如此残忍,剥夺他们这样一种自然而令人满意的人类表达方式。多么荒谬啊!」
与此同时,在城市的另一端,一个画家刚从一个类似的噩梦中醒来…
我很惊讶地发现自己在一个普通的学校教室里——没有画架,没有颜料管。「哦,我们实际上直到高中才开始涂画,」学生们告诉我。「在七年级,我们主要学习颜色和涂画工具(applicator)。」他们给我看了一张作业纸。一边是一些色块,旁边有空白的地方。他们被要求写出颜色的名字。「我喜欢画画,」其中一个说,「他们告诉我该怎么做,我就照做。很简单!」
下课后,我和老师聊了聊。「那么,你的学生们其实没有画过画吗?」我问。「嗯,明年他们就要学习『预备按数字填色』(Pre-Paint-by-Numbers)了。这为他们在高中学习主要的『按数字填色』(Paint-by-Numbers)课程做好准备。这样他们就能把在这里学到的东西运用到实际的绘画情境中——把画笔蘸进颜料,擦干净,诸如此类的事情。当然,我们也根据学生的能力进行分组。那些非常优秀的填色者——那些对颜色和画笔了如指掌的人——他们能更早地开始真正的绘画,有些人甚至能参加高级课程,获得大学学分。但我们主要还是想给这些孩子一个关于填色的良好基础,这样当他们走出去,在现实世界里给自己的厨房刷漆时,就不会弄得一团糟。」
「嗯,你提到的这些高中课程……」
「你是说『按数字填色』吗?我们最近看到报名人数大幅增加。我觉得主要是来自于父母想要确保他们的孩子能进入一所好的大学。在高中成绩单上,没有什么比『高级按数字填色』(Advanced Paint-by-Numbers)更好看的了。」
「为什么大学会在意你能否按照对应的颜色填充编号的区域?」
「哦,嗯,你知道的,这显示了清晰的逻辑思维。而且,当然,如果一个学生打算主修视觉科学,比如时尚或室内装饰,那么在高中就完成你的填色要求是一个非常好的主意。」
「我明白了。那么,学生们什么时候能够在一张空白的画布上自由地绘画呢?」
「你听起来像我以前的一个教授!他们总是不停地说要表达自己和自己的感受,还有那些类似的东西——真是非常超前的抽象的东西。我自己也有一个绘画学位,但我从来没怎么用过用过空白的画布。我只是用学校提供的『按数字填色」的套装。」
可悲的是,我们现在的数学教育体系正是这种噩梦。事实上,如果我要为了专门破坏孩子的自然好奇心和对模式创造(pattern-making)的热爱而设计一种机制,我也不可能做得像现在这样好——我根本没有那种想象力,能够想出那些毫无意义、摧毁灵魂的想法,而这些想法正是当代数学教育的组成部分。
人人都知道有些事情不对劲。政治家们说,「我们需要更高的标准。」学校们说,「我们需要更多的钱和设备。」教育家们说一套,老师们说另一套。他们都是错的。唯一了解真相的人是那些最常被指责和最少被倾听的人:学生们。他们说,「数学课很蠢很无聊,」他们是对的。
数学与文化
要理解的第一件事是,数学是一门艺术。数学和其他艺术,比如音乐和绘画,的区别只是在于,我们的文化没有把它当作一门艺术。人人都明白,诗人,画家,和音乐家创造了艺术作品,并且用文字、图像、和声音来表达自己。事实上,我们的社会对于创造性的表达相当宽容;建筑师,厨师,甚至电视导演都被认为是从事艺术的人。那么,为什么不把数学家也算作艺术家呢?
问题的一部分是,没有人对数学家到底做什么有一丝一毫的概念。普遍的看法似乎是,数学家与科学有某种联系——也许他们帮助科学家们处理公式,或者出于某种原因把大数字输入电脑。毫无疑问,如果世界要被划分为「诗意的梦想家」和「理性的思考者」,大多数人会把数学家放在后者的范畴。
然而,事实是,没有什么比数学更富有梦幻和诗意,更具有激进,颠覆,和迷幻的特质。它和宇宙学或物理学一样令人震惊(数学家在天文学家真正发现黑洞之前就已经设想出了它们),并且比诗歌,艺术,或音乐(它们很大程度上依赖于物理宇宙的性质)更能够自由地表达。数学是最纯粹的艺术,也是最被误解的艺术。
那么,让我试着解释一下数学是什么,数学家做什么。我想没有比从哈代(G.H. Hardy)的精彩描述开始更好的方法了:
一个数学家,就像一个画家或诗人,是一个创造模式(pattern)的人。如果他的模式比他们的更持久,那是因为他们是用思想制造的。
所以数学家们坐在那里,创造着各种各样的想法的模式。什么样的模式?什么样的思想?关于犀牛的想法?不,那些我们留给生物学家。关于语言和文化的想法?不,通常不是。这些东西对于大多数数学家的品味来说都太复杂了。如果数学中有类似于统一的美学原则的东西,那就是:简单就是美。数学家们喜欢思考最简单的东西,而最简单的东西是被想象出来的。
例如,如果我有想象形状的兴致——而我经常是这样——我可能会想象一个三角形在一个长方形盒子里:
我想知道三角形占了盒子的多少?可能是三分之二吗?重要的是要明白,我说的不是画在这个盒子里的这个三角形。也不是说一些构成桥梁大梁系统的金属三角形。这里没有别的实际目的。我只是在玩。这就是数学——想象,玩耍,用你的想象力自娱自乐。首先,关于三角形占了盒子多少的问题,对于真实的物理对象来说,根本没有意义。即使是最精心制作的物理三角形,也仍然是一个由颤动的原子组成的难以搞懂地复杂的集合;它的大小每时每刻都在变化。除非你想讨论某种近似的测量。嗯,这就是美学的作用。那种问题不简单,因此它是一个丑陋的问题,它取决于各种各样的现实世界的细节。那种问题还是留给科学家吧。数学问题是关于一个想象中的三角形在一个想象中的盒子里。边是完美的,因为我想让它们这样——这是我喜欢思考的那种对象。这是数学的一个主要主题:事物是你想让它们所是的样子。你有无尽的选择;没有现实的阻碍。
另一方面,一旦你做出了你的选择(比如我可能选择让我的三角形对称,或者不对称),那么你的新创造就会按照它们的方式运作,不管你喜不喜欢。这就是创造想象中的模式的神奇之处:它们会回应你!三角形占据了它的盒子的一定部分,而我不控制这个部分的大小。有一个数字存在,也许是三分之二,也许不是,但我说的不算。我必须去发现它是什么。
所以我们可以随心所欲地玩耍和想象,创造模式并对它们提出问题。但我们如何回答这些问题呢?这根本不像科学。没有任何实验,无论是用试管、仪器还是其他东西,能告诉我关于我想象中的事物的真相。了解我们想象世界中的真相的唯一方法就是使用我们的想象力,而这是一项艰巨的工作。
就盒子里的三角形而言,我确实看到了一些简单而美丽的东西:
如果我像这样把矩形切成两块,我可以看到每一块都被三角形的边作为对角线切成了两半。所以三角形内部的空间和外部的空间一样多。这意味着三角形一定占据盒子的正好一半!
这就是数学的样子和感觉。那个小故事是数学家艺术的一个例子:对我们想象中的创造提出简单而优雅的问题,并构造令人满意的优美解释。没有什么能像这个纯粹的思想领域一样独一无二;它令人着迷,有趣,而且自由!
我这个想法是从哪里来的呢?我怎么知道要画那条线呢?画家怎么知道要把他的画笔放在哪里呢?灵感、经验、试错、运气。这就是它的艺术,创造出这些美丽的思想小诗,这些纯粹理性的十四行诗。这种艺术形式奇妙地富有变换力。三角形和矩形之间的关系是一个谜,然后那条小小的线就让它显而易见。我看不见,然后突然间我就能看见了。不知怎么的,我能够从无中创造出一种深刻的简单美,并在此过程中改变了自己。这不就是艺术的意义吗?
这就是为什么看到学校里对数学的所作所为是如此令人心碎。这种丰富而迷人的想象力之旅被简化为一套需要记忆和遵循的「事实」和程序。取代了关于形状的简单而自然的问题,以及创造和发现的有趣和有益的过程,学生们却要面对这样的东西:
三角形面积公式:
A = 1/2 b h
「三角形的面积等于它的底边长乘以高的一半。」学生们被要求记住这个公式,然后在「练习」中反复「应用」它。创造性行为的兴奋、快乐,甚至痛苦和挫折都消失了。甚至连提出问题都不存在了。问题和答案同时被提出了——学生们没有什么可做的了。
现在让我明确一下我反对的是什么。不是关于公式,或者记忆有趣的事实。这在上下文中是可以的,也有它的位置,就像学习词汇一样——它可以帮助你创造更丰富、更细腻的艺术作品。但重要的不是三角形占据它们的盒子的一半这个事实。重要的是用线分割它的美丽想法,以及这个想法如何可能激发其他美丽的想法,并在其他问题中导致创造性的突破——这是单纯的事实陈述永远无法给你的。
通过去除创造性的过程,只留下那个过程的结果,你几乎可以保证没有人会真正地参与这个主题。这就像说米开朗基罗创作了一座美丽的雕塑,却不让我看到它。我怎么能从中得到启发呢?(当然,实际上比这还要糟糕得多——至少人们理解有一种雕塑的艺术,而我却被阻止了欣赏它)。
只关注结果,忽略原因,数学就变成了空洞的外壳。艺术不在于「真理」,而在于解释,论证。正是论证本身赋予了真理以背景,决定了真正在说什么和意味着什么。数学是解释的艺术。如果你剥夺了学生参与这种活动的机会——提出自己的问题,做出自己的猜想和发现,犯错,创造性地受挫,有所启发,拼凑出自己的解释和证明——你就剥夺了他们数学本身。所以不,我不是在抱怨我们的数学课上有事实和公式,我是在抱怨我们的数学课上缺乏数学。
如果你的美术老师告诉你,绘画就是填充有数字的区域,你会知道这是不对的。文化告诉你——有博物馆和画廊,还有你自己家里的艺术品。绘画被社会广泛理解为一种人类表达的媒介。同样,如果你的科学老师试图说服你,天文学是根据出生日期预测一个人的未来,你会知道她是疯了——科学已经渗透到文化中,以至于几乎每个人都知道原子、星系和自然定律。但是,如果你的数学老师给你的印象是,数学就是关于公式、定义和将算法记忆,那么谁会纠正你呢?
文化问题是一个自我延续的怪物:学生从老师那里学习数学,老师也从他们的老师那里学习数学,所以我们的文化中对数学的理解和欣赏的缺乏无限地复制着自己。更糟的是,这种「伪数学」的延续,这种对精确而无脑地操纵符号的强调,创造了它自己的文化和价值观。那些在这方面变得熟练的人从他们的成功中获得了很大的自尊。他们最不想听到的是,数学其实是关于原始的创造力和审美敏感度的。许多研究生在发现,经过十年被告知他们「擅长数学」之后,事实上他们没有真正的数学天赋,只是很擅长遵循指示时,陷入了沮丧。数学不是关于遵循指示,而是关于创造新的指示。
我甚至还没有提到学校里缺乏数学批判。学生们从来没有被告知一个秘密,那就是数学,就像任何文学一样,是人类为了自己的乐趣而创造的;数学作品是可以被批评评价的;人们可以拥有和发展数学品味。一篇数学文章就像一首诗,我们可以问它是否符合我们的审美标准:这个论证合理吗?它有道理吗?它简洁优雅吗?它让我更接近问题的本质吗?当然,学校里没有批判——因为在学校没有可供批判的艺术!
我们为什么不想让我们的孩子学习数学呢?是因为我们不信任他们,还是因为我们认为太难了?我们似乎觉得他们有能力对拿破仑进行论证并得出自己的结论,为什么对三角形就不行呢?我认为这只是因为我们的文化不知道数学是什么。数学给我们的印象是数学是一种非常冷酷和高度技术性的东西,没有人可能理解——如果有的话,这就是一个自我实现的预言。
如果我们的文化只是对数学无知,那还不算太糟糕,但更糟糕的是,人们竟然认为他们知道数学是怎么回事——而且显然是在一个粗略的误解之下,认为数学对社会有某种用处!这已经是数学和其他艺术之间的一个巨大差异。数学被文化视为一种为科学和技术服务的工具。每个人都知道诗歌和音乐是为了纯粹的享受和提升和美化人类的精神(因此它们几乎被从公立学校的课程中消除了),但不,数学是重要的。
SIMPLICIO:你真的想要声称数学对社会没有任何有用或实际的应用吗?
SALVATI:当然不是。我只是想说,仅仅因为某件事情碰巧有实际的后果,并不意味着那就是它的本质。音乐可以引领军队作战,但那不是人们创作交响乐的原因。米开朗琪罗装饰了一面天花板,但我相信他的心中有更高远的事情。
SIMPLICIO:但我们不需要让人们学习数学的那些有用的推论吗?我们不需要会计师和木匠之类的人吗?
SALVATI:有多少人真的用到了他们在学校里所谓学到的这些「实用数学」呢?你认为木匠们有机会使用三角函数吗?有多少成年人记得分数除法,或者解一元二次方程?显然,现在的实践培训计划是行不通的,而且有充分的理由:它无聊透顶,而且没有人会用到它。那么,人们为什么认为它是如此重要呢?我不明白,让社会成员带着对代数公式和几何图形的模糊记忆和对它们的厌恶记忆到处走动,对社会有什么好处。不过,向他们展示一些美丽的东西,让他们有机会享受成为有创造力、灵活、思想开放的思考者的乐趣——这种真正的数学教育可能提供的东西,可能会有些好处。
SIMPLICIO:但人们需要能够平衡自己的支票簿,不是吗?
SALVATI:我相信大多数人在日常运算中都会使用计算器。为什么不呢?这无疑更容易和更可靠。但我的观点不仅仅是现在的体制是如此糟糕,而是它所缺少的是如此美妙的东西!数学应该被当作艺术来教授,为了艺术本身。这些平凡的「有用」的方面会自然地作为一个微不足道的副产品而出现。贝多芬可以轻易地写一首广告歌曲,但他学习音乐的动机是创造一些美丽的东西。
SIMPLICIO:但并不是每个人都适合做艺术家。那些不是「擅长数学的那种人」的孩子们呢?他们怎么适应你的方案?
SALVATI:如果每个人都能在其自然状态下接触数学,体验其中充满挑战的乐趣和惊喜,我认为我们将看到学生对数学态度的巨大转变,以及我们对「数学好」含义的重新认识。我们正在失去许多潜在的天才数学家——他们聪明、有创造力,却因为数学看似毫无意义且枯燥,而选择了拒绝。这些人实在太聪明了,不愿在这种无聊的事情上浪费时间。
SIMPLICIO:但是你不认为,如果数学课变得更像美术课,很多孩子可能就什么都学不到吗?
SALVATI:他们现在什么也没学到!与其像现在这样,还不如不上数学课。至少有些人可能有机会自己发现一些美丽的东西。
SIMPLICIO:所以你的意思是要从学校课程中去除数学吗?
SALVATI:数学已经被删除了!唯一的问题是如何处理剩下的空洞无物的外壳。当然,我更愿意用对数学思想的积极和快乐的参与来取代它。
SIMPLICIO:但有多少数学老师对他们的科目足够了解,能够用那种方式教学呢?
SALVATI:很少。而且这只是冰山一角…
在学校的数学
要想扼杀一门学科的热情和兴趣,最可靠的方法莫过于将其作为学校课程的必修部分。把它作为标准化考试的主要组成部分,你几乎可以保证教育机构会吸干它的生命力。学校董事会不明白数学是什么,教育者、教科书作者、出版公司也不明白,可悲的是,我们的大多数数学老师也不明白。这个问题的范围是如此巨大,我几乎不知道从何说起。
让我们从「数学改革」的惨败开始。多年来,人们越来越意识到数学教育的现状已经腐朽不堪。已经委托了研究,召集了会议,组建了无数由教师、教科书出版商和教育者(不管他们是什么)组成的委员会来「解决问题」。除了教科书行业对改革的自利性兴趣(他们从任何微小的政治波动中获利,通过提供他们那些难以阅读的怪物的「新」版本)之外,整个改革运动一直没有抓住重点。数学课程不需要被改革,它需要被废除。
所有这些关于应该按什么顺序教授哪些「主题」,或者使用这种符号而不是那种符号,或者使用哪种品牌和型号的计算器的腾腾挪挪,看在上帝的份上——这就像在泰坦尼克号上重新排列甲板椅子一样!数学是理性的音乐。做数学就是参与一种发现和猜想,直觉和灵感的行为;就是处于一种困惑的状态——不是因为它对你没有意义,而是因为你赋予了它意义,但你仍然不明白你的创造怎样运作;就是拥有一个突破性的想法;就是作为一个艺术家感到沮丧;就是被一种几乎痛苦的美所震撼和淹没;就是活着,该死的。从数学中剔除这一点,你可以召开所有你想召开的会议;这并不重要。医生们,你们尽管动手术吧:你们的病人已经死了。
所有这些「改革」的最可悲的部分是试图「让数学变得有趣」和「与孩子们的生活相关」。你不需要让数学变得有趣——它已经有趣到我们无法承受的地步了!而它的光辉之处就在于它对我们的生活完全无关。这就是为什么它如此有趣!
试图把数学呈现为与日常生活相关的努力不可避免地显得勉强和人为:「你们看,孩子们,如果你们懂代数,那么你们就可以算出玛丽亚的年龄,如果我们知道她比七年前的两倍年龄大两岁!」(好像有人会有那种荒谬的信息,而不是她的年龄。)代数不是关于日常生活的,它是关于数字和对称性的——而这本身就是一种合理的追求:
假设我已知两个数的和与差。我怎样才能算出这两个数本身是多少?
这是一个简单而优雅的问题,不费吹灰之力就能吸引人。古巴比伦人喜欢解决这样的问题,我们的学生也是如此。(我希望你也能享受思考它!)我们不需要千方百计地给数学赋予意义。它有着与任何艺术一样的意义:那就是一种有意义的人类体验。
无论如何,你真的认为孩子们想要一些与他们的日常生活相关的东西吗?你认为一些实用的东西,比如复利,会让他们兴奋吗?人们喜欢幻想,而这正是数学可以提供的——一种从日常生活中解脱出来,一种对实际的工作日世界的安慰。
当教师或教科书屈服于「可爱化」的时候,就会出现类似的问题。这是在试图对抗所谓的「数学焦虑」(实际上是由学校造成的一系列疾病之一)的过程中,数学被塑造成一种「友好」的东西。例如,为了帮助你的学生记住圆的面积和周长的公式,你可能会编造一个关于「C先生」的故事,他开着车绕着「A夫人」转,告诉她他的「两个饼(pie)」有多好(C = 2πr),以及她的「饼是方的」(A = πr2)或者其他一些无聊的东西。但真正的故事是什么呢?是关于人类与曲线长度测量问题的斗争;是关于欧多克索斯(Eudoxus)和阿基米德(Archimedes)以及穷竭法的故事;关于圆周率的超越性的故事?哪一个更有趣——用一个没有解释的(而且让你反复记忆和练习)公式来测量一张圆形的纸张的粗略尺寸,还是听一听人类历史上最美丽、最迷人的问题之一,以及最杰出、最强大的思想之一的故事?看在上帝的份上,我们正在扼杀人们对圆的兴趣!
我们为什么不给我们的学生一个机会,至少听听这些事情,更不用说给他们一个机会去真正地做一些数学的事情,发挥他们自己的想法、观点和反应?还有什么其他的学科是经常被教授,却不提及它的历史、哲学、主题发展、美学标准和现状的?还有什么其他的学科是避开它的原始资料——历史上一些最有创造力的头脑创造的美丽的艺术作品——而偏爱三流的教科书的歪曲的?
学校数学的主要问题是没有问题。哦,我知道在数学课上什么算是问题,那些乏味的「练习」。「这是一种问题。这是如何解决它。是的,它会考到。1-35 题中的奇数题留作作业。」这是多么悲哀的学习数学的方式:成为一个受过训练的黑猩猩。
但是一个问题,一个真正的、诚实的、自然的人类问题——这就是另一回事了。一个立方体的对角线有多长?质数是否无穷无尽?无穷是一个数吗?有多少种方法可以对称地铺满一个表面?数学的历史是人类与这些问题的互动的历史,而不是无意识地重复公式和算法(以及为了使用它们而设计的人为的练习)。
一个好的问题是你不知道如何解决的问题。这就是它成为一个有趣的谜题和一个好的机会的原因。一个好的问题不是孤立地存在,而是作为跳板引出其他有趣的问题。一个三角形占据了盒子的一半。那么一个金字塔在三维盒子里呢?我们能否用类似的方法处理这个问题?
我可以理解培养学生掌握某些技巧的想法——我也是这样做的。但不是作为一种目的本身。数学中的技巧,就像任何艺术一样,应该在上下文中学习。伟大的问题,它们的历史,创造性的过程——这才是恰当的环境。给你的学生一个好的问题,让他们挣扎和沮丧。看看他们能想出什么。等到他们渴望一个点子的时候,再给他们一些技巧。但不要太多。
因此,收起你的教案和投影仪,收起你的全彩教科书,收起你的光盘,收起当代教育马戏团的所有其他东西,只和你的学生一起做数学!美术教师不会把时间浪费在教科书和特定技巧的死记硬背上。他们做的是和他们的学科自然相合的事情——他们让孩子们画画。他们挨个画架巡视,提出建议,提供指导:
「我在思考我们的三角形问题,我注意到了一件事。如果三角形是非常倾斜的,那么它就不会占据盒子的一半!看:
「观察得非常好!我们的切割论证假设了三角形的顶点在底边的正上方。现在我们需要一个新的思路。」
「要不要换个切法?」
「当然。尝试各种各样的想法。告诉我你想出了什么!」
那么,我们如何教我们的学生做数学呢?通过根据学生的喜好、个性和经验水平,选择引人入胜的自然问题。通过给他们时间去发现和提出猜想。通过帮助他们完善他们的论证,营造一个健康和活跃的数学批判的氛围。通过以灵活开放的态度对待他们的好奇心可能导致的方向突变。简而言之,通过与我们的学生和我们的学科建立一个真诚的智识关系。
当然,我所建议的在很多方面是不可能的。即使不考虑全州的课程体系和标准化考试几乎消除了教师的自主权,我也怀疑大多数教师甚至都不愿意与学生建立如此紧密的关系。这需要太多的敞开心扉和太多的责任——简而言之,这是太多的工作!
比起深入地思考自己学科的意义,以及如何最好地直接而诚实地向学生传达这个意义,做一个被动的传递者,使用一些出版商的「材料」,并遵循「讲课,考试,重复」的洗发水瓶指示,要容易得多。我们被鼓励放弃基于我们个人的智慧和良心做决定的艰难任务,而是「按部就班」。这只是一条最省力的路:
教科书出版商 : 教师 ::
A) 制药公司 : 医生
B) 唱片公司 : 唱盘骑师
C) 公司 : 国会议员
D) 以上都是
问题是,数学和绘画或诗歌一样,是一种艰难的创造性工作。这使得它很难教授。数学是一个缓慢和深思熟虑的过程。一件艺术品的诞生需要时间,也需要一个技艺精湛的教师来鉴别。当然,发布一套规则比指导有抱负的年轻艺术家要容易,写一本录像机说明书比写一本有观点的真正的书籍要容易。
数学是一门艺术,而艺术应该由从事艺术的人,或者如果没有,至少由欣赏艺术形式并能够识别它的人来教授。你不一定要从专业的作曲家那里学习音乐,但是你会希望你自己或你的孩子被一个连乐器都不会弹,一辈子都没有听过一首音乐的人教吗?你会接受一个从来没有拿过铅笔或踏进过博物馆的人作为你的美术老师吗?为什么我们接受那些从来没有创造过一件原创的数学作品,对数学的历史和哲学一无所知,对最近的发展毫不关心,事实上除了他们被期望向他们不幸的学生展示的内容之外,什么都不知道的数学老师呢?这是什么样的老师?一个人怎么能教他自己不做的事情呢?我不会跳舞,因此我永远不会假设我能教一节舞蹈课(我可以试试,但是效果不会好)。区别在于我知道我不会跳舞。没有人会因为我知道一些舞蹈单词就告诉我我很会跳舞。
我并不是说数学老师需要是专业的数学家——远非如此。但是他们不是至少应该理解数学是什么,擅长数学,并喜欢数学吗?
如果教学沦为单纯的数据传输,如果没有激情和惊奇的分享,如果教师自己是信息的被动接受者而不是新思想的创造者,那么他们的学生还有什么希望呢?如果对教师来说,分数的加法是一套任意的规则,而不是创造性过程的产物和美学选择和愿望的结果,那么对可怜的学生来说,当然也会有这样的感觉。
教学并非仅仅关于信息传递。它更重要的是与学生建立一种真诚的智力关系。这不需要任何方法、工具或培训,只需保持真实。如果做不到真实,那么你就没有权利把自己强加给无辜的孩子们。
特别是,教学这门艺术是无法教授的。教育学院完全是废话。当然,你可以学习早期儿童发展(early childhood development)等课程,还能被训练如何「有效」地使用黑板,如何准备一个有条理的「教案」(lesson plan)——顺便说一句,这确保了你的课程是有计划的,因此也是不真实的——但如果你不愿意成为一个真实的人,你就永远不会成为一个真正的老师。教学意味着开放和诚实,它需要分享激情,还要有学习的热爱。没有这些,全世界所有的教育学位也帮不了你;有了这些,那些学位又完全是多余的。
非常简单。学生并不是外星人。他们对美和规律有反应,和其他人一样天生好奇。只要和他们交谈!更重要的是,要倾听他们!
SIMPLICIO:好吧,我明白数学是一门艺术,我们没有很好地让人们了解它。但是,但这对于我们的学校系统来说,不是过于深奥,高雅吗?我们不是想在这里培养哲学家,我们只是希望人们能够合理地掌握基本的算术,以便他们能够在社会中发挥作用。
SALVIATI:但事实并非如此!学校数学涉及许多和社会生活能力无关的东西——比如代数和三角。这些学科和日常生活完全无关。我只是建议,如果我们要把这些东西作为大多数学生的基础教育的一部分,那么我们就要以一种有机和自然的方式来做。而且,正如我之前说过的,一个学科恰巧有一些平凡的实用价值,并不意味着我们必须把这个价值作为我们教学和学习的重点。也许你必须会读才能填写机动车管理局的表格,但这不是我们教孩子读书的原因。我们教他们读书是为了更高的目的,让他们能够接触到美丽和有意义的思想。用这样的方式教阅读不仅是残忍的——强迫三年级的孩子填写采购单和税务表格——而且是行不通的!我们学习东西是因为它们现在让我们感兴趣,而不是因为它们以后可能有用。但这正是我们要求孩子们对数学做的事情。
SIMPLICIO:但我们不是需要让三年级学生能够进行算术运算吗?
SALVIATI:为什么?你想训练他们计算 427 加 389 吗?这根本不是很多八岁孩子感兴趣的问题。就此而言,大多数成年人都不完全理解十进制的位值运算(decimal place-value arithmetic),你指望三年级的孩子有一个清晰的概念吗?或者你不在乎他们是否理解它吗?这对于那种技术性的训练来说太早了。当然,这是可以做到的,但我认为这最终会弊大于利。最好等到他们自己对数字的天然好奇心产生。
SIMPLICIO:那么,我们在数学课上应该如何教育小学生呢?
SALVATI:玩游戏吧!教他们下棋、围棋(Chess and Go)、六角棋(Hex)和西洋双陆棋(Backgammon)、芽棋(Sprouts)以及尼姆游戏(Nim),随便什么。自创一款游戏。玩些谜题。让他们接触需要演绎推理的情境。不必担心符号和技巧,帮助他们成为主动且有创造力的数学思考者。
SIMPLICIO:这似乎是一个很大的风险。如果我们过分弱化算术教学,结果导致学生们连加减都不会怎么办?
SALVATI:我认为更大的风险在于,我们可能会创造出一种完全缺乏创造性表达的学校。在这样的学校里,学生的任务仅仅是记住日期、公式(formula)和词汇表(vocabulary list),然后在标准化考试中机械地复述这些内容——「为今天培养明天的劳动力!」
SIMPLICIO:但毫无疑问,作为一个受过教育的人,应当对一些数学事实有所了解。
SALVATI:是的,其中最重要的一点是,数学是一种由人类为了乐趣而进行的艺术形式!当然,如果人们能对数字和形状有一些基本了解,那会很好。但这绝不是通过死记硬背、练习、讲座和习题来实现的。人们通过实践来学习,并记住对自己有意义的事物。我们有数百万成年人,脑海中浮现着「负 b 加减 b 的平方减去 4ac 的平方根,整个除以 2a」,却根本不知道这是什么意思。原因在于,他们从未有机会自己去发现或创造这些东西。他们从未遇到过让人着迷的问题,让他们感到挫败,从而激发他们对技巧或方法的渴望。没有人向他们讲述人类与数字的历史——没有古巴比伦的问题泥板,没有莱因德纸草书(Rhind Papyrus),没有《计算书》(Liber Abaci),也没有《伟大艺术》(Ars Magna)。更重要的是,他们甚至没有机会对一个问题产生好奇;问题还没来得及被提出,就已有了答案。
SIMPLICIO:我们没有时间让每个学生自己发明数学!人们花了几个世纪的时间才发现毕达哥拉斯定理(Pythagorean Theorem)。你怎么能指望普通孩子做到这一点呢?
SALVATI:我不这么认为。让我们明确一点。我在抱怨的是,数学课程中完全缺失了艺术和创新、历史和哲学、背景和视角。这并不意味着符号(notation)、技巧(technique)以及知识基础(knowledge base)的发展没有立足之地。它们当然有其必要性。我们应该兼顾两者。如果我反对钟摆过于偏向一边,这并不是说我希望它完全偏向另一边。但事实是,当产品从过程中产生时,人们学得更好。对诗歌的真正欣赏,不是来自于背诵一堆诗歌,而是来自于自己去写诗。
SIMPLICIO:是的,但在你能够自己写诗之前,你需要先学习字母表。一切总得有个起点。凡事得循序渐进。
SALVATI:不,你必须有一个想要奔向的目标。孩子们在学习阅读和写作的同时,也可以创作诗歌和故事。六岁孩子的作品是件美妙的事情,拼写和标点的错误并不会减损其价值。即便是非常小的孩子们也能创作歌曲,他们对音乐的调性(key)或所用的韵律(meter)一无所知。
SIMPLICIO:但数学不是不同吗?数学难道不是一种自成体系的语言,其中包含了各种必须先学会的符号,之后才能使用吗?
SALVATI:不,数学不是一门语言,而是一场冒险。音乐家们仅仅因为使用小黑点来简化他们的想法,就能说他们「讲另一种语言」吗?如果真是这样,对于一个和她的歌声的幼儿来说,这并不构成障碍。的确,几个世纪以来,一些数学简写形式已经发展出来,但这并非必需。大多数数学活动是在一杯咖啡的陪伴下,与朋友一起,随手在餐巾纸上画着图形进行的。数学一直是也将永远是关于思想的,一个有价值的思想超越了你选择用来表示它的符号。正如高斯(Gauss)曾经指出的,「我们需要的是概念,而非符号。」
SIMPLICIO:数学教育的目的之一,难道不是帮助学生以更精确、更逻辑的方式思考,以及培养他们的「数量推理能力」(quantitative reasoning skills)吗?所有这些定义和公式,不是都在锤炼我们学生的思维吗?
SALVATI:不,情况并非如此。如果说有什么影响,现行体制反而会使思维变得迟钝。不论何种心智敏锐,都源于自己解决问题,而非别人告诉你如何解决。
SIMPLICIO:公平地说,但对于那些有志于科学或工程(science or engineering)领域发展的学生呢?难道他们不需要传统课程提供的训练吗?这不就是我们在学校教授数学(mathematics)的原因吗?
SALVATI:有多少学习文学课程的学生将来会成为作家?这并不是我们教授文学的原因,也不是学生学习文学的目的。我们教授文学,是为了启迪每一个人,而不仅仅是培养未来的专业人士。无论如何,对于科学家(scientist)或工程师(engineer)来说,最宝贵的技能是能够创造性地、独立地思考。最不需要的,就是被训练。
数学课程
数学在学校里的教学方式之所以让人痛心,不在于缺少什么——事实上,我们的数学课上根本没有进行真正的数学活动——而在于其取而代之的东西:那些被称为「数学课程」的混乱而有害的错误信息堆砌。现在是时候仔细看看我们的学生面临的究竟是什么了——他们在所谓的数学名义下接触到什么,以及在这个过程中他们是如何受到伤害的。
这所谓的数学课程最引人注目的是其僵化性。这在高年级尤为明显。无论是从一个学校到另一个学校,从一个城市到另一个城市,还是从一个州到另一个州,教授的内容、方式和顺序完全相同。在这种奥威尔式的局面下,大多数人并没有感到不安或不满,反而已经将这种「标准模式」数学课程视为数学本身的同义词。
这与我所说的「阶梯神话」密切相关。这个观念认为,数学可以被排列成一系列的「科目」,每个科目在某种程度上都比前一个更先进或「更高级」。这种想法把学校数学变成了一场比赛——一些学生「领先」于其他人,家长则担心自己的孩子「落后」。这场比赛究竟通向何方?终点又有什么在等着呢?这实际上是一场悲哀的走向无处的竞赛。最终,你被剥夺了数学教育,你甚至还未察觉。
真正的数学不是现成的——不存在所谓的「代数二」(Algebra II)概念。问题会引领你走向它们自然的方向。艺术不是一场竞赛。阶梯神话是对这门学科的一种误解,教师按照标准课程自己的路径前行,这进一步强化了这一神话,阻止了他们将数学视为一个有机整体。因此,我们的数学课程缺乏历史视角和主题连贯性,只是一系列杂乱的主题和技巧的集合,它们之间的唯一联系是这些内容可以简单地被还原为一步步的程序。
我们本应有的发现和探索,被规则和条例所取代。我们从未听到学生说:「我想看看把一个数的指数设为负数是否有意义,我发现如果你认为这表示倒数,会得到一个非常整洁的模式。」相反,我们的教师和教科书把「负指数规则」当作既定事实来介绍,却没有提到这种选择背后的美学,甚至没有提到这本身就是一种选择。
在数学教学中,我们本可以通过探讨意义深远的问题,综合各种思想,开辟讨论和辩论的新领域,感受数学主题的统一与和谐。然而,现实却是枯燥无味且重复的练习,这些练习仅限于讨论的技术,彼此之间以及与整个数学领域(mathematics)的脱节如此之大,以至于学生和他们的老师都对这些问题的提出缘由一无所知。
在自然的问题情境中,学生本可以自行决定他们想要的词义和想要明确的概念。然而,他们却不得不面对一连串毫无动机、先验的「定义」。课程对术语和命名法(jargon and nomenclature)的迷恋似乎没有其他目的,只是为了给老师提供一些可以考察学生的内容。世界上没有哪位数学家(mathematician)会在意这些无意义的区分:2 1/2 是一个「混合数」(mixed number),而 5/2 是一个「假分数」(improper fraction)。天哪,它们是等价的。这两个数完全相同,属性也完全一样。除了小学四年级之外,还有谁会用这些词呢?
当然,测试某人对无意义定义的了解远比激发他们创造美好事物和寻找自己的意义来得容易。即使我们同意数学基础共通词汇的价值,这种做法也不对头。多么遗憾,五年级的学生被教导使用「四边形」(quadrilateral)而不是「四边形状」,却从未被告知使用「猜想」(conjecture)和「反例」(counterexample)的理由。高中学生必须学会使用割线函数(secant function),即『sec x』,这是余弦函数(cosine function)的倒数『1 / cos x』的缩写(这个定义的智力分量和决定用『&』代替「and」的重要性一样)。这种特定的简写,是十五世纪航海表的遗留物,至今仍在使用(而其他的,如「versine」已经消失),仅仅是历史偶然,对于一个不再需要快速精确船上计算的时代毫无价值。因此,我们的数学课堂被这种毫无意义的术语填满了,纯粹是为了术语本身。
实际上,课程不仅仅是一系列主题或思想的排列,更多的是符号的序列。显然,数学由一份神秘的符号列表和操作这些符号的规则组成。年幼的孩子们先被教授使用『+』和『÷』。只有在稍后,他们才能被信任使用『√』,然后是『x』、『y』以及括号的变化术。最终,他们在使用『sin』、『log』、『f(x)』,如果被认为有资格的话,还有『d』和『∫』上被灌输。所有这些都是在没有经历过任何有意义的数学体验的情况下完成的。
这个课程安排得非常严密,以至于教师和教科书作者能够提前多年准确预测学生将要做的每一件事,甚至到具体练习的页码。在二年级的代数课上,要求学生计算不同函数 ( f ) 的表达式 [ f(x + h) – f(x) ] / h 并不罕见,这样做是为了让他们在几年后学习微积分(calculus)时已经对此有所了解。虽然这种看似随机的操作组合为何会引人关注,通常没有给出(也不期望给出)动机,但我确信有许多教师试图解释这种操作可能的含义,并认为这是在帮助学生,实际上对学生来说,这只是又一个无聊的数学问题,需要尽快解决。学生可能会想:「他们想让我做什么?哦,只是简单地代入吗?好吧。」
又一个例子是,培训学生以一种不必要复杂的方式表达信息,仅仅因为在未来某个遥远的时期,这种表达方式才会显得有意义。有哪位中学代数老师能够明白,为什么他要求学生把「数字 x 位于三和七之间」改述为「|x - 5| < 2」?这些能力极差的教科书作者,真的认为他们通过为学生准备未来可能到来的日子——那时他们可能需要在更高维的几何或抽象的度量空间(metric space)中操作——而帮助到了学生吗?我表示怀疑。我认为他们只是在互相抄袭,年复一年,或许更换一下字体或突出色彩,当某个学校系统采用了他们的书,他们便洋洋得意,而这个学校系统则成了他们不知情的帮凶。
数学关乎问题,问题应成为学生数学生活的核心。虽然这个过程可能令人痛苦且充满创造性的挫败感,但学生和他们的老师应始终投入其中——有时灵感迸发,有时又似乎毫无头绪;他们会发现规律,提出猜想,构造实例及反例,设计论证,并相互批评对方的工作。特定的技术和方法将自然地从这一过程中产生,正如历史上的情形一样:这些方法并非孤立存在,而是与问题的背景有机地联系在一起,并由此生长出来。
英语教师了解,拼写和发音最好在阅读和写作的背景下学习。历史教师知道,如果把名字和日期从事件的发展背景中剥离出来,它们会变得枯燥无味。为何数学教育仍停留在十九世纪?对比一下你自己学习代数的经历和伯特兰·罗素(Bertrand Russell)的回忆:
「我被迫死记硬背:『两个数的和的平方等于它们各自的平方之和加上它们的乘积的两倍。』我对这句话的意思一无所知,当我记不住这些词时,我的家教向我头上扔书,这丝毫没有激发我的智慧。」
事情今天真的有所不同吗?
SIMPLICIO:我认为这样说不太公平。毕竟从那时起,教学方法已有所改进。
SALVATI:你是在说教学方法吗?教学本质上是一种复杂的人际关系,它并不需要什么特定的方法。或者,换句话说,如果你觉得非得依靠方法不可,那可能你并不是一名很出色的教师。如果你对自己的学科没有足够的感觉,无法用自己的话语,以一种自然而自发的方式来讲述它,你又怎能真正理解它呢?再说,谈到困于旧时代,难道不令人震惊的是,课程内容本身还停留在十七世纪吗?想想过去三百年里,数学思想中所有惊人的发现和深刻的变革!这些几乎被当作从未发生过一样,无人提及。
SIMPLICIO:但你对我们的数学老师要求是否太高了?你期望他们对几十名学生给予个别关注,引导他们各自发现和启迪之路,同时还要求他们了解最新的数学历史?
SALVATI:你希望你的美术老师能够根据你的画作给出个性化、专业的建议吗?你期待她对过去三百年的艺术史有所了解吗?但说真的,我并不抱这样的期望,我只是希望事情是这样的。
SIMPLICIO:所以你是在责怪数学老师吗?
SALVATI:不,我责怪的是造就他们的文化。这些可怜的人尽其所能,只是在做他们所受的训练。我相信他们中的大多数都爱他们的学生,也讨厌不得不让学生经历这些事情。他们心里明白,这些都是没有意义且令人堕落的。他们能感觉到自己已成为巨大的、压榨灵魂的机器(soul-crushing machine)中的一颗螺丝,但他们缺乏理解这一切的视角,或是与之抗争的能力。他们只知道必须让学生为「明年做好准备」。
SIMPLICIO:你真的认为大多数学生有能力自己创造数学(mathematics)吗?
SALVATI:如果我们真的认为创造性推理对学生来说太「高深」,他们无法应对,那么为什么我们允许他们写历史论文或关于莎士比亚的文章呢?问题不在于学生不能应对,而在于没有老师能应对。他们自己从未证明过任何东西,所以他们怎么可能给学生提供建议呢?无论如何,学生的兴趣和能力肯定会有差异,就像在任何学科中一样,但至少学生会因为数学本身而喜欢或不喜欢它,而不是因为这种扭曲的模仿。
SIMPLICIO:但我们肯定希望所有学生都能学习一套基本的事实和技能。这就是课程设置的目的,也是为什么课程如此统一的原因——我们需要学生知道一些永恒的、冷酷的事实:一加一等于二,三角形的内角和等于 180 度。这些不是意见,也不是模糊的艺术感觉。
SALVATI:恰恰相反。数学结构,无论是否有用,都是在问题背景下发明和发展起来的,并从中获得意义。有时,我们希望一加一等于零(如在所谓的「模 2」算术中);以及在球面上,三角形的内角和大于 180 度。没有所谓的「事实」;一切都是相对的和关系性的。重要的是故事,而不仅仅是结局。
SIMPLICIO:我已经厌倦了你那些神秘的胡言乱语!基础算术,好吗?你到底同不同意学生应该学习它?
SALVATI:这取决于你所说的「它」是什么意思。如果你指的是对计数和排列问题的理解,分组和命名的优点,表示与事物本身的区别,以及对数系统历史发展的某些认识,那么是的,我确实认为我们的学生应该接触这些内容。如果你指的是在没有任何概念框架的情况下死记硬背算术事实,那么不。如果你指的是探索五组七与七组五相同这一并不明显的事实,那么是的。如果你指的是制定一个规则,规定 5 x 7 = 7 x 5,那么不。做数学应该始终意味着发现规律并构建美丽且有意义的解释。
SIMPLICIO:那么几何呢?学生们不是在那里证明一些东西吗?高中几何难道不是你希望数学课成为的完美例子吗?
高中几何:魔鬼的工具
对于一个严厉指责的作者来说,没有什么比他的主要攻击目标被用来支持他的观点更令人恼火的了。高中几何就像披着羊皮的狼一样阴险,像虚伪的朋友一样背信弃义。正因为它是学校试图向学生介绍论证艺术的尝试,所以它非常危险。
这种病毒伪装成学生最终能够进行真正数学推理的场所,攻击数学的核心,摧毁创造性理性论证的本质,毒害学生对这一迷人且美丽学科的兴趣,并永久性地使他们无法以自然和直观的方式思考数学。
其背后的机制既微妙又狡猾。学生受害者首先被一连串无意义的定义、命题和符号弄得目瞪口呆、麻木不仁,然后通过系统的灌输,逐渐而艰难地被剥夺了对形状及其规律的任何自然好奇心或直觉,转而接受所谓「形式几何证明」的生硬语言和人为格式。
撇开所有比喻不谈,几何课无疑是整个小初高数学课程中对心理和情感破坏性最大的部分。其他数学课程可能会把这只美丽的小鸟藏起来,或者关在笼子里,但在几何课上,它却受到了公开而残酷的折磨。(显然,我无法完全撇开比喻。)
正在发生的是对学生直觉的系统性破坏。一个证明,即一个数学论证,是一部虚构作品,一首诗。它的目标是令人满意。一个优美的证明应该解释,并且解释得清晰、深刻且优雅。一个写得好、构思精巧的论证应该像一股清凉的水,像一盏明灯——它应该沁人心脾,照亮心灵。而且它应该是迷人的。
几何课上的所谓「证明」毫无魅力可言。学生在进行所谓的「证明」时,会被要求按照一种僵化和教条的格式——这种格式就像坚持要求想种花园的孩子用属和种来称呼他们的花一样,既不必要也不合适。
让我们来看这种疯狂的一些具体实例。我们从两条交叉线的例子开始:
通常首先发生的事情是用过多的符号使问题变得不必要地复杂。显然,人们不能简单地谈论两条交叉线;必须给它们起复杂的名字。而且不能是像「线 1」和「线 2」这样的简单名字,甚至不能是「a」和「b」。我们必须(根据高中几何的要求)在这些线上选择随机且无关的点,然后使用特殊的「线符号」来指代这些线。
你看,现在我们得称它们为 AB 和 CD。天哪,你千万不能省略上面的短横线——「AB」指的是线段 AB 的长度(至少我是这么理解的)。不管它有多么无谓地复杂,这就是你必须学会的方式。接下来是实际的陈述,通常被称为某个荒谬的名字,比如
命题 2.1.1.
令 $\overline{AB}$ 和 $\overline{CD}$ 相交于点 $P$。那么 ∠APC ≅ ∠BPD。
换句话说,两边的角角度是相同的。好吧,废话!两条交叉线的构型是对称的,天哪。仿佛这还不够糟糕,这个关于线和角的显而易见的陈述还必须被「证明」。
证明:
论证
原因
-
角相加公设
-
代入性质
-
相等的自反性
-
相等的减法性质
-
角度测量公设
我们得到的不是一个真正的人以世界上多种自然语言之一撰写的诙谐有趣的论证,而是这封沉闷、没有灵魂、官僚主义的证明信。这真是小巫见大巫!难道我们真的想让这样一个简单明了的观察结果需要如此冗长的前言吗?老实说,你真的读过它吗?当然没有。谁会想读呢?
对如此简单的事情进行如此繁琐的处理,其效果是让人们怀疑自己的直觉。质疑显而易见的事情,坚持要「严格证明」(好像上面的内容甚至构成了一个合法的正式证明),就是在对学生说:「你的感觉和想法是可疑的。你需要按照我们的方式思考和表达。」
毫无疑问,形式证明在数学中有其地位。但这个地位不应该是学生第一次接触数学论证时的内容。至少要让人们先熟悉一些数学对象,并了解对它们的期望,然后再开始形式化一切。严格的形式证明只有在出现危机时才变得重要——当你发现你的假想对象以一种违反直觉的方式表现时;当出现某种悖论时。但这种过度的预防性措施在这里完全没有必要——还没有人「生病」呢!当然,如果在某个时候出现逻辑危机,那么显然应该进行调查,并使论证更加清晰,但这个过程也可以直观且非正式地进行。事实上,与自己的证明进行这样的对话是数学的灵魂。
因此,大多数孩子不仅被这种迂腐弄得完全困惑——没有什么比证明显而易见的事情更令人费解的了——即使是那些直觉依然完好的少数学生,也必须将他们优秀、美丽的想法重新翻译回这种荒谬的象形文字框架,以便他们的老师称其为「正确」。然后老师自我陶醉地认为他在某种程度上磨砺了学生的思维。
再举一个更严肃的半圆内有一个三角形的例子:
关于这个图形的美妙真理是,无论你在圆上将三角形的顶点放在哪里,它总是形成一个漂亮的直角。(如果「直角」这个术语与问题相关并且使讨论更容易,我对此没有异议。我反对的不是术语本身,而是无意义的术语。无论如何,如果学生更喜欢,我很乐意使用「角落」甚至「猪圈」。)
在这种情况下,我们的直觉会产生一些疑问。这个结论是否成立并不明显;甚至看起来不太可能——如果我移动顶点,角度不应该改变吗?我们这里有一个绝妙的数学问题!它是真的吗?如果是,为什么它是真的?多么好的项目啊!多么好的机会来锻炼一个人的创造力和想象力啊!当然,学生们没有得到这样的机会,他们的好奇心和兴趣立即被以下内容打消了:
定理 9.5. 设三角形ABC内接于直径为 $\overline{AC}$ 的半圆内。
那么 ∠ABC 是直角。
证明:
论证
-
作半径 OB。那么 OB=OC=OA
-
m∠ABC = 90
-
∠ABC 是直角
原因
-
前提
-
等腰三角形定理
-
角和公设
-
三角形内角和为180度 5. 代入(第2行)
-
代入(第3行)
-
相等的除法性质 8. 直角的定义
有什么能比这更丑陋、更不优雅的吗?有什么论证能比这更晦涩难懂、不可读吗?这不是数学!一个证明应该是神灵的启示,而不是五角大楼的密码信息。这就是错误的逻辑严谨性带来的结果:丑陋。论证的精神被埋在了一堆令人困惑的形式主义之下。
没有数学家会这样工作。没有数学家曾经这样工作过。这完全是对数学事业的彻底误解。数学不是在我们和我们的直觉之间竖起障碍,也不是把简单的事情复杂化。数学是要消除我们直觉的障碍,并保持简单的事情简单。
将这个令人倒胃口的证明与我一个七年级学生提出的以下论证进行比较:
「将三角形旋转,使其在圆内形成一个四边形的框。由于三角形被完全旋转了一圈,框的边必须是平行的,因此它形成了一个平行四边形。但它不能是一个倾斜的框,因为它的两条对角线都是圆的直径,所以它们是相等的,这意味着它必须是一个真正的矩形。这就是为什么角总是直角的原因。」
这难道不是令人愉快吗?重点不在于这个论证是否比另一个论证更好,而在于这个想法是否传达出来了。(事实上,第一个证明的想法相当漂亮,尽管看起来有些模糊不清。)
更重要的是,这个想法是学生自己提出的。班级有一个很好的问题要解决,大家提出了猜想,尝试了证明,而这是其中一个学生的成果。当然,这花了好几天时间,是一连串失败后的最终结果。
平心而论,我对这个证明进行了相当大的改写。原版相当复杂,包含了很多不必要的赘述(以及拼写和语法错误)。但我想我已经传达了其中的感觉。这些缺陷都是好事,它们让我这个老师有了用武之地。我能够指出几个风格和逻辑上的问题,学生随后能够改进论证。例如,我对两条对角线都是直径这一点并不完全满意——我认为这并不完全显而易见——但这只意味着有更多的思考空间和更多的理解可以从中获得。事实上,学生能够很好地填补这一空白:
「由于三角形绕圆旋转了半圈,所以顶点必须正好位于起始点的对面。这就是为什么框的对角线是直径的原因。」
这是一个很棒的项目,也是一个美妙的数学作品。我不确定是学生还是我自己更为自豪。这正是我希望我的学生们能够拥有的体验。
标准几何课程的问题在于,作为一个挣扎中的艺术家的私人、个人体验几乎被消除了。证明的艺术已被一种缺乏灵感的形式推理的僵化步骤模式所取代。教材呈现了一套定义、定理和证明,教师将它们抄写在黑板上,学生将它们抄写在笔记本上。然后要求学生在练习中模仿这些内容。那些迅速掌握这种模式的学生被认为是「好」学生。
结果是学生在创造性活动中变成了被动的参与者。学生们在做出符合预先存在的证明模式的陈述,而不是因为他们真正理解这些陈述。他们被训练成模仿论证,而不是有意图地进行论证。因此,他们不仅不知道老师在说什么,也不知道自己在说什么。
即使是传统的定义呈现方式也是一种谎言。为了在开始典型的命题和定理的连串之前制造一种「清晰」的假象,提供了一组定义,以便使陈述及其证明尽可能简洁。表面上看,这似乎相当无害;为什么不做一些缩写,以便更经济地表达呢?问题在于,定义很重要。它们来自于审美决定,即作为艺术家,你认为哪些区别是重要的。而且它们是由问题产生的。做出定义就是突出并引起对某一特征或结构属性的注意。从历史上看,这源于解决问题的过程中,而不是作为解决问题的前奏。
关键是你不应该从定义开始,而是从问题开始。在毕达哥拉斯尝试测量正方形的对角线并发现它不能表示为分数之前,没有人想到「无理数」的概念。定义在你的论证中达到某个需要区分的点时才有意义。没有动机地做出定义更可能导致混乱。
这学生被屏蔽和排除在数学过程之外的又一个例子。学生需要能够在需要时自己做出定义——自己提出辩论的框架。我不希望学生说「定义、定理、证明」,我希望他们说「我的定义、我的定理、我的证明」。
撇开所有这些抱怨不谈,这种讲解方式的真正问题在于枯燥乏味。效率和经济性并不能造就好的教育方法论。我很难相信欧几里得会赞同这种做法;我知道阿基米德也不会赞同。
SIMPLICIO:等一下。我不知道你怎么想,但我其实很喜欢我的高中几何课。我喜欢那种结构化的方式,也喜欢在严格的证明格式中工作。
SALVATI:我相信你确实喜欢。你可能偶尔还会做一些不错的问题。很多人喜欢几何课(尽管更多人讨厌它)。但这并不是对当前体制的支持。相反,这强有力地证明了数学本身的魅力。很难完全毁掉如此美丽的东西;即使是数学的这一微弱影子也仍然可以是引人入胜和令人满意的。许多人也喜欢按数字填色;这是一种轻松而多彩的手工活动。但这并不意味着它是真正的艺术。
SIMPLICIO:但我在告诉你,我喜欢它。
SALVATI:如果你有过更自然的数学体验,你会更加喜欢它。
SIMPLICIO:所以我们应该开始一些自由形式的数学探险,而学生们会学习他们碰巧学到的东西?
SALVATI:正是如此。问题会引出其他问题,技术会在必要时得到发展,新的主题会自然出现。如果某个问题在十三年的学校教育中从未出现过,那它能有多有趣或多重要呢?
SIMPLICIO:你完全疯了。
SALVATI:也许我确实有些偏激。但即使在传统框架内,一位优秀的教师也可以引导讨论和问题的进展,让学生自己发现和发明数学。真正的问题在于官僚体制不允许个别教师这样做。有了固定的课程,教师就无法引导。应该没有标准,也没有课程。只有每个人都在做他们认为对学生最好的事情。
SIMPLICIO:但这样的话,学校如何保证所有学生都具备相同的基础知识?我们如何准确衡量他们的相对价值呢?
SALVATI:他们不能,我们也不会。就像在现实生活中一样。最终你必须面对一个事实:每个人都是不同的,这完全没问题。无论如何,这并不紧急。所以一个人高中毕业时不知道半角公式(好像他们现在就知道一样!)那又怎样?至少这个人会对这个学科的真正意义有一些了解,并且会看到一些美丽的东西。
总之...
为了给我对标准课程的批判画上圆满的句号,并为社区服务,我现在呈现有史以来第一个完全诚实的小初高数学课程目录:
标准学校数学课程
小学数学。灌输开始了。学生们了解到,数学不是你做的事情,而是对你做的事情。数学课的重点是坐好,填写作业纸,遵循指示。孩子们被期望掌握一套复杂的算法来操作印地数字,这与他们的任何真实愿望或好奇心无关,而在几个世纪前被认为对普通成年人来说太难了。乘法表被强调,家长、老师和孩子们也都感到压力。
初中数学。学生们被教导将数学视为一套程序,类似于宗教仪式,是永恒不变的。圣碑志或 "数学书 "被分发出去,学生们学会称呼教会长老为 "他们"(例如「他们在这里想要什么?他们想让我做除法吗?」)。人为和虚构的「文字题」将被引入,以使算术的无脑苦差事显得相对愉快。学生将接受一系列不必要的专业术语测试,如「整数」和「真分数」,而没有任何区分这些术语的合理理由。为代数I作好充分准备。
代数 I。为了不浪费宝贵的时间思考数字及其模式,这门课程转而关注符号及其操作规则。从古代美索不达米亚的板书问题到文艺复兴时期代数学家的高超艺术的顺畅叙述线被抛弃,取而代之的是令人不安的支离破碎的后现代复述,没有人物、情节或主题。坚持将所有数字和表达式放入各种标准形式中,会使学生对同一性(identity)和相等性(equality)的含义产生更多困惑。学生们还必须记住一元二次方程求根公式,尽管原因不明。
几何。与课程的其余部分隔离,这门课程将唤起希望从事有意义数学活动的学生的期望,然后将其击碎。笨拙且令人分心的符号将被引入,不遗余力地使简单的事情变得复杂。这门课程的目标是消除任何剩余的自然数学直觉,为代数 II 做准备。
代数 II。这门课程的主题是无动机和不恰当地使用坐标几何。圆锥曲线在坐标框架中被引入,以避免圆锥及其截面的美学简洁。学生们将学习将二次形(quadratic forms)重写为各种标准格式,尽管完全没有理由。指数和对数函数也在代数II中引入,尽管它们不是代数对象,只是因为它们必须被塞进某个地方,显然如此。课程名称的选择是为了强化阶梯谬误。为什么几何出现在代数 I 及其续集之间仍然是个谜。
三角学。两周的内容被拉长到一个学期,通过无意义的定义绕圈子。真正有趣和美丽的现象,比如三角形的边长如何依赖于其角度,将与无关的缩写和过时的符号约定得到同样的重视,以防止学生形成对该学科的任何清晰认识。学生将学习诸如「SohCahToa」和「All Students Take Calculus」这样的助记技巧,而不是培养对方向和对称的自然直观感觉。讨论三角形的测量时,不提三角函数的超验性质,也不提进行这种测量所固有的语言和哲学问题。为了进一步模糊这些问题,将需要使用计算器。
预备微积分。一个毫无意义的杂烩,充满了不相关的主题。大多是半生不熟的尝试,将十九世纪末的分析方法引入到既不必要也无益的环境中。技术性地定义「极限」和「连续性」,以掩盖直观上清晰的平滑变化概念。正如其名,这门课程为微积分做准备,在那里,任何与形状和运动相关的自然概念的系统性模糊化将达到最终阶段。
微积分。这门课程将探讨运动的数学,并将其埋藏在大量不必要的形式主义之下。尽管它是微分和积分微积分的入门课程,但牛顿和莱布尼茨的简单而深刻的思想将被抛弃,取而代之的是一种更复杂的基于函数的方法,这种方法是为应对各种分析危机而发展起来的,但这些危机在此环境中并不适用,当然也不会被提及。大学时将再次逐字学习。
这就是全部内容。一个彻底摧毁年轻心灵的完整处方——一种经过验证的好奇心的解药。他们对数学做了什么!
这种古老的艺术形式有着令人叹为观止的深度和令人心碎的美丽。讽刺的是,人们将数学视为创造力的对立面。他们错过了一种比任何书籍都古老,比任何诗歌都深刻,比任何抽象都更抽象的艺术形式。而这一切都是学校造成的!无辜的老师给无辜的学生造成伤害,这是多么可悲的无休止循环。我们本可以享受更多的乐趣。
SIMPLICIO:好吧,我彻底沮丧了。接下来怎么办?
SALVIATI:嗯,我想我有一个关于立方体内金字塔的想法……
Anki 卡片设计研究:学习统计学
原文:Anki Design Study: Learning Statistics
最近我在对 Anki 知识库进行双周设计审查时,发现了这样一张需要重构的卡片:
离我做这张卡大约有一年半了。它的简易度是 205%,就是说我一直没弄错。它的间隔是一年半,所以我短时间内不用再主动回忆他了。根据这些数据,这张抽认卡制作得挺成功。而且它是有用的:我制作这张卡片是因为我偶尔需要用 R 或 Python 计算并可视化数据的置信区间,知道卡片中的方程式后,我在 Google 上搜索正确的语法便能更快,更省脑力。
但是这张卡片有浓厚的卡片设计异味:我是通过死记硬背来记住这个方程的,这意味着我不能解释「为什么」这个方程的形式是这样的,因而回忆起来很困难,复习起来不愉快(即使我能答对),我现实生活中需要这些知识时,更是难以推理解释。
我隐约意识到这与 t-分布的临界值有关,但是当统计课程一结课,所有的知识很快变得非常模糊。
识别这样卡片的基本方法,是根据答错一张卡片的时候,你脑海里产生的想法:
-
如果我是把高质量的卡片弄错了,就会一激灵「噢,那确实,我懂了。我真傻。」
-
如果答错了死记硬背的卡片,我反而会想:「噢,真不走运。下次再试试吧。」
一般说来,通过死记硬背来学习公式在 Anki 是有风险的。公式的用意在于浓缩大量非常复杂的逻辑——通常是一整段的内容——而只用很小的空间。公式内在的复杂逻辑需要多张抽认卡才能加深理解。
所以让我们来优化好这张卡吧。我们将遵循分为两部分的策略,这也是我在科学类话题中经常使用的:
1.识别出地标概念,便于让直觉有定位,然后
- 围绕这些地标概念,添加足够必要的细节卡片。
大局地标概念
掌握统计问题背后的直觉是很棘手的,因为统计学充满了技术用语和准确假设,而统计学文本对此不假思索地使用。像总体、样本均值、标准误差、标准差和分布这样的术语很快就会互相混淆(我们甚至还没说区分 P.D.F.、P.M.F.、C.D.F.、P.P.F. 和 I.S.F. 这回事呢)
等等,我们在干啥?我的教授曾面向我们这帮计算机科学学生(哈!),像西西弗一样徒劳地教一些可靠的实验方法,而其中我依稀记得,任何数据样本的均值很神奇地遵循不错的理论分布(即使数据本身没有遵循这个分布)。这正是我们能够计算置信区间的出发点。但要我解释这个事实就很难了。
于是请谷歌图片来帮忙 (这里是原始图片来源)。 我缺少的概念抓手是抽样分布。一般说来,用图像来概括这样的概念要比用文本解释容易得多,所以我经常依靠图像给出问题的答案:
在我们的脑内文库中刻印下这张图片后(这也就是为什么概念抓手和技术用语威力无穷),我们就为记住置信区间做了更足的准备。仅仅是清晰而轻松地回忆起置信区间来自这样的分布函数,就已经很有用了。
但在我们继续前,我们可以再往地标概念上添一笔:
太棒了。我们已经解决地标概念了——该处理细节了!
细节卡
就像任何复杂的概念一样,为了用 Anki 学好公式,我们便要将其拆分,逐个击破。
对于公式,我会做卡来处理公式的每一项或者每一个符号。这样每个部分就成为自身的概念抓手:
这真的很棒,因为比起原来放上一整个公式的卡片,现在的一张张卡片更能让我专注。例如,现在我可以慢慢考虑那个复杂的 1-α/2;n-1
下标 (也是公式中最难记住的部分)。
然而,公式中每一项还是很复杂,而且我们仍然在死记硬背。让我们再次对这两个问题发起挑战:
现在我准备好解释置信区间方程式的每一部分从何而来了,这个公式就更容易记住了。但更重要的是,推理也变得更容易,因为我比以前更多地依赖语义直觉,而不是死记硬背。
但要想让这张语义联系的网发展成更大的知识库,更具深度 (「为什么平均值的标准差随着 n 的平方根增大而减小?」) 或广度 (「什么时候使用 t-分布
而不是 z-分布
来计算关于某个平均值的置信区间?」) ,就不能停留在我们目前做的这几张卡片了。但是目标已经达成了:我们已经重构了一张卡片,所以设计审查可以告一段落了(好吧,说实话,这次设计审查花了我整整两天。有些重构任务一口气做不完啊!)
我只想加几张缩写卡片来巩固我新制作的概念抓手,然后就收工了:
如果你好奇,这个案例里我保留了原来的卡片。保留完整公式的卡挺好,只需要一些支持性的分析卡片即可。所有这些卡片加在一起的记忆效果,远胜任何一张单独的卡片。
别跟教材客气:优质(数学)书籍挑选指南
原文:Be ruthless for textbooks: A guide for finding a good textbook
如果教材有练习,且附带答案,同时每个定义都有例子,那么这本教材就是优质的。
以下是一份以此列表为基础的教科书得分榜清单。欢迎加入我们的讨论!
以下内容是详细评述。
垃圾教材太多了。快速判断出教材是否垃圾的能力很重要。我写这篇文章来帮助自已,也帮你们。
在使用带有自动反馈、抽认卡、模拟等功能的交互式媒介进行学习之前,我们必须依靠教材。而这份清单就是为了帮助大家!
留意你的教材…
…有带答案的练习吗?
对我来说,这是最重要的,没有之一。
- 在 Vector calculus, linear algebra, and differential forms: a unified approach[1] 一书中,每个概念后,读者可以做一道简短练习。解答就写在脚注里,与练习同页。这样超方便,特别是读 PDF 的时候。
…解释原因并提供背景信息吗?
为什么某个领域很重要或者很有趣。为什么作出这样的假设?诸如此类。
-
Analysis I 这本书从「为什么要学分析?」开始。[2]同样的,在*Linear Algebra, Pillar I* 的行列式一章中,开头就讲了「为什么要行列式?」。
-
在 Precalculus[3] 一书中,读者能找到关于为什么或什么时候某些技能会很重要的注解。
...提供许多正例、非例与反例吗?
- Seven Sketches on Compositionality[4] 中的定义和例子数量大致相当。
…给出了进阶主题的预览,并传达了目前的局限性吗?
- 在 Precalculus[5] 中,作者提到了朴素集合论及其根本性缺陷,还为感兴趣的读者提供了进一步的阅读材料。
…关心术语吗?
读者需要信号,告诉他们何时符号被过度使用,或者何时短语只是某人的错误残留。
- 在一些不严谨的生物书中,你会学到「化学键断裂释放能量」。但是事实上,化学家要说的恰恰相反!
…对读者是否诚实?
Thurston 在他的论文 On proof and progress in mathematics[6] 中分享了他的观察,即论文与教科书的正式形式反而成为了理解它们的障碍。作者是否华而不实?他们是否提及背景或非正式的原因来解释他们的做法?
地位使作者无法坦诚相待。例如,作者可能避免提及某些章节很无聊。为什么呢!?对于可能认为自己对某章节有疑惑的读者来说,知道这一信息是有非常价值的。
我喜欢作者不掩饰自己的热情。知道某个特定片段是作者特别感兴趣的领域,会给教科书带来更加引人入胜的「对话式」活力。
我也喜欢在其中看到一些笑话或彩蛋。我认为这是一个标志,表明作者感到自在,没有被出版商当作机器人对待。
-
在 Introduction to abstract algebra[7] 中,作者写到「如果你读得无聊,我很同情你。我打字的时候也很无聊。」
-
《线性代数应该这样学》第 21 页的页码写着「≈ 7π」。
-
在 The integrals of Lebesgue, Denjoy Perron, and Henstock[8] 中,你会看到与元建议结合的 c 笑话:
请看同一本书的这句话:「这个引理被称为维塔利覆盖引理,起初你可能会感到很奇怪,可能需要读几遍才能理解。在欣赏它之前,有必要多次观察该引理在实际操作中的应用。」
…提及了元认知的层面吗?
如何思考这个主题?哪些类比和图片会有帮助?
你目前的知识会不会干扰你即将学习的内容?
...有整洁的图像与布局吗?
我们应该知悉图片是否按比例绘制,以及它的局限性等等。
我喜欢教科书里的手绘图。它们看起来更直观。
-
一些生物学教科书关心的是尺度,等等。这很糟糕。与之相反的优雅的示例参见 Cell Biology by the Numbers。[9]
-
在《通向实在之路》[10]中,作者画了很多图。你可以了解作者对相关主题的感受。
...用的语言简单吗?
| 牛顿定律,如是说... | |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
| Dynamics and Relativity[11] | Fundamentals of Physics[12] |
| 在没有外力的情况下,粒子以恒定的速度运动。 | 在没有外力的情况下,静止的物体保持静止,运动的物体以恒定的速度继续运动(即匀速直线运动)。|
| 粒子的加速度(或更准确地说,动量的变化率)与作用在它身上的力成正比。| 物体的加速度与它所受的合力成正比,与它的质量成反比。|
| 每个作用力都有一个相等且相反的反作用力。 | 如果两个物体相互作用,物体 1 对物体 2 施加的力 F12与 物体 2 对物体 1 施加的力 F21 的大小相等,方向相反:F12=-F21 |
...提供了每一章的总结和重点吗?
-
《线性代数应该这样学》[13]中每一章节都总结了重点和动机。
-
在 Online notes for MAT237: Multivariable Calculus, 2018-9 的每一章中,作者 Robert Jerrard 都写了「基本技能」小结。
怎样的教科书是优质的?
定义:当且仅当教材具备以上所有特点(至多不具备两个),它才是优质的。
定义:没达到优质标准的教科书就是垃圾。
参考书目
Axler, Sheldon. Linear Algebra Done Right. Undergraduate Texts in Mathematics. Cham: Springer International Publishing, 2015. https://doi.org/10.1007/978-3-319-11080-6.
Fong, Brendan, and David I. Spivak. An Invitation to Applied Category Theory: Seven Sketches in Compositionality. 1st ed. Cambridge University Press, 2019. https://doi.org/10.1017/9781108668804.
Gordon, Russell A. The Integrals of Lebesgue, Denjoy, Perron, and Henstock. Graduate Studies in Mathematics, v. 4. Providence, R.I: American Mathematical Society, 1994.
Halliday, David, Robert Resnick, and Jearl Walker. Fundamentals of Physics. 8th ed. Wiley, n.d.
Hubbard, John H., and Barbara Burke Hubbard. Vector Calculus, Linear Algebra, and Differential Forms: A Unified Approach. 4th ed. Ithaca, NY: Matrix Editions, 2009.
Milo, Ron, and Rob Phillips. Cell Biology by the Numbers. New York, NY: Garland Science, Taylor & Francis Group, 2016.
Penrose, Roger. The Road to Reality: A Complete Guide to the Laws of the Universe. London: Jonathan Cape, 2004.
Siksek, Samir. "Introduction to Abstract Algebra," n.d., 139.
Stitz, and Zeager. Precalculus, n.d.
Tao, Terence. Analysis I. Vol. 37. Texts and Readings in Mathematics. Singapore: Springer Singapore, 2016. https://doi.org/10.1007/978-981-10-1789-6.
Thurston, William P. “On Proof and Progress in Mathematics.” In 18 Unconventional Essays on the Nature of Mathematics, edited by Reuben Hersh, 37–55. New York: Springer-Verlag, 2006. https://doi.org/10.1007/0-387-29831-2_3.
Tong, David. “University of Cambridge Part IA Mathematical Tripos,” n.d., 16.
[1] Hubbard and Hubbard, Vector Calculus, Linear Algebra, and Differential Forms.
[2] Tao, Analysis I.
[3] Stitz and Zeager, Precalculus.
[4] Fong and Spivak, An Invitation to Applied Category Theory.
[5] Stitz and Zeager, Precalculus.
[6] Thurston, "On Proof and Progress in Mathematics."
[7] Siksek, "Introduction to Abstract Algebra."
[8] Gordon, "The integrals of Lebesgue, Denjoy Perron, and Henstock."
[9] Milo and Phillips, Cell Biology by the Numbers.
[10] Penrose, The Road to Reality.
[11] Tong, "University of Cambridge Part IA Mathematical Tripos."
[12] Halliday, Resnick, and Walker, Fundamentals of Physics.
[13] Axler, Linear Algebra Done Right.
「再努力点」在某些情况下可能是个糟糕的策略
原文:Certain ways that “try harder” can be a bad strategy
「再努力点!」你对自己说,仿佛五分钟后的自己会认真对待这个指令。殊不知,那个「未来版」的你根本不在乎「现在版」的你——在他们眼中,此刻的你不过是遥远过去里模糊的剪影。
「再努力点!」你对自己说,你假定努力的感觉就是创造成果的过程。殊不知,此时努力的感觉是由多余的动作造成的。就像为了想出更好的点子而拼命皱眉。
「再努力点!」你对自己说,实则通过增加痛苦感来劝退你做你害怕做的事。
「再努力点!」你对自己说,视野收窄之际,却漏看了更重要的事情。
「再努力点!」你对自己说,只因觉得若不经历外人眼中的「苦劳」,就不配获得奖赏。不知何故,你总认为轻松创造价值是一种欺骗,尤其是当这种轻松还能带来回报时。
「再努力点!」你对自己说,聪明地避开天生擅长之事(因其太容易),转而死磕天生短板(因其够艰难)。
「再努力点!」你对自己说,你以为自己是在精益求精,而不是画蛇添足、亲手毁掉作品浑然天成的灵气。
「再努力点!」你对自己说,却错过了懒惰可能催生的优雅解决方案。
「再努力点!」你对自己说,在平庸方法论里榨取着边际效益,却不愿另寻高效途径。
「再努力点!」你对自己说,试图装作很有动力去完成眼前的任务。但实际上,你对自己根本不关心这件事感到内疚,而对自己大吼大叫比承认这个事实要容易得多。
「再努力点!」你对自己说,只因不愿承认该向更擅长此事者求助,或该把任务交给更适合的人。
「再努力点!」你对自己说,以为脑中声音能指挥此刻真正掌权的潜意识。殊不知,此刻你的意识就像握着断线游戏手柄却浑然不觉的孩童。
本文灵感源自 Misha Glouberman 的观点,摄影作品由 Daido Moriyama 提供。
教育军备竞赛正在让韩国破产
原文:Education arms race is bankrupting Korea - The Korea Times
作者:Shin Hyun-gook
「眼下,全球范围内正上演着一场教育军备竞赛——从中国到德国,从印度到韩国,各国都在争先恐后。」这是美国总统奥巴马在 2010 年底的一次演讲中提到的,当时美国国会正考虑削减教育预算。他进一步强调,哪个国家能培养出最优秀的下一代,哪个国家就将在 21 世纪引领全球经济。
就在这番话的前一年,奥巴马总统在华盛顿参加「教育创新」运动论坛时,他提到:「韩国经济在过去 40 年里能够飞速发展,得益于韩国父母对教育的执着追求。」
的确,韩国的一些高学历精英对国家经济的腾飞功不可没。但在经济发展的这几十年里,韩国父母对学术「精英」和「攀比」的迷信,催生了一场内涵不同的「教育军备竞赛」。家长们的苛求,已成为韩国教育的一大难题。为了让孩子从名校毕业,将来能找到好工作,家长们不惜重金聘请私教或家教。有的家长甚至不惜超出自己的经济能力,只因周围人都在这么做让他们压力山大。教育的高昂成本,被视为导致韩国家庭规模缩小、生育率下降的直接原因。对教育的狂热,已演变成韩国社会的一种病态。
教育军备竞赛,加上高昂的住房成本,在双重重压之下,韩国中产家庭的经济负担日益沉重。在住房和教育上的非理性开销,加之工资长放缓等其它不利的经济现象,韩国的中产阶级正逐渐萎缩,不少家庭濒临破产的边缘。
拥有高等教育学位的韩国年轻人越来越多,好工作却愈发难寻,竞争日益激烈。在韩国,学历的光环已不再是长期收入稳定的保证。
麦肯锡全球研究所最近发布的《超越韩国模式:塑造新的增长点》报告指出,越来越多的迹象显示,韩国的高等教育体系并未达到学生、家长和雇主的预期。2012 年,韩国大学毕业生的就业率仅为 60%,远低于职业高中毕业生的 80%。更令人担忧的是,高昂的教育成本使得私立教育的终身收益受到质疑。私立大学毕业生的终身收入净现值,甚至不及高中文凭持有者。
教育创新刻不容缓。家长们应摒弃旧观念,不再认为只有名校才能铺就孩子的成功之路。教育部应考虑改革大学招生制度,让更多学子有机会踏入大学校门。同时,借鉴他国优秀的职业教育体系,为学生提供更多高质量的职业教育资源、教学和实习机会。韩国的企业也应与学校携手,共同打造与工作相关的课程,为学生的未来铺路。
韩国的年轻一代,他们是国家的未来,理应接受良好的教育,追逐并实现自己的梦想。他们不应成为无休止的精英竞争的牺牲品,也不应为了父母的面子和荣誉而牺牲自己。
年轻的学子们,不应因繁重的课外辅导而熬夜,导致在公交车上或课堂上打瞌睡。他们的面庞本应洋溢着梦想的光芒。现在,是时候遏制这场教育军备竞赛,拯救韩国中产阶级免于破产的命运了。
本文作者是韩国大邱天主教大学的讲席教授,之前曾担任韩国海外信息服务处的外国新闻部门负责人。他的电子邮件地址是 shinhyungook@hotmail.com。
有效的间隔重复
原文:Effective Spaced Repetition (borretti.me)
你不会因为钻研智商测试或者拉小提琴而变得更聪明,Dual n-back 训练也大概不会提升你的工作记忆。但你可以通过间隔重复记住你想记住的任何东西。
间隔重复,无疑是我迄今为止使用过的最有效的认知技巧。曾经,我读过一本书后几乎什么都记不住。有时我会用 Kindle 标注重点,或者做些笔记,但从不复习它们。我曾天真地希望,即便我不能准确地说出我记住的内容(毕竟谁的记忆里是有索引的呢?),但重要的信息也能不知不觉地融入了我的知识体系,成为隐性知识。然而,这种想法大多只是自我安慰罢了。
我热爱学习,而间隔重复极大地提升了我的学习效果。然而,掌握这种方法的精髓并非一朝一夕之事。尽管网上充斥着大量如何高效应用间隔重复的建议,但这些建议往往停留在宏观原则层面,鲜少涉及具体实例。实际上,学习者最常遇到的困惑是:如何将一个具体而明确的知识点恰当地转化为一组抽认卡?
这篇文章描述了我用来撰写有效的抽认卡的规则,并尽可能提供了许多合理的例子。
间隔重复概述
这个想法在操作上非常简单:当你学习新知识时,你会制作抽认卡,每张卡片都包含一个问题和对应的答案。随后进行复习:先看卡片正面的问题,尝试回忆答案,再翻到背面查看正确答案。最后进行自我评分:判断你的回忆是否准确。
如果你一直回忆正确,那么你的复习间隔就会越来越长;反之则越来越短。
有些人使用纸质卡片,而大多数人则使用像 Anki 这样的软件,因为其算法能高效地安排复习,避免对材料过度复习。除非你特别偏爱纸质材料,否则建议选择软件。
限制因素
如果间隔重复真的如此高效,为什么它还没有像喝咖啡那样普遍?就像说:你这么聪明,为啥没有变富呢?
间隔重复的有效实践主要受到两个因素的限制。
习惯养成
间隔重复要发挥作用,关键在于将其转化为日常习惯。比如,我把抽认卡复习作为每天早晨例行活动的一部分。然而,养成新习惯本身就是一个挑战,对于患有注意力缺陷多动障碍(ADHD)或缺乏自律性的人来说,这个过程可能更为艰难。
每天坚持复习的必要性源于间隔重复算法的工作机制。这个算法会自动为你安排复习计划,免去了手动安排的麻烦。然而,只有在打开应用程序时,你才能知道当天需要复习哪些卡片。如果某天漏掉了复习,未复习的卡片会累积到下一天,增加次日的复习量。
一种常见的失败模式(我在熟练使用之前也多次陷入这种情况)是:使用 Anki 两周后中断,半年后重新拾起时发现积累了 600 张待复习的卡片。这种情况不仅打击学习积极性,更违背了间隔重复的核心原则——按照算法设定的最佳时间间隔进行复习。
对于这种情况,我能给出的建议有限。但如果你长期存在自律性不足的问题,或有未经治疗的注意力缺陷多动障碍(ADHD)等情况,那么在开始使用间隔重复法之前,最好先着手解决这些问题。
卡片的写作技巧
制作有效的抽认卡是一门需要时间习得的技巧。在我开始系统性使用间隔重复法的头四到六个月里,制作的大部分卡片事实上都不太实用,这种情况可能会让人感到沮丧。撰写这篇文章的主要目的是分享我的经验,希望能帮助你从一开始就能有效地运用间隔重复。
其中一个令人沮丧的原因是,在最初几周内(当你高频率地复习卡片时),你通常会记得这些抽认卡片,但几个月后,你开始回忆失败。它没有在你的长期记忆中扎根,因为在某种程度上写得不好。这种长周期的反馈意味着你需要一定的时间来通过试错来学习这些技巧。
鼓励的话
学习是一种自动、本能的过程,是智力的基本特征。学校教育如此糟糕,以至于人们认为必须拥有特殊类型的大脑才能有效学习,而且「学习」这个概念会引起人们的反感,这充分说明了教育的失败。请记住费曼的话:「一个傻瓜能做到的事情,另一个傻瓜也能做到」。
规则
以下是关于高效间隔重复学习的规则。
规则按适用性进行排序(但不一定按重要性排序),通用性的规则排在前面,而最具体的规则排在后面。
由于许多例子涉及同时使用多条规则,所以我决定将例子与规则列表分开列出。
规则:先理解
不要试图记忆你不理解的内容。、在将概念转化为记忆之前,你应该首先确保这些概念在你的头脑中是清晰的。这里的「清晰」可能因人而异,没有固定标准。我通常采用的方法是:深入挖掘、拓展并厘清文本内容,直到我感到对这一概念领域有了充分的把握,之后才开始制作抽认卡。
通常,在阅读一本书的同时你无法写下抽认卡,因为之后的信息可能会阐明或联系重要的概念。一个好方法是在阅读一章节时将临时抽认卡写在便签上,最后你可以整理和重组便签,直到你能够记忆这些内容。
规则:保持诚实
软件并不知道你是否正确地回忆了某些内容。你只对自己负责。如果你回忆错了,或者记得不太对,谨慎起见,请标记为「忘记」。
规则:保持学习乐趣
这对于保持学习习惯至关重要。如果复习抽认卡感觉像一项琐事,你会对此产生厌恶情绪。
我以前经常出现这个问题。我用了几种方法解决它:
-
拥有一个多元的知识库。保持正在学习的内容有多个主题,这样你不会因为长时间浏览相同主题而感到厌倦。通常,间隔重复软件会对卡片进行洗牌,如果你将所有牌组混合学习便可经常感到惊喜。
-
常见的挫败源是卡片太长,无法快速回忆,因此感觉像一项琐事。将大卡片拆分为小卡片,快速地翻过卡片会让你感觉很好。
-
难以回忆的卡片非常令人沮丧。我通过应用本文中描述的规则解决了这个问题。
规则:自我重复
记忆状况取决于重复次数和学习量。单张卡片要言简意赅,但整副卡组可以根据你的需要重复任意多次。
规则:按来源组织内容
按来源组织内容,而不是按主题。
原因是你经常会从多个来源获得信息:多本教科书,再加上维基百科,再加上讲义等等。每个来源可能有不同的知识组织方式。
不要浪费时间试图找到完美的组织方式。
为每个来源建立一个牌组。对于教科书,为每章节建立一个子牌组。对于数学教科书,可能在每个章节中再建立一个子子牌组,用于放置定理抽认卡。
这也让你更容易跟踪自己对一本教材的学习进度。
规则:编写原子化的抽认卡
抽认卡应该简短。它们应该涉及尽可能少的信息。它们应该像化学键一样,将独立的 原子知识 连接起来。
**这是最重要的事情。**把太多内容放在一张抽认卡上非常糟糕。
这个规则有两个原因:
-
大的卡片更难记忆。
-
客观评估自己的掌握程度比较困难:揭示答案时,你可能有些地方答对了,有些地方答错了。如果你点击「忘记」,就会过度复习已经掌握的部分。如果点击「记住」,又会对遗忘的内容复习不足。
这条规则有一个例外:如果你有一些小卡片,它们加起来包含了同样的信息,那么你也可以使用大卡片。你可以把大卡片看作是在测试你能否整合小卡片上的信息。
规则:双向提问
在可能的情况下,以两个方向来提问。
每当你遇到需要定义的术语时,最显而易见的做法就是根据术语来询问其定义。比如说:
问:群的阶是什么?
答:它的基。
但你也可以通过定义询问术语,例如:
问:群的基的术语是什么?
答:群的阶。
当遇到一些数学符号时,比如表示实数的 $\mathbb{R}$,或者表示向量空间维数的 $\dim V$,你自然会想问这些符号是什么意思。
问:符号 $\mathbb{R}$ 代表什么?
答:实数集。
你也可以反过来问问题:
问:表示实数集的符号是什么?
答:$\mathbb{R}$
规则:提问方式多样化
用多种方式提问。询问术语的正式定义和通俗解释。询问定理的严格表述和直观描述。正向反向都要提问。添加一些背景性的问题,比如「[某个概念]的直观理解是什么?」。还要提出一些能够将你知识图谱中不同概念联系起来的问题。
你的知识图谱之间的相互关联越多越好。
规则:概念图谱
把你正在学习的概念视为一张图谱可能会有所帮助。在这张图谱中,每个节点代表一个具有特定属性的独立概念。而图谱中的边则是引导你从一个概念到另一个概念的问题。
规则:学习层次结构
许多知识都具有层次结构,比如「某个概念可以分为 A、B 或 C 几种类型」,或者反过来说,「A 是某个概念的一种」。这与面向对象编程中的概念类似:这些知识通过上下级关系相互联系。
关键是要从两个方向提问:自上而下「这个概念包含哪些子类?」和自下而上「这个具体类型属于哪个更大的概念?」。
这种思路与保持记忆卡片内容精炼的原则是一致的。即使某些信息本身并不是层次结构,将大型记忆卡片拆分成更小的卡片,实际上就是在构建一个卡片的层次体系。
规则:学习序列
为了高效记忆一个序列 $(A_1, \dots, A_n)$,,你需要对 $i \in [1,n]$ 生成以下抽认卡:
| 问题 | 答案 |
| -------------------------------- | --------- |
| 第 $i$ 个元素是什么? | $A_i$ |
| $A_i$ 在序列中的位置? | $i$ |
| Ai 的下一个元素? | $A_{i+1}$ |
| $A_i$ 的前一个元素? | $A_{i-1}$ |
除此之外,你可能还需要:
-
一张测试卡片:考察你从头到尾背诵整个序列的能力。
-
一套完形序列卡片:将序列中的元素挖空,根据上下文填空,测试对整个序列的掌握情况。
你可以使用序列脚本自动生成上述抽认卡。
至于采用多全面的卡片组合,取决于所学习知识的性质。我个人在大多数情况下会使用完形卡片和测试卡片。
你可能会使用另一种类型的记忆卡片(我用这种方法来背诵诗歌)。这种卡片会提供一些上下文信息(序列中的前一个或两个项目),然后要求你填空。例如,如果你想学习序列(A,B,C,D),你可能会制作如下抽认卡:
| 问题 | 答案 |
| ----------------- | ------ |
| 开始,… | A |
| 开始,A,… | B |
| A,B,… | C |
| B,C,… | D |
有一个诗歌脚本可以帮你自动生成这些卡片。
示例
以下许多例子可能过于详尽:我们制作的抽认卡数量远超主题实际所需。但这是为了阐释一般规则。随着经验的积累,你会逐渐掌握某个特定主题需要多少问题,而且你的知识网络中不同部分之间的联系程度也会有所不同。
示例:岩浆的形成
以下内容摘自我的地质学笔记:
岩浆是存在于地球表面以下的液态岩石。
形成岩浆的三个过程是:
-
**温度升高:**温度升高可以使岩石熔化。
-
**压力降低:**当压力降低时,原子能够更自由地移动,岩石就会转变为液态。
-
**加入水分:**水能降低岩石的熔点,因为水分子会破坏岩石的晶体键。
岩浆在三个地方形成:
-
热点: 地球深部的高温岩石在上升过程中,由于周围压力逐渐降低,最终熔化形成岩浆。
-
裂谷带: 当地壳板块分离时,下方密度较小的热岩石会上升填充裂隙。随着压力减小,这些岩石开始熔化。
-
俯冲带: 含水量丰富的海洋板块下沉至地幔。水分受热后上升,渗入上方的岩石中,引发岩石熔化。
让我们系统地整理这些信息。我们需要记住三个要点:
-
岩浆的定义
-
岩浆的形成过程
-
岩浆的形成地点
首先是岩浆的定义:
| 问题 | 答案 |
| ------------------------------------------------------------ | -------------------------------------- |
| 岩浆是什么? | 地球表面以下的熔融岩石。 |
| 地球表面以下的熔融岩石叫什么? | 岩浆。 |
接下来,我们需要了解岩浆的形成过程。值得注意的是,我们应该将形成过程列表和其详细解释分开,以保持每个学习要点的简洁性。
因此,我们先列出岩浆的形成机制:
| 问题 | 答案 |
| ------------------------------------- | ------------------------------------------------------------ |
| 岩浆形成的主要过程有哪些? | 温度升高、压力降低以及水的加入。 |
接下来,我们需要对每个过程进行详细解释。关于温度升高导致岩石熔化这一点,我们无需多作解释:
| 问题 | 答案 |
| ------------------------------------------------------ | ------------------------------------------------------------ |
| 为什么压力降低会导致岩石熔化? | 因为岩石中的原子获得了更大的运动自由度 |
| 为什么加入水会降低岩石的熔点? | 因为水分子会破坏岩石矿物中的化学键 |
第三:岩浆形成的地点。我们同样将地点列表与具体细节分开:
| Question | Answer |
| ---------------------- | ------------------------------------------------------- |
| 岩浆主要在哪些地方形成? | 地幔热点区域、地壳裂谷带和板块俯冲带。 |
然后我们深入探讨细节。对于每个岩浆形成的地点,我们需要了解其中涉及的具体过程,以及完整的因果关系。同时,我们还会反过来思考:哪些地质环境涉及了特定的岩浆形成过程。
| 问题 | 答案 |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
| 热点区域的岩浆形成过程是什么? | 减压熔融。 |
| 裂谷带的岩浆形成过程是什么? | 减压熔融。 |
| 俯冲带的岩浆形成过程是什么? | 温度升高和水分增加。 |
| 哪些地质环境下会因压力释放而形成岩浆? | 热点和裂谷带。 |
| 哪些地质环境下会因温度升高和水分增加而形成岩浆? | 俯冲带。 |
| 热点地区的岩浆是如何形成的? | 当高温地幔物质上涌时,压力降低导致其发生熔融。 |
| 裂谷带的岩浆是如何形成的? | 当板块分离时,高温岩石上涌填充裂隙,压力降低导致其发生熔融。 |
| 俯冲带的岩浆是如何形成的? | 含水的地壳俯冲到地幔中,水转化为蒸汽并上升,水分的加入使上覆岩石发生熔融。 |
我们可以这样可视化所得到的知识图谱:
示例:板块构造理论
以下是关键信息:
地球表面的地壳板块在相互接触的区域形成「板块边界」。板块边界可以分为三种类型:
-
汇聚型边界:两个板块相互靠近并发生碰撞。
-
离散型边界:两个板块相互分离,向相反方向移动。
-
转换型边界:两个板块沿着边界平行滑动。
遵循抽认卡双向设计的原则,我们为「板块边界」这一概念制作两张抽认卡:
| 问题 | 答案 |
| ---------------------------------------------------------- | ------------------------------------- |
| 什么是板块边界? | 地壳板块相互接触的区域。 |
| 地壳板块相互接触的区域被称为什么? | 板块边界。 |
关于不同类型的板块边界,我们只需从概念到具体类型的方向提问(无需问「什么是转换型边界?」因为名称本身已经揭示了其性质):
| 问题 | 答案 |
| ------------------------------------- | --------------------------------- |
| 板块边界有哪几种类型? | 汇聚型边界、离散型边界和转换型边界。 |
对于每种类型的板块边界,我们同样采用两种提问方式:
| 问题 | 答案 |
| -------------------------------------------------------- | -------------------------------------------- |
| 定义:汇聚型边界 | 构造板块相互靠近并碰撞的区域。 |
| 定义:离散型边界 | 构造板块相互远离的区域。 |
| 定义:转换型边界 | 构造板块沿着边界相对滑动的区域。 |
| 构造板块相互靠近的地质现象称为什么? | 汇聚型边界。 |
| 构造板块相互远离的地质现象称为什么? | 离散型边界。 |
| 构造板块相对滑动的地质现象称为什么? | 转换型边界。 |
图示展现了这些问题如何在知识图谱中连接各个概念:
示例:神经细胞
神经系统中的细胞主要分为两类:神经元和神经胶质细胞。神经胶质细胞可进一步分为大胶质细胞和小胶质细胞。其中,大胶质细胞又包括三种类型:星形胶质细胞、少突胶质细胞和施万细胞。
这种结构可以通过以下图示直观地呈现:
基于这种层级结构,我们可以设计一些由上至下的问题:
| 问题 | 答案 |
| ---------------------------------------------- | ------------------------------------------------ |
| 神经系统由哪些类型的细胞构成? | 神经元和胶质细胞。 |
| 胶质细胞可以分为哪些类型? | 小胶质细胞和大胶质细胞。 |
| 大胶质细胞包括哪些类型? | 星形胶质细胞、少突胶质细胞和施万细胞。 |
以下是一些自下而上的问题。当答案明显时,我们通常不会问这些问题。例如,「小胶质细胞/大胶质细胞属于什么类型」这个问题的答案是显而易见的。
| 问题 | 答案 |
| ------------------------------- | ---------- |
| 星形胶质细胞属于哪一类? | 大胶质细胞。 |
| 少突胶质细胞属于哪一类? | 大胶质细胞。 |
| 施万细胞属于哪一类? | 大胶质细胞。 |
示例:神经元类型
这是一个简短的例子,说明如何保持卡片内容简洁,并使用层级结构来分解复杂信息。
以下是我的神经科学笔记摘录:
神经元可以根据其功能分为三类:
-
**感觉神经元:**将感觉信息传入大脑。
-
**运动神经元:**向肌肉发送运动指令。
-
中间神经元:
在中枢神经系统内部进行连接。这类神经元可进一步分为:
-
**局部:**与周围神经元形成局部回路。
-
**中继:**具有长轴突,负责在不同脑区之间传递信息。
-
让我们先从一个错误的示范开始,即在一张卡片中塞入过多信息。
| 问题 | 答案 |
| --------------------------------------------- | ------------------------------------------------------------ |
| 神经元的功能类别有哪些? | 感觉神经元:负责将感觉信息传入大脑。
运动神经元:负责向肌肉发送运动指令。
中间神经元:负责在中枢神经系统内部进行连接。
(😩太长了) |
|中间神经元有哪些不同类型? | 局部:与附近的神经元形成神经回路。
中继:具有较长的轴突,负责不同脑区之间的信息传递。
(😩太长了) |
现在,让我们将术语与定义分开:
| 问题 | 答案 |
| --------------------------------------------- | ------------------------------------------------------------ |
| 神经元可以分为哪几类主要功能类型?| 感觉、运动和中间。|
| 感觉神经元的主要功能是什么?| 将外界环境的信息传入大脑的神经元。|
| 运动神经元的主要作用是什么?| 将大脑的指令传递给肌肉的神经元。|
| 中间神经元在神经系统中扮演什么角色?| 在中枢神经系统内部进行信息传递和处理的神经元。|
| 中间神经元可以细分为哪两种类型?| 局部和中继。|
| 局部中间神经元的主要特征是什么?| 与附近的神经元形成局部神经回路的中间神经元。|
| 中继中间神经元的关键特点是什么?| 具有较长的轴突,能够在不同脑区之间传递信息的中间神经元。 |
现在我们进行反向提问:请根据给出的定义回答相应的神经科学术语。
| 问题 | 答案 |
| ------------------------------------------------------------ | ------------------ |
| 将信息传入大脑的神经元称为什么? | 感觉神经元。 |
| 向肌肉发送指令的神经元称为什么? | 运动神经元。 |
| 在中枢神经系统内部相互连接的神经元称为什么? | 中间神经元。 |
| 与周围神经元形成局部回路的中间神经元称为什么? | 局部中间神经元。 |
| 在大脑不同区域之间传递信息的中间神经元称为什么? | 中继中间神经元。 |
示例:向量空间
以下是我们将要学习的内容:
简单来说,向量空间是一个集合,其中的元素称为向量,这些向量可以进行加法运算和数乘运算。
更严格的数学定义是:在数域 $\mathbb{F}$ 上的向量空间是一个集合 $V$,以及两种运算:
-
向量加法:$V \times V \to V$
-
标量乘法:$V \times \mathbb{F} \to V$
这两种运算需要满足以下公理:
-
加法交换律
$u + v = v + u$
-
加法结合律
$u + (v + w) = (u + v) + w$
-
加法单位元
$\exists 0 \in V : v + 0 = v$
-
加法逆元
$\forall v \in V, \exists -v \in V : v + (-v) = 0$
-
标量乘法单位元
$1v = v$
-
分配律
$\forall v \in V, a,b \in \mathbb{F} : (a+b)v = av + bv$
我们需要将其分解。让我们一步一步来。
首先,我们要区分非正式(直观)定义和正式定义:
| 问题 | 答案 |
| ----------------------------------- | ------------------------------------------------------------ |
| 简单来说,什么是向量空间? | 向量空间是一个数学概念,它描述了一个包含特定元素(称为向量)的集合。这些向量可以相互相加,也可以被数字(称为标量)放大或缩小。 |
| 从数学角度严格定义,什么是向量空间? | 在数学中,向量空间是指在某个数域 $\mathbb{F}$ 上定义的一个集合 $V$,其配备了两种基本运算:向量加法和标量乘法。 |
我们添加了一个关于符号的简短问题(你可以选择跳过这个问题,这是一个示例):
| 问题 | 答案 |
| ----------------------------------------------- | -------- |
| 向量空间的元素叫什么?| 向量。|
关于运算符号的问题:
| 问题 | 答案 |
| ----------------------------------------------- | --------------------------- |
| 向量加法运算的数学表示是什么? | $V \times V \to V$ |
| 标量乘法运算的数学表示是什么? | $V \times \mathbb{F} \to V$ |
关于公理的问题:
| 问题 | 答案 |
| ----------------------------------------------- | ------------------------------------------------------------ |
| 定义向量空间的基本公理有哪些? | 1. 加法交换律
2. 加法结合律
3. 加法单位元
4. 加法逆元
5. 标量乘法的单位元
6. 分配律 |
最后,让我们来询问每个公理的具体含义:
| 问题 | 答案 |
| ----------------------------------------------- | -------------------------------------------------------- |
| 向量空间公理:加法交换律 | $u + v = v + u$ |
| 向量空间公理:加法结合律 | $u + (v + w) = (u + v) + w$ |
| 向量空间公理:加法零元 | $\exists 0 \in V : v + 0 = v$ |
| 向量空间公理:加法逆元 | $\forall v \in V, \exists -v \in V : v + (-v) = 0$ |
| 向量空间公理:标量乘法的单位元 | $1v = v$ |
| 向量空间公理:分配律 | $\forall v \in V, a,b \in \mathbb{F} : (a+b)v = av + bv$ |
下图可以帮助你直观地理解这些抽认卡及其之间的关系:
为了更全面地掌握这些概念,你还可以创建反向问题:
| 问题 | 答案 |
| ------------------------------------------------------------ | ------------------------- |
| 什么是允许其元素进行加法和数乘运算的集合? | 向量空间 |
| 请给出这个公理的名称:$u + v = v + u$| 加法交换律 |
| 请给出这个公理的名称:$u + (v + w) = (u + v) + w$| 加法结合律 |
| 请给出这个公理的名称:$\exists 0 \in V : v + 0 = v$ | 加法单位元 |
请给出这个公理的名称:$\forall v \in V, \exists -v \in V : v + (-v) = 0$ | 加法逆元 |
| 请给出这个公理的名称:1v=v | 标量乘法的单位元 |
| 请给出这个公理的名称:$\forall v \in V, a,b \in \mathbb{F} : (a+b)v = av + bv$ | 分配律 |
示例:奇偶群
奇偶群是一个简单而富有洞察力的群论例子,它描述了偶数和奇数相加的规律。该群的基础集合为{偶,奇},其中「偶」表示所有偶数,「奇」表示所有奇数。群的运算表如下:
| + | 偶 | 奇 |
| ---- | ---- | ---- |
| 偶 | 偶 | 奇 |
| 奇 | 奇 | 偶 |
「偶」是单位元。这个群是阿贝尔群。
我们可以创建相应的抽认卡:
| 问题 | 答案 |
| ------------------------------------------------- | ------------------------------------------------------------ |
| 什么是奇偶群? | 一个描述偶数和奇数加法规则的群。 |
| 奇偶群的阶是多少? | 2 |
| 奇偶群的基础集合是什么? | {偶,奇} |
| 奇偶群的单位元是什么? | 偶 |
| 奇偶群的运算是什么? | 基于偶数和奇数的加法规则 |
| 偶 + 偶 = | 偶 |
| 偶 + 奇 = | 奇 |
| 奇 + 偶 = | 奇 |
| 奇 + 奇 = | 偶 |
| 奇偶群是否为阿贝尔群?为什么? | 是的,因为满足加法交换律。 |
示例:逻辑后果
摘自我的逻辑学笔记:
逻辑后果的两个概念是:
-
**语义后果:**如果在所有使 $P$ 为真的解释中,$Q$ 也必定为真,那么 $Q$ 是 $P$ 的语义后果。这种关系用符号 $P \models Q$ 表示。
-
**句法后果:**如果存在一个从 $P$ 到 $Q$ 的证明,那么 $Q$ 是 $P$ 的句法后果。这种关系用符号 $P \vdash Q$ 表示。
简而言之,语义后果关注的是命题在各种可能解释下的真值关系,而句法后果则聚焦于命题之间的形式化推理过程。
让我们从最基本的问题入手:
| 问题 | 答案 |
| ------------------------------------------------ | ----------------------- |
| 逻辑后果的两个核心概念是什么? | 语义后果和句法后果。 |
接下来,我们将深入探讨与语义后果相关的具体问题:
| 问题 | 答案 |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
| 请定义语义后果。 | 如果在所有使 $P$ 为真的解释中,$Q$ 也必定为真,那么 $Q$ 是 $P$ 的语义后果。 |
| 用什么符号表示「$Q$ 是 $P$ 的语义后果」? | $P \models Q$ |
| $P \models Q$ 表达了什么意思? | $Q$ 是 $P$ 的语义后果 |
| 语义后果是通过什么来连接句子的? | 解释。 |
| 在逻辑后果的概念中,哪一种涉及到解释? | 语义后果。 |
然后是句法结果:
| 问题 | 答案 |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
| 请定义句法后果 | 如果存在一个从 $P$ 到 $Q$ 的证明,那么 $Q$ 是 $P$ 的句法后果。 |
| 用什么符号表示「$Q$ 是 $P$ 的句法后果」? | $P \vdash Q$ |
| $P \vdash Q$ 表达了什么意思? | $Q$ 是 $P$ 的句法后果 |
| 句法后果是通过什么来连接句子的? | 证明。 |
| 在逻辑后果的概念中,哪一种涉及到证明? | 句法后果。 |
示例:时期划分
时间线是一个绝佳的例子,展示了如何通过层次化分解信息来帮助我们学习长序列。有时这种分解工作已经为我们事先完成了。
地质年代表(GTS)将地球的地质历史记录划分为四个相互嵌套的时间单位:
-
宙是最大的时间单位,每个宙持续数亿年之久。
-
宙进一步细分为若干个代,每个代的持续时间从数千万年到数亿年不等。
-
代再往下划分为纪,每个纪的时间跨度从数百万年到数千万年不等。
-
最后,纪被细分为世,每个世持续数十万年到数百万年。
地球历史上的四个宙,按从最古老到最近的顺序排列如下:
-
冥古宙(从 45 亿年前到 40 亿年前)
-
太古宙(从 40 亿年前到 25 亿年前)
-
元古宙(从 25 亿年前到 5.38 亿年前)
-
显生宙(从 5.38 亿年前持续至今)
我们需要了解以下三个方面:
-
地质年代表的定义。
-
地质年代表如何划分地球的历史。
-
地球历史中的四个宙。
让我们从最基本的概念入手,即地质年代表的定义:
| 问题 | 答案 |
| ----------------------------------------------------- | -------------------------------- |
| 地质年代表是什么? | 地球历史的时间线。 |
| 地球历史的时间线被称为什么? | 地质年代表。 |
地质时间单位按从大到小的顺序排列为:宙、代、纪、世。我们可以使用序列脚本来生成相关的学习卡片。以下是输入数据:
地质时间单位
宙
代
纪
世
运行 cat units.txt | ./sequence.py > units.csv
,然后将 units.csv
导入到Mochi,我们就能得到这些抽认卡:
| 问题 | 答案 |
| ------------------------------------------------------------ | ------------------------ |
| 地质时间单位: 请按从大到小的顺序列出所有单位 | 宙、代、纪、世。 |
| 地质时间单位: 最大的时间单位是什么? | 宙。 |
| 地质时间单位: 第二大的时间单位是什么? | 代。 |
| 地质时间单位: 第三大的时间单位是什么? | 纪。 |
| 地质时间单位: 最小的时间单位是什么? | 世。 |
| 地质时间单位: 宙在序列中排第几? | 第1位。 |
| 地质时间单位: 代在序列中排第几? | 第2位。 |
| 地质时间单位: 纪在序列中排第几? | 第3位。 |
| 地质时间单位: 世在序列中排第几? | 第4位。 |
| 地质时间单位: 宙的下一级单位是什么? | 代。 |
| 地质时间单位: 代的下一级单位是什么? | 纪。 |
| 地质时间单位: 纪的下一级单位是什么? | 世。 |
| 地质时间单位: 代的上一级单位是什么? | 宙。 |
| 地质时间单位: 纪的上一级单位是什么? | 代。 |
| 地质时间单位: 世的上一级单位是什么? | 纪。 |
其实你不需要全部都记。以下几张可能就足够了:
| 问题 | 答案 |
| ------------------------------------------------------------ | ----------------------- |
| 地质年代单位的层级是什么,从大到小排列? | 宙、代、纪、世。 |
| 地质年代中最大的时间单位是什么? | 宙。 |
| 地质年代中第二大的时间单位是什么? | 代。 |
| 地质年代中第三大的时间单位是什么? | 纪。 |
| 地质年代中最小的时间单位是什么? | 世。 |
既然这是一个概念层级结构,我们还需要了解每个单位的定义:
| 问题 | 答案 |
| ------------------ | -------------------------------------- |
| 什么是宙? | 地质年代划分的一个单位。 |
| 什么是代? | 地质年代划分的一个单位。 |
| 什么是纪? | 地质年代划分的一个单位。 |
| 什么是世? | 地质年代划分的一个单位。 |
另外,由于每个单位都有其持续时间,我们还需要了解它们的时间跨度。这个问题可以从正反两个方向来提出:
| 问题 | 答案 |
| ------------------------------------------------------------ | ------------------------------------------- |
| 一个宙的持续时间是多久? | 数亿年。 |
| 哪个地质年代单位持续数亿年? | 宙。 |
| 一个代的持续时间是多久? | 数千万至数亿年。 |
| 哪个地质年代单位持续数千万至数亿年? | 代。 |
| 一个纪的持续时间是多久? | 数百万至数千万年。 |
| 哪个地质年代单位持续数百万至数千万年? | 纪。 |
| 一个世的持续时间是多久? | 数十万至数百万年。 |
| 哪个地质年代单位持续数十万至数百万年? | 世。 |
接下来我们将讨论四个宙。这些宙构成了一个序列,我们不会再完整地走完整个流程,因为你可能已经再次使用了这些:
| 问题 | 答案 |
| ------------------------------- | ------------------------------------------ |
| 请按从最古老到最新的顺序列出地球历史的宙 | 冥古宙、太古宙、元古宙、显生宙 |
| 第一个宙是什么? | 冥古宙 |
| 第二个宙是什么? | 太古宙 |
| 第三个宙是什么? | 元古宙 |
| 第四个宙是什么? | 显生宙 |
我们也会问每个宙的开始和结束,前驱和后继:
| 问题 | 答案 |
| ------------------------------- | ----------- |
| 冥古宙从何时开始? | 45 亿年前 |
| 冥古宙在何时结束? | 40 亿年前 |
| 哪个宙开始于 45 亿年前? | 冥古宙 |
| 哪个宙结束于 40 亿年前? | 冥古宙 |
| 太古宙的起始时间是? | 40 亿年前 |
| 太古宙的终止时间是? | 25 亿年前 |
| 40 亿年前开始的是哪个宙? | 太古宙 |
| 25 亿年前结束的是哪个宙? | 太古宙 |
| 元古宙从何时开始? | 25 亿年前 |
| 元古宙在何时结束? | 5.38 亿年前 |
| 25 亿年前开始的是哪个宙? | 元古宙 |
| 5.38 亿年前结束的是哪个宙? | 元古宙 |
| 显生宙的开始时间是? | 5.38 亿年前 |
| 显生宙何时结束? | 现在(仍在持续) |
| 5.38亿年前开始的是哪个宙? | 显生宙 |
| 目前仍在持续的宙是哪一个? | 显生宙 |
示例:有理数
让我们将这个概念提交到间隔重复中:
有理数集合,用符号 $\mathbb{Q}$ 表示,是所有可以表示为分数形式的数的集合,其中分子和分母都是整数,且分母不能为零。
用数学语言严格定义如下:
$$
\mathbb{Q} = \left{, \frac{p}{q} ,, \middle| ,, p, q \in \Z \land q \neq 0 ,\right}
$$
这里的 $\mathbb{Q}$ 代表「商」(quotient)。
在设计抽认卡时,我们可以通过概念图来直观地展示学习内容。首先,我们从核心概念——有理数开始:
接着,我们添加一个表示符号的节点,并通过两个相互关联的问题将其连接:
| 问题 | 答案 |
| ----------------------------------------------------- | ---------------------------- |
| 有理数集合的数学符号是什么? | $\mathbb{Q}$ |
| 数学符号 $\mathbb{Q}$ 表示什么? | 有理数集合 |
最后,我们可以加入有理数的严格定义和通俗解释:
| 问题 | 答案 |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
| 通俗地说,有理数集是什么? | 有理数集是由所有可以表示为分数形式的数组成的集合,其中分子和分母都是整数,且分母不为零。 |
| 数学上严格定义,有理数集是什么? | $$\mathbb{Q} = \left{, \frac{p}{q} ,, \middle| ,, p, q \in \Z \land q \neq 0 ,\right}$$ |
| 整数之间的比值构成的集合在数学中称为什么? | 有理数集。|
| 集合 $$\left{, \frac{p}{q} ,, \middle| ,, p, q \in \Z \land q \neq 0 ,\right}$$ 在数学中表示什么? | 有理数集。|
关于数学符号的补充说明:$\mathbb{Q}$ 在表示有理数集时的含义:
| 问题 | 答案 |
| ------------------------------------------------------ | --------------- |
| 在数学中,为什么用 $\mathbb{Q}$ 来表示有理数集? | Q 代表英文单词「quotient」(商) |
示例:正则表达式
这个例子展示了如何通过两种方式提问。
以下问答卡片展示了从概念到具体正则表达式语法的对应关系:
| 问题 | 答案 |
| --------------------------------------- | ------ |
| 在正则表达式中,用什么符号匹配一行文本的开头? | ^
|
| 在正则表达式中,用什么符号匹配一行文本的结尾? | $
|
| 在正则表达式中,用什么模式匹配任意单个数字? | \d
|
除上述内容外,还可添加从正则表达式到概念的卡片:
| 问题 | 答案 |
| --------------------- | -------------------- |
| ^
匹配什么? | 行的开始 |
| $
匹配什么? | 行的结束 |
| \d
匹配什么? | 0 到 9 之间的任意数字 |
示例:电压
这是一个展示如何以不同方式提问的范例。
$A$ 和 $B$ 两点之间的电压可以通过以下两种方式定义:
-
两点之间的电势差。
-
电荷量为 $1C$ 的粒子从 $A$ 点移动到 $B$ 点所做的功。
这里的思路是:
-
首先,我们从电势差和功两个角度来询问电压的定义。
-
其次,我们还要询问每个定义所对应的专业术语。
据此,我们可以制作出以下抽认卡:
| 问题 | 答案 |
| ------------------------------------------------------------ | ----------------------------------------------------- |
| 从电势的角度来看,电压是什么? | 两点之间的电势差。 |
| 从功的角度来看,电压是什么? | 单位电荷(1 库仑)从一点移动到另一点所做的功。 |
| 两点之间的电势差通常称为什么? | 电压。 |
| 单位电荷在两点之间移动所做的功通常称为什么? | 电压。|
示例:同分异构体
当两种化合物具有相同的化学式(即各元素的原子数相同),但三维结构不同时,我们称这两种化合物互为同分异构体。
异构体可以分为以下几类:
-
**结构异构体:**指分子式相同但原子连接方式不同的化合物。
-
立体异构体:
指分子式和化学键相同,但空间排列不同的化合物。立体异构体可以进一步分为:
-
**构象异构体:**可以通过单键旋转相互转化的异构体。
-
构型异构体:
不能通过单键旋转相互转化,必须打断化学键才能转化的异构体。构型异构体又可细分为:
-
对映异构体:互为不能重合的镜像的一对异构体。由于它们对平面偏振光的旋转方向不同,也被称为光学异构体。
-
非对映异构体:
不是对映异构体的立体异构体。其中一个重要的类型是:
- 顺式/反式异构体:在具有刚性结构的分子中,当两个官能团可能处于同侧或异侧时形成的异构体。当两个官能团位于刚性结构的同一侧时,称为顺式异构体;当它们位于相对的两侧时,称为反式异构体。
-
-
下图展示了一个顺式异构体的例子:
下图展示了一个反式异构体的例子:
这个概念体系相对简单明了:我们需要学习一个定义的层次结构。我们可以将学习任务分为两个部分:
-
首先,掌握定义。练习从术语到定义,以及从定义到术语的互相转换。
-
其次,理解层次结构:学习各种异构体的类型和亚类型之间的关系。
让我们从定义开始。首先我们按照正向顺序提出问题:
| 问题 | 答案 |
| --------------------------------- | ------------------------------------------------------------ |
| 什么是异构体? | 当两种化合物具有相同分子式但三维结构不同,它们互为异构体。 |
| 什么是结构异构体? | 具有相同分子式,但原子之间的连接顺序或方式不同的化合物。 |
| 什么是立体异构体? | 分子式和化学键连接方式完全相同,但原子在三维空间中的排列不同的化合物。 |
| 什么是构象异构体? | 可以通过单键周围的自由旋转相互转化的异构体。 |
| 什么是构型异构体? | 必须打断化学键才能相互转化的异构体。 |
| 什么是对映异构体? | 互为镜像但不能重合。 |
| 什么是非对映异构体? | 属于立体异构体但不是对映异构体。 |
| 什么是顺反异构体? | 两个官能团可以位于刚性结构同侧(顺式)或异侧(反式)的异构体。 |
然后是反向定义:
| 问题 | 答案 |
| ------------------------------------------------------------ | ---------------------- |
| 分子式相同但三维结构不同的化合物,称为什么? | 异构体 |
| 分子式相同但化学键连接方式不同的异构体,称为什么? | 结构异构体 |
| 化学键连接相同但空间排列不同的异构体,称为什么? | 立体异构体 |
| 可通过单键自由旋转相互转化的异构体,称为什么? | 构象异构体 |
| 需要断键才能相互转化的异构体,称为什么? | 构型异构体 |
| 与镜像不能重合的异构体,称为什么? | 对映异构体 |
| 属于立体异构体但不是对映异构体,称为什么? | 非对映异构体 |
| 官能团位于刚性结构同侧或异侧的异构体,称为什么? | 顺式/反式异构体 |
为了保持每个知识点的独立性,我们省略了一些信息。现在需要提出问题来回忆那些被省略的信息:
| 问题 | 答案 |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
| 对映异构体的另一个专业术语是什么? | 光学异构体。 |
| 为什么对映异构体也被称为光学异构体? | 这是由于它们能够旋转平面偏振光的特性。 |
| 光学异构体是指什么? | 这是对映异构体的另一种专业表述。 |
| 什么是顺式异构体? | 两个官能团位于刚性结构同一侧的异构体。 |
| 当一个异构体的两个官能团位于刚性结构的同一侧时,称为什么? | 顺式异构体。 |
| 什么是反式异构体? | 两个官能团位于刚性结构相对两侧的异构体。 |
| 当一个异构体的两个官能团位于刚性结构的相对两侧时,称为什么? | 反式异构体。 |
现在,我们来探讨这些概念在化学分类体系中的层级关系。我们首先从概念的层级结构出发,从上层概念到下层概念进行提问:
| 问题 | 答案 |
| ------------------------------------------------- | ------------------------------------------------ |
| 异构体可以分为哪两大类? | 结构异构体和立体异构体。 |
| 立体异构体又可以细分为哪两类? | 构象异构体和构型异构体。 |
| 构型异构体包括哪两种? | 对映异构体和非对映异构体。 |
| 非对映异构体中最常见的是哪种? | 顺式/反式异构体。 |
然后从下层到上层:
| 问题 | 答案 |
| --------------------------------------- | ---------------------- |
| 结构异构体属于? | 异构体 |
| 立体异构体属于? | 异构体 |
| 构象异构体属于? | 立体异构体 |
| 构型异构体属于? | 立体异构体 |
| 对映异构体属于? | 构型异构体 |
| 非对映异构体属于? | 构型异构体 |
| 顺式/反式异构体属于? | 非对映异构体 |
最后,举几个例子:
| 问题 | 答案 |
| ------------------------------------------------------------ | ----------------- |
| 下图所示的是哪种异构体? | 顺式异构体 |
| 下图所示的是哪种异构体? | 反式异构体 |
示例:十二生肖
假设你想记住:
-
鼠
-
牛
-
虎
-
兔
-
龙
-
蛇
-
马
-
羊
-
猴
-
鸡
-
狗
-
猪
索引到元素的抽认卡:
| 问题 | 答案 |
| ----------------------------------- | --------- |
| 第 1 个生肖是什么? | 鼠 |
| 第 2 个生肖是什么? | 牛 |
| 第 3 个生肖是什么? | 虎 |
| 第 4 个生肖是什么? | 兔 |
| 第 5 个生肖是什么? | 龙 |
| 第 6 个生肖是什么? | 蛇 |
| 第 7 个生肖是什么? | 马 |
| 第 8 个生肖是什么? | 羊 |
| 第 9 个生肖是什么? | 猴 |
| 第 10 个生肖是什么? | 鸡 |
| 第 11 个生肖是什么? | 狗 |
| 第 12 个生肖是什么? | 猪 |
元素到索引的抽认卡:
| 问题 | 答案 |
| ------------------------------------- | ------ |
| 鼠是第几个生肖? | 1 |
| 牛是第几个生肖? | 2 |
| 虎是第几个生肖? | 3 |
| 兔是第几个生肖? | 4 |
| 龙是第几个生肖? | 5 |
| 蛇是第几个生肖? | 6 |
| 马是第几个生肖? | 7 |
| 羊是第几个生肖? | 8 |
| 猴是第几个生肖? | 9 |
| 鸡是第几个生肖? | 10 |
| 狗是第几个生肖? | 11 |
| 猪是第几个生肖? | 12 |
后继抽认卡:
| 问题 | 答案 |
| --------------------------- | --------- |
| 鼠后面是什么? | 牛 |
| 牛后面是什么? | 虎 |
| 虎后面是什么? | 兔 |
| 兔后面是什么? | 龙 |
| 龙后面是什么? | 蛇 |
| 蛇后面是什么? | 马 |
| 马后面是什么? | 羊 |
| 羊后面是什么? | 猴 |
| 猴后面是什么? | 鸡 |
| 鸡后面是什么? | 狗 |
| 狗后面是什么? | 猪 |
前驱抽认卡:
| 问题 | 答案 |
| ---------------------------- | --------- |
| 牛前面是什么? | 鼠 |
| 虎前面是什么? | 牛 |
| 兔前面是什么? | 虎 |
| 龙前面是什么? | 兔 |
| 蛇前面是什么? | 龙 |
| 马前面是什么? | 蛇 |
| 羊前面是什么? | 马 |
| 猴前面是什么? | 羊 |
| 鸡前面是什么? | 猴 |
| 狗前面是什么? | 鸡 |
| 猪前面是什么? | 狗 |
示例:2 的幂
让我们来记忆 2 的前 16 个幂:
$$
\begin{align*}
2^{2} &= 4\
2^{3} &= 8\
2^{4} &= 16\
2^{5} &= 32\
2^{6} &= 64\
2^{7} &= 128\
2^{8} &= 256\
2^{9} &= 512\
2^{10} &= 1024\
2^{11} &= 2048\
2^{12} &= 4096\
2^{13} &= 8192\
2^{14} &= 16384\
2^{15} &= 32768\
2^{16} &= 65536
\end{align*}
$$
正面卡片(求幂的结果):
| 问题 | 答案 |
| -------- | ------ |
| $2^{2}$ | 4 |
| $2^{3}$ | 8 |
| $2^{4}$ | 16 |
| $2^{5}$ | 32 |
| $2^{6}$ | 64 |
| $2^{7}$ | 128 |
| $2^{8}$ | 256 |
| $2^{9}$ | 512 |
| $2^{10}$ | 1024 |
| $2^{11}$ | 2048 |
| $2^{12}$ | 4096 |
| $2^{13}$ | 8192 |
| $2^{14}$ | 16384 |
| $2^{15}$ | 32768 |
| $2^{16}$ | 65536 |
反面卡片(根据结果求指数):
| 问题 | 答案 |
| -------------- | ------ |
| $\log_2 4$ | 2 |
| $\log_2 8$ | 3 |
| $\log_2 16$ | 4 |
| $\log_2 32$ | 5 |
| $\log_2 64$ | 6 |
| $\log_2 128$ | 7 |
| $\log_2 256$ | 8 |
| $\log_2 512$ | 9 |
| $\log_2 1024$ | 10 |
| $\log_2 2048$ | 11 |
| $\log_2 4096$ | 12 |
| $\log_2 8192$ | 13 |
| $\log_2 16384$ | 14 |
| $\log_2 32768$ | 15 |
| $\log_2 65536$ | 16 |
最后,我有一张测试卡,要求我按顺序回忆整个序列。
示例:Rilke 的诗
让我们记住这首诗:
Archaic Torso of Apollo
Rainer Maria Rilke
We cannot know his legendary head
with eyes like ripening fruit. And yet his torso
is still suffused with brilliance from inside,
like a lamp, in which his gaze, now turned to low,
gleams in all its power. Otherwise
the curved breast could not dazzle you so, nor could
a smile run through the placid hips and thighs
to that dark center where procreation flared.
Otherwise this stone would seem defaced
beneath the translucent cascade of the shoulders
and would not glisten like a wild beast’s fur:
would not, from all the borders of itself,
burst like a star: for here there is no place
that does not see you. You must change your life.
你可以使用序列脚本来执行这个过程,但那可能显得有些生硬和机械。不如我们采用诗歌脚本,它会向我们展示两行上下文,然后要求我们补全下一行。生成的抽认卡如下所示:
| 问题 | 答案 |
| ------------------------------------------------------------ | -------------------------------------------------- |
| 开头 ... | We cannot know his legendary head |
| 开头 We cannot know his legendary head ... | with eyes like ripening fruit. And yet his torso |
| We cannot know his legendary head with eyes like ripening fruit. And yet his torso ... | is still suffused with brilliance from inside, |
| with eyes like ripening fruit. And yet his torso is still suffused with brilliance from inside, ... | like a lamp, in which his gaze, now turned to low, |
| is still suffused with brilliance from inside, like a lamp, in which his gaze, now turned to low, ... | gleams in all its power. Otherwise |
依此类推。你应该已经领会了其中的规律。
脚本
如果纯靠人工制作所有抽认卡,许多规则将难以落实,因为这个过程会异常繁琐。幸运的是,我们可以借助自动化工具来简化这一过程。
我已将我使用的脚本上传至这个代码仓库。这些脚本主要参考了 Gwern 的脚本。
序列脚本
这个脚本可以根据学习序列规则中的原则,自动生成用于学习序列的闪卡。
假设我们有一个名为 greek.txt
的输入文件,内容如下:
希腊字母表
Alpha
Beta
Gamma
我们可以运行 cat greek.txt | ./sequence.py > cards.csv
来生成以下抽认卡:
| 问题 | 答案 |
| ------------------------------------------------------- | ------------------- |
| 希腊字母表: 请列出序列中的全部元素 | Alpha、Beta、Gamma |
| 希腊字母表: 序列的第一个元素是? | Alpha |
| 希腊字母表: 序列的第二个元素是? | Beta |
| 希腊字母表: 序列的第三个元素是? | Gamma |
| 希腊字母表: Alpha 在序列中的位置是? | 1 |
| 希腊字母表: Beta 在序列中的位置是? | 2 |
| 希腊字母表: Gamma 在序列中的位置是? | 3 |
| 希腊字母表: Alpha 之后是哪个字母? | Beta |
| 希腊字母表: Beta 之后是哪个字母? | Gamma |
| 希腊字母表: Beta 之前是哪个字母? | Alpha |
| 希腊字母表: Gamma 之前是哪个字母? | Beta |
以及完形填空卡:
| 完形填空 |
| ------------------------------------------------------------ |
| 希腊字母表: 序列中的元素依次为:[[Alpha]]、[[Beta]]、[[Gamma]] |
诗歌脚本
poetry.py脚本生成一种特殊的抽认卡。在这种抽认卡中,你会看到一首诗的两行,然后需要回忆出下一行。想了解如何使用这个脚本,可以参考这个链接。
软件
Anki 是大多数人的首选记忆卡片软件。作为一款开源软件,它拥有丰富的插件资源和免费的卡片同步服务,自然而然成为了用户的默认选择。
我个人则更倾向于使用 Mochi。相比 Anki,Mochi 拥有更加精美的用户界面,这让使用过程更加愉悦,有助于养成良好的学习习惯。此外,Mochi 原生支持图片完形填空功能,无需依赖额外插件即可使用。
Anki 唯一让我青睐的而 Mochi 所缺失的功能是笔记类型。Anki 的笔记类型允许你从同一组结构化信息生成多张卡片。举个例子,你可以创建一个「化学元素」笔记类型,包含「名称」、「符号」、「原子序数」等字段,以及如下卡片模板:
| 问题 | 答案 |
| ------------------------------------- | -------- |
| {name} 的符号是什么? | {symbol} |
| {name} 的原子序数是多少? | {z} |
| 符号 {symbol} 代表那个元素? | {name} |
| 什么元素的原子序数是 {z}? | {name} |
因此,从一条笔记(“铪”、“Hf”、“72”)中,你可以自动衍生出四张抽认卡。如果你编辑了笔记内容,所有相关的卡片都会自动更新。Mochi 软件缺乏这个功能,不过实际使用起来也不算太糟。你可以通过填空删除法来实现类似的效果。
现有技术
在学习闪卡制作领域,最具影响力的参考资料当属 1999 年发表的一篇经典论文。这篇文章出自 SuperMemo 软件创始人 Piotr Woźniak 之手,题为《高效学习:构建知识的二十条准则》。我对文中的大部分观点都深表认同。现在,让我重点阐述其中几个核心原则:
-
理解先于记忆:在开始记忆之前,务必确保你对概念有透彻的理解。「透彻理解」这个标准可能因人而异,我的方法是深入探究、拓展和厘清概念,直到我能够自如地阐述这些知识为止。
-
卡片应该是原子化的:每张卡片只对应一个最基本的概念单元。
-
避免记忆冗长的序列。
-
避免记忆大量无序的信息。
-
使用简洁明了的语言表述。
-
适度的重复是有益的:不要害怕重复表达!
结语
希望这些规则和示例能对你的学习有所裨益。现在,拿起一本教科书,开始学习一些实用的知识吧。
杰出科学家在学校丧失动力:一种不治之症?
原文:Microsoft Word - Eminent Scientists Demotivation in School.doc (gwern.net)
「在我通过最后一次考试后,整整一年里我都对任何科学问题感到厌恶。」爱因斯坦在自传中如此描述考试给他带来的强烈压迫感。然而,发现学校让人失去动力的并非只有爱因斯坦一人。查尔斯·达尔文、卡尔·荣格和迈克尔·法拉第也曾表示,他们在学校时常感到无聊,所学甚少。历史心理学家 Simonton (1994) 在研究西方文明的天才时发现,20 世纪 60% 的伟人对他们的学校生活深恶痛绝。
为何学校会让这些杰出的科学家如此泄气?他们又是如何克服学校动力不足的困境,在各自的领域取得卓越成就的?探究这两个问题无疑是一项富有挑战性的工作,需要我们深入分析这些科学家的传记和自传——尽管这些资料难免带有主观色彩和轶事性质。但这项研究仍然十分必要,因为除了其历史价值外,它还可能帮助我们理解为什么当今许多学生似乎对学校的科学课程提不起兴趣。接下来,我们将着重探讨第一个问题。
为何学校使众多杰出科学家丧失动力?
为探寻答案,我们深入研究了三位知名科学家的自传和传记:物理学泰斗阿尔伯特·爱因斯坦、自然科学先驱查尔斯·达尔文,以及分析心理学奠基人卡尔·荣格。
爱因斯坦的案例
爱因斯坦从小就渴望探索充满奇迹的世界,而汲取知识似乎是实现这一目标的最佳途径 (Hoffmann,1972)。不幸的是,学校未能满足他的这种需求。在这位伟大物理学家看来,当时盛行的教学方法过于僵化、军事化且乏味。1940 年,爱因斯坦在一封信中写道:「因此,我宁可忍受各种惩罚,也不愿意死记硬背」(引自 Hoffman, 1972, p. 25)。面对爱因斯坦在记忆单词和文本方面的困难,他的希腊语老师非但没有给予帮助,反而建议他干脆退学,认为他这辈子都不会有什么成就。在自传中,爱因斯坦承认在苏黎世联邦理工学院(即瑞士联邦理工学院)确实遇到过几位优秀的教授。但总的来说,他发现课堂讲座如此令人丧失动力,以至于他选择不去上课,而是在实验室里专注于自己的研究。此外,爱因斯坦逐渐成为了一个自主学习者。他勤奋刻苦地阅读重要的开创性科学著作。正是在苏黎世联邦理工学院求学期间,他意识到参加期末考试扼杀了他解决科学问题的动力。
达尔文的案例
达尔文从踏入校门的第一天起就对学习感到厌倦。在自传中,他回忆道,老师认为他是个普遍表现欠佳的学生,学习进度赶不上他的姐姐 (Darwin, 1958)。此后数年,情况并未见好转。达尔文曾如此评价:「就智力发展而言,再没有比 Butle 博士的学校更糟糕的了。那里严格奉行古典教育,除了少量古代地理和历史外,几乎一无所教」 (Darwin, 1958, p. 9)。这所学校主要专注于死记硬背古代语言,研究文学和哲学经典,完全无法满足达尔文对探索和理解自然现象的热忱与兴趣。由于他在学习拉丁语和研究古典作家方面缺乏动力和毅力,他的导师乃至父亲都断定,年轻的达尔文这辈子注定平庸无为。在爱丁堡大学期间,除了化学课,达尔文上的大多数课程都采用讲座形式,这让他感到极度乏味。两个学期后,他父亲建议他转学剑桥大学。然而,他在那里依然无法找到学习的动力。他后来感叹道:「我在那里的时光被可悲地浪费了,甚至比单纯的浪费更糟糕」(Darwin, 1958, p. 9)。
达尔文强烈渴望理解和探索自然现象的愿望最终得以实现,但这主要发生在学校或大学环境之外。他对矿物和昆虫标本的深入研究,大量阅读科学文献,以及与其他研究者的非正式交流,使他成为现代最博学和最杰出的科学家之一。
荣格的案例
「大学让我无聊得要死」$^1$,卡尔·荣格如是说 (1973, p. 47)。对这位著名的分析心理学家而言,高中时期变成了无聊和反抗学校的岁月。在自传中,荣格基于两个主要观察得出这一结论:他无法理解数学,且与老师的关系极差。
$^1$ 原文为法语:“le collège m’assommait.” Jung (1973,p.47)。
在大学期间,数学课对荣格来说简直是一种折磨。数理逻辑始终是他无法破解的谜题。数学能力的缺乏让他在同学面前感到羞耻和畏缩。在他日后的生涯中,他最终坦白道:「我因为无法理解而感到如此羞辱,以至于我从不敢提出任何问题」$^2$ (Jung, 1973, p. 49)。
$^2$ 原文为法语:"j’étais tellement humillié de ne pouvoir comprendre que je n’osais pas poser aucune question." Jung (1973, p. 49)。
荣格与他的教授们之间的关系充满了误解和冲突。在教授们眼中,荣格不过是个愚钝的学生,甚至是个骗子。荣格回忆起一次刻骨铭心的经历:他认真完成了一篇自认为颇有水平的作文,却被教授当着全班同学的面指责作弊,声称他不可能写出如此出色的文章。尽管荣格极力辩白,但教授和同学们依旧坚信他有罪。另一个荣格提到的小插曲是,有位教授认为他的论文虽然富有创意,但行文粗糙,断言荣格这辈子都不可能有什么成就。在所有老师中,只有拉丁语教师对他抱有信心。由于荣格已经熟练掌握了这门语言,这位老师允许他在其他学生做练习时在图书馆安静地阅读。荣格对大学时期的回忆,多半是教授们刻薄的言辞和他所遭受的不公平待遇。通过阅读和研究柏拉图、康德,尤其是叔本华等著名哲学家的作品,他得以平息内心的愤怒。
基于这些从爱因斯坦、达尔文和荣格自传中摘录的简短证词,我们提出三个假设,试图解释为何这些日后声名显赫的研究者在学校会如此缺乏动力。
首先,这些天才在学校环境中面临的一个问题是缺乏认知挑战。他们不得不忍受冗长乏味的讲座,还要死记硬背海量知识,这种学习方式无法满足他们对理解、探索的渴求,更不用说创造的需要了。正如爱因斯坦 (1959,p. 17) 所言:「现代教学方法$^3$,竟然还没有把研究问题的神圣好奇心完全扼杀掉,真可以说是一个奇迹。」达尔文、爱因斯坦、荣格等杰出的研究者,可能还包括许多其他科学巨匠,都没有接触到能激发他们非凡研究潜能的生动活泼的教学方法,结果就是他们在学校里感到极度无聊。
$^3$ 爱因斯坦的自传笔记写于 1945-1946 年。他所提到的「现代教学方法」与我们当今所熟知的并不相同。
第二个假说认为,当时的学校系统没有能力去欣赏和培养他们独特的智力类型。19 世纪的英国学校主要教授语言、经典文学和哲学,而达尔文的兴趣却在于探索和理解自然现象。爱因斯坦不擅长记忆名字、日期或拉丁语短语,但这恰恰是 20 世纪初德国文理中学的主要要求。荣格则一直厌恶学校教授的数理逻辑,而他对哲学和精神现象的浓厚兴趣从未得到教授们的鼓励和重视。达尔文和爱因斯坦在学校的低分充分说明,他们非凡的智力潜能始终未被认可。当这三位杰出的研究者意识到学校更重视知识的复制而非探索、标准化而非创新时,他们很快就将学校视为一个令人丧失动力、缺乏智力刺激的场所。
第三个假说与这些科学家和教师之间的糟糕关系有关。由于他们当作无知、难以管教或毫无主见的学生,他们与教授之间的互动主要体现为控制、权威和强制。正如前文所述,在荣格的案例中,情况甚至恶化到他在全班同学面前被指控作弊。实际上,这三位科学家的教授们都试图将他们塑造成某种模式,强迫他们与其他学生保持一致。然而,历史很快就证明他们与众不同。
由此可见,他们在学校遭遇的教学方法缺乏认知挑战,学校系统没有能力去欣赏他们的研究潜力,再加上与教授之间的冲突,这些因素似乎是导致这些杰出科学家在学校失去学习动力的主要原因。接下来,我们将探讨第二个问题。
他们是如何坚持不懈,并最终在各自的领域取得卓越成就的?
对许多著名研究者而言,进入大学是他们决定真正成为科学家的转折点 (Zuckerman, 1977)。然而,对一些科学家来说,大学初期的学习经历却是乏味且打击积极性的。如前所述,爱因斯坦在苏黎世理工学院期间并未参加理论课程,而达尔文在自传中坦言,他对剑桥大学的本科学习感到极度厌烦。直到研究生阶段,大多数杰出科学家才终于找到了适合研究的环境,以及他们长期渴望的来自教授们的激励与支持。那么,在漫长的求学过程中,从小学到大学初期,他们是如何保持学习动力并坚持不懈的呢?
Simonton (1994, 1999) 的研究表明,这些科学家通过树立成为自主学习者的个人目标来维持学习动力。达尔文曾对他的表兄弗朗西斯·高尔顿说:「我认为我所学到的一切有价值的知识都是自学的」(Simonton,1999,p. 120)。Simonton 的研究,以及 Ochse (1990) 和 Zuckerman (1977, 1983) 的研究都表明,为了实现目标,这些科学家采用了相同的策略:阅读、探索,以及与一位或多位导师建立持久而有意义的关系。接下来,我们将深入探讨这三种策略。
阅读
对于这些杰出的科学家而言,阅读是他们进行自主学习最主要且最有效的方式。达尔文、爱因斯坦和荣格在童年和青年时期就投入了大量时间阅读。爱因斯坦从 11 岁起就开始热衷于阅读他叔叔 Jakob 和一位家庭朋友借给他的科学和哲学著作及论文,并始终保持着严肃认真的态度。在回忆录中,爱因斯坦提到 12 岁时读到的一本关于欧几里得几何的书籍给他留下了深刻印象,成为他终生难忘的经历。此后,Bernstein 的《自然科学通俗读本》(Popular Books on Natural Science)以及亥姆霍兹和赫兹等科学家的著作成为他主要的阅读对象。正是通过这样广泛而深入的阅读,爱因斯坦在进入苏黎世理工学院之前就已经奠定了扎实的科学基础。
达尔文在自传中也提到,他的暑假时光主要用来阅读和远足。他最钟爱的书籍涵盖了哲学、宗教,当然还有自然科学。在剑桥大学最后一年,他接触到了洪堡的《新大陆热带地区旅行记》和赫歇尔爵士的《自然哲学研究导论》。这些书籍给他带来了特别的启发,激发了他为自然科学领域的发展做出重大贡献的强烈愿望。
荣格初次接触自然科学、文学和历史类书籍是在父亲的图书馆里。他这样回忆道:「我也开始阅读德国文学作品和经典著作。尽管学校对一些显而易见的事情做了过于繁琐的解释,但这并没有完全打消我的兴趣。」$^4$ (Jung,1973,p. 84)。有趣的是,正是在阅读一本精神病学著作时,荣格做出了放弃医学研究的决定,转而深入研究人类心理学,这最终引导他走上了精神病学的道路。
$^4$ 原文为法语:"Je commençais aussi à lire les œuvres de la littérature allemande et tout d'abord les classiques, dans la mesure où l'école, avec ses explications inutilement laborieuses de ce qui allait de soi, ne m'en avait pas dégoûté." Jung (1973, p. 84)。
这些杰出人物在阅读中找到了一种与自身完美契合的学习方式。阅读使他们能够按照自己的节奏和方式,在闲暇时间自由探索并深入钻研感兴趣的主题。Simonton (1994, p. 165) 精辟地指出:「广泛阅读是那些最终广受关注的人的显著特征。」
探索
荣格曾经深有感触地说:「大自然似乎充满了令人惊叹的奇迹,我渴望将自己完全沉浸其中。」$^5$ (1973, p. 52)。达尔文对南美洲诸国的探索性考察,以及他在加拉帕戈斯群岛的研究旅程,已是众所周知的事迹。从儿时起,他就热衷于收集各种矿物样本、动物标本和昆虫。在自传中,达尔文描述了他如何有意与渔民建立友谊,以便能够随他们出海捕捞贝类,继而进行解剖研究。相比之下,实验室则成了爱因斯坦最钟爱的「游乐场」。正如他在自传笔记中强调的那样:「然而,我大部分时间都在物理实验室工作,被与实践经验的直接接触所深深吸引」(Einstein, 1959, p. 15)。
$^5$ 原文为法语:“La nature me semblait pleine de merveilles dans lesquelles je voulais me plonger.” Jung (1973, p. 52)。
探索无疑是促进学习的绝佳方式。它帮助我们将书本知识置于更广阔的视角中,深入理解自然现象的复杂性和美妙之处。我们可以认为,杰出的科学家们从探索中获得了另一个好处:它为他们提供了独处的时间,让他们能够深入思考和反省。西蒙顿和许多其他历史心理学家都强调,这些著名人物大多喜欢独处,甚至渴望独处。正如爱因斯坦所说:「我独居在乡下,发现宁静生活的单调反而能激发创造性思维」(Gardner, 1993, p. 103)。与阅读类似,探索往往是一种独处的活动,能让人的思维自由驰骋,激发想象力和创造力。
导师
在达尔文的求学生涯中,剑桥大学的 Henslow 教授无疑是他的第一位导师,也很可能是对他影响最为深远的一位。达尔文在自传中深情回忆道,他与这位自然科学教授进行了无数次深入的讨论,并得到了珍贵的指导,这些交流大多发生在校园之外。Henslow 教授甚至为达尔文引荐了一个千载难逢的机会——Fitz-Roy 船长正在寻找一位自然学家随他环球探险。正是在这次持续 5 年之久的旅程中,达尔文收集到了大量动物标本,这些标本后来成为他构建著名的物种起源理论的基础。此后,在 Henslow 的引荐下,达尔文得以加入伦敦的几个科学团体。毫无疑问,这个科学共同体极大地激发了达尔文对物种起源的研究热情,并为他的学术生涯奠定了坚实基础。
在荣格的职业生涯和研究历程中,西格蒙德·弗洛伊德无疑是最具影响力的人物。正如荣格在自传中坦言:「在我当时所有的人际关系中,没有人能与他相提并论...他聪明绝顶、洞察力非凡,在各个方面都卓尔不群」$^6$ (Jung, 1973, p. 176)。值得注意的是,即便在后来荣格对弗洛伊德的性理论产生质疑,并与之发生争执后,他仍然不吝赞美,承认弗洛伊德「通过发现通向潜意识的途径,为我们的文明注入了新的活力」 $^7$ (p. 197)。
$^6$ 原文为法语:“Nul autre parmi mes relations d’alors ne pouvait se mesurer à lui… Je le trouvais extraordinairement intelligent, pénétrant, remarquable à tous points de vue." Jung (1973, p. 176)。
$^7$ 原文为法语:"a donné à notre civilisation un élan nouveau qui consiste dans sa découverte d'un accès à l'inconscient." Jung (1973, p. 197)。
爱因斯坦似乎并没有正式的导师。然而,他承认在 12 岁时,是叔叔 Jakob 和家庭朋友 Max Talmey(一位医学院学生)引领他步入科学殿堂的 (Hoffman, 1972)。叔叔 Jakob 不断鼓励爱因斯坦探索科学,并通过推荐一本欧几里得几何学的著作,为他开启了几何学的大门。尽管与 Talmey 年龄相差悬殊,爱因斯坦仍与他就科学和哲学进行了广泛而深入的探讨。在他后来的学术生涯中,牛顿、法拉第和麦克斯韦成为了爱因斯坦的智力引路人。他也经常与密友如 Grossman 分享自己的见解。当爱因斯坦本人被公认为杰出的物理学家后,他开始将自己的观点与其他著名同行如尼尔斯·玻尔和马克斯·普朗克的理论进行对比和深入讨论。
达尔文、荣格和爱因斯坦并非仅有的几位通过寻求导师指导或与同事交流想法来推进科学探索的杰出科学家。Zuckerman (1977) 对 92 位美国诺贝尔奖得主的研究揭示,其中 48 位曾在求学或工作期间追随同样是诺贝尔奖获得者的教授。Zuckerman (1977) 进一步指出,11 位诺贝尔奖得主都曾师从物理学大师卢瑟福,这有力地证明了在一个人的学习和成长阶段,一位卓越导师的指导可能产生多么深远的影响。由此可见,绝大多数杰出科学家在童年时期都受到过他人的激励,在求学阶段也得到过良师的指点。那么,这些人究竟在哪些方面对科学家的成长做出了贡献呢?
根据 Zuckerman (1983) 的研究,导师对杰出科学家的影响,并非主要体现在传授科学知识上,因为这些知识通常可以通过自主阅读书籍和研究资料获得。相反,导师最关键的作用在于传授科学研究的工作方法、思维模式、价值观和态度。更为重要的是,导师通过激发学生的自信心,传授思考方法和质量标准,从而激励他们追求卓越。一位接受 Zuckerman 采访的诺贝尔奖得主如此描述与导师学习的体验:「关键在于亲身接触:观察他们如何工作,如何思考,如何处理问题。[Zuckerman 问:『不是具体的知识吗?』] 完全不是。这是在学习一种思考方式」(Zuckerman, 1983, p. 246)。
结论
当我们回顾许多杰出科学家在上学阶段所经历的动力丧失,以及他们为坚持追求知识而发展出的应对策略时,我们不禁要反思当前我们为大学生提供的科学启蒙和研究培养。种种迹象表明,我们似乎正面临一个不治之症。
在政界和商界等多方社会力量的压力下,学校和大学的角色日益受到就业市场需求的主导。为了评估学生是否达到了预期的能力水平,严格的考核制度被广泛实施;最终以一纸文凭作为结果,证明持有者能够「达到预期要求」。在这样一个传统选拔标准、规范化知识和标准化要求占主导地位的环境中,认为创造力、独创性和非主流思想能够得到重视和培养,是否显得过于理想化了?
教授们的能力同样值得探讨。诚然,大多数教授在自己的专业领域内都具备足够的教学资格,但在采用能够挑战学生、激励他们探索或敢于冒险的教学方法方面,他们是否具备相应的能力呢?更重要的是,教授们是否有这样的意愿?在高中,甚至大学里,我们是否拥有那些能够在学习热情和求知欲方面成为学生榜样和引路人的教师?换言之,学生们是否曾亲眼目睹他们的教授在探索、阅读,最重要的是,享受这些活动的过程?抑或他们在高中更多地是参加例行公事般的、近乎机械化的课程,在大学里则看到教授们更专注于如何申请研究经费,而非投身于真正富有挑战性的研究中?
究其根本,家长、教授和管理者是否已经做好准备,能够接纳思维上的「异类」?诚然,在中小学和大学里,人们往往能够在一定程度上容忍一些不同寻常的行为和穿着。然而,当面对那些「跳出常规思维框架」的学生时,我们是否能够真正接纳他们?更进一步说,我们是否愿意为这些学生提供充足的资源,帮助他们将独特的想法付诸实践?
面对这些问题,答案似乎都不容乐观。正是基于这种认识,我们相信,在当今的教育体系中,仍然存在着一些潜在的杰出研究者,他们可能正在学校和大学里备受煎熬,感到无比枯燥。我们衷心希望,这些人能够效仿他们的先驱,掌握自主学习的能力,并在追求知识的道路上坚持不懈。
参考文献
Darwin, F. (Ed..). (1958). The autobiography of Charles Darwin and selected letters. New York: Dover.
Einstein, A. (1959). Autobiographical notes. In P. A. Schillp (Ed.), Albert Einstein: Philosopher-scientist (Vol. 1, pp. 3-95). New York: Harper & Row.
Gardner, H. (1993). Creating minds. New York: Basic Books
Jung, C. G. (1973). Ma vie, souvenirs, rêves et pensées [My life, memories, dreams, and thoughts]. Paris: Gallimard.
Hoffman, B. (1972). Albert Einstein Creator & rebel. New York: Penguin Books.
Ochse, R. (1990). Before the gates of excellence: the determinants of creative genius. Cambridge: Cambridge University Press.
Simonton, D. K. (1999). Origins of genius. New York: Oxford University Press.
Simonton, D. K. (1994). Greatness: Who makes history and why. New York: Guilford Press.
Zuckerman, H. (1983). The scientific elite: Nobel laureates' mutual influences. In R. S. Albert (Ed.), Genius and eminence (pp. 241-252). New York: Pergamon Press.
Zuckerman, H. (1977). Scientific Elite: Nobel Laureates in the United States. New York: Free Press.
我如何学习 X ?
原文:How Do I Learn X? (ncase.me)
2021 年 6 月 27 日 · 作者:nicky case
首先,这有一些通用的建议:
大多数人(包括我自己!)练习时往往效率低下。或者,如果他们真的「高效地」练习,却又枯燥无味,打击信心。
因此,为了高效并且富有激情地学习,我建议你做一些小项目。比如,如果你刚学习了狭义相对论,不妨写一篇简短的文章,用通俗易懂的语言解释这个理论。如果你想练习写对话,就创作一个包含大量对话的小故事。
另外,我强烈推荐你使用间隔重复。它是「升级版的抽认卡」,有认知科学的大量实验支持。你可以看看这个视频了解更多。大多数人会选择使用 Anki 这款软件,但我更喜欢实体的 Leitner 盒子,因为有实感会让学习变得更有意思,更有动力。值得注意的是,间隔重复不仅可用于记忆零散的知识点,还能帮助加深对知识的理解——在卡片上,记得加入「为什么」的问题、直观的证明过程、练习题等内容。
最后,我希望你读一读这篇文章:《哪些行之有效,哪些徒劳无功》。这是 5 位认知科学家对各种学习方法效果的总结。(比如:他们指出,高亮划线和反复阅读虽然是最流行的两种学习方式,但收效甚微。)
接下来,关于学习特定事物的一些建议......
数学
唯一了解问题所在的是那些最常被责备,但是又最被忽略的人——学生。他们说「数学课愚蠢又无趣」,他们说对了。
如果我是教育部的头儿,我会将数学从必修课程中移除,因为我深爱数学。最能扼杀对学科的热爱的,就是强迫别人在毫无兴趣的情况下学习了。
因此,如果你想学习一个数学主题,请先弄清楚自己的动机。或许这个主题有实际应用(如贝叶斯定理、非线性动力学),或许你欣赏它本身的美(如几何、复分析)。无论如何,第一步:明确你的学习目的。
**第二步:培养直觉。**设想一堂音乐课,学生们年复一年地在五线谱上画音符,却从未听过一首真正的曲子,这就是当前数学课的现状。如果你在学习某个数学主题 X,不妨先在 YouTube 或搜索引擎上查找「X 的可视化」或「X 的直观理解」。(后面列出了我最喜欢的数学学习资源)
第三步:在反馈中练习。运用间隔重复(详见前文)练习回忆知识点、深入理解概念、甚至尝试快速解题。诚然,这一步有些枯燥,但如果你明确了学习目的,培养了直观感受,练习就会变得有意义且让你获得成就感。
我最喜欢的数学学习资源:
-
3Blue1Brown,尤其推荐他的线性代数和微积分系列视频。(YouTube 频道)
-
Better Explained(博客)
-
《非线性动力学与混沌》(教科书)
-
关于博弈论的《策略艺术》。(附言:15 年前我读这本书只是为了兴趣,后来我的经济学教授却把它列为教材。hackerman.jpeg)
-
《理论最小值》,适用于物理学。(有书也有斯坦福大学的免费在线公开课)
我个人虽然没怎么用过以下这些资源,但据说它们也很不错:
写作
为了让文章更流畅:使用「因此」和「但是」,不要有「然后」。新手常写「这件事发生,然后那件事发生,然后这件事发生」……但是这样很乏味……因此,你应该这样连接事件:「有了这件事,但是又发生了那件事,因此发生了这件事。」
(然后……)
为了让文章更简洁:先写下初稿,统计字数,然后将字数乘以 0.9(90%)。你要将文章精简到这个新的字数。(我从《写作的艺术》中得到了这个建议。另外,《风格的要素》实际上也很有帮助?)
最后,不必刻意追求写作「风格」。专注于内容就好。你认为重要的,就是你认为有价值的。你的价值观赋予了你让人听得出来的独特声音。你的声音就是你的风格。
因此:内容塑造风格。去烹制一道营养丰富而且美味可口的佳肴吧。
知识解释要写得通俗易懂
在我关于如何学习数学的回答中,我列出了学习的步骤:1)目的,2)直觉,3)练习。教授数学或任何学科,本质上就是按照这个顺序为学习者提供这三个要素。
具体建议如下:
-
目的:先让他们感受到痛处,再给出解决方案。如果可能的话,展示酷炫的视觉效果和实际应用。
-
**直觉:例子先行。**使用 ADEPT 方法。利用图片辅助说明。尽可能给出事实的直观证明,而不是简单地说「记住这些东西」。
-
练习:采用认知学徒制——首先「示范」解题过程,然后让学习者自己解决一个类似的问题。这一方法有认知科学的依据!
寻找通俗易懂解释的灵感:参考我上面列出的最爱的数学资源。此外,《量子杂志》和一些教育类 YouTube 频道也很不错。
为了练习制做通俗易懂的解释,我建议你开一个博客或 YouTube 频道,然后与朋友分享,听取他们的反馈意见。(如果你想「扩大受众」,或者想在互联网上被更多人发现,也可以考虑在 Reddit 上分享)
写故事
当生存还面临诸多严峻挑战时,我们的祖先为何还要讲故事?如果说故事只是为了缓解压力,那为何所有寓言故事中总有厄运降临?如果说故事只是为了给出忠告,又为何要采用虚构的形式?
我的看法是:故事不只是「缓压」这么简单,它确实在帮助我们生存。故事启示我们如何抉择,告诫我们行为的后果,引导我们实现性格的成长。但为何偏要虚构呢?这就像牛顿想象炮弹绕地球运行,爱因斯坦想象与光同行:夸张的虚构,正是探究深层事实的途径。用毕加索的话说:「艺术是言真的谎言。」
那么,有什么事实来之不易,
(「故事」是什么?简言之:
-
有人需要/想要某样东西,但是
-
他面临内部/外部障碍,因此
-
他们行动/学习/蜕变,
-
循环往复。
讲述真理不要用空谈说教,而要用浓缩人生的鲜活事例展示出来。
明确故事主旨之后,就可以运用一些写作技巧了。我推荐以下资源:
-
Lessons From The Screenplay(YouTube 频道)
-
Rob McKee 的《故事》(书)
关于练习和获取灵感,这里有一些地方可以找到写作素材。(我个人常用 Reddit 的 r/WritingPrompts 版块)多写一些短篇故事,与朋友分享,听取他们的反馈意见吧!
最后,我反对套用三幕结构、英雄之旅等模式。别写那种「老套的叙事模式」,要写出独具一格、独属于你的故事。
编程
**如果你会读写,那你就能编程。**如果你能理解「如果-那么」的句子、「和」这个词,以及这句自我指代的句子……那你就掌握了条件、逻辑和递归这些编程的基础概念。
遗憾的是,编程(和理工科)总有一种「只有天才才行」的光环。所以,让我们通过以下方法打破这种光环:1)从周末小项目开始,2)做一些实用有趣的东西,3)无需下载软件,完全在线免费创作!
HTML:制作网站。到 Neocities.org 注册一个免费账号,完成他们的 HTML 交互式教程。最后,你就能拥有一个可以分享的个人网站。一篇宣言、猫咪的主页,还是最爱同人文的链接?想怎么玩就怎么玩!
CSS:让网站变好看。下载 Stylus 插件(支持 Firefox 和 Chrome,注意别下到 Stylish,那是流氓软件!)。打开让你分心的网站,点击插件,选择「Write New Style」,粘贴这段 CSS 代码:body{ filter: grayscale(100%); }
。网站立刻变黑白,吸引力大减!使用 CSS 和 Stylus,你可以按你的需求改网站样式,比如隐藏 YouTube 评论、干掉「同意 cookies」弹窗,或者统一改用 Comic Sans 字体。
学习 CSS:可汗学院的 HTML/CSS 课程有免费的 HTML/CSS 互动教程!
JavaScript:让网站动起来。可汗学院的 JavaScript 入门教程包含大量互动练习,教你用代码作图、做动画,都很有趣!而且你学到的这些编程基础概念,在所有现代编程语言中都通用,不限于 JavaScript。
最后,送你一句至理名言:如果实现功能时遇到问题,就模仿专业程序员——到网上搜示例代码,复制粘贴,拼拼凑凑,直到项目「活」起来!
(我的工具推荐:代码编辑器 Atom,托管平台 Github Pages,域名服务 Namecheap。)
游戏制作
你的 项目规模 要小
你的 项目 规模 要小
「不要让项目太过庞大」是学习任何艺术形式都应谨记的原则,但对于胸怀游戏开发梦想的新人来说,这一点尤为重要。因为他们往往被那些动辄耗费数百人数年之力才得以完成的 3A 大作所吸引和启发,所以我要再次强调:
你的 项目 规模 要 小
好了,接下来我想推荐一些我最喜欢的游戏设计学习资源:
-
游戏制作工具包(YouTube 频道)(建议从 Valve 的「隐形教程」看起)
-
额外分数:制作你的第一款游戏(YouTube 系列视频)
-
《游戏设计艺术》(经典教材)
如果你想在掌握编程之前,甚至在购买或下载任何软件之前就开始尝试游戏制作,不妨试试以下这些工具:
-
Twine,适合制作「选择你自己的冒险」类的文字冒险游戏
-
Bitsy,适合制作俯视角探索游戏(类似于 Undertale)
-
PuzzleScript,适合制作 Sokoban 风格的解谜游戏
如果你想练习制作小型游戏,可以访问 itch.io 网站,那里有各种游戏开发马拉松的清单!
成为独立开发者
首先,我必须坦言,成为有稳定收入的独立开发者,一半要归功于运气。(至于另一半个人实力,请参考我前面关于学习的建议。)
不过,就像扑克玩家深知的那样,驾驭运气本身就是一种本领。所以,我建议:
-
像 Tarzan 那样改变赛道。除非新的事业已经能够支撑生计,否则不要轻易放弃手中的工作。比如,可以先为副业项目设立一个 Patreon,起初按「每个作品」收费,待全职投入后,再转为「包月」计费。(或者攒下一笔资金,足以维持一段时间的零收入状态)
-
**多押小注。**尝试许多不同的小项目,每一个都是不同方向的「赌注」。一旦某个项目展现出超乎寻常的成功潜力,就适当加大在那个方向上的投入。例如,我的第一个「可探索的解释」作品,是一个仅用 3 天就完成的游戏开发教程,结果登上了 Hacker News 的榜首。于是我在这个方向上一走就是 6 年。(不过说实话,现在也应该换换方向了)
良好的心理健康
哈哈,如果你找到了可靠维持心理健康的秘诀,一定要告诉我。
我至今仍在挣扎,不过已经把「现有的心得体会」写进了互动故事《焦虑历险记》和配套文章《心理健康贴士与资源》里。
几句话总结:
-
人是群居的学习型动物,我们有社交、成长和本能需求。想象一下:「与挚爱之人并肩奋斗一生,过着长寿健康的日子,共同应对人生的重大挑战。」虽然生命本身并无意义,但这些需求赋予了它意义。
-
情绪是那些(不完美却真切的)信号,告诉我们哪些需求已满足,哪些尚未满足。所以,不要「斯多葛式」无视内心,也别「盲从直觉」,要审慎相信。
-
用优良习惯(即「美德」)来可靠满足那些需求,习惯的养成有赖于循序渐进、适度奖励和勤加练习。
所以,嗯,祝你好运!
我重塑大脑,使其精通数学
理解的基础是记忆和重复。
芭芭拉·奥克利 著
2014 年 9 月 11 日
Sam Falconer 插图
原文:How I Rewired My Brain to Become Fluent in Math - Nautilus | Science Connected
我是一个任性的孩子,在文学的滋润之中长大,把数学和科学当作瘟疫的脓包。所以我现在的情况有点奇怪——一个每天都在三重积分、傅里叶变换和数学皇冠上的明珠——欧拉方程上跳舞的人。很难相信我从天生的数学恐惧症患者变成了一名工程学教授。
有一天,我的一个学生问我是如何做到的——我是如何改变我的大脑的。我想回答这个问题,但难度很大。毕竟,我小学、初中和高中的数学和科学都不及格。事实上,我直到 26 岁离开军队才开始补习数学。如果有一个关于成人神经可塑性潜力的教科书例子,我会是证据 A。
作为一个成年人,学习数学和科学让我进入了充满力量的工程世界。但我大脑中这些来之不易的成人年龄变化也让我透视了成人学习背后的神经可塑性。幸运的是,我在系统工程方面的博士训练——将不同的 STEM(科学、技术、工程、数学)学科联系在一起——以及我后来专注于人类如何思考的研究和写作,帮助我理解了与学习有关的神经科学和认知心理学的最新进展。
在我获得博士学位后的几年里,曾有成千上万的学生涌入我的教室——经过小学和高中的教育后,这些学生认为,通过主动讨论掌握数学,是学习的精华。他们认为,如果你能向别人解释你所学到的东西,也许是通过画画解释,那么你必然
理解了。
日本因其动态的,「重在理解」的教学方法而备受钦佩,成为效仿的楷模。但它的另一面鲜为人知,不见诸报端:日本是「公文式」数学教学法的发源地,该教学法强调记忆、重复和死记硬背,让孩子对材料打上思维钢印。这种强化的课后计划和其他类似计划,被数百万日本及全世界的家长接受,他们在参与孩子教育的同时,又灌注了大量练习、重复和精心设计的死记硬背,以使他们对材料烂熟。
教师可能让学生会产生已经会了的幻觉,导致他们挂科
在美国,对理解的强调有时似乎已经取代而不是补充了旧的教学方法,科学家在现在和过去都告诉我们,利用大脑的自然过程来学习数学和科学等复杂科目。
数学教育改革的最新浪潮是「共同核心标准」——试图在全美范围内制定强有力的统一标准,尽管批评人士认为,与做得优秀的国家相比,这些标准是失败的。不过至少从表面上看,这些标准似乎显示了一种明智的观点。他们建议,在数学中,学生应该在概念理解、程序技能和熟练程度以及应用方面全面发展。
当然,魔鬼在于执行的细节。在当前的教育环境中,STEM 学科(而不是语言或音乐学习)中的记忆和重复往往被视为贬低和浪费学生和教师的时间。长期以来,许多教师一直被教导,STEM 中的概念理解胜过一切。事实上,对老师来说,引导学生讨论一门数学学科(如果做得好,这对促进理解有很大帮助)比老师繁琐地批改数学作业要容易得多。这一切都意味着,尽管程序技能和流畅性,以及应用,应该与概念理解同等重视,但这往往不会发生。传授概念理解是最重要的——尤其是在宝贵的课堂时间里。
过于强调理解的问题在于,学生们学习数学和科学时往往能够理解一个重要的想法的要点,但如果没有用练习和重复来巩固,这种理解很快就会消失。更糟糕的是,学生们往往会误以为自己已经理解了某个问题,而实际上并没有。强调理解的重要性,教师们可能会无意中让学生们在自以为是的能力幻觉中失败。正如最近一位(不及格的)工程学生告诉我:「我真的搞不懂我为什么会挂科。你在课堂上讲授的时候,我是理解的。」我的学生可能当时认为他理解了,也许他真的理解了,但他从未通过使用这个概念来进行实践,以真正内化它。他的理解没有深化到不加思索的程度,也没有能力将他所理解的应用到实践中去。
学习数学和科学与学习体育运动之间有一种有趣的联系。当你学习如何挥舞高尔夫球杆时,经过数年的挥杆练习与重复,你逐渐将这个技法掌握娴熟。你的身体只需借助单独的想法,也就是单个「组块」——便知道该做什么,而不必回忆打球所涉及的所有复杂步骤。
同样地,一旦你理解了数学和科学中的一个概念,你就不必每次都要向自己重新解释。你不需要一遍又一遍地将口袋里的 25 颗弹珠排列成 5 行 5 列来算出 5 x 5 = 25。某个时候,你便能只靠记忆顺口而出。例如,你可以记忆当同底指数相乘,只需将那些上标数字相加即可(10^4 x 10^5=10^9)。如果你经常使用该程序,通过解决各种不同类型的问题,你会发现你确实非常好地理解了程序背后的「为什么」和「如何」。更好的理解来自于你的大脑构造了这种意义模式。不断地关注理解本身实际上会阻碍你的理解。
我学这些关于数学和学习过程的东西,不是在 K-12 的课堂上,而是在我的生命历程中,作为读着玛德琳·恩格尔和陀思妥耶夫斯基的书长大的孩子,我继续在全球顶尖的语言学院学习语言,然后做出了戏剧性的转变,成为了一名工程学教授。
作为渴望学习语言的年轻女性,我没有钱,也没有技能可言,我上不起大学(当时还没有大学贷款)。所以我读完高中就直接参军了。我在高中时喜欢学习新的语言,而在军队里,语言学习似乎不用花钱还来钱,哪怕他们参加的是一流的国防语言学院——一个把语言学习当成科学来研究的地方。我选择了学习俄语,因为俄语与英语有很大的不同,但也没有难到学一辈子就是个四岁小孩的程度。此外,「铁幕」的神秘而充满吸引力——我能用我的俄语知识窥视铁幕之后吗?
退役后,我在白令海的苏联拖网渔船上为俄罗斯人当翻译。为俄罗斯人工作很有趣,也很吸引人——但这种移民工作只是表面上很有魅力。你在捕鱼季节出海,一边喝得酩酊大醉,一边挣一份体面的薪水,然后在捕鱼季节结束后回到港口,希望他们明年会重新雇用你。对于说俄语的人来说,几乎只有一个选择——为国家安全局工作。(我的在军队的熟人一直给我指这条路,但它不适合我。)
我开始意识到,虽然掌握另一门语言很好,但这也是一种机会和潜力都很有限的技能。人们不会因为你会俄语变格而踏破门槛。除非,我愿意在白令海中央的发臭的拖网渔船上忍受晕船和偶发的营养不良。我不禁回想起在陆军中与我共事的工程师,他们来自西点军校。他们以数学和科学为基础的解决问题的方法,显然是对现实世界有用处的——我年轻时在数学上有诸多不顺,这些学科的用处是我难以想象的。
所以,在我 26 岁的时候,我离开军队,寻找新的机会,突然想到:如果我真的想尝试一些新的东西,为什么不尝试一些能为我打开新视角的东西呢?工程学之类的?这意味着我将尝试学习另一种完全不同的语言——微积分语言。
你在捕鱼季节出海,薪水还算体面,喝得酩酊大醉,然后在捕鱼季节结束后回到港口。
由于我连最简单的数学都不懂,我退伍后的再培训是从不计学分的代数和三角学补习开始的。这远低于大部分大学生的数学起点。尝试重新塑造我的大脑有时似乎很荒谬——尤其是当我看着年轻同学的年轻面孔,意识到他们中的许多人已经放弃了艰难的数学和科学课——而现在我正朝着他们前进。但就我而言,从我成年后掌握流利俄语的经历来看,我怀疑——或者我只是希望——语言学习的某些方面可能适用于数学和科学学习。
在学习俄语时,我强调的不仅是对语言的理解,更是流利程度。像语言这样整体性的流利程度需要熟悉感,而只有通过重复和变化的接触才能培养出这种感觉。我的语言同学们通常只关注理解所听到或阅读的俄语,而我则尝试通过深入了解单词和语言结构,从而获得内在的,深入的流利程度。我不会仅满足于知道“понимать”是“理解”的意思。我会通过反复变化时态来使用这个动词,然后将其放入句子中,最终理解不仅是何时使用该动词的形式,而且是何时不使用该动词的形式。我会练习快速回想这些方面和变化。毕竟,通过练习,你可以理解和翻译几十甚至数千个单词。但是,如果你不流利,在某人快速说话时(学习新语言时,这总是听起来极快),你不知道他们在说什么,尽管从技术上讲你理解所有的单词和结构。而且你肯定无法像母语人士那样说得快,让他们愉快地听你说话。
这种方法——注重流利而不是简单的理解——让我在班上名列前茅。我当时并没有意识到这一点,但这种学习语言的方法,让我对学习和专业知识发展的基本核心——组块——有了直观的理解。
组块最初是在赫伯特·西蒙(Herbert Simon)分析国际象棋的开创性工作中提出的——组块被设想为不同国际象棋模式的不同神经对应物。渐渐地,神经科学家开始意识到,像国际象棋大师这样的专家之所以是专家,是因为他们在长期记忆中储存了数千块关于自己专业领域的知识。例如,国际象棋大师可以回忆起数万种不同的定式。不管是哪门学科,专家们都可以有意识地调用一个或几个这些紧密结合在一起的、分块的神经子程序来分析新的学习情况并做出反应。这种水平的真正理解,以及在新情况下运用这种理解的能力,只有通过重复、记忆和练习才能培养出这种严谨和熟练度。
对国际象棋大师、急诊室医生和战斗机飞行员的研究表明,在关键时刻,对于局面的有意识分析,会让位于快速的潜意识处理,这些专家会快速应用他们牢固的神经子程序储备——组块。在某种程度上,有意识地「理解」你为什么做你所做的事情,只会减慢你的速度,打断你的心流状态,最终反倒做出更糟糕的决定。我直觉地感觉到,学习一门新的语言,和学习数学之间可能有联系。最终证明我是对的。一天天过去,我持续的俄语练习激发并连接了我的神经回路,我逐渐掌握了大量俄语组块,都是我能在工作记忆轻松调用的。我使用交叉学习的方法,也就是不仅练习什么时候需要应用这个词,而且还练习什么时候不用这个词,或者要用不同的变体。这其实是在和专业从业者学习数学和科学的方法相同的方法。
作为成年人,在学习数学和工程学时,我开始使用与学习语言相同的策略。我会看一个方程,牛顿第二定律f=ma。我练习感受每一个字母的含义——「F」代表力量,是一种推力;「M」代表质量,是对于推力的沉重阻力;「A」代表加速时令人兴奋的感觉。(在俄语中,相当于学习读出西里尔字母表中的字母。我记住了这个方程,这样我随时都能想起来并把玩一番。如果 M 和 A 是大数字,当我把它推到方程中时,它对F有什么影响?如果F很大,A很小,那对M有什么影响?两边的单位是如何匹配的?把玩这个等式就像是做动词变位。我开始产生一种感觉,这个方程的稀疏轮廓就像一首隐喻诗,其中嵌入了各种美丽的象征符号。虽然我当时不会这么说,但事实是,为了学好数学和科学,我必须慢慢地、日复一日地建立坚实的神经「分块」子程序——比如围绕简单的方程f=ma——我可以很容易地从长期记忆中回想起来,就像我对俄语所做的那样。
数学和科学领域的很多教授都告诉我,通过实践和重复牢固掌握专业知识,对他们的成功至关重要。理解并不能带来流利度;相反,流利带来理解。事实上,我认为对于复杂主题的真正理解,只能来自于流利。
换句话说,特别是在科学和数学教育中,人们很容易陷入强调理解的教学方法,避免有时痛苦的重复和练习,但这些正是流利的基础。我学习俄语不仅仅是通过理解它——毕竟,理解是肤浅的,而且很容易溜走。(понимать 这个词是什么意思?)我通过练习、重复和笨重的记忆来获得流利的俄语,但笨重记忆强调的是灵活和快速思考的能力。我学习数学和科学正是通过应用这些相同的想法。语言、数学和科学,就像人类几乎所有的专业领域一样,都依赖于相同的大脑机制。
当我开始新的生活,成为一名电气工程师,并最终成为一名工程学教授时,我把俄语抛在了脑后。但在我最后一次在苏联拖网渔船上举杯痛饮的 25 年后,我和我的家人决定乘坐西伯利亚大铁路穿越俄罗斯。虽然我对这次梦想已久的旅行感到兴奋,但我也很担心。在那段时间里,我几乎没有说过一句俄语。如果我失去了一切呢?这些年来获得的流利到底给我带来了什么?
果不其然,当我们第一次上火车时,我的俄语就像两岁的孩子一样。我找不出合适的单词,我的变格和动词变位都是错误的,我以前的口音近乎完美,而现在听起来很可怕。但我的基础还在那里,一天天过去,我的俄语进步了。即使我的俄语仍然很粗疏,我也能应付我们旅行的日常需要。很快,有导游来找我帮忙为其他乘客翻译。当我们最终到达莫斯科时,我们跳上了一辆出租车。我很快发现,司机一心想把我们直接拉向错误的方向,把我们困在拥挤的车流里,他希望我们这些无知的外国人会默默地默许,多花一个小时打表的钱。突然,几十年没说过的俄语单词从我嘴里飞了出来。我甚至没有意识到我知道这些词。
在这一切的背后,是熟练学习在需要的时候派上用场——它很快就让我们摆脱了麻烦(并打了另一辆出租车)。熟练学习让理解深入大脑,并在需要的时候应用理解。
这个国家面临着数学和科学人才的短缺。当我审视这一现状,再考虑时兴的学习方式,回忆我自己的学习之路,唤起我对大脑的理解,我认为我们能做得更好。作为家长和老师,我们能使用一些简单易实现的方法来加深理解,使其派上用场,灵活可用。我们能鼓励其他人,还有我们自己,去尝试了解新学科,哪怕是那些我们以为太难的领域——数学、舞蹈、物理、语言、化学、音乐,这是通往新世界的大门。
正如我所发现的,在数学和科学方面拥有基本的、根深蒂固的掌握——而不仅仅是「理解」,是至关重要的。它为许多生活中最有趣的工作打开了大门。回顾过去,我意识到我不必盲目地追随我最初的爱好和激情。我热爱文学和语言的「流利」部分,也是我最终爱上数学和科学的部分——并改变和丰富了我的生活。
芭芭拉·奥克利是密歇根州罗切斯特市奥克兰大学的工程学教授,最近出版了《数字思维:如何在数学和科学方面出类拔萃(即使你代数不及格)》。她还与索尔克研究所的弗朗西斯·克里克教授特伦斯·塞诺夫斯基共同担任了 Coursera 上世界最大的在线课程之一《学习如何学习》的讲师。
本文最初于 2014 年 9 月发表在《Big Bangs》。
如何培养更强的能动性
原文:How to be More Agentic - by Cate Hall - Useful Fictions (substack.com)
一件听起来很难的事
2024 年 1 月 11 日
我经常听到人们把能动性(译注:agency,指采取行动或选择采取何种行动的能力)当作天生的特质:要么生来就有,要么就没有——如果没有,那就很遗憾,他们注定只能度过平庸的一生。但就我的经验而言,事实并非如此。多年来,随着我年岁渐长,以及结交了很多聪明的朋友,我相对于我的同龄人来说越来越蠢笨了。为了弥补这点,我才去了不少方法,其中最主要的就是提升我的能动性。我将其看作「实现目标的堂堂决心」。
在此之后,我在不同的领域完成了不少很酷的事情:我当过最高法院辩护人,我是世界排名第一的女性扑克牌玩家;我创立了艺术和香水公司;我联合创办了 Alvea 并领导运营,这是一家针对流行病的制药公司,并创下了最快开启药物临床试验的创业公司的记录。所有这些成就都是我在 30 多岁时实现的。
在我看来,所谓强大的能动性,就是要去发掘自己真正的长处,即那些你愿意去做而别人不愿意的事情,因为他们往往会讨厌这种事。我们并不会清晰认知这些事情,从而做出有意的选择——这些事情往往隐身于令人厌烦的工作里面,我们便倾向于不去分析。
找到自己真正的优势所在,而不是「多吃点苦来艰难取胜」,这个想法是我刚开始玩扑克的时候顿悟的。现在的扑克游戏竞争非常激烈。甚至在 8 年前,职业玩家花在研究上的时间已经几乎等同于打牌的时间。他们会利用求解器模型,去找出渺小的数学优势。然而,有一种巨大的优势被完全忽略了,那就是观察身体线索。(我知道举个例子会更有说服力,但很抱歉,这就像魔术师解密自己的魔术一样。)
我跟两个朋友一起疯狂地研究阅读肢体语言,我们都取得了超凡绝伦的成果。我们把这些成果分享给其他职业选手,大部分人的反应却是:「不,那行不通」。他们不愿意接受阅读肢体语言的价值,主要是因为这样的话他们就有必要去研究这些技巧了。
我认为,我的所有能动性诀窍都说明了——巨大的优胜之处,往往是人们常常忽略的。
追求「被拒绝」
要敢提要求。甚至是提出那些看起来不合理的要求,这你才能明白什么是合理的,你的直觉才足够准确(当然,提出请求时别太混账)。如果你只要求那些你应得的,那么你的目标还不够高。求职是很好的例子:特别是在你职业生涯的早期,你的方向应该是,你申请的职位应该是你大概率会被拒绝的。如果你还没学会接受拒绝,就有意识地去寻求它:比如申请一些你真的觉得自己不太可能得到的工作,这样你就可以学会区分什么是拒绝,什么是诧异和失望。
我最近发了封邮件,内容大致是:「我打算创立一个与您的组织类似的机构;您会考虑不如让我来管理您的这一组织吗?」,这是我前几年想都不敢想的。结果呢?没有任何回应。也许那个人觉得我越界了。但这并不重要,因为我向另外一个人提出了类似的建议,他接受了,我们共同开创了一个新组织,这比我一个人能做成的事酷多了。
寻求真实反馈
真实反馈的重要性再说也不为过。不从熟悉的人那里努力获得反馈,那就像做菜时自己不试尝一样。这就像最容易做到自我提升的部分,但很少人会这样做。
在很多情况下,获取有效反馈的方式是提供匿名的反馈途径。任何其他方式,都会因为顾虑社交关系而产生阻碍。为了得到诚实的反馈,你需要让反馈渠道尽可能方便,并且容易找到——例如,我在我的 Twitter 简介里放了指向我的反馈表单的链接,每周都能从这里收到几条评论。
我知道有些人可能会反对匿名反馈,认为匿名会让人变得无礼,但根据我的经验而言,这种情况很少发生。我的收件箱里,90% 的反馈或是胡言乱语,或是相当友好——我收到了很多类似「继续加油!」的信息。在一年多的时间里,我可能只收到了两条蓄意伤害我的信息。我偶尔会收到一些让我深受打击的反馈,因为我意识到这些问题确实存在——但我会尽快平复心情,并开始解决这些问题。(其实我希望能收到更多的反馈——我意识到自己说话时会上扬语调还是通过 Youtube 评论。)
广撒网,撞大运
在我最近几次寻找项目的过程中,我特意尽可能多地接触了从事相关工作的人,即使这样做似乎没有明显的好处。一开始我只是为了进入新领域时宣告自己的存在,因为总有人在招人或者寻找合作伙伴。
通过广撒网,我发现自己很难预先判断一次交流会有多有用。虽然相关性更容易预测,但它并不是衡量有用性的好标准。有用取决于很多因素,包括对方的热情和兴趣范围。实际上,我越是确信一次对话与我相关,就越不太可能在其中发现令人激动的新事物。在过去三年中,几乎所有最富成效的合作都源自于我几乎随机安排的会面。上周,我最有价值的一次对话来自于这么一个人,当时介绍人告诉我「这个人想要与你见面,但我不确定这是否值得你花时间。」
假设一切都可以学会
大多数学科都是可以掌握的,即使有些看起来非常困难。此外,很多性格特点是人们以为无法改变的,这些特点其实也是容易塑造的,如果你相信他们如此,并像学习其他事物一样去努力学习。
你可能已经猜到了,我认为能动性本身就是一个很好的例子。我很晚才掌握能动性。在我十几二十岁的时候,我偶尔会做出一些具有能动性的行动(例如,为了和一个还没说过话的人在一起,而选择去新城市工作;几个月后我们结婚了)。但我还是选择了我真的不喜欢的职业,仅仅是因为它显而易见,直到十年后我才停下来问自己我到底想要实现什么。
很多其他常人认为不变的特质,同样可以改变。你还可以学会:自信、魅力、温暖、宁静和乐观。有人最近问我如何习得魅力,答案其实很简单:阅读几本书,观看很有魅力的人与他人互动的视频,并吸取一些他们的习惯。对大多数人来说,只要不认为魅力是与生俱来,都能想出这样的行动方案。
不管什么东西,都要假定这是能学会的,剩下的任务就是找到最佳的学习路径。
学会爱上低地位护城河
我最喜欢的一个概念是低地位的护城河,感谢我丈夫 Sasha 提供了这个想法。这个理念是说,为了做出改变,特别是学习一组新技能,你需要跨越一段低地位的护城河。在这段时间里,你做事情笨手笨脚,连一些显而易见的事情都不知道。
它之所以被称为护城河,是因为你不能直接跳到另一边,而且如果能够穿越这一护城河,你就有了坚实的保障。你可以悄悄地穿过这个护城河,不提问题也不寻求合作,但这样做会大大削弱学习效果。「从做中学」是常见的建议,但你必须在护城河里扑腾一段时间才能办得到。
如果你能学会在低地位的护城河中茁壮成长,这将让你无比畅快。我曾在一场大型扑克锦标赛中犯了个很糟糕的错误,以至于上了新闻报道。我可能永远不会完全忘记对那一手牌的尴尬,但我仍然非常珍视它,因为正在那时,我意识到自己已经跨过了某种坚定不移的门槛。在摄像机和记者围观的情况下,我本可以安全地弃牌,没有人会注意;但我选择下注,尽管我知道这意味着即使我赢了也会受到嘲笑。我的下注事实上很不理智,但我出于正确的错误理由做出了选择。
避免工作太辛苦
这可能是这个列表中最重要的一条。我花了将近 40 年的时间才学到这一点,因为我本能地认为,只要真的努力提高生产力,那么更长的工作时间就意味着更高的生产力——这听起来就像简单的乘法,对吧?事实并非如此。现实是,即使长时间的努力工作暂时提高了产出,也会扼杀创造力和大局观。
耗竭(Burnout)是能动性的终极杀手。这句话再对不过了,我已经把能动性下降看作耗竭的第一个迹象。这一迹象出现的很早,往往在我有意识之前就出现了。一旦能动性下降,我脑子里一个开关就被触发了,我就开始去除多余的想法和行动,认为它们无关紧要或者行不通,而不是改善它们。
如今,我设定了一些界限,会让年轻时的我感到羞愧:我几乎每个晚上都在下午 6 点之后离线,并严格遵守周日的安息日,不容许任何能闻到「努力」味的事情。对某些人来说,这可能不值一提,但在我所在的圈子中,这可能被视为不可饶恕的罪行。
我的原则是,永远不要从那些从未经历过耗竭的人那里,听取应该怎样努力工作的建议。可惜,很少有人认真对待这一点。
能动性是人们建造了你身边整个世界的依靠,是全方位的生活强化器,能让你的生活处处都变得更像你想要的样子,无论是在职业、人际关系、审美上,还是其他方面。做一个更好的捕鼠器。拥有一个令人羡慕的婚姻。建立一个国家。没有人天生就具备这种能力,每个人都可以学习它,而且永远不会太晚。
如何阅读
原文:How to read | Robert Heaton
2018年6月25日
五年前我发现,对于我读过的大部分书,我几乎什么也没有记下来。我当时会阅读各种非虚构书籍——通俗心理学,通俗经济学,通俗社会学,五花八门——并自认为算是个多方位精通的自学者了。但是有一天,我和朋友大谈特谈我非常喜欢阅读《思考,快与慢》,我讲完后他想让我简单总结一下此书的主要观点。我思考了一阵子,结果只能嘟囔出一些什么系统一和系统二的话。我解释我只是为了补充背景知识而阅读这本书,并巧妙地转移了话题。当晚正待我要进入梦乡,我突然想到,自诩为自学者,并不意味你有所学。
很多人记不住学校教的东西,并以此而自嘲。如果你上过大学,你毕业之后应该很久没有用过你在大学学过的任何东西了。你会将上大学的这段时间合理化,称之为学习思维方式的宝贵一课,以及通往职业道路的愚蠢一站。我知道泡利有个不相容原理,但我说不出他和谁水火不相容,或者为什么。我们似乎觉得这样没什么问题。
成年人阅读非虚构书籍的动机,一方面是消遣,另一方面是想要了解并记住书中的要领。然而,我们记不住大部分我们阅读过的东西,这也不是新鲜事。重复是学习之母,然而假如你阅读完了《二十一世纪的资本论》,没有多少场合能让你考虑资本收入比率。更没有多少人会在阅读《时间简史》后还会全身心投入在黑洞理论里。
面对这个事实,有一个完全合理的办法是坦然处之。阅读《制造共识》本身就是很愉快的体验,为了阅读这本书而阅读这本书是合情合理的;把所有休闲活动都拿到投入-收益分析的透镜之下审视,实在是没必要。你读完法官朱迪的故事,也不在意你记住了多少,乔姆斯基也不例外。我需要指出的是,我没读过乔姆斯基写的书,我在这里提到他是把他当作智力高峰。
我目前在大量学习经济学的知识。我很关注我这个学习项目,因此我有充分的动机,选择一种学习效果优先于乐趣的方式,在经济学上付出我有限的阅读时间。我逐步设计出一套系统,来帮助我记住更多我所读到的东西。这套系统收效不错,我听到过「你到底是从哪里读到这些东西的?」和「显然有人读过《国家为什么会失败》。」我的这个系统显然是我全盘编造的,并没有多年的(或者任何)科学验证支撑,但我觉得很有效。下面是一个简短的总结。
基本理念
学习来自于重复,但书本上的内容冗长而繁琐,并没有考虑到这点。阅读相同话题下的多本书,可以实现更高阶,更宏观的重复,但这样的重复并不能保证你能记住想要记住的具体知识,或者知识如何一步步构建起来的。
为了实现更频繁的重复,我认为读书应该分成两个阶段:
-
读书并批注,注意批注要让读完之后容易扫视重点并消化
-
读完这本书就要写「读后总结」(writeup)。其内容包括总结这本书,进一步研究,制作抽认卡(使用Anki)
读后总结通常需要一到四个小时,有三个目的:
-
对整本书来一次大范围重复
-
将书中的重要部分提炼成闪卡,从而永久重复下去
-
提供了一本书内容的精简总结,以及你对它的看法,便于未来参考
阅读总结有种种好处,但你必须先踏实地读书才行。
1. 阅读这本书
阅读时别忘记拿根笔。在书上涂涂画画,阅读会更加有效,同时也容易写读后总结——这点更重要。写读后总结时要纵览全书,总结要点,这时候优质的批注是给你自己提供的提示,能起到引导作用。你只需要将批注收集起来,并完成批注指示的行动即可。
注释最直接也最基本的形式是下划线。一旦一句话,一个词,或者一段文字抓住了你的眼球,在文字下面画上一大条线。但还有更好的做法。写下批注来说明一下,为什么你被这些吸引了注意,你想如何处理这条批注。是因为你看到了未来研究的线索?是这句话挺漂亮,还是这句话提纲挈领,简直是串起前面十页书的关键?
我发现,我可以用一小套符号来回答这些问题:
| Q | 写读后总结时将这个事实做成卡片|
| ---- | ------------------------------------------------------------ |
| ? | 读后总结时,先做些研究,再把这个观点做成卡片 |
| r? | 需要进一步研究 |
| * | 很重要。也许做成卡片的话太过宽泛,但在读后总结中的总结一栏中应该记下 |
| ... | 这个问题很复杂--在总结的时候要多考虑一下。|
| lol | 好的引用——在写读后总结时把这句话抄下来,并添加到一份总的「好的引用」列表中。(我开始使用这个符号只是为了表示有趣的名言,但后来演变成表示所有类型的好的引用。这导致了一叠证据,无疑有一天会在法庭上困扰我——「随着他的心落入黑色的深渊,托马斯扣动了扳机」LOL))
我也有一些符号,用来作为常用笔记的速记:
| orly |我不相信你。 |
| ---- | ------------------------------------------------------------ |
| R | 如果你打算写一个评论。的话,这一部分尤其重要。这可能包含一些非常好的或非常愚蠢的东西 |
此外,把较长的句子写在空白处,并用大箭头指向他们所涉及的文本部分,用这些句子来:
-
把重要内容换个方法描述,或复制过来
- 「欧盟中的贫穷国家怒火中烧,因为他们需要救助比他们更富裕的希腊,并支付希腊老人的高额养老金」
-
写下想到的任何其他想法或联系
- 「我猜测,如果你高估了你的风险管理模型的力量,不管这些模型有多好,都会坏事」
-
写下你想出的一些问题,而作者没有回答的。把问号放在方格中(见下文)。
- 「为什么小经济体愿意加入欧盟?」
这些手写笔记迫使你更深入地琢磨你所阅读的内容,并将构成读后总结的总结部分的基础。最后,在每一章结束时,重新翻阅该章,并简单写份内容概要。读完一章不要忘记写总结——如果你这时不写,就永远不会写了。
一旦你读完了这本书,并且对你所读的内容有所理解,书中也写满了各种符号、笔记、总结,那么万事俱备,你可以开始在读后总结中巩固你的知识了。
2. 读后总结
开始(最好是完成)读后总结的最佳时间是当天,或最多是在你读完一本书后的第二天,这样知识在你脑海中还很鲜活,正适合重复。开始写总结要比继续阅读清单上的下一本书难得多,所以保持势头很重要。
用模板开始你的总结。我的模板中有下列标题:
-
评论
-
总结
-
引用
-
问题
-
我的想法
从阅读评论开始,在上面做简短的笔记。接下来,翻开书,把你给自己留下的所有注释都扫一遍。大部分内容应该是意识流的总结(写在"总结"部分),以书中的要点为指导,你要么在旁边写一个大*号,要么在空白处手写出来。我在那些原文的文本注释前面加一个箭头(=>)来区分我自己的理解笔记。我用引号来表示作者与我想法不合的地方。你可以添加章节标题和偶尔的页码,以便在需要时从你的笔记中找到书中的相关章节。
「这些富得流油的民主党人根本不鸟平等问题,除非选举年到了,要把平等问题当作口号」(P92)。
=> 这是非常绝对的声明--他是怎么知道的?
除了写总结之外,你还应该:
-
将所有好的引用(在书中用 lol 标记的)添加到「引言」部分
-
在 Anki 中把每个要记住的要点(用 Q 标记)添加到抽认卡中
-
在「问题」部分添加每一个研究点(用「?」标记)
在这之后,回到你的「问题」列表,研究每一个问题并制作更多的闪卡。如果你觉得很感动,那么你可以在「思考」部分用意识流来结束你对这本书的总体反应。我还喜欢把「引言」列表复制到一个漂亮片段的主列表中,并注明它们来自哪里。
每个人都应该在手边放上一堆格言——你永远不知道什么时候会用到。
Robert Heaton
结论
如果你遵循这个过程并坚持复习你的抽认卡,你会记住更多你所读的内容。你还可以找到其他方法来增加重复次数。找一些人和他们讲讲你所学习的东西。如果我的经历可以作为参考,那么我的妻子会非常乐意与你交谈,特别是如果你记得她父亲的生日。如果你能对一本书说出一些连贯的话,就写一篇评论。如果一本书足够好,那么一年后再读一遍(我没有经常这样做)。
另一方面,如果一本书很无聊或很肤浅,那么就不必再花时间了。如果你决定不在乎记住任何你刚读过的东西,就不要费心写了,直接去读更好的书。如果你想把一本书作为「一般常识」来读,而不花太多时间在上面,那么我觉得也没有问题,但我觉得你有点自欺欺人。我每周会听几个小时的播客。如果我记得播客中一个参议员的名字,以及听某个我不记得名字的女人描述的马来西亚经济的大致状况,我就觉得很好。但我对此无所谓——我喜欢主持人的声音,也许毕竟有「一般常识」这回事。
我确实认为,最重要的是对自己诚实。如果你读书纯粹是为了好玩,那就尽可能多地去玩,不要回头看。但如果你是为了知识而读书,请注意这是完全不同的事情。
渐进阅读
渐进阅读是一种软件辅助学习和在阅读中记住信息的方法,它涉及从电子版文章中制作抽认卡。“渐进阅读”意味着“分次阅读”。该方法的工作方式是保持一个很长的电子文章或书籍的阅读清单(通常是几十或几百篇),并在每个时段阅读几篇文章的部分内容,而不是一篇一篇的线性阅读。阅读列表中的文章优先次序由用户确定。在阅读过程中,文章的关键点将分解成抽认卡,然后在间隔重复算法的帮助下,进行长期的学习和复习。
在渐进阅读的后期阶段使用抽认卡的依据,是间隔效应(每次学习在时间上间隔开,学习效果更好的现象)和测试效应(有学习时间用于通过测试提取要记住的信息,长期记忆会增强)。它针对的是那些试图终身学习,吸收大量信息的人,特别是当这些信息来源各不相同时。
历史
一般认为渐进阅读是由波兰软件开发者Piotr Wozniak创造的。他于 1999 年在 SuperMemo 99 中实现了渐进阅读的第一个版本,为其提供了基本工具:一个按优先次序排列的阅读列表,摘录部分文章内容以及创建填空题的能力。[[1]](https://en.wikipedia.org/wiki/Incremental_reading#cite_note-1)“渐进阅读”一词是第二年在 SuperMemo 2000上出现的。[2]后来的 SuperMemo 程序增强了相关工具和技术,如网页导入、材料过载处理等。[3]
2007 年出现了对文本编辑器 Emacs 的渐进阅读支持,但比较有限。[4]
之后, 在 2011 年发布了一个 Anki 的渐进阅读插件;[5]对于 Anki 2.0 和 2.1,有另外一个插件可用。[6]
继渐进阅读之后,Piotr Wozniak 又发明了一系列相关概念:渐进图像学习、渐进视频、渐进音频、渐进邮件处理、渐进问题解决,以及渐进写作。他用“渐进学习”来整体指代这些概念。[7]
方法
阅读电子文章的过程中,用户摘录最重要的部分(类似于在纸质文章上划线或加亮),并将其逐渐提炼为抽认卡。抽认卡是以一问一答呈现的信息(从而有可能实现主动回忆)。挖空卡片经常用于渐进阅读,因为在文本中挖空创建卡片很容易。摘录和抽认卡的时间安排都是独立于原本文章的。
随着时间推移以及复习的进行,文章应该逐渐转化为文本摘录,而文本摘录则转化为抽认卡。因此,通过渐进阅读,电子文章的信息会逐渐拆解为抽认卡。
与摘录相反,抽认卡通过主动回忆进行复习。这意味着诸如“乔治-华盛顿是第一位美国总统”这样的摘录最终必须转化为问题,如“谁是第一位美国总统?”(答案:乔治-华盛顿),或“乔治-华盛顿是谁?”(答案:第一位美国总统)等,或填空题如“[……]是第一位美国总统”,“乔治-华盛顿是[……]”等。
这个制作抽认卡的过程是半自动化的——读者选择要学习的材料并编辑问题的精确措辞,而软件则协助确定文章的优先次序和抽认卡的制作,并进行调度:软件依照其间隔重复算法的规则,计算出读者复习每块内容的时间。这意味着所有经过处理的信息都会以越来越长的时间间隔呈现。
单篇文章阅读多少内容,是和[注意力持续时间]成比例的。而注意力持续时间取决于用户自己,用户当时心情,文章本身等因素。根据 Piotr Wozniak 的说法,渐进阅读显著提升了注意力。[8]
没有间隔重复,同时学习几十个主题时,读者会很快迷失在大量的信息中。倘若有了间隔重复,处理完材料之后,读者便有可能记住材料的一些内容。
参考文献
-
^“渐进阅读的历史”。2017年12月10日检索。SuperMemo 99 迈出了高效阅读电子文章的第一步,引入了阅读列表和原始的阅读工具:摘录和挖空。阅读列表是将阅读文章按优先级排列的列表。摘录可以将较长的文章分割成较短的片段。挖空可以通过句中挖空将短句子转换成问答形式。
-
^“渐进阅读的历史”。2018 年 1 月 3 日检索。SuperMemo 2000 通过引入渐进阅读的概念,大大提高了阅读的效率。
-
^ "Emacs Wiki: Recent changes to "Incremental Reading""。2007 年 2 月 25 日。2017 年 12 月 31 日检索。
-
^ Incremental Reading v4.9.13.来自 AnkiWeb. October 13, 2018.2019 年 3 月 16 日检索。
-
^ Piotr Wozniak. 渐进阅读的优势:提高注意力。2017年12月12日检索。
外部链接
完善 Janki 方法
建议,捷径,对原有方法的修改
在过去的几年里,我就使用间隔重复抽认卡来加速编程学习大作了一番讨论。但我意识到太新颖的想法难以评估其功用,所以这篇文章的目的,是基于我早期的热情之作,在又一年日日不间断的卡片复习之后,进一步优化我的方法论。
为了给我和读者节省时间,我已经把内容浓缩成论点的形式。每个小节代表了我的学习策略中加入的一个原则,其指导方针是在最短的时间内学习尽可能多的材料。
1. 截图卡片优于纯文本卡片
我最早的方法是将纯文本代码片段粘贴到我的牌组里。而我现在都是把代码示例截图(利用快捷键),这些代码有的是我在文本编辑器中打开的、有的来自编程书籍,有的来自诸如 Stack Overflow 之类的网站。我不需要在 Anki 中再次键入代码,便节省了时间。我还能顺带获得语法高亮显示,于是我阅读卡片更快了,复习速度也有提升。
请允许我插嘴说一说非严格的 Tim Ferris 风格的的科学直觉:我认为把事实做成卡片后,在卡片中用图像记录事实的来源,是有助于记忆卡片的,因为 i) 基于位置的记忆比其他种类的记忆更强;ii) 颜色、字体和网站 URL 形成的记忆,比全是文本的卡片更丰富、更独特,因此更容易被记忆。
2. 关注可用功能而不是细节
最初,我将每个函数的详细信息放入我的牌组中,包括类名、返回值及其类型、参数列表和参数顺序。这些年来,我发现一旦加上其他编程语言一起学习,这些信息就很难记住了,尤其是函数名称相似,但用法略有不同的时候 (例如 each())。编程语言之间跳转的过程中,我意识到,这种详细的信息仅能短期提升速度,但很快就失效了。尽管如此,我很高兴我有一门“母语”语言 (对我来说是Ruby) 我是熟悉到掌握了大量细节的,因为这意味着我可以快速地写出个人实用软件、顺手的工具和脚本。
更重要的是要记住哪些内置函数是语言提供的,以及哪些服务在操作系统或协议中存在的。我为各种 Linux 命令或有用的 Javascript 内置窗口属性创建卡片。
有时我会制作「混合卡」——这是我自创的术语。这种卡片总结了某个命令是什么,也囊括了操作中的细节。为此,我在卡片背面先回答「它是什么」,再跟上深入的描述或者实际使用中的代码 (包含真实参数与输出),就像语言学习者为新词汇提供例句一样。我复习时可以瞟一眼这个函数的真实用例,但我并不尝试去背下它。如果之后我恰好有项目需要卡片中描述的特性,我把这些卡片单拎出来 (利用 Anki 的强记模式),并学习卡片上更细节的信息。
3. 剪贴簿卡片
平面设计师有制作剪贴簿的习惯,在剪贴簿中保存他们欣赏的艺术作品和设计,未来的项目需要寻找灵感时可供参考。程序员也可以效仿。一看到特别优雅、高效或聪明的代码片段,就将其放入牌组中,无论代码是在代码库、博客,随手写下的笔记还是抓取的屏幕截图中发现的。
为了将代码示例的照片转换为对 Anki 友好的问题/答案对,我创建了一张卡片,放上代码的屏幕截图,截图前面有个问题,大概是这样的:「这个代码好在哪里?」在我的回答中,我将这项技术的优点列成项目符号列表,这样强制自己认清究竟学到什么,并用语言表达出来,而不停留在隐隐约约地无言欣赏。
有时我反过来分析糟糕的代码,制作卡片问「这是怎么回事?」,这样又能针对糟糕代码建立规则或建议。这两个过程的最终目标,都是让我自己编程时快速判断代码质量。
4. 有序信息不易于 Anki 化
一开始,我认为所有的技术知识都能很好地 Anki 化。从那以后,我降低了我的热情,并注意到一个重大例外:顺序/结构至关重要的信息。例如,我制作了大量卡片描述在服务器上设置 SSH 密钥,这是笔记本电脑和远程服务器之间复杂的、多步骤的舞蹈。尽管我借助 Anki 复习,但我从来没有在实践中记起完整的这一有序过程,总是求助于在线指南。我 Anki 化并复习 SSH 秘钥设置规则的时间被浪费了。
我不确定我失败的确切原因。也许我为这类信息创建抽认卡的办法不对,我该多做一些 SSH 卡片,来询问某个步骤在另一个步骤的之前还是之后。但我的直觉是,创建这么多额外的卡片是糟糕的无底洞,我宁愿维护一个这项过程的清单,用的时候再查看。
5. 暂停学习不需要的技术。在需要的时候使用强记模式。
边缘技术是我的工作中偶尔用到的语言、库、功能集和概念,我认为在有限的复习时间里复习这些技术不是很好。某个项目需要边缘技术,这个情境下我会制作相关材料的卡片 (例如,去年在 Web 应用程序中使用 Backbone),但之后我会暂停对这些卡片的复习。如果出现另一个项目也使用该技术,我会在项目开始之前使用 Anki 的强记功能快速复习该技术。如果这样的项目永远不出现,我会无限期地暂停这些卡,也许再也不会使用了。
你可能会指出,为边缘技术制作 Anki 卡片首先很浪费。也许对你来说是浪费,但是 i) 我发现很难在第一次遇到时就能分辨边缘技术和核心技术,而且,ii) 我发现主动地将技术材料转化为问题和答案这一练习,不仅让我阅读更专注,而且帮助我更快地审视文本以获取可行的信息。
6. 降低强度
标准的 SRS 使用理论(也是 P. Wozniak 所拥护的)要求我们任何一天都要把当天牌组中到期的所有卡片都复习完,才能以最高效率将知识转化为长期记忆。我这么做了差不多两年,但我感觉这样的复习负担太重了。为了应对这个问题,我限制我的编程牌组的最大复习数量为每天 40 张,并修改了 Anki 中的牌组设置,来提升简单奖励 (评分为简单的卡片间隔会增加额外时间),以及间隔修饰符 (任何卡片复习之间的间隔)。这个简单奖励的选项让简单的卡片出示次数更少 (对我来说已不构成挑战了,而且往往是我的牌组中更高级概念的基石,所以这样权衡是合理的),而间隔修饰符调整了算法,让所有卡片之间间隔更大,无论卡片难度,也就是说每次复习之间隔得更久,每天早上需要复习的更少。
我为缩短复习时间付出的代价是,我可能不会沿着「遗忘曲线」复习,这样全局看来是低效的学习策略。我还可以接受,因为我知道编程语言来来去去,而且我意识到 10 年后我可能就不编程了,我的首要目标就是此时此刻,我能飞一般地写程序,能写多快就有多快。此外,如果缩短复习时间,能确保你坚持复习,降低效率是合理的代价,其作用类似困难的减肥节食计划中的欺骗日。
7. 边阅读边编号
我在阅读纸质编程教科书时,一看到我想放进 Anki 里的内容,我便在旁边空白处标号 (1, 2, 3...),再写上简短的提示,如「文件系统效率」。书读完后,我再扫视一遍,要是觉得标号的点还值得记忆,我便添加 Anki 卡片。
我这样做的原因是:i) 要是看到一个点就靠到笔记本电脑前做 Anki 卡片,就会打破阅读的心流,因此批量处理更省时间 ii) 一些教科书作者在后续章节会对一个论点做更深入说明,而我的卡片牌组里只使用最佳描述,所以我这样做。
8. 强调独立于语言的模因
随着我学习更多编程语言和库,我逐渐意识到,应用 Janki 方法学习我的第一门编程语言 Ruby 后, 我学到了 “模因”,即在其他语言中再次出现的元素。这便是 Janki 方法的一部分价值。例如,Ruby 的 Enumerable 模块有「函数式」的方法,如 each(), map(), select(), reject(), zip() 等。这些方法在 Javascript、Lisp、Python 和各种库中(如 Javascript的 Underscore 库)同样出现了,其名称大抵相同。了解这些函数的含义以及使用方法后,学习新的语言环境便更快了。类似地,掌握 Linux 与文件交互的细节之后, Ruby、C 和 Python 中的文件与 IO 交互方法更明晰。
对于区分独立于语言的模因和「此语言独占」的想法,我没有足够简单的办法,只有一些粗略的经验法则。优雅代码和丑陋代码(比如魔数)在其他语言环境中常常有相仿案例(如果还没有,也能很有效地复制过去)与操作系统交互的函数 (线程,IO),只要没有经过抽象,与类似操作系统上运行的语言都共享相同的理念 (linux, Android, iOS, Windows);很多语言的正则表达式很相似 (虽然语法变种很多,这点很烦); 二进制数学、字符编码、性能优化、调试、面向对象编程等概念,在不同语言之间历久弥新。
9. 反复答错后自己执行代码
我若意识到自己多次答错某张卡了,便会在控制台中测试该代码,或者进行类似操作 (例如,对于 Vim 命令,我会在 Vim 中输入快捷键)。我至少这样连着操作两次,这样我的手指就能记住命令,也能向我证明代码能跑起来,并让我理解上下文,由此种种,我下次更有可能记住它。
10. 为卡片的用途头脑风暴。或将其删除。
我复习到的卡片若是包含我从未使用过的编程特性,我便问自己:是这个特性在现实世界里就是没什么用场,还是问题在我,没有下足功夫去找用例?为了回答这个问题,我会结合我手头上的项目进行头脑风暴,来探索这种特性的可能用法,即便有时想的东西很可笑。我得以应用所学的知识,而且要是我找不出合适的用例,我就认输,之后删除这个卡片,裁剪牌组中的不必要内容。
11. 把重点加粗
我们总会想尽办法减少花在复习牌组上的时间。一个简单而有效的解决方案是把问题或答案中的关键字或要点加粗,或者把两者中的关键字都加粗。这个技巧特别适合一些内容相似的卡片,比如一些卡片解释的异常都在同一命名空间或者同一类下面。多年来在网上浏览文本,我们的眼睛很擅长清晰辨识粗体文本,我发现仅仅是在你的 Anki 卡片上看到粗体字体就足以唤起记忆,并激发所需的答案,节省了你原本需要阅读整张卡片的时间。在你的复习中尽可能快地触发记忆,然后继续前进。
不加粗很难浏览
与带有粗体的版本比较
12. 最佳实践卡
无论是通过与更好的程序员配对,观看带有解说的视频,还是阅读 Github 的评论,一旦我了解到一条最佳实践,我都会将其转化为卡片。目前为止还很常规。但在我复习这些卡片时,我采取的办法与普通讲事实的卡片不一样:如果我最近在工作流中没有做到最佳实践,卡片就需要重新来过。与单纯的事实性卡片不一样,仅仅知道最佳实践存在是无济于事的;最佳实践卡片要让我掌握这种实践,而卡片反复失败会带来愧疚,我便会受刺激向最佳实践靠拢。
13. 题目与解说卡
有时你不希望只学习事实,而需要学习一种技术、方法论或心理算法。这时候 (例如,学习二进制数的乘法),我会制作一些卡片,其问题是题目,答案是题目的解答。每当我复习这些卡片,我都会力图解答题目,如果我答案错了,我就会让卡片重新来过。我发现在卡片背面解释我是如何计算出解的 (即方法论),很有必要,这样我就可以提醒自己,如果我做错了,应该怎么做。
比较这两张卡片,一张没有解释:
和一个有解释的:
一个相关的变种做法是,我为某次出错的 bug/命令及其解决办法制作卡片,但附上对该命令的深入解释。
用间隔重复软件记住一门编程语言
原文:Memorizing a programming language using spaced repetition software | Derek Sivers
2013-01-06
这个项目我已经做了一年了,这是我14年的编程经历中最有帮助的学习技巧。
Background:
我是一个中等水平的程序员,没有为此去上学。我只在必要时学习,因为我搭建了一个网站,而这个网站越来越火,我又雇不起程序员,所以我只好拿起几本关于 PHP、SQL、Linux 和 Apache 的书,学到的东西只够让网站工作,然后用这些小知识做了好几年。
但是后来,我和一位专业的程序员一同工作,我被他的专业水平折服了!所有这些命令和函数从他指尖毫不费力的流出。我们使用同一门编程语言,但是他掌握的实在是太多了,以至于我感觉就像一个懵懂小孩与大学教授坐在一起。我非常想达到那种熟练程度。
这引起了我的思考:这些年里,有多少知识是我学习过又很快忘记的。我阅读了很多书和文章,学习过许多有用的知识点,并且立刻实践。但是后来我分了心,忘记了那些知识,又重新回到了我原来做事的方式。
我想深深地记住编程语言的命令和技巧,不忘记它们,以便在我需要的时候,它们能浮现在眼前。
间隔重复:
当你听到一个新的事实,你容易很快忘记,除非它不断在你的脑海中重复。
通过把自己沉浸在某门语言中你可以凑巧做到不断重复新学的内容,比如你学到的新词碰巧被提起。
但是对记忆的研究表明,记住一个新事实最高效的时间恰好是你将遗忘它的时候。
比方说,如果你学了一个外语的新单词,你在听完几分钟后再练习,然后是几个小时,第二天,然后是 2 天,5 天,然后是 10 天,3 周,6 周,3 个月,8 个月,等等。一段时间后,它基本上就被永久地记住了,只需偶尔提醒一下。
间隔重复软件就是这么帮助你的,所以你只需**给间隔重复软件一系列你需要记忆的知识,然后一天做一次小测试,软件将根据你的反馈结果来确定复习间隔。**在每次小测试之后,如果你觉得容易,这个知识点在很长时间内都不会再重复。但如果你觉得被难住了,软件将在几分钟之内再次提问,直到你掌握了知识点。
到 apps.ankiweb.net 并下载 Anki。 这是个流行的免费开源间隔重复软件。
至于编程,你知道我要说什么。
如果你能记忆你所选择的编程语言的一切呢?所有命令,每个参数,各种函数,大部分常见问题的每一个解决方案,都被你的指尖牢牢记住?想象一下,翻阅一篇文档或一本书,永久地记住其中的每一个字
介绍到此为止,我们来讨论一下如何做:
首先,学起来!
抽认卡片适用于*记住\所学知识。*
在你建立某一知识的抽认卡片之前,其实你需要**学习并理解这个知识。**在你很好掌握之后再建立抽认卡片。
(这就是为什么看别人的抽认卡片帮助不大的原因。抽认卡片只是用来辅助记忆的。)
把知识转变成许多小的知识点:
在制作一系列抽认卡片的时候,在正面写上问题,在反面写上答案。
如果你只是用抽认卡片来记忆外语单词,那么抽认卡片的设计非常简单。在正面写上一个单词或短语,背面写上翻译,反之亦然。
但是,如果你要学习其他东西,你就得在制作自己的抽认卡时投入一点技艺和创意。
要花一些功夫来读你想记住的片段,挑出关键的事实,把它们分解成不可再分的最小片段,并把它们编成问题,用来考查未来的自己。
以下是我一年来做这件事的省时建议:
把散落的文字变成代码
如果你在阅读一本关于编程的教程时,看到一段描述一个特性的文字。
「加法(+)运算符...如果只有一个操作数是字符串,另一个操作数被转为字符串,那么结果是两个字符串的连接。」
你自己测试了一下,玩了一下,就明白了。所以你做了一张抽认卡来记住它。
var a = 5 + '5';
// a 的值是什么?
'55'
如果 + 号的任何一边是一个字符串,另一边就会
先转换为字符串,再像字符串一样相加
尝试检测未来的自己
有时你会学到一个 「疑点」——一个常见的错误或出人意料的特性。
「如果向数组构造函数传递一个数字,它将按这个数字的长度来建立一个空数组。任何其他变量的组合都会创建一个包含这些变量的数组。」
你自己测试一下,玩一玩,了解一下。然后做两张抽认卡,尝试检测一下未来的自己。
var a = new Array('5');
// a 的值是什么?
只有一个元素的数组,字符串 '5':['5'];
...然后是几乎一模一样的问题...
var a = new Array(5);
// a 的值是什么?
一个长度为 5 的空数组。
当程序对你进行测验时,卡片会被打乱,因此希望你的例子能有意地吸引你的注意力。
你也可以尝试用更复杂的例子来检测自己,让这些问题在你脑海中记忆犹新:
var a = [20, 10, 5, 1];
// a.sort() 的结果是什么?
[1, 10, 20, 5]
// sort 将所有值视为字符串
不要忘记用这个结果检测自己:
var a = [20, 10, 5, 1];
// 按数值大小顺序排序
function compare(v1, v2) { return(v1 — v2); }
a.sort(compare);
保存很酷的技巧
如果你发现一个你想记住的很酷的技巧,可以把它变成一个小挑战的答案。
var albums = [
{name: 'Beatles', title: 'White Album', price: 15},
{name: 'Zeppelin', title: 'II', price: 7}];
// 让下面的代码能够运行:
albums.sort(by('name'));
albums.sort(by('title'));
albums.sort(by('price'));
function by(propName) {
return function(obj1, obj2) {
v1 = obj1[propName];
v2 = obj2[propName];
if (v1 < v2) { return -1; }
else if (v1 > v2) { return 1; }
else { return 0; }
};
}
要求包含多种解决方案的答案
如果做某事有不止一种方法,而你想把它们都记住,以便将来能想出不止一种解决方案,那么你可以把两种方案都记在脑海中。
s = 'string like this'
# 在 Ruby 中,展示两种把它变成 'String Like This' 的方法
s.split.map(&:capitalize).join(' ')
s.gsub(/\b\S/) {|x| x.upcase}
把宽泛的概念变成言简意赅的例子
假设你刚刚花了 20 分钟学习一些概念性较强的知识,没那么多具体的功能需要记住。这时你只需要一个简洁的例子来提醒自己这个概念。
/(a(b)((c)d))/.match('abcd')
# $1, $2, $3, $4 的值是什么?
$1 = 'abcd'
$2 = 'b'
$3 = 'cd'
$4 = 'c'
其他例子:
class C
self
end
class D < C
end
d1 = D.new
# 哪一个对象是 self?
class D
阅读彼得·沃兹尼亚克所著的《知识表述的 20 条规则》
有关制卡的最佳建议出自一篇名为《知识表述的 20 条规则》的文章,作者是彼得·沃兹尼亚克 ,网址:supermemo.com/en/articles/20rules。希望大家能读一下。
每日练习
为了达到最佳效果,你需要每天打开一次间隔重复软件。如果你太久没有这样做,你将前功尽弃,并且不得不重新学习你本应记住的东西。
**只需要每天 20 分钟,你可以记住成千上万条知识。**我把它当作早晨的例行事项。泡一杯茶,用一会儿 Anki,然后喝茶。
在你测试自己时产生肾上腺素,让自己以最快的速度前进,是一件非常有趣的事情。
这就像一种去精神健身房的旅程。每天 20 分钟的小强度训练,无论是考虑眼前还是长期的影响都很值当。
随时增加新卡片,你将会惊喜地发现所有知识都清晰地印在你的脑海中。
总结
我已经这样练习了一年,这大大促进了我写代码的流畅度。如你所见,我强烈推荐这个方法。
你可以向我发邮件来让我知道这种方法对你效果如何。
进一步阅读:
Jack Kinsella 所著的《JAnki:写给程序员们的 13 条 Anki 使用经验》是一篇关于相同方法的好文章,有些地方比我写得更好。
你可以用 Anki 来学习所有知识。
Michael Nielsen 所著的《增强长期记忆》是一篇讲述用 Anki 学习任何知识的好文章。
阅读《连线》对彼得·沃兹尼亚克的访谈 ——把这个方法推向极限的人的故事。
© 2013 Derek Sivers.
Copy & share: sive.rs/srs
没有老师,没有班级,没有作业:你会送孩子到这里来吗?
民主学校或许是百年来最激进的教育实验。
2012 年 12 月 12 日
A.S. Neill 在夏山学校的教室(John Walmsley 摄)
距离波士顿不远,马萨诸塞州的乡村中,大约 200 名各个年龄段的学生参与了一项激进的实验。除非自愿,这些学生不用参加任何课程。他们可以花时间做任何想做的事情——阅读,玩电子游戏,烹饪,创作艺术,前提是不搞破坏和犯罪。共有 11 名成年人,称为「教职员工」;严格来说,没有人拥有「教师」头衔。孩子们制定规则,通过民主程序进行惩罚,社区中的每个成员都有一票——这意味着孩子们的票数几乎是成年人的 20 倍。与大多数私立学校不同,录取学生时不考虑他们的学习成绩。
今年春天,心理学家、波士顿学院教授 Peter Gray 的新书将会聚焦于瑟谷学校。他的儿子在 20 世纪 80 年代就读于瑟谷学校。当时,Gray 是一名教授和神经生物学研究员,他的工作重点是哺乳动物的驱动机制 ,在实验室里研究大鼠和小鼠 ,但他的儿子在学校里的苦苦挣扎改变了他的工作重点。
「他在学校里很不开心,而且很叛逆,」 Gray 在一次电话访谈里这么形容他的儿子。在四年级时,儿子劝 Gary 让他转学到瑟谷学校 。很明显他在那里能够「自由成长」,但 Gray 「对是否有人能从这样一所离经叛道的学校里毕业 , 并继续接受高等教育抱有疑问。」
Gray 最终成为一名学习与发展心理学家,以便继续对瑟谷教育的成果进行研究 。 这些成果令他叹为观止, Gray 描述他自己的儿子「早熟且善于表达」,他的问题不在于掌握学习材料本身,而是「浪费时间」——接受一般学校教育(即其平均教学进度和僵化的课程结构)所导致的 。
但并非所有瑟谷学校的学生和校友都是自学者:「有些人被诊断出学习障碍。」另外,虽然有些孩子家庭背景优越,父母都积极支持他们寻求替代教育,但其他父母却别无选择。(Gray 提到他所研究的大部分学生都来自于公立学校,而非来自于私立学校)但是大部分学生在学校里表现得很好,并且校友在后续回访中也很满意他们的生活。所以为什么自学的学习者能够更好地适应成年人的生活? Gray 开始探究原因。
要想让父母勃然大怒,只需叫他们不信任的人去教他们的孩子,教孩子去做、去说、去想父母不允许的事情。 虽说各家父母各不相同,但大都能达成一些共识,比如:大部分人都同意学校需要教给孩子高尚的道德观和良好的生活习惯 ,例如分享,批判性思维和共情等, 而不仅仅只是具体技能;大部分人都会同意开一门讲「个人责任」的课程;大部分人都会同意,要培养孩子的创造力和发展他们自身的兴趣爱好。
有一些学校声称要直接教授这些价值观,它们被称为民主学校,但是大部分家长绝不会考虑送他们孩子去这样的学校,因为这些学校几乎全靠孩子自己管理。
虽然民主学校之间有着显著的差别,但其基本观念是一样的。在管理学校时,不管是决定教授的课程或是设置宵禁的时间,决策的规则统一都是「一人一票」。不论学生的年纪是六岁或是十六岁,都和教师的选票被同等地计入决策。同时,因为在大多数学校里,教职工的群体远远没有学生群体庞大,故而最终的决策人会是孩子们。
现存的民主学校中,最古老的就是夏山学校,一所由英国教育家 A.S. Neill 在 1921 年创办的男女混合寄宿学校。在它创办时,大量非主流教育在英格兰涌现,但都以失败告终。但夏山学校,学生 100 人上下,还有大量国际学生,依旧欣欣向荣。1999 年和 2000 年,这所学校经历了一段艰难的时期,因为与英国国家认证机构 Ofsted 发生冲突,差点被关停,巡视员称这里的学生行为「粗鲁又任性」。官司打了很久,学校才最终得救。2007 年,它在历史上第一次收到官方认可 。巡视员做了个高度评价,称赞学生「全面、自信、成熟。」
尽管没有英国的夏山知名度高,但瑟谷学校某种程度上是美国版夏山。在 20 世纪 60 年代末和 70 年代,「自由学校」的运动在美国正值其顶峰 。在很大程度上,其理想与反战运动,黑人运动和其他同一时代的理想主义的目标相吻合。同样的还有学校的反主流文化氛围和初具雏形的无政府主义氛围。在这样的背景下,1968 年,一位哥伦比亚大学科学史系的教授决定离开大学教学岗位,并在马萨诸塞州乡下成立了一所自由学校。过去四十多年里,一代代学生低调地毕业,学有所成。这所学校在教育圈外鲜为人知,但全世界已经产生了大约二十所依照瑟谷(也就是民主)原则运行的学校。
当 Gray 开始研究瑟谷学校时,学校的第一届学生才刚刚毕业。虽然他在瑟谷学校所做的研究有限,但却启发 Gray 使得他把研究重心转移到学习、玩耍和教育上来。他同时是非学校教育运动和瑟谷学校的坚定支持者, 并且他在自己即将出版的著作《玩耍精神》中主要着墨于此。特别地,他强调了瑟谷学校的混龄社区——供四至十八岁孩子时不时地交流互动的地方。「年纪小的从其他孩子们身上学习,他们在和年纪较长的、能阅读的孩子们一起玩需要阅读的游戏中学习阅读。他们和其他孩子玩没法自己一个人玩的复杂的纸牌游戏。」其他的学生也在其中受益:「他们学着如何去关心,去帮助。他们意识到自己的成长。」
对于年纪更小的孩子,混龄学制替代了师生的互动。传统教育和瑟谷学校都在某种程度上奏效,是因为它们发扬了「近侧发展区」这一理念:有些事情,儿童无法独立完成,但在帮助下就能做到。根据一些理论,和一个能力更强的人一同做事,孩子就会学习并掌握在近侧发展区内的活动技能。
理论上来讲,一所学校不一定要民主才能允许混龄学制,(举个例子,)一些蒙特梭利学校允许有限程度的混龄。但同 Gray 指出的那样,在大多数学校里使用的严格的、按年纪区分的课程使得混龄制变得遥不可及。反过来说,要是瑟谷的所有孩子年纪都相仿,那么瑟谷学校「根本无法奏效。」
在某种程度上,民主会议使得学校能够运行:民主学校给潜在的不受法律约束并且混乱的体制以框架。当同学间的警告不奏效时,这一机制能处理校园欺凌(在瑟谷学校几乎不存在)和破坏行为。这种方法,也是为共同体的法律精细化作贡献。「这所学校,」Gray 说道,「有一本非常厚重的规章制度册。」
他举了一例。「几年前,有一个新来的十几岁的学生,穿着印有万字符的黑色皮夹克来到学校。这一行为的冒犯性,使得学校在集会上制定了一条规则,在学校里不能穿印有万字符服饰的衣服。」这条规则的提出激起了一场关于言论自由的边界的讨论,在 Gray 看来,「这值得最高法院来研究。」
学生们很快发现言论管制和学校的民主价值观的矛盾。「有各种各样的人都在参与,大部分是青少年和员工,但每隔一段时间,也有年龄更小的孩子发言。而那些不发言的也会全神贯注地听,了解和学习历史,纳粹主义,以及为什么穿戴万字符是一个特例,为什么这会和戴镰刀锤子不一样。」会议最终通过了这条规定,进一步更大规模地禁止仇恨言论,引导学生辨别常规言论和仇恨言论。
今天存在的大部分大型的民主学校都曾有过优异的成就。瑟谷学校的成立者们曾汲汲于宣传他们学生「成功满足『真实世界』的需求」 。Gray 告诉我,他的研究指出,大约 75% 的瑟谷学校毕业生们继续去上了大学,而那些没有去的人也反馈他们的生活很充实。
成功与否,部分取决于你认为的良好生活是什么样子。英国著名的自由学校,夏山学校,在 2011 年庆祝建校九十周年时,《卫报》从一些校友那收集了反思和意见。(有着严格的寄宿学校年级制度的英国人,自从夏山学校建立时就被其深深地吸引住了。)在这群人中有艺术家,一位牙医和一位作家,许多人说,他们接受的教育让他们「喜欢上做自己。」
Gray 在采访中坦白,很难搞清楚这些学生的成功是因为瑟谷,还是由于学校外的因素。相较于漫不经心、并不花多少精力择校、没有更多时间专注于此的家长,瑟谷的学生的父母能够通过调研并送孩子去这所学校,已经表明了其对孩子成长的充分参与,并给予了强力支持。每年 7800 美元(多个孩子在校则按比摊派)的学费,很多在瑟谷学校上学的学生经济条件都相对优渥。
Jonathan Kozol 等作家坚持认为,来自低收入家庭和富裕家庭的孩子们都从另类教育中同等程度地受益。然而,因为实践困难重重,有关民主学校效率的数据很大程度上是没有实据,过于主观。因为民主教育从未大规模地在有着低收入或有困难的背景的学生间试验,很难知道其对于这些学生有多少帮助。
和所有学校教育一样,你是否会受到民主学校的吸引取决于你更重视什么。你更希望你的孩子能够在经济和社会地位上更上一层楼,还是希望他做个格格不入的思想家?你更希望教你的孩子脚踏实地,在官场叱咤风云,还是倾向于她能学着参与一种近乎完美的民主?这不是一个非黑即白的抉择,但民主学校很大程度上强调后者的重要性。即使一些自诩先进的家长和老师认为这些学校不能带来全面发展。瑟谷学校模式常被人指摘,仅仅因为其没有教孩子一些成人必备知识,尽管提倡者认为大多数孩子最终都自学了他们成人需要的技能。你也可能认为,在一个更抽象的层面上,一些特定共有的基本知识能使我们成人(或者美国人),而这是瑟谷学校的学生所丧失的。(这是大学核心课程背后的精神,而且与瑟谷学校的哲学背道而驰。)
瑟谷学校留存了下来,但是 20 世纪 60 和 70 年代建立的美国大多数民主学校都失败了。在 1986 一篇合著文章中, Gray 和瑟谷学校的员工 David Chanoff 对此做了反思:
有无数所谓的自由学校在在二十世纪六七十年代开创,他们中的绝大多数都失败了。人们不愿意用他们的孩子冒险。当家长和老师们看到孩子们真正有得选的时候,如果不选择加入被大众认为的「学校活动」,他们就会焦灼,这是可以理解的。「如果我的孩子掉了队跟不上了怎么办?可能他在学校被宠坏了,纵容了他的坏习惯和不自律。或许他会考不上大学,找不到工作,工作不稳定,他的人生就毁了。」在许多方面,传统的学校教育或许不吸引人,但至少人们对它知根知底,而知根知底总比未知让人放心。事实上,在今天的美国,我们几乎没有一个不经学校教育而成功的榜样。自然,我们都有一种执念,认为这样的学校教育是成功至关重要的条件之一,其缺陷则忽略不记。
于是当一所非传统学校开始不那么像学校时,也就是说,当它真的「另类」时,成人(也包括很多孩子)会觉得它摇摇欲坠,要么关停,要么整改。
很多人同意,现在十几岁、二十几岁的这代美国人,童年时受到的监管和拘束都是史无前例的。这些监管会持续吗?以及当这代人成为家长时,会因为曾太受压抑而更敢于对自己的孩子放手吗?让我们拭目以待。如果他们对所受到的培养方式积怨已久,那么有可能,民主学校对他们极具吸引力。
Emily Chertoff,前作家,国家频道《大西洋月刊》制作人。
鲜有人问的问题:我们的孩子在学习吗?
原文:Rarely is the Question Asked: Is Our Children Learning?—Asterisk
作者:Lauren Gilbert
全球在校学生人数创历史新高,但这些学生在学校是否真的学到了更多知识——甚至这是否是教育的真正目标——都还是个未知数。
过去半个世纪,儿童的境遇显著改善。如今出生的孩子很可能比他们的先辈更长寿、更健康,也有更多机会去上学,不同于前几代人,仅仅上学一两年就不得不去卖体力维生。1960 年,发展中国家成年人的平均受教育年限仅为 1.6 年,但到 2000 年已经增至 5.4 年。即便是在当今世界最贫困的国家,新生儿也有望接受近 9 年的学校教育。
与往往不识字的祖辈不同,现在的孩子将有机会学习读写。过去在贫困偏远地区获取外界信息几乎不可能,而现在的孩子可以使用互联网,更好地融入全球经济。上一代人背井离乡,努力寻找工作机会,而如今的许多年轻人将有机会在互联网世界中追求更大的发展。
这项成就值得全人类自豪。尽管仍有不足——6000 万适龄儿童无法接受小学教育——但总体而言,普及教育的目标已基本实现。短短半个世纪,世界从只有少数特权阶层能接受教育,发展到[几乎人人都有机会接受教育](https://www.cambridgeassessment.org.uk/our-research/data-bytes/progress-towards-universal-primary-education/#:~:text=The goal of achieving universal,increased to 90% in 2015.)。
那么,问题何在?
这个看似美好的故事实际上比表面更为复杂。虽然入学人数增加了,但我们不确定学生的学习质量是否增加。一些证据甚至表明情况可能相反——尽管上学的时间更长,但学生实际学到的知识却可能更少。尽管过去几十年在教育领域投入巨大,但当我们深入分析数据时,发现关于教育影响的有力证据仅止步于此。我们缺乏有力的数据来证明增加学校教育能带来关键的人生成果——比如提高收入。那么,发展中国家的学校究竟发生了什么?我们能否就教育的预期成果达成共识?
发展中国家学校的现状
那么,发展中国家学校的现状如何?
毫无疑问,更多的儿童正在上学。就在 1991 年,撒哈拉以南非洲地区仅有一半的小学适龄儿童在校就读;到 2009 年,这一比例上升到 75%。此后,这个数字持续攀升——即使在世界上一些最贫困的国家,也有 80-90% 的儿童开始接受学校教育。失学儿童的数量和完全没有受过教育的人数正在显著下降。
为了普及教育,政府和家长都付出了巨大努力。以撒哈拉以南非洲为例,政府在教育上的支出占国内生产总值的比例从 2000 年的 2.6% 上升到 2017 年的 3.8% 峰值(尽管此后有所下降)。相比之下,高收入国家在教育上的支出约为 5%——而这些国家在卫生和其他领域面临着更为严峻的资源分配挑战。[1]家长们同样不惜牺牲,为给孩子创造更好的未来而倾其所有。乌干达人平均将超过 10% 的收入用于支付子女上学的费用。在利比里亚,约 60% 的人将支付学费视为最大的经济负担,而在赞比亚,这一比例为一半。
然而,遗憾的是,这些牺牲换来的教育质量往往令人失望。发展中国家学校和发达国家学校的差距不仅仅是资金的差距,其问题更为根本和复杂。
比如说,学校最起码要确保教师在校授课,这是最低衡量标准。而在印度农村地区,每天都有近四分之一的教师根本不来上班。即便是教师到校,也经常不在教学。世界银行的一份报告显示,肯尼亚的教师即使到校,也有 42% 的时间不在教室。
学生的出勤情况同样令人忧心。在肯尼亚,平均每天有十分之一的学生逃学;在印度,这一比例高达三分之一;而在莫桑比克,更是超过了一半。更令人担忧的是,这些数字很可能比这更糟;因为学生和家长声称的出勤率[2]往往高于突击检查时的实际情况。
那么,当师生都到校时,孩子们总该好好学习了吧?然而事实并非如此简单……
低收入国家的教室面临着比发达国家更多的资源限制:班级规模更大,几乎没有空调(学生不得不在 40 度的高温下坚持学习)[3],教科书往往需要多人合用且内容过时。一些学生上学的唯一动力是能够获得免费餐食 —— 而在那些没有校餐计划的国家,饥饿仍然是阻碍学生上学的重要因素。诚然,这些问题并非穷国独有,但在那些每个学生年度教育支出仅为 50 美元的地方,这些困境被大大加剧了。
即便我们不考虑这些限制因素,发展中国家的学校困在课程收效低微和教学方法僵化的泥沼。国家制定的课程几乎不根据学生的实际水平进行调整,而且很少有学生能够达到「年级水平」,但教师仍被要求假设学生已达标的方式进行教学。教学内容主要依赖于死记硬背。教师没有培养学生的批判性思维,反而有效地训练了学生复述教师期望听到的内容的能力。更为严重的是,课堂的授课语言往往学生自己都不会说。
家长们都希望自己的孩子学习英语。[4] 这很合理;在大多数国家,最好的工作机会都留给了英语使用者。然而,用孩子和他们的老师都不熟悉的语言进行教学并不会带来更好的学习效果——甚至不能让学生真正掌握英语。反而,这种做法导致学生既不能学好英语,也无法掌握自己的母语。
以卢旺达为例,英语是各个年级的官方教学语言。然而,只有 38% 的教师能够熟练使用英语,这导致卢旺达的学校教学沦为一场荒诞剧。不精通英语的教师试图用英语教授同样不懂英语的孩子,还要使用英文教科书。[5]
令人不安但并不意外的是,在这些条件下,学生几乎无法掌握继续接受教育所需的基本技能。在低收入国家,高达 70-[80%](https://www.worldbank.org/en/topic/education/brief/what-is-learning-poverty#:~:text=Using a measure developed jointly,as high as 80 percent.) 的小学生无法阅读一个简单的故事。超过半数的儿童到了 10 岁时仍然不具备阅读能力。在对 51 个发展中国家的调查中发现,约有一半的女性在结束学业时依然无法理解「父母爱他们的孩子」这样的简单句。某些国家的情况更为严峻:在马拉维,75% 的二年级学生甚至无法辨认出「母亲」的母语词汇,而在尼日利亚或塞拉利昂,能够理解「务农是辛苦的工作」这类句子的年轻女性比例不到 10%。
教育质量低下的问题不仅仅体现在阅读教学上,而是涉及整个教学体系。以印度农村地区为例,高达 70% 的三年级学生不会减法,[70% 的五年级学生](https://img.asercentre.org/docs/ASER 2018/Release Material/aser2018nationalfindings.pdf)甚至不会除法。在中低收入国家,平均只有 18% 的三年级学生掌握基本的数学技能。理想情况下,学校教育应该培养出能够经营小生意或改进农业技术的成年人。然而,当学生连基本算术都无法掌握时,这实在是奢望。
有人可能认为这只是暂时的现象。毕竟,学校系统从服务不到一半的人口,到努力让所有适龄儿童入学,同时还要保持教育质量,这确实挑战巨大。然而,问题似乎不仅没有好转,反而在持续恶化[6]。发展中国家的教育质量正在随时间下降,这种趋势在过去几十年尤为明显。令人担忧的是,尽管五年级学生的入学机会增加了,但在绝大多数发展中国家,他们识字的水平反而下降了——平均降幅高达 8.5%。
那么,父母和学生投入收入的 10% 到底换来了什么?坦白说,这个问题难以给出明确的答案。学生在学校可能确实学到了一些东西,但我们却很难找到系统性的数据来证实这一点。不过,上学总比不上学强,对吧?
学校教育能否足以带来工资回报?
然而,大多数父母并非纯粹出于求知的目的而关心孩子的学习。在他们看来,学费是一项投资。在对尼泊尔、孟加拉国、赞比亚和乌干达的父母进行的调查中,对教育的收益这一问题,各国普遍认为:上学能带来更好的工作机会。在这些国家中,如果教育的最终目标是提高工资水平,我们目前还无法确定学习更多的学业技能就是实现这一目标的关键。
大多数研究表明,学历更高的学生终身收入更高,但现有证据还不足以证明这些收益直接源于学习本身。一种可能的解释是,这些在校多年的学生,本就更有可能在劳动力市场上表现出色。换言之,并非学校教育使他们获得了更高的工资,而是那些喜欢上学的学生也往往更擅长工作。这涉及到统计学上的抽样偏差——继续上学的学生和辍学的学生在本质上存在重要差异,正是这些差异导致了工资的差距,而不是上学经历本身。
这种观点至少在某种程度上是成立的。有些学生的父母受过教育或收入高于平均水平,那么他们就比别人更有可能继续接受教育。这些优势也与终身收入相关,因此,接受教育的时间长短最终会与终身收入呈现相关性。
当经济学家试图控制所有可能观察到的变量时,他们发现接受更多教育确实似乎会带来更高的收入。根据目前最可靠的横截面数据估计,(在发展中国家)多接受一年的教育可以使终身收入提高约 9%。
然而,衡量证据质量的最高标准并非控制更多变量,而是随机对照试验——最好是进行多次这样的试验。在撒哈拉以南非洲地区,有限的随机对照试验结果显示,接受更多学校教育几乎不会带来工资增长(尽管对健康有显著益处)。现有证据甚至支持这样一种可能性:父母牺牲 10% 的收入投资于教育,却可能得不到任何工资回报。
学校教育的意义何在?
即便在发达国家,人们对教育目的的看法也存在分歧。学校教育真的仅仅是为了获得经济回报吗?也许是——但也可能是为了培养学生成为全面发展的人。或许教育是探索真理的过程,是获取世界知识的途径。但如果是这样,那么我们应该学习什么知识,又是为了什么目的呢?也许学校应该注重培养学生的品格和抗压能力,或者应该侧重于教授「实用技能」。
然而,发展中国家的政策制定者往往认为学校教育的主要目的并非上述任何一项。他们更倾向于让学校培养尽责的公民,而非专注于经济回报或个人发展。
在一项离散选择实验中,研究人员要求教育部门的官员[7]在基础识字能力、中学毕业率和培养尽责公民这三个目标中做出取舍。结果显示,受访者对培养尽责公民的重视程度比提高识字率高出 50%。[8]这一发现揭示了一个耐人寻味的现实:对许多政策制定者而言,教育的首要目标并非传授知识,而是培养民族主义情怀。
这种优先次序可能听起来有些匪夷所思,但事实上,在 20 世纪初,当欧洲和拉丁美洲国家将教育系统从服务小范围精英扩大到更广泛人群时,他们也曾有过类似的优先考虑。当时,教育的目标并非培养科学家或企业家,而是培养一支可靠的劳动大军,以支持国家发展。
1899 年,美国教育专员 William T. Harri 明确表达了这一观点。他希望美国的学校要「宛如机器」,其目标是教导学生「遵守秩序,安守本分,不妨碍他人」。在那个年代,人们在培养「尽责公民」时,更加强调「尽责」这一方面。
发展中国家的学校正在努力实现类似的目标。学生们学会了死记硬背、服从命令、不提问,但他们并没有真正掌握阅读和写作技能。然而,提高识字率本来就不是这些学校的首要目标——发展中国家正在重复发达国家曾经走过的老路。就像发达国家曾经做的那样,他们也将尝试「教导普通民众服从、尊重法律、[以及]热爱秩序。」[9]
诚然,这并非官僚在教育领域的唯一目标;几乎没有人认为学校应该完全沦为国家宣传的工具。同一项研究表明,政策制定者的第二大优先事项是确保学生完成中学教育。在这方面,他们也取得了进展。[10]如前所述,扩大教育机会是过去半个世纪以来教育领域最大的成就。
然而,在他们的第三大优先事项——提高识字能力方面,发展中国家的学校仍然面临挑战。考虑到全球公立学校系统普遍面临的预算限制,这种情况也许并不令人意外,识字能力已经成为一个「锦上添花」的目标,而非必需品。
毕竟,三个目标中完成了两个已经算不错;不难理解为什么持有这些优先事项的官僚会认为学校的情况相当理想。孩子们在上学,遵守规矩,「免费和公平的教育」[11]这一目标已经实现,官僚们便可以转而关注其他问题。
然而,关心教育成果的并非只有各国官僚和家长。国际捐助者在教育领域扮演着重要角色,与官僚相比,他们更加关注学习成效,而非公民身份的培养。
我们可以再次理解他们的观点。在发达国家,人们普遍认为上学的目的是学习学术技能。这些在学术界被称为「认知技能」的能力,是决定一个人成年后收入的主要因素。学得越多,收入就越高。即使教育程度相同,如果你掌握的知识更多,你的收入很可能会(显著地)更高。富裕国家的就业市场确实高度重视认知技能。
如果学校是人们获得这些技能的主要场所,那么学校的目的就应该是尽可能多地传授认知技能。学习才是学校教育的核心——不是灌输思想,不是单纯的出勤,而是真正的学习。
在这方面,我们至少有一些好消息:我们大概已经知道发展中国家可以采取哪些措施来改善其糟糕的学习水平。
显然,首先得根据孩子们的实际水平进行教学。在发展中国家的课堂上,普遍采用标准化的教学大纲——所有二年级学生学习相同的内容,所有三年级学生学习相同的内容,以此类推。然而,发展中国家课堂内的学习水平差异很大,一个班级中存在跨越多个年级水平的知识差异是很常见的。对于仍在努力理解简单句子的学生来说,给他们一本章节书帮助不大;对于还在学习加法的学生来说,要求他们做除法也不恰当。大多数情况下,学生们只会把他们不理解的内容当作耳边风。
相较于按照学生的官方年级水平进行教学,针对学生实际掌握的知识进行教学要有效得多。这种方法在印度的大规模实践中已经证明了其成功。研究显示,学生在为期 10 天的「因材施教」(Teaching at the Right Level,简称 TaRL)学习营中获得的知识,相当于他们在传统学校中 4 年的学习量。尽管在整个学校系统中推行 TaRL 较为困难,但一些政府在小范围试点中取得了成功。例如,当博茨瓦纳在学校试行这种方法时,能够进行加减运算的学生比例增加了 7 倍。他们计划到 2025 年在全国所有小学推广 TaRL 教学方法。
然而,实施 TaRL 并非易事。它需要对课堂进行彻底的重组。不再是传统的同龄学生组成的三年级班级,而可能是年龄差异很大的孩子一起学习,这样的课堂管理会很具挑战性。如果这种方法不切实际,那么改进课程也是一个较为简单且有效的选择。为发展中国家的教师提供发达国家教师习以为常的资源——如预先准备好的教案、考试和作业——可以提高教学质量和学生的学习效果。
当然,这并不像听起来那么简单,因为这些教学资源必须适应当地的实际情况。但是,如果做得好,这些资源不仅能减轻教师的负担,还能带来更好的学习成果。
学习是否足以带来工资回报?
官僚希望学生成为优秀公民,国际捐助者关注学生的学习成果,而学生家长则只是希望孩子们能过上更好的生活。然而,即便学校教育确实能帮助孩子们增加收入——这一点本身就存在很大争议——我们也不清楚学习在其中究竟发挥了多大作用。国际捐助者可能完全关注了错误的评估指标。
工资的增长可能主要源于认知技能的提升,因此,提高学习水平也会带来工资的增长。然而,关于学习能带来高回报的大部分证据——以及由此强调学习是增加收入的有效途径的观点——主要来自发达国家。在美国,一个数学能力高于平均水平一个标准差的人,终生收入将会高出 28%。但是,肯尼亚农村地区的数学天才面临的就业市场,与纽约市的数学天才所面对的情况大相径庭。在纽约的数学能力的高回报率不一定适用于加里萨县这样的地方。
工资的增长可能主要受到所谓的非认知技能,即「软技能」的驱动。这些技能可能包括自我激励(比如按时完成作业)、诚信品质(如考试不作弊),以及人际交往能力。在发达国家,这些非认知技能的重要性可能甚至超过认知技能——而且它们带来的回报正在不断上升。
如果非认知技能比认知技能更为重要,那么发展中国家的学校教育质量就会显得好得多。毕竟,学生的出勤率已经提高了,而仅仅是坚持到校上课可能就足以培养这些非认知技能。
对许多学生来说,入学是他们首次与国家体制接触,对某些学生而言,这甚至是他们首次与家庭以外的人有实质性互动。即便学生在学校没有学到太多读写技能,他们很可能正在学习如何与他人和谐相处、如何分享、如何遵从指示,以及如何与权威人士互动。捐助者青睐的学习干预措施并不特别注重这些技能,因此,如果非认知技能才是真正重要的,这些干预措施可能不会对其他方面的结果产生显著影响。
最有可能的是,认知和非认知技能对一个人的终身收入都至少有一定程度的影响。毅力和创新能力可能很有价值,但阅读和写作能力同样重要。在发展中国家,这两类技能各自的重要性如何?这个问题目前还不明确,因为没有将两者分开的随机对照试验。我们缺乏可靠的因果证据来说明在中低收入国家,在学校学习更多是否会影响一个人日后的工资水平。[12]
我们可以尝试基于发达国家的数据进行推测,但这并不是一个理想的方法;乌干达的就业市场与瑞典的截然不同。我们也可以尝试使用横截面数据来探讨这个问题,[13]但这种方法同样存在缺陷。在研究认知技能的回报时,很难控制非认知技能的影响,反之亦然。
因此,实际上,我们并不清楚在发展中国家接受教育能带来什么。我们不知道如果你坚持完成高中学业,你的收入可能会增加多少。我们甚至不知道你是否会赚到任何更多的钱。即使你通过接受更多教育确实赚到了更多钱,我们也不真正了解其中的原因。可能你的家庭人脉带来了财富,或者可能是因为你学会了读写,又或者可能是因为你学会了管理自己的时间并与他人合作。
这些观点看似都有道理,但我们无法确定哪一个是正确的——或许它们都有道理。除非我们明白成功的真正含义,否则我们就无法判断自己是否在成功的道路上。
-
2020 年,乌干达政府在医疗卫生方面的人均支出仅为 $5.75。与之形成鲜明对比的是,美国政府在同一领域的人均支出高达 $6,643,是乌干达的 1150 多倍。
-
在发达国家,教师的平均缺勤率仅约 5%。更重要的是,即便有教师因故无法授课,学校也通常会安排专门的代课教师填补空缺,确保课堂教学不受影响。
-
华氏 104 度(约 40 摄氏度)
-
在非洲以法语为主要语言的国家,应将上述情况中的英语替换为法语来理解。
-
Glewwe 曾试图评估向肯尼亚农村学校提供教科书的效果。然而,这项研究的结果令人失望。问题的根源在于,肯尼亚的教科书几乎全部采用英语编写,而对大多数学生而言,英语是他们学习的第三种语言。结果显而易见:小学生们难以从这些用他们不熟悉的语言编写的教科书中获得实质性帮助。
-
即便考虑到教育机会的选拔性(即并非所有人都能接受同等水平的教育),这一现象依然存在。如需深入了解,请参阅这份关于发展中国家教育质量长期下降的报告,特别是其中的第 6 节。
-
主要来自撒哈拉以南非洲国家——研究样本包括冈比亚、利比里亚、马拉维、塞拉利昂、坦桑尼亚、乌干达、贝宁、布基纳法索、刚果民主共和国、马达加斯加、马里、卢旺达、多哥、加纳、肯尼亚、尼日利亚、赞比亚、喀麦隆、科摩罗、刚果、科特迪瓦、纳米比亚、南非和加蓬。
-
尽管他们在初始评估时也大大高估了具有识字能力的公民数量。
-
这句话出自 1833 年的法国教育部长 François Guizot 之口。当时,法国君主制正面临民众起义的挑战,政府试图通过初等教育系统来抑制叛乱。
-
虽然撒哈拉以南非洲在教育方面的进展速度仍落后于世界其他大部分地区。
-
全球发展中心最近启动了一个试点项目,旨在跟进教育随机对照试验(RCT)的结果,以了解这些试验是否对劳动力市场产生影响,但该项目仍处于初期阶段。
-
例如,这篇论文中采用的方法。
Lauren Gilbert 是开放慈善基金会(Open Philanthropy)的研究员。她的主要工作是在全球健康和发展领域探索新的资助方向,致力于发掘能够产生重大积极影响的项目。
学校的目标即是服从
2016 年 4 月 6 日
世界上大多数动物都不能被有效地驯化。这倒不是因为我们不能吃它们的肉,或者不能提供它们所需的食物,而是因为它们天性桀骜,本能地抗拒被支配。只有极少数社会性动物能够接受人类作为首领的存在,让我们驾驭它们,而且人类还得用对方法。
如果贫穷国家早在许多年前就甘愿服从富裕国家,允许富裕国家改变自己的法律和风俗等等,并完全按照人家的方式行事,如今本可以过上富足的生活。可惜,这个设想极大地冒犯了这些国家的民族自尊心。因此,这些国家依然贫穷。
当一些跨国公司试图将先进的管理模式引入落后地区时,即便为当地员工配备了同等水平的设备、材料和流程,却往往收效甚微。问题很大程度上出在当地员工身上:他们做事随心所欲,缺乏时间观念;他们思想迂腐,迷信严重。他们视直接命令为耳边风,拒绝执行与自己在工作场所外的地位不相符的任务。尤其当新的工作方式更有难度时,他们更是[无法接受](http://faculty.georgetown.edu/mh5/class/econ489/Clark-Why-Isn't-the -Whole-World-Developed.pdf)。即便在一些发达国家,底层员工同样难以驾驭,他们不愿一切行动听指挥。可见,自尊心是通往物质财富的一大障碍。
农业社会迫使人类接受了许多对于狩猎采集者来说不舒服或不自然的变化。狩猎采集者崇尚平等,而农民则由国王和将军统治,同时财产和阶级的不平等也出现了。农民的工作时间更长,工作内容也不太需要动脑,通过旅行增广见闻的机会也变得更少。需要巨大的新的文化压力,例如具有道德教义神的宗教,才能将狩猎采集者转变为农民。
然而,农民在工作中基本上是自主的,和周围的人地位平等。尽管他们可能抱怨不得不去工作,但通常还是受信任,并允许自主地完成任务,因为农活的方式很有规律,不会随时间推移而发生太大变化。相比之下,工业时代的工人却要面对更多来自基层管理者的不平等对待。他们的上司总是直接盯着他们,不停地发号施令,对他们的错误指指点点,并且将他们的表现与其他工人进行对比评判。工人经常搞不清楚自己到底该做什么,以及应该以何种方式完成任务。
那么,工业时代是如何让至少一部分工人接受更多的统治、不平等和不确定性的?为什么这种做法在不同地区的成效不尽相同?我想在本文中探讨一个简单的答案:名校。
狩猎采集者一方面极度厌恶他人的支配,哪怕只是一丝暗示;另一方面,他们又极度渴望模仿名人的行为来接受「命令」。正是我们特别渴望并能够模仿名人的所作所为,造就了人类独特而强大的文化进化能力。所以,如果人们在看到工厂的做法时觉得这是老板在支配他们而感到厌恶,但又喜欢模仿有名气的人的做法,那么一个显而易见的解决方案是,让孩子们置身于一种更像是效仿榜样、而非服从命令的氛围中,去适应现代职场的种种做法。
我的同事布 Bryan Caplan 在其新作《反对教育的依据》(The Case Against Education)(译注:中文正式译名为《教育的浪费》)中指出,当今的学校教育,尤其是高等教育,更多是为了让学生向雇主展示自己的智力、责任心和对现代职场制度的服从性,而不是传授实用技能。他认为,如果孩子通过更早开始工作来实现这些目标,会更好。只可惜我们已经陷入了一个不幸的均衡:个人若尝试这么做,便会显得特立独行。我赞同 Bryan 的看法。与「年长的学生主要是为了学习实用技能而上学」这一理论相比,「信号传递」这一理论能更为贴切地解释学校教育的诸多弊端,如科目的实用性低、知识难以迁移、所教授的知识遗忘率高、比起学习更在意文凭、成绩只在临近毕业时大幅提升、学生盼望取消课程等等。
我对 Caplan 目前的观点(他的书还有修改的空间)的主要疑问是:几个世纪前,大多数年轻人是通过工作来展示自己的才能,而学校这一信号系统逐步取代了之前以工作为信号的机制。然而,单凭顺应现有惯例的压力,无法解释新的惯例取代旧的惯例这一现象。那么,为何通过学校发出信号的做法,会胜过通过早期工作发出信号的做法?
诚然,学校教育和早期工作*一样,都能让学生养成将来工作中有用的习惯,例如:准时到达、按指示行事(即使这与以前的做法不同)、弄懂模棱两可的指示,以及接受与他人频繁公开的比较排名。不过,早期工作可能会触发大多数动物逃避被支配的本能,但学校试图用更容易接受的术语,来包装类似的习惯训练,就像模仿那些名人一样。(*译注:early job,指的是年轻人在较早的年龄开始的工作。)
狩猎采集者的孩子不会被告知要做什么,他们只是四处游荡,做自己喜欢的事情。但他们会感到无聊,渴望获得像成年人一样的尊重。所以最终,他们会跟随一些成年人,请求他们示范如何做事。在这个过程中,孩子们有时不得不服从命令,但这只是暂时的,直到他们不再是新手。他们无需受制于一个随意指派的、不受尊重的上司,而是可以向多位成年人学习,可以选择身边最有名的人作为老师,也可以随时停止向任何人学习。
学校以一种类似的方式发挥最大效用,通过一套看似相似的过程,让学生养成适应现代工作场所的习惯。首先,学校会聘请那些在顶尖大学教学的知名研究者,让他们担任教师。学生同时修读多门课程,这样就不存在一个能从学生服从命令中直接获益的「老板」。让听课成为可选项,并让学生选择他们的课程。教师会不断布置复杂的任务,给出含糊不清的新指示,借口是帮助学生学习新事物。为了降低成本,促使学生养成按时上课和完成作业的习惯,并制造其他学生全盘接受的社会证明,每位教师都要带许多学生。以帮助学生学习和决定以后参加哪些课程和工作为借口,学校还频繁公开宣布学生的表现排名。这整个过程会一直持续到学生成年,使得这些习惯根深蒂固。
当学生最终从校园迈入职场时,大多数人会发现工作与学校的环境较为相似,这足以让他们顺利完成过渡。这一点在从事办公室文职工作、当上司避免直接下达明确命令的情况下尤为明显。不可否认,职场新人只能听命于一位主要的老板,不能像在学校里那样随意选择新的课程或工作。但是,他们遭受公开排名和批评的频率,远不及在学校时那样高,尽管这一频率已经远远超出了他们祖先所能容忍的程度。如果新人的工作最终为他们赢得了名气,那么他们之前对名师的「服从」也就显得顺理成章了。
这种观点有助于解释学校是如何让学生习惯现代职场的种种规则的,从而解释为什么有些社会会选择用学校教育来取代早期工作或其他儿童活动。同时,这也解释了学生学校教育收益的不平等:有些学校的教学效果可能不如其他学校。这背后存在诸多原因,例如教师可能自身威信不足、教师可能不能按时授课、教师评估可能与学生表现相关性低、学生可能选课的自由度有限、学校任务可能与工作实践差异过大、学生可能毕业后无法获得理想的工作,或者整个过程可能一直持续到成年后,远远超过了养成关键习惯所需的时间。
总而言之,尽管当代学生可能主要依赖学校来传递聪明、动力和服从性的信号,但我们还需要其他东西来探究学校是如何取代早期工作,承担起信号这一功能的。一种貌似合理的解释是,学校让学生养成了适应现代工作环境的习惯,而从表面上看,学校看起来更像是德高望重的狩猎采集者导师,而不是所有动物都天生抗拒的专横老板。不过,这并不意味着如今所有号称学校的机构,都能同样有效地带来这种利好。
现代世界必备技能
现代世界必备技能 - David Friedman的Substack
2025年1月25日
过去几十年间,世界因计算机技术而发生了翻天覆地的变化。这导致了一些在过去并不重要或重要性较低的技能,如今变得至关重要。这些技能大多是上一代人未曾学习,而这一代人却必须掌握的。本文尝试在一些朋友的协助下,列举出我所能想到的这类技能。欢迎读者在评论区补充更多内容。
获取信息:如何从信息洪流中汲取知识
在我成长的年代,若想了解某个事实,首选会是查阅《世界图书百科全书》,其次是翻阅父母书架上的藏书。上大学后,我得以使用大学图书馆,并且充分利用了这一资源。这些都是经过筛选的信息来源。虽然百科全书文章或书籍内容可能有误,但百科全书编辑认为特定作者有能力撰写文章、出版商认为某本书值得出版,这些判断都有其依据。
而现在,当我需要信息——比如为我上一篇文章查找特定年龄段的近期死亡率数据——我会直接上网,那里有海量的信息来源。互联网是一个未经过滤的媒介;任何人都可以发布信息,不管真假。过去,关注所获信息的质量是明智之举,但如今,这已成为必不可少的能力。因此,寻找信息并加以筛选,主要依靠内部证据来判断网上内容可信度的能力,比以往任何时候都更为重要。这是人们必须掌握的技能,但我推测无论是K-12阶段还是大学教育,很少有人在学校里系统学习过这一技能。我在以往的文章中讨论过一些相关方法。
这种分辨信息真伪的能力,不仅在人们网上讨论公共议题时有用,对于与你个人决策相关的信息同样重要。当你购买手机或汽车时,你需要判断哪些网络评论值得信赖。当你面临医疗决策,例如是否接受激光视力矫正手术(Lasik)时,你可能希望除了相关专业人士的建议外,还能获取其他渠道的补充信息。在网络和其他媒介上,你会看到大量关于营养的说法——判断哪些说法可信,直接关系到你的饮食选择和健康状况。值得注意的是,网上的许多信息都是由试图向你推销产品的人发布的。因此,你需要学会如何识别这些信息,明确哪些声明可以忽略不计,哪些需要通过其他来源进行验证。
人工智能
人工智能,这一最新的重大变革,引发了多个问题。首先是如何使用它——如何设计合适的提示词,如何检验获得结果的质量,判断它生成的信息是否真实,它为你编写的程序是否能正常运行。其次是如何防范那些伪装成人类的AI。第三个较为古老的问题介于前两者之间,即如何与更基础形式的AI互动,比如聊天机器人及其语音版本,如何识别你正在与之交流的是这类系统,如何让它提供你所需的信息,或者在无法做到时,如何让它将你转接到真人服务。
诈骗
群发邮件几乎零成本,这使得即使命中率仅为0.001的诈骗也值得一做。因此,当你收到一封威胁公开你的在线色情浏览记录的邮件时,有理由怀疑它只是成千上万完全相同邮件中的一封,没有任何一封是基于除了电子邮件地址外的真实信息。同理,那些声称能帮你获取近期车祸赔偿的电话也是如此。即使你确实遭遇过车祸,很可能电话录音的人对此一无所知,他们只是拨打数万个自动电话,期望其中少数能够命中目标。
防范网络勒索(无论真实还是虚构)需要了解密码及其他在线安全知识,掌握如何保护计算机免受病毒和其他威胁,学会维护物理隔离的备份,以便在最糟情况下可以重置设备并恢复数据,以及如何保护个人身份信息。
扭曲的认知
社交媒体向你呈现的是极端案例——比你在现实世界中可能遇到的人更美丽、更富有、更有才华。这可能会扭曲你对正常标准的认知,将对自己和他人的期望提高到不切实际的水平。根据你所处的网络角落不同,某些对话可能会使极度扭曲的观点看起来像常态。过去的信息茧房主要是地域性的,但如今,如果你的生活大部分在网上度过,你可能会误以为一种几乎无人认同的观点是所有人的共识。
社交关系
由于种种原因,在现实空间、教堂或工作场所交友、寻找伴侣已变得不如从前实用。取而代之的是线上交流——聊天群组、社交媒体和约会应用。人们需要学习如何在这些虚拟空间中导航。在应用程序上从上万人中寻找约会对象,需要的技能与在五十名同学中寻找完全不同。与一个没有共同社交圈的陌生人建立关系也是如此——没有共同的朋友或熟人,没有简便的方法来判断对方展示的形象有多少是真实的。
图像处理及更多技术
照片曾经是可靠的证据,但这一点早已不再成立。如今,视频或语音录音也是如此。要判断什么值得相信,你现在需要能够区分计算机生成的假象与现实的技能,需要保持足够的怀疑态度,不对即使是最具说服力的视觉或音频证据盲目信任。
计算机技能+
第一步是学会适应你当前的环境,了解不同文件类型、程序和界面的特性。更进一步,在这个瞬息万变的世界里,你需要掌握一项更为关键的能力——快速适应新环境,无论是社交媒体应用、新软件、游戏还是电子设备。记得我们孩子小的时候,我叔叔给他们每人买了一台装有口袋妖怪游戏卡的Game Boy,接下来几个月他们沉迷其中。虽然他们探索的是虚构世界,但学会如何在陌生环境中导航的技能却是切实可行且极为宝贵的。
打字?
随着计算机的普及,打字技能变得日益重要,尤其是当文字处理器取代打字机之后更是如此。在用早期个人电脑上的文字处理程序完成我的第二本书后,我不禁感叹:在文字处理器发明之前,恐怕没有人真正「写」过书——那实在太费力了。当我前妻告诉我,我们的儿子(他和母亲同住,但每年夏天会和我们一起度过)在手写方面遇到困难时,我为他编写了一个打字游戏,后来又购买了一款更好的。我认为没必要在一项即将过时的技术上投入精力。
不过那已是四十年前的事了。如今,随着语音识别技术发展到足够可靠的程度,打字本身或许正在成为一项被时代淘汰的技能。
教育
现在,无论是主要通过网络进行的自我教育,还是在线和现实世界中传统学校以外的子女教育选择,都比过去丰富得多。约六十年前,我遇到过一个采用家庭教育的家庭,此后几十年再未见到类似情况。然而,到了我们为孩子实践非学校教育的时候,我们所在地区已有足够多的家庭能在当地公园组织每周例行聚会。介于家庭教育与传统学校之间的教育模式也变得越来越普遍,部分原因是疫情期间的封锁措施。熟悉这个日益扩展的教育领域变得尤为重要。
部落主义
人类自古以来就习惯将彼此划分为「我们」和「他们」,内群体和外群体。政治极化的加剧,可能是由于互联网既能强化非地域性群体的内部凝聚力,又能促使敌对群体成员之间的直接接触,使这种情况变得更加严重。因此,我们需要培养跨越群体边界进行沟通的能力,避免对自己阵营的人盲目信任,也不要对对立群体的成员自动产生敌意,同时认识到这些群体之间存在分歧的领域实际上只涉及成员互动的部分方面。
听说你想让自己摆脱人生的泥潭
原文:So you wanna de-bog yourself - by Adam Mastroianni
我在泥潭中的领悟
有时候,陌生人会向我寻求建议,这让我既感到受宠若惊,又觉得有些忐忑。毕竟,我的知识仅限于我在这里写的内容,有时甚至连这些都把握不好。
举个例子,最近有人问我是否有什么教人开飞机的建议。这让我不禁想问:究竟是谁在负责飞行员培训系统??从那以后,每次我登机时,都会仔细打量机长,看看他们是否有那种「我是从某个博主那里学会开飞机的」的表情。
面对这些问题,我常常不知所措,这是因为我能力有限。但我逐渐意识到,这些求助者大多有一个共同点:他们都陷入了困境。他们不是在问「这附近有什么好餐馆推荐吗?」这样的问题,而是在求助「现在一切都很糟糕,我想改变现状,但不知道该怎么办?」
陷入困境时的心理状态像是站在齐膝深的恶臭泥潭中,四周全是沼泽,目之所及尽是沼泽。你费力地蹚水寻找干地,却只能发现更多的泥沼。一切努力都徒劳无功,没有任何不错的选择,生活变得乏味、平淡、无聊、毫无吸引力,只有无尽的泥潭。正是这种绝望的处境,驱使人们做出一些看似疯狂的举动,比如向一个博主寻求人生建议。
所幸,我人生的大部分时间都在这样的泥潭中度过。有人说我就是在泥潭中出生的,一个活蹦乱跳的「泥潭男孩」。我深刻体会到,无论你是如何陷入困境的——婚姻陷入僵局、学业落后、或是你培训的飞行员总是撞山——让你深陷其中的力量总是相似的。事实上,这些力量仅有三种,尽管它们每一种都以各种令人不快的方式呈现。
新年伊始,又到了我们一年一度的「大脱困」时刻。此时此刻,我们都在努力挣脱泥潭,追求更美好的生活。为了助你一臂之力,我汇编了一份「泥潭现象大全」,列举了我自己陷入困境的种种方式。因为要让自己摆脱困境,似乎总是要先给遇到的问题命名。[1] 愿这份清单对你受用,也但愿你乘坐的飞机永远由那些从未向我学到任何东西的人驾驶。
1. 活化能不足
从旁观者看来,我大多数尝试摆脱困境的方法就像是什么都没做。我站在泥潭中一动不动,却大喊着:「我真的在努力了!」这意味着我缺乏足够的活化能——我无法短时间内调动足够强大的力量来逃离泥潭,于是就只能原地踏步。
这种情况通常有几种不同的成因。
沟槽球
有时候,人们会找我做一些我并不想做的项目。但如果我接受了,那些人就会笑着和我握手,说:「我们感到很高兴,这都是因为你!」这种赞美确实让人感觉良好。所以我总是会接下这些项目,尽管整个过程中内心充满怨恨,暗自责备自己为什么要——自愿地!——努力做自己并不在乎的事情。
这就是所谓的沟槽球(gutterballing):发挥很好,但方向稍有偏差。就像保龄球中的沟槽球,在大部分路程中都在接近球瓶,只是在最后一刻,以微小却戏剧性的差距擦肩而过。
「沟槽球」无疑会让你续陷在泥潭中,因为人们会因此而喜爱你。当你正在下沉时,他们会大喊:「你做得对!」、「我们支持你!」
坐等头彩
有时当我陷入困境时,有人会建议:「你为什么不试试[某个合理的选择]呢?」而我会回答:「等等,朋友!你没看到这个选择也有缺点吗?等你找到一个完美无缺的选择时,我们再谈!」
我一直在坐等头彩,拒绝采取任何行动,期待出现一个在各方面都完胜其他选择的完美方案。然而,这种情况似乎永远不会发生。
通常,我在坐等最大的头彩:所有问题不费吹灰之力就能自动消失。当有人为我的困境提出建议时,我的反应是:「嗯,我不太确定,你有没有什么方案能让我保持现状不变,却能获得更好的结果呢?」
逃避巨龙
这其实是坐等头彩的另一种形式,但由于太常见,值得单独讨论。
有时我清楚地知道该如何摆脱泥潭,却因为恐惧而裹足不前。我害怕说出真相,害怕惹人生气,害怕冒险。于是我犹豫不决,盼望未来不需要我变得勇敢。
人们都认为这是个糟糕的策略,因为它只会延长痛苦,但这并不是它愚蠢的真正原因。诚然,每一刻的犹豫都伴随一刻的痛苦。但当我最终鼓起勇气时,那一刻并非痛苦的顶点——恰恰相反,勇敢让人感觉良好。试想一下,你是否曾经勇敢地面对欺凌者,或者克服了舞台恐惧症,又或者终于不再为自己所爱的事物感到尴尬?那是世界上最美妙的感觉。每当你退缩时,你不仅要忍受懦弱带来的痛苦,还会错过勇气带来的快乐。
中世纪的骑士们常常四处游历,希望能遇到荣誉的冒险来展示自己的勇气。他们渴望可怕的巨龙出现。当我推迟做需要勇敢面对的事情时,我就是在逃避巨龙:错过一个机会去做一些可能当时令人生畏,但最终会让我感觉无比美妙的事情。
平庸陷阱
我约有一半的朋友都对自己的工作颇有微词,这导致他们大多数时候都处于一种不太开心的状态,但又不至于糟糕到要辞职的地步。这就是所谓的「平庸陷阱」:一种不好不坏的处境,因为从未让你感到足够沮丧,所以你始终无法积累足够的动力来摆脱它。
平庸陷阱是一种极其危险的困境。那些非常糟糕的经历,一旦度过,往往会成为有趣的谈资或值得骄傲的回忆。而长期处于平庸状态,只会让时光虚度——无论是经历还是回忆都乏善可陈,就像你被困在一个没有手机信号、没有 Wi-Fi、也没有好杂志的候诊室里,永远在等待有人来告诉你可以开始真正的人生了。
(我曾在心理学中被低估的观点一文中讨论过这种现象。)
抚摸问题
我经常花大量时间思考自己的问题,但通常是这样的:
「哇,这可真是个大问题啊!我敢说,比天塌了还大。简直是巨大无比。瞧瞧这个问题,你说是不是!哇塞!」我可以花上好几天就这么想着。「你觉得这个问题有多大?很大?超级大?而这还只是说它的规模!别提它的深度了。」
这并不是在解决问题,而是在抚摸问题。表面上看起来像是在认真思考,实际上不过是一种社会认可的焦虑的表现,一种通过沉迷于痛苦来无限延长痛苦的方式。
2. 糟糕的逃生计划
即便你已经积攒了足够的动力可以挣脱困境,你仍然需要找准方向。(「我做到了!我做到了!」我一边喊着,一边紧急迫降在发射台上。)
以下是我的几个反复出现的糟糕逃生计划:
「加倍努力」谬误
我高中时在《使命召唤》游戏上花了大量时间,我曾经和一帮坏男孩一起在网上与其他帮派战斗。[2]
我们玩得并不好。每当我们输掉第一轮(这几乎总是发生),我们会在预赛大厅重新集结——基本上就是在线更衣室——然后决定我们在下一轮真正需要做的是「加倍努力」。好像我们刚刚连续 25 次被爆头的原因是我们不够专注于避免被爆头。带着这个史上最愚蠢的计划,我们会再次冲进战斗并输得一样惨。当我们的赛博尸体堆积如山时,我们会互相大喊,「伙计们,别再死了!」
这就是加倍努力谬误。当我审视我的处境,不知怎的我会得出结论:我将通过加强渴望来改善未来的状况,然后当什么都没发生时我就感到愤怒。比如,「嗯,对不起!我一直在非常勤奋地渴望事情有所不同,然而它们仍然保持原样,有人能查看一下这个问题吗?」[3]
无限努力幻觉
加倍努力谬误有一个表亲叫做无限努力幻觉,这是一种认为你有一个秘密的未使用的努力储备,你可以在未来通过部署它来帮助自己摆脱困境的想法。我总是迟一周回复电子邮件?没问题,我只需打开我的战略努力储备,清理我的通信债务。
这从不奏效,因为你并不真的拥有战略努力储备。我所有的努力都已被实时计入某处。如果我想在某事上投入更多努力,我就必须在其他事情上投入更少。如果我一直没有完成某件事,可能是因为我不想做——至少,不足以从其他事情上匀出时间——而我还没有向自己承认这一点。
归咎于上帝
我经常躲在厕所里抱怨时间不够用。「唉,要是一天有 25 个小时就好了」,我哀叹道,「那我该能完成多少事啊!」
但仔细想想,这种抱怨其实很可笑:我到底在生什么气呢?是因为没有时光机吗?还是因为找不到时空裂缝,让我可以躲进去多完成几项任务?我难道真的相信,纠结于时间以每秒一秒的速度不可逆转地流逝这一「不公平」现象能帮我摆脱困境吗?
这就是所谓的「归咎于上帝」:把自己当前的困境归咎于那些完全无法改变的事物。虽然许多宗教都说上帝会干预人间事务,但据我所知,没有哪个宗教认为上帝会对抱怨做出回应。(如果一个神灵会因为你不停地唠叨就显灵,你会崇拜他吗?)
文凭式问题与刷牙式问题
有些问题就像获得文凭:你努力一段时间,然后就永远搞定了。学骑自行车就是典型的「文凭式问题」。
但大多数问题并非如此。它们更像是「刷牙式问题」:你必须终生不断地努力。据我所知,你不可能把牙齿刷得特别干净后,就一劳永逸了。
当我脑袋里塞满了负面情绪的时候,我会以为重新感觉良好是个文凭式问题。我觉得只要找到正确的拉杆,轻轻一拉——嘿!——就能永远回到美好时光。有人警告我事情不是这样的,但我不相信;我会以为他们只是没能拿到「文凭」罢了。
直到我意识到自己面临的是一个刷牙式问题时,我才开始有所进步:要想重新感觉良好,可能需要我终生坚持每天做一些事情。我或许会越来越擅长做这些事,就像孩子刚开始学刷牙时,会把牙膏弄得到处都是,还会不小心吞下一半,但最终会学会正确刷牙。但,即便你成为了刷牙高手,每天还是要花几分钟时间。你可能会对此感到不满,但这并不会让你的牙齿变得更干净。
异想天开的蜕变
这是我最喜欢的一个糟糕的逃生计划:幻想自己将来会变成另一个人。比如,「我知道我讨厌锻炼,但将来的我一定会克服这个问题,不再像个小孩子一样抗拒。」或者,「我觉得量子物理很无聊,所以我打算以后再学,等我觉得有趣的时候再说。」
这些都是异想天开的蜕变。到目前为止,我还没有哪天醒来后发现自己在各方面都焕然一新,让生活变得轻松起来。我当然希望这种事情能够发生,但我已经不再对此抱有幻想了。
操纵人偶
人们总是因为一些愚蠢的行为给我制造麻烦,比如在我也想行驶的高速公路上开车,或者期望我每月按时付房租,又或者没有认识到我的才能而不让我负责重要事务。在这些情况下,似乎唯一的解决方法就是让别人改变他们的行为。我之所以陷入困境,完全是因为其他人不讲道理!
有个词很贴切地描述了这种行为,叫作操纵人偶:试图通过控制他人的行为来解决自己的问题。操纵人偶总是很有吸引力,因为在我们眼中,他人的行为是那么愚蠢,似乎很容易改变。有趣的是,当事人并不这么想。他们有着积累一生的背景故事,导致他们以特定方式行事,而且平均而言,他们的行为与你的一样难以改变。因此,除非你认为自己能轻易被牵引几次就改变方向,否则操纵人偶可能不是摆脱困境的有效方法。
3. 庸人自扰
坦白说:我绝大多数的困境都是自己想象出来的。并非外界将我置于困境,而是我将自己深陷其中。矛盾的是,这些恰恰是最难摆脱的困境,因为它需要我们意识到自己对现实的感知并非现实本身,而且我们大脑的很大一部分都在极力阻止我们产生这种认知。
地板是岩浆
每个孩子都玩过「地板是岩浆」游戏,假装踩到地毯就会被烧焦。这个游戏就连幼儿都能轻松上手,这揭示了一个深刻的道理:我们很早就习得了把虚假问题当作真实的能力。此后的人生中,我们一直在重复这种行为。
通常,当我陷入困境,是因为我为自己编造了一个游戏,并认定自己正在输掉它。我觉得自己成就不足,工作不够努力,同时又莫名其妙地觉得生活缺乏乐趣。这些游戏有着复杂的规则,比如「我必须和我最成功的朋友一样成功,但我迄今为止所做的一切都不算数」。如果违反了这些规则,我就应该感到非常糟糕。这简直就像在玩「地板是岩浆」游戏的最愚蠢版本。
难道我是经过深思熟虑才创造出这些游戏,以此来追求美好人生的吗?当然不是!这些都是我随意编造出来的。或者是别人随意编造的,而我说,「哇,我也想要一份!」
超级监视
在特朗普执政期间,我接了一份兼职工作:跟踪所有的令人愤怒的事情。大约每二十分钟左右我就必须查看一下我的手机,以免错过任何新的令人愤怒的事情,这样我就可以……收集它们?把它们做成剪贴簿?我也不确定。
我现在把这称为超级监视,追踪世界上的每一个问题,就好像它们都不知怎地,最终,是我的问题。超级监视是通往泥潭的快车票,因为世界充满了问题,你能解决哪怕一个就已经很幸运了。
我知道有些人认为超级监视是一种美德,但他们所做的只是花时间盯着屏幕并感到糟糕,而这似乎并不能解决他们正在监视的任何问题。对他们来说,我猜想,最神圣的生活可能就是坐在一百个屏幕前,用手术器械撑开眼皮,发条橙式地,同时见证全人类的苦难。我,呃,不这么想。
(另见:阅读新闻是新的吸烟。)
刺猬化
有时我会有这种感觉,就像,「我什么都做不成,我永远都不会快乐了,我的余生将永恒徘徊在暮色之中,时不时点缀以痛苦。」
然后我妻子会说,「你饿了。」
我会说,「不,不,这是真正的不快乐,它从地狱而来,将我一把抓住,它侵入我的骨髓。我被上帝迫害,而你,对此一无所知。」
然后我会吃一个墨西哥卷饼,然后:「别介意,我没事了!」
这就是刺猬化:拒绝被他人影响,即使在你应该被影响的时候。
个人问题放大射线
你知道,当你登上一座高楼并向下看街道时,每个人看起来不仅很小,而且有点傻吗?就像,「哇,看那些小小的家伙,穿着西装走来走去,就像他们是人一样!他们甚至不知道自己是那么小!」
同样地,在我眼中,他人的烦恼总是显得微不足道。朋友叫苦连天:「我压力山大啊!」我却轻描淡写地回应:「哎呀,不过是个小问题罢了,何必当真呢!别想那么多,压力自然就烟消云散啦!」
反观我自己的烦恼,却仿佛是一群 15 米高的叛逆少年,庞大、真实而复杂得令人生畏!这些问题简直无解!我只能在它们面前仓皇而逃,躲在废墟中,战战兢兢地窥视它们的可怕模样!
这就是所谓「个人问题放大射线」的魔力——它让你自己的问题看起来无比巨大,而别人的问题却始终保持原有大小。在这种情况下,合理的解决方案也变得不再合理——那些能够解决你的普通人大小问题的方法,根本无法应对我的巨型难题;它们只能用终身躲避或者战术核武器来解决。
沉迷于微不足道的预测
在读研究生时,我犯了一个大错——报名参加了一个职业发展研讨会。我们每周都要聚在一起,花 90 分钟讨论诸如「天哪!我们永远找不到大学教职!我们全都完蛋了」、「这个世界太复杂而我太渺小了」以及「救命啊救命啊救命啊」之类的话题。
有一次,我们竟然花了半节课的时间讨论在简历上列出发表的文章时是否应该把自己的名字加粗。比如:
Tweedledum, M.R. & Mastroianni, A.M., (2024). Please give me a job I will do anything, including publishing this terrible paper. The Journal of Desperation, 4(12), 122-137.
对比:
Tweedledum, M.R. & Mastroianni, A.M., (2024). Please give me a job I will do anything, including publishing this terrible paper. The Journal of Desperation, 4(12), 122-137.
有人认为把自己的名字加粗有助于忙碌的招聘委员会快速评估你的学术成果。也有人反对说,这样做显得自负。于是一场激烈的辩论就此展开。我记不清最后谁赢了——哦对了,是我们都输了,因为这根本就是一件毫无意义的蠢事。
这就是所谓的沉迷于微不足道的预测。承认自己无法掌控未来确实令人恐惧;相比之下,试图优化每一个决定,即便是再微不足道的决定,也更容易让人转移注意力。
(如果你已经到了要花 45 分钟来纠结是否在简历上使用粗体字的地步,也许你该考虑列出所有神明的名单,挨个祈祷,说不定其中哪位真的存在,并决定帮你一把。)
想让孩子进入名校的家长们已经将纠结微小细节的艺术发挥到了极致。当我带领新生参观校园时,经常遇到这样的家长:「我家孩子该学定音鼓还是双簧管?」「个人陈述里最多能用几个分号?」「能不能附上牙科记录,证明我家孩子一直有好好刷牙?」然而,笑话恰恰出现在他们身上:过分纠结这些微不足道的事情只会让人徒增焦虑,即便你的孩子真的进了名校,最后也可能沦为一个博客写手。
无法满意
有时候人们会说:「哎,有什么办法呢,生活就是痛苦。」我会回应:「哈哈,确实如此。」然后等着他们跟着笑,但他们并不会笑,这时我会惊恐地意识到,他们并不是在开玩笑。有些人真的认为泥潭般的困境就是生活的本质!
如果你经历过诸多不幸,我能理解你为什么会这么想。比如说,如果你侥幸在广岛原子弹轰炸中幸存,然后坐火车到了长崎,刚好又赶上那里的原子弹轰炸,你对生活持悲观态度也在情理之中。[4]
然而,我认识的大多数有这种感觉的人一场原子弹爆炸都没经历过。他们通常是那些受过良好教育、高收入、拥有支持性人际关系、经历着正常程度人生起伏的人。这些人拥有美好生活所需的一切要素,却似乎无法为自己创造幸福。他们的问题在于认为满意是不可能的。这就像站在一个厨房里,周围摆满了鸡蛋、面粉、油、糖、黄油、发酵粉、搅拌机和烤箱,却举手投降说:「我做不出蛋糕!蛋糕根本就不存在!」
祝你保持良好的高度
从宏观角度来看,我的人生经历并不算长。因此,可能还有许多我尚未发现的陷入困境的方式。但我已经多次深陷其中,看到了一些相同的模式不断重复,有时我甚至能够打破这些模式。
这就是为什么给这些困境起一些滑稽的名字如此重要,因为它提醒我不要相信最大的困境谎言:我陷入了一个前所未有的、独一无二的困境。如果你相信这一点,难怪你会遭遇活化能不足、糟糕的逃生计划或庸人自扰:你不知道该怎么办,因为你认为你或他人的经验都无法帮到你。每当我有这种感觉,每当我认为自己身处一个由憎恨我的宇宙专门为我定制的困境时,如果我能意识到:「哦,我现在正在『沟槽球』」,我就能感觉到脚下有了实地,就可以开始把自己拉出困境。
因此,祝你在 2024 年及未来的岁月里一切顺利。愿你在泥潭中只停留必要的时间,学习它要教给你的教训。还有,看在老天的份上,如果你看到一座山向你涌来,赶紧拉升。
[1] 再次郑重声明,我并非持有执照的心理健康专业人士。我只不过是个戴着高帽的普通人罢了,别把我想得太厉害。
[2] 我们的领导自称是海军陆战队员,但我对此持怀疑态度。因为他连我们小组的名字都拼错了,把「Delta Company」写成了「Delta Companay」。
[3] 另请参阅 Sasha Chapin 的文章《「更加努力」在某些情况下可能是一个糟糕的策略》。
[4] 事实上,山口彊在亲历了人类历史上最为惨烈的事件后,仍保持着超乎寻常的乐观。每当我因为一些琐事而感到沮丧时,比如餐厅没有在我的汉堡里加足辣味蛋黄酱,我就会想起他,提醒自己要保持积极乐观的心态。
将教育与青少年的生物钟同步:「让青少年多睡会儿,推迟上学时间」
原文:Full article: Synchronizing education to adolescent biology: ‘let teens sleep, start school later’
摘要
2013 年,美国教育部长 Arne Duncan 在推特上发文称:「让青少年多睡会儿,推迟上学时间。」本文基于过去 30 年在睡眠医学和昼夜节律神经科学领域的关键研究,探讨了早上过早上学及其带来的负面影响。文章概述了青春期昼夜节律系统导致睡眠模式的变化,并据此得出结论:调整上学时间既能提高学习效率,又能降低健康风险。本文还参考了教育学、睡眠医学和神经科学领域的相关研究,进一步论证了这些改善效果。文章结合其他提高学习效率的教育干预措施,简要考虑了延迟开学的实施情况。最后,基于先前的研究,从实践和政策角度探讨了引入与青少年生物钟同步的推迟上学时间措施所产生的影响。
介绍
时间是人类生物学和教育领域的一个基本变量,但目前这两个学科衡量时间的方式截然不同。对于教育工作者而言,学生的发展是以年龄为标准,而每日的时间表则是由各国、各地区甚至各学校所规定的。与此相反,生物时间则是以身体发育的变化来衡量的,而一天之内的时间则是由我们的内部生物钟来调控的。从进化时间尺度看,机械钟表问世的历史极其短暂。因此,我们最佳的运作效能(尤其是学习能力)遵循生理节奏,而非传统社会时间,这一点并不奇怪。
当社会时间与生理时间在教育的早期阶段更为契合时,这种区别并不重要。相比之下,在青春期后期,社会时间与生物时间之间的冲突比我们生命中的任何时候都要大。在青春期,生物变化决定了睡眠时长应为 9 小时,以及较晚的起床和睡觉时间,这一现象也存在于其他哺乳动物中(Hagenauer et al. 2009;Rüger et al. 2012)。这些生理变化叠加到极致时,每个上学日将导致青少年睡眠时间减少 2 到 3 小时。因此,对于年龄较大的青少年来说,早上 7 点的闹钟相当于 50 多岁的教师早上 4 点 30 分起床。如果不根据这种生物变化调整教育时间表,就会导致系统性、长期和无法弥补的睡眠损失。在经历其他重大生理和神经系统变化的同时,这种程度的睡眠剥夺会严重损害青少年的生理、新陈代谢和心理健康。(Hansen et al. 2005; Giedd 2009; Giedd et al. 2012; Sawyer et al. 2012; Sørensen et al. 2012; Foster et al. 2013)
大多数教育工作者并不理解提早上学时间对青少年的影响:人们普遍认为,青少年之所以感到疲倦、易怒且不合作,是因为他们选择熬夜到很晚,或者早上难以叫醒是因为他们太懒。教育工作者往往认为青少年在早上学习效果最好,只要他们早些睡觉,就能提高注意力。这些假设反映了社会对成年人中早起者的偏爱,正如谚语所言:
早睡早起
能使人健康、富有、聪明。
这种观念在许多文化中都有体现,甚至在当今的商业世界也不例外(Czeisler 2006;Roenneberg 2012)。这种传统智慧促成了一个误解:认为青少年需要接受早起早睡的训练。实际上,成年人更需要接受教育,去适应青春期青少年身上另一个重要的生理变化:他们的睡眠模式会发生显著的生物学转变。
昼夜节律系统、睡眠和青少年:学习、情绪与健康
像地球上的大多数生物一样,我们的生理和行为也呈现出 24 小时的节律。人体的每个细胞都具有细胞振荡器,这些振荡器需要彼此同步运行,并与外界的昼夜环境保持一致。这一过程是通过位于下丘脑视交叉上核(SCN)的主昼夜节律(24 小时)起搏器实现的。SCN 通过眼内的特化光感受器与环境光暗周期同步(Foster 和 Hankins 2007;Lockley 和 Foster 2012)。随后,SCN 协调整个昼夜节律网络的活动,以及包括警觉性与表现、激素分泌、核心体温、新陈代谢以及肺、肝、心等重要器官的不同节律在内的大多数 24 小时行为、代谢和生理节律(Hilton et al. 2001;Hastings、Reddy 和 Maywood 2003)。如果这种同步机制的任何环节被干扰,不同组织中的生物钟可能失去协调,导致 24 小时振荡网络内部出现不一致的状态(Foster 等 2013)。
昼夜睡眠周期是最为熟悉的 24 小时周期,但它不仅仅依赖于 SCN 。实际上,睡眠是一个高度复杂的状态,源于多个大脑区域、神经递质通路和激素的相互作用,这些因素都不是仅仅与睡眠生成相关的。正因为如此,睡眠极易受到干扰。因此,大脑在发育过程中的一些微小变化,可能对睡眠产生重大影响,而异常的睡眠又会反过来影响健康。这正是当教育开始时间过早导致系统性、慢性且无法恢复的睡眠缺失时,睡眠异常产生的后果。
睡眠-清醒周期源于 SCN 起搏器所产生的昼夜节律(警觉性)与一种稳态睡眠周期之间的相互作用。后者随着清醒时间的增加而增加入睡的压力(困倦感),并随着睡眠时间的增加而消解这种压力。这些过程相互对立,旨在保持白天的持续清醒和夜间的持续睡眠。
它们的相互作用还产生了一个「保持清醒区」(WMZ),矛盾的是,这个区间通常出现在典型入睡时间之前的几个小时(Dijk 和 Czeisler 1995; Shekleton et al. 2013)。这是青少年睡眠困难的一个主要因素。傍晚时分,稳态驱动的困倦感通常过低,无法完全抵消昼夜节律驱动的警觉性,从而导致数小时内很难入睡。在青春期,昼夜节律时钟的时间推移较晚,导致睡眠开始的时相推迟,进而将保持清醒区推迟到更晚的时段。稳态睡眠调节也发生了变化,睡眠压力的积累变得更慢,这意味着需要更长的时间才能达到启动睡眠所需的临界阈值,这也使得入睡时间推迟。保持清醒区就是为什么我们(包括青少年)不能简单选择比平时更早入睡的原因,因为大脑在这个时间仍然在促进清醒。
这些生物学变化,特别是睡眠倾向的时间变化,是与教育开始时间冲突的根本原因;大脑不允许学生早睡,但教育时刻表仍要求青少年在其昼夜节律周期中过早醒来(或被唤醒),这系统性地限制了可用的睡眠时间,导致严重且长期的睡眠缺失。反过来,睡眠持续时间不足和长期睡眠剥夺等睡眠紊乱已被证实会对认知、情绪和身体健康的造成负面影响(Lockley et al. 2004)。最近的一项综述引用了多项研究,表明睡眠受限与免疫反应受损、新陈代谢紊乱、糖尿病、高血压、焦虑、抑郁和肥胖相关(Luyster et al. 2012)。这项综述的总体结论是,睡眠少于 6 小时可能是有害的。最近的一项精巧实验支持了这一结论,该实验显示每晚睡眠时间为 5.7 小时(与对照组的 8.5 小时相比)的一周时间对身体的负面影响,研究发现有 711 个基因因睡眠不足而上调或下调,并且昼夜节律基因表达的显著变化(Möller-Levet et al. 2013)。
青少年同样表现出睡眠持续时间不足和长期睡眠剥夺的影响。多项青少年研究发现,睡眠剥夺会导致沟通不畅、注意力下降、认知表现差、意外入睡、运动表现下降、冒险行为增加以及情绪模式变化,尤其是抑郁症(Millman 2005; Knutson et al. 2007; Hagenauer et al. 2009; Foster et al. 2013; de Souza 和 Hidalgo 2014)。这一现象并不令人惊讶,因为年龄较大的青少年在自由日和工作日之间的睡眠时长差异最大,而且他们的睡眠需求也比成年人更长。其他研究表明,睡眠持续时间不足对青少年的学习和学业表现产生广泛的负面影响(Curcio, Ferrara 和 De Gennaro 2006),包括成绩差和长期记忆编码差(Carskadon 2011)。这些研究反映了成人研究的总结,见表 1(Foster 和 Wulff 2005; Wulff et al. 2011)。
表 1. 严重睡眠中断的影响
| 认知反应 | 情绪反应 | 躯体反应 |
| :------------------: | :-------------------: | :-------------------------------------------------------: |
| 减少: | 增加: | 风险增加: |
| 注意力 | 运动技能失误 | 代谢异常 |
| 表现 | 兴奋剂使用 | II 型糖尿病 |
| 注意力 | 镇静剂使用 | 体重增加 |
| 记忆编码 | 喝酒/酗酒 | 心血管疾病 |
| 记忆巩固 | 疲劳 | 下丘脑-垂体-肾上腺(HPA)轴紊乱 |
| 多任务处理 | 易怒 | 免疫力下降 |
| 决策 | 情绪波动 | 嗜睡 |
| 创造力 | 焦虑 | 微睡眠 |
| 生产力 | 情绪低落 | 意外睡眠 |
| 社会化 | 沮丧/愤怒 | 身体疼痛和寒冷的感觉 |
| 沟通 | 冲动 | 高血压 |
| 同情心 | | |
还有其他研究表明,青少年睡眠持续时间不足对警觉性和表现的影响是显著的。例如,青少年驾驶员在早晨的车祸率达到高峰(Czeisler 2009),而这种现象在年长的驾驶员中并不常见,这说明在昼夜节律不利阶段醒来且缺乏足够睡眠的功能性影响。当肯塔基州的一个学区将上学时间推迟一小时后,学生报告称平均多睡了一小时,同时并未因此而晚睡。此举对涉及 17-18 岁驾驶员的校日交通事故率产生了显著影响:虽然全州范围内车祸率上升了 7.8%,但该学区的车祸率却下降了 16.5%(Danner 和 Phillips 2008)。类似的结果也在弗吉尼亚州得到验证(Vorona et al. 2011)。
从更广的角度来看,在现代社会,在现代社会,睡眠不足和睡眠剥夺已经成了「隐形流行病」。一项最近关于工作/教育时间表与生物时间差异的综述量化了不同年龄段的睡眠赤字程度(Foster et al. 2013)。在一项国际调查中(样本量约为 150,000),基于问卷的昼型-夜型评估显示,整个青春期夜型倾向迅速上升,这一趋势在女孩中出现得更早,与青春期的提前开始相吻合。这些变化在成年早期逐渐逆转(平均从 20.2 岁开始),届时昼型倾向再次增强,起床时间也开始提前(Roenneberg et al. 2004)。
从青春期开始,青少年的睡眠时长出现了显著下降(见图 1)。此前的一些研究报告通过将学期内整周的睡眠时长平均化,未区分工作日和周末,或报告夏季睡眠情况,掩盖了这一问题的严重性。有趣的是,当不再受教育活动干扰时,青少年工作日的睡眠时间可以与周末的睡眠时间一致(Hansen et al. 2005;Jenni, Achermann 和 Carskadon 2005)。这一睡眠时长下降的原因可以从教育/工作日与自由日的睡眠差异中看出。在青春期后期,这一差异在教育日达到了将近 3 个小时(见图 1)。这种规模的睡眠损失无法通过周末补回,正如简单的算术所示:每周工作日每天失去 3 小时的睡眠,意味着周末每晚需要额外补睡超过 15 小时,但这在生理上和现实中都是不可能实现的。
图 1. 平均睡眠时长与年龄的关系。(a) 每周睡眠时长的平均值。(b) 周末(空心圆)与工作日(灰点)的睡眠时长。曲线为多项式拟合;垂直线表示平均值的标准误差(± SEM;大多数情况下标准误差大于相应的符号)。© [版权所有者]。经授权摘自 Foster et al. (2013)。
对睡眠和昼夜节律调节的理解不断进步,以及为了满足教育时间的要求而每天缺少两到三个小时睡眠所带来的负面后果,使我们对青少年行为有了新的认识。我们现在知道,促使青少年早晨赖床、晚上熬夜的是他们的生物钟,而不是懒惰。幸运的是,由教育时间导致的睡眠持续时间不足和睡眠剥夺问题可以通过将青少年的教育时间与其生物钟同步来解决。
其他教育考量
尽管解决早晨上课时间过早及由此导致的睡眠时长不足问题是使教育时间与青少年生物钟同步的关键,但从教育角度来看,还有其他相关问题需要关注。这里简要讨论其中四个方面:记忆与睡眠的关系、一天中不同时段的差异、个体差异与睡眠类型(早睡/晚睡),以及睡眠教育。
睡眠在长期记忆巩固中发挥着关键作用(Stickgold 2005;Diekelmann 和 Born 2010),而打断睡眠会妨碍长期记忆的形成(Stickgold, James 和 Hobson 2000)。在一项精巧的研究中,Walker 和 Stickgold(2010)证明了经过睡眠后,受试者所学的视觉辨别技能得到了巩固,而相同时长的清醒状态则没有这种效果。令人惊讶的是,他们还发现,睡眠后技能的表现实际上得到了提高,而没有任何额外的指导,而非睡眠组的表现则没有变化,这一现象也在其他物种中得到了验证(Menzel et al. 2001)。睡眠还能够促使问题的洞察(Wagner et al. 2004)。有趣的是,当一项记忆正在编码时,表明其在未来考试中使用的重要性似乎增加了该记忆在睡眠中被巩固的可能性(Wilhelm et al. 2011)。我们对睡眠中具体记忆功能和神经生物学过程的理解不断加深,但仍有许多问题需要进一步研究(Chauvette, Seigneur 和 Timofeev 2012;Grosmark et al. 2012)。
个体在睡眠/清醒模式上的差异是由生物学因素决定的。例如,较晚的昼夜节律周期或较慢的睡眠压力积累与消退,或两者共同作用,可能导致更偏向夜型行为(夜型倾向)。而较早的昼夜节律阶段和较快的睡眠压力积累与消退则可能导致更偏向晨型周期(晨型倾向)。这些昼型特征在成人中相对稳定,并受到遗传倾向和性别的影响(Toh et al. 2001;Roenneberg et al. 2004, 2007),女性由于昼夜节律周期较短,倾向于成为「晨型」类型(Duffy et al. 2011)。在青春期,学生自然会更晚醒来,并且在一天中的后期保持较高警觉性,作为一个群体,他们更有可能成为夜型倾向的个体。昼夜节律效应意味着注意力会随着一天中的时间发生变化,较晚的时间通常与夜型倾向和更好的注意力表现相关。Matchock 和 Mordkoff(2009)发现,在青春期后期,所有昼型的注意力得分在 08:00 时显著较低,而在 12:00、16:00 和 20:00 时则是两倍于早晨的得分。同样,青少年在一天晚些时候的测试表现更好(Hansen et al. 2005;Hahn et al. 2007;Carrell, Maghakian 和 West 2011)。这些效应对于教育工作者来说,容易在学校中进行探索。例如,在一项将上课时间推迟到 10:00 的研究中,13-14 岁的学生在 10:00 和 14:00 分别进行了单词配对测试,结果在较晚的测试时段表现更好(Kelley 和 Lockley [2013](Kelley, P., and S. W. Lockley. 2013. “Synchronizing Education to Healthy Adolescent Brain Development: Sleep and Circadian Rhythms.” Paper presented at the annual meeting of the American Educational Research Association, San Francisco, April 27.))(见图 2)。
图 2. 一天中不同时间测试得分百分比的变化。在 10:00 和 14:00,研究对象(n = 120)进行了单词配对测试。测试得分在 14:00 显著更高。T-test 重复测量,p < .01;效应量 Cohen's d = 0.32。所有数据均为平均值 ± 标准误差 (SEM)。
许多研究报告称,在衡量注意力、执行功能和记忆力等一系列认知任务的表现中,一天中的时间效应相似 (Goldstein et al., 2007; Schmidt et al., 2009; Haraszti et al., [2014])。Hahn et al. (2007) 的研究甚至表明,这些时间效应在青少年早期转变阶段就已经很重要。综合这些研究结果,调整教育任务的时间安排以适应青少年的睡眠/清醒模式和昼夜节律类型可能会带来显著的益处。这种调整不仅有助于优化认知功能的发挥,还可能促进学术表现的提升。
无论是基于生物因素还是社会因素定义的群体,针对特定人群的研究证据往往较少成为研究主题。在早期的教育体系中,处于最不利地位的群体是那些属于最晚起的人,因为他们的生物时间与教育时间存在最大的时间错位。这在研究中有所体现,青春期初期的小幅度表现差异,以及青春期结束时随着差距增大而出现的更大差异。西班牙的一项研究显示,12 至 16 岁的学生中,晚睡型学生的表现明显差于其他类型(Escribano et al. 2012)。在德国,与早起型学生相比,高中晚起型学生更多地使用与管理睡眠相关的兴奋剂和抑制剂,如咖啡、可乐、酒精和尼古丁(Preckel et al. 2013)。在巴登-符腾堡州,一项研究发现,晚起型学生的德国大学入学成绩(Abitur 分数)显著低于早起型学生(Randler 和 Frech 2006)。其他研究表明,晚起型青少年可能面临更高的健康和心理健康问题风险(Giannotti et al.2002Citation;Hsu et al. 2012)。这些发现与其他关于青少年群体的研究相一致,这些研究表明较短睡眠时长对神经行为表现的影响非常迅速(Möller-Levet et al. 2013),以及青少年期间心理健康问题临床诊断的高发病率(Wulff et al. 2011)。例如,在昼夜节律睡眠障碍(ICSD-II)中,延迟睡眠相型的发病率在美国青少年和年轻成年人(15 至 24 岁)中估计为 7% 至 16%,即超过 290 万例(Kelley, P. , and S. W. Lockley . 2013. “Synchronizing Education to Healthy Adolescent Brain Development: Sleep and Circadian Rhythms.” Paper presented at the annual meeting of the American Educational Research Association, San Francisco, April 27.)。
向学生、家庭和教师提供睡眠管理教育,以解决可能导致睡眠延迟或减少的社会因素,可以为改善青少年睡眠做出额外贡献。重要的是,睡眠教育应包含明确证据,表明家庭在睡眠调节方面的做法有助于减轻睡眠不足在抑郁和自杀想法中的作用(Gangwisch et al. 2010)。在短期内,提供关于全天候接触发光屏幕技术的信息至关重要,特别是富含蓝光波长的光线,它会提高警觉性并延迟睡眠开始,直到科技公司解决这一问题(Rüger et al. 2012)。良好的睡眠卫生习惯,以及对文化、社会和性别差异的生动认识,尤其是晚起晚睡模式的形成和影响,也是睡眠教育的重要组成部分。
推迟学校上课时间
将教育开始时间与青少年的生物钟同步,是解决目前青少年在上学日普遍存在的慢性睡眠不足问题的明显方法。天文学时间数据和国际研究中睡眠模式的变化显示,10 岁时,生物觉醒时间大约是早上 6:30,因此同步的上学时间应该是 8:30-9:00。16 岁时,生物觉醒时间大约是早上 8:00,同步的上学时间应该是 10:00-10:30,而 18 岁时,生物觉醒时间大约是早上 9:00,同步的教育开始时间应该是 11:00-11:30(Kelley, P.; Lockley, S. W. Synchronizing Education to Healthy Adolescent Brain Development: Sleep and Circadian Rhythms. 2013-04-27.)。
不幸的是,以往几乎所有关于推迟上学时间的研究都使用的是在 09:00 之前的时间,这种方法显著低估了所需变革的规模。然而,即使是对 09:00 之前时间的这些微小调整,也已经显示出了诸多益处,这使得许多研究人员呼吁进一步推迟上学时间(例如,Hansen et al. 2005;Jenni, Achermann 和 Carskadon 2005;Czeisler 2009;Giedd 2009;Hagenauer et al. 2009;Foster et al. 2013)。这些证据的有力性已经促使一些教育机构推迟了上学时间,并且组织和个人也为此进行了大量的倡导活动,以推动学校上学时间的系统性改变。
Kirkby、Maggi 和 D'Angiulli(2011)在一项关于推迟开学时间的全面回顾中得出结论,推迟开学时间的好处包括改善睡眠、健康和学习,这些好处对于所涉及的组织成本来说是「巨大的潜在回报」。Jacob 和 Rockoff(Jacob, B. A. , and J. E. Rockoff . 2011. “Organizing Schools to Improve Student Achievement: Start Times, Grade Configurations, and Teacher Assignments.” Brookings/Hamilton Project Discussion Paper 2011–08.)在另一项关于推迟上学时间的回顾中得出了类似结论,认为推迟上学时间通过这一经过充分研究的干预措施,能够带来重大的学习改善,而且几乎没有或完全没有相关成本。
大规模研究一致表明,推迟开学时间在教育中的积极效果,这一效果贯穿了整个青少年年龄段,并通过不同的成就测试得到了验证。一个强有力的额外证据是,无论推迟上学时间是否为了解决睡眠问题,或者是否所有学生的时间调整一致,积极的结果都得到了验证。即使在青春期的早期阶段(美国 6 至 8 年级,11 至14 岁),也有证据表明,推迟上学时间开始对学业成果产生影响。在一项对美国北卡罗来纳州韦德县数据的研究中,由于该县交通安排的变化,能够对比不同学校上学时间的差异(Edwards 2012)。分析了超过 4000 名学生的大型群体数据,发现将上学时间推迟一个小时,数学考试成绩在全州范围内提高了两个百分位,阅读成绩也有类似的变化。研究中有两个显著的发现:第一,对于那些成绩处于较低分布的学生,受益更大;第二,8 年级成绩提高的两个百分位,在 10 年级时依然保持了两年之久。
在基于睡眠科学研究的首批大型研究之一中,明尼阿波利斯学区的七所综合高中将学校开学时间从 07:15 推迟到 08:40(Wahlstrom, K. 2002. “Changing Times: Findings from the First Longitudinal Study of Later High School Start Times.” NASSP Bulletin 86 (233): 3–21.)。该研究使用了超过 50,000 名学生的数据,收集了时间调整前后的情况,并且这一研究最近在三个不同州的学校得到了复现(Wahlstrom, K. , B. Dretzke , M. Gordon , K. Peterson , K. Edwards , and J. Gdula . 2014. Examining the Impact of Later School Start Times on the Health and Academic Performance of High School Students: A Multi-Site Study. CAREI . St. Paul : University of Minnesota.)。自我报告的学生反馈显示,学生们喜欢这一变化,与其他两个类似学区的学生相比,他们的睡眠时间增加了一个小时,并且报告称他们的出勤率、学业成绩、行为和情绪都有所改善。与大多数研究不同,这项评估包括了非常广泛的变量数据,其中包括来自家长的详细反馈。家长们对推迟开学时间表示非常积极,92% 的家长支持这一变化,且表示他们的孩子更容易相处,家庭成员之间也有了更多的交流时间(CAREI (Center for Applied Research and Educational Improvement ). 2002. School Start Time Study: Final Report Summary. Minneapolis: University of Minnesota.)。
提早上学时间对学生表现的影响是美国空军学院的一个特别有说服力的案例研究。研究人员在三年的时间里观察了该学院一年级学生(18-19 岁)的学业表现,而在这三年里,上学时间每年都在 07:00 到 07:50 之间变化(Carrell, Maghakian, and West 2011)。该学院使用随机分配学生到教师和课堂的方式,只有部分学生在特定的某天上课,而其他学生则有额外的自由时间(n = 6165)。研究发现,课程的开始时间越晚,学生的整体表现越好。学生的表现提升相当于教师质量提高了 1 个标准差。有趣的是,研究人员发现,安排在 08:00 之前开始上课的学生,不仅第一节课表现较差,而且当天所有课程的表现都不理想。此外,推迟一小时上课与学生表现提升 0.15 个标准差相关。研究人员将这一变化与美国黑人和白人学生之间的 1.0 标准差差异进行了比较。这一时间效应的背后科学原理来自于在生物昼夜节律周期中过早醒来,年长青少年的晚睡倾向,以及这种倾向对认知的全天影响(Lockley et al. 2008;Scheer et al. 2008)。这一第一节课表现特别差的发现得到了来自芝加哥 82 所高中的数据分析的支持,结果显示,早晨第一节课的表现普遍较差(Cortes, K. E. , J. Bricker , and C. Rohlfs . 2010. “The Role of Specific Subjects in Education Production Functions: Evidence from Morning Classes in Chicago Public High Schools.” IZA Discussion Paper No. 5031.)。
一些学校和大学已经将上课时间推迟到上午 10:00 或更晚(例如,伦敦大学的媒体、艺术与设计学院的上课时间为 10:30 ),尽管大多数并没有进行正式的研究。一所新西兰的学校将 16 岁及以上学生的上课时间改为 10:30,分析显示,同一所学校中 14 至 15 岁学生(上课时间为 09:00 )报告的睡眠缺失更多,起床困难(p < .001)且在平日 07:00 之后醒来的可能性显著低于 10:30 开始上课的年长学生(p < .0001)(Borlase, Gander, and Gibson 2013)。土耳其的萨卡里亚大学有两轮全日制课程( 08:00–14:50 和 15:00–21:50 ),学业成就因课程时间和生物钟类型而异。大多数考试安排在 09:30,教学和考试的开始时间都会影响学业表现,晚睡型学生在晚间课程中表现更好,而在早晨举行的考试中表现较差(Beşoluk, Onder, and Deveci 2011)。出人意料的是,Shekleton et al. (2013)的研究发现,整体表现更好的是晚上的时段,而不是白天早些时候的时段。这些数据表明,探索一天的教育时段的上限可能对确定适合青少年群体的教育结束时间或教育安排有所帮助。亚洲和其他一些教育体系在晚上较早时间段安排课程的成功,或许也表明,直到晚上 8 点的时间段在青少年学习中可能是非常有效的。
关于推迟上课时间的研究一致表明,采用多种研究方法后,青少年的睡眠、健康和学习表现均有所改善。相比之下,没有研究表明提早上课时间对睡眠、健康或学习有任何积极影响。
对教育政策和实践的启示
睡眠医学和生物节律神经科学的研究正开始对教育政策和实践产生直接影响,越来越多的学校考虑调整上课时间至更晚。学校管理者被要求考虑继续坚持早晨上课时间可能对儿童健康和学习带来的风险(Kelley, P. , and C. Lee . 2014. Later School Start Times in Adolescence: Time for Change . Denver, CO : The Education Commission of the States.)。最近,田纳西州修改了教育法,鼓励对这类生物学问题进行培训(Tennessee Public Chapter 46, 2013),这一举措可能成为其他地区的参考。推迟上课时间也将惠及年轻教师,因为许多人属于晚型生物钟(见图 1),而将睡眠医学和生物节律神经科学纳入他们的培训中,将对支持学校中的睡眠教育产生双重积极作用。
改善青少年健康和学业成绩的其他干预措施的财务成本通常远高于调整学校上课时间。尽管实施更晚的上课时间可能会产生一些财务成本,具体取决于教育系统,但与其带来的积极影响相比,这些成本相对较为较小(Jacob, B. A. , and J. E. Rockoff . 2011. “Organizing Schools to Improve Student Achievement: Start Times, Grade Configurations, and Teacher Assignments.” Brookings/Hamilton Project Discussion Paper 2011–08.; Kirkby, Maggi 和 D'Angiulli 2011)。研究表明,更晚的上课时间对经济困难学生的高风险结果影响比许多更昂贵的干预措施更大,例如,减小班级规模(Edwards 2012)。这一点在经济困难的社区尤为重要,这些社区中的年轻孩子在接近青春期时有更差的睡眠,而那些就读于 Title 1 学校(译注:一种受联邦资助的学校,旨在改善其教育计划,帮助学生达到州标准。)的学生睡眠时间较短(El-Sheikh et al. 2013)。在英国,针对经济困难儿童学业表现的国家干预措施(学生津贴)的成本非常高,至今成效有限。相比之下,推迟上课时间似乎显著缩小了经济困难学生与其他学生之间的差距(Kelley, P. , and S. W. Lockley . 2013. “Synchronizing Education to Healthy Adolescent Brain Development: Sleep and Circadian Rhythms.” Paper presented at the annual meeting of the American Educational Research Association, San Francisco, April 27.)。
有越来越多的证据表明,教育政策和实践正在开始发生变化。公众对于推迟上学时间的兴趣日益增长,包括美国国家睡眠基金会、推迟上学时间运动甚至国会议员等组织都在敦促实施推迟上学时间的政策。特别是在美国,立法提案的数量正在增加,例如,《众议院并发决议 176》(2009 年):表达了国会的意见,即中学应在早上 9 点之后才开始上课。这是一种务实的方法,鼓励将上学时间调整到与青少年的生物钟更匹配的时间。最近,马里兰州、弗吉尼亚州和马萨诸塞州都在考虑立法以推迟上学时间,而在 2013 年美国教育部长 Arne Duncan 在推特上发表言论「让青少年多睡会儿,推迟上学时间」之后,这一势头可能会进一步增强。现在,研究证据、流行病学数据和特定年龄段的模型可以结合起来,为实施循证改革提供支持,使教育的开始时间与青少年的生物钟同步。
使教育与青少年的生物钟同步可以立即提高教育水平,而且这一目标的实现步骤相对简单,不需要新的教学方法、新的测试或大量的额外支出。通过这一同样的干预措施减少健康风险,也不需要新的医疗方法、筛查或治疗。好的政策应该基于好的证据,而数据显示,目前孩子们被迫在不合适的教育时间学习,这使他们处于极大的不利地位。使教育机构的时间安排与青少年的生物钟同步,以保证充足的睡眠时间,这既实用又必要,这也体现了基于神经科学、睡眠科学和教育研究的跨学科深思熟虑、充分调研的干预所能实现的成果(Gabrieli 2009;Meltzoff et al. 2009)。
创造性人格与理想的学生
原文:The Creative Personality and the Ideal Pupil
作者:E. PAUL TORRANCE
大量研究证据表明,具有创造性人格的人往往难以赢得教师或上司的青睐,甚至可能遭到疏远。例如,Getzels 和 Jackson [1]的研究发现,比起那些创造力突出但智商相对较低的学生,教师更偏爱智商高但创造力较低的学生。我的研究[9]也得出了类似结论,证实这一现象同样存在于小学生与教师之间。Jex[4]的报告指出,高中科学教师在独创性测试中的表现与其上级评价呈负相关。更令人深思的是,Taylor[8]的研究表明,那些最富有成效、被认为能提供最可靠信息、并发表最多科学文章的研究人员,恰恰是在人员精简时最容易被主管列入裁员名单的对象。
教师和上级对具有创造力的人往往不太欣赏,这一现象引发了我的思考:教师心目中的理想学生究竟是什么样的?我意识到,教师在有意识或无意识中,总是根据自己的理想来奖励学生。因此,了解教师对理想学生的看法,可能有助于我们理解富有创造力的人所面临的问题,并帮助他们解决这些问题。基于对创造性人格特征研究的综述,Henrickson 和我[3]已经探讨了这些发现对课堂纪律的影响。同时,我和同事们也认识到在学校奖励创造性思维的重要性,为此我们进行了 20 多项实验,试图找出一些更有效的方法。在研究过程中[7],我们发现如果教师自身的价值观不支持创造性,他们就无法释放学生的创造力潜能。当我们要求教师描述他们奖励创造性思维的事例时,这一点表现得尤为明显。令人遗憾的是,这些数据显示创造性行为往往受到惩罚而非奖励。教师内心价值观的冲突,使他们无法对这种行为给予适当的鼓励。
一些地区的模式
在探究教师心目中理想学生形象的过程中,我们运用了一份包含创造性人格特质的清单。这份清单源自约 50 项实证研究,这些研究比较了各领域中具有创造力和缺乏创造力的个体的人格特质。我们将最初的 84 项特质精简为 62 项,制成一份调查问卷,邀请教师和家长参与评估。受访者需要用单勾标示应当鼓励的特质,双勾标示五项最为重要的特质,并划去那些应该抑制或惩戒的特质。我们据此建立了评分系统:双勾得 2 分,单勾得 1 分,划去则扣 1 分。这样,我们就能为每组受访者眼中的每项特质计算出一个理想指数,并据此对这 62 项特质进行排序。
迄今为止,我们已收集了来自美国十个州(包括明尼苏达、威斯康星、伊利诺伊、密歇根、加利福尼亚、佐治亚、佛罗里达、密西西比、内布拉斯加和夏威夷)以及美国以外六个国家(加拿大、澳大利亚、德国、西萨摩亚、印度和菲律宾)共 650 名教师的调查结果。研究发现,美国境内各地区教师的排序结果高度一致,相关系数高达 0.95 左右。这表明,无论是明尼苏达、威斯康星、加利福尼亚、佐治亚还是密西西比的教师,他们对理想学生特质的看法基本一致。当然,我们也观察到一些引人深思的差异,这些差异反映了不同文化背景下的独特观念,可能对创造性人格的培养产生深远影响。
举例来说,美国不同州的教师对理想学生特质的看法存在显著差异。加利福尼亚州的教师比其他任何地区的教师都更重视学生具备审美能力、多才多艺、勇于冒险、远见卓识以及敢于表达不同意见的品质;相比之下,他们对诚实和做事彻底的重视程度较低。佛罗里达州的教师看重学生精力充沛、勤奋好学和遵守纪律,而佐治亚州的教师则更强调做事彻底。明尼苏达州的教师希望学生能够虚心接受他人的观点;密西西比州的教师重视学生追求卓越的愿望,威斯康星州的教师则强调勤奋和受欢迎的重要性。内布拉斯加州的教师特别强调记忆力好、具有竞争精神和自信,但不太重视好奇心。密西西比州和佐治亚州的非裔教师比美国其他任何群体的教师都更看重学生服从、有远大目标和愿意接受权威判断的品质;相比其他群体,他们不太重视独立思考和受同龄人喜爱。他们对学生退步的惩罚较少,但对学生提出强烈异议的惩罚较多。当然,我们必须明白,这里并不声称所使用的样本具有代表性。
尽管对理想学生特质的某些看法似乎在全球范围内都普遍适用,但其他一些看法则因文化差异而存在显著不同。例如,在西萨摩亚,良好的记忆力比其他任何文化都更受重视。同样,在美国,体贴他人的品质备受推崇;在加拿大和澳大利亚,勤奋被视为重要特质;在德国,人们看重坚持不懈和远见卓识;而在印度和菲律宾,顺从、礼貌和勤奋则被高度重视。
接下来,我们将把注意力集中在 650 名美国教师最看重的十个特质上。在适当的地方,我会引入来自家长和其他国家教师的相关调查结果。随后,我们将探讨被认为最不受欢迎的十个特质,以及一些对培养创造性人格具有特殊意义的具体特质。
对服从性的推崇
在美国,教师和家长都将「体谅他人」视为 62 项个人特质中最为重要的一项。这种对体谅他人的高度重视,无疑解释了为什么教师往往不太青睐那些极具创造力的学生。研究表明,创造力高的人往往在这一特质上显得有所欠缺。尽管他们可能会为了帮助他人、报效祖国或造福人类而不惜牺牲自我,但他们常常会全身心地投入到所研究的问题中,认为这些问题至关重要,以至于没有时间去表现出我们社会,甚至军事指挥官[2]都极为看重的礼貌和体贴。然而,将这一特质置于价值观的最高位置,可能反映出对他人思想的过度迎合,如果发展到极端,可能会阻碍创造性思维的发展。当然,如果这种重视体现的是对每个人独特性的真诚尊重,那就是另一回事了。无论如何,这些发现指出了一个需要关注的领域:如何帮助那些极具创造力的学生在不牺牲创造力的前提下,变得更容易相处。
其次,在我们调查的美国教师样本中,独立思考能力被视为第二重要的品质。鉴于几乎所有关于创造性人才的研究都强调独立思考的重要性,这一被广泛认同的价值观应该有助于通过教学激发学生的创造力。然而,真正的创造性成就不仅需要独立思考,还需要独立判断。具有创造力的个体必须能够独立做出判断并坚持己见,即使面对他人的不同意见。任何新想法在初期都会让其提出者成为孤立无援的少数派。我们都深知,处于这种境地会让人感到不适。因此,独立判断需要巨大的勇气。
令人遗憾的是,美国教师并未高度重视独立判断或勇气这两种品质。在我们掌握数据的七个国家中,美国教师对独立判断的重视程度排名第十九,对勇气的重视程度更是垫底,排在第二十九位。事实上,美国教师更看重学生的礼貌而非勇气。他们认为学生按时完成作业、精力充沛、勤奋好学、服从权威、受同学欢迎、乐于接受他人想法、多才多艺以及愿意接受权威判断,这些品质都比勇气更为重要。这样的价值取向更容易培养出易于被洗脑的学生,而非具有创造性思维的人才。正如 Maslow[5]所指出的,每一位伟大的创造者都证实了在「孤独的创造时刻,肯定新事物(与旧有观念相悖)」时需要勇气。Maslow 将其描述为「一种大胆行为,独自走在前面,一种反抗,一种挑战。」虽然恐惧可以理解,但若要实现任何创造,就必须克服这种恐惧。
负责任的动力
坚定不移的决心,在美国教师眼中位列第三,无疑是创造性人格的关键特质。有人曾巧妙地形容,真正具有创造力的人可能是第一个妥协但最后一个放弃的人。尽管我们普遍认同决心是一种「可贵品质」,但当它与我们的意愿相左时,我们往往难以欣赏。因此,这种决心常常使创新者与教师、雇主和其他权威人士产生矛盾。这种特殊的决心正是创造性人格的典型标志。他们通常拒绝接受否定的答复,即使面对挫折也坚持验证自己的想法。也许我们需要教导这些意志坚定的创新者如何在坚持理想的同时,适时做出必要的让步。
同样,创造性个体永远不会满足于固定的工作时间。他们的思考和工作似乎永无止境。然而,尽管具有创造力的孩子工作异常勤奋,投入度极高,但在老师眼中可能却是个爱做白日梦、懒惰或反复无常的学生。同事可能将具有创造力的成年人视为懒散的闲人、空想家,或工作狂。许多高度创造性的人表面上似乎不够勤奋,因为他们会花时间静坐思考,看起来并不忙碌。为了充分释放创造性思维的潜力,我们必须承认并重视这种安静的思考活动,赋予它应有的合法地位。
富有创造力的人常以幽默感著称,但这种幽默感并非总能博得周围人的欢心。相反,它可能为他们赢得「愚蠢」、「疯狂」、「小丑」、「捣蛋鬼」等标签。这种对创造性个体的不当对待经常会引发他们的敌意,而这种敌意又会以讽刺、挖苦等尖锐的幽默形式表现出来。理想情况下,美国的教师应该能够欣赏富有创造力的学生的幽默感,并帮助他们保持这种特质,同时避免因过度愚昧或敌意而冒犯他人。许多富有创造力的孩子需要帮助来减少敌意,同时保持他们的进取精神、独立判断能力和勇气。
美国教师高度重视好奇心这一点令人鼓舞。好奇心是创造性人格和创造过程中的一个关键要素。在我们的研究[6]中,我们已经识别出具有好奇心的孩子通常具有以下特征:
-
对环境中新奇、异常、不协调或神秘的事物做出积极反应,会主动接近、探索或操作这些事物;
-
表现出了解自己和周围环境的需求或渴望;
-
主动观察周围环境,寻求新的体验;
-
持续观察和探索各种刺激,以获取更多相关知识。
当我请教师们根据这些特征评估他们的学生时,我获得了一些有趣的经历。他们告诉我,此前他们从未从这个角度思考过自己的学生。当我要求他们在一个班级中提名五个最具好奇心和五个最不具好奇心的学生时,教师们抱怨说他们不得不将一些「最优秀」的学生列入低类别。一位教师说:「我感到很难过,不得不把一些最优秀的学生放在低组。他们在算术和拼写方面是我最出色的学生。但是,他们确实不太好奇。他们从不提问,只学习我告诉他们的内容。」
创造力强的人不仅充满好奇心,还极其真诚。这种真诚品质通常能赢得老师的赞赏。然而,老师们需要谨慎对待,不能只是口头上称赞真诚,而是要在学生表现出真诚时给予真正的尊重。当学生表达的真诚想法与我们正式认可的「纯洁」和「神圣」观念不符时,老师们往往难以克制惩罚的冲动。这正是在培养创造力的过程中,教师和家长面临的一个重大挑战。
另一个问题源于创造力强的孩子或成人有时可能显得不够礼貌。这往往是因为他们太专注于手头的工作或脑中的想法,以至于忽视了礼节。
然而,由于礼貌在我们的社会中备受重视,我们可能需要帮助这些富有创造力的孩子学会更有礼貌的行为方式,以便他们能更好地适应社会生活。值得注意的是,在印度、加拿大、菲律宾和澳大利亚等国家,教师们同样将礼貌视为理想学生应具备的重要品质。
在我们的社会中,准时同样备受重视,这常常让富有创造力的人陷入困境。创造力要求人们能够让一个想法自然引导到另一个想法,这往往意味着他们会全身心投入到一些令人兴奋且富有前景的想法中,而不是去赶一些在他们看来相对不那么重要的截止日期。教育者需要认识到,有时候一个人可能会绞尽脑汁,热切地希望能想出新点子,却仍然无功而返。然而,灵感往往会在不经意间突然「降临」。时间的压力是富有想象力思维的最大敌人之一。虽然我们无法完全摆脱时间的束缚,但我很高兴看到一些教师能够保持足够的灵活性,至少能在某种程度上减轻这种压力。
尽管美国被认为是世界上最注重时间观念的国家之一,但有趣的是,与教师将按时完成工作排在第九位相比,家长们却将其排在了第十六位。然而,德国、加拿大和澳大利亚的教师明显不如美国教师那么看重这一特质。
最后,具有创造力的人以自我驱动著称。令人欣慰的是,教师们如此推崇这一特质。然而,人们不禁要问,大多数教师对真正的自我驱动者——那些不仅仅按教师的指示学习和行动的人——给予了多少支持。我们大多数人所推崇的自我驱动能力,正是我们所倡导的那种。
只有德国和加拿大的教师以及美国的家长,像美国教师一样高度重视这种自我驱动能力。美国的黑人教师以及萨摩亚、印度、澳大利亚和菲律宾的教师则将这一特质排在总清单的中间位置。
受惩罚的特质
现在让我们把注意力转向排名的底部,看看教师最常惩罚或制止的十个特质。
高度富有创造力的个体有时会表现出退行行为,看似幼稚、天真和爱玩。然而,这种倾向似乎是创造性人格不可或缺的一部分。由于这种行为可能会让教师感到不适,我们或许需要帮助这些孩子以一种不会令人反感的方式展现这一特质。同时,教师也需要对创造性儿童的这一特征保持更多的包容和理解。在我们的一项研究中发现,小学教师认为高度创造性的学生比那些智力水平更高但创造力较低的同学更缺乏学习热情和勤奋精神。然而,有趣的是,尽管这些富有创造力的孩子在斯坦福-比奈智力测试中的平均分数比高智商同学低了 25.6 分,但他们在标准化成就测试(如盖茨阅读测试和爱荷华基本技能测试)中却取得了与高智商同学相当的成绩。这表明,这些年轻人似乎能够通过成年人眼中的「退行」或「玩耍」活动来有效学习。
另一方面,创造性个体往往以极大的热情生活;他们可能会全身心地投入某个想法或事业,并常常表现出极大的开放性和敏锐的感知力。这些特质经常使他们被贴上情绪化或非理性的标签,而这些特征传统上一直被教育所排斥。然而,创造性个体已经学会接纳、珍视并利用他们的非理性思维。事实上,这种非理性恰恰是他们许多伟大成就的基石。如果我们希望通过教育释放创造性智慧,就需要调和这种价值观的冲突。
许多富有创造力的人尽管内心激情澎湃,却常常表现得羞怯腼腆,这种看似矛盾的特质其实有其深层原因。世界上一些最具创造力的人虽以害羞著称,但他们的胆怯往往仅限于社交场合;相比之下,在发展、验证和捍卫自己的想法时,他们却表现得异常大胆。事实上,真正富有创造力的人可能会在人际交往中率先妥协,但在坚持自己的理念时却往往最后放弃。这种看似矛盾的胆怯,正是创造性人格的典型特征。
尽管性格羞怯,富有创造力的个体却往往善于批评他人。值得注意的是,在创造力旺盛的人群中,这种批评通常具有相当的建设性。然而,为了充分激发学生的创造力,教师可能需要明确地指导他们如何提出更具建设性的批评意见。与此同时,创造性个体往往表现得较为固执,这就给教师带来了一个棘手的问题:如何在保持学生坚持不懈精神的同时,有效培养他们的社交技能。
在坚持不懈地追求独立思考的过程中,富有创造力的个体有时可能给人以负面或对抗的印象。然而,事实恰恰相反,与创造力较低的人相比,他们通常更愿意接纳他人的建议。不过,他们确实常常表现出不轻易接受否定答案的特点。这一特征在我对美国喷气式战斗机王牌飞行员的研究中尤为突出,我认为这个群体具有卓越的创造力。遗憾的是,许多教师往往将这种行为误解为令人不快且令人烦恼的负面态度。
与此类似,极具创造力的人有时可能给人以傲慢自满的印象,因而招致同事和上级的反感。这是因为他们常常提出与现有观念和做法相悖的新想法。问题的关键在于如何在接受这一特质的同时,帮助他们以更得体的方式展现自己。另一个相关的困扰是,富有创造力的人往往喜欢挑剔,尽管大多数情况下是出于建设性的目的。事实上,创新型人才必须质疑既有的思维模式,善于发现缺陷、知识盲点和缺失环节。他们几乎总是有些「与众不同」的特质。
最后,一些富有创造力的孩子可能看起来很专横,特别是当他们在创造想法的时候,他们有一种不同寻常的天赋,无论他们在哪里发现自己,都会扰乱现有的组织。当然,这令教师们感到不安;在迄今为止所研究的几乎所有文化中,这个数字排名最低或仅次于创造力最低的。我相信这是创造性思维者和理想学生的基本和特征,如果我们要释放创造性思维能力来发展,我们必须学会如何接受它,引导它朝着有成效的方向发展,并利用它的价值来激发课堂上的学习和思考。
没有创造力的理想形态?
显然,每位教师都需要深思自己心目中「好学生」的理想形态可能带来的影响。这种理想会如何促进或限制学生创造力的发展?我们应当谨记柏拉图的名言:「一个国家推崇什么,就会培养什么。」最近,我向俄亥俄州代顿市的 S. Beaty Tanner 先生分享了一些相关观察,他经过思考后写了一篇发人深省的短文。我们将其命名为《独立宣言的传奇》。我将其作为一个挑战,希望能引发所有教育工作者的深入思考:
很久以前,人们还不知道所谓的理想学生应该是这样的:首先要有礼貌、听话、受欢迎,并且乐于接受他人的想法——虽然要独立思考,但不能做出与老师或父母相悖的判断,因为那样可能会使他与主流思想格格不入,导致他难以适应、缺乏安全感,甚至得不到爱。在那个时代,有一群人在成长过程中并没有接受现今人们认为能造就好学生和好公民的教育理念。
这群「异类」构思并撰写了一份他们称之为《独立宣言》的文件——在当时可谓是石破天惊的创举。你能想象他们接下来的举动吗?他们居然在上面签了名,明知一旦战争失败就会有杀身之祸!他们的士兵不过是些农民、猎人和小镇居民,却狂妄地以为能打败英国国王的那些训练有素的职业军队,那些穿着红色制服、严格遵守军规的士兵。如果他们输了(这种可能性很大),许多签署者将会丧命,而那些侥幸活下来的人也必定会遭到英国国王和民众的憎恨。
好吧,结果打破了所有规则,但他们赢了——经过一场艰难的战斗,而且完全不是以常规方式进行的。
这就是这个合众国的开端。当然,从那时起我们已经改进了很多。现在一切都愉快地标准化了。我们有安全保障,可以用小额首付购买一切——除了像我们 1776 年那样的新国家的全心全意的信任、友谊和支持。
我想知道为什么会这样?
参考文献
-
Getzels, J. W., & Jackson, P. W. Creativity and Intelligence. New York: Wiley, 1962.
-
Halpin, A. W. The leadership behavior and combat performance of airplane commanders. J. abnorm. soc. Psychol., 1954, 49, 19-22.
-
Henrickson, P. R., & Torrance, E. P. School discipline and the creative personality. Eastern Art Assn. Res. Bull., 1961, 18, 36-42.
-
Jex, F. Negative validities for two different ingenuity tests. In Taylor, C. W. (Ed.) The third (1959) university of Utah research conference on the identification of creative scientific talent. Salt Lake City: Univer. Utah Press, 1959.
-
Maslow, A. H. Toward a psychology of being. Princeton, N. J.: Van Nostrand, 1962.
-
Maw, W. H., & Maw, Ethel W. Establishing criterion groups for evaluating measures of curiosity. J. exp. Educ., 1961, 24, 229-305.
-
Myers, R. E., & Torrance, E. P. Can teachers encourage creative thinking? Educ. Leadership, 1961, 19, 156-159.
-
Taylor, C. W. Identifying the creative individual. In Torrance, E. P. (Ed.) Creativity: Second Minnesota conference on gifted children. Minneapolis: Center for Continuation Study, Univer. Minnesota, 1960. Pp. 3-21.
-
Torrance, E. P. Guiding creative talent. Englewood Cliffs, N.J.: Prentice-Hall, 1962.
进一步阅读
Ausubel, D. P., "Viewpoints: Some Misconceptions Regarding Mental Health Functions and Practices in the School," Psychology in the Schools, Vol. 2 (1965), pp. 99-105. Considers the most serious misconceptions about mental health concepts and practices in the schools. Takes a hard look at conceptual clichés of modern education.
Beilen, H., "Teachers and Clinicians' Attitudes Toward the Behavior Problem of Children: A Reappraisal," Child Development, Vol. 30 (1959), pp. 9-25. Reviews studies comparing teachers' and clinicians' (psychiatrists, psychologists, and social workers) rankings of importance of selected behaviors as indications of present and potential maladjustment. Sees teachers now concerned with such things as social-adjustment education in classroom.
Deutsch, M., "Facilitating Development in the Pre-School Child: Social and Psychological Perspectives," Merrill-Palmer Quarterly, Vol. 10 (1964), pp. 249-263. While this article refers particularly to the culturally disadvantaged child theory, the discussion is important in general.
Dockrell, W. B., "Society, Home and Underachievement," Psychology in the Schools, Vol. 1, No. 2 (April 1964), pp. 173- 178. The author considers absolute standards of achievement and various studies of underachievement. He comments especially on major groups of underachievers and contributory factors involved.
Dudek, S. Z., and E. P. Lester, "The Good Child Façade in Chronic Underachievers," American Journal of Orthopsychiatry, Vol. 38, No. 1 (January 1968), pp. 153- 160. The personality organization of underachievers is one of a "good child" whose failure to cope with self-assertive, aggressive impulses becomes a pattern of reaction formation, passive aggression, and superficial compliance.
"Equal Educational Opportunity" (Special Issue). Harvard Educational Review, Vol. 38, No. 1 (Winter 1968). Presents articles by 15 outstanding authorities, all committed to equal educational opportunity of all children but differing considerably in their views.
Frick, W. B., "School Phobia: A Critical Review of the Literature," Merrill-Palmer Quarterly, Vol. 10 (1964), pp. 361- 373. A concise review providing an excellent overview of an important educational problem.
Gray, S. W., and R. A. Klaus, "An Experimental Preschool Program for Culturally Deprived Children," Child Development, Vol. 36 (December 1965), pp. 887-898. A report after the third year of an intervention project with culturally deprived children designed to offset the progressive retardation commonly observed in the schooling of such children.
Jensen, A. R., "Social Class and Race: Implications for Education," American Education Research Journal, Vol. 5, No. 7 (January 1968), pp. 1-42. Reviews research on genetic and environmental determinants of individual differences in intelligence and educability. Indicates the lack of definitive answers and the need to come to grips with problems in this area.
Kagan, J., "The Child's Sex-Role Classification of School Objects," Child Development, Vol. 35 (1964), pp. 1051-1056. Through having children designate school objects as masculine or feminine, it was concluded that girls view school as congruent with their sex role, while boys are more ambivalent.
Schmuck, R. A., M. B. Luszki, and D. C. Epperson, "Interpersonal Relations and Mental Health in the Classroom," Mental Hygiene, Vol. 47 (1963), pp. 289-299. Clarifies the effect of interpersonal relations on mental health and academic learning.
Sechrest, L., "Studies of Classroom Atmosphere," Psychology in the Schools, Vol. 1, No. 2 (April 1964), pp. 103-118. Reviews the major research concerning classroom atmospheres and considers the most serious deficiencies involved. Concludes that generalizations from research are unjustifiable beyond the experimental situation in which they have been observed.
Silberman, C. E., "Give Slum Children a Chance," Harper's Magazine, Vol. 228, No. 1368 (1964), pp. 37-44. The author, a member of the Board of Editors of Fortune and a lecturer in economics at Columbia University, discusses the need to upgrade the early education of the lower classes, both black and white.
Taba, H., "Cultural Deprivation as a Factor in School Learning," Merrill-Palmer Quarterly, Vol. 10, No. 1 (January 1964), pp. 147-159. This article provides an overview of a problem of great concern in American education.
From E. Paul Torrance, "The Creative Personality and the Ideal Pupil," Teachers College Record, Vol. 65, No. 3 (December 1963), pp. 220-226. Reprinted by permission of the author and publisher.
摒弃应试思维
原文:The Lesson to Unlearn (paulgraham.com)
2019 年 12 月
你在学校受到的最有害的教育,不是某一门具体课程,而是学习只为了拿高分。
上大学时,有个特别认真的哲学研究生曾对我说,他从不关心课程的分数,只在乎从中学到了什么。这番话令我难忘,因为这是我唯一一次听到有人这样说。
对于我和大多数学生而言,学习完全是为考试成绩服务。虽然我一向比较用功、学习刻苦,也确实对大部分课程感兴趣,然而只有在备考时,我才会竭尽全力。
本来,考试应该顾名思义,是对课程学习效果的考察、测试。你本不必专门准备课程考试,就像不必专门准备验血一样。理论上,学习是通过上课、听讲座、阅读和完成作业来进行的,考试只是事后评估学习效果。
读到这里的人想必都心知肚明,实际情况截然相反。考试的意义已经完全改变了,以至于听到关于课程和考试如何运作的这番解释,就像在听词源学解释*。实际上,「应试学习(studying for a test)」几乎成了废话,因为学生只在应付考试时,才真正学习。至于勤奋和懒惰的区别,就在于前者努力学习来应对考试,而后者没有。没人会在刚开学就学得废寝忘食。(译注:大部分单词和其词源的原意已经大相径庭。)
尽管我是一个勤奋的学生,但在上学的日子里,我几乎所有的努力都是为了好成绩。
或许很多人会对上文的「尽管」感到奇怪。这难道不是事实吗?勤奋的学生不就等同于全优生(straight-A student)吗?「学习就是为了高分」的观念已根深蒂固地融入我们的文化,由此可见一斑。
那么,将学习和分数划等号真的很糟糕吗?答案是肯定的,糟糕透顶。然而,直到大学毕业多年后,当我开始创办Y Combinator时,才恍然大悟,意识到问题的严重性。
学生时代,我就明白临时抱佛脚和真正掌握知识完全是两码事。考前一天晚上死记硬背的内容,显然不会在你的脑子里停留太久。但问题远比这更严重。更大的症结在于,绝大多数的考试根本无法检验学生真正学到了什么。
倘若考试真的能够检验学习效果,情况或许还不至于太糟。学到真材实料和取得优异成绩最终总会殊途同归,只是时间早晚的问题。然而现实是,如今学生们参加的绝大多数考试都过于套路化,学生很容易就能掌握试题模式。许多考试成绩优异的人对此心知肚明,习以为常。当你意识到凭真才实学去考试有多么幼稚天真时,你就明白应试技巧才是法宝。
举个例子,假设你正在学习中世纪历史课,期末考试近在眼前。期末考试本该全面检验你对中世纪历史知识的掌握,对吧?那么,如果你在考前还有几天时间,又想考个高分,最明智的做法必然是博览群书,查阅这一领域最权威的资料。唯有如此,你才能透彻理解那段历史,在考场上脱颖而出。
但是,有「经验」的学生可绝对不会这样做。如果你只是阅读一些讲述中世纪历史的经典著作,那么你学到的大部分内容都不会出现在考试中。面对考试,你真正需要读的是这门课的讲义和指定读物。即便如此,你也可以忽略其中的大部分内容,因为你只需要关注那些可能会变成考题的知识点。你要找的是界定明确的信息块。如果指定材料中有关于某个细微观点的有趣讨论,你大可略过,因为它不太可能出现在试卷里。但如果教授告诉你,1378 年教会大分裂有三个根本原因,或者黑死病有三个主要后果,你最好记牢。至于它们是不是真正的原因或后果,那并不重要。对这门课而言,它们就是标准答案。
在大学里,旧试卷的复印件通常广为流传,这进一步缩小了你需要学习的范围。你不仅可以了解这位教授出题的套路,还能拿到真题。许多教授都会重复使用考题,即便不愿重复,如果已经教了 10 年的课,也很难避免这种情况。
在某些课程中,如果教授怀有某种政治立场,那么你也得持相同立场。这种要求因课程而异。在数学、硬科学*或工程学课程中,很少有此必要,但在其他课程中,如果你不迎合教授的观点,就别想拿到好成绩。(译注:硬科学,学术口语,指物理学、计算机科学等依赖可量化数据的学科,注重准确性和客观性)
在一门课程中取得优异成绩和真正掌握知识是两码事,学生必须二选其一。如果他们选择了前者,我们也不能责怪他们。毕竟,研究生课程、用人单位、奖学金,甚至父母,全都用成绩来评判学生。
我喜欢学习,很享受在大学写论文和编程的乐趣。但当我交完一篇论文后,我会再写一篇只是为了享受吗?当然不会。我还有其他课程的任务要完成。如果必须在学习和分数之间做出选择,我会选择后者。我来大学不是为了让成绩一塌糊涂。
追求高分的学生都必须参与这场竞赛,否则就会被其他渴望高分的对手超越。在顶尖大学,几乎人人如此,因为不在乎分数的人一开始就不会出现在这里。结果就是,学生们争夺更高的分数,优异成绩和真才实学之间产生了一道鸿沟。
为什么考试这么不可靠?更确切地说,为什么考试的套路这么容易被掌握?任何有经验的程序员都知道答案。如果软件开发者根本没有设防,那它会有多容易被钻空子?通常如同筛子一般千疮百孔。
套路化、模板化是所有正式考试的通病。你所参加的考试之所以总是那样不可靠——总是和其应有的评估效果相距甚远——原因很简单,出题人根本没有下功夫去防止学生利用应试技巧拿高分。
然而,如果老师出的考试存在套路化的现象,我们不能责怪他们。老师的本职工作是教书育人,而不是设计无懈可击的考试。问题的根源在于分数,或者更准确地说,是分数所承载的过多功能。如果分数只是老师告诉学生哪里做得好、哪里有待改进的一种方式,就像教练给予运动员指点一样,学生就没有研究应试技巧的动力。但遗憾的是,过了某个年龄,分数不再只是建议,在求学的过程中,「唯分数论」无处不在。
虽然上文以大学考试为例,但实际上大学的考试还算没那么套路化。大多数学生一生中参加的所有考试都同样的不可靠,最典型的莫过于大学招生考试。如果上大学只需要招生官像科学家测量物体质量一样衡量一个人的头脑,那么我们完全可以告诉孩子们「努力学习」就够了。但大学招生要求听起来与高中倡导所学迥然不同,由此可见这项考试是多么不可靠。事实上,有抱负的学生在高中不得不做的那些极其具体的事,恰恰反映出大学招生考试有多么不合理——那些你并不真正在意的、主要靠记忆的课程;为了展示自己「全面发展」而被迫参加的随机「课外活动」;像下棋一样拘泥于套路的标准化考试;你必须写的「论文」——想必是要达到某个非常具体的目标,但没人告诉你具体是什么。
除了会对孩子造成伤害,这类考试的另一个弊端就是应试化严重。以至于围绕考试衍生出了一整个应试行业,考试辅导机构和招生顾问的明确目标就是应试,而这也是私立学校的一项重要功能。
为什么大学招生考试如此应试化严重?我认为这跟它的评判标准有关。尽管普遍的看法是,进入一所好大学的途径就是变得非常聪明,但精英大学的招生官既不这样认为,也没有宣称他们只看重这一点。那他们看重什么?他们在寻找那些不仅聪明,而且在更广泛意义上值得敬重的人。而这种更广泛的可敬性如何评判呢?招生官凭直觉。换句话说,他们录取他们喜欢的人。
因此,大学招生实际上是在考察高中生是否合某群人的口味。这样的考试,应试技巧当然越来越重要。正因为大学招生考试模板化,且(被认为)利害攸关,人们对应试能力的追求超越了其他考试,以至于长期严重地扭曲了学生的生活。
难怪高中生常常感到缺乏自我,他们的生活形态完全是被人为塑造的。
但浪费时间并非教育系统加诸你的最糟糕的事,最糟糕的是训练你通过应试思维来解决套路十足的考试。这是一个更加隐晦的问题,直到我看到它发生在他人身上才意识到。
刚开始在 Y Combinator 给创业者提建议时,我很不理解他们为何总爱把事情搞复杂,尤其是那些年轻人。他们问我,怎样筹集资金?有什么诀窍能吸引风投?我告诉他们,想要赢得投资,最佳途径就是成为一个真正值得投资的项目。就算你骗了风投去投一个烂项目,那也是在自欺欺人——要知道,你自己也要在这家公司上投入宝贵的时间,如果这不是个好项目,何必浪费时间精力呢?
听完我的一番话,他们一时恍然大悟,紧接着又抛出问题:什么样的创业公司才算得上是个好项目?
于是我解释道,不论是在投资人眼中,还是客观上来说,创业公司最应该关注的就是增长。增长包括营收的增长,或者活跃用户数的增长。总之,对他们而言,当务之急就是获取大量用户。
对如何获取大量用户这个问题,他们天马行空、异想天开:要举办发布会博眼球,找名人为产品站台,发布日也要选在周二这个新闻日,以期获得最多关注度。
面对种种荒谬的想法,我耐心解释:这些都不是正道。要想获得大量用户,唯一可行的办法就是把产品做到极致。只有产品足够优秀,用户才会发自内心地喜欢它,主动将它推荐给朋友,一旦你做到了,指数级增长就随之而来了。
在与创业者交流时,我曾一再强调一个看似简单明了的道理:打造优秀公司的关键,在于创造出色的产品。然而,当他们听到这番话时,反应却像许多物理学家第一次听到了相对论一般,既惊叹于其精妙,又怀疑这么奇怪的答案怎么可能是正确的。他们会口头应承,但转而就会问我能否引荐他们认识某位大佬,或者叮嘱我别忘了他们要在下周二发布产品。
有些创业者花了很多年才真正领悟这些浅显的道理。这并非因为他们懒惰或愚钝,而是对摆在眼前的真相熟视无睹。
我常常扪心自问,为何他们总爱把简单的事情复杂化?后来我恍然大悟,这并非一个反问句。
为什么这些创业者明明答案近在咫尺,却还是让自己陷入困境?因为这正是他们在学校中被训练出的思维定式。往昔的教育让他们相信,获胜的秘诀就是应试思维。而他们甚至都没有意识到自己正在被这样「训练」。尤其是应届毕业生,从未经历过真正的、非人为设计的考验,天真地以为这就是世界运转的法则:但凡遇到挑战,第一要务就是以应试思维去套用应试技巧。这就是为什么他们总是喋喋不休地谈论如何融资,因为在他们眼中,融资就是考试。融资是 YC 训练营的最后环节,而且融资对应着切实的数字指标,数字越大,成绩似乎就越亮眼。这怎么可能不是考试呢?
在这个世界上,有相当一部分领域,人们习惯于通过应试思维来获得成功。这种现象并不仅限于学校。出于意识形态或无知,一些人声称创业公司也是如此。但事实并非如此。创业公司最显著的特点之一,就是你只需要踏实做好自己的本职工作就能取得成功。创业和其他事情一样,尽管也有一些例外情况,但总的来说,能否获得用户的认可才是创业成败的关键,而用户真正关心的是产品能否满足他们的需求。
我之所以花了这么长时间才明白为什么创业者会让创业变得过于复杂,是因为我没有明确意识到一个事实:学校一直在训练我们通过应试思维来获得成功。不仅仅是他们,还有我自己!我也在学校中训练出了面对套路化考试的应试思维,直到几十年后才恍然大悟。
我一直以为自己已经意识到了这一点,但却不清楚背后的原因。比如,我总是避免去大公司工作。但如果你问我原因,我可能会说因为大公司虚有其表,或者官僚主义盛行,或者就是让人心生厌恶。我从未真正明白,我如此反感大公司,很大程度上是因为在那里,你只有靠不断揣摩套路化的考核机制才能获得成功。
再比如,有些测试不那么套路化,这也是吸引我投身创业的重要原因之一,但我当时同样没有清楚地意识到这一点。
通过不断地调整和优化,我竟在不知不觉中摆脱了应试思维。假如应届毕业生能意识到这个问题的存在,并下定决心根除应试思维,这会不会有所帮助呢?这很值得一试。
仅仅是坦诚地讨论这个现象,就有可能改善现状,因为它的危害很大程度上源于我们对它习以为常。意识到这个问题后,它就像房间里一头显而易见的大象,只是这头大象善于伪装。这个现象由来已久,无处不在。它是长期忽视的结果。没有人刻意让事情变成这样。这不过是学习与分数、竞争和不切实际的完美主义结合在一起的必然结果。
我一直困惑于两个问题:高中教育与现实脱节,以及创业者对显而易见的事实视而不见。现在恍然大悟,原来这两个问题竟有着共同的根源,不禁令人震惊。如此重大的认知,如此迟才终于明白,实在难能可贵。
通常情况下,这样的顿悟会带来诸多领域的启发,这次看来也不例外。比如,它表明教育大有改进的空间,而且指明了改进的方向。同时,它还为所有大公司面临的一个问题提供了可能的答案:如何保持初创企业般的活力?我暂且不去探究它的所有影响。我想在此重点讨论的是,这个问题对个人成长有何启示。
坦白说,这意味着许多踌躇满志的大学毕业生可能需要重新审视某些观念。同时,这也改变了你看待世界的视角。与其将形形色色的工作简单地划分为有吸引力的或乏味无聊的,倒不如提出一个更加具体的问题,用一种颇有意思的方式加以区分:在某项工作中获得成功,你在多大程度上是靠应试思维?
如果有一种快速识别套路化测试的方法就好了。这其中有什么规律可循吗?答案是肯定的。
测试大致可分为两类:一类是由某个权威推行的测试,另一类则相反。不靠权威推行的测试本质上是非套路化的,因为它们并不用来评判本次检验结果之外的其他事物。比如一场足球比赛,衡量的就只是比赛的结果,而非哪支球队真正更强。这一点可从评论员赛后有时会说「表现更好的球队获胜了」略见一斑。相比之下,权威推行的测试往往别有深意,具有某种指代性。比如一次课堂测验,其目的不仅在于评判你在该次测验中的表现,更在于衡量你在整个课程中的学习收获。非权威测试天然没有固定套路,而权威推行的测试本应刻意设计得非套路、多样化,但通常并非如此。因此,大致说来,不合理的测试基本上等同于权威推行的测试。
你可能真的想靠应试思维来获胜。我相信确实有人喜欢这样做。但我敢打赌,大多数发现自己在干这种活的人并不喜欢它。他们只是觉得这就是社会的游戏规则,除非你想逃离主流社会,做个嬉皮士式的手艺人。
很多人心照不宣地认为,在一个游戏规则有缺陷的领域工作,这是为了大把赚钱必须付出的代价。但我可以负责任地告诉你,这种想法大错特错。这种说法在过去或许还算数。20 世纪中叶,经济被寡头垄断,向上爬的唯一出路就是玩他们的游戏。但现在情况已经今非昔比了。如今有很多途径可以靠出色的工作实现财富自由,这也是当代人比以往任何时候都更向往成功的原因之一。记得小时候,想赚大钱,要么成为工程师,创造酷炫的产品,要么成为「高管」。而现在,你完全可以靠打造精品来实现致富梦。
随着工作和权威的关系日渐式微,应试思维变得越来越不重要。这种关系的瓦解是当今最重要的趋势之一,几乎影响到所有的职业领域。创业公司是最鲜明的例子,但在写作领域我们也能看到类似的变化。作家不再需要看出版商和编辑的脸色才能吸引读者,现在他们完全可以直接与读者对话。
我越是深入思考这个问题,心中的乐观情绪就越高涨。这不禁让人想起一种常见的情形:某些东西明明阻碍着我们,但直到它被清除,我们才恍然大悟。眼下这套徒有虚名的考试体系,正在分崩离析。想象一下,随着越来越多人开始扪心自问,自己是否愿意靠应试思维取得成功,并最终选择弃暗投明,局面将会发生怎样的变化?那些需要依靠迎合权威才能出人头地的行业,将发现人才变得青黄不接;而那些崇尚脚踏实地的行业,则会吸引最具雄心壮志的后起之秀。伴随应试教育日渐式微,我们的培养模式也将摈弃死记硬背、机械刷题的窠臼。试想一下,如果这一切都成为现实,我们的世界该有多美好?
这不仅是个人需要根除的观念,更是整个社会需要反思的问题。一旦我们最终廓清谬见、拨乱反正,必将为扑面而来的勃勃生机而感到无比振奋。
附注
[1] 如果你觉得「考试应该只用于检验学习成果」的说法过于理想化,那就来看看 Lambda 学校的做法吧。在那里,既没有分数,也不搞排名,最后要么顺利毕业,要么哪儿凉快哪儿呆着去。考试的唯一作用,就是决定你能否升入下一个学习阶段。说白了,整个学校都是「毕业/肄业」两档论。
[2] 如果期末考试是与教授进行深入交流,你可以通过阅读有关中世纪历史的经典著作来做准备。学校考试之所以套路化,很大程度上是因为同样的考试必须面向大量学生。
[3] 学习是取得好成绩的朴素方法。
[4] Hacking 一词有多重含义。狭义上,它指的是破解某些事物。本文引用为以应试技巧应对模版化的考试。但广义上,它指的是为问题找到一个出人意料的解决方案,通常是通过从不同角度思考问题。这种意义上的「Hacking」是一件很棒的事情。事实上,人们在应对糟糕考试时使用的一些方法非常巧妙,问题不在于「Hacking」本身,而在于考试因为模板化,无法真正测试应该测试的内容。
[5] Y Combinator 中负责筛选初创公司的成员与招生官类似,但录取标准没那么随意,而是通过非常紧密的反馈循环来训练和完善,以确录取的保精确和高效。通常一个月,超不过一两年,负责筛选的成员就能意识到录取了一家糟糕的初创公司或是拒绝了一家优秀的初创公司。
[6] 我相信招生官已经厌倦了阅读那些似乎除了迎合录取要求之外毫无个性的申请。但他们没有意识到,从某种意义上说,他们是在照镜子。申请人缺乏真实性,恰恰反映了申请过程本身的随意性。一个独裁者抱怨周围人缺乏真实性,同样也说明了问题的根源所在。
[7] 我所说的好工作,不是指道德意义上的好,而是像一个优秀工匠那样精益求精、追求卓越的好。
[8] 有些情况下很难明确判断一项测试究竟属于哪一类。比如说,筹集风险资本是类似于大学招生,还是更接近于向客户销售产品呢?
[9] 需要强调的是,所谓好的测试,仅仅指的是那些无法被攻破、篡改的测试。这里的「好」不是道德层面的优秀,而是实际运作中的有效性。有缺陷的测试领域和高质量测试领域的区别不在于好坏优劣之分,而在于前者是虚假的,后者是真实可靠的。但这两个评判标准也并非毫无关联。正如 Tara Ploughman 所说,从善至恶之路往往由虚假开始。
[10] 对那些认为近来经济不平等加剧是税收政策变化导致的人而言,任何有过创业经历的人都会觉得这种看法过于天真幼稚。当今时代,能够致富的群体已经发生了变化,他们所积累的财富之多,远非仅仅依靠税收节省就能解释得了的。
[11] 送给那些望子成龙的父母一句话:你们也许认为正在训练孩子学会如何获胜,但如果你们教导孩子靠应试技巧来取胜,那就如同许多家长常犯的错误一样,实际上是在训练他们打一场注定失败的昨日之战。
感谢 Austen Allred、Trevor Blackwell、Patrick Collison、Jessica Livingston、Robert Morris 和 Harj Taggar 阅读了本文草稿。
非学校教育:1
原文:Unschooling: 1 - David Friedman’s Substack
一位评论者希望我分享更多关于我的育儿理念和经验
2023 年 2 月 15 日
传统 K-12 学校教育体系中有一个根深蒂固的假设:在浩如烟海的人类知识中,存在一个特定子集是每个人都必须学习的,而这个子集的规模刚好足以填满十二年学校教育的大部分时间。这个假设是错误的。实际上,几乎人人都值得学习的技能只有很短的一个清单——我能想到的是阅读、写作(或打字)和算术。除此之外,标准课程在很大程度上只是一份顺应当前潮流的任意列表,是每个人都被要求假装学习的科目。
思考英语写作、美国历史、代数、几何和生物学。高中课堂上教授的这些内容,对某些人来说非常有用,对更多人来说仅偶尔有用,而对许多人来说几乎完全无用。还有很多其他知识,比如统计学和经济学、烹饪和缝纫,同样可能有用,但恰巧没有被纳入标准课程。尽管几乎每位美国高中毕业生理论上都应该掌握了所有被教授的内容,但实际上许多人(可能是大多数人)并没有真正学会,几乎任何教过大学新生的人都能证明这一点。
以我妻子在弗吉尼亚理工学院教授非专业学生地质实验课的经历为例。相当一部分学生不知道长方体(一个假想的矿体)的体积是长度乘以高度乘以深度。这些学生来自弗吉尼亚州高中毕业生中排名前四分之一左右的群体,而且几乎所有人都学过几何。
第二个假设是,让孩子学习的方式应该是:告诉他们今天必须学习什么,布置一些阅读材料,然后让他们坐下来听老师讲课。这导致的一个结果是,孩子们大部分时间都在被迫接受他们毫无兴趣了解的事情。另一个结果是,考虑到兴趣和能力的多样性,教室里约三分之一的学生因为已经掌握了教学内容而感到厌烦,另外三分之一的学生因为完全跟不上进度而感到困惑,只有中间那三分之一的学生,如果运气好的话,才真正在专心听讲、理解和学习。这有助于解释为什么那些选择在家教育子女的父母经常反馈说,他们能够在学校教学所需时间的三分之一内,教授相同的内容。一位足够优秀的教师可以在一定程度上改善这种情况,但这样的优秀教师却十分稀缺。
这种教育模式的一个后果是,许多孩子在成长过程中将教育视为一种应该尽可能避免的不愉快任务。另一个后果是,学校花费六年时间教授诸如算术这类知识,而如果一个普通孩子真正想学,他可能在一年内就能完全掌握。第三个后果是,我们最终培养出许多高中毕业生,其中可能大多数人实际上并不真正掌握他们花了那么多年假装学习的知识。正如所有学生和大多数教师都心知肚明的那样,强迫一个人学习他毫无兴趣的内容,通常的结果是他为了通过期末考试而勉强记住必要的内容,然后在考试结束后尽可能快地将其抛诸脑后。
与此相对的一面,也是父母们常常注意到的现象是,孩子们能够为自己感兴趣的事物投入惊人的精力和专注力——无论是龙与地下城的游戏规则、电视剧的剧情细节,还是过去十年顶尖棒球选手的打击率。很久以前,我们给孩子们买了装有宝可梦游戏卡的Game Boy。差不多同一时期,我听到一位女士在广播谈话节目中宣称,孩子们拿到高科技玩具后只会玩半小时左右,然后就将其束之高阁。而据我估计,比尔和贝卡在接下来的许多月里,每月在这些游戏上花费了约八十小时,甚至更多——这比我在同龄时期投入到所有学校功课中的时间和精力都要多得多,并且在之后的几年里,他们仍然持续以较低频率玩这款游戏。他们所学习的技能——如何在宝可梦世界中找到自己的方向并完成目标——从某种意义上说是「无用的」,因为那个世界纯属虚构。但是,能够在陌生环境中找到方向并完成任务,这实际上是一项非常实用的能力。
教授错误的课程
在标准的学校教育模式中,由他人决定什么是真理,而你只需照单全收。在现实世界中按照这种方式生活是危险的,甚至在学校环境中也不完全安全:我们许多人都记得老师或教科书曾经将错误信息当作真相传授给我们的例子。[1] 更好的做法是,在条件允许的情况下,自己寻找信息并进行判断。
由于我们永远没有足够的时间去核实信息来源提供的所有内容,我们需要培养一种能力——通过内部证据来评估信息来源的可靠性。你需要判断:一位作者是否真诚地尝试描述支持和反对其观点的各种论据,呈现证据及其局限性,面对并回应反对意见的最佳论点,还是试图用华丽辞藻迷惑读者?出于好奇或参与讨论而进行的网络研究,恰恰是锻炼这种能力的绝佳方式;由于互联网是一个没有筛选机制的平台,任何头脑清醒的人很快就会意识到,仅仅因为网上有人说了某事,充其量只能作为其真实性的微弱证据。而在传统教育模式中,学生面对教师和教科书这两大权威,除非遇到特别优秀的老师,否则他们被要求无条件地相信这些权威告诉他们的内容,这实际上是在反向削弱判断信息来源的能力。
我们为孩子选择的替代传统模式是「非学校教育」(unschooling),让孩子们自由掌控自己的时间,学习他们感兴趣的任何事物,而成人则提供建议——他们可以自由选择接受或忽略——以及必要的支持。我们将孩子置于拥有多种信息来源的环境中:网络访问、交流对象、图书馆访问等。如果他们将来发现自己的教育中缺少某些必要的内容,可以在需要时再学习,正如我们的孩子在决定某些科目有助于他们在SAT考试中取得好成绩以进入优质大学后所做的那样。这比试图学习所有可能有用的知识——而其中大部分他们永远不会用到——要高效得多。
我们选择那种教育策略主要基于我和妻子的亲身经历。我曾就读于一所一流的私立学校,就是后来奥巴马总统将自己的孩子送去的那所学校,而我妻子则就读于一所优质的郊区公立学校。我们俩都曾遇到过几位优秀的老师和精彩的课程,但我们最深刻的记忆却是大多数时间都感到无比乏味。在英语方面,我通过为乐趣而阅读吉卜林的诗歌,以及在暑假期间每天阅读一两本书(主要是阿加莎·克里斯蒂和她的同行作家的作品)所学到的知识,远超我在英语课堂上获得的收获。关于政治哲学,我通过与挚友的辩论获得的理解,也比我在社会科学课上学到的更为深入。我们相信,我们能为自己的孩子提供更优质的教育。
我有时将这个过程描述为:向孩子们投放各种书籍,观察哪些能引起他们的兴趣。
我们的经历
搬到加州后不久,我们听说当地有一所当年新开办的学校,采用萨德伯里模式的校内非学校教育,于是我们带女儿前去参观。她决定想在那里学习,所以我们为她办理了入学手续。几年后,我们的儿子也加入了这所学校。随后,当学校出现一些问题时,我们转向了家庭非学校教育模式。
在萨德伯里学校的非学校教育中,如果学生提出要求,学校也会开设课程。当我们的女儿大约十岁时,学校有一个数学班,学生年龄和能力各不相同,这个班持续了一年多。课程从假设学生只懂基本加法开始,最终进展到代数的初级阶段。这基本上就是他们所接受的全部正规教育,直到后来他们在我任教的大学选修了几门课程。[2]我们督促他们记忆乘法表,因为这些知识实用但学习过程枯燥;这是他们教育中最接近强制学习的部分。我们已经成年的女儿认为,就连这样的强制也是一个错误。
他们是如何接受教育的?他们都热爱阅读;虽然他们阅读的很多书籍是儿童读物,但他们很早就开始接触成人书籍了。当我们的女儿大约九岁时,我们在旅行中发现给她准备的书已经读完了,于是她便开始阅读她母亲带来的伊丽莎白·彼得斯(Elizabeth Peters)的书,这些是关于埃及考古学早期历史的小说。
贝蒂记得她曾经读过并从《如何用统计学撒谎》(How To Lie With Statistics)中获益良多,这是一本教人如何不被统计论证所迷惑的书,于是我们买了一本,两个孩子都很喜欢它。我们的儿子玩龙与地下城(D&D)和其他需要掷骰子的游戏,因此他对学习概率计算非常感兴趣。我们后来发现同一位作者和插画家还创作了《如何面对机会》(How to Take a Chance)这本关于基础概率理论的书;我们买来后,他反复阅读了多次。结果是,一个只有十一、二岁的孩子就能够计算出用三个六面骰子掷出6点或更低点数的概率。
多年来,他的爱好是创造游戏。在洛杉矶的一次世界科幻大会上,他与史蒂夫·杰克逊游戏公司的史蒂夫·杰克逊(Steve Jackson)就比尔发明的一款游戏进行了一次有趣而富有成效的交谈。虽然他未能实现十六岁前商业出版桌游的抱负,但他现在正努力成为一名小说作家。他尚未成功出版,但我已经做到了,而且他是比我更出色的小说家。
两个孩子都在网上花了大量时间。我们发现比尔是在家庭网络上玩联网游戏——《暗黑破坏神》或《暗黑破坏神II》(Diablo or Diablo II)——时自学了打字,当时我们的屏幕上开始出现拼写错误的单词。他学习打字是因为他玩在线游戏需要与人交流。后来他又想学习正确拼写,这样他在与人交流时就不会显得愚蠢。他的妹妹则在《魔兽世界》(World of Warcraft)上花了相当多的时间,其中一部分时间是用来撰写战斗报告和其他文章,并将它们发布在相关网站上。
我非常热爱诗歌,也熟知大量诗作。当女儿还很小的时候,我常用诗歌哄她入睡。后来有一次,我们晚上开车出行时,突然从后座传来一个稚嫩的声音:"Larth Porthena of Cluthium, by the nine gods he thwore"——这是《霍拉修斯在桥上》的开篇诗句,带着两岁孩子特有的口齿不清。如今,她已经掌握了更多的诗歌。而当我哄儿子入睡时——我和妻子会轮流担任这个角色——我们通常先闲聊一会儿,然后他就会要求听诗或故事。
我向女儿推荐并让她阅读了Duff Cooper所著的塔列朗精彩传记。[3]她注意到书中对塔列朗回忆录的引用,并认为这些回忆录会很有趣。于是我为她找到了一本英文译本。十年后的今天,她很高兴地能向我讲述塔列朗的理论——关于太阳王的错误如何为法国大革命埋下伏笔。
在我们孩子的教育中,除了阅读之外,交谈占据了最大的比重。我们在用餐时交谈,在哄他们其中一个入睡时交谈。我和女儿常在夜晚一起长时间散步,期间讨论我正在创作的小说或她在《魔兽世界》中扮演的角色。
当她大约十一岁时,她认真地决定自己对音乐很感兴趣,并希望学习竖琴。她开始上课,练习纯粹是因为她自己想练,而不是因为我们要求她这么做。在后来的岁月里,她定期参加两个合唱团的活动,一个在她母亲的教堂,另一个专注于早期音乐。她的两位网友是一对法裔加拿大夫妇;她认为既然他们学习了她的语言,她也应该学一门外语,不过她选择的不是法语,而是意大利语——这是她在接触早期音乐时喜欢上的语言。我任教的大学有一个青年学者项目,允许高中生在暑期参加大学课程,想必是为了吸引优秀的高中生。她先修了一个学季的意大利语,然后,因为她不需要去学校上课,在学年期间又继续了两个学季。她在这门课上投入的精力,在完全没有来自我们压力的情况下,超过了我在高中、大学或研究生阶段为任何课程所付出的努力,最终当她真正进入大学后,选择了意大利文学作为专业。
我很喜欢进化生物学,所以向女儿推荐了《自私的基因》。她很喜欢这本书,发现其方法很有趣,并阅读了这一主题的其他著作。她还旁听了我在法学院教授的几门课程,能够达到那些优等生的水平。
我们的孩子在结束相当于高中阶段的学习时,对标准课程中的一些内容仍然不甚了解——这一点其实与许多接受正规教育的学生无异。但我儿子从书籍和电脑游戏中学到的历史和地理知识,远超他在高中历史课上可能学到的内容,同时也避免了那个致命的教训:学习是枯燥乏味的工作,应该尽可能地避免。两个孩子在准备上大学前确实需要在数学方面补习一些内容,但他们小时候都把解决两个方程两个未知数且要求整数解这样的问题视为一种有趣的智力游戏。
家庭教育的父母面临的一个难题是如何让孩子成功进入大学。我们的女儿除了几门大学课程外,没有高中课程记录、教师推荐信或成绩单,因此需要另一种方式向大学证明她的能力。她花时间备考SAT,但比在传统学校学习这些科目所投入的时间少得多。她在语文部分表现极为出色,数学部分表现尚可;总分完全符合她所申请的那些极为严格的文理学院的录取分数范围。她还附上了一份读书清单——惊人的四百本书。圣奥拉夫学院不仅录取了她还提供了奖学金——尽管她最终选择了欧柏林,这可能是个错误决定——招生官后来告诉我们,正是这份令人瞠目的阅读量让他们叹为观止。
许多学校要求参加两项SAT II学科成就测试,这对家庭教育的学生尤为重要。让人欣慰的是,「文学」考试并非如我所担忧的那样测试你读过哪些书籍,而是测试你的阅读理解能力;虽然她阅读的书籍并非按照高中推荐书目选择,但她的阅读能力确实出众。作为第二个科目,她选择了美国历史,通读了保罗·约翰逊的《美国人民史》——这本书文笔优美且观点鲜明,因此并不枯燥——以及部分原始史料集。在考试前一周,她利用维基百科构建了一个关于历任总统及其任期内重大事件的思维时间线。两门考试的结果都相当令人满意。
她进入大学时,在经济学、进化生物学、音乐、文艺复兴舞蹈以及写作方面的知识已远超大多数同学,但在物理、生物和世界历史方面则不及一些人,除非这些领域恰好与她阅读过的历史小说或个人兴趣相关。她比大多数人更了解如何进行自我教育,以及为什么这么做很重要。当她喜爱的一门大学课程被取消时,她震惊地发现其他学生竟然为此感到高兴。
家庭教育学生的处境愈发艰难
我孩子们曾经用来进入大学的一条重要途径现在已经不复存在;2021年1月,大学理事会宣布将不再提供SAT科目考试。接受家庭教育的学生没有高中成绩单或教师推荐信,因此除非他们能够展示一些非凡成就,比如出版小说或赢得全国象棋冠军,否则他们主要依靠客观测试来说服学校录取他们。
大学理事会建议的替代方案是AP考试。然而,家庭教育学生要参加这些考试,必须找到愿意接纳他们的当地学校。在德克萨斯州等一些州,法律要求公立学校必须允许家庭教育学生参加这些考试,而在其他州,学校则没有这样的义务,有时甚至会拒绝这些学生参加考试。
即使学生能够安排参加考试,仍然面临一个问题。AP考试的分数范围是一到五分,而SAT考试的分数范围是二百到八百分。数据显示,仅有1%的学生在文学SAT考试中获得800分满分,而有9.3%的学生在英语语言与文学AP考试中获得5分。同样,只有3%的学生在美国历史SAT考试中获得800分,而有13%的学生在美国历史AP考试中获得5分。显然,在任何一门科目中获得SAT满分800分,比在相应AP考试中获得5分能更有力地证明学生的知识水平。
根据2018年的一份报告,当时的精英院校期望申请者获得700多分的高段成绩。在文学SAT考试中,750分处于第91百分位;在美国历史考试中,该分数处于第83百分位。在任一AP考试中获得5分只能表明你刚刚达到这些学校期望的分数区间,可能处于其下限,因此这只能作为学校录取你的弱证据。对于能通过其他方式证明自己能力的申请者来说,这可能不是问题;但家庭教育的学生大多没有这些其他途径。要说服学校录取他们,他们能提供的证据必须非常有力。从SAT科目考试转向AP考试使这一点变得不可能——无论学生多么优秀,他能获得的最高分数也仅限于5分。
情况正在变得愈发严峻。近年来,许多学校已不再要求学生提供SAT或ACT考试成绩。截至2021年,美国约四分之三的本科院校已取消考试成绩要求,某些学校,包括加州大学系统的所有院校,甚至采取了「考试盲视」政策,完全拒绝考虑任何考试成绩。我推测这一变革的真正动机是为了使歧视性录取政策不那么明显,让批评者难以证明学校在偏袒黑人学生的同时歧视亚裔学生——这本是加州大学理论上被禁止的行为。然而,这一政策也使接受家庭教育的学生更难以证明自己的学术能力和资质。
关于这个主题的第二篇文章
[1] 我常用的例子来自我在一所优质私立学校的亲身经历,涉及一个简单的物理学问题。驾驶教育教科书宣称,两辆车各以每小时五十英里的速度正面相撞,对每辆车的冲击相当于以每小时一百英里的速度撞上一堵砖墙。我判断这不可能是正确的,并提出了证明——如果在两辆车之间精确悬挂一张布,由于对称性,这两辆完全相同的车都无法穿过它,这张布就如同一堵纹丝不动的墙。
值得赞赏的是,驾驶教育老师坦言他不知道这是否正确,他只知道书上是这么说的,所以我们决定向物理老师请教——但这位物理老师却坚称教科书是正确的。他没有对我的证明提出任何反驳,仅仅以自己是老师所以他就是对的这一权威为由。我一直遗憾的是,没能在我获得物理学博士学位后偶遇他,那样我就可以告诉他,按照他自己的权威论证标准,现在他应该是错的了。
[2] 他们申请的大多数学校不知道如何评估接受家庭教育的学生,因此希望在录取过程中能看到来自某处的成绩评定。
[3] 我之所以阅读这本书,是因为我是在吉卜林的一篇短篇小说中,而非在历史课上首次接触到塔列朗这个人物。
[4] 所有数据均来源于截至2021年末可获得的信息。
非学校教育:2
原文:Unschooling: 2 - David Friedman’s Substack
也谈在家上学
2023 年 2 月 16 日
当我们与他人探讨我们的教育方法时,常常会引发各种各样的问题。非学校教育(可以在家中或在合适的学校环境中实施)会带来一系列议题,而在家上学则引发另一系列问题;而我们家同时采用了这两种方式。在我的博客上讨论这个话题的一个好处是,我不仅收到了很多有价值的问题,还从其他评论者那里得到了精彩的解答。
非学校教育
在我关于非学校教育的文章评论中,有人提出孩子们必须学会有时候需要做自己不喜欢的事情。为了教会这一点,传统教育会给他们布置他们不感兴趣的作业,然后用成绩作为奖励。如果成绩的激励效果不够,有些父母甚至会用金钱奖励好成绩。这种方法忽略了努力与成果之间的因果联系。从孩子的角度看,是别人要求你做不愉快的工作,也是别人因此给予你奖励,但两者之间并没有明显的逻辑关系。据孩子所知,做作业并不会真正产生金钱。
替代方案是让现实世界来教授这一课。如果你不调整你的竖琴,演奏时它就不会发出悦耳的声音。如果你不偶尔整理房间,你就会找不到想要的东西。如果你不时地做一些弟弟想让你做的事,他也不会配合做你想让他做的事。这同样教会了孩子获得想要的东西有时需要做不那么喜欢的事情的道理,而且还建立了正确的因果关系。
对于有评论者提到的工作技能,比如准时到场,情况也是类似的。现实世界,即使是儿童的现实世界,同样提供了这方面的训练。当我儿子主持龙与地下城(D&D)游戏时,他必须在每周玩家到来时准备好当周的冒险内容。当我女儿参与《魔兽世界》公会定期组织的团队副本时,她必须在副本开始时准时在线。
另一个被提出的担忧是,正如一位评论者所说:「如果孩子对学习毫无兴趣,又没有人督促他学习,他就永远不会学到东西。」
对此,有一位评论者回应道:
「孩子对某些事物产生兴趣的可能性,远远大于他恰好对学校今天安排他学习的特定内容感兴趣的可能性。」
学生可能不如课程设计师清楚自己需要学习什么,但他对自己想学什么了解得多得多。对于需要系统呈现的知识,书籍是很好的资源;任何学科最好的书籍,都是由比设计高中课程的人知识更渊博的专家所著。
人们担心孩子们可能把所有时间都花在电子游戏或与朋友聊天上,永远不会学到任何东西。这与我们的经验不符——不过人与人之间差异很大,我们的样本也远非随机。孩子们之所以可能有这种行为,一个原因是他们在学校已经形成了「上学很无聊,应该尽量避免」的态度。这正是我女儿在欧柏林学院的同学们所表现的态度,他们对当天有一节课被取消感到十分高兴。了解非学校教育对那些先在传统学校度过几年的孩子是更有效还是更无效,将会是一个很有意思的问题。
也有可能我们只是在孩子教育上格外幸运。
在家上学
人们普遍担忧,接受在家上学的孩子会失去在学校与其他孩子互动所能培养的社交能力。这种情况确实可能发生——大约六十年前我遇到的首批接受在家上学的孩子在社交上显得笨拙,我至今认识的那位仍然如此。不过,我自己并非接受在家上学——有趣的是,一位网友告诉我们,她愿意与我和妻子共进午餐,就是因为想见见能够忍受我的那位女士。而我妻子,同样不是接受在家上学的,直到研究生阶段才有了人生第一次约会。[1]
传统学校的社交教育发生在一个所有人年龄相仿、学习几乎相同课程、彼此在社交和学业上直接竞争的环境中。这与真实社会的情况大相径庭。正如有人一针见血地指出:
「我们的公立学校系统确实相当特殊,从社交角度看极为不自然,仿佛有人读了《蝇王》这本描述孩子们残酷社会的小说,却把它当作了教育指南而非现实警示。」[2]
一位观察他人在家上学孩子的人这样描述:
「看到二十几个接受在家上学的孩子聚在一起游戏和社交实在是一道独特的风景。简而言之,在极少需要成人监督的情况下,与同等规模的普通学校孩子相比,他们制造的麻烦少得惊人。」
我博客上的一位评论者分享了他在家上学孩子的经历,这些孩子的社交活动比我们家的——甚至比我年轻时要丰富许多:
「仅本周,我9岁的儿子就安排了这些外出活动:在当地健身房参加两次各1小时的体育课(与8至12岁的孩子一起)、一场地理知识竞赛、一个制作姜饼屋的派对、一个下午的保龄球活动(与6至14岁的孩子一起),以及一次湖上巡游,观赏秃鹰捕食红鲑鱼的壮观场景。下周他还有更多体育课、与其他四年级学生的游戏日以及一个圣诞派对。这还不包括他与邻居朋友、家人和社区人士相处的时间。」
正如另一位进行在家上学的家长在我博客上分享的:
「我的孩子们日常生活中经常与各种成年人接触——在杂货店、上门服务的技术人员、汽车修理工等等。他们并非被局限在一个房间里,只能与同样不擅长表达的同龄人相处。我的孩子们的语言能力常常令成年人惊叹不已。再次强调,这并非因为他们特别聪明,而是因为他们所处的环境使这成为可能并且鼓励这种发展。」
当我们的女儿上大学后,她发现自己与教职员工交流比与同学交流要自如得多,考虑到她成长过程中大部分互动对象都是成年人,这一点并不令人惊讶。
实施难度如何?
在家上学是否必须要有一位全职在家的父母?我们家是这样做的——我妻子在我们有第一个孩子之前就辞去工作,成为全职妻子和母亲。但国家教育统计中心的数据显示,截至2016年,仅有55%的接受在家上学的孩子来自只有一方工作的双亲家庭,而11%来自单亲家庭。[3]我博客上的一位评论者描述了其他可行方式:
「我认识一些单身父母,例如,他们在孩子年幼时与其他家庭互换照顾孩子和接送孩子参加活动的责任,并相应调整自己的工作时间。一位单身大学教授在她上课时支付托儿费用,并在办公时间和其他场合带上她行为良好的孩子们。一位理发师用理发服务和数学辅导交换她工作时间的托儿服务。还有一对夫妻,丈夫是消防员,妻子是社工,他们安排轮班在不同的日子,确保家中始终有一位成年人在场,而且他们通常每周还有两天可以全家共度。」
「随着孩子们长大,情况会变得更加容易,因为他们不再需要持续的看护,并且能够在一天中的部分时间自行照顾自己。接受在家上学的孩子通常也有许多在家外参加的活动,而在那些时间照顾他们可能只是需要安排与其他家庭共乘的问题。」
青少年,自然而然地,通常会变得非常独立。那些接受非学校教育的青少年习惯于自己决定如何利用未被安排的时间,不需要有人整天指导他们。据我所知,这些青少年无一例外都非常忙碌。
非学校教育是全天候、每一天都在进行的,而帮助家庭生活满足每个成员需求是这种教育的核心组成部分。家庭学校教育,即在家中进行的学校式教育,则可以在任何适合特定家庭的时间进行。
家庭学校教育表面上看可能会占用父母大量时间,但实际上不一定如此。根据我们的经验,所需的成人时间主要是晚餐时的交谈,哄孩子上床睡觉,以及与孩子一起活动——这些大多是即便没有在家上学我们也会做的事情。我们孩子教育的其余部分包括阅读书籍,玩教育类电脑游戏,浏览网页,这些都不需要父母参与;如果我们试图遵循一个模仿传统学校的课程,可能反而会占用我们更多的时间。确实,当他们年幼时,需要一个成人在家,即使在其他孩子上学的时间,这有时候是一种负担。我妻子做了大量接送孩子的工作,去图书馆或者送我女儿上竖琴课,但我猜想,孩子上学的父母也同样需要做这些事。
而且,家庭学校教育对学生时间的消耗要小得多。我和我妻子都曾在课堂上浪费了数千小时而没有真正学到东西。我们的孩子则避免了这种浪费。
关于在家上学常被提出的第二个质疑是,实施在家上学的父母必须具备足够的教育水平,才能在不仅一个而是所有学科中担任教师角色。但实际上,大多数孩子需要学习的基本技能是阅读、书写和算术,这些都是大多数成年人能够胜任的。孩子们自然会想学习,也应该学习其他知识,但并非特定的其他知识——他们的教育很大程度上可以包括学习父母恰好掌握的任何知识。我们的孩子最终比同龄人掌握了更多关于经济学(我的专业领域)的知识,而且,至少就我女儿而言,在音乐方面(我妻子的兴趣之一)也是如此。
除此之外,还有书籍、像可汗学院这样的免费在线课程,以及孩子们可以从朋友那里学到的知识。年龄大一点的孩子可以去社区大学上课。如果孩子非常想学某样东西,而又没有其他学习途径,父母可以付费聘请老师,就像我们为女儿的竖琴课所做的那样。
还有其他学习方式,并非所有都需要花钱:
「当我儿子想从零开始组装一台复杂的电脑(我不是指沃尔玛那种即插即用型)——这远超出了我的技术能力范围——我们只是去询问了一家电脑销售/维修店。店主非常乐意用他的专业知识换取一个「学徒」在店里提供的一些帮助。我至今对电脑仍然一窍不通,但我儿子已经技术精湛,是一名出色的数学学生,而且实际上正在考虑攻读计算机工程学位。」
「我儿子通过书本、电脑实验和与其他技术爱好者孩子一起工作,学会了HTML和游戏编程(使用现有软件)。随后他在社区大学修读了网络和其他技术课程,取得了很大成功。那里的教师对我们的儿子给予了额外的指导,对此我们非常感激。」
「我的孩子们参加了由一位实施在家上学的父亲(同时也是工程师)运营的工程俱乐部,他们还参加了在在家上学合作社开展的一个很棒的科学项目(JASON)。」
诸如此类。
非传统教育和在家上学并不意味着把孩子藏在家里。"世界就是你的课堂。"随着我的孩子们渐渐长大,我的角色转变为引导者——帮助他们探索如何获取实现目标所需的教育或经验。作为成年人,我在如何建立人脉网络方面拥有更丰富的经验和知识,但相信我,当他们成为高年级青少年时,他们已经非常清楚,无论想做什么或需要学习什么,总有人能够提供帮助,不论是通过正式还是非正式的途径。而且,他们开始越来越多地自己处理这些安排——这是人们在列举在家上学优势时常被忽视的一点——这不仅有助于培养主动性,还让父母有机会示范如何在现实世界中高效、实用地工作。
我经常遇到在家上学的父母,他们能找到创新方法为孩子提供各种技术和专业教育。通常那些将学校模式视为教育默认选择的人难以进行真正"跳出框架"的思考。然而,习惯于在非主流环境中茁壮成长的在家上学者,非常擅长寻找独特而有效的方式来满足孩子的个性化需求,从而出色地培养他们成为社区中富有生产力和贡献的成员。
谁在实行在家上学?
许多人对在家上学的敌意源于这样一种信念:实施在家上学的父母是未受教育的基督教原教旨主义者,试图让他们的孩子对进化论和性教育一无所知。然而,这种看法与NCES调查数据不符。[4] 根据2015-16年的数据,只有16%的在家上学父母将「希望提供宗教指导」作为选择在家上学的最主要原因,这一比例甚至略低于选择「对其他学校的学术教育不满意」的17%。最常见的原因是「担忧其他学校的环境问题,如安全隐患、毒品或负面同伴压力」,占比34%。至于在家上学父母的教育背景,30%拥有学士学位,另有15%拥有研究生或专业学位。而对于孩子在公立或私立学校就读的父母,这一数据几乎相同:27%拥有学士学位,17%拥有研究生或专业学位。
这些发现对我来说并不特别令人惊讶。我自己是一位拥有博士学位的无神论者,而我的妻子则是拥有硕士学位的主流基督教徒。我所认识的第一个实行在家上学的家庭,大约六十年前,有两个男孩。当我认识他们时,一个是美国21岁以下象棋冠军,另一个是14岁以下象棋冠军。
当然,我并不是暗示这些案例也具有普遍代表性。
[1] 与我一起。
[2] Jehu在Robin Hanson的博客上解释为什么他发现接受在家上学的孩子比公立学校的孩子更讨人喜欢
[3] https://nces.ed.gov/programs/digest/d18/tables/dt18_206.10.asp
[4] https://nces.ed.gov/nhes/homeschooling.asp. https://nces.ed.gov/pubs2017/2017102.pdf 表8提供关于在家上学原因的信息,表7是关于在家上学父母的教育水平。
使用抽认卡,成为更优秀的程序员:第一部分
原文:Using flash cards to become a better programmer, Part 1 (sasha.wtf)
SASHA - 2015 年 11 月 1 日
等等,你说啥?
抽认卡能让你成为更好的程序员?编程可是一项复杂且精密的技能,而抽认卡是用于复习底层且原子化的信息!
说的对!如果只有抽认卡的话,那你永远不会成为一名优秀的程序员。然而,编程也是由底层技能组成的,例如记住六个月未使用的函数方法名称、可能会产生小 bug 的代码、以及需要的数据结构的模块名......
在编程的时候,你有多少次在谷歌上搜索某个问题的答案时,看到的却是紫色链接?(译注:即已点击过的链接。)**如果你只用一次就能永久记住,那岂不是很酷?**将这些信息挂在嘴边可以从根本上加快你的速度,解放你的大脑,腾出时间进行更高层次的思考。 通过这个方法你可以学习了其它技能,比如键盘盲打!如果你记住了所有按键的位置,你就可以专注于给你的宝贝发邮件、写情书。如果你在小学时记住了乘法表,你就可以专注于代数学习。 还有如果你记住了所有的那些西语词汇,你就可以在没有字典的情况下在马德里尽情游玩。
不过我的记性很好。我记得住很多事情!
确实,可你的大脑也是肉做的。它受制于人类生物学规律,因此会遗忘事情。而且你的知识用得越少,忘记它的速度就越快。
下图显示了你遗忘信息的速率。看看只在正确的时间复习会如何帮助减缓你的遗忘速度?它有 90% 的几率使你成功记住。在正确的时间,即在你的遗忘曲线下降到过低之前,向你展示正确的事实——这种记忆方式被称为间隔重复。
图片来源于 sivers.org/srs
如果你一直在用一个工具集辅助工作,那么这对你来说不是什么大问题,因为重复和练习已经融入了你的工作。我的工作要求我定期使用 10 - 15 种不同的语言和工具,但不频繁。有时候我会接连几个月不使用一种语言。
如果你对所有用过的东西都了如指掌,那岂不是很酷?如果你不需要热身时间,你不需要每次通过谷歌找答案,你的效率可以提升多少?
玩过块魂吗?你是游戏中的绿色小王子,头顶丸子状,推着一个黏糊糊的球。你的目标是把你能看见的物品全都卷起来,使你的黏球越滚越大。你将从只能卷起图钉开始,到最终可以卷起牛和房子。
我们希望你的大脑也可以成为那个球。
这真的做得到吗?
我第一次产生这个想法是在阅读 Jack Kinsella 的博文时。当时我觉得这么做非常有意思,我就尝试了几次,但都没有坚持下来。我没办法持之以恒地制作或复习卡片。在我复习卡片的时候,我会意识到很多的卡片我都看不懂,或者难以回答。这很令人沮丧,我从来没有获得过显著效果,所以很快就放弃了。
今年夏天,我正式成为了信徒,这一切都归功于陪审团制度。我被选中参加为期两周的陪审团(没有办法摆脱它)。当时我还在准备开始一个客户项目,我需要使用 Pandas,那是我第一次用这个库。但是我突然被分配在一个没有窗户的房间里,被要求待在那一整天。那里没有 wifi,也没有手机信号,每天都要去。由于无法连接到项目需要的数据库,该项目被我搁置了。
通常情况下,离开一个全新的工具两周意味着我将需要浪费一周的时间来回顾,我需要重新查找每一个新方法或属性。但是因为我制作了卡片,并在听证会期间进行了复习,所以我回来的第一天就可以开始工作了。对我来说它产生了巨大的影响!
我还注意到在使用非新工具方面的差异。在编写 SQL、Python、awk、bash 和数据科学家工具包中的所有其他工具方面,我可以表现得更快、更流畅。我写的 bug 更少了,浪费在查找资料的时间也更少了。感觉像是获取了超能力!
这也很有趣,因为我已经这样做了足够长的时间,以至于有些卡已经太老了,它们会经常把我难住。这意味着在曾经的某一时刻我知道这条信息!如果没有这张卡的存在,我会完全忘记它!但是因为它在我的套牌中,只需要快速回顾一下,它就可以回到我的脑海中。
这听起来很牛逼,该如何开始呢?
我正在撰写本系列的第二篇文章,其中介绍了我用过的所有工具和心得,它们帮助我克服困难,并真正养成日常习惯。
同时,你可以去阅读 Jack Kinsella's 博客文章,我第一次得知这种方法就是在这篇文章里。 Derek Sivers 也写过这方面的文章,并包含许多示例。我发现这些都不足以真正使我养成可持续的习惯,因此我将在下一篇文章中重点介绍这一点。
你还可以找到我用过的免费抽认卡软件 Anki。它会记录卡片何时需要复习以提醒你进行最佳学习,特别好用。不过要小心,因为它包含很多花里胡哨的东西,而且有点难以弄清楚。在我的文章中,我将向你展示哪些功能最重要,以及哪些功能可以忽略,所以不要被吓跑。
直到下一次,记录下你曾经需要停下来查找,而现在可以直接回忆起的信息所节省的全部时间。你可能会感到惊讶!
感谢 Nick Ward、Dan Bentley、Ricardo Vidal、Julia Evans、Allison Kaptur 和 Erik Osheim 阅读了这篇文章的草稿。
科学的学习方法综述:哪些行之有效,哪些徒劳无功
部分学习技巧能够显著加速学习,而另一些则纯属浪费时间——但究竟孰优孰劣?一项史无前例的综述研究为我们绘制了通往知识的最佳路径图。
作者:JOHN DUNLOSKY, KATHERINE A. RAWSON, ELIZABETH J. MARSH, MITCHELL J. NATHAN AND DANIEL T. WILLINGHAM
插图:CELIA JOHNSON
教育通常侧重于学习的内容,如代数、元素周期表或动词变位等。然而,学习如何学习同样至关重要,其益处可以受用终身。掌握正确的学习方法不仅能帮助你更快、更高效地获取知识,还能让你将所学内容牢记数年之久,而非仅仅数日。
在过去的 100 多年里,认知和教育心理学家们已经开发并评估了众多学习技巧,涵盖从重复阅读到总结归纳,再到自我测试等各种方法。研究表明,一些常用策略能够显著提升学生的学习成绩,而其他方法则既耗时又无效。遗憾的是,这些宝贵的研究成果并未真正走进课堂。当今的教师们往往不了解哪些学习技巧已得到实验证据的支持,学生们也没有被教导如何运用那些行之有效的方法。更令人担忧的是,学生最常用的两种学习辅助手段实际上几乎无效,其中一种甚至可能适得其反,阻碍学习进步。
造成这种情况的一个可能的原因是,浩如烟海的研究成果令人望而生畏,教育工作者和学生难以从中筛选出最实用、最有效的学习方法。为了应对这一挑战,我们全面梳理了 10 种常用学习技巧,深入研究了 700 多篇相关的科学论文。我们重点关注那些看似简单易行又普遍有效的学习策略,同时也仔细考察了几种在学生中广受欢迎的方法。
要想获得我们的推荐,一种学习技巧必须满足以下条件:适用于各种学习情境,无论是独立学习还是小组学习;能够帮助不同年龄、不同能力水平、不同知识背景的学习者;并且已在课堂或其他真实环境中得到实证。学习者应该能够运用这种方法来掌握各类学科知识,而且无论采用何种测试方式,都能够提高学习成效。最理想的学习方法还应该能够带来知识储备和理解能力的长期提升。
根据这些标准,我们筛选出了两种最为有效的学习技巧。这两种技巧不仅能产生显著且持久的效果,而且适用范围广泛。另外三种技巧我们有条件地推荐。剩下的五种技巧——包括两种广受学生欢迎的学习辅助工具——我们不建议使用,原因是它们要么只适用于特定情况,要么缺乏足够的实证支持。我们鼓励研究人员进一步探索一些尚未充分验证的技巧,但同时也提醒学生和教师应谨慎使用这些方法。
快速解读:最佳学习方法评估
1》某些学习方法适用于多种场景和不同学科,能够提高考试成绩并增强长期记忆能力。学会如何学习可以受益终身。
2》自我测试和分散学习——即所谓的分散练习(间隔重复)——是提高学习效果的绝佳方式。这些方法高效、简单易行且效果显著。
3》划重点和重复阅读是许多学生常用的两种方法,但实际上效果不佳,而且可能会耗费大量时间。
4》其他一些学习技巧还需要进一步的测试和评估。在此期间,学生和教师可以在课堂和家庭学习中应用那些已经得到证实的有效学习方法。
金牌得主
1. 自我测试:自我测验成效显著
工作原理:自我测试与评估知识的常规考试不同,它是学生在课余时间自主进行的练习。具体方法可能包括使用实体抽认卡(比如莱特纳盒)或数字抽认卡(比如 Anki)来测试记忆力,或者回答教科书章节末尾的练习题。尽管大多数学生都希望尽量少参加考试,但大量研究结果表明,自我测试能够显著提高学习效果和知识保留率。
一项研究要求大学生记忆一组单词对,随后对其中一半进行了回忆测试。一周后,学生们能够记住 35% 被测试过的单词对,而未经测试的单词对仅记住了 4%。另一项实验中,大学生学习斯瓦希里语-英语单词对,随后进行练习测试或复习。结果显示,反复测试过的内容回忆率高达 80%,而仅仅重新学习过的内容回忆率只有 36%。一种理论认为,练习测试能够触发对长期记忆的搜索过程,激活相关信息,形成多重记忆通路,从而使信息更易于提取。
适用情况:练习测试适用于各个年龄段的学习者,从学龄前儿童到医学院四年级学生,甚至中年人都能从中受益。它可以用于学习各种事实性知识,包括外语词汇、拼写列表和记忆植物结构等。研究还发现,这种方法甚至能够改善阿尔茨海默病患者的记忆力。短小而频繁的测试效果最佳,尤其是当学习者能够获得正确答案的反馈时。
值得注意的是,即便练习测试的形式与实际考试不同,它仍然能够发挥效果。更可喜的是,这种方法的积极影响可能持续数月乃至数年——考虑到持久学习的重要性,这无疑是个好消息。
是否实用:是的。它只需要适度的时间投入,几乎不需要特殊训练就能开始使用。
使用方法:学生可以使用抽认卡进行自我测试,或采用康奈尔笔记系统:在课堂记笔记时,在页面一侧划出一栏,用于记录关键术语或问题。之后,可以通过遮住主要笔记内容,尝试回答边栏中的问题(或解释关键词)来测试自己。
评估:实用性高。练习测试在多种形式、内容、学习者年龄和记忆保持间隔方面都显示出显著的效果。
2. 分散练习(又名间隔重复):为取得最佳效果,请将学习分散开来
工作原理:学生常常采用「集中」学习的方式——也就是我们常说的「临时抱佛脚」。然而,将学习分散开来的效果要好得多。在一项经典实验中,研究者让学生学习西班牙单词的英语对应词,然后在六次课程中进行复习。实验分为三组:一组连续进行复习,一组每天复习一次,还有一组每隔 30 天复习一次。结果显示,30 天间隔组的学生记忆效果最好。在对 254 项研究、涉及 14,000 多名参与者的分析中发现,采用分散学习的学生回忆率更高(总体得分 47%),而集中学习的学生回忆率较低(37%)。
适用情况:从 3 岁幼儿到大学生、老年人都能从分散练习中受益。这种方法不仅适用于学习外语词汇、单词定义,甚至对于掌握数学、音乐和外科手术等技能也十分有效。
是否实用:是的。尽管教科书通常会按主题将习题集中编排,但你完全可以自己打乱这种顺序,将不同类型的习题穿插练习。不过,这需要你提前做好规划,并且要克服学生普遍存在的拖延倾向。
使用方法:通常来说,间隔时间越长,学习效果越好。研究表明,相比于仅间隔一天,间隔 30 天的学习效果更为显著。另一项关于琐事记忆的网络研究发现,当学习间隔为目标记忆保持时间的 10% 到 20% 时,效果最佳。比如,如果你想记住某事 1 周,那么学习环节之间应该间隔 12 到 24 小时;如果想记住 5 年,则应该间隔 6 到 12 个月。虽然这些间隔看起来很长,但实际上你一直在潜移默化地保留所学信息,而且能够迅速重新掌握已经遗忘的部分。这种长间隔学习方法尤其适合牢固掌握那些构成高阶知识基础的基本概念。
评估:实用性高。分散练习法适用于不同年龄阶段的学习者,可应用于各类学习材料,即使在长期记忆中也能保持良好效果。这种方法简单易行,而且在多项实际课堂研究中都证明了其有效性。
亚军
尽管这些学习技巧展现出良好前景,但它们仍存在不足,主要原因是缺乏足够的证据支持其使用。某些技巧,如详细询问法和自我解释法,在实际教育环境中尚未得到充分评估。另一种被称为交错练习的新兴方法也才刚开始进行系统性研究。尽管如此,这些技巧展现出足够的潜力,使我们认为值得在接下来简要描述的情况中推荐使用。
3. 详细询问:唤醒内心的好奇宝宝
工作原理:人类与生俱来的好奇心驱使我们不断探索周遭的世界。大量研究表明,引导学生回答「为什么」类问题能显著促进学习效果。
这种被称为「详细询问」的技巧,要求学习者对事实进行解释,比如回答「为什么……是合理的?」或「为什么这是正确的?」举个例子,在一项实验中,学生们阅读「饥饿的人上了车」这样的句子。详细询问组的参与者需要解释原因,另一组则直接获得解释,如「饥饿的人上车是为了去餐馆」。还有一组仅仅阅读句子。当被要求回忆哪个人做了什么(「谁上了车?」)时,详细询问组的正确率高达 72%,而其他组仅为 37% 左右。
适用情况:当你在学习事实性信息时,尤其是当你对该主题已有一定了解的情况下。这种方法的效果会随着你的前置知识增加而提升;例如,德国学生在学习德国各州的知识时,比学习加拿大各省时,从详细询问法中获益更多。这可能是因为前置知识能让学生为事实的真实性提供更恰当的解释。
这种技巧的效果似乎在各个年龄段都很稳定,从小学四年级学生到大学本科生都适用。详细询问法明显提升了对事实的记忆,但它是否能增强理解力则不太确定,而且关于学习效果能持续多长时间,目前还没有确切的结论。
是否实用:是的。它只需要最少的培训,对时间的要求也很合理。在一项研究中,使用详细询问法的小组需要 32 分钟完成一项任务,而仅仅阅读的小组则需要 28 分钟。
评估:实用性适中。这种方法适用于广泛的主题,但对于比简单事实列表更复杂的材料,其效果可能会受限。对于缺乏相关先前知识的学习者,这种方法的益处可能也会有所减少。我们还需要更多的研究来确定详细询问法是否能够推广应用到各种不同的学习情境和信息类型中。
4. 自我解释:我是怎么知道的?
工作原理:自我解释法要求学生对所学内容进行解释,并通过一系列问题来反思自己的思考过程。例如,「这句话为你提供了什么新的信息?」以及「这些信息与你已知的内容有什么联系?」。这种方法类似于精细质询法,可以帮助学生将新信息与已有知识进行整合。
适用场景:自我解释法适用于各个教育阶段的学生,从幼儿园到大学都可以受益。它在多个领域都有应用,包括解决数学问题、逻辑推理题,理解叙事文本,甚至掌握国际象棋的残局策略。对于年龄较小的孩子,这种方法可以帮助他们学习基本概念,如数字或模式。研究表明,自我解释法能够全面提升学习能力,包括记忆力、理解力和问题解决能力,其效果范围之广令人印象深刻。然而,需要注意的是,目前大多数研究只观察了短期效果,我们还不清楚这种方法对于不同知识水平的人群是否能产生持久的影响。
是否实用:不清楚。从积极的方面来看,大多数学生只需要很少的指导就能掌握这种方法,几乎不需要特别的练习。尽管一项针对九年级学生的测试表明,如果没有适当的训练,一些学生可能会倾向于简单地复述内容,而不是真正地进行解释和思考。另外,一些研究指出这种方法可能会显著增加学习时间,范围在 30% 到 100% 之间。
评估:实用性适中。自我解释法适用于多个学科,适用年龄范围广泛,效果显著。然而,还需进一步研究来确定这种方法的长期效果,以及考虑到所需时间投入,是否物有所值。
5. 交错练习:融会贯通,触类旁通
工作原理:学生通常倾向于采用分块学习的方式,即在转向新的主题或问题类型之前,先完成一个主题或问题类型的学习。然而,近期研究表明,交错练习法更为有效。这种方法要求学生交替学习不同类型的信息或解决不同类型的问题。例如,在一项研究中,大学生学习计算四种不同几何形状的体积。在传统的分块练习中,学生需要先完成一种形状的所有问题,然后再转到下一种。而在交错练习中,不同形状的问题被穿插在一起。一周后的测试结果显示,采用交错练习法的小组准确率提高了 43%。交错练习法不仅使学生有机会练习选择正确的解题方法,还鼓励他们比较不同类型的问题。
适用情况:当不同类型的问题相似时,交错练习法特别有效,因为将它们并列可以更容易发现它们之间的差异。相比之下,当例题之间差异较大时,分块练习法——即连续完成同一类别的所有题目——可能更有效,因为这种方法能突出同类问题的共同特点。
交错练习的效果可能只体现在那些已经具备一定能力的人身上。对于不同类型的学习内容,其效果也呈现出不同的结果。在提高代数问题解决能力方面,交错练习显示出明显的优势;在一项训练医学生通过心电图诊断心脏疾病的研究中,也证实了其有效性。然而,两项关于外语词汇学习的研究却未能发现交错练习带来任何显著益处。尽管如此,考虑到许多学生在数学学习中面临的诸多困难,对于数学科目而言,交错练习仍可能是一种值得采用的有效学习策略。
是否实用:似乎是肯定的。有学习动力的学生即使没有特别指导,也能轻松运用交错练习的方法。教师同样可以在课堂上灵活采用这种技巧:首先介绍一种类型的问题(或主题),并进行集中练习;当引入下一个新问题时,就将它与之前学过的内容混合在一起进行练习。虽然这种方法可能比传统的集中练习方式略微耗时,但这种看似「放慢」的过程很可能是值得的,因为它反映了能够有效提升学习效果的认知过程。
评估:实用性适中。交错练习能够有效提高数学知识的学习效果和记忆保持,并能增强其他认知技能。然而,目前关于交错练习的研究文献相对有限,而且其中包含了相当数量的负面结果,这引发了一些值得关注的问题。这可能意味着该方法并非在所有情况下都能有效发挥作用,或者可能是由于使用方法不当所致——这些都是值得在未来研究中进一步深入探讨的重要课题。
什么没用
这些学习技巧被评为实用性低,原因在于它们要么效率低下,要么效果不佳,或者仅对某些类型的学习和短期记忆有益处。尽管大多数学生常用重复阅读和划重点的方法,但这些技巧并不能持续提高学习成效,反而会分散学生对更有效学习策略的注意力。下文将提到的其他方法则过于耗时。
划重点
学生普遍使用的方法包括在文本上划线、用荧光笔标记或采用其他形式的文字标注。这些方法虽然简单快捷,但对提高学习效果帮助甚微。在严格控制的研究中,无论是对美国空军基础训练人员、儿童、需要补习的学生,还是普通大学生,用荧光笔标记重点都未能显著提升学习效果。同样,划线的效果也不受文本长短和主题影响,无论学习对象是空气动力学、古希腊学校历史还是坦桑尼亚地理,这种方法都无法有效提高学习成效。
事实上,这在某些高级认知任务中甚至可能产生负面影响。例如,一项针对教育专业学生的研究发现,使用下划线反而降低了他们从历史教科书中进行推理的能力。研究者推测,这可能是因为下划线过于强调个别信息点,而忽视了不同信息之间的关联性,从而影响了学生对知识的整体把握和深层理解。
替代方法:单纯地划重点或加下划线的作用有限,除非你能将标记的内容制成抽认卡或用于自我测试。考虑到学生们很可能会继续使用这种普遍的学习技巧,今后的研究应该着重教导学生如何更有效地划重点——这意味着要更有选择性地划(大多数大学生往往划得过多),并将标记的信息用于更有效的学习方法。
重复阅读
在一项针对某著名大学本科生的调查中,84% 的学生表示他们在学习时会重复阅读教科书或笔记。这种方法不需要特别训练,时间投入适中,在一些回忆性和填空式测试中也显示出一定效果。
然而,关于重复阅读是否能真正增进理解力,证据并不确凿。它的效果是否取决于知识水平或能力,这方面的研究也严重不足。重复阅读的大部分益处似乎来自第二次阅读,再多次重复的效果就会递减。有趣的是,尽管这是学生们最常报告使用的学习策略,却没有任何实验研究使用实际课程材料来评估它的效果。
替代方法:不要浪费时间在重复阅读上——在直接比较中,重复阅读的效果远不如更主动的学习策略,如详细询问、自我解释和练习测试。
其他
我们的评估还发现,另外三种较为冷门的学习方法效果也不尽如人意。「文本想象法」需要更多的实证支持才能被推荐使用,而「总结法」和「关键词记忆法」则似乎既无效又耗时。
总结法要求学生提炼文本的主要观点,剔除次要信息。然而,由于这种方法的实施方式多种多样,很难对其有效性做出定论。目前尚不清楚是总结文本的小部分更有效,还是概括大段内容更有益,也不知道材料的长度、可读性或结构是否会影响学习效果。
关键词记忆法利用想象力来增强记忆。例如,学习法语单词「la dent」(牙齿)的学生可能会联想到发音相似的英语单词「dentist」(牙医),在脑海中形成一个牙医手持大臼齿的画面。这种方法确实似乎对学习外语词汇、单词定义和医学术语有所帮助,但其效果是否能够持久尚未得到证实。最终,创造关键词所需的努力可能并不是一种高效的时间利用方式。
另一种运用心理图像的技巧是文本想象法,这种方法要求学生为阅读的每一段内容创建相应的心理图像。研究结果显示,这种方法的效果参差不齐,而且尚未证明其效果能够长期保持。教师可以考虑指导学生在阅读易于联想图像的文本时尝试使用这种方法,但仍需要进一步的研究来证明其实用性。
我们学到了什么
为什么学生们不采用更有效的学习技巧?问题似乎在于他们没有接受过最佳学习策略的指导,这很可能是因为教师们自身也未曾在学校中学到过。我们对六本教育心理学教材进行了调查,发现只有「关键词记忆法」这一技巧在所有书中都有涉及。而对于各种学习方法的具体应用、效果和局限性,这些教材都缺乏深入的阐述和指导。
另一个潜在的问题可能源于教育系统本身。目前的教育更侧重于培养学生的批判性思维能力和知识储备,而较少关注如何教会学生学习。这可能导致一些在早期学习阶段表现出色的学生,在学习受到密切监督的情况下做得很好,但一旦到了高中或大学需要自主管理学习时,反而会遇到困难。
关于学习技巧的最佳应用年龄以及强化训练的频率等问题,学界仍需深入研究。然而,教师现在就可以将这些行之有效的方法融入日常教学中,引导学生主动采用。例如,在开始新的学习单元时,教师可以先安排一次针对上一单元重要知识点的测试练习,并及时给予反馈。学生则可以将新旧知识点交错学习,以加深理解。教师还可以在多次课程中重复讲解核心概念,充分利用分散练习(间隔重复)的优势。此外,通过引导学生思考新知识与已有认知的联系,以及探讨其合理性,可以培养学生的解释性提问能力。
需要指出的是,这些学习技巧并非万能良方,只有那些具备学习动力且善于运用的学生才能真正受益。尽管如此,我们有理由相信,这些方法能够有效提升学生的课堂表现、考试成绩,乃至终身学习能力。
延伸阅读
Ten Benefits of Testing and Their Applications to Educational Practice. H. L. Roediger III, A. L. Putnam and M. A. Smith in Psychology of Learning and Motivation, Vol. 55: Cognition in Education. Edited by Jose P. Mestre and Brian H. Ross. Academic Press, 2011.
Interleaving Helps Students Distinguish among Similar Concepts. D. Rohrer in Educational Psychology Review, Vol. 24, No. 3, pages 355-367; September 2012.
Using Spacing to Enhance Diverse Forms of Learning: Review of Recent Research and Implications for Instruction. S. K. Carpenter, N. J. Cepeda, D. Rohrer, S.H.K. Kang and H. Pashler, ibid., pages 369-378.
When Is Practice Testing Most Effective for Improving the Durability and Efficiency of Student Learning? K. A. Rawson and J. Dunlosky, ibid., pages 419-435.
为什么当代科学家都如此平庸乏味?浅析科学如何以牺牲智力与创造力为代价筛选毅力与合群
摘要
问题:为何众多当代顶尖科学家如此平庸乏味,且缺少科研雄心?
回答:当今科学界的选拔机制正在无情地将富有想象力和独特思维的人才排除在外。从教育到培训再到职业发展的各个阶段,人们往往更青睐那些循规蹈矩、讨人喜欢的个体,而忽视了真正聪明且具有创造力的人才。科研训练周期的不断延长,加上科研人员独立性的逐渐削弱,正在逐步淘汰那些立志于开展「革命性」科学研究的人才。相反,那些勤勉努力、善于社交的个体因为更适合从事渐进式的「常规」科学研究而备受青睐。毫无疑问,高智商(IQ)是进行革命性科学研究的必要条件。然而,我们不能忽视一个事实:教育成就不仅取决于智力,还与个人的尽责性密切相关。有趣的是,这两项特质之间并不存在强相关性。因此,那些致力于培养潜在革命性科学家的顶尖科研机构,在选拔人才时不应仅仅依赖考试成绩。他们还需要借助智商测试来发掘那些智商很高,但学业表现可能不尽如人意的「潜力股」。除了高智商,卓越的创造力也是革命性科学研究不可或缺的要素。创造力很可能与 Eysenck 人格理论中「精神质」的中高度表现相关。具有这一特质的人往往表现出自我中心、不随大流、富有冲动性和追求刺激的倾向。同时,他们在认知方面具备流畅的思维、丰富的联想能力,能够快速产生多种创新想法。然而,当前的科学界更倾向于筛选尽责性和宜人性高的人,这无形中抑制了精神质的表现,从而限制了创造力的发挥。我提出的新选拔方案可能会让人觉得有些大胆:根据高智商和中等偏高的精神质来选拔精英革命科学家。这种方法乍听之下似乎是在培养天才骗子和江湖术士。因此,我们还需要引入一个至关重要的因素:对真理的无限追求。理想的革命性科学界应该是这样一个地方:它欢迎那些才华横溢、富有灵感、特立独行甚至有些古怪的人才,但前提是他们必须全身心地投入到对真理的探索中。
引言
为何当今众多顶尖科学家显得无聊透顶,缺乏科研抱负?简而言之,这是因为科学界的选拔机制正无情地将那些富有趣味和想象力的人才淘汰出局[1]。
从教育、培训到职业发展的各个阶段,选拔过程往往青睐那些勤勉守规、善于社交的人,而将聪明有创意的人才拒之门外。随着「同行评议」机制在科学界日益占据主导地位,科学家的亲和力与社交能力被推崇备至,甚至超越了那些才华横溢、洞察力强,但性格直率、反叛权威的真理探索者——后者在过去常常是最杰出科学家的典型代表。
如今,绝大多数资深科研人员都经历了严格而漫长的教育、筛选和训练过程。然而,现代科学界这种严苛而持久的选拔机制,反而确保了那些最终脱颖而出、获得长期科研职位的人,往往并非能够开展顶尖、革命性科学研究的人才。这些科研人员可能非常高产,且善于遵守社会规范,但他们的智力水平仅略高于平均,并且可能缺乏想象力[2]。
(当然,这种对平庸乏味的指责可能不太适用于正在阅读本文的科学家,而更适合用来形容普通科学家。毕竟,大家普遍认为,阅读或在 Medical Hypotheses 上发表文章的人都不是典型科学家,他们往往来自科学界中更加绚丽多彩的那一端!)
现代科学的乏味趋势
现代科学已变得过于平庸乏味,难以吸引、留住或提拔那些最聪明、最具创造力的人才。特别是,在有机会开展自主选择的独立研究之前,需要经历长达 10 年、15 年,甚至 20 年的研究生「培训」,这足以让几乎所有充满活力或自尊的人望而却步;更遑论那些对创造性工作怀有强烈使命感的人,他们必定会被彻底排除在外。即便熬过了这十年、二十年的「培训」期,科学家最可能面临的前景不是研究由资金可得性而非科学重要性决定的课题,就是在他人的研究机器中充当一颗小小的齿轮。无论是哪种情况,科学家都只能研究别人的问题,而非自己的。那么,又有哪个严肃的知识分子会将这样的前景作为自己的职业追求呢?
科学研究的整个过程和结构已经变得缓慢。翻阅 1960 年代中期之前活跃科学家们的回忆录,你会发现当时的科研氛围灵活敏捷,步伐迅速,同时在目标设定上更具长远眼光。研究者可以自由追随意外发现的线索。二十出头的年轻人就能开展真正独立的研究,这在当时司空见惯。对于这些科研工作者来说,他们能够切实感受到进步,沉浸在令人振奋的创新氛围中。
如今,成为一名科学家的训练过程俨然变成了一场漫长的延迟满足锻炼。培训年限不断延长(即让研究者将大量时间花在完成他人认为「必要」的任务上,而非追随自己的兴趣),同时,要求更多的前期规划、委员会审批和后勤安排。雪上加霜的是,大量与科研无关的繁琐官僚程序正在激增,不断消耗研究者的宝贵精力。
科学研究和讨论的时间尺度已经从以天、周、月计,延长到以月、年、十年计。然而矛盾的是,对持续高产出的年度要求,却将研究成果的预期周期压缩到了最多 3-5 年。在这种环境下,投入时间和承担风险去进行雄心勃勃的科学研究,无异于职业自杀[2]。归根结底,科学研究的节奏变慢了,但科学的时间视野却收窄了。现代科学陷入了既乏味又短视的困境:这是最糟糕的双重夹击!
苛求超凡的毅力会筛去智力与创造力
在现代科学界脱颖而出的人,往往拥有一种堪称超人的品质——毅力。这种毅力使他们能够为追求目标而长期坚持不懈,面对困难与挫折仍毫不动摇。即便看不到眼前回报,甚至无法确定最终是否成功,他们也能持续保持高效的工作状态。
因此,现代科学对毅力设置了极高的门槛。缺乏这种毅力的人,往往从一开始就望而却步,不敢涉足科学领域。即使进入了这个领域,在积累足够资历和经验、最终能够独立研究的过程中,许多人也会被淘汰或排除在外。毅力还有一些近义词,如「自律」、「坚毅」[3-5],以及「大五」人格特质中的「尽责性」(简称「C」)[6]。
其次,这类人通常还需要在「大五」人格特质中的「宜人性」(Agreeableness,简称「A」)方面表现出色。这一特质涵盖了理解他人感受的能力、与团队和谐相处的本领,以及将集体利益置于个人利益之上的品格[6]。
从整个社会的角度来看,尽责性和宜人性无疑都是值得赞赏的特质。大多数人都向往生活在一个以尽责和友善的人为主的社会中。更重要的是,研究表明,较高水平的尽责性尤其能够预示更出色的工作表现[7]。然而,在顶尖的革命性科学领域取得成功,所需要的素质与社会整体所推崇的有所不同。虽然高度的尽责性和宜人性能够塑造出优秀的公民和员工,但如果在特定群体中过分追求这些特质的平均水平,就只能以牺牲其他重要属性(如智商和创造力)的平均水平为代价。
这是一个不容忽视的问题,因为在开展最高层次的「革命性」科学研究时,尽责性和宜人性并非最为关键的特质[9,10]。(革命性科学是指能够改变科学发展方向的研究[9];革命性科学家则是致力于这一目标,努力发展全新理论或方法的人[10]。)事实上,在革命性科学领域取得成功,最为重要的素质是智力和创造力[8]。更有证据表明,过高的尽责性和宜人性可能会阻碍科学天才的成长,甚至与之水火不容。这是因为勤奋和友善这些品质只有在服务于有价值的科学目标时才能发挥作用,而不应将其本身视为最高的科学价值准则。
高智商在革命性科学中的决定性作用
成为一名优秀的科学工作者和成为一名富有原创性、雄心勃勃的革命科学家,这两者在人员要求上存在某些方面的对立。这本不应令人惊讶,然而其影响在过去几十年里一直被忽视和漠视。
在「常规」科学领域——即旨在基于现有理论和知识逐步推进的科学研究中,研究人员的可靠性和专业技能至关重要[9,10]。现代科学的主体部分属于「常规」科学,这也是过去 60 年来科研经费和人力资源大幅增长的主要方向[11,12]。从事这类研究的科学家无需特别具有创新精神;相反,他们需要勤勉、一丝不苟,并在思想和方法上保持审慎态度。鉴于常规科学研究越来越强调团队合作,科研人员若能善于社交并遵守团队规范,将会获得显著优势。高智商在常规科学研究中同样重要,这一点与其他几乎所有职业领域相似[13]。然而,在常规科学的「问题排查」环节中,高智商可能更为关键——这有助于确保研究方法的有效实施和问题的顺利解决。
因此,对于常规科学而言,高尽责性似乎是不可或缺的,高智商和高宜人性都具有重要价值,但创造力可能反而会产生不利影响。
然而,对于革命性的科学研究而言,智力和创造力是两大不可或缺的关键要素。相比之下,尽责性在这一领域的重要性主要体现在科学家能够,并愿意长期深入研究他所钟情的科学问题上。值得注意的是,专注于自己感兴趣的问题所需的毅力,远远不及长期致力于非科学问题(如在学校求学或获取第一个学位时)或他人的科学问题(如在研究生阶段或从事博士后研究时)所需的毅力。
一般智力(又称「g 因子」智力),即通过标准 IQ 测试所衡量的智力,是进行顶尖科学研究的一个极为重要的心理要素[8]。事实上,只要深入理解 g 因子智力的本质和精英科学的特性,就不难发现高水平的一般智力对革命性科学研究的重要价值[14]。对杰出科学家的研究表明,这些人通常拥有远高于平均水平的智商,超出几个标准差[8]。(注:在英国,随机人口样本的平均 IQ 被设定为 100,标准差为 15 分。其他国家在对照英国 IQ 标准时,可能会呈现不同的平均值和分布。)
1926 年,Cox 进行了一项回顾性研究,通过间接方法估算出过去「天才」科学家的平均智商在 135 到 175 之间,这一水平位居人口的前 1%(引自[8])。然而,这种研究方法所得出的测量结果精确度有限。到了 20 世纪 50 年代,Roe 采用了更为直接的方法,她对 23 位极其杰出的美国科学家进行了智商测试[15]。研究结果显示,这些科学家的智商中位数为 166,最低为 121,最高达到 177(177 约为平均水平以上 5 个标准差,同时也是测试的上限;如果没有这个上限,某些受试者的得分可能会更高)。
研究表明,极高的智商似乎是几乎所有顶尖科学家共有的特征,这意味着高智商可能是成为顶尖科学家的必要条件之一。从某种角度来看,成功的革命性科学家很可能是当今世界上智力最为卓越的一群人。Roe 的研究进一步指出,成功从事革命性科学研究的最低智商门槛可能在 120 左右。在英国,这一智商水平位于人口的前 10%;在平均智商略低于英国的美国,则大约位于前 7%;而在一些平均智商高于英国的东亚国家或地区,如台湾、新加坡或香港,这一水平则约为前 15%[16]。
此外,对「天才儿童」(即在标准化智商测试中得分极高的儿童[17,18])进行的前瞻性追踪研究表明,这些儿童在科学考试中展现出远超常人的能力。他们在顶尖大学获得纯科学、医学或工程学博士学位的比例显著高于普通人。这些孩子往往倾向于在本科和博士阶段选择科学相关专业(如数学、纯科学、工程和医学)作为职业发展方向。在科学界精英评价体系中,如被选入重要学术团体的比例,他们的表现也远高于平均水平。然而,值得注意的是,这些评价标准大多没有区分常规科学和革命性科学。
总的来说,在革命性科学领域取得成就几乎必定需要极高的智商;过去,高智商常常与选择科学作为职业以及在科学领域表现出色密切相关。然而,当今的科学界很少直接使用智商测试作为选拔标准;相反,考试成绩或其他教育指标通常被赋予最大的权重。因此,我们无法准确判断现代的选拔、教育、培训和职业体系对那些坚持长期从事科研工作的科学家的平均智商和最高智商产生了多大的影响。
尽管目前尚无法精确量化影响程度,但假设科研人才的智力水平并未显著提升,且专业科学家群体的规模也未缩减以形成更精英的队伍(事实上,科学领域的就业人数已增长数倍),那么当前的科学人才选拔方式很可能正在降低长期科研人员的平均智商。
智力与尽责性:教育成就的双重预测指标
一个多世纪以来的研究表明,包括考试成绩在内的诸多教育成就,都可以通过结合「能力」和「努力」来预测(详见参考文献[19])。用现代心理学的术语来解释,这意味着一般智力(g 因子,通常用 IQ 表示)和「大五人格」理论中的尽责性(C)特质是影响教育成就的两大核心因素。
智商(IQ)和尽责性(C)之间的关系可以用下面这个方程表示:
IQ × C ≈ 教育成就
(需要强调的是,这个乘法公式准确地反映了一个关键事实:如果智商或尽责性中的任何一项为「零」或极低,都将严重阻碍个人取得显著的教育成就。)
上述等式源自 Lynn [19]的研究。Lynn 最初提出了一个更通用的公式:「智商 × 尽责性 × 机会 = 成就」。然而,在本文中,我省略了「机会」这一因素,主要基于两点考虑:其一,机会这一因素难以准确量化评估;其二,在发达社会的一般环境中,当我们控制了智商(可能还包括性格特征)这一变量后,几乎没有证据表明机会的差异会对教育成就产生显著的系统性影响[14,20]。
因此,从初步的角度来看,智商(IQ)[13,14,21]和尽责性(C)[3,22-25] 是预测个人教育成就最为可靠的两个属性。尽管智力和尽责性并非影响教育成就的唯一因素,但它们可能是最为关键的。考虑到其他因素要么缺乏确定性,要么难以量化测量,本文将专注于研究智商和尽责性这两个核心因素。
智商、尽责性与教育成就之间的相关程度会因研究对象、教育测量的内容和性质,以及研究方法的不同而有所差异。传统观点认为,相比于性格特征,智商在预测教育表现方面更有效[13,14,21,22],但这种情况并非绝对[3]。我个人推测,近几十年来,智商在预测教育成就方面的能力很可能已经有所下降,而尽责性的预测能力则有所提升。这种变化可能源于教育过程中对尽责性要求的不断提高。
智商与尽责性相关性不高,筛选尽责性倾向于降低平均智商
从个体层面来看,智力与尽责性之间几乎没有明显的相关性。然而,不同的群体研究得出了不同的结论。特别是那些跨越不同社会阶层、种族群体或国家的广泛样本研究,发现智商(IQ)与尽责性(C)相关指标之间存在正相关[6,19,26]。与此同时,许多研究表明两者之间没有显著相关性[5,27],还有一些研究甚至发现智商与尽责性(C)之间存在显著的负相关[28]。
这些研究结果之间的差异很可能源于受试者的选择方式。我推测,当研究样本在教育程度、社会阶层或种族背景上差异很大时,智商(IQ)和尽责性(C)之间可能会呈现正相关。然而,当研究控制了社会阶层或教育程度因素(比如只选取大学生作为样本)时,这种相关性可能会消失,甚至变成负相关。这是因为相同的教育成就可能是智商和尽责性(C)不同组合的结果。举个例子,一个智商较低但更加勤奋的人可能会在考试中取得与一个智商较高但不那么努力的人相同的成绩。
换言之,当我们将研究样本限制在一个狭窄的教育程度范围内,从而使教育程度这一变量保持相对恒定时,智商(IQ)和尽责性(C)之间可能会呈现出反向关系。这种关系可以用上述方程的反向版本来表示:教育成就 $\approx \mathrm{{IQ}} \times \mathrm{C}$(其中 C 代表尽责性)。这个公式暗示,在教育成就相同的情况下,较高的智商可能对应较低的尽责性,反之亦然。
然而,智商(IQ)和尽责性(C)之间缺乏强相关性,这意味着当科学界对毅力有极高要求时(例如,只有完成博士学位和 6 年博士后研究的人才有资格被选中),这种提高的平均尽责性水平必然会以牺牲其他能力为代价,包括智商。在教育水平保持不变,且智商(IQ)和尽责性(C)呈反比的情况下,这种效应会更加显著。即便这两个变量之间没有明显关系,选择尽责性更高的人也往往会导致平均智商的下降。
举个例子,假设一所大学正在从申请者中选拔前 10% 的人进入博士项目。平均而言,被录取的人在智商和尽责性两方面可能都处于前 10%。在这个平均水平上下,有些人可能更勤奋但不那么聪明,而另一些人可能更聪明但不那么勤奋。(那些在智商和尽责性两方面都高于前 10% 的学生可能会选择去排名更高、门槛更高的大学就读。)
让我们假设一个情景:达到某一教育水平所需的尽责性标准提高了。例如说,教育评估方式从偶尔的正式考试转变为频繁的课程作业,同时正规教育年限延长了 3 年。在这种情况下,这所假想的大学虽然仍然维持相同的选拔比例(即录取排名前 10% 的学生),并且仍然基于学业成绩进行选拔,但现在学生还需要在尽责性方面达到前 5% 的水平。
在这种尽责性要求下,许多原本有资格入学的高智商学生可能无法(或不愿)完成教育评估。他们的位置将被那些智商可能较低,但尽责性排名前 5% 的学生所取代。为了满足招生名额,大学可能不得不将录取范围扩大到智商排名前 20% 的学生。这样一来,成功申请者的平均智商将会下降。而那些智商高但尽责性较低的学生则可能被迫就读于门槛较低的大学,从而在未来的职业竞争中可能失去一些优势。
随着教育系统对毅力的要求不断提高,一种筛选机制将在整个教育系统中发挥作用。具有较高尽责性的学生会被选送到门槛更高的院校,而毅力较低的学生则可能被淘汰。虽然考试成绩最优异的学生仍然会同时拥有极高的智商和尽责性,但这样的全才并不常见,因为智商和尽责性之间并不存在强烈的正相关关系。事实上,现在的教育系统更加重视那些具有较高尽责性的学生,而非高智商的学生。
通常情况下,在其他条件相同的前提下,对尽责性的重视程度越高,对智商的选择性就相对越低。
长期、阶梯式、等级森严且充满竞争的教育系统往往会筛选掉高智商人才
随着工作对认知能力要求的提高,智力在预测教育和职业成功方面的作用愈发显著。可以说,智商在更高级的教育阶段和更深入的科研活动中变得尤为重要。相比之下,在较低层次的科学教育、培训和专业实践中,非智力因素(尤其是尽责性)可能扮演更为关键的角色。因此,对于常规性、技术性的科研工作而言足够优秀的智力水平,可能完全无法满足前沿性、革命性科研工作的需求。
这揭示了教育系统,特别是科学教育的低层级存在一种内在倾向:选拔出的个人特质与高层级的需求不符。具体而言,低层级教育更倾向于选择尽责性高的候选人,而非智商高的候选人。这是因为在科学研究的初期阶段,尽责性比智力更为可贵,而智商的重要性相对较低(由于认知挑战相对简单)。
在缺乏专门的智商测试(用于识别、保留或提拔最聪明的候选人)的情况下,一个长期、阶梯式、等级森严且充满竞争的教育系统——其中晋升取决于在较为简单、认知要求较低的阶段的出色表现——将会偏爱尽责性最高的个体。与此同时,这种系统可能会筛选掉一些高智商者,而这些人本应能在该领域的高层级阶段展现出更卓越的表现。
这种选拔机制导致的结果是,最高层级的科学界的平均智商很可能低于最优水平。这是因为在较低层级(即认知要求较低的阶段)的选拔过程中,过分强调了尽责性。考虑到极高的智商可能是成功进行革命性科学研究的必要条件,这意味着许多高层科学家因智商不足而无法开展革命性的科学工作。取而代之的是,他们可能成为了常规科学家——尽管是异常高产的常规科学家(这得益于他们卓越的工作能力和自律精神)。
理论上,高智商人才的流失可以通过在晋升过程中逐步减少保留人数来弥补。这意味着即使失去了一半的高智商人才,如果最终只保留四分之一的人员,这种损失可能就不会被察觉。然而,近几十年来科研资金的持续增长导致专业科研人员数量增加了数倍[2,12],这表明上述这种越来越严格的选拔机制在实际中很难实施。
理想情况下,高层科研群体应该是一个「最高智商精英团队」,其中大多数成员都具备开展革命性科学研究的能力。然而,当代科学界的领军团队更像是一个「最高毅力精英团队」,他们通常难以进行革命性科学研究,而是倾向于从事大量的常规科学工作[2]。
结合考试成绩和智商测试可间接估计尽责性
在科学领域广泛开展智商测试是一个至关重要的步骤。智商测试在多个方面都展现出强大的预测能力[29],尤其是在预测工作表现方面(适用于所有工作,但在认知要求较高的工作中尤为显著)[13]。有诸多理由支持在我们的社会中更广泛地推广智商测试。然而,当前普遍存在的、有意为之的政治动机扭曲和虚假信息阻碍了这一进程[30]。
在科学领域,智力测试具有特殊价值,因为理解科学和进行科学研究的能力与智商高度相关。近几十年来,随着教育系统越来越重视培养学生的尽责性(相应地,对智商的选拔性降低),正式的智商测试可能变得更为必要。例如,在英国和美国的教育系统中,课程作业的比重显著增加,取代了以往较少的正式、有监督和限时的考试。此外,教育和培训的周期也在不断延长。
对候选人进行智商测试的目的是为了发现智商测试结果与考试成绩之间的差异。如果考试成绩排名与智商测试结果排名存在显著差异,这表明该考生的尽责性可能异常高或异常低。
这种关系可以通过重组 IQ 与 C 的方程表示:
$$
\text{ 尽责性 } \approx \frac{\text{ 教育成就 }}{\text{ 智商 }}
$$
或者从排名的角度来表达:
$$
\text{尽责性的排名} \approx \frac{\text{ 教育成就的排名 }}{\text{ 智商的排名 }}
$$
换句话说,我们可以通过综合考虑一个人的教育成就和智力水平,来间接估算这个人的尽责性。
(在机构选拔和职业决策的背景下,我认为这种间接估算尽责性的方法很可能比传统的自我评价人格问卷更为有效[6],主要原因在于它更难以作假。对于高智商人群而言,在自我评价问卷中作弊相对容易,他们只需掌握那些被标记为代表高(或低)尽责性的「正确」答案即可。然而,要在这种间接估算尽责性的方法中「造假」,申请人唯一的选择就是在智商测试或考试中故意表现不佳——这通常会对其职业前景造成不利影响。举个例子,如果一个不诚实的候选人想表现出高尽责性,他可以在智商测试中故意降低表现,使得自己的考试排名高于智商排名。但在绝大多数选拔或就业场景中,这并非明智之举。相反,如果有人想让自己看起来像个「潜力未充分发挥者」,可以故意在考试中表现糟糕,但在智商测试中全力以赴——这样他们的智商排名就会高于考试排名。然而,这么做的代价是降低考试成绩,在大多数情况下都不会带来任何好处。)
这项比较考试成绩和智商测试结果的活动,旨在使革命性科学的教育或研究机构能够优先选择成绩差的学生而不是成绩优异的学生。举例来说,如果某人的智商位居人群前 2%,但考试成绩仅在前 20%,我们可以合理推断,他考试表现相对较弱可能是因为他在尽责性(C)方面相对较低(尽管仍高于平均水平)。这种情况就是所谓的「潜力未充分发挥」。
如果没有可用的人口统计标准,机构可以简单地将候选人的考试成绩和智商测试结果分别排序。若两个排序列表出现明显差异,就可能表明存在潜力发挥过度或不足的情况。例如,一个潜力未充分发挥的人可能在 20 人中智商排第 2,但考试成绩却排第 16。
与之相反的是「表现过度者」,即考试成绩排名显著高于智商测试排名的人。这种情况可以解释为:他们在尽责性(C)方面较高,但智商较低(更加勤奋但不那么聪明)。
宜人性 vs 精神质和创造力
革命性的科学突破需要高智商,但高智商并不必然带来创造力。事实上,一些高智商者似乎缺乏创造力。革命性科学家既需要高智商,也需要卓越的创造力。实际上,革命性科学是人类创造力最重要的展现领域之一,孕育了牛顿、达尔文和爱因斯坦等标志性人物[8]。
有趣的是,研究发现创造力往往与 Eysenck 人格理论中的「精神质」特质的中等偏高水平相关[31]。精神质已经通过大量研究得到验证[6,32]。具有高精神质的人通常表现出较低的宜人性(例如,更加自我中心,不易受群体规范影响)和较低的尽责性(例如,较为冲动,喜欢寻求刺激),同时拥有一种特殊的认知风格,能够流畅、快速地进行联想并产生大量想法。虽然低精神质通常意味着理性和亲社会的人格(这些通常被视为理想的品质),但中等偏高的精神质并非完全负面。它也有积极的一面——体现为一种独立精神和更加自发、富有想象力的思维方式。这种独特的认知风格似乎正是创造力的基础。
极高的精神质往往意味着适应不良(这一点从其名称就可见一斑)。这种个体会表现出极度冲动的行为,无法持续专注于任何事务;极端反社会,甚至可能精神错乱(进而导致入狱或被社会排斥);思维过程极度混乱,呈现神经质特征,伴有幻觉、妄想和思维障碍(可能导致语无伦次、无法就业,甚至需要住院治疗)。然而,Eysenck 的研究揭示了一个引人深思的现象:中等偏高程度的精神质与创造力密切相关。这一结论基于多维度的创造力评估,包括实际成就、实验室测试,以及对易患精神病个体创造力的测量[8,31,32]。值得注意的是,在各个领域(不仅限于科学,还包括艺术)中创造出最杰出成就的个体,往往具有中等偏高的精神质[8]。
从革命性科学的角度来看,这是有道理的。因为要将科学引向全新的方向,需要个体具备相当程度的独立性,能够突破群体规范的束缚;同时需要一定程度的自我中心,能够在一定程度上置他人感受于不顾;此外,还需要一种能够产生新颖思想的思维模式。相比之下,精神质较低的个体可能过于顺从,易于屈从于权威;过度畏惧社会制裁,不敢冒险;思维过程过于循规蹈矩,难以产生和追求具有颠覆性的原创(即创造性)成果。因此,低水平的精神质虽然可能更适合从事常规科学工作,但对于追求革命性科学突破的研究者来说,却可能成为阻碍。
总的来说,「天才」很可能具有中等偏高的精神质。如果这一观点成立,那么它对科研人才的选拔将产生重要影响,因为创造力与宜人性及尽责性呈负相关。因此,现今的科研职业体系——强调高度的尽责性,倾向于选择性格随和、善于社交的人——不仅无法选拔出富有创造力的科学家,反而可能会将这些人排斥在外。
革命性科学机构应着重选拔高智商、富有创造力且精神质相对高的人才
因此,如果顶尖的科研教育和培训机构的目标是选拔最优秀的天才——即那些有潜力在本领域引领变革的科学家——那么当前的人才选拔方法和职业发展体系都需要进行相应的改革。
首先,顶尖研究机构需要了解申请者的智商。如前所述,智商测试的独特价值在于它能够识别那些智商高但考试成绩不突出的「潜在人才」。这类人可能在尽责性方面略显不足,导致他们在不感兴趣或不投入的任务中表现欠佳。然而,如果他们的毅力足以支撑他们进行独立研究,那么他们的尽责性可能已经足够高,能够在自己选择的、能带来更直接回报的问题上投入大量持续的努力。因此,一个在学校和本科阶段感到乏味、缺乏动力的人,在面对自己感兴趣的问题时可能会展现出截然不同的热情和干劲。选择智商高、尽责性达标的科学家,还能增加中等偏上精神质个体的比例——这些人有潜力成为富有创造力和革新精神的科学家。
目前,创造力还无法直接通过选拔获得。尽管存在一些创造力的心理测试[6,8,31,32],但这些测试的有效性尚不确定,特别是在预测革命性科学所需的高水平创造力方面。然而,顶尖科研机构完全可以、也绝对应该避免他们目前(无意中)抑制创造力的选拔做法。
以许多顶尖大学的录取程序为例,它们在要求申请者提供参与社区服务、团队运动、担任管理职责或加入戏剧、音乐团体等活动的证明时,可能无意中筛选掉了具有创造力的候选人。选择最「善于交际」的学生或许能营造出更愉快、更富有活力的校园氛围,也能形成一个更友好、更易管理的学生群体。然而,这种倾向于排斥不善社交或不太圆滑的个体的策略,很可能会限制未来最优秀的理科毕业生的潜在成就。
相比之下,那些选拔标准不太严格的「常规科学」教育和培训机构,其目标是培养能够胜任可靠但较为常规的技术和管理工作,或需要细致入微的工作的人才,可能会更合理地关注选拔平均尽责性(C)较高的学生——但这不可避免地会以牺牲智商(IQ)为代价。因此,这些机构可能会招收一批「超常努力者」学生,他们具备长时间稳定工作的能力。此外,这些机构可能还希望选择宜人性高的学生,以提高团队合作的能力。
无论科学人才选拔的具体目标如何,将考试成绩与智商测试结果结合起来,都能比单纯依靠考试更加精确、全面且客观地评估个人能力。
超凡脱俗的真理探索者
简而言之,我的观点如下:
-
教育成就是智商与尽责性(C)的乘积,但两者并非高度相关。
-
现代教育通过延长教育周期和改变评估方法,逐步提高了对尽责性的要求。
-
因此,当今的教育成就越来越倾向于奖励尽责性,而非智商。
-
然而,革命性的科学研究仍然需要高智商,且智商越高越好。
-
所以,在智商至关重要的革命性科学领域,人才选拔不应仅仅或主要依据教育成就;还需要辅以直接、正式的智商测试。
-
此外,革命性的科学研究需要很高的创造力,这与中等偏高的精神质相关。然而,现代教育和科学界强烈倾向于选择高尽责性、高宜人性的人,因此降低了精神质。
-
因此,现代科学的教育、培训和职业体系往往会抑制平均智商水平,并淘汰创造力——而这两者恰恰是在革命性科学研究中取得成功所不可或缺的关键素质。其结果是,当今的顶尖科学家可能不如理想状态下那般聪明和富有创造力,而且在智力和创造力方面很可能明显逊色于往日的顶尖科学家。
回顾历史,科学家的教育和培训过程曾经要简短得多——许多科学家在二十多岁中期就已经具备了独立开展研究的能力。这种相对简短的过程大大降低了对尽责性和宜人性的要求。对于一个尽责性适中的人来说,目标并非遥不可及,只需几年的辛勤努力就能达成所愿。而对于一个不那么善于与人相处的人来说,他也无需与众多上司和团队周旋,从而避免了可能会阻碍他职业发展的人际关系问题。
此外,过去衡量教育能力的方式主要是通过频率相对较低、限时、有监督且事先未知的正式考试。在这种考试中,考生需要快速调动和组织知识。与近几十年来教育系统越来越重视的频繁「课程作业」相比,这种正式考试可能更能反映学生的一般智力水平(即与智商的相关性更强)。相较于正式考试,课程作业更倾向于奖励学生的尽责性而非智商,因此更受那些尽责性高但智力相对较低的学生青睐[33]。
让我们回到最初的问题:为何当今的顶尖科学家如此平庸乏味?答案主要在于,科研界对长期艰苦奋斗和避免社交争议的能力要求不断提高。这种趋势在潜在的优秀科学家还未开始独立研究之前,就已经开始阻挠、淘汰和忽视他们。更令人担忧的是,后期繁重的规划和管理工作可能会使更多聪明有趣的人才流失。如今,经过漫长培训过程脱颖而出的科研人员与半个世纪前的科学家有着显著差异。他们自然而然地推动科学朝着造就自身成功的方向发展。因此,现代科研领袖往往更加重视科研人员在漫长而枯燥、与科研本质关系不大的工作中的表现,并主要根据他们稳定产出和团队协作的能力来评判。这些要求无疑会抑制创造力和智力的发挥。
近几十年来,科学界的人才选拔机制发生了变化,这似乎不可避免地导致了经过完整专业训练的科研人员平均智商和创造力的下降。这种变化可能会特别影响革命性科学研究的表现,但却可能提高常规科学研究的水平。在常规科学研究中,只要智商达到中等偏上的水平,毅力和社交能力可能更为关键。实际上,这很可能就是这些变化发生的原因,因为绝大多数科学家都从事常规科学研究,因此常规科学的要求往往占据主导地位[2]。然而,这种变化对智商和创造力降低的具体影响程度尚未被量化,这构成了一个值得未来进行实证研究的课题。
与其维持现有的教育和职业体系——它过分强调选拔具有超常尽责性的人才,而对智力和创造力的要求却相对较低,革命性科学需要一个全新的体系。这个新体系应该优先选拔具有超常智力和高创造力的人才。在这个体系中,尽责性只需要达到一个能够确保独立科学家投入长时间、艰苦工作的水平,使他们有足够的动力去解决那些自己选择的、令他们着迷的问题。同时,宜人性只需要达到能够排除精神病患者和反社会人格者的程度即可。
Eysenck 的研究[8]表明,选拔精英科学家的标准是高智商和中等偏高的精神质。乍一听,这似乎是在培养天才骗子的配方。然而,还缺少一个至关重要的要素:精英科学家家必须对真理的超验价值具有职业奉献精神。Charles Murray 在其对人类卓越成就的权威研究中[34]得出结论,天才的诞生离不开一个将超越性价值视为生命的社会环境。因此,伟大的革命性科学成果,是由追求超越性真理的个人在同样崇尚真理的氛围中工作的产物。
正是这种对真理的不懈追求,将伟大的独立科学家与那些仅仅利用科学谋取私利的聪明骗子区分开来。当然,要识别这种对真理的追求,需要科学体系在理论和实践中都将超越性的真理追求置于毅力和社交能力等社会美德之上——而这样的观点在当今科学界并不常见。由于缺乏这种活跃的超越性价值观,科学已退化为单纯追捧社会美德,将同行认可奉为圭臬,视为最高裁决[35]。毫不意外,这样的科学界会过分推崇尽责性(C)和宜人性(A),而低估智商和创造力的价值。
当前科学界面临的一个严峻挑战是,许多科学领导者本身缺乏追求真理的品质,因此也难以在他人身上识别这种特质。这意味着革命性科学(或称「纯粹」科学)可能需要在一种新的「真理追求者传承」的基础上重建。这个重建过程应该从那些少数杰出的科学家开始,他们凭借智慧和创造力,成功地突破常规,获得了高地位和权威的专业地位[36]。
那些智商极高,同时精神质中等的人,可能会被认为很聪明,但在日常社交中可能显得过于自私、不稳定或不切实际。然而,恰恰是这些看似古怪却富有洞察力的奇人,对于推动革命性科学的发展至关重要。现代社会需要一个特殊的场所,让那些聪明、不擅社交但富有想象力的人能够发挥才能,同时又能避免他们因能力和想象力不受常识、慷慨或群体规范约束而对社会造成伤害。科学界应该成为这样一个平台:欢迎并培养这些有创意的怪才——前提是他们也是真正以追求真理为己任的人。
致谢
Richard Lynn、Phil Rushton、Wendy Johnson 和 Ian Deary 等学者(有时是在不经意间)为这场学术辩论做出了极其宝贵的贡献。然而,我必须明确声明,他们对我如何运用他们的思想和见解不承担任何责任。毫无疑问,我在学术上最大的亏欠是对已故的 Hans Eysenck,尤其是他的著作《天才:创造力的自然史》(Genius: the natural history of creativity)[8]。
参考文献
[1] Charlton BG. Why are scientists so dull? Oxford Mag 2008;281:7-8.
[2] Charlton BG, Andras P. The 'down-shifting' of UK science. Med Hypotheses 2008;70:465-72.
[3] Duckworth AL, Seligman MEP. Self-discipline outdoes IQ in predicting academic performance of adolescents. Psychol Sci 2005;12:939-44.
[4] Duckworth AL, Seligman MEP. Self-discipline gives girls the edge. J Educ Psychol 2006;98:198-208.
[5] Duckworth AL, Peterson C, Matthews MD, Kelly DR. Grit: perseverance and passion for long term goals. J Personal Soc Psychol 2007;92:1087-101. UK: Cambridge University Press; 2003.
[7] Barrick MR, Mount MK. The big five personality dimensions and job performance: a meta analysis. Pers Psychol 1991;44:1-26.
[8] Eysenck HJ. Genius: the natural history of creativity. Cambridge, UK: Cambridge University Press; 1995.
[9] Kuhn TS. The structure of scientific revolutions. Chicago: Chicago University press; 1970.
[10] Charlton BG. Scientometric identification of elite 'revolutionary science' research institutions by analysis of trends in Nobel prizes 1947-2006. Med Hypotheses 2007;68:931-4.
[11] de Solla Price DJ. Little science, big science: and beyond. New York: Columbia University Press; 1986.
[12] Ziman J. Real science. Cambridge, UK: Cambridge University Press; 2000.
[13] Gottfredson LS. Implications of cognitive differences in schooling within diverse societies. In: Frisby CL, Reynolds CR, editors. Comprehensive handbook of multicultural school psychology. Hoboken, NJ, USA: John Wiley and Sons; 2005.
[14] Mackintosh NJ. IQ and human intelligence. Oxford: Oxford University Press; 1998.
[15] Roe A. The making of a scientist. New York: Dodd, Mead and Company; 1952.
[16] Lynn R, Vanhanen T. IQ and global inequality. Augusta, GA, USA: Washington Summit Publishers; 2006.
[17] Terman LM. The gifted group at mid-life: thirty-five years follow-up of the superior child. Stanford: Stanford University Press; 1959. human capital over two decades. Psychol Sci 2006;17:194-9.
[19] Lynn R. Dysgenics. Westport, CT, USA: Praeger; 1996.
[20] Nettle D. Intelligence and class mobility in the British population. Brit J Psychol 2003;94:551-61.
[21] Deary IJ, Strand S, Smith P, Fernandes C. Intelligence and educational achievement. Intelligence 2007;35:13-21.
[22] Chamorro-Premuzic T, Furnham A. Personality, intelligence and approaches to learning as predictors of academic performance. Personal Individ Diff 2008;44:1596-603.
[23] Chamorro-Premuzic T, Furnham A. Personality predicts academic performance. J Res Personal 2003;37:319-38.
[24] O'Connor MC, Paunonen SV. Big five personality predictors of post-secondary academic performance. Personal Individ Diff 2007;43:971-90. prediction of behaviour: a multitrait-multimethod approach. Personal Individ Diff 2008;45:160-6.
[26] Lynn R. The global bell curve. Augusta, GA, USA: Washington Summit Publishers; 2008.
[27] Nettle D. Personality: what makes you the way you are. Oxford, UK: Oxford University Press; 2007.
[28] Moutafi J, Furnham A, Paltiel L. Can personality factors predict intelligence? Personal Individ Diff 2004;38:1021-33.
[29] Deary IJ. Intelligence: a very short introduction. Oxford: Oxford University Press; 2001.
[30] Charlton BG. Pioneering studies of IQ by GH Thomson and JF Duff. Med Hypotheses 2008;71:625-8.
[31] Eysenck HJ. The definition and measurement of Psychoticism. Personal Individ Diff 1991;13:757-85.
[32] Stavridou A, Furnham A. The relationship between Psychoticism, trait creativity and the attentional mechanism of cognitive inhibition. Personal Individ Diff 1996;21:143-53.
[33] Chammaro-Premuzic T, Furnham A, Disson G, Heaven P. Personality and preference for academic assessment. Learn Individ Diff 2005;15:247-56.
[34] Murray C. Human accomplishment. The pursuit of excellence in the arts and sciences 800 BC to 1950. New York: HarperCollins; 2003.
[35] Charlton BG. Figureheads, ghost-writers and pseudonymous quant bloggers: the recent evolution of authorship in science publishing. Med Hypotheses 2008;71:475-80.
[36] Charlton BG, Andras P. The future of 'pure' medical science: the need for a new specialist professional research system. Med Hypotheses 2005;65: 419-25.
高等教育应当认真对待「信号传递批判」的理由及其潜在影响
2021 年 10 月 19 日
作者:Chris Percy & Aveek Bhattacharya 博士
本文由 Chris Percy 和 Aveek Bhattacharya 博士慷慨撰写,基于他们近期在社会市场基金会发表的研究报告。欢迎在 X 上关注他们:@chris_percy 和 @aveek18
不久前,高等教育政策研究所公布了 David Willetts 议员的一篇论文,该文有力地论证了继续支持和扩大高等教育的必要性。我们赞同该论文中的诸多观点。教育确实可以成为一段足以改变人生轨迹的经历,它不仅能提高毕业生的收入水平和幸福感,还能为整个社会带来积极影响。Willetts 的建议——增加大学数量,提高教育经费,同时加大对继续教育和终身学习的投资——鲜明地体现了教育学界的主流观点:越多越好。
Willetts 敏锐地意识到,当前我们正处于一个大众质疑高等教育价值的时期。他特别指出了一个令人担忧的趋势:英国毕业生的工资溢价正在下降,这一现象我们在报告中通过图表进行了详细展示(见下文摘录的图 3)。智库 Onward 在其研究报告中指出,由于许多大学毕业生的实际收入水平较低,他们的学位实际上提供了「糟糕的投资回报」。与此同时,有明确迹象表明,财政部正在试图收回部分此前投入高等教育系统的数十亿英镑公共资金。
高等教育批评者经常提到一个被称为「信号传递批判」的观点。这种观点认为,教育带来的工资收益中,相当大一部分并非源于教育过程中个人技能和能力的实际提升,而是来自于教育经历本身对一个人既有能力的展示作用。换言之,学位的价值很大程度上不在于你在大学里学到了什么,而在于你有能力被某所特定大学录取这一事实本身。
某种程度的信号传递可能难以避免,也无需过分忧虑,但没有人资助大学是为了助长一场炫耀天才的军备竞赛。从财政和道德的角度来看,我们都应该希望教育能尽可能地专注于持久,能够改变一个人的教育经历(包括那些能够提高整体生产力的历程),而不是仅仅为雇主提供一种便捷却草率的招聘筛选方式(这对提高生产力或其他方面几乎毫无益处)。
诚然,生产力和经济效益只是政府补贴和个人投资高等教育的动机之一,但它们是 Willetts 议员有望在与财政部的辩论中取胜的核心论点,也是许多学生的主要动机,尤其是在英格兰(详见我们报告第 8 页和第 9 页的引用)。
高等教育界在政策层面上通常选择回避对「信号传递理论」的批评。这一现象可以通过以下三个例子得到印证:首先,Willetts 议员在其著作中虽然提及了这一理论,但未提供任何支持或反对的证据就将其搁置一旁(参见第 20 页)。他反而将重点放在文化冲突和选民投票趋势等议题上。其次,伦敦大学学院教育政策与平等机会中心近期发表的一项研究综述,虽然对「信号传递理论」的证据给予了相对公正的审视,但却不愿对其在提高工资方面的权重做出具体量化。该研究仅笼统地断定,这一理论的影响是「有限的」。
第三个例子来自 Danny Dorling 教授为高等教育政策研究所撰写的一篇书评。该书评针对的是乔治梅森大学 Bryan Caplan 教授所著的《教育的浪费》——这本书极力主张「信号传递理论」。Dorling 教授在评论中虽然提出了一项批判性研究,但更多地着眼于 Caplan 教授的成长背景、个人特质和写作动机。尽管这种反驳证据的提出值得肯定(且论述得当),但仅凭一项单一研究是不足以推翻一项综合性研究的结论的,无论该研究的作者是谁,或其写作动机如何。
然而,信号理论的支持者也难辞其咎,他们同样应为缺乏建设性对话负起责任。Caplan 提出的核心政策建议是大幅「削减教育投入」,这一极端提议实际上阻碍了进一步讨论的可能。在这种情况下,他的其他想法,如强调职业教育的重要性,往往难以获得公正的评估。尽管做出防御性反应并非明智之举,但这种反应也是可以理解的。
我们认为,双方的观点都有其道理:教育的主体内容无疑极其宝贵,但同时也不可否认存在一些社会资源浪费的问题。我们的目标是将这两种观点融合起来,从而更有效地引导教育系统的时间、精力和资源分配,使其真正造福学习者和整个社会。这正是我们近期发表的论文《信号失效》所要探讨的核心问题。
目前,我们尚无法确切断定高等教育带来的工资溢价中,有多大比例纯粹源于信号效应,而非新知识和技能等提升生产力的因素。准确估算这一比例极其困难,学术界关于这个问题的争论已持续数十年之久。在这场辩论中,想要支持任何一方观点都能轻易找到相应的研究依据。尽管如此,我们通过五种不同的计量经济学方法审视之后得出结论:这个问题的规模足够大,值得我们认真对待。据保守估计,工资溢价中有 20% 到 40% 可能源于信号效应(详见下方摘自我们报告的表 1)。
我们引用的一些研究显示,高等教育的信号作用占比在 20% 到 40% 之间。这些研究得出的结论认为:这个水平的贡献并不重要,大概是因为它不是「主要」驱动因素,占比低于 50%。然而,我们对此持不同看法。如果这个比例只有 5% 或更低,或许可以忽略不计——但很难想象任何客观公正的综合研究会得出这样的「点估计」。考虑到人们在高等教育上投入的巨大时间和金钱成本,即使是这个范围的「低端」也值得我们全社会的共同关注。
那么,我们应该如何应对这个问题呢?我们认为,答案并不在于大规模削减教育经费(无论是针对哪个阶段的教育)。事实上,我们担心高等教育界目前对信号理论批评的回应方式,反而可能导致教育经费增加而非减少。
以下是高等教育界可以尝试的三个初步方案,旨在限制(而非完全消除)信号传递作用的影响:
-
将重心转移到专业和成绩上。目前,毕业生招聘过分强调就读院校,这实际上更偏重于入学考试的成功(即优秀能力的信号),而非学生在学习过程中的实际收获(即人力资本的增长)。如果能够建立一个更细致、更具可比性的跨院校学位评级体系,雇主将能够获得更多有价值的信息来评估应聘者。
-
提高教育体系的灵活性。如果教育的主要价值在于传递学生先前能力的信号,那么我们应该帮助学生更快地获得这种信号,但同时不能降低难度,以免削弱这种信号的可信度。短期课程、微学分和模块化课程都可以帮助实现这一目标。我们应该积极支持学生中断、重新开始或转换学习方向,允许他们进行多年的学习间断而不会受到歧视。为了应对这种新的灵活性,我们需要提供优质的职业指导并加强雇主参与度。当学生重返校园时(相信会有很多人这样做),他们将对自己所收得的教育价值产生更清晰的认识。这种转变将有助于培养终身学习的文化,并吸引更多可能更倾向于追求真正能提升人力资本的教育的成年学生。
-
迎接测量挑战。我们应该直接衡量学习增益,持续追踪信号效应对不同群体的影响,并将这些发现作为与政策制定者建设性对话的一部分。我们绝不能因为追求完美阻碍了良好措施的实施。尽管像通货膨胀和社会不平等这样的关键社会问题的测量方法仍然不够完善,但我们仍然可以通过追踪替代指标并理解这些指标的局限性来推动重要的政策进展。
信号传递并非仅限于高等教育部门,其他相关方也有义务发挥重要作用。我们的报告也为学校和学院的职业指导、企业的招聘实践以及政策制定者监管的系统基础设施提出建议。
这些建议中有些并不陌生——并且它们对多个政策目标的实现都颇有价值。这其实是一件好事。我们希望通过信号传递的视角,既能强调这些政策的合理性,又能缓解那些批评论调的锋芒。如果这些批评仍然被用作政治工具,可能会对教育部门造成严重损害。
我们并非无所不知。上述想法仅仅是对话的开端,而非终点。有些建议可能最终被证明无效或难以实施,但其中一两个或许能带来实质性改进——同时我们也欢迎其他新的想法。如果您希望发表正式回应、参与小组讨论,或只是分享您的看法,请随时与我们联系。
属于自己的项目
2021 年 6 月
几天前接儿子放学时,九岁的小家伙告诉我他迫不及待地想要回到家去续写他的故事。看着他眼睛里闪烁的期待,我不由得欢欣起来——这不仅是为他对创作的热情欣喜,更是为他找到了属于自己的创作方式。这种全身心地投入自己热爱之事的状态,就像在冰面上自由滑行,比起按部就班的行走,既充满乐趣,又事半功倍。
古往今来那些传世佳作,有多少是诞生于这样在创作的冰面上自由滑行的人?十之八九。
从事自己的项目有一些特别之处。我不会说你会更快乐。一个更好的词是兴奋,或投入。当事情进展顺利时你会感到快乐,但事情通常并非如此。当我在写文章时,大多数时候我都感到担心和困惑:担心文章会写得很糟糕,困惑是因为我在摸索一些我还看不太清楚的想法。我能用语言将它们确定下来吗?最终我通常可以做到,如果我花足够长的时间,但我从来不确定;最初的几次尝试经常会失败。
当事情进展顺利时,你会有幸福的时刻,但它们不会持续很久,因为接下来你就要面对下一个问题。那么为什么还要这样做呢?因为对于喜欢这种工作方式的人来说,没有什么其他的事情感觉如此正确。你感觉自己就像一只处于自然栖息地的动物,在做你注定要做的事情——也许并不总是快乐,但清醒而充满活力。
许多孩子都曾体验过独立完成项目时的兴奋感。然而,真正的挑战在于如何将这种体验与成年后的工作衔接起来。我们的社会习俗更是加剧了这种困难。我们习惯将「玩耍」和「爱好」与「工作」划分开来,认为它们本质上是不同的。对于一个正在搭建树屋的孩子来说,很难意识到这项活动与未来可能从事的建筑学或工程学之间存在着直接(尽管漫长)的联系。更糟糕的是,我们不仅没有指出这种联系,反而通过暗示孩子们的活动与真正的工作不同,掩盖了这种关联。[1]
我们没有告诉孩子们,他们搭建的树屋可能是通向未来职业的一条路径,反而告诉他们必须通过学校教育才能达到目标。遗憾的是,学校作业往往与个人项目大相径庭。它通常既不是一个真正的项目,也不是出于个人意愿。因此,随着学业变得越来越繁重,个人项目(如果还存在的话)往往沦为边缘化的活动。
想到所有高中生为了应付考试而放弃建造树屋,乖乖地坐在教室里学习达尔文或牛顿的理论,着实令人感到些许悲哀。因为实际上,使达尔文和牛顿名垂青史的工作,在本质上更接近于建造树屋,而非为考试而死记硬背。
如果要我在孩子们获得优异成绩和从事富有雄心的个人项目之间做选择,我会毫不犹豫地选择后者。这并非出于溺爱,而是因为我曾站在另一端,深知哪一个更具预测价值。当我为 Y Combinator 挑选创业项目时,申请人的成绩并不在我的考虑范围内。但如果他们曾经独立完成过项目,我会对此充满兴趣,渴望了解每一个细节。[2]
学校教育的现状可能是难以避免的。我并非主张我们必须彻底重塑教育体系(当然也不是说我们不应该这么做),而是希望我们能够认识到它对我们工作态度的影响——它引导我们趋向于那种尽责但缓慢的工作方式,常常以竞争为诱饵,而远离了那种富有创造性和自主性的「滑行」式工作。
有时候,学校作业会变成一个人自己的项目。每当我不得不写一篇论文时,那就会变成我自己的项目——除了讽刺的是在英语课上,因为在英语课上必须写的东西是如此虚假。当我上了大学开始上计算机科学课时,我必须编写的程序变成了我自己的项目。每当我在写作或编程时,我通常都在滑冰,从那以后一直如此。
那么,一个人自己的项目的边界到底在哪里呢?这是一个有趣的问题,部分原因是答案如此复杂,部分原因是涉及的内容如此重要。事实证明,工作可以从两个方面成为一个人自己的:1) 你是自愿做的,而不仅仅是因为有人告诉你要做,2) 你是自己一个人在做。
前者的边界相当清晰。非常关心自己工作的人通常对拉和推之间的区别非常敏感,工作往往会落入其中一个类别。但测试并不仅仅是看你是否被告知要做某事。你可以选择去做被告知要做的事。事实上,你可以比告诉你做这件事的人更彻底地拥有它。
例如,对大多数人来说,数学作业是他们被告知要做的事情。但对我父亲来说并非如此,他是一名数学家。我们大多数人认为数学书中的问题是一种测试或发展我们对每个部分所解释材料知识的方式。但对我父亲来说,问题才是重要的部分,而文本仅仅是一种注释。每当他得到一本新的数学书时,对他来说就像被给了一个谜题:这里有一套新的问题要解决,他会立即着手解决所有问题。
「一个项目是自己的」这个概念的另一层含义——独立完成项目——其界限则更为模糊。它与合作之间存在一个渐进的过渡。有趣的是,这种过渡可以通过两种不同的方式实现。一种合作方式是共同参与一个单一项目。例如,两位数学家在交谈过程中共同完成一个定理的证明。另一种方式是多人各自负责独立的项目,但这些项目最终能像拼图一样巧妙地组合在一起。比如,一个人负责撰写书籍内容,另一个人负责图形设计。[3]
这两种通向合作的路径自然可以相互结合。但在适当的条件下,独立项目所带来的兴奋感可以在相当长的时间内得以保持,而不会迅速消散在大型组织的繁忙工作中。事实上,成功组织的历史在某种程度上就是如何保持这种兴奋感的技巧发展史。[4]
最初的 Macintosh 开发团队就是这种现象的绝佳例证。Burrell Smith、Andy Hertzfeld、Bill Atkinson 和 Susan Kare 等人并非只是在被动执行命令。他们不是被 Steve Jobs 抽打的网球,而是被他点燃的火箭。尽管团队成员之间有大量合作,但他们似乎都能从个人层面体会到独立项目带来的兴奋感。
在安迪·赫茨菲尔德描述麦金塔电脑开发历程的著作中,他提到团队成员经常在晚饭后返回办公室,工作到深夜。那些从未体验过全身心投入令人兴奋项目的人,可能无法区分这种自发的加班和血汗工厂里被迫的超时工作,但这两种情况实际上是天壤之别。正因如此,固执地坚持「工作与生活平衡」这一观念是值得商榷的。事实上,「工作/生活」这个表述本身就存在误区:它预设了工作和生活是截然分开的。对那些认为「工作」就等同于枯燥乏味的例行公事的人来说,确实如此。但对于那些乐在其中的人来说,工作与生活的关系更像是密不可分,而非泾渭分明。我不愿从事任何不能让我全身心投入的工作。
诚然,当你参与像麦金塔这样具有开创性的项目时,更容易产生这种程度的工作热情。新颖的事物往往容易让人产生强烈的主人翁意识。这也解释了为什么程序员常常倾向于重写看似不需要重写的代码,或者为已有的功能重新编写自己的版本。这种行为有时会让管理者感到不安,而且从代码量的角度来看,这种做法很少是最优选择。但这并不总是出于傲慢或无知。从零开始编写代码能带来更大的成就感——这种成就感如此之大,以至于一个优秀的程序员最终可能会因此获得净收益,尽管这种做法看似浪费了大量代码。实际上,这可能是资本主义的优势之一,它鼓励这种重写。一家需要软件来完成某项任务的公司不能直接使用另一家公司已经开发的软件,因此必须自行开发,这往往会产生更好的结果。[5]
滑板运动与解决新问题之间存在着天然的契合,这是初创公司能够获得高回报的原因之一。未解决的问题不仅市场价值更高,而且在解决这些问题时,你还能获得额外的生产力提升。实际上,你会得到双重的生产力增长:在进行全新设计时,不仅更容易吸引到优秀的「滑板手」,而且他们还能全身心投入到「滑板」中。
史蒂夫·乔布斯通过观察史蒂夫·沃兹尼亚克,对「滑板手」有了深刻的认识。如果你能找到合适的人才,你只需要在宏观层面上指导他们。他们会自己处理细节,实际上,他们坚持如此。要让一个项目真正成为自己的,你必须拥有足够的自主权。你不能只是听命行事,或者被繁琐的官僚主义所拖累。
确保自主权的一个方法是完全没有上司。实现这一点有两种途径:自己成为老板,或者在工作之外开展项目。虽然在财务规模上处于两个极端,但初创公司和开源项目有很多共同点,包括它们往往都由「滑板手」来运营。事实上,这两个极端之间存在一个捷径:发现创业点子的最佳方式之一就是纯粹出于兴趣来做一个项目。
如果你的项目能够盈利,那么投入其中就容易得多。当项目无法盈利时,就会变得困难。而最大的挑战通常是保持士气。这就是成年人比孩子更难的地方。孩子们会全身心投入建造他们的树屋,不会担心是否在浪费时间,也不会去比较自己的树屋与他人的优劣。坦率地说,我们在这方面可以向孩子们学习很多。大多数成年人对「正经」工作的高标准并不总是对我们有利。
在个人项目中,最为关键的阶段无疑是开端:就是从「觉得做某事很酷」到「实际着手去做」的那个转折点。恰恰在这个时候,过高的标准不仅毫无益处,反而会产生负面影响。诚然,有极少数人倾向于同时启动过多新项目,但我推测,更多的人是因为害怕失败而裹足不前,错过了原本可能成功的机会。
虽然我们小时候可能无法意识到,搭建树屋这样的活动其实是通向成年项目的一个起点,但作为成年人,我们至少可以认识到我们当前的项目是从儿时的树屋一路延伸而来的。还记得孩提时代开始新事物时那种无忧无虑的自信吗?要是能重拾那种自信,将会是多么强大的力量啊。
成年后,我们可能更难保持那种天真的自信,但我们往往更清楚自己在做什么。孩子们常常是在不知不觉中被推着从一种活动转向另一种活动,而我们对不同类型的工作有更多了解,也能更好地掌控自己要做什么。理想的状态是,我们能够兼具两方面的优点:在选择自己的项目时深思熟虑,在开始新项目时保持轻松自信。
注释
[1] 「爱好」这个词颇为有趣。如今,它指的是不那么「正经」的工作——一种不该被严格评判的活动。但最初,它泛指一种普遍意义上的痴迷(甚至可以是政治观点),就像孩子骑木马一样,人们会全身心地投入其中。很难说它近来更狭义的含义是好是坏。诚然,有很多「假阳性」——许多最初被视为单纯爱好的项目最终变得举足轻重。但另一方面,这个概念为那些处于早期、貌似不起眼的项目提供了宝贵的庇护。
[2] 虎式父母,如同许多父母一样,正在为一场已经过时的战争而奋斗。在过去,当成功之路是通过攀登预设阶梯来获取资格证书时,成绩确实更为重要。不过,他们的策略仍专注于成绩倒也是不幸中的万幸。试想,如果他们侵入项目领域,通过强迫孩子参与而让他们对这类工作产生厌恶,那将是多么可怕的情况。成绩本就是一个严酷而虚假的世界,父母的干预并不会造成太大伤害,但个人项目则是一件更为微妙、私密的事情,很容易受到破坏。
[3] 「孤独天才」这一概念之所以存在诸多争议,部分原因在于个人项目与团队合作之间那条复杂而模糊的界限。实际上,人们以各种不同的方式进行合作(或选择不合作),但孤独天才的概念绝非空穴来风。它蕴含着一个与特定工作方式密切相关的核心真理。
[4] 合作同样具有强大的力量。理想的组织应该能够以最小化损害的方式结合合作与个人所有权。有趣的是,企业和大学院系从相反的方向趋近这一理想:企业强调合作,偶尔也会招募并允许「独行侠」自由发挥;而大学院系则坚持独立研究能力(按惯例被视为自由发挥,无论实际如何),他们雇佣的人可以自主选择合作程度。
[5] 如果一家公司能够设计出这样的软件系统,使最优秀的新进程序员总能获得一张白纸,它就可能拥有永葆青春的秘诀。这或许并非不可能实现。假如你有一个定义了足够清晰规则的软件框架,个别程序员就可以编写自己的参与者程序。
鸣谢 Trevor Blackwell、Paul Buchheit、Andy Hertzfeld、Jessica Livingston 和 Peter Norvig 对本文草稿的审阅。
文凭的终结
2008 年 12 月
几个月前,我读到一篇《纽约时报》关于韩国补习机构的文章,其中说道
能否进入正确的大学可以成就或毁掉一个有抱负的韩国青年。
一位家长补充道:
「在我们国家,高考决定了一个人 70% 到 80% 的未来。」
这听起来多么老套,真是令人震惊。然而当我还在高中时,这作为对美国的描述似乎并不太离谱。这意味着这里的情况一定起了变化。
现在,在美国,人们的生活轨迹似乎比 25 年前更少由文凭决定,而更多由表现决定。你上哪所大学仍然重要,但不像以前那样重要了。
发生了什么?
通过文凭来评判人在当时是一种进步。这种做法似乎始于中国,从 587 年开始,国家官吏的候选人必须参加一项关于古典文学的考试。[1]这也是一项财富测试,因为它所测试的知识是如此专业,以至于需要多年昂贵的培训才能通过。但尽管财富是通过的必要条件,却不是充分条件。以 587 年世界其他地区的标准来看,中国的制度非常开明。欧洲人直到 19 世纪才引入正式的公务员考试,而且即使在那时,他们似乎也受到了中国榜样的影响。
在文凭之前,政府职位主要是通过家族影响力获得的,如果不是公然贿赂的话。通过考试成绩来评判人是一个巨大的进步。但绝不是一个完美的解决方案。当你那样评判人时,你往往会得到补习机构——这在明朝的中国和 19 世纪的英国就和现在的韩国一样普遍。
补习机构实际上是教育公平体系中的一个缺口。文凭制度本是为了阻断代际间权力的直接传递,而补习机构则代表着这种权力在寻找突破口。补习机构把上一代人的财富转化为下一代人的文凭。
这种现象难以根除,因为补习机构会不断调整以适应考试内容的变化。当考试范围狭窄且可预测时,就会出现传统模式的补习机构,比如为英国桑赫斯特军校(相当于英国的西点军校)培养候选人的机构,或者现在美国学生参加的 SAT 考试辅导班。随着考试范围的扩大,补习机构也随之扩展。就像现在的预科学校一样,为中国古代科举考试做准备也需要多年时间。但所有这些机构的存在目的都是一样的:钻制度的空子。[2]
历史告诉我们,在其他条件相同的情况下,一个社会的繁荣程度与其防止父母直接影响子女成功的能力成正比。父母间接帮助孩子是件好事——比如,帮助他们变得更聪明或更自律,从而让他们更容易成功。问题出在父母使用直接手段时:当他们能够用自己的财富或权力来弥补孩子能力的不足时。
只要有可能,父母往往会这么做。父母愿意为孩子付出生命,所以他们为了孩子而将一切顾虑抛之脑后也不足为奇。尤其是当其他父母都这样做的时候。
遏制这种做法有双重好处。不仅社会能得到「最适合岗位的人」,而且父母的野心也会从直接干预转向间接影响——真正致力于把孩子培养好。
然而,我们必须认识到,要遏制父母为子女谋求不正当优势的行为是极其困难的。这触及了人性中最强大的驱动力之一。我们不应天真地认为简单的解决方案就能奏效,就像我们不会指望用简单的方法就能杜绝毒品进入监狱一样。
解决这个问题的明显方法是提高文凭的含金量。如果当前社会使用的测试存在漏洞,我们可以研究人们钻空子的方法,并努力堵住这些漏洞。补习机构恰恰揭示了大多数漏洞的所在。同时,它们也能反映我们的努力是否有效:当补习机构的受欢迎程度下降时,就说明我们取得了进展。
一个更全面的解决方案是推动提高透明度,尤其是在大学录取这样的社会关键节点上。在美国,这一过程仍然呈现出诸多腐败的迹象。例如,「校友子女优先」政策。官方说法是这一身份并不占太大权重,仅用于在同等条件下决定录取与否:申请者先按能力分组,校友子女身份只在申请者在录取线附近时才起作用。但实际上,大学可以通过调整这个「边缘组」的大小,来随意放大或缩小校友子女身份的影响力。
通过逐步削弱对文凭的滥用,理论上可以使其更加严密可靠。但这注定是一场旷日持久的斗争,尤其是当负责考试的机构本身并不真心希望文凭变得滴水不漏时。
幸运的是,还有一个更好的方法来阻止权力在代际间直接传递。与其试图让文凭更难被钻空子,不如让文凭本身变得不那么重要。
让我们思考一下文凭的本质用途。从功能上讲,它们是预测个人表现的一种方式。如果能直接衡量实际表现,文凭就变得多余了。
那么,文凭主义为何会应运而生?为什么我们不直接评估实际表现呢?让我们追溯文凭主义的起源:它诞生于大型组织的人才选拔过程中。在大型组织里,个人表现难以准确衡量,而衡量的难度越大,预测表现就越显重要。假如组织能够快速、低成本地评估新人表现,他们就无需过分关注文凭了。他们可以广开门路,择优录用。
然而,大型组织难以做到这一点。但市场中众多的小型组织却能接近这一理想状态。市场会保留优秀的组织,淘汰表现不佳的。随着组织规模缩小,这种机制越发接近于留下优秀个人、淘汰平庸者。因此,在其他条件相同的情况下,由更多小型组织构成的社会,对文凭的重视程度会相对较低。
这正是美国当前的发展趋势。这也解释了为何那些来自韩国的言论听起来如此老套。他们描述的是几十年前的美国经济模式——由少数几家大公司主导。在那种环境下,雄心勃勃者的职业发展路径是加入大公司并一步步攀升至顶层。彼时,文凭格外重要。在大型组织的文化中,精英背景往往成为一种自我实现的预言。
然而,这一套在小公司中行不通。即便你的同事起初被你的文凭所折服,如果你的实际表现不尽如人意,你们很快就会分道扬镳。因为公司可能会因此倒闭,人员也会随之四散。
在小型公司主导的世界里,实际表现成为唯一重要的衡量标准。创业公司在招聘时根本不在乎你是否拥有大学文凭,更不用说是哪所大学的。他们只关注你的实际能力。事实上,即便是在大型组织中,这也应该是唯一值得考虑的因素。文凭之所以长期以来备受推崇,是因为社会中的大型组织往往掌握着最大的权力。但至少在美国,这些组织不再像过去那样独揽大权,恰恰是因为他们无法准确衡量(进而无法恰当奖励)个人的实际表现。既然可以直接从市场获得回报,为什么还要花上二十年时间在公司内部慢慢攀升呢?
我承认,我所观察到的变化可能比大多数人感受到的更加剧烈。作为一家早期风险投资公司的合伙人,我的角色就像是一个跳伞教练,推动人们从注重文凭的旧世界跃入注重表现的新世界。我是这种变革的推动者,但我并不认为这种变化只是我的想象。25 年前,一个雄心勃勃的人想要直接接受市场的评判并非易事。你必须通过上级的层层筛选,而他们往往会受到你的学历背景的影响。
是什么让小型组织能在美国获得成功?我至今仍不能完全确定。创业公司无疑是其中的重要因素。小型组织能比大型组织更快地发展新想法,而新想法的价值正在与日俱增。
但我认为,仅凭创业公司还不足以解释从重视文凭到重视实际表现的全面转变。我的朋友 Julian Weber 告诉我,在 1950 年代,当他在纽约的一家律师事务所工作时,助理律师的薪酬远低于今天的水平。那时的律师事务所完全不会假装按照员工工作的实际价值来发放薪酬。薪酬完全取决于资历。年轻员工正在付出他们的「学费」。他们需要等到以后才能获得回报。
这一原则在工业企业中同样盛行。上世纪 70 年代,我父亲在西屋电气工作时,他的一些下属因为资历较长,薪水反而比他还高。
如今,公司越来越需要按市场价格支付员工薪酬。这主要有两个原因:首先,员工不再相信公司能够兑现长期承诺的回报。毕竟,谁愿意为了积累未来的回报,在一家可能破产或被收购后抹去所有隐性义务的公司辛勤工作呢?其次,一些公司打破常规,开始给年轻员工开出高额薪酬。这种现象在咨询、法律和金融领域尤为明显,并催生了「雅皮士」这一群体。如今,「雅皮士」这个词已经很少被使用了,因为 25 岁就拥有财富不再是什么稀奇事。但在 1985 年,看到一个 25 岁的专业人士能买得起一辆全新的宝马是如此新鲜,以至于专门创造了一个新词来形容他们。
典型的雅皮士通常在小型机构工作。他们不会为 General Widget 这样的大企业效力,而是在为这些大企业处理并购业务的律师事务所,或者承销其债券的投资银行工作。
创业公司和雅皮士这两个概念大约在 20 世纪 70 年代末、80 年代初同时进入美国人的词汇库。我认为两者之间并无直接的因果关系。创业公司的兴起是因为技术变革速度过快,大公司已经无法压制小公司的发展。雅皮士的崛起似乎更多源于大公司运作方式在社会惯例(可能还包括法律)层面的变革,而非受创业公司的启发。然而,这两种现象很快融合在一起,产生了一个如今看来再平常不过的原则:给朝气蓬勃的年轻人支付市场价格的薪酬,同时从他们那里获得相应的高绩效表现。
大约在同一时期,美国经济从困扰了整个 70 年代的低迷状态中迅速复苏。这两者之间是否存在联系?我不敢妄下定论,但当时确实给人这种感觉。仿佛有一股巨大的能量被释放出来。
那些担心自身竞争力的国家关注国内创业公司数量无疑是正确的。但如果能深入探究背后的原理,他们会做得更好。他们是否允许那些充满活力的年轻人获得与其工作相称的市场回报?年轻人是一个试金石,因为当人们的回报不与表现挂钩时,必然会变成按资历来论薪酬。
只需要在经济体中建立几个按实际表现付酬的桥头堡就足够了。绩效评估就像热量一样会逐渐扩散。如果社会的某一部分在绩效评估方面做得比其他部分更好,它往往会推动其他部分不断进步。如果那些年轻但聪明且有干劲的人通过创办自己的公司能赚得比在现有公司工作更多,现有公司就会被迫提高薪酬来留住人才。这样,市场价格就会逐渐渗透到每个组织,甚至政府部门。[3]
绩效评估的推广甚至会迫使那些颁发文凭的机构也不得不跟上潮流。这让我想起小时候,我常常命令妹妹去做她本来就要做的事来捉弄她。当文凭被实际表现取代时,这些曾经的「把关人」,顶多也就混成我当年那种自嗨的指挥官。一旦颁发文凭的机构玩不动「盖章即真理」的游戏,他们就必须更加努力地去预测未来。
文凭制度是比贿赂和裙带关系更进一步的做法。但这并不是终点。还有一个更好的方法来阻断代际间权力的传递:鼓励经济向由更多、更小的单位组成的方向发展。这样,你就可以直接衡量文凭所预测的东西。
无论左派还是右派,都不赞同权力在世代间的传递。然而,事实证明,右派所推崇的市场力量比左派不得不依赖的文凭证书,更能有效地阻止这种现象的发生。
文凭证书主导的时代始于 20 世纪后期,当时大型组织的影响力达到了顶峰。如今,我们似乎正在步入一个以测量为基础的新时代。这种新模式之所以能够如此迅速地发展,是因为它的效果远胜于旧模式。目前来看,这种趋势并没有放缓的迹象。
注释
[1] Miyazaki, Ichisada (Conrad Schirokauer trans.), China's Examination Hell: The Civil Service Examinations of Imperial China, Yale University Press, 1981.
古埃及的文士也需要参加考试,但那更类似于任何学徒都可能需要通过的一种技能测试。
[2] 当我说预科学校的存在理由是帮助学生进入更好的大学时,我指的是最狭义的含义。我并不是说这就是预科学校的全部功能,而是说如果它们对大学录取完全没有影响,对它们的需求就会大大减少。
[3] 然而,累进税率倾向于削弱这种效应,因为它缩小了优秀测量者和糟糕测量者之间的差距。
感谢 Trevor Blackwell、Sarah Harlin、Jessica Livingston 和 David Sloo 阅读本文的草稿。
好的和坏的拖延
2005年12月
我认识的那些最优秀人士都是重度拖延症患者。那么,拖延症会不会并不总是坏事呢?
多数探讨拖延的文章都在教授拖延症的「治疗」之法。但严格来说,拖延无法根治——世间事务无穷无尽,你专注某件事时,必然在忽略其他的事情。因此关键不在于消除拖延,而在于学会高质量拖延。
根据你在该做某事却去做了什么,拖延可分为三种:(a) 什么事都不做,(b) 做些较无关紧要的事,(c) 做更重要的事。最后一种,我称之为「良性拖延」。
这正是「心不在焉的教授」的写照:他可能忘记刮胡子、忘记吃饭,甚至走路时都不看路,因为他的大脑正在思考某个有趣的问题。他之所以对日常琐事视而不见,是因为他的心思正全然投入在另一个“更重要”的世界里。
这就是我认识的最令人印象深刻的人都是拖延者的意义。他们是 C 型拖延者:他们推迟做小事以做大事。
什么是"小事"?大致上,是那些在你的讣告中绝对不会被提到的工作。在当时很难说什么会变成你最好的作品(是你关于苏美尔神庙建筑的巨著,还是你用笔名写的侦探惊悚小说?),但有一整类任务你可以安全地排除:刮胡子、洗衣服、打扫房子、写感谢信——任何可能被称为差事的事情。
好的拖延是避免做差事而做真正的工作。
在某种意义上是好的,至少。那些想让你做差事的人不会认为这是好的。但如果你想完成任何事情,你可能不得不惹恼他们。看起来最温和的人,如果他们想做真正的工作,在避免差事方面都有一定程度的无情。
某些琐事,比如回复信件,如果你置之不理,它们可能就会自行消失(也许还会顺便带走一些朋友)。而另一些,如修剪草坪或报税,拖延只会让情况变得更糟。按理说,对于后一类事务,拖延不应该是个好办法。你终究要完成这些任务,为什么不(就像逾期通知上常说的那样)立即行动呢?
然而,即使对于这类不得不做的事,拖延之所以仍然可行,是因为真正的工作需要两个琐事所不具备的条件:充裕的时间和恰当的心境。如果你突然对某个项目灵感迸发,在接下来的几天里搁置所有原定计划全身心投入其中,可能反而是件好事。诚然,当你最终处理那些被搁置的琐事时,可能会耗费更多时间。但如果你在这几天里取得了显著成果,从整体生产力来看,你仍是赢家。
事实上,这可能不仅仅是程度上的差异,而是本质上的不同。有些类型的工作可能只能在灵感涌现时,通过长时间专注不间断的努力才能完成,而非循规蹈矩地在预定的时间段内完成。经验似乎也印证了这一点。当我回想那些成就伟业的人时,我脑海中浮现的并非他们按部就班地完成待办事项,而是他们悄悄溜走去探索新想法的画面。
相反,强迫某人按部就班地处理琐事必然会限制其生产力。中断带来的代价不仅仅是耗费的时间本身,更在于它将前后的时间段都一分为二。你可能只需要每天打断某人几次,就足以使他们完全无法应对复杂的问题了。
我常常思考为什么创业公司在最初阶段——仅有几个人在公寓里工作时——效率最高。主要原因可能是此时还没有人来打扰他们。理论上,当创始人终于筹到足够的资金来雇人分担工作时,这应该是件好事。但实际上,过度工作可能比被频繁打断要好。一旦你用普通的办公室职员——那些容易拖延的B型人格——稀释了创业团队,整个公司就会开始与他们的节奏同步。他们的工作容易被打断,很快你也会变成这样。
琐事之所以能如此有效地扼杀伟大项目,以至于许多人故意用它来达到这个目的。比如,一个下定决心要写小说的人突然会发现家里需要大扫除。那些最终没能写出小说的人,并不是整天坐在空白的纸张前一字不写。相反,他们忙于喂猫、为公寓采购、与朋友喝咖啡、查看电子邮件。他们说:「我没时间工作。」确实如此,因为他们已经刻意安排好了。
(还有一种变体是声称没有合适的工作场所。解决方法是去参观那些名人曾工作过的地方,看看它们有多么不尽人意。)
这两种借口我都用过。在过去 20 年里,我学会了许多促使自己工作的技巧,但即便如此,我现在也不能保证每次都能战胜拖延症。有些日子我能完成实际的工作,而其他日子则被琐事吞噬。我清楚这通常是我的错:我允许琐事占据整天,以逃避面对某些棘手的问题。
最危险的拖延形式是那种未被察觉的B型拖延,因为它给人一种并非在拖延的错觉。你觉得自己在「完成任务」,只是完成的是错误的任务。
任何只专注于划掉待办事项清单上的内容的反拖延建议,如果不考虑待办事项清单本身可能是一种 B 型拖延的形式,那么这种建议不仅不完整,而且会产生误导。事实上,「可能」这个词太过保守了。几乎每个人的待办事项清单都是如此。除非你正在致力于你能做的最重要的事情,否则你就是在进行 B 型拖延,不管你完成了多少任务。
在 Richard Hamming 的著名文章《你和你的研究》中(我向所有有抱负的人推荐这篇文章,不论他们从事什么工作),他建议你问自己三个问题:
-
你所在领域最重要的问题是什么?
-
你正在解决其中之一吗?
-
如果不是,为什么?
Hamming 在贝尔实验室工作时就开始提出这些问题。理论上,那里的每个人都应该能够研究他们领域中最重要的问题。也许不是每个人都能在世界上留下同样显著的印记;我不确定;但无论你的能力如何,总有能够挑战和拓展它们的项目。因此,Hamming 的练习可以概括为:
你能从事的最有价值的工作是什么,为什么你没有去做?
大多数人会本能地回避这个问题。我自己也会回避它;当我在页面上看到这个问题时,我会迅速转向下一句话。Hamming 曾经真的四处向人们提出这个问题,这并没有让他变得受欢迎。但这是任何有抱负的人都应该面对的问题。
问题在于,你可能会因为这个问题而陷入一个巨大的挑战中。要做出优秀的工作,仅仅找到好的项目是不够的。一旦你找到了它们,你还必须要推动自己去做,而这可能会很困难。问题越大,让自己开始着手解决就越困难。
毋庸置疑,人们难以攻克特定问题的主要原因是他们对此缺乏兴趣。特别是年轻人,常常会发现自己在做一些并不真正喜欢的事情——或许是因为这些事看起来很有分量,或者是被指派的任务。大多数研究生都不得不钻研一些他们并不真正感兴趣的大课题,这就使得研究生院成为了拖延症的代名词。
即便你喜欢自己正在做的事,相较于大问题,你也更容易驱使自己去解决小问题。为什么会这样呢?为什么解决大问题如此艰难?其中一个原因是你可能在可预见的未来得不到任何回报。如果你做的事情能在一两天内完成,你很快就能获得成就感。但如果回报遥遥无期,它就显得不那么真实了。
人们不愿意承担大项目的另一个原因,颇具讽刺意味的是,源于对浪费时间的恐惧。如果失败了怎么办?那样的话,所有投入的时间都将付诸东流。(实际上可能并非如此,因为在艰难项目上的努力几乎总能有所收获。)
然而,大问题的困难之处不仅仅在于它们无法即时带来回报,还可能会耗费大量时间。如果仅仅如此,它们也不会比去拜访岳父母更让人却步。事实上,问题远不止于此。大问题是可怕的。面对它们几乎会带来身体上的痛苦。这就像把一台真空吸尘器连接到你的想象力上。你所有的初始想法瞬间被吸走,你再也想不出任何新点子,而这台吸尘器还在不停地运转。
面对重大问题时,我们不应直接面对。相反,我们需要采取一种迂回的方式来接近。但关键在于找准角度:你要足够直面这个大问题,以便感受到它散发出的激励,却又不至于被其压倒。一旦开始行动,你就可以逐步调整角度,就像一艘起航的帆船能够逐渐向上风航行一样。
如果你想完成一些重大的事业,你可能需要一些小技巧来激励自己。你可以从小事做起,让它们逐渐发展成大事;或者逐步增加工作的规模;又或者与他人合作,分担压力。依赖这些技巧并不意味着你软弱。事实上,最杰出的成就往往就是通过这种方式实现的。
在与那些成功投身于重大事业的人交谈时,我发现他们都会忽视一些琐事,并为此感到愧疚。但我认为他们不应该有这种感觉。世界上的事情总是多得做不完。因此,专注于最重要的工作难免会导致一些琐事被搁置。为此感到自责似乎是不必要的。
我认为克服拖延的方法不是被待办事项清单所驱使,而是让内心的热情来引导你。专注于一个你真正热爱的有抱负的项目,全力以赴地向目标迈进,你自然会把该搁置的事情搁置。
感谢 Trevor Blackwell、Jessica Livingston和Robert Morris对本文草稿的审阅。
如何做你所爱
2006 年 1 月
要出色地完成一件事,你必须真正热爱它。这个观点并不新颖,我们可以用四个字概括它:「做你所爱」。然而,仅仅向人们传达这个理念是远远不够的。践行「做你所爱」这一理念实际上相当复杂。
这个观念与我们大多数人从小所受的教育大相径庭。在我小的时候,工作和乐趣似乎天生就是对立的。生活仿佛只有两种状态:一些时间里,成年人强迫你做某些事情,这就是所谓的工作;而剩余时间你可以自由支配,这便是玩耍。有时,成年人要求你做的事情也会很有趣,就好像玩耍偶尔也会不愉快一样——比如你不小心摔倒受伤。但除了这些罕见的例外,工作基本上就等同于「不好玩」。
这种对立似乎并非偶然。它暗示我们,学校之所以枯燥乏味,正是因为它在为将来成年后的工作做准备。
于是,世界上的人被分为两类:成人和孩子。成人,仿佛背负着某种诅咒,不得不工作。孩子们虽然不用工作,但必须上学,而上学则是一种为了让我们适应未来真正的工作而设计的简化版本。尽管我们不喜欢上学,但所有成人都异口同声地说,成人的工作更加糟糕,相比之下我们已经算轻松了。
特别是老师,似乎都不约而同地认为工作就是不愉快的。这并不奇怪:对他们中的大多数人而言,工作确实乏味无趣。为什么我们必须记下各个州府的名称,而不是去玩躲避球?就像老师要照看学生而无法躺在沙滩上享受日光浴一样,你不能总是随心所欲地做自己想做的事。
我并不是说应该放任孩子们为所欲为。我们确实可能需要督促他们做一些事,但当我们期待孩子完成某些看似单调的课业时,也许明智的做法是告诉他们:乏味并非工作的本质,事实上,他们现在之所以必须做一些无聊的东西,是为了将来能够从事更有趣的事。[1]
记得在我 9 或 10 岁的时候,父亲曾告诉我,长大后我可以成为任何想成为的人,无论职业,只需我乐在其中。这番话给我留下了深刻的印象,因为它听起来如此与众不同。就像有人告诉你可以使用「干水」一样令人费解。不论我当时如何理解父亲的话,我都不认为他的意思是工作可以真的像玩耍一样有趣。直到多年后,我才真正体会到其中的深意。
工作
到了高中,我们开始接触到真正的工作。有时,成年人会与我们谈论他们的工作,又或者我们去到他们的工作场所参观。普遍的看法是,这些成年人都热爱自己的工作。现在回想起来,我想可能只有一个人是真正喜欢自己的工作:那位私人飞机驾驶员。但我并不觉得银行经理会乐在其中。
这些成年人之所以表现得好像喜欢自己的工作,主要原因可能是中上阶级的社交惯例使然。公开表示厌恶自己的工作,不仅会影响职业发展,还会被视为一种社交失仪。
为什么人们习惯于假装喜欢自己的工作呢?这个问题的答案就在文章的开头。如果只有喜欢某事才能把它做好,那么最成功的人自然都会喜欢自己的工作。中上层阶级的这种传统正源于此。正如美国很多家庭中的[椅子](http://images.google.com/images?q=louis xv chair),使用者浑然不知它们的源头可以追溯到 250 年前为法国国王设计的椅子。人们传统的工作态度同样如此,在不知不觉中,这些态度正是对那些取得过伟大成就之人的行为方式进行了无数次的效仿。
这是制造认知撕裂的完美配方。当孩子长到可以思考未来职业的年龄时,大多数人对热爱工作的概念已经有了错误的认识。学校教育让他们将工作视为一种不愉快的义务。据说,拥有一份工作比做学校作业更加令人不快。然而,所有的成年人却都声称喜欢自己的工作。难怪孩子会想:「我和这些人不一样;我不适合这个世界。」
事实上他们被告知了三个谎言:他们在学校里被教导认为是工作的东西并非真正的工作;成年人的工作不(必然)比学校作业更糟糕;他们周围的许多成年人嘴上说喜欢自己的工作,实则是在撒谎。
最危险的骗子可能是孩子们的父母。如果你像许多人一样,从事一份无聊的工作来给你的家庭提供高水平的生活,就可能让孩子们也认为工作本身就是枯燥的。[2] 或许在这种情况下,如果父母能不显得那么「无私」,对孩子们来说会更好。一个以身作则热爱工作的家长,可能要比一栋昂贵的房子对他们孩子的帮助更大。[3]
直到上大学后,我才终于将工作的意义从谋生的概念中分离出来。此时重要的问题不再是如何赚钱,而是从事怎样的工作。理想情况下,这两者应是一致的,但从一些著名的极端案例(如爱因斯坦在专利局工作)中可以看到,它们并非完全等同。
现在,我对工作的定义是:为世界做出一些原创性的贡献,并在这个过程中不至于挨饿。但经过多年习惯的浸染,我对工作的看法仍然包含了大量的痛苦成分。工作似乎仍然需要自律,因为只有艰难的问题才能产生伟大的结果,而艰难的问题不可能真正有趣。无疑,人们必须强迫自己去应对这些难题。
如果你认为某事理应带来痛苦,那么当你行驶在错误的路上时,可能就不太容易察觉。这或许就是我研究生经历的最佳注脚。
界限
你应该有多喜欢你所做的事?除非你清楚这一点,否则你不会知道何时该停止寻找。如果你像多数人一样,低估了它,你往往会过早放弃追寻。最终,你将从事一些由父母选择的工作,或是那些能给你带来金钱、声望的职业——又或纯粹因惰性而安于现状。
在此我们设定一个「上限」:「做你所爱」并不意味着你应该只做此刻最想做的事。即便是爱因斯坦,可能也有想喝杯咖啡的时候,但他会提醒自己先完成手头的工作。
过去,每当读到有人如此热爱自己的工作,以至于觉得没有什么比工作更让他们向往的事情时,我都会感到困惑。因为我似乎找不到任何能如此令我着迷的工作。假设让我选择:(a) 接下来一小时专注于工作,或 (b) 瞬间传送到罗马闲逛一小时,有什么工作能让我更倾向于选择前者吗?老实说,并没有。
然而,事实是几乎任何人在任何时候都更愿意在加勒比海度假、享受鱼水之欢或品尝美食,而非攻克难题。「做你所爱」这个原则是建立在一定时间跨度上的。它指的不是让你此刻最快乐的事,而是在更长的时期内(比如一周或一个月)让你最幸福的事。
没有成果,纯粹的享乐终将失去吸引力。躺在沙滩上一段时间后,你不可避免地会感到厌倦。如果想维持快乐,你必须投身于某些事业。
作为「下限」,你对工作的热爱程度至少要超过任何无益的娱乐活动。你应该如此热爱自己的工作,以至于「业余时间」这个概念在你看来都是错误的。这并不意味着你要将所有时间都投入工作。在你累了并开始搞砸之前,你只能工作这么多。此时,你需要做点别的事,甚至是不费脑力的活动。但你不应该把这些休闲时光视为奖赏,也不应当将工作时的痛苦视为为此而付出的代价。
我之所以设立这个「下限」,是出于实际考虑。如果你的工作不是你最喜欢做的事,你很可能会遇到严重的拖延问题。你将不得不强迫自己工作,而这种被迫的工作往往会导致明显低劣的结果。
要获得真正的幸福,我认为你必须投入到既能让你享受又能让你引以为豪的事。你要能在完成后由衷地赞叹:「哇,这真是太酷了!」这并不意味着你必须创造出什么实物。即使是学会操纵三角滑翔翼,或熟练地掌握一门外语,也足以让你(至少在一段时间里)感到「哇,这真是太酷了!」关键在于要有一个检验标准。
我认为阅读相较于这个标准稍有不及。除了一些数学和自然科学的书籍,大多数书籍并没有检验你阅读效果的标准,这就是为什么单纯的阅读并不能给人一种真正在工作的感觉。你需要对所读的内容付诸实践,才能感到富有成效。
我认为最好的检验方法是 Gino Lee 教给我的:试着做一些能让你的朋友「惊叹」的事情。不过,这个方法可能要到 22 岁左右才能真正发挥作用,因为在此之前,大多数人还没有遇到足够多的人来筛选出真正志同道合的朋友。
警示
我认为,你千万不要在乎朋友以外任何人的看法。不必担心声望,声望不过是外界的评价。当你可以征询自己敬重之人的意见时,考虑那些素不相识的人的看法又有何意义呢?[4]
这个建议说起来容易做起来难,尤其是当你还年轻时。[5] 声望就像一个强大的磁场,它甚至能扭曲你对自己兴趣的认知。它驱使你去追求的,并非你真正喜欢的,而是你「希望」自己会喜欢的东西。
这就是为什么有人会尝试写小说。他们喜欢阅读小说,而且注意到有人能通过写小说获得诺贝尔奖。他们心想,还有什么比成为一个小说家更棒的呢?然而,仅仅是喜欢「成为小说家」这个想法远远不够;如果你想在这方面有所成就,你必须热爱创作小说的实际工作——你需要喜欢编织精致复杂的虚构故事。
声望不过是如化石般固化的灵感。只要你将某件事做到极致,声望便会随之而来。许多我们如今推崇备至的事物,在最初并非如此。就好比爵士乐——虽然几乎任何成熟的艺术形式都是这样。因此,专注于「做你所爱」,声望自会随之而至。
声望对雄心勃勃的人来说尤其危险。如果你想让有抱负的人浪费时间在琐事上,只需用声望作为诱饵。这就是为什么人们会去做发表演讲、写序言、加入委员会、担任部门主管之类的事。避开任何能带来声望的任务,也许是一个简单的好办法。如果这项工作本身不是糟糕透顶,它就不需要利用声望来吸引人。
同样地,如果你对两种工作同样欣赏,但其中一种更有声望,你或许应该选择另一种。毕竟声望或多或少会影响你对那些工作的看法。因此,假使两者在你看来并无高下之分,你或许对声望较低者有更为诚挚的欣赏。
另一个容易让人误入歧途的重要因素是金钱。金钱本身并没有那么危险。有抱负的人通常不会被那些报酬丰厚却招人唾弃的工作吸引,比如电话推销、倚门卖笑或人身伤害诉讼。这类工作最终由那些「只是为了谋生」的人来做。(提示:避开任何从业者这样说的领域。)真正的危险在于金钱与声望的结合,例如公司法或医学领域。对于年轻人来说,一个相对安全、富足,且自带一定声望的职业,会成为一个危险的诱惑,特别是当他们还没有深入思考自己真正热爱什么的时候。
检验一个人是否真正热爱自己的工作的方法是:即使不为此获得报酬,甚至需要另谋他职来维持生计,他们是否仍会坚持做这份工作。试问,有多少企业律师愿意继续从事他们目前的工作,假使这份工作必须无偿完成,只能在业余时间进行,并且他们还得兼职做服务员来养活自己?
这项测试在选择不同类型的学术工作时尤其有用,因为不同领域在这方面存在巨大差异。大多数优秀的数学家即使没有数学教授的职位,也会继续研究数学;而在光谱的另一端,能否获得教职才是主要驱动力:人们宁愿成为英语教授也不愿在广告公司工作,而发表论文正是争取这类职位的手段。即便没有数学系,数学研究也会继续进行;但正是英语专业的存在,以及由此产生的教学岗位,才催生了那些数以千计关于Conrad小说中性别与身份认同的枯燥论文。没有人会纯粹为了乐趣而做这种研究 。【译注:这里提到的 Conrad 应为约瑟夫·康拉德(Joseph Conrad)。约瑟夫·康拉德是一位著名的波兰裔英国小说家,以其深刻的心理描写和对殖民主义、道德困境等主题的探讨而闻名。他的作品,如《黑暗之心》(Heart of Darkness)、《吉姆爷》(Lord Jim) 等,经常被文学研究者分析,探讨其中的性别、身份认同、殖民主义、人性等复杂主题。】
父母的建议往往会偏重金钱因素。可以肯定地说,相较于那些立志成为医生却被父母期待成为小说家的大学生,现实中有更多大学生渴望成为小说家,而他们的父母却希望子女从医。孩子们可能认为他们的父母「物质」,但事实并非总是如此。所有家长对子女总会比对自己更为保守,因为作为父母,他们需要分担的风险远多于收获的喜悦。当八岁幼子决意攀爬参天大树,或是花季女儿选择与街头痞子约会,父母无从体验其中的刺激快感;但若儿子坠落受伤,或女儿未婚先孕,后果却需父母共同承担。
自律
在如此强大的力量误导我们的情况下,我们难以发现自己真正喜欢的工作也就不足为奇了。大多数人在童年时就注定要接受「工作 = 痛苦」的公理。而那些逃脱这一命运的人,又几乎都会被声望或金钱所诱惑,陷入另一困境中。究竟有多少人能够发现自己真正热爱的工作?在数十亿人中,可能只有几十万。
找到自己热爱的工作绝非易事;正因如此困难,才导致寥寥无几的人能够做到。因此,千万不要低估这项任务的挑战性。即使你尚未成功,也不必灰心沮丧。事实上,如果你能坦然承认自己的不满,你就已经领先于那些仍在自欺欺人的大多数了。若你周围的同事声称他们热爱那些你认为毫无价值的工作,很可能只是他们在自我欺骗。虽然不能断言一定如此,但可能性极高。
虽然完成伟大的工作所需的自律比人们想象的要少——因为成就伟业的秘诀在于找到你极其热爱的事情,以至于你根本不需要强迫自己去做它——但寻找你所热爱的工作通常需要自律。有些幸运儿在 12 岁就清楚自己想做什么,然后人生就像在轨道上滑行一般一帆风顺。但这似乎是只是例外。更为常见的是,那些最终成就伟业的人,他们的职业轨迹就像乒乓球一样跳跃。他们在大学学习 A 专业,中途辍学去从事 B 工作,最后却因为业余时间涉足 C 领域而声名鹊起。
在不同种类的工作间切换,有时是充满活力的表现,但有时也可能是懒惰的迹象。你究竟是在避之若浼,还是在勇敢地开辟新天地?很多时候,连你自己也难以分辨。许多后来取得伟大成就的人,在早期寻找自己的舞台时,也平平无奇,并不出众。
有没有什么方法可以让你对自己保持诚实?一个策略是:无论做什么工作,即使你不喜欢,也要尽力做到最好。这样至少能确定你不是在用对工作的不满作为懒惰的借口。也许更重要的是,你会养成把事情做好的习惯。
还有一个可以用来检验自己的策略:「持续产出」。比如说,如果你有一份并不重视的全职工作,只因你的目标是要成为一名小说家,那么你真的在「持续产出」吗?哪怕写得很糟糕,你是否仍然笔耕不辍?只要你在「持续产出」,你就能确信,你不是在用自己能有朝一日写就旷世巨著这一朦胧的愿景来麻痹自己。你对它的美好幻想,会被你正在实际创作的那部充满明显缺陷的作品所阻挡,让你不得不直面现实。
「持续产出」也是发现你所热爱的工作的一个方法。如果你坚持这个原则,它会自然而然地让你远离那些「应该做的事」,转而引导你去践行「真正喜欢的事」。「持续产出」会帮助你发现自己毕生的事业,就像水借助重力,找到屋顶上的漏洞一般。
当然,找到你喜欢做的事并不意味着你就能从事这份工作。这是另一个问题。如果你有雄心壮志,就更要分清这两点:你要有意识地努力,不让你对理想的追求被「可能性」所污染而过早放弃。[6]
将理想和现实分开是痛苦的,更煎熬的是,清晰地感受到他们之间的隔阂。因此大多数人会选择在事前降低期望。比如,如果你在街上随机问路人,他们是否想拥有达芬奇一般的绘画水平,大多数人可能会说「哦,我不会画画」。这与其说是陈述事实,不如说是表明态度;它的意思是,我不打算尝试。事实上,如果你随便找个路人,想办法让他们在接下来的二十年里全力以赴地投身绘画领域,他们很可能会取得惊人的进步。但这需要巨大的毅力;这意味着要在数年时间里,每天直面失败。因此,为了保护自己,人们会说「我做不到」。
你经常会听到的另一句话是,并非每个人都能从事自己热爱的工作——总要有人来承担那些不愉快的任务。但这种说法真的站得住脚吗?我们又如何强迫他人去做这些工作呢?在美国,除了已经 30 多年未曾动用的征兵制度,我们没有任何手段强迫人们从事不喜欢的工作。我们能做的,仅仅是通过金钱和声望来激励人们接受这些不那么令人愉快的工作。
如果确实存在无人愿意从的工作,社会似乎只能学会在没有它们的情况下运转。家庭佣人就是一个很好的例证。几千年来,这一直被视为「必须有人做」的典型工作。然而,到了 20 世纪中叶,富裕国家的家庭佣人几乎销声匿迹,富人们不得不学会自己打理生活。
因此,尽管可能确实存在一些必须完成的工作,但对于任何特定工作而言,认为它「必须有人做」的观点很可能是错误的。如果真的没有人愿意从事,大多数不受欢迎的工作要么会被自动化取代,要么就销声匿迹。
两条道路
然而,从另一个角度来看,「并非每个人都能从事自己热爱的工作」这句话却不无道理。毕竟,谋生是必须的,而从事自己热爱的工作往往并不容易能获得报酬。要实现「做你所爱」,有两条路径可循:
渐进路线:随着你在行业中声望日隆,逐步增加你热爱的工作内容,同时减少你不那么喜欢的部分。
双轨路线:从事你不太喜欢但能赚钱的工作,以此支持你投入真正热爱的事业。
渐进路线是更为常见的选择。对于任何工作出色的人来说,这种转变都会自然而然地发生。例如,一个刚入行的年轻建筑师可能得被迫接受一切可能的工作机会,但如果他表现优秀,随着时间推移,他将逐渐获得挑选项目的权利。这条路径的不足之处在于过程缓慢,结果也不那么确定。哪怕签署了终身合同,也未必能获得真正的职业自主权。
双轨路线有多种变体,主要取决于你在赚钱的工作上投入多少时间。一个极端是「全职工作」,即你在一份固定工作中挣取生活所需,同时在业余时间追求自己的兴趣爱好。另一个极端是全身心投入某项工作,直到积累了足够的财富 ,不再需要为金钱而奔波。
相较于渐进路线,双轨模式较为少见,因为它需要周密的选择。这种模式也存在更大风险。随着年龄增长,生活开支往往会上升,很容易陷入在赚钱工作上投入超出预期时间的窘境。更糟的是,你所从事的工作会潜移默化地改变你。长期从事枯燥乏味的工作会腐蚀你的大脑。那些报酬最丰厚的工作往往最具风险,因为它们需要你全身心的投入。
双轨路线的优势在于它能让你跨越职业障碍。职业世界并非一马平川,不同领域之间存在着高低不同的壁垒。[7] 通过放大现有工作中你热爱的部分,或许能实现从建筑行业向产品设计的转型,但若想跨入音乐领域则可能力有不逮。而假如你一边从事赚钱的工作,一边追求自己的兴趣,你就能拥有更大的选择空间。
那么,你应该选择哪条路线呢?这取决于几个因素:你对自己想做的事情有多确定,你有多善于服从指令,你能承担多大的风险,以及在你有生之年是否有人愿意为你的兴趣付费。如果你对自己想从事的领域很确定,而且这个领域有较好的市场前景,那么你或许应该选择渐进路线。但如果你还不确定自己的职业方向,或者不喜欢被人指挥,双轨模式可能更加适合你,前提是你能承受相应的风险。
不要过早地做出决定。那些很早就知道自己想做什么的孩子看起来很了不起,就好像他们比其他孩子更早找到了数学题的答案。他们确实有了答案,但这个答案很可能是错的。
我有一位颇为成功的医生朋友,却总是对自己的工作怨声载道。每当有人向她咨询报考医学院的意见时,她都恨不得摇晃对方,大喊「千万别走这条路!」(当然,她从未真的这么做过。)她是如何陷入这种困境的呢?原来她在高中时就立志成为一名医生。她雄心勃勃,意志坚定,克服了一路上的重重障碍——遗憾的是,这些障碍也包括了对这份职业的不喜欢。
如今她的生活,是被高中时的自己一手选定的。
年轻时,我们往往会认为,在做出每个选择之前,都能获得足够的信息。然而,在职业选择方面,情况却大不相同。当你需要决定未来的发展方向时,往往只能在信息严重不足的情况下做出判断。即便到了大学,你对各种职业的了解仍然十分有限。实习机会本就有限——并非所有岗位都开放实习,即便有幸获得机会,能学到的实战技能,虽比当球童耳濡目染学到的棒球技巧多出三瓜两枣,也难成体系。
在设计人生时,就像设计其他事物一样,采用灵活的方式往往能获得更好的结果。因此,除非你对自己想做的事情胸有成竹,否则最好选择一种能够兼顾渐进路线与双轨路线的工作类型。这可能也是我选择计算机行业的部分原因。在这个领域,你可以成为一名教授,也可以赚大钱,或者转行到其他领域。
在职业生涯的早期,寻找能让你接触多种不同工作的机会也是明智之举,这样你就能更快地了解各种工作的真实面貌。相反,走极端的双轨路线可能会很危险,因为它无法让你足够了解自己感兴趣的事业。假如你作为一名债券交易员,辛苦工作十年,心想等有足够的钱就辞职写小说,但当你真的辞职后却发现自己其实并不喜欢写作,那又该如何是好?
很多人会说:「我会解决这个问题。给我一百万美元,我会弄清楚该怎么办。」但实际上,这比想象的要困难得多。生活中的种种限制实际上为我们的人生赋予了形态,一旦失去这些约束,大多数人反而会不知所措。看看那些中了彩票或突然继承巨额财产的人就知道了。尽管每个人都认为自己渴望经济保障,但最幸福的人并非那些已经实现财务自由的人,而是那些热爱自己工作的人。因此,一个以失去人生方向为代价换取自由的计划,可能并不如表面上看起来那么诱人。
无论你选择哪条路线,都要做好面临挑战的准备。找到你所热爱的工作是一件非常困难的事,大多数人都未能如愿以偿。即使成功了,在三四十岁之前能够自由地从事自己热爱的工作也是极为罕见的。但是,如果你心中有明确的目标,你就更有可能实现它。如果你知道自己能够热爱工作,那么你已经接近成功了;如果你已经明确知道自己热爱什么样的工作,那么你几乎就已经到达终点了。
附注
[1] 现在我们的做法恰恰相反:当我们让孩子做一些枯燥的工作,比如算术练习时,我们不愿坦率地承认这些工作很无聊,而是试图用一些肤浅的装饰来掩饰它的乏味。
[2] 一位父亲向我讲述了一个相关的现象:他发现自己在向家人隐瞒自己有多喜欢工作。当他想在周六去工作时,他觉得找个「不得不去」的理由更容易,而不是承认他更喜欢工作,胜过待在家里陪伴家人。
[3] 郊区也发生了类似的情况。父母搬到郊区是为了给孩子一个安全的成长环境,但郊区生活往往过于单调和人工化,以至于等到孩子 15 岁时,他们已经认定整个世界都是无聊的。
[4] 我并非主张朋友应成为你作品的唯一受众。 能够帮助更多人自然是更好的。 然而,朋友应当如同指南针一般,为你指引方向。
[5] Donald Hall 认为,年轻的诗歌爱好者过分执着于作品发表并非良策。然而,试想一下,对于一个 24 岁的年轻人来说,在《纽约客》上发表一首诗会带来怎样的影响。突然间,在各种社交场合,他成了一位「真正的诗人」。尽管他的诗歌水平与过去并没有什么变化,但在那些缺乏鉴赏能力的人眼中,权威机构的认可却意味着一切。因此,这个问题比 Hall 所认识到的更为复杂。年轻人如此看重声望,根本原因在于他们想要打动的人往往缺乏真正的判断力。
[6] 这与一个原则是相似的,即你应该防止你关于事物实际情况的认知被你希望事物成为的样子所污染。然而,大多数人却常常让这两者毫无节制地混杂在一起。宗教的持续盛行就是这种现象最为明显的体现。
[7] 如果要用一个更准确的比喻来描述就业市场,可以说各种工作之间的联系并不那么紧密。
感谢 Trevor Blackwell、Dan Friedman、Sarah Harlin、Jessica Livingston、Jackie McDonough、Robert Morris、Peter Norvig、David Sloo 和 Aaron Swartz 在本文草稿阶段提供的宝贵意见。
独立思考的艺术
2020 年 11 月
在某些领域,如果你无法跳出常规思维模式,就难以取得卓越成就。以科学家为例,仅仅得出正确结论是远远不够的。你的观点不仅要正确,还必须具有创新性。发表他人已知的内容是毫无意义的,你需要洞察并阐述尚未被他人认知的事物。
投资界也遵循类似法则。对于股票市场投资者而言,准确预测公司表现只是基本要求。如果大多数人都做出相同预测,股价就会反映出这一点,那就没有获利空间了。真正有价值的见解往往是那些与众不同的观点。
创业者同样需要这种思维。如果你选择创业方向是人人都认同的好主意,那么必然已有竞争对手在此领域深耕。你需要做的是在大多数人看来不靠谱,但你却深信不疑的事情——比如为仅有几千名爱好者使用的微型计算机开发软件,或创建一个让人们在陌生人家中租用充气床的平台。
对于散文作家也是如此。如果一篇文章只是重复读者已知的内容,必然乏味无趣。你需要为读者带来全新的视角或信息。
然而,这种模式并非放之四海而皆准。事实上,这不适用于大多数工作。例如,作为一名行政管理人员,你只需要确保工作正确无误即可。其他人对错与否并不重要。
虽然大多数工作中都有一定的创新空间,但实际上,独立思考至关重要的工作和独立思考无关紧要的工作之间存在明显界限。
我真希望小时候就有人告诉我这种区别,因为在选择职业时,这是最重要的考虑因素之一。你是否希望从事那种只有通过独特思维才能成功的工作?我猜,大多数人的潜意识在理性思考之前就会给出答案。我就是这样。
独立思考似乎更多是天生的,而非后天培养的结果。这意味着如果你选择了不适合自己的工作类型,你可能会感到不快乐。如果你天生具有独立思考的能力,你可能会发现做一个中层管理者令人沮丧。相反,如果你天性乐于遵从常规,尝试进行原创研究可能会举步维艰。
然而,这里存在一个问题:人们常常误判自己在传统思维到独立思维的光谱上的位置。思维保守的人不愿承认自己思维保守。无论如何,他们确实感觉自己对所有事情都有独立见解。只是碰巧他们的观点与同龄人相同罢了。同时,独立思考的人往往不知道自己的想法与主流观点有多么不同,至少在公开表达之前是这样。[1]
到成年时,大多数人大致知道自己有多聪明(就解决特定问题的能力而言),因为他们不断接受测试和排名。但学校通常会忽视独立思考能力,除非是为了压制它。因此,我们并没有得到关于自己独立思考能力的同等反馈。
甚至可能存在类似邓宁-克鲁格效应的现象:思维最保守的人坚信自己思维独立,而真正独立思考的人却担心自己的独立思考能力还不够。
你能培养出更独立的思维方式吗?我认为是可以的。尽管这种品质很大程度上是天生的,但也有一些方法可以增强它,或者至少不去压抑它。
最有效的方法之一,正是大多数「极客」已经在无意中践行的:单纯不去关心主流观点是什么。如果你不清楚应该遵从什么,就很难成为一个随波逐流的人。当然,这也可能是因为他们本来就有独立思考的能力。相比之下,一个思想保守的人可能会因为不了解他人的想法而感到焦虑,从而会更加努力地去探寻。
你身边的人对你影响重大。如果你被思想保守的人包围,你能够表达的想法就会被限制,进而你能够产生的想法也会被限制。但如果你周围都是独立思考的人,你就会有截然不同的体验:听到他人表达令人耳目一新的观点会激发你也这样做,并产生更多创新的想法。
因为独立思考的人被思想保守的人包围会感到很不自在,所以一旦有机会,他们往往会选择自我隔离。高中时期的问题在于,他们没有这样的机会。另外,高中往往是一个封闭的小世界,其中的学生普遍缺乏自信,这两个因素都会使人更倾向于从众。因此,高中对独立思考的人来说常常是一段艰难时期。但这种经历并非毫无益处:它能让你明白什么是应该避免的。如果你日后发现自己处于一个让你感觉「这就像回到了高中」的环境,你就知道该尽快脱身了。[2]
成功的初创公司是另一个独立思考者与思维保守者交汇的场所。创始人和早期员工几乎无一例外都是独立思考者,这正是初创公司得以成功的关键所在。然而,由于思维保守者在数量上远远超过独立思考者,随着公司规模的扩大,最初的独立思考精神不可避免地被稀释。这不仅导致公司整体表现每况愈下,还引发了诸多问题。其中最为奇特的是,创始人发现自己与其他公司的创始人反而能更加畅所欲言,与自己员工的交流则不然。[3]
幸运的是,你并不需要时刻与独立思考者为伍。只要有一两个可以定期交流的对象就足够了。一旦你找到这样的人,你会发现他们同样渴望交流,因为他们也需要你这样的同道中人。尽管大学不再像从前那样垄断教育资源,但好的大学依然是结识独立思考者的绝佳平台。虽然大多数学生仍然秉持传统思维,但你至少能找到一些独立思考者的小群体。与高中时期几乎找不到任何独立思考者的情况相比,这已经是巨大的进步。
另一种策略则是反其道而行之:除了和少数几个志同道合的独立思考者建立友谊,也要尝试接触各种不同类型的人。如果你能同时融入几个不同的社交圈,就能减少单一群体对你的影响。此外,如果你能够游走于多个不同的领域,你往往能够将一个领域的创新理念引入另一个领域,实现跨界思考与创新。
当我谈到不同类型的人时,我并非指人口统计学上的差异。要让这种方法发挥作用,关键在于他们的思维方式要有所不同。因此,虽然到其他国家游历是个绝佳的主意,但实际上你可能在家门口就能找到思维独特的人。每当我遇到精通某个小众领域的人(如果你发掘足够深入的话,几乎每个人都有这样的一面),我都会努力了解他们的独到见解。这种交流总是令人惊喜。虽然这是与陌生人攀谈的好办法,但我这么做并非为了社交,而是真心渴望学习。
你还可以通过研读历史来拓展思维的时空维度。我阅读历史不仅仅是为了了解过往事件,更是为了尝试进入古人的思维世界。在他们眼中,世界是什么样子的?这种思考虽然困难,但正如为了使用三角测量法而远行一样,为之付出努力是值得的。
此外,你还可以采取更直接的措施来避免不假思索地接受传统观点。最普遍的方法是培养怀疑精神。当听到他人发表意见时,暂停片刻,问问自己「这是真的吗?」不必说出口。我的建议并非要你让每个与你交谈的人都为自己的观点提供证据,而是要你自己承担起评估他人观点的责任。
将其视为一个有趣的谜题。你知道一些当前被广泛接受的观点日后可能被证明是错误的。试着猜猜哪些观点可能有问题。这样做的目的不是为了挑剔别人的观点,而是为了发现被错误观点掩盖的新思想。因此,这个过程应该是一次充满激情的探索新事物的旅程,而不是枯燥乏味的知识检查。当你开始问「这是真的吗?」时,你会惊讶地发现,答案往往不是立即可以确定的。如果你富有想象力,你更可能面临的是线索过多而非不足的问题。
总的来说,你应该努力不让任何未经审视的想法进入你的头脑,而这些想法并不总是以明确陈述的形式出现。有些最深远的影响是潜移默化的。那么,你怎么才能觉察它们呢?方法是退后一步,观察他人是如何形成自己的想法的。
当你站在足够远的距离观察时,你会发现想法像波浪一样在人群中传播。最明显的例子是时尚:你可能会注意到几个人穿着某种款式的衬衫,然后越来越多的人开始穿,直到你周围一半的人都穿上了同样的衬衫。虽然你可能不太在意自己的穿着,但要知道,思想也有其时尚,而你绝对不应该盲目追随这些思想潮流。这不仅是为了保持思想的独立性,更是因为不合时宜的想法往往更有可能将你引向有趣的发现。想要发现未被探索的想法,最好的方法就是去别人都忽视的地方寻找。[4]
要进一步探索这个普遍性的建议,我们需要研究独立思考的内在结构——就像我们需要锻炼特定肌肉一样。在我看来,独立思考包含三个核心要素:对真理的严谨态度、对思想灌输的抵抗力,以及好奇心。
对真理的严谨态度不仅仅意味着不相信虚假的事物。更重要的是,要谨慎对待自己的信念程度。大多数人的信念往往无度地趋向极端:他们会把不太可能的事情视为不可能,把可能发生的事情视为必然。[5]对于独立思考者来说,这种草率态度是不可原谅的。他们愿意在头脑中容纳各种观点,从高度推测性的假说到(看似)不言自明的真理,但对于他们关心的话题,每一个想法都必须附带经过深思熟虑的信念程度标签。[6]
独立思考者对意识形态深感排斥,因为意识形态要求人们一次性接受一整套信念,并将其奉为圭臬。对独立思考者而言,这就像要求一个对食物挑剔的人吞下一个装满各种来历不明、保质期难辨的配料的潜艇三明治一样令人作呕。(潜艇三明治:内夹色拉、冷切肉或奶酪的长条形面包。)
如果缺乏这种对真理的严谨态度,你就无法真正做到独立思考。仅仅抗拒社会规范对你如何思考的规训是远远不够的。那样的人拒绝传统观念,却会转而接受最荒诞的阴谋论。由于这些阴谋论往往是专门设计来吸引他们的,他们反而比普通人更缺乏独立思考能力,因为他们臣服于比单纯的传统更加严苛的主宰。[7]
我们能否提高对真理的严谨程度呢?我认为是可以的。根据我的经验,仅仅思考你所谨慎对待的事物就能增强这种谨慎。如果真是这样,这就是那种罕见的美德,我们只需渴望就能拥有更多。如果它和其他形式的严谨相似,那么它也应该可以从儿童时期开始培养。我无疑深受父亲影响。[8]
独立思考的第二个要素——对思想灌输的抵抗力——是三个要素中最显而易见的。但即便如此,人们对它的理解也常常存在偏差。最大的误解是将其视为纯粹的消极特质。我们使用的语言强化了这种观念。你是「非」传统的。你「不」在乎别人的看法。然而,它不仅仅是一种免疫力。对最具独立思考能力的人来说,不被他人左右思想的愿望是一种积极的力量。这不仅仅是怀疑主义,而是对那些颠覆传统智慧的想法的积极热爱,越是违反直觉的想法越令人着迷。
一些最具创新性的想法在最初提出时,几乎被误认为是恶作剧。仔细想想,你面对一个新奇想法时,有多少次的第一反应是笑出声来?这并非因为新颖的想法本身就令人发笑,而是因为新颖性和幽默感都具有某种出人意料的特质。尽管两者并非完全等同,但它们之间的相似性足以说明,具有幽默感与独立思考之间存在明显的关联——正如缺乏幽默感与思想保守之间也存在关联一样。[9]
我们恐怕难以显著提高对他人思想灌输的抵抗力。这似乎是独立思考三要素中最依赖先天禀赋的;成年后表现出这种品质的人,通常在童年时就已经展现出明显的迹象。既然我们无法增强这种抵抗力,那么至少可以通过与其他独立思考的人为伍来巩固它。
独立思考的第三个要素——好奇心,或许是最引人入胜的。如果要简要回答新颖想法从何而来,答案就是好奇心。人们在产生新想法之前,通常都会感受到这种好奇心。
根据我的观察,独立思考和好奇心能够完美地互为预示。我所认识的每一个独立思考者都极其好奇,而每一个思想保守的人则都缺乏好奇心。有趣的是,唯独儿童例外。所有幼童都充满好奇心。这可能是因为即便是日后会墨守成规的人,在最初也需要保持好奇,以了解什么是常规。而独立思考者则是求知若渴的人(gluttons of curiosity),探索永无止境。[10]
独立思考的三个要素相互配合:对真理的严谨态度和对思想灌输的抵抗力为你的大脑留出空间,而好奇心则寻找新的想法来填充这个空间。
有趣的是,这三个组成部分能够相互替代,就像肌肉一样。如果你对真理极其严谨,你就不太需要抗拒他人的想法,因为这种严谨本身就会使你的知识体系中留下足够的空白。这两者中的任何一个都能弥补好奇心的不足,因为一旦你在头脑中腾出足够的空间,对这种空虚的不适感会激发你的好奇心。反之,好奇心也能弥补前两者:如果你足够好奇,就不需要刻意清理大脑中的空间,因为你发现的新想法会自然而然地取代你不经意间接受的常规观念。
由于独立思考的这些要素可以互换,即使你的这三种能力的水平不尽相同,依然能达到相同的效果。因此,独立思考并非只有一种模式。有些独立思考者公开挑战传统,而另一些则安静地保持好奇。尽管如此,他们都懂得这种「秘密握手」。
那么,有什么方法可以培养好奇心吗?首先,你要避免那些抑制好奇心的环境。想想看,你目前的工作在多大程度上激发了你的好奇心?如果答案是「不太多」,也许是时候做出一些改变了。
培养好奇心最重要的主动步骤也许是,寻找能够激发它的话题。很少有成年人会对所有事物都保持同等程度的好奇,而且你似乎无法自主选择自己的兴趣点。因此,找到这些话题就成了你的责任,或者,如果有必要的话,创造它们。
增强好奇心的另一个方法是放纵它,去探索你感兴趣的事物。在这一点上,好奇心与大多数其他欲望不同:放纵它往往会让它增长,而不是让它满足。一个问题会引发更多的问题。
相较于对真理的严谨态度和对思想灌输的抵抗力,好奇心似乎更能彰显个人特质。在前两方面,人们的表现大都相似,而在好奇心的对象上却可能千差万别。因此,好奇心或许就是探索未知的指南针。如果你的目标是发现新颖的想法,也许你的座右铭不应该是「做你热爱的事」,而应该是「追随你的好奇心」。
注释
[1] 有趣的是,由于没有人愿意承认自己思想保守,你可以毫无顾忌地评论思想保守的人而不会招致太多麻烦。当我写了「顺从主义的四个象限」这篇文章时,我原本预计会引发思想保守者的强烈抗议,但实际反应却相当平淡。他们隐约感到文章中有些内容令他们极度不适,却又难以定位具体的段落来指责。
[2] 当我思考生活中哪些方面酷似高中时,我想到了 Twitter。那里不仅充斥着思维保守的人(任何规模庞大的平台都难免如此),而且总会陷入令人联想到木星表面风暴的保守思想狂潮。尽管在那里消磨时光可能得不偿失,但它至少促使我更深入地思考了独立思考与传统思维之间的区别,而我原本可能不会这样做。
[3] 在快速成长的初创公司中,如何保持独立思考仍是一个亟待解决的问题,但可能存在一些解决方案。
创始人可以通过有意识地只招聘具有独立思考能力的人,延缓这个问题。这样做还能带来额外的好处,因为这些人通常能提出更好的想法。
另一种可行的策略是制定政策来削弱从众心理的影响力,从而降低固守成规者的潜在危害,就像用控制棒减缓核反应链一样。洛克希德公司的「臭鼬工厂」(Lockheed's Skunk Works)在地理位置上与公司主体分离,可能在无意中实现了这一效果。近期的案例表明,像 Slack 这样的员工交流平台可能利弊参半,并非纯粹有益。(控制棒:一种由吸中子材料制成的杆,用于调节反应堆中核裂变的速率。)
最为激进的方案是在不扩大公司规模的前提下提升营收。你可能认为相比雇佣一名程序员,聘用一名初级公关人员更为经济实惠,但这会对公司整体的独立思考能力产生怎样的影响呢?(大学里行政人员数量相对于教师的增长似乎也产生了类似的影响。)也许我们应该在外包非「核心业务」的原则之外,增加一条新规:将那些一旦成为正式员工就可能破坏公司文化的人所从事的工作外包出去。
一些投资公司似乎已经能够在不增加员工数量的情况下提高收入。自动化技术的发展加上「技术栈」的不断细化和明确化,意味着产品公司未来也可能实现这一目标。
[4] 每个领域都存在思想潮流,但它们的影响程度各不相同。例如,政治之所以常常让人深感乏味,其中一个原因就是它极易受这些潮流的支配。对政治发表看法的门槛远低于对集合论发表意见的门槛。因此,尽管政治领域也存在一些真知灼见,但在实践中,它们往往被思想潮流所淹没。
[5] 思想保守的人常常被自己观点的坚定程度所迷惑,误以为这就是独立思考的表现。然而,强烈的信念并非独立思考的标志,恰恰相反。
[6] 对真理持严谨态度,并不意味着一个独立思考的人就不会说谎,而是他不会自欺欺人。这有点类似于对绅士的定义:一个从不会无意冒犯他人的人。
[7] 这种现象在政治极端分子中尤为明显。他们自认为是特立独行者,实则不过是小众圈子里的随波逐流者。虽然他们的观点可能与普通大众大相径庭,但他们往往比一般人更容易受到同伴观点的影响。
[8] 如果我们将对真理的严谨态度扩展到更广泛的范畴,不仅排斥严格意义上的虚假,还拒绝迎合、伪造和夸张,那么我们关于独立思考的模型就可以进一步延伸到艺术领域。
[9] 然而,这种相关性并非绝对。例如,哥德尔和狄拉克在幽默感方面似乎并不突出。不过,一个既属于「神经典型(Neurotypical)」又缺乏幽默感的人,很可能持有传统的思维模式。(神经典型:指神经发展和认知功能方式符合社会规范预期。)
[10] 例外:八卦。几乎所有人都对八卦充满好奇。
**致谢:**感谢 Trevor Blackwell、Paul Buchheit、Patrick Collison、Jessica Livingston、Robert Morris、Harj Taggar 和 Peter Thiel 阅读本文的初稿。
如何努力工作
2021 年 6 月
乍看之下,关于如何努力工作*似乎没什么可学的,上过学的人都明白该怎么做,哪怕自己选择偷懒。连 12 岁的孩子都能拼命学习。但如果说我现在比学生时代更懂怎样才算「真正努力」,答案绝对是肯定的。(*译注:这里的工作是广义上的 work,而非 job。我觉得更类似于马克思所说的、非异化的劳动。)
我现在确信,如果你想成就伟业,就必须付出极大的努力。我小时候对此并不确定。学校作业的难度参差不齐,并非总要拼命努力才能成功。那些名人做的事,有些看来几乎毫不费力。我不禁想,是否有某种方法,能仅凭出众的才华就避开努力工作?如今我知道了答案:没有。
有些科目看似简单,其实是因为学校要求不高;那些名人看似轻松,背后却是多年苦练,他们只是举重若轻。
诚然,那些名人通常也天赋异禀。成就伟业需要三大要素:天赋、练习与努力。具备其中两者也能小有成就,但要做到顶尖水平必须三者兼备——既要过人的天赋,又要大量练习,还要全力以赴。[1]
以比尔·盖茨为例:他不仅是同代商界最聪明的奇才,也是最勤奋的劳模。「二十多岁时我从未休息过一天,」他说,「一天都没有」。梅西亦如此,虽然天赋过人,但他的青年队教练提起他时,最难忘的不是他的球感,而是玩命的训练态度和必胜的执念。如果硬要评选 20 世纪最佳英语作家,我大概会投给 P. G. Wodehouse。他的文字堪称「举重若轻」的典范,但背后却是常人难及的苦功:74 岁高龄时,他仍笔耕不辍。
每当我写新书时,就像我说的,总感觉是从文学园子里摘了酸柠檬。说来倒是好事,毕竟小心才让人字斟句酌,每句话改上十遍,甚至二十遍也不稀奇。
你觉得这已经够夸张了?但比尔·盖茨更极端:整整十年没休过一天假?这两位天赋已经是顶尖,偏偏还拼到了极致。天赋与努力,缺一不可。
道理看似浅显,现实中却有点难以理解。天赋与努力间总萦绕着某种「非此即彼」的错觉。一方面源于流行文化根深蒂固的叙事,另一方面则因为突破常规的天才实在稀有。超凡天赋与极致勤奋本就罕见,二者兼备者则更是罕有。你遇到的大多数人往往偏执一端,但如果你想脱颖而出,二者缺一不可。既然天赋高低已经很难改变,那么所谓成就伟业,归根结底就是往死里努力。
当目标明确,且由外界强加时(比如在学校),努力是直截了当的事。这其中也有些技巧:你要学会不自欺、不拖延(拖延本质是自欺)、不分心走神、不在遇到困难时放弃——但说实话,这种程度的自律,只要真心想做,连小孩子都能做到。
我从小就学会了如何为那些目标模糊且无人督促的事努力。如果想成就非凡,两种能力你都得修炼。
其中最基础的水平就是无需他人提醒的自觉。如今我稍有懈怠,内心便警铃大作,虽然不敢保证拼命就必然有收获,但懒散就必定一事无成,这种滋味实在煎熬。[2]
这种认知并非是一朝一夕形成的。和所有孩子一样,我幼时总因为学到新东西而高兴。年岁渐长,这份喜悦逐渐化为一事无成时的自我厌恶。唯一清晰的转折点是 13 岁那年,我彻底戒掉了看电视。
我接触过的不少人回忆说,也是在这个年纪开始严肃对待工作的。当我问 Patrick Collison 何时开始觉得懒散令人不悦时,他答道:
大概是我十三四岁那年吧。当时的场景我记得清清楚楚:坐在客厅呆望窗外,满脑子都在想:我怎么就任由自己浪费暑假了?
或许青春期会有一些变化。这倒也合乎逻辑。
但奇怪的是,认真投入工作的最大障碍恰恰来自学校。他们所谓的「功课*」把工作异化为枯燥无意义的苦役。我必须先看清真实工作的样貌,才能全身心投入其中。这会花些时间,因为即便在大学,许多课堂仍然空洞,有些院系的存在本身就毫无意义。但当我触碰到真实工作的形状时,我发现自己对工作的渴望便与之契合。(*译注:原文就是 work,这里我猜是调侃学校作业的单词是 homework。)
我猜多数人只有先了解工作的本质,才可能爱上它。哈代在《一个数学家的辩白》中对此有精辟的诠释:
我记不得年少时对数学有什么「热爱」,数学家的事业在我的想象中也远谈不上崇高。那时数学于我不过是考试与奖学金的代名词:我想击败其他人,而数学似乎是最能确保我胜出的武器。
他直到大学期间研读 Jordan 的《分析教程》(Cours d'analyse),才真正触碰到数学的本质。
那份震撼我至今难忘,这部启蒙了整整一代数学家的杰作,让我在初读此书时,第一次领悟到数学的真义。
要理解什么是真实的工作,你得学会识破两种「虚伪」:其一是哈代在学校遭遇的那种。学科为适应教育孩子而被扭曲,往往面目全非,与从业者的真实工作毫无关联[3] 。其二是某些工作固有的虚伪性。它们要么本质空洞,要么不过是瞎忙活。
真实的工作自带一种实在感。虽然并非每项工作都如撰写《自然哲学的数学原理》那样重要,但每件事都不可或缺。这一标准看似模糊,实则是有意为之,毕竟它要涵盖形形色色的工作类型。[4]
一旦看清真实工作的本质,接下来就要摸清每日该投入多少时间。解决这个问题不能单靠耗尽所有清醒的时间,对多数工作而言,超过某个临界点后,工作质量就会开始滑坡。
这种极限时长因人因事而异。我做过各类工作,每种工作的极限时长都不同。高强度写作或编程每天至多五小时,但当年创业时却能全天连轴转。至少在前三年如此。如果持续更久,我恐怕也要偶尔休个假。[5]
探寻个人极限的唯一方式是跨越它。培养对工作质量的敏锐判断,当过度投入导致产出质量下降时,你应该能及时察觉。此时保持诚实至关重要,需要双向审视:既要识别怠惰状态,也要觉察过度消耗。如果认为超负荷工作值得称赞,请摒弃这种观念。这种行为不仅会降低工作成效,更折射出某种自我表现的倾向,即使观众只有你自己。[6]
确定努力工作的极限是持续的动态过程,而非一蹴而就。工作难度与个人能力时刻处于波动之中,因此你需要持续审视自身投入的程度与实际成效。
努力并不意味着要不断逼迫自己工作。或许有人会如此,但我的经历更具普遍性,只有在启动项目或遇到关键节点时,才需要偶尔自我施压,这时最容易陷入拖延的风险。而一旦我进入状态,就能形成惯性,持续前进。
驱动力因工作类型而异。开发 Viaweb 时,失败的恐惧驱使着我。那时我几乎从不拖延,因为总有事情要处理,而每完成一项就能与穷追不舍的危机拉开距离,那还等什么?[7]现如今我撰写文章,驱动力则是源于字里行间的瑕疵。每写完文章的几日内,我总会陷入焦躁,如犬择栖处般反复踱步。可一旦动笔,我就无需强迫自己工作了,因为文中总有待修正的谬误或待填补的疏漏在推我前进。
我确实会刻意聚焦核心议题。多数难题都有坚固难解的内核,外围则包裹着相对易解的部分。努力的本质,是尽可能的直指核心。有些日子你或许力有不逮,只能处理简单的边缘事务,但你应该始终以逼近内核为目标,同时避免陷入停滞。
人生该做什么这类更宏大的命题同样遵循核心难题法则:核心区是重要但棘手的挑战,边缘区则是次要但易解的问题。因此,除了日常应对具体课题时的微观调整,你将偶尔面临职业方向的宏观抉择。原则仍然是相同的:真正的努力在于锚定核心,即直面那些最具雄心的命题。
但此处所指的核心,是真正意义上的核心,而非当下普遍认同的伪核心。无论宏观层面还是具体领域,关于什么是关键问题的共识往往是错误的。如果你对这种共识存疑且判断正确,这或许正是开拓新事业的宝贵机遇。
更具雄心的目标通常更富挑战性,你无需否认这一点,但也别把难度视为决策时的绝对准则。如果因为天赋所长,或因创新方法,抑或纯粹出于更高热情,你发现某类雄心勃勃的工作对你来说反而更容易,请务必把握机会。那些最伟大的成就,往往由那些把复杂问题化繁为简的人完成。
除了摸清实际工作的门道,你还需要找到适合自己的方向。这不仅是要发现与天赋最匹配的领域——并非身高七尺就非打篮球不可,关键更在于兴趣使然。对某个领域怀有赤忱热爱时,这种内驱力所能激发的努力,远非外在约束可比拟。
相比天赋,发现自己的兴趣往往更难。天赋的种类本就少于兴趣,且童年时期便初现端倪,而兴趣则微妙得多,可能直到二十多岁,甚至更晚才真正成型,有些领域甚至早年根本不存在。此外,还需警惕诸多干扰因素:你究竟真心热爱某件事,还是被高薪诱惑?是渴求他人艳羡的目光,还是屈从于父母的期待?[8]
确定人生方向的难度因人而异,这是我从小到大对工作最深刻的认识。童年时,我们总以为每个人都背负着某种天职,只需循声而行,就像电影桥段或专供孩童的简化版传记所描绘的那样。现实中确实有莫扎特式的幸运儿,自幼明晰方向,矢志不渝,但也不乏牛顿这种辗转多个领域的探索者。后人或许会一厢情愿认定数理领域才是他的归宿,惋惜他在炼金术与神学中虚掷光阴,但这不过是后见之明造成的幻觉。事实上,并没有什么声音在召唤着他。
因此,有些人的人生轨迹能很快聚焦,也有些人可能终生无法聚焦方向。对后者来说,寻找方向并不是奋斗的前奏,而是持续终生的命题,如同动态求解的多元方程。这类人的成长方程中,除了评估努力程度与成果质量,还要不断权衡:该坚守阵地还是另辟蹊径?当投入与产出持续失衡时,转换跑道才是理性选择。道理虽然简单,实践起来却很难。不应该只是因为初试受挫就放弃,要给自己积累突破的时间。而当顺风顺水的事业遭遇瓶颈时,又如何判断应该坚持多久?[9]
如何定义「好的结果」?这本身就可能是个无解之问。当涉足人迹罕至的领域时,你甚至不知道好的结果是什么样子。历史长河中,多少先驱都曾误判过自己所从事工作的分量。
最可靠的试金石,在于是否发自内心的兴趣。这看似主观得近乎危险的标准,却可能是你能把握的最精准标尺。毕竟,你才是做这些工作的人,谁能比你更懂它的价值?又有什么比是否有趣更能预示你工作的重要?
但要让这套评估机制奏效,你必须对自己诚实。事实上,整个关于「努力工作」的命题,最引人注目的地方就在于每个决策节点都取决于你能否诚实面对自己。
真正的努力并非简单地把旋钮拧到极限。它是个精密复杂的动态系统,需要实时校准,要看清现实工作的本质规律,也要精准定位自身的适配领域。要无限逼近核心问题,也要时刻清醒评估能力边界与进展质量。要最大化每日有效工时,又要警惕过劳导致产出贬值。如此精密的决策网络,难以蒙混过关。但如果能始终保持清醒与诚实,它自然会涌现出最佳状态,你的生产力也将远超常人。
注释
[1] 在《车票理论:什么造就了天才?》一文中,我提出伟大工作的三要素是天赋、决心和兴趣。这是前期阶段的公式;而决心和兴趣则会带来实践和努力。
[2] 我这里说的是以天为单位,而非小时。你常常会在非工作状态下有所突破,比如淋浴时或睡梦中突然想到问题的解决方案,但这只是因为你前一天在这个问题上付出了艰苦努力。
偶尔度假是好事,但我度假时更喜欢学习新知识。我不会喜欢单纯地躺在沙滩上无所事事。
[3] 在学校里,孩子们所做的最接近真实工作的事情就是体育运动。诚然,这是因为许多运动项目最初源于学校里的游戏。但至少在这一领域,孩子们在做的正是成年人所做的事情。
在普通的美国高中,你面临两个选择:要么假装做些严肃的事,要么认真地做些假想的事。可以说,后者并不比前者更糟糕。
[4] 知道自己想做什么工作并不意味着你就能做到。大多数人,尤其是在职业生涯早期,不得不花大量时间做自己不想做的事情。但如果你知道自己想做什么,至少你知道该往哪个方向引导自己的人生。
[5] 降低高强度工作的时间限制提出了一个解决方案,来应对有了孩子后工作时间减少的问题:转向更具挑战性的课题。事实上,我就是这么做的,尽管并非刻意为之。
[6] 某些文化中存在一种表演式的努力工作传统。我不太认同这种做法,原因有二:(a)它将重要的事物变成了一种拙劣的模仿,(b)它导致人们耗尽精力去做一些无关紧要的事情。我不敢断言这种传统究竟是利大于弊还是弊大于利,但我倾向于是弊大于利。
[7] 人们如此努力地投入创业,其中一个原因是初创公司可能会失败,而当失败来临时,往往既无法挽回又引人瞩目。
[8] 为了赚大钱而工作是可以理解的。你需要以某种方式解决经济问题,通过一次性赚取大额收入来高效地实现这一目标并无不妥。我想,即使你对金钱本身感兴趣也无可厚非;只要你觉得合适就好。关键是要清楚自己的动机。真正需要避免的是不经意间让对金钱的渴求扭曲了你对最感兴趣工作的看法。
[9] 许多人在处理个别项目时也会遇到类似的小规模问题。但是,相比于完全放弃某一类型的工作,认识并接受单个项目的死胡同要容易得多。你越是坚定,这个决定就越艰难。这就像西班牙流感的患者在与自己的免疫系统抗争:你不愿放弃,反而告诉自己,我应该更加努力。谁又能说你的想法是错的呢?
感谢 Trevor Blackwell、John Carmack、John Collison、Patrick Collison、Robert Morris、Geoff Ralston 和 Harj Taggar 为本文草稿提供的宝贵意见。
Paul Graham 作品导读
[Paul Graham 导论](https://www.jaakkoj.com/blog/graham “接下来译者会掺点私货”)
在创业领域,恐怕没有人比 Paul Graham 更有发言权了。作为创业加速器 Y Combinator 的联合创始人,他帮助过数以千计的创业公司,从他的文章中我们可以学到许多宝贵的经验。而 Graham 的智慧远不止于此;他的文章吸引了数百万读者,涵盖了教育、智力、写作、社会、人类思维等热门话题。
我通读了 Paul Graham 发表的所有文章(超过 200 篇),积累的笔记足以写成一本书。本文旨在总结我认为最有洞见的部分,为 Graham 的新读者提供一个了解Graham 的捷径。
我附上了他文章的链接,这样当你发现有趣的内容时,就可以轻松地追溯到源头。(事实上,我建议你把这篇文章当作通向精彩内容的大门,而不是把它视为全面的总结)。
**如果我对 Graham 观点的描述引起了你的好奇,那不妨去阅读他的原文。**只有在原文中思想才能得到充分地诠释。这篇文章只是一个非常粗浅的概述。
尽管如此,希望我的写作能激发你阅读 Graham 文章的兴趣。相信我,它们值得你投入时间。
无聊的免责声明:
-
我制作了这篇文章的 Google Docs 版本,方便大家浏览。
-
我整理了 2021 年 11 月之前发表的所有文章(截止至《超越智慧》 )。你可以在 Graham 的网站上找到所有对应文章的列表。
-
以下文章都是一些我感兴趣的内容。我只是在恰好的时间被这些文章所打动。另外,paul写了 200 篇之多的文章,我肯定会忽视或遗忘一些重要内容。虽然有点啰嗦,但我还是希望你能亲自阅读这些文章。
-
**本文不涉及Paul Graham关于编程/代码的想法或文章。**我对这些内容既不感兴趣也不了解,所以我认为自己不适合在这里大放厥词。他写了很多关于代码的内容。如果你对此感兴趣,请自行探索他的文章。
-
最后,如果发现谬误或遗漏,请为我斧正:jaakko@jaakkoj.com / Twitter
好的,让我们进入Paul的世界。
Paul Graham 论创业
毫无疑问,Graham 的许多文章都与创业有关。鉴于他在创业领域的经验,他的很多观点值得深入探讨,包括诸如《方便面盈利》、《做那些不可规模化的事》和《创造者与管理者的时间表》等经典文章。接下来,让我们从一篇概述开始。
-
选择优秀的联合创始人。
-
快速上线。
-
认知迭代。
-
了解目标用户。
-
构建核心客户社群。
-
为优质客户提供个性化服务。
-
你衡量什么就会得到什么。
-
降本增效。
-
节源开流。
-
避免分心。
-
不要灰心丧气。
-
不要放弃。
-
交易存在失败的可能。(译者注:感觉这里有点概率论的意思)
想要深入了解以上内容,可以去读《如何创办一家创业公司》。
本节阐述了 Graham 关于创业的核心思想,包括前文提到的各项原则。
本节引用的文章:
创业公司的独特性所在
创业公司与普通企业之间存在本质上的差异。正如 Paul Graham 所言,「创业公司是一家为快速成长而设计的公司」,它从根本上区别于传统的餐厅或美发沙龙。创业公司的所有决策都围绕着其成长需求展开。事实上,Graham 强调:「要理解创业公司,就必须理解成长这一概念」。
「从经济学角度来看,创业可以被视为一种短期内高效的变现手段。与其庸庸碌碌工作四十年,不如在四年内全力以赴。尤其对于在技术领域的工作者来说,创业具有很强的变现能力」(摘自《如何创造财富》)
创业不同于你的学校生涯。在学校,你可能会找到应付考试的技巧,但在创业领域,成功是无法取巧的。在学校里,你学会了如何在考试中脱颖而出,于是你掌握了应对考试的诀窍。然而,在创业世界里,你无法仅凭花言巧语就说服投资者给你投资;真正的诀窍是成为一个值得投资的对象。同样,你也不能靠花招诱导用户使用你的产品;真正的技巧是打造一个卓越的产品。真正有价值的工作是无法靠取巧来完成的。
因此,成为一名优秀的创业者并不需要你是一个好学生。实际上,如果你的观点与商业课老师不同,这反而可能是件好事(毕竟,如果你的商业老师真的精通商业,他们可能已经成为创业者了)。在创业公司中,学历和成绩单并不那么重要——你的用户不会关心你是否毕业于斯坦福或者成绩全 A。(相关阅读:《给学生的创业指南》)。
创办一家创业公司与普通工作有着根本的区别。在创业中,经验的作用往往被高估。真正重要的是成为替你的用户解决问题的专家;其他一切都可以在创业过程中逐步摸索。「最有潜力的年轻人总是会被大型组织低估,因为年轻人还没有可以衡量的业绩,而对他们能力的任何估计误差都只会趋向于平均水平。」(引自《招聘已过时》)通过创业,你可以发现自己的真实市场价值。
总的来说,创业公司与其他公司、学校和「常规工作」有着本质的不同。那么,为什么只有少数人选择创业呢?Graham 在《为什么不要不创业》一文中列举了人们常见的借口(以及相应的批判)。
创业公司是财富创造机器
创业公司本质上就是与众不同的。你无法通过类比其他事物来真正理解它们。那么,该怎么描述它们呢?
创业公司是合法致富的最有力方式之一。如果你成功了,你就可能只用几年时间成为富翁,以至于不知道该如何处理这么多钱。但也许比金钱更好的是成功的创始人所节省的宝贵时间:
「从经济角度来看,创业最好被视为一种提升工作效率的方式,而不是致富的方式。你必须谋生,而创业是一种快速完成这一目标的方法,而不是让它拖延贯穿你的一生。」(摘自《创业公司最难学会的教训》)
在《如何创造财富》一文中,Graham 说明了为什么创业公司是为财富创造而优化的。(为了清晰起见,这里我们要区分财富与金钱:财富是人们想要的东西,而金钱仅仅是获取它的交换媒介。所以创业公司实际上并不创造金钱,而是创造财富;换句话说,它创造人们想要的东西,人们为此给予金钱。这个区别看似微小,但却很重要:「赚钱」看起来非常复杂,而「创造人们想要的东西」则要容易得多。)
为什么创业公司更擅长创造财富?
**杠杆作用:**假设一个创业公司解决了一个复杂的问题,那么它只需要解决一次,便可通过技术无限扩张。因此,一旦创业公司找到了某种问题的解决方案,就可以迅速创造大量财富。
**可测量性:**在创业公司中,每个员工的贡献比在大型组织中更容易衡量。因此,如果你表现出色并创造了财富,你就更有可能在创业公司中获得与你的价值相称的报酬。
更多详情请参阅《生财有道》。
好的创业想法起源于个人需求,而且听起来并不令人信服
尽管获得创业灵感的方式多种多样,但 Graham 观察到,大多数成功的创业公司都源于创始人的个人需求。他提议,你应该专注于为自己解决问题,而不是一开始就考虑创办公司。只要持续解决问题,你可能会在不知不觉中创立了一家公司。(出自《有机创业想法》)
Graham 还注意到,好的创意往往来自边缘地带——那些你意想不到的地方。这些想法通常非常聚焦,比如一个专门的在线书店或针对大学生的社交网站。正因为如此,它们并不轻易显露出改变世界的潜力;我们往往会忽视这些创意,直到它们的价值变得无法忽视。
因此,好的创意在最初可能并不像是能够创造十亿美元价值的商机——事实上,什么才算是「十亿美元级」的商机呢?这显然不是我们能够提前识别的。实际上,最初的想法往往都是如此粗糙和基础,以至于如果你刻意寻找能够一鸣惊人的机会,你很可能会忽视它。真正伟大的想法甚至可能会让你望而却步——因为它们看起来太过雄心勃勃。
一个好的想法之所以听起来不那么令人信服,是因为如果它真的很明显,早就有人付诸实施了。因此,这些想法往往看起来有些疯狂或非常规。「最成功的创始人往往致力于那些未被人们关注的项目。这种状态在你看到成果之前,与人们对疯狂的描述相去不远。」(出自《黑天鹅养殖》)
事实上,当有人向你提出一个看似疯狂的新想法,并且这个人「既是该领域的专家,又是一个理性的人」,那么这很可能就是一个好想法(即使它乍听起来像是个糟糕的主意)。「如果提出想法的人是理性的,那么他们也知道这个想法听起来多么不可思议。但他们仍然选择提出这个想法,这表明他们知道一些你不知道的事情。如果他们在该领域有深厚的专业知识,那么这很可能就是他们独特见解的来源。」
Graham 还强调创业成功的关键不在于想法本身,而在于那些践行这些想法的人。
他还引用了一句发人深省的话:「不用担心别人会窃取你的创意。如果你的想法真的够好,你反而得绞尽脑汁让别人接受。」(这是 Graham 引用自 Howard Aiken 的话)
不过,如果你正在寻找灵感,Graham 提供了一些很好的思路来激发创业点子。
创始人决定创业公司的命运
「创业公司成立得越早,创始人的重要性就越突出。」Graham 在他的多篇文章中反复强调创始人的关键作用。比起其他任何因素——比如目标用户、市场趋势、潜在市场规模等——都更加重要。(当然,其他员工也很重要。但创始人是特殊的,他们是创业公司的灵魂所在。)
「对于创业公司而言,联合创始人就像房地产中的地理位置。你可以改变房子的一切,唯独改变不了它的位置。同样,在创业过程中,你可以轻松调整商业理念,但更换联合创始人却是一件难上加难的事。」(摘自《13 句话总结创业》)。
事实上,Graham 指出大多数成功的创业公司都有多个创始人。
认真和足智多谋是优秀创始人的标志
既然创始人是决定创业公司成败的最关键因素,那么了解什么样的人能成为优秀的创始人就显得尤为重要。Graham 在多篇文章中都深入探讨了这个问题。
根据 Graham 的观点,一个优秀的创始人应该是:
「我们能给予创始人的最高评价就是称他们为『认真』的人。」
一个认真的人做事是出于正确的动机,并且会全力以赴。这个正确的动机通常不是为了赚大钱,而是为了解决某个问题或满足智力上的好奇心。这就是为什么找到你的内在动力或者拥抱你的极客特质如此重要(我们稍后会详细讨论这两点)。
「几天前,我终于用两个词概括了优秀创业公司创始人的特质:永不言弃,灵活应变。」
永不言弃 = 坚持不懈地推动事情朝你期望的方向发展
灵活应变 = 为了达成目标而适应环境并尝试新方法
既永不言弃又灵活应变的人明确自己的目标,他们会积极尝试各种方法,不遗余力地「奋斗」直到实现目标。 Airbnb 的创始人就是一个很好的例子,他们曾经通过销售特制麦片来维持公司运营。
Graham 观察到了关于应变能力的一个规律:当他与善于应变的创始人交谈时,他只需点到为止。他简单指明方向,这些创始人就能自行摸索前进。相比之下,与缺乏应变能力的创始人交流则显得更加困难。
成功的关键不在于智力,而在于决心。聪明人也常有失败的时候,而一些看似平庸的人却因为下定决心追求成功而最终获得成功。
「创造人们需要的产品」是目标,而「永不言弃,灵活应变」则是实现这一目标的前提。
另外需要注意的是:优秀的创始人不应刻薄。《刻薄的人注定失败》,因为他们无法吸引优秀的人才与之合作,而友善的创业公司创始人则更容易吸引人才。
创造人们需要的产品
如果只能从Graham那里得到一条创业建议,那必然是:「创造人们需要的产品」。(你可能知道,这也是 Y Combinator 的座右铭)
诚然,这看似显而易见。但它却是创业中最为关键的要素:只要你创造了人们真正需要的产品,就能自然而然地吸引用户、员工、投资者和资金。「我们可以将创业公司创造的价值想象成一个矩形,其中一边代表用户数量,另一边代表你对用户生活的改善程度。」
事实上,许多初创公司在起步阶段「与非营利组织极其相似」,因为它们过分专注于帮助用户,而较少关注盈利。有趣的是,这种看似不计回报的方法反而能在将来为它们带来丰厚的回报。
「几乎每一个失败的创业公司,其根本问题都在于产品无法满足客户需求。虽然大多数公司的死因被归结为'资金耗尽',但这只是表面现象。为什么他们无法获得更多资金?很可能是因为产品本身乏善可陈,或者迟迟无法完成,抑或两者兼而有之。」(摘自《如何创办一家创业公司》)
那么,如何打造人们真正需要的产品呢?答案是:贴近用户,快速推出,持续迭代。
贴近用户
「创业公司的核心任务是创造财富;而你最能掌控的财富维度,就是尝试最大程度地改善用户的生活;其中最具挑战性的部分在于洞悉用户的真实需求。一旦你明确了产品方向,实现它只是付出努力的问题,而大多数优秀的程序员都能胜任这一点。」(摘自《13 句话中的创业公司》)
「设计产品时,你必须以用户为中心,但更重要的是,你要设计用户真正需要的,而不仅仅是他们口头上说想要的。这就像医生的工作一样。你不能只治疗表面症状。当病人描述症状时,你需要洞察真正的病灶,并针对性地进行治疗。」(摘自《设计与研究》)
由于在产品正式推出前,你可能无法准确定位目标用户群体及其具体需求,因此亲身体验自己的产品是一种行之有效的方法。如果你能从使用中获得满足感,那么与你相似的人群很可能也会喜欢这个产品。这就解释了为什么成功的创业公司往往发源于创始人的个人需求。
快速推出,持续迭代
「我最常强调的创业建议是:尽快推出第一个版本,然后根据用户反馈不断改进。」
迭代的重要性在《1.0 版本》、《这是哪个微软的 Altair Basic?》和《早期工作》等文章中得到了充分强调。(如果你真正理解了迭代的重要性,那么你就会明白必须尽快推出 1.0 版本,以便更早地开始迭代过程。)
这些文章中提出了一些重要观点:
-
不要拿你的处女作与别人的成熟作品相比较。(如果非要比较,最好是与成功人士的早期作品相比。但人们往往会为了避免被嘲笑而隐藏自己的初稿。)
-
当感到迷茫时,问问自己:这个看似拙劣的 1.0 版本是否有可能通过不断迭代,最终成长为一部令人赞叹的杰作?
度过早期的拙劣阶段并持续迭代从来都不是易事。不过,Graham 在《早期工作》一文中列出了一些帮助你调整心态的实用技巧。
创业是开辟一条前所未有的道路,不过依然可以借鉴一些前人的经验
大多数情况下,创业公司不应该直接套用其他创业公司的模式:
「如果你的每一步都按照普通创业公司的方式来走,那么你注定平庸。问题在于,平庸的表现意味着你的公司终将倒闭。创业公司的存活率远低于 50%。因此,如果你正在经营一家创业公司,你最好尝试变得与众不同。否则,你就会陷入窘境。」
创业在执行阶段不存在成熟的方法论;尽管许多博客文章和意见领袖想让你相信存在固定的成功公式,但事实并非如此。这就是为什么创始人必须诚实可靠、永不言弃并且善于利用资源:因为他们需要靠自己去探索前进的道路。
尽管创业世界中并不存在一条可以按图索骥的成功捷径,但 Graham 通过走访数百乃至上千家创业公司,总结出了一些行之有效的普遍原则:
「你所进行的创业并不仅仅是成立一家公司然后扩大规模,你真正要做的是努力去推动这份事业的发展。」
「创业公司之所以能够腾飞,是因为创始人在默默推动。如果你的公司没能起飞,并不一定是因为市场不存在,很可能是因为你还不够努力。」
在某个阶段,你的创业公司可能会进入自动增长模式。但在达到这个阶段之前,你需要做一些看似微不足道的事情,例如给潜在客户发送冷邮件,在各类会议上与人交流,或者提供「超乎想象的优质客户服务」。
「做那些不可规模化的事」这一建议警示我们,打造一个伟大的产品只是成功等式中的一部分;无论你的产品多么出色,我们仍然需要进行大量艰苦的、无法大规模复制的工作来实现初期增长。
方便面盈利 = 创业公司刚好能赚到足以支付创始人基本生活开支的收入。
「方便面盈利意味着创业公司不需要通过融资来维持生存。此时主要开支仅限于创始人的基本生活费用,而这些费用现在已经可以得到覆盖(即便他们只吃得起方便面)。」
意义:方便面盈利标志着创业公司从默认死亡状态转变为默认存活状态。此时,你面临的挑战从「如何避免资金耗尽」变成了「如何避免精力耗尽」。尽管经营创业公司始终充满压力,但达到方便面盈利确实能让你稍微卸下一些心理负担。
要提高创业公司成功的概率,就要提高生存的概率;要提高生存的概率,就要达到方便面盈利。
要真正进入创造和构建的状态,你需要长时间不受干扰的专注。你不可能在会议间隙的一小时内创造出优秀的产品;「那点时间连热身都不够」。想想那些给人刻板印象的程序员,他们喜欢彻夜工作,很可能是因为凌晨三点没人会来打扰他们。
「对于遵循创造者时间表的人来说,会议简直是灾难。一场会议就能搞砸整个下午,因为它把时间切成了两块,每块都不足以完成任何有挑战性的工作。」
如果你想要创造出卓越的作品,就必须认识到管理者和创造者的工作节奏有很大不同。作为管理者,要尽量为创造者提供大块的连续时间;作为创造者,则应该尝试把所有会议都安排在一周的某两天,这样剩下的时间就可以自由创作了。
《在头脑中构建程序》一文对这些观点进行了更深入的探讨。
不该做什么
Graham 还研究了反面情况:什么是不该做的。他将其称为「《如何避免失败》」。
-
保持高昂士气(不要精疲力尽)
-
不要资金耗尽(例如,不要过快扩张团队)
-
不要分心做其他事情。创业需要你全身心投入。(拖延主要源于分心。避开干扰,你就能避免拖延。不过,请注意,拖延也可以是有益的。)
-
不容许自己失败(迫使自己全力以赴)
-
永不言弃,即使困难重重
总结一下这部分关于具体实践的内容,以下是 Paul Graham 提出的《创造新事物的六项原则》:
-
简单的解决方案
-
忽视不重要的问题
-
关注真正亟需解决的问题
-
以尽可能非常规的方式提供解决方案
-
从一个极其粗糙的 1.0 版本开始
-
然后快速迭代
你越关注金钱,就越难专注于产品
Graham 不经常谈论金钱,当他谈论时,我会有一种奇怪的感觉。这就像「比起谈论金钱,我更愿意谈论产品。」让我解释一下:
在《不要和公司发展部门交谈》中,Graham 说一个初创公司需要知道的关于并购的一切内容就是,除非你现在打算出售,否则你永远不应该和公司发展部门交谈。所以最好专注于产品,直到你绝对必须考虑并购。
在《你脑海中的最优先想法》中:「一旦你开始筹集资金,筹集资金就会成为你脑海中的最优先想法」,而不是用户和产品。所以你的产品会受到影响。
不要花光你获得的资金。「最常见的失败原因是资金耗尽」,你可以通过不花钱,精准且不过度的雇人来避免这种情况。
只有一种情况需要你优先考虑赚钱:当你的初创公司处于濒死状态——「假设公司的开支保持不变,收入增长率与过去几个月一样,公司能用剩余的钱实现盈利吗?」如果你知道你的公司处于濒死状态,你的工作重心会迅速转移到扭转局面并实现盈利;以此避免《致命紧缩》。
从长远来看,很明显,更关注用户感受和产品效果的公司比痴迷于赢得投资者青睐并筹集资金的公司更胜一筹。
Paul Graham 的择业建议
从事什么工作是你生命中最重要的问题之一,与你的住处和伴侣同样重要。虽然 Graham 对这个问题的处理肯定倾向于创业,但你也可以从副业、爱好、项目(职业内外)等角度来套用他的想法。
本节提到的文章:
为什么书呆子不受欢迎(这系列的文章可以阅读《黑客与画家》)
听从内心的召唤
当你对某事怀有强烈的热情时,你会对它产生无穷无尽的好奇心,并且终将在这个领域有所成就。(稍后我们将探讨好奇心如何孕育天才。)
「如果某项工作在他人眼中是苦差事,而你却乐在其中,那么你就非常适合做这件事。」换句话说:你的兴趣爱好越是独特,就越应该坚持并发展它们。
在互联网时代,你可以通过追随自己的兴趣爱好来赚钱。这是一个革命性的变革:过去人们不得不在枯燥乏味的工作中赚钱,只能在周末时间满足自己的好奇心。而如今,无论是创业还是经营 YouTube 或 Gumroad 账号,你都可以仅仅凭借追随内心的兴趣就能获得可观的收入。
世界上最强大的两股力量——金钱和好奇心——正日益趋于一致。追随内心动力的最佳时机莫过于此。当下,关键的问题不在于如何赚钱,而在于要做什么。因为只要你找到了后者的答案,前者的问题就会迎刃而解。
事实上,书呆子们比普通人更接近找到人生真谛。(这里的书呆子,或者说热忱之人,指的是那些纯粹为了兴趣而投入,而非为了追求名利的人)。高中时期的书呆子们往往不受欢迎,这并非因为他们不懂得如何讨人喜欢或操纵社交规则,而是因为他们根本不在乎自己是否受欢迎。这可能让他们的高中生活颇为艰难,但在现实世界中,他们反而能获得更多成就感:当其他人陷入追逐人气和地位的无休止竞争中,热衷于解决时髦问题时,书呆子们却能自由地追随自己的好奇心,专注于他人忽视的领域,从而有机会发现新事物,最终取得成功。更可贵的是,他们在这个过程中能获得更多乐趣。
要发掘你的内在动力并确定该做什么,不妨问问自己:「在哪个领域,你是个不折不扣的书呆子?」
让我们以《如何做你热爱的事》中的一个深刻而实用的洞见来结束这一部分:
「我认为,要获得幸福,你必须做一些不仅让你享受,而且让你敬佩的事情。你必须能够在完成后说,『哇,这真是太棒了。』这并不意味着你一定要创造什么。如果你学会了悬挂式滑翔,或者能流利地说一门外语,那也足以让你在相当长一段时间里感叹,『哇,这真是太棒了。』」
从心所欲
顺着内在动机的逻辑,我们可以得出结论:你应该投身于自己的项目(或在其中拥有重要话语权的他人项目)。
你可能已经注意到,自己发起的项目与上司或老师分配的任务有着本质的不同。这背后是有原因的:《你本不该有老板》。
在那篇文章中,Graham 提出了一个发人深省的观点:尽管如今在大型组织中工作已成为常态,但这并非人类与生俱来的工作方式。他巧妙地将大型组织比作现代饮食——充斥着披萨、糖果等加工食品,而将小团体(如创业公司)比作狩猎采集者的饮食。前者表面上轻松、安全、诱人,但长期而言可能弊大于利;后者则看似艰难、缺乏吸引力,却更符合自然法则,从长远来看更有益处。
Graham 在《一个属于自己的项目》」一文中进一步阐述,在小团体中工作不仅能带来更多的幸福感和自由,还是成就伟业的途径。当你感觉一个项目真正属于自己时,你会拥有其他情况下难以企及的动力和责任感。你会更乐意沉浸在细节中,孜孜不倦地追求卓越。
心无旁骛
「固守『工作/生活平衡』的教条是错误的。事实上,『工作/生活』这个说法本身就存在问题:它假定工作和生活是泾渭分明的。……我不愿从事任何不能让我全身心投入的工作。」(引自《一个属于自己的项目》)
对创业者而言,创业就是他们的全部生活——几乎没有时间顾及其他,连睡眠都成了奢侈。为什么他们宁愿每周工作 80 多个小时,以方便面果腹,没有确切的经济回报,也不愿在大公司朝九晚五、享受龙虾大餐呢?这是因为创业是他们自己的事业,他们已经——希望是经过深思熟虑后——决定让它成为生命的主旋律。「人们愿意为自己创立的公司付出任何程度的辛劳。」
如何判断某事是否已经占据了你的生活?这里有个简单的测试:你是否会在淋浴时思考它?
在《主导你思维的核心观念》一文中,Graham 阐述:如果某件事对你真正重要,你的大脑就会不自觉地思考它,在散步或洗澡等日常活动中,相关的想法会自然涌现。事实上,如果你没有经历这种状态,你就很难做出卓越的工作——这是一个信号,提示你需要重新考虑自己的工作方向。
Paul Graham 对于思考和决策的思考
创业者是一群独特的人:他们致力于改变现状,这意味着他们能洞察一些不易察觉的可改进之处,并且对这种改进深信不疑,以至于愿意每周工作 80 多个小时,忍受艰苦的生活条件,直到他们的愿景成为现实。
是什么在驱动着他们?这绝不仅仅是金钱——许多创始人已经获得了财富,却仍然在自己的公司工作,甚至开始新的创业项目。那么,为什么创始人的数量并不多呢?创始人具备哪些非创始人所缺乏的特质?
通过深入研究这群人,Graham 揭示了许多关于思考、决策和人类心智的普遍真理。
本节涉及的文章:
独立思考 vs 循规蹈矩
独立思考型的人喜欢自主思考问题,因此在循规蹈矩者(即那些追随大众、随波逐流的人)眼中,他们可能显得与众不同。由此可见,新思想和新创业项目几乎都是独立思考者的杰作,这几乎是不言而喻的。
在《循规蹈矩的四个象限》一文中,Graham 更深入地探讨了独立思考和循规蹈矩的积极和消极表现形式。值得注意的是,积极型的独立思考者倾向于质疑并挑战现有的规范和规则,而积极型的循规蹈矩者则致力于维护这些规范和规则。这两类群体之间难免产生冲突,因此,为独立思考者提供「保护」至关重要,应当给予他们创新的空间,让他们能够打破常规,提出新的想法和创造。(这些「受保护的区域」对创新至关重要,硅谷可以视为其中之一。)
如果你知道某人是循规蹈矩型的,你就能对他们有相当程度的了解。他们的信念和行为与大众平均水平相符,而这个平均水平是可预测的。相反,如果某人是独立思考型的,你就难以真正了解他们;他们会自主思考问题,因此可能会得出你难以想象的结论。事实上,在某个问题上,独立思考者可能持左翼立场,而在另一个问题上又可能持右翼立场;他们不经意间成为政治中间派。相比之下,循规蹈矩者更可能在所有问题上都坚持左翼或右翼立场。
Graham提出了《正统特权》的概念,用来描述那些思维方式传统的人。这些人认为,每个人都可以毫无顾忌地表达自己的观点,因为在他们眼中,一切都是约定俗成、毫无争议的。他们甚至无法想象,有什么真实的言论会给自己带来麻烦。
当你向这些人表达一些具有争议性的新想法时,他们可能会将其视为不实的异端邪说。《新颖性和异端性》往往如影随形。在这些思维传统的人看来,他们并不觉得自己思维保守,只是认为自己的观点才是正确的。对他们而言,任何非主流的观点都可能是错误的;而对独立思考者来说,过于主流的观点反而值得怀疑。因此,如果你决定公开表达自己独立的见解,最好先学习《如何理性地表达不同意见》。
在《如何独立思考》一文中,Graham 指出,某些领域的工作只有在你的思维方式与众不同时才能做得出色:科学家致力于新发现,循规蹈矩难有作为;投资者如果思维模式与他人完全一致,就难以获利;创业者若只是重复他人的想法,就无法创造出伟大的新事物。在这些领域,你不仅要是正确的,而且大多数人还得是错的。
当然,并非所有工作都是如此。例如,做一名优秀的行政人员并不需要特立独行的思维方式;其他人的观点是否正确并不重要。通常,具有独立思维的人更倾向于在那些鼓励创新的领域发展。
在《如何独立思考》一文中,Graham 还分享了一些锻炼独立思考能力的方法。
天才源于无尽的求知欲、智慧、勤奋和勇气
我们往往认为天才是上天赐予的礼物,是与生俱来的禀赋。然而,Graham 打破了这种神秘感,他认为天才是可以被培养和影响的。
好奇心
「真正成就伟业的人往往对某事有着难以言喻的痴迷」。无穷无尽的好奇心总能引领人们做出惊人的发现,这是因为你会付出远超常人的努力去思考和探索某个主题。对你而言,这些思考和探索宛如游戏(尽管在旁人眼中像是工作),因为这种痴迷的兴趣「既是能力的象征,也是毅力的替代品」。
智力
智慧与智力是有区别的。如果说智慧是在不同领域中表现出通才的能力,那么智力则是在特定领域内达到卓越成就的能力。我们通常理解的"天才"更符合后者:即使你在其他方面都平平无奇 ,只要你发现了像相对论这样的惊世成果,就足以被称为天才。
强烈的好奇心和卓越的天赋让你能够在相关领域如鱼得水。但仅凭这些还不足以做出创新。正如 Graham 在《超越智慧》中所阐述的,聪明人并不一定能做出创新;「很多真正聪明的人并没有取得多大成就。」
智力和好奇心是成为天才的必要条件,但还不够充分;你还需要为求新知不懈努力的刻苦和发掘真相捍卫真理的勇气。因为创新不仅要战胜自我,还要面对腐朽者们的怒火。
勤奋和勇敢
即使是天才也要努力工作。(事实上,仅仅知道《如何努力工作》就可以让你提升自己的效率。)然而,努力工作本身并不是目标。产出才是重要的(在这个背景下,产出指的是重要的新想法):「如果我用牙刷给某人粉刷房子,房主不应该因为我用牙刷花费了更多时间就多付我钱。」
初涉新领域时,你难免会经历新手期但「局部越是青涩,全局越显从容」。正如Graham在《在变动中成为专家》中指出,即便你的观点曾经正确,也可能因世事变迁而不再适用。故而,更新观点既需智识谦卑,亦需破除成见的勇气,而非固守过往经验。
把 Graham 的想法综合起来,似乎天才并不是一种你难以触及的先天品质,而是好奇心、智力、努力工作和勇气等多种品质的有机结合。
良好的品味对于好的工作是必要的
良好的品味是与天才相关的一种品质。有些人仿佛有精巧设计的「慧眼」和奏鸣音律的「乐感」,但 Graham 一再声称,品味是可以培养的。
「品味是主观的」这一说法并不准确,这一点从你开始设计、写作或构建事物的那一刻起便可见一斑。正如艺术领域存在杰作与平庸之作,写作有优劣之分,设计亦有高下之别。将‘品味是主观的’作为借口,实则是思维的懒惰,无益于作品的精进。「品味是主观的」这一说法并不准确,这一点从你开始设计、写作或构建事物的那一刻起便可见一斑。正如艺术领域存在杰作与平庸之作,写作有优劣之分,设计亦有高下之别。将‘品味是主观的’作为借口,实则是思维的懒惰,无益于作品的精进。
要创造出更优秀的作品,首先你需要意识到自己可能存在品味欠佳的问题,并致力于培养良好的品味。这通常需要通过不断提升自己的技艺或向那些品味出众的人学习来实现。正如 Paul Graham 所言:「优秀的作品源于你对于缺陷的洞察,理解其中缘由,并努力将其完善。」(引自《创造者的品味》)
那么,什么才算是优秀的艺术或设计呢?Graham 列举了以下几点建议(经过删减):
-
简洁
-
经典
-
解决恰当的问题
-
富有启发性
-
常带一丝幽默
-
难度高
-
看似简单
-
活用对称
-
返璞归真
-
往往独特
-
常常大胆
真正优质的作品未必是广受欢迎的;正如Graham在《艺术与错觉》中指出的那样: [某些认知偏差的破坏力如此强大,若举行公投,最终测量的不过是偏差本身](http://paulgraham.com/goodart.html)但若能持守真知灼见深耕创作,真正杰出的作品终将在时光沉淀中焕发光彩,赢得真正的鉴赏与传承。
你的论点是否可以验证?
仔细阅读 Graham 的文章,你会发现他在提出论点时,往往会伴随着验证这个论点的方法。这体现了他科学家般的思维方式:只有可以被验证的论点才值得接受。
例如,在How to Do What You Love一文中,他是这样论述的:
「我认为,要获得幸福,你势必付出足够的努力。你要能够在完成后由衷地说:『哇,巴适的很!』。这并不意味着你必须进行发明创造。只要你掌握了诸如滑翔之类的技能,或者一门外语,便足以让你在一段时间内感叹『哇,我真牛逼!』。关键在于必须有一个检验标准。」
在《岛屿测试》一文中,他提出了一个测试方法来发现自己真正需要的事物:
「想象一下,你要在缅因州海岸附近的一个小岛上,在朋友家度过周末。岛上没有商店,而且你无法离开。此外,你从未去过这所房子,所以不能假设它比普通房子更设施齐全。
除了衣物和洗漱用品,你会特意带些什么?这就是你离不开的东西。」
有时,验证观点(并使其具有实用性)的最佳方法是设计一个测试。在《如何创办创业公司》一文中,Graham 探讨了优秀创业公司员工的特质。他本可以简单地说「他们坚定不移,义无反顾」,但这种论点既不可验证,也缺乏实用性。
相反,Graham 设计了一个测试:「你能把这个人比作一种动物吗?」如果你能说「Jaakko 就是一头野兽」,而且不是在开玩笑,而是认真地这么形容,那么这就是你想要的创业公司员工。一个"野兽型"的销售人员绝不接受拒绝;一个"野兽型"的程序员会通宵达旦地编码;一个"野兽型"的公关人员会锲而不舍地向城市里的每家报社推销,直到你的创业公司登上报纸。
你可以尝试一个有趣的晚间活动:回顾你写过的文章,看看你是否还坚持过去的想法。。
Paul Graham谈写作
Paul Graham 以文章清晰简洁而闻名。无论主题多么复杂,他的文章都通俗易懂。
仅通过阅读 Graham 的作品,你就能学到很多写作技巧,如果是关于写作主题的文章,那就更是收获颇丰。幸运的是,他写了很多这样的文章。
首先,Graham 在《写作简述》中概括了他的写作哲学。这篇文章将整个写作课程浓缩成一个简单思路。我建议你先阅读这篇文章,然后再继续往下看。
本节提到的文章:
写作是获得创意、发展认知和提升思维的途径
如果你读过《写作简述》(你应该读),你会注意到这段话:
「我认为写作的重要性远超大多数人的认知。写作不仅仅是传达想法,更是产生想法的过程。如果你写作能力差且不喜欢写作,你将错过写作本可以带来的大量想法。」
从想法的角度来看,成为一个优秀的写作者比成为一个优秀的演讲者更为重要。写出好文章需要好的想法,但一场好的演讲可能并不需要太多实质性内容。尽管演讲在激励和建立个人联系方面可能更有优势,但在产生想法方面,写作更胜一筹。
写作的目的不是说服他人,而是发现新颖有用的东西
大致上,文章可以分为两类:一类是你在开始写作前就清楚知道文章走向的,另一类是你完全不知道文章会如何发展的。
在学校教育中,我们通常被教导写作第一种类型的论文:在引言部分阐明主题,然后确保文章的其余部分都围绕这个主题展开论述。这种写作的目的是说服读者接受我们的观点。列表式文章就属于这种类型,但撰写这样的文章并不能帮助我们发现新的思想或知识。正如有人所说,「我担心如果我为了说服而写作,我会不自觉地开始回避那些我知道难以让人接受的想法。」
Paul Graham 是第二种写作方式——为探索而写作的支持者和实践者。在他看来,一篇优秀的文章应该具备两个关键特质:新颖性和实用性。
文章应该具有新颖性
如果一篇文章没有呈现任何新颖或令人惊讶的内容,那它还有什么意义呢?当我们为了探索而写作时,我们希望能给自己和读者带来惊喜。最令人惊讶的内容往往是与人们当前既有认知相距最远的。
但仅仅是新颖还不够。世界上每天都有海量的新信息和新闻产生,但它们并不一定能对我们的生活产生实质性影响。我们应该追求的是《既具普遍性又令人惊讶的》内容。「通常情况下,人们最多只能做到其中之一:要么令人惊讶但缺乏普遍性(如八卦新闻),要么具有普遍性但缺乏新意(如陈词滥调)。」如果你能在某种程度上兼顾普遍性和新颖性(至少对一部分读者而言),那么你就写出了一篇成功的文章。
正如 Graham 所说,「文章应该追求最大程度的惊喜。」
文章应该具有实用性
那么,一篇文章如何才能称得上有用呢?Graham 在《如何写出有用的文章》中提出了一些见解:
-
实用性是检验正确性的标准。单纯具有说服力的论述可能是错误的。
-
「优秀的写作无疑应该具有说服力,但这种说服力应该源于你得出了正确的结论,而非源于你出色的论证技巧。」(摘自《论文写作的时代》)「有价值的写作应该提出尽可能有力的观点,但又不至于失实。」
-
「有价值的写作应该告诉人们一些重要的、他们之前不知道的事情」(这再次呼应了「惊喜」的理念)
优秀的写作源于反复修改(尤其是为了使文本更加简洁)
就像任何需要技能的事情一样,提高的关键在于反复练习。优秀的写作来自于反复修改。因为我们看不到别人的草稿和修改过程,我们往往将他们的最终作品与我们的《早期作品》进行比较,然后因为看到差距而感到沮丧。相反,我们应该意识到,现在看起来糟糕的作品如果经过足够的修改,也可能会变得出色。
「我的写作策略是先放松后严格。我会快速写出文章的初稿,尝试各种想法。然后我会花几天时间非常仔细地重写它。」(摘自《如何写出有用的文章》)
当你重写时,你的主要目标应该是使你的写作变得简单。大多数情况下,最简单的词语和句子比华丽复杂的词藻更好。你的目的是传达一个想法,而不是使用花哨的词语,让读者「为了让你看起来很酷而做额外的工作」。
在《像说话一样写作》中,Graham 分享了一个简单写作的技巧:通过交谈向朋友解释你的想法;然后,用这个对话记录作为你的文章草稿。你的想法的口头表达和书面表达应该尽可能接近。「如果你能做到像说话一样写作,你就已经超过了 95% 的作家。」
尽可能为你的想法找一个恰当的比喻
这并非Graham直接给出的建议(尽管他确实主张写作要简洁,而还有什么比一个绝妙的比喻更简洁呢?)
相反,这是你在广泛阅读 Graham 的作品后会发现的一个特点。比喻是他常用的一种有力的写作工具。
以下是我最欣赏的几个 Paul Graham 的比喻:
「意大利有一道名为 saltimbocca 的菜,意为『跳入口中』。我的写作目标可以称为 saltintesta:想法直接跳入你的大脑,你几乎感觉不到传递这些想法的文字。」(摘自写作要简洁)
「人们往往没有意识到,伟大事物的开端通常是由零散的部分拼凑而成的。他们不自觉地用成熟企业的标准来评判处于萌芽状态的创业公司。这就像有人看着一个新生婴儿,就断定『这个小生命不可能有任何成就』。」(摘自《做那些无法规模化的事》)
「在文章体裁中,N 个要点的清单文章就像快餐界的芝士汉堡。如果你在一家你不太信任的餐厅用餐,最保险的选择就是点一个芝士汉堡。即使是烹饪技术欠佳的厨师也能做出一个还过得去的芝士汉堡。而且,芝士汉堡的制作有相当严格的规范。你可以确信厨师不会在这上面搞什么奇怪的艺术创作。同样,N 个要点的清单文章也能在一定程度上限制糟糕作者可能造成的破坏。」(摘自《N个要点的清单》)
「有时候,这是因为作者只掌握了非常宏观的数据,然后就从中得出结论。这就像那个寻找钥匙的醉汉的寓言:他在路灯下找,而不是在真正丢钥匙的地方找,只因为路灯下光线更好。」(摘自《经济不平等》)
「如果我给别人的房子刷油漆,房主不应该因为我用牙刷来完成这项工作就多付钱。」(摘自《正视差距》)
「我也说不清楚原因,也许只是我太笨了。这就像开罐器在狗狗眼中一定是个神奇的玩意儿。」(出自《创造者的品味》)
「创业公司就像蚊子。熊能承受打击,螃蟹有坚硬的外壳,而蚊子的设计只为一个目的:叮人。它不会把精力浪费在防御上。作为一个物种,蚊子靠数量取胜,但这对单个蚊子来说可没什么安慰。」(出自《如何创造财富》)
「因此,独立思考的人对意识形态深恶痛绝,因为意识形态要求人们一次性接受一整套信念,并将其视为信仰。对独立思考者来说,这就像让一个对食物挑剔的人去咬一口装满各种来历不明、存放时间不确定的配料的长条三明治一样令人作呕。」(出自《如何独立思考》)
Paul Graham 的社会观
创业公司成长为大企业,创业者晋升为亿万富豪,产品用户从数百人扩展到数百万人……如果你致力于帮助创业公司,你就是在以一种深远的方式改变社会。
本节涉及的文章:
"减少财富不平等"并非听上去那么美好
正如我们先前所述,创业公司是一台创造财富的机器。因此,当我们看到Graham讨论财富不平等的相关话题,并解释为何它并非人们所认知的那般"洪水猛兽"时,我们不应感到意外。
财富不平等是一个极具争议的话题,而我并非这方面的专家。因此,我将尽量客观地概述这个问题,避免曲解Graham的观点。如果你对这个话题感兴趣,建议你阅读相关文章的全文。
人们普遍认为财富不平等本质上是有害的。
在《注意差距》一文中,Graham 列举了三个导致我们认为财富不平等天生就是坏事的原因:
-
**财富的「父亲模型」:**我们往往将财富等同于金钱,并认为财富总量是固定的。基于这种固定总量的思维,我们认为财富应该被平均分配。(然而,你现在应该明白,财富与金钱是不同的,而且财富是可以创造的;并不存在所谓的「固定总量」或「固定蛋糕」;实际上,我们可以让蛋糕变得更大)
-
**我们以为现在致富的方式与过去相同:**在历史上,富人往往通过掠夺(战争或苛捐杂税)来积累财富。因此,一些人仍然认为今天的富人是通过不正当手段获得财富的。然而,在当今社会,创造财富才是更好、更可靠、更快捷和合法的致富之道。
-
**我们对杠杆效应缺乏理解:**技术进步扩大了高生产力者和低生产力者之间的差距,从而加剧了财富不平等。当我们看到一位 CEO 的财富是普通员工的 100 倍时,会觉得这很不公平,因为 CEO 不可能比普通员工辛苦 100 倍。但是,由于杠杆效应,CEO 的决策和行动可能产生 100 倍于普通员工的价值。正如 Graham 所说:「我完全可以想象一个人的生产力是另一个人的 100 倍。」
财富不平等可能是积极现象的表现。
「财富的差异可能反映了生产力的差异。(在只有一个人的社会中,财富等价于生产力。)这几乎可以肯定是件好事:如果你所处的社会没有生产力的差异,这可能并不是因为每个人都是托马斯·爱迪生。更可能的情况是,你的社会根本就没有托马斯·爱迪生这样的人才。」
在技术水平不高的社会里,个人生产力的差异并不显著。设想一个需要采集木柴生火的游牧部落,最擅长采集的人和最不擅长的人之间的效率差距能有多大?可能也就两倍左右吧。然而,当你把电脑这样复杂的工具交到人们手中时,他们利用这个工具所能创造的价值差异可能就是天壤之别了。(引自《super大黑客》)
「当你帮助创业者时,某种程度上你也在促进经济不平等。如果我们的目标是减少经济不平等,那么按理说就不应该有人去帮助创业者。不过这种论断听起来似乎有些不妥。」(引自《经济不平等》)
导致经济不平等的因素有很多。其中一些因素确实是负面的,比如腐败和盗窃。但也有一些因素通常被认为是积极的,例如生产力的差异。有些人在创造人们需要的东西方面有着卓越的才能,远超常人,因此他们能够创造更多财富也就不足为奇了。
我们需要认识到,创业公司实际上是在做大整个行业的蛋糕:他们通过为他人创造价值来实现自身的财富积累。他们的富有并不意味着你一定是受害者。恰恰相反,以谷歌的创始人为例,他们之所以富有,是因为他们为数十亿人的生活带来了便利和富足。
当然,财富不平等的原因并不仅限于创业公司(尽管创业公司确实可能导致最极端的结果)。一些人的薪资高于他人,同样是因为他们创造的财富更多。如今的薪资比以往任何时候都更接近市场价值,而且这种趋势还在持续。这是因为人们有更多的自由来创办自己的公司、更换工作单位,甚至在国际范围内寻找工作机会。
对富人征税确实能在一定程度上减少经济不平等,但其结果可能并不如你所愿。
如果你想让穷人变得更富裕——这很可能是你希望缩小贫富差距的初衷——你有两个选择:一是从富人手中拿钱,二是提高穷人的生产力,比如通过教育和基础设施建设来帮助他们致富。然而,即便你提高了人们的生产力,仍然会有一些人的产出比其他人高出千倍,因此经济不平等依然存在。
要想减少经济不平等,唯一的办法就是从顶层着手——也就是从富人那里拿钱(详见《不平等与风险》)。但这样做会降低创办或投资初创企业和商业活动的回报,从而阻碍技术创新。这听起来可能不如「减少经济不平等」那么正面。特别是当你考虑到除了收入不平等之外,还存在许多其他类型的不平等时,情况就更复杂了。
富人和穷人之间的差距在金钱上确实在扩大,但在实际财富方面可能正在缩小。如今,普通人在物质生活上与富人的差距并不太大:双方都拥有冰箱、汽车、手机、Netflix 等。而在 100 年前,富人有汽车,穷人没有;富人拥有我们现在视为「必需品」的东西,穷人则无法获得。通过商业发展,基本产品变得越来越便宜,也越来越容易为所有人所获得。在很多情况下,富人可能会花钱购买某样东西的更高端版本,比如跑车或名牌手表,但基础版本的性价比仍然很高,足以满足大多数人的需求。
如今,富人和穷人的区别主要体现在外表和品牌的档次上;而在过去,区别在于是否拥有。因此,虽然收入差距在扩大,但伴随而来的是生活质量差距的缩小。这种变化反映了社会进步和技术发展带来的普遍福利提升。
「社会需要富人,与其说是希望他们通过消费创造就业机会,不如说是因为他们为致富所做的贡献。这里我并非在讨论涓滴效应。我的意思不是说,如果你让亨利·福特变得富有,他就会雇你在他的派对上当服务员。我是说,他会为你制造一台拖拉机来取代你的牛马。」(引自Mind the Gap)涓滴经济学是一个站不住脚的论点,因为它没有抓住问题的痛点。我们应该关注的是财富如何被创造,而不是如何被使用。
Graham 的观点:
当人们被允许保有自己创造的财富时,他们就能通过创造而非掠夺来致富。如果人们在冒险成功时能够获得更多收益,他们就会更愿意承担风险。创业公司的创始人从来不会独占所有创造的财富;大部分财富都会转移给其他人,因此我们应该鼓励而不是阻碍那些想要致富的人。
基于这些观点,你大概能推测出 Graham 对资本主义与共产主义的看法(他在本节链接的文章中讨论了这个话题,特别是在《如何创造财富》和Mind the Gap中)。
万物皆虚,万事皆允
「在历史的每个时期,人们都相信一些荒谬至极的事情,而且信念如此坚定,以至于你若说出不同意见,就有可能遭到排斥甚至暴力对待。更遑论我们所处的时代。」(引自创造者的品味)
「然而,在历史的每个时刻,总有一些真相一旦说出口就会给你带来巨大麻烦。难道我们是第一个不存在这种情况的时代吗?那将是多么不可思议的巧合啊。」(引自《正统的特权》)
** 万物皆虚,万事皆允**
Graham 反复强调这一核心观点,尤其是在探讨独立思考和从众心理的文章中(如前所述)。这一思想也贯穿于他的创业文章;毕竟,成功的创业往往源于一个当时大多数人并不认同的未来愿景。
Graham 在他的经典之作What You Can't Say中深入探讨了这一观点。这篇文章的思想价值极高,很难用简单的总结概括其精髓。不过,我从中得到的最重要启示是:
我们每个人都持有一些错误的观点,而且可能错得离谱。然而在我们自己看来,这些观点似乎理所当然。因此,保持开放的心态至关重要。
Paul Graham 的人生哲学
如果我们认同写作即思考(正如我们之前讨论的),那么 Graham 凭借 200 多篇文章和数十年的写作经历,无疑进行了大量深入的思考。当他分享人生智慧时,我们应当认真倾听并深入思考。
你将希望现在就知道的事可以说是 Paul Graham 给高中生的人生智慧集锦,也是他最受欢迎的文章之一。虽然强烈建议你亲自阅读全文,但以下几点是我认为特别值得注意的:
-
没有明确的人生规划也无妨。事实上,年轻时不过分执着于某个特定计划可能更为有利。要致力于保持更多的可能性。当你感到迷茫时,选择那个能为你未来带来更多机会的选项。
-
创造些什么。独立完成一些具有挑战性的事情,具体是什么并不重要。在这个过程中,你会深入了解自己。这是快速找到你想投身的事业的捷径,而这正是人生中的重要问题之一。「如果能重返二十岁,我会多做一件事:就是尝试将各种想法组合在一起。……我应该少一些忧虑,多一些行动。如果你不确定该做什么,那就动手创造点什么吧。」(摘自《边缘的力量》)
-
学校里的成功方式与现实生活中的成功方式大相径庭。「学校给你的一个最危险的错觉是,成就伟业需要极强的自制力。大多数学科的教学方式枯燥乏味,以至于你只能靠自律来强迫自己学习。」在学校,知识是被动灌输的;而在现实生活中,你主动发起的事情才是真正重要的,它们会塑造你的人生轨迹。
-
「成年并非是到了某个年龄或从某所学校毕业后自动发生的事。真正的成年是当你决定为自己的人生负责时开始的。这种转变可以在任何年龄发生。……关键是要走出去,积极行动。与其坐等别人教导,不如主动出去做事。」
除了上述观点,我还想在下面强调几个更广泛的主题。
本节提到的文章:
人生苦短
大多数人都会不假思索地认同「人生苦短」这句话。然而,Graham 对这条格言进行了更深入的探讨。
首先,创业本身就是一种珍惜短暂生命或适应它的方式。与其经历 40 年的职业生涯,不如将赚钱的时间压缩到几年的创业期,从而为生活中其他重要的事情腾出时间。随着人类平均寿命的增加和实现经济独立最短周期的减少,创业成为了最大化两者时间差的高效方式。
无论你是否赞同《生命短暂》一文中的观点,我们都存在一个共识:要让生命显得不那么短暂,可以尽量减少不重要的事情。如果你无所事事地度过 5 小时,这 5 小时会感觉漫长难熬。我们越是忙碌,生命就感觉越短暂。因此,我们应该果断削减那些我们不喜欢做的事情,那些我们认为生命太短而不值得浪费时间的事情(Graham直白地称之为「废话」)。
如果我们换个角度思考,就会意识到我们应该为重要的事情投入更多时间。如果人际关系对你很重要,你的日程安排就应该体现这一点。当认识到生命短暂时,我们必须果断地削减不重要的事情,同时为重要的事情腾出时间。这听起来简单易懂,似乎不值一提,但 Graham 在《生命短暂》一文中赋予了它深刻的意义。
如果不够谨慎,浪费生命是出奇地容易
生命短暂,稍不留神,就可能在浑浑噩噩中虚度光阴。
我们容易陷入的一个陷阱是「反测试」。这种测试看似可以追求卓越,但实际上最明智的应对方式是完全置之不理。举例来说,你可以努力成为学校里的人气王,但其实不应该过分在意自己的受欢迎程度;你可以追求成为社会上的重要人物,获得崇高的地位,但这些同样不应该成为你的最终目标。即使你意识到存在某种评判标准,这也不意味着你就必须竭尽全力在这个标准下表现出色。
对于聪明且雄心勃勃的人来说,忽视这些测试尤其困难。因为他们的雄心为他们提供了动力,智慧则为他们提供了在这些测试中脱颖而出的能力。但请努力不要陷入生活中的这些反测试;它们正是生命短暂而不该投入时间的「无谓之事」。
另一个可能悄然侵蚀你生活的因素是成瘾。我们都知道要谨慎对待酒精和赌博等常见的成瘾物,但更难避免的是那些人人都有的瘾,因为这些在我们看来似乎很正常。在《上瘾性的加速》一文中,Graham 区分了两种「正常」:统计意义上的正常(大多数人都在做的事)和实际操作中的正常(最有效的做法)。沉迷于社交媒体和智能手机在统计上可能是正常的,但从实际效果来看并不正常。"技术往往使'正常'与'自然'脱节。"
「从现在起,你可以把这当作一条经验法则:如果人们不觉得你很奇怪,那么你可能活得不够好。」举例来说,如果你对待消费的态度看起来不是有点与众不同,那么你可能拥有太多《不必要的东西》。
然而,仅仅警惕享乐、自我放纵和「无谓之事」是远远不够的。我们还必须谨慎对待那些看似重要且富有成效的事情。在《如何浪费时间和金钱》一文中,Graham 这样写道:
「不知不觉中挥霍一笔财富是很困难的。对于一个品味普通的人来说,想要不经意间花掉几万美元而不感叹『哇,我花了好多钱』是很难做到的。然而,如果你开始交易衍生品,你可能在眨眼之间就损失一百万美元(实际上,你可以损失任意数额的钱)。」
同理,对于一个颇有抱负的人来说,很难通过看电视或躺在沙发上来浪费时间——你的大脑迟早会意识到「这是在浪费时间」。但你却可能轻而易举地每天工作 12 小时,在一些事情上投入两年之久,而事后回顾却发现这完全是在浪费时间。
如果你不谨慎地投资你的时间和金钱,生活的流逝会无比的轻易。
你有许多需要消除的固有观念
你童年时被告知的一个谎言是什么?像「如果你吞下一颗苹果籽,树就会在你的胃里长出来」这样的说法很容易被识别为谎言。但像「要小心陌生人,他们很危险」这样的话呢?就没那么容易辨别了。
在《我们对孩子说的谎言》一文中,Graham 指出我们在童年时期被灌输了许多谎言,原因各不相同(有些原因比其他的更站得住脚)。一些错误观念来自家庭,一些来自学校,但关键在于我们在年幼时就将这些谎言编织进了我们对世界的理解中。如果这是我们在童年时期学到的东西,作为成年人就会觉得它无可辩驳地是真实的;要拆解这些根深蒂固的信念需要付出巨大的努力。
如果你仅仅因为你在学校或童年时学到过就坚信某件事。那就假设它可能是错的,然后亲自去验证它,即使最终证明它是正确的。
如果说童年信念是开启认知迭代之旅的起点,那么继续这一过程的有效方法就是审视你所认同的身份(比如民主党人、极简主义者、加密货币多头等)。这是因为我们在思考与自身身份密切相关的事物时往往难以保持清晰的思路,因此可能会不自觉地接受片面的观点。当你认同某个身份时,对该身份的批评会让你感到如遭受人身攻击,因为这个身份已成为你的一部分。你的身份认同越强烈,需要重新审视和思考的内容就越多。
通过阅读《城市与野心》这篇文章,我们可以察觉另一个需要辨别的观念。大多数人读到这篇文章时会得出一个显而易见的结论:你应该去一个与你的野心相匹配的城市。比如,如果你想在娱乐圈发展,就该去好莱坞;如果你对创业感兴趣,就该去硅谷(或者越来越多地,去互联网上的某个特定领域)。但还有一个同样重要的反向思考:你曾经生活过的地方已经在潜移默化中塑造了你的野心。因此,在我们选择与野心相匹配的城市之前,我们应该先弄清楚自己的野心是否真的源于内心,还是仅仅是过去生活环境的产物。
这种认知迭代的理念与前文的观点相呼应:由于你已经被某种陈规塑造了认知了,你可能会不自觉地走上一条并非你真心所愿的道路。因此,除非主动将自己的认知迭代,否则很容易虚度光阴。
认知迭代是一项浩大的工程,所以你最好立即着手开始。
Paul Graham 的人生五诫
临终关怀护士 Bronnie Ware 整理了一份临终病人最大遗憾清单:
-
忘记追逐梦想
-
忽视家人
-
压抑情感
-
疏远朋友
-
忘记为所拥有的一切感恩
在《我的待办事项清单之首》一文中,Graham 将这些遗憾反向转化为他的五条人生准则:
-
珍视梦想
-
适度工作
-
畅所欲言
-
培养友谊
-
保持快乐
Paul Graham 的精华文章
个人推荐
-
[《你不该屈居人下》](http://paulgraham.com/boss.html “男儿当自强”)
-
[《财富创造之道》](http://paulgraham.com/wealth.html “君子爱财,取之有道”)
-
[《时间与金钱的消耗》](http://paulgraham.com/selfindulgence.html “一寸光阴一寸金”)
结语
以上内容仅仅是 Paul Graham 思想的一个简要概览。还有许多文章、观点和话题未能在此详细介绍。敬请期待将来更全面的 PG 201 !
无论如何,我希望这能激发你自主探索这些文章的兴趣,并为你提供一个便捷的方式去找到感兴趣的内容。
如果你觉得这个总结有用,欢迎与他人分享。我花了将近一年的时间阅读Graham的所有文章并将笔记整理成有用的内容,如果能让更多人了解到这些内容,那就再好不过了。
如果你有任何想要补充或修改的内容,请联系我:jaakko@jaakkoj.com / Twitter
感谢你的阅读。
摒弃应试思维
原文:The Lesson to Unlearn (paulgraham.com)
2019 年 12 月
你在学校受到的最有害的教育,不是某一门具体课程,而是学习只为了拿高分。
上大学时,有个特别认真的哲学研究生曾对我说,他从不关心课程的分数,只在乎从中学到了什么。这番话令我难忘,因为这是我唯一一次听到有人这样说。
对于我和大多数学生而言,学习完全是为考试成绩服务。虽然我一向比较用功、学习刻苦,也确实对大部分课程感兴趣,然而只有在备考时,我才会竭尽全力。
本来,考试应该顾名思义,是对课程学习效果的考察、测试。你本不必专门准备课程考试,就像不必专门准备验血一样。理论上,学习是通过上课、听讲座、阅读和完成作业来进行的,考试只是事后评估学习效果。
读到这里的人想必都心知肚明,实际情况截然相反。考试的意义已经完全改变了,以至于听到关于课程和考试如何运作的这番解释,就像在听词源学解释*。实际上,「应试学习(studying for a test)」几乎成了废话,因为学生只在应付考试时,才真正学习。至于勤奋和懒惰的区别,就在于前者努力学习来应对考试,而后者没有。没人会在刚开学就学得废寝忘食。(译注:大部分单词和其词源的原意已经大相径庭。)
尽管我是一个勤奋的学生,但在上学的日子里,我几乎所有的努力都是为了好成绩。
或许很多人会对上文的「尽管」感到奇怪。这难道不是事实吗?勤奋的学生不就等同于全优生(straight-A student)吗?「学习就是为了高分」的观念已根深蒂固地融入我们的文化,由此可见一斑。
那么,将学习和分数划等号真的很糟糕吗?答案是肯定的,糟糕透顶。然而,直到大学毕业多年后,当我开始创办Y Combinator时,才恍然大悟,意识到问题的严重性。
学生时代,我就明白临时抱佛脚和真正掌握知识完全是两码事。考前一天晚上死记硬背的内容,显然不会在你的脑子里停留太久。但问题远比这更严重。更大的症结在于,绝大多数的考试根本无法检验学生真正学到了什么。
倘若考试真的能够检验学习效果,情况或许还不至于太糟。学到真材实料和取得优异成绩最终总会殊途同归,只是时间早晚的问题。然而现实是,如今学生们参加的绝大多数考试都过于套路化,学生很容易就能掌握试题模式。许多考试成绩优异的人对此心知肚明,习以为常。当你意识到凭真才实学去考试有多么幼稚天真时,你就明白应试技巧才是法宝。
举个例子,假设你正在学习中世纪历史课,期末考试近在眼前。期末考试本该全面检验你对中世纪历史知识的掌握,对吧?那么,如果你在考前还有几天时间,又想考个高分,最明智的做法必然是博览群书,查阅这一领域最权威的资料。唯有如此,你才能透彻理解那段历史,在考场上脱颖而出。
但是,有「经验」的学生可绝对不会这样做。如果你只是阅读一些讲述中世纪历史的经典著作,那么你学到的大部分内容都不会出现在考试中。面对考试,你真正需要读的是这门课的讲义和指定读物。即便如此,你也可以忽略其中的大部分内容,因为你只需要关注那些可能会变成考题的知识点。你要找的是界定明确的信息块。如果指定材料中有关于某个细微观点的有趣讨论,你大可略过,因为它不太可能出现在试卷里。但如果教授告诉你,1378 年教会大分裂有三个根本原因,或者黑死病有三个主要后果,你最好记牢。至于它们是不是真正的原因或后果,那并不重要。对这门课而言,它们就是标准答案。
在大学里,旧试卷的复印件通常广为流传,这进一步缩小了你需要学习的范围。你不仅可以了解这位教授出题的套路,还能拿到真题。许多教授都会重复使用考题,即便不愿重复,如果已经教了 10 年的课,也很难避免这种情况。
在某些课程中,如果教授怀有某种政治立场,那么你也得持相同立场。这种要求因课程而异。在数学、硬科学*或工程学课程中,很少有此必要,但在其他课程中,如果你不迎合教授的观点,就别想拿到好成绩。(译注:硬科学,学术口语,指物理学、计算机科学等依赖可量化数据的学科,注重准确性和客观性)
在一门课程中取得优异成绩和真正掌握知识是两码事,学生必须二选其一。如果他们选择了前者,我们也不能责怪他们。毕竟,研究生课程、用人单位、奖学金,甚至父母,全都用成绩来评判学生。
我喜欢学习,很享受在大学写论文和编程的乐趣。但当我交完一篇论文后,我会再写一篇只是为了享受吗?当然不会。我还有其他课程的任务要完成。如果必须在学习和分数之间做出选择,我会选择后者。我来大学不是为了让成绩一塌糊涂。
追求高分的学生都必须参与这场竞赛,否则就会被其他渴望高分的对手超越。在顶尖大学,几乎人人如此,因为不在乎分数的人一开始就不会出现在这里。结果就是,学生们争夺更高的分数,优异成绩和真才实学之间产生了一道鸿沟。
为什么考试这么不可靠?更确切地说,为什么考试的套路这么容易被掌握?任何有经验的程序员都知道答案。如果软件开发者根本没有设防,那它会有多容易被钻空子?通常如同筛子一般千疮百孔。
套路化、模板化是所有正式考试的通病。你所参加的考试之所以总是那样不可靠——总是和其应有的评估效果相距甚远——原因很简单,出题人根本没有下功夫去防止学生利用应试技巧拿高分。
然而,如果老师出的考试存在套路化的现象,我们不能责怪他们。老师的本职工作是教书育人,而不是设计无懈可击的考试。问题的根源在于分数,或者更准确地说,是分数所承载的过多功能。如果分数只是老师告诉学生哪里做得好、哪里有待改进的一种方式,就像教练给予运动员指点一样,学生就没有研究应试技巧的动力。但遗憾的是,过了某个年龄,分数不再只是建议,在求学的过程中,「唯分数论」无处不在。
虽然上文以大学考试为例,但实际上大学的考试还算没那么套路化。大多数学生一生中参加的所有考试都同样的不可靠,最典型的莫过于大学招生考试。如果上大学只需要招生官像科学家测量物体质量一样衡量一个人的头脑,那么我们完全可以告诉孩子们「努力学习」就够了。但大学招生要求听起来与高中倡导所学迥然不同,由此可见这项考试是多么不可靠。事实上,有抱负的学生在高中不得不做的那些极其具体的事,恰恰反映出大学招生考试有多么不合理——那些你并不真正在意的、主要靠记忆的课程;为了展示自己「全面发展」而被迫参加的随机「课外活动」;像下棋一样拘泥于套路的标准化考试;你必须写的「论文」——想必是要达到某个非常具体的目标,但没人告诉你具体是什么。
除了会对孩子造成伤害,这类考试的另一个弊端就是应试化严重。以至于围绕考试衍生出了一整个应试行业,考试辅导机构和招生顾问的明确目标就是应试,而这也是私立学校的一项重要功能。
为什么大学招生考试如此应试化严重?我认为这跟它的评判标准有关。尽管普遍的看法是,进入一所好大学的途径就是变得非常聪明,但精英大学的招生官既不这样认为,也没有宣称他们只看重这一点。那他们看重什么?他们在寻找那些不仅聪明,而且在更广泛意义上值得敬重的人。而这种更广泛的可敬性如何评判呢?招生官凭直觉。换句话说,他们录取他们喜欢的人。
因此,大学招生实际上是在考察高中生是否合某群人的口味。这样的考试,应试技巧当然越来越重要。正因为大学招生考试模板化,且(被认为)利害攸关,人们对应试能力的追求超越了其他考试,以至于长期严重地扭曲了学生的生活。
难怪高中生常常感到缺乏自我,他们的生活形态完全是被人为塑造的。
但浪费时间并非教育系统加诸你的最糟糕的事,最糟糕的是训练你通过应试思维来解决套路十足的考试。这是一个更加隐晦的问题,直到我看到它发生在他人身上才意识到。
刚开始在 Y Combinator 给创业者提建议时,我很不理解他们为何总爱把事情搞复杂,尤其是那些年轻人。他们问我,怎样筹集资金?有什么诀窍能吸引风投?我告诉他们,想要赢得投资,最佳途径就是成为一个真正值得投资的项目。就算你骗了风投去投一个烂项目,那也是在自欺欺人——要知道,你自己也要在这家公司上投入宝贵的时间,如果这不是个好项目,何必浪费时间精力呢?
听完我的一番话,他们一时恍然大悟,紧接着又抛出问题:什么样的创业公司才算得上是个好项目?
于是我解释道,不论是在投资人眼中,还是客观上来说,创业公司最应该关注的就是增长。增长包括营收的增长,或者活跃用户数的增长。总之,对他们而言,当务之急就是获取大量用户。
对如何获取大量用户这个问题,他们天马行空、异想天开:要举办发布会博眼球,找名人为产品站台,发布日也要选在周二这个新闻日,以期获得最多关注度。
面对种种荒谬的想法,我耐心解释:这些都不是正道。要想获得大量用户,唯一可行的办法就是把产品做到极致。只有产品足够优秀,用户才会发自内心地喜欢它,主动将它推荐给朋友,一旦你做到了,指数级增长就随之而来了。
在与创业者交流时,我曾一再强调一个看似简单明了的道理:打造优秀公司的关键,在于创造出色的产品。然而,当他们听到这番话时,反应却像许多物理学家第一次听到了相对论一般,既惊叹于其精妙,又怀疑这么奇怪的答案怎么可能是正确的。他们会口头应承,但转而就会问我能否引荐他们认识某位大佬,或者叮嘱我别忘了他们要在下周二发布产品。
有些创业者花了很多年才真正领悟这些浅显的道理。这并非因为他们懒惰或愚钝,而是对摆在眼前的真相熟视无睹。
我常常扪心自问,为何他们总爱把简单的事情复杂化?后来我恍然大悟,这并非一个反问句。
为什么这些创业者明明答案近在咫尺,却还是让自己陷入困境?因为这正是他们在学校中被训练出的思维定式。往昔的教育让他们相信,获胜的秘诀就是应试思维。而他们甚至都没有意识到自己正在被这样「训练」。尤其是应届毕业生,从未经历过真正的、非人为设计的考验,天真地以为这就是世界运转的法则:但凡遇到挑战,第一要务就是以应试思维去套用应试技巧。这就是为什么他们总是喋喋不休地谈论如何融资,因为在他们眼中,融资就是考试。融资是 YC 训练营的最后环节,而且融资对应着切实的数字指标,数字越大,成绩似乎就越亮眼。这怎么可能不是考试呢?
在这个世界上,有相当一部分领域,人们习惯于通过应试思维来获得成功。这种现象并不仅限于学校。出于意识形态或无知,一些人声称创业公司也是如此。但事实并非如此。创业公司最显著的特点之一,就是你只需要踏实做好自己的本职工作就能取得成功。创业和其他事情一样,尽管也有一些例外情况,但总的来说,能否获得用户的认可才是创业成败的关键,而用户真正关心的是产品能否满足他们的需求。
我之所以花了这么长时间才明白为什么创业者会让创业变得过于复杂,是因为我没有明确意识到一个事实:学校一直在训练我们通过应试思维来获得成功。不仅仅是他们,还有我自己!我也在学校中训练出了面对套路化考试的应试思维,直到几十年后才恍然大悟。
我一直以为自己已经意识到了这一点,但却不清楚背后的原因。比如,我总是避免去大公司工作。但如果你问我原因,我可能会说因为大公司虚有其表,或者官僚主义盛行,或者就是让人心生厌恶。我从未真正明白,我如此反感大公司,很大程度上是因为在那里,你只有靠不断揣摩套路化的考核机制才能获得成功。
再比如,有些测试不那么套路化,这也是吸引我投身创业的重要原因之一,但我当时同样没有清楚地意识到这一点。
通过不断地调整和优化,我竟在不知不觉中摆脱了应试思维。假如应届毕业生能意识到这个问题的存在,并下定决心根除应试思维,这会不会有所帮助呢?这很值得一试。
仅仅是坦诚地讨论这个现象,就有可能改善现状,因为它的危害很大程度上源于我们对它习以为常。意识到这个问题后,它就像房间里一头显而易见的大象,只是这头大象善于伪装。这个现象由来已久,无处不在。它是长期忽视的结果。没有人刻意让事情变成这样。这不过是学习与分数、竞争和不切实际的完美主义结合在一起的必然结果。
我一直困惑于两个问题:高中教育与现实脱节,以及创业者对显而易见的事实视而不见。现在恍然大悟,原来这两个问题竟有着共同的根源,不禁令人震惊。如此重大的认知,如此迟才终于明白,实在难能可贵。
通常情况下,这样的顿悟会带来诸多领域的启发,这次看来也不例外。比如,它表明教育大有改进的空间,而且指明了改进的方向。同时,它还为所有大公司面临的一个问题提供了可能的答案:如何保持初创企业般的活力?我暂且不去探究它的所有影响。我想在此重点讨论的是,这个问题对个人成长有何启示。
坦白说,这意味着许多踌躇满志的大学毕业生可能需要重新审视某些观念。同时,这也改变了你看待世界的视角。与其将形形色色的工作简单地划分为有吸引力的或乏味无聊的,倒不如提出一个更加具体的问题,用一种颇有意思的方式加以区分:在某项工作中获得成功,你在多大程度上是靠应试思维?
如果有一种快速识别套路化测试的方法就好了。这其中有什么规律可循吗?答案是肯定的。
测试大致可分为两类:一类是由某个权威推行的测试,另一类则相反。不靠权威推行的测试本质上是非套路化的,因为它们并不用来评判本次检验结果之外的其他事物。比如一场足球比赛,衡量的就只是比赛的结果,而非哪支球队真正更强。这一点可从评论员赛后有时会说「表现更好的球队获胜了」略见一斑。相比之下,权威推行的测试往往别有深意,具有某种指代性。比如一次课堂测验,其目的不仅在于评判你在该次测验中的表现,更在于衡量你在整个课程中的学习收获。非权威测试天然没有固定套路,而权威推行的测试本应刻意设计得非套路、多样化,但通常并非如此。因此,大致说来,不合理的测试基本上等同于权威推行的测试。
你可能真的想靠应试思维来获胜。我相信确实有人喜欢这样做。但我敢打赌,大多数发现自己在干这种活的人并不喜欢它。他们只是觉得这就是社会的游戏规则,除非你想逃离主流社会,做个嬉皮士式的手艺人。
很多人心照不宣地认为,在一个游戏规则有缺陷的领域工作,这是为了大把赚钱必须付出的代价。但我可以负责任地告诉你,这种想法大错特错。这种说法在过去或许还算数。20 世纪中叶,经济被寡头垄断,向上爬的唯一出路就是玩他们的游戏。但现在情况已经今非昔比了。如今有很多途径可以靠出色的工作实现财富自由,这也是当代人比以往任何时候都更向往成功的原因之一。记得小时候,想赚大钱,要么成为工程师,创造酷炫的产品,要么成为「高管」。而现在,你完全可以靠打造精品来实现致富梦。
随着工作和权威的关系日渐式微,应试思维变得越来越不重要。这种关系的瓦解是当今最重要的趋势之一,几乎影响到所有的职业领域。创业公司是最鲜明的例子,但在写作领域我们也能看到类似的变化。作家不再需要看出版商和编辑的脸色才能吸引读者,现在他们完全可以直接与读者对话。
我越是深入思考这个问题,心中的乐观情绪就越高涨。这不禁让人想起一种常见的情形:某些东西明明阻碍着我们,但直到它被清除,我们才恍然大悟。眼下这套徒有虚名的考试体系,正在分崩离析。想象一下,随着越来越多人开始扪心自问,自己是否愿意靠应试思维取得成功,并最终选择弃暗投明,局面将会发生怎样的变化?那些需要依靠迎合权威才能出人头地的行业,将发现人才变得青黄不接;而那些崇尚脚踏实地的行业,则会吸引最具雄心壮志的后起之秀。伴随应试教育日渐式微,我们的培养模式也将摈弃死记硬背、机械刷题的窠臼。试想一下,如果这一切都成为现实,我们的世界该有多美好?
这不仅是个人需要根除的观念,更是整个社会需要反思的问题。一旦我们最终廓清谬见、拨乱反正,必将为扑面而来的勃勃生机而感到无比振奋。
附注
[1] 如果你觉得「考试应该只用于检验学习成果」的说法过于理想化,那就来看看 Lambda 学校的做法吧。在那里,既没有分数,也不搞排名,最后要么顺利毕业,要么哪儿凉快哪儿呆着去。考试的唯一作用,就是决定你能否升入下一个学习阶段。说白了,整个学校都是「毕业/肄业」两档论。
[2] 如果期末考试是与教授进行深入交流,你可以通过阅读有关中世纪历史的经典著作来做准备。学校考试之所以套路化,很大程度上是因为同样的考试必须面向大量学生。
[3] 学习是取得好成绩的朴素方法。
[4] Hacking 一词有多重含义。狭义上,它指的是破解某些事物。本文引用为以应试技巧应对模版化的考试。但广义上,它指的是为问题找到一个出人意料的解决方案,通常是通过从不同角度思考问题。这种意义上的「Hacking」是一件很棒的事情。事实上,人们在应对糟糕考试时使用的一些方法非常巧妙,问题不在于「Hacking」本身,而在于考试因为模板化,无法真正测试应该测试的内容。
[5] Y Combinator 中负责筛选初创公司的成员与招生官类似,但录取标准没那么随意,而是通过非常紧密的反馈循环来训练和完善,以确录取的保精确和高效。通常一个月,超不过一两年,负责筛选的成员就能意识到录取了一家糟糕的初创公司或是拒绝了一家优秀的初创公司。
[6] 我相信招生官已经厌倦了阅读那些似乎除了迎合录取要求之外毫无个性的申请。但他们没有意识到,从某种意义上说,他们是在照镜子。申请人缺乏真实性,恰恰反映了申请过程本身的随意性。一个独裁者抱怨周围人缺乏真实性,同样也说明了问题的根源所在。
[7] 我所说的好工作,不是指道德意义上的好,而是像一个优秀工匠那样精益求精、追求卓越的好。
[8] 有些情况下很难明确判断一项测试究竟属于哪一类。比如说,筹集风险资本是类似于大学招生,还是更接近于向客户销售产品呢?
[9] 需要强调的是,所谓好的测试,仅仅指的是那些无法被攻破、篡改的测试。这里的「好」不是道德层面的优秀,而是实际运作中的有效性。有缺陷的测试领域和高质量测试领域的区别不在于好坏优劣之分,而在于前者是虚假的,后者是真实可靠的。但这两个评判标准也并非毫无关联。正如 Tara Ploughman 所说,从善至恶之路往往由虚假开始。
[10] 对那些认为近来经济不平等加剧是税收政策变化导致的人而言,任何有过创业经历的人都会觉得这种看法过于天真幼稚。当今时代,能够致富的群体已经发生了变化,他们所积累的财富之多,远非仅仅依靠税收节省就能解释得了的。
[11] 送给那些望子成龙的父母一句话:你们也许认为正在训练孩子学会如何获胜,但如果你们教导孩子靠应试技巧来取胜,那就如同许多家长常犯的错误一样,实际上是在训练他们打一场注定失败的昨日之战。
感谢 Austen Allred、Trevor Blackwell、Patrick Collison、Jessica Livingston、Robert Morris 和 Harj Taggar 阅读了本文草稿。
主导你头脑的想法
2010 年 7 月
最近我意识到,早晨洗澡时的思考,远比想象中重要得多。我早知道这是个灵感迸发的好时机。但现在我要更进一步:我认为,若某事未能在洗澡时主导你的思考,你恐怕很难真正做好它。
凡是攻坚过复杂难题的人,都熟悉这样的体验:你拼命思考某个问题,尝试各种方法却毫无进展。可等到过了一会儿,在做别的事情时,答案突然浮现。这种无意识的思考,不是你刻意去想,而是自然而然的。我愈发确信,这对对于解决难题不仅是有助的,而且是必要的。但棘手之处在于,这种思维状态只能间接控制。[1]
我认为,大多数人任何时刻脑中都有一个主导想法。放任思绪自由飘荡时,这个想法就如磁石般牵引着思维轨迹。它得以独享这种无意识思考的滋养,而其他念头则陷入养分匮乏的境地。正因如此,让错误的想法主导你的头脑,后果不堪设想。
让我深刻体会这一点的,是我的两段较长的经历。在那期间,我的脑中充斥着一个我并不愿受其主导的想法。
我曾注意到,初创公司一旦开始融资,效率便大打折扣。但直到我们自己融资时,我才明白为什么。问题不在于与投资人会面所耗费的时间,而在于,一旦启动融资,融资便会成为你脑中的主导想法。于是,早晨洗澡时你的思绪也只围绕这件事转,真正重要的问题反而退居次席。
在经营 Viaweb 时,我曾讨厌融资,却早已忘记那时为何如此反感。等到为 Y Combinator 融资时,我才猛然回忆起来:资金问题特别容易成为主导你头脑的想法,这实属必然——毕竟金钱不会自动流向你。除非你让它成为洗澡时的思考内容,否则它根本无从谈起。但代价是,你将难以在其它你更想做的事情上取得进展。[2]
(我也听到一些在学术界的朋友有类似抱怨。如今的教授似乎都成了专业融资者,顺带副业搞点研究。或许该是拨乱反正之时了。)
之所以这件事给我留下了如此深刻的印象,是因为在过去十年里,我一直可以自由地思考自己想做的事。因此,当我没法这样做的时候,对比就很鲜明。不过,我相信这问题绝非我一人独有,几乎所有我见过的初创公司一开始融资,或与收购方接洽时,工作就会陷入停滞。
你无法直接左右思绪漫游的方向。如果你刻意控制它们,那它们就不再是漫游。但你可以通过控制自己所处的环境,间接影响其方向。这给我的启示是:谨慎抉择何为人生要务。尽量让自己置身于「燃眉之急正是心之所向」的情境中。
当然,完全的控制并不存在。突发事件可能会让其他想法瞬间涌上心头。但除却突发事件,我们还是能在很大程度上间接决定主导我们头脑的想法。
我发现,有两类想法尤需警惕——它们就像尼罗河鲈鱼一样,将更有价值的创意挤出你的思绪。其中之一,就是关于钱财的念头。搞钱几乎注定会消耗你全部的注意力。另一类则是争执。这些争执同样以一种错误的方式吸引着我们:它们表面上像是真正有趣的想法,具有同样的「粘性」,但实际上却空洞无物。因此,如果你想完成真正有意义的工作,就要尽量避开这些争执。[3]
强如牛顿亦难逃此劫。1672 年,他在发表色彩理论后,竟深陷论战泥潭数年,最终决意停止发表以求解脱:
我发现自己已沦为哲学的奴隶,但若能摆脱 Linus 先生的差事,我定将毅然与哲学永别——除非是为了满足个人志趣而作,或留待身后发表的文字。因为我明白,一个人要么决心不立新说,要么就得沦为捍卫学说的奴仆。[4]
列日的 Linus 及其学生堪称最难缠的批评者。牛顿的传记作家 Westfall 似乎认为牛顿当时的反应有些过激:
当时牛顿所谓的「奴役」仅仅是他一年内针对列日方面所做的五次回应,总计十四页印刷内容而已。
相比之下,我更理解牛顿的苦衷。问题不在那短短十四页纸的笔墨官司,而在于,这场愚蠢的争论不断侵占他本应用于思考其他事物的宝贵时间,给人带来莫大的痛苦。
事实证明,忍让也有利己之效。别人对你出手,不仅令你当下受伤,更会让你事后不断反刍,从而遭受二次伤害。如果你学会漠视,至少可以免除后者的痛苦。我发现,只要不断提醒自己「这些事情不值得主导我的头脑」,就能在一定程度上避免沉溺于那些令人不快的往事。每当我发现自己已忘却争论的细节,我便心生喜悦,因为这意味着我没有在那上面耗费过多精力。妻子总说我比她更宽容,但实际上,我的动机是纯粹的利己主义。
我怀疑,很多人其实在任何时候都不太清楚主导自己头脑的想法是什么。实际上,我自己也常常搞错。我往往以为占主导地位的是我希望成为主导的那个想法,而不是实际上占主导地位的想法。但弄清这一点其实很简单:只需洗个澡。看看你的思绪是不是总会不由自主地回到某个话题?如果那并非你想关注的内容,那么或许该做出一些改变了。
附注
[1] 毫无疑问,这种思维方式已有现成的称谓,但我称之为「环境思维(ambient thought)」。
[2] 这一点在我们的经历中表现得尤为明显。我们筹集的两笔资金都不难获得,然而整个过程却各自拖延了数月。调动大额资金从来不是人们轻率对待的事,所需注意力也会随着资金规模不断上升——也许增长并非线性,但绝对是单调递增的。
[3] 推论:切忌成为管理员,否则你的工作就只能整天处理资金和争执。
[4] Letter to Oldenburg, quoted in Westfall, Richard, Life of Isaac Newton, p. 107.
感谢 Sam Altman、Patrick Collison、Jessica Livingston 和 Robert Morris 审阅本文草稿。
你将希望自己早该知道的事
原文:What You'll Wish You'd Known
2005 年 1 月
(我为一所高中准备了这场演讲。但我最终没能出场,因为校方否决了邀请我的计划。)
当我提到要在一所高中演讲时,我的朋友们都很好奇。「你打算对高中生说些什么呢?」于是我反问他们,「你们希望自己在高中时期别人应该告诉你们什么?」令人惊讶的是,他们的回答出奇一致。所以,我今天要告诉你们的,正是我们每个人都曾希望有人告诉我们的事。
首先,我要告诉你们一件在高中阶段其实不必知道的事:你想活出怎样的人生。人们总是问你这个问题,以至于你觉得自己应该有个现成的答案。但实际上,成年人问这个问题主要是为了引起对话。他们想了解你是什么样的人,这个问题只是一个引子。这就像你可能会用手指轻轻碰触潮间带里的寄居蟹,看看它会有什么反应。
如果现在我回到高中,有人问起我的未来计划,我会说我的首要任务是了解都有哪些选择。你不必急于选择自己的终身职业。你真正需要做的是发现自己喜欢什么。如果你想在某个领域出类拔萃,你必须投身于你热爱的事业。
乍一看,似乎没有什么比确定自己的兴趣爱好更容易的了,但事实证明这并不简单。部分原因是我们很难对大多数工作有准确的认知。比方说,医生的真实工作与电视剧中的描绘大相径庭。不过,你可以通过在医院做志愿者来近距离观察真实的医生工作。[1]
然而,还有一些工作你无法了解,因为这些工作目前还不存在。我在过去十年里从事的大部分工作,在我上高中时都还未出现。这个世界变化得太快了,而且变化的速度本身也在不断加快。在这样一个瞬息万变的世界里,坚持固定的人生规划并不明智。
然而,每年五月,全国各地的演讲者都会开始发表那套老生常谈的毕业演讲,其中心思想无非是:「坚持你的梦想,永不言弃。」我理解他们的良苦用心,但这种表达方式其实并不恰当,因为它暗示着你应该被早年制定的某个计划所束缚。在计算机领域,这被称为「过早优化」,而这往往将带来灾难。这些演讲者不如直截了当地说:「别轻言放弃。」
他们真正想表达的是:不要失去斗志,不要认为自己比不上他人。我赞同不应低估自己潜力这一观点。那些成就伟业的人常给人一种与众不同的感觉。大多数传记更是加剧了这种错觉,一方面是因为传记作者难免会对主人公怀有崇敬之情,另一方面是因为他们知道故事的结局,不自觉地会美化情节,使主人公的人生仿佛是命中注定的,仅仅是天赋异禀的自然表现。事实上,我怀疑就算 16 岁的莎士比亚或爱因斯坦与你同窗,他们可能会给人留下深刻印象,但也不会与你的其他朋友有天壤之别。
这种想法让人感到不安,因为如果他们与我们无异,那就意味着他们必定付出了艰辛的努力才有如此成就。这也是人们喜欢相信天分的原因之一,它为我们的懒惰提供了借口。如果这些人之所以能有如此成就,仅仅是因为他们拥有某种神奇的"莎士比亚特质"或"爱因斯坦特质",那么我们做不出同等出色的成果就不算什么了。
我并非否认天才的存在。但是,如果你在两种理论之间抉择,而其中一种为你的懒惰提供了借口,那么另一种可能才是正确的。
到目前为止,我们已经将那套陈词滥调的毕业演讲从「永不放弃梦想」精简为「别人能做到的,你也能做到」。但这仍需进一步提炼。虽然大多数人高估了天赋的作用,但不可否认,人与人之间确实存在些许先天能力的差异。假如我面对一个身高仅有 4 英尺(121.92厘米)却梦想进入 NBA 的人,如果我说「只要你努力,你就能实现任何目标」,那未免太不负责任了。[2]
因此,我们应该将毕业演讲的核心进一步浓缩为:「与你能力相当的人能做到的,你也能做到;同时,不要低估自己的能力。」然而,正如常见的情况,当你越接近真相,你的表述就越显得复杂。我们已经将一个简洁明了(但并不正确)的口号,搅成了一团浑水。它不再适合作为演讲的内容了。更糟糕的是,它也不再能为你指明方向。「与你能力相当的人」?那么你的能力又是什么呢?
保持上风
我认为解决之道在于转换思维。与其从目标倒推所需要付出的努力,不如从有潜力的现状出发,向前探索。事实上,这也是大多数成功人士的真实做法。
传统的毕业演讲式方法是:先设想 20 年后的理想状态,然后扪心自问:"我现在该做什么来实现这个目标?"相反,我建议你不要过早地为未来设限,而是关注当下的各种可能性,选择那些能为你带来更多未来选择的机会。
你现在从事什么工作并不那么重要,关键是不要虚度光阴。专注于那些你感兴趣且能拓宽未来选择的事情从而提升自己,至于最终会选择哪条路,可以留到以后再做决定。
举个例子,假设你是一名大学新生,正在犹豫是主修数学还是经济学。从长远来看,数学会给你带来更多可能性:因为几乎所有领域都离不开数学。如果你主修数学,即使日后转向经济学研究生院也会相对容易;但如果你主修经济学,再转向数学研究生院就会困难得多。
飞行滑翔机在这里是一个绝佳的比喻。因为滑翔机没有发动机,所以你不能迎风飞行,否则会失去很多高度。如果你处于下风位置,让自己远离适合着陆的地点,你的选择就会变得非常有限,且令人不安。一般来说,你应该尽量保持在上风位置。因此,我建议用「保持上风」来替代「不要放弃你的梦想」这句话。
然而,你该如何做到这一点呢?即便数学是经济学的上风学科,作为一个高中生,你又怎么会知道这一点呢?
事实上,你确实不知道,而这正是你需要去发现的。寻找聪明的人和具有挑战性的问题。聪明人往往会聚集在一起,如果你能找到这样的群体,加入它将是值得的。但找到他们并不容易,因为有很多人只是在装模作样而已。
对于刚入学的本科生来说,所有大学院系看起来都差不多。教授们都显得学识渊博,令人生畏,并发表外行人看不懂的论文。但是,虽然在某些领域,论文难以理解是因为其中包含了深奥的思想,而在其他领域,论文则是故意用晦涩的方式写作,以显得自己在阐述一些重要的观点。这可能听起来是一个令人震惊的说法,但它已经在著名的《社会文本》事件中得到了实验性验证。一位物理学家怀疑文学理论家发表的论只不过是听起来很高深实则毫无意义的内容,于是他故意写了一篇充满听起来很高深实则毫无意义内容的论文,并将其提交给一家文学理论期刊,结果该期刊竟然发表了这篇论文。
保持竞争力的最佳方式,就是持续攻克真正的难题。写小说是艰难的创作跋涉,读小说只是惬意的精神漫游。所谓"难关"必然伴随认知痛感——若你对正在构建的作品毫无崩坏焦虑,对钻研的领域毫无理解障碍的恐慌,那只能说明挑战强度尚未达标。真正的硬核突破,永远伴随着悬而未决的认知张力。
好吧,你可能会觉得,这似乎是一种相当悲观的世界观。那我是在告诉你应该忧心忡忡吗?也许确实如此,但实际情况并没有你想的那么糟糕。战胜忧虑带来的喜悦是无与伦比的。你很难看到比奥运冠军更灿烂的笑容,但你知道为什么他们如此开心吗?那是因为如释重负。
我并非说这是获得幸福的唯一途径。我只是想说,有些担忧并不像表面上看起来那么可怕。
雄心
实际上,「保持上风」就是要「迎接挑战,解决难题」。而且你现在就可以开始行动。我真希望自己在高中时就能领悟这一点。
大多数人都希望在自己的领域中出类拔萃。在现实社会中,这种渴望是一股强大的动力。然而,高中生却很少能从中受益,因为他们被赋予了一个虚假的任务。回顾我的高中时代,我让自己相信,我的职责就只是做一个高中生。于是,我仅仅沉迷于在学校取得优异成绩的自满之中。
如果你在我高中时问我,高中生和成年人之间的区别是什么,我可能会说成年人需要谋生。但这是错误的,真正的区别在于:成年人要为自己负责。谋生只是其中很小的一部分。更为重要的是,我们要为自己的思想负责。
如果让我重返高中,我会把它当作一份日常工作。但这并不意味着我会在学校偷懒。把某事当作日常工作并不等于敷衍了事,而是说不要被它所定义。我的意思是,我不会把自己仅仅看作一个高中生,就像一个以服务员为日常工作的音乐家不会把自己当作一个服务员。[3] 在完成日常工作之余,我会开始尝试做些真正有意义的事情。
当我询问人们对高中生活最后悔的事情时,他们几乎都给出了相同的答案:虚度了光阴。如果你在怀疑现在做的事情日后会最令你懊悔,那很可能就是了。[4]
总有人说这是必然现象——觉得高中生还无法真正成事。但我不认同这种观点,最直接的证据就是你们常挂在嘴边的「无聊」二字。回想八岁时的你们,恐怕鲜少感到无聊吧?同样是和小伙伴消磨时光,在那个年纪叫做「玩耍」,如今却被称作「闲逛」,其实本质并无二致。以我自身经历为例,只要有后院和三五玩伴,就能不知疲倦地疯玩一整天。
现在我明白了,之所以到了中学和高中这种状态变得索然无味,是因为我已经准备好迎接新的挑战,已经不再幼稚了。
我可不是说你们不该跟朋友厮混,把自己变成不苟言笑的做题机器。朋友相处就像品尝巧克力蛋糕,适度享用恰到好处。但终日以之为食,不出三餐就会感到恶心。高中生普遍感受到的那种不适,实际上就是这种精神反胃。[5]
你可能会说,我们不仅要追求好成绩,还要多参与课外活动。但其实你心里清楚,大多数课外活动其实相当形式化。为慈善机构募集捐款固然值得称赞,但这并不困难,也称不上是真正完成了什么。我所说的「完成某事」,是指学会如何优雅地写作,掌握计算机编程技能,深入了解前工业社会的真实面貌,或者学会如何生动地描绘人物面孔。遗憾的是,这些真正有价值的技能往往无法在大学申请表上简单地罗列出来。
腐败
将人生全部押注在考大学上并不合理,因为决定你能不能进大学的那帮人,眼光其实不怎么样。大多数学校里,录取学生的不是教授,而是招生办的老师——这些人的水平比教授差远了。他们只是学校里的“办事员”,根本看不出你有多大能力。要不然为什么地都是补习班?这就是最好的证明。
几乎没有父母愿意花大价钱送孩子上一所升学率低的学校。补习班公开宣称这是他们的主要目标之一。但仔细想想,这其实意味着他们能够在一定程度上利用录取规则:他们能够把同一个学生包装成比上公立学校更具吸引力的申请者。[6]
现在你们多数人觉得,自己的人生目标就是当个优秀的大学申请者。但这意味着你们正在为了迎合一个毫无意义的过程而设计自己的人生,以至于还催生了一整个专门用来钻空子的行业。难怪你们会变得愤世嫉俗。你们现在所感受到不适,跟拍真人秀的编导或者烟草公司高管的感觉一模一样。最惨的是,人家好歹能拿高薪,你们连这点安慰都没有。
那么你们该怎么办?千万不要选择叛逆。那是我当年的做法,结果证明是大错特错。当年虽然没完全搞清问题根源,但我嗅到了一股强烈的阴谋论,于是干脆躺平——既然这世界糟透了,何必白费力气?
当我发现我们的一位老师自己也在使用Cliff's Notes时(教辅速成手册),我反倒觉得意料之中了,在这样的课堂上获得好成绩显然毫无意义。
回想起来,这种想法实在太愚蠢了。这就像一个球员在足球比赛中发现对手犯规后说:「喂,你犯规了,这不公平」,然后愤怒地选择离场一样。犯规是在所难免的,但当你遭遇犯规时,不应该失去理智,你要做的是继续比赛。
社会把你们扔进这个坑里,确确实实地将你们给坑了。你们猜得没错,你在课堂上学到的大多东西都是废话。而且没错,正如你所怀疑的,大学录取过程在很大程度上也是一场闹剧。但就像许多犯规一样,这个「犯规」是无心的。[7] 所以,请继续比赛吧。
盲目叛逆和绝对服从本质上同样愚蠢。无论选择哪一种,你都在让他人的指令定义你的人生。我认为,更明智的选择是另辟蹊径。不要仅仅执行他们的指令,也不要一味地拒绝。相反,不妨把学校当作一份日常工作。从工作的角度来看,这其实是相当不错的:下午 3 点就可以结束,而且你甚至可以在学校时间里做自己想做的事情。
好奇心
那么,你真正的「工作」应该是什么呢?除非你是莫扎特那样的天才,否则你的首要任务就是找到答案。哪些是值得投入的伟大事业?富有想象力的人在哪里?最重要的是,你对什么感兴趣?
「天赋」这个词可能会误导人,因为它暗示了某种与生俱来的能力。然而,最强大的天赋往往是对某个问题持续不断的兴趣,而这种兴趣通常是后天培养的。
这个概念的一个扭曲版本以「激情」的名义渗透到了流行文化中。我最近看到一则招聘服务员的广告,声称他们在寻找「对服务充满激情」的人。然而,真正的兴趣绝不是一个人可能对等待餐桌产生的感觉。而且,「激情」这个词并不恰当。一个更贴切的词是好奇心。
孩子们天生好奇,但我所说的好奇心与儿童的好奇心有所不同。儿童的好奇心是广泛而肤浅的,他们会对任何事物随意地问「为什么」。在大多数成年人中,这种好奇心完全消失了。这是必然的:如果你总是对每件事追问原因,就无法完成任何事情。但在有抱负的成年人中,好奇心并非消失,而是变得集中而深入。就像浅滩变成了深井。
好奇心能将工作转化为游戏。对爱因斯坦来说,相对论不是一本他必须为考试而钻研的艰深教材。它是他试图解开的谜题。因此,对他而言,发明相对论可能比现在的人在课堂上学习它要轻松得多。学校给你植入的最危险错觉之一,就是认为成就伟业需要高度自律。大多数学科的教学方式都枯燥乏味,以至于你只能靠自律来强迫自己度过难关。因此,当我在大学初期读到维特根斯坦的一句话时,我感到十分惊讶。他说自己毫无自制力,从未能够克制自己的欲望,哪怕是一杯咖啡也不例外。
如今我认识一些成就卓著的人,他们都有一个共同特点:几乎没有自律可言。他们都是出了名的拖延症患者,对于不感兴趣的事情几乎无法强迫自己去做。其中有人结婚四年了,婚礼感谢信的一半还没寄出。另一个人的邮箱里堆积了 26,000 封未读邮件。
我并不是说完全不需要自律。你大概需要的自律程度,和去跑步时差不多。我常常不太愿意去跑步,但一旦开始跑,我就会乐在其中。如果几天不跑,我就会感到不适。做出伟大成就的人也是如此。他们知道不工作会让自己感觉糟糕,所以有足够的自制力让自己坐到办公桌前开始工作。但一旦开始,兴趣就会接管一切,自律也就不再必要了。
你觉得莎士比亚是咬紧牙关,勉强自己写出伟大的文学作品的吗?当然不是。他是在享受创作的乐趣。这正是他如此出色的原因。
如果你想做出优秀的工作,你真正需要的是对一个有潜力的问题充满强烈好奇心。爱因斯坦的关键时刻是当他看着麦克斯韦方程时问道:「这到底是怎么回事?」
找到一个富有成效的问题可能需要数年时间,因为理解一个学科的本质同样可能需要数年。让我们看一个极端的例子:数学。大多数人认为自己讨厌数学,但其实你在学校里以「数学」之名学习的那些枯燥内容,与数学家真正在做的事情完全不同。
著名数学家 G. H. Hardy 曾坦言,他在高中时期也不喜欢数学。他选择数学仅仅是因为自己在这门学科上比其他同学更有天赋。直到后来,他才真正领悟到数学的魅力——也是在那时,他开始主动提出问题,而不仅仅满足于正确回答问题。
每当我的一位朋友因为要写学校布置的论文而抱怨时,他母亲总是这样鼓励他:「想办法让它变得有趣起来。」这正是你需要做的:找到一个能让世界变得引人入胜的问题。那些成就伟业的人,他们所观察的世界与常人无异,但他们能够捕捉到那些极具吸引力且充满神秘的细节。
这种洞察力不仅限于学术领域。亨利·福特提出的重要问题是:「为什么汽车必须是奢侈品?如果我们将其视为大众商品会怎样?」弗朗茨·贝肯鲍尔则在思考:「为什么每个球员都必须固守自己的位置?为什么后卫不能也参与进攻呢?」
现在
如果阐述伟大问题需要多年时间,那么作为一个十六岁的少年,你现在该怎么做呢?朝着发现这样一个问题的方向努力。伟大的问题不会突然降临,它们会在你的头脑中慢慢成形。而促使它们成形的正是经验。因此,寻找伟大问题的方法不是刻意去搜寻——不是到处想着「我该做出什么惊天动地的发现?」你无法回答这个问题;如果你能,那你早就做出发现了。
要在脑海中孕育一个重大想法,正确的方法不是刻意寻找,而是在你感兴趣的工作上投入大量时间,同时保持开放的心态,让重大想法有机会在你的头脑中扎根。爱因斯坦、福特和贝肯鲍尔都遵循了这一法则。他们对自己的工作了如指掌,就像钢琴家熟悉琴键一样。因此,当他们察觉到某些不寻常之处时,他们有足够的自信去注意并深入探究它。
如何投入时间?投入到什么上?只需选择一个你感兴趣的项目:可以是深入学习某个领域的知识,或者创造一件作品,又或者探索一个问题的答案。挑选一个能在一个月内完成的项目,并确保你有能力将其完成。选择一个能够适度挑战你能力的项目,尤其是在刚开始的时候。如果你在两个项目之间犹豫不决,那就选择看起来最有趣的那个。如果一个项目半路夭折了,就立即开始下一个。持续这个过程,直到它像内燃机一样变得自我驱动,每个项目都能自然而然地引发下一个项目的灵感。(这个过程可能需要数年时间。)
最好不要为了学校而做项目,因为这可能会限制你的发挥,或者让项目变得像是一种负担。你可以邀请朋友参与,但不要太多,而且只邀请靠谱的人。朋友们能提供精神支持(很少有创业公司是由一个人单独创立的),但保密也有其优势。秘密项目往往会带来一种愉悦感。而且你可以承担更多风险,因为即使失败了也不会有人知道。
不要担心一个项目看似与你应该追求的目标无关。人生的道路可能比你想象的要曲折得多。所以让项目自然地引领你的方向。最重要的是保持对项目的热情,因为正是在实践中你才能真正学习。
不要轻视那些看似不那么高尚的动机。其中最强大的动力之一是想要在某些方面胜过他人。Hardy 坦言这就是促使他开始的原因,我认为他唯一与众不同的地方在于他敢于承认这一点。另一个强大的动机是想要做或了解那些你本不应该接触的事物。与此密切相关的是想要做一些大胆事情的欲望。十六岁的少年本不应该写小说。所以如果你尝试了,无论取得什么成就都是意外之喜;即使彻底失败了,也不过是符合预期罢了。[8]
警惕不良榜样,尤其是那些为懒惰开脱的。回想高中时代,我常仿效著名作家创作"存在主义"短篇小说。这些作品情节寥寥,却自诩深奥。相比写些有趣的故事,这种方式显然省事许多。我本该意识到这是个危险信号。事实上,我发现自己的作品相当乏味;真正令我兴奋的,是模仿名家创作严肃、富有思想性作品的想法。
如今阅历丰富的我终于明白,那些所谓的著名作家其实也不过如此。许多名人都是这样;短期来看,作品质量只是成名因素中的一小部分。我本该少些顾虑做看似酷炫的事,而专注于自己喜欢的事。说到底,这才是真正通向「酷」的捷径。
在许多项目中,寻找优质书籍几乎堪称一项独立任务。大多数书籍质量欠佳,几乎所有教科书都不尽如人意。[9] 因此,不要想当然地认为随手可得的书就能教会你某个学科。你必须主动搜寻为数不多的佳作。
关键在于走出去,亲身实践。与其坐等他人教导,不如主动出击,自我学习。
你的人生不应由招生官来主宰,而应由你的好奇心来塑造。所有雄心勃勃的成年人都是如此。你无需等待,现在就可以开始。事实上,你甚至不必等到成年。没有哪个神奇的开关会在你到达某个年龄或从某所学校毕业时自动触发。当你决定为自己的人生负责时,你就开始成为一个成年人。这种转变可以在任何年龄发生。[10]
这番话可能听起来像是无稽之谈。你也许会想:「我只是个未成年人,没有经济来源,不得不住在家里,整天都得听从大人的安排。」然而,大多数成年人同样面临诸多限制,他们依然设法完成自己的目标。如果你觉得做孩子很受束缚,那么想象一下肩负抚养孩子责任的感受吧。
成年人和高中生之间唯一真正的区别在于,成年人意识到了完成任务的必要性,而高中生还没有这种认知。这种顿悟通常在 23 岁左右出现。不过,我现在就把这个秘密告诉你们。所以,行动起来吧。也许你们能成为第一代人,他们对高中时代最大的遗憾不是浪费了太多时间。
注释
[1] 一位医生朋友提醒说,即便如此也可能会给人一个不准确的印象。「谁能想到它会占用那么多时间,在漫长的培训岁月里自主权如此之少,而且随身携带寻呼机会烦人到难以置信的地步?」
[2] 他最好的选择可能是成为独裁者,然后威胁 NBA 让他上场打球。到目前为止,最接近这一目标的人也不过是当上了劳工部长。
[3] 日常工作是为了支付账单而从事的工作,这样你就可以做真正想做的事,比如在乐队演奏,或发明相对论。
将高中视为日常工作实际上可能会让一些学生更容易取得好成绩。如果你把课程当作一个游戏,即使它们看似毫无意义,你也不会感到沮丧。
无论你的课程有多糟糕,你都需要在这些课程中取得好成绩才能进入一所不错的大学。而这确实值得去做,因为现在大学是聪明人聚集的地方之一。
[4] 第二大遗憾是过分在意不重要的事情,尤其是他人对自己的看法。
我认为在后一种情况下,他们真正的意思是在意陌生人的看法。成年人同样非常在意他人的看法,但他们可以更有选择性地关注特定的人。
我有大约三十个朋友,我在意他们的意见,而世界上其他人的看法几乎不影响我。高中的问题在于,你的同龄人是由年龄和地理的偶然因素决定的,而不是你基于对他们判断力的尊重而选择的。
[5] 浪费时间的秘诀在于分心。若无分心,大脑很容易意识到你正无所事事,从而让你感到不适。想要测试自己对分心的依赖程度吗?不妨尝试这个实验:在周末抽出一段时间,独自静坐思考。你可以带上一个笔记本记录想法,但仅此而已:不能有朋友、电视、音乐、手机、即时通讯、电子邮件、网络、游戏、书籍、报纸或杂志。大多数人在一小时内就会强烈渴望某种分心。
[6] 我并非暗示预科学校的唯一作用是蒙骗招生官。它们确实通常提供更优质的教育。但让我们做个思想实验:假设预科学校提供同样优质的教育,但对大学录取有微小的负面影响(0.001)。那么还会有多少家长愿意送孩子去就读呢?
有人可能会辩称,预科学校的学生因为学到更多,确实是更好的大学人选。但这似乎与实际情况不符。即便是最顶尖高中所教授的知识,与大学相比也只是沧海一粟。公立学校的学生刚入大学时可能略显劣势,但到了大二就开始迎头赶上。
(我并非说公立学校的学生比预科生更聪明,而是说在任何给定的大学里情况如此。如果你认同预科学校确实提高了学生的入学机会,那这个结论就是必然的。)
[7] 为什么社会会败坏你?主要是因为漠不关心。根本没有外部力量推动高中变得更好。空中交通管制系统之所以有效,是因为否则飞机就会坠毁。企业之所以必须有所作为,是因为否则竞争对手就会抢走客户。但即便你的学校糟糕透顶,也不会有飞机坠毁,它也没有竞争对手。高中并非邪恶;它只是随机的;但随机的结果往往相当糟糕。
[8] 然后当然还有金钱。这在高中不是一个重要因素,因为你不能做太多人们想要的事。但是很多伟大的事物主要是为了赚钱而创造的。Samuel Johnson 说「除了为了钱,没有人会写作,除非是傻瓜。」(许多人希望他在夸张。)
[9] 甚至大学教科书都很糟糕。当你上大学时,你会发现(除了少数杰出的例外)教科书并不是由该领域的顶尖学者撰写的。写大学教科书是一项不愉快的工作,主要由需要钱的人完成。这是不愉快的,因为出版商施加了太多控制,而且几乎没有什么比被一个不理解你在做什么的人密切监督更糟糕的了。这种现象在高中教科书的制作中显然更糟。
[10] 你的老师总是告诉你要像成年人一样行为。我想知道如果你真的这样做他们会喜欢吗。你可能很吵闹且没有组织,但与成年人相比你非常温顺。如果你真的开始像成年人一样行动,那就好像一群成年人被转移到了你们的身体里。想象一下 FBI 探员或出租车司机或记者被告知他们必须请求许可去洗手间,而且一次只能去一个人,他们会有什么反应。更不用说你们被教授的那些东西了。如果一群真正的成年人突然发现自己被困在高中,他们要做的第一件事就是组建一个工会,与管理层重新谈判所有规则。
感谢 Ingrid Bassett、Trevor Blackwell、Rich Draves、Dan Giffin、Sarah Harlin、Jessica Livingston、Jackie McDonough、Robert Morris、Mark Nitzberg、Lisa Randall 和 Aaron Swartz 阅读本文的草稿,也感谢许多其他人与我讨论高中话题。
需要控制愤怒情绪的斯多葛学派
原文:Stoics in Need of Anger Management | Issue 163 | Philosophy Now
David Ashton 认为斯多葛学派对愤怒的看法需要更新。
众所周知,斯多葛学派厌恶强烈的情感,但愤怒似乎让他们感到特别恐惧。古罗马著名的斯多葛哲学家曾将愤怒描述为「一种疯狂」。因此,斯多葛学派对愤怒的最好回应总是以控制为基础:他们谈论「驯服」、「驯化」或「调节」愤怒。Seneca 更进一步说:
「我们不应该控制愤怒,而是要彻底消灭它,因为对一种在根本上就邪恶的事物,『控制』又有什么意义呢?」
不是只有斯多葛学派厌恶愤怒,社会也普遍对愤怒持消极看法,这也是愤怒管理能成为蓬勃发展的行业的原因。在一些国家,法院将违法者送往愤怒管理项目,作为其康复治疗的一部分。在英国,甚至还有一个英国愤怒管理协会( British Association of Anger Management,缩写是 BAAM)!在这个网站上,他们故意模糊的声称愤怒管理是「当今心理教育中增长最快的领域」。有趣的是,BAAM 网站上直截了当地假设愤怒总是有害的,并把它视为不言而喻的结论,却没有对此提供任何论证。
愤怒显然可以具有破坏性和毒害性。我们也知道,愤怒并不总是行动的正当基础,这就是为什么人们常常建议「先冷静一下」,因为经过一夜的思考,清晨往往会带来不同的视角,但对于斯多葛主义者来说,愤怒在任何情况下都不是恰当的反应,即使是在极端的条件下。
我最近请了位当代斯多葛哲学家对乌克兰战争中令人痛心的电视新闻片段发表看法,画面中一位乌克兰父亲在俄罗斯导弹袭击后,从废墟中拉出自己死去的孩子。那位父亲对施暴者的愤怒几乎是无法抑制的。我问这位哲学家:「在这样的悲剧面前,愤怒是否可以被视为自然、合理,甚至合乎理性的反应?」他回复说:「当你开始讲这个故事时,一开始我没有想到这位父亲会愤怒,在我看来,这不是自然的反应,更不是最好的反应」。他根本没有想到,愤怒或愤慨是对自己孩子被杀的自然而然的反应!某种程度上,我对此感到震惊,但换个角度看,又并不令人意外,因为这正符合斯多葛主义者对情感的标准解释。
画作 © Venantius J Pinto 2024。如想查看更多他的艺术作品,请访问 behance.net/venantiuspinto。
愤怒被视作不理性和不自然的情绪
在斯多葛学派看来,世界可一分为二:其一是我的内在世界,涵盖行动、态度、选择等,它完全处于我的掌控之中;其二是除此之外一切不受我控制的外界。我与外界建立联系的方式取决于我的德性水平。我能在多大程度上做到有德性,取决于我的判断在多大程度上受到斯多葛主义四个基本德性,即勇敢、明智、公正和节制的影响。践行斯多葛主义,就是要形成一种视角,尽可能完美地协调这些德性,以这种视角来看待并回应世界。这样一来,无论面临何种外在情形,我都能做出正确的判断,并以符合德性的方式行动或回应。德行是善的,恶行是恶的,而我只有合乎德性地评判外界时才是善的,这又取决于理性——(心灵的)「主导能力」。
以下是斯多葛主义者的关键主张:虽然我可以在与外界的联系中做到有德性,但外界本身是无关紧要的。它们既非善,也非恶,任何外界事物都无法决定德行与恶行之间的差别。只有我自己可以决定两者的区别。我以与外在的万物相联系的这种方式去思考和行动。对斯多葛主义者来说,丢了钱包、没赶上火车、求职失败,孩子夭折在本质上是一样的,因为它们本身既非善,也非恶,唯一重要的是我对这些事件的回应,这是我能控制的。重要的是我自身的道德品格,没有任何外在的事物能影响它。
那么,激情又如何呢?在斯多葛主义者看来,有德性的生活完全没有任何激情可言,因为这些情绪本质上对灵魂有害。所谓激情,就是任何强烈的情绪,它在心中具有恼人且误导的力量,它的产生是因为未能正确地运用理性。任何经历这类情绪的人,都对无关紧要的事物做出了错误的价值判断。
上述简要的揭示了斯多葛学派为何纯粹把愤怒视为负面的东西,认为它是非理性的、破坏性的、不道德的——因为它阻碍了通往德性之路。我们将论证,有充分的理由怀疑这种观点。
愤怒被视作自然反应
近年来,斯多葛主义在应对现代生活的诸多压力上再度广泛流行起来。现代斯多葛主义者声称,当愤怒时,我们的理性功能就会被压倒,某种意义上,我们就变得不那么像人了。他们似乎把愤怒等强烈的情绪看作人类原始发展阶段的某种残余,如今我们需要摆脱它了。他们认为,愤怒没有存在的必要,但这就好比说,既然消化是古老的进化事实,那消化也不再有必要了。
在一篇对愤怒的神经科学全面且颇具洞见的综述中,Riccardo Williams 指出,愤怒及其他的情绪反应是具有重要适应功能的进化产物。他写道:「近期的发展研究及临床案例都强调了愤怒与暴怒在人格成长中不论正常还是反常方面的重要性」, 「因此,愤怒与暴怒被视为必要的手段,它让我们在经历失败时能重建个人的连贯性与自主性感受,或者让我们坚持追求自己的目标。」(Frontiers in Psychology, 2017)。
因此,与斯多葛主义者的观点相反,愤怒完全是自然的反应,确切地说,因为(不管我们喜不喜欢)它是我们进化过程遗留的一部分,我们并没有选择愤怒这种情绪。注意,愤怒不仅是自然的,而且对人格的成长也很重要。现代斯多葛主义者为了坚称愤怒始终是负面的、具有破坏性的情绪,便一贯轻易地忽视了这一点,但事实并非如此。
盛怒之下仍能理智思考
斯多葛主义者不仅认为愤怒是非理性的(Seneca 称之为「疯狂」),而且进一步指出愤怒会蒙蔽理性,阻碍德性的养成。换句话说,不可能在完全保持理性时又心怀愤怒,所以保持冷静的头脑总归是好事。实际上,斯多葛主义者主要担心的是,愤怒总是会妨碍我们对世间万物做出理性的回应,它只会让事情变得更糟。愤怒的人做出的决策比冷静且有「斯多葛式」 风范的人要糟得多。但是,这种说法有何依据?
恰恰相反,有大量的科学文献表明,愤怒非但不会妨碍良好的决策,实际上还能起到促进作用。例如,在加州大学圣巴巴拉分校(University of California, Santa Barbara)针对本科生开展的一项分为三部分的研究中,研究人员 W.G. Moons 和 D.M. Mackie 发现,愤怒能促进分析性的思考方式,因为受试者在愤怒时做决策,会更频繁地忽略那些用处不大的信息。有趣的是,他们还发现,那些一开始并不愤怒,但随后变得愤怒的受试者,其推理能力还得到了提升(Thinking Straight While Seeing Red, 2007),其他研究也得出了类似的结论。
《纽约时报》一篇题为 The Rationality of Rage(2015 )的文章中,Matthew Hutson 对这一主题的学术文献提供了有益的总结,并且得出结论:「我们往往会把愤怒与失控联系在一起,但愤怒其实有其明确的用途,且遵循着特定的规则。它或许有些直白,但自有其独特的逻辑。如果运用得当,它能帮我们争取到更有利的条件,激励各方联合起来,从而改善我们的生活。」因此,从清晰表达情绪或者把情绪转变为建设性行动的角度来看,愤怒可能会引发更理性,甚至是完全合乎理性的行动和思考。事实上,愤怒既可以是理性的,也可以是有用的,尽管斯多葛主义者在 2500 年以来一直持相反的观点。
被视作德性的愤怒
在斯多葛学派看来,愤怒是错误的态度,因为它是充满敌意、着眼于过去的 「报复欲」,具有报复性和破坏性。传统的斯多葛主义者认为,愤怒总是包含着报应,它渴望对他人造成伤害或施加残忍的行为,而这在道德层面是错误的。
然而,其他哲学家却认为愤怒存在道德层面的意义。从 Aristotle 到 Thomas Aquinas,再到 18 世纪诸如 Adam Smith 等经验主义者,直至许多当代哲学家,都能看出有这样一种悠久的传统,即认为愤怒是让人们在道德层面相互负责的一种方式。或许这个观点在现代的最佳例证是 Peter Strawson。在他那篇颇具影响力的论文 Freedom and Resentment (1960)中,他指出,诸如愤怒之类的负面情绪是道德评判的表达,而我们之所以是有道德的生物,是基于这样一个事实:在情感层面上,我们在意对彼此行为的看法。Strawson 观察到,由于人们会针对他人的行为表现出诸如怨恨、愤怒、感激等情绪,所以让他人对某一行为在道德上负责,无非就是产生一种 「回应性态度」。如果我对你感到愤怒,那是因为我在道德层面上对你所说或所做的某事做出了回应。所以,我的愤怒就是让你在道德上承担责任的手段。在这些观点看来,情绪具有工具性作用。实际上,它们是道德责任的基本机制,是人类践行道德的方式。这再次与斯多葛主义者的观点相反,意味着人们产生这些情绪反应是有正当理由的。
Adam Smith 同样把愤怒视为道德判断。他认为愤怒更多是提出对尊重和认可的要求,而非惩罚其所针对的对象。他写道,愤怒的目的与其说是让其针对的对象感到痛苦,不如说是 「让他明白,他所伤害的人不应该受到那样的对待」(The Theory of Moral Sentiments, Section III, 1759)。所以,愤怒不必有报复性。Laura Silva 也持有类似观点,她认为愤怒不必是充满敌意的。她和 Strawson、Smith 一样,认为愤怒是让人们认识到已遭受的伤害,而不是惩罚那些造成伤害的人。她说:「我主张,我们应该认真对待这种观点,即对愤怒的传统叙事不仅存在过度简化愤怒的问题,还严重误解了这种情绪的本质」(Review of Philosophy and Psychology, 2021)。
哲学学者 Agnes Callard 为这场讨论增添了另一个维度:无法愤怒在道德上有时是应受谴责的,换句话说,这是一种恶行。在她的著作 On Anger (2020) 中,她写道:「尽管我们不想让自己失控的愤怒…… 但如果我们过于用力地压制它,我们就会失去自尊,更普遍的说,会失去道德的立足点。在面对真正不道德的行为时压抑所有的愤怒,就是在默许邪恶。」 在这里,她呼应了 Thomas Aquinas 的观点。Aquinas 曾写道:「有理由愤怒却不愤怒的人是有罪的」。因此,对于斯多葛主义者来说,愤怒是判断失误的表现,而对于 Callard 和 Aquinas 而言,有理由愤怒时却不愤怒则是一种恶行。
Zac Cogley 在 Virtues And Their Vices (2014)一书的文章 A Study of Virtuous and Vicious Anger 中也得出了同样的结论。他以 Frederick Douglass 和 Martin Luther King Jr 为例,说明他们是 「恰当愤怒」的有德行之人,他们相信,如果能正确地引导愤怒,愤怒可以成为有用、积极的力量。Douglass 曾是奴隶,(理所当然)对奴隶制深感愤怒,他通过演讲、政治及社会行动去努力摧毁奴隶制;而 King 则利用非暴力行动对抗种族不公正。在他的文章 Showdown for Nonviolence 中,King 写到美国的种族不公正问题:「我们必须要有发泄的渠道,我把这场运动看作是把贫民区里那种不成熟的愤怒转化为建设性和创造性的表达。」这里的愤怒毫无 「克制」或 「驯服」 可言。这种愤怒,纯粹而直接,但却有指向且经过引导。它表明愤怒不一定像许多斯多葛主义者声称的那样,是一种无法控制、充满报复性、非此即彼的现象。
在介绍了恰当愤怒的概念之后,Cogley 接着说道:「但是,即使愤怒的感受是恰当的,在某些重要的方面,一个人仍可能无法完全具备德性。例如,一个人感受到了恰当的愤怒,但却没有在这种情况下被触动,去采取行动反对或抗议,那他就太被动了……」 换句话说,仅仅有恰当的愤怒,对具备德性来说是不够的:一个人必须愿意采取行动。所以,愤怒可以是合理、理性且在道德上正当的,但要使其发挥作用,它必须成为行动的基础。
当然,斯多葛主义者可能会声称,King 和 Douglass 感受到的不是真的愤怒,而是驯化过的斯多葛式的愤怒。但那只是斯多葛主义者把不利事实硬塞进他们教条的削足适履的表现。因为对斯多葛主义者来说,愤怒始终是不好的,所以无论 King 和 Douglass 过他们的道德行动取得了什么成就,按照他们的定义,其行动的基础就不可能是愤怒。但是,斯多葛主义是错误的。
创造性的愤怒
愤怒是否还能有另一个积极的层面,即创造性呢?
艺术创造力与包括愤怒在内的情绪状态存在某种关联的观点,可追溯至亚里士多德时期,而且这样的例证很多。1963 年 9 月一个周日的早晨,3K 党成员在阿拉巴马州伯明翰市炸毁了一座浸信会教堂,致使 4 名女孩丧生。歌手 Nina Simone 悲愤交加,她在不到 1 小时内创作的歌曲 Mississippi Goddamn,便是她内心愤怒的表达,这首歌也成了 20 世纪最具感染力、最动人的抗议歌曲之一。
贝多芬堪称将极端情绪运用到创作的绝佳范例之一。从他一生的苦难与辉煌中可以明显看出,他借助愤怒等各种情绪来引导并展现自己的创作力。只需要听听他的《第九交响曲》那激昂的几个开篇小节,或《第六交响曲》中暴风雨般的乐章便可知晓。斯多葛主义者或许会说,贝多芬这种极端的情绪反应是 「不健康的」。但我会说,它们具有启发作用,且富有创造性,正因如此,我们所有人都因此变得更加丰富多彩了。
或许当代最著名的把愤怒化作创作动力的例子,当属巴勃罗·毕加索的画作 Guernica,它普遍被认为是历史上最伟大的反战作品。1937 年 4 月 26 日,西班牙内战初期,德国和意大利空军轰炸了巴斯克小镇格尔尼卡,造成约 1700 名男女老少丧生。这位艺术家义愤填膺,当即运用自己的绘画技巧进行创作,仅用 35 天就完成了这幅杰作,它是画家愤怒情绪的直接表达。事实上,这幅画被称作「油彩里的愤怒」。
如今观赏这幅作品,Guernica 对毕加索来说显然是发自内心的创作体验,他想通过这幅画来表达自己的愤怒。对他而言,艺术成了一种斗争工具,能够激励观看者采取政治行动。正如他所说:「绘画不是为了装点公寓…… 它是一种用于对抗和抵御敌人的斗争工具。」
几年后,在德国占领巴黎的某天,一名盖世太保闯进他的公寓,指向印着这幅画的照片问他:「这是你的杰作吗?」「不」, Picasso 回答道,「这是你们的杰作。」 我们不难从这个回答中感受到蕴含其中的怨恨之情。
结语:愤怒是一份礼物
我一直主张,斯多葛学派对情绪的阐释太过狭隘了。斯多葛学派所倡导的 「顺应自然的生活」,实际上是要把个人的理性运用到社会生活当中。他们认为,愤怒是不理性的,它会损害社会,因此它是违背自然的。并且,愤怒永远不可能是有益的、理性的或在道德上正当的。秉持这一立场,斯多葛主义者与其他哲学流派产生了距离,比如亚里士多德学派,他们的观点就更为微妙。
所以,斯多葛主义者对愤怒的看法完全是片面的,他们故意忽略了其他的可能性,包括愤怒有时也可能是理性的、富有创造性的,或在道德上正当的这些情况。斯多葛主义者以这种专横的方式否定愤怒,他们自己其实就犯了行为不理性的错误,阻碍了自身对德性的追求。此外,还可能导致一些令人反感的荒谬观点,比如认为那位在废墟中拖拽出自己孩子遗体的乌克兰父亲,在悲痛和愤怒之时,不仅是不理性的,甚至是不道德的。但这种观点从斯多葛伦理学的基本原理来看,却是完全合乎逻辑的。
我在这里论述的观点是,愤怒有时是一种美德,它是对我们认为的错事所做的恰当回应,它反映了我们对事物应该是怎样以及我们珍视什么价值的判断,这种道德判断是意志的体现。对不公现象恰当的情绪反应就是愤怒。当我们的理性和情感处于恰当的秩序时,我们就能认清不公正的本质,并为此感到愤怒。当一个人目睹不公的现象时却不感到愤怒,那他在道德上就是有缺陷的。
需要明确的是,我并不是说斯多葛主义者对愤怒的阐释完全错误。实际上,我很乐意承认,它在很大程度上可能是正确的。我不是说我们应该刻意地去愤怒。我们每个人在体验包括愤怒在内的各种情绪上程度不同。正如 William James 所说:「我们的沸点各不相同。」我想说的是,斯多葛主义者的标准答案并非事情的全貌,愤怒除了明显具有的潜在危害之外,它也能产生重要的积极影响。
结论是,斯多葛学派需要改进他们对愤怒情绪的控制,不是因为他们正在遭受愤怒的负面影响,而是他们对愤怒可能带来的包括道德层面的益处视而不见。愤怒是人类所拥有的丰富情感宝库中的重要组成部分,它是一份礼物。
© David Ashton 2024
David Ashton 曾是一名医生和临床流行病学家,现在是独立学者,对休谟、海德格尔和 T.S. 艾略特的诗歌很感兴趣。
0A1:语言习得
原文:Language Acquisition | Refold
语言学家 Stephen Krashen(克拉申)表示,形成语言能力有两条路:习得和学得。1
「习得」一门语言,就是对这个语言建立一种直觉性的认识。我们人人学母语(Native Language,NL)时都是如此。在母语中,我们大部分人不知道语法规则的,只知道哪句话顺耳,哪句话别扭。说话时,我们不费心思去琢磨语法或者词汇,只是想想要表达的意思,说出的话便水到渠成。
比如说,如果你英语说得溜,你就会觉得 the big red dog 这个说法比 the red big dog 更自然,但你可能也不大清楚解释这一点的那套复杂的语法规则是啥 2。
另一方面,「学得」一门语言就是学习有关这门语言的知识。光靠学得来掌握一门语言,这就是人们所说的「技能培养法」的办法。大多数学语言的方法都是聚焦于技能培养,而不是习得。它们把词汇和语法教给你,好像搭积木一样,一块一块地拼凑句子。用这种方法,你可以把母语中的思维翻译成你要学的那门目标语言(Target Language,TL)。
再多的技能培养法,也无法让你变得流利
这或许看起来有点反直觉。毕竟,在学校里,你学会的其他学科都是通过这种技能培养法。但是,语言和其他科目可大不相同。
在语言中,「对头」与「不对」的之间往往没有确切的规律。也许你能够把英文逐字逐句地翻译成韩文,但这样翻译出来的内容可能一点都不通顺。即使通顺,也不会听起来自然。语言是极其特殊且难以预测的。要边说边尝试记住所有的语法规则和特定于语言的说法,这是不可能做到的。
值得庆幸的是,你的大脑有解决这一难题的内置功能。我们每个人天生都有自然习得语言的能力。与大众观点相反,这种能力在你长大后并未消失。事实上,通过将你的成熟分析思维与与生俱来的语言习得能力结合起来,你甚至可以比孩子们更快地学会新语言。
孩子们是如何习得语言的?
我们的大脑就像是一台能识别各种模式的机器。这个天生的能力让我们能够预测未来,欣赏音乐,对的,当然也能让我们掌握语言。
孩子通过父母的示范和教导来习得语言。父母和孩子一起玩,一边给孩子讲解周围发生的事情。比如说:「球从桌子上滚下来了。」「你觉得热不热?来,咱们把你的毛衣脱掉」「你想要红色这个还是蓝色这个?」
孩子们能习得语言,是因为他们理解了话语背后的含义,经过数月数年地持续不断地听他们父母对他们说的话,他们的大脑能够解码这些模式,于是他们就学会了如何说话。
模仿习得过程
我们虽然长大了,父母不会天天陪着说话,但互联网给了我们无限的资源。利用网上随处可见的媒体资料,我们完全可以仿照孩子的语言习得过程。
下篇文章里,我们会一步一步告诉你如何习得你的目标语言。
脚注:
- 1:Stephen Krashen(克拉申)使用术语 "learning"(学习)来和 "acquisition"(习得)区分。
因为 learning(学习)这个词被用滥了,我们在这使用 study(学得)这一术语。
0A2:概述——Refold 语言习得路线图
原文:Overview: The Refold Roadmap | Refold
在投身于你的语言学习征程之前,先来快速了解一下各个阶段你将要做些什么。
通向流利掌握一门语言,有四个阶段:
-
建立基础
-
提升理解
-
开口表达
-
精益求精
阶段 1:建立基础
相较于儿童,我们成年学习者的一大优势就是能制定策略,进行系统学习,并运用各种工具。
在阶段 1,你会用到一些传统的语言学习工具,比如抽认卡、词汇表和语法手册,但用法和传统截然不同。
你不需要用这些工具来学会如何表达,你只需要用它们来理解素材内容就可以了。学习的方向只有一个,那就是从目标语言到母语。不去尝试说或者写,也就是不做「输出」。
同时,你将开始沉浸在目标语言的各类媒体中,这就是所谓的「输入」。
你学得的词汇和语法,会让你更容易理解这些沉浸材料。当你的大脑在这种沉浸体验中碰到并搞懂了某个词,你会开始本能地掌握这个词的用法。
你可以将这个过程视为在你的大脑中构建一台小机器,它让外语中的叽里呱啦变成你理解的含义本身(也就是,mentalese,心语),有意识的学习和沉浸学习相结合,为你的大脑提供了构建这个机器所需的一切工具。
阶段 2:提升理解
要想迅速提高理解能力,得把注意力集中。别乱选电视剧或随便背单词,应挑那些你最容易理解的沉浸内容,并仅在这个范围内学习词汇。
在阶段 2,你将把注意力集中在有意识地学习沉浸材料上。这样做,你实际上是在学习和实践之间建立了一个良性循环,加快了语言习得的速度。
开始时,选些更容易理解的媒体,再逐渐提高难度,直至能听懂面向成年人的母语级别内容。从简单的媒体开始,不仅能打下牢固的基础,还能让你在沉浸学习中找到乐趣。
当你的理解能力达到一定水平后,就缩小学习范围,专攻语言的某个小领域。一旦你对这一小块领域的理解接近完美,就可以开始开口说话了。
阶段 3:开口表达
如果你曾试着学过第二语言,你肯定明白,用「学得」的语言说话总感觉精疲力竭,可用母语说话却不费吹灰之力。
习得中最让人振奋的一刻,就是你感觉大脑开始不假思索地「吐字」。当你有了足够的可理解输入后,脑袋里那台机器似乎开始反向运行。你嘴里就会不由自主地输出目标语言。
到这个阶段,你就该准备输出了。之前你都是通过输入来建立潜能池,下一步就是把这种潜能转化为实际输出能力。
在阶段 3,你会刻意把自己放到需要写作和说话的场合。这样做会迫使你的大脑在已经习得的语言池子中搜寻,使词汇和短语随时可以用来输出。
当然,也有时候你会觉得不知所措,一时说不出合适的话。这正好揭示了你语言习得中的不足。有了这个发现,你可以针对性地多听、多看,弥补这些不足。这种输出和输入的相互作用,能让你迅速地达到基础流利程度。
阶段 4:精益求精
到这个时候,你习得的语言能力会达到 B2 级,无论是听力理解还是口头交流,都能游刃有余。[1]
想要突破 B2 级?在更多的分支主题上重复阶段 1 和阶段 2。每重复一次,过程就变得更简单。不用多久,你就能达到 C1、C2 或者母语般的流利程度。
好的开始,是成功的一半
坚持就是胜利的另一半。
学习语言需要时间,但并不复杂。与学习微积分不同,学语言更像减肥。每项任务单拿出来看并不难,但要想成功,你得持之以恒,耐心坚持数月甚至数年。
阶段 0 余下的内容,会教你如何培养一种勤恳扎实的心态和习惯,以保证你能持之以恒。
脚注
- 1: B2 是指欧洲语言水平框架中的一个等级。参见:CEFR, Wikipedia
0B1:享受语言
原文:Enjoy the Language | Refold
不少流行的语言学习应用,比如 Duolingo 和 Babbel,通过游戏和俏皮的图形等手段,给语言学习过程增添乐趣。但这些应用并没有让语言本身变得有趣。
习得语言的唯一方式,是快乐地使用你的目标语言。如果你对沉浸学习的内容感到厌烦,那么无论你多么努力,你的大脑也不会接受这门语言的。
享受你所沉浸的内容,是语言习得中【最最最】重要的部分。
享受语言有两大好处。
乐在其中,比心力交瘁更有动力
很多学习语言的人由于觉得过程漫长而辛苦,最后选择了放弃。然而,如果你能找到你喜欢且愿意接触的内容,那么学习语言就不会像做苦工一样烦闷无聊。
一旦你享受沉浸学习,你会有动力去继续沉浸。如果你享受学习语言,你就会想在上面花更多时间。
反过来,无聊会让你对花时间在语言学习上的动力下降。如果你对某个电视剧或书籍感到厌烦,那就换一个。强迫自己接触不喜欢的内容只会让动力消逝殆尽。
不要强迫自己沉浸学习不感兴趣的内容。
享受会加速语言习得
如果你觉得你所沉浸的内容非常生动有趣,你将会忘我地沉醉其中。1 语言知识会退到幕后,而你会完全投入到内容里。
这种心流状态,对于大脑吸收语言来说,是最佳的习得体验。你的兴趣越浓厚,你的参与度越高,学习的速度也就越快。
如果你没有投入其中,你就会走神,也就无法习得任何东西。无聊会导致你的大脑完全过滤掉所输入的语言内容。
在阶段 1 和 2 中,你的语言能力还不够,无法让你完全沉浸到内容中,所以保持投入可能有些困难。别担心:即使你不完全理解,我们也有其他的方式让你在享受内容的同时学习。在每个阶段,我们都提供了一些技巧和练习来帮助你保持投入。
有一句忠告:Refold 方法只是一个指南。追随你的兴趣,比死守我们的计划更为重要。如果你在到达「阶段 2C:阅读」之前就迫不及待地想读一本书,那么,请放手去读吧,没有必要等待。你享受这些内容的内在动力,会比任何学习方法,包括我们的,更能促进语言习得。
脚注
1: The Compelling Input Hypothesis, Krashen
0B2:容忍模糊感
原文:Tolerate the Ambiguity | Refold
学校中的传统学习基于这样一种观点:你应该努力争取完美。满分是 100%,任何偏离完美的行为都会导致分数降低,遭受老师和父母的责备,你甚至可能会被留堂。这种教育方式,让我们习惯于避开那些可能让我们感到无能为力的非舒适区。
在无法理解外语时,我们会有种无所适从的感觉。面对这种难以理解的语言输入,我们很自然地会觉得自己很蠢,感到挫败,甚至自闭,这些负面情绪不仅会打击你的学习动力,还会阻碍你的大脑吸收语言,这种现象被称为「情感过滤器假说」。[1]
在学校的语言教育中,教师通常会尽量避免学生遇到这个问题。他们鼓励学生在接触「真正」的语言之前,先通过技能培养法来学习,以为这样学生就不会因为不理解而感到痛苦。
技能培养法对语言习得是【行不通】的。
等到自信满满再开始学,这种思路其实毫无道理。就像游泳一样,你不能光靠理论学习就能学会游泳。再多的理论知识也无法教你如何在水中游。如若想要学会游泳,你必须直接跳到泳池里,自己摸索。
语言学习也是如此。单靠背诵词汇和语法规则,你并不能真正准备好应对实际语言使用。在现实生活中,人们的说话方式各不相同,他们可能会含糊其词,使用方言和俚语,或者快速说话,甚至模糊不清。要想理解他们,你也必须参与其中,自己摸索。
在这个参与和摸索的过程中,你可能会有种像是在水中挣扎的感觉。学习语言最艰难的部分,就在于接受自己的无力感,以及容忍自己无法理解的语言带来的模糊感。
如何增强对模糊感的忍耐力?
首先,不要再自我贬低。不要再说「我永远也搞不明白」,你现在还不懂,并不代表你永远都不会懂。你越是自我贬低,心情就会越糟,学习的难度也会随之增大。
换个思考角度看问题:问题的关键不在于你「没理解」,而在于你无法接受自己的不理解。不理解其实没关系,这是学习过程中很自然、也很必要的一部分。试着跟它和解。
别每个生词都查字典。当你因为模糊感而觉得难受时,你可能会忍不住查阅每个不知道的单词。但你要学会克制这种冲动。频繁的查阅会打断你的学习节奏,影响大脑对语言的吸收。
慢慢来。你还不习惯不懂的感觉,甚至可能会头疼。给自己一些时间,慢慢来,逐步提高忍耐力。过不了多久,你就能轻松看完一小时的电视节目。
欣喜每一个小进步。可能你听懂了一个新词,或者一个句子。每当有这样的时刻,记得为自己点赞。
最重要的是:记住要享受其中。
脚注
1: Affective Filter Hypothesis, Wikipedia
0C1:主动沉浸
主动沉浸,就是将全身心投入到你正在接触的内容中,无论是听音频、看视听媒体,还是读文字材料。
主动沉浸是语言习得中【最重要】的一环。
当你刚开始沉浸时,你的大脑可能会忽略大部分信息,因为它认为这些信息并不重要。当你专心致志地将注意力集中在目标语言的内容时,你的大脑会知道它需要开始关注了。
你也许觉得把时间花在观看目标语言的电视节目上,是诡异且没有成效的事情。请放心:这并不是虚度时光,这正是语言习得发生的地方。即使有的内容你几乎完全无法理解,你的大脑仍在积极工作,寻找规律,验证假设,构建你内在的语言机器。
找到吸引你的内容至关重要。有趣的内容能够吸引你,并使你保持投入,你会发现自己能在其中沉浸更长时间,而且关键的是,它将使你一次又一次地回来学习——长到足以掌握这门语言。如果你对某些内容感到厌倦,那就放手,找些更让你兴奋的事情去做。
路线图的每个阶段都会确定发展特定技能的沉浸活动的优先顺序。每个阶段我们都会就建议的具体沉浸时长和沉浸方案提供指导。
寻找内容
在搜索目标语言内容时,可以先从你已经习惯浏览的母语内容入手,然后尽量用目标语言的内容替代母语内容。
Netflix 和其他在线视频网站
试着看看不同类型的电影和电视剧,看看有哪些符合你的口味。
YouTube
无论是烹饪、编织、骑山地车、开锁、旅行日记,还是其他任何你感兴趣的话题,YouTube 都会有丰富的目标语言内容供你选择。
其他平台
对于一些语言,可能还有其他平台和产品能够提供丰富的内容:你只需要简单地用 Google 搜索一下就能找到它们。
工具
Language Learning With Netflix(谷歌浏览器插件)(译注:现在也叫 Language Reactor)
这个插件可以同时显示目标语言字幕和母语字幕。它支持每段字幕自动暂停,并可以遮罩母语字幕,仅在你需要时才显示出来。还包含了一个内置词典,你可以在看字幕时随时查词。
专用的目标语言 YouTube 账号
为了帮助你脱离母语,你可以创建一个只使用目标语言的 YouTube 账号。
把你的位置设置在使用目标语言的国家,并将账号的默认语言设为目标语言。这样,YouTube 的推荐算法就会优先推荐目标语言的内容。
在首页,对非目标语言的视频,点击「不感兴趣」或「不推荐此频道」,让 YouTube 不要向你推荐母语的视频。
专用的目标语言沉浸设备
如果你经常被母语的邮件、社交媒体账户和其他日常习惯所干扰,你或许可以试试只用于学习目标语言的平板电脑或其他设备。
0C3:主动非沉浸学习
作为成年人,我们有学习语法、记忆词汇的能力,这让我们在语言学习上比孩子们更有优势。通过语法学习,我们能把复杂的语言分解成更容易理解的部分。同时,记忆能以三种方式助力我们的语言习得:启动、理解和记忆保持。
启动效应
你有没有这样的经历:刚买了新车,突然发现街头巷尾都是同款车?这就是我们常说的「频率错觉」[1]。
当你学习一个新词时,你的大脑就像在「心理字典」中为它开辟了一个新词条。这个词条促使你的大脑在沉浸学习中注意这个词,每当你遇到这个词时,你的大脑就会把一点点补充信息关联到这个词条中,当你多次见到这个词,你的大脑就可以根据积累的信息推测出这个词的含义和用法。
理解
别忘了,我们通过可理解输入习得语言。当你记住一个词的含义时,你就会在心理字典的词条中为它加上定义。有了这个定义,你接收的输入就变得更容易理解了。你理解的越多,你习得的就越多。
记忆保持
遗忘是大脑的自然过程。你大脑中的每一条信息都在慢慢腐烂消失。大脑中有一个精力旺盛的修剪机器,可以抹去一切对你不重要的东西,如果你想记住一条信息,就需要不时地刷新和强化。
当你学会一个新词,一再在沉浸学习中遇到它,它就会被习得。习得的词汇会对大脑修剪机器产生抵抗能力,需要很长时间才会被遗忘。
不幸的是,如果你在沉浸学习中没有经常看到这个词,你的大脑可能会在这个词被习得之前就把它删掉。偶尔复习一下这些脆弱的词条有助于保留足够长的时间,以便你通过沉浸学习掌握这些词。
一旦你习得了一个单词,记忆就会变得很牢固,但它并不是无敌的。为了词汇留在长期记忆中,你需要通过沉浸学习或刻意学习的方式每年复习一次左右。
智能的记忆方法
许多人都用抽认卡来背过单词或概念,以应付考试,但这玩意儿对长期记忆没啥用。不去温习的东西,迟早会忘掉。
要让一个词牢牢地留在长期记忆里,不时地复习是必须的。多久复习一次,看你对这个词有多熟。理想情况下,最佳的复习时机是在你快要忘记它之前。按这么个最佳时机来复习,你用最少的精力就能记住大量的信息。
轮到间隔重复系统(SRS)出场了
间隔重复系统(SRS)是一个程序,它能智能地预测你什么时候可能会忘记某条信息。它会在你忘之前提醒你复习,这样你的记忆就能巩固下来。
当你第一次学习一个新单词时,相关的记忆很弱,所以 SRS 会频繁向你展示这个词。随着时间的推移,随着记忆的增强,SRS 展示的频率也会越来越少。最后,一年复习一次(甚至更少)就能让这词儿牢牢地印在记忆里。
Anki:首选的间隔重复系统
Anki 是一款依据间隔重复(SRS)原理设计的电子抽认卡程序。目前在同类产品中,它可说是无出其右。
用 Anki 学习主要分两大块:学习新卡片和复习旧卡片。
记单词的第一步,就是在脑海中为这个单词建立一个「心理字典词条」。在 Anki,就是添加一张「新卡片」。Anki 允许你选择每天想学习多少张新卡片。一旦你学会了一张卡片,它就变成了「复习卡」。
每天,Anki 都会生成一组你可能即将遗忘的卡片。这其中或许有些是你刚刚学过的,或许有些是你几月甚至几年前学过的。你不能选定每天需要复习多少张卡片,因为你无法控制大脑何时删除信息。所以,持之以恒地复习至关重要,否则你就会遗忘。
Anki 虽然好用,但它的算法终究只能猜测你什么时候会忘记;它无法百分百确定。总会有些信息会从缝隙中溜走。
所以 Anki 需要你给出反馈。当你学一张卡片时,它会让你自我评价这张卡片你记得怎么样。这个反馈决定了下次你应该何时再看到这张卡片。
如果你告诉 Anki 你记得很牢,那么下次见到这张卡片的间隔就会拉长。反之,如果你告诉 Anki 你没记住,那么这张卡片很快就会再次出现,以便让你回顾,刷新你的记忆。
你的记忆保留率指的是你在复习时成功记住的卡片比例。如果这个比例在 80% 到 90% 之间,那可谓是相当出色了。
在阶段 1,你将设置好 Anki,并开始学习你的第一组词汇。
脚注
1: Cognitive biases, Wikipedia
0C2:被动收听
正如上一篇文章指出,主动沉浸是语言习得中最重要的活动。遗憾的是,对于忙碌的人来说,很难在日常生活中找到大把的时间来进行主动沉浸。幸运的是,在日常生活中,你有很多机会来被动收听你的目标语言,比如做饭、打扫卫生、上下班通勤或锻炼身体等不太耗脑子的活动时。
我们称之为「被动收听」,因为你并没有全神贯注在内容上,你的注意力被分散在各种活动之中。
你或许习惯在这些机械性的活动中听音乐或播客来娱乐,但我们推荐你利用这些时间来学习语言。
被动收听的关键在于养成习惯。每次你想听音频时,首选的应该是你的目标语言。我们建议每天至少被动收听 30 分钟。每天 30 分钟积少成多,这将大大加快你的理解速度。
选择收听内容
我们建议你反复听那些你已经主动沉浸过的内容。因为重复能让你的大脑有机会进一步吸收和分析语音和词汇,这对大脑有益。遗憾的是,重复往往乏味,而无聊是学习的敌人。被动收听则是一种无感的重复,让你的大脑有机会再次收听你已经主动沉浸过的内容。
最初,你可能有很多内容都听不懂,因此学会容忍模糊感并坚持听下去很关键。听你已经观看过的内容可以帮助你保持兴趣,因为即使你听不懂,你也会记住故事情节。
开始时,你应该专心听你目标语言的声音。你可能感觉不到有什么变化,但实际上你的大脑正在无意识地学习解析外语声音。
随着你的词汇量和听力能力的提高,你会对被动收听的内容有更深的理解。最终,你将能够听懂全新的内容,如播客、有声书和谈话节目。
记住,无聊是学习的敌人。如果你对被动收听的内容感到无聊,那就换些更有趣的内容吧!
1A1:主动沉浸
如在阶段 0 所述,主动沉浸毫无疑问是学习目标语言最重要活动。
在主动沉浸的过程中,你会把所有的注意力集中在你正在观看、收听或阅读的内容上。这种高度集中会向大脑发出信号,告诉你的大脑它应该开始注意目标语言了。
在下一个阶段(阶段 2),你将在没有母语翻译的情况下观看目标语言内容。这可能是一个挑战,原因有二:
-
你现在可能只习惯看母语内容。
-
观看目标语言内容需要你接受你的不理解。
调整你日常接触内容的习惯
在日常生活中,无论是吃喝拉撒还是消遣娱乐,大都离不开母语内容。这是因为我们从小就在这样的环境中长大,已经成了习惯。大多数人都不喜欢或者不适应接触他们不理解的内容,尤其是其他语言的内容。
沉浸学习就是让你开始尝试接触那些你一开始可能不理解或不习惯的内容。
让大脑真正搞懂目标语言,需要花费数百小时的时间去观看、收听和阅读。你在目标语言中沉浸得越久,进步就越快。因此,你需要削减接触母语内容的时间,给目标语言内容腾出空间。
首先设个小目标,每天至少花半小时主动沉浸在你的目标语言中。
在这个阶段,你应该探索目标语言中可看的视频内容。涉猎不同类型的媒体:卡通、动漫、连续剧、话剧、电影等,到处逛逛看,尝试不同的题材,熟悉那些常见的套路。如果碰上了合眼缘的导演、编剧或者演员,那就多关注他们的作品。
敢于尝试一些在你母语里从没碰过的内容。多了解一下这个文化,说不定能找到一些意想不到的好东西。
当你发现你真正喜欢的东西时,记得做个标记,在阶段 2,你就可以从这个清单里的沉浸内容直接学起了。
一些启动小窍门:
-
新开个 YouTube 账号,充分利用上 YouTube 的推荐算法。
-
看带有母语字幕的视频,让自己在养成这个新习惯的同时,享受沉浸的乐趣。
接受模糊感
如果你还没有读过《容忍模糊感》,先别往下读,看完那篇再回来。
语言学习中最难的部分之一,就是不理解你的目标语言,这会让你觉得自己很笨,情绪低落,甚至焦躁不安。但别因此气馁。这是每个人都要经历的自然过程。
这种负面情绪会妨碍你学习新语言。这一现象有个学名,叫做情感过滤假说[1]。你得调整好自己的心态,这样才能愉快地沉浸在新语言中。
这个阶段是无法跳过的。处理这种模糊感是语言习得过程中必经之路,但你别担心。时刻提醒自己这只是暂时的,你终将走出这个阶段。
在阶段 1 结束时,你将训练有素,能够轻松应对不理解了。
如何接受模糊感
一开始,用母语字幕没啥不可以,这样至少不会让你气馁。尽管母语字母并不能直接帮助你学习语言,但它能帮你养成观看目标语言内容的习惯,同时也能积累下一些以后可以重看的内容。一旦你适应了这个阶段(1A)里规定的日常习惯,就应该逐渐放弃母语字幕。
一旦你去掉了母语字幕,就会更难跟上你所看节目的情节,因此,你需要学会容忍不知道到底发生了什么的模糊感。以下几点建议或许能帮你适应这种模糊感:
限制使用母语字幕
有个插件叫 Language Learning with Netflix,可以遮罩母语字幕,这样一来,除非你真的需要,否则你就无法看到翻译。
试着控制看字幕的次数。比方说,在看一个 30 分钟的电视剧时,你最多只看十行字幕。然后你逐步减少这个数字,直到能看完一整集也不用去瞄一眼字幕。
重温老剧
大家总有那么几部喜欢到能背出台词的剧,比如《口袋妖怪》,Netflix 上有多种语言版本。试着用目标语言去看,因为剧情你已经了如指掌,就算听不懂,你也能维持对剧情的兴趣。这样,你就能集中精力去理解语言,而不是去揣摩剧情了。
看简单点的节目
儿童节目和情景喜剧通常有丰富的视觉元素,方便你理解。即便你听不懂对话,也能跟得上剧情。
这也可以是一个观看具有文化意义节目的机会,这些节目常常会在其他媒体和日常生活中被提到。简单搜一下,就能找到和你年龄相仿的母语者以前常看的节目。
一句忠告:如果你对儿童节目没兴趣,就别勉强自己。乐子比理解更重要。
把它变成游戏
为了在面对费解的内容时保持兴趣,你可以自己创造一些小游戏:
- 专注于发音。
试着把注意力放在语言的声音上,而不是放在意思上。在阶段 1B1:语音中,你将了解到目标语言中会存在一些你大脑还听不懂的发音,试着去听这些声音。
- 仔细听这些词。
试着判断一个单词在哪里结束,下一个单词从哪里开始。
在头脑中记下两个词混在一起时听起来是什么样子。
- 寻找认识的单词。
当你学习词汇时,在你的沉浸中找出这些词。
看看你能认出多少个熟悉的单词。
脚注
1: Affective Filter Hypothesis, Wikipedia
1A3:Anki 初级配置教程
正如在阶段 0:主动非沉浸学习中所述:我们会运用间隔重复系统(简称 SRS)来主动学习目标语言词汇。
虽然 SRS 软件五花八门,但我们还是倾向于推荐 Anki。这个软件不仅跨平台,而且功能齐全,在绝大多数平台上都是免费的。唯一的弊端就是入门门槛稍高。如果你对 Anki 的使用方式感到一头雾水,没关系,耐心摸索一两周,你就能渐入佳境。本篇文章主要会聚焦于 Anki 的基础用法。为了让你能快速上手,我们不会过多地深究每个设置背后的逻辑。
在文章的最后部分,我们还会给那些想深究 Anki 细节的资深用户提供一些额外资源。
安装
你可以从 Anki 的官网下载到最新的稳定版。桌面版完全免费,适用于 Windows、Mac 和 Linux。
如果你是苹果用户,App Store 里有官方出品的 AnkiMobile,售价 24.99 美元(每个国家的价格不同)。安卓用户也不用担心,Google Play 上有第三方的免费应用 AnkiDroid。此外,Anki 还有网页版,叫做 AnkiWeb。
虽然 AnkiMobile、AnkiDroid 和 AnkiWeb 在卡片复习方面做得很好,但创建新卡片的功能相对有限。所以,本文接下来将重点介绍如何在桌面版上添加新卡片。
本文的其余部分将侧重于桌面版 Anki 的设置。
Anki 的组成要素
牌组
当你打开 Anki 时,首先映入眼帘的便是你的牌组列表。一开始,你只会有一个牌组,名为「默认牌组」。
牌组本质上是就是一组抽认卡。在学习时,你一次学习一个牌组。
要新建牌组,底下有个「新建牌组」的按钮,点一下就行。牌组数量没上限,单个牌组里放多少张卡也没有限制。
一般来说,我们建议把你所有的卡片放在一到两个牌组里。将你的卡片分成许多牌组,会人为地把卡片复习变得太容易了,例如,如果你有一副专门用于「动物名称」的牌组,当复习这个牌组时,你的大脑会自动知道答案一定是动物名称。这个「提示」会让你更容易回忆起答案。由于你在现实生活中没有这类提示可以依靠,所以最好在没有提示的情况下进行练习。
笔记和卡片
在 Anki 里,最容易让人摸不着头脑的就是「笔记」和「卡片」的区别。如果你一开始觉得费解,不必纠结。只需了解这两样东西存在就行,随着时间推移,你自然会明白其中道理。
Anki 最基本的单位是「笔记」,这是一个非常抽象的概念。你不能像拿实物一样触摸或拿起一条笔记,这让它显得更加复杂。
简单来说,笔记就是一堆有关联的数据。比如,你可能会有以下五类信息:
-
你目标语言中某个单词的写法
-
使用这个单词的一条例句
-
这个单词在你的母语里的粗略翻译
-
母语者说这个词的音频
-
你在谷歌图片上搜索该词时发现的图片
所以,一条笔记就是这五类数据(无形地)聚在一起。
这些数据会被转换为抽认卡(在 Anki 里就叫「卡片」),也就是你每天都要复习的那些卡片。
总结一下:笔记是一组数据的集合,而这些数据会用来生成一张或多张卡片。
你也许会好奇,这些卡片是怎么生成的,这就引出了另一个抽象概念:笔记类型。
笔记类型
笔记类型比笔记更抽象,如果你现在感到困惑,这没关系。
笔记类型是笔记的蓝图,它由以下部分组成:
-
一个名字
-
一系列字段
-
一组卡片类型
重复上面的例子,笔记类型的名称可能是「词汇」,因为它是用来创建用于生成词汇卡的笔记。
字段列表可能包括:
-
单词
-
例句
-
释义
-
音频
-
图片
这些字段就是预留的地方,用来在笔记里存放数据。
卡片类型
卡片类型实际上是 Anki 用来生成卡片的视觉模板。在这里,你得明确卡片正反两面要展示哪些信息。虽然 Anki 允许你为同一种笔记类型设置多个卡片类型,但我们并不建议这样做。
小结
-
笔记用于储存数据
-
卡片是你复习的对象
-
笔记类型规定了笔记可以储存哪些信息
-
卡片类型则决定了卡片上展示什么内容
如果你更改了某个笔记类型,所有相关联的卡片都会立即发生改变。同理,如果你调整了卡片类型,所有相关的卡片也会随之改动。
Anki 内置了五种笔记类型。你可以对这些笔记类型进行修改,也可以从头开始创建新的。要修改或新增笔记类型,你需要在 Anki 的主界面上点击「工具 > 管理笔记类型」。
添加卡片
Anki 本身并未预装任何学习资料。你需要自己创建卡片,或者导入别人预制的牌组。
要新建卡片,点击 Anki 主界面顶部的「添加」按钮,进入添加窗口。
在添加窗口的顶部,你可以选择想用的笔记类型和将卡片放入哪个牌组。然后填写相关字段,点击「添加」。
预制牌组
除了制作你自己的卡片之外,你还可以从 Anki 网站上下载其他人制作的牌组。
因为每张卡片都与一种笔记类型相关联,所以当你添加别人的牌组时,它通常会附带一种新的笔记类型,这个笔记类型也将被添加到你的集合中,你可以在自己手动添加新卡时使用它。
浏览器
Anki 浏览器是查看和编辑你所有卡片的地方。
要打开浏览器,只需点击 Anki 主界面上方的「浏览」按钮。
在浏览器中寻找卡片时,你可以按牌组、笔记类型或标签进行筛选,你也可以使用搜索窗口。
想修改卡片字段的内容,直接在浏览器里选中就行。要删除卡片或者挪到别的牌组,用鼠标右键点击卡片,选择相应的选项。
偏好设置
偏好设置是影响整个 Anki 程序的全局设置,你可以通过 Anki 主界面上的「工具 > 偏好设置…」来访问。
我们建议改变偏好设置中的一个开关:在「复习」标签页中的「在回答按钮上显示下次复习时间」。当这个选项被打开的时候,在复习卡片的时候,每一个回答按钮的上方都会显示卡片的下一次复习的估计时间。这可能会使你怀疑自己的记忆力,并给卡片打上过于保守的分数,最好是相信算法,不要担心具体数字。
如果你想同步 Anki 集合到你的 AnkiWeb 账户,可以在「网络」标签页里设置。这样你就能把信息同步到其他设备上。
选项
选项是你自定义 Anki 的算法如何工作的具体细节的地方,选项是在单个牌组层面上设置的。
在选项窗口的顶部,你可以看到哪个「选项组」正被应用于当前的牌组。一个选项组是一组选项。你可以为每个牌组创建一个选项组,或者让多个牌组共享一个选项组。
如果你使用多个牌组,我们建议为每个牌组创建一个单独的选项组。你可以通过按右上方的「管理...」,选择「新增」来创建一个新的选项组。
推荐的选项设置
Anki 自带的默认选项设置有很多问题,为了适应语言学习,有必要进行精细调整。(译注:用 FSRS 算法的可以跳过这节了。)
下面是我们推荐使用的选项设置:
唯一需要个性化的选项就是「新卡片/天」这个设置,在「新卡片」标签页里。这个选项决定了 Anki 每天会给你展示多少新卡片。具体应设置为何值,我们会在后面的文章里详细解释。
修正旧设置
如果你用 Anki 已经有一段时间了,那你需要更新旧的卡片并卸载过时的插件。
要更新旧的卡片,请使用 Refold Ease 插件。Refold Ease 的默认设置已经足够好了(虽然我们知道间隔修改器上有 1% 的差异)。
若你曾安装过下面列出的任何插件,建议一并卸载:
-
No Penalties or Boosting
-
ResetEZ
学习
要学习一个牌组,先在 Anki 的主界面里选中这个牌组,然后点「现在学习」。
当你在学的时候,Anki 先给你看卡片的正面,然后提示你按「显示答案」看卡片的背面。背面一旦出现,系统就会让你给本次回忆打分。
在给复习打分时,Anki 会让你从四个选项里选一个:「重来」,「困难」,「良好」和「简单」。
我们强烈建议【只】用「重来」和「良好」按钮,而避免使用「困难」和「简单」按钮。
这是因为「困难」和「简单」两个按钮对 Anki 算法的影响与直觉相悖,长期下来会引发问题。具体原因,可参见本文末尾的「按键精简版 Anki 」一节。
数据统计
要查看你学习的各种数据,只需在 Anki 的主界面点击「统计」即可。
最值得一提的数据就是「保留率」,也就是你评为「良好」或「简单」的卡片在总数里占的比例。你可以在统计页面里的「回答按钮」部分找到这个数据。
保持率在三类卡片中分别计算:学习中、欠熟练和已熟练。「学习中」对应的是你还在学习过程中的卡片。「欠熟练」则是那些你已经学会但仍然每 20 天至少复习一次的卡片。「已熟练」则是那些你 21 天或更久才复习一次的卡片。
事实上,保留率只对「已熟练」的卡片有意义。对于「学习中」的卡片,你还没完全掌握,自然容易忘记。同理,「欠熟练」的卡片是你最近刚学的,还没有牢固地记在脑子里。
在语言学习方面,已熟练的卡片的理想保留率在 80% 至 90% 之间。如果你的保留率没有达到这个范围,我们在后面的《阶段 1C:最佳实践》一节里,有具体的应对建议。
新手别往下读了
文章接下来的部分会详细剖析 Anki 的算法。如果你刚接触 Anki,建议先跳过这部分,直接阅读下一篇文章。
高级用法
跟着上面的步骤,你能搞定 Anki 优化的 90%。不过,要想彻底玩转,你得先弄明白 Anki 的算法是怎么回事。如果你还不熟悉 Anki,先把基础搞定,一个月或两个月后再回头来看这部分。
算法全解
下面这个视频详尽解析了 Anki 的算法,以及各种设置选项的效果。
按键精简版 Anki
按键精简版 Anki 是在 Refold 社群中颇受欢迎的 Anki 算法改进。在语言学习的场景下,它能避开默认算法的多数缺陷,让你的复习效率大大提升。
我们已经把按键精简版 Anki 融入到了上文推荐的设置选项和复习指南中。只要你按照推荐设置和复习指南去做,就能充分享受到按键精简版 Anki 带来的好处。
如果你想了解按键精简版 Anki 背后的基本逻辑,请阅读这一系列的文章。
按键精简版 Anki 浅析
按键精简版 Anki 包含两个部分:只用「重来」和「良好」的按钮,以及取消所有的简易度变化。正如上面链接的一系列文章所解释的那样,这最初是通过一个插件来实现的,这个插件可以阻止 Anki 改变卡片的简易度,而不论你怎么对卡片评分,但你要知道,其实不用任何附加组件,也能搞定这个按键精简版 Anki 。
在 Anki 中,一张卡片的最低简易度是 130%。一旦简易度达到 130%,即使这张卡片评为「重来」或「困难」,它也不会下降。因此,只要一开始就把卡片的初始简易度设为 130%,并假设用户从不点「简单」按钮,那么卡片的简易度将永远不会改变。由于简易度一开始就在底线上,所以点「重来」和「困难」按钮不会降低简易度,而「良好」按钮本就不会改变简易度。
这个低初始简易度可以通过把全局间隔乘数提高到 192% 来平衡。这样一来,卡片的间隔增长跟初始简易度为 250% 和全局间隔乘数为 100% 时是一样的。
不幸的是,Anki 2.1.35 有一个 bug,导致所有简易度为 130% 的卡片都会被重置到 250% 的初始简易度。为了绕过这个 bug,我们把最低简易度改为了 131%,全局间隔乘数也调到了 191%。
这个无插件版本的按键精简版 Anki,就是上面推荐设置里已经用上的那个。
1A2:养成被动收听习惯
原文:Create a Passive Listening Habit | Refold
正如在阶段 0:被动收听中提到的,当你在做不用动脑筋的事情时,如做饭、扫地或者上下班途中,顺便听听你的目标语言,能有效提升你的听力理解。
你的大脑要大量的音频输入来熟悉目标语言的各种声调和语速,尤其是刚入门时,可能得听个几遍,大脑才能开始分辨这些声音,熟悉它们。被动收听就是为了能让你有大量机会重复听,反复听。
在整个语言习得过程中,被动收听都是核心活动,所以,一开始就要建立好合适的工作流。
为了有效的被动收听,你得培养两个好习惯:
在做无需动脑的事情时收听
现在就花点时间想想,你一天里哪些时候能够把被动收听融入进来。比较常见的机会有:
-
在通勤或旅行的路上
-
在散步或锻炼的时候
-
做饭、扫地或是搞其他家务的时候
-
在早晨的例行活动中,如遛狗或吃早餐时
-
在睡前的例行活动中,如刷牙或入睡时
提前做个计划,看看啥时候适合被动收听,并准备好你需要的工具(比如,手机里整个音频列表,再弄一副耳机),一个简单的办法是,打开手机上的 YouTube 或 Netflix,听你已经看过的内容。
让被动收听更简单
为了让这个习惯尽可能轻松,关键是要准备好一份随时能被动收听的播放列表。
虽然被动收听 Netflix 或 YouTube 上的视频很容易,但这两个应用需要你手机保持解锁状态。作为替代,我们推荐你在手机里创建一个永远在循环的本地播放列表。
长时间被动收听同样的内容可能会让人生厌,所以,最好定期更新播放列表,淘汰一些陈旧的内容。每隔一两周,抽空将新音频加入手机,以便随时随地都能收听。
如何制作播放列表
下载内容
你不一定总能联上网,所以最好提前下载好你想被动收听的内容。
Youtube
-
JDownloader:一个能轻松下载音频和视频的软件
-
youtube-dl:一个用于下载的命令行工具
-
Y2 Mate:一个用于下载 YouTube 视频的网站,这样的网站有很多。
-
NewPipe:一个可替代 YouTube 应用的安卓应用,支持视频下载
Netflix
- FlixGrab:一个用于下载 Netflix 节目的软件(仅支持 Windows)
提取音频
从视频中提取音频是创建被动收听播放列表的关键。
对于那些不太擅长技术的人,网上有一些易用的音频提取工具。如果你对技术比较得心应手,以下是几个可用于提取音频的软件:
在线工具
Mac
PC
- VLC:一款不仅能播放,还能提取音频的媒体播放器。
将音频加载到你的手机上
下面有详细的指南:
优化
一旦你养成了听目标语言音频的好习惯,你可以做一些可选的优化:
-
换个更方便的耳机(如无线、降噪、骨传导)。
-
浓缩音频,提高对话密度。
-
使用独立的 MP3 播放器,以达到理想的被动收听效果。
内容推荐
选择被动收听内容的首要目标是找到能引起你兴趣的东西。听你已经看过的电视节目的音频有助于此,因为你已经了解剧情。
或者,听听你喜欢的小说的目标语言有声书。要是你对故事了如指掌,即便只认识几个词,跟着听也相对容易。
音乐不是被动收听的好选择。尽管娱乐性强,但其学习价值不高。歌词经常让人困惑,而且容易误解。你自己听母语歌都能听错词,何况是别的语言。
要是你就喜欢听歌,那目标语言的歌也比啥都没有强,但最好还是多听听有对话或者叙述的音频。
如果你对正在听的内容感到厌倦,那就换点别的。随你的兴趣走。
无聊是语言学习的敌人。
如何对「天书」保持兴趣
当你第一次开始被动收听时,你不会理解任何东西,你的思绪会飘忽不定,这没有关系!这是一种自然的反应,你的大脑会过滤掉「不重要」的声音,所以你很可能会感到无聊并跳到另一个思绪里。
要让大脑不走神,试试以下几招:
-
专注于听声音而不是听单词。
-
试着听出一个词的结束和另一个词的开始。
暂时别纠结意思。
- 当你学习新的词汇时,泛听音频以尝试听到学习中的新词汇。
1B1:发音规则
幼儿具备准确听出人类所有语言中每一个音素的能力[1]。随着年龄增长,大脑为了更高效地处理母语,会放弃识别不必要的音素。这意味着,你现在可能无法察觉到目标语言中的某些音素。在你有机会注意到这些音素之前,你的大脑就已经将其过滤掉了。然而,这并非无可挽回。大脑能重新学会识别这些曾经认为不必要的音素。
如果你学习一下外语的发音规则,就能更快地听出这些发音。我们的目标是达到可以开始学习词汇的程度,所以你只需要学习目标语言声音系统的基本知识。高深的发音规则等到阶段 4 再说。
如何学习发音
首先,上网搜一搜你要学的那门语言的读音规则。查一查都有哪些元音和辅音,嘴巴怎么张怎么合才能发出这些音。别只看一个网站,多找几个参考一下。寻找那些既能让你听到这些音,又能展示如何发这些音(口型、舌位等)的资料。
如果你的目标语言还有其他核心的语音特征,如力重音、音高重音或声调,也一并学习了解。
在主动沉浸的过程中,也别忘了特别注意这些发音细节。可以参考 1A 主动沉浸中描述的方式练习。
脚注
[1] 《为什么婴儿的大脑可以同时学习两门语言?》,theconversation.com
1B2:书写系统
成年人学习语言,最行之有效的方式就是在培育听力理解的同时培育阅读理解。
在开始阅读之前,你需要学习目标语言的书面文字。
只需打个基础
这个阶段的目标,就是把文字学到能认词、看懂语法的程度。至于快速、流利地阅读,那是之后的事。
要花多长时间,因人而异,也得看你要学的是哪种语言。比如说,讲英语的人学西班牙语可能就几分钟就能上手,但要学中文,那可得花上几个月。
错误发音
对于那些与你的母语使用相同文字的语言,你会自动将相同的符号与母语中的发音联系起来,这可能会导致你在脑中默读时出现发音错误。
别焦虑,这个问题以后自然会改正过来。只需明白,这种情况肯定会发生。请确保你清楚哪个字母对应哪个发音。
接受自己的不足
对于那些用一套完全不同的字母系统的语言,学习阅读可能会觉得吃力,感觉处处都束手束脚。就像孩子学习阅读一样,你一开始只能一个字一个字地拼读,而不是以一个个意群来感知整个单词和短语。
特别是在你不确定应该怎么念某个词的时候,可能会觉得特别沮丧。不过别太焦虑——随着时间的推移,这个问题会自然解决。
非表音文字
像汉语这样的语言,并没有字母表。每个字都是一个寓意于形的小图画。这些图画一旦组合,不仅构成了更复杂的图画,意义也更加丰富。
请参考针对特定语言的指南,学习如何理解这些基于图画的书写系统。
学会用你的目标语言打字也很有帮助,这样查单词会更方便。
注:即将推出针对汉语和日语的语言指南。
1C1:语法
跟世界语、克林贡语、精灵语这些人造语言不一样,大多数语言都不是精心设计出来的,它们都是历经千锤百炼,几千年的无序演变才有的,所谓的「规则」根本不存在。
学校教育让我们误以为,只有遵循语法规则才能正确使用语言。此乃谎言。语法规则其实是事后对人们实际语言用法的归纳总结。
所谓的语法并非一套「规则」,更多地是对语言混乱性的解释尝试。不幸的是,这种混乱本质上是无法解释的,所以你会发现一大堆语法的例外。这些例外就是语法解释说不清、道不明的地方。
我们真的需要学习语法吗?
简短的答案是:不需要。你的大脑可以自己悟出语法,不需要刻意去学。可惜,这个过程真的很慢。
刚开始学习语言时,了解一些基础的语法有助于加快你的理解。简单来说,语法就是拐杖,等到你的大脑可以自然而然地理解这门语言,这个拐杖就可以丢了。
因为你只需要语法来进行基本的理解,所以没必要去钻研高级语法那些复杂微妙的地方,这些东西,你在沉浸学习中自然会掌握。
因此,只管抓紧学那些最基本、最直接影响你理解沉浸内容的语法点就行了。
如何学习语法
一口气大量学习语法枯燥无味,所以我们建议在沉浸学习和词汇学习的同时逐步学习语法。
每天花 10 到 20 分钟学习目标语言的基础语法概念。
由于你不需要深入了解细微的语法概念,所以选哪本语法书其实没大差别,只要是能帮你了解目标语言基础语法的材料,那就够了。
动动手指,网上搜索一下,看看有哪些适合初学者的语法指南。不论是 YouTube 教学视频,网课,独立网站,入门教材,还是语言学习应用,挑一个你喜欢,符合你生活节奏的就行了。
要是碰到某个让你摸不着头脑的语法问题,那就跳过去,继续往下走。通过在沉浸学习中不断接触,你会逐渐对语法有一种直观的理解。要是实在觉得不对劲,等你有了更多经验后,再回头去翻翻语法书也不迟。
别忘了,学语法的最终目的是为了让你理解目标语言,【不要】硬着头皮按语法规则去说或写。你将通过沉浸学习培养这两种能力。
学什么
学习语法的目标是为了理解。要想理解一个句子,你需要能做到以下几点:
-
把单词分清楚
-
看清主语是啥
-
弄懂主语碰上啥事了
-
搞清楚这事啥时候发生的
把单词分清楚
有的语言把单词粘一块儿,或者单词之间没空隙。学点语法,你就能知道哪儿断句,一个单词在哪儿结束,下一个单词从哪儿开始。
看清主语是啥
你将通过词汇学习来学习名词,但大多数语言都使用代词和连接词来隐含表示主语,语法学习将教会你代词和基于主语的变位的基本知识。
弄懂发生啥事了
这与语法无关。你将通过学习动词词汇来培养这个能力。
这事啥时候发生的
明白过去、现在、将来这几种时态,对于看懂故事至关重要。
别试着通过学习语法去细究这些时态。我们的目标是先打开理解的大门。
举个例子,你不必深究各种过去时态的微妙之处。关键是,遇到这些时态时,心里要有数,这是在说过去的事。
一旦你查了上面这些语法知识,建立了基础的理解框架,就可以停下日常的语法学习了。
随着你的进步,你会在沉浸过程中发现你还不理解的语法,碰到这种情况,随时可以去查一查,弄清楚是怎么回事。
1C2:SRS 最佳实践
原文:SRS Best Practices | Refold
培养习惯
使用间隔重复系统(SRS)的目标是长期记忆。【只有】坚持不懈地用,才能从中受益。最重要的最佳实践,就是每天出席,认真复习!
对待 SRS 复习,有两种截然不同的方法。
多数人觉得,每天定个固定时间复习,更容易形成稳定的习惯。早晨第一件事来个复习效果尤佳,当然,选一个你自己觉得合适的时间点也是很好的习惯锚点。
有些人则更善于在一天中找出零碎的时间来做复习。他们把复习当作手机上的小游戏。无论是在超市排队,还是等水烧开,他们都会掏出手机来做几个复习。这样他们就能把集中注意力的时间用在沉浸学习上。
不妨试试看,看看哪一种更适合你,能让你持续地完成复习。
复习
每天坚持复习至关重要,这有两个原因。
遗忘
正如我们在 0C:主动非沉浸学习一章里讲的,SRS 会推送那些你很可能快要遗忘的卡片。如果你不按时复习,将会忘记更多卡片,并且不得不花更多时间重新学习被遗忘的材料。
SRS 债
第二个原因是所谓的「SRS 债」:当天没完成的复习任务会堆到第二天。今天不复习,明天的任务就会翻倍。
这样很快就会让人感到不堪重负。SRS 债也是人们放弃使用 SRS 的头号原因,为了避免这种情况发生,务必每天完成所有复习任务。
如果你时间不够,就减少新卡的数量,专心复习。少学一天新卡片基本上没什么大碍。
新卡片
大多数 SRS 都允许你设置每天要学习多少张新卡片。具体如何在 Anki 里设置,已经在 1A:基础 Anki 配置里详细解释了。
默认情况下,Anki 会把新卡和复习卡混在一起给你,但你也可以选择在复习前或复习后学习新卡片。这一设置可以在「首选项」里的「复习」一栏里调整。试验这三种设置,找出最适合你的那一种。
别一股脑儿学太多新卡!
每天究竟得复习多少卡片,这事儿你可没法儿决定,因为 SRS 会自动安排所有你可能快要遗忘的卡片。不过,你确实可以通过调整今天学习的新卡片数量来影响未来的复习量。
一上来就贪心地学太多新卡,这可是很多人刚开始用 SRS 时最常犯的错误。这样下去,你会发现复习多到手忙脚乱,还会挤占你沉浸学习的时间,最终导致精疲力尽(即弃 SRS 而去)。
这个陷阱之所以如此普遍,主要是因为新卡片全面影响复习数量需要大约两周时间。这个时间差容易让人低估实际的复习量。
你可以通过新卡片数量乘以 7 来估算每天的复习量。比如说,你每天学 10 张新卡,那么两周后,你大概每天得复习 70 张。
在开始时,最好先从小的、简单的任务开始做起,确保在养成每天使用 SRS 的习惯时不会感到不堪重负。先从每天 5 张新卡开始,然后根据自己的感觉逐渐增加。持之以恒比数量更重要。如果你能够每天稳定地学习 10 张新卡,不到三个月就能积累超过 1000 张卡了。
记住,主动非沉浸学习不如沉浸学习重要。在 SRS 上花太多时间,会从沉浸学习中抽走你宝贵的时光。
如何为卡片评分
在给卡片打分时,别太追求完美。不用纠结于确切的含义,大致的理解就够了。
如果你觉得在实际情境中能认出并理解这个词,那就按「良好」。如果不行,就按「重来」,这样卡片会更快出现。正如在 1A:Anki 初级配置教程 中提到的,不要使用「简单」和「困难」这两个按钮,它们会扰乱你的进度。
如果你犯了个小错,但其实你是知道这个词的,那就大可评为「良好」。要是后来发现真的忘了,下次自然知道该选「重来」。
不要害怕点击「重来」。这里不是学校,目标不是得个高分。忘记一个词并不意味着失败。
Anki 的算法并不旨在让你百分之百记住所有东西;实际上,它的目标是大约 90% 的保留率。这就意味着,要是忘了某个卡片,可能是你应该更早地复习这个词,或者你还没准备好。这两种情况都很正常,在 Anki 的逻辑里,十张卡片里总得有一张你会忘记。
如果你从来没有忘记过任何含义,那可能意味着你复习得太频繁了。虽然这感觉与直觉相悖,但每次复习都有几张卡片没记住,反而会让整个复习过程更高效。
删除或暂停卡片
如果你一张卡片老是记不住,Anki 会给它打上「记忆难点」的标签,之后它就不会再出现在复习中了。
记住,主动非沉浸学习只是助推你的习得过程。你的大脑对某些词或短语「准备」得比较充分,但对其他的就不然。如果一张卡片成了记忆难点,就说明你的大脑还没准备好记住它,硬去记也是徒劳。总有一天,你会再次遇到这个词,并在准备好的时候学会它。
制卡本身就是在猜测你到底准备好了没有。偶尔猜错也是正常的。
任何卡片,无论什么原因,你都有权利删掉。不喜欢它?删了。觉得概念模糊?删了。单词怎么也记不住?删了。
你可以选择删除卡片,彻底从牌组中移除,也可以选择暂停卡片,这样它就不再出现,但仍然保留在系统里。我们推荐选择暂停,因为将来你可能会觉得准备好了,再把它加回复习队列里。
落下复习进度了怎么办?
若你有几天没复习,复习任务堆积如山,令你想到 Anki 都觉得头疼,首先要做的就是止住这一切。
损失已经造成:堆积如山的那些卡片,大多是你可能已经遗忘的词汇,咱们就叫它们「陈卡」。
同时,那些 Anki 认为你快要忘记的卡片会被自动安排复习,我们称这些为「鲜卡」。
现在,你的队列里混合着两种卡片:一方面是快要遗忘的鲜卡,另一方面则是可能已经遗忘的陈卡。
问题在于,Anki 并不会优先推送鲜卡。按照 Anki 的复习优先级,如果你没有复习完整个队列,就要花时间重新学习陈卡,而遗忘鲜卡。
简单说,如果你只忙着重新学习那些忘了的单词,反倒会让更多单词从脑子里溜走。
解决这个问题的办法是,暂时将陈卡从复习队列里移出,等当天所有鲜卡都复习完后,再逐渐将它们放回。
具体操作如下:新建一个名为「积压」的牌组,然后把所有待复习的卡片都移到这个新牌组里。
接着,每天要:
-
在你的主牌组中进行复习。
-
从积压牌组中抽取适量你能搞定的卡片,移回主牌组。
-
复习这些卡片。
这样,这些卡片就重新回到了正轨。
虽然可能要花上几周时间才能清空积压牌组,但至少在这期间,你不会漏掉那些即将忘记的新鲜单词。
1C3:词汇
直接跳入沉浸学习,观看没有字幕的目标语言节目,也不是不可能。只是这样做会比较慢,也容易气馁,但你最终还是会逐渐学会一些常用词,培养理解能力。
要让这过程不那么枯燥,你可以先主动学习在沉浸中会经常见到的词汇,这样能加速你的理解。
使用间隔重复系统(SRS)来学习目标语言中最常出现的 1500 个单词。
有研究 [1], [2] 估计,在英语中,大约 2000 个单词就覆盖了日常对话中约 94% 的内容。如果词汇量达到 5000,这个数字就会跃升到将近 99%。不同的研究对不同的数据进行分析,得出的数字各不相同,但也大同小异。
虽然这个百分比因语言而异,但记住 1500 个单词将为你打下坚实的基础。
然而,知道 1500 个单词并不能自动转化为理解,所以如果你仍然不理解,不要感到惊讶。你可能会理解对话中 90% 的单词,但要理解一段对话的完整含义,还需要沉浸其中,并将这些知识用于实践。
如何开始
运用间隔重复系统(SRS)学习常用词汇,大致有两个方法。
-
直接用别人做好的词汇牌组。
-
自己找个高频词表,动手做卡。
用别人现成的牌组是最快的开始方法,但高质量的牌组并不好找。大多数牌组都是用软件生成的,没有针对高效学习进行筛选。这些牌组常常包含一些与你要实现的目标——即快速开始沉浸学习——不太相关的词汇。还可能出现翻译不准确、音频错误或缺失的问题。
自己做卡片虽然初期需要花费更多时间,但如果你找不到精选的牌组,那么这点儿功夫是值得的。
两种方式都可以,选一个你觉得合适的就行。
请记住,1500 个单词并不是什么硬性规定。即使你只学 1000 个词,也完全没问题。别忘了:背单词是学得,而不是习得。你只需要建立一个基础词汇量,以加速你对沉浸内容的理解。你追求的不是完美,而是够用——够常见的词,记得够牢固。
理解,而不是输出
学词汇的根本目的,就是为了在沉浸学习中识别并理解这些单词。要锻炼这种识别能力,你只需要学习正面为目标语言的卡片。这类卡片常被称作「理解卡」或「认识卡」。
在传统的学习方式中,一般会让你背出目标语言的单词,或者从你的母语翻译过来。这种卡片就叫「输出卡」或「回忆卡」。这种类型的卡片可免则免。如果你碰到带有这种「生产卡」或「回忆卡」的牌组,大可直接删掉。
当你在阶段 3 需要输出目标语言时,这些词早就印在你心底了。你无需刻意去记,自然而然就能说出口。
学习小贴士
删除卡片
如果有某个词你怎么也记不住,删了它。如果你不喜欢某张卡片,删了它。
还有,如果这个词跟你的母语里的基本一样(也就是借词和同源词),也删了它。一旦你开始注意到这些词在目标语言里是怎么发音的,大脑会自然而然地从语境中学会它们。
慢慢起步
正如 1C:SRS 最佳实践中所说,如果你过于激进地使用 SRS,很容易感到不堪重负。如果你之前从未使用过 SRS,建议从每天只学习 5 张新卡片开始,直到你养成每日复习的习惯。几周后,再将这个数字提高到每天 10 张。
按照我们推荐的每天 10 张卡片的速度,学习 1500 个单词需要五个月的时间。不过,实际上可能不需要这么长时间,因为你还会通过沉浸来学习其中一些单词。如果你已经知道某个单词,那就暂停或删除这张卡片。
如果你愿意在主动非沉浸学习上投入大量精力,可以提高到每天 20 个单词。但要注意,这样两周后,你每天大概需要复习 140 张卡片。
进阶
记住,【没必要】在进入阶段 2 前就硬啃完最常用的 1500 个词汇。
进入阶段 2 后,你将建一个新牌组,开始在你的沉浸内容中做词句挖掘。你可以同时学习这两个牌组,也可以抛开入门牌组,专注于词句挖掘。怎么选,全凭你。
脚注
1: "Vocabulary coverage according to spoken discourse context", Adolphs and Schmitt, 2004
2: "How Large a Vocabulary Is Needed For Reading and Listening?", Nation, 2006
2A7:基础词句挖掘
原文:Basic Sentence Mining | Refold
词句挖掘是直接从沉浸学习中获取单词和句子,并用间隔重复软件学习它们的过程。你可以尽早开始词句挖掘,但是大多数人更喜欢在他们学习了最基本的语法结构并且记住了最常用的单词之后再开始挖掘。如果你还没完成对常用词汇的学习,不妨先暂缓词句挖掘,或者两者一起进行,全凭你自己。
词句挖掘使得学习与沉浸融为一体。当你开始在第一个领域站稳脚跟时,通过学习直接来自沉浸内容的单词和句子,你可以确保自己把学习的重点放在与自己最匹配的单词上。精心挑选自己要学习的单词和句子,会使你对它们有深刻的印象。这让你在背单词的过程中事半功倍。
词句挖掘是一个创造性、探索性的过程,每个人都有自己的方法。随着时间的推移,你会找到最适合你个人喜好和生活方式的方法。
这里有一些基本的准则帮助你开始。
选择挖掘内容
每沉浸一个小时,你都会遇到许多你可以学习的生词。但并非所有词都值得你花时间。由于你每天能制作的 SRS 卡片数量有限,因此,仔细选择挖掘的内容尤为重要。
首先要考虑的是,你是否真的需要一张卡片来学习某个内容。如果你觉得不借助 SRS 就能记住一个词,那就不用为它制作卡片。有些词汇与你的母语非常相似,听一两遍就能记住。有时,一个词由你熟悉的几个部分组成,一旦看出其中的联系,其意义就会牢牢地留在心头。有时,某些词自己就能牢牢地留在心里,不需要特别的理由。
话虽如此,在初期,如果没有 SRS,大多数词汇都很难学会。在缩小挖掘的范围时,请记住,提高你目标语言的理解能力——进而习得目标语言——最有效的途径就是挖掘那些低垂的果实:
1. 感觉熟悉的词汇优先。
在你沉浸学习中经常出现的词,投资回报率更高。如果某个词引起了你的注意,或给你一种熟悉的感觉,那就说明它是个常用词。
2. 选择看起来容易理解的词。
如果你查了某个词的定义,感觉很难理解,那就先放一放。把时间和精力用在那些触手可及的词汇上,更值得。
3. 你想要学的词优先。
如果一个词很有趣,仿佛在呼唤你,那就足够成为学习它的理由了。对一个词产生情感连接,会让记忆更为容易,降低学习的「成本」。即使这个词看似不太实用或不常用,学习它也是值得的。
挖掘句子,而非词汇
一般来说,你应该为短语和句子制作卡片,而不是为孤立的单词。这样做有三个理由。
第一个原因是,光知道一个词的意思并不等于你能完全掌握它在实际中的用法。Antimoon 用「account for」(占比)的定义非常生动地说明了这一点:[1]
If a particular thing accounts for a part or proportion of something, that part or proportion consists of that thing, or is used or produced by it.[2](翻译:如果某一事物占了某个整体的一部分或某个比例,那么这一部分或比例就是由这个事物构成的,或者是由它使用或产生出来的。)
就这个定义本身而言,它其实并不能让你真正明白「account for」到底是什么意思,或在实际中是怎么用的。但这个词典还提供了一条很好的例句,让整个用法一目了然:
Computers account for 5% of the country’s commercial electricity consumption. (翻译:计算机占全国商业用电的 5%。)
由此可见,一个恰当的例句往往是理解单词真正用法的关键。
基于句子制卡的第二个原因是,许多单词具有多重含义。比如说,「bark」这个词的意思可以天差地别(「狗吠」和「树皮」),这取决于你说的是狗还是树。
试图用一张卡片记住一个单词的所有含义,往往会导致卡片极其困难,复习起来也异常繁琐。把单词的多重含义拆开,一次只学习一个要有效得多。这正是最小信息原则的一个实例,在下一节会有更深入的解释。
与其为单个词汇,不如为一条句子制作卡片。这样做最直接的好处就是能让你专注于目标词汇的某一特定用法:简单地说,就是关注该单词在特定句子里的含义。而且,由于这些句子源于你的沉浸内容,你将学到与你最相关的特定含义。
为句子制卡的最后一个原因是,它们更容易记住。与孤立的单词相比,整个句子能提供更丰富的语境,这样你的大脑更容易将其内化。
特别是当句子来自你实际读过的书或看过的节目时,这一点更为明显。你能回忆起是哪个角色说了这句话,还能记得这句话出现在哪个场景。与这句话建立的个人联系,会让你更容易把这个目标词汇真正融入到你的语言知识中。
挑选单一目标(One Target,1T)句子
最好挖掘那些只包含一个未知元素(不论是词汇还是语法规则)的句子,这类句子通常被称作「单一目标」或「1T」句子。
有人担心,仅仅挖掘 1T 句子会效率低下,反而浪费时间。其实情况恰恰相反。大量有针对性、干脆利落的抽认卡会让你更快、更轻松地达成学习目标,这就是所谓的最小信息原则。
假如你有三个词汇想学,那么最好是制作三张不同的丑认卡,每张卡只针对一个目标词汇。
如果你把三个词塞进一张卡片里,然后你忘记了其中一个词,你就得把这张卡片标记为「失败」,哪怕你记住了另外两个词。这样一来,你就得白白重复那两个其实已经记住的词。
同时要回想三个生词,也会使卡片更难理解,使你完全内化每个词的可能性降低。
这也会增加记忆干扰的风险:这三个词本来毫无关联,硬是一起学,很可能会让你在头脑中错误地把它们联系起来。
卡片上应放什么内容
在这个阶段,尽量让你的卡片简单明了:正面写句子。背面写目标词汇的定义,以及(可加可不加)该句子出处的截图。
切记:你的目的不是要自己去造句;这些卡片的目标是提高你的理解能力。因此,让卡片保持简单,你给自己的评分也应依据你对正面句子的理解程度。
何时进行挖掘
词句挖掘主要有两种方法:自动和手动。
自动挖掘是利用软件自动从你的沉浸材料中提取 1T 句子,并制成卡片。这是一种高级技巧,需要一些折腾点技术才能运作起来。所以,我们建议你稍后再尝试这一方法。
手动词句挖掘则是从你的沉浸内容中手工挑选要学习的句子,并自己制作卡片。你可以在精细沉浸,比如看电视剧时,进行手动词句挖掘,也可以在无阻沉浸中进行。两者都试试看,你可能会发现两者都不错,或者其中一个更适合你。
手动词句挖掘还可以分为两种方式:同步和异步。
在同步挖掘中,当你在沉浸学习中遇到想学的句子时,就暂停沉浸,当场制作一张卡片。这种方法的好处是,你的主动沉浸和词句挖掘可以融为一体,成为一个统一的活动。这可以帮助你精简整个语言学习流程。
有些人发现同步挖掘会打断他们的沉浸学习。他们更喜欢异步挖掘,即将制卡与沉浸分开。在异步挖掘中,你只需在沉浸学习时标记想学的句子和单词。你可以把句子复制粘贴到一个文本文件里,或者记下句子的时间戳。在沉浸学习后,你可以批量地为收集到的句子制作卡片。
最佳实践
我们推荐的 SRS 从阶段 1 开始就不会更改,所以尽管重读 1C:SRS 最佳实践。
脚注
-
1: http://www.antimoon.com/how/examplesent.htm
2A2:可理解性的影响因素
原文:Comprehensibility Factors | Refold
在整个阶段 2 ,你将沉浸于各种各样的内容,难易程度也各不相同。选择合适的沉浸学习材料时,找到适当难度的内容至关重要。你需要尽可能多地理解,同时又能稍微拓宽自己的能力范围。
与你水平相匹配的内容,将最大化你的理解,使学习更加有趣,同时也让你更快地习得这门语言。过于超出你当前能力的内容,虽然依然有助于你提升语言技能,但由于你理解的内容太少,因此习得的速度会相对较慢。
这篇文章里,我们会告诉你哪些因素会影响媒体内容的可理解性。在寻找材料时,请牢记这些因素,这将有助于你找到适合你水平的内容。
语境的可理解性
你有没有试过把电视声音关了,但仍然能理解剧情?我们把这称为语境可理解性。可理解性不仅仅与用词的难易有关,它还与视觉信息的丰富度,剧情的可预见性,以及你对这类故事的熟悉程度有关。
视觉语境
观看电视或阅读漫画时,视觉信息会传达故事。这种视觉语境有助于你理解使用的语言。就算你碰到个不认识的词,根据看到的角色动作,也能猜个八九不离十。
在没有视觉语境的情况下听和读会增加一层复杂性,因为全部的语境需要用文字来描述。俗话说,一图胜千言。也就是说,没有图片的话,你需要多学习一千个词才能理解语境。
叙事的可预测性
跟着剧本走的内容,比如电视剧或小说,能让你逐渐熟悉里面的角色和故事。这种熟悉性赋予了语言相应的语境。如果你了解叙事的常见套路和角色的个性,通常可以预测出角色在特定情境中会说什么。故事越简单,你预测和推断的准确度就越高。所以,尽量避开像《西部世界》或《巫师》这样剧情复杂的作品。
对初学者而言,没有剧本的内容要比有剧本的难懂得多。虽然这些内容可能用的都是简单、普通、日常的词汇,但缺乏连贯的故事线,因此更难理解。像街头采访、即兴表演、日常对话等,对初学者来说都很困难,因为它们不遵循任何让内容容易预测的叙事套路或模式。
领域熟悉度
就像之前 2A:领域里提到的,把精力集中在语言的某个小范围内,你就能因为熟悉了那个领域里常用词汇和语法而迅速提高理解能力。
叙事性的内容往往停留在一个狭窄的领域内,但诸如新闻、脱口秀和各种访谈节目等媒体类型则不然,这些媒体跳来跳去,今天这个话题,明天又是那个,让你不得不面对多个领域的挑战。对初学者来说,这种跨领域的媒体是一大挑战。
另一个领域相关的问题是方言。有些语言的方言之间差别大得就像两种语言一样。仅仅口音的不同就足以让语言难以理解,即使对于母语者也是如此。再加上俚语、词汇和语法的不同,两种方言的差异可以大到被认为是不同的语言。因此,我们建议在尝试涉猎其他方言之前,先精通一种。
语言复杂性
不同内容所使用的语言的复杂性各不相同。受众层次和体裁是评估一篇内容语言复杂性的两个主要因素。此外,配音内容往往更为简单。
在以下几节中,我们以电视节目为例来解释这些概念,但它们同样适用于小说、播客和其他媒体类型。
受众
不同的受众对语言复杂性有不同程度的期望。在美国,大多数视频内容都针对不同年龄段的观众进行了分级。电影采用 MPAA 分级制度,而电视则使用「电视家长指南」制度。尽管这些分级制度本意是为了评估一部作品的少儿不宜程度,但你也可以将它们作为语言复杂性的参考标准。
受众可以按照五个年龄段来划分:
婴幼儿(0-5 岁):适合婴幼儿看的节目(如《朵拉探险记》、《蓝色斑点狗》)用夸张的视觉元素和简单到极点的语言传达信息。我们不推荐使用这类内容进行学习。因为语言密度(每分钟的词数)很低,而且故事对成年人来说通常很无聊。参考的分级标准:MPAA-G, TV-Y
儿童(5-10 岁):儿童节目(如《口袋妖怪》、《超能战警》)依靠简单的故事情节,但希望观众能有更高的词汇量。如果你能对简单且重复的故事情节保持兴趣,这些节目对初学者来说是一个不错的开始。参考的分级标准:MPAA-PG, TV-Y7/G/PG
青少年(10-15 岁):针对青少年的节目(如《最后的气宗》、《嗨,阿诺德》)是大多数学习者的完美起点。这些故事足够复杂,可以让成年人的兴趣持续多季,而语言的密集和复杂程度足以让中级学习者的能力得到提升。参考的分级标准:MPAA-PG-13, TV-14
成人:面向成年人的节目(《老友记》、《星际迷航》)在可理解性上各不相同。这些节目可能因为语言复杂性而变得困难,但更多的时候是由于主题和叙事缺乏可预测性。我们将在下面关于类型的章节中更深入地讨论这些问题。参考的分级标准:MPAA-R, TV-MA
技术类:如大学课程、会议演讲和教科书等专业媒体的可理解性相对较低,但通常不是因为语言复杂性。这类媒体的可理解性取决于你之前对该主题的了解,而非你的语言能力。即使是母语者,如果他们没有学过基础化学,也无法理解高级化学课程。
领域难度
正如 2A:领域中指出的,不同领域的复杂程度各异。像《老友记》这种日常生活剧通常用的词汇,你在其他大部分媒体里都会遇到。相对而言,政治剧像《白宫风云》则充满了与美国政治流程相关的高难度词汇。
我们建议你从「日常生活」这个领域开始入手。所谓「日常生活」,就是剧里的角色和情节与你每天可能会碰到的场景比较贴近。这些剧通常的冲突焦点是约会、婚姻、朋友之间的矛盾、财务问题,或是其他你在日常生活中可能会遇到的情况。对初学者来说,这类节目的语言最易于理解。
当然,不是每个人都喜欢「日常生活」这种类型。一如既往,跟随你的兴趣,这样才能保持学习的热情和乐趣。但要注意,像奇幻、政治、科幻和犯罪这些类型因为覆盖的领域更广,因此比「日常生活」更难以掌握。而且,这些领域会教给你一些在特定场合之外基本用不到的词汇。
配音版(译制片)
当外国电视剧或电影被配音后,其语言一般都会被简化。在语言间的翻译过程中,母语中的概念并不能一一对应地翻译成目标语言。因此,配音版本为了适应目标语言的语言范式,通常会省去一些双关语、笑话或成语。通过简化语言,配音版变得更容易理解。当你进行沉浸学习时,这一点可能会很有用。
但别忘了,这些配音版并不是目标语言的本土产物。你在这里感受不到本土文化里特有的幽默或者习惯用语。如果你【只】看配音内容,就永远学不到母语者的一些特殊习惯,他们的幽默感,或他们文化的微妙之处。
最后一点,但也很关键,当你自我评估语言理解能力的时候,千万别以配音版为准。那样会让你觉得自己的水平比实际上要高。
最大化你的理解
在阶段 2A,你的理解能力起初是很弱的。为了克服难度陡坡,启动语言习得过程,找到尽可能易于理解的沉浸材料至关重要。
怎么做呢?首先,选择针对儿童或青少年的内容,如果是配音版就更好了。你可以观看连续剧,这既增加了视觉语境,也让故事情节变得容易预测。同时,确保你看的内容用的都是同一种方言。
你并不会受限于某个媒体内容固有的可理解性上。在下一篇文章中,我们会详细解释如何操作这些可理解性因素,让任何内容都变得更容易理解。
2A3:可理解性的媒体类型索引
原文:Comprehensibility Index | Refold
你沉浸的每种媒体,不外乎三种输入信道的组合:读、听和看。把这些信道结合起来,你能更好地理解目标媒体内容,这就是「混合输入」。
带有目标语言字幕的电视节目是混合输入的最高形式:视觉语境提供了一个粗略的理解基础,让你大致抓住故事走向。音频则提供了更细致的信息。而字幕则消除了音频中的模糊性。三管齐下,可以最大限度地提高你大脑的理解能力,同时也让你在读和听方面得到锻炼。
其他类型的混合输入也有其特定的能力提升作用。
- 漫画:结合视觉语境和阅读。
有助于提升阅读能力。
- 无字幕电视剧:结合视觉语境和音频。
有助于提升听力。
- 带文字稿的音频:结合音频和阅读。
建立听读之间的反馈循环。
像读小说或听播客这种单信道的输入,我们称之为「纯粹」输入,即纯阅读和纯听力。
在这篇文章中,我们将解释不同类型的混合和纯媒体类型在可理解性方面的是如何比较的。
按媒体类型划分的可理解性等级
下面,我们提供了一个各种媒体类型的分级排名系统。我们建议将这篇文章收藏起来,因为这个排名体系将作为你在整个阶段 2B 的沉浸学习参考。
我们根据媒体的难易程度对 10 种媒体类型进行排名,并解释了哪些因素会增加或减少它们的可理解性。请注意,这里并没有考虑到所有因素,只是考虑了那些看起来最相关的因素。
| 等级 | 媒体类型 | 优点 | 难点 |
| :---: | :----------------------------------------------------------: | :----------------------------------------------------------: | :----------------------------------------------------------: |
| 1 | 带字幕的电视剧 | - 三通道输入,可理解性最高 | |
| 2 | 不带字幕的电视剧 | - 视觉背景和音频对话相互增强的双信道输入。 | - 除非你大量练习听力,否则会听不懂音频。- 在无阻沉浸中,音频速度可能太快,你的大脑无法跟上。 |
| 2 | 漫画 | - 双信道输入 - 视觉语境让对话更容易理解 - 可以慢慢读 - 方便查词 | - 在知道目标语言大概如何发音之前,阅读速度会很慢 |
| 3 | 纯阅读:简化版(如儿童小说或分级读物) | - 针对儿童读者的小说,语言复杂度较低。 - 故事情节容易预测。 - 可以按照自己的节奏慢慢阅读,多查字典 | - 由于描述性词汇的存在,相比电视和漫画对话,语言复杂度更高。 |
| 3 | 纯阅读:单一领域(博客文章) | - 简短 - 容易上手,快速了解领域 - 比小说的文学词汇少 - 可以随心所欲地查找生词,按自己节奏阅读 | - 大部分博客默认你对该领域有基础了解 - 叙述的可预测性低 |
| 4 | 纯阅读:文学小说 | - 叙述的可预测性高 - 可以随心所欲地查找生词,按自己节奏阅读 | - 领域扩张巨大,每本小说都应当作为一个独立的领域来对待。 |
| 4 | 纯听力:叙事性播客/有声剧 | - 结构明了 - 叙述的可预测性高 | - 中等程度的音频模糊程度 |
| 4 | 纯听力:单一话题的脱口秀 | - 易于熟悉该领域 - 只有对话;没有复杂的词汇和句型 | - 结构松散:叙述的可预测性低 - 音频中的模糊程度很高 - 无法通过文字稿核对听力 |
| 5 | 纯听力:有声书 | | - 具有文学小说的所有复杂性 |
| 5 | 纯听力:多话题的脱口秀 | 只有对话,几乎没有文学词汇 | - 结构松散:可预测性低 - 视觉语境无助于理解 - 需要熟悉多个领域 - 音频的模糊程度高 |
增进理解的妙招
记住,当你理解句子的意思时,习得就会发生。任何类型的媒体都可以通过一些方法来人为地增进你的理解。
在提高理解能力的初级阶段,使用这些妙招是完全没问题的。然而,我们的最终目标是能够不借助任何外力,自主理解目标语言。随着你的水平提高,逐渐减少这些辅助手段的使用。
查字典
这一点显而易见,但如果你在阅读或听力过程中查找不熟悉的单词,将大大提高你对该媒体内容的理解。
熟悉故事内容
你对所沉浸的内容越熟悉,理解起来就越容易。提高熟悉度的方法有很多:
-
你可以选择那些你用母语已经看过或听过的内容。
-
在接触新内容之前,你可以先在维基百科上阅读故事摘要。
-
对于有改编版本的书籍,你可以先看看改编的电影或电视剧,再去读书。
操纵时间
当你利用录制的媒体资料时,你可以控制播放速度,以便给自己更多消化和理解的空间。
-
暂停电视节目来阅读字幕,这样你就有充足的时间去处理信息。
-
多次重复听某一段音频,能让你更准确地听出声音的细节。
你在日常的被动听力练习中应该已经在这么做了,但你也可以通过倒带内容来重新听一遍。
- 把音频速度放慢也是个不错的办法,这样你就有更多时间去理解它。
注意:我们不推荐你过于依赖这个方法。因为放慢速度可能会产生一些不自然的声音效果,这可能会影响你大脑对实际语言的解析。
增加输入信道
如上所述,一个媒体的输入信道越多,其可理解性就越高。你可以通过增加媒体的输入信道来巧妙地提高其可理解性。
例如,你在听播客的同时看一下它的文字稿,就能大大提高你的理解。如果你在看电视节目,开启目标语言的字幕也能起到相同的效果。
听力本来就比阅读更难,因为音频中有很多模糊之处。你的大脑需要先把声音解析成单词,才能理解语言的含义。当你加入一份文字稿,这些模糊之处就被消除了。无论是哪种听力练习,搭配文字稿都能让难度降低一个等级。
反之,给阅读加上音频并不能显著减轻其难度。带音频的阅读和纯阅读相比,并没有轻松多少。实际上,有人甚至觉得这样更容易分心。
往前走,回头看。
阶段 2 指南的其余部分将多次提到 2A:可理解性的影响因素和这篇关于可理解性的媒体类型索引的文章。这两篇文章是你如何精通首个领域的基础框架。为了便于日后查阅,务必将这两篇文章加入书签。
2A1:领域
即便同属于一个文化,在不同的场景下,人们也会使用不同风格的语言。这种不同不仅是词汇上的,而包括了语法结构、口音、语调、发音清晰度等方面。
即使你熟练掌握了一个领域的语言,你也不会无师自通其他领域的语言。比如,理解使用目标外语的新闻播报,跟理解日常对话是完全不同的技能。你需要有意识地针对你希望掌握的领域语言而努力。
领域范围
语言的总词汇量是很大的。根据牛津词典,英语词汇去重之后有 171476 个。幸运的是,对于理解特定的沉浸学习材料,你不需要掌握 100% 的英语词汇。比如说《哈利波特》第一部的词汇去重后只有 6185 个[1],而精灵宝可梦的前十集只有 1700 个词汇。
达到目标语言较高理解水平的最快方法,是缩小沉浸内容的选择范围,只取目标语言的一小部分领域,将其掌握熟练,之后再扩大范围。
大部分领域之间是互有重叠的。因此每次你学习新领域,你并不是从零开始。如果你能轻松理解日常对话,那么新闻播报理解起来也会更容易,因为两个领域之间有共同的词汇、语法等等。
如果目标领域和你掌握的所有领域之间重叠越多,那么目标领域会更容易掌握。随着你掌握的领域增多,陌生的领域也会变得容易,因为你希望学习的和你已经知道的重叠也会增加。
领域要小
当你处于阶段 2 时,你每看一集电视节目,看一部电影,读一本书,你试图掌握的领域都被扩大了。领域扩张的程度需要注意,避免在不同领域之间反复横跳。你越聚焦于小领域,你的进步就越快。
脚注
1: http://www.tylervigen.com/literature/words
2A6:沉浸学习指南
阶段 2 的目标,就是在一个有限的领域内,将你的理解水平从等级 1 提升到等级 5。孩子们通常只通过听来达成这个目标,但我们成年人可以通过同时运用阅读和听力来加快这个过程。
阅读和听力是相辅相成的基础技能。阅读能够丰富你的词汇量,并帮助你在听力练习中更好地分辨单词。听力则通过教你单词的发音来提高阅读能力。这样一来,你在阅读时就不再需要逐字逐句地拼读,从而提高阅读速度,同时也能改善你最终开始说话时的口音。
到目前为止,你可能一直在听你的目标语言,但还没开始阅读。这个阶段的首要任务,就是要提高你的阅读能力,让它赶上你的听力水平,这样两者就能形成一个良性的反馈循环。
选什么读物
理想的内容是有趣、可理解、语言密集的。
有趣
我们之前就说过,选个自己觉得有趣的材料沉浸进去,这样你才愿意多花时间,不会觉得是在做苦差事。
可理解
利用可理解性因素,我们可以从多个维度优化理解。具体来说,就是找一部有配套字幕、面向年轻人的电视剧。
电视剧通常只有对话,而且语法简单。这确保了词汇和语法的范围相对较小,有助于你迅速提高理解能力。
电视剧相较于书籍,提供了视觉语境;与漫画相比,它们有音频。而且,跟电影相比,你更容易猜到剧情,因为你能逐渐熟悉角色和故事情节。
对初学者来说,选电视剧最重要的就是字幕和音频得逐字对应。等你能轻松理解字幕和音频之间的差异后,使用不完全匹配的字幕也无妨。
对于本土节目,找到匹配的字幕通常不是问题。只要有字幕,基本上都能对上号。
然而,对于配音节目,找到匹配的字幕就比较困难了。一般来说,这些字幕和配音不一样,因为字幕是直译,而配音可能会意译。如果你在找配音节目,看看有没有标「CC」(即闭路字幕)的,这种通常和音频是一致的。要是实在找不到,那就在无阻沉浸中看吧。
理想情况下,你应该从面相 7-15 岁观众的电视剧开始,因为这些比面向成年人的节目更容易理解。然而,这种内容如果要找到匹配的字幕,可能会有点难。如果找不到更简单的内容,那就直接看成人节目吧,虽然一开始难度大些,但总能熬过去。
语言密集
语言密度这个术语用来描述你在一定时间内能接触到多少不同的词汇。
比如,Dr. Seuss 的 Green Eggs and Ham 只用了 50 个单词。虽然你可能很快就能读完,但如果用同样的时间去读 Roald Dahl 的 Matilda 前几页,你会接触到更多的单词。
面向幼儿的书籍和节目通常语言密度很低。一些面向成年人的节目也可能语言密度不高。例如,某些动作片有很长、很精致的打斗和追车场面,但对话却很少。
理想的语言密度是「足够」。一般来说,内容的密度越高,效率越高。但这也要取决于你个人的兴趣,找个平衡点最重要。
三通道阅读
在这个阶段,你主要的精细沉浸方式就是阅读电视剧。
虽然阅读电视剧的方法很直接,但也不是那么容易。基本思路是,在每一句对话之前或之后暂停,阅读这句话,然后继续播放。
如果你用的是 Netflix,那么有一个叫做 Language Learning with Netflix 的扩展程序,里面自带了一个专门为这个练习设计的自动暂停功能。
如果你用的是其他流媒体平台,那就得手动按暂停了。
如果你是下载到电脑上用本地播放器看,那你可以用 MPV 播放器和这个自动暂停的脚本。
重点关注什么
对于你要读的每一句话,目标都是试图去理解它。把这当成一场解密游戏,你在破译句子的意义。遇到生词,就查阅双语词典,琢磨整个句子的意思。
刚开始时,大多数谜题你可能都解不出来。当一个句子里有三个或以上的生词时,即便查了词典,你也可能无法弄懂它的意思。没关系!你的大脑还没准备好去理解这个句子。对于这些句子,如果你有动力,查所有生词也无妨,但直接跳过它们,继续下一句也完全可以。
这个阅读过程也是一个挑选你在间隔重复系统(SRS)里要复习的材料的好机会。这个过程叫做「词句挖掘」,具体怎么操作,下一篇文章会详细解释。
无阻沉浸
除了精细阅读沉浸外,也别忘了进行无阻沉浸。两者搭配使用,能让你充分利用从阅读中获得的知识,转化为习得的语言。
选材时,确保两边的内容都在同一领域内。这样,你的精细阅读就能更好地帮助你理解无阻沉浸中的内容。
至于在无阻沉浸中是否使用字幕,在这个阶段这完全看个人。字幕能消除听力上的模糊性,提高理解,但有些人会觉得字幕太过分散注意力,无法让他们关闭分析思维来全身心地享受内容。你可以试试两种方式,看哪种更适合你。
在无阻沉浸中,虽然不建议你频繁地查字典(这会打断无阻沉浸),但偶尔查查也无妨。
利用无阻沉浸的时间,去探索新的节目,看看哪些你更喜欢。如果几集下来觉得不喜欢,就别再看了。
只要你想,完全可以用已经无阻沉浸过的节目来精细沉浸。第一遍观看时,你肯定会错过很多细节。重新精细沉浸在一个你之前无阻沉浸过的节目里,会更有趣,因为这次你可以解答之前的所有疑问。
投入多少时间
对于语言学习来说,这个等式很简单:沉浸学习的时间越多,进步就越快。
从此刻开始,你应该寻找生活中的各种机会,用目标语言的沉浸内容来替代你的母语。比如说,如果你喜欢周末刷剧,那就把这段时间变成沉浸学习的好时机。
平衡精细沉浸与无阻沉浸
刚开始阅读的时候,你可能会觉得有点儿吃力。尽量在精力最旺盛、注意力最集中的时候进行精细沉浸。你应该争取每天做到 30 分钟,如果觉得有困难,就从每天 10 分钟开始,慢慢提升到 30 分钟。剩下的主动沉浸时间,就用来进行无阻沉浸。
最低要求
对于差异巨大的语言(例如,英语→阿拉伯语),我们建议每天专注沉浸至少两小时:精细沉浸半小时,无阻沉浸一个半小时。
对于较为接近的语言(例如,英语→意大利语),我们建议每天至少专注沉浸一个小时:精细沉浸和无阻沉浸各半小时。
以上所说的时间,并不包括被动收听或间隔重复系统(SRS)的学习时间。
请记住,这些都是最低要求。你主动沉浸越多,你进步就越快。因此,我们鼓励你在不让学习变成负担的情况下,尽量多地将其融入到日常生活中。
当然,乐趣永远是首要考虑的——与其拼命到头,最后因为累垮而放弃,不如每天适量地进行,这样更高效。要知道,如果你半途而废,那么所谓的效率也就无从谈起。
被动收听
一般而言,听力理解提升的速度会比阅读理解慢一些。为了让你的听力水平不落后,在做不费脑子的事情同时,继续听那些你之前看过的节目。
被动收听你之前精细沉浸过的节目会更有帮助。但如果这样的内容不够多,也可以用你无阻沉浸过的节目来补充。
进阶
当你在看一集新的电视剧时,能达到等级 3 的理解水平,那就说明你准备好进入阶段 2B 了。这个新剧集可以从你一直在追的系列中挑选。
为了评估你的理解水平,你需要逐句地看这一集,阅读字幕,但不要去查词。你应该能:
- 认出一半左右的词汇。
这不代表你真的理解这些词,只要你觉得这些词似曾相识。
-
偶尔能完全理解一个句子。
-
能大致跟上故事情节,尽管具体细节依然不甚理解。
2A4:理解等级
原文:Levels of Comprehension | Refold
这个「理解等级」模型为评估外语理解能力提供了一个简单明了的系统。我们建立这个模型是为了给语言学习过程提供清晰、具体的指导,同时也为学习者在思考和讨论他们的进展提供了一个坚实的框架。
模型简介
该模型将理解的范围分为六个等级,从初学者到轻松掌握。这个模型对听力和阅读都同样适用。
这个模型并不是描述你对整个语言的理解,而是聚焦于你在接触某个特定内容时的理解程度。
使用这个模型时,你应评估在没有查阅字典或阅读翻译的情况下,你能理解到什么程度。
大部分沉浸学习者用百分比来衡量自己的理解水平。我们故意没用这种方式,因为很难明确说「理解了多少百分比」到底是什么意思。30% 的理解是指懂了 30% 的词汇,还是 30% 的大致含义,还是像个母语者那样理解了 30% 的微妙之处?每个人都有不同的解释。取而代之的是,我们的模型是围绕你理解的含义量来构建的。
理解不是静态的
通常,理解水平和具体领域有关。比如说,你看侦探小说可能理解得有模有样,大约是 5 级,但看新闻可能就是 3 级。而且,就算在同一个领域,你的理解水平也可能因为具体的内容而起伏不定。
你的理解水平每天,甚至每小时都有很大的波动,这很正常。甚至在同一个电视节目的不同集里也可能不一样。影响理解的因素有很多,包括你的心情、精力,以及你对所接触内容的投入程度。
有时候,你可能会觉得自己的理解水平突然下滑了。这其实是假象。随着你理解水平的提高,你更容易察觉到自己还有哪些不懂。这种对自己无知更深刻的认识,会让你觉得好像理解水平下降了。其实这是好事,不是坏事!
具体模型
等级 0:啥都不会
你刚开始沉浸学习,这门语言对你来说完全是天书。
等级 1:一星半点
大部分内容还是天书,但总算觉得有几个字或音似曾相识。你能偶尔认出个别字或词。
但整体来说,你还是摸不着头脑。
等级 2:零零碎碎
在大多数句子里,你能认出一两个词,偶尔甚至能理解一个完整的句子。
你对正在谈论的内容有一种极其模糊的感觉。
等级 3:懂得要旨
你能认出大半的词汇,而且时不时能完全理解整个句子。
你能跟上大部分的主要思想,但很多小细节还是不甚了了。
等级 4:明了情节
你能跟上大多数表达的思想,但偶尔会遗漏一些细节。
当你没有看懂所有单词时,你极度依赖语境推断来确定在谈论什么。当你无法理解某个部分时,通常也搞不清楚为什么你无法理解。
等级 5:轻松晓畅
你几乎能理解一切,但有时会错过一些微妙之处。你能轻易地跟上所有的对话,但有时可能会忽略演讲者或作者的一些匠心。
当你不理解的时候,通常能找出问题所在,并通过查阅资料来弄清楚。
在这个等级,你理解内容还是需要付出一番努力。
等级 6:浑如天成
你能毫不费力地理解几乎所有内容,几乎不会漏掉任何细节。能够完全领会到最微妙的意涵。
也就是说,你理解的程度和母语者在接触他们熟悉的内容时几乎一样。
案例:哈利波特
以下是《哈利·波特与魔法石》的第一段:
Mr. and Mrs. Dursley, of number four, Privet Drive, were proud to say that they were perfectly normal, thank you very much. They were the last people you’d expect to be involved in anything strange or mysterious, because they just didn’t hold with such nonsense.
下面,我们将演示一下,如果你是一名英语学习者,尝试阅读《哈利·波特》,每个理解等级是什么感觉。
生词已被替换为胡言乱语(gibberish)。其他单词和短语也用相似的英文单词进行了替换,以表示学习者知道这个单词,但在特定情境下无法理解其用法。我们用「*」标记了这些词。
等级 1:一星半点
Pe and Per Dursley, of camer embe, Privet Unfax, were preth to say that quiga were counges kepter, *gratitude very slamy. Quiga were the pilso olical themic novatial to be vitimese in theoloney unittlem or writuence, because quiga atter inson voler rotes evere disgushese.
你能认出一些单独的单词,比如「and」、「to」、「were」和「thank you」,但你对整个段落的意思一无所知。
等级 2:零零碎碎
Pe and Per Dursley, of camer four, Privet Unfax, were preth to say that they were counges kepter, *gratitude very slamy. They were the pilso people themic novatial to be vitimese in theoloney unittlem or writuence, because they just didn’t voler with such disgushese.
你大概能理解一半的单词。这让你大致能推测出,这个段落似乎是在谈论一群人。
等级 3:懂得要旨
Mr. and Mrs. Dursley, of letter four, Privet Move, were preth to say that they were counges normal, *I show you gratitude. They were the *final people you’d expect to be vitimese in anything strange or writuence, because they just didn’t *carry with such disgushese.
你明白这个段落是在谈论两个名叫「Mr. and Mrs. Dursley」的人。你相当确定这个段落的重点是描述他们是「normal」的。
你认识大多数单词,但也有几个你从未见过。你不明白「number four, Privet Drive」是什么意思,因为你认为「drive」是「开车」的意思。你知道「thank you very much」的意思,但你把它解释为「我向你表示感激」,所以你不明白为什么会在这种语境中用到它。你知道「last」意味着「最后的」,但你无法理解这个特定用法。「hold」和「carry」也是如此。尽管如此,你还是能从上下文中推断出,这句话很可能是在说 Dursleys 家一点也不奇怪。
等级 4:明了情节
Mr. and Mrs. Dursley, of number four, Privet Drive, were proud to say that they were perfectly normal, *I show you gratitude. They were the last people you’d expect to be involved in anything strange or writuence, because they just didn’t *carry with such nonsense.
你只有一个单词不认识。你明白这个段落是在谈论两个名叫「Mr. and Mrs. Dursley」的人,他们非常重视自己是「normal」的,甚至可能不喜欢那些「not normal」的人。
你仍然对第一句末尾的「thank you very much」感到困惑。你对第二句中「hold」的特定用法不太熟悉,但你能从上下文中推断,它可能意味着「他们不会容忍这种胡说八道」。
等级 5:轻松晓畅
Mr. and Mrs. Dursley, of number four, Privet Drive, were proud to say that they were perfectly normal, thank you very much. They were the last people you’d expect to be involved in anything strange or mysterious, because they just didn’t hold with such nonsense.
你没有生词,而且完全明白段落的核心意义。
到这一步,你只是错过了一些细微的差别。你大致明白「thank you very much」在这个语境中的意义,但你没有完全理解这个语气表达了 Dursleys 夫妇是多么的自豪和固执。你明白「you'd」意味着「you would」,但你无法察觉这种缩写词的使用如何微妙地改变了句子的感觉。你也没有注意到最后一句中「just」用于强调的微妙方式。
你需要思考这些精妙之处和细微差别,但对于母语者来说,他们会自动且本能地察觉到这些。
等级 6:浑如天成
Mr. and Mrs. Dursley, of number four, Privet Drive, were proud to say that they were perfectly normal, thank you very much. They were the last people you’d expect to be involved in anything strange or mysterious, because they just didn’t hold with such nonsense.
你毫不费力地理解了这段话,并自动地捕捉到了所有的细微差别和精妙之处。你的理解能力实际上已经达到了母语水平。
2A5:主动沉浸的类型
原文:Types of Active Immersion | Refold
在阶段 2,你目标是尽快在你首个领域内达到等级 5 的理解水平。为了达成这个目标,你有几样法宝:主动沉浸、被动收听和主动非沉浸学习。
正如之前提到的,主动沉浸就是全身心地投入到你正在接触的内容中。主动沉浸是语言习得中最重要的活动。
许多学习者都有这样的疑问:在主动沉浸的过程中,我应该多久查一次字典?
这个问题有两种极端情况。一方面,你可以查阅每一个生词,力求百分百地理解内容。另一方面,你也可以什么都不查,任由语言自然地冲刷你的大脑。
我们建议,与其试图在这两者之间找一个平衡点,不如把它们当作两个独立的练习来做。
任何带有阅读内容的媒体都可以用于精细沉浸或无阻沉浸。例如:
-
三通道:看电视时开启目标语言的字幕
-
双通道:阅读漫画书
-
双通道:边听播客边看文字稿
-
纯阅读:看小说或博客
精细沉浸
传统的语言学习方式鼓励学生查阅一切,力求做到 100% 理解,这就是精细沉浸。像 LingQ、Language Learning with Netflix,还有 Lingopie 这样的工具,都是基于这个思路设计的,让你能方便地查词,以便尽量多地理解。
精细沉浸是从真实世界的内容中直接学习词汇和语法的强有力手段。你在沉浸的过程中,会尝试用查字典的方式,琢磨每个句子的意思。在这个琢磨过程中,你会用你的分析思维,拆解这门语言,努力去理解它。精细沉浸会积累一系列你的大脑稍后能够习得的显性知识。
一开始,你可能并不总是能弄清楚一个句子,这完全没问题!如果句子太难,或者有太多生词,那就跳过去,继续前进。最好把注意力放在那些低垂的果实上。
无阻沉浸
精细沉浸对于学习词汇和语法固然有益,但对于语言习得来说,效果一般。每次打断沉浸状态去查词,你的潜意识就失去了内化语言、建立语感的机会。
另一种方法是无阻沉浸,让语言自然地冲刷你。你依然全神贯注,但不应频繁查词。偶尔查一下没关系,但要避免频繁中断你的沉浸状态。
无阻沉浸就是要你接受并习惯语言的模糊感。比如,看电视剧时,不必强求要懂每一句话。不要试图查找每一句不懂的台词。
无阻沉浸并不意味着要你快速前进。只要不打破沉浸的无阻感,就以你觉得舒服的速度前进。如果你在读漫画或小说,那就慢慢来,但对于那些一头雾水的句子,不必纠结,接受它们暂时不在你的理解范围内,然后继续前进。
无阻沉浸能培养出自动性:即不假思索地立即理解单词和结构。自动性依赖于潜意识。要培养自动性,你需要关闭你的分析思维,以便你的潜意识能充分接触到输入的语言。
大部分的语言习得,其实都是在无阻沉浸中完成的。你通过精细沉浸和主动非沉浸学习所积累的显性知识,会帮助你的潜意识更好地理解语言,并把你听到的词汇和你心中的抽象思维联系起来。
初学阶段,精细沉浸和无阻沉浸是两种截然不同的活动。但随着你对语言的掌握逐渐加深,你在精细沉浸中查词的次数会越来越少,感觉上它会越来越像无阻沉浸,最终两者会融为一体。
鱼与熊掌兼得
在阶段 2 的后半段,我们建议你同时沉浸于两种内容。一个是专为精细沉浸准备的,另一个则完全用于无阻沉浸。
选两个同一领域的内容很关键。这样做是为了让这两种内容之间有尽可能多的语言交集,这样通过精细沉浸获得的显性知识,能在无阻沉浸中习得。
比如说,电视剧《Friends(老友记)》和《How I Met Your Mother(老爸老妈的浪漫史)》就是一对不错的搭配。两者都是以日常生活为背景的情景喜剧,都发生在纽约,都属于浪漫喜剧。这两者之间有很多相似之处。通过《老友记》进行精细沉浸,你能学到很多在《老爸老妈的浪漫史》进行无阻沉浸时也会用到的词汇。
精细沉浸要比无阻沉浸花费更多时间,所以你会比较早地看完其中一个系列。当你寻找新的无阻沉浸内容时,记得要限定范围,选一些与你之前看过的节目相似的内容。
2B2:高级词句挖掘
原文:Advanced Sentence Mining | Refold
简言之,用于语言学习的 SRS 卡片大致分为两种:理解卡和输出卡。
理解卡会给你展示一小段语言,你的任务就是去理解它。这可能是一个单词,一个词组,或者一整句话。卡片背面则会提供必要的信息,以便你核实自己是否理解准确。
输出卡则要求你凭记忆输出某一小段语言。举例来说,卡片的正面可能会有一张冰箱的图片作为提示,让你凭记忆输出「冰箱」这一目标语言的词汇。
在 Refold 方法中,SRS 的作用是帮助你更多地理解你的沉浸内容,而不是帮助你输出语言。请记住,说和写目标语言的能力来自于习得,而习得来自于对你的沉浸内容的理解。
因此,当你进行词句挖掘时,你制作的所有卡片都应是理解卡,而非输出卡。
不同的卡片格式
卡片格式的区别在于你在卡片的正面写了什么。这部分尤为重要,因为你就是靠这个来测试自我。卡片的背面相对不那么重要,其目的是帮助你更好地理解卡片正面的内容。
卡片的正面可以是音频或文字,但别把这两者一起放上去,这样做无法真正检测你的听力或阅读能力。
音频或文字可以只是一个目标词或单一目标(1T)句子,其中目标词是句子中你唯一不了解的东西。
这就形成了四种不同的卡片格式:
这四种卡片格式各有优缺点。建议你每种都试试,以了解各自的优势。最终,你可能会选用一到两种最适合你的格式,或者继续使用全部四种。你也可能发现,在语言学习的不同阶段,某些格式或多或少会更有用。
音频句子卡
音频句子卡测试你对 1T 句子的听力理解。
卡片的正面是句子的音频。这段音频一般取自你正在看的节目,但也可以来自任何其他来源,只要该句子是母语者念的。
卡片的背面至少应包括:
-
该句子的文本。
-
目标词的定义。
你还可以在卡片的背面添加其他内容,以帮助你更好地理解。例如,你可以添加一张挖掘该句子的场景截图。
对于音频句子卡,选择你能清楚听到目标词的句子至关重要。在清晰的句子上训练你的听力理解能力,可以让你理解含糊不清的句子;反之则不然。
如果你找到了一条特别喜欢但听不太清楚的句子,那就换个卡片格式。你还是可以把句子的音频放在卡片的背面。
音频句子卡主要是训练听力能力,但由于句子的书面形式在卡片背面,所以也有助于提高你的阅读能力。
这种卡片格式最大的弊端是,它容易产生高度依赖情境的记忆。音频包含太多线索和人工痕迹:语调、停顿、句子的节奏、演员的嗓音、背景噪音和音乐。你也可能会记住音频来源的具体场景,或者当时看场景时的情感反应。这些因素常常会和你对句子意义的记忆紧密相关。在复习卡片的时候,你可能觉得句子很好理解,但在平时沉浸中遇到同一目标词,有时却回想不起它的意义。有时你甚至不觉得这个词你曾经做过卡片。
由于制作音频句子卡需要录音,而且对音频的清晰度要求非常严格,所以有时很难找到适合这种卡片格式的句子。
在给自己打分时,如果你在听到这句话时能理解它的意思,这张卡就可以过关了。重听两三遍也没关系,如果你还是不理解,就点重来,这样你就会更快地看到它。
文本句子卡
文本句子卡测试你对 1T 句子的阅读理解。
卡片的正面是句子的文本。
卡片的背面至少应包括目标词的释义。
此外,你还可以加点辅助理解的内容在卡片背面,如目标句子的音频、目标词的音频、代表目标词意思的图片、你遇到该句子的场景截图或发音提示。
但是,不管是国际音标还是其他音译方式(例如罗马字、拼音、假名批注等),发音提示都别放在卡片正面。
文本句子卡制作起来很快,而且复习起来也很自然,因为目标词嵌在够明确其意义的上下文中,用句子形式呈现目标词也有助于你更好地内化这个词的用法。
话虽如此,这种上下文也可能是一个缺点,因为有时你会记住整个句子的意思,但在其他情境下却难以认出或理解目标词。
在起步时,你的阅读能力完全没有发展,看这种文本句子卡会让你头大,因为你得读完整个句子。这可能会降低你在复习环节的整体学习容量。
文本句子卡并不能锻炼听力能力,尽管通过沉浸学习,阅读能力会逐渐迁移到听力上。要是想更针对性地练习听力,给卡片背面加上句子的音频也行。在这种情况下,语音模糊或不清楚也没关系,因为当你听到音频时,你的大脑已经知道在听什么了。
在给自己打分时,如果你在读这句话时理解了它的意思,这张卡就可以过关了。否则,选择「重来」,这样你会更快地再次看到这张卡片。
音频词汇卡
音频词汇卡测试你对单个单词的听力理解。
卡片的正面包含母语者念的目标词汇的音频。
卡片的背面至少应包括:
-
该词的书面形式。
-
包含该词的例句的书面形式。
-
该词的定义。
卡片背面还可以加上其他内容,比如例句的音频、代表该词的图片,或者是你挖掘例句的场景截图。
音频词汇卡的例句不一定要严格遵许 1T 原则。因为你在卡片正面测试的是你对目标词的理解,所以背面的句子里即使有未知内容,也不会干扰你的记忆。
音频词汇卡主要训练听力能力,与音频句子卡相比,它对上下文的依赖较低,这往往能帮助你在沉浸中更可靠地认出和理解这个词。但缺少上下文也是这种卡片格式的最大缺点:初次学习单词时可能会觉得更难。同时,由于缺乏上下文,在复习时也可能会显得有些尴尬。因为你往往最终要花更多的时间在记忆中搜索,试图把这个词和正确的含义联系起来。
音频词汇卡在一定程度上也能锻炼你的阅读能力,但这并不是其强项。
在给自己打分时,如果你在听到目标词时能理解它的意思,这张卡就可以过关了。否则,选择「重来」,这样你会更快地再次看到这张卡片。
文本词汇卡
文本词汇卡测试你对单个单词的阅读理解。
卡片的正面是目标词汇的文本。
卡片的背面应包括:
-
包含该词的例句的书面形式。
-
该词的定义。
卡片背面还可以加上其他内容,比如例句的音频、目标词汇的音频、代表该词的图片,或者是你挖掘例句的场景截图,或目标词汇、例句的发音提示。
但是,不管是国际音标还是其他音译方式(例如罗马字、拼音、假名批注等),发音提示都别放在卡片正面。
文本词汇卡很容易制作,一般复习起来也很快。然而,让单词孤立地进行测试会使其更难学习,并且会使复习变得很尴尬,因为意义单位太小,很难将单词直接与它所对应的概念联系起来。因此,与正面为句子的卡片相比,复习这些卡片可能需要更多的时间,因为你要花很多时间来思考这个词,并将其与意思联系起来。
由于文本词汇卡的背面有一个例句,它们仍然提供了足够的上下文,帮助你理解这个词及其用法,这个句子不一定要严格遵循 1T 原则,因为它只是在你的记忆被测试后提供额外的上下文,因此,不用担心会有记忆干扰。
在给自己打分时,如果你看到目标词就能理解它的意思,这张卡就可以过关了。否则,选择「重来」,这样你会更快地再次看到这张卡片。
如果卡片背面有音频,你也可以根据读出的正确发音给自己打分。
指导方针
不要为同一个词的同一个意思制作多张卡片。
如果一个词有多个意思,用不同的句子卡来区分这些意思。单独的词不足以区分不同的意思。
对于你所学的每个单词,选择你认为最有助于学习的卡片格式。你可以在任何时候把一张卡片从一种格式转换成另一种。
在卡片的正面,小心不要添加额外的线索和上下文(比如图片),这样可能会产生依赖额外信息的记忆。这将减少你在沉浸学习中理解目标词的可能性。
在卡片的背面放张图片有助于形成更强烈的记忆,尤其是当目标词是名词时。在这种情况下,图片比定义更有帮助。
自动词句挖掘
高级的词句挖掘技巧是用软件从带字幕的视频中自动创建抽认卡。这将生成一个庞大的「句子库」,然后你可以根据需要来选择要学习的卡片,或者搜索你想学的单词并筛选出相应的句子,或使用软件根据词频表自动确定要优先学习的卡片。
这里有一些用于自动词句挖掘的有用工具:
-
将带有字幕的媒体转换成 Anki 卡片:
-
Morphman:对你的卡片进行排序,达到最佳的学习效果
2B3:自然单语过渡
原文:Casual Monolingual Transition | Refold
语言是我们用来理解周遭世界的工具。每一种语言都是一个独特的范式:一个我们用来观察世界的镜头。初学一门语言时,人们往往会习惯性地在母语和目标语言之间相互翻译,因为你此前只通过一个镜头看世界。不幸的是,如果你试图把你的目标语言硬套进母语的范式里,那么目标语言的很大一部分将在这个过程中失真。要做到真正的流利,你需要为你的目标语言建立一个全新的范式。
初学语言时,双语词典是个不错的工具,因为它利用你母语的范式作为支撑,加速了你对目标语言的理解。然而,这种方式也把两种语言纠缠在一起,导致目标语言的含义失真。
单是沉浸学习就足够解开两种语言间的纠缠,构建这个新的思维范式。但若把单语词典作为主要的参考工具,这一过程会得到加速。
建立这种新的思维范式就等于找到了用目标语言思考的钥匙。当你学习新的词汇和概念时,你自然而然地会把它们和目标语言里的其他词汇和概念联系起来,而不是回到母语里去找对应。这不仅让你用目标语言描述事物得心应手,而且读单语词典也成了一种主动沉浸,能让你在目标语言中累积更多时间。
用单语词典,你对词汇或概念的理解也会更到位。之前你一直用双语词典把目标语言的词汇翻译成母语,以便理解。但这种从目标语言到母语的翻译,其实是在把目标语言的意思硬套到你母语的范式里,这样很容易让原意失真。用单语词典,你就能直截了当地学习目标语言,避免了含义的失真。
通过早早地构建这个新的思维范式,你通往流利之路的速度将大大加快。
什么时候开始过渡到单语词典
对某些语言来说,单语过渡比其他语言更困难。对于相似的语言,过渡相对容易,只需要 1-2 个月。对于这类语言,我们建议在阶段 2B 结束时进行过渡。我们在下面提供的渐进过渡指南应该可以满足这一转变的实现。
对于差异较大的语言,我们建议等到阶段 2C。如果你在对该语言有稳固基础之前就尝试用单语词典,压力会很大。稍等一下,过渡就会容易多了。
如果你尝试了下面的渐进方法,但对你来说并不奏效,那就等到阶段 2C,届时我们会提供更加结构化的教程。
渐进过渡
单语过渡是一个循序渐进的过程,你不必一夜之间(或永远不需要)100% 转用单语词典。
刚开始用单语词典时,确实会消耗更多精力。如果觉得太费劲,那就暂时回到双语词典,等精力恢复后再试。
1. 先查单语词典
在沉浸学习和词句挖掘过程中,查双语字典前,先查单语词典。
许多单词有多重含义。尝试分辨出与你要理解的句子最贴切的定义。
2. 在卡片上添加单语定义
假设你能找出与你要理解的句子相匹配的定义,那么除了双语定义外,还要将该单语定义添加到你的卡片上。
通过使用 [HTML summary][html-summary-tags] 标签,你可以把这些解释隐藏在可展开的区域内。复习时,先看单语定义,再看双语定义。即便你没完全理解单语定义也没关系,每次复习这张卡片都是重新尝试的机会。
如果定义中有生词,那就为它们制作卡片。
下面是一个示范的 Anki 牌组,里面有一张用 summary 标签创建隐藏区域的示例卡片:
- [Example Anki deck][sample-anki-deck-with-summary-tag]
隐藏部分折叠后:
隐藏部分展开后:
3. 切换到单语模式
如果你在沉浸学习或词句挖掘中能完全理解单语定义,那就没必要再用双语词典了。随着时间的推移,你会逐渐停止使用双语词典。
当你能在不依赖双语词典的情况下,用单语词典查词并理解 90% 的内容,就算是完成了这个过渡。
选择词典
有许多单语词典可供选择。同一个词在不同词典里的描述也各不相同。我们建议手头准备多本词典,或者用一个聚合搜索工具,一次性查找多个词典。这样,你就更有可能找到合你心意的解释。
何时不宜用单语词典
某些词类的单语定义过于复杂和晦涩。对于这类词,最好还是回到双语词典。
简单词汇
这听起来可能有些违反直觉,但很多看似简单的词,其实有非常复杂且抽象的意思。
例子
[Thing][example-definition-thing]: an object or entity not precisely designated or capable of being designated.(没有明确指代,或无法明确指代的物体或实体。)
The: used as a function word to indicate that a following noun or noun equivalent is definite or has been previously specified by context or by circumstance.(用作功能词,表示接下来的名词或名词短语是明确的,或者在上下文或特定情境中已被明确。)
此外,一些简单且常用的词有时会有二十个略有不同的定义。对于这些词,还是用双语词典为妙。
具体名词
具体名词指的是那些你可以通过触觉、味觉和嗅觉来体验的物体。与之相反的是抽象名词,它们用来描述某些概念。
大部分具体名词你应该都有实际体验,只需要将目标语言的单词和这些体验联系起来。但有些具体名词的定义过于专业或抽象,无法帮助你将其与个人体验建立联系。
例子
Piano: a musical instrument having steel wire strings that sound when struck by felt-covered hammers operated from a keyboard.(一种乐器,有钢制弦线,用键盘操作的覆有毛毡的锤子敲击而发声。)
Camera: a device that consists of a lightproof chamber with an aperture fitted with a lens and a shutter through which the image of an object is projected onto a surface for recording (as on a photosensitive film or an electronic sensor) or for translation into electrical impulses (as for television broadcast).(一种装置,由一个防光的密闭空间组成,装有镜头和快门,可以将物体的图像投影到一个表面上进行记录(如感光胶片或电子传感器上)或转化为电脉冲(如用于电视广播)。)
如果你觉得某个定义过于专业且抽象,那就别用它,别把事情复杂化。你可以考虑用图片代替。如果目标词是一个地点、颜色、植物或动物种类,或任何一种实物,图片通常比定义更有用。
如果实在找不到合适的图片,那就直接用双语定义吧。
专业或学术术语
对于学术或专业词汇,依赖双语词典是没问题的。这些词在各种语言中都有标准化的专业含义,所以用双语定义不会丢失任何信息。
实际上,对于专业术语,我们建议你明确地把你的母语和目标语言关联起来,这样有助于在两种语言之间迁移专业知识。
比如,「氢」这个词,在英文中是「hydrogen」,在法文里是「hydrogène」,在日文中是「水素」(suiso)。
如果你已经知道「氢」在中文中是什么意思,那就没必要通过单语词典去学目标语言里「氢」的对应词。直接把中文的「氢」和目标语言中的对应词联系起来即可。
[example-definition-thing]: https://www.merriam-webster.com/dictionary/thing) [html-summary-tags]: https://www.w3schools.com/tags/tag_summary.asp [sample-anki-deck-with-summary-tag]: https://drive.google.com/file/d/1oRTHZ3LCQrjLeieIGjQ6qN8ljONJ1gd3/view?usp=sharing
2B1:沉浸学习指南
在阶段 2A,我们的目标是学习阅读目标语言的基础。现在,你应该能在阅读一部简单的电视节目时,使用 2A:可理解性的媒体类型索引中描述的所有可用工具和支持,达到等级 3 的理解。
在阶段 2B,你将逐渐增加沉浸难度。在阶段 2B 结束时,你将能沉浸在面向成年观众的本土内容,并达到等级 4 的理解。
理想情况下,你应该在提高难度水平的同时,保持所有内容在同一类型中。然而,这样的期望并不现实。多数人会想涉猎不同的类型,以保持自己的娱乐和参与。在阶段 2B,拓宽知识范围,进入其他领域是可以的。
但扩大专注领域的缺点是,提升你的理解能力会变得更为困难。到了阶段 2C,你需要重新集中精力,以快速将你的理解水平从等级 4 提升至等级 5。
如何提升难度
在阶段 2A,你会希望沉浸内容尽可能容易理解。这意味着使用更简单的媒体和工具来辅助理解。
随着你在阶段 2B 的进步,你将逐渐增加沉浸的难度。正如我们在 2A:可理解性的影响因素中所描述的,有很多方法可以控制沉浸的难度水平。下面我们解释哪些方法值得使用,哪些应当避免。
语境复杂度
现阶段不要尝试提高语境复杂度。继续使用具有叙事结构的视觉媒体,并尽量停留在你已经熟悉的领域里。
话虽如此,比起严格局限于一个领域,更重要的是你的兴趣和享受。如果你想接触不同领域的内容,尽管去做。但要明白,重叠度会减少,你对使用的语言也不那么熟悉,这会让内容更加困难。
语言复杂度
到目前为止,你一直在用简化内容进行沉浸,因为这样更容易理解。请回想一下 2A:可理解性的影响因素,语言复杂度由三个因素决定:受众水平、领域难度,以及内容是配音版还是本土出品。
受众水平
在阶段 2B 结束时,你应该精细沉浸在面向成年观众的内容中。面向儿童和青少年的节目仍可用于无阻沉浸,因为它们将有助于巩固和习得你已经获得的知识。
领域难度
暂时不要追求难度高的领域。尽量让事情简单点。比如,日常生活领域要比政治或者奇幻容易得多。
配音 vs 本土
配音内容往往被人为地简化了。在阶段 2B 结束时,你应该只用本土内容进行精细沉浸。这将使你熟悉你的目标语言的文化和母语者的实际说话方式(例如,他们常用什么习语,他们的幽默感在哪里)。
技巧、工具和支持
在阶段 2B,你应该继续使用所有可用的工具来帮助你理解精细沉浸的内容。
漫画
到现在为止,你一直用电视剧节目来进行沉浸学习,并把它当作精读的主要材料。
你也可以选择漫画作为另一种阅读活动。漫画是一种混合输入形式,结合了文本和视觉情境。视觉情境强化了文本的含义。
漫画是向阅读如博客、新闻和小说这类更复杂内容迈进的好起点。漫画里多数文本都是对话,而且即便文字难懂,视觉情境也使得故事容易理解。
另一方面,小说是用文学和描述性语言来填补视觉元素的空缺。在这个初级阶段,很多学习者通常觉得小说里的用词难以理解,结果灰心丧气。如何阅读小说,我们会在阶段 2C 中详细解释。
网络漫画
如今,在网上就可以看到漫画,它们被称为 Webcomics 或 WebToons。
网络漫画的一个缺点是文本通常是内嵌的,也就是说你不能高亮、复制和粘贴单词以便快速查找。对于表音文字系统的语言来说,这不是个大问题。但对于中文和日文,认出未知文字可能会比较困难。这个问题可以通过使用光学字符识别(OCR)工具来解决,这些工具允许你从图片中复制文本。
实用链接
网络漫画:
-
Cover:适用于 Windows 的漫画阅读器
-
WebToons:在线或通过应用阅读漫画
-
WebComicsApp:在线或通过应用阅读漫画
OCR 工具:
-
Google Lens:安卓系统内置的一个工具,能让你复制和粘贴你在现实世界中看到的文本。
-
Google Keep:一个可以保存图片的笔记服务。
图片中的文字可以用 OCR 自动提取。
无阻沉浸
阶段 2B 的无阻沉浸与阶段 2A 几乎一摸一样。你将继续沉浸其中,实时观看电视节目。
但是,此刻起,你应当开始在无阻沉浸中减少对字幕的依赖,以便更多地练习听力。至少有一半的无阻沉浸时间应当是无字幕的。
到这里,你应该已经累积了一大堆在无阻沉浸中观看过的节目。挑你最中意的,排好队,准备用于精细沉浸。
如何分配你的时间
对于上述所有主动沉浸的活动,我们的建议与阶段 2A 相同,至少要有 30 分钟的精读时间(电视或漫画),剩下的时间则投入到无阻沉浸中。
被动收听
通过被动收听你精细沉浸过的节目,比起无阻沉浸的节目,收益会更大。原因很简单,你之前已经花时间和精力去查单词和解析句子含义。这样一来,被动收听就会更易于理解,也更吸引人。越早地对你精读过的内容进行被动收听,效果越佳,因为这些内容在记忆中还很新鲜。
如果你已经积攒了一定量的被动收听素材,就试着集中精力在这一部分内容上。但同样,不要强迫自己只用这些内容,还是要看你感兴趣且愿意投入的内容。
进阶
在阶段 2B 结束时,你在阅读本土内容时应该有等级 4 的理解。
评估你的理解水平时,选个面向成年观众(即,不是少儿节目)的本土节目。观看一个你从未看过的剧集,逐行阅读字幕,但不要去查单词。虽然会有细节你未必完全把握,但整体上,你应该能够理解角色们所表达的主要观点。
2C3:如何阅读小说(选修)
原文:How to Read a Novel (Optional) | Refold
阅读文学作品并不是学会输出的先决条件。
阅读引人入胜的故事能有效培养语言能力。但文学语言比我们日常使用的语言要丰富且复杂得多。
理解一本小说,其难度远超过理解漫画或电视节目,需要投入大量的时间和精力,而且对日常交流并没有太大帮助。如果你希望尽快开口说话,我们建议你在阶段 4 再开始阅读文学作品。
不过,如果你对阅读小说确实感兴趣,并且不介意推迟说话的时机,那么在阶段 2 阅读也有好处。这样,到了阶段 3 后,你的词汇量会更大,而且会更了解这种语言的习惯用语和文化背景。
如果你决定挑战阅读文学作品,可以先从简单的内容开始,随着语言能力的提高再选择更难一些的书籍。
理想的内容应该既引人入胜,又略高于你的水平。虽然会遇到一些生词,但上下文中的其他词语可以帮你推测出它们的意思,无需查字典。这样,当你阅读时,你会完全沉浸在故事之中。
初次涉足文学作品时,找到这样理想的内容可不容易。要是你在读第一本小说时就能找到这样的内容,那可真是走运了,好好珍惜吧。因为当你刚开始阅读小说时,大部分内容不是枯燥无味就是晦涩难懂。
分级读物
分级读物是根据特定的语法复杂程度和词汇范围编写的。通常有几个经过仔细校准的级别,让读者能够渐进地提高阅读的难度。这些系列的书籍通常改编自更复杂的小说,并对语言进行了简化。
如果能为目标语言找到适合你的分级读物,那是最好不过了。你可以选择那些只有 2-3% 的生词的级别。这可以让你读得更快,也意味着相较于对你来说理解起来太过容易的内容,你会更经常遇到生词。你会花费更少的时间去查字典,而更多时间沉浸在故事里,忘掉语言的细枝末节。因此,你正在学习的所有单词和语法结构都会得到更快的巩固。
当你能够轻松、流畅地阅读某个等级的分级读物时,就可以挑战更高的级别了。
小说
如果你决定阅读小说,直接跳到面向成年母语者的小说可能会有些困难。面向大孩子和青少年读者的小说是个不错的起点,它们的词汇量比成人小说少,但故事同样精彩。
Lexile 公司为儿童书籍的难度和可读性建立了一个评估框架。他们提供了一个搜索门户,方便读者比较不同书籍的难度。虽然 Lexile 主要关注英语书籍,但英文版本的书籍分数应该与你目标语言的版本大致相当。
当你考虑要读的书时,可以比较它们的 Lexile 分数,并从分数较低的书开始。
如果你找到了一本自己喜欢的书,那么不妨再读读同一作者的其他作品。因为作者往往有自己独特的写作风格和习惯用词。熟悉了之后,你会更容易理解他们的作品。
查词频率
阅读有两个极端,一端是完全精读,查阅每个单词,一端是完全泛读,什么都不查,容忍所有模糊之处。
哪怕是精读,尤其是在读第一本小说时,你也常常需要容忍一些模糊之处。面对如此之多的生词,你甚至对句意连一点模糊的概念都没有。如果你试图查阅每一个单词,等你查到下一个单词时,你可能已经忘记了前面的意思。
不必为此纠结。如果需要,查一两个句子中看起来关键的单词。如果你想的话,也可以查更多。不想查就不查,没关系。如果你理解了一些意思,就当作是一次成功,接着往下读。
通常,生词的意思会在句子的后半部分变得清晰,所以别急着去翻词典。先通读整个句子,试着去揣摩其意,然后再去查定义。
阅读策略
一轮阅读
阅读小说的最直接方法就是读它。按需查词,以保持阅读的兴趣。
这种策略的缺点在于,小说的学习曲线相当陡峭。一轮阅读虽然能让你学到很多,但你会错过很多故事情节和细节。有些人觉得要坚持读一个自己不懂的故事太难了。
两轮阅读
通过结构化的两轮阅读法,你有两次机会理解故事并习得小说中的语言。这有助于让你即便在面对艰难的挑战时,仍能沉浸在小说的世界里。
缺点:阅读时间会翻倍。在两轮阅读法中,一本书要读两遍,一遍精读,一遍泛读。
精读优先
在「精读优先」方法中,你要先精读一个章节,查找大部分生词,并努力理解句子的含义。读完这一章后,再以泛读的方式重读一遍,这次就几乎不用再查词了。
由于你已经精读过了,因此在第二轮的泛读时,你理解的内容会多很多,并巩固在第一轮精读中学到的知识。这种方法的缺点是,你的阅读速度受限于你精读的速度。
泛读优先
在「泛读优先」方法中,你可以按自己喜欢的速度阅读,偶尔查个词。等精力充沛时,再去精读。第一轮的泛读让你了解故事的大概,第二轮的精读再填补细节。
因为在泛读时你不用全神贯注地去琢磨其中的含义,所以消耗的精力会更少,阅读速度也会更快。但这种方法的缺点是,第一轮的泛读可能让你不能充分理解内容,不足以保持你对故事的兴趣和投入。
限时阅读
刚开始精读可能有些费劲。与其纠结读了多少页或多少张,不如关注你投入了多少时间。我们建议每天至少精读 20 分钟,这样能慢慢积累基本词汇和语法,帮助你理解小说。
随着时间的推移,这 20 分钟会产生更多更好的效果,你也会逐渐培养阅读的耐力,能够读更长的时间。
2C1:沉浸学习指南
在阶段 2B,你逐渐提高了沉浸内容的难度,直到能理解面向成年观众的本土媒体。至此,你在继续使用 2A:可理解性的媒体类型索引里描述的大多数辅助手段的同时,对本土内容达到等级 4 的理解水平。
阶段 2C 将指导你该如何逐步摒弃这些辅助工具,为阶段 3 的写作和口语准备,使你能够完全理解本土媒体。
聚焦你的领域
在阶段 2B,你或许跟寻兴趣的脚步,在各个领域之间跳来跳去。这样的话,虽然你对多个领域有大概的了解,但还没有真正精通任何一个。正如 2A:领域中提到的,学习语言最快的方法是先精通一个领域,然后再拓展到其他领域。要快速精通一个领域,最好尽量缩小范围。
我们建议你首选「日常生活」作为首个精通的领域,因为这与你阶段 3 的实际输出最贴近。「日常生活」内容主要描写普通人(但很美好)的生活。
你也可以挑个别的领域起步,但要明白,在日常交流中,你大概用不上跟执法、手术、庭审、飞船或者 14 世纪剑术有关的词汇。
在本文的剩余部分,我们会默认你挑选了「日常生活」作为你聚焦的方向。
借助工具精通领域
三通道阅读
回顾一下,三通道混合媒体包括音频、视觉和字幕。到现在为止,你应该已经能够比较流畅地阅读目标语言的本土电视节目。随着熟练度的提升,你查词的频率会越来越低,暂停的次数也会减少。最终,你将完全不用暂停,可以实时阅读字幕。这时候,三通道媒体的精细沉浸和无阻沉浸将融为一体。
阶段 2C 的第一步就是逐渐实现这种融合,使你能实时阅读电视节目的字幕。
无字幕的无阻沉浸
你的阅读理解能力可能已经超过了你的听力理解能力。除了三通道阅读外,你应该利用其余的沉浸时间,在没有字幕的情况下无阻沉浸,以锻炼你的听力。
听本土的「日常生活」内容是最理想的,因为这与你首先要精通的领域最为匹配,但如果你觉得无聊,需要一些变化,那么你可以选择配音内容或者跳出这个领域的内容。但记住,精细沉浸最好用「日常生活」的本土内容;至于你在无阻沉浸中选择什么,相对来说不那么重要。
撤下所有辅助
当你精读和带字幕的无阻观看合二为一时,就意味着你可以开始去掉那些人为提高你理解的辅助了。
别再提前阅读剧情简介,或观看你已经熟悉的故事的配音或改编版本。同样地,更多地关注新节目,而不是重复观看之前看过的节目。
字幕只留作应急,偶尔用来核对你的理解,或在进行词句挖掘时确保拼写无误。
别再倒带回看,不要给自己第二次解析音频和捕捉细节的机会。
现在你的理解能力有了提升,可以尽情欣赏电影了,这就消除了对长篇故事情节和熟悉角色的依赖。
你查字典的次数应该越来越少,直到能够不用字典就能舒适地观看。虽然还会有生词,但它们不会影响你的理解。
纯听力(可选)
随着理解能力的提高,你就可以不再依赖视觉语境来理解了。要锻炼听力,你可以使用纯音频,比如播客、有声书,或者只有说话者面部特写的视频。
纯听力虽然是选修的,因为理解电视节目已足够你进阶到阶段 3。不过,纯听力能加速你对电视节目的听力理解,对你以后的学习也有好处。
音频的难度各不相同,因此我们提供了一份进阶指南。最容易开始的是结构明确的音频内容,比如有剧本的广播剧或讲述短故事的简单播客。
渐渐地,你对纯音频的理解会提升到可以一边做无需动脑的任务,一边听懂新内容的程度。这时,主动收听和被动收听将会合二为一。
非电视节目阅读(选修)
如果你想专门练习电视节目之外的阅读,那就大胆去做吧!提高你一般阅读理解能力会让你在沉浸三通道媒体时读得更快。
正如阶段 2B 提到的,漫画与电视阅读是绝配,因为漫画对话多,还有视觉元素。挑漫画时,尽量选那些接地气、与日常生活贴近的,这样更有助于你达到等级 5 的理解水平。
你也可以开始阅读博客。虽然这对日常对话来说不是必需的,但如果你阅读一些自己感兴趣的主题,那能丰富你日常交流中讨论兴趣爱好的词汇。
在阶段 2,阅读小说完全是选修的。电视和漫画使用视觉语境,而小说则使用文学性和描述性的语言,这种文学性的语言会大幅拓宽你的首个领域,所以阅读小说会拖慢你从等级 4 进阶到等级 5 的进度。如果你的目标是尽快开口说话,那么小说暂时可放一边。
但如果你真对阅读小说有兴趣,那也没关系,尽管去读!一定要追随你的兴趣。我们也提供了如何选择你的第一本小说以及多种应对策略的指南。
单语过渡
如果你的目标语言与你的母语差异很大,那么当你的阅读理解水平高达等级 4 时,你应做好准备,迎接单语过渡的挑战。对付难啃的语言,比起阶段 2B 介绍的自然过渡,我们建议你走个更结构化的路线。我们提供了一份指南,专门解决如何有针对性地进行单语过渡。
进阶
当你在没有任何明显辅助的情况下,能够流畅理解面向成年观众的「日常生活」电视节目,并达到等级 5 的理解水平时,你就做好准备,可以进入阶段 3 了。
为了评估你的理解能力,挑选一集你以前从未看过的本土节目。不使用字幕,也不暂停,一口气看完这一集。你应该能准确无误地理解其中所有的对话。
当你进入阶段 3 时,继续沉浸在首个领域,直到你达到等级 6:不费吹灰之力的理解。有了等级 6 的领域,意味着你在精疲力尽、无法集中注意力的时候,也可以用你的目标语言来进行放松活动了。
2C2:纯听力(选修)
原文:Pure Listening (Optional) | Refold
到现在,你一直是通过看电视节目来锻炼听力理解,视觉语境起到了很大的帮助。电视和电影通过视觉叙事显著提高了你的听力水平。
然而,在日常对话中,虽然肢体语言提供了一定的视觉语境,但这远不如电视节目或电影中的视觉元素丰富。为了让你更好地应对现实生活中的对话,你可以尝试用纯音频进行听力练习,这样能提升你的听力理解。
由易到难,循序渐进
如 2A:可理解性索引所述,不同媒体类型有不同的难度。
我们建议你先从有剧本的广播剧或是有故事情节的播客开始。这些一般来说录音质量好,故事也好猜。
另一个不错的起点是只有一个主题、一个演讲者的 YouTube 视频。这类视频领域狭窄,更容易掌握,而且画面信息和实际面对面聊天差不多。TED 演讲就是很不错的例子。
继续进阶,就是多人参与,但主题单一的脱口秀。虽然领域依然狭窄,便于掌握词汇,但多个说话者会让声音变得凌乱。他们可能会打断对方、同时发言或含糊其辞。这对你来说,是练习听懂复杂音频的好机会。
或许你不把街头采访当作「脱口秀」,但其实这也是一种多人参与、单一主题的体裁,声音环境也相当复杂。这能让你锻炼到同样的听力技能。
最高难度要数那种多主题、多人参与的脱口秀了。你需要对他们涉及的所有领域都有一定造诣,还得有足够好的听力水平,才能应付人们互相打断、快速说话的情况。在你达到阶段 4 之前,别指望能完全听懂。
如果你选择读小说,也可以听听有声书。有声书的音频质量通常很不错,虽说这对日常对话帮助不大,但能让你在读小说累积了大量词汇后,继续习得对这些词汇的听力理解。
如何分配时间
到这个阶段,你如何分配沉浸学习的时间,取决于你的目标,以及你是否决定涉猎文学阅读。
如果你遵循 2C:沉浸学习指南中的建议,那么增加 30 分钟的纯听力练习,对你听力的整体提升绝对是如虎添翼。
如果你打算挑战阅读小说,那么如何分配你的沉浸时间就由你自己决定了。今天可以全身心投入阅读,明天再转战电视,后天专注听力也未尝不可。当然,每天都尽量平衡这几种活动也是个不错的选择。
如果你决定在一个星期或更长时间里重点关注某一项活动,那就务必花点时间定期练习其他技能,以防它们因缺乏练习而退化。
听力活动的种类
主动收听就是把全部精力和注意力都集中在你选定的纯听力材料上。如果你决定做纯听力训练,那么每天专门抽出 30 分钟来进行主动收听练习。把这当作看电视剧或阅读一样重要,不要试图一边听一边做其他事。
随着你对纯音频内容理解力的提高,你会发现主动和被动收听会逐渐融合。你不再需要百分之百的注意力去听和理解所有内容。如果你能轻易地理解某个纯音频内容,那就尽管用它来进行被动收听。
2C4:结构化单语过渡
原文:Structured Monolingual Transition | Refold
对于差异极大的语言(如英语→汉语),单语过渡可能会遇上陡峭的学习曲线。如果自然方法对你无效,这里有一个结构化的指南,可以帮助你开始使用单语词典。
如果你还没看过自然单语过渡的文章,我们建议你在尝试这个结构化的方式前,先去读一读。
词典领域
词典本身就是一个领域,用到了很多你在其他地方很少见到的词汇。与其他领域相比,词典的领域相当小,但因为这些词汇你在日常沉浸学习中不会遇到,所以采用结构化、刻意练习的方式来应对是个不错的主意。一旦你学会了词典里的关键词汇,定义就会变得容易理解得多。
结构化方法
以下步骤详细阐述了如何主动学习词典领域,并克服单语词典的学习曲线。按照你自己的学习节奏,待感觉吃透了再迈向下一步。
1. 挖掘词典
每天抽出时间,查一下那些你已经熟悉的单词的单语定义。如果定义中有生词,就借助双语词典来理解它们。
大多数单词都有多个意思和定义,尽力找出与你已知的意思相吻合的定义。如果你找到了,就为那个定义中的生词制作双语对照卡片。
2. 递归查词
继续挖掘词典,查找熟词,但请尝试用单语字典来理解定义中的任何生词。自己琢磨这些词的意思,随后用双语词典验证你的理解。
对于新的生词,继续制作双语卡片。
3. 将两种语言都加到卡片上
在词句挖掘时,在求助双语词典之前,先试着用单语词典理解生词。
如果你能明确地找出与目标句子中的词义相符的定义,那么即使你不能完全理解单语定义,也要把单语和双语定义一起放到你的卡片上。
使用 HTML Summary 标签来隐藏这两个定义。当你复习卡片时,先看单语定义,再看双语定义。
对于定义中的任何生词,制作包含单语和双语定义的卡片。把这些新卡片的复习时间定在原来的目标句子卡片的前几天。
以下是一个使用 summary 标签创建隐藏部分的 Anki 卡片样本示例:
这是隐藏部分折叠后的样子:
这是隐藏部分展开的样子:
4. 切换到单语词典
无论是词句挖掘还是在沉浸学习中查词时,开始将单语词典作为主要工具。需要时,回头用双语词典也没关系。
当你在不求助于双语词典的情况下,能够理解单语词典中 90% 的内容时,就表示你已经完成了这个过渡。
3A2:活动指南
阶段 3A 的活动目的是为接下来的阶段 3B 和 3C 做好准备。这个阶段你会开始输出,但大部分时间还是要专注于输入,为阶段 3B 的写作和阶段 3C 的口语做准备。
准备写作
基础输出
正如 3A:开始输出中所提到的,开始进行一些输出很重要,这能使你大脑中的齿轮转动起来。对一些人来说,输出是自然而然的。其他人则需要专门的时间来练习。
如果你的目标语言使用的是不同的键盘布局或打字系统,那么你就需要学习如何使用它。我们将在特定语言的指南中讨论如何学习这些键盘布局。
你可以使用文字聊天软件,比如 HelloTalk、Tandem 或 Discord 来开始写作。不必太在意写得是否完美无缺,也不用在写作时查找单词或语法变化。这个练习的重点是开始动手。
我们建议每周输出一次,每次 30-60 分钟。如果你愿意,可以多输出一些,但你的时间还是应该更多地用于输入。
对话领域
在阶段 2,你掌握了理解日常生活领域的语言。在阶段 3,你的首要目标是学会理解另一个领域:日常对话。
日常文字对话与口语或文学作品有所不同。你需要沉浸在这个领域中,以习得相关的词汇和语法。
多花时间阅读非正式的语言材料:电子邮件、Twitter、Instagram 帖子、YouTube 评论、博客评论、论坛、短信等等。试着找一些公共聊天网站或应用,看看母语者是如何交流的。
短信、聊天室和论坛里的语言随意、混乱且无固定结构。你可能需要一段时间来适应。像处理电视节目或书籍一样,对这些内容进行词句挖掘。
如果你不喜欢公共聊天,阅读博客也是一个不错的开始。博客文章通常比论坛和聊天室更有条理,但比文学作品更加随意。
为说话做准备
收听你的语言家长
到目前为止,你的输入来自于成千上万个不同的人。当你尝试输出时,你可能会混合他们不同的说话风格,听起来会很奇怪。
为了使自己听起来更自然,请挑一个人来模仿说话。这个人被称为你的「语言家长」。在下一篇文章中,我们会解释如何选择一个合适的语言家长。
在阶段 3B 和 3C,你将模仿语言家长的发音、用词和举止。然而,在你能模仿之前,你需要能够完全理解你的语言家长。
将你 50% 的主动沉浸时间用于观看和收听你的语言父母,将 100% 的被动收听时间花在你语言父母身上。到了阶段 3C,你对语言父母的理解应该达到等级 6,意味着你能够自动地、不假思索地完全理解他们。
听对话
如果你想能够积极地参与对话,就得学会理解日常的口头语言。现实世界中的对话是混乱的,没有脚本,也没有结构。人们经常会说不完整的句子、撤回前言、或者扯到别的话题上。
一种体验真实对话的方法是进行语言交换(language exchange),每个人只说自己的母语。这样,你不仅能练习听真实的对话,还能享受社交的益处。
街头采访和一对一访谈也是理解对话的好起点。街头采访虽然没有剧本,但由于采访者通常会向每位受访者提出一系列相同的问题,因此还是有一定的结构。街头采访的音频通常比较杂乱,这有助于你锻炼耳朵,专注于语言,过滤掉背景噪音。而一对一访谈完全没有剧本,但录音通常非常清晰。
一旦你能理解这两种类型的内容,就可以开始接触更复杂的对话了。找一些人们大声喧哗、含糊其辞、互相打断的内容来练习。综艺节目、真人秀、脱口秀和小组讨论都是这种类型内容的好例子。
缩小方言范围
如果你一直在目标语言的不同方言之间跳来跳去,现在是时候专注于一种方言了。专注一个方言能帮你更好地掌握单一的说话风格,而不是混合不同的风格。
选定了你的语言家长后,请确保你其他的输入内容与他们的方言一致。
日程示例
到了你的语言之旅的这一步,你可能会有很多学习活动抢占时间。以下是你可能的日程安排:
-
早上第一件事是复习 Anki
-
整天被动收听你的语言家长
-
花 1 小时沉浸学习语言家长的材料
-
花 30 分钟阅读聊天对话
-
花 30 分钟听访谈
-
每周安排一次 30 分钟的写作练习
你可以继续用目标语言看电视节目或阅读。到了这个阶段,你应该能够很轻松地理解这些内容,从而把它们当作休闲活动。
根据每个人自己的近期目标,日程安排可能会有所不同。如果你特别关注写作,那就在沉浸学习中多读些对话。如果你更注重口语,那就在沉浸学习中多听点东西。
进阶
当你对语言家长的理解达到等级 5 时,就可以进入阶段 3B 了。等级 5 意味着你能完全理解他们,但需要全神贯注和并加以努力。
3A3:认领语言家长
原文:Adopt a Language Parent | Refold
如果你曾和三岁小孩相处过,你可能听过他们说一些搞笑的话,比如:「这房子真乱!」他们一定是听过这句话很多次,才能说出来。
孩子听到什么言语都会极力模仿。小孩子会学习父母兄妹的说话方式,而大一点的孩子则会收到朋友和媒体的影响。
成年人也是如此。我们自然会模仿那些我们从中习得语言的人。你可以利用这种天然的模仿能力,通过认领语言家长,让自己的听起来更像母语者。
什么是语言家长?
当孩子第一次学习语言时,他们大部分的语言输入来自于一两个人(他们的父母)。这决定了孩子未来的说话风格。
你也可以这么干,只要选择语言家长即可。让输入的语言全部来自一个人之后,你就能全面掌握的说话风格,分毫不差。你的大脑会发挥其与生俱来的模仿能力,而你的说话风格会很贴近你的语言家长。
为什么要认领语言家长?
到目前为止,你的语言输入来自成百上千人。每个人的说话风格都不同。除了词汇、短语、俚语和习语等明显差异外,还有更微妙的差异,包括重音、发音、语调和语域等。
这些语言风格的混合塑造了一个人的外在形象。当你开始输出时,你的语言将是所有你沉浸学习中接触过的人的说话风格和个性的混合体。你的说话方式可能会显得有些奇怪。选择一个语言家长将帮助你形成一种连贯、自然的表达方式。
大多数学习者都希望自己听起来「像母语者」,但这个描述很模糊,因为每个母语者听起来都不尽相同。我们建议你选一位特定的母语者来模仿。比起问「我听起来像母语者吗?」,问「我听起来像这个人吗?」要简单得多。
随着时间的推移,你会逐渐形成自己的风格和特点,但现在,不妨先借用你语言家长的说话风格。
如何选择语言家长?
在选择语言家长时,有几个因素需要考虑。
标准
- 你的语言家长应该和你性别相同。
男女说话方式和行为举止都有所不同,所以你要选择合适性别的语言习惯来模仿。
- 你的语言父母应该与你年龄相仿(相差 10 岁以内)。
语言会随时间变化,人们随着年龄的增长也会调整他们的说话风格。青少年的说话方式与老年人完全不同。尽量找一个能反映出你如果在他们的文化中长大会如何说话的家长。
- 你应该喜欢他们的性格。
你要听这个人说话很久,你也会沾染上他们的性格。你一定要喜欢他们才好。
要求
你的语言家长得非常高产。他们要有大量的原始内容,就是未经剧本编排和编辑的素材,供你观看和收听。找到原始内容很关键,因为它能展示他们真实的说话方式。你需要听他们的每一个口吃、怪癖和言语习惯,这些都让他们的语言听起来更自然。
建议你选择至少有 100 小时原始内容的语言家长。理想情况下,这个人还有很多视频素材,这样你能看到他们的面部表情和肢体语言。人与人之间的交流不仅仅局限于口头语言,模仿母语者的行为方式也很重要。
如果你找不到满足 100 小时原始内容的语言家长,使用一些有剧本或编辑过的内容也可以。
我们推荐你尽量只找一个语言家长。但有时候你可能找不到完全符合所有条件且内容充足的人,这时可以考虑选第二个语言家长。我们不建议认领两个以上。
语言家长代表
Twitch 直播主播很适合当语言家长,因为他们的内容都是脱稿的,未经编辑。广播主持人和采访者也是一样。
油管主和播主也可以是不错的选择,但你需要确保他们有足够的脱稿且未经编辑的内容。许多高产的油管主会给他们的所有视频编写脚本,并进行后期剪辑,这就不适合作为语言家长了。
如何与你的语言家长共度时光?
在整个阶段 3,你将与你的语言家长共度大量时间。在阶段 3A,你的目标是尽可能快地理解你的语言家长。至少 50% 的主动沉浸时间和全部的被动收听时间,都应该花在语言家长上。如果听不懂他们在说什么,模仿起来就会很难。
在阶段 3B,你将继续沉浸学习你的语言家长,直到你能自动、不假思索地理解他们。同时,你也会开始刻意模仿他们,进行一种叫做「影子跟读法」的练习。
影子跟读法就是听语言家长说话,然后跟着重复。这样你就能注意到自己发音上的不同,并进行调整,直到能够像他们一样说话。我们会在阶段 3B 详细介绍这个过程。
到了阶段 3C 时,你应该能够不假思索地理解你的语言家长(等级 6 的理解水平)。有了和母语者的这种联系,你可以通过模仿来学习他们的说话风格。很多人能够模仿几句话的口音,但在使用目标语言时,你需要像演员一样一直模仿母语口音。
在阶段 3C,我们将解释如何模仿你的语言家长,以及他们口语中的各种特征。
3A1:开始输出
经过数月或数年的沉浸学习,一些学习者会有一天醒来,发现自己能开口说目标语言了。
不妨来看几段日语学习者初次开口说日语的视频:
他们说得并不完美,但他们能表达自己了。这些视频最棒的地方在于,这些学习者是下意识地在说日语的。他们并不是从自己的母语翻译过来的。
然而,我们在社区中观察到,并非人人都有这样的经历。有些人最终会陷入这样的模式,不断获得输入,但总是感觉自己没「准备好」去输出。
我们推测,这个问题的根源在于心理障碍,而非习得语言的方式上的差异。
经过数月甚至数年,这些学习者虔诚地遵循了「不要过早输出以避免巩固错误」的建议,结果却是他们感到巨大的压力:要么正确输出,要么干脆不输出。
语言习得能够培养出一种直觉,让人感觉到什么是对的,什么是自然的。这种直觉有时候会过于强烈,以至于成为开始输出的障碍。当你刚开始尝试输出时,你的口语能力可能还追不上你的语感,这种反差可能会让你感到非常不协调。你能意识到许多错误,但还无法纠正它们。
当你步入学习的新阶段时,请记得,犯错是没关系的。
我准备好输出了吗?
如果你对每天沉浸的本土内容有了等级 5 的理解,那么你就准备好输出了。你已经习得了一大块语言,现在只需激活它。
如何开始输出
我们建议从写作而不是说话开始。写作让你有更多的时间去思考,让你表达自己,而不用担心你的口音。
如果你对输出感到焦虑,最好的办法是直接开始写作。当前阶段的目标,是让输出的齿轮开始转动,激活你已经习得的语言。
起步时,任何不会给你带来压力的写作都是个不错的选择。这可以是给自己写电子邮件,也可以是写日记;任何能帮助你流畅表达的,都是好方法。
很快,你就应该找到与母语者进行文字交流的方法。社交互动向你的大脑发出信号:输出是重要的。与真实的人聊天,能将写作转化为沟通,而非仅仅为了练习而练习。在下一篇文章中,我们会提供更详细的入门指导。
在写作时,尽量使用那些你自信的表达。不要为了给人留下深刻印象,而去使用那些你还没习得的高级词汇。
现阶段,不必过于担心犯错。你的语感应该已经足够强,能够防止这些错误变成顽固的坏习惯。至于如何处理错误,我们在阶段 3B 会深入探讨。
3B4:活动指南
在阶段 3B,我们专注于三个独立的领域,为你的口语表达做好准备:
-
通过写作激活已习得的语言。
-
建立正确发音的肌肉记忆。
-
精通日常对话的理解。
语言激活
如 3B:语言激活中所述,你将通过挖掘你潜在的语言能力来磨练你的写作能力。
我们建议你进行实时书面交流。下面是一些你可以找到语言交换伙伴的地方:
应用
网站
如果想到与陌生人交流让你感到不安,你也可以选择聘请一名私教,通过聊天进行交流。比较知名的聘请私教的网站包括 iTalki 和 Verbling。
如果你选择独自写作而非对话,可以使用 iTalki 上的「笔记本」功能,寻找愿意批改长篇写作的人。
锻炼发音肌肉
每天花时间进行影子跟读,并练习你所学语言的绕口令,具体可参考 3B:发音训练。
理解对话
这部分内容与 3A:活动指南无异。继续沉浸在你的语言家长、文字聊天以及脱口秀节目中。
日程示例
-
早上用 Anki
-
整天被动收听你的语言家长
-
花 30 分钟练习输出(写作或影子跟读)
-
花 45 分钟沉浸学习语言家长的材料
-
花 45 分钟阅读或听脱口秀节目
我们建议以天为单位交替进行输出活动,比如第一天专注写作,第二天影子跟读。
进阶
当你对语言家长的理解达到等级 6,并且能够在写作中流畅表达自己时,就可以进入阶段 3C:口语表达。
有些人可能不太喜欢写作,更愿意直接开口说。如果你属于这类,那么可以同时进行阶段 3B 和 3C。
3B1:语言激活
原文:Language Activation | Refold
当你的理解水平达到等级 5 或以上时,大部分理解过都会自然而然、轻松完成。即便你想阻止自己理解,也做不到。这是因为通过不断输入,你的大脑已经在潜意识中构建了一个模型,来理解你的目标语言。因为这个模型运作在潜意识中,所以激活它并不需要耗费心力。你的大脑会自动地使用这个模型,将目标语言输入转化为纯粹的含义,让你能够理解。
而输出能力,就是让这个模型反向运行。当你有想要表达的东西时,你的大脑会通过这个模型将其转换为目标语言。这个过程和理解一样,主要发生在潜意识中。这让输出变得自然而然、轻松自如,这也是流利说出目标语言的关键所在。
学习反向运行这个模型的过程称为「语言激活」。
语言激活的不同阶段
语言激活过程可以分为三个阶段:
-
习得
-
可用
-
激活
习得指的是你大脑中关于语言的潜意识模型。如果你在沉浸学习中能毫不费力地理解某个词或结构,这意味着你已经习得了它。
当你想用目标语言来表达某个想法时,潜意识会在你习得的语言池中搜寻相关的词汇和短语。这些语言自然而然会浮现在你的意识中,我们称之为「可用语言」。
把可用的语言片段组合成完整句子有点像拼拼图。你通过直觉来判断这些拼片是否合适:哪些感觉对,哪些感觉不对。如果你能将它们组合在一起,并且确信它们正确地表达了你的想法,那么语言就被激活了。
激活可以理解为把你的纯粹想法与特定的语言片段相连的过程。一旦建立起这种连接,未来你就能毫不费力地使用这个片段。
例如,假设你的目标语言是英语,你想表达「有一只狗和我住在一起」。你脑中可能会浮现 “I”, “own”, “have”, “pet, “a”, “the”, “dog” 等词。通过反思你的直觉,你能构造出句子「I have a dog(我有一只狗)」。你感觉它是对的,所以你说出它。这样就激活了「I have a __(我有一个……)」这个结构以及「dog(狗)」这个名词。这样以来,未来的你就能轻松使用这种模式。
从写作开始
我们推荐你先从写作入手,而不是直接开始练习口语。正如我们在概述中提到的那样,口语需要同时运用四种不同的技能。而写作能让你专注于把想法转换成语词的过程,这对于语言激活来说,比口语更加理想。
写作的另一个好处是,它给了你更多时间思考。与口语不同,你可以慢慢组装可用语言的拼图,不需要急于回应。
最重要的是,写作提供了一个客观的输出记录,可供评估。这使得写作成为更有效的从母语者那里获得反馈的工具。
解决语言拼图
在写作时,你的目标应该是激活语言。这意味着你应该使用潜意识中自然浮现的语言;写作时不要去查找单词或语法。查资料是一种拐杖,它掩盖了你真正的语言能力。
如果你之前正确地使用过某个短语,那么它会自然而然地出现在你的脑海中,你对此会感到非常自信。
如果你第一次尝试表达某个想法,你也可能感到同样自信。有时候,所有的语言片段都恰到好处地拼凑在一起,你能感觉到这种契合感。它就是感觉对头。在这种情况下,只要说或写这些话一两次,你就能激活这些表达,使其在未来能毫不费力地使用。
然而,更多时候,你对大部分这样的语言拼图都不太确定。你不太清楚怎样组合这些语言片段。可能有些单词浮现在你的脑海中,但你不确定该怎么用。或者,你感觉你知道怎么表达某个想法,但没有十足的把握。
对于这些不确定的情况,你需要确认自己是对是错。不确定性会阻碍语言的完全激活,所以你需要更有信心地确认自己的猜测,以加速激活过程。
校准确定性
当你刚开始输出时,你会对很多实际上正确的事情感到不确定。随着你变得更加自在,你可能会变得过于自信,而不自觉地犯下错误。最终,你会找到一个平衡点,知道自己知道什么,不知道什么。
为了达到这种自知的状态,在输出时你需要运用内省和确认这两种工具。
内省
每次写完一个句子,问问自己,你有多大把握认为它是正确且自然的。
宁愿倾向于不确定也好。只要你对句子感到不确定,犯错就是可以接受的。这种不确定感能防止错误固化成坏习惯。
确认
假设你的对话伙伴愿意帮你纠错,他们能即时给你反馈。每次被纠正时,心里要记下来,以便在今后的沉浸学习中特别注意。
如果你没法找到愿意帮你纠错的人,那就用谷歌搜索来代替吧。(译注:现在还可以找 ChatGPT 来帮你纠错)
在这个阶段,输出应该不是一个创造性的过程。你想说的话,很可能别人已经说过了。用谷歌搜索这个词或结构,看看别的母语者有没有用过相同的表达,它是不是以你认为的那种方式被使用。
用谷歌确认可能有点乏味,还会妨碍交流。如果你只是想轻松聊天,不想太在意确认的事儿,那就在心里记下那些不太确定的点,之后在你的沉浸学习中去寻找答案。
盲点
你难免会犯错,甚至没有意识到这些错误。这类错误你自己是无法纠正的,如果拖得太久,它们可能会变成根深蒂固的习惯。
确保有母语者定期纠正你的写作,这样你才能意识到这些盲点。当母语者指出盲点时,不要只关注具体的错误。通常,一个盲点会导致一整类错误,并在不同情况下反复出现。
比如,许多人会在不知不觉中陷入母语的折痕中。虽然这些句子在他们看来没问题,但母语者可能觉得用词很奇怪,很罕见。
一旦你意识到这些盲点,你就会自然而然地在你的沉浸学习中留意它们,并在尝试输出时避免它们。有了足够的输入,你最终会完全克服这种倾向。
对于获得纠正的小建议
大多数母语者可能都不熟悉 Refold 方法论。他们在纠正你的写作时,往往会尝试告诉你为什么错了。最好忽略他们。母语者通常能够指出你的错误,也能告诉你如何纠正,但他们几乎无法解释为什么。你只需留意他们指出的错误类型,在沉浸学习时加以注意。
像 Tandem 和 HelloTalk 这样的应用可以让你在与母语者实时交流中得到纠正。如果你不喜欢这些应用,可以在网上找找其他语言交换社区。
请注意,母语者并不总是会纠正你。有时他们会被对话吸引,忽略掉一些小错误。偶尔找私教合作也是有用的,因为他们受过专业训练,会指出所有的错误。
如果你想得到专业的纠正,或者你对与陌生人交谈感到紧张,我们建议聘请一位 iTalki 私教。在激活过程的这个阶段,我们建议你与私教进行文字聊天而非口语交流,这样你就可以集中精力提高写作能力。
问题排查
如果你是一个天生的输出者,上述信息应足以让你顺利完成阶段 3。但如果你在输出方面遇到难题,我们也在下一篇文章中提供了详细的问题排查指南。
3B2:输出问题排查
原文:Output Troubleshooting | Refold
如果输出对你来说是自然而然的事儿,那么你可能不需要这份指南。但若你在吸收了大量输入后,输出仍然步履维艰,那这份指南将为你提供一个框架,帮助你思考可能面临的问题以及解决方案。
从根本上说,几乎所有输出问题都能通过增加输入来解决。
激活的各个阶段
正如 3B:语言激活所述,语言在激活过程中经历了三个阶段:
-
习得:此时你正在构建语言的内在认知模型。
-
可用:习得的语言开始浮现在你的脑中。
-
激活:你开始把纯粹的想法与脑海中的语言连接起来。
你的目标是要让目标语言完全习得、随时可用、彻底激活。这样你就能立刻、不假思索地生成你知道是正确的输出。
如果你在输出上遇到困难,可能是因为这三个阶段中的某个环节出了问题。
理想情况
你已经完全习得了一部分语言,并且随时可用。但之前你从未尝试输出过这些语言。
每当你第一次尝试输出某个词语或短语时,都会有一些犹豫。一旦你输出过这个短语一两次,它就会被完全激活,犹豫也随之消失。
可用性问题
你可能已经完全习得了某个语言知识(即你在沉浸学习中能轻松识别和理解),但并不意味着它随时都可用于输出。
部分可用
部分可用的语言有三种情况:
- 不完整:脑海中浮现某些短语,但不足以完整表达你的意思。
比如,你想到了个名词,却想不起与之相配的动词。2. 不确定:脑中出现了某个词,但你对它不太确定。虽然拼图似乎能拼在一起,但总感觉有点不对劲。3. 目标语言冲突:脑中同时出现两个不同的表达方式,你不确定哪个是对的。
在这三种情况下,你只需要更多地接触这个词汇或语言模式,就能建立起自己使用它的能力。请记得在沉浸学习中留意这类模式。你也可以尝试当场谷歌或找母语者确认。
想了解更多,可参阅 3B:语言激活中《确认》一节的说明。
母语冲突
在语言输出时最常见的错误之一,是人们倾向于从母语翻译到目标语言,而不是用目标语言自然的表达方式。
这就像我们之前提到的纸鹤比喻,意味着你又回到了母语的折痕。正如我们在 2B:自然单语过渡中所讲的那样,每种语言都有其特有的看待世界的方式。想要用目标语言自然地表达,你需要理解并接受这种语言的世界观。
大多数情况下,你实际上已经习得了所需的语言,只是需要转变你的思维方式。解决这个问题的关键在于提出正确的问题。不是去问「我该怎么说?」,而是要思考「一个母语者在这种情况下会怎么说?」。这样微妙地转变问题的角度,往往能激发你的潜意识输出完全不同的结果。
不可用
有时候,即使你已经完全习得了某个语言知识,但当你需要用到它的时候,它却不会自然地浮现在你的脑海中。你觉得自己知道该怎么表达,却怎么也想不起来。
你的大脑会自动记录这些令人挫败的瞬间,并对它们变得更加敏感,以便在你的沉浸学习中留意到它们。由于频率错觉,你可能会发现这种情形似乎无处不在。
只要是你已经习得的内容,下次再遇到时,你通常会有一个尤里卡(eureka)的时刻,那时这个语言表达就会在你下次输出的时候变得可用。
你也可以有意识地通过谷歌搜索这个表达。但是,如果你对搜到的答案感觉陌生,那就意味着你还未真正习得它,你应该避免在对话中使用它。
习得问题
部分习得
如果你在沉浸学习中能识别并理解某个词汇或短语,但还需要付出一定的脑力劳动,那么你可能还没有完全习得它。当你试图在输出中使用这样的短语时,最初可能会感觉像是可用性问题。
要判断这是可用性问题还是习得问题,可以使用谷歌搜索或询问母语者来确认短语的正确用法。如果正确的表达在你脑海里感觉既熟悉又清晰,那么这是一个可用性问题。如果感觉不太熟悉,或者意义不够明确,那么就是习得问题。
解决习得问题需要的是更多的沉浸学习。在这种情况下,频率错觉会让你在沉浸中更频繁地注意到这个词汇或短语,帮助你完全习得它。
在你能够在沉浸中观察到其正确用法之前,尽量避免使用这些未习得的语言。
部分习得——语法
如果你在理解某种特定语法形式时没有问题,但在输出中反复遇到困难,这表明你还没有完全习得这种语法。
可理解输出假说认为,在输入过程中,你可能不会总是注意到语言的具体语法或句法,因为这些对理解来说并不必要。当你试图在输出中使用尚未习得的语法时,你会遇到困难。这种困难会提示你的大脑在沉浸中寻找该语法的示例,以便更快地习得它。
通常情况下,我们建议在你完全习得这种语法前,避免使用它。不幸的是,这可能做不到。许多语法形式是日常输出所必需的,即使你还没有习得它们,你也需要使用它们。
只有在这唯一一种情况下,我们会建议在输出时进行有意识的监控。如果你无法避免这种错误,那就得有意识地学习正确用法,在输出时仔细检查自己的使用是否正确。随着时间的推移,你会习得这些语法,不再需要自我监控。
未习得
如果你还没学会理解某个领域,自然就无法用语言表达这个领域的事物。
如果你不知道如何表达某事,那就不要强行尝试。说一些你有把握的话。不要试图使用高深的词汇、复杂的概念,或你还没学会如何理解的领域。
记住,你当前的目标是精通日常对话这个领域。不要企图在物理学或政治学上写论文。
对于自己知识上的缺口,不必自责。一旦你精通了第一个领域,向其他领域扩展就会变得更加简单。在阶段 4,你将开始攻克新领域。
3B3:发音训练
原文:Pronunciation Training | Refold
拥有悦耳、清晰易懂的口音能快速与母语者建立深厚的联系。改善口音能减轻交流中的障碍,不管是交朋友、给约会对象留下好印象,还是找工作都会更加顺利。
发音主要是一种身体技能,需要通过身体训练来掌握。不幸的是,仅仅通过语言输入,无法确保你的发音准确。
语言输入可以让你准确地感知目标语言的声音,从而帮助你自我纠正发音。
如果没有这种能力,你就几乎不可能达到与母语者相似的口音。虽然母语者的纠正和口音消除课程可能有所帮助,但如果你听不出自己的口音问题,你能取得的进步是有限的。
肌肉记忆
Refold 的标志是一只纸鹤,寓意着学习第二语言就像是将折好的纸鹤展开,再用这张纸尝试叠出新的结构。
用已经折过的纸再折出新造型的挑战在于,纸张会记住原来的折痕,想要不顺着这些痕迹折叠是很难的。
这个比喻非常适用于口腔的肌肉记忆。外国口音之所以出现,很大程度上是因为我们的口腔已经习惯了某种发音方式,改变这种习惯非常难。
要想说话没有口音,你需要培养出像母语者一样的口部运动模式的力度和精准度,同时放松那些母语者不常用的肌肉。
给你的口腔重新编程
当你开始说目标语言时,你可能会感到口腔疼痛。因为你以前从未这样使用过你的口腔。
你需要像锻炼身体其他肌肉那样对待你的口腔。这包括热身、伸展和锻炼。对于口腔来说,这些动作被称为「发音锻炼」。
发音练习
发音练习有很多种类,其中一些会根据具体语言有所不同。
口腔放松技巧
在尝试开口说话时,你原有的肌肉记忆会有所抵抗。遇到这种情况时,可以尝试使用歌手和演讲者所用的口腔放松技巧。
口腔的拉伸与热身
要想流利地说目标语言,你的口腔动作必须与以往大不相同。进行口腔拉伸能帮助放松你在说母语时常用的肌肉,让它们更自然地适应目标语言。
同时,如果你在说目标语言时感到口腔酸痛,做些拉伸运动能帮助肌肉更快恢复。
下面这个视频的前半部分会教你如何进行口腔拉伸。后半部分是针对英语学习者的发音练习。
绕口令
绕口令是故意设计成难念的句子,有时念错了会产生搞笑效果。绕口令的难点在于要快速地在语言中相似(但又不同)的发音之间切换。
大多数语言都有绕口令,这些绕口令对训练口腔快速在不同发音间转换的能力非常有用。
清晰发音练习
这些练习类似于绕口令,但通常不是单词或句子。它们更多是串联的辅音和元音,通过变换顺序来提高说话的精准度和清晰度。
例如,以下视频展示了一些专为英语学习者设计的练习:
- 公共演讲的发音练习
特定发音
有时,你可能难以在目标语言中发出某些特定发音。比如,对很多学习者来说,卷舌 R 音是个挑战。
先了解这个发音的名称,然后在谷歌上寻找相关练习指导。每天练习这些难点发音,直到你能顺利发出它们。
影子跟读
这些练习很有用,但要真正掌握自然的发音,你需要用真实的语言来练习。
一些人会录下自己大声朗读书籍的声音,然后回听自己的录音来练习。这种方法的问题是,你没有一个明确的对照标准。
取而代之,我们建议你影子跟读你的语言家长。
什么是影子跟读?
影子跟读法是一种练习方式,你需要听你的语言家长说话,然后跟着复述,接着把你的发音和他们的对比。因为有了直接的对照,你可以清楚地发现你们发音之间的差异。接着,你可以针对这些差异进行特定的练习,形成一个反馈循环,使你的发音越来越接近于你的家长。
前提条件
我们不建议在你对语言家长的理解达到等级 5 之前开始影子跟读。你应该能够听清你的家长说话时的每一个单词。
如果你听不清你的家长,就难以辨识你和他们的发音差异。这可能会导致建立错误的肌肉记忆和糟糕的发音,日后想改正会很困难。
先在母语中练习影子跟读
影子跟读是需要练习才能掌握的技能。通常来说,你的大脑不习惯于在短期记忆里保留确切的措辞,它更倾向于只捕捉意义,而忽略具体的词句。
要培养这项技能,建议你先在母语中练习影子跟读,然后再尝试你的目标语言。
影子跟读的类型
影子跟读有两种类型:连续跟读和完美句子跟读。它们各有所长,因此我们推荐两者结合练习。
连续影子跟读
连续跟读是指一边听你的语言家长说话,一边大声实时复述。即使你出错或跟不上,也要继续下去。
连续跟读的不间断性有助于你进入心流状态,这对于建立肌肉记忆是非常理想的。缺点是,它可能有点混乱,让你难以专注磨练正在努力学习的特定发音。
可以看看下面这个视频,里面展示了英语的影子跟读实例:
在开始时,你可能无法跟上你的语言家长,这很正常,关键是要继续跟读,不要太在意准确性。不要暂停或倒带,尽你所能在整个练习过程中模仿家长。
对已经听过的音频进行影子跟读可能有帮助,但不建议对同一段音频反复跟读。
一旦你能够顺畅地跟上,就把注意力转移到你的发音是否与他们的相似上。你的注意力应该平均分配在你的家长和你自己的声音上。影子跟读的目的是调整你的发音,所以不必太关心家长所说的具体内容。注意你和家长发音上的差异,会自然地让你的发音随着时间变得更准确。
想深入了解连续影子跟读的解释,请观看以下视频:
进行连续影子跟读的最简单方式是通过扬声器或耳机听你的语言家长的录音,并大声复述他们所说的话。为了正确进行这个练习,你必须能够同时听到你的家长和你自己的声音。
将音量调整至合适的水平可能有点难。人们常常反映,要么听不清自己的声音,要么听不清音频里的声音。
为了解决这个问题,可以使用麦克风或音频接口,通过耳机听到自己的声音。这样做的一个额外好处是,能更客观地听到自己的声音。你可以选择让自己的声音进入一个耳朵,而家长的声音进入另一个耳朵,或者两者声音都进入两个耳朵。
使用这种技术时,请确保你的音频设置对你的声音延迟很小。如果延迟超过几百毫秒,会严重影响你的说话能力。实际上,有一种设备叫做「说话干扰器」,就是利用这种原理工作的。
完美句子影子跟读
完美句子影子跟读是指,你先听语言家长说完一句话,然后尽可能地模仿这句话并录音。接着,把你的录音和原声对比,找出其中的不同之处。
完美句子影子跟读特别适合磨炼那些让你困扰的特定发音或发音组合。不过,由于它的间断性,对于整体节奏和流畅度的训练效果相对较弱。
可以用 Audacity 这样的应用程序,单独剪辑出语言家长说话的单句片段。先多听几遍这段话,让它留在你的短期记忆里,然后尽可能地模仿并录下你的发音。接着,多次回听你的录音和原声,注意其中的差异。之后,再次录制你对这段话的发音,尝试减少差异。重复这个过程,直到你觉得你已经达到了极限,然后再换一个新句子。
像 Audacity 这样的工具还能让你将两段音频叠起来。这样一来,识别发音上的差异就变得非常简单了。如果你的发音有误,就会在叠加的音频中听到不协调的声音,听起来会很刺耳。想要了解如何叠加音频,可以参考相关的指南。
「完美句子技巧」这个术语是由多语言者 Marc Green 提出的。他的方法是这样的:你和一个说该语言的母语者一起,大声读出一句话。他们会对你的发音进行评价,然后再给你读出同一句话。你不断重复这个过程,直到对自己的发音感到满意。
在 Refold 中,当你开始练习完美句子影子跟读时,你已经能够准确地感知到目标语言的发音。这意味着你可以自己成为练习的伙伴,给自己提供反馈。当然,如果你觉得自己在发音上有困难,寻找一位该语言的母语者,按照 Green 原来的方法练习,也是非常有帮助的。
3C5:活动指南
到了这个阶段,有多种不同的活动可供选择。你需要制定自己的计划和日程,专注于个人目标。
以下有两个专注方向可供选择:
-
拓展你的口语能力。
-
提高你的口语表现。
专注口语能力
如果你刚开始练习口语,那我们建议你先专注于提升能力。你需要习得母语者在说话时的许多微妙之处。你可能还存在一些从阶段 3B 遗留下来的能力缺口。
为了提高你的口语能力,你需要专注于以下三个方面:
-
口语专项习得
-
一般习得
-
激活已习得的语言
口语专项习得
如 3C:口语能力所述,在提高口语能力时,你需要关注许多新的语言特征。在模仿这些特征之前,你需要培养自己去察觉它们。
持续沉浸学习电视节目,直到你的理解水平达到等级 6。花时间主动收听,留意每一种新的语言特征。
一般习得
开始说话时,你会碰到一些能理解但不太确定如何使用的词汇和语法结构。这些是你想要迅速填补的能力小缺口。多沉浸学习日常对话(阅读和口语)及你经常讨论的各个迷你领域。按照 3B:输出问题排查中的建议,找出并填补你的习得缺口。
警告:如果你频繁出现能力错误,这意味着你还没准备好开口说话。此时,你应该已经能够对语言家长和日常生活剧达到等级 6 的理解水平。如果你还没有达到这个水平,那就继续沉浸学习!
激活已习得的语言
在阶段 3B 的写作练习中,你应该已经激活了大部分所习得的语言。如果你在尝试开口说话时感到脑袋空空,那你可能还需要激活更多语言。
继续通过在线文字聊天与人交流。也可以利用长篇写作来激活大量新学的词汇,并巩固你的语法能力。
虽然大部分语言应该已经被激活,准备好用于口语,但有时你需要说一两次,才能完成最后的连接。通过独白或与母语者随意交谈,让自己有机会完成最后的口语连接。
专注口语表现
如果你对自己目前的能力水平(比如写作能力)还算满意,但对口语能力感到困扰,那么你需要的就是练习提升口语表现。
提高口语表现能让你在交谈中更加自信、自在。你需要关注的四个方面包括:
-
成为优秀的对话伙伴
-
说话时的轻松自在
-
语言的准确性
-
发音
成为优秀的对话伙伴
成为优秀的对话伙伴,意味着你能够倾听对方,专注于他们所说的内容,并适时给出反馈,让他们知道你在听。
你理解对方的能力越强,就越能够聚精会神地听他们讲话。通过观看脱口秀节目和其他带有背景噪音的音频,来提高你的听力,直至你能毫不费力。特别要注意倾听反馈(backchanneling)、发言者过渡以及社交反应,这样你才能弄懂在你的语言和文化背景中什么是合适的。在与母语者进行随意聊天时,试着模仿这些。
轻松自在地说话
要想轻松自在地说话,关键是多练习。你得经常参与到对话中,不断地让自己置身于交流之中。可以通过独白来练习,这样压力较小,但也要确保你有机会和真实的人进行真正的对话。
如果你在让自己说话变得轻松自在中遇到难题,不妨翻翻 3C:口语问题排查,那里有很多改进的建议和技巧。
语言准确性
你得确保自己的语言使用准确无误。录下自己的对话再回听,这能帮助你提高语言的准确性,但得到母语者的反馈也同样重要。母语者会指出你自己可能没察觉到的语言能力上的缺口。
想了解如何获取关于口语能力的反馈,可以参考 3C:口语练习。
发音
3B:发音训练里面提到的所有练习方法依然适用。要确保你还在积极地模仿你的语言家长,并且注意到 3C:口语能力中所强调的语言特征。
继续进行影子跟读,同时试着按照 3C:口语能力中的方法,模仿你的语言家长。
日程示例:能力
假设你每天有两小时可以专心学习:
-
15 分钟用 Anki
-
60 分钟沉浸学习脱口秀和日常生活剧
- 再加上一整天的被动收听。
-
45 分钟用于激活和口语练习
- 闲聊或写作
日程示例:表现
假设你每天有两小时可以专心学习:
-
15 分钟用 Anki
-
60 分钟沉浸学习脱口秀和语言家长
- 再加上一整天的被动收听。
-
45 分钟用于口语或发音练习
-
影子跟读
-
模仿
-
矫正对话
-
进阶
在阶段 3 结束时,你应该能够自如地进行日常交流。当你想扩展到新的领域时,就可以进入阶段 4。
3C2:培养口语能力
原文:Build Speaking Competence | Refold
至此,你在日常对话这一领域已经达到了非常高的理解水平。现在,理解本身不再是障碍,你就有足够的精力开始注意母语者在讲话中那些更细微的地方。注意并模仿这些微妙之处,对于让你的口语听起来更像母语者至关重要。
下面,我们将解释三类你在模仿母语者时,应该注意到的语言特征:
-
母语者表达了什么想法?
-
在表达这些想法时,他们是怎样措辞的?
-
他们又是如何用言语表达这些措辞的?
你不该期待在阶段 3C 结束时就能完全掌握这些。要精通所有方面,是一项持续终生的努力。这里列出的,只是你在收听和模仿你的语言家长时,应开始留意的事项。
母语者表达了什么
说外语并不仅仅是把相同的想法换成另一种语言的词汇表达。每种语言中,人们通常会表达的想法有所不同。为了说得更地道,你需要表达目标语言中常见的想法,同时避免那些不常见的。
比如,在美国,人们经常问对方星相和星座。但在日本,几乎没有人讨论星相。如果你问一个日本人他的星相,他可能会一头雾水。
相反,在日本,人们常常谈论血型以及血型所对应的性格特质。如果一个日本人对美国人说他的性格跟血型不符,那美国人可能会感到非常困惑。
了解你学习的目标语言中常见的想法是非常重要的,它有助于让你的表达听起来自然,并避免沟通时出现障碍。
社会背景
在不同的社交场合,每种文化和语言都有其独特的行为准则和反应模式。这包括非语言的肢体动作、恰当的发言时机、避免独霸话题等。如果你的行为与对方的期待不符,可能会让人感到不自在。
比如,在英语交流中,别人夸奖后表达感谢是很常见的。但在日语里,人们通常会谦虚地否认夸奖,甚至会说实际情况恰恰相反。
这些社交反应和行为习惯在不同的语言和文化背景中各有差异,因此,针对你学习的目标语言,你需要有意识地去发现和实践这些特定的社交行为。
地道的遣词造句
尽管你可能完全理解母语者所说的话,但在措辞和语境上有一些微妙之处,可能不会立即显现。
同样的想法,不同的措辞
即使在你的母语和目标语言中存在相同的想法,其表达形式也大相径庭。
比如,在英语里我们会说 "I am hungry"(我饿了),但在西班牙语中表达为 "I have hunger"(我有饥饿感),而在日语里则说 "My stomach has become empty"(我的胃空了)。
通过沉浸学习,你可能已经发现了不少这样的例子。继续留意目标语言中表达特定想法的方式,以避免直接从你的母语硬套过去,造成不自然的表达。
语体风格
即使在在同一文化内,我们会根据不同的场合使用不同风格的语言。这些不同的风格被称作「语体风格」。
比如,很多语言在礼貌用语和日常用于中会有不同的语体风格。这种差异可能体现在词形变化、词汇选择,甚至是表达方式的直接程度上。
以英语为例,如果你不认识对方,用祈使句通常会被认为不礼貌。在餐馆里,我们往往用问句或陈述句来表达请求,比如:"I would like two tacos, please"(我可以要两个墨西哥卷饼吗?)或 "Can I have two tacos"(我想要两个墨西哥卷饼,谢谢);这样听起来比 "Give me two tacos"(给我两个墨西哥卷饼)要礼貌得多。
在西班牙语中,用「我想要两个墨西哥卷饼,谢谢」这样的表达会显得过于正式。直截了当地说「给我两个墨西哥卷饼」反而更加自然。
了解给定语境下正确的语体风格,是帮助你融入母语者、避免尴尬的关键。
母语者的语体风格错误
并非所有语体风格错误都会让你听起来像外国人。有些错误连母语者也会犯。比如在《窈窕淑女》这部剧中,就讲述了一位英国高贵的英国绅士教一个底层的卖花女如何使用上流社会的语体风格。
要精通某个特定的语体风格,最好的办法是像剧中的伊莉莎那样,将其与日常交流区别开来单独练习。
填充词
即便是母语者,在交谈时也不总能做到完全流畅、毫不犹豫。他们经常会停顿一下,思考合适的用词。这种在停顿时使用的词我们称为「填充词」。如果使用得当,它们可以让你说话的停顿显得非常自然。
英语中常见的填充词包括 "uhm" 和 "like"。
因为填充词并不传达具体意思,所以在听别人说话时,我们的大脑往往会自动忽略它们。实际上,你对目标语言的理解越深,就越不容易注意到这些填充词。
为了克服这一点,在沉浸学习语言家长的内容时,你需要刻意去听这些填充词。尝试区分不同填充词的细微差别,以及应该以什么样的频率使用它们才能听起来自然。
纠正口误
母语者在说话时经常会在句子中途改变原先的表达,这是很常见的现象。不同于写作,你可以随时修改前面的想法或措辞,在口语中,你需要实时覆盖之前的想法,以便澄清或改述。
每种语言中母语者纠正口误点方式都是独特的。学会像母语者那样灵活转换,可以在你犯错时避免给人留下语言能力不足的印象。
英语中的例子:
-
“He was really tall, well, I mean, not that tall, but like, tall for a kid”.(他个子很高,我是说,不是特别高,但对一个孩子来说算高的。)
-
“I’ve been feeling really lazy lately… well… now that I say it out loud, it’s not really laziness. More like lethargy.”(最近我感觉特别懒……嗯……现在我大声说出来,感觉不是懒,更像是无力。)
开始留意母语者在你的目标语言中纠正口误的具体方式。
口语连接词
口语连接词能帮助你顺畅地延续一个想法或从一个想法过渡到另一个。在同时表达多个想法时,它们对于自然地串联思绪非常重要。
这里有一个句子延续和视角转换的例子:
“So I went to the market, and there was this guy there, and he told me about this concert tonight, and I was like, “Oh my god, my friend loves that band”, and so I had to text you to see if you wanted to go.”(「所以我去了市场,那儿有个人告诉我今晚有个音乐会,我当时就想,『哦天哪,我的朋友超喜欢那个乐队的』,所以我得发信息给你,看你想不想去。」)
在上面的例子中,使用了三种类型的连接词。“And” 连接了一系列的想法来讲述一个故事。“I was like” 这种口语化表达使说话者能从过去转换到现在的说话视角,并引用自己的话。连接词“ “so” 在前面的想法和后面的想法之间建立了因果关系。
留意母语者是如何连接想法、回溯修改想法或者转移话题的。这些连接词将帮助你更自然地说话。
发言者的过渡
在对话中,存在一些固有的方式来将你的话语与前一个发言者的话语联系起来。这些过渡有助于将你的想法置于之前表达过的想法的背景下。
例子:
发言者甲:“I believe that apples are the best fruit.”(我认为苹果是最棒的水果。)
确认并扩展:“Absolutely, I couldn’t live without apple pie.”(非常同意,没有苹果派我简直活不下去。)
强烈反对:“Definitely not. Oranges are better.”(完全不对,橙子更好。)
委婉反对:“While I agree apples are great, I prefer grapes.”(虽然我同意苹果很棒,但我更喜欢葡萄。)
这些过渡使对话在每个发言者及其想法之间自然流转。
倾听反馈(Backchanneling)
当你在对话中,而对方正在说话时,你需要提供反馈,以显示你在认真听对方讲话。这种行为被称为「倾听反馈」。
倾听反馈可以是确认、口头反应或身体反应。在英语中,“Yeah”,“totally”,"uh-huh",以及点头都是表明你在注意对方讲话的确认信号。
每种语言和文化在对话中对于倾听反馈的类型和数量的期望都不尽相同。例如,相比英语,在日语中,你被期望更频繁地进行倾听反馈。如果你不增加倾听反馈,你的对话伙伴可能会认为你很失礼。
地道的发音
大多数人在谈论发音时,通常只考虑元音和辅音,但实际上,发音还有许多更深层次的要素需要考虑。
音素
当普通学习者思考发音时,他们通常关注的是音素:语言中存在哪些元音和辅音。当然,元音和辅音是发音的基础,掌握它们至关重要。
你还需要能够准确发出单词相邻时的连读音。这些连读有些可能会体现在书写中(例如,“can’t”),而有些则不会(例如,“youwanna” = “do you want to”)。
当你完全理解一种语言时,你可能不会注意到许多这样的连读。你的大脑会自动将它们转换为多个单词。在收听你的语言家长时,🈶️有意识地关注他们发音的具体音素。
词汇层面
根据语言的不同,除了音素之外,可能还有其他语言特征可以改变单词的含义,如果你的目标语言包含这些特征之一,在你的沉浸学习中一定要注意它。
重音
「重音」是指对单词中某个特定部分的强调。在有重音的语言中,错误地强调单词的某一部分可能会使其难以理解,甚至完全改变其含义。
例如,在英语中,当一个词既可以作名词也可以作动词时,通常使用重音来指示应该如何理解这个词。第一个音节重读时为名词,最后一个音节重读时为动词:如 PERmit(名词)与 perMIT(动词)。
有时,当单词组合使用时,它们被视为一个单独的重音单位。
例如:bad TEMpered1
在给定的语境和含义中,单词通常只有一个正确的重音。如果你的目标语言中有单词级或音节级的重音,刻意学习并练习正确的单词重音,可以使你听起来更自然。
音高重音和声调
在某些语言中,音高或声调的变化是单词的基本发音的一部分。在这些语言中,用不同的音调发出相同的音素,可能会产生完全不同的含义。如果你的目标语言具有音高或声调特征,刻意学习并练习这些特征是非常有用的。
韵律(句子层面)
重音、音高、声调、强调和节奏可以在句子层面上使用,以改变句子的含义或情感状态。
例如,在英语中,如果句末的音高上扬,这个句子通常会被解读为一个疑问句:“I’m in charge”(我负责)对比 “I’m in charge?”(我负责?)。
韵律可以影响句子含义的解读(比如让你听起来像是在讽刺)。
英语例子:"I didn't say that".
I didn’t say that:强调 "I" 表达了对指控的拒绝和责任的转移。可以翻译为「说那话的不是我」。
I didn’t say that:强调 "didn't" 表达了对指控的否认,可以翻译为「你指责我说了某事,但我并没有说」。
I didn’t say that:强调 "that" 表达了对特定观点的拒绝,可以翻译为「我确实说了些什么,但你误解了我的意思」。
这些韵律方面的细微差别通常难以刻意学习,必须通过输入来习得。
口音
即使在同一种方言中,也常常有许多不同的口音。例如,在美国,波士顿和纽约有不同的东北口音,路易斯安那州和乔治亚州有不同的南方口音。甚至在同一城市的不同街区之间,口音也可能存在细微差异。
当你听到一个与你语言家长的口音不同的人说话时,尝试留意任何细微的差异。将你想要学习的说话风格与其他风格对比,可以帮助你注意到语言家长口音中的微妙之处,从而更好地模仿。
同时,也要意识到不同口音可能会带有的文化内涵和背景。如果你带着波士顿口音在纽约走动,就要准备好就棒球问题展开争论了。
3C1:能力(Competence)与表现( Performance)
原文:Competence Vs Performance | Refold
语言学家诺姆·乔姆斯基提出,语言能力(ability)包含两个方面:能力(competence)和表现(performance)。当你在语言输出中犯错时,要正确地判断这是能力问题还是表现问题,这样才能选用合适的练习来改正。
请注意:我们的目标并非教授语言学,而是为语言学习提供一个框架。我们对这些术语的使用可能与严格的语言学定义有所出入。想要深入了解原始的语言学概念,请参考相关的维基百科页面:Competence 和 Performance。
能力
在你习得语言的过程中,大脑会无意识地构建出这种语言运作的模型。所谓的能力,就是指这种无意识的模型。它包含了语言的各个方面,如词汇使用和习语、语法和发音。
你可以通过直觉有意识地调用这种能力。这种直觉让你能感觉到什么是正确的,什么是错误的。
在阶段 3B,我们讲解了语言如何从习得到激活。通过这一过程,你可以识别出自己还未习得或尚未可用的语言部分。这些在习得或可用性上的不足,就是能力方面的问题。
表现
即便掌握了语言的必要能力,也不意味着你在实际说话时就能够顺利运用。回想一下我们在阶段 3 概览中提到的,说话实际上涉及四种不同的技能:
-
理解你的谈话对象。
-
迅速将你的想法转化为言语。
-
动嘴发音。
-
展现自然的举止和表达风格。
在说话过程中,你需要分配注意力来同时处理这四个子技能,在时间的压力下进行,而且没有修改的机会。这几乎使得你的口语表现不可能完全达到你的能力水平。
所谓的表现,指的是你将语言能力转换成正确且连贯的输出。你的表现受到你能力的直接限制。如果你只是在猜测哪些听起来正确或错误,你就无法自然地说话。
但是,能力并不能直接转化为表现。你可能在写作时能够流畅表达自己,但这并不意味着你能够轻松地口头交流。如果你在这四个子技能中的任何一个上遇到难题,你就会在说话时支吾其词。
你的能力越强,实现高水平表现的潜力就越大。但是,就连母语者有时也会在表现上遇到困难,比如口吃、口误或在压力下说话结巴。
通过输出练习可以提高表现。阶段 3C 的目标,是通过输出练习来缩小你的能力和表现之间的差距。
表现不是非黑即白的,而是一个光谱。表达任何一个想法都有很多正确的方式,它们在文雅程度、简洁性和准确性上各有千秋。一旦你的输出能力达到了基础水平,你就可以开始挑战这些更高级的表现目标。我们会在阶段 4 进一步探讨这个话题。
识别错误
根据能力与表现的区别,我们可以将输出错误分为两类:
-
基于能力的错误
-
基于表现的错误
不同类型的错误需要不同的练习活动来纠正。
能力型错误
当你还未习得相关语言知识时,就会犯能力型错误。比如,你可能会发音不准确,因为你是通过阅读学到这个单词的,而在听力中对它的接触还不够。
你通常不会意识到你犯了能力型错误。正如我们在阶段 3B:输出问题排查中所讨论的,你需要通过母语者的纠正,才能意识到这些错误并加以改正。在同一篇文章中,我们还解释了一旦意识到错误,大脑就会在沉浸学习中寻找纠正方法。通常情况下,意识加上输入就足以纠正能力型错误。
此外,你还可以通过有意识地监控自己来弥补这些不足,在每次输出时自我检查。尽管如此,在你通过输入来弥补能力上的不足之前,监控只是权宜之计。
表现型错误
表现型错误更容易识别。你已经有了相应的能力,也知道应该怎么说,只是一时疏忽了。
其中一些错误,你在犯下的那一刻马上就会意识到,但有些则可能被忽略。当你全神贯注于对话时,用来观察自己说话的心力就不多了。这就是为什么我们推荐录下你的对话,以便事后回听。
因为你的能力已经培养得很好了,所以你的大多数错误都将是表现型的。回听自己的对话录音时,识别这些错误应该比较容易。一旦找出错误,你就可以通过有针对性的输出练习来纠正。
如何识别和纠正错误
在写作中,你有机会在事后对所表达的内容进行修改,这让识别和修正错误变得非常直接。
相比之下,口语表达则带来了发音和时间压力方面的额外挑战。这导致了在写作中不会出现的一些能力和表现上的错误。
在阶段 3C 的其余部分,我们会详细介绍你在口语表达时可能遇到的各种问题,以及应对这些问题的方法。
3C3:口语练习
提高口语能力是一辈子的事,你可以想走多远就走多远。下面概述的练习对于新手和老手都很有帮助。
对于学习者和母语者来说,提高口语表现主要有两个方面:
-
让自己置身于新的情境中,拓展自己的口语能力。
-
录下自己的讲话,刻意回顾和练习,以提高自己的表现。
下面我们介绍了四种不同的练习,你可以用它们来拓展和完善你的口语能力。根据你的个性,你可能会发现其中一种或多种练习比其他的更有趣、更有益。我们鼓励你尝试所有练习,以找到最适合你的方式。
独白
如果你在尝试开口说话时感到社交焦虑,独白练习是一个很好的开始,可以帮助你逐步习惯说话,而不需要立即面对社交压力。所谓独白,就是指你独自一人或面对摄像机,谈论某个想法、问题,或讲述一个故事。
独白最关键的一点是不要提前准备说什么。如果你仅仅是背诵并复述一段独白,那么你并没有真正锻炼你的口语能力。你的目标是练习即兴发言。
这些独白无需过长,1 到 5 分钟就足够了。如果你不确定要说什么,以下是一些建议:
-
观看一段视频或阅读一篇博文,然后用你自己的话来概述。
-
使用随机话题生成器来为你提供发言的提示词。
在说话时,不要担心犯错。把你的精力集中在整理思维并将其表达出来上。当你事后回看(或重听)自己的录音时,你可以专注于发现错误,并纠正错误。我们在本文的最后部分会说明如何评估这些录音。
模仿语言家长
如 3A:认领语言家长中所述,想要讲得像母语者一样「地道」是个相对模糊的目标,因为每位母语者的说话方式都有所不同。如果你想说话听起来像母语者,你应该模仿一个具体的母语者(你的语言家长)。
到目前为止,你一直在影子跟读你的语言家长,即精确地重复他们所说的话。这样做让你能够专注于说话的口腔动作,而不用考虑如何将思维转化成言语的心理过程。
另一方面,全面模仿则意味着要化身为你的语言家长,用他们的风格表达自己的思绪。在有具体文本可背时,模仿某人相对简单;但模仿他整个灵魂,并照着他的思考模式和逻辑说话,要难得多。
当你尝试模仿你的语言家长时,你会自然地开始更加关注他们说话方式的细微差别,而不仅仅是他们说了什么。这些是你之前可能没太注意到的。比如肢体语言、语调、反应和填充词。
要模仿你的语言家长,请观看他们的视频,尝试用自己的话总结相同的话题或故事,但要有他们的个性。如果你发现难以模仿你的语言家长,可以先尝试一个更简单的练习:即记忆一段独白,并按照他们的个性进行表演。
录下自己的表演,在回放时将你的举止与他们进行比较。
真实对话
对大多数学习者而言,与母语者进行面对面的交流是学习语言的核心目的。真实的对话是无可替代的。没有与真人进行实际的对话练习,你无法在口语上达到流利自如。
如果你在说话时发现自己想得太多,我们建议你即便觉得自己还没准备好,也应该勇敢地投入到真实对话中。对话节奏通常较快,不会给你想太多的机会。这能帮助你摆脱过度思考的困扰,更自然、更直觉地使用语言。此外,对话还能带来与真人建立联系的愉悦体验。
刚开始与人交流时,要同时在倾听、思考和表达之间找到平衡可能会有些困难。这需要一段时间去适应,但很快你就会习惯。
你可以利用多种语言交流平台(例如 HelloTalk、Tandem、Discord)来在线上结交母语者朋友。待新冠疫情封锁结束后,也可以参加面对面的语言聚会。走出去,交些朋友!
要注意,大多数母语者不会纠正你的所有错误。只要他们能理解你的话,通常会自然地忽略掉大部分错误,以保持对话流畅,避免显得不礼貌。如果你通过视频或语音聊天与母语者交谈,不妨询问对方是否可以录音,这样你就可以事后回顾,自行发现并纠正错误。
专业纠错
遗憾的是,语言交流并不能替代专业私教的指导。在你的语言水平达到较高程度之前,语言交流是练习真实对话、结交朋友的好地方,但它无法提供你所需要的精准反馈,以助你提高。
找到一位了解你正在积极提高语言水平,并愿意仔细纠正你的母语者是非常值得的。例如,iTalki 上的私教便是获得专业纠正的好资源,他们通常也不介意被录音。
一定要告诉你的私教,你希望他们指出你的每一个错误,这样你才能意识到并加以改正。
回顾你的录音
一旦你有了自己的录音,就该复习了!记住,最重要的是要留意自己的错误。仅仅注意到错误,通常就足以解决问题。
一旦你发现了一个错误,试着判断它是能力型错误还是表现型错误。如果你不确定该如何正确表达,那就是能力型错误。如果你的反应是「哦,原来如此」,那这就是表现型错误。
对于能力型错误,3B:输出问题排查中建议仍然适用。确认它是习得、可用还是激活错误,并采取相应行动。
对于表现型错误,尝试再说几遍,以熟悉正确的说法。如果问题在于发音,那么录下自己的声音,回放听听看是否有所改善。你也可以使用 YouGlish 等工具,找到母语者说同样话语的例子,比较你的发音与他们的区别。
3C4:口语问题排查
原文:Speaking Troubleshooting | Refold
我们调查了我们的社区成员在口语方面遇到的难题,并将最常见的问题整理成了这份指南。
心态准备
你在 3C 阶段的目标并不是 100% 精通这门语言。你应该追求的是 B2* 级的熟练程度。这意味着你能够使用相对简单但正确无误的语言,就你的生活和感兴趣的话题进行闲谈。(译注:指的是欧洲共同语言参考标准中的 B2 水平。)
不必想着要说得多么地高深或者雄辩。说话简单易懂即可。使用那些你有把握的词汇和短语。尽量避免去猜怎么表达。当你不得不猜时,留心区分哪些是猜测,哪些不是。这样可以帮助你避免养成坏习惯。
你的目标是以自然而准确的方式表达你的想法。一旦你掌握了日常对话这一领域,你就可以进入阶段 4,那时你将专注于使你的表达更精准、更具创造力。
动机问题
输出能力发展缓慢
如果你觉得自己的输出能力提升得比预期慢,那你可能需要调整一下期望值。别忘了,你不是为了到阶段 3 结束时成为一名完美的演讲者。不妨回顾一下你之前的能力(书面或录音材料),充分认识你已经取得了多大的进步。
如果这个答案还不能让你满意,那么你可以通过缩小首个输出领域的范围来人为地加速你的输出能力提升。确定几个你想如鱼得水的具体话题和情境(迷你领域),并集中所有的沉浸学习和输出练习在这些迷你领域上。在向外拓展之前,先掌握这一小部分内容。
理解到输出的差距
如果你对你能理解的内容比你能说出口的内容多感到沮丧,那么我有一些坏消息要告诉你。这其实是语言的普遍现象。在你的母语中也是如此:大多数英语母语者都能阅读海明威的作品,但很少有人能写出像他那样的作品。
你可以通过专注于迷你领域来更快地缩小这个差距。例如,如果你是美食爱好者,喜欢谈论食物,那么就把你的沉浸学习内容限定在与食物相关的内容上,把你的输出练习限定在与食物相关的对话上。
能力问题
从根本上说,所有能力问题的解决方式都是一样的:更多的输入。不过,针对不同类型的错误,有些小窍门和策略能让这个过程更加高效、轻松。
反复出现的语法错误
如果你经常用错某个语法结构,可能是因为你还没完全习得它。在你思考如何使用这个结构时,可能会觉得有点模糊不清。
解决这个问题的关键是增加输入。尤其是广泛阅读(比如读大量符合你水平的书),能让你接触到更多这种语法结构的实例,加快习得速度。
同时,你也可以刻意学习语法规则,有意识地监控自己的输出,必要时进行自我纠正。但请记住,这只是暂时的辅助手段,不足以解决根本问题;真正的解决之道唯有沉浸学习。
找错词
如果你只能想到错误的表达方式,这通常意味着你的母语在干扰着你。
我们经常会发现,想要表达的想法在母语中有特定的说法。这就导致当我们尝试用目标语言表达同样的想法时,脑海中浮现的却是从母语直译过来的表达。
解决这个问题的关键在于提出正确的问题。不是去问「我该怎么说?」,而是要思考「一个母语者在这种情况下会怎么说?」。这样微妙地转变问题的角度,往往能激发你的潜意识输出完全不同的结果。
为了更生动地说明这一点,我们来分享一个俄语学习者的小故事。
这位学习者在与她的交流伙伴谈话时,用俄语说「我想去佛罗里达看看阳光」。她的伙伴很迷惑,因为在俄语中人们不会这样说。
在英语里,如果你住的地方经常阴雨绵绵,你可能会说「我想看看太阳」。这实际上是在说「我想享受好天气」。
这位学习者其实应该问自己的是,「母语为俄语的人如何表达想要享受好天气的愿望?」这样她可能就能用一种更自然的方式来表达相同的意思。
脑中一片空白
如果你想表达一个想法,但却找不到合适的词语,不妨问问自己,有没有其他不同但又类似的想法能够表达出来。
因为不同的语言会表达不同的想法,所以有时候你脑海中特定的想法可能就是没有一个贴切的表达方式。正如前面提到的,换个角度思考问题,常常是规避母语思维定势的关键。
迅速补上能力缺口
在某些情况下,你可能迫切需要尽快填补你的语言能力缺口。比如,工作中有人让你用目标语言做演讲,而你需要在演讲前迅速提高水平。
在这类情况下,我们建议你暂时放下所有其他练习,集中精力进行大量输入。观看、阅读和收听你能找到的该特定迷你领域的所有内容,直到你习得它。
说话时对用词感到不确定
当你在写作时,如果对某段语言不确定,可以通过向母语者求证、Twitter、或 Google 来核验。在说话时,你可以通过询问与你对话的母语者来确认任何你不确定的内容。
如果你脑海中有几种可能的表达,可以当场向对话伙伴提出,让他们告诉你哪种是对的。
但这通常会打断对话。有时,最好的办法是简单地在心里记下,然后在后续的沉浸学习中留意。
表现问题
在对话时想得太多
有些人还没开口就陷入了自我思维的漩涡。他们过分担心说错话,结果往往什么也说不出口。
要破除这种心理障碍,可以试着练习持续地独白。具体来说,就是选择一个自己熟悉的话题,不停顿、不畏错误地连续说上一分钟。可以用计时器,确保自己在时限内不停地说。
另一个办法是缩小输出的专注范围,在一个迷你领域里逐步建立起自信。通常在一个领域变得自在,就能带动在其他领域的自信。
对话时语言激活太慢
如果你已经沉浸学习了很长时间,但才刚刚开始输出,那你的头脑中已经有大量已经习得的语言需要激活。在对话中激活这些语言可能会让人有点泄气,因为这个过程相当缓慢。你得花额外的时间去找到合适的思路,拼凑可用的词句,再把它们有条理地组织起来。
这就是为什么写作是个不错的激活已习得语言的方法。没有时间的压力,你可以按自己的节奏慢慢来。
如果你对文字对话形式的写作已经驾轻就熟,但在语言激活上仍有困难,不妨试试长篇写作。针对某个话题进行长篇写作,有助于激活跟这个话题相关的语言,并使其在对话中更可用。你还可以通过就这个话题进行独白来进一步激活语言。
试着就你想激活的话题写一页文章,然后尝试不看文章,用自己的话口头总结一下。这样应该就能激活用于对话的语言。
根深蒂固的坏习惯
有时候,语法或词汇可能会被错误地习得和激活。一旦坏习惯形成,要改正就不容易了。
如果你的坏习惯只有几个,那我们建议你在使用这些语言时,有意识地自我监控和检查。只要你持续接触新的语言材料,这些坏习惯最终应该会慢慢消失,或者你的自我监控能力会变得足够强,能立刻纠正这些习惯。
但如果你是在一个传统的学习环境下成长,很早就被鼓励去输出,那么你可能已经养成了许多坏习惯。对于这种情况,我们建议你经历一段「沉默期」,来重置你的语言输出。
暂停输出 3 到 6 个月,尽可能多地进行语言输入。这样做应该能重塑你的潜意识,消除那些已经形成的坏习惯。
发音问题
顽固的发音错误
如果你能听出自己的发音错误,这通常足以让问题自然解决。但遗憾的是,情况并非总是如此。不能准确模仿某个特定单词或音素的发音,主要有两个原因:
1)你的心理音频是错的。
你对某个声音的预期会影响你的听觉。如果你一开始就学到了一个有缺陷的声音模型,这可能会影响你以后在沉浸学习中对这个声音的听感。
要解决这个问题,你可以使用像 YouGlish 这样的工具或音频词典,多听一些该声音的不同示例。试着改变你内心对这个声音的默读发音(internal subvocalization),使之与这些示例相符。利用你找到的音频,进行影子跟读,不断重复练习这个声音,直到你能准确发音。你可能不会一次就纠正过来,因此,对于顽固的错误,请每天练习。
还需要注意的是,特定单词或音素的发音可能会随着上下文而变化。你可能正确学会了其中一种发音,然后尝试把它应用到所有场合。发音教程实际上可能会使这个问题更加严重,因为它们的解释通常会过度简化,只考虑最常见的情况。
2)你无法做出正确的口腔动作。
你可能还不完全理解如何调动口腔肌肉来发出某个特定声音。发音图虽有助于理解,但也存在之前提到的简化过度的问题。
你可以把这些图作为参考,并按照第 1 点提到的影子跟读进行练习。
母语口音掺杂
如果你在说目标语言时,总是不自觉地掺杂母语口音,那么 3B:发音中列出的各种发音练习对你应该有帮助。
你可能还需要暂时避免说母语,以便让你的口腔完全适应目标语言。
如果你在用尽阶段 3 中的所有练习后,对自己的口音还是不满意,不妨考虑请一个专业的口音教练,为你提供定制化的建议。
阶段 1:建立基础
原文:Stage 1: Lay the Foundation | Refold
掌握一门语言非朝夕之事。它需要一段时间,因此重要的是先建立一个坚实的基础,涵盖技能、工具、习惯以及知识,为这场学习之旅做好全面准备。
阶段 1 包括三个部分:
-
A) 配置好工具,养成好习惯
-
B) 学习基础知识
-
C) 快速启动你的理解力
在阶段 1 结束时,你就能直接从面向母语者的内容中学习了。
阶段 1A:配置好工具,养成好习惯
正如在阶段 0 提到的那样,在整个学习过程中,我们有三个核心活动:主动沉浸、被动收听和主动非沉浸学习。
由于这些都是日常活动,因此将它们融入你的日常生活十分重要。阶段 1A 的重点就是要着手准备支持这些日常练习的工具,同时也要培养相关的好习惯。
在阶段 1A 结束时,你应该配好了 Anki,并沉浸在目标语言内容中。
阶段 1B:学习基础知识
每种语言都有自己的发音和书写系统。即使是有共同书写系统的语言也有不同的发音和表音规则,在开始学习词汇之前,你需要了解你的目标语言的发音和书写系统。
学习目标语言的发音将有助于听力理解,但更重要的是,它是学习词汇的先决条件。如果你知道它们的发音是什么,学习单词就会容易得多。
同时,学习书写系统可以培养你的阅读能力,让你能把听到的和看到的联系起来。
一般来说,如果你的母语和目标语言很相似(例如,英语和西班牙语),这个子阶段就只需要花费几分钟。如果语言有很大的不同(例如,英语和日语),这个子阶段可能需要几个月。
阶段 1B 的目标不是要完全理解这些概念:只要有个大概的了解就行。
在阶段 1B 结束时,你应该了解你的目标语言的发音,并且已经开始或完成了书写系统的学习。对于那些与你的母语有很大不同的书写系统的语言,你应该养成每天学习书写系统的习惯。
阶段 1C:快速启动你的理解力
到目前为止,你还无法理解目标语言。在阶段 1C ,重点将转向学习目标语言中最常用的词汇和基础语法,以加强你的理解能力。
随着你学习更多的语法和词汇,你会开始理解更多的沉浸内容。等你学完 1500 个最常见的单词后,你在读或听每一个句子时,应该至少能认出一个词。
在阶段 1C 结束时,你应该每天学习语法和词汇。
进阶到阶段 2
阶段 1 的目标是让你准备好能直接从沉浸内容中进行学习。
在进入阶段 2A 之前,你应该足够熟悉目标语言的书写系统,这样在阅读字幕时才能方便查词。
你应该每天与你的目标语言打交道,并且即便是观看一些自己不理解的内容也能感到自如。
虽然你不必在进入阶段 2A 之前就把所有 1500 个词都学完,但你还是应该定期学习词汇。
在阶段 2,我们不见不散。
阶段 2 :建立理解
原文:Stage 2: Build Comprehension | Refold
阶段 2 是语言习得过程中最漫长的部分。从最基础的理解开始,一步步建立完全的理解。你的目标会随你在阶段 2 的不同位置而改变,所以你需要在战略上选择与你的水平和目标相匹配的沉浸学习材料。
阶段 2 共分 3 个子阶段:
阶段 2A:克服难度陡坡
刚开始沉浸时,你几乎无法理解任何内容。所有的沉浸内容都像遥不可及的高峰。一开始,理解能力的提升是一个难度陡坡。你得先缩小沉浸学习的范围,挑一部分语言内容来专攻,这样能更快地提升你的理解能力。
通过选择更简单的媒体,运用各种工具和策略,让媒体内容更容易理解,进一步缩短初始的难度陡坡。我们专门讲解了如何评估和调整内容的难易度:
你应该充分利用一切可用的黑科技或策略,使你接触的内容更容易理解。比如,观看一部你用母语看过的儿童电视节目,边看边读附带的字幕。
在你阶段 2 的学习过程中,你的理解能力会从一窍不通逐渐提升到近乎完美。为了让你更明确自己在学习旅程中的位置,以便更精准地分配你的时间和精力,我们还特意构建了一个理解水平模型。
如果你在主动沉浸中还在使用母语字幕,那么是时候放弃它们了。习得语言的唯一途径就是沉浸学习,下面两篇教程,详细讲解了主动沉浸的两种类型,以及如何运用它们。
当你已经用 SRS 学完了目标语言中最常见的单词,就该开始直接从你的沉浸内容中学习词汇了。
一旦你能顺利看懂一部简单电视节目,达到了理解水平模型中的等级 3,就可以进阶到阶段 2B 了。
阶段 2B:拓宽你的领域
一旦你能理解较简单的媒体内容,就该开始提高你精细沉浸的难度了。在下面的指南中,我们将教你如何逐步提高沉浸材料的难度。
现在你已经习惯了 SRS 和基础词句挖掘,该开始按照你的优势和需求,来打磨你的学习卡片了。具体怎么做,我们在下面这篇教程里都有讲解:
如果你的母语和目标语言有几分相似,那可能是时候改用(纯目标语言的)单语词典作为你的主要词典了。使用单语词典,意味着你开始用目标语言进行思考,视角也变得更接近母语者。
当你能够顺利观看面向成年母语者的电视节目,并达到理解水平中的等级 4 时,就可以进入阶段 2C 了。
阶段 2C:精通理解
在阶段 2B ,你对各类内容的理解已经达到了相当不错的水平,为了达到接近完美的理解,你需要重新集中精力,将你的第一个领域缩小到非常狭窄的子集。
在阶段 2C,你将集中精力于「日常生活」型电视剧上,直到你完全精通了这个领域。具体的细节,请参见沉浸指南:
在进入阶段 3 之前,你还可以多练练纯听力(就是不看视频,也不看字幕),以此来提高你的听力理解。
- 纯听力(可选)
在整个阶段 2 ,你一直在提升阅读理解能力。读小说似乎是非常合理的下一步,但你会惊讶地发现,文学作品的难度不菲,而且并不是流利口语的必要条件。如果你还是想要阅读小说,我们也有可选的指南供你参考。
- 如何阅读小说(可选)
如果你的目标语言与你的母语大相径庭,那么在阶段 2B 转向单语词典可能会有些吃力。对难度更高的语言,我们提供了一本结构明确的指南,教你如何顺利过渡到单语词典:
当你能不借助字幕,毫无障碍地看懂一部面向成年母语者的电视节目,你就已经准备好进入阶段 3 了。
阶段 3:学会说话
原文:Stage 3: Learn to Speak | Refold
欢迎来到阶段 3。在漫长的几个月(或几年)时间里,你已经学会了理解目标语言,现在,终于轮到学说话了!
说话能力并非一种单一的技能,而是四种不同技能的结合:
-
理解你的谈话对象(3A)
-
迅速将你的想法转化为言语(3B)
-
动嘴发音(3B)
-
展现自然的举止和表达风格(3C)
在阶段 3A 和 3B,你将分别练习这些技能。接下来,在阶段 3C,你会将它们结合起来,最终达到一个流利的水平。
阶段 3A:为输出做准备
在阶段 3A,你将为阶段 3B 和 3C 的各种输出练习活动做好准备。
首先,你需要克服对输出的抗拒感。几个月(或几年)回避输出后,有些人会遇到心理障碍,阻止他们写作和说话。
如果你无法理解某个领域的内容,你也就无法在这个领域中进行交流。日常对话与你在阶段 2 所精通的领域有所不同,你需要学习人们在现实生活中是如何书写和对话的。既然你已经掌握了一个领域,那么第二个领域应该很快就会掌握。在下面的文章中,我们将解释掌握日常对话领域所需的所有活动。
在阶段 3B 和 3C,你将刻意练习发音和口音。想要发音地道,模仿一个母语者是最简单的方法。在接下来的文章中,我们会解释如何认领一个合适的母语者,作为你学习发音的榜样。
一旦你对日常对话领域的理解达到等级 5,并且能够听懂你的语言家长,就可以进入阶段 3B 了。
阶段 3B:刻意练习
Refold 方法里的输出训练与传统方法不同。你不需要在心里边翻译,也不用有意识地用记住的词汇和语法去造句。
相反,你将让你的潜意识驱动你的输出。如果你至少在一个领域有等级 5 的理解,那么你已经有了大量的习得语言储备,可以用来写作和说话。你所需要做的,仅仅是建立一个小小的心理链接,这些习得的语言就会准备好用于输出。
在下面的文章中,我们会讲解如何通过写作来建立这些链接。如果你在激活语言的过程中遇到了任何难题,我们还提供了一份问题排查指南,以帮助你诊断和解决任何问题。
为了给你的口语表达做准备,你也将开始练习发音和口音。发音训练的主要活动是影子跟读,但还有许多其他技巧可以用帮助你改善口音。我们将在以下文章解释这些技巧:
输出练习很重要,但输入始终是掌握语言的核心动力。当你发现你的输出有问题时,你将通过输入来解决它们,你将继续收听你的家长,直到你达到等级 6的理解。你应当能够轻松自如、几乎自动地理解他们说的每一句话。
在下面这篇文章中,我们会解释所有这些活动将如何结合在一起:
当你对家长的理解达到等级 6,并能轻松自如地写作时,就可以进入阶段 3C。
阶段 3C:开口说话
现在,你已经能够自如地通过写作来表达自己,并且培养了良好发音的肌肉记忆,你就准备好开口说话了。
一开始,你应该就能够毫无问题地与母语者进行对话。
然而,你在说话时仍会犯错,而且听起来还不完全自然。口语错误有两类:基于能力的和基于表现的。我们在下面的文章中解释这些概念:
要精通口语,你需要注意模仿母语者讲话时的许多微妙之处。在下面的文章中,我们将解释这些方面,以及如何识别它们:
不说话是无法学会说话的!根据你的目标和偏好,有许多不同的口语练习方法。我们将在下面的文章中详细解释这些方法:
在发展你的口语能力过程中,你会遇到各种困难。我们从社区成员那收集了一些问题,并针对最常见的问题编写了一份问题排查指南。
这时,根据你的近期目标和需求,你可以进行很多不同的活动。在下面的文章中,我们将解释如何考虑你的日常安排,并为你的目标选择合适的活动。
进阶
在阶段 3 结束时,你应该能够自如地进行日常交流。当你想扩展到新的领域时,就可以进入阶段 4。
阶段 4:超越流利
有反馈吗?给我们发一封电子邮件!Feedback@refold.la
恭喜!你现在已经能够流利地使用第二语言了!
你应该可以轻松自如地使用目标语言进行对话,而不必费劲思考。虽然偶尔会犯一些错误,但这些错误并不频繁,也不影响别人理解你的意思。
有些学习者对这种流利程度已经很满意,不打算再花更多时间去追求更高的水平。这完全是个合情合理的选择,每个人都需要自己决定要投入多少精力。
学习一门语言是永无止境的。每门语言都博大精深,任何人都不可能在有生之年学会其中的每一个词汇和文化细节。至于你想把这门语言学到什么程度,决定权在你。
如果你决定继续深入,你就需要决定到底要专注于语言的哪些具体方面。下面,我们给出两条路,助你思考语言学习的下一步方向。
两条道路
这份指南为你的语言学习提供了两种继续深造的途径:
-
拓展并深化流利程度:提高你的交流能力。
-
力争达到母语者水平:努力让你听起来像个母语者。
很多外语水平很高的人虽然听起来不像母语者,但他们能够在讨论不同领域时流露出他们的语言魅力。
以阿诺德·施瓦辛格为例,他不仅是一位杰出的演员、公共演说家和商人,还曾担任加利福尼亚州州长,但你绝不会把他误认为是英语母语者。
要想成为一位优秀的外语演讲者或作家,不必让自己听起来像个母语者。同理,即使能听起来像个母语者,表达的深度和广度上也未必理想。
至于你想在这两条路上各投入多少努力,取决于你自己。
目录
4A:拓展并深化流利程度:
-
掌握新领域(例如生物学、政治等)
-
培养专业技能(例如公开演讲,创意写作)
-
毫不费力地听
4B:力争达到母语者水平:
-
接受母语者的世界观
-
融入文化
-
精进发音
阶段 4A:拓展并深化流利程度
4A 1. 掌握新领域
在阶段 2 和阶段 3,你已经掌握了自己的第一个领域。第一个领域最难,因为你需要同时学习所有的常用词汇、特定领域的词汇和语法。
一旦打下了这样的基础,未来的学习将会轻松许多。每一个新领域都会比前一个更容易学习。你只需学习该领域特有的词汇,还有偶尔会遇到的新语法点。
可选择的领域数不胜数,因此最好是先明确自己具体感兴趣的方向,然后优先学习。
在决定要深入的领域时,有两条路可以考虑:
-
将母语中你已经熟悉的领域知识迁移到目标语言中。
-
通过目标语言学习一个全新的领域。
1)将母语中的知识迁移到目标语言中
母语中已经熟悉的知识迁移到目标语言中,这相对简单。
示例:烹饪
如果你喜欢烹饪,并想把这方面的知识迁移到目标语言上,那么你就应该专注于学习烹饪相关的词汇,并多看看与烹饪相关的内容。
其他你可能熟悉的领域还包括:
-
奇幻:《指环王》、《龙与地下城》。
-
科幻:《星际迷航》、《沙丘》。
-
科技:电脑、编程。
-
美容:化妆、时尚。
-
运动:足球、棒球、板球
2)通过目标语言学习新知识
语言习得的最终目标,是对语言的内容无所不晓,而对语言本身又浑然不觉。一旦你习得了这门语言,就不再是在学习语言本身,而是通过这门语言来学习新知识。
互联网上有丰富的教育内容和课程。通过参加这些课程,你不仅能学到新技能,还能巩固你的目标语言。
Coursera 提供了不同语言的众多课程。很多目标语言也有自己的热门在线学习平台。去寻找这些平台,找到你感兴趣的课程,尽情享受学习的乐趣吧!
学习领域示例:
-
科学:物理、化学、生物、动物学、解剖学
-
电影制作:摄影、剪辑
-
历史
-
政治
-
经济
-
健身锻炼
-
宗教:《圣经》、《古兰经》、《摩西五经》
4A 2. 培养专业技能
理解某个领域,并不等于你能轻松自如地运用它。比如,你能听懂公开演讲,并不代表你就擅长演讲。同理,能听懂单口相声,并不意味着你能讲单口相声。
要想掌握这些技能,仅仅在语言方面实现流利是不够的,而需要进行专门的训练,就像在母语中那样。
比如,如果你想成为目标语言的优秀演讲者,你可以尝试:
-
阅读并收听著名演讲者的演讲。
-
影子跟读这些演讲者的演讲,记忆他们的演讲内容。
-
报名参加目标语言的公共演讲课程。
-
用目标语言撰写并练习演讲。
-
雇一位说目标语言的演讲教练,获取他们的反馈。
如果你在母语中已经掌握这些技能,那么大部分技能可以迁移过来,但你需要让它们适应目标语言的文化背景。在你的母语中有趣的事情,在目标语言中可能就不怎么好笑。
以下是一些你可能想在目标语言中培养的技能示例:
-
演讲
-
单口相声/段子
-
调情
-
公文写作
-
文学写作
-
法律文书写作
-
职业写作和演讲
-
教学
-
谈判
培养这些特定技能,也能帮助你在目标语言中塑造自己独特的个性。
到目前为止,你更多的是像演员一样模仿你的语言家长。现在,是时候决定你在目标语言中想塑造怎样的自我了。你在说话、写作和运用肢体语言时总会展现出一些小习惯和个人特色,正是这些塑造了你的独特个性。这种独特会贯穿你的各个方面,使你更加真实。
标准化测试
大部分学习者迟早都会想参加像 CEFR 这样的标准化语言考试,无论是为了工作、升学,还是单纯为了给自己一个证明。
如果你不着急,那么遵循 Refold 方法就足以为考试做好准备。只需等到你觉得理解和说话都非常自在,那考试对你来说就应该是小菜一碟。
但如果你时间紧迫,需要快速通过这些考试,最好的办法是使用标准的学习材料来专门针对考试学习。许多考试要求你掌握一些你在日常沉浸学习中可能接触不到的词汇。专门针对考试学习可以帮你补齐这些知识上的空缺。
4A 3. 毫不费力地听
到目前为止,你都是在简单模式下听别人说话:
-
你戴着耳机听
-
你听的音频质量好,无杂音
-
你听的专业人士的发音非常清晰
-
你在听力时全神贯注
在现实世界中,听力会更具挑战性。人们可能会含糊其词、结结巴巴、窃窃私语。周围的噪音可能会干扰你听清每个词。你的注意力可能会被周围的事物分散,比如其他人的谈话、车声、风声等。
想要让你的听力不费吹灰之力,你需要:
-
对这门语言非常熟悉,不用刻意思索就能理解。
-
反复经历类似的对话,几乎能预测对方接下来会说什么。
-
在嘈杂的环境中练习,训练大脑过滤掉杂音,专注于主要信息。
上下文推断
Matt vs Japan 有一个很棒的视频,题为《为什么你还是听不懂你的目标语言?》。在此时间戳的小节中,他描述了一种我们称之为「上下文推断」的现象。
这个术语描述了你的大脑利用上下文来「填空」的能力。比如,在嘈杂的环境中初次遇见某人,你听到「____ ____ 名字?」,你可能会猜测对方问的是「你叫什么名字?」。
通常情况下,你的大脑反应如此之快,以至于你几乎没意识到这个过程正在发生。这种能力来自于长时间的收听和反复经历同样的场景。
以前面的例子来说,你能预测你的新朋友说的是「你叫什么名字?」,因为这是初次见面时最常见的提问之一。但你之所以能这么猜测,是因为你已经听过这句话,而且在这种场合中经历过无数次。
语言上下文
鉴于你的听力能力已经非常强了,被动收听和后台收听现在变得更加有用。因此,尽可能多地去听吧!你在语言中投入的时间越多,从上下文中推断的能力就越强。最终,你将能做到「帮别人把话说完」。
情境上下文
如果你还没开始,那么现在是时候走出去,尽可能地多与真人交流了。你需要反复进行数百次对话,让你的大脑能够预判别人的话。
你的水平再高,偶尔也会误解别人说的话。这很自然,也很正常,这在使用母语时也会发生。
提高听力难度
以下是 5 种提高听力难度的方法:
-
摘下耳机(如果你还没这样做)。你需要习惯杂音的干扰。
-
调低音量。
-
在嘈杂的环境下听:比如公交车上,或是喧闹的餐厅里。
-
听音质较差的音频:比如电话、语音消息和视频聊天。
-
如果你愿意,可以用 Audacity 这个软件自制带噪声的音频。
Audacity.
以下音效极为适合制造噪音:
-
失真效果Distortion Effect
-
噪音生成Noise Generator
-
回声效果Echo Effect
-
同时播放两段音频,试着专注去听其中一段
-
4B. 力争达到母语者水平
达到流利水平后,要想追赶上母语者水平,就得终身学习。作为第二语言使用者,要想真正达到母语者水平极其困难。
终其一生,每个母语者都浸润在自己的语言和文化中。作为二语使用者,想完全模仿这一点,可能需要数十年的时间。
这不仅仅是口音的问题,还涉及到历史文化和社会常识。要达到「母语水平」,你需要理解母语者是如何成长的,以及在日常生活中是如何相互交流的。
-
他们经历了哪些文化事件,这些事件怎样塑造了他们的观点?
-
关于他们的社会以及它在世界中的位置,学校教给了他们什么?
-
他们如何与彼此交流?
你可能听说过「融入法Method Acting」:演员在拍摄现场内外都完全投入角色。力求达到母语者水平,就像是融入法。你会完全而深入扮演母语者,你的言行举止、跟别人的互动都得体现这一点。
4B 1. 接受母语者的世界观
我们成长的社会环境塑造着我们的世界观。我们被教授的价值观、所受的教育方式,以及我们经历的世界大事,都对此有影响。
同一天出生的中国人和美国人,他们的生活经历会截然不同。他们看不同的电视节目,学校教的内容也不同,对各种世界大事的重视程度也会有所不同。
你与母语者世界观之间的认知差异,并不仅仅是因为词汇量不够。更多的是缺乏共同的文化体验。接受母语者的世界观,就是要设想,如果你出生在另一个国家,你的生活可能会怎样。
母语者会经历的事情
-
流行文化
-
和你同龄的母语者在成长时,喜欢看哪些电视节目?
-
他们小时候都读过哪些书?
-
-
历史
-
对你学习的目标语言的母语者而言,哪些时事影响最深远?
-
他们的社会关注了哪些历史事件,又忽略了哪些?
-
-
教育
-
他们必须学习哪些课程?
-
他们的教科书教了他们什么?
-
他们受到了哪些道德和价值观的教育?
-
去习得母语者的人生经历需要很长时间,不是每个人都愿意这样做。但至少,我们建议你和母语者谈谈他们的生活和成长经历。对他们的生活保持好奇,这能促进交流,还能帮助你从他们的视角看世界。
4B 2. 融入文化
每个社会都有其潜规则(即社会常识,社会规范),指导人们在不同场合下应如何行事。在一个文化中被视为礼貌的行为,在另一个文化里可能就是不礼貌的。
例如:
-
当街上有人不小心撞到你时,合适的反应是什么?
-
以何种频率谈论自己和自己的成就才算得体?
-
对刚失去家人的人说些什么合适?
-
与人交谈时,保持多远的距离才是恰当的?
一致的不一致:「你最近怎么样?」
在全世界不同的文化中,对「你最近怎么样?」这个问题的回应方式截然不同。在一些文化里,人们通常期待一个标准的回答。而在其他文化中,这个问题则是在邀请你分享你生活的点点滴滴。事实上,Tandem 应用就曾专门针对这个现象撰写了一篇文章。
如果你想表现得像母语者一样,就需要解构自己的文化偏见,去接受你所学习的目标语言的社会文化倾向。
人类学
到了这个阶段,我们学习的已经不仅仅是语言了。我们成了人类学家。我们在探究一个异国社会的行为模式,并努力去模仿这些行为。
要注意并遵循这些文化常识的一个简单方法是,搬到使用你学习的目标语言的国家,融入当地的朋友圈。这样,你就能观察他们的行为,进行模仿,并依靠他们来指正你的行为。
你还可以通过阅读人类学和文化礼仪的书籍,专门学习这些文化规范。如果想加速这一过程,你可以聘请专家服务,比如 "Minding Manners",这类服务提供国际商务和外交礼仪的教学。
4B 3. 精进口语
发音
有些人在发音模仿方面很有天赋,比如那些模仿秀选手,或是拥有绝对音感的歌手。他们确实拥有一种特别的能力,能听出别人无法分辨的东西,并能够模仿出来。即便如此,他们也需要在自己的技艺上下些功夫。
对于我们来说,我们需要刻意地练习“听,并模仿”。就像语言学习的其他部分一样,我们需要先注意,然后才能模仿。如果你听不出某个发音、口音或词汇,那么模仿它几乎是不可能的。
扪心自问:在听目标语言的母语者讲话时,你能分辨出不同的口音吗?如果你分不清口音,那说明你的听力还不够好,无法恰当地模仿那种口音。
对于词汇,我们通过在 Anki 中学习单词来使大脑对其保持敏感。对于发音,我们需要运用不同的工具。
在深入学习发音之前,重要的是要明白,发音有多个层面:
-
音素
-
单词
-
短语
-
句子
-
音素层面
每种语言都有其特有的一套音素。对于未经训练的耳朵而言,不同语言中的两个音素可能听起来相似,但实际上它们差别很大。
在阶段 1,我们建议你学习目标语言的音素。现在,回过头来再次继续学习是个不错的选择。你接触这个语言已有成千上万小时,对于音素学习会有更深的理解。
学习国际音标,以及目标语言中可能存在的各种基础音素,同样非常有益。这有助于你识别那些看似相似,实际却有所不同的音素。
练习音素发音,确保你的基础音素发音准确。
如果你在学习日语,Kotu.io 的音高重音训练器(pitch accent trainer)是一个很好的工具,它能帮助你学会辨别日语中不同的音调。
- 单词层面
能够单独发出一个音,并不意味着你对单词也能正确发音。单词合声练习(single-word chorusing)是个很好的方式,可以测试你是否能像母语者那样准确地听出并复读一个单词。
如果你不熟悉合声练习(也称为 Flow-verlapping),可以看看 Mimic Method 的这个视频。它可以让你直观地看到你的发音与母语者的差异。
- 短语层面
很多单词组合会导致单词本身的音变。如果你看过 Matt 的视频《为什么你还是听不懂你的目标语言》,他举了不少例子,比如「Don’t you want to」变成「donchyawanna」。
这种音变在语言中随处可见,且时常发生变化。当你在沉浸学习中注意到这类音变时,可以提取出那段音频,通过合声练习,让你的发音更贴近母语者。
- 句子层面
在句子层面,我们需要学会感受流:节奏、韵律和语调。掌握语言中正确的流,是让自己听起来真正像母语者的关键。
这就是影子跟读的用处所在。如我们在阶段 3 所讨论的,影子跟读对提升你的节奏、韵律和语调大有裨益。与单纯的单词或短语合声不同,影子跟读是持续且同步进行的。这会迫使你放下对每个发音细节的拘泥,转而专注于语言在句子层面的流。
为了改进节奏、韵律和语调,我们推荐下面这些(难度逐步提升):
-
重复完整的句子:重复句子,直到听起来自然。
-
纠正式朗读:大声朗读,并让母语者纠正你。他们不仅要纠正你的发音,还要指正你表达的细致之处。
-
有脚本的影子跟读
-
无脚本的影子跟读
-
模仿
获取帮助
当演员需要在电影中精准地模仿一种口音时,他们往往会请专业的口音或方言教练来帮忙。这些教练能提醒你哪些地方听起来不正宗,并指导你专注于解决特定的口音问题。
母语者也能帮助你识别出你的语流哪里「感觉不对」,但他们通常无法准确指出问题所在。可以邀请母语者朋友给你这方面的反馈。
遣词造句
要听起来像母语者,另一大困难是你表达想法的方式。我们很容易不自觉地陷入母语的思维模式,随后在目标语言里表达出来,可能就不够自然。
在目标语言里,同一个意思往往有好几种不同的表达方式。你自己感觉最说得通的措辞,在目标语言里可能感觉就不太对。
例如:
如果一个学英语的人说 “I reversed the car(我开车倒着)”,虽然人们也都能理解,但以下表达会更自然:
-
I backed up the car.(我往后开车)
-
I put the car in reverse.(我把车倒着开)
-
I drove the car in reverse.(我倒着开车)
注意这类表达,确保模仿母语者的说法。
结语
学习语言是终身的事业。你不仅仅是在学习一项技能,更是在塑造一个全新的自我。每位学习者都要自己决定为学习语言投入多少时间和精力,以及他们想达到什么样的目标。
无论你选择何种道路,每个阶段进步的每一毫每一厘,都值得骄傲。
欢迎来到 Refold 语言习得路线图
原文:Welcome to the Refold Roadmap | Refold
开始学
沉浸学习与传统方法大不相同。在你踏上语言学习之旅之前,你得做好准备。本节将介绍整个旅程中你将使用的方法、心态和工具。
方法
心态
在这个过程中,正确的心态是很重要的。下面的文章将帮助你解除破旧的语言学习方法,进入沉浸学习心态。
核心活动
在你迈向流利的旅程中,有三种核心活动必不可少:主动沉浸,被动收听,以及主动非沉浸学习。我们对这些核心活动分别进行了概述。
进阶
阶段 0 的目标是概述 Refold 方法。一旦你读完了这些文章,就可以进入阶段 1 了。
0A:语言学习的三种方式
Refold 提供的方法主要是以下三种:
-
主动沉浸:全神贯注于沉浸学习的过程之中。
-
被动收听:随时随地沉浸在所收听的语言中。
-
主动非沉浸学习:学习词汇和语法。
每种方式都在语言习得的过程中发挥重要作用。
主动沉浸
主动沉浸是指你投入全部的注意力到目标外语的内容中。内容可以是电视节目、一本书或播客。
主动沉浸是语言习得过程中最重要的部分。大多数习得是在这里产生的。当你全身心投入一篇文章的时候,你的大脑正努力解构这门语言。
主动沉浸分两种:精细沉浸和无阻沉浸。(简单类比为精读和略读)
精细沉浸
精细沉浸是借助词典来理解沉浸学习的内容。每个不认识的词都要查,要力图还原每句话的含义。这一过程有助于学习新词汇并建立理解。
精细沉浸面临的挑战是,它需要大量努力。如果你觉得它是一种负担,那么最好转换到无阻沉浸,以避免精疲力竭。
无阻沉浸
无阻沉浸是专注于内容而不停下来查词。无阻沉浸的目标是进入沉浸的心流状态。如果偶尔有单词实在不认识,仍然可以查词,但不要频繁查词。
无阻沉浸能让你理解内容更轻松,更自然。
无阻沉浸的缺点是:相比精细沉浸,你不理解的东西变多了。对于成年人来说,不理解的感觉是很不舒服的,但这是学习语言过程的必要一环,没办法绕过去。最好的办法是拥抱这种不适感。
平衡
有些人偏爱精细沉浸,另一些人更喜欢无阻沉浸。不过,两者都是习得过程的重要组成部分。你应该多用你喜欢的方式,但要确保你每种方式都做一些。
相比无阻沉浸,精细沉浸往往更容易精神疲劳,所以最好在你还剩些精力的时候先进行精细沉浸。
被动收听
大多数人不可能整天主动看电视或者阅读。不过,我们在一天中基本不会没时间听目标外语。
被动收听时,你将部分注意力放在音频上。你可以在通勤或做饭时被动地收听音频。开车和做家务不需要太多脑力活动,所以你可以边做边听目标外语。
被动收听是提高你沉浸时长的好方法。它不如主动沉浸那么有效,但依然有所裨益。
并非所有被动收听都是等效的。你收听时越专注,效果就越好。选择你感兴趣的被动收听内容,这样你可以保持投入。
一种让被动收听更有趣的方法是重听你已经主动沉浸过的内容。由于你已经知道了故事情节,它对你来说将更容易理解和有趣。重听给你大脑另一个机会来习得你第一次学忽略的东西。
主动非沉浸学习
Refold 是以沉浸学习为基础的学习方法,但这并不意味着我们只推荐沉浸式学习。主动非沉浸学习是指你花时间学习关于你目标语言的知识,以使你的沉浸材料更容易被理解。
当你理解你所沉浸内容的意义时,语言习得就发生了。主动非沉浸学习使得你的大脑获得额外的信息去理解那些句子的意义。
每种语言有四部分要学习:
-
发音规则
-
书写系统
-
词汇
-
语法
对大多数语言来说,发音规则和书写系统不到一周就能学会,但词汇和语法的学习会贯穿整个语言习得过程。
在第一阶段,我们将告诉你主动非沉浸学习的四个部分该如何开始。
0A:什么是沉浸式语言学习?
大多数语言老师教你如何记住单词和语法,然后把两者结合起来造句。这种学习方式叫做「技能培养」法。
如果有在短时间内开口说外语的需求,采用技能培养法是合适的。如果你计划去另一个国家旅行,并且需要能够交流,我们推荐使用 Benny Lewis 的 Language Hacking 课程。Benny Lewis 是技能培养法的大师。
然而,技能培养法无法让你流利地掌握外语。想达成流畅交谈,你不能浪费时间在动词变位和句子结构的确定上。对话时脑海里应该立即闪现出正确的语言。
为了流利掌握外语,需要培养对语言的直觉,正如你对母语抱有直觉。你可能不清楚你的母语有哪些语法规则,但说话时每个词都能自然而然地脱口而出。语言直觉是语言「习得」的结果。一旦你习得了一门语言,你就能不假思索地用这门语言交谈。
沉浸学习是习得语言的方式。沉浸学习很简单,就是与语言不断接触,如看电视,读书,网上冲浪等。
沉浸学习的原理是什么?
「我们习得语言的原理别无二致:通过理解信息。」
——斯蒂芬·克拉申
掌握单词的含义,只是习得这一单词的第一步。若要能习得运用这一单词的“直觉”,你需要在大量不同的场景下多次遇见这个单词并理解它。
在沉浸学习的过程中会接触各种各样的场景。每次你看到一个单词并成功理解,你的直觉就得到了锤炼。最终,你建立起了很清晰的直觉,便能自然而然地知道单词如何使用了。
时间与精力
习得语言需要不少时间,但这个过程并不是苦役。维持自身热情的关键,是在快乐中沉浸学习。
你可以看电视节目,Youtube 视频,Tiktok 视频。你可以读推文,读博客,读书。所有你享受的母语媒体,你都可以看它的外语版本。
美国人平均每天花 11 小时看电视,流视频,阅览社交媒体。将越多的媒体时间投入目标外语中,你就能更快达到流利水平。
当然,达到流利水平的真实时间与具体学习的语言,以及很多个人因素有关,但关键一点是在语言上花足够多的时间。只要你能持之以恒,每天都投入时间沉浸在目标外语中,你最终必能习得这门语言。
0A:我目前处于哪一阶段?
Refold 提供的学习导航主要分为四个阶段:
-
了解基础
-
提升理解
-
开口表达
-
拓展能力
每一阶段又划分为几个子阶段。不同的子阶段会有不同的目标、策略、建议,我们会帮助在目前阶段的你,向着最能见成效的地方努力。我们会为不同的子阶段提供自我检测,帮你判断是否能够进入下一阶段。
第一阶段:开始学
第一阶段中,你需要了解目标外语的基础部分,以及沉浸学习所需的工具。你不仅要注意语言习惯的建立,还要学习语言的书写系统、发音系统、基本语法和基本词汇。
第二阶段:提升理解
在第二阶段,你要提升理解力,使你最终能理解某一题材的原汁原味内容。第二阶段划分为三个子阶段:
2A:理解简单内容
在 2A 阶段,你专注于理解简单内容,比如儿童电视节目。少儿节目有助于习得第一阶段的常见词汇和语法。一旦你能跟上这些简单内容的情节,你就从 2A 阶段毕业了,可以进入 2B 阶段。
2B:追随兴趣
在 2B 阶段,你建立了足够的语言基础,能够开始追随兴趣。例如,如果你对时尚感兴趣,那么你可以关注 Youtube 上说你的目标外语的时尚博主。
随着你探索兴趣,你的理解能力会逐步提升,最终你能懂得所学材料的大意。你可以开始真切地享受你所沉浸学习的内容了。这时候,你能行进到 2C 阶段。
2C:专注主题
刚到达 2C 阶段时,你大概能理解材料,但也会有一些磕磕绊绊不理解的地方。若要扫除这些障碍,你要专注于单一类话题(也就是「领域」)的母语内容,直到你能完全理解为止。
母语内容意味着所学语言原汁原味的材料,也就是母语者读的材料。译本或课本不算母语内容。
你可以随意选择领域主题(比如科幻、时尚、料理)。但我们建议首先从日常电视节目开始,因为这些节目与日常谈话的内容最为相关。
第三阶段:开口表达
第三阶段的重点是将理解能力转化为口语能力,分为三个子阶段:
3A:理解日常对话
日常对话相比第二阶段中你学到的材料,在内容风格上往往还会有些许的差异,所以我们先要提升对日常对话这一新领域的理解。一旦你能理解日常对话内容,后续对写作和口语的学习也会易如反掌。
3B:练习写作和发音
在 3B 阶段中,你要分别练习写作和发音。对于发音练习来说的话,你可以找一名“语言家长”,并模仿他的说话风格,这样你就能像母语者一样说话了。
Twitch 直播者,播客者,和 Youtube 博主都可以被你当作“语言家长”。
3C:开口说
在 3C 阶段,你要结合写作能力和发音技巧,开始尝试着去说。第三阶段结束后,你就具备了流利使用目标外语的基本能力。
有了流利使用目标外语的基本能力,你就能应用目标外语了。你能讨论日常生活话题,或是你选择的其他话题。好消息是:你用目标外语时不必组织母语、翻译母语。你的想法直接转化成目标外语,你交谈时便能又自然又轻松。
第四阶段:拓展能力
一旦你能基本流利地使用目标外语,之后的语言习得旅程就由你自己选择。你可以选择生物、商业、政治等新主题并沉浸其中,扩展你的理解能力,或者也可以提升语言流利程度,打磨发音使之更贴近母语者。
在第四阶段,我们会解释拓展深造语言能力的不同方法。
我该从哪里开始?
很多学习者已经学习目标外语一段时间了,不必从路线图的起点开始。但无论你水平如何,我们建议通读这篇指南,以免遗漏。
读完指南之后,下面的测试可以帮助你确定自己目前的水平,以及应该从哪个阶段开始:
你能读懂这门语言的书面文字吗?你认识 1000 条词汇吗?
如果有任何一项不能,去第 1 阶段。如果两者都能,去 2A 阶段。
借助目标外语的字幕,你能认出儿童电视节目(面向 7 岁以上)里的大部分词汇吗?
如果能,去 2B 阶段。
借助目标外语字幕,你能跟上成人电视节目(面向16 岁以上)的情节吗?
如果能,去 2C 阶段。
不依赖任何字幕,你能基本完全看懂成人电视节目(面向 16 岁以上)吗?
如果能,去 3A 阶段。
你能用目标外语流利地交谈,但希望进一步提升流利程度,并拓宽流利使用语言的领域吗?
如果能,去 4 阶段。
回答这些问题时一定要对自己诚实。低估语言能力比高估好。如果你不确定从哪个阶段开始,可以先从 1A 阶段开始。之后感觉合适就可以升阶。
1A:沉浸学习
沉浸学习是语言习得的基础。通过沉浸学习,你会在许多不同的场景下接触到每一个单词、短语和语法结构,这样你便能直观地掌握它们的细微之处。
你花越多时间沉浸学习,掌握目标外语(TL)就越快,投入的时间是决定性因素。沉浸学习越早开始越好,以便积累沉浸时间,启动习得过程。即使一开始什么都不懂,你的大脑也在努力对语言解码。
请容忍模糊之处
语言学习新手往往会落入这种陷阱,总觉得自己没有「准备好」接受沉浸学习。沉浸学习不理解的内容时,他们总感觉很不舒服。新手总是想避免这种不适感,他们会推迟沉浸学习,只专注主动非沉浸学习。
这种方法永远都不会有效果。
无论你提前以非沉浸的方式准备、研究、学习了多少,在你第一次接触真实的语言材料时,你都不会懂的。
我们强烈建议你一头扎进目标外语并学着拥抱模糊之处,而不是去避免不理解所带来的不适。你越能容忍不适,你就能在沉浸中享受越多,你的大脑也能越快掌握语言。
如何减少模糊感
在你刚起步时,往往仍然耐受不了模糊含混。如果你发现这太难了,这里有一些可以让沉浸体验更舒适的策略。
情节剧透
减少模糊的一种方法是,在观看电视节目或电影前,先阅读剧情梗概。还有种方法是,重看你已经看过其母语版的电视节目或电影。这些方法可以让你无需理解单词就能跟上故事情节。
母语字幕
通常来说,我们不推荐在沉浸于外语材料内容时使用母语字幕。你从中学不到什么东西。
然而,如果你觉得自己完全迷失了方向,学起来非常费劲,那么可以使用母语字幕来吸引自己。
作为锻炼,试着在没有母语字幕的情况下看尽可能长的时间,撑不住了再打开。或者不开母语字幕观看一段内容,然后打开母语字幕再看一遍。
当你达到 2A 阶段时,你最好抛开母语字幕或者翻译来浏览内容。
恢复沉浸学习所需的耐力
沉浸学习新语言很累,很快就会疲劳。大脑在适应新语言时,你甚至可能会感觉头疼。
一定要经常休息和打盹以补充精力。随着时间推移,你对材料的耐受时间会增长,直到你可以连续沉浸数小时。
寻找合适内容
在你的学习之旅中,你将投入数千小时在目标外语的沉浸学习上,所以找到你享受的内容十分重要。你越享受所学内容,你就越想沉浸其中,学的速度也就越快。
为了最大化你花在语言上的时间,尽可能地将你平时浏览的媒体内容转到目标外语上。包括电视节目、电影、YouTube 和博客。你需要探索目标外语上的内容,并找到你最感兴趣且享受的内容。
在外语平台上创建新账号
有个寻找目标外语材料的好办法是:在你使用的社交媒体和视频平台上,创建目标外语账号。在这个账号里你只观看目标外语的内容,这样推荐算法就能给你推送又新鲜又有趣的资料了。我们推荐创建 Youtube, Netflix, Tiktok, Twitter 的外语账户。(当然,科学上网是前提。)
为了帮助你获得目标外语的推荐内容,Refold 收集了 YouTube、Netflix 等内容网站上每种语言的频道和内容列表。你可以通过我们的社区访问这些内容。
Netflix
要找目标外语材料,Netflix 无疑是个好去处。由于 Netflix 对不同国家提供不同内容,你可以通过科学上网搞假地址来欺骗 Netflix,从而获得不同国家的推送内容,这样你就能获得所有 Netflix 上的目标外语材料。
我们建议使用民间 Netflix 在线全球搜索数据库。这会帮助你更容易地找到你的目标外语内容。它还会告诉你的位置要切到哪个国家,才能看这些内容。
这里是设置目标外语 Netflix 账号的详细指南。
目标外语视频资源
Netflix 和 Youtube 都很适合获取目标语言材料。但不要局限于你已经知道的网站。每个国家都有不同的流视频服务。用谷歌搜索来查找你目标外语的母语者最常使用什么视频网站。
Refold 内容合集
我们的社区收集了很多适合初学者的材料。记得加入 Refold 的 Discord 频道来获取超过 45 种语言的数千条内容推荐。
被动收听材料
正如 0A:语言学习的三种方式(已汉化)这篇文章所解释的那样,被动收听是在你忙碌时,提高你沉浸时长的好方法。
播客和有声书是开始被动收听最直接的办法,但这对于新手来说太难了。材料越难,越难以集中注意力。找一些你以前观看过的电视节目和 Youtube 视频,重听这些材料的音频,这样的被动听力更容易听懂,也不容易走神。
要让被动收听成为你日常生活中的习惯,将其变得轻松不费力是关键。开始被动收听最简单的方式是打开你手机上的 Netflix 或 YouTube,听就完事了。如果你对技术比较熟,你可以下载音频,把它放在你的手机或单独的数字音频播放器中。
要了解更多关于被动听力的详细指导,请阅读这篇文章。
1A:打下外语基础
第一阶段的目标,是学习基础知识以备理解,这样第二阶段便能直接开始学习目标外语的材料。
正如 0A:语言学习的三种方式这篇文章所说,主动非沉浸学习,相比沉浸学习能帮你更快掌握基础知识。
有四部分知识需要主动非沉浸学习:
-
发音规则
-
书写系统
-
词汇
-
基础语法
发音规则
每种语言都有一套自己的发音规则,与其他语言有所差异。你的目标外语中有些发音是你的母语没有的。
刚开始学习目标外语时,很多发音你甚至无法辨识。你的大脑单纯无法弄懂这些声音,你无法像母语者一样理解这些声音。
要想弄懂这些发音,你需要完成数百小时的听力练习。好在主动非沉浸学习目标外语的发音规则能加速这一进程。
要想了解目标外语的发音规则,你可以去网上找相关的视频或帖子。
除非你能在听语言时精准地辨认不同发音,不要开口练习语音,否则你的口音会很不尽如人意,之后改起来也很困难。
书写系统
为了以准确的方式学习词汇,你需要阅读这些词汇。如果你的目标外语是表音文字,那么你要学习如何书写字母,并将这些字母与语音学习中学到的发音联系起来。
汉语和日语的书写系统是表意的。如果你学的是这两种语言,你需要有意识地学习它们的文字。
对于每种语言,用于学习其书写系统的工具都有所不同。加入 Refold 社区可获得最适合学习你的学习资源。
不要试图在这一阶段把书写系统学到极致,掌握基础即可。阅读是 Refold 学习导航中的核心部分,所以,你以后还会有很多机会来加强对书写系统的掌握。
词汇
刚开始学习一门语言时,你可能一点都不懂你沉浸学习的材料。最快提升自己理解能力的办法是:掌握最常见的 1000 个单词。这些词能覆盖 70-80% 的日常对话。
一旦你掌握了基础,并能够理解一小部分沉浸学习材料,你就要开始通过沉浸学习来认识词汇,而非背诵词汇表。这一办法非常有效,因为你以这种方式学到的单词往往是你遇见最多的,也是你最有必要认识的。
学习词汇的工具有很多。最简单的可以用纸质抽认卡。但我们推荐使用间隔重复系统(SRS)。SRS 比普通抽认卡高效百倍,因为 SRS 系统会调整学习内容,让你专注于难以掌握的单词。
在下一篇文章中,我们会解释什么是 SRS,如何挑选一款 SRS,以及如何开始学习目标外语的常见词汇。
语法
别问「为什么」
初学者学习新语法时,他们常常会问:「为什么这条语法是这样子?」他们想要找到某种可以解释这门语言的根本规律。
可惜他们的问题往往没有答案。实际上语言就是混沌的一团乱麻,无法用简单的一组规则解释清楚。没有「为什么」,且「语言为什么是这样?」这个问题毫无意义。
有一点很重要:语法「规则」并不是金科玉律般的规则。语法规则只是语言实际用法的指导。
研究语法对于流畅对话帮助不大,因为你不可能记住所有规则,以及例外的情况。即使你过目不忘,你说话时也没有足够时间来运用这套知识。
幸运的是,大脑很擅长以直觉领会语法。通过沉浸学习,你能用直觉理解语言,不思考语法也能遵循语法。
精进理解
尽管研究语法对口语帮助不大,但对于理解很有帮助。学习词汇有助于理解单词,学习语法有助于理解整条句子。
一开始你可以每天阅读 10-15 分钟目标外语的基本语法规则。而沉浸学习时,你可以意识到句子中有你之前阅读过的语法规则,你可以体会到它们是如何在句子中发挥作用的。
只有沉浸学习了足够多的材料,并见识了不少实例,你才能真正地理解你学习那些语法。如果有你不懂的,那就跳过。足够的沉浸学习终会使你领悟。
1A:背单词
在语言习得的开始阶段,你的首要目标是:为达成理解奠定基础。只有具备足够的理解能力,才能直接开始沉浸学习。如上一篇文章所述,建立这一基础的最快方法,是记住最常见的词汇。
学习工具
记忆工具和技术有很多。我们认为间隔重复系统(SRS)是迄今为止最有效的记忆工具。
SRS (间隔重复系统)旨在追踪你对每张抽认卡的记忆程度,并智能地向你展示你将要遗忘的卡片。这样,你能记住海量信息,并且尽可能省去不必要的复习。
目前可用的最佳 SRS 工具是 Anki。Anki 有很多辅助语言学习的功能和插件。其电脑端、网页端和安卓端都是免费的,不过 iOS 端收费 163 人民币。(如果你实在不想了解 Anki,且目标外语是英语,可以下载墨墨背单词作为代替)
Anki 有点复杂,所以最好安排专门时间来安装和配置。这里是 Anki 入门的完整指南。
学习策略
在沉浸学习中,你的目标是理解,而非表达。这意味着你只需要提升被动词汇量即可,被动词汇是你认识理解的词汇。
你不必在沉浸学习中记忆词汇。当你到了第三阶段,你的大脑能够自然地将被动词汇转化为主动词汇,你便能轻松的回忆这些单词。
选择单词表
Anki「牌组」是你可以下载并学习的预制 Anki 卡片合集。Refold 社区正在努力制作适合新手的 Anki 牌组。
免费加入你所学语言的 Refold Discord 社区来获取这些牌组。
如果你的目标外语下没有可用的 Refold 牌组,你可以使用其他来源的预制牌组,或者自己制作牌组。
选择预制卡组
在优质的预制牌组中,每张卡片应有单词、例句、释义,最好也配上例句的音频。
Refold 社区已经整理好了每种语言的优质牌组列表。加入[社区]((https://refold.la/join)来获取这些推荐牌组。
自制牌组
如果按照上面的标准找不到优质的预制牌组,你可以自制牌组并与社区分享。
制作牌组的第一步是选择你想学习的单词,最好的办法是借助词频表。词频表是将单词按照最常见到最罕见排序的单词列表。上网搜索即可找到任何一种语言的词频表。
选择词频表时,一定要保证表中的单词都是原型,而非变位/屈折形式。比如 “walk” 和 “walking” 应当归入同一单词。
如果你的母语和目标外语有联系(比如英语和西班牙语),那么这两门语言之间有很多单词会比较相似。这些相似单词是「同源词」,你不必学习。
有了单词表之后,你要为每个单词收集制卡所需的信息,并将其导入 Anki。单词卡片有很多类型可供选择,但我们建议简单即可。
在卡片正面写上单词。
卡片背面写上例句和释义。
新手可能还需要在卡片背面添加例句翻译以辅助理解。但进阶之后最好不要使用例句翻译,因为翻译总是不准确的。
此外,不要忘了这时候你学习的目的是认识理解单词。卡片正面不要有母语文字,只能有目标外语。
SRS 最佳实践
每学一个新单词,之后都会有数次复习。新手最常见的错误是卡片学得太多太快。新卡片学得太多,复习负担也会变大,会让人很容易倦怠。
重要的是坚持,不是卡片数量。我们建议每天添加 10 张新卡,这样每天复习量大概是 70 张卡片。改变新卡添加量后,复习量会在大概两周后发生变化。
一旦感到倦怠,停止添加新卡片,等复习量下降为止。可以调整为每天学 5 个单词,或者其他你能掌控的学习量。
2A:精细沉浸
精细沉浸能很好地提升阅读和词汇能力。对于初学者来说,把书和博客作为材料入手太困难了。我们推荐把目标外语的电视节目的字幕作为材料。
我们推荐从字幕开始有四大原因:
-
电视节目的画面提供额外的视觉信息,有助于理解。
-
电视节目有声音,这样你能学到单词的正确发音
-
边读边听有助于你剖析句子的语法结构。
-
字幕是对话的书面文本。通常来说,对话所用的语言要比小说和博客更简单。
如何精细沉浸
在精细沉浸中,你的目标是尽可能去理解。因此,在每行字幕后都要暂停,并尝试理解句子。如果有不认识的单词,请查阅词典。
当你精细沉浸时,你遇到的一些语言会很容易理解,但其余部分则较为困难。甚至在字典的帮助下仍有些句子你无法理解。
专注于适合你的大脑的难度。如果你在思考 10 秒后还是搞不懂一句话,跳到下一句就好了。
在传统教育中,你被告知应当努力学习困难的东西。其实,在沉浸学习中,专注于简单的内容是更好的策略。当你的理解能力逐步提高,曾经困难的内容也将变得简单。
该看什么内容
字幕
对于听力不好的人来说,纯靠听音来查词是很困难的。因此需要找到字幕和音频匹配的内容。如果没有字幕,你无法精细沉浸电视和电影。
本土产出影像的字幕通常是与音频匹配的,但配音影像往往并非如此(译注:比如 CCTV6 的官方配音往往和字幕不一样)。匹配的字幕对初学者来说很重要,你要听清每个单词的正确发音。能力提升之后不匹配的字幕就不成问题了。
除非是冷门小语种,一门语言会有很多搭配字幕的影像。Refold 社区正在汇集这样的内容,以便初学者上手。
但是,小语种语言可能没有字幕。如果你找不到有字幕的目标外语影视,我们建议用漫画书做精细沉浸的材料。我们会在 2B 阶段进一步解释阅读漫画的细节。
面向儿童的内容
面向成年人(16 岁以上)的母语内容,对于刚开始学语言的人来说是很难的。从儿童内容上手会更简单。
我们推荐从面向 7 至 14 岁的儿童节目开始。儿童节目的故事和对话更简单,也更容易理解。
我们不推荐面向婴幼儿的电视节目。这些节目包含的语言太少,对成年人来说也太无聊了。
重看内容
加速习得过程的最佳途径就是增进理解。材料越容易理解,它就越吸引人,你的大脑也能从中学到更多。
增进理解和投入的好策略是把内容看两遍:先无阻沉浸一遍,再精细沉浸一遍。如果你已经看过一遍,你将懂得故事的来龙去脉、对此有更深的理解,在精细沉浸中也会更加投入。第二遍的精细理解可以让你解开第一遍没有理解的所有谜团。
对于你以前没看过的节目,你可以通过在观看前/后阅读情节梗概来增强理解。这将有助于你理解故事,帮助你去猜测其中涉及到的单词意思,并引导你更加投入于材料中。
不要精疲力竭
精细沉浸也许会很累人。这个过程需要你高度集中,会消耗很多精力。做精细沉浸做累了就切换到无阻沉浸。
一旦你觉得手头上的视频或书籍没意思,就换别的东西看。不要强迫自己沉浸学习。对于语言习得来说,愉快是最重要的。
沉浸学习的工具(译者注:我们也整理过一些语言学习工具,参见:https://zhuanlan.zhihu.com/p/556277936)
弹窗词典
看视频或读书时要查词典。电子词典软件比纸质词典更快捷,但查词时仍然需要切换窗口。
利用弹窗词典,你能直接在看视频的应用里面查词。
如果你有 Netflix,我们推荐 Language Learning with Netflix 这个 Chrome 插件。这个插件能在每行字幕结束后自动暂停,并借助内置弹窗词典来查词。这个插件能免费使用,但也有付费版本,提供了更多功能,也许对你有用。
制作了这个插件的公司同样制作了 Language Learning with YouTube 插件。
还有一些服务于阅览网页的弹窗词典:
MPV 视频播放器
如果你喜欢离线看视频,我们推荐 MPV 这一视频播放器。MPV 是开源的,而且有很多社区制作的插件,是绝佳的语言学习工具。
MPV 比较复杂,所以我们制作了引导视频来帮你配置。
寻找带字幕的视频
YouTube
Youtube 是寻找电视节目和其他有趣母语材料的绝佳场所。Youtube 中每个视频都配有自动生成的字幕,虽说不尽准确。若要查找配有准确字幕的视频,请使用 Youtube 的高级搜索功能。
Netflix
如果你在使用 Netflix,你目标外语的任何原创内容都会配有字幕。
如果你看的视频是配音的,请使用标有「CC」的字幕轨道,「CC」表示「隐藏式字幕」。如果字幕轨道没有 CC 的标识,那么字幕大概跟音频匹配不上。
目标外语的流视频服务
不要只盯着这几个网站,多看看别的流视频服务。每个国家都有本土媒体和本土流视频平台。在那里你可能会发现更多字幕匹配音频的视频。
Refold
我们的社区整合了字幕匹配音频的视频列表。加入社区来获取这些资源。
2A:衡量理解能力
许多人喜欢估计一段材料中他们认识单词的占比,来衡量他们的理解能力。但是,这招没法去衡量高层次的理解。
这主要有两个原因:
-
即使你认识每个词,但连成一句话可能就不懂了。
-
即使不认识句子里所有的词,你也能完全理解句子。
因此,我们建立了一套体系来帮助你评估理解能力,评估标准基于你真正理解了多少。
理解等级
下面的理解等级包含多个阶段:从完全不理解的阶段,一直到相当于母语者的完全理解阶段。
等级 0:啥都不会
- 材料对你是来说天书。
等级 1:一星半点
- 个别词汇你看得懂。
等级 2:零零碎碎
- 每句话中你几乎至少能认出一个词。
等级 3:懂得要旨
-
你能认出文中一半左右的词汇。
-
你能理解一些句子的完整含义。
等级 4:明了情节
-
你能理解几乎所有句子的意思。
-
你懂得故事大意,但是个别情节不太懂。
等级 5:轻松晓畅
-
你几乎能理解所有句子,除了偶尔会不懂个别单词或者短语。
-
你可能不理解笑话、双关或者一些微妙的语言差别。
-
理解依然需要努力。
等级 6:浑如天成
- 你能毫不费力地理解一切。
理解能力不是恒定的
请注意,在不同内容中,你的理解等级也是不同的。你可能对少儿节目有等级 5 的理解,但对新闻报道只有等级 3。
测试你的理解能力
在整个 Refold 学习导航中,我们使用上述的理解等级标准来确定你何时准备好进入下一个子阶段。每个子阶段都会有自我测试,以帮助你衡量自己的理解力。这些测试解释了要使用哪种类型的内容以及如何执行测试。
随着你在各阶段的进展,内容的难度会不断增大,帮助你理解的工具会变少。但无论是什么情况,在自我检测理解能力时,你都不应该使用字典查询。查字典会人为地提高你的理解力,掩盖你的真实能力。
进阶
要从 2A 阶段升到 2B 阶段,你应该对面向青少年年龄段的内容有 3 级的理解力。记住,3 级理解力意味着你能认出一半以上的单词。
你不需要完全理解这些词在给定语境中的含义。如果你看到一个词,心想「我知道这个词,但不明白它在这里是怎么用的」,这也算认识。
为了测试自己是否有足够的能力可以进入 2B 阶段,选择一个有字幕的儿童年龄段电视节目(针对 7-14 岁)。带着字幕看节目,暂停阅读每一行。关掉你的弹出式词典,这样你就不会被诱惑着去看定义或翻译。
如果你能理解几乎每一个词,且理解一些句子的完整含义,那么你已经准备好进入阶段 2B 了。祝贺你!
2A:词句挖掘
词句挖掘是在沉浸学习时发现新单词,并制作 Anki 卡片来学习这些新单词。词句挖掘得名于卡片要用到原文中单词所在的句子作为例句。这个方法威力无穷,因为你学到的单词,都是你在自己的沉浸学习中经历过的。
你可以随时开始挖掘词句,但最好还是打牢了语法词汇基础再做。我们推荐挖掘词句之前先掌握至少 1000 个单词。
以句子为单位,而非单词
我们强烈推荐在每张卡片上都添加例句。卡片如果只有单词及其释义而没有例句,那么在学习过程中会有很多问题:
1. 大部分单词有多种含义
有些单词甚至可能有十几个不同的含义。同时掌握所有意思太难了。
选择例句后,你只需要关注单词在语句中所表达的意思即可。这样一次只学一个释义是更有效的词汇学习方法。
2. 孤立的单词很难记忆
孤立的单词是脱离实际的,而脱离实际的东西很难记忆。例句为单词添加了上下文,构造了更具体的情景,更容易勾牢在记忆里。
3. 单词从不被单独使用
学习孤立而没有上下文的单词,就无法掌握跟其他单词联用时的用法。而例句可以帮助你从整体的角度出发理解一些词组和搭配。
如何选择句子
不是所有句子都适合拿来学习。合适的单词例句需要符合两条主要的选择标准。满足这两条标准的句子称为 1T 句子。
1. 只有一个未知
好的例句应该只有一个陌生单词或者一个语法结构。有多个未知元素的句子不要用。
2. 完全理解
当你查找了未知单词的释义或未知语法结构的解释后,就应该完全清楚例句的意思了。如果查询后还是搞不懂,那么这可能不是一个好例句。
如何选择要记忆的单词
并非每个单词都值得学习。以下标准决定了该学哪些词汇:
-
这个词在日常交谈中有用吗?
-
这个词对于理解你的沉浸内容是否必要?
-
你之前见过这个词了吗?你是否觉得熟悉?
-
这个词对你个人而言是否有趣?
如果以上问题你的回答都是「是」,那么你应该学这个单词。
何时挖掘
精细沉浸是语句挖掘的最佳时机。你已经在努力理解语句,查询单词意思了,所以顺带找出好的 1T 句子也很容易。
有多种将被挖掘的词句制卡的方法:
-
边沉浸边制卡(同步挖掘)。
-
保存你想学的句子,留到之后再制卡(异步挖掘)。
-
用软件自动制作卡片(自动挖掘)。
同步挖掘是社区中最流行的方法,所以我们建议从它开始。这里有许多让同步挖掘变简单的工具。
加入 Refold 社区以获取你目标外语最好的支持工具。(译注:国内也有类似的插件可以帮助制卡,详见https://zhuanlan.zhihu.com/p/25866272)
如何制卡
有许多不同的卡片样式可供使用。我们推荐从只包含文本的卡片上手,因为这种卡片制作起来最简单。有两种文本卡片:单词和句子。它们各有优劣,这个视频可供参考。
在第一阶段(已汉化),我们推荐使用单词卡,因为你的词汇量还不足以理解整个句子。你现在已经进入第二阶段了,我们建议你切换到句子卡。
句子卡格式:
-
正面:例句
-
背面:目标单词的释义
熟悉 Anki 用法之后,你可以在卡片里添加图片和音频。你可以在这里了解更高级的卡片格式。
工作流程示范
-
第一步:在沉浸学习的材料中找到 1T 句子。
-
第二步:把句子放在卡片正面
-
第三步:在卡片背面放上释义
翻译
不推荐在卡片上添加整个语句的翻译。不同语言表情达意的方法各有千秋,所以翻译总是不准确的。对于满足了 1T 标准的句子,你应该不需要翻译就能理解。
多少卡片?
我们推荐每天学习 10 张新卡片。你可以多学,但是 Anki 复习会越积越多,你可能承受不住。
若要估计未来的复习量,将每天学习的新卡片数量乘以 7 。例如,如果你每天学 10 张卡片,那么几周之后,你每天要复习大约 70 张卡片。
2B:转向单语词典
目前为止,你都在使用双语词典。你在词典里查找目标外语的单词,阅读词典中用母语撰写的单词释义。
一旦你对于电视节目字幕或者动画能够达到 4 级(已汉化)的理解水平,这时候就应该改用单语词典了。单语词典是母语者所使用的词典,用你的目标外语解释目标外语中的单词。
为什么要使用单语词典?
双语词典很适合初学者,因为你能借助母语快速学习目标外语中的单词。但是双语词典有个问题:不够准确。
每种语言各有微妙之处,难以经由翻译传达。双语词典把单词翻译成另外一门语言,这一过程会丢失单词的部分内涵。
如果你依赖这些不准确的翻译,你会很容易误解目标外语单词的真正意思。虽然通过足够的沉浸,这些误解能自然得到纠正,但是这样太慢了。如果使用单语词典,你能在第一时间学到这个单词的正确意思,而且加快习得的过程。
如何使用单语词典?
现在你使用词典查找单词的过程,可能类似于:
-
见到不认识的单词。
-
使用双语词典查询这个单词。
要想过渡到单语词典,最简单的方法是在这个过程中加上一步:
-
见到不认识的单词。
-
使用单语词典查询这个单词。
-
使用双语词典查询这个单词。
如果单语词典的释义中出现了很多不认识的单词,那么你就要在双语词典中查询这些不认识的词,并为这些词创建卡片。
随着你越来越熟悉单语词典,卡片背后的释义就要从母语释义改成单语释义了。你最终就能丢掉双语词典,完全依赖于单语词典的释义了。
我们将上述过程称为「平易单语过渡」。这种平易的方法适用于大多数学习者。但对于某些语言来说,单语过渡太困难,需要更成体系的方法。
如果你尝试了平易方法,但是仍然感到有困难,可以尝试结构化的单语过渡。
2B:沉浸学习指南
2B 阶段的目标是在特定题材的母语内容达到 4 级的理解水平。一旦你达到了这一水平,沉浸就容易多了,因为你能理解足够多的内容,很容易保持专注。
我们社区的许多成员说,当他们达到 4 级的理解后,他们的沉浸学习能够自我维持,因为他们会渴望在目标外语上花更多的时间。
选择难度适中的内容
面向少儿的内容,很适合初学者,但跟成人使用的语言差距很大。现在你已为理解打下坚实基础,观看真正的母语内容将更加容易。
为了保证你能尽量理解材料,请尝试寻找相对容易理解的内容。
故事简单
题材简单为佳。浪漫的情景喜剧比讲时间旅行的科幻小说更简单。
内容形象
形象「展示」故事,而不平铺直叙为佳。情绪夸张的肥皂剧比独白自述更容易理解。
语言简单
语言简单,可用于日常生活为佳。个人轶事比政治辩论更容易理解。
领域
不同类型的内容使用不同类型的语言。奇幻剧的语言,与校园剧的语言不同。我们将这些不同类型的语言称为「领域」。
当你进入 2B 阶段,探索你的兴趣时,你会在许多不同领域中沉浸学习。你在一个领域中学到的东西,可能对其他领域用处不大。因此,你为了加速提升你的理解力,需要专注在少数几个领域。
我们推荐你选择「日常喜剧」作为入门领域。日常喜剧关注普通人的日常生活,往往故事情节很简单,包含大量的视觉信息,而且使用的语言都是日常生活能用得到的。
不过,你需要结合你的兴趣和享受程度综合考量。
快乐最大化
在选择内容时,把享受放在首位。找到符合你兴趣的内容。你越喜欢沉浸学习,你学到的东西就越多。
如果你不喜欢「日常」,那选一个你喜欢的就好。如果你对某个领域感到厌烦,那就切换到下一个。保持对语言的兴趣比优化效率更重要。
拥抱模糊不解
关于享受沉浸学习,我们能给出的最好建议是:不要担忧自己不能完全理解。许多学习者苦于不能理解细枝末节,却从不因为他们能理解的内容而鼓励自己。
不要丧气。你迟早能理解的。
沉浸学习多久呢?
你沉浸得越多,你习得目标外语的速度就越快。如果你目标外语与你的母语相似,我们建议你每天完成 2-3 个小时的主动沉浸(精细或无阻)。对于较难的语言,每天 5 个小时以上是取得快速进步的理想选择。
看起来很长时间,但别忘了,沉浸学习不需要正襟危坐。如果你在闲暇时间都收看外语内容的话,你就可以一边看你喜欢的电视节目享乐放松,一边学习语言。
进阶
如果你对从未看过的母语内容达到了 4 级的理解水平,你就准备好进入 2C 阶段了。你可以配字幕观看,并在每段字幕后暂停理解,但你不该查词。
母语内容的难易差别很大。对于这个测试,你要选择面向成人的材料,且材料的领域是你所熟悉的。
看一集你以前从未看过的节目。每一行字幕都要暂停阅读。不要查词,问问自己:
-
我能否理解几乎所有的句子?
-
我能否理解完整剧情,不会晕头转向?
如果你的回答都是「是」,祝贺你!可以升到 2C 阶段了。
2B:阅读
到目前为止,我们都一直建议你把字幕作为阅读材料。我们这样建议的原因有四:
-
电视节目的画面提供额外的视觉信息,有助于理解。
-
电视节目有音频,这样边读边听,能培养正确的发音认知。
-
边读边听有助于你剖析句子的语法结构。
-
字幕是对话的书面文本。通常来说,对话要比小说和博客更简单。
一旦你感觉阅读字幕太容易,你就可以开始读更困难的材料了。
纯文字
纯文字不附加视觉或听觉信息,纯文字材料包括书籍、博客、新闻。
阅读字幕时,即使有些单词不懂,你也能借助节目图像的视觉信息来理解故事情节。阅读纯文字则更加困难,因为没有视觉信息了。书页上的文字是唯一了解故事的信息来源。
阅读纯文字不是学习语言的必要条件。如果你愿意的话,你完全只通过字幕学习,同样能流利掌握语言。然而,比起看电视,许多人更喜欢读书。
下面我们将解释如何逐步提高你的阅读能力,直到你能够阅读完整的小说。
漫画
字幕之后就是漫画。漫画基本上以对话为主,其语体跟电视节目类似。
漫画没有音频来帮助你解析句子,但跟电视一样都有图像。这些视觉信息有助于理解,因此漫画很适合当作阅读材料中视频字幕跟纯文字的衔接。
许多漫画可以在线阅读;这些漫画是「网络漫画」,很容易在网上搜到。加入 Refold Discord 社区来获得你目标外语的漫画推荐。
分级读物
如果你准备好阅读纯文字了,我们推荐从分级读物开始。分级读物是为儿童或二语学习者简化过的小说。简化后的语言能帮你战胜纯文字的难度陡坡。
当你读过几本分级读物后,你就会有更充分的预备去阅读小说。
童书
如果你找不到面向你的目标外语的分级读物,或者你对找到的材料不满意,你可以阅读童书。
不要以为童书就简单。给孩子看的书,不意味着对于第二语言学习者就简单。童书经常会用搞笑有趣的词,这些词往往是读字幕学不了的。
我们不推荐阅读图画书或面向 7 岁以下儿童的书籍,因为这些书中的语言过于简化。
博客
纯文字阅读的另一个选择是博客和网络上的文章。博客的语言没有简化,但它们的内容往往专注于单一主题。如果你已经了解了这一主题,那么你就能推断出大部分不认识的单词的意思。
如何阅读
就像读电视字幕那样,你可以用精细沉浸或无阻沉浸来读纯文字。如果用小说上手,我们建议阅读方法更偏向无阻沉浸,只查会影响情节理解的单词。查单词太频繁会打断阅读,阻止大脑吸收语言。
阅读策略有不少。如果你想进一步了解,可以在这篇文章中找到这些策略的详细介绍。
2C:沉浸学习指南
为了在你选择的领域中快速从 4 级提升到 5 级理解,你需要交替进行这两项活动:阅读与听力。
你可以周期性地(每天或每周)交替安排这些活动。由你自己决定最适合你生活、兴趣和精力水平的方式。
下面,我们为以上两个活动分别建立了沉浸式学习计划的示例,且两种沉浸式学习计划都假设你正尝试掌握生活领域。
专注阅读
精细沉浸
-
观看: 带字幕的老友记
-
阅读: 生活化的漫画杂志
-
阅读:个人博客
词句挖掘:
- 尝试理解每个生词,并为其逐个制作卡片。
被动听力:
- 听老友记的音频,这样你能复习你在 Anki 中所学的单词。
专注听力
无辅助的无阻沉浸
-
观看:老爸老妈的浪漫史
-
观看:YouTube 上的个人轶事视频
-
收听:关于个人轶事的播客
进阶
2C 阶段结束时,你对面向成年人的日常喜剧应该具备了 5 级的理解水平。下面是一些自我测试。
选一集你从没看过的日常喜剧节目。关掉字幕。把这集节目看完,中途不要暂停回退。问自己这三个问题:
-
你能听得清所说的每个词吗?
-
你能理解故事中的每个细节吗?
-
你能不假思索、自然而然地理解大部分对话吗?
即便有一个问题的答案是「不能」,也不必担心。只要持续沉浸式学习,你很快就能进阶到第三阶段。
如果这三个问题的答案都是「能」。恭喜你!你可以开始第三阶段了。
2C:掌握一个领域
要从 2C 阶段毕业至 3A 阶段,你首先对某个领域的理解应该达到 5 级 。 从 4 级 过渡至 5 级是一项挑战,需要在策略上做一些调整。 第一个变化:聚焦在单个领域上。
我们还建议进行另外两项策略调整:
-
让精细沉浸更加精细
-
丢掉无阻沉浸中的所有辅助
完全沉浸
现在,你对首个领域的理解应该达到 4 级,这意味着你可以跟上沉浸式内容的故事。 4 级足以让人享受沉浸;欣赏故事不必要理解每一个词的意思。 但想要达到 5 级的理解水平,你需要给自己树立更高的标准。
在 2A 阶段,我们建议你查找每个单词的时间不要超过 10 秒,因为将注意力集中在能理解的单词上是最有效的。 既然你正在尝试缩小与 5 级之间的差距,那么花上最多 30 秒来理解任何生词和短语也是值得的。为大多数生词及短语制作 Anki 卡片也是很有帮助的。
如果在体验沉浸时发现查找的意思过于混乱,应该先保存句子,暂停查找,在沉浸时间结束时继续查找。
习语、固定表达以及文化或历史文献资料比普通单词更难查找。 你通常无法在字典中找到它们。 如果你认为自己遇到了习语或文献资料,那么它值得花上最多 60 秒来进行谷歌搜索。 当你把它搞懂后,制作一张 Anki 卡也是值得的。
如果在搜索 60 秒后仍然无法弄清楚,我们的建议是最好放弃。有些参考资料需要完整阅读 Wikipedia 文章或是博客才能完全理解;也有些可能是太晦涩难懂,难以查询。 除非你个人觉得它们非常有趣,否则这么做不值得。
无辅助的无阻沉浸
在本阶段,无阻沉浸的目标是提高听力。在 2C 阶段的最后,你应能不借助字幕和词典而对母语内容有 5 级的理解水平。
现在你的阅读理解水平很可能比你的听力理解水平要好得多。为了提高听力,你应该在无阻沉浸中脱离字幕的辅助,这样你的大脑就不得不发展听力能力。
这也是一个开始收听纯音频的好时机(播客、访谈等等)。你的理解力应该足以保持兴趣和投入,哪怕没有任何视觉背景。
在这个阶段,重听也变得非常有用。 如果你再听一遍你挖掘过词句的内容,这就相当于学完 Anki 词汇后立刻再听一遍,你就能记得更牢。
2C:专注主题
在 2B 阶段时,你的目标是提升理解能力,让你能享受沉浸学习。4 级(已汉化)的理解水平足够让你享受材料了,虽然你仍然不理解大部分内容。
2C 阶段的目标,是对于某一领域的母语内容,达到 5 级(已汉化)的理解水平。达到这一水平之后,大脑能注意到语言的细腻之处并将其习得。
达到 5 级理解能力就意味着:你已经潜意识地习得了足够的语言来学习像母语者一样说话和写作。
从 4 级提升到 5 级很花时间。为了加快进展,你要把注意力聚焦到语言的一小块领域上。
选择主题领域
我们在 2B 阶段提到,不同类型的内容,其涉及到的语言也属于不同领域。比如奇幻主题的语言,与科幻主题的语言所用到的词汇就不同。
在 2B 阶段,你需要目标明确地享受并追随自己的兴趣,所以你可能一直会在不同的领域之间跳来跳去。在不同领域之间的转换会减缓你迈向第 5 级理解的进度,因为它打断了对特定领域语言的掌握。
为了加快这个过程,我们建议你一个一个来,掌握了一个再去掌握下一个。具体来说,我们建议先掌握「日常喜剧」领域,因为它与日常讲话最为相关。
通过把学习专注于日常领域,你将更快地习得语言的细微之处,为第三阶段的口语表达做好准备。
享受学习
你要平衡效率与享受,一如既往。
理想情况下,你总会享受你所专注的领域的。可惜大部分人不能如愿。如果你开始厌烦一块领域了,那么就多学一些你感兴趣的材料。
找到最适合你的平衡点。
3A:认领语言家长
大部分沉浸学习者想要达到母语者的口语水平,但是每个母语者都有自己独特的说话方式。既然如此,你要如何「说得像母语者一样」呢?
不要想着「像母语者一样说话」,而是确定一名特定的母语者,来模仿他的说话方式。这个人就是你的“语言家长”。
确定家长人选
在不同家长人选之间斟酌时,你要考虑以下问题:
-
你是否喜欢这个人的说话方式?
-
这个人说的材料是否合适?
合适的发音
认领家长的目的是模仿他们说话的方式。你说话的方式最终会听起来很像你的家长,所以家长的选择应该基于你对说话方式的喜好。
语言家长应当与你性别一致,年龄相当。如果你是 16 岁的女孩,不要模仿 75 岁男人说话。
家长的性格也是认领家长的关键因素。你将要花大量的时间收听他们的材料,所以你应该确保自己能够享受他们制作的内容。
合适的内容
你的家长应该制作了很多没有字幕、未经编辑的内容(也就是生肉)。这些内容很重要,它们为你提供了语言家长正常的说话方式。
包含字幕且被编辑过的材料,其语言风格与自然的说话方式差别很大。如果通过这些内容来模仿练习口语,你的说话风格会像个动画角色或者电视人物,异常生硬。
尝试找到拥有 100 小时生肉材料的家长。如果能听到他们在不同场景下的说话风格那更理想。主播,博客或者脱口秀的主持人,都是最佳的语言家长人选,因为他们制作了大量生肉可以作为你的模仿语料。
制作的材料中应该包括视频,不能只是音频。通过视频,你可以看见他们的肢体语言和表情,这些都是沟通的重要一环。
如果你在一番搜寻后,发现没有单独一个人能满足上述所有标准,你可以找两名语言家长。但不推荐认领更多人。
和家长共度高质量时光
为了全身心地认领语言家长,你需要:
-
找到语言家长。
-
大量收听他们制作的材料。
-
练习他们的说话方式。
人与人相处会受到潜移默化的影响。如果你听过很多语言家长的材料,你也会自然而然地开始模仿他们。为了加快这个过程,你可以有意地做「影子跟读」练习来模仿。我们会在 3B 阶段解释如何模仿家长。
刚开始沉浸你的家长制作的内容时,你的理解水平可能会下降,因为语言家长的说话方式,可能和你习惯的领域不太一样。为了快速提升理解力,我们推荐把 50% 的主动沉浸时间,和 100% 的被动收听时间,花在语言家长上。同时你也应该学会自己挖掘语句。
你和语言家长度过越多的时光,你就能越快地达到 5 级理解水平,并且越早开始模仿他们。
3A:新领域:真实对话
到目前为止,你可能一直沉浸在带有字幕、经过编辑、表演的内容中。 现实生活中的对话是一个新的领域,有不同的词汇和不同的说话风格。 你将会需要重复之前的掌握方式来接触这个新领域。 不用担心,第二次会比第一次容易得多。
与其他领域相比,这个新的领域相对来说更加容易。 现实生活中的对话通常侧重于具体主题或人类经验,比起谈论抽象概念会容易许多。随意的交谈也比辩论政治或哲学更容易。
关于现实生活中的对话,这里有两个子域:
-
书面对话
-
口语对话
书面对话
书面对话包括短信、即时消息、论坛、聊天室、YouTube 评论、Twitter 以及博客。这里使用的语言通常是随意、凌乱且无结构的,需要一定时间来适应。
首先阅读其他人在互联网聊天室和论坛中的对话,尝试找到你所感兴趣的话题。例如,如果你喜欢漫威电影宇宙系列,可以找一个经常讨论漫威电影和电视剧的粉丝论坛。
Twitter 和 YouTube 评论也是非常好的休闲书面对话的来源,但请你务必关注你熟悉的主题。 否则,这些可能太难理解了。
你可以像是体验电视节目和书籍中一样,深入沉浸于书面对话,并且自我挖掘语句。
口语对话
如果你想加入母语者的口语对话中,那么你需要具备能够立即自动理解他们在说什么的能力。
到目前为止,你一直在收听电视节目和 YouTube 视频,它们通常具有清晰的音频和发音。然而,人们在日常生活中的对话却不是很清晰。他们有时喃喃自语,有时谩骂,有时大喊大叫。因此,你的大脑需要根据上下文来推断出任何遗漏的单词。
另一个挑战是口语对话会进行得非常快。假设有四个母语人士正在聊天,他们之间会互相打断,切换话题,以及控制话题的走向。任何一个关键词的缺失都可能导致整个对话失去主线。
这两个问题叠加起来使口语对话的理解达到 5 级 或 6 级 变得非常困难。 为了克服这一挑战,应当将听力练习的优先级置于阅读之上。
听力练习
从听你的语言家长开始。 他们应该有很多的对话内容,这将帮助你快速适应这个新领域。
听你的语言家长说话是一个很好的开始,但这还不足以掌握口语对话的整个领域。你需要能够在不同的环境中理解不同的说话风格。
脱口秀、访谈和播客都是非常适合练习如何跟进多个发言者之间的对话的材料。 尝试找到凌乱的、无结构的和无字幕的对话。
而想练习在嘈杂环境中的听力,则可以考虑加入有母语者参与的互联网音频聊天室。在糟糕的麦克风和糟糕的连接之间,这种沉浸感将扩展你的听力水平。
进阶
在听你的语言家长说话时,一旦你具备 5 级理解,就进入 3B 阶段。
要对此进行测试,请从你的语言家长那里找到一段你从未听过的内容。 聆听内容并问自己:
-
你能完全理解他们所表达的内容吗?
-
你能不假思索就听懂大部分对话吗?
如果你可以,那就太好了!我们将在阶段 3B 再见面。
3A:开始写作
在阶段 0 ,我们解释了沉浸学习是你获得语言直觉的方式。这种直觉使你能够通过感觉来完成自我纠错从而驾驭语言。
这种直觉在你对许多领域达到 6 级理解之前不会完全成熟。也许你想在还没培养好这种直觉前就迫不及待的输出,但那会让你流利得更晚。
达到 5 级理解后,你已经对语言产生了部分直觉。通过在这一水平上练习输出,你迫使自己用现实来检验这种直觉。比起单单的输入,你从结合了输入的输出和纠正中获得的反馈将更快的建立成熟的直觉。
由于你的直觉尚未建立完成,写作和说话可能会感到不适。在 3A 阶段,输出的目的是适应这种不适,并克服你可能感到的任何焦虑。在进入 3B 阶段前,不用担心纠正问题。
输出焦虑
有些人很容易的把他们习得的语言转化为输出。他们甚至可能有写作和说话的冲动。经过数月或数年的沉浸,他们的大脑学会了语言并开始说话。
其他学习者从未经历过这种情况, 即使他们有相同的沉浸学习时间。无论输入了多少,他们都认为自己还没有做好输出的准备。
根据我们社区的轶事,外向者似乎比内向者更容易输出。内向者对于自己母语有些社交焦虑,再加上第二语言会产生更多的焦虑。
想要解决这种焦虑,关键是不要怕犯错。学习者主要担忧之一是错误会固化为坏习惯。这对一门语言的初学者来说是对的,但你不是初学者了。你已经花费了成百上千小时沉浸在你的目标语言中。你强大的直觉足以让你避免初学者犯的大多数错误。解决这种焦虑的关键是不要怕犯错。学习者的主要担忧之一是错误会固化为坏习惯。对于一门语言的新学习者来说,这是正确的,但你不是一个新的学习者。你已经花费了数百或数千个小时沉浸在目标外语中。你的直觉足够强大,可以避免新学习者犯的大多数错误。
你肯定会犯错误,但你在 3B 和 3C 阶段前不需要担心要纠正它们。3A 阶段的目标只是克服最初的输出障碍。一旦你突破了障碍,输出将变得容易很多。你会惊讶于你提升的有多快。
写作
我们建议从写作而不是口语开始输出。口语更困难,因为它是四个子技能包含在一起:
-
听你的交流伙伴说什么
-
思考该说什么
-
快速将想法快速转化为话语
-
开口发出声音
从写作开始,你可以忽略 #1 和 #4。写作没有说话时的压力,也不需要你发音。通过写作,你可以把所有的精力和注意力都集中在思考你想说什么以及你想怎么说。
HelloTalk,Tandem 和 Discord之类的在线文字聊天软件是寻找语言练习伙伴的好去处。这些软件可以让你找到世界各地的本地人和他们发短信。
如果和陌生人发短信使你感到不舒服,那么你可以从独自写作开始练习。你可以写有关你一天的日记或总结你沉浸学习中有趣的内容。你甚至能为自己写购物清单和个人笔记。
输出建议
尽量简单
不要想着用华丽的语句给人留下深刻的印象。从现在起,使用简单的,并且能让你感到自信的单词和短语。
查验
如果你是个完美主义者,你可能想要尽可能确保写的每一个句子都写的正确。这中断了对话的流程,使输出感觉像工作一样。记住,这阶段的目标是克服你的焦虑。请允许自己犯错误。
别担心,经过一番练习后,你会惊讶于你有多擅长这件事。
3B:激活语言
如果你对某个领域已经达到了5 级的理解水平,那么你已经习得了目标外语(TL)的一大部分内容。沉浸学习时,你应该直接能轻松理解很多词句。
下一步是学习使用这些习得的语言知识。我们将此过程称为「激活」。为此,你首先需要弄清楚你已经习得了什么和没有习得什么。然后你需要不断运用这些习得的语言知识,直到你能像理解语言材料一样运用自如。
此过程中另一好处是,你将识别出尚未习得的语言片段。识别之后,大脑会在沉浸学习中留意这些地方的正确用法,你便能习得更快。
写作
正如我们在3A: 开始写作提到的那样,我们建议从写作开始而不是口语,因为口语实际上包含多种技能。
建议从写作开始的另一个原因是,在写作过程中你无法掩盖自己的错误,这样纠正起来更容易,避免养成错误习惯。
出于同样的理由,当你写作的时候,不要查字典或者参考语法,否则你会掩盖你的真实水平。
获得纠正
纠正错误,对于弄清楚你是否真正习得了某个语言片段,是非常关键的。一旦你确定某个语言片段是正确的,你就能在输出时自信地使用,将其激活了。
一旦意识到一些语言片段使用得不对,大脑会在沉浸学习中留意这些地方的正确用法,你便能更快习得这些材料。
自我纠正
你习得的越多,你越能感觉出来什么是自然正确的语言。这种直觉越强,输出就越容易,同时你就越能确定对错。
达到 5 级的理解水平后,你已经能够正确使用大量的目标外语,也能注意到那些明显的错误并加以纠正。
但是,母语者视角在很多情况下还是有必要的。如果你不确定你写的东西是否正确,你需要有母语者帮你判断正误。
母语者的纠正
在你完全发展出自我纠正的直觉之前,由母语者来纠正是非常重要的。
而当被母语者纠正时,你会自然地想记住他们告诉你的「正确答案」,但这做法其实误解了「纠正」的目的。记住,纠正的目的是帮助你注意到错误,而不是纠正它们。一旦你在沉浸学习中看到了足够多次的正确措辞,你的大脑就会自然而然地纠正错误。
当母语者纠正你时,相信他们的纠正,但要警惕他们对为什么某事不正确的解释。大多数母语者不擅长解释语法规则,因为他们从来没学过语法。他们完全通过沉浸学习母语。
谷歌纠正
如果你没有母语者搭档,也可以利用搜索来纠正。如果你写一句话,但不确定它是否通顺时,可以用谷歌搜索看看这句话是否常见。
谷歌纠正对于句子片段和短语效果最好。搜索时把片段用引号括上,看看互联网上是否有人曾经写过。如果它是自然出现的短语,应该有数十万个结果。
3B:活动指南
在整个学习导航中,我们解释了可用于发展特定技能的许多活动和策略(activities and strategies)。思考如何安排所有这些不同的部分来学习可能会让人不知所措。
本文旨在帮助你解决这一问题,以便更有效地规划你的语言学习。
反馈循环
从反馈循环的角度思考,有助于建立学习流程。
「循环(loop)」是:一系列重复的步骤。每通过一次循环就是一次重复。
「反馈循环(feedback loop)」是指:一次重复的输出的内容,成为下一次重复的输入内容。
阶段 2 中描述的每项活动(activities),都是反馈循环中的步骤,用以帮助你提升理解能力:
-
精细沉浸:有意识的拆解语言知识。
-
词句挖掘:找出并学习不懂的词句。
-
Anki 复习:复习新学的词句。
-
无阻沉浸:融会贯通新学的词句。
-
重复循环,以加深理解。
每循环一次,你都将习得新的语言片段,提升理解能力,从而为下一次循环中更难的片段做准备。
这就是我们建议你跳过那些太难的目标,而着眼于更容易达到的目标的原因。每习得一些语言片段,下一片段的学习变得更容易。只要继续循环,最终困难的内容将变得简单。
在 3B 阶段,学习过程中加入了两个新的反馈循环:改善写作和发音。
改善写作能力
3B 阶段结束时,你应该能轻松的用目标语言书面对话。使用下面的反馈循环,以达到此目标:
-
与对话伙伴或 iTalki 导师进行书面对话。
-
由母语者(或通过谷歌搜索)来纠正。
-
通过沉浸学习找到正确用法(书面论坛和聊天室)。
-
沉浸学习直到习得正确用法。
-
重复上述过程。
像 Tandem 和 HelloTalk 这样的软件内置了纠正工具,可以帮助你被母语者纠正。也可以使用像 Journaly 之类的工具来纠正较长的文章。
如果和随机的陌生人聊天让你感到焦虑,我们建议你请位导师。在 iTalki 上找位导师,并说明你有纠正写作的需求。
改善发音
发音练习是你需要开始的第二个新的反馈循环:
-
听语言家长所说的内容
-
影子跟读语言家长所说的内容
-
将你的发音和他们的进行比较,找到不同之处
-
有意识的调整你的发音,从而和他们一样
-
重复
当你听语言家长说的越多,影子跟读起来就越容易。影子跟读的越多,就越能注意到语言家长说话时的细微之处。
平衡
我们经常被问到,「每项活动我应该每天花多少时间?」
语言学习需要多年。对于长期的目标来说,以周为单位来做计划比以天更好。你无需每天训练。其实,最有助于融会贯通新练习的方法是:单独为某一训练腾出一到两周的时间,直到轻松掌握为止。你可以专注写作训练两个星期,接着发音训练安排在下两周。
一旦你适应了这样的强度,我们推荐每周都做几次这样的训练。这是我们建议的日程表:
-
每周影子跟读 4 次,每次 15 分钟
-
每周写作练习 3 次,每次 30-60 分钟
-
每周花 15 小时沉浸学习于语言家长的闲聊。
-
其他时间用来沉浸学习有趣的内容。
进阶
当你能轻松做到以下时,就升级到 3C 阶段 :
-
你能很轻松的理解语言家长的话语(6 级理解能力)。
-
你能理解闲聊的纯音频(5 级理解能力)。
-
你能轻松的理解书面形式的闲聊(6 级理解能力)。
-
你能影子跟读要练习的音频 60 秒,同时 1 秒钟都不落下。
-
你能很轻松的用目标语言进行书面交流。
口语的捷径
有些人比起写作更喜欢口语。如果你迫不及待的想要开口说话,可以 3B 和 3C 阶段同时进行。
3B:发音
有了大量的听力输入,你应该能很熟练地听清目标语言的不同发音了。但是光能听清发音不意味着你把他能发出来。
发音是身体技能。你要练习强化一块块口腔肌肉。规律练习几周之后,口腔就能比较适应新语言的发音了。
影子跟读
发音练习有很多,但最重要的练习是影子跟读。
影子跟读是一边听母语者的录音,一边实时而准确地重复录音内容。
影子跟读能极大地锻炼发音技能,因为你能听出录音和你的发音有怎样的区别。反馈很及时,你能专注于练习还不够自然的地方。
这个视频是影子跟读学英语的实例:
https://youtu.be/Kn94FOy3jBk
如何影子跟读
刚开始影子跟读时,单单跟上录音的节奏就很困难。你可能只能跟读几个词,然后就跟不上对话了。没事。哪怕一句话只能听清两个词,也要继续跟读下去。
久而久之你就能跟上材料了。你能自然而然地听清音频并复述材料。一旦你能轻松跟上音频,你的练习重点就要切换到发音和节奏上。目标是尽可能接近你所跟读的人的说话方式。
选择跟读的内容
刚开始练习跟读时,你可以随意选择材料来做练习。但一旦你能跟上音频,你就应该选择只跟读你的语言家长。如果模仿多个人的说话方式,你的口音会是这些人的混合体。专注听一个人的材料,你才能说得又自然又统一。
选择你的语言家长自然交谈的内容,最好是未经编辑,没有剧本的。对于你选择要跟读的内容,你应该能达到五级的理解程度。
我们推荐你跟读的内容中应该有视频的内容,不要全是音频,因为视频里你能看见语言家长的表情和肢体语言。你的大脑会下意识地吸收这些信息,这样你会更好地模仿他们说话的风格。
3C:常见语言能力弱项
目前为止,你主要着眼于提升词汇、语法、发音方面的能力。但是,在你的目标语言中,有些更为细致的方面是你尚未注意过的。
接下来,我们会描述一些语言学习的常见问题,你需要开始关注它们。我们的详细版指南有一份列表详述所有问题。我们建议,如果你愿意的话,来阅读这篇完整文章。
不要指望在第三阶段能把这些都掌握好。你的目标单纯是在沉浸学习时能注意到这些问题。这是将其习得并提升语言能力的第一步。
自然的遣词造句
第二语言学习者最容易犯的错误之一,是用母语的方式遣词造句。
同一个概念在不同的语言中表达方式也有所不同。将母语的表达方式迁移到目标语言的话,你说的话听起来会很不自然,甚至意思会不通。
例如,在英语里你不是吃药而是“拿药”:我拿过药了(I took the medicine)。在日语里,吃药的表达字面翻译过来是「我喝药」,即使药是固体药丸也这么说。如果你对日本人说「我拿过药了」,他们会觉得你是从药店偷药。
学习外语的其中一环,是分清概念及其表达方式的区别。不要想「我怎么用目标语言说这个东西?」,而要问自己「母语者遇到这个情况会怎么说?」
语体风格
人们在不同情况下会有不同的口吻。你不会像跟孩子说话一样向国王进言。这些不同的口吻也就是「语体风格」。
不同语言和文化应对各种情况有相应的语体和社会规范。你需要掌握各种语体的说话方式及其适用场合。
衔接词和搪塞话(译注:Fillers and Fumbles, fumble 指找不到合适的词时应付着说的东西)
自然的对话不是一丝不苟的。人们会说到一半停下来思考,跑题讲其他的事,澄清之前的描述。
母语者会以特殊的方式来衔接不连贯的话语,这样听起来就更为自然。正确适当运用这些模式,你的对话会更自然,母语者听起来也更舒适。
重音、音高、声调
在第一阶段,你学习了目标外语中的基本音位。除了这些基本音位,有些语言也会使用重音、音高、声调的特征来区分不同意思的单词。
比如说,英语有时候会使用重音来区分拼写相同的名词、形容词、动词。「PER-fect」是形容词,而「per-FECT」是动词。
除了单个单词的发音需要调整,你还需要注意句子的语调。语调是一句话之中音高和重音的变化。语调的反常意味着弦外之音。比如在英语中,有一种特殊语调会表达讽刺。
阅读了解目标外语的发音特征和模式,有助于你在沉浸学习中察觉到这些。
3C:能力(Competence)与表现( Performance)
你说母语的时候不需要考虑语法。你用直觉驾驭你的母语。你能感知什么是对的,什么是错的。这种凭直觉驾驭语言的本领称为「能力(competence)」。
在整个阶段 2,你着眼于建立理解,因为理解的建立是培养能力的前提。高水平能力使你面对语言片段时,凭直觉便可知晓它是否正确。
另一方面,表现(Performance)是你在对话时运用你能力的体现。将你的想法转换为目标外语,正确发音单词,保持自然的说话节奏和腔调都是表现的一部分。
能力优先
在 Refold,我们在练习表现之前优先考虑建立高水平的能力。建立基础的能力可以让你学会该如何发音,以便你可以正确的模仿发音。
建立能力后,如果你试着开口说话,你会发现你的口语已经比大多数传统学习者好多了。你的大部分能力将自动轻松的体现在表现上。你仍还会犯错误,但凭借高水平的能力,你比传统的学习者提升更快,因为你能够察觉到自己的错误并纠正。
如果你没有像大多数方法所建议的那样,首先建立能力,而是直接在刚开始就输出,那么你需要依靠母语者来不断纠正你的每个错误。由于语言知识太过繁杂,仅通过外部纠正无法变得流利。如果你想流畅自如的交流,前提是建立对语言的直觉,以达到能察觉错误并自我纠正。
达到 3C 阶段后,你应该对在现实生活中的日常对话有 6 级的理解能力,这能让你自我纠正犯的绝大数错误。
衡量能力
衡量你的能力:
-
记下你的输出内容 (口语或者写作)。
-
回看录下或写下的内容,并记下所有你能发现的错误。
-
找母语者纠正。
如果你能意识到自己犯了语言错误,那么就说明你的能力已经强大到可以帮助你能通过直觉纠错。
如果你无法发现或不知道如何解决你的语言错误,那么就说明你的能力仍然不足。
修正错误
表现错误比能力不足更容易纠正。如果你足以发现它们,那么这说明你只是练得不够,接下来就不断练习直到把他们做对。
能力不足更难纠正,这意味着如果没有母语者的帮助,你发现不了它们。在意识到能力不足后,你需要通过沉浸学习找到正确用法。
在下一篇文章中,我们会解释常见语言能力弱项,以便你知道需要注意什么。
3C:口语练习
3A 和 3B 阶段,你要专心练习口语能力的各个子技能。
-
去听和你交流的人说的内容(听力练习)
-
思考该说什么(写作练习)
-
把想法转化成文字(写作练习)
-
开口发出声音(发音练习)
现在你已经全部掌握这些子技能,是时候整合它们,开始说话了。
练习口语能力时有两项任务需要注意:
-
发现问题。
-
刻意练习正确的用法。
发现问题
影子跟读
通过影子跟读,你可以把你的口语能力与母语者的说话录音相比,这使得你可以发现一些你纠错能力之外的问题。你无需感受对错,只需要感受哪里不同。
说话时录音
说话时难以注意到自己犯的错。因为你全神贯注于听对话伙伴说话和构造自己的句子。说话时录音,你就能稍后再次观看、收听对话,专注于找出错误。
可以录制自己的独白,也可以录制与母语使用者的对话。之后重听录音,找出问题,再刻意练习正确用法。
接受母语者的反馈意见
口语表现受制于语言能力。语言能力不足时,没有母语使用者的反馈就无法发现问题。无法发现问题就无法解决问题。
你可以在对话中获取母语使用者的反馈,但给自己录音并把录音发送给母语使用者会更容易。这样,他就能反复听录音,并给你书面反馈。
刻意练习
对话
谈到输出,什么都不能代替真正的对话。不与真人练习就永远无法达到轻松晓畅的口语水平。
HelloTalk、Tandem、Discord 之类的软件是与母语者交友聊天的好去处。
如果能负担得起专业导师的经济成本,iTalki 也很适合练习对话,纠正错误。
独白
如果你尝试和人说话却感到社交焦虑,可能更愿意独白。独白意为独自一人或在镜头前说话。
重要的是:不要提前准备独白。独白要尽可能不打草稿,自然流露,才能展示你真正的口语能力。
想说什么说什么。你可以概括刚看过的电影,或者讲述个人经历。如果不确定从何开始,就随便看一个 Youtube 视频,总结其内容。
模仿语言家长
你可以通过影子跟读专门练习发音和语调,无需思考要说什么。一旦在影子跟读时掌握了语言父母的说话风格,下一步就是在表达自己的思想时尽力模仿语言父母。
你能以语言父母的声音表达自己的想法时,就达到了近似母语的流利程度。
其他问题
练习口语时可能会遇到很多问题。为了帮助你克服这些问题,我们从 Refold 社群搜集问题并编写了[口语常见问题解答](https://refold.la/roadmap/stage-3/c/speaking-troubleshooting)。
口语练习指南
要提高你的口语技能,请专注于这个口语练习循环:
-
与母语者交流。
-
录下自己说话,之后重听修正错误。
-
找母语者纠正你,找出能力不足导致的错误。
-
通过沉浸学习找到正确用法。
-
重复。
如果你觉得某项口语子技能的欠缺妨碍了你的口语能力,完全可以集中练习该子技能 1-2 周再回到口语练习循环。
要让语言「活起来」,注重写作和独白。要改善口音,注重影子跟读和模仿。
进阶
当你能够轻松地与母语者闲聊时,请进入第 4 阶段。在第 4 阶段,你将把自己的能力扩展到新的领域,同时精进口语发挥,最终像母语者一样说话。
添加卡片的所有排列以防止模式匹配
原文:Add all permutations of a card to prevent pattern-matching
写卡片(尤其是挖空卡)时的一个常见问题是,大脑只是模式匹配卡片的「形状」,而不是真正处理卡片上的信息,因此你可以不用真正思考就给出正确的答案。发生这种情况是因为你的大脑知道哪些卡片在你的 Anki 牌组里,哪些卡片不在里面。防止这种模式匹配的一种方法是,把一张卡片的所有「排列」都加进去,这样你的大脑就必须做一些额外的工作来区分哪张卡片是刚刚出现的那张。
下面是一个例子:
-
如果 E 是一个初等矩阵,那么 A 和 EA 的列空间是如何关联的?
-
如果 E 是一个初等矩阵,那么 A 和 EA 的行空间是如何关联的?
-
如果 E 是一个初等矩阵,那么 A 和 AE 的列空间是如何关联的?
-
如果 E 是一个初等矩阵,那么 A 和 AE 的行空间是如何关联的?
(我认为,最好问问我们能做出的最强有力的陈述是什么:空间总是相等的吗?维度总是相等的吗?或者两者都不是?)
所以一般原则是:如果你做了一张卡片的所有排列,那么你的大脑就不能自动匹配答案的模式,这是一件好事。因为如果你只是添加了其中一张卡片,那么无论什么时候,只要看到卡片的「形状」,你的大脑就会自动得出「他们是一样的!」这一结论。
对于填空卡,这会起作用吗?我觉得没用。我认为你需要把它转换成基本的问答卡。
我也一直在试验这个技巧,以便能够将「是否」类问题添加到陶哲轩实分析抽认卡中。虽然标准的「是否」类问题不那么有用(因为你的大脑只会去模式匹配) ,我仍希望如果我添加所有的排列,大脑就不得不思考,这样的效果会不错。
另见
链接到本文
-
制作精小卡片的技巧列表 (← 链接)
-
-
好的文字解释有什么特点? (← 链接)
简单问题卡片的初始间隔应更大
原文:Add easy problems as cards with large graduating interval
对于特别简单的数学问题,比如 janich 的线性代数选择题,可以设立单独一个牌组,其毕业间隔设为一两年,所以我之后还能再看到几次。但毕业间隔够长,展示次数也不会频繁得让人烦躁。
我觉得这样一来,十年之内的复习次数大概能减半。
手机上完成 Anki 复习更有趣
原文:Anki reviews are more fun on mobile
出于我不知道的原因,我发现在移动设备上用 Anki 复习比在笔记本电脑上更有趣/有动力,即使我几乎所有事情都更喜欢在笔记本电脑上进行(并且通常讨厌移动设备!)。
AnkiDroid 也似乎在过去这几年变得更好了,比如现在 MathJax 开箱即用。
唯一的例外是证明卡:相较我的其他小卡片而言,回答这些卡片时要写的文字更多,所以我即使用平板也很难复习这些卡片。
更新:现在我感觉手机上复习也没那么有趣了,并且随身携带的移动应用不再能帮我清除积压的卡片。所以这可能只是新奇效应在作祟。
更新 2:我认为部分原因是 AnkiDroid 开始变慢了,而且这延迟很是恼人,让复习难称有趣。
间隔重复会干扰对知识重要性的内心认知吗?
原文:Can spaced repetition interfere with internal sense of relevance?
间隔重复会干扰内心对知识重要性的认知吗? 我也称之为 间隔重复对知识真实频率的扭曲。
Matt vs Japan的一个视频提到,Anki 会扰乱你对某些词的频率的内在感觉(尤其是对于非常不常见/罕见的词)——由于 SRS,你更容易想起来这些词,即使没人用它们。(译注:Matt 是美国人,在美国花了 5 年时间就让自己日语达到了日本人都以为他是母语者的水准;他主要进行沉浸式学习,曾是重度 Anki 使用者)
我想知道,SRS 应用到其他学科时是否会出现这个现象。比如说,如果对于数学应用 SRS, 会不会扰乱数学家对于何种情况下应用何种定理的直觉?
Anki 会扭曲知识的「真实频率」吗?因为卡片的复习方式都是一样的(按照相同的间隔重复算法),「不那么有用」的知识展示给你的频率,和更有用的知识展示给你的频率,都是一样的。由此一来,大脑会错误地认定,这些不那么有用的知识,「在真实情况下出现的频率」比实际频率更高。
至少在语言学习中是存在这种现象的:matt vs japan 的一个视频里,他很快想到 shokumotsu 一词来表达「食物」,但不应如此。其实我觉得上个段落是我看这个视频前就写了的,但我不是非常确定。(译注:shokumotsu, 日语中表达「食物」比较正式的方式)
参见
链接到本文的
卡片分享能让你有理由制作价值稍低的卡片
原文:Card sharing allows less valuable cards to be created
通过 Anki 牌组分享、量子国度、Orbit 等渠道分享卡片时,写卡片或编问题的人只有一个,但卡片使用者有很多,因此创作者有理由花很多时间琢磨一张卡片。相比之下,自学者自制 Anki 卡片时,没办法在每张卡上花太多时间。
换句话说,自学者制作的少量卡片,即使没有很多用户分担制作卡片的成本,也是非常有价值的。换句话说,制作卡片的价值排在前 10%。因此,有很多卡片,其价值只有在更多用户分担成本之后显现(我不知道卡片价值分布是什么样的,所以我这里就是说一些自己的感觉)
我甚至没有讨论规模经济效应呢:如果有大型组织制作卡片当然会更高效,但我上面描述的规模似乎更小。
参见
- 等价类卡片 —— 如果有很多人分担工作量,撰写更多等价类卡片就更轻松
卡片分享
原文:Card sharing
我试图用卡片分享一词,来概括卡片复习者与撰写者不相同的情况。卡片分享可能出现在如下场合:分享 Anki 牌组、学习《量子国度》或 Orbit 之类助记媒介、或者与学习伙伴共同制作卡片。
相关页面:
链接到本文
自制卡片的间隔可以排得更长
原文:Cards created by oneself can be scheduled more aggressively
Andy Matuschak 针对《量子国度》也发表过类似观点:如果你遇到的卡片,来自于你正在阅读的文章,那么你对卡片测试的事实有足够的了解,因此相比于外语词汇卡片,这张卡片的复习间隔可以拉得更长。你充分理解材料,并用材料制作卡片,这些卡片也同样适用。
另见
- Anki 牌组设置 ——内有关于排期的更多思考
链接到本文
记忆等价属性的中心节点技巧
原文:Central node trick for remembering equivalent properties
数学有很多等价属性和同一概念的不同刻画。记忆这些内容的一种办法,是将这些东西都关联到一个「中心」属性,然后掌握「中心」属性与各条属性的双向推导。例如,线性代数中关于单射和满射有一系列等价属性。在这些等价属性中,我将「单射」与「满射」作为「中心」属性,那么比如平凡零空间与单射的等价属性,我只需记住的平凡零空间与单射双向推导。
单纯从数学角度来看,这样证明比「循环式」的证法效率差(证明 A 推出 B,B 推出 C,C 推出 D,D 推出 A,形成循环)。但从记忆角度来看,构造中心节点很有帮助。假设 A 是中心节点,你只需学习 A<->B,A<->C,A<->D 即可。
这种做法不要求你一次列出所有属性,但你能了解每条推导背后的原因与推理,这样你就能更好将其内化。
参见
外部链接
- 我想到从本质看算法 中提出的第二网络了
如何为间隔复习选择合适的数学证明题
原文:Choosing problems for spaced proof review - Issawiki (issarice.com)
即使按照正确方法执行,间隔复习数学证明也需要投入大量精力。在这个过程中,一个常见的错误是选择了不值得反复练习的题目。(这里的「题目」泛指各种形式的数学问题,包括习题、定理陈述等。)
好问题的一些特性:
-
问题很简单
-
问题很有趣
-
问题很基础/很重要
简单而有趣的问题有助于建立并巩固间隔复习证明的习惯。
糟糕问题的一些特点:
-
细枝末节太多,以至很难当场做好
-
让你感到恐惧,或者觉得「呃……」(厌烦)
对于那些仍然感觉晦涩难懂的数学证明,我在思考是否应该将它们作为证明卡片添加到 Anki 中。我认为这样做既有优点也有缺点:
-
尝试回忆不完全理解的内容通常是痛苦的,而且我认为这不是有益的那种痛苦(这更像是因姿势不当引起的疼痛,而非良好锻炼后的酸痛)。这就像你以一种结构混乱的方式存储了知识,这正是你难以回忆它的原因。一旦你理解了解决问题的自然方法,记忆它就会变得容易。
-
但也许,通过努力记忆这些尚未完全理解的知识,你最终能达到一种精炼而良好的知识结构。经过多次复习,你会逐渐消除最模糊的部分;它开始变得有意义,而且因为你已经记住了问题的大致轮廓,你的大脑不再每次思考时都陷入混乱,你就能真正思考这个问题了。我感觉对很多内容,我直接放弃了将它们添加到 Anki 中,因此我从未能将理解发展到成熟阶段(结果就是完全遗忘)。将它保留在 Anki 中就像一个不断提醒你完善理解的机制。
-
尽管如此,我仍然觉得解决新问题比在 Anki 中复习已有问题更有成就感和刺激性。
我认为如何决定在间隔证明复习中选择哪些问题,或者应该将多大比例的已解决问题制作成 Anki 卡片,这仍是一个开放式的问题。
哪些证明和练习应该制成 Anki 卡片?我倾向于选择那些简单又重要的问题。如果一个问题涉及很多繁琐的细节,我倾向于跳过它(我可能会开始制作只询问这些繁琐练习的主要观点或洞见的卡片)。
另见:
创造性遗忘
遗忘不一定是坏事。把一件事忘掉后,你便能用「崭新的视角」审视这件事。我认为遗忘也有助于「洗涤」工作记忆,摒弃不够重要的细节,在脑海中保留最重要的想法,并利用省出来的工作记忆,储存新的或重要或琐碎的知识。
需要添加到这个页面的:
-
SuperMemo wiki 上的一些东西
-
关键词:功能固着,Einstellung 效应(译注:功能固着指的是解决问题时往往只看到某种事物的通常功能,而看不到它其他方面可能有的功能;Einstellung 效应指的是人们倾向于继续应用熟悉的方法来解决问题,即使存在其他的「更好的」”或「更适合的」解决方法,也就是「拿着锤子看什么都像钉子」)
引自 Andrew Wile: 「我觉得,如果你想成为数学家,记忆力太好会适得其反。你最好记性差一点,因为你要忘记你之前解决问题的方法,这就像演化和 DNA. (记不清的话),你按之前的方法解决问题时,会犯一些错误,但这样就出现了差异,因此你就能解决[这个问题]。」[1]
Richard Borcherds 在接受 curt jaimungal 采访的 youtube 视频上也表达了类似的观点。
参见:
参考文献
链接到本文
概念发现故事
概念发现故事是一种教育风格。教导者按照这种风格讲授概念时,会虚构一个故事,描述这个概念可能是如何被发现的。
Michael Nielsen 时常讨论这个话题,他可能是独立提出的。但我觉得 Tim Gowers 也独立提出了这个想法:
然而,为了说明引入新的数学概念合情合理,还有一种办法。不必回顾发现这一概念的实际历史,而是虚构一段历史。如果你能把概念可能的发明路径讲得合理可信,那么这一概念也就合情合理了。有些读者会疑惑,怎么能有人想出来这团东西,那么虚构的历史恰好能解决这点,同时还能说明,这个概念的发明是必然的,迟早会发生。[1]
例子
-
https://www.lesswrong.com/posts/rTC8MgPuYfXEw3WLp/discovery-fiction-for-the-pythagorean-theorem
-
https://gowers.wordpress.com/2011/11/20/normal-subgroups-and-quotient-groups/
链接到本文
参考文献
间隔重复让你感觉在某门学科上总是学生
原文:Feeling like a perpetual student in a subject due to spaced repetition
间隔重复很好,因为它能让你把你学到的东西记得很久。但同时它也带来着许多情感上的困难。其中之一是,你感觉自己在某门学科上永远是学生。学习线性代数课程的人,经过几个月的学习后,能够较好地理解线性代数,并通过该课程,然后被认定为「懂得线性代数的人」或「擅长线性代数的人」。然后他们学习更深入的科目,仍然保持这种身份(尽管忘记了很多材料!)。但是,通过间隔重复学习的人,可能会在一段时间内以间隔的方式学习线性代数,因此,两年后他们仍然是「正在学习线性代数的人」! 更糟糕的是,他们会被不断提醒他们已经忘记的、必须重新学习的部分线性代数。
有趣的是,Andy Matuschak 强调了相反的情况,即「量子计算学习者」是积极的情感,其意味着花功夫来掌握它,而不是只读一篇文章后就抛弃遗忘了。
链接到本文
链表式证明卡
链表式证明卡是使用 Anki 记忆证明的方法。在链表式证明卡中,每一张卡片会询问证明的下一步是什么,所以这些卡片形成了链表这一数据结构(或者说是「累加」的链表,每张卡片都包含了卡片之前的所有证明步骤,而不仅仅是上一个步骤)。
实际上我不喜欢「链表式证明卡」这个名字,因为这听起来像是每张卡片都是一个链表,而没有体现出卡片的集合形成了一个链表。或许「链表证明法」或者什么别的名字会更好?
分析
我认为仅仅尝试将证明组织起来的卡片并不是一个好主意。这总是会在你能回答出证明的下一步前花费时间来回想证明的上下文。并且我感觉当你只是想讲整个证明写为一张「大」卡片的一部分时,回答一些任意的步骤没有什么帮助。(当然,当你在写证明的时候卡住,你可以制一张「小」卡片来回答一个特定的问题)——或许另一种说法是,你不「需要」能任意访问证明步骤。你需要的只是能够从开头写到结尾;你需要将证明的故事从头到尾讲出来的能力。并且,为了得到后一种的能力,去做前者的练习是一条充满痛苦的路。(叙事者并不需要能够从故事的任意片段开始讲述)。这条论坛帖子表达了一种类似的感觉:「别尝试说服我你能够从中间步骤开始解决一个简单问题,因为我认为那是胡说八道。解数学问题是整体的,是从头到尾的一个过程。你的思路需要回顾你从哪里来,要展望你要到哪里去。你不能只解半道积分……」
给问题做分步证明卡(把证明分解成许多张卡):「下一步」 往往有许多可能,所以有个情况很烦人,就是我不记得确切的下一步,但我可以给出合理的下一步,但这步骤不是我在卡片上写下的。
最近我感到沮丧的一件事是,当我添加关于证明的不同部分的卡片时,我常常不能迅速回忆起证明的陈述/背景,所以我就只能「呃......」,或者也许我可以迅速回答卡片,却不能回忆起证明的细节(这本身就很令人担忧)。这就像,这些证明卡的成本太高,无法回忆,但我却想知道它们。也许有一个问题是,有些证明没有名字(例如,Peter Smith 的 Goedel 书中的一个证明是没有名字的不完全性结果,以及史迪威的反向数学书中关于无限二叉树的那个证明)。如果我知道证明的名字,那么我也许可以把它作为「中心节点」,从名字可以联系到其他卡片(包括证明的声明)。
我注意到的另一件事,与上述情况有关,就是有些卡片只是在加强某一个联系。但我需要不断制作卡片,让知识的图中连接越来越密集。
另见
链接到本文
可引用性 vs 可制卡性
原文:Quotability vs ankifiability
如果一段话很容易在其他地方引用,那这句话就是可引用的。作为一个在 Wikiquote 上写了不少页的人,我很关注不同人作品的可引用性。有些人的作品比其他人的更容易被引用(尽管其见解是同等分量的)。
如果一段话很容易能做成 Anki 卡片,那么它就是可制卡 的。作为渴望娴熟使用 Anki 的人,对于如何把一段文字(比如数学课本或网上的文章)变成 Anki 卡片的问题,我思考颇多。有些文本更容易被 Anki 化。
在我看来,可引用的文本和可制卡的文本,都具有局部性(locality):中心思想集中在文本的一小部分,你可以把它「剪下来」,得到原子性的见解。如果见解是逐步表达出来的,而没有单独一句话或一个自然段能囊括整条见解(比如在讨论性文本中),制卡就很困难。
在某种意义上,可以认为渐进阅读放弃考虑文本的可制卡性,转而使用可引用性作为凭据,判断什么内容值得加入到牌组中(因为与可引用性相比,可制卡性似乎是限制性更强的属性)。
给所有东西做反面卡片
原文:Reverse side card for everything
给所有东西做反面卡片指的是在 Anki 中,不要用基本笔记类型(正面 -> 反面),而要用「基本(和反面卡片)」的笔记类型(正面 <-> 反面)。对每个新术语,要既能回忆起术语背后的概念,也能回忆起术语本身(这样你就能用上这个术语)。对每个问题,你要做 Jeopardy* 游戏,给答案想问题。「每个想法都有其反面·对称的。」《危险边缘》(*译注:Jeopardy 是美国著名的智力问答竞赛节目。 比赛以一种独特的问答形式进行,问题设置的涵盖面非常广泛,涉及到历史、文学、艺术、流行文化、科技、体育、地理、文字游戏等等各个领域。 根据以答案形式提供的各种线索,参赛者必须以问题的形式做出简短正确的回应。)
做 Anki 卡片的时候,建议总是问问自己「这张卡片的反向问法有用吗?」我越来越频繁地发现,反向问法有用,而且为此做卡的代价并不大(通常只要稍稍调整措辞,保证正向问反向问都能听得懂即可)
总的来说……这个想法挺疯狂的。我也并不太感冒……我只是想到了,并且觉得很有趣。也许这样的想法需要认真想上一个月,努努力把它实现出来,最终在放弃后总结其精华部分(比如能够注意到应该添加反面卡片,改变措辞,将基本型卡片快速转化成基本+反面类型)。刻意练习,强迫自己做一些事,发展某种直觉,之后从强加的约束中解放出来(但仍然保留这种直觉)。
参见
关于间隔收件箱的一些想法
我未来可能会做间隔收件箱 app ,下文是一些想法。
标签似乎很重要。复习安排根据标签有所变化。比如我觉得在间隔收件箱里放待办事项很不错,这样就能给低优先级的事项安排更长的间隔。为了实现这点,你可以打上 #todo 之类标签,然后采用「待办事项复习安排」,这个安排可能和 #idea, #readlater 或者 #quote 的调度不同。这个概念不一定要叫做「标签」;只是用来区分不同复习安排的方法。
还有一个要点是能区分话题,比如能区分默认的收件箱、AI 安全、日常工作。
我觉得 LessWrong 的短推送可以充当间隔收件箱——只要自己制作界面,与 LessWrong 通过 API 交互即可。
问题是,有些人觉得在 LW 发帖有点可怕(比如我),而间隔重复收件箱的意义,就是让记笔记的过程更流畅。
某种「所有笔记」 视图,只是按照创建时间或最后修改时间顺序列出笔记。如果你进入 https://roamresearch.com/#/app/YOUR_GRAPH_NAME/search,你会发现 Roam 也有这个功能。
我目前在 inbox.txt 中的「间隔收件箱」只有这个视图。但也应该有一个默认的「收件箱」视图。有点像 Gmail 有收件箱和「所有邮件」。
笔记/间隔收件箱应用程序的基本功能或「主要模式」?
- 每日笔记/org 模式记录/wordpress p2 主题/存放新想法的唯一场所,具有能够直接滚动浏览最近的笔记的功能
*收件箱功能,要复习的东西都显示在一个地方
- 概念/页面的网络,彼此通过[[维基链接]]互相连接。
链接到本文的
通过间隔证明复习来理解证明中的关键点
原文:Spaced proof review as a way to understand key insights in a proof
我认为数学有一个核心难点就是「组合爆炸」,换句话说就是可能性的问题。比如说一份证明中,有一处不等式符号是 ≤ 而不是 < 或者其他符号(比如说反过来的 ≤),那么当你阅读这份证明时,你必须准备好去解释「为什么这么用」。对于证明中的每个环节,你必须有能力解释,为什么作者是如此操作,而非采用其他办法。最终你不仅仅记住了表面上短短几行的证明—— 而是在解答一类更大的问题:「为什么作者选择这个办法,而不是其他那些行不通的办法」,这样一来,你写自己的证明时便有了思路。随着证明一点点淡忘,你的想法是「等一下,所以这里我应该做这件事还是那件事?」所以你测试这两条路,之后你会恍然大悟,「原来书上写成了那个样子是这个原因」。
有一次我想证明 Löb 定理,但我连证明开头使用的技巧都忘记了。(也许这样也挺好,因为我不仅仅是依赖于记忆技巧!)最终我想起来了,Löb 定理和圣诞老人命题有关,所以我写下了「如果这句话是真的,那么圣诞老人存在」。于是我回忆起了我需要一些类似 $T \vdash L \leftrightarrow (L \to \varphi)$ 的命题,继而回忆起,它并不仅仅是一句光秃秃的命题, 而且在某个地方有一个可证明谓词,基于此我又回忆起,我们应该将 $\mathrm{Bew}(x) \to \varphi$ 对角化。因此 $T \vdash L \leftrightarrow (\Box L \to \varphi)$。在这之前,对于为什么我应该将那个特殊的公式对角化(或者那个公式是哪里冒出来的),我是感到疑惑的。
参见
外部链接
间隔复习证明不在于记住证明
原文:Spaced proof review is not about memorizing proofs
间隔复习证明是指借助Anki间隔地证明一个结果。而 Anki 是用来记忆的。所以乍一看,间隔证明复习的目的似乎是记住证明。但我不喜欢这样想。你的确想要在很长的一段时间里都能证明某个结论,但为了获得这个能力,你不应该记住证明,而应该获得更通用的证明能力。
如果你想拥有证明事物的通用能力,为什么不直接解决新的问题呢?这不是更好吗?这里有一些支持间隔复习证明的理由:
- 对于特定的数学子领域,重要的定理是有限的。在实分析中,中值定理、Bolzano-Weierstrass 定理等是比较「经典」的定理,但也这就是这么多了。你能接触到的任何新问题,都必然不如这些基础的结论来得深刻。
*你想要保证,几个月或几年之后,你仍然能证明出来这些东西。牢牢记住重要的知识是很令人满意的。
- 如果你设置得当,做这些问题的摩擦就会减少。你不需要去寻找解决方案来检查你的工作(因为它就在卡片的背面)。(当然,缺点是你需要付出一些初始努力来制作卡片)。
当然,即使你做了间隔性证明复习,你也会一直增加新的证明,所以你仍然在解决新的问题。因此,区别就在于是否要把时间投入到复习你已经看过的问题上。我确实认为,在未来,如果能有类似Anki的东西,显示你以前没有见过的问题(而且这些问题是根据你的兴趣/口味选择的),那就更好了。
即使是极有能力的数学研究生似乎也会忘记很多问题:[1]
尽管有时候我不愿意承认,我曾多次遇到下面的情况。我解决了教科书上的一些练习。后来,我在阅读一些其他的结果时,我需要一些中间结果,这些结果看起来可能是真的,但我不知道如何立即证明它。于是我就去搜索,然后发现是我做的那个练习(然后不得不再次重做这个练习,因为我没有写出解题步骤)。
我想你可以说,如果你后来连命题都认不出了,你就没有从中学到什么。所以我认为下面这句话是很好的总结性测试:学生以后真正记住它的可能性有多大?
我对此非常难过。Evan Chen 的解决方案是挑选更好的练习,但你也可以从相反的方向努力:发明一套更好的系统,来防止你忘记练习,甚至是比较枯燥的练习。
使用 Anki 作为问题库(用我的证明牌组):间隔更多的是为了确保反复看到相同的问题不会触发你的烦扰阈值,而不是为了最佳的记忆。实际上,你甚至不是为了记忆证明,而是为了「吸收基本概念的节奏」。当你在证明事物时,有一堆非语言的本能/「心理动作」在进行(这很难有意识地观察/推理)。重点不是像监督学习那样对证明的文本进行学习,并能够完美地重现它。相反,你正在训练自己练习这些心理动作,以一种间隔的方式(间隔使它不烦人,并验证这种能力是一种本能,而不是一种反射/保护记忆)。
也可参见 Tim Gowers 关于记忆证明的内容,例如 [2], [3]
另见
参考文献
-
↑ https://usamo.wordpress.com/2020/06/14/on-choosing-exercises/
-
↑ https://gowers.wordpress.com/2011/09/23/welcome-to-the-cambridge-mathematical-tripos/
链接到本文
-
间隔重复并不是仅为了记忆 (← 链接)
间隔证明复习
原文:Spaced proof review routine - Issawiki (issarice.com)
这是我做间隔证明复习的基本步骤。
对于每份证明/练习:
-
第一次要自己完成证明。这步跟一般完成书中练习,或者阅读书中证明没什么区别。阅读证明,或者在纸上写下证明即可。
-
决定这份证明是不是足够有趣,值得记忆。如果你觉得值得,那么就继续下一步,否则到此为止。(译注:在 SuperMemo 里你也许可以分配优先级,决策不一定是二元对立的,可能是连续而不是离散的)
-
将证明写成 Anki 卡片,添加到「数学问题(新卡片)」牌组。证明卡上把证明写完整以方便复习。如果你无法解出问题,需要查看答案,手上不完整的证明也应该写下来。另外要描述你为什么觉得这样写有用(比如说你用了什么策略,套用了什么模式)。证明步骤的「动机」,在常见的解答中并没有记录,因此未来复习时会非常有帮助(你未来重做问题时,可能会忘记这些东西)。
-
添加证明卡片后立即复习卡片以避免积压(调高牌组的「每日新卡片」选项,这样即使你当天已经学完了当日新卡片的份额,新卡片仍然会出现)。(还有一个好处,数学主牌组的卡片都是旧卡,因此搁置(bury)卡片不会出问题。我以前搁置新卡片时曾经出过奇怪的问题,这些卡片会在新卡队列最后面出现,诸如此类。)
-
复习之后,将这些新卡导入「主要数学问题」牌组
Anki 的机制给上述不少步骤额外添了不少麻烦。未来可能会有系统能自动化这套流程,但目前我尚未发现(译注:2022)。
每天:
-
复习所有到期卡片(有时候,如果到期卡片太多,我会只复习其中一部分,剩下的第二天再说。由于 Anki 安排问题,每天到期卡片数量变化很大。) 复习中我会拿上纸和铅笔,并在纸上写下证明。我用草稿纸写证明,一般在复习完成后就扔掉了。(一旦复习卡片得到什么新启发,我会在这张卡片的背面记录下来,或者添加到长期的笔记中)。评分时我只评「重来」和「良好」(不用「简单」或者「困难」)。
-
如果我复习时写的证明,跟卡片上的证明不一致,我会稍微思考我写的新证明有没有问题。如果证明是对的,我会将其完善,并添加到卡片背面。(参见通过间隔证明复习来发明新证明方法)
另见
链接到本文
间隔重复实验可以体面地停止
原文:Spaced repetition allows graceful deprecation of experiments
在间隔重复实验里,你会尝试新事物(例如,新的制卡方法、新的牌组配置参数),然后会等上几个月,看看实验结果如何(记忆效果多好,复习时感觉怎么样)。由于间隔的特点(特别是递增间隔),「保持实验继续」所需的努力会随着时间减少(只要你不再添加新卡片)。这意味着即使实验「失败」,继续复习这些卡片也不会很费劲。
换句话说:间隔重复实验启动时代价最大(此时不确定性非常高)。随着实验效果越来越明确,你付出的代价也越来越少。所以即使最终实验失败了,你也不会损失很多。
比如我做了一些「阅读即可」的挖空卡片,但感觉用处不是很大,因此我最终选择专门用一个牌组做渐进阅读,但些挖空卡片还能继续复习!而且这些卡片出现的频率会不断下降,因此复习负担也越来越小,对比做笔记:改用新的笔记系统后,需要把现存笔记全部导入新系统中,这样这些内容才能发挥作用。
还有一些实验一旦失败,终止的代价会很沉重,比如约会,更换文本编辑器或者操作系统(需要调整思考模式),换工作(辞职前需要存钱)
在 SuperMemo 中渐进阅读时,降低文章的出现频率有很多办法,比如只按回车,降低优先级,按 Ctrl+Shift+R 然后输入一年左右的新间隔,这样就能很长时间都看不到这篇文章。所以相比通常的学习方法,在间隔重复中略过内容的压力要小很多。
另见
-
间隔重复充当软性闹钟——能够体面停止实验,体现了更广泛的间隔重复软化效应
间隔重复与打扫房间
原文:Spaced repetition and cleaning one's room
我觉得间隔重复和打扫房间冥冥之中有种联系。
对于我现实中的周围环境,我常常会将我当前使用的书或草稿纸放在桌子上,但之后我就不再用这些东西了,因为我转头去做其他事了。这时候,这些书/纸就成为了「也许会用」的东西,但我还想把他们留在桌子上,也许我马上又会用到呢(尽管大多数时候都没用到)。
我感觉,我一旦搞乱了我周围的环境,比如我的工作桌,我常常想留有一部分凌乱的源头,因为我觉得我可能还要用到某本书或某张纸。这时候,我犯的错不是犯懒(不过某些像脏盘子没洗这样的乱就完全是犯懒),而是对物件相关度的认知错误(具体而言,我未来什么时候还会用到某物)。所以这就是打扫房间和间隔重复的关联之处了——如果有一种间隔重复的方式来提示我,或者自动清理我不再使用的东西,这种方式是更加「柔和」、「自然」且「人性化」的处理凌乱周围环境的方法。
参见
链接到本文
通过间隔重复生成问题
原文:Spaced repetition as generator of questions
用 Anki 来提出问题:复习 Anki 卡片时我经常会产生各种疑问。我会停下来记录这些疑问。我觉得,如果我不做成 Anki 卡片,这些问题还不如不提——因为如果我会问这些问题,那么我也应该在 Anki 制卡时提出这些问题。也许使用一些其他的复习机制,比如定期重温关于这个概念的维基百科页面,也是一种产生问题/不断深化知识的方式。但是 Anki 的全部意义在于将这种安排自动化。
渐进阅读与 SuperMemo 中这种情况出现得更多。在那里,你会不断补充完善一段文字,但同时也在添加问题和感想。
间隔重复与记忆无关
原文:Spaced repetition is not about memorization - Issawiki (issarice.com)
间隔重复与记忆无关:这个标题虽有些吸引眼球的意味,但更准确的说法应该是「间隔重复不仅仅关乎记忆,甚至不主要是关于记忆」。诚然,间隔重复确实涉及记忆,但对我而言,其中最有趣的部分在于了解自己的思维方式、如何更好地解释概念(例如,更好地理解读者的思维和注意力运作方式),以及如何创造一种引人入胜的学习方式。间隔重复更多地是关于如何将知识分解成小块并更深入地理解,从而在实际生活中(包括学习新知识)变得更加高效。
我认为像陶哲轩实分析抽认卡这类材料学起来可能会非常有趣——甚至比玩《时空幻境》或《传送门》这样的游戏更有趣。理解这种「趣味性」是如何产生的,比确保人们记住他们在实分析中学到的所有内容更为重要。
当我想到「记忆」时,我联想到的是对积累知识的一种自满,就像「看看我知道了多少关于这个世界的事实」这种心态。但对我来说,间隔重复更多是面向未来的,比如「现在我有了这个学习工具,我还能学到什么?」
看到这个标题时,你们中的一些人可能期待看到一个悲观的 Hansonian 模型,也许确实存在这样的情况:人们出于各种社交动机使用间隔重复软件,比如想要显得聪明,或满足某种修补欲(tinkering urge)等。
Michael Nielsen 提出了一个类似的观点:「记忆不是目的:使用记忆系统的目的是让生活更美好,而不是为了记忆而记忆。暂且将目光转向另一种工具——笔记系统。笔记系统有一个常见现象,就是为了笔记而笔记。我知道有些人可以一连几个小时讨论自己的笔记系统,但是对于使用笔记系统来改善生活的其他方面,他们并没有多大兴趣。我姑且认为记笔记可以是有趣的爱好,这也挺好,但我对这些人的动机有些不解。制作这样一套系统是自我放松吗?这样的事在记忆系统上很少见(目前如此),但其发生不难想象。」[1]
另见
参考文献
- Jump up↑ Michael Nielsen. "Building a better memory system". November 23, 2022. https://michaelnotebook.com/bbms/index.html
卡片写作的模拟教学法
原文:Tutoring heuristic for prompt writing
卡片写作的模拟教学法(或者说「模拟聚会对话」)认为,卡片写作的目的,是如果有人(学生或者是你在聚会上遇到的人)就一个话题问起你,你能给出流畅的回答。比如说,你在为一篇博客文章写卡片,那么假设有个学生会问你「帮我总结一下吧?」之类的问题,而你就要写足够多的卡片(可能需要一些综合卡),让你能胸有成竹地回答这个问题。比如说,你可以找张卡片把回答写在背面,或者用一套卡片来回答。
但光有细碎事实的卡片是不够的——询问者希望听到连贯的总结,所以你要能把信息整合在一起。总之,你不仅要能回忆起各项事实,还要将其串联在一起,形成完整的描述。
参见
- 卡片写作的专家回应检测法——专家回应检测法是针对单张卡片的,而模拟教学法更多辅助于如何布局多张卡片,以及检测某一话题下总体卡片的质量。
链接到本文
-
卡片写作的专家回应检测法 (← links)
为啥你数学没有更强
原文:Why ain'tcha better at math
我觉得如果我告诉别人,我有一种新鲜刺激的方法来学数学,别人很可能会问我「那为什么你并不是数学最好的人」。我对这个问题有几种回答:
-
数学很有意思,但它不是我的主要兴趣。那些对数学感兴趣到成为了数学家的人,他们对数学的兴趣之浓厚,是我远远无法匹敌的。我兴趣广泛,这使我永远不可能成为数学家。在投入的时间上,我可能只花了一年全身心研究数学(2018 年中到 2019 年中);在我人生的其他时段,数学并不是我的唯一焦点。
-
相比于推动数学向前发展,我对其心理层面更感兴趣。我更喜欢思考教学和基础的东西(比如探索教一些东西的最佳方式,或者如何以一种新的方式看待非常基本的东西),而不是把我能研究的东西向前推进到最先进的程度,或者证明一个尚未被其他人证明过的定理。我会花时间为初学者编写解题手册,编写数学心理层面相关的维基页面,尝试 Anki,编写说明文章,等等。因此,即使在数学领域,我感兴趣的部分也不会促使我深入研究最先进的东西。
-
我的基本能力/原始处理能力不如那些真正擅长数学的人(比如赢得数学竞赛、进入顶级博士项目、赢得专业奖项的人)。
然而,我认为我的基本观点是好的。如果我的方法有任何价值,那么使用它的人应该能够学习并记住重要的东西。事实上,我对那些热衷于生产力/生活黑客的人有这样的批评: 如果你的「记笔记方法/学习方法/待办事项列表系统/生活方式/无论什么」真的那么好,那么,你的成果是什么呢?你用它做了什么?所以我确实觉得我需要证明我在数学方面很好/过得去,不一定是从常规的角度,但至少是从某些特殊的角度上说,我对之感到满意,且任何一个公道的人都会对之满意。
3Blue1Brown
原文:3Blue1Brown
我对 3Blue1Brown 的数学视频持以下看法(2020 年 4 月初稿;2021 年 3 月更新):
-
他在可视化上花了不少精力,作品很好看,而且挺优质(不仅是好看,而且的确有用)
-
视频内容是真正的数学,不是那些通俗数学物理科普视频里面假惺惺的玩意。(Numberphile 便这方面不尽如人意了。)
-
他也很强调看待东西的直觉(很多书并非如此)。比如他的神经网络视频中的例子
-
他有一点没有足够强调,就是学习数学其实要下很多功夫,花很多时间,导致观众可能自以为理解了,掌握了。这样其实是有害的。有些科普其他技术话题的视频也有这个问题,但他仍然难辞其咎。你的确可以说,这是观众的问题而不是视频的问题——很有动力学习数学的学生,已经知道了理解数学需要很多练习,而他的视频正好是教科书和老师的良好补充。但我对教学材料的要求很高,也经常埋怨教科书同样没有足够的直觉解释。所以我这里是一碗水端平的。
-
我觉得我不爽的是对他的视频的过分吹捧,因为这些视频替代不了埋头苦干,钻研细节的学习(他的视频并没有这些内容)。我不喜欢人们一提到数学教学就会讲 3blue1brown,完全忘了其他人(比如 Michael Nielsen 、陶哲轩、Tim Gowers 等)
-
我觉得,长期看来,这种 ADHD 般「你能不费吹灰之力学到数学」一类的视频,吸走了注意力,让数学教学中最为重要的部分无人问津。比如说,有人满腹才华,刚接触数学教学这块领域。他会觉得,类似可视化这样的工作是最为重要的目标。其实这件事已经发生了,因为 Sanderson 已经决心做这些视频了。现在 Youtube 也出现了不少山寨 3b1b 的频道,也有不少人在利用他的 manim 动画引擎。
观众是否有能力利用这些视频来提高理解水平并将其记牢,我对此表示怀疑。我估计,99.9% 的人只是单纯看了个视频,然后就把它抛到脑后。没有一股力量把他们拽过来复习材料,继续思考,或者重新发明一遍。
然而这样的情感联系也有其暗面。很多人经常会说 Sanderson 的视频是在「教数学」。但我跟他对话时,他说他觉得,只有一小部分观众,在看完视频后,获得了对数学知识的细致理解。我觉得这点基本上是成立的。感人至深的视频,对人们的智力理解水平影响甚微。对此我非常同意。可是观众知道这点吗,还是说他们在哄自己,觉得其实他们在学数学?Sanderson 自己是清醒的,这还不错,但我觉得他在蒙蔽他的观众。
链接到本文
面向数学的《时空幻境》
Braid 最神奇的地方在于玩家能立刻从直觉上理解游戏,并有一种欣赏之感。不用阅读教程手册或者查看统计数据。玩就可以了——探索就可以了。
我怎么让教数学也能带上这种 Braid 特质?一个挑战是数学探索需要将问题情境加载到工作记忆
另一个挑战是数学概念有不同的心理表征,这对于制作数学探索媒介是个挑战
这些问题不适用于广域认知增强。但是当然了,如果我们将自己限制在广域认知增强上,我们会错过 Braid 中一些魔法般的特点。
考察有指导意义的具体例子,这可能是让数学带有 Braid 特质的一个办法。
另见
链接到本文
时空幻境(Braid)
原文:Braid
在时空幻境里你真能学到东西。你能判断这点,证据就是你能够马上重新解开之前已经解决过的谜题。相比之下,《史蒂芬的香肠卷》和《果冻迷阵》则给人一种更偏「组合式」的感觉。尽管如此,你可以从这类游戏中获得更多「回味无穷」的乐趣,但正因为此,它们对我的吸引力也相对降低(重玩价值往往与实际学习呈反比)。一款游戏应该以一种创造持久洞察力的方式教你了解它的世界。
我将此称为「真实地学习真实的东西」测试。数学就是一个真实的东西,但许多课程并没有真正教会学生数学的精髓,以致学生再次学习时并不觉得更容易。另一方面,你可能非常用心地学习,真正掌握了一些知识,但如果所学的内容像《史蒂芬的香肠卷》那样,你的进步空间也十分有限。(由于你能从记忆中得知答案的「大致形状」,解题速度会有所提高,尽管你的直觉并没有变得更敏锐。)《果冻迷阵》则介于两者之间,游戏往往先给出一个「重大启示」,然后玩家需要在较低层次上持续推动果冻。这种情况下,你会记住那个重要的启示,但未必记得驱动果冻的具体细节。
参见
链接到本文
-
Jelly no Puzzle (← 链接)
数学中的组合爆炸
原文:Combinatorial explosion in math
相比于解谜游戏,数学有一个重大难点,即概念之间组合的数量多到爆炸。解谜游戏可能每步只有 20 种可能的走法,每次分支的个数(branching factor)也是 20。但在数学里,一个关于分析的问题,可能会用到代数里似乎风马牛不相及的见解。数学里这样的「走法」是可能的,这便意味着解决问题时可以采取的动作数量是「无比庞大」的。大部分问题都无法蛮力解决,除非问题很简单,使用定义便可以解决。
另见
- 通过间隔证明复习来理解证明中的关键洞见 ——对抗组合爆炸的一种方法是反复尝试证明一个定理
比较教学场景
原文:Comparison of pedagogical scenes
| 名称
| 媒介
| 力求全面覆盖所有知识点吗?1 | 讨论深入/困难的主题,迫使学习者思考吗?2 | 重点是解释还是创造/实践?
| 重点是分析解释吗?[3] | 全新概念,还是「旧瓶装新酒,但是更快更锃亮」?
|
| --- | --- | --- | --- | --- | --- | --- |
| 主流数学教材,比如陶哲轩, Axler, Spivak 的优质数学教材 | 文本 | 是 | 是(而且很难!) | 解释 | 不是 | 老一套
|
| 思想工具 | 目标是创建新媒介! | 可能吧 | 是吧? | 创作/实践 | 是 | 全新的概念
|
| 研究成果精炼[1] | 以文本为主,有一些可交互小组件 | 不 | 有一点(有启发性,但大部分网上文章不那么深入) | 解释 | 不,至少不是在公共场合 | 更快更好
|
| 可探索的解释 | 可交互小组件 | 否 | 否 | 解释 | 否 | 新旧兼有
|
| 3Blue1Brown | 不可交互的可视化视频 | 否 | 否 | 解释 | 否 | 兼有
|
| 可汗学院 | 像教学一样的视频和文本 | 解释 | 是,但只关注「简单领域」 | 大概是,但只关注「简单」领域 | 否 | 只关注「高中话题」
|
| 间隔重复 和「学习如何学习」 | 闪卡,笔记 | 是 | 是(但主要是你在做工作)| 创作/实践 | 是 | 是,有关于写好卡片的讨论以及新的学习技术
|
| 异步交流的 Discord 服务器 | 在线聊天室 | 并非独立学习资源,但优质服务器能覆盖教材全部章节,为学习者提供跨阶段帮助 | 能(提问者往往直面学习难点疑惑) | 以知识讲解为主 | 否 | 理念本身很新,但建成后往往缺乏持续优化动力,而着眼拓展覆盖更多教材和数学分支
|
| 解释学 | 目前主要还是文本形式 | 是(面向未来愿景) | 是 | 以知识讲解为主 | 是 | 探索全新的研究领域!
|
另见
链接到本文
参考文献
附注
-
↑ 这些材料是否内容全面,可以作为一套独立完整的学习资源?还是更多地起到辅助作用,为学习主题增添趣味性?
-
↑ 在该领域或场景中,对解释方法本身的探讨是否被视为研究工作的核心内容?还是更多地发生在幕后,不为大众所关注?提出一种解释事物的新技术是否被认为是对该领域的重要贡献?该领域是否鼓励和接纳运用「元分析」的思路和方法来审视问题?
定义压轴
解释概念有两种办法,例子先行,以及定义并讨论。但另一条原则是「定义压轴」,我是从这条关于 3blue1brown 的视频中总结出来的。
链接到本文
针对学习数学证明的刻意练习
原文:Deliberate practice for learning proof-based math
针对数学的刻意练习是什么样的?我具体指的是,自学本科和研究生阶段以证明为主的数学知识。(所以我不考虑高中之前更早阶段的数学,大学中证明成分较少的微积分和线性代数,数学竞赛,以及数学研究。我对数学研究很感兴趣,但这个问题似乎更难讨论。为什么不考虑数学竞赛?因为那些题目对我来说挺无聊的。)
对刻意练习的认知:Ericsson 的研究可信吗?值得我们信任吗?我认为:我们不一定要信他,但他的研究对错与否也没什么关系。我看中的是这个研究是否足够合理,我能否从这个研究中学到新东西。当将其应用到学习之后,我们可以问:「利用刻意练习的理论,我们是否在某个技能上突飞猛进?」换句话说,我们不是把他的研究作为一个必须坚持的结论或信念,而是当作需要斟酌的假说。
目录
数学是「高度发展的领域」吗?
Ericsson 在《巅峰》一书中,以及 Cedric Chin [1] 都声称,数学是非常适合刻意练习的领域。但我怎么看不出来呢?我看到书里的例子都是网球、记忆数字、音乐之类。
我翻遍了《巅峰》整本书,里面确实有一些关于数学家及其特质的讨论,但整本书都没有涉及学习数学的具体技巧,也没有描述数学家会做什么样的「刻意练习」。
在数学中应用刻意练习的困难之处
可以参考 https://commoncog.com/blog/the-problems-with-deliberate-practice/ 中关于「在缺乏成熟训练方法的领域中,练习会遇到哪些问题?」的讨论。
我觉得数学有「定义不良的子技能」这个问题。在本科数学中,我们很难明确界定具体包含哪些技能。理解证明的能力?解决问题的能力?我觉得这些技能作为技能分类太过宽泛了。也许可以细分为「解决特定类型问题的能力」。然而教科书上的练习并没有标注练习的各项属性,因此我们很难有针对性地选择题目来提高特定技能。
本科水平的证明题太长了,你没办法进行「达到 95% 的准确度」之类的练习——你无法在短时间内完成足够多的练习来达到这个标准。
Kathy Sierra 在 Badass: Making Users Awesome 这本书中用一系列插图来指导如何拆解技能(特别是最后一张图)。所以对于证明题,我觉得可以这样做来实现刻意练习的(也是经常做的),那就是放松一些假设条件,让问题更简单,或者证明一个特例。不过已经有人这样做了。另一种简化方法是先看一眼解答,然后尝试自己解决。这两种方法都是常见的学习技巧。
「缺乏反馈」——这是自学数学时面临的另一个重要挑战。获取反馈的唯一办法,是查看答案,或者在数学 Stack Overflow 上发帖求助。针对特定书目/领域的 Discord 服务器可能解决这个问题,但反馈会很慢。这跟如果概念的现有解释质量低下,费曼学习法起不了作用一样(如果现存的解释质量很糟糕,你甚至不能使用费曼技巧来获取假反馈)。
但我们也有 Anki 这样的工具。
在某种程度上,随着数学水平的提高,学习者确实能够逐渐培养出自我反馈能力,例如判断数学推导是否正确。但是我觉得这样的反馈仍然不同于刻意练习讨论的那种。
我觉得可以设计一些能够提供良好反馈的多选题。你可以设定「在这道多选题上达到 95% 的正确率」之类的目标。
刻意练习定义的组成成分
https://www.lesswrong.com/tag/deliberate-practice
让我们看看可以刻意练习的要求有哪些:
-
有目的的练习(「挑战自我获得进步」[1]):
-
定义良好,足够具体的目标。[1]良好定义的目标(比如连续完成三次练习不出错误)。如前所述,这在数学学习中是一个难点。数学证明往往冗长复杂,证明一次需要大量时间。而且,你也不能像处理高中水平的问题那样,简单地用随机数生成器来「重新生成」新的练习题。当然,你可以设定「完成本节所有习题」这样的目标,算是良好定义的,但这种似乎不完全符合这个要求的本意?那么,我们该如何判断一次数学学习是否成功呢?也许「我解出了一道问题」就够了。但这样不是很有趣。不过,在进行间隔证明复习或使用 Anki 进行定期复习时,设定这样的目标可能更有意义和可行性。「关键是要把那个笼统的目标——变得更好——转化为你可以切实努力并期待有所进步的具体事项。」[1] 因此,一个可能的方法是设定类似这样的目标:「在解题过程中,有意识地运用特定策略(例如,在适当的情况下运用归纳法;尝试概括问题,同时也关注具体例子)」。
-
专注:[1]「保持专注(学习者全神贯注于提升自己,而非注意力分散)」:我不确定数学学习是否完全满足这一要求...比如,当你在解决面前的问题或努力理解教科书内容时,你确实非常专注。这或许可以算作是专注?但另一方面,你通常不会刻意地意识到「我正在解决这个问题,目的是提高某项具体技能」,不是吗?
-
有反馈:[1] 如前所述,这也是数学学习中的一个主要难点。
-
走出舒适区:[1]「需要走出舒适区,在能力极限处练习」:在数学学习中,这一点似乎是自然而然地得到满足的。你不会去解决那些显而易见的问题,而是总是在尝试解决新的、引发你好奇心的问题。(好奇心往往会引导你去挑战那些恰好处于你能力边缘的问题。这些问题之所以看起来「有趣」,正是因为它们具有挑战性,但又不是完全无法解决)。
-
-
「明白何为优秀」/「有一个技能理论,并按照这个理论来指导练习」:关于什么才算是一个理论,我的理解还不够清晰。比如,「解决大量问题,你最终就会擅长数学」这样的说法恐怕并不能算作一个理论(天哪,这听起来更像是一种过于简单化的练习方法!)。《巅峰》这本书主要强调了接触专家的重要性,据说专家能够通过观察你的表现来判断你需要在哪些方面进行改进。
「这就是在任何领域中提升自己的基本方法:尽可能地接近刻意练习。如果你所处的领域可以实现刻意练习,那你就要做刻意练习。如果实现不了,那就要尽可能应用刻意练习的原则。这通常可以归结为一种带有额外步骤的有目的练习:首先,找出表现卓越的专家;然后,弄清楚是什么让他们如此出色;最后,设计能让你也做到这一点的训练方法。」[1]——从某种意义上说,「尝试证明一个定理,遇到困难,翻书寻找提示,然后找出你缺少的洞察力或者策略,并将其记录在 Anki 里」,这种方法正是这个原则在数学学习中的具体体现。
另外值得一提的是,刻意练习常常被视为防止技能停滞不前的一种方式;但在数学学习中,你其实不用太担心技能停滞的问题!只要你在不断学习新的数学知识,解决以前没有遇到过的问题,并且没有忘得太快(间隔重复在这方面非常有帮助),你就可以确信自己一直在进步。
目标
有一件事要弄明白,那就是为什么我们要「提高数学能力」?我们的最终目标究竟是什么?根据不同的目标,我认为我们应该采取的学习和练习方法也会有所不同。
与竞技象棋或游泳等领域不同,数学学习并没有一个明确的、单一的优化目标(尽管即使在游泳这样的运动中,你也可以追求速度以外的其他目标)。因此,在数学学习中,我们必须首先明确自己的学习目标。
关于我个人的数学学习方式,有一点似乎与常规不同:当我学完一个主题后,我通常不会刻意通过大量练习题来「进一步提高」。但也许我应该这样做?我的自然倾向是转向其他引起我好奇心的新主题。只有当某些情况提醒我时,比如遇到一个具体的问题或困难,我才会回头复习之前的主题。
另一个难点是理解什么是「所期待」的掌握程度,比如说,对于任意一个重大定理,只要听见名字,就能坐下来默写一遍证明,应该达到这样的水平吗?还是说,如果一个人在证明过程中遇到困难,但最终通过几个小时的努力(依靠记忆和一般的解题经验)成功完成证明,这样也可以接受?学界对于一个数学家应该掌握哪些知识并没有明确的标准。
我的一些目标:
-
我希望能够理解某些数学概念或结论背后的缘由。这个目标某种程度上取决于你对解释水平的要求。
-
能够识别出某个场景下有哪些数学知识与其有关,并将其应用。
参见
参考
- ↑ 1.0 1.1 1.2 1.3 1.4 1.5 1.6 Peak: secrets from the new science of expertise. Anders Ericsson, Robert Pool.
外部链接
一些链接(我觉得这些链接没啥用,但我也只能找到这么多了)
链接到本文
#《青春珊瑚岛》中描述的学习不尽如人意
原文:Depictions of learning in The Blue Lagoon are awful
《青春珊瑚岛》是一部关于两个孩子在一次海难中幸存并在一个岛上长大的电影。该片通过许多不同的事例探讨了教育和探索的主题——从老人 Paddy 那里学习生存技能(如如何建造小屋,哪些食物安全可食),体验性、手淫、月经、哺乳、育儿、关系处理等等。电影中甚至有关于想要了解世界运作机制的对话。尽管如此,我觉得这部电影没有抓住机会来探讨教育/学习的运作机制,它更侧重于情感/审美方面,而没有仔细探讨在电影的设定下将发生的事情。
数学概念有不同的心理表征,这对于制作数学探索媒介是个挑战
如果我们希望实现面向数学的 Braid,我们要处理一大挑战:对于同一个数学概念,其思考角度可能截然不同(也就是说,同一概念有多种完全不同的心理表征)。熟练运用这个概念的人,通常需要不断在这些不同的思考方式之间切换。像游戏中的谜题一样,只实现一种表征是不够的。
一些例子:
-
在《关于数学证明与发展》一文中,Thurston 网罗了各种各样思考导数的角度。
-
Michael Nielsen 发过一条推文,讲的是很大一部分数学知识其实就在用各种方式来思考同一个数学概念。
-
Tim Gowers在这篇文章的末尾写道,阶为 2n 的二面体群的思考方式有两种角度,一种是具体的,一种是抽象的。
我觉得这就让「面向数学的 Braid」更加困难了。假如你在一种类似游戏的环境中支持了某种表征,你实让游戏与这种思考方式深深耦合,过于强调这种特定角度了。
Duolingo(多邻国)
原文:Duolingo
Duolingo 使用了这些学习技巧/技术:
-
每个单元的初始关卡主要以再认练习为主,难度较低,有助于增强学习者的自信心,让他们对学习内容逐渐熟悉,而不会感觉太难。
-
在后面的学习中,你需要做一些如用西里尔字母输入单词的练习。这些练习较难,但此时你已经多次接触过这些单词,所以难度感不会太强。
-
在很多场景下,你可以把鼠标悬停在单词上查看其释义,这样就不至于完全摸不着头脑。
-
邮件提醒
-
Duolingo 没有单独的语法规则教学——你只需要通过尝试理解越来越复杂的句子,自然而然地掌握语法。这种模式类似于一些游戏的「教学模式」,或者没有明确教学的解谜游戏(比如The Witness)。
-
我发现,如果我在一个句子中只错了一个短语,这个短语往往会在接下来的练习中单独出现。我遇到过几次。我不确定这是有意为之,还是我只是弄错了最困难的短语。
-
我注意到了另一个规律,如果我做错了俄语 -> 英语的翻译,那个俄语句子很快就会以听力练习的形式再次出现。我估计这是为了让我更熟悉我做错的问题。
-
我碰到过一个很巧的短语:「одно окно и две двери」(一扇窗,两扇门),其中数字和物体在发音上很相似,我估计他们用这个短语是为了避免混淆单词。如果你先学到窗户是「okno」,之后又学到数字一是「odno」,你可能会开始混淆这两个单词。但有这样同时使用这两个单词的短语,你就必须要分清楚这两个单词,同时你会注意到「原来这两个单词发音类似啊」。
- 另一个类似的短语是「Стол стоял около окна」,意思是「桌子摆得离窗户很近」。
-
在需要用到「祖母和祖父」这样的短语的题目中,有时候会出现两种不同的词尾,比如 -a 和 -u。我发现多邻国在「祖母」和「祖父」这两个词上都用了 -a 和 -u 的词尾,这样你就不能单凭选择出现两次的词尾来猜答案。
-
我喜欢 Duolingo 提醒邮件的一点是,这些邮件的发送时间,跟你前一天做练习的时间差不多。所以 Duolingo 会自动地弄清你的日常安排,试图融入其中。
我没有在上面谈及 Duolingo 搞的「游戏化」或者成就系统(比如勋章、分数、排名榜)。我觉得这些玩意又蠢又没用(除了连续学习天数,能激励我每天都练习)
我不喜欢 Duolingo 后期课程,内容变得越来越多,越来越长,但是所获得的经验值却和以前一样。当我感到累的时候,我更倾向于做一些简单的课程来保持连续打卡记录,而不是去学习新内容(尽管我知道学习新内容其实能更有效地利用时间)。
我认为 Duolingo 对错误的惩罚过重也很不合理。答错问题会导致获得较少的经验值。我常常感觉,正是在我犯错并需要理解语法或词汇选择的新细节时,我学到的东西最多。如果我一开始答错了,然后在几个问题后答对了,这说明我确实学到了新东西,这种行为应该得到鼓励(学习 vs 表现)。
另见
链接到本文
-
我能着手的 AI 安全项目 (← links)
全面详尽的测验可以让急于求成的学习者跳过文本阅读
原文:Exhaustive quizzing allows impatient learners to skip the reading
一套强大、内容全面的测验系统(例如类似 Anki 的、能够穷尽学习材料的提示卡),能够颠覆传统的学习模式。学习者可以先尝试回答问题,如果回答不出,再回头去阅读材料。相比之下,像 Quantum Country/Orbit 这样的平台必须首先展示全部文本内容,因为测试问题并未涵盖所有信息,学习者会担心遗漏某些知识点,即便能答对所有问题。全面的测验方式可以让学习者快速检验自己的学习情况,避免在已经掌握的内容上浪费时间。
我认为最棘手的问题是:如何在保证测验内容全面的同时,又能提高测验效率?如果只是机械地将每一条信息变成一道测试题,那么完成测验所需的时间恐怕会比阅读材料更长!因此,测验必须以某种方式对阅读材料中的信息进行「浓缩提炼」,做到既全面,又高效。
一个思路是:与其进行全面详尽的测验,不如设计一种类似「二分查找」的智能算法。通过学习者的答题情况来推断其知识水平,动态调整问题的难度和阅读材料的深浅。但这个设想在实践中可能面临重重困难。
解释学
「解释学」是我经常会遇到的一个词。我觉得写好解释是门学问。
我认为这篇文章(诚然,是我写的)很好地说明了我用「解释学」表示的范畴:https://learning.subwiki.org/wiki/Examples_in_mathematics。这篇文章深入考察了「例子」这个概念,并提出了一套分类法。这样一来,如果有人在写数学解释材料,他就可以用这套方法,保证解释里完整具备四种例子。
对比其他教学法,解释学的观点是,解释是一项技能,我们能提高这项技能的水平,并发现更多新技术。
参见
链接到本文
-
我能着手的 AI 安全项目 (← links)
可探索的解释
我想在这里提一些关于可探索的解释的主张/意见:
-
「可探索解释」的概念建立在有穷性的假设上,但在数学中,你经常要处理任意对象 、各种无穷大、以及不可能的情形 (例如在反证法中)以及其他「无穷」的事物。到底要怎么做,才能在可探索解释的框架内,讨论这些涉及无穷/不可能的事物?
-
在选材上,现有的可探索解释材料,往往选择最容易用可探索的形式表达的领域,而非找出最值得解释的知识,然后花费气力,用可探索的形式表达出来。这意味着可探索解释常常让人感觉是无关痛痒的花哨玩意。见证者是漂亮而凄美的,但你最终只是在面板上画波浪线来解决人造(=鸡毛蒜皮的玩意)规则带来的问题。
-
可探索解释通常只能承载非语言的知识?这个属性很有趣,但也导致可探索解释比较难以用于数理逻辑这种语言原生的知识领域。
-
让可探索解释代劳那些无聊而繁重的智力劳动,目前则是由数学家手动完成的——比如,写好证明框架,验证某个算式时进行的低层次计算等。我特别感兴趣的是,如何借助这些工具来练习如何选择高层次的证明策略。
-
很少有可探索解释使用一系列的谜题,从简单的概念出发,逐步解释复杂概念,在我印象里,除了视频游戏之外,都没有这么做的。因此可探索解释也就缺乏「连续深度」,因此就令人感觉花哨无比,对于理解主题无关紧要。
另见
外部链接
链接到本文
-
可探索媒介的有限对象假设 (← 链接)
-
对比狭域认知增强与广域认知增强 (←链接)
虚假动机
真正让我对数学阐述感到烦恼的是,当阐述者试图给出动机并相信他们已经成功时,实际上观众并没有产生真正的动机。 但阐述可能进展得太快,让观众不能理解真正发生了什么,所以他们只是顺其自然,不求甚解,或者只是感到困惑,认为自己一定不适合学数学。
对此可能有更好的表述。
链接到本文
- 好的文字解释有什么特点? (← links)
如果概念的现有解释质量低下,费曼学习法起不了作用
原文:Feynman technique fails when existing explanations are bad
费曼学习法对于非常想要掌握知识的人很有用。但如果现存的所有解释都一言难尽,这个方法就遇到问题了。你尝试自己解释知识,但一旦你遇到困难了,你找不到可以参考的资料。
即使是解释费曼学习法的文章,其中使用的解释也不好。比如这个网站,解释费曼学习法时使用了勾股定理来举例,例子举得很糟糕。里面的解释很难称得上是解释,他们竟然把证明放在文章末尾,而且这个证明只是重新摆放图形,根本给不了任何启发。
链接到本文
- 针对学习数学证明的刻意练习 (← links)
可探索媒介中的有限性假设
原文:Finiteness assumption in explorable media
电子游戏里的对象都是离散且有限的。可探索和交互式媒体(尤其是可探索的解释)似乎经过有限性假设的烘焙,这使得处理数学中的「无限」或「任意」时都显得棘手。「无限」的一个典例是「设 $x$ 是 $X$ 的任意元素」,你在做数学证明时经常遇到,其中 X 是讨论的某类对象。游戏中「移动」时,没什么简单直接的办法,可以搞成这样。
例子:
-
可探索的媒介 https://explorabl.es/math/
-
见证者中从简单的谜题开始构建复杂的谜题。但是每个谜题都是有限的(有限的棋盘尺寸,有限的状态空间)
我感兴趣的那种可探索的媒介, 会以某种方式对 证明编写/ 证明生成 过程进行编码,以便用户可以进行真正的数学运算。但是你如何证明关于「任意紧凑的度量空间」这种东西的命题?你将如何 “探索” 依赖反证法的命题(这需要呈现 "不可能的反例")
数学的棘手之处在于您经常需要处理「无穷」,就是说, 那些不能在有限情况下表示的对象(例如数列)你得清楚地比划出来。我认为,你可以退回到 组合学 等领域去处理有限对象,但提出适用于任何领域的通用解决方案, 更会令哥哥满意.
参见
链接到本文
-
电子游戏使用有限且离散对象 (redirect page) (← links)
果冻拼图
果冻拼图是 Windows 平台的免费解谜游戏(能在 Linux 上通过 Wine 运行)。
一些观察:
-
文字不多(沉默宣言),这点很好,但我认为对于介绍关卡机制,其实可以添加一些比较简单的关卡,这样便完全不需要文字。例如,游戏控制可以用一个简单的关卡介绍,在背景中突出显示鼠标左键和右键单击的图案。为了介绍合并果冻,也可以设计这样一个简单的关卡,其中有三个果冻和一个单位大小的坑,其排列为 [红色] [坑] [红色] [红色]。唯一的通关方法,是将坑右侧的两个红色果冻合并起来,这样玩家便掌握了该机制。让我特别恼火的一件事,是教程文本会在每次进入关卡时出现,而不是仅在第一次进入时出现。
- 左右单击的操作,也可以通过关卡来介绍,让关卡必须利用左击或者右击才能解决即可。例如这样的关卡:在山上设置一个红色果冻,下面设置第二个红色果冻。将底部果冻放在左侧或右侧。必须通过将顶部果冻向左或向右移动来解决难题。
-
许多谜题可以分为「大局策略」部分和「低层技术」部分(第 17 关是最显然的例子)。大局策略正确,基本上关卡就通了一半,但有时即使弄清楚了高层次的策略,确定正确的低层技术也可能非常困难。有些谜题只需要低层技术。
-
没有时间元素,我喜欢(Braid 有时间元素,所以不知为什么很难打)
-
即使到了游戏后期,我感觉我也没有提高解决谜题的通用能力。基本上通关靠的是蛮力搜索。我认为这与时空幻境)这样的游戏形成鲜明对比,在时空幻境中,你似乎在「做研究」——试图更好地理解游戏中的现实。
-
我觉得,玩果冻拼图的过程中,可行与不可行的直觉,能够得到很好锻炼。具体而言,这款游戏很好地训练了将看似不可能的难关化为可能的技术。Eliezer 有篇帖子讲的是冒不可能而为之,我的感觉跟他的观点有点像。一旦这些谜题做得足够多,你大脑天生的「这不可能」反应,就会被转化为「让我看看怎么办」。新手刚开始编程时,也会发生类似的事情:新手经常会遇到一个问题,就是心里的算法模型,与屏幕上看到的输出不匹配,而他会怀疑自己能否像机器一样思考。
外部链接
-
https://joelthefox.github.io/2018-11-07-Jelly-no-Puzzle/ -- 这篇博文讨论了 Android 版本,从游戏中剔除的奖励关卡,以及一些类似的解谜游戏
链接到本文
解释材料中管理工作记忆的技巧列表
原文:List of techniques for managing working memory in explanations
-
在合适的位置加入总结
-
增加练习,让读者放缓脚步/促使他们更好掌握知识
-
像《量子国度》或者 Orbit 一样,在文本中嵌入抽认卡,使得读者记忆特定的术语或者事实。
-
在一些地方重复关键事实
-
大量重复特定知识,像 Duolingo 一样
-
引用时把相关内容复制过来,而不单单提一个名字,这样读者就没必要查找了
-
博客/章节/小节写得足够简短,这样读者就能一口气看完,而不会读得太久,坐立难耐,忘记阅读进度。
参见
链接到本文
直播数学视频
我在这里写过: https://learning.subwiki.org/wiki/Live_math_video
另见
链接到本文
管理学习中的微动作
原文:Managing micro-movements in learning
(一定有更合适的说法……)
-
有的数学教材会在非平凡的推导步骤后面加个**(为什么?)**这对新手来说心里踏实多了,否则他们会一下子慌了,心想:「停停,这步我是不是应该一眼就看出来?」
-
有些视频教程也会嘱咐:「暂停一下,自己思考一下再继续看。」
这两者都是在「管理微动作」,告诉学习者应该如何在短短几秒到半分钟内行动,而不是管理「大动作」,比如让学习者去完成一个练习或读完一整章。
我发现,真正让我青睐某个学习资源的一个主要原因,就是它能妥善管理这些微动作。
我特别喜欢可汗学院(用来备考高级数学的时候看了不少)的一点是,萨尔总会说:「如果你愿意,我建议你现在就暂停视频,自己动手解一解。」这样反复的嘱咐一点也不让人烦。当我觉得自己能做到的时候,我喜欢自己解决问题,但如果全凭自己,我常常懒得去决定什么时候应该动手。所以萨尔的嘱咐对我真的很有帮助。
曝瑕媒介
曝瑕媒介指媒介能够揭示出使用该媒介的材料有何瑕疵。
正面案例:
-
表格让缺失信息的单元格一目了然。只要指定了行列各有多少,便自动创造了 n*m 个需要填补的单元格。如果将表格的信息用文章或者新闻报告展示的话,缺失的信息就很难看出来了。
-
Jonathan Blow 指出,电子游戏设计者在设计系统时,必须确保游戏的规律/机制是互不矛盾的,但是小说家写设定则不必如此。
-
「做完数学,烧掉数学,跟直觉走」:写下真切的计算和各种可能性,能够确保前后统一,并能建立起清晰的模型,这是文字说理和付诸直觉无法做到的。(Paul Graham 建议过做无法扩大规模的事情,这可能与其类似)
-
各种计划一无是处,但筹谋策划是重中之重[1]
-
MediaWiki 中的红色链接,非常清晰地表现出了链接到文章的意图,与没有创建链接的现实之间的差异。这是「如果页面不存在就不要链接到上面」(互联网的默认做法)的做法所实现不了的。
-
空白小节同样让意图与现实的差异很明显。
-
设计界面:「你开发的新表示方式可能完全存在于你的脑海中,因此不受传统静态媒介形式的约束。即使基于静态媒介,它们也可能打破关于『可接受』论点的社会规范。无论原因是什么,它们可能难以用传统媒介传达。因此,它们要么保持私密,要么只在与专家同事的非正式讨论中出现。」[1]
-
写作和语言一般都有这种特性(例如,写作促使人们更加深入地理解,「将思想转换为言语会减慢思考速度,但增加纪律性,并可能显著增强创造性产出」[2]),但在我看来,它还不够严格。Jonathan Blow 喜欢谈论小说作家可以随意写任何内容。
-
deluks 在一篇帖子里说过,一步步的指导更容易批判并找出错误。这便是一例曝瑕媒介(背景是比特币)
反面案例:
???:
-
「未来工作」小节
-
Wikipedia 的「需要引用」
-
TODO/FIXME
我认为我跟大部分人的差别是我更喜欢使用这类曝瑕媒介,来曝光我知识的局限。
我们如何将某物分类为例子或反例?需要注意的几点:这个东西是否是结构性的/一种媒介,而不仅仅是现有媒介的一种特定用法?是否有其他(例如社会信号)对这种行为的解释?
某种程度上:媒介曝光瑕疵与否要用程度来衡量。比如,说话时人们能够嘟囔说完不确认的地方,而书面文本不允许这样做。所以相对而言,文章也是曝瑕媒介,但会弱于表格之类的媒介。
参考文献
-
↑ https://notes.andymatuschak.org/zRJ5mjwiTryLbJ7Jm2bDhgjLtYSa6xc6sEYS
-
↑ https://help.supermemo.org/wiki/Creativity_and_problem_solving_in_SuperMemo
对比狭域认知增强与广域认知增强
原文:Narrow vs broad cognitive augmentation
这是我在思考「如何使人更擅长思考?」的问题时,一直关注的一个主轴:
-
狭域/垂直/专门:这种增强针对于具体主题,并试图找出其「真正本质」,然后发明工具来帮助人们具体地思考这个主题。例如,阿拉伯数字专门针对数量,帮助人们操纵和思考它们。当然,学习阿拉伯数字也有助于了解对数,或实数序列,但大多数情况下它们只帮助你思考数量,而不是一些完全不相关的主题,比如线性代数。(我想区分两种情况:知道阿拉伯数字有助于运用线性代数,因为你运用线性代数时当然会使用数字,我觉得这是明摆着的;以及阿拉伯数字真的能提供关乎线性代数的洞见,我觉得不然。)
-
广域/水平/通用:这种增强着眼于所有学习,并探求我们如何发明适用于各种领域的工具。例如,间隔重复或文字的发明就是很好的例子。间隔重复不仅有助于学习语言,还有数学、化学、物理的各种细分领域,等等。间隔重复不是专门针对,比如,线性代数的;不如说间隔重复是关于人类大脑学习方式的事实。
找到了广域认知增强,人便能「解锁」新能力,这种能力能够应用到任何你想学习或思考的东西,但它也是「浅薄的」,因为增强本身不会「涉及」或「知道」你想了解的任何特定主题。
狭域认知增强用起来更令人满意,但需要发明这种认知增强是费时费力的,而且对于每个希望涉猎的话题都需要单独发明工具。
3blue1brown 频道的可视化作品感觉像是两者的结合。一方面,可视化本身像是广域认知增强。但另一方面,Grant 只能给每个他想解释的东西单独做视频。观众自己不知道怎么把数学概念做成动画;他们就是来看视频的。所以在那种意义上这也是狭域的。
Andy Matuschak 在「对某领域只有一些专业知识时,可以通过写文讨论相关主题来开发助记媒介」[1]论及了相似的区别。具体看这些话:「如果你正在开发一个界面,通过具体化关于媒介(如 Logo)的深刻想法来获得力量,你需要深入该媒介的专业知识才能具体化正确的想法。Papert 没有这种经验。相比之下,助记媒介主要具体化关于记忆、知识理论、习惯等的想法,而不是关于量子计算的想法。」
参见
- 可探索的解释——可探索的解释主要侧重狭域认知增强。
链接到本文
-
宽泛认知增强 (redirect page) (← 链入)
- 面向数学的 Braid (← 链入)
参考文献
数学教育的杂烩假说
原文:Potpourri hypothesis for math education
数学教育的杂烩假说认为,要实现理想的数学教育,需要各种不同的干预措施,每一种都能带来价值,而不是依赖某个单一的大规模或连贯的干预措施。
改善数学解释的杂烩模型:有多种独立的方法可以使解释更好,比如添加间隔重复卡片、更清晰地撰写解释、提供好的解答手册、建立支持网络如 Discord 聊天或导师、提供多项选择测验等。没有哪一种方法能显著提高人们理解数学的能力。你只需不断添加这些方法,每一种都能有所帮助。最终,你会做出很多改进,但并没有一个像 Braid 或 the Witness 那样的「单一理念」。
另一种观点类似于 Michael Nielsen 喜欢讨论的内容——你希望找到「下一种写作方式」或「下一个阿拉伯数字系统」。也就是说,找到一种能显著改善人们思考数学或其他事物方式的单一技术。
概率和统计是具有可探索媒介的领域
原文:Probability and statistics as fields with an exploratory medium
对于概率和统计学,我注意到的一点是,当我在研究一些东西(最近,我在思考[1]),而不太确定答案是什么时,我常常可以简单编写一个 Python 程序,来测试我的想法/检查我的工作。尽管有概率编程这种更高级的玩意,但目前我甚至不需要这些,仅仅是简单的蒙特卡洛式的采样+计算各种数字的程序,就已经是很不错的「可探索媒介」和验证机制了。
显然,编程学习也有类似的东西,你可以得到各种及时反馈,如语法错误、漏洞(例如错误的断言)、Haskell 之类语言中的类型错误。
数学的其他领域似乎没有这么好的媒介。例如,你可以在学习序列或度量空间的时候在纸上画东西,这往往是有帮助的。但是,这个过程没有反馈,没有智能的过程来处理你的工作并说「这样不行」或「看着不错」。你必须想出你自己的用例来测试想法,去手动检查想法与定理假设是否一致, 这样才能获得反馈。当我在做数学时,我对我处理的内容经常有多种高层次的策略/思路,但我的低层次的「计算能力 」却不是很好,以至于我最后花了很多时间在细节上摸索。[注1] 当然,所有这些低层次的计算和摸索是「对你的灵魂有益的」,但我确实觉得,就像程序员可以使用代码补全和语法检查等一样,数学家也可以受益于某种辅助工具,来自动化一些简单的/繁琐的工作。
我认为图形计算器/ 绘图软件基本上是这个方向的工具。
- ↑ 我认为建立这样一个问题库会相当有趣:你不必解决整个问题,但你可以提交一个高水平的想法,或想出三个想法并提交。然后这个问题库可以回应这个高水平的策略是否有效。你便能训练直觉,了解哪些高层次的策略是有效的,而不需要经历所有低层次的细枝末节。
链接到本文
表示不可能的情况
原文:Representing impossibilities
数学中经常需要处理不可能的情况(比如使用反证法证明时)。在可探索解释中,如何可靠地表示这些不可能的情况?
如果你要用反证法证明,你必须找个办法来在视觉上呈现不可能的情况!
参见
链接到本文
-
可探索媒介的有限对象假设 (← links)
序列 vs 常青笔记
原文:The Sequences vs evergreen notes
Eliezer Yudkowsky 在 LessWrong 连载的「序列」与 Andy Matuschak 的常青笔记有诸多相似之处。
-
他们试图给概念贴上标签,并不害怕创造新的术语,以便使后续的思考更加清晰
-
他们将原子化的洞见打包成笔记或博客文章,以便在作品的其他地方引用。
-
他们广泛使用维基式链接,这样读者就可以探索前置知识和相关思想
几点显著差异:
-
Andy 似乎并不将常青笔记视为最终成果,而是将其作为撰写论文等公开作品时的知识底座。相比之下,Eliezer 眼中的序列本身即是主要交付物。
-
常青笔记往往处于不断修订的状态,而序列的写就则是为了系统阐述 Eliezer 业已形成的连贯思想。
-
常青笔记篇幅通常远比序列文章精简。
链接到本文
数学社区对于数学家应知应会的知识没有明确标准
原文:The mathematics community has no clear standards for what a mathematician should know
数学家很不擅长区分(1)你应该仔细过一遍,然后抛之脑后的知识(2)你应该熟练掌握的知识,要达到有需要便能完整回忆起所有细节的程度,或者至少能回忆起主干,之后可以按需细化(3)你应该知道其表述或者其结果的知识,但你并不需要仔细研读证明,只要懂得证明概要即可。
如果能对数学家开展调查,测试出他们熟练掌握哪些知识,不知道哪些知识,那应该很不错。
我感兴趣的问题:对于数学知识,如何确定应该理解到何种深度。如果我在学习一些知识,如何能更优地做出判断,是否将其做成 Anki 卡片,或者将哪些部分做成卡片呢?这个问题当然取决于个人目标,但我想知道一些原则:比如说,如果我想成为数学研究者,我应该掌握分析/线性代数等学科到何种地步呢?很多人都会问这个问题,我觉得。
链接到本文
-
针对学习数学证明的刻意练习 (← links)
数学头脑
数学头脑或者说物理头脑的数学版本,是一本用《物理头脑》的方式教授数学的假想数学书。
实际上有《数学头脑》这样的书吗?(可能是 AOPS 的书?)这种方式似乎不太适合数学,但我不太能表述清楚。也许你需要让读者掌握一大堆术语和概念甚至才能开始问问题。概率论/组合数学是少数不必引入太多术语也能讨论的数学分支(这可能就是 AoPS 的书读起来非常享受的原因)。
更新:我觉得一问一答模式在《物理头脑》行得通的原因,是这些问题可以用来问所有人,他们都能理解,而不像数学一样,非得先讲一大堆概念,或者解释什么是什么证明才行。
有一些书试图采取问答形式,像 H.S. Wall 所著的《创意数学》,以及《窥自初等问题的数学精要》,但这两本书我都没有深入读过。
参见
-
面向数学的 Braid (← 链入)
链接到本文
-
面向数学的 Braid (← 链入)
-
《物理头脑》的数学版本 (redirect page) (← links)
数学探索需要将问题情境加载到工作记忆
原文:Tinkering in math requires loading the situation into working memory
**在数学探索中,我们首先需要将问题情境加载到工作记忆中。**这与玩电子游戏或使用 Duolingo 等应用程序的体验有所不同。在游戏或应用中,所有的操作对象都直观呈现,用户可以立即与之互动。而在数学中,问题往往以文字描述的形式出现在纸上,这种描述并不等同于问题本身。要真正开始探索这些数学对象,我们必须先在工作记忆中构建起它们的模型。
一旦你把问题「加载」到工作记忆中,就可以像玩游戏一样进行试验。只是从书面形式转换到认知媒介——即「下载到大脑」的过程——需要一些语言上的努力。我们能否将这种「认知媒介材料」呈现为计算机模拟?
数学版多邻国的一个问题是,在数学中,如果你想思考一个问题或定理,通常需要把很多东西加载到工作记忆中。所以,即使只是「玩」,也需要这个初始加载过程。然而,一旦你把东西加载到工作记忆中,你往往可以以有趣的方式进行试验,像 Duolingo 那样的小任务也能很好地发挥作用。
参见
链接到本文
解释材料中假设了工作记忆容量是无限的
原文:Unbounded working memory assumption in explanations
解释材料中假设工作记忆有无限容量,这指的是很多解释材料假设读者的工作记忆的容量是无限的,也就是读者能阅读时能记住前文提到的所有内容。这样的解释对作者来说更容易写(因为写作者已经掌握了所有概念和微妙之处,他感觉没有必要「管理工作记忆」),也会在概念上更「整洁」(因为这样的材料直指话题的概念框架,而不必顾虑人类心理的各种细节)。然而这样的解释更难懂,因为工作记忆实际上是有限的。
可以这样理解,总有人要处理工作记忆的限制。如果解释者没有处理,那么读者就要承受管理工作记忆的负担。
这可能是产生显然的幻觉的机制之一。
很多解释材料会假设读者会管理自己的工作记忆限制,所以他们并没有跟踪工作记忆的负荷。这样一来,解释会很整洁,但也很难懂。
参见
链接到本文
电子游戏允许即时的探索
原文:Video games allow immediate exploration
在电子游戏中,游戏对象与屏幕上呈现的视觉元素通常是一一对应的。这种设计使得玩家可以直接、直观地探索游戏世界,同时也为游戏编程提供了便利。
相比之下,探索数学问题则有着本质的不同,因为数学探索需要将问题加载到工作记忆。
参见
链接到本文
对比数学与电子游戏
原文:Video games comparison to math
链接到本文
-
电子游戏 vs 数学 (redirect page) (← links)
-
数学 vs 电子游戏 (redirect page) (← links)
沉默宣言
沉默宣言来自 Hamish Todd 的一次演讲,其题目是《必须停止制作冗长的教程。为什么游戏设计者都应该做出「沉默宣言」》
链接到本文
我们仍然不知道系统性撰写优质文字解释的方法
原文:We still don't know how to systematically write great word explanations
文字解释已经很不错了,但他们仍然太稀有了,似乎需要非常熟练的解释者,而且可能只适用于某些主题。我们(作为一个文明)如何更系统、更稳定地提升撰写优质文字解释的能力呢?这意味着:
-
我们希望在指导人们撰写优质解释方面取得更大进步;我们希望将其发展为一门科学,保证任何(在某种最低胜任水平以上的)人都能学会它。
-
我们希望能够在更广泛的主题上做到这一点。我能感受到我们目前只擅长解释那些在数学/符号上相对简单,且没有一次性涵盖太多前置知识的东西。
-
我们希望学会如何更快、更高效地做到这一点。
参见
好动机有什么特点?
原文:What counts as good motivation?
-
有助于解决有趣的问题
-
有内在美或者迷人之处
-
能解开心里的巨大疑团
参见
链接到本文
- 好的文字解释有什么特点? (← 链入)
好的文字解释有什么特点?
原文:What makes a word explanation good?
本文我专注于文字解释,所以我会忽略间隔重复卡片、可视化之类的手段。
-
确立读者所需的前置知识,介绍背景信息,之后以此为基础进一步阐述
-
模拟读者缺乏经验的心境
+ 预计有哪些常见的误解或错误观念,并一一处理
-
预计读者会问哪些常见的问题
-
不要假设读者的工作记忆是无限的(这里说明了如果违反这条规则会有什么后果:解释材料中假设了工作记忆容量是无限的)
-
如果文中有指代相同概念的不同词汇/术语/短语,要明确说明(即使是技术领域,同义词也非常常见!)
-
指出哪些东西不是很重要,初学者不用关心,让读者集中注意力
-
如果同一个词汇/术语/短语指代了不同概念,也要说明(这个现象即使是在技术领域也非常常见!)
-
定义概念时要给全四种例子
-
对抗混淆:相连介绍看起来相似的概念时,停下来要说明这两个概念是否真的相似
-
告示读者有一些概念会过时,因为后续会进一步阐述
-
-
-
考虑概念的各种组合情况(参见遍历组合技巧,这是更相近的想法)——其实人们写作时会隐式地画一个表格,一列一个属性,一行一个例子,然后把一些单元格填满,但有些单元格没有填;举例说明这个想法不成立的地方:https://github.com/riceissa/project-ideas/issues/18
-
在具体和抽象之间交替解释
+ 从头到尾都要提供很多例子
-
给出一个精确/技术性/可操控的模型以便读者摆弄
-
措辞要保证让读者读得懂(你措辞模糊,可能指代很多东西,或者用词抽象,读者不知道能联系到什么具体东西,读者就看不懂了;)
-
引入参数和变量时,要说明常见的值,也要说明极端的值
-
给出高质量的心理表征
+ 比如给出数学概念的定义时也要说明人们在应用时心里是怎么想的
-
按照概念发现故事的结构设计
-
开头给出学习该领域的动机,回答「那又如何」——换句话说,如果有人因为话题看起来似乎有点酷,或者所有人都在讨论,而阅读你这篇文章,看到动机一节时,他们应该会非常感兴趣;你描述的动机,应该能增强读者初始的动机。不要写那种大多数文章里面一点即灭的动机,说什么「这个学科很重要」。这里就要问:什么样的动机是好动机?甚至很多偏向教学的数学解释材料都会遇到这个问题;虚假动机。
-
每个步骤都要说明动机
-
不仅要说明关键的洞见,而且要说明可用于发现这些洞见的通用方法
-
说明这个话题下容易想到但是失败了的方法/行不通的办法
-
定义压轴放最后
-
-
提问方法
- 请读者在阅读解决方案之前先自己思考一下。但这需要谨慎行事,以提高读者的兴趣,而不是吓唬他们。有关详情,请参阅管理学习中的微动作。
参见
外部链接
-
https://machinelearning.subwiki.org/wiki/User:IssaRice/Mental_representations_in_mathematics
-
https://jvns.ca/blog/confusing-explanations/ https://news.ycombinator.com/item?id=28254630
-
这个页面上的视频也讨论了一些提升解释文章质量的方法:https://www.3blue1brown.com/blog/some1
-
评判教科书 by https://captchasamurai.github.io/homepage/index.html
链接到本文
数学中的沉默宣言会是什么样的?
原文:What would a vow of silence look like for math?
数学中的「沉默宣言」会是什么样的?也许我们不能真的沉默,但我们可以做到不去下定义。Hamish Todd 在他的 Braid 直播里提到,Braid 从来不给游戏里的物体取名字,用户必须自己给这些物体取名。
数学游戏可能也类似,游戏里一切事物都是逐步构建的机制,没有什么是预先定义/命名的。
链接到本文
文字解释已经很不错了
原文:Word explanations are already great
我最近在阅读 https://math.stackexchange.com/a/498790/35525,它让我注意到了,如果你会写的话,只有文字的解释(没有图片、视频、交互组件、动画、间隔重复、多选题)就已经很好了。我认为人类文明仍然不知道如何撰写文字解释,如果继续这样下去,我们尽管能在文字上堆砌各种花招,我们仍然无法产出优质的解释。如果解释材料以文字的形式无法立住,那么这个解释就是糟糕的。
如何写出非常优秀的文字解释,这点上还有很多尚未明晰的地方: 我们仍然不知道系统性撰写优质文字解释的方法
参见
在解释学中你并不需要践行自己提倡的原则
原文:You don't need to eat your own dogfood in explanation science
有时,人们喜欢批评关于教学法的文章(不是教学内容本身),说它难懂,或者没有遵循自己提倡的原则。但我认为,在写关于解释的文章时,人们也感受到了一种「践行自己提倡的原则*」的压力。然而,我觉得这种压力有点不必要,以下是我的看法:(译注:eat their own dogfood,吃自己家的狗粮,作者在这里说不需要这样做,意思就是你在批评教学法的内容时并不需要遵守你的批评,通俗来说就是在评论空调制冷效果好不好时,你自己并不需要会制冷。)
没有人会把对电影的评论,或关于如何制作电影的说明(或者是视频游戏、绘画作品等),误认为是电影本身。只是因为阐述和评论都是非虚构文本,人们才会用「你在提炼这个东西,但你对提炼的解释有点糟糕」这样的逻辑。
其实,解释和对解释的评论可以是两码事,它们应该被视为不同的文学体裁。
将解释作为科学:一些关于发展解释学的想法
原文:Exposition as science: some ideas for how to make progress - LessWrong
在前一篇帖子中,我认为,把解释当作一个科学领域对待,是促进大众创建更多优质解释的最佳策略。然而,我尚未详细说明「把解释当作科学」是什么意思。所以在这篇帖子中,我会解释更多细节,主要是举例说明什么是促进优质解释的进步,以及一些进一步发展的想法。
这个列表没什么条理,可能要怪到我自己的想法也没什么条理。列表里有些条目,甚至和其他的条目都不属于同一「类别」。我希望在未来,我(或者其他人)能够为这个领域设计更好的分类法/分类/路线图。
(这篇文章的大部分章节可以独立阅读。有几处我提到了其他章节。)
选择一种解释类型(比如练习册的「参考答案」),尝试为其制作最佳版本,看看你可以发现什么技巧或学到什么教训
在 2020 年 3 月,我建了一个博客,为《陶哲轩实分析》写习题解答,这本书是面向本科生的实分析教材。开展这个项目的动机有很多,其中有一项是「为什么参考答案都这么烂?难道以目前最先进的技术,创作出『史上最佳的参考答案』不是应该很容易吗?」我为这本书中三分之一的练习写了参考答案,之后便搁置了这个项目,所以我并没有创作出「史上最佳的参考答案」。不过我觉得至少有 50 道题目的解答的平均水准是很高的。在数学解释的质量上,我觉得这些文章的水平挺不错的,但还没有达到无可匹敌的地步。
我想出了一系列「技巧」来写出更好的习题解答材料,包括:
-
将习题解答组织为博客,这样就可以通过网络搜索找到每道练习
-
给每道练习开评论区,这样读者可以提问或提交其他证明
-
如果练习可以有多种解法,那就给出各种不同的证明
-
付费获得独立评议,让读者了解解法的质量
上述想法的构想和实现都很容易,但参考答案这类材料尚未采纳过任何一条。(对于其中的某些想法,我甚至觉得无可替代。)
通过开展这个项目,我发现没什么人很在意怎样写好参考答案。(参考答案主要是为方便教授或助教给作业评分而写的,甚至没有惠及最能从中受益的受众。)
参考答案只是我选择的一种类型。我认为还有很多其他类型值得精进(比如教科书、录制课程、数学解释视频、概念发现故事(参见下文详细列表)、选择题、间隔重复卡片、个人思考问题的过程记录)。我觉得,探索这些材料的过程中,可以发现很多技巧,并提升创作一般解释材料的能力。
发现能够提升特定解释环节的技巧(比如:如何在解释数学时更好地举例)
在 Learning Subwiki 上,我写了一篇关于数学中的例子的页面,在那里我将例子划分为四类:显然正例、黑天鹅、意外之喜、显然反例。(我不会重复那篇文章的内容,但理解那些内容对下文很重要。)
就我的经验而言,大部分数学教科书在举例子时都不会给全四种例子,而是基本上只给出最显然的例子,偶尔会给出黑天鹅例子。我觉得,大部分教科书作者在写教科书举例子时,并没有这四种概念的意识。换句话说,他们不会想「我应该给全四种例子吗?我不会给出显然反例,因为我知道我的受众数学水平比较高,但我会给其他三种例子。」相反,他们只会这样想「啊对了,我应该给个例子。」然后就开干了。我觉得由于这种缺乏反思/缺乏正确概念,以及四种例子的做法没有更广泛地执行,导致数学材料对学生来说特别难以理解。
我刚刚就改善数学中的举例给了一个例子。有其他改善举例的办法吗?有更好描述定理的方法吗?证明呢?非数学解释材料里有类似的组成部分吗,我们如何改善这些组分呢?我觉得改善唾手可得,只要有心问问这些简单的问题。
有人可能会反驳,找出各种例子这个方法,本来就是好学生会做的事情,而且举例子应该是学生做的事,而不是解释者。我喜欢换个角度问一问:我们能不能找出好的学习者的做法,使其自动化,或者清晰地表述出来,这样即使是不太会学习的人也能完成?在这种角度下,这四种数学例子只是我发现的一种原则而已。还有什么原则?
可以与各种写作做类比,比如数学证明写作,程序写作,以及文学写作。数学证明有分类讨论和「不失一般性(译注:Without loss of generality,缩写:WLOG、WOLOG 或 w.l.o.g.)」;编程有各种循环结构,还有诸如模块化的各种思想,不同的编程范式等等;文学的技巧众多。那么,对于解释又有什么类似的技巧?
找出领域中的视角变换
有时候,人们会提出看待同一学科的不同视角,从而创作出前所未有的解释。我比较熟悉两个例子:
-
Sheldon Axler 的《线性代数应该这样学》在解释线性代数时,尽可能推迟了行列式的引入。很多证明都要重写以避免提及行列式。
-
Noson Yanofsky 的论文《A Universal Approach to Self-Referential Paradoxes, Incompleteness and Fixed Points》(以及 Lawvere 的先前作品,不过不容易获取)将很多计算理论和逻辑学中出现的对角化/自我指代结论结合在了一起,并说明「这些都是一回事」。
还有第三个例子值得提及:
- Tristan Needham 的《复分析可视化方法》一书,在解释复分析时使用了很多高质量的插图。我只读了一点点,但看起来很不错。
我觉得在数学和其他领域,肯定还有很多例子。找出这些例子当然很有帮助,但目前而言,更重要的的任务是制造出这样的例子。有哪些主题是太过难以理解的?有什么证明是容易忘记的?也许有一些子领域,通过一些截然不同的视角审视,理解和记忆会更加「自然」?
有一个有趣的问题,这项任务是解释者应该做的,还是「这个领域的研究者」应该做的?也许是两者都应该做的?也许应该合作?也许解释和研究之间没有什么差别?我目前只想出了这些容易想到的问题。
某种意义上,解释文章的最高境界就是视角变换:可能你用了每一项小「技巧」,但有件重要的事没做到,结果文章仍然难以理解。
有一种视角变换是创造新的符号系统。Adam Shimi 跟我分享了这个页面,上面分类了符号系统如何影响学科的思考方式。
发明新的解释类型或者解释风格(比如「概念发现故事」)
概念发现故事是一种解释风格,其中解释者要虚构一个故事,描述一个概念可能是如何被发现的。做得好的话,读者能清晰地了解概念的起源,为什么概念的原理是这样的等等。概念发现故事也能教授一点如何发现新概念的心理习惯。
多创作一些概念发现故事,弄清楚如何写出很好的概念发现故事是不错的做法。参见「考虑一类解释」一节。而本小节是关于创建一种新的类别,相当于「概念发现故事」,或者「习题答案手册」,或者「教科书」或者「可互动视频」,或者「嵌入了间隔重复卡片的文章」。我不指导怎么创建类别。我应该只做过一次。[2]我觉得没有人知道如何可靠地创造新类别。但似乎有弄清楚的价值。
发明心理技巧来辅助解释写作(比如「像写儿童绘本一样解释这个话题」)
Jessica Taylor 写过《创作儿童插画书》,而 Eliezer Yudkowsky 之前写过《解释者要心怀高远,脚踏实地》,两篇文章都描述了一种用于提高解释材料质量的技术:想象自己解释的对象,是比实际受众背景知识更少的人。我怀疑有其他类似的「心理」技巧可以派上用场。这里「心理」技巧指的不是检查清单或者局部动作(比如我前文说过的四种数学例子),而是全局的「思维模式」或者「心境切换」,这会引起解释者行为的一系列变化。
将教学工具移植到其他领域,看看会有什么效果
编程这个领域有很多有意思的学习工具,比如 LeetCode,Exercism,Scrimba 等等。电子游戏社区有「直播实况」类视频,速通等等。如果将这些工具移植到其他领域会有什么?数学版 LeetCode 会是什么样?钢琴版 Scrimba 又会是什么样呢?诸如此类。
别急着把教科书塞满,而是写出更多解释材料的「攻略手册」或者「大纲」
我认为,解释主题的「攻略手册」或者草稿大纲,和完善的解释材料,是同等重要的。大部分实分析教材的作者会采取稍微不同的策略。但对于一些部分,他们的解释方法都应该是相同的。这里面有很多重复劳动。我觉得,如果能先讨论一下教科书解释,或者完成一些对立统一的合作,写出书的「大纲」,然后基于大纲进一步讨论,在课上教学,之后再写教科书,会好很多。
考察教科书,找出作者(或许是下意识)使用的模式和技巧
不同教科书的质量参差不齐。我们最终的目标是制作出不世出的高质量解释。但这个目标很难实现,所以有个办法是考察优质的教科书和劣质的教科书,看看什么办法有用,什么办法不行。我对《陶哲轩实分析》做了这样的考察。
更多小规模实验与原型
有人容易陷入这样的误区。他们认为,既然解释学的最终目的,是出品容易理解的解释材料,那么所有解释学的相关作品,都应该是通俗易懂的。然而,正如其他领域的一些材料,是其他领域的专家为彼此而撰写的一样,我认为,在「解释学」里,应该有一些原型,是面向熟悉解释学的人制作的。
创造更多像 X 的东西,然后看看会有什么效果
我比较感兴趣的 X:
-
非常细致的学习指导,比如 Teach Yourself Logic 指南。很多学习指南都比较简略。我想看到更多像 Teach Yourself Logic 这样的指南,而不是教科书。
-
Youtube 的 HaskellRank 频道。
-
关于 Tricki 的文章。
-
Tricki 网站本身。
-
量子国度。
对读者的理解建立具体的模型,写作时努力让读者的理解达到理想状态
我觉得,很多解释不奏效的原因,是作者没有针对读者的理解建立足够细致的模型(比如他们没有考虑到读者的工作记忆容量有限,或者没发现有个地方很容易误解,或者没想到读者的参与度不够,或者读者会忽略某个地方的解释)。优秀的作者对读者的思考有不错的把握,并会由此预测读者会产生什么问题,并积极解决读者的误解。但是我觉得这些优秀的作者是靠直觉行事的,没有正式的模型。显式地考虑读者理解会更好吗?换句话说,我们能显式地建立读者阅读时的思想状态的模型,并利用这个模型写出更好的解释吗?能不能从「读者充分理解材料」的理想状态反推,让写解释像按图索骥一样容易呢?这里面很多问题的答案我都不知道,但我很好奇,想试着一一解答。
感谢 Adam Shimi 对本文草稿的有益讨论和评论。也感谢 Vipul Naik 阅读本文草稿并提醒我加了一段内容。
感谢 Adam Shimi,他点出了修辞技巧这一项。
我想出了「数学直播视频」的主意,但并没有自己真去开直播。在那之后,Tim Gowers 得出了相同的想法(几乎可以肯定是独立想出的),并真的做了不少视频)。(译注:国内有皮套人讲数学呢)
如何促使人们创作更多优秀的解释文章?一些策略及其背后的假设
最近, LessWrong 的「精馏与教学法」标签下有一些帖子一直困扰着我,例如「需要知识精馏者」和 AI 安全知识蒸馏文章竞赛,这篇文章是我对这种困扰的反思。
为实现「创造更多优秀的解释文章」这一目标,下文列出了四大策略:[1]
-
鼓励人们创作更多的解释文章,让人们知道,创作解释是可行的。在我的理解中,「需要知识精馏者」这个帖子主要使用了这种策略。
-
给创作解释的人付费。AI 安全知识精馏文章竞赛可能半是用了这个策略,半是用了上一个策略。
-
让那些擅长创作解释的人来指导其他人。我认为《Distill 期刊》主要使用了这种策略。
-
将解释视为科学研究领域:不要把好解释当成黑匣子,而要探究什么样解释的是好解释,并提出优质解释的制作技术或 「构成要素」。我所知道的最好的例子是 Tim Gowers,请参考他的博客文章,YouTube 视频和 Tricki 网站。
为能利用这些策略最优地实现目标,需要满足一系列假设:
-
让我们假设,解释作品面临的主要问题是,人们不知道他们能够创作解释文章,那么鼓励他们多创作解释是很好的策略。但是,如果将之用作主要策略,有一条假设需要满足,即许多人已具备创作优秀解释作品的技能,或者他们将能够自行学会这项技能。
-
如果人们缺乏时间或资源来创作解释,那么向这个问题投入资金是很好的策略。与鼓励策略一样,如果这是主要策略,那么需要满足这样的假设,即许多人已经擅长创作解释或者可以自行学会。或者,即使很少有人擅长创作解释,优秀的解释者虽少,只要资助者能够找出几位,投入资金仍然是不错的策略。
-
应对下列情形,导师制是很好的策略:大多数人不知道如何做出优秀的解释,并且很难独自学会,但他们很想掌握,而且也有能力在有帮助的情况下掌握。
-
如果没有人真正知道如何做出优秀的解释,「将解释作为科学」是很好的策略。知道如何做出优秀的解释的人越少,或者有能力做出优秀的解释的人越少(但这仍然假设了最终许多人可以学习这项技能),[2] 这种策略看起来越好。
话题回到这些最近的帖子一直困扰我的问题。我接下来会尝试写清楚我的疑惑:这些帖子采用的策略,都附带了他们的假设,我认为这些假设是错误的。具体而言,我相信阐述是一项非常重要的技能,基本上没有人知道如何做出好的解释(即使有些人偶尔能够做出好的解释,也不能可靠持续地做出好解释,或者必须要费很大的功夫才能完成),而且人们很难独自学会这项技能。所以,我很担心鼓励和「 投入资金 」策略作为主要策略:两者都很重要,但是如果我们不同时采用其他策略,那么我们最终将会得到一大堆平庸的解释。[3]
除了将鼓励和「 投入资金 」作为「 辅助」策略外,我也赞成导师制(也是作为「 辅助」策略)。原因之一是,导师制能切实传达好解释的品味,并传授必要的技能。但我对导师制的担心是,如果将之用作主要策略,就不是很容易辐射到更多人。而且导师制倾向于把好解释的要素当成不传之秘,只在小圈子里流传,外人无法知晓,甚至有可能他们自己都不清楚什么是好解释(类似的观点请参阅「科学家已经知道这些东西了吗?」和「 无法教授的卓越」)。换句话说,导师制不够开放,过于精英主义。
最后剩下了「将解释作为科学」策略。我相信,这个策略最适合充当主要策略,也可以配合另外三个策略。关于该策略将包括哪些工作,我没有具体提及。我希望在以后的帖子中做进一步说明。
致谢:感谢 Justis Mills 对本文的草稿提供了实质性反馈(是 LessWrong「获取反馈 」功能的一部分)。也感谢 Vipul Naik 审阅本文。
-
^ 本文挂一漏万。这些策略之间也不是互斥的。但是,我主要讨论将某个策略作为其「主要」策略。
-
^ 我的猜测是,「写出良好解释的能力」,有点像「 写出数学证明的能力」。即使是聪明的高中生,也有可能写出糟糕的数学证明,但是他们可以参加证明写作课程(或其他本科数学课程),或者通过学习一些数学教科书,这样他们便能确实地掌握这项技能。当下,聪明的高中生写的解释大多也都很糟糕;此外,对于获得写出良好解释的能力,还没有直截了当的途径。但是我认为,这样的途径最终是可以创造出来的。
-
^ 对于这段发表的观点,我希望日后发表一些文章,来解释这个观点背后的推理。
反对教育的理论依据
原文:A Theoretical Case Against Education - by Scott Alexander (astralcodexten.com)
2024 年 5 月 23 日
I. 学校究竟教会了我们什么?
最近,Bryan Caplan 的《反对教育的依据》(译注:The Case Against Education,正式译名为《教育的浪费》)再次引发了对教育问题的广泛讨论。对此,我想谈谈自己的一些看法。
教育并非只是传授事实知识,但事实知识也是教育的一个主要方面。诚然,是否掌握事实是很容易衡量的,而且这是通向更深层次理解的重要途径。例如,如果一个人从未听说过乔叟、狄更斯、梅尔维尔、马克·吐温、乔伊斯等文学巨匠,他大概还没有掌握鉴赏文学名著的能力。再比如,如果有人叫不出华盛顿、林肯的名字,分不清两位罗斯福总统,他很可能对美国历史的兴衰演变缺乏了解。那么,普通美国人都知道哪些事实知识呢?
1999 年的一项民意调查显示:在 18 至 29 岁的美国人中,只有 66% 的人知道美国摆脱的是英国的殖民统治(而不是其他国家)。仅有 47% 的美国人能说出三大政府部门的名称(行政、立法、司法)。只有 37% 的人知道距离太阳最近的行星(水星),58% 的人知道是什么气体导致了全球变暖(二氧化碳)。44% 的民众知道奥斯威辛曾是纳粹的集中营。而在一道判断电子与原子大小的判断题中,答对的人竟然不到一半(比乱猜还低)。
这些调查结果散落在多份民意测验中,这使得它们容易受到发表偏见的影响。我无法找到一项全面、权威、针对大众常识的调查。但有一份针对大学生的调研非常出色。请记住,这是一个经过精心挑选的、超级聪明的群体,以下是一些数据:
-
85% 的人知道《罗密欧与朱丽叶》是谁写的(莎士比亚)
-
56% 的人知道太阳系最大的行星(木星)
-
44% 的人知道 1775 年奔走呼号「不列颠人来了」的人是谁(Paul Revere)
-
33% 的人知道分泌胰岛素(insulin)的器官(胰腺(pancreas))
-
31% 的人知道俄罗斯的首都(莫斯科)
-
30% 的人知道相对论是谁发现的(爱因斯坦)
-
19% 的人知道珠穆朗玛峰在哪个山脉(喜马拉雅山脉)
-
19% 的人知道《1984》是谁写的(乔治·奥威尔)
-
16% 的人知道在爱伦坡的诗作《乌鸦》中,乌鸦反复念叨的台词(「永不复述!」)
-
10% 的人知道《白鲸记》中船长的名字(Ahab)
-
7% 的人知道日心说是谁在 1543 年提出的(哥白尼)
-
4% 的人知道老子创立的中国宗教是什么(道教)
-
不到 1% 的人知道名将汉尼拔来自哪里(迦太基)
值得注意的是,调查对象都是大学生,普通民众的知识水平只会更低。
这些事实知识,大都是我认为学校理应教授的内容。有些要点(如美国政府的分支部门)是整个学科的基石,我原以为学生求学时会反复学习和巩固这些事实。倘若多数人都已忘却,那他们似乎更不可能记得在校所学的其他知识。那学校到底在做什么?
或许,正因为有学校教育,大多数人才掌握了最起码的常识——譬如美国脱离英国独立,譬如莎士比亚是《罗密欧与朱丽叶》的作者。但我对此表示怀疑。且看下列问题,其正确率和「莎士比亚写了《罗密欧与朱丽叶》」相差无几:
-
曲棍球(hockey)运动员击打的橡胶圆盘叫什么?(冰球(Puck),89% 的人答对)
-
以吃菠菜增强力量著称的漫画人物叫啥?(大力水手(Popeye),89% 的人答对)
-
多萝西在《绿野仙踪》里的小狗叫啥?(托托(Toto),80% 的人答对)
学校不曾教过这些知识,人们多半是通过文化浸润而吸收的。照此推论,人们了解《罗密欧与朱丽叶》,或许也是通过同样的方式。要知道,这项调查发布的十多年前,好莱坞才推出了一部关于莎士比亚创作《罗米欧与朱丽叶》的获奖影片。诚然,只有 19% 的人知道奥威尔写了《1984》,但有多少人晓得 1984 日历的梗?知道「1984不是操作指南!」的笑话?听说过真人秀《老大哥》?学校不教这些,人们多半是在了解 1984 相关文化时,顺带知晓了奥威尔其人。
好吧,学校可能并没有很好地传授事实知识。但它至少能教会学生一些技能,不是吗?
然而,测试结果显示,尽管从大多数公立学校毕业理论上需要掌握代数知识,但实际上不到 10% 的美国人「精通」 PIAAC(国际成人能力评估项目)所界定的数学技能。
我在初中学过一年西班牙语,但如今我就是为了救命,也说不出一句像样的西语。那一年完全是浪费时光。诚然,我知道「你好」(Hola)、「再见」(Adios)这些词,但我也知道「老外」(gringo)和「我想吃塔可贝尔」(Yo quiero Taco Bell)这些,而这只能归因于文化浸润。
由此可见,无论是事实还是技能,大多数人似乎都忘记了在学校学到的几乎一切。学校教育支持者仅存的论点或许是:即便学生忘记了所有具体细节,他们至少还保留了某种学习框架,让他们日后学习和理解新事物变得更加容易;也就是说,他们习得了某种总体的学习理念。但这个假说未免有些牵强附会,而且与许多孩子的切身体验背道而驰——他们说学校让他们厌恶学习,让他们无法以非虚假的、非死记硬背的方式学习,又或是由于多年被迫阅读自己讨厌的书,以至于现在一想到阅读就心有余悸。
II. 为什么我们记住了这些,而忘记了那些?
让我们退后一步,思考为什么这些可能都是正确的。换句话说:
-
为什么大多数学生会忘记学校反复教授的内容?
-
为什么当他们通过文化浸润的方式习得知识时(例如大力水手,“yo quiero Taco Bell”),他们反而能牢记于心?
-
孩子们在标准化考试中不是一直表现不错吗?为什么后来他们就不记得那些知识了呢?
-
如果一个专业教师倾囊相授的内容,你全神贯注地学习,只为应对一场至关重要的考试,事后你尚且遗忘殆尽,那你究竟还能记住什么呢?
下图是著名的艾宾浩斯遗忘曲线:
图片出处见此。请注意横轴的不规则刻度。
就我们的讨论而言,该曲线未免有些程序化——记住 20% 的美国史课程意味着什么?重点在于,随着时间流逝,你能记住的只会越来越少。
遗忘曲线主要关注抽象的、毫无关联的、缺乏情感联结的知识——你会记住杀害至亲的凶手姓名,远超出曲线的预测——但对于在学校学到的知识而言,它给出了一个很好的近似。我找不到任何跟踪调查超过一个月的研究,但很可能十年左右后,记忆保留率会极其低下。因此,如果你询问一位成年人有关电子的知识,而他们上一堂高中理科课已是十年前,他们多半是全然不记得了。
那人们究竟为什么能记住某些事情呢?与遗忘曲线相对的,还有一条更加乐观的曲线——间隔重复曲线:
相关数据来源见此。需要注意的是,递增间隔的重复并不一定比固定间隔的重复效果更好;更多细节请参阅这里。
从乐观的角度来看,你应该会复习在课堂上学到的知识。如果运气好,你下一学年的老师会系统回顾这些知识,并在此基础上深入拓展。这样一来,你就能获得几十次间隔合适的重复学习机会,直至这些知识能够伴随你一生。
那么,现在让我们回到最初的问题:为什么只有 19% 的人知道喜马拉雅山脉呢?
我没能找到任何有关遗忘曲线和重复曲线在数年乃至数十年尺度上的权威研究,但某个间隔重复网站推荐了以下复习时间表:
- 第 0 天:初次学习
- 第 1 天:24 小时内第一次复习
- 第 6 天:大约一周后第二次复习
- 第 14 天:大约两周后第三次复习
- 第 30 天:大约一个月后第四次复习
- 第 66 天:大约两个月后第五次复习
- 第 150 天:大约五个月后第六次复习
- 第 360 天:大约一年后第七次复习
通常,重复 7 次就足以让人终身记住某些信息。另外值得注意的是,从第二次重复开始,下一个重复间隔可以通过将上一个间隔乘以一个大约 2.2 的因子来计算。这个数值被称为简易度,根据实际情况,它通常被设定在 2 到 2.5 之间。
综上所述,无论是学生时代对知识点反复记忆的次数不够,还是有人过于乐观地认为重复 7 次就能让人「终生」牢记,我认为后一种可能性更大。例如,我都快忘光某些大学教授的名字了,虽然他们曾经给我上了整整一年的课,几乎每天都能碰到面。
假如世上真有什么抽象的事实,无论如何重复记忆也只能保持 10 年,那大家遗忘学生时代学到的大部分知识也就不足为奇了。
但是,假设一个人学习某个知识点,已经透彻到了考试也能轻松过关的地步,那之后哪怕一年才复习一次,或许也足以让他长久铭记。这就能解释为何每个人都记得莎士比亚的大名——因为在日常生活的随意交谈中,我们每年都有可能不止一次听到别人提起他。
这是我今年的那次。它值得吗?
文化重复效应到底有多强呢?为了解决这个赌局,我问 ACX 调查的参与者,他们在过去 24 小时内是否想到过罗马帝国。结果显示,大约 45% 的人想到了。虽然我们无法给出任何正式的估计,但最有可能的是,这个分布中的大多数人每周至少会想到它一次,绝大多数人每月至少会想到它一次。由此可见,无论你的历史老师教得多么糟糕,你永远也不会忘记罗马帝国。
(说起乔治·奥威尔,仅在这篇文章躺在我草稿箱的两周里,我就在日常生活中无意间发现了三次提及他的地方。)
人们多久会想起桑海帝国?我在七年级时肯定学过它——它是那个「你们都必须知道非洲历史的存在和辉煌,请务必谨记于心」单元的一部分。但我把它彻底遗忘了,直到它在《文明》系列游戏(大概是《文明 5》)中登场。在那之后,我玩了足够多盘的《文明》,桑海帝国这个名字才得以在我记忆中多逗留了几年。这或许比起历史老师讲授每个主题的时长,更能解释为什么大多数人记住了罗马,却遗忘了桑海。
根据这一模型,聪明人记忆力出众,部分原因在于他们遗忘曲线的形状有所不同,但更主要的是,他们会积极主动地将自己置于经常接收信息的环境中。如果你记得乔治·奥威尔是《1984》的作者,很可能是因为你在阅读报纸、博客时,常常看到某些政府措施被冠以「奥威尔式」的称号。而如果你整日埋头刷抖音,或许就鲜少接触这些信息,渐渐地也就和 81% 的大学生一样,忘记了这个名字。
(关于《1984》,我还记得的内容有:作者是乔治·奥威尔。小说中有欧亚、东亚、大洋洲三个国家。英国隶属欧亚,被称为「空军第一号基地」。三个国家时而结盟,时而反目,政府却谎称「我们一直在和东亚作战」。邪恶的极权政府统治着一切,最高领袖名叫老大哥,真实性存疑。还有一位疑似反抗军领袖,名字听起来像犹太人。社会等级分为内党、外党、无产者三类。官方语言「新话」中创造了「超级加倍好(doubleplusgood)」一类新词,令人难以质疑当局。主人公温斯顿和朱莉娅试图反抗极权统治,温斯顿惨遭酷刑折磨,其中涉及令人毛骨悚然的老鼠。最终他被洗脑,宣称爱老大哥、认同 2+2=5。朱莉娅的身份也耐人寻味,疑似是政府的卧底特工。我想这些情节细节都属于那种大概每隔几年才会在现实生活中偶然接触到一次的。)
III. 除了看护孩子,我们还能指望什么?
这个模型使得学校几乎无用。它所传授的事实知识,要么是出了学校后再也遇不到的,你转瞬即忘;要么是出了学校后将会频频遇见的,这种情况下学校就显得多余了,因为无论如何你都会学会。
我们能否为学校教育挽回一些价值?一种思路是,学校通过帮助你长时间学习某些知识,开启一个良性循环,让你在日后能够重新运用所学。以阅读能力为例,一旦你在学校掌握了阅读技巧,可能会每天都运用它,从而不断强化记忆。但如果始终未能习得阅读,你可能永远不会主动学习了。
(当然,这个例子现在有点站不住脚了,因为许多中产阶级家庭里,孩子们早在入学前就已经精通阅读——如今,为了不让孩子输在起跑线上,父母恐怕从娃娃两岁起就得教起。但无论如何,学校教育至少能帮助底层家庭孩子掌握阅读能力。)
同样的道理也适用于某些数学知识——尽管 PIIAC 的数据显示,只有 10% 的美国成年人具备基本数学运算能力,但对于一些更基本的算术能力,比如简单的加减法等,大多数人还是在学校学会并受用终生的。
好吧,这也许可以证明上到四年级是合理的。再往后的学校教育呢?还有没有类似的论据?
你大可以假设一些相似的情况。比如,要想读懂和欣赏有关古罗马历史的书籍、电影、播客等作品,你必须先掌握一定的相关背景知识。一旦积累到某个数量门槛,就像棘轮一样,你会持续吸收更多知识,同时强化已有认知。但我觉得这种假设站不住脚,因为现实中,许多领域的知识,人们在学校根本就没学过——比如编程、烹饪,或是钟爱的奇幻系列的历史背景等等——可后来不也都无师自通了吗?当然,你要愿意信那一套,我也拦不住你。
除此之外,学校教育还能发挥什么作用呢?——恐怕也就是在家长不在身边时,充当临时看管孩子的托管所吧。说实话,我实在想不出学校教育还有什么独特的存在价值了。
(当然,以上纯属理论探讨)
美国教育系统是否充分满足优秀学生的需求?
原文:[ACC Entry] Does The Education System Adequately Serve Advanced Students? | Slate Star Codex
作者:SCOTT ALEXANDER 发表于 2018 年 9 月 4 日
本文是 TracingWoodgrains 和 Michael Pershan(一名 K-12 数学教师)为对抗性合作竞赛提交的参赛作品,探讨了教育体系对优秀学生的培养问题
「美国最优秀的学生们听到了什么?每年,全国各地那些本应按自身学习节奏快速前进的学生,却被要求原地踏步。成千上万的学生被告知要降低期望,将梦想搁置。无论他们想做什么,老师们都说,可以再等等。」 ——《被蒙蔽的国度》,第 3 页
「捐助者似乎更倾向于研究弱势群体、品行不端者和能力欠缺者的需求,并资助他们,而对高智商群体持消极漠视的态度,任由他们『自谋出路』。」 —— Hollingworth,1926 年
1 求知若渴却未能发挥潜力
假设你是一名教师。在一个 25 人的班级里,哪些学生会引起你的注意?
首先是那个不断举手的学生,他总是在寻求关注。其次是角落里那个从不说话的安静孩子,他从去年 10 月起就对数学课程一筹莫展,如果你不采取措施,他可能会不及格。还有那些处于中游的学生,他们随波逐流。最后,还有一个学生总是很快完成所有任务。她经常环顾四周,困惑地想:「我现在该做什么?」
2008 年的一项教师调查显示,只有 23% 的教师将优秀学生视为首要关注对象,而 63% 的教师表示他们最关注班上学习困难的学生。2005 年的一项研究也发现了中学存在类似趋势,学习困难的学生获得了大部分的教学调整和特殊安排。有趣的是,尽管 73% 的教师认同优秀学生在学校经常感到无聊并缺乏挑战,但这种情况仍然普遍存在。显然,虽然教师们同情那些聪明但感到无聊的学生,但这并不是他们的工作重点。
这并非是要责备教师。他们承受着各种压力,不得不帮助学习困难的学生勉强达到及格线,而且归根结底,他们只是在尽力为学生谋福利。但我们应该考虑,哪个问题更为紧迫?如果你没能让一个孩子掌握必要的技能,他们来年的学习可能会陷入困境。更严重的是,他们可能会因此辍学。至于行为问题?这往往源于学业上的挣扎。另一方面,天赋异禀的孩子已经走在成长为杰出的成年人的路上。人们普遍认为,他们能够暂时顾好自己。因此,教师更多时候会建议那些提前完成任务的学生去阅读、做作业或做任何其他事情,而自己则专注于帮助教室角落里那个安静、迷茫的孩子。
如果孩子们只是感到有点无聊,这并不足为奇。很难找到一个在学校生活中从未感到无聊的人。对于许多已经展现出成就潜力的优秀学生来说,这种情况最终可能不会造成太大影响。然而,仍然存在一些反复出现的案例,表明缺乏挑战可能会演变成更严重的问题。
其中一个广为人知的故事是这样的:某些学生从小就觉得学校的任务轻而易举。他们很快就认定学校理应如此简单——这甚至成了他们引以为傲的资本。多年来,他们在学校里游刃有余,逐渐形成了一种固有的身份认同。然而有朝一日,可能在学校漂泊多年的之后,他们终于遇到了挑战……但这种挑战并非良性的。相反,它成了一种威胁。当这些学生开始觉得学校困难重重时,他们的世界顿时崩塌。他们在学校里感到孤立无援、无人理解。他们开始变得暴躁易怒,对学校厌恶至极,只想尽快逃离这个环境。
为了深入了解这一现象,我们在 Reddit 论坛和博客上征询用户的学习经历,收集到了这个「故事」的诸多变体:
-
学校教育简直是在浪费宝贵时光,几乎没有提供任何有意义的学习机会。上课时我一般不理会老师,而是自顾自地阅读书籍。最令我感到深深不公的是,这种自主学习的行为竟然只会招来惩罚。如今我有了自己的孩子,我决定让他们在家上学。
-
学校的课程让我感到无比乏味。教学进度慢得令人难以忍受,内容也毫无吸引力。被校规强制要求早起,到一个特定地方去学习那些我早已掌握的知识,这种经历让我产生了持久而强烈的反感。
-
从幼儿园到高中我都在当地的公立学校就读,但这段经历着实不愉快。从学术角度来看,课程进度缓慢,教学质量低劣。即便是号称高水平的 AP 课程(大学预修课程),也不得不迁就班上进度最慢的学生,这种体验简直令人痛苦不堪。优等生课程和普通生课程的情况更是糟糕:除了优等生数学课之外,在所有非 AP 课程中,我的水平都比班上其他同学领先一年甚至更多。我逐渐养成了一种习惯,就是不再费心学习或做作业,即使是在 AP 课程中也是如此。这种做法可能使我养成了不端正的工作态度。
随着我们关注那些极度早熟儿童的案例,他们在学校遭受的痛苦和学业不佳的情况显得愈发触目惊心。这些学生承受的压力与日俱增,如果得不到适当的帮助,他们往往会感到与同龄人格格不入,并产生一系列复杂的负面情绪。Miraca Gross 在澳大利亚对这类学生进行了研究,发现这些超常儿童常常在默默忍受着痛苦。特别是在谈到那些未能发挥潜力的神童时,她这样写道:
在我的研究中,绝大多数天赋异禀的年轻人坦言,在求学生涯中,他们曾长期刻意隐藏自己的才能或显著压制学业表现,以减轻同学和教师对他们的嫉妒和敌意。几乎所有被安排在平行班与同龄人一起学习的天才儿童的父母都反映,他们的孩子早年表现出的强烈进取心、对智力探索的热情以及对新知识的渴求,如今已大幅减弱甚至完全消失。这些孩子表现出令人担忧的低学习动机和社交自尊。他们更容易遭受同学的排斥,并承认经常为了获得同龄人和教师的认可而故意降低表现。令人遗憾的是,这些孩子就读的学校并未深入探究这一现象的根源,反而倾向于将他们动力的衰退和随之而来的学业退步视为孩子已「回归平均水平」、不再具有特殊才能的证据。
面对这些案例,我们应该如何解读?这种经历在天才儿童中究竟有多普遍?
在研究「天资优异却未能发挥潜力」这一现象的文献中,我们得到了部分证实——潜力未能发挥确实是一个真实存在的问题,这一点已被大量案例研究所证实。根据一项针对各类学校教育工作者的调查显示,在面对天资优异的学生时,潜力未能发挥是最受关注的问题。从定义上看,优秀学生在每个学生群体中只占很小的比例,因此在任何特定地区受影响的学生数量都不多。然而,从全国范围来看,这个问题就变得很严重了。
这个问题并非仅仅困扰富裕阶层。它对[黑人学生](https://books.google.com/books?hl=en&lr=&id=8MOBFNbHaUUC&oi=fnd&pg=PR7&dq=donna+ford&ots=X29E1Ksan3&sig=xrC9lsyW95UGl70W6wfupPQ7EdA#v=onepage&q=donna ford&f=false)、贫困学生以及正在学习英语的学生造成了持续的负面影响,这些学生较少被推荐参加天才教育项目或获得特殊照顾。这种影响的一个具体体现是:一项研究显示,一年级时在阅读上被认定为天才的贫困学生中,有 44% 到了五年级时已不再学业优异。相比之下,高收入家庭中只有 31% 的一年级学生出现了这种学业水平下滑。
对这一群体关注的不足也延伸到了研究领域。很难确定受影响学生的具体数量。尽管潜力未能发挥是一个客观存在的现象,但当前的研究并未能为我们提供太多关于导致天才学生潜力未能发挥的因素的信息。已开展的研究往往几乎全部集中在诸如患有注意力缺陷多动障碍(ADHD)或不被家庭支持的学生是否未能发挥潜力等方面,而非关注可控因素,例如学生在学校接受的教学类型。
学校肩负着教育下一代的重任。那些满怀热情踏入校门的孩子,不应在离开时感到被冷落和忽视。这一点对来自弱势群体的天才儿童尤为重要,如果学校无暇顾及他们,他们可能在校外也缺乏助力成功所需的支持体系。然而,我们显然不能为了照顾那些尖子生而牺牲其他学生的利益。那么,有没有一种可行的方法来解决这个问题,又不会使情况变得更糟呢?
有充分的证据表明,个性化的关注对学生的学习效果有着巨大影响。研究显示,作为学生课程补充的个别辅导是一种非常有效的教育干预手段。20 世纪 80 年代,教育心理学家 Benjamin Bloom 提出的「两个标准差」效应引起了广泛关注。虽然近期研究将这一过高的估计降至更现实的水平,但一项元分析仍然发现其效应量达到 0.36。这一数值仍然表明个别辅导有着相当可观的影响,足以将一个学生的成绩从平均水平(第 50 百分位)提升到较好水平(第 64 百分位)。
如果补充的一对一辅导真的能够产生显著效果,那么我们不禁会思考:是否可以完全用一对一辅导来取代传统的课堂教学?特别是对于那些天资聪颖却未能发挥潜力的学生,或是早慧的孩子们,这种方法是否更为适合?在天才儿童教育领域,我们已经见证了一些令人振奋的成功案例。比如,著名哲学家约翰·斯图尔特·密尔的父亲,为了培养一位功利主义哲学的传人,为儿子量身定制了一套严格而全面的学习计划。结果证明,密尔不负众望:他 3 岁就掌握了希腊语,8 岁精通拉丁语,最终成长为一位举世瞩目的哲学家。另一个引人注目的例子是拉斯洛·波尔加,他声称发现了培养「天才」的秘诀,并决心通过从 3 岁起就教导自己的女儿们下国际象棋来验证这一理论。他的成果令人叹为观止:两个女儿成为了国际象棋特级大师,另一个成为国际大师,其中朱迪特·波尔加更是跻身世界排名第 8 位,成为历史上唯一一位在对阵现任世界冠军时赢得一局的女棋手。
对于未能充分发挥潜力的天才学生来说,一对一辅导似乎是理想的解决方案,但在学校实际运作中却难以落实。(尽管在在家上学中,这种方式在一定程度上仍然存在)。当前,学校正在努力帮助每个孩子掌握基本的阅读能力,在这样的背景下,仅为天才学生配备专门导师的做法不仅在道德上存在争议,在政治层面更是几乎不可能实现。而如果为每个学生都配备一名导师,则无疑会给地方教育经费带来巨大压力。这个看似简单的答案实际上揭示了教育问题的复杂性:我们可以专注于那些简单有效的教学实践,但同时不能忽视非学术因素和政治可行性。
一个有价值的教育理念应该同时具备有效性、政治可行性和经济性。既然为潜力未能发挥的天才学生提供一对一辅导不太现实,我们是否可以寻找其他方式来近似实现个性化、人性化关怀的效果呢?以下是天才教育倡导者常用的三种方法:
-
按能力将同龄学生分班,即能力分组教学(详见国家天才儿童协会)
-
根据学生实际水平而非年龄或年级,加快其课程进度(详见《被蒙蔽的国度》报告)
-
使用个性化软件取代人工辅导(详见《可汗学院如何助力发掘下一个爱因斯坦》)
接下来,我们将从理论和实践两个层面,评估这些教育方法的前景。
关于天才教育研究,我们推荐的综述文章请点击这里。
关于一对一辅导教学,我们推荐的综述文章请点击这里。
2 能力分组(又称分班教学)
将能力相近的学生编入同一班级,这种做法看似应该和一对一辅导一样简单有效。如果学生的学习进度需求相似,教师的教学效果就会更好。因此,可以将学得慢的学生编入一个班,将学得快的学生编入另一个班。虽然这不是一对一辅导,但应该是仅次于辅导的最佳选择。
然而,教育研究往往不会如此简单。
Bob Slavin 是一位在教育心理学领域颇负盛名的研究者,他的论文被广泛引用,是当今最具影响力的教育学者之一。Slavin 给人的印象是一个永不停歇的工作狂。他不仅著书立说,还管理研究中心,为学校设计教育项目,甚至坚持撰写博客。《卫报》的一位记者曾询问 Slavin 的喜好,他表示他自己热爱工作,厌恶安于现状。
在 20 世纪 80 年代末至 90 年代初,Slavin 对当时有关分班制和班级间能力分组的研究文献进行了一系列全面的元分析。他的研究结果表明,无论是在小学、初中还是高中阶段,能力分组都没有带来显著的教育效果,即便是对所谓的「尖子班」的学生也是如此。
然而,Slavin 的研究还揭示了一个出人意料的发现:能力分组并没有在学业上对任何学生群体造成负面影响,包括那些被分到最低水平班级的学生。基于这一发现,Slavin 认为,当我们权衡所有非学业因素时,取消分班制度、避免按能力分组似乎是更为明智的选择。
那么,这些需要考虑的非学业因素具体指的是什么呢?在 Slavin 总结小学阶段研究论据时,他是这样阐述的:
「各种形式的能力分组教学方案都让许多教育工作者感到不安。他们对于在小学阶段就为学生做出可能影响其终生自尊和未来发展的决定深感忧虑。在已实现种族融合的学校中,人们尤其担心能力分组可能会导致学生按种族划分成不同群体或班级。」(第 327 页)
这是 Slavin 的观点。那么,争议的焦点究竟在哪里?
在教育研究文献中,有一点是毋庸置疑的:Slavin 提出的非学业方面的担忧确实存在。无论是分组教学的支持者还是反对者都承认,平行班往往存在秩序混乱、教学质量差、不良行为普遍等问题,这是一个亟待解决的难题。当代分组教学的支持者 [Tom Loveless](http://edex.s3-us-west-2.amazonaws.com/publication/pdfs/Loveless Final Copy_8.pdf) 指出:「即便在最理想的条件下,平行班的教学也极具挑战性。那些注重学业的平行班往往试图通过枯燥、重复的课堂练习来弥补。」 Jeannie Oakes 因详细记录了大量平行班的糟糕状况而声名鹊起。
部分实施分班制的学校似乎在平行班的教学上取得了较好的成效。尽管 Gamoran 反对分班制,但他高度评价了某些天主教学校平行班的管理方式。Gutierrez 在研究中发现,有几所实行分班制的学校都致力于帮助全校学生提高数学水平。她由此得出结论:「分班制并非决定学生数学进步的关键政策」。改善这些教育体验无疑是一个重要目标。然而,这些复杂的教育动态确实是一个普遍存在的真实问题,教育工作者对此表示担忧是合理的。
Slavin 关于分班制可能助推学校种族主义的担忧也得到了广泛认同。争议的焦点并不在于种族是否直接影响分班结果。Lucas 和 Gamoran 使用了一个大型全国代表性样本,在先前控制学生成绩的情况下,研究发现种族并非影响分班结果的因素。(然而,Dauber 等人的研究表明,在巴尔的摩的学校中,种族确实影响了分班,这说明种族主义在某些情况下可能影响分班结果。)
然而,由于黑人和白人学生等群体之间存在学业表现差距,在种族混合的学校中,分班制可能会无意中将黑人学生划分到最低水平的班级。这种做法可能会使他们遭受许多难以量化但在教育领域频繁讨论的负面影响。许多教育工作者和研究人员指出,在一个将黑人身份与学业表现不佳和行为问题画等号的学校环境中,所有黑人学生的学习期望和学业自信心都可能受到打击。
(对那些喜欢听坏消息的人来说,这可能算是个好消息:学校种族隔离正在加剧,这反而可能减轻了能力分组与种族之间的负面互动。)
Slavin 关于能力分组对学业成绩影响的论断引发了主要争议。他的元分析研究是与 Chen-Lin 和 James Kulik 之间一场持续已久的学术辩论的一部分。Kulik 夫妇就能力分组这一主题发表了数篇持不同观点的分析文章。虽然双方都对对方的研究方法提出了批评,但 Kulik 夫妇强调的核心观点是:只要相应地强化或加速课程,能力分组确实能对天才学生产生积极影响,而这种做法在专门的天才教育项目中确实都会采用。Kulik 夫妇指出,他们与 Slavin 在所分析的数据上基本达成共识,但 Slavin 的研究排除了对天才教育项目的研究,而 Kulik 夫妇则将这些研究作为重点。
布鲁金斯学会高级研究员 Tom Loveless 对他们争议的一个关键方面做了[总结](http://edex.s3-us-west-2.amazonaws.com/publication/pdfs/Loveless Final Copy_8.pdf)。他认为,这场辩论的焦点更多地落在价值观上,而非他们对现有证据的解读:
尽管 Slavin 和 Kulik 在其他问题上可能存在共识,但他们在分班制度这一议题上的分歧比表面看起来更大。Slavin 明确表示,从哲学角度来看,他坚决反对分班制度,认为这种做法有悖平等和民主原则。Slavin 的论点是,除非学校能够切实证明分班对某些学生有实质性帮助,否则就应当停止这一做法。与此相对,Kulik 则持不同观点。他认为,鉴于分班制度能够让尖子生受益,且不会对其他学生造成负面影响,因此废除这一制度将是一个错误的决定(参见第 17 页)。
[Betts 指出](http://econweb.ucsd.edu/~jbetts/Pub/A73 Pre-Publication Version Betts tracking Handbook Post Conf draft 2009 09 19.pdf),Kulik 和 Slavin 在其元分析中所审视的研究存在一些局限性,如样本量较小且数据缺乏全国代表性。一些研究者(Hoffer, Gamoran and Mare, Argys, Rees and Brewer)利用更具全国代表性的样本进行研究,得出结论认为传统的分班制对尖子班学生有利,而对平行班学生不利。然而,在这些明显非实验性的研究中,要控制恰当的变量着实困难,[Betts 和 Shkolnik](http://econweb.ucsd.edu/~jbetts/Pub/A23 Betts Shkolnik EER 2000 Ability Grouping.pdf) 对这些研究结果提出了质疑。此外,近期一项大规模的元元分析发现,分班制并无益处,这与 Slavin 的观点一致;但该研究也发现,将有天赋的学生分入特别的班级是有益的,这又与 Kuliks 的观点相呼应。
有趣的是,Figlio 和 Page 提出了一个出人意料的观点:分班制可能通过吸引更优秀的学生入学(因为家长倾向于选择实行分班制的学校),从而间接使平行班学生受益。
那么,综上所述,我们应该如何看待这些研究结果呢?经济学家 [Betts](http://econweb.ucsd.edu/~jbetts/Pub/A73 Pre-Publication Version Betts tracking Handbook Post Conf draft 2009 09 19.pdf) 在一篇文献综述中指出,就分班制度的整体影响或学生成绩分布而言,「现有研究并未提供令人信服的论据。」Loveless 对此并无异议,但他强调对于学习成绩优异的学生而言,情况则更为明确:
「目前没有证据支持分班制度本质上有害的说法,同样也没有确凿证据表明取消分班、采用混合能力编班制能为任何学生提供更好的教育。然而,分班制度的坚定支持者同样难以找到大量能佐证自己立场的研究。这些论据既不支持分班有利于大多数学生的论点,也不支持混合能力编班会降低学生成绩的观点。尖子生是个例外。对他们而言,采用加速课程进度或强化课程的分班教学,确实优于混合能力编班制。」([第 22 页](http://edex.s3-us-west-2.amazonaws.com/publication/pdfs/Loveless Final Copy_8.pdf))
归根结底,分班教学对学生学习成效的所有影响,都是通过教学内容和方法来实现的。如果教师不改变教学内容或方式,单纯改变分班方式并不会对学生的学习产生显著的正面或负面影响。只有当分班伴随着相应的课程调整时,才有可能真正对天赋较高的学生有益。
这一结论已得到广泛认可。即使是 Slavin 这样坚决反对传统能力分班制的教育学者,也对一种名为「Joplin 计划」的教学方法赞誉有加。该方法包含三个核心要素:
-
根据阅读能力而非年级对学生进行分班
-
定期测试并根据结果重新调整分班
-
为不同能力水平的学生提供差异化课程
Slavin、Kuliks 等研究者似乎都一致认为,采用这种方法的学生——无论起点如何——在一年的学习中通常比传统教学方法的学生领先 2-3 个月。Joplin 计划采用的正是一种良性的能力分班方式。
那么,1986 年当巴尔的摩教育局长邀请 Bob Slavin「设计一个项目」来改善该市最为落后的学校时,你能猜到 Slavin 会如何对学生进行分班吗?
Slavin 与其妻子、研究科学家 Nancy Madden 携手为巴尔的摩市开发了 Success for All 项目。该项目在学校改革领域声名显赫,已在数千所学校推广实施,并仍在持续扩展。这一项目的核心理念源自 Joplin 计划的三大特色:评估、能力分组和针对性教学。
Success for All 并非唯一一个成功运用这些理念的课程。20 世纪 60 年代,Siegfried Engelmann 和 Wesley Becker 创立了「直接教学法」(Direct Instruction)。该方法同样根据学生当前在阅读和数学方面的水平进行分组,并频繁进行再评估和重新分组。直接教学法已有大量研究证明其有效性(例如,它在教育界广为人知的「坚持到底」(Follow Through)实验中脱颖而出),但除了补习课堂,这种方法在其他领域并未得到广泛采用。2018 年初,一项涵盖 50 年研究成果的最新元分析重新引发了对直接教学法的关注。该分析涉及 328 项研究(p<0.001),发现英语和数学科目的平均效应量在 0.51 到 0.66 之间,有力地证明了该教学方法的成效。
尽管直接教学法提升学生成绩的效果几乎无可争议,但这一教育项目仍然备受争议。教育历史学家 Jack Schneider 这样评论道:「直接教学法确实有效,但我绝不会让自己的孩子就读采用这种方法的学校。这种教学方式限制了教育的目标,几乎不给课堂上的创造力、自发性和游戏活动留下空间。尽管考试分数可能会上升,但这种进步是要付出代价的。」教育博主 Ed Realist 则担忧这种教学方法论令人不快,且尚未证明对高年级学生有效。他还指出,富裕家庭正在用「用脚投票」的方式抵制这种课程,而直接教学法可能会拉大学生之间的差距。与此相反,支持者们则描绘了一幅被长期忽视和低估的强大而有效的教学体系图景。
Success for All 和直接教学法并非学校可以轻易采用的简单项目。实施这些项目相当于进行一次重大的组织变革,同时也挑战了一个极其根深蒂固的观念——即学校应该按年龄对儿童进行分组。尽管这类全面的能力分组项目似乎行之有效,但在实际操作中却很少被采用。
关于能力分组这一话题,我们强烈推荐两个全面的参考资源:一是这篇深度报告,二是这个专题讨论,后者提供了更广泛的争议全貌。
3 加速教育
既然全面的能力分组的方法难以实施,那么让我们来探讨另一种可能:允许个别学生(比如那些因感到课程缺乏挑战性而倍感沮丧的学生)按照适合自己的节奏学习课程。这种针对性的方法是否能够行之有效呢?
事实上,学校有多种方式可以帮助某些学生更快地完成课程。例如,学生可以跳级一年,在极端情况下甚至可以跳好几级。他们也可以在某些科目保持原年级学习,而在其他科目则加入高年级的课程。有时,学校会安排学生在一年内同时学习两门课程(如代数 1 和几何)。在某些情况下,年龄较小的学生甚至可以提前入学。
毫无疑问,如果一个孩子已经具备了学习某门学科高级内容的能力,让他直接学习高级内容而不是低级内容,他通常会学到更多。但真正值得深入研究的问题是:(a)从学业角度看,这些接受加速教育的孩子是否真的已经做好充分准备,他们在后续的课程中是否会表现不佳;(b)加速教育是否会给学生带来非学业方面的负面影响,例如压力过大、学习动力下降、失去对学科的热爱或自尊心受挫等。
数学天才少年研究(Study of Mathematically Precocious Youth,SMPY)是一项持续进行的纵向调查,研究对象为数千名数学天赋优异的学生。在 SMPY 的一项研究中,研究人员比较了数学天赋学生中跳级者和非跳级者在 STEM 领域的专业成就。他们采用了一种相当精密的方法来控制学生的学业背景变量,研究发现,跳级的学生在获得学位、发表论文、论文被引用次数和获得专利数量等方面,普遍领先于未跳级的学生。这项研究表明,在 SMPY 研究群体中,跳级并未对学生的学习能力或对自己热爱领域的热情产生任何负面影响。
加速教育一直是 SMPY 研究的重点之一。1993 年一篇关于 SMPY 研究发现的文章指出,「没有证据表明加速教育会在学业或心理社会方面对愿意接受的学生造成伤害。」这一结论得到了多项元分析研究的支持,从 1984 年 Kulik & Kulik 的论文开始,到 2011 年对现有研究的分析,都证实了这一点。除了「无害」的结论外,这些元分析还发现加速教育对学生的学业有积极影响。
在研究这些关于天才学生的报告时,人们很容易对学生的天赋程度感到困惑。以 SMPY(数学天才青年研究)为例,他们迄今已经研究了五个群体,范围从排名前 3% 到前 0.01% 的学生不等。我们可以发现,学生的成绩水平越高,实施加速教育的需求就越迫切。
许多教师每年都能遇到「百里挑一」的优秀学生,但对于那些「能力爆表」的天才来说,他们的教育往往需要依靠教育者的洞察力,而非固定的政策。尽管如此,仍然有成功的案例可以借鉴。这些案例展现出了教育者如何悉心关注学生学业和社交状况。
著名数学家陶哲轩(Terence Tao)就是这样一个典型的成功案例。他在两岁前就展现出惊人的阅读能力,让父母大为震惊。随后,他以惊人的速度攀登数学的高峰。陶哲轩从小就被认定为极度有天赋,教育研究者 Miraca Gross 在她对天赋异禀儿童的纵向研究中,详细记录了陶哲轩的教育历程:
陶哲轩的父母走访了多所当地学校,他们在寻找一位既有灵活性又思想开放的校长,能够接受他们为陶哲轩设计的特殊教育方案。...
这种做法为「综合性」多年级加速教育计划奠定了基础,这正是哲轩父母所构想的,并在学校经过深入思考和讨论后得以采纳实施。到 1982 年初,年仅 6 岁 6 个月的哲轩已经在不同学科上同时就读 3、4、6 和 7 年级的课程。在他的求学过程中,他能够与各个年级的孩子一起学习和交往。由于他在每个科目上都按照自己的节奏进步,而不是采用正式的「跳级」方式,这种教育模式避免了他的知识出现断层。
陶哲轩的教育以这种方式持续进行,最终他在 21 岁就获得了博士学位,此后过上了卓越且平衡的生活。后来,他还就天才教育提出了自己的建议。
考虑到加速教育的成功,我们是否应该更广泛地采用这种方式?从一个角度来看,加速教育似乎已经成为一种广泛使用的工具,用来满足天才学生的需求。根据 SMPY 的调查,在数学能力最顶尖的万分之一的学生中,将近一半的人经历过跳级,而几乎所有人都接受过某种形式的加速教育,包括高级课程、提前进入大学或其他方式。约三分之二的学生表示对自己的加速教育感到满意,并在多个方面给予了积极评价:
[来源:SMPY]
在那些万里挑一的天才学生中,约有三分之一表示不满,他们大多希望能获得更多的教育加速机会。与此同时,天才教育的倡导者们强烈认为,加速教育这一方法被严重低估了。《被蒙蔽的国度》这份报告正是基于这一理念——尽管除了呼吁「更多」之外,报告并未具体说明应该有多少学生接受加速教育。该报告主要从文化角度论证了支持加速教育的观点,引用了诸如马丁·路德·金 15 岁就高中毕业这样的典型案例。
为了深入了解教育工作者对加速教育的看法,我们通过 Twitter 调查了 21 位教师、学术教练、辅导老师和教育管理人员。调查中,我们要求他们对以下情境做出回应:
假设你们学校现有一名一年级学生,其数学能力远超同龄人,例如能够心算长除法。这个孩子向父母抱怨学校的数学课很无聊,父母因此主动与老师联系,担心孩子没有得到足够的挑战。班主任意识到这名学生的数学水平确实高于年级要求,并努力在课堂上满足他的需求。然而,家长们认为目前的安排并不理想。老师反馈说,这名学生在数学课上很难集中注意力,有时甚至会出现行为问题。
从他们的回应来看,加速教育确实被列为一种选择,但几乎总是作为最后的方案,只有在尝试了各种课内或课外选项(如课后俱乐部)之后才会考虑。全国数学教师委员会也持相似观点,认为数学加速应该是一种「不得已而为之」的措施:他们声称按能力分班教学在道德上是站不住脚的,对加速教育持谨慎态度,但承认[在某些情况下可能是适当的](https://www.nctm.org/uploadedFiles/Research_and_Advocacy/Advocacy_Toolkit/15699_Catalyzing Exec Summary rlt.pdf)。
从多个方面来看,当前的主流教育体系深受 Bob Slavin 思想的影响。作为反对分班教学的主要代表人物,Slavin 却对某些形式的能力分组持开放态度。他借鉴了能力分组中行之有效的研究成果(包括评估、频繁的重新分组和课程调整),为表现不佳的学校制定了一套教学方案。虽然他对加速培养天才学生持怀疑态度,但也承认在某些情况下,这是一种有用且必要的手段。如果你与孩子的老师探讨加速教育的话题,你很可能会听到一些与 Bob Slavin 观点相近的看法。
关于这种怀疑态度的根源,还有更多值得探讨的内容。然而,我们必须认识到,一个学生能够接受加速教育,并不意味着他们就应该接受加速教育。诚然,一些天才学生确实符合我们先前描述的特征——对学校感到失望,觉得枯燥乏味且缺乏挑战,难以与同龄人沟通——但许多同等才能的学生在学校生活中也能找到快乐。(我们在网上评论中听到了一些快乐的故事,尽管数量不多。)如果一个孩子不需要加速教育就能保持快乐和成功,那么无论是否接受加速教育,他们很可能都会继续保持快乐和成功。如果他们不愿意接受加速教育,就不应该强迫他们。事实上,对加速教育的部分质疑恰恰来自那些不恰当地敦促学校为他们已经快乐、满足的孩子提供加速教育的家长。
加速教育并非唯一选择。常规课程之外还有大量值得学习的内容。即使在一般的课堂上,精心设计的课程或经验丰富的教师也能为主要教学活动创造「拓展」机会,使已经准备好接受更多挑战的学生能够参与有意义的学习。增强现有知识或接触相关的新主题同样能够很好地满足学生需求。例如,在算术方面进步神速的学生可能会被帕斯卡三角形和数论深深吸引;而对英语痴迷的学生则可能在学习西班牙语或中文时找到同样的乐趣。这些方法与加速教育一样,都遵循一个简单的原则:如果孩子渴望更多的学习且学有余力,就应该满足他们对更多学习的渴望。总的来说,现有证据表明,加速教育是一种切实可行且资源利用效率高的方法,能够帮助天赋异禀但未受到足够挑战的学生在学校中充分发展潜能。
如果你想深入了解加速教育,这里有我们推荐的最佳一站式阅读资源。
4 教育目标的冲突
通过加速教育、一对一辅导或能力分组,一些孩子可以学到更多知识。那么,为什么学校不积极推行这些方法呢?难道他们不应该致力于让孩子们学到尽可能多的知识吗?这不正是学校应尽的职责吗?从最大化学习效果的角度来看,教育工作者对能力分组或加速教育持怀疑态度令人感到困惑:为什么学校要放弃这些宝贵的学习机会呢?
我们极少讨论的一个重要话题是:学校实际上并非单纯致力于最大化学习效果的机构。事实上,家长、纳税人和政治家对学校寄予了多方面的期望。在某些情况下,他们心目中的教育目标之间存在权衡取舍,迫使教育工作者不得不做出艰难的抉择。
历史学家 David Labaree 提出了一种分析这些相互冲突的教育目标的框架,他在《注定有人要失败》一书中对此作了深入阐述。Labaree 认为,有三个相互竞争的教育目标导致了教育系统内部的普遍张力:
-
民主平等(「教育作为培养合格公民的手段」)
-
社会效率(「教育作为培养高效劳动力的手段」)
-
社会流动(「教育作为个人巩固或提升社会地位的途径」)
Labaree 指出,这些目标经常处于相互矛盾的状态。许多表面上看似严重失职或组织功能失调的现象,实际上是这些目标相互排斥的必然结果:
这些教育目标反映了任何自由民主社会中根深蒂固的矛盾,如果不牺牲社会的自由主义或民主本质,这些矛盾就无法得到化解……我们期望教育系统促进社会平等,却又希望它在不损害个人自由或私人利益的前提下达成这一目标。我们要求它为个人创造机会,但又不希望这种做法威胁到国家的完整性或经济的效率。结果是,教育系统在实现其任何一个主要社会目标方面都彻底失败了……因此,学校系统表面上的功能失调并非必然源于规划不当、管理不善或教学质量低下;它们实际上是自由民主思想内在矛盾的外在体现。
能力分组和加速教育恰好反映了 Labaree 所揭示的这些张力。这些旨在最大化学习效果的方法可能会得到那些将教育视为国家对国防或经济的投资的人士的支持。毫无疑问,对学校实施加速教育的最强烈呼声往往来自家长,他们希望学校能为自己的孩子提供一切可能的向上流动的机会。(「我们要确保他们能进入一所好大学。)
这些因素促使学校倾向于实施能力分组和加速教育。然而,学校也深知自己肩负着为全体公民创造公平教育成果的责任,而在这个社会中,人们彼此视为平等。从经济学角度来看,一个能够提高尖子生成绩而不损害其他学生利益的项目无疑极具吸引力,但在学校环境中,这反而可能成为一个棘手的问题。
现实情况是,许多学校常常被家长要求为孩子提供加速教育的请求所困扰。那些经济实力雄厚、人脉广泛的家长尤其善于向学校施压,希望借此帮助自己的孩子脱颖而出。有时,即便这种做法对孩子的教育并无实质性帮助(即教育效率低下),或可能加剧教育不平等(例如允许任何有钱有势的家长让孩子提前学习代数1课程),他们也会执意如此。
简而言之,从学校的角度来看,加速教育存在两个主要问题。首先,即使在学术或社交方面并不适合的情况下,家长也会强烈要求实施加速教育。其次,这可能会加剧教育不平等。这或许解释了为什么教育界普遍对加速教育持怀疑态度。
需要强调的是,这里仅仅是在解释这种现象背后的动态机制。在现实中,这种情况的发展往往令人心痛。为了缓解家长需求而设计的制度可能会让一些孩子长期处于沮丧和挫败的困境中:
我的大儿子希望能在下一学年学习更高难度的数学课程。为此,他在今年二月参加了两次针对下一学年课程的期末测试。在这两次考试中,他表现优异——每次只有半道题没有完全答对,其余题目全部正确。换句话说,他在这两次考试中都取得了约 90% 的高分。然而,令人意外的是,他申请跳过当前课程直接学习高级课程的请求竟然被学校拒绝了。(来源)
学区通常会制定一系列繁复的政策,这些政策在处理真正需要加速教育的学生脱离不利学习环境时,往往会变得异常棘手且令人沮丧。我们从一位教育工作者那里听说了一个令人心碎的案例:一名非常年幼的学生竟然表现出了自杀倾向。而这一切都因为糟糕的课堂环境而愈发恶化——这个孩子说他感觉老师和同学都讨厌他,仅仅因为他热爱数学。孩子的父母和这位教育工作者试图为孩子寻找一个更适合他的班级,却遭遇了重重阻力,这些阻力就像 Labaree 所描述的那样层层叠加。无可奈何之下,这位教育工作者私下建议家长们干脆离开这里,转而选择一所能更好地满足孩子需求的当地私立学校。
这个故事最终迎来了一个令人欣慰的结局:这位原本还在上四年级的小学生成功转入了一所私立学校,在那里他被直接安排在八年级的荣誉班学习。如今,他开始真正喜欢上了数学课。更令人欣喜的是,他看起来比从前快乐多了,而且还对街头艺术和社会公正事业产生了浓厚的兴趣。
然而,我们不得不承认,并非所有类似的故事都能有如此圆满的结局。
5 个性化教育软件
[来源:Larry Cuban]
「我们身处一个科幻照进现实的时代,」Bryan Caplan 在《反对学校教育的案例》一书中这样写道。「在发达国家,几乎人人都能使用回答几乎任何问题、教授几乎任何学科的软件程序,而全球约有半数人口也享有这种便利。互联网不仅提供了源源不断的知识启迪,还带来了优质的正规课程。」
用互联网取代传统实体课堂的构想与当今时代的脉搏完美契合。这一点从人们对在线学习和个性化教育软件的热情追捧中可见一斑。比尔·盖茨、埃隆·马斯克和马克·扎克伯格等科技巨头纷纷在个性化学习和教学软件领域投入巨资。整个教育科技行业更是蓬勃发展,仅 2017 年就吸引了约 80 亿美元的风险投资,同时创造了 177 亿美元的盈利。
终于,我们找到了一条摆脱学校系统及其诸多妥协的出路!如果学校作为一种机构,其目标与最大化学习效果存在冲突……那么,让我们远离学校及其内部矛盾,给予孩子们他们渴望的自由学习环境吧。我们的目标是将理想的导师转化为一款软件程序。
这个梦想不仅契合当今时代的潮流,还有着深厚的历史渊源。历史学家 Larry Cuban(《教师与机器》和《摸索着走向乌托邦》的作者)和 Audrey Watters(正在撰写一本相关著作)对这段历史有详尽的记载。Watters 的演讲「教育未来的历史」很好地阐释了这一核心观点:这个梦想远远超越了任何特定的技术范畴。电影、广播、电视,这些媒介在不同时期都曾被誉为教育创新的突破口,有望让学生摆脱僵化的学校教育模式,实现个性化学习。从托马斯·爱迪生到 B.F.斯金纳,技术倡导者们长期以来一直在描绘我们(至少按照 Caplan 的说法)如今正在经历的未来蓝图。
话说回来,过去的科技倡导者也曾认为他们生活在个性化学习的时代。让我们回顾一下 1965 年对一个采用「个性指导教学」项目的课堂描述:
每个学生都按照自己的进度学习,通过听录音和完成练习册来学习。完成一个单元后,学生会立即接受测试并得到反馈。如果分数达到 85% 或以上,就可以进入下一单元;否则,教师会开小灶来弥补不足,包括一对一辅导。
相比之下,2017 年《纽约时报》的一篇题为《新型课堂》的文章是这样描述的:
学生通过习题册、在线课程和与教师的小组讨论,按照自己的节奏学习。他们会频繁得到关于已掌握技能和待习得技能的反馈。
现代和历史上关于个性化学习的论述如此相似,这并不能完全说明问题。诚然,互联网在许多方面确实带来了变革,但个性化学习软件似乎仍然面临着许多我们熟悉的、非常人性化的挫折。
每个尝试过在线学习的人,或多或少都曾面临这样一个矛盾:互联网上虽然汇聚了浩如烟海的人类知识,但我们往往无法充分利用这些资源。在这样一个时代,麻省理工学院几乎所有的课程都可以免费在线学习,可汗学院、Coursera 等众多学习平台和工具唾手可得。那么,为什么人们翘首以盼的学习革命却迟迟未能到来呢?
从某种意义上说,教育革命确实已经到来,只是并未如预期那般显著改善教育现状。以加利福尼亚州的特许学校火箭船为例,他们将约一半的课程搬到线上,并取得了不错的成绩。然而最近,该校开始放弃一些激进的个性化教学尝试,重新认识到教师的重要性。他们表示:「我们发现,将在线学习引入优秀教师的课堂,这种模式最为成功。」曾经在纽约市备受追捧的 School of One 高中教学模式,原本计划进一步推广。但当更全面的评估结果出炉后,这一模式却遭到了猛烈抨击。与此同时,研究显示,在线的特许学校似乎反而抑制了学生的学习进步。
问题部分在于,很难获得关于各种教育科技产品效果的可靠研究数据。许多工具,尤其是那些直接销售给学校或被在线特许学校使用的工具,往往是专有技术,隐藏在付费墙后。它们有选择性地展示最有利的数据和有限的演示。总的来说,教育科技行业对学生的影响似乎喜忧参半。
那么,为什么开发有效的教学软件如此困难呢?
首要原因是教学本身就是一项复杂的工作。一位优秀的人类教师需要完成许多复杂的任务 —— 了解学生,回应班级的情绪和需求,提出「恰到好处的」问题,监控学习进度,在学生露出困惑表情时及时解释等等。要让计算机实现这些功能,难度实在太大了。
理论上,也许可以设计出一款能完成各种教学任务的软件。然而,现实中很多软件设计师甚至不愿意尝试。相比之下,采取一些教学上的妥协方案,比如完全依赖视频进行教学,显然更加简单和经济。诚然,也有一些经过深思熟虑的教育工具,例如可探索的解释团队制作的「囚徒困境」课程。但是,开发出高质量且适合数字环境的教育工具既困难又耗时。对于有前途的设计师来说,加入谷歌或暴雪这样的公司往往比与学校合作更有吸引力。因此在实际情况下,人类教师目前在教学方面仍然具有诸多优势。
即便我们成功解决了所有设计方面的问题,学生是否会有足够的动力坚持使用这些教育程序呢?针对线上教育特许学校的研究表明,保持学生的参与度是最核心的挑战。当你让一个孩子坐在电脑屏幕前时,他们很容易就会跳转到游戏网站、YouTube、SlateStarCodex 或谷歌图片等任何与学习无关的内容上。为了解决这个问题,许多教育游戏采用了所谓的「巧克力包裹的西兰花」策略,试图在日益复杂的学习内容外围添加一些与学习本身无关的游戏化元素。
公平地说,提高学生参与度也是传统学校面临的核心挑战。但正是那些饱受诟病的学校制度在努力应对这一问题。学校那种高度社交化的环境有助于孩子们建立学生的身份认同,并内化一套有利于学习的社会期望。法律规定儿童必须入学,学校要求学生必须到课。更重要的是,当孩子们进入教室后,与真实的、活生生的教师之间的互动能够设立高标准的学业期望,而孩子们通常会发自内心地努力去达成这些目标。
常见观点认为学校教育会严重打击学习积极性,但事实上,与在线教育相比,传统学校在激发学生学习动力方面表现出乎意料地好。以 Coursera 为代表的大规模开放在线课程(MOOCs)的平均完成率仅为 15%,而公立学校的表现远远超过这一数字。即便是广受欢迎的语言学习应用 Duolingo,根据其 2013 年自行公布的数据,课程完成率也仅约 1%。如果学习完全依靠用户每天的一时兴起,那么只有最专注、最有毅力的人才能坚持下去,而这些人往往本就是在学校里表现优秀的学生。这也正是为什么人们愿意作出多年的学业承诺,在各种激励和约束机制的推动下完成学习过程。有些学者如 Caplan 认为,人们逃避学习去网上消磨时间反映了他们的真实兴趣,但我们同样可以将坚持上学视为一种真实意愿的体现。实际上,人们需要社会制度来帮助我们做真正想做的事情。因此,即便随着计算机成为越来越优秀的教学工具,学校在激发学习动力方面的优势似乎仍将长期存在。
基于科技的学习工具如何应对这些挑战,从而有可能长时间吸引学生的注意力并实现有效教学?推广高等数学教育的机构 Art of Problem Solving 为我们提供了一个值得深入探讨的案例。该机构找到了一个令人瞩目的平衡点。首先,它开发了一系列容易上手的游戏化在线学习工具,这些工具围绕精心设计的思维激发型问题展开。其次,它还提供定期在线课程,承诺快节奏、富有挑战性的内容,以及由学科专家指导的志同道合的学习伙伴。尽管在线课程价格较高,但保留了人性化的教学方式。
这种平衡对学生意味着什么?对于那些勤奋自律、渴望迅速掌握知识的学生来说,他们可以尽情沉浸在这些富有吸引力的软件中学习。软件总能为他们指明下一步,并提供更具挑战性的问题,没有任何障碍能阻碍他们的进步。另一方面,对于那些希望在更具挑战性的环境中建立自我激励机制,同时保持学校社交互动优势的学生来说,他们也能找到适合自己的学习方式。
成功的教育工具可以有多种形式,但有一个核心理念值得反复强调:教育软件应该能够激发热爱学习的孩子们的热情,让他们能够自主学习,但不应该完全取代那些基于社交互动、富有人性的激励机制。确实,有时甚至应该保留「传统」学校中的一些做法。
从历史的角度来看,在线学习是教学自动化尝试的延续。然而,我们似乎总是重复过去的错误,忽视了历史给我们的教训:教学比我们的机器复杂得多,学习动机很大程度上来源于社交互动,而在设计学习软件时学校往往难以区分真正愿意献身于教育事业的设计师和那些只顾利益的投机商人。
当前市面上确实存在大量质量平平的在线学习工具,还不乏一些糟糕的产品。目前,还没有哪种工具能在缺乏持续、细致的人工教学指导的情况下,完全取代传统学校教育。
尽管如此,根据学习者的兴趣爱好,互联网上确实存在一些优质的学习资源。特别是当学生有一个关心他们的导师或者一群志同道合的伙伴时,他们能够通过网络学到很多东西。随着教育工作者和设计师开发出更多能对在线学习扬长避短的学习工具,在线学习的潜力将不断增长。但这种场景还不能完全等同于科幻小说中的描述。
我们的算法建议你观看以下两个视频:视频 1 和视频 2,以平衡现实主义和理想主义。
6 可操作的建议
教育很复杂,难以一概而论。尽管如此,以下是一些具有普遍性的建议。
如何为孩子选择合适的学校:
-
即便是最优秀的学生,在不同的环境中也未必能同样出色。就算是天资聪颖的孩子,有老师指导也比自学效果更好。除非有条件安排一对一辅导或其他个性化教学,否则学校仍是学习的最佳场所。
-
然而,目前的学校教育并不能满足所有孩子的需求。一个可行的解决方案是:如果孩子渴望接受加速教育,并且在学业上已经做好准备,那么加速教育通常会对他们大有裨益。
-
大多数学校并不致力于为每个学生提供最佳的学习体验,尤其是他们往往对加速教育持怀疑态度。
-
因此,如果你认为你的孩子需要得比学校所能提供的更多,你就要准备好成为一个助推者。
-
但是,如果你觉得孩子需要更多挑战,而孩子本人在学校却很快乐,那就尽量克制自己,不要过分干涉。
-
不要为了让孩子进入一个教授内容完全相同、进度也完全相同,只是名字上带有「荣誉/实验/尖子」字样的班级而大费周章。这种形式上的能力分组对教育效果并没有实质性的影响。
-
优先考虑免费、开放的在线学习资源。但不要指望这些工具能替代你或孩子的努力。如果在线学习缺乏适当的指导和监督,很可能会导致注意力分散,学习进展缓慢。
对于教育工作者:
-
作为小学教师或管理者,如果你的学校想要尝试创新的教学方法,不妨考虑按科目实施跨年级能力分组,尤其是在数学和阅读课程中。
-
天赋卓越的孩子通常并非在所有领域都同样出色。可以考虑根据孩子在各个科目的实际表现,为他们提供不同程度的进阶学习机会。
-
聪明的孩子往往学习得很轻松,可能缺乏克服困难的经验。要为他们寻找一些富有挑战性的任务,无论是学习还是其他方面,这将有助于他们日后应对更重大的挑战。
-
如果一个孩子在课堂上感到无聊,并且已经掌握了所有内容,那么他可能不应该在你的课堂上。
对于技术设计师和用户:
-
在开发在线学习工具时,要把学习过程本身设计得引人入胜。不要仅仅依赖于表面的吸引力,或者认为单纯呈现内容就足够了。认真对待动机问题。
-
寻找那些充满热情且拥有活跃社区的群体,不论是线上还是线下。不要忽视学习的社交维度。
对于教育改革倡导者:
- 人们在讨论教育问题时,往往只关注教育效果。但要警惕,教育争论很少涉及方法的有效性,常常反映的是我们的价值取向。
最后,对于所有与儿童接触的人,无论是教育工作者、家长还是其他人,请务必认真对待孩子们的感受,好吗?如果一个孩子感到痛苦,那就绝对是一个必须解决的问题,不论学校的规定如何。
特别鸣谢:衷心感谢 Reddit 平台上的 /u/Reddit4Play 用户、SSC 社区的 JohnBuridan 成员、Education Realist 博客作者,以及众多在写作过程中阅读草稿并贡献宝贵见解的朋友们。你们的支持与建议对本文的完善功不可没。
反对补贴郁金香
原文:Against Tulip Subsidies | Slate Star Codex
发表于 2015 年 6 月 6 日,作者:SCOTT ALEXANDER
一、郁金香的寓言
试想有这样一个小王国,它流传着一个独特的习俗:当一名男子爱慕一位女子时,他会送她一朵郁金香;如果女子接受了,两人便会很快喜结连理。若是一对情侣没有经过郁金香仪式就成婚,会被视为非法同居;除此之外,任何其他形式的求婚都不被认可或接受。
有一天,一位荷兰商人来到了这个小王国。他向当地人介绍说,他的祖国也有一个与郁金香相关的独特传统:他们会对郁金香进行疯狂的投机交易,将价格炒到天文数字。在荷兰,一朵郁金香的价格可能高达普通工人一年收入的十倍!这位商人很高兴找到了新的郁金香球茎来源,于是提出用几个荷兰盾一朵的价格收购郁金香,王国的居民欣然接受了这个提议。
不久之后,更多的荷兰商人蜂拥而至,掀起了一场激烈的竞价战。郁金香的价格开始飙升,从几十荷兰盾猛涨到几百荷兰盾。郁金香种植者因此而暴富,但其他人却不那么高兴了。想要向心上人表达爱意的求婚者发现,自己不得不倾其毕生积蓄来购买一朵郁金香,而且还不能保证对方一定会接受!很快,一些最贫困的人彻底失去了组建家庭的机会,被排斥在婚姻之外。
一些国会议员对此状况感到极为愤慨。他们坚称,婚姻是一项不可剥夺的基本人权,眼睁睁看着穷人因外国投机者的操纵而被迫放弃这项权利,简直是一种令人发指的暴行。他们强烈要求国王为每位公民提供充足的资金,确保人人都能买得起一朵郁金香。然而,这一提议也引发了一系列质疑:这样做是否会耗尽国库?我们是否有义务为每个人购买完美无瑕的高级球茎,抑或仅需提供最低劣、勉强满足仪式要求的植株即可?倘若有人屡屡向不同女性求婚却频遭拒绝,我们是否要为他反复购买新的球茎,变相纵容他的愚蠢行为?
支持补贴政策的一派断言,提出这些质疑的人无一不是富裕阶层,他们自己很可能有能力购买郁金香。这些人正是仗着自己的特权地位,对其他人获得他们已经享有的婚姻幸福权利横加阻挠,提出种种毫无意义的反对意见。在这些持不同意见者遭受残酷对待——被涂上焦油和羽毛并被扔进河里后,议会最终投票通过了一项决议:不论价格几何,公共财政将无限量地支付穷人所需的郁金香。
几年后,又一位荷兰商人造访这个小王国。当地居民纷纷询问他此行是否是为了购买郁金香,商人却告知他们,荷兰的郁金香泡沫早已破灭,价格已跌至一两个盾。这个消息令王国百姓大为震惊,因为他们的郁金香价格一直在飙升,如今已攀升至数万盾的天价。尽管如此,他们仍然庆幸,无论郁金香价格如何高涨,政府总会出手相助。诚然,道路年久失修,军队因缺粮而苦不堪言,但至少人人都能如愿步入婚姻的殿堂。
与此同时,河对岸的另一个小王国也有类似的郁金香婚俗。当荷兰商人开始哄抬价格时,他们同样陷入危机。然而,这个王国却无力实施全民郁金香补贴政策。一时间,局势岌岌可危,民怨沸腾。
而今,他们改用水仙花作为订婚的象征,国家经济更是蒸蒸日上,欣欣向荣。
二、价值 20 万美元的一丝格调
在美国,有志成为医生者需先完成四年本科教育,专业不限(例如我主修哲学),随后再就读四年医学院,总计需要在高中毕业后接受八年教育。相比之下,在爱尔兰,医学生可以直接从高中升入医学院,五年后便可毕业。
我在美国和爱尔兰都有行医经验,可以说两国医生的水平大致相当。爱尔兰医生参加美国的标准化考试时,往往能取得不俗的成绩。值得一提的是,爱尔兰是众多发达国家中,医疗健康成果 100% 优于美国的典型代表。然而,并没有任何证据表明,美国医生从额外的三年本科教育中获得了显著的专业优势。实际上,我们不禁要问:为什么会有这种优势呢?我实在无法理解,为什么拥有一个哲学学位能够提升我的医术水平?
(说句玩笑话,也许长期「夸夸其谈」的练习,无意中培养了我做结肠直肠手术的技能。不过显然,为此花费那么多时间和精力并不值得。)
让我再坦白一件事。爱尔兰的医学院学制为五年,比美国的四年制多出一年。这是因为爱尔兰在第一年会教授基础科学课程,包括生物学、有机化学、物理学和微积分。有趣的是,当我申请爱尔兰医学院时,他们认定我在美国本科阶段肯定已经学过这些内容,因此为我提供了一个四年制的加速课程。然而事实上,我并没有系统学习过这些科目。我只是在暑假时自学了一些相关的书籍,结果竟然应付得相当不错。
美国人需要整整八年才能成为一名医生,而爱尔兰人只需四年就能达到同样的水平。在一所顶尖大学——我们说的是常春藤盟校级别的,而不是某个无名小卒的社区学院——每年的学费高达 5 万美元。那么,不禁要问:美国医学生额外付出的 20 万美元,究竟……换来了什么?
值得注意的是,当前医保危机的部分原因可以追溯到医生们难以承受的高额债务负担。许多富有社会责任感的医生本想投身于帮助弱势群体的低收入职业,但当面临高额教育贷款时,他们不得不优先考虑如何立刻赚取高收入以偿还债务。面对这一问题,我们的解决方案却是让医生们毫无理由地多承担 20 万美元的债务。
正如 Dirkson 所言,看似微不足道的 20 万美元在这里那里积少成多,最终会累积成一笔惊人的巨款。美国每年培养 2 万名医生,这意味着要求医生必须获得本科学位的政策每年就要耗费 40 亿美元。令人震惊的是,这笔钱几乎足以解决全美所有无家可归者的住房问题(按每人 1 万美元的安置费用,总计 60 万无家可归者)。
我原本希望能说人们已经注意到了爱尔兰和美国医学教育体系的差异,并正在认真思考这个问题。事实上,我确实可以这么说,只是情况并非如我所愿。在爱尔兰,我接触到的许多资深医生都表示希望能采用美国的教育体系。有趣的是,他们的理由并非认为美国体系能培养出更优秀的医生,而是觉得与像我这样年龄稍长、阅历较丰富的医学生共事更有意思。相比之下,爱尔兰的医学生大多刚高中毕业,医生们觉得难以与之产生共鸣。我们这些外国学生比他们大四岁,而且已经完成了某个领域的本科学习。有位主治医生甚至说,因为我在大学学过哲学,所以我的存在为团队增添了「一丝格调」。一丝格调!
这就是为什么,尽管我对自由意志主义持有保留态度,但真正令我恐惧的是非自由意志主义。每当那些不必承担决策后果的人被授权为他人做决定时,你就会看到这样的场景:一群年迈的医生聚在一起,心想「没错,如果我们让别人支付 20 万美元,这里确实显得更有格调,就这么办吧」。结果,原本可以用来解决全国所有无家可归者住房问题的资金就这样付诸东流了。
更为关键的是,这也彻底粉碎了我最后一丝希望——即当前社会对各行各业都疯狂要求大学学位的现象背后,可能存在某种合理的理由。
三、为不必要的学位买单
我之所以拿医疗行业举例,纯粹是因为它的情况最为明显。你可以把美国视为实验组,爱尔兰作为对照组,你会发现两者之间几乎没有差异。你可以观察一位美国医生和一位爱尔兰医生,看他们在相同情况下开具相同的药物,你会由衷地感叹:「我们刚刚白白花了 20 万美元。」
但这种现象并不局限于医疗行业。让我给你讲讲我家里的情况。
我有个表弟,他一直梦想成为一名消防员。从小到大,这个愿望都没有改变。他在当地消防部门做过志愿者,而且他们已经承诺给他一份工作。但是要得到这份工作,他必须先上四年大学。没有大学学位,你就不能成为消防员。这听起来很荒谬,对吧?回想过去,当人们只需要 13 年的基础教育就可以成为消防员时,据可靠消息称,有几个主要的州被烧成了平地。
我的母亲是一名西班牙语教师。 在执教二十年并赢得学生们的一致好评后,她攻读了教育学硕士学位,因为她所在的学校承诺,一旦她取得该学位就会提高她的薪酬。 然而,她告诉我,授课的教授们能力不足,缺乏实际教学经验,整个课程都在盲目追随最新的教育潮流。 尽管如此,在投入了数千美元后,她还是获得了学位,学校也言而有信地提高了她的薪水。 她的情况可以说是幸运的。 在一些州,法律要求教师必须攻读硕士学位才能继续从事教学工作。 奇怪的是,这些州的学生学习成果并不比没有此要求的州更好,但这似乎并未影响他们对这一规定的热衷。 即使许多严谨的对照研究表明,拥有或缺少硕士学位对教师质量的影响几乎为零,许多州仍然要求教师必须获得硕士学位才能保留教师执照,而且几乎每个州都会因教师拥有硕士学位而提供更高的薪酬。
在担任现职之前,我曾在日本教授英语。尽管我既不懂日语也没有教学经验,但面试公司只看重我是否拥有某个专业的本科学位,这就足以让我获得工作机会。相比之下,我认识的一些人虽然日语流利且拥有高级托福证书,却因为没有大学文凭而被拒之门外。
我的前女友主修性别研究,但不幸的是,所有高薪的性别相关工作都转移到了中国。为了应对这一困境,她选择参加了 App Academy——一个为期三个月、费用 1.5 万美元的编程培训课程。令人深思的是,App Academy 的毕业生能够与那些花费四年时间、耗资 20 万美元攻读计算机科学学位的人竞争同样的工作岗位。
我坚信我身边的人并非特例。普遍的现象是,人们花费数十万美元获得艺术史学位却从事销售工作,或者拿着西班牙文学学位却成为中层管理者。更令人担忧的是,那些无力负担高昂学费的人,可能永远失去成为消防员或销售员等职业的机会。
四、全民免费大学?补贴教育泡沫!
针对这种状况,总统候选人 Bernie Sanders 提出了一项全民免费大学教育的提案。
从某种角度来看,我能理解他的出发点。如果没有大学文凭就无法获得比「快餐店员工」更好的工作机会,而贫困人群又无力承担高昂的学费,这无疑是一个令人沮丧的现状,也明显对穷人不公平。
然而,如果没有郁金香就不能结婚,而穷人买不起郁金香,这同样是一个令人沮丧的处境,对穷人也显然不公平。
但是,全民郁金香补贴显然不是解决问题的方案。
当前的高等教育正经历着一场泡沫,与历史上的郁金香泡沫如出一辙。过去四十年里,大学学费飙升了十倍(即使根据通货膨胀进行调整,也上涨了四倍)。从前,学生只需一份暑期工作就能轻松支付学费;如今,这已成为不可能完成的任务。与此同时,没有大学学历的人的失业率是拥有学历者的两倍。毫无疑问,情况已经相当严峻,Sanders 参议员对此表示担忧是有充分理由的。
不过,换个角度来看,当我们要求医生在进入医学院之前必须获得大学学位时,我们仅仅是浪费了 50 亿美元,这笔钱勉强够为全国所有无家可归者提供住处。然而,Sanders 参议员承认他的计划每年将耗资 700 亿美元。这几乎相当于整个夏威夷州的经济规模,或者说,足以每年为每个生活在贫困线以下的美国人提供 2000 美元的补助。
到什么时候我们才会说「与其要求人们倾家荡产去获得可能毫无实际价值的学位,不如让他们能够轻松获得并保有基本工作」?
我担心 Sanders 的教育计划与文章开头提到的郁金香补贴想法如出一辙。这个计划将延续一个已经演变成投机泡沫的无用传统,阻止泡沫破裂,并打消人们寻找替代方案的积极性,比如用其他更实用的教育方式取代现有的大学教育。
(诚然,上大学也有非经济方面的好处,但让我们实事求是地想想——如果不存在大学这种机构,你会不会单纯出于非经济原因,建议政府花费 10 万美元让穷人去学习中世纪历史?此外,任何与就业无关的知识,通过自学都能以三倍的速度掌握。)
假如我是 Sanders,我会提出一个截然不同的策略:将「大学学历」纳入受法律保护的特征范畴,与种族、宗教信仰和性取向等同等对待。既然法律禁止询问求职者的性取向,那么询问他们是否拥有大学学位也应该被禁止。你可以对求职者进行各种考试,可以询问他们的高中成绩和 SAT 分数,可以了解他们的工作经历,但如果你询问他们是否有学位,那就构成了非法的阶级歧视,将会受到法律制裁。我很清楚这个提议明显违背了我一直以来坚持的半自由意志主义原则,但在目前的情况下,我已经顾不上这些了。
别为个人智商操心
原文:Against Individual IQ Worries | Slate Star Codex
作者:Scott Alexander 发表于 2017 年 9 月 27 日
[相关文章:态度与高度]
一、智商:科研重要,个人勿忧
我经常撰文强调智商研究的重要性,并致力于揭穿那些声称「智商是假的」、「智商无关紧要」或「智商只反映考试表现」的伪科学言论。事实上,智商是心理学领域研究最透彻的概念之一,也是预测工作表现、未来收入以及其他各种成就的最可靠指标之一。
然而,我时不时会收到这样的评论或邮件:「救命!我刚做了智商测试,发现我的智商只有 x 分!这远低于我的预期,看来我注定一事无成了。请告诉我哪里有最适合跳崖的悬崖?」
因此,我想澄清一点:智商对于科学研究而言确实非常有用且意义重大,但对于个人来说,它并没有那么重要。
这怎么可能呢?
让我们打个比方,以收入不平等为例:出身富裕家庭的孩子在生活中往往占据优势,而来自贫困家庭的孩子则处于劣势。
从研究的角度来看,认识到这一事实至关重要。如果科学界否认富裕的家庭背景能为子女提供人生优势,那将是学术界的重大耻辱。了解财富在家族间的传承对于最基本的社会认知都不可或缺。任何人若因政治因素被迫否认这一点,最终都会陷入如此混乱的境地,以至于还不如彻底放弃构建一个连贯的世界观。
从个人的角度来看,出身贫困家庭固然不是什么好事,但也不应该让人陷入无尽的沮丧。这并不意味着一个孩子应该这样想:「我来自一个年收入只有 3 万美元的家庭,看來我注定要一辈子失败了,甚至不值得去尝试。」诚然,相较于富裕家庭的孩子,贫困家庭的孩子确实处于劣势,但她可能早在任何科学家告诉她之前就已经意识到这一点了。如果她把代际收入传递的科学研究当作比她对生活艰难的一般感受更权威、更终极的判断,如果她执着地记录父母每一次加薪和奖金,认为这决定了她对未来的希望,那她就是过分夸大了科学研究的重要性。
因此,对于那些给我写信,真挚地抱怨自己智商低的人,我想强调两个重要观点。首先,我们在测量个人智商方面并不是很精确。其次,个人智商在预测未来成就方面也不是很可靠。
二、智商测试的准确性
让我们先来探讨测量问题。那些抱怨自己智商低的人(更别提那些炫耀高智商的人了)往往对这个数字的估计大相径庭。
根据官方研究,智商测试的结果很少出错。标准测量误差在 3 到 7 分之间(1,2,[3](https://books.google.com/books?id=IUElDwAAQBAJ&pg=PA198&lpg=PA198&dq=SEM+IQ&source=bl&ots=4nrHkNOJ6e&sig=hYky4WaBaifAxBhCYGpP0Mf6iGE&hl=en&sa=X&ved=0ahUKEwjQ1Ynvhb3WAhXqy1QKHXFRCM0Q6AEITDAI#v=onepage&q=SEM IQ&f=false))。假设取 5 分,这意味着你的测试智商只有 32% 的几率偏离 5 分以上。偏离 10 分以上的概率仅为 5%,而更大的误差几乎不可能发生。
然而,现实情况却是,我经常听到人们得到一些匪夷所思的智商分数。
这里有一个「我的智商太低该怎么办」类型的典型帖子 —《应对低于平均水平智商的残酷现实》:
16 岁那年,我参加了一次教育评估,其中包括韦氏成人智力量表第四版(WAIS-IV)和伍德考克-约翰逊认知能力测验。我母亲很想弄清楚为什么我在某些科目上一直很糟糕,尤其是几何等数学科目。
遗憾的是,我没能有机会和心理学家讨论测试结果,只能依靠自己和被戏称为「互联网大神」的资源来解读——我很清楚这样做存在风险。结果是,我花了整整两年时间进行业余研究,随之而来的是对我那低于平均水平、仅有 94 分的智商可能带来的影响的无休止的担忧...直到现在,我在某些领域的理解能力仍然很弱。我的 SAT(美国学术能力评估测试)成绩是 1070 分(阅读 540 分,数学 530 分),现在上大学代数课也只是勉强及格。老实说,如果我的同事知道我连高中水平的代数都几乎搞不定,我会感到非常难堪。
这个人以为列举两种不同的测试能够佐证自己的观点,但实际上 SAT 1070 分大约相当于 104 的智商,比他认为的高出整整 10 分。从他帖子中的其他细节来看——比如正确使用复杂词汇和句式、提到自己在网络安全领域工作得不错、喜欢阅读哲学/心理学论坛等——我推测 104 分更接近他的真实智力水平。
以下是来自同一 Reddit 帖子的评论:
真有意思,我希望更多智商一般或偏低的人也来分享经历。说说我自己吧,我的智商测试结果大约是 90。不过呢,测试那天我几乎整夜没睡,可能只睡了两个小时。而且我平时不怎么喝咖啡,那天却喝了相当于 500 毫克咖啡因的饮料。也许低智商的人都会这么干吧。
后来,我看了 Peterson 讲智商重要性的视频,一时兴起就做了 IQTest.dk 的瑞文测试。当时我心不在焉,注意力很分散,甚至有点像 ADHD,脑子里还在不停地胡思乱想。结果我得了 108 分。不过很多人说这个测试通常会比实际低 0.5 到 1 个标准差,所以按这么算,我的实际智商应该在 115 到 123 之间。另外,我是素食主义者,如果补充肌酸的话,可能还能再提高几分。我觉得我的智商应该在 120 多吧,虽然低智商的人往往会高估自己。但至少在非语言智力方面,我肯定有 108,这个分数算是中等偏下了。
评论者说得没错,IQtest.dk 的分数确实往往比其他测试要低。但即便如此,他第一次测试的分数也足足低了将近 20 分。按照官方统计,这种情况理论上只有万分之六点七的概率。然而现实是,只要有人在 Reddit 上发帖提到这事,马上就会有人跳出来说「没错,我也遇到过同样的情况」。
诺贝尔物理学奖得主理查德·费曼在学生时代的智商测试中「仅」得了 124 分。这个分数虽然表明他很聪明,但远不及人们对诺贝尔奖获得者的预期。有人指出,这可能是因为测试偏重于评估语言能力而非数学能力。然而,费曼的自传(尽管是由代笔作家编辑整理的)销量却高达 50 万册,还登上了《纽约时报》畅销书榜单。那么,要么是他的智商测试结果至少低估了 30 分(据说这种情况发生的概率只有 5.05 亿分之一),要么就是智商根本不存在,所有证明智商存在的研究都是蜥蜴人为了混淆视听而捏造的。无论是哪种情况,如果你自己在学校里的智商测试成绩看起来不太理想,也不必过分担心。
我不清楚为什么官方公布的可靠性数据与我们从日常经验中得出的看似合理的结论之间存在如此大的差距。我猜测,可能是官方研究在某些方面进行了更为严谨的测试。例如,他们会聘请专业的测试管理员,而不是让工作繁重的学校辅导员来进行测试;他们会在一天中特定的时间段进行测试,而不是在受试者昏昏欲睡的时候;他们不允许受试者在测试前大量摄入咖啡因;他们会当场将结果记录在电子表格中,而不是相信受试者能够准确记住自己的分数。
在我从事的精神病学领域,官方研究采用精心设计的结构化临床访谈来诊断精神疾病,这些访谈严格遵循既定指南。然而,现实中的医生却常常使用一些检查表来做出诊断,而这些检查表的顶部往往明确标注着「不得用于诊断」的字样。如果心理测量学也存在类似情况,那么各种数据之间的矛盾就不难理解了。
除此之外,还有两点值得我们关注。
首先,从整体人口的角度来看,智商随年龄的变化相当稳定。一项涉及 87,498 名苏格兰儿童的研究显示,11 岁时的智商与成年智商的相关系数为 0.66,这在社会科学研究中可以说是极其强的相关性。然而,「0.66 的相关系数」同时意味着「只能解释 44% 的变异」。就个体而言,一个人 11 岁时的智商是 100,到 30 岁时变成 120,或者反过来,这都是完全可能且并不罕见的。因此,我们应该将高中之前获得的任何智商分数仅仅视为对成年智商的一个貌似合理的预测,而不应过分依赖。
其次,那些因低智商分数而感到震惊,仿佛世界崩塌,并拼命维护自己知识分子形象的人,其实并不能代表所有智商得分较低的群体。大多数得到低分的普通人可能会平淡地说:「嗯,这大概解释了我为什么所有课程都不及格」,然后继续他们的日常生活。而当你看到有人说:「天哪,我的智商测试分数很低,我已经仔细核对了所有分项测试的标准差,发现了一些细微的差异,但不确定这是否能作为整体分数有误的贝叶斯证据」——老实说,如果我不是经常遇到这种人,我也不会拿他们开玩笑。相信你们心里清楚我在说谁。
出于好奇,我分析了在我收集的 SSC/LW 调查中智商最低的几个样本。我只找到三个自称智商不超过 100 且提供了 SAT 成绩的人。有趣的是,这三个人的 SAT 分数实际上相当于智商 120 以上的水平。
因此,我得出结论:至少在我接触到的人群中,以及那些经常给我发这类邮件的人当中,智商估计的准确性是相当值得质疑的。
这与基于数千份智商评估的人口平均值仍然是宝贵且实用的研究工具并不矛盾。它只是提醒我们不应该将其简单套用于自己。统计学告诉我们,绝大多数人服用兴奋剂后会感到亢奋。然而现实情况是,我有一位病人每次服用安非他命都会昏昏欲睡。统计数据和个人经历都不能说是错误的——但如果你在需要依赖一种时却使用了另一种,那么你将会有一段糟糕的经历。
三、智商预测力的局限性
第二个问题是,即使你成功避开了上述所有陷阱,完美无误地测量了智商,它的预测能力仍然相当有限。
这听起来是不是很离经叛道?!智商不是我们所知最具预测力的指标吗?难道它不是影响人生方方面面的关键因素,这一点不是已经在无数次可重复的实验中得到了证实吗?
的确如此!我并不否认这些事实。我要强调的是,在统计意义上成立的规律并不一定适用于每一个具体的个体。
让我们再次通过家庭收入代际传递这个类比来探讨这个问题。根据「社会经济地位」的具体定义,父母的社会经济地位与子女的相关系数大约在 0.2 到 0.3 之间。有趣的是,这个数值与 Strenze (2006) 研究中发现的智商和社会经济地位之间的相关性非常接近。毫无疑问,良好的家庭背景对个人成功是有帮助的。但我们也都明白,这并非成功的唯一决定因素。即使出身贫寒,只要足够努力并善于把握其他机会,依然有可能实现成功。对于社会学家或经济学家而言,父母与子女成功之间的相关性无疑是一个值得深入研究的课题。然而,对于追求进步的普通人来说,最明智的态度是:认识到家庭背景可能会让事情变得稍微容易或困难一些,然后继续专注于自己的人生。
成功并不仅限于成为运动员、音乐家或其他较少依赖智力的职业。研究表明,国际象棋天赋与智商的相关性为 0.24,这与智商和收入的相关程度相当。智商是一个复杂的核心因素,它对各种认知技能都有一定影响,但并不完全决定任何一种认知能力。使你智商一般,只要付出足够的努力,也完全有可能成为一名出色的国际象棋选手——这个结论固然没错,但问题还不止于此。关键在于,哪怕是智商平平之人,也可能在国际象棋上拥有很高的天赋。尽管概率不如智商高者那般大,但这种可能性确实存在。如果在此基础上再加上刻苦努力所产生的效果,你就一定能够取得一定的成就。
下图是一张按职业分类的智商范围表。尽管这份数据可能已经有二三十年的历史,但总体上应该仍具有一定的参考价值(详细讨论可参见此处):
我实在想不出更好的方式来阐释「统计上可靠,个体不确定」这一概念。从宏观角度看,我们发现医生的平均智商比清洁工高出 30 点,大学教授们则几乎清一色都是高智商群体,这似乎符合我们对智力测量统计的预期。然而,当我们聚焦到个人层面时,却发现智商低于平均水平的人有时也能成为科学家、教授、工程师,甚至是你能想到的几乎任何职业。
四、理解统计预测器的概念
老实说,我有些不情愿写这篇文章。在投入了大量精力来驳斥那些否认智商存在的人之后,我觉得这么做似乎是在——怎么说呢——削弱自己的立场。
不过,我认为这其实并没有看上去那么矛盾。我之前那些论证智商并非虚构的文章与这篇文章之间,确实存在某种内在联系。
如果你真正理解了统计预测器的概念——换句话说,如果你的大脑中已经形成了这样一种基本认知机制——那么社会科学就不会让你感到恐惧。你可以去阅读关于智商、遗传、刻板印象、性别差异或其他任何相关话题的文章,然后你会平静地说:「原来如此,某件事与另一件事之间存在一定的相关性。」之后你就可以心安理得地去享用晚餐了。
如果你无法理解这一点,这个世界就会显得异常可怕。当有人说智商「与」生活成就「相关」时,你可能会感到困惑不已。「相关」到底是什么意思?难道他们在暗示只有高智商的人才能成功?如果你在智力测试中没有取得理想的分数,是不是就意味着你注定失败?
面对这种情况,你可能会选择奋力抗争——否认所有数据,在研究机构门前抗议,或者编造一些关于「情商」和「毅力」之类的牵强理论。又或者,你可能会选择向现实低头,至少能从接受这个残酷事实中得到一丝苦涩的慰藉。
设想一个美国人突然深信共产党即将以压倒性的力量入侵。他可能会囤积武器,将家改造成堡垒,并开始鼓吹将共产党同情者监禁,以防他们在关键时刻背叛国家。或者,他也可能选择在房子上挂起红旗,穿上印有**「欢迎共产主义统治者」**的 T 恤,开始学习俄语。这两种看似截然相反的反应,实际上都源于同一个根本性的误解。当前的文化战争——无论是哪一方——似乎都存在这样的问题。我不知道该如何彻底解决这个问题,只能不断尝试,努力培养必要的思维方式,并试图说服人们:相关性既不是毫无意义的,也不总是等同于绝对的因果关系。
因此,我诚挚地呼吁大家:请学习关于智商的科学。运用智商理论来解释和预测社会现象。致力于探索提高人类智商的方法。我们可以假设,提高智商将对广泛的社会问题产生深远而强大的影响。但请谨记,不要期望智商能够准确预测某个特定个体的成就。特别是你自己的成就。
提防只看一项研究的人
原文:Beware The Man Of One Study | Slate Star Codex
作者:Scott Alexander 发表时间:2014 年 12 月 12 日
中世纪神学家 Aquinas 有一句名言:「提防只念一本书的人」。在此基础上,我想补充一句:提防只看一项研究的人。
让我们以医学研究为例来阐明这个观点。假设有一种药物对某种疾病具有轻微的治疗作用。几年后,多个研究团队分别对这种药物进行了各种不同的研究。理想情况下,这些研究的平均结果应该能反映出真相——即该药物确实效果轻微。
然而,由于实验中不可避免的误差以及研究质量的参差不齐,研究结果中难免会出现随机波动。最终,我们可能会看到类似钟形曲线的结果分布。曲线的峰值会落在「轻微有效」这一点上,但两侧也会分布着一些其他结果。大致如下图所示:
从图中我们可以看出,曲线的峰值位于中性点的略右方——也就是轻微有效的位置。约有 15 项研究得出了这个准确的结论。
然而,也有约 5 项研究得出这种药物效果显著的结论,另有 5 项研究完全背离预期,认为这种药物实际上有害。甚至还有 1 项研究发现这种药物极其糟糕,可能存在严重危险。
这还是在我们考虑欺诈或统计操作不当之前的情况。我所说的是,仅仅因为实验设计的正常变种,就会出现这样的结果。即使我们提高实验的严谨性,钟形曲线可能会在水平方向上变得扁平,但仍然会呈现钟形分布。
实际情况可能更加复杂,因为这里假设所有人都在研究完全相同的问题。
假设图表的标题是「该药物治疗双相情感障碍的有效性」。
但这种药物在治疗双相 I 型障碍时可能比治疗双相 II 型更有效(例如 Depakote 丙戊酸钠)。
或者,这种药物对双相躁狂可能非常有效,但对双相抑郁的效果可能差很多(再次以丙戊酸钠为例)。
又或者,这种药物可能是一种很好的急性抗躁狂剂,但在长期维持治疗方面效果较差(我们继续以丙戊酸钠为例)。
如果你有一张标题为「丙戊酸钠治疗双相情感障碍的有效性」的图表,横轴从「效果极差」到「效果极佳」,纵轴是研究数量——而你把所有的研究——包括维持治疗、躁狂期、抑郁期、双相I型、双相II型——都放在这张图表上,那么你最终会得到从「效果极差」到「效果极佳」的全部范围,这还是在考虑数据噪音之前,更不用说研究偏见和实验设计缺陷了。
这就是为什么你应该提防只看一项研究的人。
如果你浏览那些较为高端的替代医学网站,他们不会直白地宣称「科学研究不过是西方医学和大型制药公司阴谋的产物,是一种充满逻辑中心主义和男权中心主义的工具。」
相反,他们会这样说:「医学科学已经证实了这种药物的危害性,但那些无知的医生仍在不顾一切地将它推销给你。瞧,这里有一项来自权威机构的研究,明确证明这种药物不仅无效,而且有害。」
事实上,这样的研究的确存在,其作者也确实是声名显赫的科学家,研究本身的严谨程度和质量可能也不亚于任何其他研究。
于是,许多被灌输了某些事物有证据而其他则没有这种观念的人会惊呼:我靠,他们说的果然没错!
另一方面,你的医生当然不会去浏览那些不靠谱的替代医学网站。她会仔细研究所有相关文献,并从中得出谨慎而明智的结论…
哈,开个玩笑罢了。实际上,她正在参加一个由制药公司赞助的、在高档餐厅举办的午宴。该公司向她保证,他们绝不会利用这种机会来推销自己的药物,他们纯粹是想让大家了解最新的研究成果。而这项最新研究恰好表明他们的药物效果出众!简直棒极了!你的医生频频点头表示赞同,因为这项研究的作者都是赫赫有名的科学家,而且研究本身的严谨程度和质量看似也无可挑剔。
然而,不难看出制药公司精心挑选了位于钟形曲线「效果极佳」一端的某项研究结果。
我将这种现象称为「提防只看一项研究的人」,但仔细观察那张小图表就会发现,实际上有三四项研究都表明这种药物「效果极佳」。因此,假如你的医生对此表示怀疑,制药公司可以这样回应:「您的谨慎态度很正确,单一研究确实难以令人信服。但请看,这里有另一个研究团队得出了相同的结论,这里还有一个团队也发现了一致的结果,而且这里还有一项重复实验,进一步验证了前两项研究的发现。」
尽管在我们的例子中,那个可信度存疑的替代医学网站似乎只能引用一项「效果极差」的研究,但他们完全可以通过增添一系列仅仅是「效果不佳」的研究来充实论据。或者,他们还可以引入一些研究对象略有差异的相关研究。例如,丙戊酸钠在治疗双相抑郁症方面无效;丙戊酸钠在维持双相障碍治疗方面无效;丙戊酸钠对双相障碍 II 型无效。
因此,人们往往会将研究结果过度简化为「Smith 等人在 1987 年发现该药物无效,但医生们仍在继续开具处方」。即便有人去查阅原始研究(事实上几乎没人会这么做),Smith 等人的论文也不会明确声明:「请注意,本研究仅针对双相障碍的维持治疗,这与双相障碍的急性抗躁狂治疗是两个不同的话题,我们并未对后者发表任何意见。」相反,论文可能只会用类似「在为期六个月、涉及 91 名患者的试验中,丙戊酸钠未能显示出优于安慰剂的效果」这样的标题,并天真地假定阅读的专业人士完全理解急性治疗和维持治疗之间的区别(哈哈哈哈哈)。
因此,我们不应该仅仅「提防只看一项研究的人」,而应该「提防没有全面、客观地审视研究综述就轻易下结论的人」。
二、
我认为医学科学总体上仍然相当健康,在大多数存在争议的医学问题上,医生和研究人员的共识基本是正确的。
(反而是那些看似无争议的问题才更值得我们警惕)
然而,政治领域却缺乏这种保护机制。
让我们以最低工资问题为例吧(别嫌老生常谈)。想必大家都听说过 Krueger 和 Card 在新泽西州进行的那项研究,结果表明提高最低工资并不会对经济造成负面影响。我们可能也听说过一些反对声音,称这项研究已被彻底驳斥,斥之为可耻的、不诚实的统计学术不端。或许有人还知道,Card 和 Krueger 后来发表了一篇颇具说服力的反驳文章,回应了这些质疑。此后,又有一系列规模更大、方法更为先进的研究相继问世。其中,像 Dube 的研究没有发现明显影响,而 [Rubinstein](https://economics.uchicago.edu/workshops/Rubinstein Yona Using Federal Minimum Wages Paper.pdf) 和 Wither 的研究则发现了显著影响。这些仅仅是冰山一角;实际上,支持和反对的研究恐怕多达数十甚至上百项。
那么,我们是不是可以通过元分析和系统综述来解决这个问题呢?
这完全取决于你想要选择哪种观点。你会倾向于那项对 14 个研究进行元分析的结果吗?它指出,人们普遍认为的高最低工资带来的负面影响很可能只是发表偏误导致的。或者,你可能更认同另一项涵盖 64 个研究的元分析?它得出了相似的结论,并在纠正相关问题后发现,最低工资实际上并不产生影响。也许,你会对那项覆盖 55 个国家的元分析更感兴趣?它在大多数研究对象国家中都发现了最低工资的影响。又或者,你更愿意相信那篇系统性综述?它审视了约 100 项研究,发现最低工资确实产生了显著且一致的影响。
我们能信赖各大新闻媒体、智库、经济学博客以及其他机构对这些证据的概括和总结吗?
CNN 声称,85% 的权威研究表明,提高最低工资会导致就业岗位减少。然而,raisetheminimumwage.com 却宣称:「二十年来严谨的经济研究发现,提高最低工资并不会导致工作岗位减少……如今,研究人员和企业都一致认为,大量证据表明,提高最低工资不会减少就业。」Modeled Behavior 表示:「大多数新的最低工资研究都支持最低工资上涨会增加失业率的假说。」预算和政策优先中心则指出:「提高最低工资会减少低收入工人就业机会这一普遍观点,是实证经济学中研究最为广泛的议题之一。大量证据表明,这种影响微乎其微,甚至可以忽略不计。」
那么,经济学家又是如何看待这个问题的呢?毕竟他们是这方面的专家。
事实上,有 500 名经济学家联名给政策制定者写信,声称经济学理论表明提高最低工资是个糟糕的主意。这似乎是一个颇具分量的共识...
然而,有 600 名经济学家联名致信政策制定者,声称经济学研究表明提高最低工资实际上是一个明智之举。(感谢 Greg Mankiw 提供此信息)
那么,让我们对经济学家进行一次正式调查吧。结果如何呢?
raisetheminimumwage.com 这个网站——如果要说有什么最公正的信息来源的话,它应该算一个——信心十足地告诉我们,「一个具有指标性意义的例证是芝加哥大学布斯商学院 2013 年进行的一项调查。在这项调查中,顶尖经济学家以近 4 比 1 的比例认同,提高最低工资并将其与物价指数挂钩,其利大于弊。」
然而,Employment Policies Institute(就业政策研究所)——这个名字听起来像是极力想让人觉得它是个中立的信息来源——却向我们报告说,「超过 73% 的美国经济学会(AEA)劳动经济学家认为,大幅提高最低工资将导致就业岗位减少,68% 认为这些就业损失将对技能最低的劳动者造成不成比例的影响。只有 6% 的经济学家认为提高最低工资是缓解贫困的有效手段。」
由此可见,整个问题复杂得令人困惑。但除非你极其仔细地研究,否则你永远不会意识到这一点。
如果你是一个保守派,你在你信赖的网站上看到的内容可能是这样的:
经济学理论一直表明,提高最低工资会导致失业增加,但左派始终拒绝接受这一基本事实。1992 年,他们大肆宣传 Card 和 Krueger 的一项研究,声称最低工资上涨并不会带来负面影响。然而,这项研究很快就被揭穿,被证实是基于统计学上的不当操作和「数据美化」。此后,数十项研究相继发表,印证了我们一直以来的认知——过高的最低工资无异于经济自杀。系统性综述和元分析 (Neumark 2006, Boockman 2010) 都一致表明,绝大多数研究都支持这一观点——73% 的经济学家也持相同看法。正因如此,近期有 500 位顶尖经济学家联名致信,呼吁政策制定者不要轻信那些已被否定的自由派最低工资理论。与其听信天真的自由派空谈,不如关注实证研究结果和绝大多数经济学家的意见,反对提高最低工资。
如果你是左派人士,你可能会在你信赖的网站上看到这样的内容:
人们曾普遍认为,实行最低工资制度会导致失业率上升。然而,Card 和 Krueger 在 1992 年发表的一项著名研究彻底颠覆了这一传统观念。此后,类似的研究结果已被重复验证超过50次,而进一步的元分析 (Card and Krueger 1995, Dube 2010) 也未发现最低工资对就业有任何负面影响。主流经济学家以 4:1 的压倒性比例认同提高最低工资的益处大于潜在的负面影响,这也是为什么超过 600 位经济学家联名向政府请愿,呼吁提高最低工资。我们不应该听信保守派那些基于早已被驳斥的理论的危言耸听,而应该相信扎实的实证研究结果和绝大多数经济学家的专业判断,支持提高最低工资。
来吧,亲自试试看。在谷歌上搜索这个话题,看看会出现什么样的结果。如果搜索结果与我刚才所说的不太一致,那往往是因为那些文章的学术水平甚至还达不到我所描述的程度。有一半的网站只是简单地引用 Card 和 Krueger 的研究就草草了事了!
这些网站上列举的大量研究和专家观点看起来非常有说服力。但实际上,其中有一半的内容是错误的。
在接受教育的过程中,大多数聪明人通常都会学会不盲目信任权威的论证。假如有人说「相信我关于最低工资的观点吧,因为我看起来很可靠」,他们中的大多数人心里至少会有个声音说:「我应该要求看看具体证据」。如果他们真的很聪明,还会提到「经同行评议的实验研究」这个关键词。
然而,我担心的是,大多数聪明人还没有意识到,即便是一份包含数十项研究、多项元分析、数百位专家意见,以及显示几乎所有学者都支持某个论点的专家调查——仍然可能是胡说八道。
这是非常遗憾的,因为这恰恰是那些想要误导受过教育的听众的人最喜欢使用的手段。
三、
我并不想提倡极端的怀疑主义。
举个例子,在最低工资问题上,我注意到只有一方提供了漏斗图。漏斗图通常用于检测发表偏误,但它还有另一个用途——它几乎完美地呈现了我们前面讨论的「钟形曲线」。
这个分布图虽然更像针状而非钟形,但其核心含义依然成立。我们可以看到,分布以 0 为中心,这表明在纷繁复杂的数据中,确实存在一些真实的信号。曲线略微向左倾斜,意味着发现最低工资负面影响的研究比发现正面影响的更多。然而,由于曲线不对称,我们可以将其解读为很可能存在发表偏误。总的来说,我认为至少有一些证据支持自由派在这个问题上的观点。
当然,除非有人已经看穿了我对这些研究、元分析和专家调查的了解,并找到了操纵漏斗图的方法。这种可能性我可不敢完全排除。
(好吧,我确实有点想宣扬彻底的怀疑主义了)
此外,我还应该指出,这个问题远比简单地判断哪一方正确要复杂得多。最低工资的效果可能会因行业、是州级还是联邦级工资标准、经济是处于衰退还是繁荣期、是从 5 美元提高到 6 美元还是从 20 美元提高到 30 美元等诸多因素而有所不同。图中有 11 项研究显示效果甚至比 -5 还要糟糕,很可能它们对于各自研究的具体问题都是准确的——就像丙戊酸盐这种药物,可能是有效的抗躁狂药,但却是糟糕的抗抑郁药。
(彻底的怀疑主义听起来确实比搞清楚这一切要轻松得多)。
四、
然而,一个问题仍然存在:当你没有像漏斗图这样的系统性证据时(这在大多数情况下都是如此),应该怎么办?
对此,我没有一个令人满意的积极答案。不过,我确实有几个值得参考的消极建议。
首先,如果你不确定自己是否已经全面考察了所有证据,那么对大多数事情都应该持谨慎态度,降低你的确信程度。
其次,不要轻信那些明显带有偏见的网站(比如 Free Republic、Daily Kos 或 Dr. Oz)声称要为你呈现某个问题的「证据全貌」,即使这些证据看起来非常有说服力。对于任何列出「关于 X 的误解与真相」的网站,你的警惕性要加倍;对于使用「某某人用铁一般的事实粉碎了对方关于 Y 的谎言」之类夸张说法的网站,警惕程度要翻两番;而对于 RationalWiki 这类网站,警惕程度则要提高到八倍。
最后,也是最重要的一点:即便有人向你展示了看似无可辩驳的证据来支持某个观点,在你通过简单的谷歌搜索确认反方是否也有同样有力的论据之前,也不要轻易相信。
斗争(Conflict)Vs. 错误(Mistake)
原文:Conflict Vs. Mistake | Slate Star Codex
发表于 2018 年 1 月 24 日 作者:Scott Alexander
Jacobite 杂志——显然是一本真实存在的杂志,而非为了讽刺 Jacobin 杂志而炮制的一次性笑话——对其文章《政府理论研究不足》的概括是:「你永远不会从社会主义者口中听到『委托代理问题』、『寻租』或『激励机制对齐』这些术语。这是因为他们指望意识形态能解决治理实践中的所有问题。」
近来,一些异常古怪且论据不足的社会主义批评针对公共选择理论展开。该文章由此推断,马克思主义者就是不愿意思考如何设计一个良好政府这一棘手的技术问题。这可以解释为什么他们自己的政府往往以失败告终。同时也解释了为什么每当现有政府表现不佳时,马克思主义者总是立即跳到结论,认为一定是有些别有用心的人故意搞砸了一切。
在思考马克思主义者可能如何回应这种批评时,我想到了评论者 no_bear_so_low 提出的「斗争与错误二分法」(这一理论与社会学的三大视角有关)。简而言之:
错误理论者将政治比作科学、工程或医学。在他们眼中,国家就像一个患病的机体。我们都是医生,围在病床前讨论最佳的诊断和治疗方案。有人提出富有洞见的想法,有人则提出可能无效甚至有害的建议。
斗争理论者则将政治视为战争。他们认为,不同利益集团之间存在永恒的斗争,斗争的核心是「国家」应该为「精英」谋利还是为「人民」服务。
错误理论者认为辩论至关重要。他们相信,每个人都能贡献独特的专业知识,当我们全面了解情况后,就能借助集体智慧为我们共同的病人——国家——找到最佳解决方案。对他们来说,在具体问题上谁赢谁输并不重要,关键是要营造一个能让真理长期占据主导地位的环境。
斗争理论者认为辩论的作用微乎其微,充其量只能起到一点澄清的效果。举例来说,你可能会和老板就加薪问题进行「辩论」,但双方都心知肚明,你们天然就站在对立面上。最终谁是「赢家」,与其说取决于客观的道德准则,不如说是由各自握有的权力大小决定的。如果你注意到老板频频搬出客观道德准则来论证,那么他很可能是在为一个对你不利的方案找托词。
错误理论者认为,不同立场之间是对等的。以利率问题为例,一方主张上调,另一方则主张下调。双方的支持者人数大致相当,各自阵营中既有德高望重的专家,也有爱哗众取宠的网络喷子。两边都同样希望促进经济发展。在错误理论者看来,唯一值得关注的差异是(在经过反复核实数据和充分辩论各方观点后)最终哪一方在当前问题上的立场被证明是正确的。
斗争理论者认为,社会群体间的不对称性是首要且最关键的原则。在他们眼中,「精英」虽然人数稀少,却掌握着巨额财富和巨大影响力。与之相对,「人民」虽然人数众多却贫困——但他们拥有不屈的精神和赤诚的心。「精英」的一贯策略是挑起纷争、混淆视听;而「人民」则必须团结一致。在这场政治博弈中,胜负取决于双方如何充分发挥各自的优势。
错误理论者热衷于探讨社会工程带来的复杂而矛盾的效果。你可曾听说,学校里的禁毒教育项目反而增加了吸毒率?你是否知道,许多研究表明提高最低工资实际上损害了穷人的利益?你是否了解,处决罪犯比终身监禁他们花费更多?正是因为这些反直觉的现象,我们不能仅凭直觉制定政策,而是需要大量的研究和讨论,并最终听从科学权威的指导。
斗争理论者认为,这种复杂性论调更多是一个方便的借口,而非真正的问题。他们眼中的现实是:「精英」拥有豪华游艇,而「人民」却流落街头,饥肠辘辘。每当有人提议从「精英」手中抽调一小部分财富来养活「人民」时,总会有「精英」的走狗拿出一份花里胡哨的 PPT,声称这样做实际上会引发黄石超级火山喷发,导致全人类灭绝。这种论调恰好能蒙蔽足够多的「人民」,以至于经济正义永远无法实现,「精英」的游艇越来越豪华,而「人民」依旧在挨饿。
错误理论者认为,提高智力水平就能拯救世界。他们主张培养足智多谋的技术官僚来制定最佳政策;培养高瞻远瞩的政治家来选择合适的技术官僚并有效执行其建议;同时提高选民的判断力,使他们能够识别并选举最优秀的政治家上台。
斗争理论者认为,激发民众的热情就能改变世界。他们认为,富人和权贵之所以能够主导社会,是因为他们已经形成了有效的合作机制;而穷人和弱势群体只有团结一致,勇于为自己发声,才能扭转局面。按照这种观点,理想的社会图景应该是:活动家们孜孜不倦地向公众宣传重要的社会议题,号召大家共同奋斗;社区组织者积极建立工会或青年团体;抗议者随时准备采取行动,一旦发现对手有不轨企图就能迅速应对;选民们积极参与每次投票,并且能够明辨哪些候选人是真正为民请命,哪些只是冒充的「草根代表」。
对于错误理论者而言,单纯的热情是远远不够的,甚至可能产生适得其反的效果。他们认为,持错误观点的人往往能和持正确观点的人一样声音洪亮,有时甚至更加响亮。举个例子,假设两位医生正在讨论一个疑难病例的诊断,这时病人的一位不太理智的姨妈雇人整天在医生办公室门前大喊「这是狼疮!」,这样做显然于事无补。更有甚者,如果一群支持狼疮诊断的抗议者封锁了医院入口,不让任何医护人员进入,直到医生同意将病情诊断为狼疮,这无疑会酿成灾难。错误理论者认为,这种过度的热情所造成的后果,不过是通过施加压力甚至威胁,给原本应该客观理性的辩论和分析过程引入了偏见。
对于斗争理论者而言,智力并非解决问题的灵丹妙药,反而可能引人生疑。无需超凡智慧也能明白,当公司 CEO 年薪高达 900 万美元时,那些在烈日下辛勤劳作 12 小时的贫困农场工人理应获得高于每小时 9 美元的最低工资。真正的「天才」是那些借助 PPT 演示,声称提高工资会引发黄石超级火山爆发的人。
错误理论者坚信,言论自由和公开辩论至关重要,甚至是最为重要的。让我们设想这样一种情况:你的医生建议你使用辉瑞公司的药物,而你后来发现辉瑞公司实际上掌控着这家医院,会解雇开具其他公司药物的医生,当地医学院拒绝教授任何非辉瑞药物的知识,而且所有声称辉瑞药物有副作用的研究都被无情地压制。这无疑是一场荒诞剧,你肯定会尽快离开这家医院,转而寻找一家允许各种观点并存的医院。
斗争理论者对待言论自由和公开辩论的态度,如同 20 世纪 50 年代约翰·伯奇协会成员对待公开进入社区宣传共产主义优点的苏联特工一样。或者就像普通步兵对敌机空投写有「你们必败无疑,现在就投降吧」传单的看法一样。在他们眼中,任何主张让敌人自由传播其思想是件好事的人,极有可能就是敌方的间谍。
错误理论者认为,抱怨乔治·索罗斯或科赫兄弟是毫无意义的。在他们看来,真正重要的是评估论点本身,而不是关注提出这些论点的人。
斗争理论者认为,阻止乔治·索罗斯或科赫兄弟是世界上最重要的事情。有趣的是,他们可能会愤怒地指责我,说我不公平地将他们眼中为「人民」奋斗的正义斗士(如乔治·索罗斯或科赫兄弟)与他们所认为的邪恶自私的顶级「精英」(如科赫兄弟或乔治·索罗斯)相提并论。
错误理论者认为种族主义是一种认知偏见。他们认为,白人种族主义者错误地推断黑人更愚笨或更容易犯罪。错误理论者发现,种族主义的叙事很有用,因为它可以作为一种根本性错误,帮助解释人们为何会做出一些看似难以理解的选择,比如选举唐纳德·特朗普或反对某些特定政策。
斗争理论者认为种族主义是种族间的斗争。在他们看来,白人种族主义者并非受到认知偏见的影响,也没有对任何事情产生误解:这些人准确地认识到白人至上主义让他们处于优势地位,并希望维持这种状态。斗争理论者认为种族主义的叙事很有用,因为它可以解释一些看似矛盾的联盟,例如为什么工人阶级的白人会与富有的白人资本家结盟。
当错误理论者批评民主制度时,是因为它赋予了普通公民过多的权力。在他们看来,普通人往往缺乏足够的智慧,容易做出不明智的决定,比如因为不相信气候变化而反对征收碳税。这些理论家们向往一个由专家治理的技术官僚制度,在这种制度下,学识渊博的专家们可以制定政策,不受选民反复无常情绪的影响。
当斗争理论者批评民主制度时,是因为它没有赋予普通民众足够的权力。他们担忧特殊利益集团可能通过金钱操控选举,或者贿赂民选代表背弃竞选承诺。这些理论家幻想发动一场革命,让自己的阵营崛起,彻底摧毁对方的权力,最终取得胜利。
错误理论者认为革命是愚蠢的。他们认为,即使无产阶级(或所谓的真正爱国的美国人,或其他任何群体)成功夺取了权力,他们仍然要面对与当前相同的政策难题,而且并没有额外的解决方案。在他们看来,共产主义在理论上是站不住脚的,因为它无法为共产主义国家提供有效的政策指导。如果共产主义真的有良好的政策建议,我们现在就可以在不发动革命的情况下进行测试和实施。从这个角度来看,如果卡尔·马克思当初选择成为像伯尼·桑德斯这样的改革派政治家,或许能为世人省去许多麻烦。
斗争理论者认为技术官僚制毫无意义。他们认为,无论什么样的政策方案是正确的,权贵阶层都绝不会允许任何人将其付诸实施。这些掌权者要么会贿赂技术官僚,让他们沦为自己观点的传声筒;要么会阻挠这些建议产生任何实质性影响。唯一的突破口是组织那些无权无势的群体,用强力击败权贵——这样一来,技术官僚制也就变得多余了。如果伯尼·桑德斯能够早点认识到从一开始一切就被操纵得对他不利,他本可以省去许多麻烦,径直化身为卡尔·马克思。
错误理论者自然而然地认为斗争理论者是在犯错。表面上看,他们认为斗争理论者不够聪明,无法领会新的贸易协议其实是惠及所有人的,也看不到摧毁国家机器实际上会引发大规模饥荒和灾难。但更本质的是,错误理论者认为斗争理论者不理解「慈善原则」,也不懂得汉隆剃刀所倡导的「能用愚蠢解释的,就不要归咎于恶意」。在错误理论者眼中,斗争理论者的思维似乎停留在某种原始人的水平,就像是「银河大脑」梗图中的第一格,天真地以为组织暴民、打砸破坏就能解决极其复杂的社会工程问题。错误理论者认为,正确的应对方式是给这些斗争理论者上一堂「哲学入门」课。
(这是一篇体现雅各宾派观点的文章。它指责马克思主义者根本不懂相关理论。文章暗示,学界已有大量关于政府设计的卓越研究成果,但马克思主义者却愚钝到不屑一顾。这种论调让人联想到一位医生尖刻地批评同行:「在你对这个病例妄下结论之前,你是否曾费心研读过英格斯坦关于神经免疫学的最新论文?」)
斗争理论者自然而然地将错误理论者视为他们斗争的对象。表面上看,这些错误理论者可能直接受雇于科赫兄弟、美国企业研究所等机构。但从本质上讲,他们已经沦为一个特权阶层的一份子,这个阶层更热衷于维护自身利益,而非帮助穷人或为全社会谋福利。即便是其中最优秀的人,充其量也只是在试图保持中立,却没有意识到在强权与弱势群体的博弈中,中立立场实际上总是有利于强者。因此,正确的应对之策是彻底压制这些错误理论者。
那么,斗争理论者会如何反驳雅各宾派的观点呢?请花点时间认真思考这个问题。他们的论证是否类似于我现在所写的内容——阐释斗争理论与错误理论的区别,并论证为何斗争理论比错误理论能更准确地描绘现实世界?
不,事实并非如此。Baffler 杂志发表了一篇文章,宣称公共选择理论带有种族主义色彩,并断言任何相信这种理论的人都是白人至上主义者。如果你没有想到这一点,那就说明你还没有真正理解:斗争理论者并不仅仅是持有不同观点的错误理论者。面对你的批评,他们不会礼貌地解释你为何错误来作为回应。
这样说是否有失公允?我不太确定。在尝试理解并以其本身的方式来接触「不要试图理解其他立场并以其本身的方式接触」这一观点时,我们面临着一个元层面的悖论。如果你成功了,反而意味着你失败了;如果你失败了,反而意味着你成功了。我相当确信,将斗争理论「钢人化」为一种友好合作的解释是错误的,比如说我们都需要团结起来,认识到斗争理论客观上是正确的思维方式,然后利用这种洞见来帮助治愈我们共同的病患——国家。
那么,如果这个模型确实具有一定的解释力,我们应该如何运用它呢?
让我们进一步区分简单错误理论者和复杂错误理论者。简单错误理论者认为,我们面临的所有问题都源于极其愚昧的人犯下的极其简单的错误;例如,愚蠢的人否认全球变暖的证据,而聪明的人则不会。相比之下,复杂错误理论者认为,这些问题实际上非常复杂,需要比我们目前所能收集到的更多的证据才能解答——例如,关于最低工资研究的错综复杂的争议就很好地说明了这一点。诚然,有些问题比其他问题更容易解决,但是将问题普遍视为简单或复杂的倾向似乎将人们和思想流派分成了不同的阵营。
(可能简单斗争理论者和复杂斗争理论者之间也存在进一步的区别。简单斗争理论者认为,我们所有的问题都来自于那些如同卡通反派般追求邪恶目标的人;坏人想要屠杀有色人种并掠夺他们的石油,而好人则追求世界和平与包容。复杂斗争理论者则认为,我们的问题源于不同但可以理解的世界观之间的斗争 - 例如,那些希望通过传播现代、高效、平等的工业文明来帮助人们摆脱贫困的人,与那些希望保留传统文化及其所有棘手之处的人之间的矛盾。显然,有些道德斗争比其他斗争更加非黑即白,但同样,某些人似乎比其他人更倾向于使用这些模型中的某一种。)
本博客一直是「复杂错误理论」的重要阵地,但有一个例外:我过去可能过于简单化地看待了斗争理论者们的观点,把他们归类为犯了「简单的错误」。回想起来,我似乎在暗示「我猜你们不懂基本哲学,不知道应该互相善意理解」。现在我意识到这种态度是错误的。我不确定这种态度有多少可以原谅,我很好奇评论区会有多少人认为「这不是显而易见的吗」,又有多少人会说「我从未认真思考过这个问题,可能一直以来我都在误解他人的行为,认为他们无缘无故地表现得很糟糕」。有人之前就指出,这个博客能吸引政治光谱上各种立场的人,唯独缺少马克思主义者。也许这是因为我们尊重除了马克思主义之外的所有立场,而更好地理解斗争理论可能会改变这种状况。我不确定,但这值得一试。
就目前而言,我认为相比斗争理论,错误理论可能是一种更有效的世界观。但显然,这两种理论都可能在某些方面是正确的,而现实往往比任何单一理论都要复杂得多。也许在今后的文章中,我会进一步探讨这个问题,包括规范性与描述性的区别、部落主义在其中的作用,以及「理性选民的神话」等相关话题。总的来说,我对自己的观点不如从前那么确信了,认为这个问题值得被视为一个需要在更具体情境下深入讨论和论证的复杂案例。诚然,「政府中的每个人都是善意的,只需要向他们阐明正确的事实」这种观点在当今看来越发缺乏说服力。至少,如果我想说服他人接受我的立场,我必须切实地去说服他们——而不是采用那些简单化的错误理论支持者惯用的策略,即不断重复「真难以置信,在主的 2018 年,人们居然还相信这种东西」这样的言论。
教育私有化真的会带来灾难吗?
原文:Contra Robinson On Schooling | Slate Star Codex
作者:Scott Alexander 发表于 2016 年 12 月 2 日
一、教育私有化中的利润与效率
Nathan Robinson 对教育券制度提出了质疑:《为何公立学校的大规模削减是一件坏事?》
(请注意,尽管这个标题有点煽动性,但他确实在论证公立学校的大规模削减是一件坏事)
Robinson 首先提出了一个元层面的观点:大多数针对特朗普提名的教育部长 Betsy DeVos 的批评,仅仅局限于指出她将推行教育券制度而非支持公立学校,期望这样就能引起读者的反感。然而,这种批评无法改变 DeVos 支持者的想法,因为他们的核心诉求恰恰就是推广更多的教育券。要想说服他人,就必须拿出真正有说服力的论据。如果你觉得这个见解算不上多么高深,不妨点击链接阅读全文,你可能会发现有什么不同寻常之处。是字体很特别吗?还是屏幕在闪烁?最终你可能会恍然大悟:这竟是你在过去难以计数的日子里,第一次读到一篇逻辑清晰、善意撰写、旨在说服他人的文章。
不过,让我来解释一下为什么我认为 Robinson 的观点是错误的。
Robinson 说:
将营利引入学校系统是极其危险的,理由其实很简单:这会产生一系列极其不良的激励效应。假设我们向营利性私立学校发放教育券,或者给予营利性特许学校大额补助金,这无疑会强烈刺激学校尽可能地减少教育投入。毕竟,营利性公司的根本目标是为股东创造最大价值(而非为学生创造最大价值),因此营利性学校必然会竭尽全力压缩教育支出,以获取最大经济利益。如果不是迫不得已,学校就没有任何动力去购置新的实验设备或更新教材,尽管这些投入能够让学生受益匪浅。
作者也意识到了针对这一观点的反对意见,但对此他并不信服:
私有化的支持者对这一论点有一个颇具说服力的反驳。他们认为,这种观点忽视了问题的全貌。诚然,公司确实有追求股东利益最大化的动机。然而,要想实现这一目标,他们必须满足客户的需求。选择机制的存在恰恰协调了股东和消费者的利益。就学校而言,由于家长手持教育券,如果某所学校不把学生的利益放在首位,家长完全可以选择其他学校。没有人强迫他们将孩子送到特定的学校。学校选择理论的核心就是选择,而选择会带来竞争,竞争则会提升质量。如果一所学校只是将资金输送给高管和股东,而不注重教育质量,那么它很快就会失去生源。
然而,这种选择理论实际上是一种美好的幻想。现实情况是,家长的选择往往很有限(毕竟,在一个家庭可接受的距离范围内,学校的数量是有限的),而且转学可能会给孩子带来巨大的困扰和不适应,对其造成伤害。我们还可以看到,即便从理论上讲,私有化的学校系统很容易演变成一种让富人更富、而让贫困儿童教育状况更加恶化的局面。在公立学校系统中,所有的资金都用于学校教育。而在营利性学校系统中,至少有一部分资金会流入股东的口袋(否则,营利性学校就无法生存)。假设一个学区只有三所营利性小学,它们都只是将大部分教育券资金据为己有,而不是用于教育孩子,那么无论家长如何在这些学校之间「选择」,都无法提高学校的教育质量。有人可能会期待新的经营者进入市场,但如果从孩子身上赚钱的唯一方法就是忽视他们的教育需求,那么新的经营者也不会比旧的更好。
这个观点颇具洞见,但由于未能充分阐述为何这一论点不能推广到其他领域,使得论证的说服力稍显不足。
Robinson 将教育券与食品券进行了类比,后者本质上就是可在杂货店兑换的「食品代金券」。我经常在自己常去的杂货店里看到低收入群体使用食品券,因此我深知他们能够获得怎样的优质服务。不得不说,这种服务相当出色。事实上,几乎所有的杂货店都做得很好。有一个广为流传的鲍里斯·叶利钦轶事:他首次访美时,偶然走进一家普通杂货店,惊讶地发现普通美国中产阶级的商品选择竟比苏联最高级官员还要丰富,这让他震惊不已,甚至怀疑这是美国人精心布置的一个繁荣假象,意在动摇他的信念。杂货店不仅提供五十多种麦片和上百种饮料,价格还十分亲民。仅用一小时的最低工资,你就能购买一天所需的食物;即便想要提高些许品质和多样性,最多也不过花费两小时的工资而已。
那么,为什么我们没有看到杂货店的股东过度榨取利润,导致商品价格虚高和服务质量低劣呢?为什么商店不是脏乱差,鼠患横行?为什么现实中并没有出现 Robinson 所描述的那种情况——选择自由只是一个浪漫的幻想,因为穷人能够获得的所有杂货选择都糟糕透顶,而新的经营者也无法做得更好,因为在杂货行业赚钱的唯一方法就是欺骗顾客,开一家糟糕的商店,卖掺了锯末的大米?
据统计,约有 48% 的美国人对美国的教育系统感到满意。而我猜测,可能有 100% 的美国人对美国的杂货店系统感到满意。为什么会出现这种差异呢?
我的看法是:效率提升带来的收益大于利润损失造成的影响。
利润率是一个具体的数字,你可以直接查到。通常这个数字并不大。一旦你查到了这个数字,你就知道公司究竟赚了多少钱。这样一来,你就把「利润带来的危险」限定在了一个相对较小的范围内。
举个例子:众所周知,这个国家的医保价格过高。有些人认为,这是因为贪婪的保险公司为了赚取利润而收取了过高的费用。
健康保险公司的利润率大约为 3%(见这里的说明。尽管这个数字有一些需要注意的地方,但我认为在本次讨论中 3% 是一个具有相关性的数字)。从绝对金额来看,这无疑是一笔可观的数目。然而,如果我们考虑它对医疗保健成本的实际影响,其实并不如想象中那么显著。让我们用一个具体例子来说明:假设你每年需要支付 5,000 美元的健康保险费用,即使我们完全消除保险公司的盈利因素,你的年度保费也只会降低到 4,850 美元。这种差异甚至不及年度间的正常波动,更不用说其他真正对医疗成本产生重大影响的因素了。
保险公司将部分患者「抛弃街头」的行为,表面上看来似乎冷酷无情,但实际上并非主要出于追求利润的考虑。真正的原因在于,他们能够支付的金额受限于客户缴纳的保费总额,而这些保费往往不足以覆盖所有人所需的医疗费用。换句话说,在被保险公司「抛弃」的人群中,可能只有 3% 是因为利润考虑,而其余 97% 则是由于资金限制而不得不为之的无奈之举。
这种情况并非健康保险行业所独有,在其他常被视为「掠夺性」的行业中也普遍存在,例如发薪日贷款公司。根据维基百科:
Fordham Journal of Corporate & Financial Law 进行的一项盈利能力分析显示,美国七家上市的发薪日贷款公司(包括典当行)的平均利润率为 7.63%,而纯发薪日贷款公司的利润率仅为 3.57%。这些数字低于信用合作社和银行等传统借贷机构的利润率。相比之下,在同一研究期间,星巴克的利润率略高于 9%,而其他可比较的贷款机构平均利润率高达 13.04%。这些可比较的贷款机构都是主流金融公司,包括 Capital One、通用电气金融、汇丰银行、Money Tree 和美国运通信用卡公司。
发薪日贷款公司收取高额利息,并非为了从中牟取暴利。实际上,他们这么做是因为向经常无力偿还贷款的贫困人群提供贷款,本身就是一项难以保证收支平衡的业务。
现在,让我们将这种逻辑应用到私立学校上。你是否认为私立学校会通过不断增加利润来破坏教育质量?我的观点是,私立学校的资金中大约 11% 会用于盈利,这与目前私立学校的情况相同。实际上,这个比例可能更低,因为当前的大多数私立学校主要服务于富裕群体,这些人只要能获得声望,就不在乎过高的收费。
然而,11% 的利润难道不比零利润要好吗?假如私立学校的开支与公立学校相当,但其中 11% 用于股东分红,这是否意味着我们的孩子将接受质量打了九折的教育呢?
换个角度来看,这占教育预算 11% 的资金究竟为我们带来了什么?
理想情况下,我们期望它能为我们带来效率的提升。
Robinson 写到:
让我们来探讨保守派关于学校教育的核心论点。他们的观点是这样的:政府管理的机构通常效率低下。与企业不同,这些机构缺乏提高表现的动力。企业在市场竞争中必须提供最佳产品以保持盈利,而政府可以提供劣质服务,因为它们是国家强制的垄断体,消费者别无选择。引入学校选择制度将改善教育质量,因为它让家长有权选择心仪的学校,而不是被迫接受政府指定的学校。学校将不得不努力提高质量,否则家长可能会将孩子转到其他学校。将盈利动机引入学校教育领域,能为学校提供强大的改进动力。如果办好学校能带来可观利润,企业必然会积极投身于创办优质学校。因此,通过教育券资助的私立营利性学校,是提供高质量教育的一种高效方式。
他反驳道:「将利润因素引入学校系统是极其危险的」,但却并未真正否定上述观点的正确性。因此,我们实际上面临的是一个权衡问题。一方面是利润带来的潜在风险,另一方面是效率提升的前景。如果利润不会从教育系统中抽走过多资金,那么效率的提升是否值得这小小的代价?
下面是 Cato 研究所提供的一张图表——请注意,这些数据已经经过通货膨胀调整:
如果你对 Cato 研究所的数据持怀疑态度,这里有 Politifact(一个著名的事实核查网站)对类似说法的评估,认为基本属实,尽管他们的具体数字因统计方式不同略有差异。
我们该如何看待这一现象呢?显然,这并非由于教师薪酬的增加——在这段时期内,他们的工资实际上一直停滞不前,与其他职业相比,他们的经济地位甚至可能有所下降。这也不是因为学校建筑成本的上涨——尽管我没有学校的具体数据,但我研究过摩天大楼的情况,发现建筑价格并没有普遍上涨趋势。那么,一项本质上只是将一群学生集中在一栋建筑里,并安排教师进行教学的活动,为何会在教师薪酬和建筑成本基本不变的情况下,其成本却如此显著地攀升?对此,我只听说过三种理论:
第一种理论认为,学生的考试成绩实际上在不断提高,但我们可能陷入了辛普森悖论。这个悖论的表现是:尽管每个种族群体的学生成绩都在提升,某些种族群体的学生成绩甚至高于其他群体,但由于成绩较低的种族群体学生比例增加,导致整体平均分呈现下降趋势。然而,具体到各个种族的成绩数据,我们发现它们也呈现停滞状态(1,2)。唯一的例外可能是黑人学生在 1980 年到 1990 年间的成绩跃升。考虑到其他族裔并没有出现类似的跃升,而学校教育支出一直在稳步增加,我更倾向于认为这种变化主要源于社会经济因素,而非教育投入的影响。
第二种理论认为,这些额外的教育经费主要用于帮助此前未得到充分关注的特殊教育需求学生。然而,教育这类学生的成本大约是普通学生的两倍。据统计,特殊教育需求学生占总人数的比例高达 13%,尽管我们不确定这里的「特殊需求」定义是否与计算成本时使用的定义完全一致。即便我们采用这个估算,为特殊需求学生提供额外服务也只能解释教育成本上涨 13%,远不及我们实际观察到的 150% 的涨幅。
第三种理论源于王尔德定律:「官僚机构会持续膨胀,以满足膨胀的官僚机构的需要。」
支持这一观点的一个有力论据是:我们在基础教育领域观察到的现象,同样也在高等教育领域上演。经通货膨胀调整后,如今大学教育的成本约为 1980 年的 4 倍。
这种学费上涨并非源于政府减少了补贴。这些钱也没有流入股东的腰包——要知道,大多数大学都是非营利机构,就连公立院校的学费也出现了大幅增长。虽然我手头没有类似小学阶段标准化考试成绩停滞不前的数据,但如今的大学生似乎并没有比他们的前辈们多接受四倍的教育。那么,这些飞涨的学费到底花在了哪里?
我想没有人能对此给出一个确切的答案。已经有专门针对这个问题的研究了。人们时不时就会在报纸的评论版上就此展开激烈的讨论。有人认为是「行政管理」费用的增加导致的,也有人说不完全是行政管理,而是其他因素在起作用。我也说不清楚具体原因。但有一点可以肯定,这现象似乎既不是辛普森悖论,也不是由特殊需求学生引起的。
许多专家认为,学生贷款越来越容易获得推动了大学成本的上涨——比如可以参考这篇文章。这种理论认为,大学能够收取更多的钱,所以它们就这么做了。老实说,我不太理解这在经济学上是如何运作的,但似乎是容易获得的学生贷款,再加上缺乏真正的竞争压力,导致大学扩大了行政管理规模,并将成本转嫁给了学生。也许在小学教育领域也发生了类似的情况?
如果小学教育成本上涨的第三种假设成立,那么我们只需将官僚体制恢复到 1970 年的水平,就能在保持考试成绩基本不变的同时削减 75% 的成本。或者,我们可以维持现有的开支水平,但将资金投入到真正有效的教育项目中。
问题的关键在于,私立学校的资金中有 11% 用于股东利润,而公立学校则显然有 75% 的资金流向了…呃,没人真正知道去了哪里。
私立学校是否也像公立学校一样,将 75% 的资金用于不明去向?我不确定,因为我没有看到多少像 1980 年那样便宜的私立学校。Arnold Kling 的一些计算结果显示,私立学校应该有很高的利润率。但现实似乎并非如此。坦白说,这个问题让我感到困惑。尽管如此,相比公立学校,我还是对私立学校能够解决这个问题抱有更大的希望。「编辑:请参见文章底部注释」
单纯关注成本可能看起来有些冷酷无情。但事实是,在教育成果没有任何改善的情况下,公立学校预算的增加金额足以为国内每一个无家可归的人提供舒适的住所。金钱确实至关重要。当我们批评私立学校过分追求利润时,本质上也是在讨论金钱问题。这意味着,每一美元流向股东,就意味着少了一美元用于改善教育、解决无家可归问题或其他有益的事业。
Robinson 写到:
究其根源,即便将穷人所需的服务做到极致,也难以成为利润丰厚的生意。一旦引入逐利的动机,必然会导致对穷人的剥削和忽视,因为他们的「选择」已被现实处境所严重制约。我之所以担忧私有化,并非出于对政府低效的盲目崇拜,而是害怕「教育」这一崇高理念被逐渐侵蚀。教育本不该是一桩双赢的交易,我们之所以给予孩子教育,是因为这是他们应得的权利,而非我们可以从中牟利的工具。我担心那些将一切都「视为生意」来经营的人,可能并不真正关心孩子的福祉,反而会被错误的动机所驱使。我更忧虑的是,一旦他们面临在「做正确的事」和「做有利可图的事」之间作出抉择时,会做出怎样的决定。
恕我直言,我认为这种思维方式中确实存在一些难以捉摸的东西,仿佛有一个需要用铃铛、蜡烛和公共选择理论教科书来驱除的幽灵。实际上,并不存在一个叫做「系统」的实体,在商业领域专注于利润,在公共服务领域专注于教育。真实情况是,有一群人,他们的行为受到道德、激励机制以及保住工作等多重因素的驱使。商业并非与关怀对立——举例来说,普通的家庭医生虽然经营着小型诊所,但主要还是被帮助病人的愿望所驱动。同样,缺乏盈利动机也并不能保证良好行为——我们看到一些非营利性大学的管理者选择将意外所得用于提升声望和扩张规模,而不是降低成本。
对于这一观点,我并没有十分把握。我认识很多从事教育工作的人,他们都是非常优秀且富有激情的人,绝对不会中饱私囊,拿走 75% 的资金为自己购买豪华游艇。在我的家乡加利福尼亚州,十年前曾出现严重的资金短缺,学校试图削减一切可以削减的开支,最后他们表示已无可削减之处,也没有其他办法了。我相信他们确实尽了最大努力。如果官僚主义确实在推高学校教育的成本,它往往是隐晦的,你很难准确指出哪个具体部门应该为此负责。
然而,造成这种情况的可能是一种普遍存在的低效率文化,导致许多小问题累积成大问题——我知道在医保领域就是如此。我认为,至少值得进行这样的尝试。
(我意识到这种尝试已经在进行中,并且在不同的具体情况下会产生截然不同的结果。我打算近期深入研究这方面的文献,看看是否存在任何一致的趋势。)
二、医疗领域的情况
为了进一步论证我的观点,即有时提高效率可以弥补因追求利润而减少的资金投入,我想岔开话题谈谈医院的情况。
医院大致可以平均分为营利性和非营利性两类机构。评估「医院质量」比评估学校质量还要困难,但研究人员在各种指标上进行了尝试。虽然很难对结果进行全面总结,而且我只找到了少数几项研究,没有看到任何权威学者对这一领域的全面概述,但目前看来,营利性和非营利性私立医院之间的差异很小,而政府医院的表现最差:
— 哈佛大学的一个研究团队发现,营利性和非营利性医院的质量大致相当,而政府所有的医院则比这两类医院都差。同一团队的后续研究表明,非营利医院转变为营利性医院与医疗质量下降并无关联。
— Truven Health Analytics 的研究发现,教会所有的非营利医院在某些方面表现最为优异,其次是非教会的非营利医院和营利性医院,而政府所有的医院整体表现最差。需要说明的是,这是我根据大量不同数据所做的个人解读,读者可以查阅他们使用的具体评估指标,自行得出结论。
— 一本专门研究医院行业的教科书指出:「总的来说,即使在考虑了系统性差异后,非营利医院在治疗老年心脏病患者方面的表现似乎略优于营利性医院。然而,这种微小的平均差异掩盖了一个重要事实:无论是营利还是非营利医院群体,其内部的医疗质量都存在巨大差异。」
— 一项发表在心脏病学权威期刊上的研究表明,没有证据支持以下观点:相比非营利医疗机构,营利性医院会倾向于选择性地接收病情较轻的患者、提供较少的循证医疗服务、限制患者的住院时间,或导致患者在急性期的治疗结果更差。
— 根据《卫生经济学手册》:
迄今为止,最为严谨且规模最大的实证研究,旨在比较不同所有制医院的服务质量,是由 Keeler 及其团队于 1992 年完成的。他们审查了来自五个州的五种疾病共 14,000 份医疗记录,采用了两种过程性质量评估方法。第一种称为「明确过程评估」,主要考察医疗记录中是否体现出特定的诊断和治疗程序被专业地执行。第二种称为「隐含过程评估」,则着眼于整体护理过程的评估,而非像「明确过程」那样聚焦于具体的护理细节。例如,研究者会向医生审阅员提出这样的问题:「基于你目前对这个病例的了解,你会选择将自己的母亲送到这家医院就医吗?」此外,他们还采用了一项结果指标来衡量医疗质量——比较实际死亡率与基于患者特征预期的死亡率之间的差异。
研究结果显示,在超额死亡率和明确过程这两个指标上,私立非营利医院和营利性医院之间并无显著差异;而公立医院在这两项标准上的表现则相对较差。然而,在第三个指标——隐含过程评估上,私立非营利医院与其他两种所有制类型的医院在护理质量方面存在统计学上的显著差异,结果表明营利性医院在这一方面的质量水平更高。尽管出现了这一差异,研究者似乎更倾向于根据前两个指标得出结论。他们总结道:「总的来说,非营利和营利医院提供的医疗质量水平相似。」
Shortell 和 Hughes 在 1983-84 年开展的一项覆盖全美 981 家医院的研究发现,从死亡率这一医疗质量指标看,不同所有制的医院之间并无显著差异。但 Hartz 等学者后续采用较少协变量进行分析时则得出不同结论:营利性医院的病人死亡率高于私立非营利性医院。
Sloan 等人 (1998a,1998b, 1998c) 则考察了老年患者因髋关节骨折、中风、冠心病和充血性心力衰竭首次住院治疗后的康复情况。他们特意选取急性发病初次入院的病例,因为这类突发疾病的患者不太可能事先对医院进行比较和选择。研究评估的预后指标包括生存状况、身体机能、认知能力和生活方式(即入住养老院的可能性)。结果显示,尽管部分指标表明大型教学医院的患者恢复情况更佳,与 Keeler 等人 (1992) 的结论一致,但非教学性私立非营利医院与盈利性医院患者的预后并无统计学差异。而控制其他因素后,入住公立非教学医院的高龄患者的某些康复指标则明显更差。
因此,看起来营利性医院和非营利性医院在运营效果上的差异并不显著,而政府医院的表现可能比这两类医院都要差。这个结果可能会让两种持有极端观点的人感到困惑:一种是认为追求利润必然会产生破坏性影响的人,另一种是认为追求利润必然会带来更优质服务的人。
在此,有必要澄清一个事实,这可能与 Current Affairs 这篇文章给读者的印象不同:实际上只有 13% 的特许学校是营利性质的。因此,一个包含教育券和特许学校的教育体系,很可能更接近于私立非营利医院的模式。而研究表明,私立非营利医院不仅表现良好,而且明显优于政府运营的医院。然而,我不得不承认,到目前为止我所讨论的这些内容可能都不太切题。也许我应该一开始就指出这一点。
三、代金券还是公共服务?
同一篇文章还提到:
公立学校体系面临的「空心化」威胁还存在其他严重问题。正如我们此前在 Current Affairs 杂志中所论述,将公立学校转变为代金券系统会使教育运作方式与食品券计划极为相似。实际上,SNAP(补充营养援助计划)福利就是采用这种模式:我们不是直接提供食物,而是给予等值的资金,让受益人自行购买食品。同理,教育券计划也是如此:不是直接提供学校教育,而是发放代金券,让家长们自行选择私立学校。然而,食品券计划的现状值得警惕:一旦开始发放「代金券」,保守派就倾向于将其视为某种不劳而获的「施舍」。随之而来的就是削减这种「施舍」的压力。我们有理由相信,「教育券」所面临的削减压力会比食品券更小吗?代金券计划的一个严重隐患在于,它可能侵蚀教育作为基本权利的理念,反而使其沦为一种不必然应得的特权。但是,教育理应是一项基本权利,因为孩子们无法选择自己的出生环境,因此不应该因父母的经济状况而受到不公平对待。
我认为,从教育相较于食品券的受欢迎程度中得出这样的结论是有失偏颇的。Robinson 认为保守派偏好一刀切的援助,而不喜欢代金券式的施助。我认为保守派更倾向于支持普惠性的援助,而非专门针对贫困人群的援助。
设想这样一个场景:食品券被联邦食品署取代。每周,一辆卡车会来到贫困家庭,发放政府认为能满足其营养需求的统一食品包。你认为保守派会比现行的食品券制度更满意吗?同理,保守派对公共住房项目的支持度,真的比他们如今对住房券的支持度有显著差异吗?
反观医保,尽管其本质上是一种代金券制度,却一直广受欢迎。参保者可以自由选择医生和医院,然后由医保支付费用。由于人人都期望将来能从中受益,这项制度获得了广泛的两党支持;即便是批评者,大多也只是主张改革而非废除。
我认为,公共教育从服务模式到代金券模式的转变不会改变人们对它的支持态度。
四、我对教育券的担忧
因此,我不赞同 Robinson 的具体论点。然而,教育券制度确实存在一些令我担忧的方面。
首先,关于医院的案例研究结果并不十分明确。虽然营利性医院的表现并未明显逊于非营利性医院,但也未显示出明显优势。更值得注意的是,营利性医院的引入并未如人们期待的那样,引发一种良性循环——即所有医院为了节省成本和提供更优质服务而展开竞争,最终使医疗机构变得精简高效、价格亲民,并像杂货店一样随处可及。事实上,一个行业对竞争开放并不必然意味着它就能避免价格虚高和效率低下的问题。评论者还指出了一个值得关注的现象:现有的私立学校通常并不比公立学校便宜 75%,这表明在教育领域大幅削减成本是一项极具挑战性的任务。
其次,Robinson 进一步指出:
私有化方案的成功在很大程度上依赖于存在一群极其精明的家长,他们有充足的时间和强烈的意愿去仔细研究各个学校。然而,最弱势的儿童往往难以拥有这样的父母。我们可以设想这样一种情况:为了吸引生源,私立学校从教育券中抽出 100 美元作为诱饵,只要家长同意让孩子入学就可以得到这笔钱。那些生活困顿或对子女教育漠不关心的父母可能会为了这笔快钱而仓促做出决定,结果最需要帮助的孩子反而可能落入最恶劣、最不负责任、最唯利是图的学校之手。
虽然我认为不太可能出现如此赤裸裸的回扣行为——这不仅是非法的,而且在食品券等其他代金券项目中也未曾发生过——但他指出许多家长要么无知,要么别有用心,这一点确实值得重视。即便没有明目张胆的贿赂,一些学校也可能凭借花哨的广告宣传而非优质的教育来吸引家长。正如人们往往不会去查询当地医院的医疗评级一样,家长们可能也不会去核实一所听起来不错的学校的实际成绩。最令人担忧的是,一些与邪教或极端政治思想有关的学校可能会趁机而入,利用那些真正狂热或容易被操纵的家长,从而坑害他们的孩子。
第三,特朗普主义的核心理念是,通过减少移民,我们可以创造一个文化上更加凝聚的社区,让所有人都认同某些核心价值观。然而,学校系统——尽管存在分散和多样化的问题——实际上是为数不多的能够向所有人灌输基本公民价值观,并确保大家有共同认知的机构之一。我担心人们可能会开始将孩子送到专门教授自由主义或保守主义价值观的学校,这样一来,原本就不太有效的防止社会进一步极化的机制之一就会被废除。不过,从另一个角度来看,天主教学校在某种程度上已经是这样的模式了,但它们似乎并没有成为政治体系中的某种异常存在,所以这个问题可能并没有那么严重?
第四,教育券制度可能会加剧阶级隔离。尽管这种影响可能不会太严重,因为目前人们已经在各自社会阶层集中的社区中就读公立学校,但至少现在还保留着一点的社会经济多样性。然而,引入代金券制度可能会导致有意识的分层/信号传递。例如,如果每个人都获得 10,000 美元的教育券,一些优质学校可能会故意将学费定为 15,000 美元,仅仅是为了出售一个「特权」——就读于没有贫困学生的学校。这种现象类似于人们愿意为封闭社区的房子支付更高的价格,因为他们担心低收入群体成为糟糕的邻居。同样,他们可能会为更昂贵的学校支付额外费用,因为他们担心来自贫困家庭的学生可能会对学习环境产生负面影响。即使只是少量的隔离也会产生深远影响,因为一旦有足够多的人这样做,那些恰好收费 10,000 美元的学校就只会招收贫困学生,这与少量种族隔离也会产生广泛影响的情况相似。
(我对目前提议的代金券制度了解不多,但我在思考,是否可以设计一种制度,禁止将代金券与个人资金相结合使用。换句话说,如果你获得了 10,000 美元的代金券,你只能就读收费 10,000 美元的学校。但如果你想就读收费 11,000 美元的学校,你就必须完全放弃代金券,全额自费。)
在权衡教育券制度的诸多不利因素时,我们不得不认真考虑一个极其重要的优势——它消除了家庭为了进入「优质学区」而在住房上过度投资或选择隔离居住的动机。Elizabeth Warren 曾指出,这种动机是过去 50 年来房地产价格持续上涨的主要原因,而房价上涨又严重削弱了中产阶级的经济实力。这一因素的影响可能远超其他所有因素的总和,即便教育券制度可能在某种程度上降低教育质量,它仍可能成为一个净利好。
关于教育券制度,我的观点与我对这类问题的一贯态度一致:让我们通过实验来探索。我们应该确定一个可接受的、可逆转的、风险相对较低的可能性范围,让不同的州和地区尝试不同的方案。随着我们对这一制度的理解逐步加深,我们可以在合适的方向上扩大可能性的范围。然后检查结果,总结经验,反复尝试,最终找到最佳方案。
五、教育领域的竞争不足
最后,文章中还有一个值得我们深入探讨的观点:
假设有一个学区,只由三所营利性小学构成。如果这些学校只顾着将大部分教育券资金据为己有,而不认真履行教育职责,那么无论家长如何在这些学校之间「选择」,都无法提升教育质量。有人可能会期待新的办学者进入市场,但如果唯一能从孩子们身上获利的方式就是忽视他们的教育需求,那么新进入者也不会比现有学校强到哪里去。
这个问题之所以重要,是因为缺乏良性竞争确实是此类行业的通病。经济理论预测,在完全竞争的环境下,企业的表现会相当不错。但在这种只有三所学校、竞争不足的小型学区中,理论就难以自信地做出预测了。
在现实中,需要通过实证研究来确定这个问题的严重程度。而在我的理想世界里,我有一个解决方案(新任教育部长可能不会赞同):让我们允许普通民众开办微型学校。
约有 3% 的父母选择为子女提供家庭学校。这种教育方式跨越阶级和种族的程度,比人们想象的更为普遍。研究结果一致显示,接受在家上学的学生在标准化考试、大学入学考试、大学平均绩点(GPA)以及成年后的整体生活满意度方面,都明显优于接受传统学校教育的学生。然而,这种比较可能存在偏差,因为选择在家上学的往往是一些深思熟虑、富有责任感的父母,他们的孩子可能在基因上就具有显著优势。尽管如此,目前还没有任何证据表明在家上学会对学生的发展产生负面影响。
在美国,每名学生的年均教育成本约为 10,000 美元。假设我们为每个学生提供价值 10,000 美元的教育券。如果一位家长希望赚取美国年收入中位数 30,000 美元,理论上需要教育三名学生。但考虑到实际运营中的管理开销和课程材料费用,可能需要教育五名学生才能达到这个收入水平。
设想这样一种教育模式:一位母亲在生育后决定不再重返职场,也不愿将孩子托付给日托中心 18 年。她通过一系列考试和监管程序,承诺确保孩子在标准化考试中达到特定水平,从而获得正式的办学资格。随后,她邀请几位信任她的朋友和邻居将孩子送来就读。如果她的丈夫在外工作,维持家庭收入,她甚至不需要招收太多学生。两三个孩子就足够了(需要强调的是,不应允许通过教育自己的孩子来牟利;否则,这将激励父母不让孩子上学,假装自己在教育他们)。这样,她就可以在一个比公立学校小得多的班级里进行个性化教学。
如果你是一位合格的专业教师,你可能会吸引到十到二十个学生。这意味着你可以赚取 10 万到 20 万美元的收入,扣除开支后,仍远高于当前合格教师的薪资,而且班级规模更小,教学质量更有保障。值得回顾的是,在美国历史的大部分时期,孩子们都是在社区成员经营的单间校舍里接受教育的。正是这种教育系统培养了本杰明·富兰克林和托马斯·爱迪生等杰出人物。
(另外,值得注意的是,所有研究都表明正规的教师培训和教师资格认证对教学质量实际上并没有显著影响。)
这种教育方式将为数百万人创造一种自主经营、不依赖雇主的收入来源,其中包括缺乏正规资格认证的贫困群体、行动不便的残疾人士、偏远地区居民,尤其是年轻的母亲们。它不仅能重新构建社区纽带,还能确保人们不再为学区内仅有少数几所学校的有限选择而忧虑。
诚然,这个构想可能存在我尚未察觉的重大缺陷。但我仍然认为,这个案例的启示在于我们应该开展更多的教育创新实验。而推行教育券制度或许是一个良好的起点。
编辑补充:以下是来自评论区的反馈:「在我们这所独立的非营利高中,我们已经将每名学生的年均成本降至 3000 美元。尽管预算有限,我们依然能为学生提供许多公立学校无法企及的机会。例如,我们开设玻璃吹制、铜银锻造等艺术课程,有机化学和生物化学等高级科学课程,远超州标准的全面健康教育,以及由学生自主营造的欺凌零容忍的校园文化等等,不胜枚举。相比之下,周边学区高中生的年均成本高达 17,000 美元,却只能提供我们所提供服务的一小部分。」
我能宽容一切,除了外群体
原文:I Can Tolerate Anything Except The Outgroup | Slate Star Codex
作者:Scott Alexander 发表于 2014 年 9 月 30 日
[内容提醒:本文涉及政治、宗教、社会正义等话题,并含有《布朗神父的秘密》一书的剧透。文中观点并非本人独创,仅是对我从他人那里听到的想法的阐释和重新表述。因个人知识局限,文章难免带有美国中心视角。请勿将本文转发至 Reddit 等类似平台。]
一、
在 Chesterton 的《布朗神父的秘密》中,一位备受爱戴的贵族因三十年前在决斗中杀死自己不成器的兄弟而内疚不已,回到了故乡。镇上的居民迫不及待地想要宽恕他,还嘲笑书中的神父只愿在忏悔和自省的基础上给予有限度的宽恕。他们向神父传授慈善和同情的美德。
然而,后来真相大白:这位备受爱戴的贵族实际上并未杀害他那不成器的兄弟。恰恰相反,是那个不成器的兄弟杀死了这位贵族,并冒充了他的身份。此时,镇民们却态度大变,要求将他处以私刑或活活烧死。唯有那位神父始终如一,坚持在忏悔和自省的基础上给予有限度的宽恕。
神父对他们说:
在我看来,你似乎只愿意宽恕那些你并不真正视为罪过的行为。你只会宽恕那些在你眼中并非真正犯罪,而只是违反常规的人。你会宽恕一场约定俗成的决斗,就像你会宽恕一桩司空见惯的离婚一样。你之所以宽恕,不过是因为你认为根本无需宽恕。
他进一步阐述道,正是这种心态使得镇上的居民能够自以为是地认为自己比他更富有同情心和宽恕精神。然而,真正的宽恕——那种牧师必须努力培养以宽恕作恶者的宽恕——是极其艰难的。相比之下,镇上居民用来宽恕他们喜欢的人的那种虚假宽恕则轻而易举,这使他们不仅可以夸耀自己宽容的天性,还能自诩比那些认为宽恕困难且坚持要求忏悔的刻薄老牧师们高尚得多。
经过深入思考,我赞同 Chesterton 的观点。在现实生活中,许多人说「我宽恕你」时,实际上只是想表达「没什么大不了的」;同样,当人们说「这是不可宽恕的」时,往往仅仅意味着「这确实很糟糕」。关于原谅是否正确这个问题,涉及的层面很广,我不打算在此详细讨论。然而,鉴于宽恕普遍被视为一种美德,而且很多人都希望因具备这种美德而得到认可,我认为可以这样说:只有当你能够宽恕那些确实对你造成伤害的事情时,你才真正有资格称自己是「宽宏大量的」。
让我们借用 Chesterton 的例子来阐释:如果你认为离婚完全可以接受,那么你就没有立场去「宽恕」他人的离婚行为,你充其量只是对此不以为意。只有那些认为离婚是可憎恶的人,才能真正「宽恕」离婚。同理,你可以宽恕偷窃、谋杀、逃税,或者任何你认为可憎的行为。
从功利主义的角度来看,不因他人离异而对其苛责确实是正确之举,这无可厚非。你当然可以为此获得所有你想要的「功利分数」。但我想强调的是,如果你「宽恕」的是你本就不在意的事,那么这种「宽恕」并不能为你赢得任何「美德分数」。
(举个例子:一位亿万富翁和一位贫困的退休老人各自向慈善机构捐赠 100 美元,从功利主义角度看,他们获得的「功利分数」相同,但后者无疑赢得了更多的「美德分数」)
宽容同样被视为一种美德,但它也面临着与宽恕相似的期望降低问题。
皇帝召见菩提达摩,自豪地宣称:「大师,我已经宽容了无数的同性恋者、女同性恋者、双性恋者、无性恋者、黑人、西班牙裔、亚洲人、跨性别者和犹太人。请问我因这些功德行为获得了多少美德分数?」
菩提达摩答道:「一分也没有。」
皇帝顿时不悦,追问其中缘由。
菩提达摩问道:「那么,你如何看待同性恋者?」
皇帝立即回应:「你把我当成什么人了?某种恐同的偏执狂吗?我对同性恋者当然没有丝毫偏见!」
菩提达摩答道:「这样的话,你仅仅宽容他们并不能获得任何功德!」
二、
若要我给「宽容」下个定义,大概会是「对外群体持有尊重和善意的态度」。
然而,当今社会却出现了一种几乎前所未有的情况。
我们看到许多人——就像那位皇帝一样——自诩能够宽容他们所能想象到的任何外群体中的每一个成员,对外群体倾注热爱之情,洋洋洒洒地写下长篇文章歌颂外群体的伟大,甚至彻夜难眠,只因担心他人可能不够喜爱外群体。
这是一个令人震惊的现象。它彻底颠覆了我们迄今为止对人类心理学的所有认知。这并非源于任何基因工程,也不是因为有人在公立学校散发了什么神奇药丸。然而,我们突然发现一群人公开推崇和维护与自己不同的群体,而且这些群体与他们越是不同,就越受到他们的青睐。
这究竟是怎么回事?
让我们先来探讨一下什么才算是真正的「外群体」。
假设皇帝是异性恋,那么同性恋者属于他的「外群体」——即他不属于的群体,这种说法听起来很平淡无奇。但如果皇帝有卷发,那直发的人就是他的外群体吗?如果皇帝的名字以字母『A』开头,那名字以『B』开头的人就是他的外群体吗?
显然不是。我认为「外群体」这个概念有多层含义,其中一层是「你不属于的群体」,而另一层则是……某种更深层次的含义。
我想避免陷入一个常见的误区,那就是简单地认为外群体的形成仅仅基于群体间的差异程度或敌意程度。我认为这种观点并不完全准确。
让我们比较一下纳粹对德国犹太人和日本人的态度。纳粹与德国犹太人在表面上极为相似:他们外貌相近,使用同一种语言,有着相似的文化背景。而纳粹与日本人则存在巨大差异:种族不同,语言不同,文化鸿沟巨大。然而,纳粹和日本人的关系却相当融洽。有趣的是,即便严格来说,他们之间处于交战状态,纳粹对中国人的态度也相对友好。与此形成鲜明对比的是,纳粹与德国犹太人之间的冲突——其中有些犹太人在查看祖父母的出生证明之前,甚至不知道自己不仅仅是德国人——却成为了历史上的噩梦。任何简单地假设纳粹的天然外群体是日本人或中国人的理论,都将无法充分解释这种复杂的现象。
这种现象并非特例,而是普遍存在的。弗洛伊德提出了对小区别的自恋理论,他指出:「恰恰是那些地域相邻、在其他方面也有密切联系的群体,往往会陷入持续的争斗和相互嘲讽中。」历史上的诸多冲突都印证了这一点:纳粹与德国犹太人、北爱尔兰新教徒与天主教徒、卢旺达的胡图族与图西族、南非白人与黑人、以色列犹太人与阿拉伯人,以及前南斯拉夫地区各民族之间的矛盾。
那么,是什么因素导致了外群体的形成?答案是:地理邻近性加上细微差异。如果你想了解前南斯拉夫地区的某个人最敌视谁,不要去关注远在天边的印度尼西亚人、南非祖鲁人、藏族人或其他遥远的异族。相反,你应该寻找与他们紧密相连、生活方式极为相似的南斯拉夫族裔。很可能,你会发现正是这个群体,他们对其怀有长达八百年之久的刻骨仇恨。
是什么让原本互不相干的群体突然成为「内群体」?对德国人和日本人而言,答案显而易见——战略同盟。事实上,两次世界大战缔造了许多出人意料的短暂「伪友谊」。War Nerd 最近的一篇文章指出,英国人在花费数个世纪征服和蔑视爱尔兰人和锡克教徒后,却在第一次和第二次世界大战期间突然需要他们参军。曾经的「将他们踩在脚下」迅速变成了阿谀奉承的歌曲,歌颂「三叶草生长的地方从未出过懦夫」,以及对锡克教徒军事才能的无尽赞美。
诚然,稍加剖析这些溢美之词,你就会发现根深蒂固的轻蔑之情依旧如故。然而,英国人对爱尔兰人长达八个世纪的种族屠杀和视其为低等生物的态度,在爱尔兰人被视为更大规模冲突中的有用炮灰时,却转变成了对三叶草的颂扬和歌咏。同样,锡克教徒——这些深肤色、头戴头巾、蓄着胡须的人,几乎完美契合欧洲人对「可怕外国人」的刻板印象——却赢得了从新闻媒体到温斯顿·丘吉尔等各界人士的赞誉。
换言之,外群体可能是那些与你外貌几乎一模一样的人,而那些看似可怕的异族,在某些时候,可能转眼间就成为了内群体成员。
三、
某些暗物质理论推测,暗物质几乎完全不与我们熟知的物质世界产生相互作用。按照这种理论,即使存在一个与地球完全重叠的暗物质行星,我们也将浑然不觉。也许此刻就有暗物质人在我们周围来回走动,甚至穿越我们的身体;也许我的房子恰好坐落在某个庞大暗物质都市的时代广场中心;也许就在离我几米远的地方,一位暗物质博主正在他的暗物质电脑上写文,思考着如果他身边有个他看不见的普通物质人会是多么奇怪。
这种感觉,与我对保守派的认知颇为相似。
我说的可不是那些整天抱怨政府规模过大、偶尔给 Romney 投票的温和保守派。这种人我随处可见。我指的是——好吧,就拿神创论者来说吧。根据 Gallup 民意调查,约 46% 的美国人信奉神创论。请注意,这里不是指那些认为上帝在引导进化过程的人,而是指那些彻底否定进化论、认为它是一个可憎的无神论谎言,坚信上帝按照现在的样子直接创造了人类的人。想想看,这可是占了全国人口的一半啊!
在我的社交圈里,找不到哪怕一个持有这种观点的人。这并非因为我有意回避他们;在政治立场上,我秉持「和平共存」的态度,不会仅仅因为某人持有一些异常信念就将其排斥在外。然而,尽管我大约认识一百五十人,我却能相当确信地说,他们当中没有一个是神创论者。这种巧合的概率有多大?1/2^150 = 1/10^45,约等于你在地球上所有原子中随机挑选出某一个特定原子的几率。
大约有 40% 的美国人支持禁止同性婚姻。即便我极度放宽标准,在我最亲密的一百五十个朋友中,可能也只有十个人会持有这种观点。虽概率升至百万的三次方分之一(即1/10²⁰),仍是百亿亿分之一的渺茫几率。
人们常常谈论社交茧房,但这概念远不足以解释百亿亿分之一的鸿沟。唯一看似贴切的比喻,恐怕就是那个诡异的暗物质世界了。
我居住在一个由共和党议员代表的国会选区,州长也是共和党人。毫无疑问,保守派就生活在我们身边。他们与我行驶在同样的道路上,居住在同样的社区里。然而,他们却仿佛是看不见摸不着的暗物质,我从未真正遇到过他们。
诚然,我的确大部分时间都宅在家里,沉浸在电脑世界中。我经常浏览 Reddit 这样的网站。
不久前,Reddit 上出现了一个引人注目的帖子,标题是——反对同性婚姻的 Redditors,你们最有力的论据是什么? 一位无法理解为何会有人反对同性婚姻的 Reddit 用户,真诚地想要了解那些确实持反对态度的人是如何为自己的立场辩护的。他心想,何不在这个拥有数千万用户、堪称互联网巨擘的平台上一探究竟呢。
然而,结果却出人意料:竟然没有一个人真正表示反对同性婚姻。
论坛上充斥着各种帖子:有人说「我当然支持同性婚姻,不过这里列举一些其他人可能反对的理由」;有人表示「我反对同性婚姻的理由是政府根本不该插手婚姻事务」;还有人直接质疑「为什么要问这个问题,根本不存在什么好理由,你在浪费时间」。浏览到帖子一半时,有人开始论述同性恋的非自然性,我以为终于有人要正面回答问题了,结果他们最后补充道:「但判断什么是自然或不自然并非我的职责,我仍然支持同性婚姻。」
在这个拥有 10,401 条评论,专门寻求反对同性婚姻观点的帖子中,我最终在靠近底部的位置找到了两个公开表示反对的人。他们的发言都以「我知道这么说会被踩得体无完肤……」作为开场白。
当然,我不只活跃在 Reddit 上。我也经常在 LW(Less Wrong)网站上闲逛。
根据去年的调查结果显示,在认同美国两大政党之一的 LessWrong 社区成员中,80% 支持民主党,20% 支持共和党。乍一看,这个比例似乎比其他一些案例要平衡得多。
然而,这种表面上的平衡实际上并不牢固。那些「共和党支持者」中,几乎清一色都是将共和党视为「两害相权取其轻」的自由意志主义者。当给予「自由意志主义者」这一选项时,仅有 4% 的受访者仍然认同保守派。不过,这个比例至少还是……存在的,对吧?
在进一步深入分析数据后,我发现其中有 3% 是新反动派,这是一个奇特的群体,他们渴望被君主统治。而真正能够代表美国约一半人口的那种普通的、传统的、信奉上帝和枪支权利但不崇拜乔治三世的保守派,在 LessWrong 社区中竟然只占百分之一。
情况愈发严峻。我的成长关键期恰逢就读于一所大学,若这所大学与其他顶尖学府相仿,其教师队伍和学生群体中,自由派与保守派的比例约为 9:1。我们可以大胆推测,就像 Less Wrong 论坛一样,即便是那寥寥无几的保守派代表,也更像是 Mitt Romney 式的温和派,而非坚持「上帝与枪支」理念的传统保守派。我的新闻来源是 vox.com,这是一个获得自由派官方认可的网站。甚至在日常用餐方面,我最钟爱的餐厅——加州披萨厨房,竟然被评为全美最具自由派色彩的餐厅。
我所居住的地方保守派比比皆是。但不知不觉间,我为自己创造了一个强大得令人瞠目结舌的茧房,一个 10 的 45 次方那么大的茧房。尽管保守派就在我周围,但我遇到他们的可能性,和遇到西藏喇嘛的可能性差不多。
(其实概率更小。曾经有位西藏喇嘛来我们学校做了一场精彩的演讲,但如果换成保守派来做,恐怕会引发抗议,最后不得不取消。)
四、
有一天,我猛然发现,自己竟然在毫无意识的情况下,完美符合了所有关于犹太人的刻板印象。
我是个书呆子,受过高等教育,擅长文字和理财,有一种独特的幽默感,不爱出门,喜欢吃熟食三明治。而且我是个精神病医生,这大概是仅次于脱口秀演员或拉比的最具犹太特色的职业了。
我算不上虔诚,也不去犹太教堂做礼拜。但这恰恰也是犹太人的典型特征!
我之所以提出这一点,是因为如果我们持这样的观点就大错特错了:「嗯,所谓犹太人,从定义上讲就是指生于犹太母亲的人。或者也可以说是那些遵循摩西律法、经常去犹太会堂的人。但我并不关心 Scott 的母亲是谁,而且我知道他也不去犹太会堂,所以知道 Scott 是犹太人这一点对我来说毫无意义。」
犹太教的表面特征——阅读妥拉经、参加会堂活动、具有犹太血统——只是这个庞大文化体系的冰山一角。犹太人有时将自己视为一个「部落」,即使你不去犹太会堂,你仍然是这个部落的一员。人们仍然可以(从统计学角度)通过了解你的犹太身份来推断你的某些特征——例如,你成为精神病学家的可能性有多大。
上一节提出了一个问题——如果人们在选择朋友、同事和顾客时很少明确考虑政治因素,那么我们的社会为何会出现如此严重的政治隔离现象?
事实上,「去犹太教堂」仅仅是犹太群体众多特征中的冰山一角,同样地,「投票给共和党」、 「认同保守派」或「相信神创论」也只是保守派群体诸多特征的表层体现。
我的朋友中犹太人比例异常高,这是因为我经常在精神病学会议等场合遇到他们——我们之间的聚集并非基于明确的宗教信仰,而是源于潜在的群体特征。同理,政治群体也会以惊人的程度自我聚集——我一再强调的是,这种聚集程度高达 1/10^45——这种聚集是基于他们潜在的群体特征。
真正热衷于研究这类现象的人会勾勒出许多推测性的群体和亚群体,但为了简化讨论,我就只谈两个半。
红色部落的典型特征包括:持保守派政治立场,笃信福音派基督教,支持神创论,反对同性婚姻,热衷持枪,喜食牛排,畅饮可口可乐,驾驶 SUV,沉迷电视节目,痴迷美式橄榄球,对恐怖分子与共产主义者义愤填膺,早婚早离,高呼「美利坚天下第一!」,并热衷乡村音乐。
蓝色部落的典型特征则包括:秉持自由派政见,带有不可知论倾向,支持 LGBT 权益,视枪支为野蛮象征,享用芝麻菜,啜饮高端瓶装水,驾驶普锐斯,博览群书且学历光鲜,揶揄美式橄榄球,对足球怀有叶公好龙式的好感,对性别歧视与顽固偏见痛心疾首,倾向晚婚,言必称欧洲文明优越论,音乐品味标榜「只听非乡村曲风」。
(近来,有人试图将一个被称为「灰色部落」的新兴群体从主流社会中区分出来。这个群体的特征包括:奉行自由意志主义,推崇道金斯式无神论,对同性婚姻议题感到莫名烦躁,践行原始人饮食法,饮用代餐饮品 Soylent,出行必叫优步,沉迷博客阅读,戏称美式橄榄球为「球类运动」,对毒品战争与国安局监控深恶痛绝,热衷奇幻民谣——但就本文讨论范畴而言,该群体多数时可视为蓝色部落的分支,无需过多关注。)
我认为,这些「部落」的划分可能比传统的政治立场更能反映社会的实际分化。举例来说,在哈佛大学,民主党支持者与共和党支持者的比例可能是 80 比 20,自由派与保守派的比例可能是 90 比 10,但属于蓝色部落的人与属于红色部落的人的比例可能高达 99 比 1。
正是这些群体之间的诸多差异,解释了茧房的强大威力——我是否提到过它能以 10 的 45 次方分之一的惊人程度将人们分隔开来?即便是在看似与政治立场无关的选择上,比如去加州披萨厨房还是寿司屋吃晚餐,我也在不经意间将自己局限于那些喜爱精致手工披萨或高雅外国美食的群体中。这些恰恰是典型的蓝色部落特征。
这些群体的划分究竟是基于地理位置吗?还是基于种族、族裔、宗教信仰、智商水平,抑或是你童年时期观看的电视节目?老实说,我也无法确定。
这其中确实有相当大一部分是由基因决定的——研究表明,遗传因素对一个人政治立场的影响程度在 40% 到 60% 之间。而在一个人对同性恋权利的态度方面,遗传因素的影响程度在 30% 到 50% 之间。有趣的是,这个比例甚至比同性恋倾向本身的遗传性还要高一些。
(一项有趣的研究尝试将政治倾向细分为更为严谨的概念,如「传统主义」、「威权主义」和「内群体偏好」,并探究了每个概念的遗传影响程度,详细内容可点击此处查看)。另一项研究则致力于追踪与这些倾向相关的具体基因,研究结果显示这些基因大多与 NMDA 受体有关,具体研究可点击此处了解。
然而,我认为这不仅仅是遗传因素在起作用。还有其他更深层的原因。「阶级」这个词似乎是最贴切的类比,但前提是你要以 Paul Fussell 在其著作《美国地位体系指南》中那种深入复杂的方式来理解它,而不是简单地将其等同于「另一种描述收入水平的说法」。
就目前而言,我们可以暂且将这些现象视为一个客观存在的事实——就像多个平行社会共存,它们之间的互动少得可以忽略不计,如同暗物质一般——然后继续我们的讨论。
五、
在我所有的博客文章中,引发最强烈反对声浪的是我关于本·拉登之死的那篇文章 。尽管我曾写过各种涉及种族、性别、政治等敏感话题的文章,但那次的反应是最激烈的。
我并未公开表示为他的死感到高兴。然而,有些人却这样理解了我的态度。随后,我收到了大量评论、邮件和 Facebook 私信,质问我怎么可能为他人的死亡感到高兴,即便那人是个恶棍。他们认为,每个人,包括本·拉登在内,都是人类,我们不应该为同胞的死亡而欢欣鼓舞。有一位评论者直截了当地说:
你的反应让我感到意外。在我偶尔关注的网络人物中(主要是在 LJ 和 Facebook 上),你是第一个属于「聪明、理性、深思熟虑」群体,却对这一事态发展表现出毫不掩饰的喜悦,而不是像其他约 90% 的人那样,对大众的反应感到厌恶。
这位评论者说得一针见血。在我认识的那些「聪明、理性、深思熟虑」的人中,普遍的情绪是对他人因本·拉登之死而欣喜的明显反感。我急忙澄清,表示我并非真的感到高兴,只是对这一切终于尘埃落定感到惊讶和如释重负。
那一天,我真诚地相信我在人性中发现了一份意外的善意——我认识的每个人都表现得如此仁慈富有同情心,以至于他们无法为一个憎恨他们及其所代表的一切的人的逝世而感到欣喜。
然而几年后,玛格丽特·撒切尔去世了。在我的 Facebook 主页上——由同样这群「才智非凡、理性深思」的人组成——最普遍的回应是引用那首关于女巫死亡的歌曲中的某些歌词。另一个广受欢迎的反应是分享英国民众自发在街头庆祝的视频,并附言「真希望我也在现场,可以一起庆祝」。令人不解的是,在这完全相同的群体中,竟然没有一个人表示不满,或说一句「冷静点,伙计们,我们终究都是人啊」。
当时我委婉地指出了这一点,却主要收到了一堆「是啊,那又怎样?」的回应,还附带着一篇文章链接,宣称「在公众人物去世后要求保持尊重性的沉默不仅是错误的,而且是危险的」。
就在那时,我突然有了一个顿悟。
你可以尽情谈论伊斯兰恐惧症,但我朋友口中那些「聪明、理性和深思熟虑的人」——她对蓝色部落的称呼——甚至无法凝聚足够的情绪来真正憎恨本·拉登,更不用说穆斯林群体了。我们理解他的所作所为是错误的,但这并没有激起我们的个人愤怒。当他死亡时,我们能够非常理性地运用我们更高尚的本性和远距离模式下的信念,认为我们永远不应该为任何人的死亡而感到高兴。
然而,颇具讽刺意味的是,这同一群人对撒切尔却怀有刻骨铭心的憎恶。虽然在理性判断时,绝大多数人(尽管并非全部)会承认本·拉登比撒切尔更为可憎,但在本能反应上却截然不同。提到本·拉登,人们的直觉反应是「有缺陷的人类」;而一提到撒切尔,立即便想到「人渣」。
本文开篇我就指出了一个看似矛盾的现象:尽管常理会认为地理和文化差异越大,敌意就越深,但纳粹的主要敌人并非与他们迥然不同的日本人,反而是与他们几乎无异的德国犹太人。
我的假设很简单明了:如果你属于「蓝色部落」,你真正的外群体并非基地组织、穆斯林、黑人、同性恋者、跨性别者、犹太人或无神论者——而是「红色部落」。
六、
「然而,种族主义、性别歧视、顺性别歧视和反犹太主义,难道不是那些影响深远、无所不包的社会因素吗?它们甚至可以说是人类社会的普遍现象!你该不会是在说,仅仅是政治分歧就能与这些问题相提并论吧?」
我们之所以确信种族主义是渗透社会肌理的庞然巨网,隐性偏见测试就是关键证据之一。在这项心理学实验中,研究人员要求参与者迅速判断词语或图片是否属于某些精心设计的组合类别,例如「白人面孔或积极情绪词」,或「黑人面孔和消极情绪词」。随后,他们会让参与者对另一组组合类别进行同样的判断,如「黑人面孔或积极情绪词」,或「白人面孔或消极情绪词」。如果参与者在将白人与消极事物联系时比将白人与积极事物联系更耗时(以反应时间衡量),那么他们的潜意识中可能存在对白人的正面偏见。你可以点击这里亲自体验这项测试。
当然,这项测试最引人注目的发现是,即便是那些声称自己完全没有种族偏见的白人,在测试中通常也会对白人产生正面联想,而对黑人产生负面联想。虽然对这一结果的确切含义存在诸多争议和不同解读,但它最终成为支持当前普遍观点的重要依据——即所有白人或多或少都存在一些种族主义倾向。
颇为有趣的是,就在三个月前,终于有研究人员灵机一动,想到了对政党进行内隐联想测试。研究结果令人震惊:人们潜意识中的党派偏见程度竟然比种族偏见高出整整一半还多(感谢 Bloomberg 的相关报道)。举个具体例子,如果你是一位白人民主党支持者,你对黑人的潜意识偏见(用专业术语 d-score 来量化)为 0.16,而对共和党人的潜意识偏见则高达 0.23。根据学术界公认的标准,种族偏见的 Cohen’s d 为0.61,被归类为「中等」效应量;相比之下,党派偏见的值则高达 0.95,已然达到「大」效应量的水平。
好吧,就算抛开这些测试结果不谈,我们也心知肚明种族问题具有现实层面的后果。举个例子,有几项研究做过这样的实验:研究者们发送了一批内容完全相同的简历,唯一的区别是有些附上了黑人的照片,有些则附上了白人的照片。结果表明,雇主明显更倾向于邀请那些附有白人照片的虚构候选人参加面试。相比之下,那些简单的内隐联想测试结果就显得微不足道了,你不觉得吗?
Iyengar 和 Westwood 决定将这种简历测试的方法延伸到政党研究领域。他们要求参与者为几位候选人的奖学金申请做出选择(参与者被告知这是研究人员所在大学的真实决定)。在准备的简历中,一部分贴有黑人的照片,另一部分则贴有白人的照片。此外,部分学生的简历中提到了他们在美国青年民主党的经历,而另一部分则列出了在美国青年共和党的经验。
研究结果再次表明,基于政党的歧视程度远远超过基于种族的歧视。对白人而言,种族因素的影响程度仅为 56 比 44(且方向与预期相反);而政党因素的影响程度则高达 80 比 20(针对民主党人)和 69 比 31(针对共和党人)。
如果你想了解他们的第三项实验,可以阅读原论文。该实验采用了另一种检测种族主义的经典方法,结果再次证实党派主义的影响力远大于种族主义。
I & W 完成了一项十分深入的研究,但这种研究并非新鲜事,也称不上突破性。几十年来,学界一直在探讨「信念一致性理论」——该理论认为,在形成内群体和外群体时,信念差异比人口统计因素更为重要。早在 1967 年,Smith 等人就在全国范围内开展了调查,结果表明相较于接受不同信念的人,人们更容易接纳不同种族的朋友。在随后的四十年里,这一发现被反复验证了数十次。Insko、Moe 和 Nacoste 在 2006 年发表的综述《信念一致性与种族歧视》中得出结论:
相关文献研究支持了信念一致性理论的弱版本。该理论认为,在社会压力不存在或无效的情况下,信念比种族更能决定种族或民族歧视的产生。然而,对于信念一致性理论的强版本——即在社会压力不存在或无效的情况下,信念是导致种族或民族歧视的唯一决定因素——其支持证据则被认为存在较大争议。
种族主义最广为人知的例子之一是「猜猜谁来吃晚餐」的情景:父母对子女与异族通婚感到震惊。Pew 研究中心在这个问题上做了一些很有价值的调查,结果显示只有 23% 的保守派和 1%(!)的自由派承认会在这种情况下感到不安。然而,当 Pew 调查父母对子女与不同政党成员结婚的态度时,情况却大不相同。数据显示,30% 的保守派和 23% 的自由派表示会感到不安。将这两组数据平均,我们可以看到,因种族问题而感到不安的比率从 12% 骤升至因政党差异而不安的 27%——增加了一倍多。诚然,受访者在民意调查中可能并非完全诚实,但这些数据无疑勾勒出一幅令人深思的图景。
(顺便一提,哈佛大学的情况颇具戏剧性。黑人学生的比例(11.5%)略高于保守派学生(10%),但在教职员工队伍中,保守派的数量却多于黑人。)
鉴于人们很可能会曲解我的意思,让我在这里过分强调一下我表达的不是什么。我绝不是说任何一个政党的支持者的处境比黑人「更糟」,也不是说党派主义是比种族主义更为严重的问题,更不是在暗示任何沿着这个思路的荒谬观点——尽管我确信我仍会被指责持有这些看法。事实上,种族主义比党派主义更为有害,因为两个政党在人数和资源上至少还算均衡,而整个国家的种族主义则主要冲击着少数弱势群体。我真正想表达的是,导致党派主义的根深蒂固的态度比导致种族主义的态度更为强烈,但这并不必然意味着它们的社会影响也更大。
然而,如果我们想要深入探究人们的心理和动机,党派主义以及它所代表的这种特殊形式的部落主义将会是一片富饶的研究领域。
七、
每逢选举季,保守派就会像精准的时钟一般,准时指责自由派不够爱国。而自由派也会以同样的准时度,做出毫无说服力的辩解。
「我们并非真的反对美国,只是……嘿,你们知道欧洲的医疗体系比我们强多了吗?他们的犯罪率也低得多。天呐,他们是怎么做到这么棒的?再看看我们,连同性婚姻这种事都搞不定。说真的,一个国家要是连这都办不到……哦,抱歉,我们刚才说到哪儿了?对了,美国。美国还行吧。Cesar Chavez 就很了不起。还有一些非主流人士,他们恰恰是因为批评主流社会而出名的。这某种程度上也体现了美国的伟大,因为我认为那些指出国家问题的声音往往能提出真知灼见。所以,请把票投给我吧!」
(别见怪,我调侃你只是因为我爱你)
几年前,当奥巴马首次展现出问鼎总统宝座的实力时,一场风波悄然酝酿。导火索是米歇尔·奥巴马的一番言论:「这是我成年以来第一次为我的祖国感到骄傲。」
共和党人立即对这一言论穷追猛打,质问她为何之前从未感到自豪。面对质疑,米歇尔急忙澄清,声称她一直以来都为美国感到自豪,她对美国的热爱如同亿万个太阳般炽烈,她只是想表达奥巴马的竞选活动格外令人振奋。
这番解释虽然苍白无力,却也堪称否认艺术的巅峰之作。但实际上,没有人真的因此对她心怀芥蒂。或许大多数奥巴马的支持者内心深处都有着相似的感受。我是给奥巴马的选民,我回想起童年时期,每逢独立日就忍不住要揭穿他人发自内心的爱国情怀,这段回忆至今令我自豪。正如 Aaron Sorkin 所言:
[是什么让美国成为世界上最伟大的国家?]它根本就不是世界上最伟大的国家!我们的识字率排名第 7,数学第 27,科学第 22,预期寿命第 49,婴儿死亡率第 178,家庭收入中位数第 3,劳动力第 4,出口也是第 4。所以当你问是什么让我们成为世界上最伟大的国家时,我真不知道你在胡说八道些什么。
(另一个一针见血的回应是「我们是第一?没错——在监禁率、无人机袭击和迫使新父母尽快复工这些方面,我们确实是第一!」)
这些说法自然都是事实。但奇怪的是,这种论调成了蓝色部落成员的经典兴趣,而红色部落成员似乎从不提及。
(「我们是第一?没错——在性道德沦丧程度上我们排第一!好吧,可能排第二,仅次于荷兰,不过他们太小了,不该算数。」)
我有一种直觉——不管出于什么原因,红蓝两派似乎都倾向于将「美国」等同于红色部落。当你询问人们什么是典型的「美国特色」时,得到的往往是一系列浓郁的红色部落元素——枪支、宗教、烧烤、美式橄榄球、NASCAR 赛车、牛仔、大型 SUV 和肆无忌惮的资本主义。
这就导致了红色部落对「他们的」国家怀有强烈的爱国情怀,而蓝色部落则感觉自己仿佛生活在敌境深处的孤立堡垒中。
这里有一篇在主流媒体网站上广受欢迎的文章,标题是美国:一个又肥又蠢的大国。另一篇则是:美国:一群被宠坏的爱抱怨的孩子。美国人被描绘成无知、科学素养低下的宗教狂热分子,他们所谓的「爱国主义」实际上不过是自恋的表现。美国人的无知程度会让你震惊,我们应该谴责这些幼稚无知的美国民众。
不言而喻,这些文章无一例外都出自美国人之手,读者群也几乎全是美国人。有趣的是,这些美国读者很可能对这些文章津津有味,丝毫不觉得受到冒犯。
再仔细看看这些新闻来源:赫芬顿邮报、沙龙网、石板杂志。你不觉得它们有什么共同之处吗?
在不同阵营中,「美国人」这个词既可能只是个普通的国民称谓,也可能暗指红色部落的成员。
八、
几天前,我登录了 OKCupid 交友网站,发现一个看起来很酷的用户。我浏览她的个人资料时,发现了这样一句话:
如果你是个性别歧视的白人男性,请不要给我发消息
我的第一反应是:「等等,难道这意味着一个有性别歧视的非白人就可以吗?这是为什么?」
(值得一提的是,这位女士本人的肤色白皙得像雪一样)
恰逢 Ferguson 骚乱初起之时,一系列引人注目的文章接连问世,其标题令人深思,如《为何白人似乎难以理解 Ferguson 事件》、《白人难以领悟 Ferguson 事件的深层原因》,以及《白人同胞请注意,让我为你们解读 Ferguson 事件的真相》。其中最后一篇文章开篇即言道:
社交媒体上充斥着来自各方的臆测,人们往往只愿意相信符合自己立场的观点。然而,白人似乎并未真正理解这一切的本质。让我试着用最简单的方式来解释[…]
无论你如何认为 Trayvon Martin 或 Michael Brown 有错,我想我们都能达成共识:他们不应该为此付出生命的代价。我希望你们白人能够明白,这正是愤怒情绪的根源所在。你们只关注抢劫行为……
出于直觉,我查看了这些文章作者的照片,令人惊讶的是,每一篇竟然都出自白人之手。
白人在摧毁美国?白人。白人依旧是社会的污点?白人。白人男性:我们很糟糕,诚挚道歉?白人。爱抱怨的白人男性,是时候说再见了?白人。致自以为是的直男白人:我要把你们驱逐出我的生活?白人。白人男性该停止用白人视角解释一切了?白人。美国人令人讨厌的首要原因:白人?白人。
我们经常看到这样的文章和评论。一些别有用心的人试图利用它们来「证明」白人才是真正的受害者,或者媒体对白人存在偏见等论调。相反,一些善良乐观的人则用这些例子来说明,部分白人已经有了自知之明,并愿意进行自我批评。
然而,我认为「白人」这个词的使用情况与「美国人」非常相似 —— 它既可以按字面意思理解,也可以作为红色部落的代号。
(当然,在白人喜欢的东西这个博客上,它显然是蓝色部落的代号。说实话,伙计们,我也搞不清楚。这种复杂局面可不是我造成的。)
我明白这个说法听起来可能有些武断,但这种情况并非前所未有。当人们说「游戏玩家都是厌女的」这样的话时,他们指的是占游戏玩家 52% 的女性吗?或者是指那 59% 偶尔玩电子游戏的、来自各行各业的美国人中的每一个人?显然不是。「游戏玩家」这个词实际上是在暗指「灰色部落」——那群半独立的、倾向自由主义的技术宅和极客,这一点大家心知肚明。这就像期待人们谈论「软呢帽」时真的是在说印第安纳·琼斯,或者提到「城市青年」就是在指纽约大学的新生一样可笑。每个人都心照不宣,当我们说「城市青年」时指的是谁,而这些人是否年轻或住在城市里,与这个词的实际含义几乎毫无关系。
我想说的是,「美国人」和「白人」这样的标签也遵循着类似的逻辑。比尔·克林顿曾亲切地被称为「第一位黑人总统」,但假如赫尔曼·凯恩在 2012 年赢得大选,他却可能会被视为第 43 位白人总统。同样地,当一个愤怒的白人滔滔不绝地表达他有多么厌恶「白人伙计」时,他实际上并非在谦逊地进行自我批评。
九、
设想一下这样的场景:你听说一位自由派脱口秀主持人兼喜剧演员因 ISIS 的暴行而怒不可遏,甚至录制并发布了一段视频。在这段长达十分钟的视频中,他对 ISIS 破口大骂,痛斥这些「狂热的恐怖分子」,称他们为「彻头彻尾的野蛮人」,拥有「野蛮的价值观」。
如果我听到这样的消息,我会感到颇为诧异。这与我对自由派脱口秀主持人一贯行为方式的认知大相径庭。
但我真正想讨论的是这个例子:自由派脱口秀主持人兼喜剧演员拉 Russell Brand 对福克斯新闻进行了类似的抨击。原因是福克斯新闻支持对伊斯兰国(ISIS)开战,而 Brand 甚至在结尾处补充道:「福克斯比 ISIS 还要可怕」。
这完全符合我的理论模型。你不会庆祝本·拉登的死亡,却会为撒切尔的逝世欢呼。你不会称 ISIS 为野蛮人,却会这样称呼福克斯新闻。福克斯是你的对立群体,而 ISIS 仅仅是沙漠中的一群陌生人。你憎恨对立群体,却不会去憎恨远在他方的陌生人。
我想进一步阐述。Brand 不仅不太想憎恨 ISIS,他还有强烈的动机避免这么做。这个动机在于:红色部落以公开、强烈地憎恨 ISIS 而闻名。憎恨 ISIS 会被视为红色部落的标志,就像带着一个醒目的血帮纹身闯入瘸子帮地盘一样危险。
然而,这种分析可能有失公允。如果我们问 Russell Brand,请他解释为什么对福克斯的愤怒远甚于对 ISIS 的愤怒,他会如何作答呢?
他可能会这样解释:「显然,福克斯新闻并不是真的比 ISIS 更糟糕。但是请看,我现在是在跟我的受众对话,他们主要是英美的白人。这些人早就深知 ISIS 的邪恶本质,无需我再多加强调。事实上,在当前形势下,过分强调 ISIS 的罪行不太可能真正改变人们的看法,反而更可能加剧伊斯兰恐惧症。我的受众群成为 ISIS 支持者的可能性为零,但他们患上伊斯兰恐惧症的风险却相当真实。因此,在这种情况下抨击 ISIS 不仅毫无意义,反而可能造成危险的后果。」
另一方面,我的白人英国和美国受众中很可能包含了大量福克斯新闻的观众和支持者。尽管福克斯新闻的危害程度不及 ISIS 那般极端,但也相当糟糕了。因此,这里为我提供了一个难得的机会,可以接触到那些可能受到不良影响的人,并有望改变他们的观点。鉴于此,我认为我决定强烈抨击福克斯新闻,甚至可能夸张地宣称他们「比 ISIS 还要可怕」,在这种情况下是合理的。
我非常认同假设中 Brand 的某些观点,尤其是关于伊斯兰恐惧症的部分。确实,有些人可能会利用谴责 ISIS 的暴行来弱化论证一些已经处于社会边缘的穆斯林群体,因为他们面对的受众本就对 ISIS 充满仇恨。我们当然需要打击恐怖主义和暴行,但这绝不应成为对一个远在万里之外的无辜女孩仅仅因为在公共场合戴头巾就大加指责的理由。同样,尽管基督徒在苏丹因信仰而遭受迫害,但这并不能成为我们阻挠他人在本地建造清真寺的借口。
然而,当 Brand 假设他的受众可能是福克斯新闻的忠实粉丝时,我就不再赞同他的观点了。
在这样一个世界里:Reddit 用户中几乎无人反对同性婚姻,Less Wrong 网站上仅 1% 的用户认同保守派立场,而我认识的 150 人中竟无一人支持神创论。那么,试想一下,一位知名自由派活动家开设了 YouTube 频道,其标志明显受到切·格瓦拉的启发,节目标题诸如《战争:究竟有何价值?》和《莎拉·西尔弗曼畅聊女权主义》——你觉得这样一个频道的观众中,会有多少人是福克斯新闻的忠实粉丝呢?
从某种角度来看,Russell Brand 若是选择抨击 ISIS,反而比批评福克斯新闻更需要「勇气」。因为即便他抨击 ISIS,他的观众最多也就感到些许困惑和不适。而每当他抨击福克斯新闻时,他的观众便会兴高采烈地附和:「哈哈!说得太对了!狠狠批评他们!让那些无知偏执的异己分子见识见识!」
Brand 似乎认为,他的言论只是被笼统的「英国」和「美国」这两个国家接收。然而事实并非如此。现实中存在着两个平行的信息宇宙,而他的声音仅仅传播到了其中之一。
这个结果恰恰印证了我们对伊斯兰教案例的预测。不断向人们灌输他们已经憎恨的远方国度的负面形象,并煽动他们加深这种憎恨,最终导致的是加剧了对那少数几个偶然滞留在你这一方的、来自那个文化的茫然失措、边缘化的代表人物的不宽容。果不其然,只要某个行业、文化或社区变得足够「蓝」,属于「红色部落」的成员就会开始遭受骚扰,失去工作(Brendan Eich 就是一个典型例子),或者以其他方式被排挤出局。
设想 Brendan Eich 是一个小宗教的少数派的成员,周围都是仇视这个少数派的人。从这个角度看,突然解雇他就显得不那么正义了。
如果你把德克萨斯州的某个偏僻小镇和伊拉克的摩苏尔混为一谈,你就可以「证明」穆斯林是可怕而又强大的群体,他们一直在屠杀基督徒——这样我们就有了一个貌似合理的借口,可以把镇上仅剩的一个穆斯林家庭驱逐出去,尽管他们只是普通人,从未伤害过任何人。
设想一下,如果你将开源技术行业与一个荒诞的平行世界相融合——在那里,仅仅穿着 FreeBSD T 恤就可能招致他人的「驱魔」尝试——你就能「证明」基督徒是一群可怕且强大的人,他们无时无刻不在迫害其他所有人。这样一来,你就找到了一个冠冕堂皇的理由,可以将一个从未伤害过他人、愿意加入红色部落的人驱逐出境。
当我的一位朋友听说 Eich 被解雇时,她完全没觉得有什么不妥。她说:「我可以宽容一切,除了不宽容。」
「不宽容」这个词似乎正在变成另一个类似于「白人」和「美国人」的标签性词汇。
「我能宽容一切,除了外群体」——现在再听这句话,是不是就没那么高尚了?
十、
我们最初提出的问题是:为什么数百万人会公开赞美他们能想到的每一个外群体,同时又公开谴责自己的内群体?这似乎与我们所了解的社会心理学原理相悖。究竟是怎么回事?
我们发现,所谓的「外群体」往往并非与我们截然不同的群体,反而更可能是那些与我们极为相似、几乎拥有相同特征并生活在同一地区的群体。
进一步观察发现,尽管自由派和保守派生活在同一片土地上,但就彼此之间的互动程度而言,他们可能就像是来自两个完全不同的国家或平行宇宙。
与普遍认为他们仅在投票行为上有所区别的看法不同,我们认为他们是拥有截然不同文化的两个独立部落。谈论「美国文化」就如同谈论「亚洲文化」一样笼统——实际上掩盖了许多内部的差异和界限。
红色部落的外群体有时是黑人、同性恋者和穆斯林,但更多时候是蓝色部落。
而蓝色部落似乎完成了一项令人惊叹的心理炼金术,将其所有对外群体的敌意都转化为了对红色部落的仇视。
这种现象并不令人意外。事实证明,当面临共同的战略目标时,族裔差异往往能够被轻易搁置。就连以种族歧视臭名昭著的纳粹,在有共同利益的情况下,也能与日本人称兄道弟。
研究表明,蓝色部落与红色部落之间的偏见程度远远超过了种族主义等更为广为人知的偏见形式。一旦蓝色部落成功地将黑人、同性恋者和穆斯林吸纳进自己的阵营,这些群体就摇身一变,成了他们的权宜盟友,值得用略带优越感的颂词来歌颂其美德。正如那句谚语所说,「三叶草生长之地,从无懦夫」——仿佛他们突然间就变得高尚起来。
花费毕生精力去诋毁另一个群体,不断强调对方有多么糟糕,这种行为会让人觉得你,嗯,很有部落主义倾向。这绝对算不上高尚之举。因此,当「蓝色部落」的成员决定倾其所有去大肆抨击「红色部落」有多么可怕时,他们会巧妙地避开「红色部落」这个词,转而使用「美国」、「白人」或「直男白人」这样的说法。这样一来,他们的批评就华丽变身为谦逊的自我反省。他们对正义似乎如此执着,以至于不惜批评自己所属的、深爱的群体,尽管这么做让他们痛彻心扉。我们相信他们并非言过其实,因为人们可能会夸大敌人的缺点,但任何人夸大自身的缺点都不符合尴尬标准。
蓝色部落总是随时准备好各种借口,将不幸落入其势力范围的红色部落成员贴上「全能的、专制的压迫者」的标签,从而对他们进行迫害和打压。他们辩称,这确实是红色部落在其势力范围内的做法,而且既然是在同一个国家,那就应该视为同一个社区。结果是,每个蓝色部落组织都被赋予了永久的权力,可以对红色部落采取任何必要的紧急措施,不管这些措施在其他情况下看起来多么令人不安。
啊,蓝色部落是多么有美德,多么高尚啊!他们完全宽容所有恰好与他们结盟的不同群体,只有在面对不宽容时才会表现出不宽容。他们从不屈尊参与那可怕的红色部落那样的琐碎派系冲突,而是始终高尚地批评自己的文化,努力使之变得更好!
抱歉。不过我希望这至少能稍微说服你一点。所谓的外群体亲和和内群体恐惧的奇特现象,其实并非表面看起来那样。它不过是传统的内群体偏爱和外群体贬低,只是变得更加复杂和巧妙了而已。
十一、
这篇文章很糟糕,我应该为此感到愧疚。
我之所以应该感到愧疚,是因为我犯了我正试图警告其他人的同样错误,而且直到快写完时才意识到这一点。
我该多么高尚、多么崇高啊!从不屈尊参与那些愚蠢的红色部落的琐碎部落冲突,而是一直在高尚地批评自己的部落,努力使之变得更好。
是啊。当我写了一篇长达一万字、猛烈抨击蓝色部落的文章后,要么我是个与众不同的人,要么蓝色部落就是我的外群体。而我并没有那么与众不同。
正如你可以玩个小把戏,通过让你的读者假设只有一种美国文化来显得谦逊自省,也许你也可以通过假设只有一个蓝色部落来蒙蔽人们。
我很确定自己不属于红色部落,但我确实在前文中提到过「灰色部落」,而且我身上也具备成为灰色部落一员的所有特征。这意味着,无论我对蓝色部落的批评是否正确,从动机上来说,它与红色部落谈论他们对基地组织的憎恨,或蓝色部落成员谈论他们对无知偏执者的厌恶是出于同样的心理。当我自诩能够宽容那些被蓝色部落刻薄对待的基督徒和南方人时,我其实并不是真正的宽容,只是意识到这些人与我相距甚远,根本不足以成为一个合适的对立群体罢了。
写这篇文章时我感到很有趣。人们在严厉批评自己所属群体时不会感到愉快。人们确实可以批评自己的群体,这并非人类无法做到的事,但这需要钢铁的意志,会让你怒火中烧,甚至要你呕心沥血。这本不该是件趣事。
你可以想象,在 Gawker 这样的网站上,某些白人作者每周都在发表诸如《为什么白人如此糟糕》和《愚蠢的白人不懂这些事》之类的文章,他们写得轻松自在,毫不费力。事实上,这些人并非在批评自己的群体,他们甚至从未考虑过要批评自己的群体。我不能怪他们。批评自己所属的群体是一项极其困难的任务,我自己也才刚刚开始培养这种思考能力。
我能想到一些对自己部落的批评,这些批评既重要又真实。但一想到要把这些批评付诸笔端,我就感到怒火中烧。
我可以想象自己的感受,可能就像一位美国自由派穆斯林领袖上 O’Reilly 脱口秀节目时的处境。O’Reilly 突然对他发难,质问为什么他和其他美国穆斯林没有更强烈地谴责 ISIS 的斩首行为,并要求他立即在直播中表态。你几乎能看到这位穆斯林领袖脑海中思绪急转,他可能在想:「显然,斩首行为令人发指,我和任何人一样深恶痛绝。但你分明对那些被斩首的受害者毫不关心,你只是想借机抹黑我,羞辱全体穆斯林。我宁可亲手斩下世界上每个人的头,也不愿给你这种自以为是的偏执狂哪怕一丁点得意的机会。」
这就是当我被要求批评自己的部落时的感受,即使理由再正当也是如此。如果你认为自己在批评自己的部落,却没有感受到这种程度的内心煎熬,那么也许你根本就不是在批评自己的部落。
然而,如果我想获得自我批评的道德点数,批评灰色部落或许是唯一诚实的方式。而如果我想赢得宽容点数,我目前必须肩负的个人十字架就是宽容蓝色部落。我需要不断提醒自己,即便他们是坏人,也仅仅是本拉登级别的坏人,而非撒切尔级别的恶棍。当他们是好人时,他们则是对抗世界邪恶的强大而必要的斗士。
这篇文章最糟糕的结局,莫过于被当作随手可得的粪便,在需要时朝蓝色部落扔去。考虑到我最近几篇类似文章的遭遇,以及我自身潜意识中的明显偏见,我已经预料到它会落得如此下场。
然而,这篇文章若能产生的最理想效果,莫过于促使众多读者,尤其是我自己,深入思考如何变得更宽容。这里所指的宽容,绝非第一部分中皇帝那种轻描淡写的「我当然很宽容,有什么理由不宽容呢?」相反,它是「尽管宽容会让我怒火中烧,会让我呕心沥血,但是该死的,我还是要咬紧牙关坚持宽容」。
大学录取竞争日益激烈:比你想知道的要多得多
原文:Increasingly Competitive College Admissions: Much More Than You Wanted To Know | Slate Star Codex
发表于 2019 年 4 月 15 日 作者:SCOTT ALEXANDER
0 引言
以下数据来自 businessstudent.com:
在过去约十年间,顶尖大学的录取率降低了近 50%,这引发了人们对学业竞争日益加剧的担忧。进入一所优质大学的巨大压力甚至可能导致一些精英高中出现学生自杀的悲剧。
然而,也有人对这一问题持不同看法。他们认为,过分关注哈佛和耶鲁等名校,忽视了一个事实:大多数大学其实比以往更容易进入。例如,《大西洋月刊》曾发表一篇题为《上大学真的比以前更难了吗?》的文章,其中就提出了这样的观点:
近年来,一些曾被视为「保底选择」的大学,其录取率已降至 20% 或 30%,这似乎暗示每年春季的大学入学变得愈发困难。然而,国家学校董事会协会公共教育中心的高级政策分析师 im Hull 表示,「在耸人听闻的新闻报道和广为流传的传言之外」,他们 2010 年的报告显示,对大多数学生而言,2004 年进入大学的难度与 1992 年相比并无显著提高。尽管该中心计划在未来几年更新数据,以反映过去十年申请者的情况,但他们认为,如果 90 年代的学生的美国学术能力评估测试(SAT)成绩和平均学分绩点(GPA)与今天的学生相同,那么他们进入同等门槛的大学的几率大致相同。
然而,由于他们提供的报告链接已失效,我无法验证这一说法的真实性。而且,根据现有数据,这一结论在今天似乎并不成立。Pew 研究中心的最新数据显示:
第一张图表揭示,53% 的大学录取率呈下降趋势,而仅有 31% 的大学录取率有所上升。第二张图表进一步表明,录取率下降主要集中在那些门槛最高的顶尖院校,而录取率上升则主要发生在门槛相对较低的学校。然而,我们不应过分夸大这一问题:事实上,四分之三的美国学生就读于录取门槛较低的大学,这类院校的数量足以满足所有学生的需求。但是,如果你的目标是进入一所竞争激烈的学校——不仅仅是哈佛和耶鲁这样的顶尖名校,而是任何排名前几百的知名院校——你将面临越来越激烈的竞争。
这与我对「实际情况」的认知相符。2002 年,我在加州一个优质社区的高中就读。当时,我的大多数同学都梦想进入知名的常春藤盟校,把加州大学系统的学校仅仅视为「保底选择」。进入加州州立大学(加州的二三线院校)则被认为是一种巨大的失败。然而,我母亲刚从一所类似的学校退休,她告诉我,如今相同背景的学生会为了进入加州大学系统而拼尽全力,而许多人甚至难以被加州州立大学录取。
我听到的关于这种现象的解释通常集中在一点上:现在上大学的人比以往任何时候都多,但像哈佛这样的顶尖学校的招生名额并未增加,因此竞争变得更加激烈。
然而,据我所知,这种解释并不正确。
当今的大学入学率与 2005 年持平。如果你看到过一些图表似乎显示相反的趋势,那些可能是展示拥有大学学位的美国人总数的图表。这只能说明现在获得学位的人数比 20 世纪 40 年代或更早期间多,而不能反映入学率的实际变化。
(事实上,由于出生率正在下降,上大学的绝对人数正在减少)。
我想进一步指出,哈佛大学一直在增建宿舍、增聘教授,因此今天每个美国人拥有的哈佛名额,与十年前、二十年前,乃至追溯到 19 世纪都保持不变:
我希望深入研究这个问题,探讨以下几个方面:
– 我们是如何发展到今天这种状况的?大学录取是否一直都是社会关注的重大事件?乔治·华盛顿当年是否也需要为进入一所好大学而焦虑?富兰克林·罗斯福呢?如果他们那时不需要担心这个问题,原因又是什么?
– 学术界现在真的比过去更具竞争性吗?这种变化是在什么时间尺度上发生的?体现在学术界的哪些层面?造成这种情况的原因是什么?这种趋势会停止吗?
– 为大学录取而焦虑是否是正确的应对方式?
1 以哈佛为中心的大学录取历史
在美国高等教育最初的两个世纪,大学入学并不存在竞争。哈佛大学的录取标准是……
(在这段历史时期,哈佛大学是记录最为详尽的学府,因此我将以它为重点。别插嘴,Ben Casselman,该闭嘴的是你!)
……哈佛大学录取所有精通拉丁语和希腊语的人。1642 年,哈佛大学的入学要求[是这样规定的](https://books.google.com/books?id=zjE9DwAAQBAJ&pg=PA173&lpg=PA173&dq=Harvard+admissions+read+Cicero&source=bl&ots=H12pA9damQ&sig=ACfU3U0w2qxNTO6UORcefBf8PGXbznwOSQ&hl=en&sa=X&ved=2ahUKEwiE3JnP_dDhAhWFKDQIHRm-A8cQ6AEwC3oECAkQAQ#v=onepage&q=Harvard admissions read Cicero&f=false):
凡能够随时阅读 Tully [Cicero] 或同等水平的古典拉丁作家作品,能够独立用拉丁语创作诗歌和散文,并能够完美掌握希腊语名词和动词的变化规则的学生,均可获准入学。在达到这些条件之前,任何人都无权要求入学。
在现代人眼中,能够流利地运用拉丁语无疑令人印象深刻,仿佛是一项只有最高雅的贵族学者才能通过的测试。然而,在早期的马萨诸塞州,即便是那些几乎不识字的农民,对古典语言的掌握程度也令人惊讶地高。1647 年,尽管当时的居民正忍受着饥饿之苦,还要抵御印第安人的袭击,该州仍然颁布了一项法律,要求每个拥有至少 100 个家庭的城镇必须设立一所教授拉丁语和希腊语的学校。这项法律被称为「旧欺骗者撒旦法」,其名称本身就反映了当时清教徒的思想。即便是那些无法接受正规学校教育的农村家庭,也常常自行教授子女古典语言。19 世纪初在新罕布什尔州农村长大的 Mary Baker Eddy 的经历就是一个生动的例证。她曾写道:
我父亲被告知我的大脑发育过快,与身体不相称,因此让我尽量远离学校。但我获取知识的速度远比常人快得多。十岁时,我就已经熟悉 Lindley Murray 的语法教材,就像熟悉每周日必须背诵的威斯敏斯特教理问答一样。我最喜爱的学科是自然哲学、逻辑和道德科学。我的哥哥 Albert 还教我古代语言——希伯来语、希腊语和拉丁语。他自己则利用大学假期学习希伯来语。
按照当时的标准,哈佛大学的入学要求虽然严格,但却公平合理,即使家境较为贫寒的学生也有机会达到。更为关键的是,这些要求的设立仅仅是为了确保学生能够跟上课程进度(当时的课程是用拉丁语授课的),而非用来限制稀缺的哈佛录取名额。事实上,根据一篇对 Jerome Karabel 所著 Chosen 一书的总结文章指出,「哈佛大学并未设置班级规模限制,因为它正试图在规模上与牛津和剑桥大学展开竞争」。哈佛大学渴望招收尽可能多的学生,唯一的限制因素就是合格申请者的数量。
这些入学政策一直延续到 19 世纪,只是在具体的考试科目上进行了一些调整。18 世纪末,他们在入学考试中增加了数学内容;19 世纪初,又加入了一些科学科目。你可以在这里查看 1869 年哈佛大学入学考试的原始试卷。这份考卷难度不小,但通过率却高达 88%(这无疑部分归因于只有充分准备的学生才会参加考试),而且所有通过考试的学生都能保证获得哈佛大学的入学资格。同一时期塔夫茨大学的一些文献显示,他们的入学程序与哈佛大学非常相似。其他一些文献则表明,如果考生毕业于一所声誉良好的高中,这些大学会认为他们已经具备了入学条件,可以免试录取。
这种理想的局面是何时结束的?关于这个问题的资料并不容易找到。虽然我无法提供具体出处,但据我所知,19 世纪末出现了一场统一大学入学标准的运动。起初,这只是为了确保各大学采用相同的资格考试,避免一所学校考拉丁语,另一所考希腊语的情况。这一进程在 1899 年达到顶峰,那年成立了大学理事会,它负责管理一种入学考试,可以说是 SAT 的前身。随后,这一制度悄然无息地发生了转变,从确保学生具备入学资格,逐渐演变为分配稀缺的入学名额。到 1920 年左右,这一转变基本完成,以至于当人们讨论「大学应该如何决定录取谁」之类的问题时,已不会感到意外。如果你能找到更多关于这一转变过程的信息,请与我联系。
在早期,大学录取完全取决于入学资格考试的成绩。然而,到了 20 世纪 20 年代,一个引人注目的现象出现了:在这项考试中取得高分的学生中,犹太人的比例远远超出了他们在人口中的占比。尽管犹太人仅占美国总人口的 2% 左右,但在哈佛 1922 年的新生中,他们的比例却高达 21%(如果你想深入了解这一现象背后的原因,可以阅读我的另一篇文章《原子弹被视为匈牙利的高中科学博览会项目》)。为了改变这一局面,哈佛等顶尖大学决定摒弃单一的标准化考试制度,转而采用一种更为灵活的「全面评估」录取体系。这种新的录取制度在实际操作中,使得这些大学能够对犹太学生实施事实上的录取限额。
支持配额制的人不仅否认自己持反犹太主义,还辩称他们实际上是在努力抵制反犹太主义;他们认为,如果学生群体中犹太人占据主导地位,可能会加剧社会对犹太人的种族敌意。作为配额制最坚定的拥护者,哈佛大学校长 Abbott Lowell 曾说过:「学生中的反犹太情绪正在增长,而且随着犹太学生人数的增加而愈发严重。如果犹太学生的比例达到学生总数的 40%,种族矛盾将变得异常激烈」。他这番话是否只是为自己的反犹太主义倾向辩护?我并不这么认为。我怀疑现今的哈佛管理层不大可能怀有恶意的反亚裔情绪,但他们仍在执行亚裔配额制。如果你问他们为什么这么做,他们可能会说,在一个以白人、黑人和拉丁裔为主的国家里,如果顶尖大学的学生主要是亚裔,可能会(用 Lowell 的话说)「激化种族矛盾」。我认为,没有理由认为 1920 年代的管理者的思维方式与当代的管理者有什么本质区别。
无论其中缘由如何,到 20 世纪 20 年代中期,哈佛大学已经实施了针对犹太学生的录取配额制,并转向了全面考核的录取方式。然而,时任校长的 Lowell 及其同僚反复强调,这些新政策绝非为了提高哈佛的选拔性。他们明确表示:「将大学入学标准提高到只有杰出学者才能达到的程度,这既不现实也不可取…对于那些认真努力、志向远大但智力平平的学生来说,入学门槛永远不应该高不可攀。」
我们稍后会讨论这种为所有普通人提供顶尖教育的乌托邦式梦想是如何破灭的。但在此之前,我们需要思考一个更为基本的问题:为什么当时的哈佛大学没有被申请者淹没?如果学术要求对大多数聪明的高中生来说并非遥不可及,为什么不需要限制录取名额呢?
下面,我将深入探讨几种可能的原因。
1.1 历史学费水平
早期美国大学的学费是否高昂到只有贵族阶层才能负担得起?
答案是否定的:
关于美国殖民时期大学学费的记载存在较大分歧。然而,从独立革命后到 20 世纪 90 年代初,大学学费相对稳定,一直维持在家庭中位收入的约三分之一。进入 90 年代后,学费急剧上涨至家庭中位收入的 1.5 倍。换言之,从历史角度来看,过去的大学学费相对于家庭收入而言,仅相当于现今的五分之一左右。值得注意的是,一些知名大学在早期甚至不收取学费。例如,斯坦福大学在建校后的前 35 年里实行了零学费政策。
历史记载表明,即便在收取学费的年代,大多数大学生的经济负担也并不沉重。当时普遍存在各种方式来帮助那些无力支付学费的学生。早在 17 世纪 40 年代,哈佛大学就设立了第一个奖学金。有零星记载显示,一些来到哈佛的学生因为付不起学费,便被安排为大学教职员或其他学生做仆人来抵扣费用。在美国,著名作家拉尔夫·沃尔多·爱默生 就曾受益于这种安排;在英国,伟大的物理学家艾萨克·牛顿也有类似经历。
对于那些既无法获得奖学金,又不愿意做仆人的贫困农民子弟,一些大学还愿意接受其他形式的付款。据 The Billfold 报道:
哈佛大学四年的学费约为 55 英镑,通常可以用以物易物的方式支付,最常见的是小麦和麦芽。有时,新英格兰的父亲会让儿子带着防风草、黄油,甚至是山羊肉(尽管这并不受欢迎)去剑桥就读。一头 141 磅重的牛就足以支付一年的学费。
1.2 歧视
早期美国大学是否只招收白人男性?这种做法是否显著缩小了申请者群体,以至于所有申请的白人男性都能获得入学机会?
我认为,仅凭种族歧视很难解释这种现象。纵观 19 世纪,美国的白人比例一直维持在 85% 左右。而在新英格兰地区,即哈佛大学大多数申请者的来源地,白人比例可能高达 95% 至 99%。例如,有资料显示 1865 年波士顿的黑人比例仅为 1.3%;其他少数族裔的比例可能更是微乎其微。因此,种族歧视对缩小申请者范围的影响实际上相当有限。
关于 19 世纪大学对女性的排斥程度,事实可能与普遍认知有所出入:
(来源:通过粗略结合这份资料和这份资料,得出一个能够涵盖整个时期的综合指标)
1890 年,高等教育领域中每招收一名女生,就有约 1.3 名男生入学。这一性别比例差距与当今相当,只是方向相反。这个鲜为人知的历史事实令人惊讶,其原因可能在于:当时的许多女性就读于师范学院或其他专门面向女性的教育机构;直到 20 世纪初,哈佛大学才开始招收女生。随着性别融合的推进,女子学院通常被并入邻近的男子学院,形成了统一的教育机构。在这种情况下,性别融合似乎并未对招生的选拔标准产生重大影响。此外,尽管招收女性使得申请者人数翻倍,但 19 世纪的大学入学难度似乎远低于现在。
总的来说,我认为这并非造成当今与 19 世纪大学入学难度差异的主要因素。
1.3 缺乏专业学校学位要求
如今,大学竞争如此激烈,部分原因在于人们将其视为获得理想工作的通行证。然而在 19 世纪,大学学位几乎不能带来经济上的实际好处。
以医生这一职业为例。当时的大多数医学院直接录取中学毕业生,不要求申请者具有大学学位。事实上,多数医学院和哈佛大学一样,几乎接收所有「申请者」。与哈佛类似,医学院有时会安排一次入学考试,主要测试申请者的希腊语和拉丁语水平(这在当时被认为是医生必备的技能!),通过考试后就可以顺利入学了。
(这篇文章记录了一些关于殖民时期和南北战争前美国医学教育的有趣轶事。当时,任何人都可以开办医学院,而利润驱动使得这些学校几乎来者不拒。医学教育竟如此赚钱,以至于病人资源反而成了瓶颈。由于没有法规要求医学生必须接触真实病例,一些不那么严谨的学校干脆省略了这个环节。解剖课是当时课程的重中之重,但由于没有制冷设备,新鲜尸体成为了抢手货。盗墓行为猖獗,甚至引发了医学院与当地居民之间的小规模冲突。「至少有两次,当地居民突袭学校抢夺尸体。其中一次导致学校建筑被烧毁,另一次则造成一名学生和一名教授丧生。」对于医学院学制长短没有明确规定,有些学校的培养周期短至九个月。然而,对于谁可以自称医生同样没有限制,因此有些学生会一直学到厌倦为止,然后干脆退学开始行医。当时的学费约为每年 100 美元,另外还需支付生活费和各种隐性费用。据估算,这大约相当于现今医学院学费(占医生平均收入的比例)的一半。这种混乱局面一直持续到镀金时代,那时医学院才开始逐步走向规范化和专业化。)
假设你立志成为一名律师。在 19 世纪的美国,最常见的途径被称为「研读法律」。这种方式主要包括自学法律教科书,在执业律师门下实习,然后就可以开始以律师身份执业了。在某些州,你还需要一封法院出具的品行证明。实际上,在执业律师门下实习更像是一个有益的建议,而非硬性要求。在我看来,除了钻研足够多的法律教科书,使自己有信心胜任律师工作之外,你似乎不需要做什么特别的事情就可以开始执业了。值得注意的是,当时大多数律师甚至没有大学学历。
亚伯拉罕·林肯本人就是一名律师,他曾经这样建议一位法学生:
如果你已经下定决心要成为一名律师,那么你就已经成功了一大半。是否有人指导你学习并不重要。我就是自学成才的。关键在于获得相关书籍,仔细阅读并深入研究每一个细节。你不必非要在大城市才能学习。我是在人口不足三百的 New Salem 镇学习的。无论在哪里,书籍的内容和你理解它们的能力都是一样的。
1846 年就任的美国第 30 任最高法院大法官 Levi Woodbury 是首位接受过正规法律教育的大法官。而 1941 年上任的第 81 任大法官 James Byrnes 则是最后一位未经法学院培训的大法官。值得注意的是,即使在今天,包括加利福尼亚在内的四个州仍然允许通过自学法律来成为律师,尽管这种做法已经非常罕见,且不受推崇。
这种进入专业领域的相对宽松条件解释了为何哈佛大学当时并未面临申请者过剩的问题。然而,这也引发了一个值得深思的问题:为何当时并未出现医生和律师供过于求的情况?我们往往认为,严格的医学院入学标准当然是绝对必要的,仿佛一旦放宽标准,就会导致某种难以预料的灾难性后果。那么,这种开放的政策是否真的造成了专业人士的过度供给?
事实证明,并非如此。当时的人均医生和律师数量反而低于现在的水平。
那么,这种开放政策是否导致了这些专业人士薪资的下滑呢?
尽管我没有掌握律师薪资的精确数据,但通过比较 1797 年英国和 20 世纪初美国的工资统计图表,我发现在这段历史时期,律师的收入大约是非技术工人的 3 至 5 倍,是文员和教师的 3 至 4 倍,与医生相当。这一收入水平与当今成功律师的薪资相当,甚至可能高于现代普通律师。造成这种现象的原因可能是,如今非技术工人有最低工资保障,教师也有工会支持,但无论如何,19 世纪拥有法律学位所带来的收入优势似乎至少不低于现在,很可能还要更高。
医生的薪资情况也类似。上述研究估计,当时医生的年薪约为 600 美元,而同期农业劳动者可能只有 100 美元左右,文员和教师的薪资则大约是农业劳动者的两倍。
由此我得出结论:即使允许任何符合条件的人成为医生或律师,不设置准入门槛,也并未导致这些职业人才过剩,更没有将其薪资水平压低到我们今天认为不合理的程度。
1.4 结论
那么,为什么没有出现大学生、医生和律师供过于求的情况呢?虽然我找不到一个决定性的原因,但以下是一些可能的解释。
在 19 世纪初期,美国有 60% 到 80% 的人口以务农为生。对于绝大多数人而言,「选择什么职业来实现自我价值」这样的问题根本不存在,除非你家境富裕或生活在城市。你要么注定成为一名农民,要么已经确定了某条非农业的发展道路,可以直接追随,而不需要上大学来「为自己保留更多选择」。
在农村,孩子们从小就要在农场里干活,不存在长期只读书不劳动的情况。人们也不会认为孩子在 18 岁之前无法创收,因此没必要让他们一直读到 22 岁才开始工作。正因如此,把孩子送到波士顿或其他地方上大学,还要负担他们四年的城市生活开支,这笔费用远远超过学费本身。据一篇文章称,1816 年时,学费仅占送孩子上大学总开支的 10% 左右(诚然,家境贫寒的学生可以通过节衣缩食来大幅降低开支,但这个定律依然成立)。
另一个限制因素可能是,在大学教育和专业领域之外,几乎每个行业都存在广阔的发展机会。值得注意的是,包括乔治·华盛顿在内的十二位美国总统都未曾接受过大学教育。被公认为早期美国全才楷模的本杰明·富兰克林同样没有上过大学。在美国历史上最富有的十个人中(主要是 19 世纪的工业巨头),据我所知仅有两人接受过高等教育。撇开明显存在的种族和性别歧视不谈,19 世纪的社会比起当今这个基于学历证书的伪精英制度,反而更接近真正的能力至上主义。面对这种情况,人们做出了理性的回应:他们不再过分看重学历证书,而是专注于做有价值的事情。
2 零竞争的局面是如何演变成今天这种混乱状况的?
下图展示了哈佛大学录取率随时间的变化趋势,主要基于这些数据:
20 世纪初期,哈佛大学的录取政策仍延续 19 世纪的做法,即录取绝大多数符合条件的非犹太裔申请者。然而,到了 1940 年前后,哈佛的录取率却从 95% 骤降至 25%。我所查阅的大多数资料都将这一变化归因于《退伍军人权利法案》。这项立法本意是好的,旨在鼓励二战退伍军人接受高等教育。结果,大量退伍军人响应政府号召,申请入学,导致哈佛大学在其悠久历史上首次面临巨大的招生压力,难以应对。
然而,事情并非这么简单。
你之前已经见过了这张图表——它展示了美国人(按性别划分)的大学毕业率。图表按出生年代排序,这意味着横轴上的 1920 年代表的是 1940 年代就读大学的人群,也就是我们所说的退伍军人。《退伍军人权利法案》的影响在图表上清晰可见——在 1920 年出生的人群中,男性的入学率出现了显著上升,而女性则没有,这正符合我们对退伍军人群体的预期。然而,这项法案仅将大学毕业率从 10% 提高到 15%(相比之下,现在的毕业率已达 40%)。更值得注意的是,在《退伍军人权利法案》实施后,大学毕业率又开始下降——这符合我们对一次性战争带来的短期影响的预期。而在 1955 年到 1960 年间,哈佛大学的录取率又回升到了约 40%。
1938 年至 1952 年间出生的这一代人中,大学入学率出现了显著攀升,与此同时,哈佛大学的录取率相应下降。是什么原因导致如此多的人突然涌入大学校园?答案是:他们在逃兵役。当时大学入学人数激增,很大程度上是因为人们利用上大学这个合法途径来规避被派往越南战场的命运。
需要指出的是,这本应该只是一次性的冲击,而且主要影响男性群体。然而,为何我们却观察到在这一时期,大学毕业率增长了整整四倍,并且这种增长趋势似乎对男性和女性都产生了同等的影响?
一种广为流传的观点认为,过去一个世纪以来,工作变得越来越难,因此劳动者需要接受更多教育。然而,我始终对这种说法持怀疑态度。在一些国家,学生可以直接进入医学院或法学院学习,而不需要预先获得大学学位。以编程这一现代高技能复杂职业为例,许多程序员是大学辍学生,还有相当一部分人根本没有接受过高等教育。与此同时,各种编程「训练营」如雨后春笋般涌现,在传统大学教育体系之外提供编程技能培训。即便在那些确实要求大学学历的工作岗位上,所学专业往往与实际工作毫不相干。以我个人经历为例,我成年后从事的两份工作——英语教师和医生——都要求应聘者必须具备大学学位。然而,我的大学教育背景(哲学专业)与这两份工作可谓风马牛不相及。这种学位要求更像是一种阶级壁垒或身份标识,而非意味着只有精通哲学的人才能成为优秀的教师和医生。我深知这一观点可能颇具争议,限于篇幅无法在此详尽论证。如果你想深入了解这个话题,可以阅读我的文章《反对补贴郁金香》和《SSC 的毕业演讲》,或者更推荐 Bryan Caplan 所著的《反对学校教育的依据》一书。
如果说技能需求的增长并非导致大学入学率上升的主因,那么真正的原因是什么呢?尽管我在此无法详细论证(建议读者参考 Caplan 的著作),但这可能源于一种自我强化的社会信号机制。当上大学的人数达到一定规模后,社会普遍形成了一种共识:聪明勤奋的人应该拥有大学学位。这使得大学学历成为衡量智力的标志,反之,没有大学学历则可能被视为能力不足的表现。设想一下,如果只有 10% 的优秀人才上过大学,那么没有学位并不意味着一个人就不够聪明或勤奋。但如果 90% 的优秀人才都有大学学历,那么缺少学位可能会让人质疑其智力和工作态度。这种循环效应意味着,在 20 世纪中期社会变革的影响下,知识密集型行业对学历的要求越来越高,这迫使女性和后几代男性不得不继续追求高等教育以保持竞争力。更为棘手的是,政府提供的所谓「免费」大学贷款政策,不仅加剧了这个问题,还破坏了可能遏制这种趋势的自然市场调节机制。
与此同时,多种因素的汇集开始让那种凭直觉的「看着顺眼就行」的招聘方式失去市场。首先,社区纽带逐渐弱化,使得雇主难以与潜在雇员建立社交联系。其次,能够凭直觉用人的家族企业正逐步被大型公司取代,在这些公司里,面试官需要向上级解释他们的录用决定。再者,人们对种族主义问题的日益关注使大家意识到,基于直觉的招聘往往会对少数族裔造成歧视。歧视诉讼的出现更是促使雇主采用客观标准进行招聘,以便在必要时证明拒绝某位应聘者并非出于种族因素。最高法院在 Griggs 诉杜克电力公司一案中的裁决可能或可能没有产生影响,尽管这一点尚有争议。该裁决使得公司对求职者进行能力测试在法律上变得有风险。这些因素共同造就了一个「完美风暴」,雇主迫切需要一些客观标准来评估潜在的新员工,而传统的评估方式已经不再适用。在这样的背景下,大学学位作为衡量智力的信号,以及人们根据大学选择性进行的更细致的分类,恰好完美地填补了这一空缺。
随着社会逐渐认定知识型工作需要大学学历,加之自动化、全球化和社会不平等程度的加剧,知识型工作越来越成为谋生的必要途径,这一趋势逐步形成。
如果我的这一解释成立,那么在其他不具备这些特定因素的国家,大学入学率的增长应该不会如此迅速。虽然我没有全面的跨国数据,但以下是我所能找到的信息:
据说英国的大学入学率一直处于较低水平,直到 1992 年一项旨在鼓励入学的法案出台。不过,这种变化看起来部分原因可能只是他们将一些其他类型的教育机构重新归类为大学。我不确定英国的实际情况与美国相比如何,欢迎了解这方面情况的英国读者提供更多信息。在世界其他地区,大学入学率长期落后于北美,但这种按大洲划分的类别可能混合了处于不同经济发展水平国家的数据。对于这一点,我并没有太多了解。
让我们来分析引言中的图表。这些图表显示,自 2005 年左右以来,美国的大学入学率一直保持稳定。那么,是什么因素导致了这种增长趋势的停滞呢?这些文章指出了一些相关的趋势。
第一,经济形势通常是影响大学入学率的主要因素。数据显示,2008 年经济衰退期间,大学入学率略有上升,而在近期的经济繁荣时期,又有所下降。然而,纵观整个经济周期,大学入学率的增长似乎总体上已经放缓或停止,这与过去的经济周期模式有所不同。
第二,出生率的下降也是一个不容忽视的因素,直接导致了上大学的适龄年轻人减少。尽管国家总人口仍在增长,但这主要是由于移民的贡献。然而,许多移民是成年人,他们往往没有接受过高等教育,因此对大学生人口的增长贡献有限。
第三,大学学费不断攀升。令人惊讶的是,这也成为了导致入学率下降的一个原因。我原本认为正是学生人数过多才导致学费居高不下,但现在看来,这两个因素可能是相互影响的。
第四,营利性大学正在崩溃。
在某些情况下,政府已经因这些院校是彻头彻尾的骗局而将其关停。另一些情况则是,潜在学生变得更加明智,意识到这些学校纯属骗局,因而对就读失去了兴趣。这类院校通常以那些无法进入其他大学的人群为目标做广告(有人会说是「掠夺」),因此它们的倒闭表面上造成了大学入学或毕业率的下降。
这些因素可能都有一定关联,但在我看来影响力似乎有限:它们或许能解释年度间的变化趋势,却无法说明为什么那个长期推动更多人接受大学教育的社会运动已经停滞不前。
或许这个趋势只是达到了一个自然的上限。目前已有 70% 的高中毕业生在上大学。剩下的 30% 中可能有相当一部分人面临严重的社会经济问题或健康问题,这使得他们上大学变得异常困难。
此外,值得注意的是,只有约 60% 的大学生能在预期时间内或接近预期时间内毕业。一些经济学家已经提出了「理性避免上大学」的模型,认为那些预计无法从大学顺利毕业的人会理性地选择不浪费金钱去尝试。
3 既然过去十年申请大学的学生人数一直保持稳定或呈下降趋势,为什么顶尖大学的录取竞争却变得更加激烈?
回顾近十年来的情况:美国学生申请大学的总人数呈下降趋势(申请四年制私立大学的人数基本保持稳定)。然而,哈佛大学的录取率却骤降了一半,其他顶尖学校也出现了类似程度的下降,而大多数优秀和中等水平的大学录取率也有所下降,只是幅度相对较小。与此同时,人们普遍认为学生在申请前需要保持完美学业记录的压力越来越大。为什么?
3.1 这个问题可能是由国际学生数量增加引起的吗?
这个假设似乎能很好地解释美国本土学生申请人数保持稳定,而大学选拔变得更加严格的现象。
哈佛大学对「国际学生」的定义并不统一,在几种不同的定义之间存在模糊地带。不过,我们可以认为,当哈佛表示 2013 届学生中有 10% 是外国公民,而 2022 届学生中有 12% 是外国公民时,这两个数据是可以直接比较的。这两届学生恰好涵盖了我们关注的时间段,但这种变化并不算显著。更值得注意的是,纵观美国所有高校,国际学生的入学人数实际上呈现下降趋势,而非增加。这种现象可能部分源于特朗普政府实施的严格签证政策,也可能与国际社会普遍认为美国对外国人的敌意在增加有关。
鉴于国际学生的申请总体呈下降趋势,即便顶尖学校也仅有微小增长,这一因素似乎难以解释当前情况。
3.2 问题是否源于更加注重种族因素的录取政策?
顶尖院校是否正在加大推行平权行动的力度,更倾向于录取少数族裔和低收入群体,从而使那些习惯于评论大学录取状况的上层白人群体处境愈发艰难?或者,大学是否正在放宽对亚裔优秀学生的限制,最终导致相同的结果?
这些猜测与大学近期的公开言论相符,但实际上并没有太多证据支持。哈佛大学一直密切关注其学生群体的种族构成,然而 2010 届和 2022 届学生的种族比例并未发生变化。《纽约时报》的调查结果更加出人意料:与 35 年前相比,白人在大学中的代表性实际上有所提高(相对于他们在美国人口中的比例),不过亚裔才是真正的受益群体。
《泰晤士报》并未对这一现象给出解释。造成这种情况的原因可能是平权行动的影响力正在减弱,包括一些州已经立法禁止实施平权行动。另一个可能的原因是大量教育程度较低的墨西哥移民涌入,他们的后代可能需要几代人的时间才能完全融入社会,使其家庭的大学入学率达到与白人或早期拉丁裔移民家庭相当的水平。
那么亚裔群体的情况又如何呢?虽然亚裔学生的录取人数确实出现了大幅增长,但这主要发生在本文讨论的时期之前。常春藤盟校很可能存在一种非正式的亚裔学生配额制度,这个配额在过去十年中基本保持稳定。尽管亚裔人口持续增长,他们的学业成绩也不断提高,但这可能只会加剧亚裔群体内部的竞争,而不会对其他种族的申请者产生实质性影响。
3.3 问题是否在于每个学生的申请学校数量在增加?
这里有一个值得关注的现象:尽管近十年来申请上大学的美国本土学生和国际学生总数并未增加,哈佛大学收到的申请数量却翻了一番,从约 20,000 份激增至超过 40,000 份。这究竟是怎么回事呢?
近年来,大学生平均递交的申请数量呈现显著上升趋势。
以我为例,我深知自己并非哈佛大学的理想人选。然而,在我筛选大学时,母亲却极力劝说我申请哈佛。她说:「试试看吧!只需花几个小时而已!说不定你真的会被录取呢!如果不尝试,你永远都没有机会!」
果不其然,哈佛并未录取我。但我母亲采用的这种策略正日益普及。这种现象部分可能源于社会平等意识的真正提升。也许某些方面已经发生了积极的变化,以至于普通美国人确实相信自己有机会进入常春藤盟校。然而,这种趋势背后也可能隐藏着大学为提高排名而采取的一种阴险伎俩。在 US News 等大学排名指南中,学校的排名部分取决于其「选拔性」,即拒绝申请者的比例。如果学校鼓励更多不合格的考生申请,随后拒绝这些申请,就能显得更加「有选拔性」,从而提升排名。
然而,申请数量的激增主要归功于日益简化的大学录取程序,尤其是通用申请系统的推广。我并不赞同母亲的建议,因为在过去,每份大学申请都意味着要重新填写一堆表格,反复叙述自己的生平经历,然后将所有材料整理到一个附有支票的牛皮纸信封里。这个过程就像在报税,只不过还要额外回答一些论文题目。更让人头疼的是,你可能要为每所心仪的学校重复这个繁琐的过程。不过现在,这些烦恼已成为历史。包括整个常春藤联盟在内的 800 所大学都接受通用申请。让我们再来看看《纽约时报》的报道:
曾几何时,提交六份大学申请就已经不算少了,递交八份更是雄心勃勃的表现。然而,对于越来越多日益焦虑的高中毕业生来说,这样的数字如今却只能算是起步罢了…
据那些疲于应对的辅导员们反映,对于 2015 届中那些瞄准更具竞争力院校的学生而言,提交 10 份申请已是司空见惯;20 份申请也不再鲜见;就连 30 份也并非天方夜谭。但为何要止步于此?弗吉尼亚州亚历山大市的托马斯·杰斐逊科技学校的学生服务主任 Brandon Kosatka 最近就遇到一位立志进入音乐学院的学生,为了圆梦,她竟然申请了 56 所大学。Naviance(一款广受高中生及其辅导员青睐的申请追踪工具)的发言人透露,他们发现有位用户的「申请院校」列表中已经包含了 60 所高校。而去年的最高纪录更是高达惊人的 86 所。
那么,这是否意味着大学入学竞争真的变得如此激烈?让我们换个角度思考:假设在过去,每个尖子生要么申请哈佛,要么申请耶鲁。而如今,每个尖子生既申请哈佛又申请耶鲁,这就导致两所大学的申请人数都翻了一番。由于录取名额保持不变,表面上看他们的录取率似乎降低了一半。但实际上,两所大学的入学难度是否真的提高了呢?这种竞争加剧的现象,会不会只是一种错觉?
这种解释并不完全准确。让我们仔细分析一下:在第一种情况下,耶鲁大学会期望所有被录取的学生都会选择就读。而在第二种情况下,耶鲁大学会预计约有一半被录取的学生可能会选择哈佛,因此它需要录取两倍的学生数量,但每份申请的实际录取率并不会改变。
然而,如果越来越多的人采取了我母亲的策略——即使不完全符合哈佛的入学标准,也抱着「死马当活马医」的心态申请哈佛——这确实可能成为一个重要因素。假设那些实际上不太适合哈佛,但被母亲高估的申请者数量是真正适合哈佛的申请者的两倍,那么哈佛的申请量就会激增至原来的三倍。如果哈佛录取了这些申请者,他们必定会选择就读哈佛,因此哈佛无需提高录取率来弥补可能的缺额。在这种情况下,确实会产生一种竞争变得更加激烈的错觉。
最后,这一过程可能会强化选拔分类的效果。假设历史上首次出现这样的情况:一位犹太母亲能够准确评估她儿子的智力水平,而我真是块哈佛的料,只是一直在错误地低估自己。如果通用申请系统的存在使更多人抱着「姑且一试」的心态申请哈佛,而哈佛的招生委员会又能够胜任他们的工作,那么最优秀的学生就能更高效地与顶尖学府匹配。在过去,哈佛可能因为申请者不合理的悲观预期而错失了许多优秀人才;而现在,这些人都会提交申请,从而使竞争更加激烈。
回顾过去,我认为很多人,即便是那些真正聪明的人,也只是选择了离家最近的、还算不错的州立大学。这部分源于谦逊,部分是因为人们更重视家庭和社区,还有部分原因是当时人们并不认为大学是衡量一个人价值的唯一标准,也不会认为非进入常春藤盟校不可,否则人生就毁了。如果现在这些人都开始尝试申请哈佛,竞争无疑会进一步加剧。
那么,我们能否量化这种变化呢?
这份数据是我能找到的最有价值的资料。它显示,过去十年间,公立大学的本州学生比例下降了 5%。这种现象很可能与学生的自我定位有关——那些精心规划未来的学生倾向于选择他们能够进入的最优秀学校,而不是仅仅局限于本州最近的学校。不过,这种变化并不十分显著。我怀疑,尽管无法确证,这个数据可能掩盖了顶尖院校更大幅度的变化。
3.4 问题会不会仅仅是学生们变得更加努力了?
让我们设想这样一种情况:同样的学生申请同样的学校,但他们的准备过程发生了变化。2009 年时,他们态度随意,SAT 考试前一晚才开始复习;而到了 2019 年,他们都聘请了私人辅导老师,还积极参与五项课外活动。在这种情况下,2019 年的大学录取无疑会显得更具竞争性。
然而,任何试图衡量这一现象的尝试都会受到反向因果关系的干扰——努力程度的提高可能会导致录取变得更具选择性,但录取变得更具选择性必然会促使学生付出更多努力。我目前还不确定该如何解决这个复杂的问题。
如果更加刻苦的学习能够提高 SAT 成绩,那么这些成绩或许可以作为衡量学生努力程度的一个参考指标。然而,2016 年 SAT 考试进行了改革,使得新旧分数难以直接比较,因此我们只能对之前年份的成绩进行分析。数据显示,从 2005 年到 2015 年,数学和阅读两个科目的平均分均呈现下降趋势。这一现象可能是由于参加 SAT 考试的学生人数显著增加(从 2008 年的 150 万增至 2018 年的 210 万),导致考生群体的整体水平有所下降。考虑到大学入学人数保持稳定或略有下降,这种趋势似乎有些出人意料。但一个可能的解释是,作为推动教育公平的措施之一,学校正在鼓励更多学习成绩较差的学生参加 SAT 考试,以「争取上大学的机会」,尽管这些学生最终可能并不会真正进入大学。支持这一理论的证据是,在以前可能不会参加 SAT 考试的群体中,如黑人、西班牙裔和其他较贫困的少数族裔,分数下降最为明显。相比之下,白人的分数保持稳定,而亚裔的分数则呈上升趋势(这可能与越来越多的高素质中国移民有关)。这是我能想到的最合理的解释,来解释为什么会出现这种分数变化模式。然而,这也意味着 SAT 分数作为衡量学生是否「更加努力」的指标已经失去了用处。
学生们为何似乎比从前更加努力?一种可能的解释是,社会现象从发生到被广泛认知通常需要十年左右。因此,90 年代大学入学人数的激增以及随之而来的竞争加剧,可能直到近年才真正影响到普通学生,使他们意识到上大学已变得极为困难,必须努力提高自身竞争力。另一方面,互联网的普及让新一代易焦虑的父母们越来越多地接触到这样的信息:除非自己的孩子十全十美,否则不仅无法进入理想的大学,甚至可能面临凄凉的人生结局。
此外,传统评判标准的衰退可能正导致人们越来越重视课外活动,这对大学生造成了更大的压力。由于成绩膨胀现象,大学不再像从前那样看重高中成绩;由于优绩主义已经过时,他们对 SAT 考试的关注度也在下降。这意味着课外活动——诸如学生会、社团、实习、慈善工作等——变得愈发重要。尽管存在一些误解,SAT 本质上是一种智力测试,并不会真正奖励过度焦虑和金钱投入。然而,获得合适的课外活动经历却绝对会鼓励学生过度焦虑并投入大量金钱。也许二十年前,你只需参加「智力抽奖」并期待最好的结果,而如今你却需要拼命工作,努力成为青年奋斗者俱乐部的副主席。
不过,这些都只是推测;我实在不知道如何在这些问题上获得可靠的数据。
3.5 资金削减是否正在减少可用的大学名额?
有观点认为,公共教育经费的削减导致公立大学可提供的入学名额减少,这意味着同等数量的学生要竞争更少的机会。一项研究证实了公共资金确实大幅缩减:
为应对这种情况,这些公立大学采取了提高学费或增加缴纳更高学费的外州学生比例等措施。数据显示,这些措施几乎完全弥补了公共资金的减少,甚至使得现在每名学生获得的资金比公共资金充裕时还要多。
加州的数据也呈现了类似趋势:
然而,州政府支持的减少是否实际影响了入学率仍不明确。大学似乎主要是通过大幅提高学费来应对这一变化。
数据显示,2007 年公立大学的学生人数是私立大学的 2.8 倍,根据公立和私立院校的统计。到 2017 年,这一比例略微上升到 2.9 倍。如果公立大学确实面临吸收学生能力不足的问题,我们可能会预期公立大学学生所占比例下降,但事实并非如此。
总的来说,公立大学的经费削减似乎并未对这一现象产生显著影响。
3.6 我们能得出哪些结论?
过去十年里,学业竞争日益激烈,其中最主要的原因是每位学生的申请数量增加,这主要得益于在线通用申请系统的普及。尽管申请者总数保持稳定,但像哈佛这样的顶尖大学收到的申请数量却翻了一番。值得注意的是,这种看似加剧的竞争部分属于统计假象,但由于分类效应的增强,某些方面的竞争加剧可能确实存在。
其他可能的原因包括:人们普遍意识到竞争激烈,从而更加积极地参与竞争;以及高校逐渐减少使用难以人为操纵的评价指标(如 SAT 成绩),转而更多地采用容易被刻意包装的指标(如课外活动)。
4 大学以上的教育领域情况如何?
竞争正在变得更加激烈。
从 2006 年到 2016 年,美国医学院的申请人数增加了 35%(请注意,这里指的是申请人数的增加,而非申请次数的增加)。
一项涵盖不同年份的统计数据显示,2002 年至 2017 年间,医学院录取人数增长了 28%。尽管这一数据无法与申请人数直接对比,但我们可以大致推断,医学院招生名额的增长速度明显低于申请人数的增长速度,很可能慢得多。
正如预期,医学院入学考试(MCAT,相当于 SAT 考试的医学院版本)的录取分数线一直在逐年攀升。
这一现象也与我从医学院和住院医师招生工作人员那里得到的印象不谋而合。几年前,我有机会参与一个并不怎么令人印象深刻的项目的住院医师面试,那些应聘者实在是太可怕了。
法学院在这方面保存了详尽的数据(感谢法学院的努力!)。US News 明确指出,即便是在顶尖项目中,法学院的入学竞争程度也不如 2008 年那般激烈。以下是相关图表:
尽管我们常有律师遍地的感觉,但事实上自 1970 年代以来,法学院的入学率增长仅与人口增长保持同步,而且在过去十年里还呈现下降趋势。这可能是因为人们逐渐意识到,律师这一职业已不如从前那般利润丰厚。
与法学院形成鲜明对比的是,研究生院几乎没有保留任何相关统计数据,研究生教育的现状可以说是一个巨大的未解之谜。我们所掌握的信息,仅限于授予的博士学位数量:
...就这些而已。
我之所以萌生写这篇文章的念头,部分原因是听到一位著名科学家(具体是谁已记不清了)分享他的经历。他回忆道,在 1940 年代他还是学生时,几乎是机缘巧合地进入了科学领域,在一个优秀的实验室找到了理想的工作,随后逐步晋升,最终成为实验室主任,并做出了重大科研发现。他指出,这种情况在今天几乎是不可想象的——现在想要进入科学研究生院,你必须表现出极大的热情;而一旦入学,你还得不断撰写研究计划,努力成为最优秀的人才,才有可能在未来拥有自己的实验室。我经常听到类似的言论,但一直找不到能够将这种观点置于正确历史视角中的确凿证据。如果有人对科学领域的研究生教育和工作的历史脉络有更深入的了解,请不吝赐教。
我对这个问题也很感兴趣,因为它能进一步解释本科生之间日益激烈的竞争。如果更多人把目标锁定在医学院或研究生院,那么进入顶尖大学就变得格外重要,因为这将大大提高他们未来的成功机会。此外,社会不平等程度的加剧和教育投资回报的提高,使得需要高等学位的工作比仅需学士学位的工作更具吸引力,这也可能解释了学业竞争加剧的部分原因。然而,除了医学院的相关数据外,我没有找到其他有力证据支持这一观点。
5 对大学录取的过度焦虑是否合理?
Dale 和 Krueger 在 2011 年的研究中探讨了这个问题,他们以终身收入作为因变量。
研究结果总体表明,就读门槛更高的大学并不能带来显著优势。虽然哈佛大学的学生收入远高于普通大学的学生,但这完全可以解释为哈佛只录取最优秀的学生。在控制个人能力因素后,就读门槛更高的大学并不会带来更高的收入。
一项针对特定群体的深入研究发现,即使在考虑了学生原有能力的情况下,来自弱势背景的学生仍然能从就读顶尖大学中获得显著收益。具体而言,黑人、拉丁裔以及来自教育程度较低家庭的学生,都能从被精英大学录取这一经历中受益。虽然该研究报告并未对这一现象的原因做出推测,但有一种广为人知的观点认为,大学教育的价值不仅在于传授专业知识,还在于帮助学生融入上流社会。这种融入过程包括学习上层阶级的行为准则、语言表达方式,以及建立高端人际网络。对于本就出身优越的学生来说,这些可能显得不那么重要,但对于其他背景的学生而言,这些经历可能带来巨大的社会流动机会。
另一种可能的解释是,大学学历在就业市场上扮演了重要的信号角色,有助于求职者突破统计性歧视的障碍。研究表明,当雇主要求应聘者提供药物测试结果或犯罪记录时,黑人求职者往往更容易获得工作机会。这一现象的可能原因是,某些存在偏见的雇主倾向于对黑人群体持不恰当的负面假设(例如认为他们更可能有犯罪或吸毒问题)。因此,当黑人应聘者有机会证明自己并非如此时,实际上是帮助他们获得了与其他族裔应聘者更加公平的竞争环境。同理,如果雇主一开始就对白人和亚裔应聘者的能力持积极看法,而对黑人和拉丁裔应聘者的能力存疑,那么来自知名大学的学历可能不会显著改变雇主对白人和亚裔的评价,但却可能大幅提升他们对黑人和拉丁裔应聘者能力的认可程度。
Dale 和 Krueger 的研究还发现,在他们所研究的 1976 年至 1989 年期间,大学教育的价值并未增长。
这是否意味着至少白人和亚裔可以不再为进入哪所大学而倍感焦虑?
那么,如果你想进入医学院或法学院呢?虽然我找不到同样严谨的研究,但为准医学生提供建议的网站告诉他们,本科就读的大学并不如他们想象的那么重要。对于有志成为律师的人来说,情况似乎也是如此。一如既往,关于研究生院的可靠数据仍然匮乏。
如果你想成为一个人脉广泛、举足轻重的人物又该怎么办?
从这份资料中我们可以看到,按政党划分的毕业于常春藤盟校的国会议员百分比随时间的变化:
仅有约 8% 的国会议员毕业于常春藤盟校,考虑到他们在其他方面的精英地位,这个比例低得令人吃惊。在民主党人中,这一趋势呈上升态势,但在共和党人中则保持不变。显然,这里存在 40-50 年的时间滞后,我们还需要很长时间才能知道今天的大学生未来当选国会议员的可能性有多大。但总的来说,这些数据看起来令人鼓舞。
从另一个视角来看,美国总统和最高法院大法官的学历背景几乎被常春藤盟校所主导。近五任总统无一例外都曾就读于常春藤盟校(克林顿虽然本科毕业于乔治城大学,但他的法学学位是在耶鲁大学获得的)。在现任最高法院大法官中,除了 Clarence Thomas 之外,其他所有人的本科学历都来自常春藤盟校,而包括 Thomas 在内的全体大法官都在常春藤盟校获得了法学学位。然而,我们很难判断这一现象是源于这些人本就拥有卓越的能力,还是这些顶尖学府为他们的成功奠定了基础。
科技企业家通常都曾就读于顶尖大学。然而,这里我们似乎可以观察到一个有趣的现象,暗示他们的成功更多源于自身的能力:许多人选择了中途辍学,这表明无论是课程内容还是学位所带来的社会认可,对他们而言都不是至关重要的。例如,比尔·盖茨、马克·扎克伯格和拉里·埃里森都从顶级学府中途退学;埃隆·马斯克虽然完成了本科学业,但在斯坦福大学的博士课程仅仅坚持了两天就选择退出。这些案例似乎表明,成功的科技企业家往往来自那些有能力进入顶尖大学的群体,但他们的成功并不一定得益于大学教育本身。
总的来说,除非一个人来自弱势群体,否则几乎没有确凿证据表明,作为本科生就读于一所顶尖大学会对其长远发展产生显著影响。这一结论的唯一例外可能是像总统或最高法院大法官这样的少数特殊职位。
这并不意味着选择一所优秀的研究生院就不重要了;事实上,相关研究表明,在许多学科领域,要成为大学教授几乎必须毕业于一所声誉卓著的研究生院。然而,对于本科院校的选择,似乎并不存在如此严格的要求。
题外话:加州的学校
我在文章开头提到,加州人普遍认为更难被加州的大学录取。虽然这种看法在全美各地都存在,但在加州似乎尤为普遍。尽管这些都是轶事证据,但这些故事都惊人地相似:
我朋友的女儿是一名出色的学生:GPA 高达 3.85,高中期间修读了 5 门 AP 课程,还是校竞技游泳队成员,累计志愿服务时间超过 100 小时,并积极参与各种校园活动。然而,她申请的 4 所加州大学系统的学校竟全部拒绝了她。值得注意的是,这些学校甚至不是加州大学系统中最顶尖的,如伯克利。她原本认为加州大学圣地亚哥分校和圣克鲁兹分校是稳妥的选择,因此没有申请其他学校。这个结果让整个家庭都陷入了沮丧和困惑中。
官方数据似乎也支持了这一观点。下图中,虚线表示申请人数,点线表示录取人数,实线表示实际入学人数:
…然而,我也无法确定这种现象有多少是由于学生们普遍增加了申请学校数量造成的,这种情况在其他地方也很常见。
为什么加州大学系统受到的冲击格外严重呢?起初,我猜想这可能是因为加州的人口增长速度超过了全国其他地区,但事实似乎并非如此:从 1990 年到 2000 年,加州和整个美国的人口增长率都是 13%。而正是在这十年间,2008 年至 2018 年间上大学的那一代人出生了。
《大西洋月刊》指出,由于预算缩减,加州大学系统正在增加录取州外学生(他们需要支付更高的学费)的比例,这就减少了加州本地学生可以获得的入学名额。但这种影响真的有那么大吗?
数据显示,在过去的十年里,非加州居民学生的比例从 6% 上升到了 12%。这种程度的变化应该不至于将情况搞得如此糟糕。
说实话,我对此并没有十足的把握。一种可能的解释是,加州的学校质量确实非常出色。在 money.com 评选的最佳大学榜单中,排名前十的学校里就有四所是加州大学。此外,你还可以在宜人的加州生活,而不是在寒冷的新英格兰地区挨冻。考虑到大学入学危机主要集中在顶尖学校,这可能就是加州受到特别严重打击的原因。
我对这个解释还不太满意。如果你知道更多相关信息,请不吝赐教。
6 结论
-
有充分证据表明,与 10 年前、50 年前或 100 年前相比,当今顶尖大学的入学竞争明显更加激烈。对于中上层次的大学,也有相当程度的证据支持这一趋势。而对于中下层次的大学,入学仍然相对容易。
-
一直到 1900 年,顶尖大学、医学院或法学院的入学并不存在竞争。此后,一个持续扩大招生规模的长期趋势(可能源于社会财富增加和对技能需求的提升),加上退伍军人法案和越战征兵带来的两次重大冲击,导致申请人数激增。这使得学校不堪重负,最终被迫开始筛选申请者。
-
直到十年前,变化主要源于申请人群体的持续扩大。然而此后,申请人群体(包括国内和国际)停止增长,并开始呈现缩小趋势。值得注意的是,近十年来竞争加剧的原因,与申请人群体规模的变化并无直接关联。
-
近十年来的变化不太明确,但最关键的因素可能是申请多所大学变得更加便捷。这导致了每录取一人的申请数量增加,但这种增加在很大程度上可能只是表面现象。然而,如果这意味着学生能更有效地根据自身能力选择合适的申请对象,那么部分增加可能是真实的。另一种可能是,学生们陷入了一种高度竞争的平衡状态(类似于军备竞赛),从而加剧了竞争,但由于缺乏数据支持,这仅仅是一种推测。
-
医学院的入学难度在不断提高,而法学院的入学则变得相对容易。至于研究生院的情况,目前缺乏可靠的数据来支持任何明确的结论。
-
除非你来自弱势背景,否则所有关于进入好大学的苦恼可能都是浪费时间。对于大多数人来说,进入门槛更高的大学并不能转化为更有利可图的职业,或更高的接受研究生教育的机会。最高层可能存在孤立的例外,比如最高法院法官。
我之所以对这个话题产生兴趣,部分源于一种跨越政治光谱的普遍社会情绪——人们普遍认为一切都在变得越来越糟。我此前曾探讨过这种情绪的一个侧面——必需品价格不断上涨——并证实了这一现象的确存在。另一个值得关注的侧面是,人们普遍认为如今的社会竞争更加激烈,各种机会也越来越难以获得。我父母那一代常常这样描述他们的高中时光:可以无所顾忌地偷懒,不必过分担心,因为他们知道无论如何都能进入一所不错的大学。而千禧一代的故事则充满了对残酷现实的描述:即便你有完美的成绩、出色的 SAT 分数,以及数百小时的课外活动,仍有可能被所有梦想中的学校拒之门外,这是一个弱肉强食的可怕世界。
对于这个问题,我还没有得出一个明确的结论。至少在十年前,大学之所以变得更难进入,是因为有更多人能够(或感到必须)去上大学。而过去十年的情况则更为复杂,可能是由于社会按能力进行了更细致的分层。这种变化究竟是好是坏?我也不能确定。我仍然觉得自己没有很好地理解到底是哪里出了问题,我们父母那一代描绘的美好图景是否真实,或者除了彻底扭转所有朝着平等主义发展的进程之外,是否还有其他方法可以让我们回到过去。我很希望能听到一些比我更了解这个领域的人的看法。
就算孩子缺上几年学,日后也能赶上
原文:Kids Can Recover From Missing Even Quite A Lot Of School (astralcodexten.com)
2021 年 8 月 17 日
一、引言
在公立学校停课或转为线上授课期间,我认识的一位家长为了挣钱送孩子上私立学校,不得不加班加点拼命工作,直到精疲力竭。他们觉得其他家长肯定也都会这样做,不然自己的孩子就会远远落后,进不了名牌大学,这辈子就完了。
我听说,这种情况现在又再次上演了。随着越来越多的学校停办,很多父母忧心忡忡,提出类似这样令人担忧的问题:「我该冒险送免疫力低下的孩子去上学,还是眼睁睁看着他落后,将来一事无成?」
(另请参见这篇故事)
你大概能猜到我在这个问题上的立场。和所有人一样,我中学时学过一年西班牙语,结果和所有学过这门语言的人一样,到头来只记得一句「no hablo Espanol」,还很可能把几个字母上的变音符号都给忘了;和大家一样,我在高中学过高等数学,到现在和其他人一样,顶多也就会点基础代数和与工作相关的简单运算,其他的早就还给老师了。说起高中代数,我唯一的印象就是「高斯消元法」,老实说,我都不确定那究竟是不是个游戏名;和其他人一样,我也曾把许多重大内战战役的名称和日期倒背如流,不过现在——好吧,这些我其实还都记得,但那只是因为内战的历史着实引人入胜。
我认为这就是问题的关键。我们在学校里学了很多东西,但最终记住的只有那些与我们的兴趣、工作和生活紧密相连,并且反复接触和实践的内容。如果我生活在西班牙,我一定会记住西班牙语;如果我从事数学工作,我肯定不会忘记高斯消元法。我觉得,对于一个充满好奇心的孩子来说,你所接触和感兴趣的很多东西,他都会主动去学习;而那些你不感兴趣的内容,充其量在你脑海中匆匆掠过,然后迅速遗忘,只留下应付考试的浅薄印象。
学校教育的另一个问题在于重复。我在五年级、八年级和十一年级都学过一模一样的南北战争知识。我记得《记忆传授人》(The Giver)这本书在许多英语课上都重复阅读过。更别提那些真正重要的技能了,比如论文写作和资料引用,年复一年地强调个不停。
(说实话,我至今也不知道如何正确引用资料,只是依稀记得「MLA 格式」好像挺重要,还有一个「芝加哥风格」,但我可能把它跟芝加哥比萨饼搞混了。每当我需要引用资料时,我就点击 PubMed 右上角的「引用」按钮,然后照着它的指示做。)
我由此推测,一个普通学生就算缺课一两年也不会带来什么严重的、长期的影响。他们在错过学习的那两年后参加标准化考试,成绩可能会落后于一直在校的学生。但用不了多久,他们就能重新赶上。我认为,你没必要为了供孩子上私立学校而超负荷工作,把自己累垮;你也无需冒着损害健康的风险,强迫免疫力低下的孩子去教室上课;我觉得你完全可以放轻松。
接下来,我想分享一些让我产生上述看法的证据。
二、各种非典型情况中的证据支持
在 Benezet 实验中,某学区在六年级之前(学生大约 10-11 岁)完全不开设数学课,到六年级才开始系统学习数学。到了学年末,这些学生的数学成绩就已经赶上了传统教育下学了5 年数学的学生。在我看来,这意味着许多教育只是在机械地给幼小的学生灌输知识,而这些知识等他们长大后很快就能掌握。毫无疑问,没有在一至五年级上数学课似乎不会对学生产生重大长期影响。
[**更新:**评论者提出了一个强有力的论点,我误解了 Benezet 实验;请暂时忽略这一段]
卡特里娜飓风过后,由于学校被毁、或不得不疏散到其他城市与亲戚同住等原因,许多新奥尔良的学生缺课了一到两年。灾后,新奥尔良转向以特许学校为主导的教育体系,学生的考试成绩有所提高,总体上优于同龄人。关于这是否意味着特许学校很好,人们议论纷纷,但无论如何,少上一两年学似乎并未给新奥尔良的学生造成太大影响。
数据显示.:新奥尔良学生的 ACT 成绩从卡特里娜飓风前到飓风后实现了提升,尽管飓风过后的孩子们曾经缺课一到两年之久。我无意淡化教育工作者和学校改革者为帮助学生赶上进度所付出的辛勤努力,但在这些努力之下,学生确实重新跟上了学习进度。我相信,教育工作者也会投入大量心力,帮助因新冠疫情而被迫缺课的孩子们追赶学习进度。
有些父母选择让孩子接受「非学校教育」。也就是说,他们反对传统的学校教育模式,因此让孩子在家上学。但他们不会进行系统化的教学,只是在孩子主动提出问题时给予解答。值得注意的是,这类家庭往往经济条件较好且家长受教育程度较高。尽管如此,这类孩子在学业上与公立学校的学生相比,平均会落后大约一个年级的水平,但也仅限一个年级(当然,随着孩子年龄增长,这一差距可能会逐渐扩大)。然而,当这些非传统教育下的孩子申请大学时,他们展现出了丰富的知识储备,成功进入大学的比例相当高,并且在大学课程中也有着出色的表现。我认为有一些证据表明,从一些传统指标来看,根本不上学会损害这些孩子的表现。但这并没有对他们造成太大伤害。考虑到完全没有上过学所带来的影响是如此之小,我认为即便缺课一两年,对孩子的发展也不会造成太大的负面影响。
这项研究深入追踪了儿童癌症患者的学业发展轨迹。结果表明,患有神经系统癌症、需接受放疗的癌症,或是在学龄前幼年阶段确诊的癌症患儿,其长期的学业成绩往往会受到不同程度的影响。这背后的主要原因,是癌症本身或其治疗过程可能带来的生理副作用。不过,对于其他类型的癌症,特别是那些在学龄期才发病的癌症,患者的学业成绩并未受到显著影响。在实际生活中,儿童癌症患者往往需要长时间请假接受治疗。我认识的一位学生就因癌症而几个月没有上学,但从他的长期学业情况来看似乎没有受到太大影响。
各国学生的在校学习时长差异很大,但这并不影响他们的学习成效。
[中学教学时长](https://www.oecd.org/education/eag2013 (eng)--FINAL 20 June 2013.pdf)(横轴)与学生 PISA 数学成绩(纵轴)之间呈现出显著的负相关关系。这一现象可能反映了成绩相对较低的国家试图通过延长学年来提升学生成绩,然而效果并不理想。即使撇开这个简单的分析图不谈,众多跨学校、跨州乃至跨国的研究文献也一致表明,学习时间的长短对于学业成绩的影响微乎其微,几乎可以忽略不计。如需更深入了解这一观点,请参阅这篇介绍。
此外,现有证据表明,家庭作业对学习效果的促进作用非常有限,甚至可以说没有影响。如果在校学习时间与家庭作业的作用相当,那么学校教育的效果恐怕也很低。这个发现从另一个角度引发了我们的思考:教育工作者往往并不清楚他们的教学行为是否真正有效地提升了学生的学习成效。因此,我们没有充分的理由认为,仅仅「把孩子交给老师」就必然意味着「孩子能够学到更多知识」。
20 世纪 60 年代以前,德国各地的学年开始时间差异很大。60 年代,政府决定在全国范围内统一规定秋季开学。在这一过渡期间,一些学生因此只在某一年级学习了半年,而有一些学生则学习了一年半。尽管此举在短期内对学生产生了一定的直接影响,但 Pischke 的研究发现,从长远来看,这一政策变化并未对毕业生的收入等方面产生显著的影响。
此外,Potochnik (2018) 的研究对象是那些因移民而缺课的学生(至少相当于一个年级)。排除其他因素后,研究表明,对于在小学阶段(11 岁以下)缺课的学生而言,他们在十年级(大约 15 岁)时的考试成绩与那些从未缺课的学生表现相当。然而,对于在中学阶段(11 岁以上)缺课的学生,虽然他们的阅读成绩与其他学生保持相当,但在数学成绩上却呈现出一定的落后。这表明,低年级时的缺课影响可能会随着时间的推移而逐渐减弱,但在临近考试前的缺课,其负面影响可能尚未完全消除,这在数学学科上的表现尤为明显。不过,值得注意的是,尽管缺课学生的学业成绩可能没有受到太大影响,但他们的辍学率往往更高。这一现象可能由学业以外的其他因素导致,也可能与一些尚未被发现的潜在原因有关。
三、所谓「缺席」的反证,以及我确信它错误的原因
人们常说「研究表明」,学生缺课会严重影响学业,对此你有什么看法呢?这类「研究」的确「发现」了种种相关性,但它们很多都存在严重的问题。这个研究是一个典型例子,此研究发现缺勤率的增加与成绩和考试分数的变差密切相关。
这样的研究设计,在本科生的实验方法课程中恐怕都难以获得通过,显然,它只能说明相关性,而不能证明其因果关系。实际上,家境贫寒、存在行为问题、以及因父母疏于管教而缺课的孩子,其缺课频率远高于那些来自富裕家庭、受到「直升机式」过度监护的孩子。同时,这些孩子也更易在阅读上出现问题。难道我们真的可以相信,就像这个研究所呈现的这样,仅仅缺课两周,就会孩子在两年后出现阅读障碍的概率增加 33%?不是,哥们……
在此类关于缺课影响的研究中,我勉强接受的只有这个,它不仅尽力调整了贫困等混杂因素的干扰(尽管我们深知这些混杂因素无法被完全消除),还细致地区分了「经许可」的缺席与「未经许可」的缺席。前者,诸如「孩子生病并持有医生证明」的情况,这类缺席往往较少受到家庭阶层和父母教育投入的直接制约。该研究的主要发现如下:
仔细观察图 6 下半部分,你会发现,如果忽略其他混淆因素,无故缺勤次数较多的学生成绩百分位会从 50 骤降至 12。但一旦将混淆因素考虑在内,他们的成绩仅从第 50 百分位下降到…第 47 百分位。即便如此,这 3 个百分点的差异也可能源于某些未被考虑的混淆因素。至于因故缺勤,无论是否剔除混淆因素的影响,其对成绩的冲击都微乎其微。那些缺勤时间超过 18 天(整个学年十分之一)的学生,他们的表现与从未缺勤的学生不相上下,甚至更胜一筹。
图 7 的数据略显悲观,它表明大量缺课的学生在数学测试中的表现的确稍逊一筹,但即便缺勤时间高达学年的 10%,成绩也仅从第 50 百分位下滑至第 46 百分位。对此我并不感到意外。比如,如果你恰好在老师讲授高斯消元法的那一周缺勤,那一年你可能就学不会如何解高斯消元了(这些数据无一例外地来自学年末的测试,而那时缺勤的学生已经重返校园)。然而,五年之后,缺勤与非缺勤学生之间不太可能再存在明显差异。如果遗漏的内容是基础乘法一类的重点,缺勤的学生终会抽空补上;如果是高斯消元法之类的冷门知识,不缺勤的学生也会忘得一干二净。别忘了 Benezet 实验,学生虽然完全缺失了五年的数学课,但只用一年时间就完全赶上了正常的学习进度。
四、从灾难和罢工中得出的所谓反证,以及为什么我认为它很可能是错误的
反对我观点的最有力证据,来自一系列关于学校长期关停的影响的文献,在这些文献中,这些学校的关停大多是因为灾难,偶尔也源于教师罢工。
我本能地对这些研究持怀疑态度,因为我察觉到教育研究者往往倾向于强调教育的巨大影响力,视任何对教育过程的干扰为灾难,并主张孩子们应该在学校待更长时间。这种倾向可能源于他们对正面结果的偏爱。尽管如此,这样的研究既然存在,我们还是应该读读看。
在这类文献中,有一个分支着重关注降雪天数对学习所产生的影响。在降雪天数更多的年份里,孩子们学到的知识是否更少?很多研究都对此得出了肯定的结论,比如这项研究。但这里有个关键点得注意:该研究发现,只有冬末(如 2 月)的降雪会影响考试成绩,而早些时候(如 11 月)的降雪则没有影响。这可能是因为,用来衡量学习成果的考试在 3 月份进行。
在我看来,这明显体现了「应试教育」的模式。降雪这种自然现象,对于「教育」或是「知识」这种深远、抽象且持久的东西其实没什么影响。但是如果考前一周的复习因为降雪而被迫取消,那对即将迎来的考试的成绩影响就很大了。不过显然,这种影响是很短暂的,它不会持续到下一年的考试,甚至对三个月后的考试都不会有什么影响。那些过分夸大降雪天对教育不利的声音,无非是在「雪后紧接着的考试成绩」这一指标上耍小聪明。
(回顾我自己于这些标准化考试的经历:我们学校的社会研究课老师会在讲授美国原住民和殖民时期时从容不迫,接着便转向抨击奴隶制的种种弊端,直到标准化考试前的最后一周,他们猛然惊觉「天哪,我们应该要讲到 20 世纪 50 年代了,该死该死该死,格兰特、海斯、加菲尔德、阿瑟、克里夫兰、哈里森、麦金莱、克里夫兰*、一战、二战、工会运动、日裔拘留营,好了祝你好运!」。如果你不巧在这段时间缺课,我相信,一周后你在应对有关麦金莱政府的考题时必定会捉襟见肘。)(译注:以上 8 个人名为美国历史上的总统。其中,克里夫兰(Cleveland)出现两次是因为格罗弗·克利夫兰曾两次担任美国总统)
Joshua Goodman 的一项研究同样值得关注。他发现,在马萨诸塞州,学校因降雪而停课并未对学生的考试成绩产生显著影响。尽管尚无官方解释,但我推测这是因为该州的标准化考试在 5 月举行,届时不太可能出现影响备考的雪天停课。
另一类研究则将目光转向了发展中国家所遭遇的重大灾难,比如巴基斯坦地震。这些灾难不仅让学校化为废墟,还使得学生们在接下来数年里都无法正常接受教育。研究显示,灾后学生的学业表现出现了明显的滑坡,而且下滑的幅度远远超出了仅仅因为停课所能解释的范围。他们可能仅仅因为灾难而错过了一年的学习时光,但学业成绩却已经落后了同龄人两到三个年级。大多数研究都将这一现象归因于多重因素的叠加效应,包括营养不良和创伤后应激障碍等。更为令人担忧的是,即便学生们最终能够重返校园,他们的学业成绩也并未能够止跌回升,成绩下滑的情况反而仍在恶化。比如,原本只是落后两年的学生,在两年后可能已经落后了四年之多。一些评论者将这一持续下滑的现象归咎于「升级过快」,然而,我认为这反而进一步证明了除了教学中断之外,还有其他更为复杂的因素在影响着学生的学业恢复。值得一提的是,在前面提到的卡特里娜飓风所导致的学生缺课的研究中,并未发现这种学业成绩持续下滑的现象。由此我推测,在营养不良风险较低的发达国家,我们大可不必对此过于忧虑。
此外,还有一些关于教师罢工的研究。这类研究普遍发现教师罢工对学生学业构成了显著的负面影响。尽管我对这些研究背后的方法论细节了解有限,难以作出恰当评判,但我不得不承认对这些结论是怀疑的。比如这项经典的研究,它的结论所呈现的效应模式令人费解。该研究指出,五年级教师罢工后,受影响的是男生(而非女生)六年级的数学成绩,而六年级的教师罢工则影响女生(而非男生)六年级的阅读成绩。另外罢工对五年级学生阅读成绩的影响是六年级的四倍,对其写作能力的影响则大致相当。或许是我没能正确理解这个研究方法,否则我真不知该如何看待这些结果。
不过,这项来自阿根廷的研究得出了非常稳健的效应量。在该研究中,多经历十天阿根廷教师的罢工不仅直接拉低了考试成绩,还会在几十年后损害他们的就业和收入。这种影响甚至跨越了代际,影响到经历教师罢工的学生的子女,导致他们的在校表现更差。
我找不出这项研究的任何明显瑕疵,只是觉得结论似乎有些偏激。从之前的缺勤数据可以看出,学生缺课 18 天都不会影响当年的阅读测试成绩,但这项研究却表明,哪怕只缺了 10 天课,就会对成年后的工作产生负面影响,甚至祸及子孙后代。再看 Benezet 的案例,学生五年没上过数学课也没什么大问题,但阿根廷的研究却认为,如果你错过了 10 天的数学课,你就永远无法恢复了?
(此外,不妨比较一下经历 10 天教师罢工和经历大屠杀对下一代的影响,结果可能会让你大吃一惊!)
如果将这项阿根廷的研究与其他相关研究相互印证,我就要提到学校教育的多维度影响了。许多与学校相关的干预措施,比如学前教育,它们的作用并不总是直接反映在考试成绩或知识水平的提升上。然而,这些措施在塑造学生良好行为习惯、增强责任感等方面展现出了显著的成效。这或许就能向我们解释,为何学校教育对考试成绩的直接影响有时并不明显,却能在学生步入社会多年后,通过其收入水平等间接指标得以体现。
五、试图为反方立场「反对学生缺课」提供有力论据
考虑到我是带着偏向性来写这篇文章的,我将试着换位思考,假设自己持相反观点,看看能得出什么有趣的结论。
大量研究表明,许多看似有益的教育干预措施不一定能提高学生的考试成绩,但确实能提高他们的毕业率,减少青少年犯罪,达成其他「道德品格」方面的教育目标。例如,学前教育项目如 Head Start 虽然不能有效提高考试分数,但似乎能够在一定程度上预防学生中途辍学。
学生缺课是否也会产生类似的影响?从一项关于移民儿童的研究中,我们似乎能找到一些有启发性的线索。在这项研究中,学生的成绩通常能够在一段时间后就恢复,但即便成绩恢复正常,辍学率仍然显著偏高。这一发现或许也可以解释,为什么阿根廷教师罢工期间的学生,多年后的收入水平仍普遍较低。许多关于教育影响收入的研究表明,考试成绩并不是影响未来收入的决定性因素。
我们真的有理由认为,学生缺课可能会对多年后的考试成绩产生影响吗?大部分关于小学生缺课的研究表明,他们最终能够赶上学习进度;但一些针对中学生的研究则发现,他们无法完全弥补缺课造成的影响。我原本以为,这是因为中学生在结束标准化考试和被纳入研究统计之前(通常为 10 至 12 年级),没有足够时间补课。然而,现有证据并不排除这样一种可能性:中学教育实际上极其重要,错过了就难以弥补。即便这在本质上并非绝对,从另一角度来看也可能成立:假如你缺席了 11 年级的课程,在申请大学前可能没有充足时间补上落下的功课,最终只能进入一所比原本理想更次的大学,而这一结果将永久反映在你的简历上。
我认为,对于家境贫寒、少数族裔或处于危险之中的孩子而言,以上观点更有说服力;而对于家境富裕、欧亚裔或风险较低人群的孩子来说,这些观点的影响力则显得较为有限。只有当孩子本身已接近辍学或犯罪的边缘时,对其辍学或卷入犯罪活动的担忧才有意义。我推测,学校教育之所以能避免此类问题,是因为对于成长于极度恶劣家庭环境的孩子来说,学校是他们习得主流价值观和行为准则的唯一场所,而如果家庭环境没那么糟糕,学校教育产生的影响就不会显得那么关键。有证据表明(详见此文第 5 节),考入名校对弱势儿童的长远发展至关重要,这或许是因为他们若不如此,更容易在就业市场上被忽视。然而,对于条件已经较好的孩子来说,就读名校不会给他们带来终身的影响。
六、结论与开放性问题
我不想浮于表面,说些标新立异却不负责任的话。以下是我基于上述研究所作出的判断,尽管无法确定你将如何检验这些结论,我还是在每个结论后附上了相应的置信水平。我并不是说这些结论就是上述所有研究得出的明确结论,任何了解这些研究的诚实的人都会认同这些结论,而只是我个人根据这些研究作出的推测。
- 如果一个孩子错过了一年的小学教育,那么到高中毕业时,平均而言,他的学习水平会比按正常轨迹发展的学生落后不到 5 个百分位数(置信水平:85%)
- …落后幅度可能不到 1 个百分位(置信水平: 35%)
- 如果孩子完全没有念过初三,到高中毕业时,其阅读能力的落后幅度可能不到 5 个百分位(置信水平: 60% )
- …数学能力的落后幅度也在此范围内(置信水平:30% )
- 学习成绩最差的孩子受到的负面影响可能略高于平均水平,最优秀的孩子所受影响则可能略低于平均值(置信水平尚不确定)
如果这些判断正确,那么十年后,我们或许不会发现新冠疫情导致的封锁措施对学生的学业造成巨大影响。
然而,这种影响将难以精确衡量。标准化考试通常关注的是学生在同龄人中的百分位排名,而新冠疫情波及了所有适龄学生。因此,即使疫情确实对学生的学业造成了严重影响,我们也不太可能从标准化考试的成绩中察觉到明显的变化。
我相信,许多研究会试图论证,与停课时间更长的地区相比,那些坚持更多面授教学的学区、私立学校或国家的学生考试成绩会相对更好。但我对此持保留意见。这类研究往往涉及复杂的多层回归分析,需要控制诸多混杂变量。它们可能会得出「478 号模型表明停课比大屠杀还糟糕」这样耸人听闻的结论,但其可靠性实则有待进一步商榷。当然,如果有显著差异的具体案例可供参考,比如一个国家的学校全年开放,而另一个国家全年封锁,那将是理想的研究情境。但遗憾的是,在现实中恐怕难以出现如此极端的对比。
我们能否评估新冠疫情停课对学生未来收入的影响?如果十年后,2019 届毕业生的收入水平明显高于 2021 届,或许能从侧面佐证一二。但其中依然存在诸多混杂因素,解释起来需谨慎。
我真正期待的是,能够建立一套统一且绝对的评分标准(即根据学生答对题数评分,而非相对排名),所有学生每年都要参加这样的测试。我不确定这样测试出来的效果会怎么样。但如果真的有这种测试,我预计今年参加考试的学生成绩会出现中等程度的下滑,不过之后的两三年内,他们的成绩应该会逐步回归到正常水平。
在此之前,我建议广大家长保持乐观,莫把孩子缺课的风险看得太重,尤其是对于尚在启蒙阶段的儿童。家长应因时制宜,权衡利弊,选择最有利于孩子和家庭身心健康的教育方式,不必对孩子的学业前途过度焦虑。
褪黑素:比你想知道的要多得多
原文:Melatonin: Much More Than You Wanted To Know | Slate Star Codex
作者:Scott Alexander 发布于:2018 年 7 月 10 日
[本人并非睡眠医学专家。如需进行任何重大调整或治疗严重症状,请务必咨询专业医师。]
Van Geiklswijk 等研究者将褪黑素补剂描述为「一种具有催眠作用的生物节律调节剂」。如果仅将其当作普通安眠药使用,就好比用 AK-47 自动步枪当棍子来敲打敌人的脑袋。虽然可能奏效,但你显然没有充分发挥这种神奇物质的全部潜力和精妙之处。
褪黑素是由大脑中的松果体分泌的一种神经激素。在正常的昼夜节律中,它在你醒来时处于最低水平(血液中含量低于 1 皮克/毫升,无法检测),并在整个白天持续保持低水平。大约在你清醒 15 小时后,体内褪黑素含量会突然飙升至 10 皮克/毫升——这一现象被称为「暗光褪黑素初始释放」。在接下来的几个小时里,褪黑素含量会持续攀升,可能高达 60 或 70 皮克/毫升,使你越来越昏昏欲睡,最终不得不上床休息。褪黑素含量通常在凌晨 3 点左右达到峰值,随后逐渐下降,直到清晨再次降至无法检测的低水平。
这是让你想睡觉的原因吗?是,也不是。实际上,困意是由昼夜周期和所谓的「过程 S」共同作用产生的。「过程 S」这个听起来有些神秘的名词,其实指的是一个简单的事实:你保持清醒的时间越长,就会越困。这个过程似乎部分受到一种叫做腺苷的分子调控。当你保持清醒状态时,身体会产生腺苷,使你感到疲劳;而当你睡眠时,身体会清除腺苷,让你重新恢复精力。
在健康人的体内,这些过程是协调一致的。昼夜节律让你在夜间感到困倦,白天保持清醒。而「过程 S」则确保你在刚刚睡醒时(通常是早晨)感到精神饱满,在长时间未睡觉时(通常是夜晚)感到疲倦。这两个过程都指向同一个结果:你应该在白天保持清醒,晚上感到疲倦。因此,你的身体也就自然而然地遵循这个规律。
然而,当这些过程因某些原因而失调时——比如夜班工作、时差反应、药物作用、基因因素,或者熬夜玩《文明》游戏到凌晨 5 点——整个系统就会崩溃。此时,一个过程在催你睡觉,另一个却在唤你醒来。结果就是你既不能完全清醒到感到精力充沛,也不能完全疲倦到获得充分休息。你可能会发现自己躺在床上辗转反侧,或者在天还没亮时就醒来,却怎么也无法再次入睡。
褪黑素对人体的两个睡眠调节系统都有作用。首先,它对过程 S 有轻微的「催眠」效果,服用后能迅速增加睡意。其次,它对昼夜节律有更强的「生物钟调节」效果,可以调整身体认为适合睡眠的时间。要想有效使用褪黑素,关键在于理解这两种效果,并在适当的情况下加以运用。
一、褪黑素是否是有效的安眠药?
是的。
简而言之,在想要入睡前服用褪黑素确实有助于入眠。关于这一点,现有证据基本一致。就原发性失眠而言,Brzezinski 在 2005 年和 Ferracioli-Oda 在 2013 年分别进行的两项元分析都证实了褪黑素的安全性和有效性。对于时差反应,以严谨著称的 Cochrane Collaboration 在一项元分析中称褪黑素「效果显著」。针对广泛的原发性和继发性睡眠障碍,Buscemi 等人在摘要中声称褪黑素无效,但仔细审视其研究结果会发现褪黑素实际上是有效的,他们对自身研究结果的报告不够准确。Psychiatric Times 在这一点上支持我的观点:「另一项被报道为阴性的研究实际上显示了一个具有统计学意义的积极结果,即褪黑素平均缩短了 7.2 分钟的入睡潜伏期」。
专家共识通常与元分析结果一致:褪黑素确实有效。相比 Mayo Clinic 和 John Hopkins 对褪黑素的谨慎认可,我反而对「基于科学的医学」博客上一篇不那么彻底否定的评论印象更为深刻。要知道,这个博客通常都会对各种膳食补充剂进行猛烈抨击。
专家们普遍认为褪黑素只是一种效力较弱的催眠剂。尽管 Buscemi 等人的元分析发现褪黑素有统计学上的显著效果,但仍得出了负面结论,原因是这种补充剂只能让人提前大约 10 分钟入睡。「10 分钟」听起来似乎微不足道,但我们需要将其放在适当的背景下考虑。即便是像安必恩(Ambien)这样最强效的睡眠药物,研究显示也仅能让人提前 10 到 20 分钟入睡。《纽约时报》的一篇文章指出,「总体而言,[安必恩、乐奈特(Lunesta)和舒乐安(Sonata)等新型睡眠药]与安慰剂相比,平均缩短入睡时间 12.8 分钟,延长总睡眠时间 11.4 分钟。」虽然我不知道有什么严格的统计学比较来对比褪黑素和安必恩的效果,但两者之间的差异恐怕算不上天壤之别(day and night,这个双关语并非有意)。
我不赞同简单地下结论说「褪黑素毫无效果」,相反,我认为所有安眠药的实际效果都远不如人们主观感受的那么显著。相关文章推测了一个可能的原因:人们在入睡时的意识状态较低,很多人判断自己是否失眠,更多是基于焦虑(有时甚至是在梦中的感受)而非客观现实。这种解释是有可能的,但我更倾向于从抗抑郁药研究的角度来看待这个问题。这些研究发现,尽管患者(和医生)坚称抗抑郁药改变了他们的生活,但药物的客观效果却相当微弱。如果非要我猜的话,我会说这些研究可能混合了病情严重和较轻的患者,并且也没有区分对药物有反应和无反应的人群。这种解释可能显得有些牵强,我也不能确定。但是,如果你认为其他安眠药效果显著,那么褪黑素的效果可能并不比它们差多少。
睡眠潜伏期的统计数据难以直接比较,因为研究对象的差异会极大地影响结果。例如,对于需要一小时才能入睡的受试者,褪黑素可能能够缩短三十四分钟的入睡时间。然而,对于只需二十分钟就能入睡的受试者,即便是效果最佳的安眠药也很难缩短十五分钟的入睡时间,更不用说三十四分钟了。虽然我无法直接对比不同研究中褪黑素缩短十分钟、三十四分钟或安比恩缩短十二分钟入睡时间的结论,但我个人的非专业估计是,褪黑素的效力大约是安比恩的三分之一。值得注意的是,褪黑素的副作用比安比恩少了约一百倍,这使得它在睡眠医学领域仍然占有重要地位。
二、褪黑素的正确剂量是多少?
0.3 毫克。
「可是我在当地药店买到的都是 10 毫克的药片!我询问是否有更低剂量的,他们翻遍了库房,好不容易才找到 3 毫克的药片!你却说正确剂量只有三分之一毫克?!」
确实如此。目前市面上销售的大多数褪黑素药片的剂量都是正确剂量的十到三十倍左右。
早期关于褪黑素的研究多以老年人为主要对象。研究者选择老年人是因为他们体内产生的内源性褪黑素比年轻人少,因此被认为对褪黑素补充剂的反应更为显著。多项研究结果一致表明,0.3 毫克是最适合老年人的褪黑素剂量。研究发现,服用约 0.3 毫克褪黑素的老年人比服用 3 毫克或更高剂量的老年人睡眠质量更好,且副作用更少(Zhdanova et al 2001)。一项针对剂量-反应关系的元分析也支持这一结论,发现褪黑素的效果在 0.3 毫克左右达到平台期,继续增加剂量不会带来更多益处,反而会加重副作用(Brzezinski et al, 2005)。更为重要的是,约 0.3 毫克的剂量能够使血液中褪黑素浓度的峰值在幅度和持续时间上最接近睡眠正常的健康年轻人的自然水平(Vural et al, 2014)。
研究人员还针对盲人群体进行了一系列实验。由于缺乏光线刺激来调节生理节奏,盲人对褪黑激素特别敏感。这项研究虽然主要将褪黑激素作为调节生理节奏的药物,而非单纯的安眠药,但其结果与之前的发现惊人地相似:小剂量比大剂量更有效。例如,Lewy 等人在 2002 年的研究中发现,每晚服用 0.5 毫克褪黑激素能够有效地帮助盲人受试者恢复正常的夜间睡眠规律,而 20 毫克的剂量却收效甚微。研究者们据此推断,20 毫克的剂量过高,会导致褪黑激素在体内持续存在,这与该激素本应起到的昼夜节律信号作用背道而驰。其他针对盲人的研究也普遍支持这一结论,确认 0.3 到 0.5 毫克左右的剂量最为理想。
令人遗憾的是,针对视力正常年轻人使用褪黑激素的研究非常有限。在为数不多的研究中,Attenburrow 等人在 1996 年进行的研究发现,1 毫克剂量有效,而 0.3 毫克剂量无效,这表明这类人群可能需要稍高的褪黑激素剂量。然而,该研究结果与其他研究存在一定差异。例如,Zhdanova 针对 25 岁年轻人进行的另一项研究发现两种剂量均有效。而 Pires 等人对 22-24 岁年轻人的研究则表明 0.3 毫克比 1.0 毫克更有效。我并不太关注 0.3 毫克与 1.0 毫克剂量孰优孰劣的争论,而是想强调一个重要事实:这些研究中使用的剂量远低于药店销售的褪黑激素片剂中常见的 3-10 毫克剂量。
UpToDate 作为医生们公认的黄金标准研究数据库,也赞同使用这些低剂量褪黑素。该数据库明确指出:「对于失眠或时差症,我们建议使用低剂量、符合生理水平的褪黑素(0.1 至 0.5 毫克)(2B 级建议)。高剂量制剂会使血浆中褪黑素浓度升至超生理水平,从而干扰正常的昼夜褪黑素节律。」Mayo Clinic 也给出了类似的建议,他们推荐使用 0.5 毫克剂量。John Hopkins 的专家们的观点也基本一致:他们说「少就是多」,但最终还是谨慎地建议使用 1 至 3 毫克,这个剂量明显高于研究结果所建议的水平。
基于多项研究结果(部分支持低剂量使用,部分显示不同剂量效果相近)、确凿证据(0.3 毫克剂量最接近健康人体内自然褪黑素峰值)以及权威医疗资源 UpToDate 的建议,我推荐使用 0.3 毫克的褪黑素剂量。不过,1 毫克以内的剂量都可以接受。但超过这个范围则明显过高。过量服用褪黑素虽然不会造成严重危害,但可能导致耐药性,并可能以其他方式干扰你的昼夜节律。根据一些非正式报告,以及考虑到人体不太可能对自身自然分泌剂量的激素产生耐受性,我推测长期服用足够低剂量的褪黑素应该是安全有效的。然而,这仅是一种推测,大多数医疗指南在建议超过三个月左右的使用时都持谨慎态度。
三、什么是昼夜节律障碍?如何使用褪黑素来治疗这类问题?
昼夜节律障碍是指个人的生理节奏与正常的昼夜规律不同步,导致无法在夜间正常入睡,早晨按时醒来的状况。
最普遍的生理节律障碍可以说是「成为青少年」。青少年的褪黑激素分泌周期自然就比较晚,这导致他们通常要到午夜甚至更晚才有睡意,而且往往要到早上八点以后才愿意起床。显然,这与学校的作息时间存在严重冲突。结果就是,青少年要么睡眠不足,要么被迫在身体不适合且无法有效利用睡眠的时间段里勉强入睡。这就是为什么每一位 声誉良好的 睡眠 科学家 以及 相关 科学 机构 一直在 向 公立 学校 系统 呼吁 推迟 上课 时间。
当一个人长期保持很晚睡觉的作息,并且这种情况持续到成年或者对生活造成严重困扰时,我们称之为睡眠相位后移障碍(DSPD)。患有 DSPD 的人通常要到很晚才会感到困倦,如果不受外界因素限制,他们会自然而然地睡到很晚。这种情况的轻微表现就是我们常说的「夜猫子」或「不是早起型的人」。而严重的情况则很容易被误认为是失眠:你晚上 11 点上床,却辗转反侧到凌晨 2 点才入睡,早上7点被闹钟叫醒,然后抱怨自己「睡不着」。但是,如果你能够在凌晨 2 点左右稳定入睡,不管什么时候醒来都是如此,而且如果你第一次上床时间就是凌晨 2 点的话能够一沾枕头就睡着,那么这其实不是失眠——而是 DSPD。
与睡眠相位后移障碍相反的是睡眠相位前移障碍。这种情况在老年人中最为常见,我记得我的祖父就有这种症状。他通常会在傍晚 6 点左右就开始犯困,7 点前就上床睡觉,凌晨 1 点或 2 点就醒来,然后精神饱满地开始新的一天。这种情况的轻微表现是那些每天早上 5 点就自然醒的人,尽管他们的闹钟要到 8 点才响,本可以多睡两个小时。这些人如果能在晚上 8 点或 9 点就上床睡觉可能会感觉很好,但工作和社交生活的压力让他们觉得自己「应该」像其他人一样熬夜。结果,他们在晚上 11 点上床,早上 5 点就醒来,然后抱怨自己患有「终末性失眠」(指无法在预期的睡眠时间内持续睡眠,过早醒来的情况)。
最后,让我们来了解一种称为非 24 小时睡眠障碍的情况。患有这种障碍的人,其生物钟仿佛被某种神秘力量深深地、顽固地「洗脑」,坚信地球上的一天长达 25 小时(或其他非 24 小时的时长),并决意死守这个错误认知。这导致了一个奇特的现象:如果今晚你的自然睡眠时间是晚上 11 点到早上 7 点,那么第二天晚上可能会推迟到午夜 12 点到早上 8 点,再下一晚则是凌晨 1 点到早上 9 点,如此循环往复。这种情况要么持续到你完成一个完整的 24 小时周期,要么更可能的是,你会因为极度疲惫和混乱而不得不强撑 24 小时以上来打破这个恶性循环。这种障碍在盲人中最为常见,因为他们缺乏视觉线索来调节自己的生理节奏以适应 24 小时的昼夜规律。不过,一些视力正常的人也会受到影响。例如,著名的人工智能研究者 Eliezer Yudkowsky 就曾详细描述过他与这种睡眠障碍抗争的艰难经历。
值得庆幸的是,褪黑素能有效治疗这些睡眠障碍,但前提是要正确使用。
一般来说,褪黑素会把你的睡眠时间「拉」向你服用它的时间。这是理解如何正确使用褪黑素的关键。
因此,如果你的目标是更早入睡(和醒来),就应该在白天较早的时候服用褪黑素。那么,具体应该多早服用呢?根据 Van Geijlswijk 等研究者的总结,最有效的服用时间是「在传统确定的[微光褪黑素分泌开始时间](也就是昼夜节律时间 9 点)之前 5 小时」。如果你不清楚自己的褪黑素周期,最佳选择是在醒来后 9 小时服用(这通常相当于你计划入睡时间前约 7 小时)。
如果你想延后入睡和醒来的时间,有什么办法吗?根据我们对褪黑素周期的认知,在刚醒来时服用褪黑素很可能会产生这种效果,但遗憾的是,目前还没有正式的研究来证实这一点。据我所知,最相关的信息仅限于一些研究人员的推测,他们认为这种方法可能有效,同时也对这个领域缺乏深入研究感到不解。
那么,对于非 24 小时睡眠障碍患者又该如何处理呢?治疗的目标似乎是通过每天在固定时间服用褪黑素来逐步调整睡眠相位,使睡眠周期更多地受到外源性褪黑素的调控,而不是受到紊乱的内源性褪黑素分泌的影响。关于具体的用药方法,目前存在不同的观点:有人建议将褪黑素作为安眠药使用,即在睡前服用;而另一些人则推荐遵循典型的相位前移方案,在醒后 9 小时、睡前 7 小时左右服用,通常是在下午 5 点左右。这个问题可能比较复杂,或许需要一位了解你个人生理节奏的专业睡眠医生来为你制定最佳的用药时间表。值得一提的是,Eliezer 表示后一种方案对他效果显著(你可以在这里搜索「Last but not least」了解更多)。我很好奇,给 Eliezer 提出这个建议的 MetaMed 研究员是如何判断他需要采用相位前移方案的。
这种方式服用褪黑素(例如在下午 5 点)会引起困倦吗?我认为可能会有些影响,但与这个时间点本身不利于入睡相比,这种影响可能微乎其微,难以察觉。
调整睡眠周期并非只能依赖褪黑素。以下是一份简明的研究结果和理论预测小抄:
针对睡眠相位后移障碍(即你的作息比正常时间晚,希望提前):
-
在起床后 9 小时、睡前 7 小时左右服用褪黑素,比如下午 5 点
-
日落后避免接触蓝光(可使用防蓝光眼镜或 f.lux 软件)
-
清晨接触明亮的蓝光(最好是阳光,如果不行可使用模拟黎明灯或光疗灯)
-
晨练
-
早晨服用 β 受体阻滞剂(一般不推荐,但如果你正在服用,请在早上服用)
针对睡眠相位前移障碍(即你的作息比正常时间早,希望推迟):
-
起床后立即服用褪黑素
-
早晨避免接触蓝光(可使用防蓝光眼镜或 f.lux 软件)
-
傍晚接触明亮的蓝光(最好是阳光,如果不行可使用光疗灯)
-
晚上锻炼
-
傍晚服用 β 受体阻滞剂(一般不推荐,但如果你正在服用,请在傍晚服用)
这些方法并不能一劳永逸地「治愈」昼夜节律紊乱;你必须坚持每天执行,否则你的昼夜节律就会自动回归到原本的模式。
那么,用于这些目的的适当剂量是多少呢?这个问题比确定催眠剂量要有争议得多。在 van Geijlswijk 描述的九项研究中,有七项采用了 5 毫克的剂量,这似乎已成为某种标准。然而,唯一一项直接比较不同剂量的研究(Mundey et al 2005)发现,0.3 毫克和 3.0 毫克剂量之间并无显著差异。同样,关于时差的 Cochrane 综述(我们稍后会看到,这是类似的过程)也没有发现 0.5 毫克和 5.0 毫克剂量之间存在明显区别。
Van Geijlswijk 提出了一个重要观点:如果你在睡前七小时服用 0.3 毫克褪黑素,到睡觉时你体内应该已经没有残留的褪黑素了,那么它究竟是如何发挥作用的呢?老实说,这确实令人困惑。特别是,目前似乎还缺乏一个被广泛认可的生理学解释,来阐明为什么在白天早些时候服用褪黑素能够在七小时后影响你的昼夜节律。
因此,我认为现有证据表明,在这种情况下 0.3 毫克也是一个相当合适的剂量。不过,如果你想尝试服用更高剂量,我也不会反对。
四、如何使用褪黑素来缓解时差症状?
大多数研究建议,在你抵达新时区后,按照当地时间,在睡前服用 0.3 毫克褪黑素。
这个问题的复杂性让我感到困惑。不过,我们似乎可以将时差视为一种昼夜节律紊乱。举个例子,如果你前往一个比原来早 5 个小时的时区,你的生理状况就类似于一个昼夜节律比正常人晚 5 个小时的青少年。基于这个类比,你应该采用治疗睡眠相位后移障碍(DSPD)的方法,即在以下时间点服用褪黑素:醒来 9 小时后,或暗视觉褪黑激素开始时间(DLMO)前 5 小时,或睡眠前 7 小时。
我推测,对大多数人来说,他们在新时区的就寝时间确实比原来早了几个小时,所以这种方法已经能产生显著效果,再加上褪黑素本身的催眠作用。当然,这只是我的猜测,也许提前服用会更有效。不过,考虑到新的光照环境已经有助于调整昼夜节律,我认为大多数人发现在就寝时服用褪黑素就已经足够有效了。
五、我试着用褪黑激素来帮助睡眠,但它只会让我做一些奇怪的梦,让我醒得很早
这也是我的亲身体验。当我服用褪黑素时,第二天早晨醒来时会感到一股充沛的精力。虽然我通常不得不勉强自己起床,但褪黑素让我醒来时神采奕奕,面带微笑,准备好迎接新的一天……
…但总是在凌晨 4 点。这就是为什么尽管我对这种物质感兴趣,但我再也不自己服用褪黑素了。
有很多人和我一样。我们这是怎么了,能否找到方法让褪黑素为我们所用?
某健身网站提出了一个未经证实的理论。众所周知,褪黑素能抑制皮质醇的分泌,而皮质醇与肾上腺素呈反比关系。因此,如果一个人体内的皮质醇水平天生就很低,服用褪黑素可能会导致肾上腺素水平过高,从而产生我和一些人经历过的「突然惊醒」现象。我欣赏这种思维方式。他们考虑到了个体差异,他们的模型在生物学上看似合理,而且逻辑自洽。但这个理论很可能是错误的,因为它涉及的环节太多,而自然界中的生物学过程很少如此简单明了。
我认为,一个更简洁的解释应该与昼夜节律有关。即使是 0.3 毫克的褪黑素,也足以让体内褪黑素含量达到自然昼夜周期中的最高水平。假设我想在晚上 11 点睡觉,于是服用了 0.3 毫克褪黑素。这时我体内的褪黑素浓度达到峰值,而这通常发生在深夜 3 点左右。如果身体误以为现在真的是凌晨 3 点,它可能会在 5 小时后,也就是它认为的早上 8 点(实际上是凌晨 4 点)时自动醒来。
我感觉自己的昼夜节律比大多数人要弱得多。这种感觉主要源自两个方面:一是我白天经常小睡,二是无论什么时候我都能轻松入睡。如果这种感觉是准确的,那么褪黑素对我而言可能产生了超常的刺激效果。正常情况下,人们醒来时会感到神清气爽、精力充沛,而在我身上,这种感觉被放大成了一种突如其来、难以抵抗的清醒状态。
我不敢确定这种解释是否比之前的肾上腺素理论更接近事实,但它至少与我们已知的昼夜节律知识相符。我计划在今年的 SSC 调查中加入一些关于褪黑素反应的问题,所以我建议大家现在就开始尝试使用褪黑素,这样到时候就能提供有价值的数据了。
那些奇怪梦境,又该如何解释呢?
根据赫芬顿邮报的一篇文章报道:
斯坦福大学睡眠医学教授 Rafael Pelayo 博士认为,褪黑素本身并不会导致生动的梦境。他解释道:「服用褪黑素的人通常是那些有睡眠问题的人。当你为了改善睡眠而服用任何药物时,只要你的睡眠时间延长或质量提高,就会出现所谓的『快速眼动睡眠反弹』现象。」
这种现象意味着你的身体会「补偿」之前缺失的快速眼动睡眠阶段,而这个阶段的特征是脑电波高度活跃。
Pelayo 博士补充说,在睡眠实验室的严格控制条件下,服用褪黑素补充剂的正常受试者并没有表现出更长的做梦时间或更多的快速眼动睡眠。这一发现表明,褪黑素本身并不具有引发更多或更奇怪梦境的固有特性。
其实,我平常的睡眠质量还不错。我偶尔会服用褪黑素,主要是因为我对尝试各种影响精神状态的物质比较感兴趣。有趣的是,即便服用褪黑素,我仍然会做一些极其离奇的梦。更有意思的是,一位 Slate 杂志的记者曾提到,他服用褪黑素已经长达九年,但至今仍然会做一些匪夷所思的梦。
众所周知,快速眼动(REM)睡眠通常发生在接近清晨的睡眠末期。众所周知,睡眠结构的某些部分能够直接对褪黑素做出反应。虽然关于褪黑素究竟如何影响 REM 睡眠还存在诸多争议,但考虑到大量关于梦境改变的报告,我们可以推测,褪黑素在促进或增强 REM 睡眠的睡眠架构中很可能扮演着重要角色。
六、这些现象是否与其他精神疾病有关?
虽然可能存在关联,但目前这些观点仍属于推测性质。
季节性情感障碍是最有可能相关的疾病。研究表明,季节性情绪变化与温度无关;它们似乎完全取决于冬季日照时间较短而夏季日照时间较长这一因素。
研究表明,冬季抑郁症可能存在两种不同类型。第一种是由于冬季日出时间较晚,导致人体昼夜节律被推迟,形成所谓的「相位后移」。第二种则是因为冬季日落时间较早,使人体昼夜节律提前,产生「相位前移」。季节性情感障碍(SAD)很可能是这两种情况的某种组合,导致人体的昼夜节律变得紊乱。无论是哪种情况,都可能使睡眠与人体正常的昼夜节律不协调,从而降低睡眠质量,最终引发情绪问题。
那么,日出时间究竟如何影响普通人呢?毕竟大多数人在日出时还在睡觉,而且通常是在黑暗的房间里。我认为,即使在睡眠状态下,我们的大脑也能在潜意识层面「感知」到黎明的到来。科学研究发现,眼睛和控制生物钟的大脑区域之间存在一些特殊的神经通路,这些通路似乎独立于常规的视觉系统。即使只有微弱的光线透过窗帘,这些通路也能持续监测日出时间。这一观点也得到了「模拟黎明灯」的支持,据说即使在睡眠中,这种设备也能发挥作用。不过,我们还不确定如果人们长期处在完全封闭的环境中(比如地下),是否会患上季节性情感障碍,因为在那里他们无法以任何方式感知日出时间的变化。
明亮的光照之所以成为季节性情感障碍(SAD)的标准疗法,原因与它作为其他昼夜节律相位延迟症状的标准治疗方式相同。那么,褪黑素是否也能发挥作用呢?答案是肯定的,一些初步研究(包括一篇学术论文和一篇科普文章)已经证实了褪黑素的有效性。然而,使用褪黑素时需要格外谨慎,因为患者中有些人存在相位延迟,而另一些则是相位提前,如果不当使用褪黑素,可能会适得其反,使情况恶化。不过,对于典型的相位延迟型 SAD,常规的相位提前褪黑素治疗方案似乎可以很好地配合明亮光照,作为一种有效的补充治疗手段。
这一模型还解释了一个看似矛盾的现象:为什么有些 SAD 患者反而在夏季会变得抑郁。问题的关键并不在于光照的多少,而是昼夜节律的紊乱——而夏季和冬季一样,都有可能导致这种紊乱。
根据几条证据线索,我强烈怀疑抑郁症与昼夜节律存在密切的关联。
首先,抑郁症最典型的症状之一是在凌晨很早就醒来,并且无法再次入睡。这种情况常常让抑郁症患者感到困惑,因为他们通常认为自己非常疲惫,需要更多的睡眠,但这种早醒现象却确实存在。这种睡眠模式恰恰符合昼夜节律紊乱的特征。
其次,阿戈美拉汀——一种褪黑素类似物,已被证实是一种相对有效的抗抑郁药物。
第三,有一个引人注目的发现:连续保持清醒 24 小时以上竟然是一种非常有效的抑郁症治疗方法(尽管效果是暂时的,睡眠后症状会重新出现)。这似乎是在向你的昼夜节律宣告:「你控制不了我,我要自己做主。」基于这一发现,一些复杂的睡眠剥夺和昼夜节律调整方案正试图将其发展成更持久的治疗方法。虽然我对此并不了解,但这个现象确实有趣。
第四,研究证实,抑郁症患者的昼夜节律确实存在异常。
最后,双相情感障碍与生理节律有着密切的联系。虽然很少有生活方式的改变能真正预防双相情感障碍的发作,但保持规律的作息时间是其中一个被证实有效的方法。人际关系和社交节律疗法是一种罕见的有效治疗双相情感障碍的心理疗法,其核心就是训练患者调控自己的昼夜节律。
关于昼夜节律为何如此重要,主要有两种理论:一种认为睡眠质量与昼夜节律同步度相关,即睡眠与昼夜周期同步时更有利于身体恢复;另一种则认为人体存在多重节律,当这些节律相互协调时,身体功能会更加优化。
七、我该如何选择最佳的褪黑素补充剂?
Labdoor 对市面上各种褪黑素品牌进行了纯度测试,并给出了相应的排名。然而,他们推荐的品牌剂量仍然是适当剂量的十到三十倍(顺便说一句,别再用「三倍强效!」之类的夸张说法了!药物并非越强效越好!)。像往常一样,在这类产品上我最信赖 NootropicsDepot。果不其然,他们在亚马逊上销售的褪黑素剂量恰好是 0.3 毫克。真是太棒了。
成长型思维:疑云未散
原文:No Clarity Around Growth Mindset | Slate Star Codex
发表于 2015 年 4 月 8 日,作者:SCOTT ALEXANDER
一、
承认偏见是克服它的第一步,所以我坦白:我对成长型思维怀有强烈偏见。
(简单介绍一下,成长型思维认为,相信能力不重要、只有努力才能决定成功的人,比那些强调能力重要性的人更具韧性、技能、勤奋,面对失败时更能坚持,并在其他诸多方面表现更佳。由此推断,我们只要告诉每个人能力不重要、努力才是关键,就能让所有人变得更优秀。更多详情可参考维基百科)。
这简直太反常了。一个广受欢迎的心理学发现,竟然没有愤世嫉俗者将其贬为昙花一现的潮流?没有政客抨击它是为社会弊病开脱的自我安慰?没有一群油嘴滑舌的研究者说:「什么,你还相信那个理论?难道你不知道它已经无法重复验证,而且早就被白俄罗斯的一项新研究彻底推翻了吗?」我不是说 Carol Dweck 一定和魔鬼做了交易,我只是觉得找不到其他合理的解释。
这就引出了我反对「成长型思维」理论的第二个原因。可靠的研究表明,先天能力(包括但不限于智商)确实极其重要,而那种认为失败者只是不够努力的普遍偏见实际上是既错误又有害的。社会心理学一直,对否认这一研究结果表现得异常热衷。如果「成长型思维」理论仅仅是继续否认这一点,那也不足为奇。但它更进一步。它不仅(仅仅?)认为能力不重要,还认为正是这种 "能力可能很重要 "的信念导致了人们的失败。据这种理论所说,那些相信能力很重要的人会拒绝努力,逃避挑战,在压力下变得「无助」,从根本上厌恶学习,拒绝付出努力,对自己的「才华」变得自负和防御,对他人撒谎并隐藏失败,甚至可能辍学沾染毒品(这可不是在开玩笑)!相比之下,那些相信只要努力就能成功的人将会成功,适应良好,并把生活视为一系列充满挑战的冒险。对于像我这样的愤世嫉俗者来说,这简直是自《天路历程》以来最厚重的道德说教,也是自「你之所以看不到超能力,是因为你是个怀疑论者!」以来最方便的解释性政变!
这就引出了我对它持有偏见的第三个原因。它恰好处于一系列最近开始显得有些可疑的研究领域的中心。大多数关于成长型思维的实验都采用了启动法,让参与者进入一种专注于努力或专注于能力的心理状态。然而,近期的启动实验却屡屡无法重复,从而让整个领域的可信度都受到了质疑。此外,成长型思维与刻板印象威胁明显相关,而后者最近也开始显得站不住脚。
因此,我有充分的理由对成长型思维持怀疑和负面态度。但令人惊讶的是,这些研究竟然如此出色。
让我们来看看 Dweck 和 Mueller 在 1998 年进行的一项研究,这是该领域的一项关键性研究。研究者邀请了128名五年级学生完成各种拼图。首先,他们给学生们一些简单的拼图,所有学生都顺利完成了。随后,研究人员对他们进行了如下表扬:
在这项研究中,所有参与的儿童都收到了积极的评价:「太棒了,你在这些题目上表现得非常出色。你答对了[具体数量]道题。这个成绩相当高!」为了确保实验条件的一致性,无论儿童的实际表现如何,他们都被告知自己至少正确回答了 80% 的问题。
随后,研究者将儿童分为三组,给予不同的额外反馈。第一组儿童在初步表扬后,又得到了针对能力的赞扬:「你在解决这些问题上一定很机灵。」第二组儿童则收到了强调努力的表扬:「你一定为这些问题付出了很多努力。」第三组作为对照组,没有得到任何额外的反馈。
这个实验干预可以说是微乎其微,几乎可以忽略不计。整个实验过程复杂,包含了各种详细的指示和任务,参与者可能在实验室里停留了至少半小时。而真正的实验干预,却仅仅是在一个句子中改变了三个短短的词而已。
然后发生了什么?接受智力赞扬的儿童比接受努力赞扬的儿童更倾向于认为智力比努力更为重要,这一差异具有极高的统计学显著性(p < 0.001)。当给予选择机会时,67% 接受努力赞扬的儿童选择了具有挑战性的学习导向目标,而在接受智力赞扬的儿童中,这一比例仅为 8%,差距之大令人震惊!在随后设置的一次必然失败的测试中,接受努力赞扬的儿童更容易将失败归因于自己不够努力,而接受智力赞扬的儿童则更倾向于认为是因为自己不够聪明(p < 0.001)。面对困难任务时,接受智力赞扬的儿童的平均坚持时间明显短于接受努力赞扬的儿童(3.2 分钟对 4.5 分钟,p < 0.001),他们对活动的享受程度也显著降低(p < 0.001),在后续的可解决问题集上的表现也更差(p 值同样显著)。这些发现并非孤例。研究团队在后续针对白人、非裔美国人和西班牙裔学生的一系列研究中反复验证了这些结果,不同种族背景的学生均呈现出相同的模式。
让我们来看看一项关于习得性无助的研究分析。心理学家 Dweck 使用了一种名为 IAR 的测试,将儿童分为两组:一组认为努力更重要(称为「掌控型」),另一组认为能力更重要(称为「无助型」)。随后,她给所有儿童布置了一些无法解决的问题,观察他们的反应——更准确地说,是测试两组儿童在面对困难时能够持续有效工作的时间长短。研究结果非常显著——在每组 30 名受试者中,11 名掌控型儿童在失败后反而更加努力,而无助型组中没有一个孩子这样做。21 名无助型儿童在失败后就放弃了努力,而掌控型组中只有 4 名儿童如此。Dweck 描述说,掌控型儿童会说「我喜欢挑战」之类的话,而无助型儿童则恳求允许他们停止任务。
这项研究的结果令人匪夷所思。它呈现出一组数据为 100%,而另一组则为 0% 的极端对比。这要么意味着研究中存在重大疏漏,要么表明这个用于区分掌控型儿童和无助型儿童的简单测试在心理学领域总能产生最显著的效果,而且从未失准。测试结果显示,所有认为能力对成功至关重要的儿童中,竟然没有一个会监控自己的进步。相比之下,超过 95% 认为努力更重要的儿童会这样做。同样,前一组儿童中没有一个对自己的进步表示积极,而后一组中超过三分之二的儿童会对自己的进步做出正面评价。
通常情况下,我会怀疑这些结果是伪造的。但是,我尝试了所有常见的识别伪造结果的方法,却找不到任何蛛丝马迹。更令人惊讶的是,即便是世界上最大胆的造假者,也不敢编造如此极端的数据。此外,一项涵盖所有成长型思维研究的元分析虽然发现了更为温和但仍然一致的效果,却只显示出轻微的发表偏倚。
那么,我们是否该得出结论:成长型思维是心理学中唯一能产生巨大效应且始终有效的概念?还是说,Carol Dweck 真的与魔鬼做了交易,用她的永恒灵魂换取了这些令人瞠目结舌的研究结果?
老实说,我也说不准。不过,有几点原因让我更倾向于后一种解释。在此我必须坦白,这个话题已经超出了我的专业范畴。我发这篇帖子,纯粹是希望能引发更深入的讨论。
二、
让我感到困扰的第一件事是历史。
我一直在努力追溯其起源故事,但这条线索相当错综复杂。它似乎源于 Carol Dweck 和几位合作者在七十年代进行的几项研究。然而,这些研究普遍发现,相信天赋能力是一种积极因素,与相信成长型思维并存,而那些将成功或失败归咎于坏运气或外部因素(比如考试作弊,顺便说一句,这种情况总是存在)的孩子才是问题所在。
这一类型的优秀例子是儿童中的习得性无助与强化责任感。其摘要描述了这一发现:「表现大幅下降的受试者是那些对行为结果承担较少个人责任的人……以及那些在承担责任时,将成功与失败归因于能力的有无而非努力程度的人。」
但这种似乎是这张表格的一种有偏向性的解读:
研究结果显示,「坚韧型」儿童(即在面对失败时仍能坚持的孩子)比「无助型」儿童(即遇到挫折就放弃的孩子)更倾向于认为能力在他们的成功(I+a)和失败(I-a)中起着关键作用。虽然在这项样本量为 10 的研究中,这些差异并未达到统计学显著性,但在所研究的四种成功与性别组合中均呈现出一致趋势。该研究的核心发现是,那些将成败归因于稳定因素(无论是努力还是能力)的孩子,其表现优于那些没有固定归因方式的孩子。
值得注意的是,Dweck 在《期望和归因的作用》一文中声称:「坚韧型儿童和无助型儿童在将成功归因于能力的程度上并无显著差异。」然而,仔细审视原文后会发现,这又是一个坚韧型儿童实际上更强调能力重要性的案例。之所以未能达到统计学显著性,主要是因为该研究的总样本量仅为 12 名儿童。
(关于这项研究,我还想补充几点看法。Dweck 比较了两种干预方法,旨在减少儿童的无助感,提高他们应对失败的能力。第一种方法是给孩子们一系列简单的问题,让他们必然能够成功,并因此感到自己很聪明。第二种方法则是给孩子们一些他们注定无法解决的难题,然后告诉他们失败的原因是不够努力。最后,两组孩子都被要求挑战一些极其困难的问题,以观察他们会投入多少努力。结果显示,之前接触过不可能完成的问题的孩子,比那些因只接触简单问题而感到自己很聪明的孩子表现更好。Dweck 将此解释为:告诉孩子要努力工作能减少他们的无助感。然而在我看来,更为明显的结论是:习惯于失败的孩子在面对几乎不可能完成的任务时,比那些一直被人为制造成功体验的孩子更不容易感到困惑和慌乱。)
此外,还有这项研究,它是我在第一部分提到的第二项研究的预备性工作。这项研究是否表明掌握导向型儿童在各个方面都优于无助型儿童?确实如此。但让我们来看看讨论部分的这段内容:
研究结果揭示了无助儿童和掌控导向儿童在面对失败时,其表现模式和言语表达存在显著差异。特别值得注意的是,虽然无助儿童如预期般将失败归因于不可控因素,但掌控导向儿童却没有对自己的失败做出解释。
然而,仔细分析数据后,这一结论似乎与实际情况存在出入。
数据显示,掌控导向的儿童将失败归因于最不可控因素——坏运气的可能性是其他儿童的约 6 倍。同样,他们将失败归因于任务「不公平」的可能性也是其他儿童的约 6 倍。这一发现与之前的所有研究,包括 Dweck 自己的研究结果,都存在矛盾。归因理论作为一个广受关注且被 Dweck 本人认可的研究领域,普遍认为将事物归因于运气是不可取的,而归因于能力,虽然不如归因于努力,但也被视为相对积极的态度。然而,Dweck 的研究却得出了令人意外的结论:使用能力归因的儿童普遍表现不佳,反而是那些将失败归因于运气或世界不公平的儿童表现出色。
我专门挑选这几项小型研究来评论,可能有失公允,毕竟还有那么多其他研究。但事实是,这些是最早的相关研究,而且许多评论文章只引用了这些研究和几篇据我所知从未正式发表的论文。因此,我只能基于这些有限的资料来分析。根据我掌握的情况,我发现直到 1980 年左右,包括 Dweck 在内的每项研究都认为,相信自身能力是一种保护因素。然而,这种观点突然消失了,反而变成了一种有害的「瘟疫」。究竟发生了什么?我也不得而知。
三、
第二个让我感到困扰的是从纵向观察的结果。
按照 Dweck 的理论,那些抱持无助感、固定思维、相信先天能力的孩子是这样的:「...他们过分关注自己是否有才能以及如何展现才能,以至于从未真正发挥出全部潜力。在固定思维模式下,首要原则是不惜一切代价展示才能。其次是不要过分努力工作或练习...因为不得不努力会让人怀疑你的能力。第三,遇到挫折就逃避。他们会说『我会试图在下次考试中作弊』之类的话。他们找借口,责怪他人,通过贬低表现更差的人来让自己感觉良好。」
这些人听起来简直就是彻头彻尾的失败者,显然 Dweck 也赞同这种解读:
「几乎所有卓越的运动员——例如迈克尔·乔丹、杰基·乔伊纳-基尔西、泰格·伍兹等——都具备成长型思维。这些运动员无一例外地并非仅仅依靠天赋…大量研究反复证明,成长型思维能够培养更积极健康的练习和学习态度,促进对反馈的渴求,增强应对挫折的能力,并且随着时间推移带来显著的表现提升…从长远来看,拥有成长型思维的人似乎获得了优势,并开始在表现上超越那些固定思维模式的同侪。」
哥儿们,如果固定型思维的学生普遍比成长型思维的学生表现更出色,那岂不是很尴尬?
[Aronson、Fried 和 Good 2001 年的研究](http://steinhardt.nyu.edu/scmsAdmin/uploads/004/308/Aronson Fried Good.pdf)乍看之下似乎是又一项支持成长型思维的令人瞩目的研究。他们对大学生进行了仅仅半小时的成长型思维培训,却发现几个月后这些学生的成绩仍然保持更高水平(这种效果如此惊人,以至于我专门写文讨论过)。然而,他们似乎是事后才想起要测量学生的一般成长型思维水平,以及干预前的一些学业表现指标。
研究结果显示,具有高度成长型思维的学生 GPA 较低(效应量可观但统计上不显著),SAT 分数也较低(且在统计上显著)。
研究者们显然对这一结果感到不安,但他们却提出了一个颇具讽刺意味的建议:SAT 成绩一般的人会通过自我暗示「能力并不重要」或「能力根本不存在」来保护自己那本就所剩无几的自尊。
诚然,这种说法可能确有道理。(有评论者提出了一个同样发人深省的观点:天资聪颖的人往往只依赖其与生俱来的智力,很少付出额外努力。因此,基于他们的亲身经历,他们自然会认为能力才是关键,而努力并不那么重要。)
然而,如果我们全盘接受 Dweck 的理论,那么具有成长型思维的人就会被描绘成令人惊叹的超级英雄,而固定型思维的人则会被贴上一无是处的标签——他们厌恶学习,遇到困难就立即放弃,甚至不惜作弊。但现实世界远比理论复杂。无论成长型思维的效果有多大,它都完全被我们之前提到的那个效应所掩盖了——即低 SAT 分数者为了保护自尊而产生的心理防御机制。
这项研究还揭示了一个令人尴尬的结果:与白人相比,黑人更倾向于相信智力是可塑的,更认同成长型思维的观点。这一发现颇具讽刺意味:一方面,黑人在学业表现上普遍落后于白人;另一方面,推广成长型思维的初衷之一恰恰是为了解释少数族裔学习成绩不佳的问题。
这一发现并非孤例。例如,Furnham 在 2003 年对伦敦大学学院学生的研究表明,思维模式与学业成绩并无显著关联。据我所知,宾夕法尼亚州也有类似的研究结果,尽管我未能找到具体文献。
仔细审视 Dweck 的研究,我们甚至能发现一些耐人寻味的现象。她的研究中有一个常被忽视的特点:那些被归类为「无助」的孩子和「掌握导向」的孩子在初始阶段的表现总是不相上下。只有在 Dweck 通过失败经历给他们施加压力后,两组孩子才表现出明显差异——掌握导向的孩子能够从容应对,而无助的孩子则每况愈下。
然而,值得注意的是,这些研究对象都是五年级的学生!两组儿童在第一组问题上表现相当,这意味着从一年级到四年级,所谓「无助」、「固定型思维」、「厌恶工作」的特质并未影响他们掌握五年级水平知识的能力!更有趣的是,在这项研究中,固定型思维的孩子起初表现甚至更佳。我未能找到任何证据表明成长型思维的孩子在初始阶段表现更优。
有趣的是,当对她的论点有利时,Dweck 本人也承认:
一些最聪明、最有才能的人也表现出这种不适应的行为模式。因此,我们不能简单地认为,只有那些能力欠缺或曾经失败的人才会(恰当地)回避困难任务,或在面对挑战时表现得不堪一击。
然而,我认为她并没有充分领会这一论述的深层含义。尽管固定型思维模式似乎注定会导致失败,但这些人却已经成为「最聪明、最有才能的个体」。
事实上,最近有一些针对天才学生、精英大学学生或顶级运动员的成长型思维研究。这些研究都例行公事地表明,具有固定型思维的人在研究者设计的任何随机、人为的情境中表现都要差得多。但截至目前,还没有人指出,在斯坦福这样的顶尖学府中,这类人的比例似乎与其他地方相差无几。如果成长型思维真的如此重要,你会预期在斯坦福遇到固定型思维的人应该像遇到智商低于 100 的人一样罕见。考虑到你几乎找不到后者,却不难找到一堆前者来研究成长型思维模式有多好,这似乎表明智商确实很重要,而成长型思维并非如此。
在心理学研究中,持固定型思维的参与者往往表现得极其糟糕,仿佛完全丧失了学习能力和工作动力。然而,在研究情境之外,他们的表现却与持成长型思维的同龄人不相上下,有时甚至更为出色。这种鲜明的反差究竟是如何产生的?老实说,我对此也感到十分困惑。
四、
第三个让我感到困扰的是《失败后的表现缺陷》这项研究。尽管这项研究来自一个很可能并不存在的城市里的大学,但它却出人意料地有意思。
他们采用了一个与 Dweck 实验相似的方法。首先,让孩子们完成一组问题。然后,给他们一些无法解决的问题。最后,再给他们更多的问题,以观察他们是否因为在无法解决的问题上的失败而产生了「习得性无助」。根据 Dweck 的理论,固定型思维的孩子会出现这种情况,而成长型思维的孩子则不会。虽然 Bielefeld 的团队并非专门研究成长型思维,但他们确实发现,有一群孩子在经历失败后变得慌乱,不再愿意尝试,此后的表现也大幅下滑。
随后,研究人员对实验进行了创新和重复。这一次,他们巧妙地设计了一个匿名环境,确保没有人能够知道每个孩子的个人表现。他们告诉孩子们将被分到不同的团队中,每个团队成员的分数会在公布前合并计算。这种设计使得孩子们可以毫无顾虑地尝试,即使失败也不会对他们个人造成任何负面影响。
研究结果表明,经历失败后,儿童的表现与失败前完全一致,没有出现任何退步。同时,也没有观察到任何为了维护自尊而突然放弃的「固定型思维」群体。
这一发现似乎与思维模式理论存在一定出入。根据思维模式理论,人们的行为应该受到其根深蒂固信念的影响。理论预期,当固定型思维的孩子遭遇失败时,她会认定自己不够聪明,无法改变这一事实,因而唯一的选择就是在后续问题中故意表现糟糕,以此来抗议这个未能识别她才能的不公世界等等。然而,实际研究中观察到的失败反应似乎更多地体现了一种社会性角色。Bielefeld 的研究团队将这种现象解释为「自尊保护」,但这种解释在我看来并不完全令人信服。因为如果他们真的只是担心自尊,那么即使在没有人知道他们表现的情况下,他们也应该会感到忧虑。
在我看来,这更像是自尊和他人评价之间的某种互动。固定型思维的人在科学家面前公开失败时会感到慌乱。这种反应本身并不算特别奇怪。更值得探讨的问题是,为什么这种反应会与相信先天能力的观念存在关联。
我们可以假设,「强调先天能力的人」和「强调努力工作的人」之间的区别反映了一种更广泛的差异。有些人真心渴望在某项任务中取得成功;而另一些人只是在走过场,敷衍了事,然后宣称「我已经尽力了」。
想象这样一个场景:将第一组参与者置于一位看起来颇具权威的科学家面前,要求他们解决一个问题,但实际上确保他们无法成功。在这种情况下,他们会将失败视为一种巨大的耻辱——他们本应该取得成果,却未能如愿。结果,他们会变得异常焦虑,而这种焦虑不可避免低会影响他们的表现。
现在,把第二组参与者也置于一位看起来很有权威的科学家面前。他们会迅速意识到,只要在科学家叫停前花几分钟写些看起来大致相关的内容,就可以声称自己尝试过了,没人能对此有什么异议。于是他们采取这种策略,然后理直气壮地要求获得一个「A」来表彰他们的努力。在整个过程中,他们完全不会感到焦虑,因此他们的表现也不会受到任何影响。
现在,如果将这两组参与者单独置于私密环境中,他们都不会感到任何羞辱,而且他们的表现也基本相当。
现在让我们把这两组人置于现实生活中。追求成功的群体会研究如何最有效地学习;而注重形式的群体则会精确计算出他们需要投入多少学习时间,才能在失败时不被他人责备,然后恰好投入那么多时间。你会发现,尽管追求成功的群体在 Dweck 式的实验中表现不佳,但他们在学校的实际表现却略胜一筹。
如果实验者表扬孩子们的勤奋努力,他们会认为实验者只看重他们投入的精力。因此,当面对一个无法解答的问题时,孩子们会毫无意义地绞尽脑汁,因为他们以为这正是实验者想要看到的。相反,如果实验者赞赏孩子们的能力,他们会觉得实验者真正期望他们能够正确解决问题。当遇到无法解决的难题时,孩子们会坦然承认,并预料到实验者可能会感到失望。
我怀疑这并非成长型思维背后的真正机制,因为它恰好迎合了我个人的偏见,就像思维模式理论迎合了其他人的偏见一样。然而,我认为这表明我们可以用多种不同的理论来解释这一现象,而这些理论都能在某种程度上解释部分实验结果。
五、
在结束之前,我想纠正一个关于成长型思维的重大误解。虽然 Dweck 本人基本上避免了这个错误,但她的追随者们却经常严重地犯这个错误。让我们来看看这篇名为《为什么成长型思维是学习的唯一途径》的文章,它很好地体现了这种误解:
[有些人认为]一个人的智商是固定不变的。他们认为,你只能胜任与所学专业相关的工作,在足球、约会或冒险等领域永远不可能有明显进步。在这种观念下,一个人的人生轨迹和性格特征似乎都被预先确定了,宛如一张精确绘制的地图。然而,这种思维方式的危害在于,它会让人变得自满,削弱自尊心,并扼杀了真正有意义的学习和进步。
简而言之,这种固定型思维就像一种智力上的顽疾,而且显然与现实情况不符。
文章进一步展示了成长型思维如何证明「天赋」是一个「神话」,这一观点在诸如揭穿天才神话和学习神话:为什么我永远不会告诉我的儿子他很聪明等成长型思维倡导者的文章中被反复提及,以及这位女士所说的我们需要揭穿天生才华的观念。
假设我在第一至第四部分中所述的一切都是错误的,而成长型思维完全如所述般百分之百正确。
这仍然无法提供丝毫证据来反驳这样一个观点:天赋/智商/或其他任何内在因素,无疑是决定成功的最重要因素。
让我们深入思考一个问题。众多研究表明,坚定的宗教信仰能带来诸多益处:延长寿命、提高幸福感、降低抑郁风险,甚至减少犯罪行为。毫无疑问,信仰(以基督教为例)能给人的生活带来诸多积极影响。然而,没有人会轻率地认为这就证明了基督教的真实性。事实上,这甚至不能暗示基督教是真实的。
同样的逻辑也适用于思维模式理论。该理论认为,相信智力主要是可塑的会带来许多积极影响。但这并不意味着智力真的主要是可塑的。让我们看一下这张简单的示意图:
假设这是 Dweck 进行的一项针对三个孩子的实验。每个孩子都有不同程度的先天才能,用点 1 表示。在他们树立成长型思维,保持正确态度并努力练习后,他们的能力达到了点 2 的水平。
关于这个模型,有两点同时成立。首先,Dweck 的所有实验结果在现实世界中得到了完全验证。具有成长型思维并付出努力和实践的孩子,表现确实优于那些没有这种思维的孩子。如果将众多个体汇集成组进行比较,成长型思维组的平均表现必然优于固定型思维组。智力是可塑的,如果不肯下功夫练习,就无法充分发挥自身潜力。
其次,个体之间的巨大差异主要源于先天才能的不同。以 Alice、Bob 和 Carol 为例:Alice 无论多么刻苦,永远无法达到 Bob 的水平。Bob 如果非常努力地练习,可能会超越 Carol 的起点,但若 Carol 付出同样的努力,Bob 就永远无法赶上她。Alice 和 Carol 之间存在着一道难以逾越的鸿沟,这是成长型思维理论完全无法解释的。
这里有一张相对不错的图表——之所以说「相对不错」,是因为它不是出自我手。我是从互联网上为数不多的对成长型思维持批评态度的资料中找到的,具体来源是这两个网站之一:
关于成绩落后的学生为何表现不佳,我们可以无休止地争论:是因为他们身体状况不好?基因劣势?成长环境欠佳?还是社会结构对他们不利?实际上,我们之前在这里已经就这个话题争论过很多次了,每次讨论都相当精彩。
然而,在这个问题上,具体原因并非关键所在。如果成功完全取决于付出的努力,那么我们似乎会看到贫困儿童付出的努力呈现出令人惊讶的线性递减。但是,明智之人不会支持这种理论。
有趣的是,在这一点上,坚定的生物决定论者和顽固的社会主义者达成了罕见的共识:告诉孩子们他们失败是因为缺乏正确的工作态度,这种做法实在是糟糕透顶。这种说法通常是错误的,而且会严重打击孩子们的自尊心。行为遗传学研究清楚地表明,学业和体育成就至少有 50% 是由基因决定的;而众多社会学家则致力于证明,在一个存在偏见的社会中,个人所处的位置在很大程度上决定了剩余的成就。如果一个天生处于不利地位的人付出了巨大努力,他们可能最终会达到上文提到的 A2 水平。否认这一点而坚持「一切都取决于你的努力程度」的观点,无疑会冒犯到左右两派理性人士的敏感神经。
让我们回到前面提到的 1975 年那篇关于「期望和归因作用」的论文,仔细审视一下为帮助这些陷入固定型思维的学生所提出的干预措施:
研究人员挑选了 12 名极度缺乏自信的儿童,测试他们在规定时间内解决数学题的能力。他们将目标设定为比每个孩子通常能完成的题量多一道。在测试中,当孩子还差一两题就达标时就被叫停,随后研究人员会将他们的失败归咎于努力不足。
简而言之,这项实验就是挑选最脆弱的对象,给他们布置注定会失败的任务,然后指责他们失败的原因仅仅是因为不够努力。
这就像一只靴子无休止地践踏着一张人脸,还不断说:「你的问题在于没有足够努力地避免被踩踏。」
或许这种做法确实有其价值,如果它能培养出一种成长型思维,让孩子在学业、运动和今后的生活中更加成功。但这并非在「揭穿天才的神话」。天赋依然至关重要,就像勤奋、财富、健康、特权等其他因素一样。实际上,你是在对孩子们讲述一个「高尚的谎言」,因为你认为这个谎言是有益的。你可以为自己开脱说:「我们并非否认现实,只是有选择地强调了现实的某些方面。」但归根结底,这就是你在做的事。如果你认为这符合你的道德准则,那就继续吧。
然而,我仍持保留态度。诚然,有一些非常出色的研究——或许可以说是巧妙得令人叹为观止的研究——表明这一理论在某些实验环境中确实有效。它背后不仅有大量扎实的研究成果作支撑,还赢得了众多杰出学者的支持。但与此同时,也有其他研究显示,在现实世界中,我们无法测量到它的任何长期效果。更有一些研究可能(或者也可能不会?)以其他方式与该理论的预测相矛盾。对于如何协调这些看似矛盾的事实,我只能说是管中窥豹,难以全面把握。因此,我非常期待能听到那些对此有更深入了解的人的见解。
我个人尚未阅读过 Dweck 的著作,但对于任何想要深入探讨这些问题的人来说,研读她的书无疑是一个水到渠成的下一步。
人非完人,万物可度
原文:Nobody Is Perfect, Everything Is Commensurable | Slate Star Codex
作者:Scott Alexander 发布于 2014 年 12 月 19 日
一、社交媒体与政治参与
近期,在社交平台 Tumblr 上,有这样一段引人深思的评论:
「我知道这个观点可能不讨喜,但我注意到有些人不愿意转发与弗格森事件有关的内容或世界各地意识觉醒的帖子。理由是,他们不想负面情绪侵扰自己的生活,也不想因此焦虑。他们觉得自己来 Tumblr 是为了逃避现实、寻求快乐,我认为这纯属无稽之谈。现实中有人正在失去生命,每天生活在一踏出家门就可能遭遇枪击的恐惧中,而你却因为感到『略微不适』就连转发一张相关图片都不愿意?」
「你们能不能暂时放下那些饭圈琐事和搞笑段子,多花点时间去了解、转发关于巴基斯坦的帖子?你们享有安全庇护的特权,但并非每个人都如此幸运。」
不谈一些可能引发争议的表述方式,这段文字确实包含了一个值得深思的重要观点。大意是:「长期处于愤怒、卷入接连不断的社会争议话题确实很累,能够置身事外,和家人享受美好时光,或者悠闲地看猫咪照片之类的,也确实很吸引人。然而,当这些争议涉及无辜者被残酷杀害或生活在恐惧中等严重问题时,作为一个正直的人,我们有责任去关心这些事情,理想情况下,我们甚至应该组织大型抗议之类的来履行这种责任,但即使做不到,至少转发几条相关的口号标语也是我们能做的最起码的事情。」
我认为 Cliff Pervocracy 在这篇文章中试图表达的就是类似的观点。以下是关键摘录:
当你从小被灌输「自己无法做出决策、自己不配拥有任何东西、自己永远不够好」这样的观念,[保守派]所描绘的「坚韧的个人主义」(rugged individualism)幻想就会看起来非常吸引人。
理智告诉我,我目前所处的女权主义、进步主义和社会正义的政治环境更为正确,对世界和我个人都更有益,毕竟现实中我并非生活在与世隔绝的小木屋里。
但是,老天,它就是让人不舒服。这种不适是刻意制造的——它迫使我们对不公正感到愤怒,质疑自己的行为是否正当,并为许多人仍在水深火热中挣扎感到悲伤。你不能只是看着自己的小屋,沾沾自喜地宣称「我要把它命名为…克利福德森庄园」。相反,你需要认识到,你能在树林里买下这栋华而不实的大房子,全靠你的白领工作,而这背后是一连串残酷的不公:这片土地的原主人要么遭到杀害,要么被强行驱逐。
而且你永远都不够好。你可以做好事,比如慈善、社会活动、为正义而战,这些都能为你加分,但仍然不够好。无论你做什么,你依然在参与那些维护压迫的腐败体系。除非你能彻底改变一切,否则你的任务永远无法完成,你永远做得不够好。
我再次强调,我并不认为这种观点是错的,只是觉得它让人沮丧。
我不知道该如何解决这个问题。(又是一个令人沮丧的事实。)我不认为进步主义能与小屋幻想带来的舒适自满相抗衡,也不认为它应该这样做。世界需要改变,而人们只有在不满足时才会改变,因此不适是必要的。
我想对 Cliff 的观点做一个善意的补充。他以为自己在讨论进步主义与保守主义的区别,但实际上并非如此。一个安于小木屋、偶尔外出打猎的保守派,与一个满足于纽约苏豪区小公寓、偶尔参加诗歌朗诵会的进步派,在心理状态上其实非常相似。同样地,一个放弃安逸生活、到城市贫民区当社区组织者、致力于消除贫困的自由派,与一个放弃优渥生活、去阿富汗当步兵打击恐怖主义的保守派,本质上也没有太大区别。Cliff 试图区分的其实不是政治光谱上的左右立场,而是积极行动者与消极旁观者之间的差异。
作为近来被归类为「后政治」运动的一分子,我不得不承认,至少从这一界定来说,我更偏向于消极主义者这一方。我只在感兴趣或觉得享受的时候才会谈论政治,并且我认为自己有责任不主动让局势变得更糟。但我不觉得自己有必要不停地讨论那些指定的「热点议题」,直到让自己和读者都身心俱疲。
我听说过人们给出的各种各样的不愿涉足政治的理由。有些人一听到世界各地发生的种种罪恶,就想蜷缩成一团,痛哭数小时;有些人则是对所听到的任何事情都深感自责,他们近乎病态地认为,世界上任何地方有人受苦都是自己未能阻止的错。还有一小部分人长期摇摆不定,不知该站在哪一边,担心自己的行动反而带来更多伤害;还有些人则是因为创伤经历而对加入某一阵营心存戒备,比如,你知道吗,弗格森案的检察官,他父亲正是一位被黑人嫌疑犯所杀害的警察。当然,还有一些人非常单纯,只是想转发小猫咪的照片。
Pervocracy 也认同这一点,而且表达得比我更为贴切:
但是,老天,它就是让人不舒服。这种不适是刻意制造的——它迫使我们对不公正感到愤怒,质疑自己的行为是否正当,并为许多人仍在水深火热中挣扎感到悲伤。你不能只是看着自己的小屋,沾沾自喜地宣称「我要把它命名为…克利福德森庄园」。相反,你需要认识到,你能在树林里买下这栋华而不实的大房子,全靠你的白领工作,而这背后是一连串残酷的不公:这片土地的原主人要么遭到杀害,要么被强行驱逐。而且,你永远都不够好。你可以做好事,比如慈善、社会活动、为正义而战,这些都能为你加分,但仍然不够好。无论你做什么,你依然在参与那些维护压迫的腐败体系。除非你能彻底改变一切,否则你的任务永远无法完成,你永远做得不够好。
这种观点似乎相当准确。Pervocracy 最终感到不适,我的感受也差不多。然而,其他一些心理状态不那么稳定的人可能会陷入自我厌恶。甚至有些人会更进一步,陷入加尔文主义式的「也许我只是一只不配存在的卑微虫子」的思维。从 moteinthedark 对 Pervocracy 的回应中,我感觉她有时也在与这种想法抗争。对这些人来说,远离政治成了他们唯一的应对方式。
然而,批评者仍然认为,当白沙瓦、弗格森或伊拉克的人们无法获得这种应对方法时,你提出这种借口实在太过厚颜无耻。你不能只是简单地拿出一张医生证明,然后宣称「精神病医生说我有心理健康问题,所以我不必关心那些不幸的人」。
有一种选择是拒绝承担这种责任。我非常赞同这个观点。实际上,我的存在对世界上贫困和受苦群体的边际影响为零,甚至可能是正面的。我的经济活动主要包括治疗病人、购买商品和缴纳税款。第一项活动帮助穷人治疗疾病,第二项创造就业机会,第三项为政府援助项目提供资金。那么,我到底应该为此道歉什么呢?我可能确实从印第安人的种族灭绝中受益了,因为我现在生活的土地曾经属于他们。但要这么说的话,这片土地还曾经属于恐龙,我也从导致恐龙灭绝的小行星撞击中受益了。我不认为自己与小行星撞击有任何关系,那么为什么我要觉得自己与印第安人的种族灭绝有关呢?
我并不反对持这种观点的人。它的问题不是哲学层面上的,而是在情感层面。对大多数人来说,仅仅认识到这一点还远远不够。正如古语所言:「你无法用理性说服自己放弃一个并非源于理性的想法」。那种认为生活安定、富足的人需要「回报社会」的观念,比指责他们「参与压迫体系」的说法要古老得多,甚至可能比《圣经》的历史还要悠久。人们内心深处有一种强烈的需求,想要表明自己深知自身的幸运,并帮助那些没自己那么幸运的人。
那么,面对「我们在道德上有义务成为政治活动家」这一论点,我们该如何应对呢?是否应该像有些人所建议的那样,不加选择地转发所有与弗格森事件相关的新闻?
二、慈善与政治参与
我们不禁要问:为什么我们要特别强调「改善世界」这一广泛范畴中的某个特定方面呢?
Pervocracy 说过:「除非你能彻底改变一切,否则你的任务永远无法完成,你永远做得不够好。」然而,这种看法未免过于乐观。即使你实现了彻底的革命,难道就能解决缺血性心脏病?治愈疟疾?让老年人不用进养老院?如果都做不到,那你还没还清你所谓的「无限债务」!
要成为一个完美的人,远不只是跟风参与每一个网络热点那么简单。它意味着你需要把你全部的时间都奉献给救助站的志愿服务,严格奉行素食主义,把所有积蓄都捐给慈善机构,每周给奶奶打电话嘘寒问暖,甚至放弃自己的真爱,和需要签证的第三世界难民结婚。
然而,这些事情并不都是同等重要的。
以「#BlackLivesMatter」(黑人的命也是命)这个推特运动为例,它吸引了五百万人参与。假设仅凭这场运动的影响,所有在职警察从此再也不会伤害任何手无寸铁的黑人。这相当于每年挽救 100 条生命,乘以假定警察平均剩余的 20 年职业生涯,总共可以拯救 2000 条生命。平均到每个参与者身上,相当于每人拯救了 1/2500 条生命。巧的是,这个数字恰好等同于向抗疟疾基金会捐赠 1 美元所能挽救的生命。更具讽刺意味的是,如果人们参加「黑人的命也是命」抗议活动的往返车费用于捐款,本可以挽救比抗议本身多出十倍的黑人生命——即便我们对抗议活动的效果做出了极其夸张的高估。
这个故事的寓意是,如果你觉得自己有义务回馈世界,参与激进的政治活动恐怕是最糟糕的选择之一。其实,哪怕你只是给慈善机构捐一点点钱,效果也可能比你做任何形式的政治活动高出几百倍甚至几千倍。就算你坚信某个政治议题是世界上最重要的事,通过向相关非营利组织捐款支持其游说活动,效果也比在网上随便转发要大得多。
对于一个真正想要「跳出特权圈子」或「帮助那些生活在危险中的人」的客观理性者来说,根本没有理由特别关注政治。那些声称想做好事就必须传播某种政治主张的人,其可信度就像电视布道者宣称想做好事就得给他们捐钱建新总部一样低。也许电视布道者拥有豪华总部比有个破旧总部稍微好那么一点点,但这绝对不是一个真心想改善世界的明智之人首先会考虑的事。
本博客文章的平均点击量,按主题分类
如今,人们对慈善事业漠不关心,却对政治议题极为关注,尤其是涉及种族和性别的话题。这种现象有点像某些电视布道者,他们过分热衷于改善自己的居住环境,甚至将捐款给他们的建筑基金当作衡量一个人品德的唯一标准。同样地,我们普遍也普遍热衷于政治、种族和性别议题,这使得人们会提出这种看似有理有据的论点——衡量一个人品德的唯一标准就是在这些问题上持有并传播「正确」立场。
这为我们提供了一个新的视角来审视我们最初的问题:「不那么关心政治就代表我个坏人吗?」事实上,其他所有的善行方式,特别是做慈善,都比关心政治更为重要。因此,这个问题完全可以被另外一个问题所替代:「我没有参与其他各种行善方式,尤其是慈善活动,我就是坏人吗?」在回答了这个问题之后,我们还可以进一步追问:「除了因不参与慈善而背负的道德责任外,我们是否还应该因为我额外地没有参与政治,而再加上大约原来的 1%的道德责任?」
那么Cliff Pervocracy 提出的担忧:「即使我积极参与政治,但因为没有参与『所有』政治活动,我是否仍然是个坏人?」就可以被这个问题所替代:「即使我做了很多慈善,但因为没有参与『所有』慈善活动,我是否就是个坏人?更进一步,除此之外,是否还应该因为没有参与所有政治活动而再背负额外的、大约原来 1% 的道德责任?」
对于这个问题,实际上并没有一个令人满意的答案。如果你执意要因为没有将收入的 100%(除去基本生活开支)全部捐给慈善而自寻烦恼,陷入焦虑和自我厌恶的情绪中,那么恐怕没有人能够阻止你这样做。
相比之下,我更愿意将这种情况称为「不追求完美」。我的观点是,如果你觉得在向慈善机构捐赠一定数额的钱之前会一直生活在焦虑和自我厌恶中,那么不妨将这个数额定为你收入的百分之十。
为什么选择百分之十呢?
之所以是百分之十,是因为这是「Giving What We Can」组织和有效利他主义社区所倡导的标准。那么,我们为什么应该采纳他们的标准呢?我认为我们应该接受这个标准,原因如下:如果我们拒绝它,转而支持「除非你把所有钱都捐出去,否则你就是个坏人」这种观点,那么很可能每个人都会陷入极度的内疚感而无所作为。但如果我们明确表示「只要你捐赠百分之十或更多,就算履行了道德义务」,那么许多人就会愿意捐出百分之十或更多。最关键的是要有一个共识点,而百分之十这个数字恰好是一个很好的、整数的、在宗教传统中也有渊源的数字。更重要的是,它已经成为我们普遍接受的共识点。这是一个正在发挥实际作用的共识点。如果你捐赠百分之十,你不仅可以让自己的名字出现在一份体面的名单上,还能获得进入「Giving What We Can」网站上一个秘密论坛的资格 —— 尽管那个论坛其实挺无聊的。
之所以是百分之十,正是因为定义应该为人服务,而不是人为定义服务。如果我们把「好人」定义得过于严苛,导致每个人都因无法达到这个不切实际的标准而痛苦不堪,那我们就是愚蠢的定义制定者。相反,如果我们是明智的定义制定者,我们应该采用最有效的方式来定义「好人」,以此来激励人们至少付出那么多的努力。
最后,我们选择百分之十这个比例,是因为如果你认同普遍化原则是道德的基础,那么在一个每个人都将收入的百分之十用于慈善的世界里,每年将有约七万亿美元流向慈善事业。要知道,永久解决全球贫困问题,估计每年需要 1000 亿美元,持续几十年。这仅仅占到突然可用慈善资金的百分之二左右。如果慈善事业每年能获得七万亿美元,仅第一年就足以解决全球贫困问题,消除所有可治疗的疾病,为不可治疗疾病的研究提供几乎无限期的资金支持,教育所有需要接受教育的人,养活所有挨饿的人,推动艺术领域前所未有的复兴,永久保护世界上所有的热带雨林,还能有余力发射五到六个不同的载人火星探索任务。而这仅仅是第一年的成果。谁能想象第二年会发生什么样的奇迹呢?
(与此形成鲜明对比的是,如果世界上的每个人都只是转发最新的话题标签,Twitter 可能会因为无法承受如此大的流量而崩溃。)
慈善堪称是最纯粹的无私之举。假如你认为治疗疟疾是当务之急,那么慈善捐款就是在全身心地投入这项事业。我曾经论述过,我们之所以无法解决世界贫困和疾病等问题,是因为我们的财力资源被无序的利益驱动所操控。既然如此,还有什么方式能比这更有力地反击呢——「不,谢谢,我要将这些象征我劳动成果的资源,用在我认为最有意义的地方」。
如果你每年都捐出 10% 的收入,那么你就已经为创造那个理想世界尽了自己的一份力。你可以理直气壮地说:「嘿,这可不能怪我,是其他人还在拖后腿呢。」
三、行善的选择:捐赠与道德责任
一旦我们将捐赠比例固定在 10%,就能更好地回答最初的问题:「如果我想成为一个回馈社会的好人,但又对政治敏感,我该怎么办?」答案是:你可以选择不触及你敏感神经的方式行善。将义务限定在 100% 以下的另一个好处是,它给了你进行预算和权衡的空间。假设你年收入 3 万美元,并且认同 10% 是一个理想的捐赠比例,那么你可以选择直接捐出 3000 美元,或者参与政治抗议活动,直到你挽救的生命数量、创造的价值或改善的生活质量(按伤残调整寿命年DALY计算)相当于这个数字。
人无完人。这给了我们不必追求完美的理由。与其设定一个遥不可及的目标,最终只能望洋兴叹、无所作为,不如制定一个看似随意但切实可行的目标,以此鼓励更多人尽己所能。这个目标就是百分之十。
万物皆可衡量。这使我们能够精确地决定如何实现那百分之十的目标。有些人对政治敏感且心生恐惧;有些人因病无法从事志愿服务;还有些人因为经济拮据而捐不出太多钱。然而,金钱会不断提醒我们,所有资源和贡献最终都会汇集在同一目标上,我们可以通过多种等效的方式来履行义务。对于有些人来说,捐出收入的百分之十可能很痛苦,但我敢说,如果他们将自己的贡献视为一种可替代品,就能更好地权衡需要多少志愿服务或社会活动来达到同等价值。
Cliff Pervocracy 说:「你的任务永远无法完成,你永远做得不够好。」这种观点似乎是一个引发问题的方程式,即使是在最好的情况下,它也会让人失去方向,迷茫痛苦,陷入自我厌恶的泥潭,并使人对首个出现的寄生性观念 毫无抵抗力,任由其驱使自己参与进最新的冲突里,否则就会被贬低为废物。在最坏的情况下,甚至它会自动催生出一群利己主义者,他们嘲笑帮助他人的想法。
另一方面,耶稣说:「你们要背上我的轭......你们的心里就必得安息。因为我的轭是容易的,我的担子是轻省的」这话听起来就像是在诱导人们说:「好啊,我愿意背起你的轭!感谢你的慷慨!」
波斯诗人奥马尔·海亚姆在思考伊斯兰教严苛的律法与自己享受人生的欲望之间的矛盾时,总结出了这样的准则:
无需严守教规,亦或神圣律法;
只要你慷慨济贫,不吝施舍,
从不伤害他人,也不出言不逊,
我保证你既能享天堂,又能品美酒!
我并不是说,把你 10% 的收入捐给慈善机构就能让你成为一个高尚的人,从而免除了其他所有的道德义务。我也不是说,选择不这样做的人就一定是坏人。我只是想表达,如果你感到有道德责任去帮助他人,而且你想要明智地履行这一责任,那么这种方式比大多数其他选择都要好。
本月,「尽己所能施予」(Giving What We Can)组织正在开展会员招募活动。这个组织的成员都会承诺将个人10%的收入捐给慈善机构。我自己是这个组织的一员,Ozy也有加入意向,计划在有了稳定收入就加入进来。我们社区中有很多评论者也是会员——例如,我在他们的会员名单上看到了 Taymon Beal 的名字。一些著名的道德哲学家,如 Peter Singer 和 Derek Parfit,也都是会员。除此之外,还有 700 多人加入了这个组织。
我建议你不妨了解一下这个组织。
幼儿园:我错了
原文:Preschool: I Was Wrong | Slate Star Codex
作者:Scott Alexander 发表时间:2018 年 11 月 6 日
Kelsey Piper 近期在 Vox 上发表了一篇文章,题为《幼儿教育带来了巨大益处——只是和你想得不一样》。
我曾关注过各种研究,这些研究表明幼儿园无法提高学业技能、学业成绩或智商,因此我断定幼儿园是无用的。事实上,这一论点甚至成为了循证社会干预运动的一面旗帜:大众对幼儿园的持续支持恰恰证明,他们是不懂科学的蠢货。我可能从未公开说过这番话,但我内心对此深信不疑。
我和 Kelsey 讨论了她文章中的一些研究,并独立得出了同样的结论:尽管关于学业成绩的早期研究是准确的,但幼儿园(包括备受诟病的 Head Start 项目)似乎能以更为微妙且深远的方式助益儿童的发展,而这种影响往往在多年之后才会显现。上过幼儿园的儿童通常能在学校系统里待得更久,获得更理想的工作,更少触犯法律,对社会福利的依赖度也更低。而大多数早期研究所聚焦的核心指标——学业能力——反倒是幼儿园唯一无法产生影响的方面。
这表明幼儿园的益处并非源于课程设置或「教导幼儿如何学习」等因素,而是纯粹来自社会层面的原因。Kelsey 回顾了一些证据,指出幼儿园可能改善儿童健康,但这似乎不是其最主要的影响。她认为,幼儿园的主要作用在于:为低收入家庭的父母腾出时间,使他们能够获得更好的工作(对母亲而言,甚至可能是获得工作的机会),从而提升父母的人力资本,并带来一系列相关的积极影响。更进一步推测,如果家庭环境特别恶劣,幼儿园能让孩子暂时远离这种环境,帮助他们适应「正常」的生活方式。我将在接下来的文章中详细讨论这个更为完善的模型。
在赞同这一观点的同时,我唯一的疑虑来自 Chetty 的研究发现:优秀的小学教师(相比糟糕的教师)能够为学生带来类似的效果——即没有学业进步,但在多年后能显著改善学生的人生境况。这一发现似乎无法用解放父母的时间或让孩子远离不良家庭环境来解释。不过,它可能与社会化过程有关,尽管我不愿意勾勒出一个具体的模型来解释这一过程。但既然关于教师影响的数据和 Head Start 项目的数据结果一致,这让我更有理由相信两者的结论都是正确的。
说实话,我不记得自己曾经发表过任何贬低 Head Start 的帖子,但我确实曾经认为这个计划毫无价值。如今,得知事实并非如此,这对我来说是一个重大的认知更新。我曾在文章中提到,当你对某个观点做出如此大规模的更新时,在进一步解释或为自己辩护之前,公开承认错误是至关重要的。因此,我必须坦诚地说:我之前对 Head Start 的看法是错误的。
既然已经坦白了错误,那么接下来,就让我们来看看我能找出什么自我辩护的理由和借口吧!
1)Head Start 项目的成效似乎源于一些与其初衷完全无关的因素。尽管项目倡导者最初的设想是错误的,但这个案例仍然很好地展示了政策效果难以预测的特点。该项目的成功更像是一个意外的结果,而非证明「幼儿教育」本身就是一个好主意。
2)这一发现很可能强化而非削弱了 Caplan 提出的反对学校教育的依据。研究表明,幼儿园中的教学内容实际上并无实质性作用,即使配备更优秀的教师或采用更好的课程设置,也不会影响项目的整体效益。
3)这一发现强化了学业成就主要与智商相关的观点,同时也支持了智商主要由遗传决定且难以改变的论点。针对学业成就和智商的干预措施能改变除了学业成就和智商之外的一切,但这两个关键变量却始终保持不变。研究普遍表明,智商只能解释约 25% 的人生成果,这意味着教育可能影响其余 75% 的因素。
然而,从更宏观的角度来看,这确实动摇了我对生物决定论的信心。幼儿园属于共同环境因素的范畴,父母对子女是否上幼儿园有重大影响。那么,为什么这种共同环境因素没有在研究中显现出来呢?大多数研究通常认为共同环境因素并不重要。
这个问题与 Ozy 在其关于铅的文章中提出的问题如出一辙。我们普遍认识到铅的重要性,也深知它会对个人的人生发展造成不利影响。然而,我们同时了解到铅属于共享环境因素,而大量研究却反复表明共享环境的影响并不显著。有些研究发现,只有在样本中刻意制造极大的收入差距时,共享环境才会表现出微弱的影响。但其他研究则完全否定了这一点。更值得注意的是,几乎所有研究都表明,即使在通过便利抽样获得的、仍然存在较大收入差距的样本中,共享环境的影响依然微不足道。这种现象令人困惑不已。我们面前有两套同样卓越、经过多次验证的科学文献,却得出了完全相反的结论。那么,面对这样的矛盾,我们又该如何处理呢?
我能想到的唯一解释是,共同环境或许确实能产生影响,但这种影响在整体上微小到无法被那些宏观的综合研究所捕捉。这个解释似乎可以调和两种文献基础之间的矛盾。然而,这种解释又显得不太合理。我们知道铅中毒的影响是巨大的。而幼儿园的影响虽然程度适中,但也表明即便是像「母亲在孩子 3-5 岁期间有一部分时间不用亲自照看,从而为家庭带来的一点社会优势」这样微小的因素,都能产生持久且可被检测到的影响。那么,按理说我们应该能预期到更显著的环境差异会产生更大的影响,比如母亲是否拥有独立的财富可以自由支配,或者家庭是否有能力积累社会优势。
这种差异可能也与我们的测量对象有关。尽管双胞胎研究普遍认为共享环境的影响很小,但也存在一些例外情况。例如,犯罪研究经常[发现](https://books.google.com/books?id=Bmy2BQAAQBAJ&pg=PA49&lpg=PA49&dq="shared+environment"+crime&source=bl&ots=gOzVgxhp-u&sig=J_ZSYWjU3NElaNC5mWPZUNSbC_g&hl=en&sa=X&ved=2ahUKEwiw8t_oq5beAhWEJHwKHRbTB704ChDoATAGegQIABAB#v=onepage&q="shared environment" crime&f=false)共享环境因素的影响约为 15-20%,特别是在年轻群体或贫困人群中。有趣的是,一些发现幼儿园效果显著的研究恰恰测量的是犯罪率。这些研究结果虽然存在一些不一致,而且 15-20% 的整体影响似乎与仅仅来自幼儿园的可测量效果不太相符,但在这种情况下,我不得不作出这样的解释。
鉴于此,我倾向于更多地相信那些研究结果。它们表明,当我们将研究范围限定在非认知因素,并将极度贫困群体纳入考虑时,共享环境的影响会更加显著。我希望未来的研究能够进一步证实这一结论。
我将加大对这类项目的政治支持力度。在我看来,这些研究结果使得推行全民儿童保育计划(几乎)成为一个想都不用想的选择。同时,这些发现也大大提升了普及幼儿园的吸引力。尽管反对者可能会质疑其效率,认为全民儿童保育或基本收入计划能更有效地实现相同目标,但考虑到当前的政治现实,普及幼儿园比全民儿童保育或基本收入更易落实。因此,我现在愿意全力支持这一政策。
幼儿园:比你想知道的要多得多
原文:Preschool: Much More Than You Wanted To Know | Slate Star Codex
作者:Scott Alexander 发布于 2018 年 11 月 13 日
一
我此前发表的一篇关于幼儿园的文章引发了不少反对声音。看来,我们有必要对此进行更加深入细致的探讨。
简要回顾:高质量的随机对照试验已经证明,幼儿园并不能持续提高学生的考试成绩。尽管有时考试分数会略有提升,但这种效果通常在接受一两年常规学校教育后就会消失。然而,早期针对一些密集型「全方位(wrap-around)」幼儿园项目(如 Perry 幼儿园计划和 Abecedarians 项目)进行的随机对照试验发现,这些项目的毕业生在成年后确实取得了显著更好的成果。这些成果包括更高的学校毕业率、更高的大学入学率、更低的犯罪率以及更好的就业机会。不过,这些研究是在 20 世纪 60 年代进行的,当时的研究方法还不够规范,随机化和后续跟踪都相对随意。此外,这些研究的样本量较小,且所研究的项目比后来取代它们的大规模推广版本更加密集。现代大规模推广的幼儿园项目,如 Head Start,迫切希望能够继承这些早期项目的声誉,并宣称取得类似的成果。然而,目前针对 Head Start 唯一的高质量随机对照试验——HSIS 研究——仍处于初期阶段。该研究已经证实,Head Start 带来的考试成绩提升确实会逐渐消退。但是,研究时间还不够长,无法得知该项目是否会对学生的未来生活产生长期影响。我们可能需要再等约十年才能看到这些结果。在此之前,我们只能基于一些准实验研究进行推测。
在众多相关研究中,Deming 2009 年的研究最令我赞赏。Deming 分析了全国青年纵向调查的数据,这是一项被广泛应用于社会科学研究的全国性大型调查。他特别关注了参加 Head Start 项目的儿童。考虑到 Head Start 项目主要针对贫困家庭,这些儿童大多来自弱势群体,因此直接将他们与普通儿童进行比较显然是不公平的。Deming 没有采用简单的「收入控制」方法,因为他深知这种方法的局限性。相反,他采用了一种独特而巧妙的研究方法:找出那些参加了 Head Start 项目但有兄弟姐妹未参加的儿童,将这些未参加项目的兄弟姐妹作为 Head Start 参与者的匹配对照组。
这种研究方法虽然确保了对照组与实验组来自相同的社会经济背景,但研究者也承认这种做法引发了新的问题。我们不禁要问:为什么父母会选择让一个孩子参加 Head Start 项目,而不让另一个参加呢?可能是因为其中一个孩子学习能力较差,父母认为他需要幼儿园提供的额外帮助。如果是这样,Head Start 的参与者可能普遍不如对照组聪明,这就会导致我们低估 Head Start 项目的效果。也可能是因为其中一个孩子特别聪明,父母希望通过教育来充分开发他的潜力。在这种情况下,Head Start 的参与者可能普遍比对照组更聪明,从而夸大了项目的效果。另一种可能是,父母偏爱某个孩子,因此在各方面都给予更多支持。如果这意味着这些孩子在其他方面也获得了更多优势,那么同样会夸大 Head Start 的效果。还有一种可能是,父母将更偏爱的孩子送到高档私立幼儿园,而不太受宠的孩子则被安排到面向弱势群体的政府项目 Head Start。还可能是父母最初经济条件不佳,将孩子送入 Head Start,但后来经济状况改善,便将下一个孩子送入高档私立幼儿园。这种情况下,后者不仅享受了更好的幼儿园,还因家庭新获得的财富在其他方面受益。显然,这里存在诸多潜在的问题。
Deming 竭尽全力地试图证明 Head Start 项目对参与者并无实质性影响。为此,他开展了一项全面的对比研究,比较了参加 Head Start 项目的儿童与其未参加项目的兄弟姐妹,涉及三十个不同的前置变量。这些变量涵盖面广泛,包括幼儿园阶段的家庭收入、标准化测试成绩、各种健康指标、母亲在孩子幼儿园阶段的工作时长,以及是否接受母乳喂养等。然而,在这三十个变量中,Deming 仅在出生体重一项上发现了显著差异:参加 Head Start 项目的儿童出现极低出生体重的可能性更小。这一发现颇具意义,因为出生体重被普遍认为是预测儿童整体健康状况和未来生活成就的重要指标。但是:
鉴于近期大量文献探讨了出生体重与个人后续发展之间的关联,这对本研究的有效性构成了严峻挑战。然而,我们有充分理由相信,出生体重的差异并不会导致严重的偏差。首先,这种差异似乎主要源于低出生体重儿童比例的不均衡,而非 Head Start 项目参与者的整体出生体重分布向右偏移。例如,当我们将占样本不到 10% 的低出生体重儿童排除在外时,出生体重就不再存在显著差异。
其次,在本研究样本中,出生顺序与出生体重之间存在显著的交互作用。出生体重的平均差异主要来自第三胎、第四胎或更晚出生的孩子。相比于未参加幼儿园的兄姐,那些出生较晚且随后参加 Head Start 项目的孩子,出生体重偏低的可能性要小得多。当我将分析范围限定在仅有兄弟姐妹对的家庭时,出生体重的差异大幅缩小且不再具有统计显著性,而主要研究结果仍然保持稳健。最后,我在剔除低出生体重儿童后,重新估算了第五节中的所有模型,结果显示主要发现依然保持不变。
尽管如此,为了评估可能存在的正向偏差的程度,我参考了 Black, Devereux 和 Salvanes (2007) 对出生体重影响长期结果的估计,进行了一次修正计算。他们的研究发现,出生体重增加 10% 会使双胞胎的高中毕业率提高 0.9 个百分点,兄弟姐妹间则提高 0.4 个百分点。假设这种简化关系在本研究中同样适用,一个粗略的修正表明,Head Start 项目对高中毕业率的影响(以及由此推及的其他结果)可能存在 0.2 到 0.4 个百分点的上偏,约占总效应的 2-5%。
Deming 设立了实验组和对照组后,开展了一项研究,旨在比较参与「Head Start」计划的儿童与对照组儿童的表现。测试结果呈现出一些复杂的模式,这些模式在不同子群体间存在差异。黑人儿童(占样本的主体;「Head Start」计划主要面向弱势群体,有时特别关注黑人)表现出典型模式:在幼儿园和一年级时,测试分数略高,但这种优势在几年后逐渐消失。白人儿童的测试分数则始终没有显示任何提高。某些子群体,如男孩和高智商母亲的孩子,测试分数的提高似乎持续存在。然而,这些子群体间的显著性差异本身并不具有统计学意义,可能只是随机现象。合理的推测是,作为样本主体的黑人儿童的结果才是真实的,其他结果可能只是统计噪音。这与对整个样本的非子群体分析结果一致,研究似乎也采用了这种解释方式。
Head Start 项目在非测试指标上的成效尤为显著。参与该项目的学生比对照组学生高中毕业的概率高出约 8%。这种积极影响在黑人、男孩和母亲智商较低的孩子中特别明显,而在白人、女孩和母亲智商较高的孩子中则不太显著。考虑到前三类群体本身面临较高的辍学风险,这种差异可能只是反映了所谓的「地板效应」。此外,参与 Head Start 项目的学生被诊断为学习障碍的可能性更低(值得注意的是,学习障碍的诊断标准本身存在问题,往往会不公平地影响学业表现欠佳的学生),他们留级的可能性也略低。研究结果表明,对于那些原本就容易出现不良结果的群体,项目的效果更为显著,这与预期相符。然而,该项目对减少犯罪行为似乎没有明显影响。令人疑惑的是,尽管数据集应该包含相关信息,研究者并未分析项目对参与者收入的影响。
研究者将这些结果综合成一个「年轻成年人结果」指数,发现 Head Start 项目使这一指数提高了 0.23 个标准差。虽然这个数字小于常被认为效果微不足道的抗抑郁药 0.3 个标准差的影响,但在社会科学领域,这已经是相当可观的进步。Deming 对这一结果做出了乐观的解读,认为它「缩小了家庭收入中位数和底部四分之一之间差距的三分之一」,「弥补了 75% 的黑人-白人差距」,并且「以 60% 的成本达到了 Perry 幼儿园项目 80% 的效果」。
最后,为了确保研究结果的可靠性,他进行了一系列稳健性检验,以验证结论不会过度依赖于分析中的任何特定因素。我不会在此详细介绍这些检验,但有兴趣的读者可以在手稿的第 127 页找到相关内容。值得称赞的是,他主动进行了这样的检验。这一点尤其难能可贵,因为我平常阅读的社会心理学家们的论文中,他们对待稳健性检验的态度,就如同吸血鬼对待大蒜一般。
Deming 的研究与 Garces Thomas & Currie (2002) 的论文在研究方法上高度相似,只是采用了不同的数据集。GTC 的研究更早且更为知名,在相关领域的讨论中常被引用。我之所以更关注 Deming 的研究,是因为我认为他的分析更为严谨,且对研究方法的阐述更为详尽。仔细研读 GTC 的研究,可以发现他们并未在整体样本中发现显著效果。在分组分析中,他们发现 Head Start 项目提高了白人完成高中学业并进入大学的可能性,同时降低了黑人参与犯罪的概率。这种差异似乎可以用地板效应来解释:黑人与刑事司法系统接触的几率本就远高于白人,再加上样本中黑人数量多于白人,因此这一效果只在黑人群体中表现得显著也不足为奇。然而,仔细审视研究结果,我发现白人群体中也存在几乎同等强度的正面效应(即参与 Head Start 项目的白人犯罪率上升,幅度与参与项目的黑人犯罪率下降相当)。只是由于白人样本较少,这一效应未达到统计显著性。此外,无论如何解读,有关高中教育的结果都难以自圆其说。GTC 在论文中多次提到「统计显著性」,表明他们确实考虑了这一因素。但他们并未给出具体的显著性水平,这让人感觉他们的结果并不十分令人信服。更值得注意的是,他们的研究结果与 Deming 的发现存在较大差异。Deming 的研究表明,所有种族都更可能从高中教育中受益,且没有任何种族的犯罪率下降。此外,GTC 在证明兄弟姐妹之间不存在差异方面的工作也远不如 Deming 充分。虽然 Deming 的研究被认为是对 GTC 的确认或复制,但实际上,这种说法仅仅是因为两项研究都对 Head Start 项目给予了积极评价。事实上,他们的研究结果模式大相径庭,而且 GTC 的结果在某种程度上显得缺乏说服力。
值得一提的是,在十年前,本文提到的两位作者 Currie 和 Thomas 就进行了一项类似的研究。他们同样使用了全国青年纵向调查数据,这让我不禁好奇他们的分析方法与 Deming 的研究有何区别(可能是因为时间更早,可用数据较少?)。他们最初采用了一个「调整混淆因素」的模型,但效果并不理想。随后,他们转而使用了一个比较兄弟姐妹的模型,结果发现参加 Head Start 项目的孩子通常比未就读幼儿园的兄弟姐妹年龄稍大,且往往出生于经济条件较差的母亲(这两个现象本质上可能是同一结果的不同表现,因为母亲随着年龄增长,经济状况通常会有所改善)。这些参加项目的孩子在标准化测试中的表现也往往更为出色。然而,研究中并未明确说明测试的具体时间,因此我无法判断这是否意味着分组本身就存在偏差,还是说项目干预确实提高了测试分数。研究发现,Head Start 项目并未增加参与者的收入,可能会在某种程度上提高白人而非黑人的测试分数,降低白人而非黑人的留级率,并改善黑人而非白人的健康状况。研究者还探讨了 Head Start 对母亲的影响,因为该项目的全面服务中包括家长培训。研究仅发现对白人母亲的智商分数有轻微影响,此外还有一个「Head Start 显著提高白人母亲首次生育时为青少年的概率」的结果,但研究者认为这可能只是抽样误差。与后来的研究类似,这项研究也没有给出 p 值,而我也懒得算这些值。不过,从给出的信息来看,这些结果的统计显著性可能并不令人信服。
最后,布鲁金斯学会的一个研究团队也对 Deming 的工作进行了复制和拓展。他们采用了与 Deming 和 GTC 论文相同的全国青年纵向调查数据集,但纳入了更多年份的数据进行更新分析。与 Deming 的发现一致,他们确认参加 Head Start 项目的儿童与未上学前班的兄弟姐妹在「大量」潜在混杂因素上并无显著差异。作为布鲁金斯学会的研究,他们以更为清晰直观的方式呈现了研究结果:
布鲁金斯的复制研究(图中标记为 THP)发现的效果大小介于 GTC 和 Perry 幼儿园之间。具体而言,他们发现 Head Start 项目对西班牙裔学生的高中毕业率产生了积极且显著的影响,但对黑人和白人学生则无显著影响。这一发现呈现出与之前研究不同的种族差异模式。由于他们的样本中黑人和西班牙裔学生比例较高,且黑人学生的结果接近显著水平,因此整体样本的结果是显著的。研究显示,Head Start 项目使高中毕业率提高了约 6%,略低于 Deming 声称的 8%。然而,从这张图表上很难理解 Deming 如何得出他的 8% 效果达到 Perry 幼儿园 80% 的结论。此外,研究还发现 Head Start 项目在大学入学率、自尊心和「积极育儿」等方面也产生了类似的积极影响。他们的结论是:
这些研究结果与 Deming (2009) 的发现高度一致。值得注意的是,Deming 当时只能基于有限的群体数据来计算高中毕业率。
Deming、GTC、CT 和 Brookings 这四项研究尽管使用了不同的数据集,但本质上都在探讨同一个问题。从宏观角度看,它们的结论听起来大同小异——「某些族裔群体的高中毕业率等指标有所改善」。然而,深入细节就会发现,这些研究在具体哪些指标得到改善,以及哪些族裔群体受益等问题上难以达成一致。这种分歧的严重程度值得我们深思。这些研究的结果普遍徘徊在统计显著性的临界点附近,时而略高,时而略低,这一方面解释了研究之间的矛盾,另一方面本身也引发了质疑(Deming 的研究是个例外,其中多项结果在 0.01 显著性水平上成立)。尽管如此,大多数研究确实发现了总体向好的趋势,得出的结论也基本合理。总的来说,我认为 Deming 的研究表现较为出色,Brookings 的重复研究因细节不足难以评判,而各种 GTC 论文则对整体结论影响不大。
二
我打算单独讨论 Ludwig 和 Miller的研究,因为它采用了一种不同的——也更为有趣的——研究设计。
1965 年,美国政府启动了一项新措施,旨在为全国 300 个最贫困县实施「Head Start」项目。由于该计划并未惠及排名第 301 位及之后的县,这就在第 300 位和第 301 位之间形成了一个自然的断点。这种情况为开展断点回归实验提供了典型案例,因此研究者 Ludwig 和 Miller 决定深入调查,探究从第 301 位最贫困县到第 300 位是否存在儿童发展成果的显著跃升。
他们首先关注健康方面的结果,发现了令人瞩目的进展。数据显示,「Head Start」项目使某些易预防的儿童疾病的发生率降低了 33% 到 50%。例如,在实施该项目的县中,儿童贫血症状况明显改善。这一结果并不令人意外,因为「Head Start」项目的一个重要内容就是进行贫血筛查并为儿童补充铁质,这对多数贫血症都有治疗效果。值得注意的是,1965 年美国最贫困的 300 个县主要集中在深南部地区,以黑人人口为主,各方面条件之恶劣远超一般想象——可以说接近第三世界的贫困水平。在这样的地方实施健康筛查和干预措施,自然会降低那些原本可预防的疾病的发生率。Ludwig 和 Miller 的研究证实了这一点。尽管这个结果令人鼓舞,但并不特别出人意料,而且可能与我们此处讨论的其他内容关联不大。
然而,研究人员还发现了一个关于高中毕业率的显著现象,他们称之为约 5% 的「正向断点」。具体而言,在美国最贫困的前 300 个县,儿童完成高中学业的几率比排名第 301 位及以后的县高出约 5 个百分点。这相当于平均多接受了半年的学校教育。值得注意的是,这种断点现象在「Head Start」(一项针对低收入家庭儿童的早期教育计划)实施之前并不存在,而且在那些因年龄原因无法参与该计划的儿童中也未观察到。这一现象恰好在 Head Start 计划启动时出现,且仅限于参与该计划的儿童群体。这是一个极具意义的研究发现。
遗憾的是,研究结果并不如预期理想。研究者坦诚地指出,他们的发现仅仅达到了统计学上可检测的临界值(p<0.05)。为了增加结果的可靠性,他们使用另一个数据源进行了交叉验证,结果显示了相同的趋势,但统计显著性更低(p<0.1)。研究者承认:「我们关于 Head Start 项目对教育程度产生积极影响的证据更多是推测性的,而且受限于我们可用的两个数据源都不够理想这一事实。」尽管这项研究采用了最为严谨的设计,确实发现了一些效应,但这些效应基本上等同于对着图表仔细观察后得出「这条线似乎比另一条稍微高一点」的结论。他们进行的统计分析,本质上也不过是用数学方法来表达这种微弱的差异,说服力同样有限。如需更全面、更具批评性的分析,可以参考这个 subreddit 上的相关讨论。
值得关注的是 Carneiro 和 Ginja 进行的另一项断点回归研究。他们分析了 Head Start 项目可用性对参与者的影响,试图证明那些刚好符合参加条件的人比那些刚好不符合条件的人表现更好。这种研究方法既巧妙又具有说服力。研究结果显示,参加 Head Start 的人在某些方面确实受益:他们较少出现肥胖问题,患抑郁症的可能性也较低。对于非黑人群体(不包括黑人),参与犯罪的可能性降低——这一发现与先前关于 Head Start、犯罪和种族的研究结果恰恰相反。然而,该研究并未发现 Head Start 对提高高中毕业率或大学入学率有显著影响。有趣的是,研究者似乎有意淡化了这一结果,而其他人在引用这项研究时,往往只强调「瞧,Head Start 项目的效果得到了再次证实」这一观点。
三
一些零散的其他相关研究:
1980 年,芝加哥启动了名为「儿童父母中心」的幼儿园项目,其目标群体是弱势儿童,这与我们此前讨论的其他项目如出一辙。他们进行了一项研究,研究结果却出人意料地发表在了一份医学杂志上。这项研究的严谨程度似乎不及同类研究。例如,对照组的情况几乎只是一笔带过,仅称其为「匹配的」。尽管如此,得益于异常庞大的样本量和出色的跟踪调查,他们得出了一些引人注目的结论:该项目使儿童在校时间延长了六个月,这与其他多项研究的发现不谋而合;对大学毕业率产生了显著影响(参与项目的儿童大学毕业率为 14%,未参与的为 8%);效果呈现剂量依赖性;而且「结果稳健」。然而,由于他们在展示研究过程方面表现欠佳,我不得不选择信任他们和发表这项研究的《美国医学会杂志》。这是一本享有盛誉的期刊,我只能寄希望于它不会刊登毫无价值的文章。
Havnes 和 Mogstad 对挪威一项分阶段在各地推行的免费普惠儿童保育计划进行了分析。他们发现,「接受儿童保育的经历提高了完成高中教育和进入大学的可能性,其影响程度与美国黑人-白人教育差距相当」。我不禁略显犬儒地推测,如果挪威有黑人人口,他们从这个项目中获得的利弊可能会呈现出完全不同的模式。然而,由于挪威是一个几乎单一民族的国家,他们得以避开了分群体分析。这与魁北克的情况形成鲜明对比,那里一个类似的儿童保育计划似乎导致了更糟糕的长期结果。深入探讨这些研究结果,虽然证据尚显薄弱和非正式,但支持了这样一个模型:当日托质量优于父母照料时,儿童发展结果会改善;反之,当日托质量低于父母照料时,儿童发展结果会下降。因此,建立高质量日托并主要吸引那些父母无法提供良好照料的儿童的改革将会有益。相反,创建低质量日托并从已经做得很好的家庭吸引儿童的改革则会产生负面影响。更多相关讨论可参见此处。
接下来让我们关注 Chetty 关于学前班(kindergarten)的研究,我在另一篇文章中曾详细探讨过。他的研究发现颇具启发性:优秀的学前班教师虽然不能持续提高学生的考试成绩,却能持续影响其成年后的收入水平。这一现象与幼儿园效果先消退后显现的论点不谋而合。这项研究采用随机对照设计,具有很强的说服力。然而,将其直接应用于当前的讨论可能不太恰当,原因有三:首先,幼儿园与学前班存在本质区别;其次,拥有一位优秀教师并不等同于接受幼儿园;最后,我们目前讨论的大多数研究并未涉及成年收入这一指标。尽管如此,这项研究至少揭示了一个重要可能性:学校教育对人生后期的发展可能产生意想不到的巨大影响,这种影响可能会先消失,而后又重新显现。
最后,还有一项涵盖 22 项早期儿童教育研究的元分析,结果显示早期儿童教育对高中毕业率的影响效应为 0.24 个标准差,p 值小于 0.001。老实说,也许我应该一开始就提到这项研究。把它留到最后可能显得有些不合常理,因为它的重要性可能超过我之前提到的所有研究的总和。我之所以这样安排,一方面是想让你体会到我在研究接近尾声时发现这一重要文献的沮丧心情,另一方面也是为了让你对这个元分析所包含的研究类型有一个全面的认识。
四
那么,面对这些纷繁复杂的研究结果,我们能得出什么结论呢?
我担心第一部分和第二部分的所有研究都被过于简单地总结为「Head Start 项目有效!」,因而被视为相互印证。毕竟,最新的研究和之前的研究似乎都得出了这个结论。然而,实际情况远比这复杂。每项研究实际上都发现 Head Start 对某些特定群体在某些特定方面有微小影响,而且这些受影响的群体和具体影响往往因研究而异。以 GCT 和 Deming 的研究为例。虽然这两项研究通常被认为相互验证,但它们的结果实际上存在矛盾。GCT 的一个主要发现是 Head Start 降低了黑人儿童的犯罪率,但 Deming 却发现 Head Start 对黑人儿童的犯罪率没有影响。这两项研究唯一一致的结论是 Head Start 似乎提高了白人的高中毕业率。然而,Carneiro 和 Ginja 的研究(通常被视为对前两项研究的重复验证)却发现 Head Start 对白人的高中毕业率没有影响。
对这种现象,有一个合理的解释:所有这些研究结果都非常接近统计显著性的临界值,因此这些差异可能仅仅是统计噪音。用图表来展示可能会更直观:
从图中可以清楚地看出,两项研究基本上得到了相同的结果,只是存在少许噪音。但是,由于统计显著性的判断,研究 1 不得不将其结果报告为「对黑人有显著影响,对白人无显著影响」,而研究 2 则必须报告相反的结论。这是否就是导致这些看似矛盾的结果的原因呢?
我整理了一份数据表格,但坦诚地说,我对这个表格的可靠性存有很大疑虑。首先,从本质上讲,我不确定我所进行的这种数据比较是否真的可行。我怀疑这些研究中的数据是否真的具有可比性,它们是否确实反映了表面上看起来的那些含义。其次,我也不能完全确定我记录的信息绝对准确,或者所有数字都被放在了恰当的位置上。尽管如此,我还是决定将这个表格呈现出来;其中红色标记表示该结果在统计学上具有显著性:
这个表格印证了我之前的担忧。每项研究都得出了迥然不同的结论,而且差异之大令人吃惊。举个例子,Carneiro & Ginja 的研究发现,该项目对降低白人犯罪率有显著的积极效果。然而,GCT 的研究却发现 Head Start 反而略微提高了白人犯罪率,尽管这一增加在统计学上并不显著。同时,GCT 的研究表明该计划能显著降低黑人犯罪率,效果很强,但 Carneiro 和 Ginja 的研究却发现这一效果几乎可以忽略不计。
在这些研究中,黑人高中毕业率的结果最为一致,也最具说服力。Deming 的研究,以及 Ludwig 和 Miller 的研究都发现了积极效应。尽管 Carneiro 和 Ginja 的研究没有发现显著效应,但他们得出的效应量与其他研究相近。他们之所以没有得出显著性结果,可能是因为采用了更为严格的标准,这体现在他们对多重比较进行了调整,并检验了多个变量。事实上,他们确实应该采用更严格的标准。我试图为反对这一做法辩护,本质上是在否定他们恰当的研究方法,仅仅因为我想强行得出积极结果。然而,这正是良好的统计实践试图阻止我们做的事情。因此,我应该认识到这种倾向的不妥,避免这样做。
以下是支持接受这项身体研究的最有力论据。首先,这似乎并非源于发表偏差。Ludwig 和 Miller 在一篇论文中指出,由于几乎所有可用于评估「Head Start」项目的数据集都已被分析,因此这里不太可能存在发表偏差。其次,尽管我在前面的图表中没有特别关注性别或智商因素,但大多数研究确实发现,该项目在解决男性和低智商群体常见问题方面更为有效,这表明研究结果通过了合理性检验。更为关键的是,如果一项研究的结果完全是虚假的,那么理应会有数量相当的有益和不利发现(例如,发现「Head Start」项目使某些群体在某些方面的表现变差)。考虑到这些研究每一项都涉及多个方面,并通常得出许多不同的显著结果,因此通过发表偏差完全排除所有不利发现应该是极其困难的。这在某种程度上与积极的元分析结果相符。各项研究要么显示微小的正面效果,要么结果不显著,但当将所有这些研究结合进行元分析时,结果变得高度显著,看起来令人信服且合乎逻辑。这与挪威的一项研究结果高度一致,该研究表明儿童保育对未来生活有显著的积极影响。同样,Chetty 的研究也表明,尽管幼儿园教师的影响似乎会随时间减弱,但在学生未来的生活中仍会产生显著的积极影响。此外,Perry 幼儿园和 Abecedarian 研究也显示,尽管测试分数的影响会逐渐消退,但在未来生活中仍会产生显著的积极影响。我最近甚至了解到一个非常精妙的发展理论,可以解释为什么会出现这种情况,但遗憾的是,限于篇幅,无法在此详述——请期待未来几周的一篇相关书评。
对这项研究的质疑主要在于,研究人员可能采取了一些手段来规避不利结果。元分析的结果或许只是反映了这样一种现象:当大量研究者各自进行一些微小的、难以察觉的数据操纵时,这些看似无伤大雅的行为累积起来就会产生显著的整体效应。这种说法虽然略显尖锐,但最近我看到了一张极具启发性的图表(感谢 Mother Jones 杂志,他们将其誉为「十年来最具价值的图表」和「有史以来最精彩的图表之一」):
这张图展示了医学界引入预先注册制度(图中垂直线所示)前后的药物试验结果。换言之,这反映了在研究造假变得更加困难之前和之后的情况。在实施预先注册之前,60% 的试验显示所研究的药物是有效的。而在实施之后,这一比例骤降至 10%。这意味着,通过提高作弊难度,阳性结果的比例直接下降了六倍。在早期儿童教育研究领域,操纵数据并非难事;本文迄今为止提到的所有研究都属于未经严格监管的范畴。因此,我们应该对这类研究保持高度警惕,除非它们能经得起最严格的审查——而目前讨论的这些研究显然还达不到这个标准。
《理性的美德》中提到:
倾向于相信的人会问:「证据是否支持我的信念?」而倾向于怀疑的人则会问:「证据是否迫使我相信?」我们要警惕的是,不要只对自己不喜欢的观点设置过高的举证门槛,然后为自己辩解说:「保持怀疑态度是好事。」如果你只关注对自己有利的证据,从收集的数据中挑挑拣拣,那么你搜集的信息越多,反而会知道得越少。如果你有选择地审视某些论点是否存在缺陷,或者对不同论点投入不同程度的审视,那么你发现的每一个缺陷不仅不会让你变得更聪明,反而会让你变得更加愚蠢。
这是众多问题中的一个,现有证据允许我怀疑,但并不迫使我怀疑。目前,我只能依靠直觉和一些模糊的经验法则。我的直觉告诉我,二十年后当所有研究结果都出来时,早期儿童教育项目可能会继续显示出微小的积极效果。然而,我的经验法则却得出相反的结论,认为我不应该信任这种不够严谨的研究。因此,我现在无法做出确定的判断。
我认为我正确地意识到,我之前「幼儿园绝对无效」的观点已经过时,并正面临挑战。然而,我可能过早地宣称我关于「幼儿园无效」的看法是错误的;我本应该说我可能是错的。如果非要我下个结论,我会说有 60% 的可能性幼儿园能够以这些研究所描述的方式产生积极作用,40% 的可能性它是无效的。
我希望,随着研究参与者在 2020 年代某个时候进入高中阶段,对 Head Start 影响研究(HSIS)的进一步跟踪调查能够为这个问题提供更多见解。HSIS 是一项针对 Head Start 早期教育计划开展的、质量异常优秀的随机对照试验。
SSC 发表了一场毕业演讲
原文:SSC Gives A Graduation Speech | Slate Star Codex
发表于 2014 年 5 月 23 日 作者:SCOTT ALEXANDER
[触发警告:本文可能引发你对毕业生就业前景的恐慌]
[知识状态:文章旨在发表有说服力的演讲,可能有点夸大其词]
女士们,先生们,我深感荣幸,能受邀在[消音]大学这所著名学府发表演讲。让我们一起为野猫、斯巴达人或雄鹰欢呼,具体要看贵校的吉祥物是什么了!
请原谅我今天的发言可能不够精雕细琢。原定演讲嘉宾 Steven L. Carter 先生,因为他那些令人不齿、有悖常理的观点,被取消了演讲资格,主办方临时通知我来顶替。在这里,我要明确表示,我完全谴责 Carter 先生及其所代表的一切,也赞赏[消音]大学在此事上所持的坚定立场。
诸位,说到史上最著名的毕业演讲,恐怕非 Kurt Vonnegut 的「涂防晒霜」莫属了。我相信你们都有所耳闻。他当年告诉麻省理工毕业班的学生,一定要记得涂防晒霜。因为他提供的其他人生建议可能是错的,但涂防晒霜这条,至少有充分的科学依据。
而我今天站在这里,是要告诉大家,如今在皮肤科医学界,对防晒问题还存在激烈争议。一项 1995 年的研究发现,使用防晒霜越多,罹患最危险的皮肤癌——恶性黑色素瘤的风险就越高。8 年后的一篇综述文章则声称,这项研究有肤色这个混淆因素,认为防晒霜与黑色素瘤实际并无关联。但更进一步的研究显示,防晒霜可能会增加内脏器官癌症风险,或因维生素 D 相关或不相关的某些机制所致。据我所知,目前大多数皮肤科医生仍建议使用防晒霜,但这一问题尚无定论。
但我们有必要深思这种分歧背后的深层含义。曾有一位全美最聪明的智者,在一个与今天类似的礼堂里,语重心长地说,他的人生箴言只有一条是无比确凿的——那就是你必须涂防晒霜。然而多年之后,我们才恍然大悟:这个问题错综复杂,至今仍无法得出唯一定论。更可怕的是,倘若你真的听从了他的建议,很可能反而会患上皮肤癌而英年早逝。
有时候,那些被奉为圭臬的所谓「真理」,其实根本就站不住脚。比方说,你可曾听说过,Vonnegut 压根就没写过那篇关于防晒霜的毕业演讲?
本着这种敢于质疑的批判精神,在你们中的许多人即将完成学业之际,我想问大家一个问题。诚然,或许你们有些人还会继续深造或接受专业训练,但毫无疑问,此时此刻,一个漫长的求学时代正在落下帷幕。回首从幼儿园到现在长达 17 年的求学路,请你们认真思考:
教育真的值得吗?
这个问题,俨然已是大学毕业典礼演讲的「标配」。主讲人往往会先反问教育的价值,继而言之凿凿地强调其必要性,理由无非是教育事关人生前途。台下掌声雷动,大家纷纷欢欣鼓舞地散席,前往招待会寻欢作乐。然而,为了提醒你们打起十二万分精神,严肃对待这个问题,我想提出一种截然相反的观点:在你们心目中,无论是公立、私立还是特许学校,从孩提时代到大学时光,从整体上说,会不会是在浪费你们宝贵的时光和金钱?
要想不落窠臼,理性评判教育的是非曲直,正如我们应该像给予防晒霜客观公正的审视一样,就必须全面权衡教育的利弊得失。毋庸置疑,教育至少有两大显著益处:在精神层面,它让人领略数学的优雅、人文的魅力、历史的恢弘;在物质层面,它能让人找到工作,满足衣食住行等现实需求。
让我们从精神层面谈起。人类的知识可谓博大精深。你的人生因为这些杰出思想家的真知灼见而丰富多彩,他们是巨人,你或许希望有朝一日能够站在他们的肩膀上。这还不够吗?
不过,正如你们中的大多数人(86%)所知,你不能仅仅因为观察到实验组出现了某种效果,就将其归因于实验干预本身。你必须看看对照组中的其他人是否付出了更少的努力就获得了同样的收益。
那么,在评估学校教育的效果时,对照组应该如何设置呢?几乎所有的评估指标都表明,在家接受教育的孩子要比公立或私立学校的学生表现得要好。但这种比较并不公平;用科学的话说,这是一种「主动对照」。我们真正应该做的,是将接受学校教育的孩子与完全没有接受任何教育的孩子进行比较。
然而,不对孩子进行教育是不合法的,因此我们很难找到理想的对照组。不过,「非学校教育」运动或许是一个最接近的选择。参与这一运动的父母认为学校具有压迫性和破坏性。他们告诉政府他们在家教育孩子,实际上却任由孩子自由发展。如果孩子主动要求学习,他们可能会教一些东西,但大多数时候都是放任自流。
不过,对「非学校教育」进行研究十分困难,因为实践这一理念的家庭经过了高度自我选择,而且数量稀少。我能找到的唯一一项针对这个运动的研究,样本量仅有 12 个,尽管研究者已经竭尽全力,试图在种族、家庭收入水平、父母受教育程度等各个维度上,将他们与接受学校教育的孩子进行匹配,但我相信,一些细微的差异性依然被忽略了。话虽如此,这已经是我们目前掌握的所有研究成果了。
那么,这些孩子真的比公立学校的同龄人表现更差吗?
确实如此。
对于大学阶段,我们了解甚少。不过,如果你不去上公立学校,而是呆在家里玩游戏,偶尔向父母请教一些问题,那么当你的朋友们高中毕业时,你的学业水平相当于高二。
另一个发人深省的线索来自 Louis Benezet 的数学教学实验。Benezet 是 20 世纪初的一位学监,他质疑在孩子很小的时候就给他们强灌数学是否弊大于利。于是,他指示管辖区内的部分学校推迟到六年级才开始教授数学。结果他发现,仅仅一年时间,这些六年级学生就赶上了传统学校的同龄人。更重要的是,他们思考数学问题的逻辑性更强——他们会深入探究题目的内在规律,而非机械地将题中数字胡乱套用乘除法。如果 Benezet 的实验结果确凿可信(细读之下这一点毋庸置疑),那么六年级之前的任何数学教育充其量也是徒劳无益的。由此我们不禁怀疑,在其他学科以及更大一些的孩子身上,情况恐怕也大抵如此。
为什么非学校教育的孩子能轻易跟上受过更好教育的同龄人呢?我想这很可能是因为学校里根本没有多少实质性的学习。教育的支持者们常常夸夸其谈,吹嘘感悟数学的优雅、人文的魅力、历史的恢弘。然而,在他们培养出来的孩子中,有几个能证明欧几里得的哪怕一个定理?有几个读过《坎特伯雷故事集》?又有几个真正体验过帕台农神庙的崇高之美?
需要说明的是,以上的问题并非反问句。根据一项关于大学生知识水平的普查,只有 3.3% 的人知道欧几里得是谁,7.6% 的人知道《坎特伯雷故事集》的作者是谁,仅 15% 的人知道帕台农神庙坐落在哪座城市。
在高中生中,只有 36% 的人知道原子比电子大,而非相反。到了大学生中,这一比例达到了 59%,也只比随机猜测高出 9 个百分点。而这仅仅是关于构成万物本质的最基本知识之一。
有人或许会说:「但知识不止局限于名字和日期!」诚然,名字和日期只是知识中容易衡量的部分。但可以有把握地说,如果一个人不知道帕台农神庙在哪里,他可能还没有真正领悟希腊建筑的精髓;如果一个人从未听说过乔叟,他对中世纪英国文学的经典著作可能也缺乏深刻见解。
因此,我认为「教育是传授高雅知识的必由之路」这一观点难以成立。首先,教育系统中的绝大多数人并未掌握这些知识;其次,即便是未受过正规教育的人,也能掌握相当多的此类知识;最后,如果一个人到了成年后才决定学习这些知识,即使儿童时期从未接触过,也能够快速而轻松地掌握,无需像强塞进七岁孩童稚嫩大脑那般痛苦。
那么,关于「教育在找工作和赚钱方面切实有用」这一说法,又当如何呢?
相比大多数年轻人,你们更「有幸」亲眼目睹梦想在残酷的现实中瞬间幻灭。你们中约有 15% 的人,在大学毕业后将沦为某种形式的失业者;另有 10% 的人或许能找到兼职;还有约 40% 的人将面临大材小用的窘境——或当服务员,或做文员,或去咖啡店打工,从事一些完全用不上你们苦苦掌握的知识的工作。剩下三分之一的「幸运儿」,纵然找到了与所学大致相关的工作,却仍不得不忍受这十年来裹足不前的工资、与日俱增的工作时长,以及几乎翻番的学生贷款。
但不必担心,我敢肯定,只要你表示对这笔「购物」略有不满,摩根大通、贝尔斯登、沙利美、高盛等大佬们,再加上联邦政府,定会慷慨大方地一笔勾销你的债务。毕竟,你当初肯定选了「保证满意」选项,对吧?啊,没有?哎呀。
就业市场已如此惨淡,继续深造的前景更是暗淡。经济学家告诫,上法学院是你能做出的最糟糕的职业决定,不然刚毕业的律师们也不至于无事可做,只能反过来起诉母校不该招收自己;知名律所更是新创了「非法学院奖学金」,只为唤起世人对这一乱象的关注。医生们普遍不快乐,自杀率屡创新高,十之八九都劝诫年轻人千万不要学医。读研向来是一场豪赌,但如今博士申请者与教职空缺比例已达百比一,绝大多数人最终沦为可怜的兼职教授,一边打几份工,一边赚着与星巴克咖啡师同等的微薄薪水,就连健康保险都无从谈起。
对了,我要特别感谢率先在演讲中引用网址的人,此举堪称世间最伟大的发明。
但在此,我不得不承认一个普遍观点:上大学能提高赚钱能力。无论你的处境多么糟糕,那些没上过大学的人的日子只会更加悲惨。所有经济指标都指向曾经的工业中心地带,如今那里已是一片荒芜之地:工人们的前景暗淡无光。他们的工资不仅停滞不前,还在持续下降;失业率高达 35%,堪比希腊;而改变现状的希望渺茫。一些经济学家将其归咎于全球化,认为它使得制造业和其他体力劳动很容易外包给中国。还有人指出罪魁祸首是技术,因为许多昔日高薪的蓝领工作已经被机器取代。这两大趋势只会愈演愈烈,把更多的工厂工人、卡车司机和仓库管理员变成快餐店的厨师、沃尔玛的服务员和眼神空洞的失业者。
但别以为自己能幸免于难。再过二十年,沦落到这般境地的就是你。诚然,目前机器只能完成一些简单的工作,全球化程度也不足以让外国人替我们处理太过精妙的事务。然而,律师已经感受到了自动生成合同软件带来的冲击;程序员的饭碗也正受到印度人的威胁,后者的工资只有他们的一半,却能用邮件把代码发到硅谷。即便无需发明什么机器人,只需一款高效软件就能让一个工程师完成三人的工作量,工程师也难逃失业的厄运。尽管有人做着微不足道的抵抗,但这就像卡努特国王试图阻挡汹涌的钞票浪潮,注定徒劳无功。
一旦机器能够比人类做得更出色、更低廉,那结局不难预料:少数发明和操控机器的天才过着优渥的生活;拥有机器的资本家则赚得盆满钵满;至于大多数人的命运,不言而喻。
「这是注定要发生的景象,还是仅仅是可能出现的景象?」其实,从马丁·路德·金、理查德·尼克松到米尔顿·弗里德曼,各路远见者都提出过基本收入保障的构想。设想在一个高度发达的未来社会,物质产出远远满足所有人的需求。但也正是在这样的社会,绝大多数普通人才力难支,无法谋生。在这种情况下,每个人都应该享有基本收入,仅仅因为他的存在。可以将其视为一种福利,但它覆盖所有人,无关身份地位,足以维持体面的生活。然而,这一宏伟蓝图却撞上了一座冰山,上面赫然写着「钱从何来」。即使取消现有的所有福利和救助计划,节省下来的财政资金,顶多只够提供人均 5800 美元的全民收入。我不晓得这点钱够不够糊口,但我可不想尝试。
不过,我们跑题了。我们是在盘点教育的种种益处。证明教育能增长见识,我们做得并不出色;但教育似乎确有实际好处,能让你多捞点钱。攥着闪闪发亮的大学文凭,你就能自信地宣称「我已得之」,只要你懂得视而不见那些渐行渐远的劳工大军,对收入差距日益拉大熟视无睹就好。
那么,教育的代价是什么?你失去了什么?
首当其冲的,是你青春的大约两万个小时。不过没关系,你本来也没打算好好利用那段健康完美、值得回味的金色岁月——那可是你一生中创造力、想象力和幸福感的巅峰时期。如果当年没有老师布置作业,要你做个拼贴画来抒发对《红字》的感受,你大概就会虚度年华,从一粒沙里看世界,从一朵花里见天国,诸如此类不务正业的事。
我对教育投资的财务收益更感兴趣。按照学生平均每年花费 1.1 万美元,13 年累计再加上各种各样的学前和大学补贴,政府为一个普通美国人从幼儿园到大学的教育总共投入了 15.5 万美元。
一条推文启发了我:如果政府在你出生时就拿着这笔根据通胀调整过的钱投资股市,等你大学毕业时再从股市取出本金,放入低风险债券,用部分利息对冲通胀,剩余的每年发给你作为基本收入保障,你能得到多少?
我算了一下,考虑到利息因素,每人每年能有 1.5 万美元。我们可以在此基础上,再加上现在已经能负担得起的 5800 美元基本收入保障,这样每人每年就有近 2 万美元。无论你是黑人或白人、男性或女性,就业或失业,健全或残疾,贫穷或富有。欢迎来到现实世界,一个人去很危险,拿上这个。什么,难道你以为我们会狠心把你扔进一个自生自灭,死了就真死了的世界?别逗了,我们才没那么残忍。
那么,当我们问你的教育是否值得时,就得将你的收获——让你比没受教育的人多知道那么一点点,让你们中 3.3% 的人了解欧几里得是谁的教育——与你本可以得到的东西相比。2 万小时的青春时光可以尽情玩乐、求知、学小提琴、做任何你想做的事情。再加上,每年 2 万美元,无需付出汗水。
每年 2 万美元听起来不算多。一个普通大学毕业生的职业中期平均收入接近这个数字的三倍——5.5 万美元。从数字上看,你受的教育回报似乎相当不错。但数字可能具有欺骗性。
设想一下,靠着这 5.5 万美元,你将过着怎样的生活。最接近这个收入水平的职业是律师助理,就以此为例吧。你在曼哈顿一家知名律所谋得一份律师助理的工作。住不起曼哈顿,但你设法凑钱在布鲁克林租了间狭小的公寓,每月房租 2000 美元。每天早上 7:45 起床,乘坐 45 分钟地铁去曼哈顿,9 点准时到达事务所。你的上司是个有点刻薄的律师,他自己还在为偿还法学院贷款犯愁,整天对你大声嚷嚷。等晚上 6 点左右回到家中,除了看会儿电视,你已经疲惫得什么都不想做。你没有真正的时间去邂逅异性——我假定你是女性,你们中的 60%,我将此归咎于父权制度——于是你在 Craigslist 网站上登了一则个人征友广告,过了一阵子觅得一位称心如意的人。一年后你们喜结连理,蜜月地点选在佛蒙特州,因为他的公司假期有限,去不了更远的地方。
你有 2.4 个孩子,却发现不得不搬到城里治安更好的社区,因为现在孩子们所在学区的教学质量实在太差。再加上沉重的学生贷款,这些因素都给家庭财务带来巨大压力,以至于你连儿童看护的费用都付不起。好不容易,你总算找到一家价格便宜的看护机构,尽管那里看起来有些脏乱,小儿子还学会了用一句不地道的英语脏话「puta」(妓女)来称呼你,但那里的价格的确实惠,而且是唯一愿意接收「0.4 个孩子」的机构。大一点的孩子总是向你和另一半求助功课,但你们实在爱莫能助,因为忙于律师助理的工作和追剧娱乐,早已无暇钻研数学、语法之类的知识。你只好让孩子向老师寻求额外的帮助,但老师也分身乏术,因为她还要兼顾其他 40 个提出同样要求的学生,每天只有 24 小时可支配。尽管条件如此艰苦,小儿子最终还是考上了大学。当然,你根本就没有存款支付学费,而眼下学费已经飙升到 120 gazillion 美元,摩根大通、贝尔斯登、沙利美、高盛和联邦政府也无法贷给他,因为 gazillion 根本就不是一个合法的数字。天哪,小儿子该不会沦落成一名高中毕业生,在失业率堪比希腊的「锈带」地区的一家破旧工厂前无助地徘徊吧?(译注:「锈带」是指美国东北部和中西部一些传统工业州,常被用来指代美国衰退的制造业)更可怕的是,难道他最后真的不得不搬回来跟你同住?绝望之下,你只能苦苦哀求小儿子回到银行,去申请任何利率的贷款。于是,这个恶性循环就这样开始了新一轮……
且让我们畅想一下,倘若你有每年 2 万美元的基本收入保障,生活会是何种景象?不再被工作羁绊,你可以自由选择栖身之所。我独爱群山,不妨在科罗拉多州的落基山深处安个家,住进一座木屋。那里风光旖旎,月租仅需 500 美元——无需拼命挤进大城市或郊区的优质学区,住房其实相当便宜。就这样,你在落基山脉安了家,偶尔开着二手车去丹佛会会友人看场演出,其余时光,青山绿水,鹿影松鼠,只属于你一人。早晨九点醒来,亲自下厨做顿健康餐,再沿着林间小道慢跑。待你返回木屋,脑中已跃动着诸多灵感火花。你将有趣的想法分享给数十个关系亲密的网友,你们志趣相投,随时可以相约公路旅行、互访串门。倾吐完思绪,你蜷进躺椅,捧起亚里士多德的美学巨著。你正在学习绘画,这个主题令你兴味盎然——向往成为画家的你,如今拥有无尽的创作时光和大自然瑰丽的景致,正是激发灵感的不竭源泉。无需取悦顾客和评论家,你将探索独树一帜的艺术风格。Kipling 那首古老的诗篇,让你感到振奋:
赞美他们的唯有大师,
指摘他们的也唯大师。
无人为金钱而创作,
无人为虚名而创作。
各自为创作的欢愉,
在自己的孤星之上,
描画他心中的图景,
只为万物本真的缘故。
在你的粉丝中,有一位可爱的姑娘——这次我们假设你是男士,过去四年里,你想必已经学会了如何巧妙地称呼她们。你们坠入爱河,喜结连理。如今,你们的家庭年收入达到了 4 万美元,接近美国家庭收入的中位水平。除了你的收入,你妻子也从政府领取了年均 2 万美元的生活津贴,作为接受教育的替代。你们育有了可爱的子女。作为全职奉献的父母,你们见证了孩子们的每一个成长瞬间:第一次蹒跚学步,第一句咿呀学语,还有性格逐渐形成的点点滴滴。当孩子们开始渴望与同龄玩伴相伴时,你们依依不舍地告别了居住多年的山间小屋,举家搬迁到了蒙大拿湖畔的小镇,在一栋更为宽敞的房子里安家。尽管孩子们没有去学校接受正规教育,但在你的悉心引导下,他们掌握了阅读的技能。从浅显的童话故事,到引人入胜的《哈利·波特》,再到你书房里的珍藏书籍,孩子们如饥似渴地汲取着知识的甘露。大女儿沉浸于亚里士多德的哲学思想,憧憬着未来成为一名哲学家。夜幕降临,孩子们或在湖中嬉戏,或与镇上的小伙伴尽情玩耍。
转眼间,孩子们到了该上大学的年纪。你的女儿渴求更高深的知识,她向摩根大通、贝尔斯登、沙利美、高盛或联邦政府申请了 1.5 万美元的贷款,这也是当今大学学费的全额。随着高等教育的普及,如今只有真正有求知欲的人才会选择深造。大学数量的增长远超需求,学费也下降到了前所未有的低点。凭借在家自学的扎实功底,你的女儿顺利考入了耶鲁大学。虽然学习的是哲学专业,但她发现自己对科技更有兴趣。她决心成为一名工程师,用专业知识为他人的生活保障基金贡献一己之力。你的女儿找到了一位好男人,在确认他愿意在家照料孩子之后,她嫁给了他——她没有疯,她才不愿将孩子托付给某种机构来抚养。
你的小儿子有轻度智力障碍,阅读水平相当于三年级,但这对你和他而言都不是什么大问题。等他长大后,便搬去了夏威夷,把大部分时光都消磨在海里游泳上,据说日子过得十分惬意。
你为儿子今后的经济保障感到欣慰,但从更宏观的角度来看,你更高兴身边再无人因害怕失业而忐忑,再无人为维持生计而焦虑,也再无人因一身过时技能而被困在没落的「锈带」。你偶尔会给女儿打个电话,感谢她参与设计了代替人工完成大部分繁重劳动的机器人。
「你可愿荡在星辰间?将月光装入罐中带回家?让生活更加美好?」还是,「你更愿接受正规教育?」
抱歉跑题了这么久,我们言归正传。我瞧见学生主任在那头频频看表,神色凝重。她大概是怕我故意拖延时间,扰乱这场毕业典礼。要知道,按照法律规定,如果我一直演讲到今晚午夜,毕业典礼就会泡汤,你们还得在校园里再熬一年哩。
我无意探讨「教育」这个概念对「社会」这个概念是否有价值这类宏观命题。此时此刻,站在这里的你,我想问:你的教育真值得吗?
既然这是一场大学毕业演讲,我想按理说我有义务提点人生建议。那么,我将根据你们的回答,给出量身定制的意见。
你们中有人会说,我的求学经历是值得的。我是那 3.3% 的幸运儿!我知道欧几里得是谁,领略过几何学的超凡脱俗之美。若非置身此地,与一群志趣相投的同学朝夕相伴,聆听满腔热忱的教授讲学,我恐怕没机会涉猎这一领域,更没有毅力坚持探索下去。这一顿悟抵得上失去科罗拉多的小木屋,抵得上我甘愿忍受单调乏味的日常和时刻笼罩的失败阴云。这就是我的全部诉求。
对于你,我的建议是:如果你已为求知付出一切,莫要忘却初心。当你成为布鲁克林的律师助理,下班回家后疲惫不堪,只想蜷在电视机前,看肥皂剧麻痹自己时,告诉自己,你最珍视的是知识,哪怕世界末日你也要追寻智慧之美,然后去读本书或做点别的。或者去社区大学旁听个课程。总之,除了高喊知识至上然后自甘堕落,你可以做任何事。
你们中还有人会说,我的求学经历是值得的。倒不是因为学到了有关尤克里里琴或桉树之类的知识,而是因为我在这里结识的朋友,骄傲的[消音]大学的同窗情谊,它将伴我一生。
对于你,我的建议大同小异:如果你已为友谊付出一切,莫要忘却初心。当你成为布鲁克林的律师助理、西雅图的市场分析师,或但愿不是密歇根的实习生,下班回家后筋疲力尽,只想蜷在电脑前刷 Reddit 时,告诉自己在此结识的朋友,打个电话问候他们,看看他们近况如何。寄一张圣诞卡给他们,尤其是在 12 月的时候。总之,除了把友谊奉为圭臬最后反而疏远,你可以做任何事。
你们中还有人会说,我接受的教育是值得的,不是因为我学到了圣餐仪式或纸牌游戏的知识,而是源于我建立的人际网络,校友圈子将为我的人生目标保驾护航。
对于你,我的建议仍然大同小异。如果你已为野心牺牲一切,那就要格外雄心勃勃。当你在布鲁克林当律师助理或从事其他行业时,要努力攀至顶峰,并运用自己的影响力做些意义非凡的事。既然野心驱使你抛弃一切,那可千万别只当个平庸的中层管理者。
你们中还有人会说,我接受的教育是值得的,这并非因为我学到了关于丝兰植物或尤卡坦半岛之类的知识,而是它帮我塑造公民意识,成就更高尚、更乐于助人的品格。
对于你,我的建议仍然大同小异。如果你已为帮助他人奉献一切,可别仅仅满足于偶尔给街头的乐施会募捐者捐上十元了事。去加入 Giving What We Can 组织,或投身志愿服务。如果你为他人利益抛洒一切,务必确保他人从中真正受益!
你们中还有人会说,我接受的教育是值得的。这并非因为我学到了关于真核生物或乌克兰之类的知识,而是学校教育教会了我如何思考。
对于……不好意思,等我一下,哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈,哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈,哈哈哈哈哈哈哈哈哈,哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈,哈哈哈哈哈,哈哈哈哈哈哈,哈哈哈哈,哈哈哈哈哈哈哈,哈哈哈哈哈哈哈哈哈,啊哈哈哈哈哈,哈哈哈哈哈,哈哈啊啊哈哈啊哈哈,啊哈哈哈哈,哈哈哈,哈哈,哈,哈哈哈,哈哈,咳,咳,咳,好。
我很抱歉。咳咳。对于持这种看法的人,我的建议仍然,大同小异。如果你已倾其所有去学习独立思考,那就真正地去思考吧。当有人说了一些与你观点相左的话,在你一口否定、给对方贴上标签,并为自己的精彩反驳沾沾自喜之前,请花点时间设身处地、公正地审视一下。去了解偏见、启发法,以及如何避免犯错。多读一些心理学和认知科学的书,弄清为何你的观点可能有点会让那些对该领域略知一二的人忍俊不禁。只是,不要为学会思考而舍弃一切,最终却只是重新排列了你的成见。
最后,你们中有人会说,慢着,或许我所受的教育并不值得。抑或,在一个糟糕的框架内,这或许是最优选择,但我并不满足于此。我真希望有人能在毕业前的 15 分钟更早以前就把这一切告诉我。
对于你,我可以给予些许安慰。你已经得到了一个极其宝贵的教训,而这是你或许难以通过其他方式领悟的。
你已认清,这套体系不是你的朋友(Not Your Friend)。
我特意使用了最后三个词。人们常用「不是你的朋友」轻描淡写,意指某个东西处心积虑与你为敌。我的意思并非如此。
这个系统既非你的朋友,也非你的敌人。它就像一个智障的巨人,毫无章法地向四面八方抛洒着一沓沓百元大钞和一本本规章制度,还大呼**「看啊!我在帮忙!我在帮忙!」**有时,你幸运地接到一沓钞票,便以为系统眷顾你。而有时,你不幸被规章砸中肚子,又觉得系统憎恨你。但无论何种情形,你都给了系统过多的赞誉或责难。
系统的每一位设计者和管理者都智慧非凡——其中一些人甚至还有[消音]大学的学位。但即便是我家狗脑中的每个神经元,都是经过三十亿年进化而成的精妙复杂的结晶,然而,它本身却能一站就是一小时,毛发倒竖,对着一个塑料袋狂吠不止。
对于你,我也没什么可建议的。我并非比旁人更聪明——好吧,或许我还知道欧几里得是谁,但也仅此而已——如果我知道如何修复这个系统,很可能其他人也已经想到了,系统早就该被修复了。或许,凭借[消音]大学的学位,你将成为帮助解决这个问题的人。
不过,有位比我聪明得多的人确实给了你一些人生建议。可怜的 Kurt Vonnegut 虽然从未有机会发表一篇真正的毕业演讲,但他的一本书中有段话,专门写给处于人生另一个重大转折点的人:
喂,小子们,欢迎到这个世界。这个地方夏天很热,冬天很冷。这儿是个圆的,潮湿而拥挤的地方。小子们,你们在这里大约要呆一百年。小子们,我所知道的只有一条规则——「该死的,你应该对他们善良点儿。」
我不知该如何修复这个系统,但我深信,善良必定是其中不可或缺的要素。
我所说的善良,不仅仅是在施粥所当义工,或是终其一生为帮助他人而活这样的道德善举,更是一种认知上的美德。认知的善良有点像谦逊,是对你并不认同的想法心存善意,是对你想斥之为荒谬并加以嘲讽的立场心怀宽容。唯有这样的善良,才能让你走出自负的泥淖,让你明白真理的追寻远比个人的荣辱得失更加紧要,尤其是在事关重大之时。
我们终于走到了这个充满磨砺的求学旅程的尽头。回首往昔,我们在这条道路上投入了 15 万美元、2 万小时光阴,写过数十篇关于《红字》的论文,也曾在更衣室里偶尔听到「死基佬」的叫骂,并挨过拳头。在某个平行世界里,有一群和我们境遇相似的人正在科罗拉多的小木屋中阅读亚里士多德,他们知道再也没有人会挨饿。我们与他们的差距并不在金钱,即使我的判断有误,政府给你 15.5 万美元的助学金在其他地方也绰绰有余。我们的差异也不在智力,因为我们所处系统的设计者无疑是各个领域的佼佼者。我认为,这种差异也许源自一个品质——「善良」。
严格来说,是善良加上协作能力,但这需要用另一场演讲来阐述了。我注意到学生主任已经开始朝我疯狂地打手势,在气氛变得尴尬之前,我要抓紧时间结束演讲。
我不知道让每个人都拥有科罗拉多的小木屋是否真的可行,但我衷心希望那些肩负重任的领导者们,能够以善良和谦逊之心来对待这个问题。
关于防晒的话题,支持者和反对者各有道理。防晒霜确实可以降低鳞状细胞癌和基底细胞癌的患病风险,对黑色素瘤的影响目前尚无定论;防晒霜是导致还是预防内脏肿瘤,目前也缺乏确凿证据。不过,我们还是把这个话题留到下次再聊吧。
我知道这很复杂,也不令人满意。欢迎来到现实世界。
[祝贺我的女朋友 Ozy,她本周大学毕业了!]
社会正义与话语,话语,话语
社会正义与话语,话语,话语 | Slate Star Codex
发表于2014年7月7日,作者Scott Alexander
[内容提示:对社会正义运动持批判态度,讨论各种形式的偏见]
"话语!话语!话语!我已厌倦了话语!整天从早到晚都是话语。先是从他那里,现在又从你这里。你们这些讨厌鬼除了这个就没别的本事了吗?" —— 伊丽莎·杜立特
一、
我最近才知道社会正义运动所做的事情有一个专门术语。但在此之前,先看一张来自「种族主义学校」Tumblr网站的图片。
原来,「特权」这个词被相当合理地使用了。它的真正含义不过是:你插手他人的对话,并要求把他们的痛苦变成关于你自己的讨论。我想我代表所有直男白人说,这听起来确实糟糕透了,如果我曾这样做,我深表歉意,并会尽力避免再犯。问题就这么解决了,对吧?真难以置信我们竟花了几个世纪才理清这个简单道理。
但一种不祥的预感告诉我,事情恐怕没那么简单。
在我博客上一篇关于社会正义的灾难性文章的评论区,有人开始抱怨他们多么厌恶「男性解释」(mansplaining)这个词,随后另一个人——颇具讽刺意味地——跳出来解释什么是「男性解释」以及为什么它是一个不能轻易被否定的有价值概念。他们的解释既清晰又合理。这时我加入讨论并评论道:
我感觉社会正义术语中的每一个词汇似乎都有一个完全无可争议且显然重要的表面含义——然后在实际使用时却以完全不同的方式被应用。
我能想到的最贴切的类比是那些宗教人士,他们说「上帝只是宇宙中秩序和美的另一种称呼」——然后转身就祈求上帝惩罚他们的敌人。当你批评他们后一种行为时,他们会说:「但上帝只是指宇宙中存在的秩序与美,你总不会反对这一点吧?」
结果就是,人们可以无论对方做什么都指责他们拥有「特权」或进行「男性说教」,而当有人批评「特权」这一概念时,他们就退回到:「但『特权』只是指你在女性专属安全空间中打断女性发言。当然没人会反对批评这种行为吧?」
……即使我因为在自己博客上写文章而被指责有「特权」,尽管这根本不可能构成「打断他人」或「侵入女性专属安全空间」。
当你指出这一点时,人们只会否认他们在这么做,并称你是偏执狂。
当你记录下自己和他人被指责「特权」或「男性说教」的例子,向他们展示这个清单,并指出其中完全0%与「在女性专属安全空间中打断女性」有任何关联,而 100% 都是「提出了某人想要压制的正确论点」时,你的对话者只需说:「你故意只选择了不代表这个运动最强有力部分的草人女权主义者,你不能让我为他们的行为负责」,然后继续坚称任何对「特权」一词的使用感到不满的人只是不理解在安全空间中打断女性是错误的。
对于这种策略,我至今没找到有效的应对方法。
我对那个来自「种族主义学校网站」(racism school dot tumblr dot com)的动图有这样的猜测:顶部的那些表述展示了大多数人在现实生活中实际遇到「特权」一词被使用的方式,而底部的表述则展示了那些无争议的陈词滥调——当有人针对此概念质疑或挑战他们时,人们会防御性地声称「特权」一词「真正」的含义。因此,这个动图应该被视为一种奇特的社会正义「罗塞塔石碑」,我只希望其他同样充满争议的术语也能有类似直观的解释。
这听起来有些偏执吗?我坦率承认,在这个领域我确实有些偏执。但让我用另一个例子来进一步说明。
每个人都或多或少有点种族主义。我们知道这一点,因为有一首名为《Everyone's A Little Bit Racist》(人人都有点种族主义)的歌曲,而且它非常可爱。也因为大多数人在内隐联想测试中表现不佳,因为许多白人在深夜的荒凉街道上看到一个黑人时会感到焦虑,还因为在心理学实验中,如果你用传统白人名字与传统黑人名字来引导受试者,他们会给出不同的回答。只要你承认自己有种族主义倾向并尽力抵制这种倾向,种族主义就不是什么可耻的事。这是众所周知的道理。
Donald Sterling 是个种族主义者。我们之所以这样认定,是因为他在自己家的私人空间里发表了种族歧视言论。结果,他被罚款 250 万美元,终身禁止从事他已经参与了三十五年的行业,禁止他观看任何篮球比赛,被迫违背个人意愿出售自己的财产,从美国总统到普通百姓,所有人都公开谴责他,从全国性新闻媒体到《帕登克先驱论坛报》这样的地方小报,所有媒体都对他进行声讨,互联网上到处都是对他幸灾乐祸的人,他们甚至对他即将去世一事感到由衷的高兴。我们知道他罪有应得,因为那些敢于为他辩护、认为他不该受此对待的人也被解除了他们的工作。他应受此惩罚,因为他是种族主义者。这是众所周知的事实。
所以。
人人都是种族主义者。
而种族主义者理应失去一切,被所有人憎恨。
这似乎会带来一个问题。除非你打算成为那个裁决者,由你来决定哪些种族主义者该失去一切并被众人唾弃,而哪些种族主义者暂时可以安然无事——只要他们永远不以任何方式冒犯到你。
抱歉,我又陷入偏执了。
有人会说我在对「种族主义者」这个词的两种不同用法混为一谈。对此我要回应的是:这正是我的观点所在。我不知道「种族主义学校网」上是否有一块解码石,顶部刻着 Donald Sterling 的案例,底部是某人的内隐联想测试结果。但我认为社会正义运动中确实存在这样一种倾向——肆意滥用这种能力,用极具危险性的标签给人定罪,而这些人又不被允许为自己辩护,以此来推进他们的政治目标。
我在这篇文章开头提到,我最近才了解到社会正义运动所采用的那种策略有一个专门的术语。一位读者回应我上述评论时指出,这种策略已经在一篇学术论文中被描述过,名为"城堡-庭院学说"。
这篇论文批评的是后现代主义,这是个我了解不够深入的领域,无法判断该批评是否公允。论文抱怨后现代主义者有时会宣称"现实是社会构建的"。这句话有一层无争议的含义——我们并非直接体验世界,而是通过我们社会中隐含的分类和偏见来感知世界。举例来说,我可能将某种蓝绿色调视为蓝色,而在不同文化背景下成长的人可能将其视为绿色。这点无可争议。然而后现代主义者进一步主张,如果某个不同文化中的人认为太阳只是天空之牛角上闪烁的光芒,那么这一观点就和我们文化中"太阳是一团灼热气体,一座巨大的核聚变熔炉"的理论同样真实。如果你质疑他们,他们就会指责你否认现实是社会构建的,暗示你非常天真,以为自己拥有完美的客观性,认为感官可以直接感知现实。
论文作者将此比作中世纪城堡的结构,城堡中有一片理想且富有经济产值的土地,称为"庭院"(bailey),而中央有一座又高又坚固的防御塔楼,称为"土堡"(motte)。如果你是中世纪领主,你会在庭院中进行大部分经济活动并逐渐致富。但当敌人来袭时,你会撤退到土堡中,向敌人射出密集箭矢,直到他们放弃进攻离开。之后,你便可重返庭院——那个你始终想要停留的地方。
借用这个比喻,诸如「上帝是一个极具威力的超自然存在,专门惩罚我的敌人」或「天牛理论和核熔炉理论同样具有正当性」或「男性不应该参与关于性别的讨论」这类言论就是「外院」——完全无法辩护,但若你能成功持有这些观点,你就赢了。
而类似「上帝仅仅是宇宙中的秩序与爱」和「没有人能完全直接地感知现实」和「男性不应干涉女性的安全空间」这样的表述则是「内堡」——极易辩护,却毫无实用价值。
只要没人质疑你,你就能在「外院」中享受占据这片有价值领地带来的好处。一旦有人向你发起挑战,你就立刻撤退到固若金汤的「内堡」,怒视挑战者直到他们感到厌烦而离开。然后你又回到「外院」。
这是一个只有中世纪战争史学家才会喜爱的比喻,所以也许我们可以简单地称之为「策略性模糊」,这样就能避开那些关于封建防御工事的冗长解释。
我的说法可能仍然显得偏执。因此让我指出标准理论无法解释但我的理论能很好阐明的一点。
为什么社会正义术语不能应用于受压迫群体?
仅仅提出这个问题就会让人们极度不安。没有什么能比将「特权」或「种族主义者」这类社会正义术语应用于非异性恋/非白人/非男性群体更能迅速引发社会正义人士的反应了。这一点令人惊讶。
如果「特权」仅仅意味着「将自己强行插入他人对话」,那么似乎女性和男性都有可能这样做。比如,假设一位女性主义者在这篇文章下留下了一条深思熟虑的评论,而我回应说:「感谢你的意见,但我其实只是想向我的非女权主义男性朋友解释一些事情,希望你不要在此插话。」难道她不可能继续坚持己见,从而将自己插入到别人的对话中吗?
或许"特权"一词只是指一个关于狗和蜥蜴的生动寓言,讲述不同个体如何难以理解彼此的经历,难以体会他们可能给对方造成的痛苦。我认识许多男性,他们既恐惧永远孤独,又极度害怕向女性表白,我能感受到他们的痛苦,我大多数男性朋友也能体会。然而,我交谈过的许多女权主义者却认为,这完全是因为这些男性觉得自己有权占有女性身体、理所应当获得性关系。而从她们作为有魅力女性的经历来看,约会轻而易举,如果你约不到,那可能是因为你本身有问题或者努力不够。在我看来,这恰恰体现了认知上的脱节和对他人痛苦的低估,正是狗与蜥蜴式的相互不理解。
"特权"一词在社会正义运动中有着众多完全无害且无可反对的定义,几乎每个活动参与者都有自己的解释,但它们通常有一个共同点——如果从字面意义理解,女性有时对男性表现出特权的可能性是如此显而易见,以至于不值得一提。
然而,若有人在现实生活中提及此事,他们很可能立即会收到一连串「解释性文章」的链接。也许是18个为何女性特权概念荒谬至极的理由,或是致那些认为女性特权存在的性别歧视者的公开信,或是女性特权的概念——它不仅错误,更是危险的,抑或那篇关于不存在女性特权,只有善意的性别歧视的文章。还有你所谓的女性特权实际上只是男性爱发牢骚综合症,以及女性特权是在责备受害者——这篇文章「好心地」指出,谈论女性特权的人「应该被烧死」,并以「我们需要谈谈,不,不仅是关于你戴软呢帽和留着颈部胡子的事实」作为开场白。
这几乎让人感觉你触碰到了某条敏感神经。但为何这里会有一条神经呢?
作为我们触及了某些出人意料之事的进一步佐证,还请注意这一现象:不同的社会正义团体正带着绝望的眼神争论着,哪些群体相对于其他群体确实拥有或不拥有特权。
如果你是那种喜欢惹是生非的人,可以去社会公正领域问问任何人关于跨性别男性(或跨性别女性)是否拥有男性特权的问题。你很快会发现自己陷入各种观点的漩涡,比如「闭嘴吧厌恶跨性别女性的跨性别者」或「顺性别特权仅仅是男性特权的一个组成部分」或「关于跨性别者与男性特权指控」或「天生女性运动」或「反对顺性别特权清单」或「厌女情结如何伤害跨性别男性:我们有时确实享有男性特权,但这里有更重要的事情需要讨论」。
据我所了解,争论的核心在于:跨性别女性是否比顺性别女性拥有更多的特权(因为她们在曾以男性身份生活时积累了残留的男性特权),还是拥有更少的特权(因为她们是跨性别者)——在跨性别男性这边也存在着基本对称的辩论。值得注意的关键现象是,每个群体都视证明自己比其他人更缺乏特权为关乎存亡的重要任务,他们使用的论点包括(引自最后一个链接):"所有所谓的顺性别特权例子实际上都是男性特权,这些特权并不授予女性,或者只是对跨性别政治主张的抵制表现。当不愿重新定义自己的性取向以包括生理男性被贴上冒犯标签时,我称之为父权制特权。"
关于跨性别男性特权的争论,不过是数百种恶性争端中的一种,在这些争端中,每个人都坚称他人比自己拥有更多特权,争论得如同性命攸关。
这里的问题是:如果特权真的只是一个平淡无奇的概念,仅仅提醒你不要插入自己到别人的对话中,或者只是关于狗和蜥蜴的一些美好事物——但绝对不是任何你应该为拥有而感到羞耻的事情,也不是任何暗示罪恶感或负担的东西——那么为什么所有在使用这一术语的社群中的少数群体都如此疯狂地试图证明自己没有特权?
我们在种族主义话题上也看到了同样令人意外的模式。我们都知道每个人都是种族主义者,因为种族主义仅仅意味着你有无意识的偏见和预期。每个人都有一点点种族主义。
有色人种似乎是「所有人」的一部分,他们也似乎与所有其他人类一样具有群体认同感。但据称他们不是种族主义者。我们之所以知道这一点,是因为有文章宣称「当白人抱怨反向种族主义时,他们实际上是在抱怨失去自己的特权」,并承认「字典在这个问题上是错误的」。或者那些声称白人称有色人种为种族主义者「源于对这一术语缺乏理解,这种缺乏理解来自无知或刻意的无知和仇恨」。还有那些认为「当白人抱怨经历反向种族主义时,他们实际上抱怨的是失去或被剥夺已有的特权」。为什么针对白人的评论不是种族主义,黑人能对白人种族主义吗?(剧透:不能),为什么你不能对白人实施种族主义,诸如此类,不胜枚举。
所有这些来源都提出同样的论点:种族主义等同于结构性压迫。如果某个黑人仅仅因为某人是白人就殴打她,这可能是不幸的,甚至可能是「出于种族动机的」,但因为他们没有在社会压迫结构中行动,所以这不构成种族主义。正如上述一位博主所言:
不可避免地,总会有白人出现,要么声称他们有着类似的经历——因为他们在一个全是黑人的社区长大,放学路上曾几次被追赶,然后大呼「天啊,这太种族主义了」,并坚称这完全是同样的事情;要么发表一些其他类似的胡言乱语,还期望他们的无知能被人默默忍受并给予尊重。如果你确实是那个放学后被追赶的孩子,那确实很可怕,我为你感到难过……但说实话,那玩意儿根本不是种族主义。
对此我无法反驳。不,字面意思上,我真的无法反驳。对词语定义的争论是没有意义的。如果你宣称「种族主义」是一种稀有的夜行鸟类,原产于新几内亚,以晨露和儿童的梦想为食,那么我能做的只有指出字典和普遍用法都与你相悖。而我上面引用的那些资料已经承认「字典是错的」以及「没有人正确使用种族主义这个词」。
来源:某个可能没意识到自己刚刚成为语言规范主义拥护者的人
当然,面对不友好的字典定义和公众理解,一个人或许可以通过诉诸发明这个词的人的原始意图来摆脱困境。但发明「种族主义」一词的人其实是一位主张强制同化印第安人的活动家,他曾说过这样的话:「有人说唯一好的印第安人是死去的印第安人。从某种意义上说,我同意这种观点,但仅限于:种族中所有的印第安人特质都应该消亡。杀死他内心的印第安人,拯救这个人。」我猜这位仁兄并不完全支持拆除压迫结构的理念。
我们现在面临这样一种情况:尽管从原始词源、所有权威词典到绝大多数日常用法都以一种方式定义"种族主义",但社会正义博主们却以惊人的热忱坚持认为这种方式完全错误,并必须采用另一种定义。虽然我们无法争论定义本身,但可以分析它们,因此不得不问——为何如此坚持种族主义必须采用基于结构性压迫的定义,而非原始且更为通用的定义呢?为什么那些想讨论结构性压迫的人不能创造自己的词汇,从而消除这种混淆?即使他们坚持为新概念使用"种族主义"这个词,为什么不如实描述现状:"'种族主义'一词对不同人可能有不同含义,我承认当一群黑人在街上挥舞着刀追赶一个白人孩子并大喊'杀死白人'时,按多数人的定义可能构成种族主义,但我更倾向于用自己特立独行的方式来定义它,所以在阅读我的文章时请记住这一点"?或者,为什么不承认这整个争议根本毫无意义,无论你用什么词来称呼这种恶意行为,你都应该尽量避免对他人恶意相向?
为什么这种情况会发生在每一个社会正义词汇上?为什么互联网上塞满了宣称黑人不可能是种族主义者、女性不可能拥有特权、根本不存在厌男情绪,并且你甚至仅仅想到「顺性恐惧症」这个词就应该感到羞耻的页面?究竟谁会在意这些?这在任何其他领域绝对不会发生。没有医生会觉得有必要宣称,如果我们讨论抗菌药物,那么就应该把细菌毒素称为「抗人类药物」。即使有医生这么做,其他医生也不会大吼:「你给我收回这句话,你这个垃圾!只有人类才能有药物!这是一个错误的类比,因为细菌已经感染人类数百年,但人类不能感染细菌!」——他们只会对这种非标准术语感到略微惊讶,然后继续他们的正常生活。据我所知,实质性争论被关于「我们可以对哪些人使用哪些词」的争论所取代,这种情况的程度完全是社会正义领域独有的。为什么?
于是我们回到我先前的论点:
我认为社会正义运动中存在一种倾向,完全是在滥用给人贴上极其危险标签的能力,而这些标签是被贴标签的人不被允许否认的,目的是为了推进他们的政治目标。
如果「种族主义学校网」(racism school dot tumblr dot com)和社会正义社区的其他人是对的,那么「种族主义」、「特权」以及所有类似词汇都是无辜且完全不具侮辱性的词语,它们只是指出许多人正在做的一些事情,而这些事情应该尽量避免。
如果我的观点是正确的,那么"种族主义"、"特权"以及所有类似的标签恰恰就是人们口口声声否认它们是的东西——武器——而且正是因为你不被允许将它们描述为武器或尝试防御,它们才变得如此强大。社会正义运动宛如一位坐在控制面板前的疯狂科学家,随时准备将这些武器指向她选中的任何人。一旦你被击中,就会被标记为一个不配拥有观点的可憎之人,应当像Donald Sterling那样遭受彻底的毁灭和全民的鄙视。如果你通过完全服从来安抚这位疯狂科学家,她就会放过你,转而攻击你右侧那个可怜的倒霉蛋,而你得以多活一天。由于社会正义运动的力量源自于他们对这些武器的控制,他们的首要任务自然是保护这些武器,不断完善它们,最重要的是防止它们落入敌人手中。
如果「racism school dot tumblr dot com」的观点是正确的,人们对"种族主义"和"特权"等词的反应应该是接受它们作为有效沟通的一部分,必要时也可以用其他词语替代表达。除了在某人表达不清的情况下,没有人需要过分纠结于这些词的定义。除非这些词揭示了独立于词语本身的客观现实,否则没有人应当忧虑这些词是否被用来描述自己。
然而,如果我的看法是正确的,人们面对这些词语时的反应将是一场疯狂的「烫手山芋」游戏——他们会像被逼入绝境的动物一样攻击任何试图将这些标签贴在他们身上的人,拼命地将这些标签转嫁给他人,并像生死攸关般争论这些词的定义。
我知道社会正义人士喜欢嘲笑直男白人正是以这种方式行事,但说实话,我们不过是在追随你们的脚步罢了。
假设政府在自来水中添加了某种药物,声称它能让人变得更加友善,更能理解他人的困境,而且绝对不会产生任何有害影响。几个阴谋论者声称这种药物会导致你的手指一根根脱落,但政府反驳说这纯属荒谬,药物只是为了让人们对他人的问题更加敏感,这当然无人能反对。然而,有人观察到所有的政府雇员却只喝瓶装水,而如果有人建议这些政府雇员也应该服用这种据称完全无害的药物来变得更加友善,他们就会歇斯底里地大发雷霆,称你为恐怖分子和人渣,并且诅咒你去死。如果你碰巧在某个政府雇员的饮料中偷偷加入一点自来水,而他发现了,他会像女妖一样尖叫着到处跑,不时喊道:"啊啊啊啊啊!我的手指!我珍贵的手指!"
在某个时刻,你可能会开始怀疑政府是否对你完全诚实。
这正是我目前与社会正义运动之间的关系状态。
苏格拉底式追问
原文:Socratic Grilling | Slate Star Codex
作者:Scott Alexander 发布于:2020 年 3 月 6 日
想象一下,当一名学生第一次在学校接触到细菌理论时。可能会发生这样的对话:
老师:许多疾病,如普通感冒,都是通过细菌传播的。当一个被感染的人接触他人时,细菌就会传播。
学生:可前几周我得了感冒,明明从未接触过除家人以外的任何人,何况他们谁都没生病啊。
老师:疾病传播不一定需要直接接触,有时细菌可以通过空气中的黏液飞沫传播。
学生:我曾独自在森林里露营一个月,结果也感冒了,虽然那段时间根本没接触过任何人。
老师:如果那是在春天,你可能是过敏了。过敏的症状和感冒很相似,但它并不是由细菌引起的。
学生:可那是秋天啊。
老师:那可能是某种罕见的过敏,或者其他原因导致的。
学生:等等,如果细菌是通过接触在人与人之间传播的话,那政府为什么不专门规定有一周人们不许互相接触?这样细菌不就全死光了?从此我们就再也不用担心细菌了。
老师:问得好。许多细菌在自然界有「储存库」,不感染人类时就躲在里面。即便政府真的采取你所说的措施,大多数细菌恐怕还是会从「储存库」里卷土重来。
学生:我为什么从没见过什么细菌储存库呢?它们究竟藏在哪里啊?
老师:它们可不是像水库那样的真「库」。当细菌寄居在蝙蝠、浣熊等动物体内时,我们就称宿主为「储存库」。
现在让我们好好审视这一场对话。
首先,这种情况的发生其实是非常可喜的。这名学生对细菌理论的多个部分感到困惑。第一,他的亲身观察似乎与老师所说的「细菌只通过接触传播」这一说法相矛盾。第二,他产生了一种类似于「有效市场假说」的质疑:如果细菌理论真的提供了一种永久消除所有疾病的简单方法,为什么至今还没有人去实施这个易如反掌的方案呢?第三,他被一个模糊的术语搞糊涂了——他误以为「细菌储存库」是指某种具体的「仓库」。
这些困惑其实都是完全可以理解的。事实上,这恰恰表明他在认真思考——他正在努力理解细菌理论的真正含义,以及如何将它与自己已有的知识体系相融合。这与简单地填鸭形成了鲜明对比。毫无疑问,这个孩子将来一定会成长为一名杰出的科学家。
其次,从一个持批评意见的旁观者视角来看,这种情况可能会被解读为学生在挑战老师的权威。每当老师尝试解释细菌理论时,学生就会迅速「抓住」看似矛盾的地方不放。而当老师努力解释这些表面上的矛盾时,学生又会质疑她的解释。有时候,学生的行为甚至可能被视为在嘲弄老师。如果缺乏必要的基础知识,也不理解年幼的孩子对其的困惑,这种情况可能会被误解为:这个孩子是个傲慢自大的「万事通」,认为自己已经将生物学家们将了一军,证明了细菌理论根本不可能成立。或者,他可能会被认为是在妄自尊大,认为自己这个小学生竟然想出了一个前人从未想到过的——根除所有疾病的革命性方法。
而本文的核心观点是,我们绝对不能,也不应该采取这种态度。这样做是极其有害的。如果你粗暴地打压学生,说「我认为我比你更了解细菌理论」,让他感觉到挑战你的权威是件坏事——那么最好的结果可能是他再也不敢提出问题来解决自己的困惑了。最坏的情况是,他可能会完全停止感到困惑,或者不再认为努力理解新知,将其与自己原有的知识体系融合起来是一个值得追求的目标。
理性思考的核心技能之一是「察觉自身的困惑」。然而,这一技能建立在一个更为根本的能力之上:渴望理解事物背后的道理。如果你失去了这种渴望 —— 也就是说,即使当你无法理解某事时,也不再对其感到疑问,不再将其视为一个需要解决的问题 —— 那么你将永远无法察觉到自己的困惑,也就无法成为一名优秀的科学家,或在任何需要独立思考的领域有所建树。更重要的是,如果你错误地将他人探索认知不一致的尝试解读为一种需要被压制的炫耀行为,那将会彻底扼杀这种能力。相反,你应该将这种探索视为一种类似苏格拉底式追问的方法 —— 只是更加直白和富有挑战性,以便更快地触及问题的核心。
然而,保持这种态度并非易事。大多数人在一两轮交流中还能保持友好和乐于助人的态度。但是,由于大多数人并不擅长解释复杂的概念,一两轮交流往往不足以达成真正的理解。我曾为了理解老师所讲,向其咨询了五到十轮。这一过程可能听起来像是:「你刚才说的显然是错的」...「不,你的解释仍然说不通,你还是错的」...「你一直在重复同样的话,而那是错的」...「不,那与我困惑的点无关」...「不,那也不相关,你还是在说一个明显错误的东西」...「哦!原来那个词的意思与我理解的完全不同,现在你的解释说得通了。」
然而,实际情况往往比想象的更加复杂。有时,你与老师的思维模式之间存在巨大的认知鸿沟,要想弥合这一差距,势必要经历一段无比艰辛的旅程,这一旅程可能就像试图将一个虔诚的宗教信徒转变为坚定的唯物主义者(或反之)一样充满挑战。从一个截然不同的哲学立场出发,真正理解并欣赏共产主义、自由主义或其他任何主义,往往需要不断提出质疑:「这难道不是一种暴行吗?」「这样做难道不会不可避免地导致一个反乌托邦社会吗?」并仔细聆听对方的解释。在这个过程中,我们很容易将对方的回答简单地理解为试图抓住我们的把柄(有时确实如此),并认为他们并不想真正理解我们的观点。这种误解的诱惑实在是太大、太大了。
面对一位优秀的老师,你可以在表达疑问时加入一些谦逊的措辞,以避免引起对方的不快:「我知道我只是一个学生,远不够聪明到能真正质疑您,所以肯定是我理解有误。您刚才的观点让我感到困惑,我并非否定它的正确性,只是无法理解其中的道理。这完全是我的问题,不是您的错。您能否换个方式再解释一下?」而在面对一位卓越的老师时,这些客套话都是不必要的。你可以直接说:「什么?这说不通啊。」并期待老师会耐心地重新解释。
真正的教育者通常能正确地对待学生的疑问,这一点我深有体会。然而,令我担忧的是互联网上那些自封的「反自学」人士。这类人会偶尔在我的博客留言,并在 Reddit 等平台上更为活跃。当有人提出「这很奇怪」或「如果 X 是真的,那不是意味着 Y 吗?」这样的疑问时,就会遭到猛烈抨击:「你真以为自己比所有人都聪明?你真认为网上随便一个人就能发现 X 理论的漏洞?」实际上,提出这些问题的人往往只是在运用苏格拉底式追问,试图察觉自己理解中的矛盾,并寻求他人的解答。
我发现,写这个博客最令人沮丧的一点是:如何表达我还需要学习的内容,而不被那些自以为是的「傲慢警察」盯上?这与面对特定教师的情况完全不同 —— 在博客中,我只是将自己的困惑抛向虚空,希望能得到回应。而且,我偶尔确实会自负地认为自己发现了一些比我更优秀的人在推理中的缺陷,这就让人难以区分我何时是在暗示这一点,何时只是单纯地提出疑问。为了应对这种情况,下次我打算尝试贴上这篇文章的链接,看看效果如何。
我想我在处理这个问题上已经取得了不错的平衡,尽管代价是要不断添加那些烦人的免责声明,而这些声明对 95% 的读者来说都是多余的。从现在开始,也许我只需要贴上这篇文章的链接就足够了。
教师:比你想知道的要多得多
原文:Teachers: Much More Than You Wanted To Know | Slate Star Codex
发表于 2016 年 5 月 19 日 作者:SCOTT ALEXANDER
[认识声明:这是一个极其复杂的话题,超出了我的专业领域。即便是毕生致力于此研究的专家们也见解不一。我仅仅进行了浅尝辄止的调查,欢迎指出文中不可避免的谬误。]
一、教师对学生成绩的影响
新闻报道称,仅仅在优秀教师的班级里读上一年(例如一位出色的四年级老师)就能让学生的终身收入增加 8 万美元。然而,行为遗传学研究表明,父母对子女未来收入的(非遗传)影响微乎其微。这怎么可能?四年级老师教你学习分数的短短一年就能如此显著地影响你的前途,而父母二十多年如一日的言传身教却收效甚微?**啊?**为了揭开这个谜团,我决定深入研究有关教师效力的文献。
首先,让我们探讨一个关键问题:相较于其他因素,教师的影响力究竟有多大?为了回答这个问题,研究人员选取了一个学区的学生样本,分析他们的标准化考试成绩。研究旨在确定学生所在的学校、任课教师以及其他人口统计因素能在多大程度上解释成绩的差异。举个例子,如果同一位教师班级内两名学生的成绩相似度,与来自不同教师班级的两名学生的成绩相似度相当,那么我们就可以推断教师的影响力并不显著。相反,如果我们经常观察到 A 教师班级的学生全部获得 A+,而 B 教师班级的学生普遍只得 D 的情况,这就有力地说明了优秀教师的重要性。
以下是三个研究团队采用这种方法得出的结果(数据来源:参考文献 1,[参考文献 2](https://www.ets.org/s/pdf/23497_Angoff Report-web.pdf),[参考文献 3](http://www.cedr.us/papers/working/CEDR WP 2010-6_Teacher Effectiveness in WA (12-7-10).pdf)):
这些研究结果存在细微差异:第一项研究假设排除了所有干扰因素(「未解释的变异 (unexplained variance)」),而后两项研究则将其纳入考虑。但它们都得出了相似的结论:个人因素最为重要,其次是学校和教师因素,后两者的影响力大致相当。研究表明,教师因素能解释 5% 到 20% 的成绩差异。其他研究的结论也大体一致,通常倾向于较低的比例。例如,Goldhaber, Brewer, and Anderson (1999) 的研究发现,教师因素解释了 9% 的成绩差异;Nye, Konstantopoulos, and Hedges (2004) 的研究则显示,在数学成绩中,教师因素解释了 13% 的差异,在阅读成绩中解释了 7% 的差异。美国统计协会对这些研究进行了总结,认为「教师因素解释了考试分数变异的 1% 到 14%」,这一结论似乎是合理的。
简而言之,平均来说,决定学生成绩的主要因素是学生个人的能力毅力。优秀的学校和教师可能会小幅提升学生的表现,而糟糕的学校和教师则可能会略微拉低学生的成绩,但他们都不能创造奇迹。
(需要注意的是,我们目前讨论的是同一学年的标准化考试成绩。换句话说,我们在探讨四年级历史老师对学生在四年级历史考试中表现的影响。如果有什么情况能够体现教师的影响力,那应该就是这种情况了。)
在教育研究领域,我们经常面临这样一个棘手问题:虽然可以粗略估算各种因素对教育成果的影响程度,但要具体指出这些因素的内容却困难重重。这种情况与基因研究颇为相似——笼统地说「这有 40% 是由遗传决定的」要比找出具体的相关基因容易得多。同理,声称「学校因素占 10%,教师因素占 10%」比明确这些因素的具体内容要简单得多。Goldhaber 的研究尝试深入探讨这个问题,但他们唯一能确定的学校层面变量是:学校里白人学生的比例越高,考试成绩就越好。然而,据我所知,这项研究并未考虑学校或其所在社区的社会经济状况,而这很可能才是白人学生比例所反映的根本因素。理论上,「学校层面效应」应该包括诸如「学校资金充足」或「学校有优秀的校长」等因素。但我担心,这些所谓的学校效应可能不经意间混入了学生个体因素的影响。换言之,如果你就读的学校里大多是富裕的白人学生,那么你自己很可能也是一个富裕的白人学生。尽管研究者试图控制这种影响,但仅凭种族和收入等几个可量化的变量,恐怕难以全面反映社会阶层对居住区选择产生的复杂影响。
在教师层面可观察到的影响因素中,研究发现只有性别造成了显著差异(女教师的表现更为出色)。教师资格认证、教学经验年限、各类证书和学历等因素并未显示出明显影响。这一结论与大多数其他研究的发现一致,例如 Miller, McKenna, and McKenna (1998) 的研究。尽管我们稍后会提到一些研究表明教学经验确实很重要,但几乎没有研究认为资格证书或学历能产生显著作用。
有一个本文未提及的可量化变量似乎能够有力地预测教师的教学成效。虽然我无法直接查阅这些相关研究,但根据美国助理教育部长网站提供的信息:
研究文献中最为可靠的发现是教师的语言和认知能力对学生学习成绩的影响。所有包含了有效的教师语言或认知能力测量指标的研究都发现,这一因素对解释学生成绩变化的贡献度超过了教师的任何其他可测量特征(例如,Greenwald, Hedges, & Lane, 1996; Ferguson & Ladd, 1996; Kain & Singleton, 1996; Ehrenberg & Brewer, 1994)。
到目前为止,这些观点大多清晰明了,不存在争议。教师对学生考试成绩的影响约占 10%,仅凭教师的个人特征很难预测其教学效果,而学校的影响略高一些,但这可能受到其他因素的干扰。要深入探讨这个问题,我们需要一个更精确的方法来识别哪些教师是真正优秀的,这无疑是一个更为复杂的过程。
二、评估教师影响:标准化考试与增值模型
假设你想确定某个学区哪些教师是最优秀的。你认为生活中唯一真正重要的就是标准化考试分数[来源请求],于是你计算每位教师班级的平均考试分数,然后将平均分最高的教师评为年度最佳教师。这种做法会有什么问题呢?
实际上,你很可能只会把奖项颁给负责教授天才班的老师。教师面对的班级学生能力差异很大,我们已经确定,与教师的技能相比,学生的先天能力和毅力对成绩的影响更大。因此,教导弱势学生的教师将处于巨大的…呃…劣势。
让我们换个角度思考这个问题。与其用学生的平均考试分数来评价教师,不如关注学生分数的平均提升幅度。假设一位教师接手了一群一直徘徊在 20 分位左右的学生,经过他的悉心教导,这些学生的成绩提升到了 40 分位。尽管这些学生的成绩仍低于平均水平,但这位教师显然做出了显著贡献。如果我们能够统计出每位教师的学生在一学年里平均提升了多少个百分位,就能更准确地识别出真正优秀的教师。
这一思路,再辅以复杂的统计模型,就构成了 VAM(增值模型,Value-Added Modeling)的基本理念。VAM 作为最新的教育改革热点,也是奥巴马政府教育改革的核心。通过 VAM 识别出优秀教师后,可以给予他们更高的薪酬,以留住这些人才。至于那些表现不佳的教师,VAM 的反对者略带讽刺地将这一计划描述为「通过解雇来提升教育质量」。
「VAM 能准确预测测试分数」这种说法听起来有点像循环论证,因为我们正是用测试分数来确定 VAM 的。然而,我认为这个领域的研究者们采用了更复杂的方法,比如用某一班级的 VAM 来预测下一个班级的学生表现。Chetty、[Rothstein](http://achievehartford.org/upload/files/Teacher Quality in Educational Production - Tracking, Decay, and Student Achievement.pdf) 以及 Rivkin, Hanushek 和 Kane 的研究都得出了一个共同结论:教师 VAM 提高 1 个标准差,大约对应学生测试分数提高 0.1 个标准差。
让我们用人话来解释这个概念。想象一个普通学生,她有一个普通老师。我们预计她的测试成绩会正好处于第 50 百分位。现在,假设她换到了全校最优秀的老师。以我的小学为例,大约有 40 名教师,所以这位最优秀的老师处于第 97.5 百分位,即高于平均水平两个标准差。VAM 高于平均水平两个标准差的教师,其学生的平均得分应该高于平均水平 0.2 个标准差。这意味着,这个学生的成绩将从原来的第 50 百分位提升到第 58 百分位。
让我们再来看看 SAT 考试。虽然它不是 VAM 中涉及的那种标准化考试,但几乎人人都知道它。SAT 的每个分项测试都以 500 分为平均值,110 分为标准差进行标准化。假设有一位接受良好教育的学生,他的 SAT 成绩可能从 500 分提高到 522 分。然而,要进入哈佛大学,SAT 每个分项的平均成绩仍然需要在 740 分左右。因此,这种进步虽然确实存在,但并不足以令人印象深刻。
那么,如果一个学生能够连续多年接受最优秀教师的指导,会产生怎样的效果呢?[Sanders 和 Rivers](http://www.cgp.upenn.edu/pdf/Sanders_Rivers-TVASS_teacher effects.pdf)(以及 Jordan, Mendro 和 Weerasinghe)的研究表明,这种影响是显著的,而且会持续累积。他们在田纳西州进行了一项对比研究,比较了连续三年由优秀教师(成绩排名前 20%)和较差教师(成绩排名后 20%)教导的学生。这种情况极为罕见,只有约 1/125 的学生有幸或不幸被纳入研究范围。研究结果显示,连续三年由较差教师教导的学生,平均成绩只达到第 29 百分位;而连续三年由优秀教师教导的学生,平均成绩则高达第 83 百分位。这一结果远远超出了单个教师影响的简单叠加,展现出惊人的效果。从这个角度来看,优秀教师的长期影响确实令人印象深刻,或许真的能够帮助学生达到哈佛的水平。事实上,这项研究有时甚至被引用为「四年连续接受优秀教师指导可以消除黑人和白人学生之间的学习差距」(不过我不确定这种说法是否同时假设了白人学生连续四年接受较差教师的指导)。
一份来自 RAND 公司的教育研究报告对此类研究提出了批评,指出它们采用了「权宜之计的方法(ad hoc methods)」,并警告这些研究可能会陷入重复计算学生成绩的误区。这种情况可以这样理解:我们首先根据学生的优异考试成绩判定某位教师是最优秀的;随后又对「最优秀教师的学生考试成绩优异」这一「发现」感到兴奋。这实际上是一种循环论证。Sanders 和 Rivers 确实采取了一些复杂的方法试图避免这个问题;但 RAND 公司通过模拟发现,这些复杂方法的有效性取决于教师效应与学生效应的实际相对强度。基于这些分析,RAND 公司得出结论:「[Sanders 和 Rivers 的研究]的确为教师或课堂效应的存在和持续性提供了证据,但这种效应的强度可能被有些夸大了」。
Gary Rubinstein 声称他已经成功驳斥了 Sanders 和 Rivers 类型的研究。我对他的研究方法持强烈异议——他似乎认为,只要优质教学与优异考试成绩之间不存在完全的一一对应关系,就可以将这种关联性完全否定。尽管如此,他提供的数据还是具有一定的参考价值。通过粗略观察和分析这些数据可以发现,所谓「连续三年遇到优秀教师」所带来的大部分进步,实际上可能主要源于最后一位优秀教师。因此,这种效果的叠加性可能并不如原先假设的那么显著,Sanders 和 Rivers 的研究或许只是比其他研究者发现了更为明显的教师效应而已。
那么,这些优秀教师带来的学业进步会以怎样的速度逐渐消退呢?
教育收益的衰减速度令人吃惊。[Jacob、Lefgren 和 Sims](http://faculty.smu.edu/millimet/classes/eco7321/papers/jacob et al.pdf) 的研究表明,仅有 25% 的收益能持续到次年,到第三年更是只剩 15%。具体而言,假设你四年级时遇到了一位优秀的老师,他让你的考试成绩提高了 x 分,那么到了五年级,你的成绩将比没有这位老师时高出 0.25x 分。Kane 和 Rothstein 的研究也得出了类似的结论。RAND 公司的一份报告指出,一年后的收益持续率为 20%,两年后则降至 10%。Jacob、Lefgren 和 Sims 的另一项研究发现,一年后仅 25% 的收益仍然存在,两年后约为 13%,此后下降速度才会明显放缓。这些研究结果都与 Sanders 和 Rivers 的观点存在较大分歧。
这些研究都无法确定,经过足够长的时间后,教育收益是否会完全消失。Chetty 的计算显示,收益最终会稳定在初始值的 25%。然而,这个数字不仅比其他大多数研究中两年后的结果还要高,而且 Chetty 一向以得出比其他研究者更为惊人和便于解释的结果而著称。对此,我持相当怀疑的态度。我能清楚记得去年发生的许多事,但对二十年前的记忆却寥寥无几。比如,虽然我几乎可以确定六年级时老师曾(出于某种奇怪的原因)教我们班跳排舞,但现在我连一个舞步都回想不起来了。此外,我们还应该回顾 Louis Benezet 在 20 世纪初进行的实验:他将数学教育推迟到初中才开始,结果仅仅一两年后,这些学生就达到了与其他同龄人相当的水平。这似乎暗示了小学数学教师的作用可能并不如我们想象的那么重要。即便是 Chetty 本人似乎也不愿对此多加争辩,他表示自己的研究结果「与现有证据相符,即教育改善会提高当前的分数,但这种效果会在日后逐渐消失」。
总的来说,我认为有相当充分的证据表明,教师 VAM 评分提高一个标准差,能使学生当年的考试成绩提升 0.1 个标准差。不过,这种效果在随后的两年内会衰减 50%-75%。至于连续遇到多个优秀或垃圾教师时这些数据会如何变化,以及两年后效果会衰减到何种程度,我目前还无法确定。
三、增值模型的局限与争议
最初,当我开始寻找关于教师如何影响儿童的证据时,我以为教师团体和教育专家会大力推广所有积极的研究结果。毕竟,还有什么比可靠的统计数据更能证明优秀教师的价值呢?
然而,出人意料的是,这些团体恰恰成为了上述研究最强烈的反对者。这并非因为他们质疑优秀教师的影响力,而是因为要证明这种影响,就必须承认教学质量是可以客观衡量的。这种观点往往会演变成使用 VAM 评估教师表现,进而解雇表现不佳者的提议。他们认为 VAM 存在偏见,可能会对那些被分配到智力较低毅力较低学生的教师造成不公平的负面影响。
从旁观者的角度来看,学术界的激烈争论总是令人津津有味,而围绕 VAM 展开的这场论战,更是将学术争议推向了前所未有的高度。例如,一个名为「VAMboozled!」的博客就格外引人注目。这个博客不仅有着异常醒目的 logo 设计,还持续不断地发布诸如「Kane 故伎重演:夸大『统计显著性』以左右公共政策」之类的文章。与之相比,历史学家兼研究员 Diane Ravitch 的文风虽然不那么花哨,但言辞同样犀利:
VAM 纯属伪科学。将儿童视为流水线上的产品,把学习简化为标准化考试分数,这种做法也许能让某些计量经济学家兴奋不已,但与儿童、学习和教学的真实世界完全脱节。这种宏大理论或许能为其作者摘得诺贝尔桂冠,但它不仅与真正的教育理念毫不相干,其机械化、简单化的人性观更是有百害而无一利。
不得不说,这番话里的情绪可谓溢于言表。
起初,我对这些批评持怀疑态度。然而,在深入阅读了大量相关网站后,我不得不承认,他们关于 VAM 并非始终是可靠评估标准的观点确实有其道理。
首先,VAM 的效果似乎在很大程度上取决于学生的个体特征。例如,在一个主要由英语非母语学生组成的班级中,教师要获得高 VAM 评分会更加困难。这些学生在标准化测试中表现欠佳是可以理解的,但考虑到 VAM 会控制学生的先前成绩,人们可能会期望他们仍能获得与其他学生相当的 VAM 评分。然而,事实并非如此。此外,许多 VAM 模型还会将学生的种族、性别、社会经济地位等因素纳入考量。我猜这种做法表面上看比完全忽视这些因素要好,但也暴露出模型自身的不确定性——如果仅仅控制先前成绩就足够的话,就不需要再考虑这些额外因素了。然而,研究人员显然认为有必要控制这些变量,这就引发了我经常提出的质疑:我们永远无法完全控制所有的混淆因素。更重要的是,这些因素在某种程度上可能只是遗传因素的有损代理指标,而遗传因素是绝对无法充分控制的。
VAM 估计结果中存在大量噪声,这可能源于前文所述的原因。Goldhaber & Hansen (2013) 表明,一位教师在某一年的 VAM 得分与次年得分的相关性仅约为 0.3。盖茨基金会的一项研究[也得出了类似结论](https://www.ets.org/s/pdf/23497_Angoff Report-web.pdf),VAM 的可靠性在 0.19 到 0.4 之间浮动,平均约为 0.3。Newton 等人的研究结果略高,在 0.4 到 0.6 之间;而 Bessolo 的研究显示了更广泛的范围,从 0.2 到 0.6 不等。尽管这些数据有所差异,但大体上处于同一水平。Goldhaber 和 Hansen 还尖锐地指出,用于评估学生的标准化考试通常需要 0.8 到 0.9 的相关性才能被认为是有效的(例如,SAT 考试的相关性约为 0.87)。这表明 VAM 虽然有一些稳定的成分,但不能被视为与常规考试评估学生的方式等同的教师「评估」工具。
有人可能会问,即使 VAM 是一个噪声较大的估计方法,难道不能通过多年平均来降低这些噪音吗?我认为这确实是可行的,而且我相信最谨慎的 VAM 支持者也希望采取这种方法。然而,现实情况是,奥巴马总统希望立即改善教育质量,而许多教师并没有积累十年之久的 VAM 评估数据。
此外,一些教师指出,即便采用平均值的方法,如果学生分配存在持续性差异,这种方法也无法有效消除偏差。例如,假设 Andrews 老师总是被分配到最优秀的学生,而 Brown 老师则总是得到成绩最差的学生,那么即使计算十年的平均值,得到的仍然是带有偏差的数据。支持者认为,除了少数特殊情况(如天才班教师或英语作为第二语言的班级教师),这种情况不应该普遍存在。他们建议在评估模型中引入学校固定效应(例如,控制某所学校学生的平均表现),从而只保留教师效应。他们还坚持认为,学校内学生与教师的配对原则上应该是随机的。然而,反对者对此表示质疑,他们引用了 Paufler 和 Amrein-Beardsley 的一项针对校长的调查研究。在这项研究中,所有受访校长都承认他们并非完全随机地分配学生到各个班级。不过,仔细审视这项研究会发现,校长们表示他们正努力实现「超级随机」——即有意识地确保所有班级尽可能保持均衡。即便他们无法完全实现这一目标,剩下的差异应该也微乎其微,不是吗?
这个问题可能没那么简单。Rothstein (2009) 的研究尝试使用学生五年级教师的 VAM 分数来「预测」这些学生在四年级时的考试成绩,结果发现这种方法竟然有效。这要么意味着学校在违反时空规律,要么暗示四年级成绩优秀的学生不知何故得到了最优秀的五年级教师。更令人惊讶的是,Briggs 和 Domingue 不仅重复验证了这些效果,还发现五年级教师对其四年级学生的「影响」与她实际教导这些学生时的影响同等显著。这一发现似乎暗示 VAM 可能完全是偏差。尽管如此,Goldhaber 提出了一个观点,认为从统计学角度来看,这些结果可能并不那么令人沮丧。可惜我没有足够的理解能力毅力,难以评判这一论点的合理性。
遗传因素可能在解释这些结果中扮演重要角色(感谢 Spotted Toad 关于此主题的精彩文章)。Robert Plomin 进行的一项双胞胎研究采用经典行为遗传学方法分析了 VAM,发现个别学生在某一年级的 VAM 约有 40% 到 50% 可归因于遗传因素。换句话说,你从三年级到四年级的考试成绩变化,很可能更接近你的同卵双胞胎兄弟姐妹的成绩变化,而不是你的异卵双胞胎兄弟姐妹的成绩变化。
乍看之下,这似乎有些矛盾——既然 VAM 已经考虑了学生过去的表现,那么它难道不应该成为一个相当纯粹的教师效能指标吗?然而,Toad 提出了不同的见解。他引用了行为遗传学的十个可重复发现之一:对于年龄较小的孩子,智商更多受到共同环境的影响,而随着年龄增长,基因因素的作用逐渐增强。换句话说,在幼年时期,一个人的聪明程度在很大程度上取决于所处环境的丰富程度;而随着年龄增长,基因的影响变得越来越显著。
让我们考虑这样一种假设情况:你的成长环境可能将你的智商限制在 100,但你的基因潜力却能让你达到 120 的智商。假设(这里我们做了一些简化)你 5 岁时的智商是 100,15 岁时达到 120,并且这十年间智商呈现线性增长。这意味着你的智商每年可能会提高 2 点。现在,让我们再设想另一个孩子,她的成长环境有利于形成 130 的智商,但基因因素却将她的智商潜力限制在 90。5 岁时她的智商是 130,到 15 岁时降至 90,也就是说她的智商每年会下降 4 点。进一步假设,你们在标准化测试中的表现完全由智商决定。在这种情况下,你在五年级时的测试成绩会比前一年提高 2 分,这会让你的老师看起来教学能力出色。她可能会在 VAM 中获得高分,继而得到加薪和晋升的机会。相比之下,你的朋友在五年级的测试成绩会比前一年下降 4 分,这会让她的老师看起来教学能力不足,可能会被要求参加补救性培训。
这一批评恰好印证了 Rothstein 测试的观点。由于你每年都在稳步提高 2 分,Rothstein 教授可以根据你五年级的 2 分增长,准确预测出你在四年级时也增长了 2 分。同样,他也可以根据你朋友五年级的 4 分下降,准确预测她在四年级时也下降了 4 分。
这个解释简洁明了,但我有一个疑虑:它没有很好地解释衰减效应。假设一位五年级教师对四年级学生的「时间弯曲」效应与她对五年级学生的「无时间弯曲」效应完全相同,那么为什么当这些学生升入六年级后,她的影响力就只剩下五年级时的 25%?到了七年级,为什么影响会进一步减弱?这种解释显然存在重大漏洞。
如果我们能够将所有这些研究结果归纳为以下结论,那该多好:教师几乎没有持续性影响,而 Plomin 发现的遗传因素和 Rothstein 指出的因素恰好对应了 Chetty 等人识别出的 15-25%「永久」收益(这与我对排舞课的记忆缺失形成鲜明对比)。然而,这样做就会完全否定 Briggs 和 Domingue 的发现,即 Rothstein 效应可以解释 100% 已识别的 VAM 结果。
在我阅读的这个领域最优秀的论文中,我反复看到一个观点:与其争论「VAM 存在偏差!」还是「VAM 很棒!」,研究者们或许应该达成共识,承认 VAM 确实存在偏差,就像其他所有评估方法一样。接下来,我们应该致力于准确测量这种偏差的程度,并利用这个数据来决定 VAM 适合或不适合哪些用途。遗憾的是,我还没有看到有人以我能理解的方式开展这样的研究。
总的来说,我们有诸多理由对 VAM 持谨慎态度。然而,这些理由之间也存在一些矛盾之处,而且我们也不应该对 VAM 完全持否定态度。尽管 VAM 确实存在偏见,但在纷繁复杂的数据中可能仍然隐藏着一些有价值的信息,尤其是当我们对多年的数据进行平均分析时。
四、教师影响与学生收入
让我们重新审视那项声称优秀的四年级教师能为学生带来 89,000 美元收益的研究。这项研究出自 Chetty、Friedman 和 Rockoff 之手(分为第 1 部分和第 2 部分)。你可能对 Chetty 这个名字并不陌生,他经常发表一些令人瞠目结舌的研究成果。
彭博社报道称,「真正杰出的」教师可以使学生的收入增加 80,000 美元,但我认为这主要是一种推测。我在论文中看到的具体数据是,相比平均水平高出一个标准差的四年级教师可以使学生的终身收入增加 39,000 美元。我们还是以这个更为可靠的数据为准。
这项研究结果乍听之下令人印象深刻,但让我们仔细推敲一下:假设一个普通人的职业生涯长达 40 年,这意味着一位优秀的老师每年能为学生的收入增加约 1000 美元。然而,需要指出的是,研究本身并未得出这一结论。实际上,研究发现这些杰出的教师能为学生每年增加约 300 美元的收入。但研究对象多为 20 多岁的年轻人,普遍收入不高。研究者由此推测,如果优秀教师能为刚踏入职场的员工增加 300 美元的年收入,那么对于拥有一定工作经验的员工,这个数字可能会攀升至 1000 美元。作者运用了大量统计数据来支撑这一假设,但我并不具备评判其合理性的专业能力。不过,这些具体数字真的那么关键吗?真正令人惊讶的是,四年级的一位优秀老师竟然能对学生未来的收入产生任何可测量的影响。一旦接受了这一前提,无论是 300 美元、1000 美元还是 50 万美元,似乎都不那么难以置信了。
还有一点值得我们关注。大多数研究都表明,教师对学生考试成绩的影响会随时间迅速减弱。Chetty 的研究似乎显示有高达 25% 的影响会长期存在,但他本人似乎并不热衷于为这一观点辩护,也承认考试成绩的提升可能只是暂时的。然而,有趣的是,Chetty 同时指出,优秀教师对学生未来收入的影响却似乎完全没有衰减。他和他的合著者在论文中写道:
我们得出教师具有长期影响的结论可能令人意外,因为有研究表明,教师对学生考试成绩的影响在随后几年会迅速「衰减」(Rothstein 2010,Carrell and West 2010,Jacob,Lefgren,and Sims 2010)。尽管我们的数据也证实了这种快速衰减现象,但我们发现教师对学生未来收入的影响,与根据收入和同期考试分数增长之间的横截面相关性预测的结果相符。
研究者后来将这种现象描述为「衰减和再现的模式」,但这种说法有些误导。实际上,VAM 在考试分数上从未再现,它只在收入数据中显示出来。
这些发现都颇具争议,而第三部分似乎为我们提供了一个简单的解释。VAM 中可能存在一个年复一年稳定的偏差成分,它实际上反映的是学生的素质,甚至可能是天赋能力,而非单纯的教师质量。很容易就可以认为,正是这个成分导致了 Chetty 所发现的 28 岁时的收入增长;四年级时天赋较高的学生在二十多岁时可能仍保持这种优势。
Chetty 意识到了这一论点,并试图反驳它。为此,他进行了一项准实验,他认为这验证并确认了他最初的观点:当新教师进入学校时,会发生什么变化?
我们最担忧的问题是学生选择教师时可能存在的偏见。为了消除这种影响,研究者采用了一种新方法:将一所学校的整个年级作为研究单位(例如,一所学校的所有五年级教师会被视为一个整体)。基于这种方法,Chetty 观察了当老教师退休、新教师加入时整个年级的变化情况。他特别关注了教师从其他学校转入的案例。这些转入的教师在原学校已有一个 VAM 评分,这个评分可能高于或低于他们新学校的平均水平。如果 VAM 评分确实能反映教学质量,那么当一位高分教师转入时,该年级的平均 VAM 评分应该相应提高;反之,如果转入的是低分教师,平均分则应下降。Chetty 分析了所有转校教师的数据,结果证实了这一假设。更加引人注目的是,他用这些转校数据估算的 VAM 与常规数据得出的数字完全一致(预示学生未来年收入增加 1000 美元)。这个发现令人惊叹,甚至可能显得过于完美。真的吗?完全一样的数字?难道常规数据中完全没有偏差?我印象中有大量证据表明,大部分研究结果其实都存在偏差,这似乎有些矛盾。
Rothstein 成功地使用另一个学区的数据复现了 Chetty 的研究结果。不仅如此,他还对 Chetty 的准实验研究采用了与分析常规 VAM 相同的方法,并得到了类似的结果。具体来说,当一位优秀的五年级新教师调入某校后,该校的整体表现提升程度可以在一定程度上预测这位教师的学生在四年级时的成绩。这种预测虽然不是完全准确,但确实存在一定的相关性。令人困惑的是,教师调动似乎产生了与其他 VAM 评估相同的、看似违反时间逻辑的效应。对于这一现象,Rothstein 主要从 Chetty 的样本选择角度进行了解释。他认为 Chetty 错误地排除了某些班级和教师,尽管这一论点我并未完全理解。Rothstein 还提供了另一个可能导致这种现象的例子:假设一个社区正在经历中产化进程。随着原有教师退休,新调入的教师很可能是被不断改善的社区环境吸引而来的更优秀的专业人士。同时,学校的学生群体在基因和社会经济背景上可能也变得更具优势。因此,我们会观察到更优秀的调入教师与学生的高成绩之间存在相关性,但这并不意味着前者直接导致了后者的出现。
在此之后,Rothstein 和 Chetty 之间展开了一场愈发深入复杂的学术辩论,其中涉及的技术细节已经超出了我的理解范围。Chetty 与其同事 Friedman 和 Rockoff 合著了一份长达 52 页的《回应 Rothstein》报告。他们在报告中指出,即便在一个理论上不应存在因果关系的公平实验中,Rothstein 的研究方法也会得出回溯性因果效应的结论。据 538 网站的一篇相关报道,一些学术造诣颇高的专家(尽管他们本就支持 VAMs,可能存在一定偏见)认为 Chetty 的回应很有说服力,就连 Rothstein 本人也承认这种论证「可能」成立。538 网站明确表示,在这轮交锋中 Chetty 占据了上风。然而,Rothstein 随后发表了一份新的研究报告作为回应,重新验证了他的研究结果。他声称这份新报告不仅回应了 Chetty 的质疑,而且仍然发现了表明存在偏见的回溯性因果效应。据我所知,Chetty 至今尚未对此作出回应,也没有其他专家就这份新报告的正确性给出权威意见。
我通常会倾向于这样说:这里有一些非常奇特的结果,看起来难以成立,我们想要为它们找个合理的解释。现在有一位德高望重的伯克利大学经济学教授声称他已经解释清楚了,太好了,让我们把整件事都抛诸脑后吧。然而,还有一个实验,我无法轻易将其忽视。
五、幼儿园教师的长期影响
STAR 项目(全称为「学生与教师成就比」)是 80 年代和 90 年代开展的一项重大教育实验,旨在研究较小的班级规模是否能提高学生的学习成绩。这个问题本身就错综复杂,但关键在于,为了进行这项实验,研究人员在 79 所不同的学校里,将幼儿园学生随机分配到各个班级中。考虑到最近几项研究可能存在偏差的一个主要原因是学生可能被非随机地分配给教师,这些田纳西州的学校提供了一个难得的机会,使我们能够获得比其他任何地方都要可靠得多的数据。
Chetty、Friedman、Higer、Saez、Schanzenbach 和 Yagan 对 STAR 项目的数据进行了深入分析。他们尝试通过教师经验、资格证书及其他特征来预测学生未来的收入,但这种方法的有效性仍存在争议。Bryan Caplan 在他的分析文章中(1 和 2)对此研究提出了诸多质疑。尽管 Caplan 对该研究的多个方面持怀疑态度,但有一点他并未提及,而这恰恰是我认为最具说服力的部分——这种方法与 VAM 颇为相似。
得益于随机分配的实验设计,Chetty 等人无需采用完整的 VAM 方法。他们评估幼儿园教师质量的指标似乎仅仅是该教师所有学生标准化考试成绩的平均值(且慢,现在连幼儿园学生也要参加标准化考试了吗?看来确实如此)。在用教师质量预测特定学生的未来成就时,为了确保公平性,他们会采用除了该学生以外的所有其他学生考试成绩的平均值作为指标。
研究发现,同班同学的平均考试成绩与学校内其他随机分班学生的平均成绩相比,能够预测一个学生的考试成绩。具体来说,「入学年级的班级整体水平每提高一个百分点,预计会使学生个人的考试成绩提升 0.68 个百分点,这证实了同一班级内学生的考试成绩高度相关。」然而,这种影响到四年级时会逐渐减弱至几乎可以忽略不计,表明优秀教师对学生考试成绩的积极影响是短暂的,会迅速消退。但是,被分到整体水平较高班级的学生,在 25-27 岁时的平均收入会有显著提升!研究者声称,班级水平每提高一个百分点,学生未来的收入就会增加 0.4%,而且这种关系是线性的。举个例子,在他们的数据集中,最优秀的幼儿园教师使她的班级平均表现达到第 70 百分位,这些学生在成年后的平均收入约为 17000 美元(注意,这些数据来自田纳西州的年轻初级职员),而那些由普通水平幼儿园教师教导的同龄人平均收入仅为 15500 美元左右。换言之,仅仅是幼儿园老师这一个因素,完全不考虑他们一生中遇到的其他老师,就使他们的平均收入增加了 10%。面对如此惊人的研究结果,不禁让人质疑:Chetty 及其研究团队,你们真的认为这个结论可信吗?真的?
尽管这项研究的结论令人难以置信,但却很难找出其中的漏洞。即便是持反对意见的 Caplan 也不得不承认,「这是一篇极其出色的论文」,「作者极为谨慎」,并将其评价为「有史以来最杰出的实证研究论文之一」。由于采用了随机实验设计,我们无法对其应用大多数常用的反对 VAM 的论据。坦白说,我也不知道该如何评判。我真的无法确定。
好吧,我有一个虽然可能性很小,但值得考虑的假设。Chetty 等人在评估教师质量时,是基于整个班级学生的表现,并在预测每个学生结果时将其排除在外。这种方法只有在学生不影响同学考试成绩的情况下才是客观的。然而,现实可能并非如此简单,某些学生可能确实会影响其他同学的成绩。如果一个学生存在行为问题,可能会影响整个班级的学习氛围和成绩。Carrell 的研究发现,「在小学 25 人的班级中,接触到一个捣乱的同学会导致 26 岁时的收入降低 3% 到 4%」。诚然,这本身就是一个令人难以置信的研究结果。但如果我们接受这个同样难以置信的第二项研究,它可能为我们提供了一种质疑第一项研究的新视角。假设班上有一个问题学生,经常捣乱并干扰课堂秩序。这不仅会降低其他同学的考试成绩,还会使得教师看似能力不足。这个学生长大后可能仍然问题重重,行为不端,难以获得好的工作。如果这是导致班级间表现差异的重要因素,那么所谓的「教师质量」可能实际上反映的是班上行为问题学生的比例,而教师质量对未来收入的影响可能只是反映了行为不端的学生往往成为低收入成年人这一事实。虽然我不确定这种效应的影响程度如何,但它可能是一种可能性。
然而,如果我们无法证实这一观点,我们就不得不接受一个令人困惑的结论:优秀的幼儿园教师能够显著提高学生未来的年收入,增幅可达数千美元。这种现象该如何解释呢?
值得注意的是,所有研究都一致表明,测试分数的提升效果远不能持续几乎那么长时间。因此,我们不能简单地认为幼儿园教师为学生奠定了有价值的知识基础,供他们日后继续发展。同样,我们也不能假设幼儿园教师仅仅通过激发兴趣或丰富经历来提高学生的智商或培养他们对学习的热爱。这种长期影响必定源自某些与考试成绩和可量化智力能力无关的因素。
Chetty 等研究者提出的解释是,教师还在传授「非认知技能」。虽然我无法完全理解他们所使用的复杂回归分析方法,但他们的研究结果显示:幼儿园班级质量提高一个百分点,虽然对八年级标准化考试成绩的影响微乎其微(仅提高 0.05 个百分点,不具统计学意义),但对八年级学生的非认知能力评分却有显著影响(提高 0.15 个百分点,具有统计学意义)。这里的「非认知能力评分」是通过让八年级教师评估学生的行为表现来获得的,例如回答「这个学生是否经常打扰他人?」之类的问题。研究进一步表明,这些非认知能力的持续性比标准化考试成绩更能准确预测未来的收入增长。研究者尝试将这些非认知效应分为四个类别:「努力程度」、「主动性」、「参与度」和「对学校教育的重视程度」,但结果显示这四个方面的影响大致相当,没有特别突出的单一因素。
这一发现与我此前提出的「行为问题」理论高度吻合,该理论探讨了幼儿园班级对学生未来收入的影响。值得注意的是,学生所在幼儿园班级的「质量」可能主要取决于班上存在行为问题的学生数量,而非其他因素。有趣的是,这一「质量」指标与学生未来的考试成绩并无明显关联,但却与日后出现的行为问题密切相关。这一观察结果也呼应了 Plomin 的研究发现:早期的考试成绩主要受环境影响,而后期的考试成绩则更多地由基因决定。由此可见,尽管幼儿园阶段的不良学习环境可能会产生重大影响,但这种影响在学生日后的学习生涯中可能会逐渐减弱。
这一发现与其他一些研究结果不谋而合。众所周知,学前教育带来的考试成绩提升往往会在几年后消失殆尽。然而,一些大规模的学前教育研究,如 Perry 学前教育计划发现,尽管这类项目可能不会提高智商,但却可能产生其他影响。不过,情况并非如此简单。有趣的是,Perry 计划确实提高了参与者日后的标准化考试成绩,只是没有提高智商分数。更让人困惑的是,其他研究则发现,接受过学前教育的儿童反而会表现出更多行为问题。这让我联想到我最近引用的一些初步研究。这些研究表明,过早的入学年龄似乎会导致类似注意力缺陷多动障碍(ADHD)的不良行为模式,并对日后的生活产生负面影响。我倾向于将这种现象归因于在儿童大脑仍在发育的阶段过早地给予过度挑战。如果我想说得更尖锐一些(而我确实想这么做!),我甚至可以说,所有的幼儿园教育都是一种神经学上的创伤,因为它迫使学生过度使用尚未成熟的大脑来专注于枯燥的事物,从而破坏了他们未来的人生前景。不过,优秀的教师可以通过让课堂更有趣来减轻这种负面影响。
然而,即便这是事实,我们仍然要回到我最初提出的问题:有力证据表明,除去基因因素,父母对子女人生结果的影响相对有限。那么,我们现在却在说,一位仅仅教导一年的幼儿园老师反而能产生如此重大影响?更令人不解的是,这种影响并非来自幼儿园教师的专长领域(即学科教学),而是在行为问题方面——这恰恰是父母有着无数接触机会和巨大影响力的领域?
坦白说,我仍然难以完全接受这些研究结果,但我也没有足够有力的证据去彻底否定它们。不得不承认,参与这场讨论的各方都表现出色,数据质量很高,而且成功避开了许多常见的研究陷阱。尽管如此,这些还不足以让我完全信服。
六、总结
总的来说,教师质量大约能解释当年考试成绩差异的 10%。一位优秀程度高出 1 个标准差的教师,可能会使学生的考试成绩每年提高 0.1 个标准差。这种影响随时间迅速减弱,可能在四五年后就完全消失,尽管也可能存在一些微小的长期效应。我们难以排除其他因素的影响,比如学生的自然分组或遗传潜力,这些可能作为人为因素影响研究结果。大多数人都认为,这类评分既包含有效信息,也掺杂了大量干扰因素。有趣的是,尽管教师对考试成绩的影响很快就会消退,但研究表明,他们对学生 20 或 25 年后的收入有显著影响。这种影响之大,以至于幼儿园教师的质量可以预测学生成年后收入相差数千美元。这个看似难以置信的发现已在准实验甚至真实实验中得到重复验证,难以否定。由于这种影响并非通过标准化考试成绩体现,最可能的解释是它涉及行为等非认知因素。对于这个发现,我持保留态度,认为它是否真实存在的可能性各占一半。这主要基于我对该领域研究的低先验预期,而非研究本身的缺陷。我对这个领域了解不深,因此对我所说的任何内容都持谨慎态度。
延伸阅读资料:Institute of Education Science summary, [Edward Haertel’s summary](https://www.ets.org/s/pdf/23497_Angoff Report-web.pdf), TTI report, Adler’s critique of Chetty, American Statistical Society’s critique of Chetty/VAM, Chetty’s response, Ballou’s critique of Chetty
优绩主义,众矢之的
原文:Targeting Meritocracy | Slate Star Codex
发表于 2017 年 6 月 24 日,作者:SCOTT ALEXANDER
一、优绩主义正遭遇空前质疑
Prospect 杂志剖析了优绩主义的种种弊端。First Things 认为优绩主义正在毒害美国。女权主义哲学家们集体发出反对优绩主义的声音。《卫报》呼吁打倒优绩主义。Vox 号召攻击虚假的优绩主义神话。书店的架子上甚至出现了一本名为《反对优绩主义》的著作。乍听起来,优绩主义似乎天经地义,无可厚非(这不只是意味着职位要交给有优绩的人吗?),似乎确实有很多人反对它。
在这些人当中,有些只是小题大做。第三篇文章似乎承认,真正的优绩主义原本应是一件好事,但指出我们当下的社会尚未实现真正意义上的优绩主义。这与「反对优绩主义」相去甚远,就如同指出我们尚未实现彻底的种族平等,并不意味着你就「反对种族平等」一样,但无论如何,我想你必须以某种方式获得点击量。
其他几篇文章则是来真格的。它们的论点似乎影射了这样一种看法:精英阶层把孩子送进私立名校,在那里拿到一连串 A+,最后当上「青年才俊俱乐部」的主席。他们进而考入哈佛,凭着惊世才华和不凡气度,令教授们倾倒。毕业后旋即被摩根大通、贝尔斯登、沙利美、高盛和联邦政府网罗,走马上任高薪管理岗位。自此,他们便可终日享用松露鱼子酱,沾沾自喜地对彼此说:「区别于以往的精英,我们是才智精英,因为我们的优绩,我们真正配得上我们的职位。」而那些穷苦大众,只能在高墙外面咬牙切齿。
姑且认为这一切都是事实,而且很糟糕,但这意味着我们就应该反对优绩主义吗?
二、优绩主义的朴素逻辑
纵观所有这些文章,都不约而同地暗含了一个匪夷所思的假设:优绩主义是建立在这么一种信念上——聪明人应该得到好工作作为聪明的奖励。Freddie de Boer 在评论另一本反优绩主义的著作时,对此说得入木三分:
我之所以反对优绩主义,是因为我反对「人各有其应得」这一观念。我认为,个人的物质条件不应该由他「应得」什么来决定,无论判断标准是什么,也无论用来衡量的体系设计得多巧妙。我坚信,任何时候都应该一视同仁地为所有人谋求最大利益。
从更现实的角度看,准确评判一个人应得的东西几乎是不可能的。因为其中不可避免地掺杂了太多混淆变量:根深蒂固的特权、遗传和生理倾向、父母的影响、同伴效应、运气,以及个人的工作条件。思考人类应得的非物质性,并非否定人的选择,而是在否定人的自决权。现实世界对优绩主义所谓「给人应得的东西」这一诉求,漠不关心。
我认为这些观点尽管颇有道理,但并没有抓住问题的要害。支持优绩主义的朴素逻辑是这样的:假如你的性命取决于一台高难度手术,你是希望主刀者是医学院的优等毕业生,还是一个差点被淘汰、靠补考才勉强及格的人?如果你选择前者,那么至少在外科医生的问题上,你就是优绩主义的拥护者。这个道理稍加类推,你自然会在其他所有领域也支持优绩主义。
美联储的决策优劣,可能意味着经济繁荣还是衰退,意味着数以千万计的工人加薪还是失业。当一个决定事关如此重大,你自然希望由最优秀的决策者来做出——换言之,你希望完全基于优绩选拔美联储主席。
这无关公平、无关应得,也无关其他任何考量。假设某些富有的家长为尚未出生的孩子提供实验性基因治疗,使其成为智慧超群的经济学家,而且实验成功了。即便这超凡的才智并非孩子自己的功劳,我还是愿意让他来掌管美联储。如果你真的在乎挽救上千万人的饭碗,你也会赞同我的观点。
三、真正的优绩主义:抛弃学历崇拜
那是否意味着我们只能忍气吞声,任由那些出身哈佛、饱食松露的精英,高高在上地主宰摩根大通、贝尔斯登、沙利美、高盛和联邦政府,俯视我们芸芸众生?
非也。对这个问题,真正的解决之道是所有反优绩主义文章都不敢提及的:认清教育和优绩是两回事!
我的病人中有很多来自社会底层和工薪阶层,他们反复向我诉说同一个遭遇:由于没有大学文凭,单位不肯给他们晋升的机会。一些人甚至直接被告知:「你工作出类拔萃,十分适合担任管理岗位,但公司的规章制度就是不允许非本科学历的人出任经理。」其中一些人因为家境贫寒,根本无力承担高昂的学费;还有一些人怀疑自己能否完成学业——他们或许拥有出色的人际交往和实操能力,但在学术论文写作方面稍有不足。虽然个别幸运儿可以进入大学深造并平步青云,但大部分人的上升通道被学历门槛牢牢封死,只能停留在单位内部不要求学历的最高职位,长年累月为那些头衔漂亮却能力欠缺的直属上司善后。这些人实际上优绩横溢。在优绩主义社会,他们理应立于金字塔尖,跻身最高领导层。然而在我们的社会中,他们被困住了。
问题的关键不只在于考上大学,而是大学中的成功与现实世界中的成功之间的关联十分微弱。我之所以能够进入医学院,是因为我在大学期间取得了优异的成绩;而那些优异成绩来自于我的大学专业——哲学。另一个哲学造诣比我稍逊一筹的人也许永远无缘医学院,但谁又能说他不可能成为一名更加出色的医生呢?也许,一些在校成绩并非顶尖的人,反而具备了成为护士、消防员或警察的独特才能。如果这种猜想是对的,那么在当今渐渐将大学在校表现视为求职敲门砖的趋势下,我们恐怕永远没机会发掘这些人的潜力了。Ulysses Grant 以垫底的成绩从西点军校毕业,但最终事实证明,在一众资历表面上更加亮眼的将领们全都败下阵来后,他却是唯一有能力同李将军抗衡并最终赢得那场内战的人。假如当代真的出现了一位 Grant这样成绩平平却战斗力超群的人才,我们能确信现行的教育体制能够发现并任用他吗?我们能确信它至少会去尝试吗?
别忘了,智商与国际象棋天赋的相关性系数仅为 0.24。即便是国际象棋冠军卡斯帕罗夫,智商也不过 135,仅属于中上水平。倘若他的学业成就与智商相称,能否考入哈佛尚且难说,更遑论成为哈佛的佼佼者了。假如国家象棋队的选拔完全以学历背景论英雄,那卡斯帕罗夫和其他许多大师就将永无出头之日。事实上,真正的优绩主义应该忽视学历,看谁能在棋局中实际取得胜利。
在我看来,编程是为数不多优绩主义实行良好的领域之一。Triplebyte(利益冲突声明:SSC 赞助商)只要求应聘者参加编程能力测试,而无需简历。它会根据应聘者的编程专长,为其匹配合适的科技公司。你在大学时是否担任过学生社团主席无关紧要,你是否设法通过了那些因你不合上流社会气质而拒你于门外的把关者也不重要。关键在于你的编程能力。因此,我认识的许多无法上大学的弱势群体,如穷人、跨性别或精神病患者,通过自学编程,最终被大型科技公司录用。如今,编程几乎成了唯一允许弱势群体凭实力获得高薪的领域。主流社会总是将编程文化妖魔化,试图打压这一现象,这并不令我感到意外。
我认为我们应该反其道而行之:尽可能地按照这一模式改造每个领域。高盛不应该只聘用哈佛的尖子生,而应招揽那些能够证明自己掌握投资原理,或者更进一步,能够证明自己有能力凭实力而非运气预测市场走向的人才。他们中有些是在哈佛商学院学习投资技能的学术翘楚,但更多的将是那些自学成才或天赋异禀的普通工人阶级,就像投资界的「Grant 将军」和「卡斯帕罗夫」。
我不认为上述反对优绩主义的文章作者真的反对其本意。他们可能使用了「优绩主义」一词的另一种定义,即「由受过良好教育、拥有声望的人统治」。但我认为,重要的是要维护「优绩主义」的字面含义——根据优绩,而非财富、阶级、种族或教育程度来做决策,并将其视为一件好事。如果我们任由这个词被污名化,成为象征腐败体制的某种模糊标志,那么那些真正身处腐败体制中的人就会利用其堕落来反对唯一可能的替代方案。「哦,你不喜欢所有重要职位都由上层阶级而非最优秀的人担任?你更愿意根据优绩来分配?但你读过 The New Inquiry、First Things 和 Vox 了吗?相信所谓的『优绩主义』太不酷了!」然后,我们就失去了为数不多的集结点和表达方式,难以指出当前体系的弊端以及更可取的替代方案。我们应该拒绝将「优绩主义」重新定义为「根据阶级和进入哈佛的能力来分配职位」,并重申其原本含义——职位归于那些最称职、最能造福他人的人,这正是我们所期望的。
(所有这些都无法解决反优绩主义人士抱怨的一个最大问题:高盛的百万富翁分析师和赤贫者之间一开始就存在差距。我只是想说,在一个必然有人要担任投资银行家、外科医生或美联储主席的世界里,我宁愿通过真正的优绩主义而非其他任何标准来选拔这些人。)
【欲了解更多讨论,请参阅此处】
关于天赋的寓言
原文:The Parable Of The Talents | Slate Star Codex
发布于 2015 年 1 月 31 日 作者:Scott Alexander
[内容注意:本文可能会引起某些读者在自尊上的不适。文中涉及智商、体重和节食的简短讨论,不利于成长型思维。]
一、为何不应忽视基因的影响?
我偶尔会发表一些关于智商和人类智力研究的博文。我相信,大多数读者已经知道智商有 50% 到 80% 是由遗传因素决定的。而且,智商对学术成就的重要性怎么强调都不为过。在某些领域,杰出科学家的平均智商高达 150 至 160。要知道,在全人口中,智商如此之高的人只占 1/10,000 左右的比例。在顶尖学者群体中频繁出现这么高智商的人,绝非偶然巧合,只能用强大的智力筛选效应来解释。打个比方,如果你看到一群人的平均身高都在 7 英尺(213.36 厘米)以上,你会立即意识到这是一支篮球队或其他什么专门挑选高个子的团队,不会天真地认为这是一群碰巧个子都很高的植物学家。
很多人觉得这段话相当令人沮丧。有人担心,如果认真对待这一观点,可能会破坏人们充分发掘自身潜力所需的「成长型思维」。这一点很重要,我想最后再来讨论,但现在还不是时候。我此刻想谈的是那些「对自己」感到沮丧的人。比如上周的一条评论:
抱歉发表一条自我中心的评论,但读到这段话真的让我很沮丧,我只是需要倾诉一下……如果一个人本身并不怎么聪明,而且显然也没有变聪明的潜力,他们又怎能在一个如此看重智力的文化氛围中保持理智呢?尤其像 Scott 所说的,如果人类智力的确是未来的关键,那我此刻简直感觉自己就像一滩烂泥。
我时不时会听到这样的反馈,所以我本应习以为常并预料到会有这种反应。但我从未如此。在我看来,这种反应完全本末倒置。这里存在着一道观念鸿沟,我想通过娓娓道来的故事、入木三分的洞察,直到它们在鸿沟底部堆积成山,搭起一座便于通行的桥梁。不过在这之前,我想先打个比方:
有人认为,体重是生物/遗传决定论的;另一些人则坚信,体重完全由意志力说了算——饮食有多严格,能逼迫自己付出多少运动。持这两种观点的人常常陷入相当尖锐的争辩。
在肥胖问题上,人们的观点存在分歧。超重人群,特别是那些感到自己因体重问题而受到不公正污名化的人,往往认为肥胖是生物决定论的。虽然并非所有相信体重完全由个人意志控制的人都对胖子心怀恶意,但那些对胖子刻薄的人几乎无一例外地坚持认为,体重是自己选的,而且很容易改变。
尽管这个问题在科学层面存在诸多争议,但双方似乎都认同一点:更富同情心和进步性的立场,即那些切实关注羞辱问题和自尊问题的人所倡导的观点,认为肥胖是生物决定论的。
类似的情况也发生在人们对待心理健康的态度上。我有时会遇到一些抑郁症患者,他们的家人真的不理解。这些家属会说:「我知道女儿心情低落,但她必须认识到,这不是她逃避责任的借口。她需要振作起来,继续生活。」另一方面,大多数抑郁症患者却认为,抑郁远比这复杂得多,它无法简单地靠意志力克服,更不是一个人能够轻易『摆脱』的。
同样,在关于抑郁症的讨论中,持更富同情心和进步性观点的一方认为,抑郁症类似生理疾病,无法轻易地靠意志力和努力来战胜。
让我们再来看一个体现这种辩论模式的例子。在许多政治辩论中,保守派(或被归于此类的人)常常论证,经济成功是勤奋的结果,所以穷人之所以贫穷,无非是因为他们不够努力。而自由派(或被归于此类的人)则反驳说,个人努力与成败关系不大,人的成功主要取决于父母、肤色等先天因素,因此,不应苛责穷人的处境。
这里的表述或许略有偏颇,但不难看出,在此类讨论中,富有同情心、同理心的进步派一方(以及许多穷人本身)倾向于把成功归因于命运的偶然,而另一方则坚信成功取决于努力工作、毅力、勇气和意志力。
我们可以明显察觉这样一种倾向:把结果归因于基因、生理特征或出身等非个人因素,通常被视为一种宽容仁厚的表现;相反,把结果归咎于个人是否更加努力、是否「真心付出」,则可能让处境不佳者感到羞愧,往往不会被认为是一种善意的做法。
然而,令人费解的是,在关于智力成就的讨论中,上述模式似乎不再适用。
在这一领域,一些标榜理性的保守派反而力主,智力优劣源于基因和出身的偶然性,并坚持要求大家接受这个「令人不快却无可辩驳的事实」。
然而,一些标榜「富有同情心」的进步人士却坚称事实并非如此,认为成败的关键在于谁更加努力。他们声称任何人只要真正尽力,就能变得才华横溢,并告诫我们切莫给智力低下者贴上「基因劣等」的「污名」。
对于观点的这种突然反转,我能想到几种解释,但无一站得住脚。在我看来,这似乎都未能打破问题的根本对称性。我选择以始终如一的信念来坚守立场:正如超重者、抑郁者和穷人并非完全咎由自取,智力低下者也不应被如此对待。归根结底,这一切都源于先天的偶然性。智力主要由遗传基因决定,从出生起就注定了人的不同天赋——我们已经在其他领域达成共识:「主要由遗传决定,从出生起就注定」,这意味着如果生而不幸,我们大可不必耿耿于怀。
不妨想想史里尼瓦瑟·拉马努金,这位空前绝后的数学天才。他出生于印度一个小镇,在拥挤的单间房中度过了贫寒的童年。通过向当地大学生借阅书籍,他自学数学,独立钻研,攻克一道道难题,直至穷尽所有能解的题目,才被迫另辟蹊径,发明崭新的方法去解决那些不可解的谜题。
今时今日,美国有大量的贫困人口,他们的生活境遇使父母无法在孩提时为他们读书,无法让他们进入名校,无法让他们接受高等教育,诸如此类。但几乎所有这些人仍然获得了比拉马努金更多的受教育机会。
由此,我们可以得出两种看法:一种观点认为,智力在很大程度上是天生的,拉马努金是个天才,我们普通人无法企及他的成就。
另一种观点则认为:那些穷人只是不够努力。
如果我们撇开「天赋」这个因素,那么当你在街头遇到一个乞讨的穷人,听他诉说自己从未获得机会时,你势必会回答:「若你在 12 岁时从图书馆借几本数学书来看,现在早就成了菲尔兹奖得主了。我听说那奖金很可观。」
不这么说的最好理由是,我们认为拉马努金天资聪颖。但这恰恰揭示了这种观点的实质:拉马努金的天赋,与你父母在你 18 岁生日时赠与你一笔信托基金,在本质上并无二致——它们都是一种「天赐的礼物」,在道德评判中理应给予相应的权重。
二、我在数学和写作上的经历
我不该假借关心穷人之名,实则为我自己的处境而忧虑。
我最近一次与智商相关的测试,还要追溯到高中时的 SAT 考试。彼时,我的语文部分取得了满分,数学部分的成绩虽不失优秀,但谈不上出类拔萃。
我在高中英语课上可谓是春风得意,各个班级拿了 A++,获得校长金奖章,考试轻松满分,还在州内各类作文大赛中斩获头筹。与之相比,数学简直是我的滑铁卢,微积分勉勉强强才混了个 C-。
但凡我在英语方面有点小成绩,父母就会不吝赞美之词,说我很棒棒,要自豪云云。老师们也总拿我当榜样,鼓励其他同学向我看齐。可当我带回那张数学 C- 的成绩单时,父母满脸愁容,絮叨个没完,对我大失所望,说我没有尽全力,还得继续努力云云。
我已经分不清哪点让我更困扰了。
每次英语课上被捧为典范,我恨不得找个地缝钻进去。我根本就没努力好嘛!学习从来都是三天打鱼两天晒网,一半时间都是在赶着上学的路上匆匆写完作业,投那些州赛稿子也是随手一挥,从没真花什么心思。表扬我这些,对当时和现在的我来说都觉得莫名其妙。
但另一方面,直到今天,我还是觉得自己应该为了勉强通过微积分 I 而得到一座大大的雕像。就竖在校园中央,底座上刻着类似这样的铭文:「Scott Alexander,他通过顽强的努力勉强通过了微积分 I,即便老师们总在那个小卷曲符号后面瞎搞一通,还装得有理有据。」
如果我们完全否认先天能力的存在,我真不知该如何解释自己的亲身经历。我不想承认自己是个懒惰的人,在数学上没有付出足够的努力。但我真的不愿意被迫接受别人说我是个品学兼优、比其他同学更刻苦用功的英语学生这样的溢美之词。我知道,有些人比我在英语上付出了更多心血,全身心投入到这门课程的学习中,最后却只得到了 C 或 D 的成绩。否认先天能力的差异,就是在贬低他们的付出和牺牲,同时也在给我冠以不应得的荣誉。
反观那些在数学上不费吹灰之力就能胜过我的同学,我并不嫉妒他们。但如果他们开始宣称自己与我具有同等的先天能力,唯一的区别就是他们在努力,而我却在偷懒,那我肯定会感到不服气。特别是当我得知他们在海滩上享受悠闲时光,而我正埋头苦读教科书的时候,这种不平之感会更加强烈。
我倾向于把社会准则看作不同群体之间讨价还价达成的契约。说到对待智力的态度,谈判双方就是聪明人和笨人。因为我同时具备这两个身份,所以我能跟自己谈,这就大大简化了谈判过程。我的处置方式是:不会因为自己不擅长的地方而自暴自弃,但在擅长的地方也不能得意忘形。不管怎样,都是基因抽奖的结果。与此同时,我会全力以赴发挥自己的长处,尽量掩盖自己的短处。到目前为止,我觉得这是一种对自己非常有益的态度,我对待别人也力求如此。
三、我和我弟弟的经历
主题依然是「Scott 重温童年阴影」。所以——
那年我 6 岁,弟弟 4 岁。妈妈觉得,作为一个标准的望子成龙的犹太母亲,她有义务让我们俩学钢琴。于是她给我报了雅马哈钢琴入门班,给弟弟报了雅马哈的「小不点弹琴」班。
过了一段时间,我发现弟弟居然和我一起上钢琴入门班了。
再过了一段时间,我惊讶地发现,尽管弟弟才刚开始学琴,而且比班上其他人小两三岁,但他已经成了全班钢琴弹得最好的学生。
没过多久,雅马哈美国公司就把弟弟送到了日本,让他在雅马哈高层面前露两手。
事情就这样一件接着一件,我弟弟先是在多个国际钢琴比赛中获奖,25 岁就成为了音乐教授,现在经常有新闻文章称他为「同辈中首屈一指的音乐家」。
而我呢,在雅马哈学琴时一直都是个平庸的学生。上小学时,我决定尝试拉小提琴,看它是否比钢琴更得我心。但我很快就被分进了补习班,因为我怎么都无法让我的小提琴发出正常的声音,而不是像只受伤的小猫在叫唤。折腾了大约一年后,我决定还是选择合唱来应付音乐课的要求吧,周围所有不得不听我拉琴的人都松了一口气。
我常常思索,在我内心深处,是否存在成为「我这一代顶尖音乐家」的可能性。我试图回想我弟弟是否比我练习得更刻苦。记忆有些模糊,但我认为在他作为神童的事业腾飞之前,他的练习时间并没有比我多太多。他似乎每次练习都能轻松自如地奏出优美动听的乐曲,令在场所有人为之惊叹。这种成就感想必非常美妙,并且激励他投入更多的时间练习。随着技艺日益精进,动人的乐章流淌得愈加自如,赞美之词也越发溢于言表,直到最终他选择全身心投入音乐事业,达到了令人仰慕的高度。反观我自己,每次练习总会发出像受伤小猫一样的声音,得到的评价也总是谨小慎微,诸如「干得不错,Scott,那只小猫听起来好像没有上次那么痛苦了。」这让我感到灰心丧气,渐渐不愿练习,演奏水平也每况愈下,最终只能黯然放弃。
然而,我认识一些渴望成为出色作家的人,他们信心满满地要求自己每天写 200 词。但仅仅一周之后,他们就因为感到索然无味而选择放弃。这些人对我无比崇拜,这也不足为奇。毕竟在过去的十年间,我几乎每天都在写上几百上千字。
但正如我先前所说,写作于我而言完全不需要任何毅力。更准确地说,即便我想要停下,我也已经无法自拔了。这可能部分源于,每当我提笔写作,我都能准确无误地表达自己的思想,并为此感到由衷的欣慰。许多人阅读我的文章,他们留下评论,他们称赞我,我倍感欣喜,热情高涨,继而笔耕不辍。这与我弟弟弹奏钢琴时的良性循环如出一辙。
因此,我认为如果轻率地下定论说:「天赋完全不存在。你弟弟勤练钢琴,却鲜少写作;而你笔耕不辍,在练琴上却退缩了。这不正是你们应得的结果吗?」未免有失偏颇。
我曾竭尽全力地尝试像他一样刻苦练习钢琴,真的倾尽心血。然而每时每刻都如负重前行,艰难而痛苦。我勉力坚持了一段时日,但当假期来临,难得有机会远离钢琴时,我暗自庆幸有一个现成的理由可以喘口气。反观我弟弟,他却会想方设法寻觅钢琴继续练习。与此同时,即使在医院走廊里响应精神科紧急情况的间隙,我也在抓紧时间写下这篇文章。或许有人会对此大为惊叹,感慨道:「明明有充分的理由偷得浮生半日闲,你却依然笔耕不辍!」
我不知道如何定义「努力」。但我并不觉得自己在擅长的事情上付出了极大的努力,或者需要不情愿地强迫自己去做。也许在旁人看来我确实很努力,只是我没意识到罢了,但这并非有意忽略,我内心确实没有这种感受。
拉马努金在数学上非常用功,但他大概并不认为那是一种苦差事。他获得了大学奖学金,却很快退学,因为他无法专注于数学以外的学科。后来他又被另一所大学录取,但因为学不好学校要求的非数学科目,生理学课也没通过,最终再次辍学。接着他几乎饿死,因为身无分文,连奖学金也没了。在我看来,他似乎不是刻意去勤奋的人。如果他能学好其他科目,他一定会去学,哪怕只是为了能继续在大学学习数学。某种程度上,拉马努金好像天生就无法在数学以外的事情上费心思。
我真心想学好数学,但以失败告终,不过我以优异的成绩从医学院毕业了。拉马努金发自内心地想学好生理学,虽然失败了,但他成为了一位伟大的数学家。那么,究竟谁更努力呢?
从前,人们总是向我请教写作的秘诀。我总是非常认真地回答:「把脑海中浮现的想法一字不差地写下来就可以了。」后来我发现,这个方法并不适用于所有人,可能对我自己也未必有效,只是感觉似乎管用罢了。
但是,你听说过拉马努金的故事吗?这位著名数学家在被问到如何将一个非常复杂的问题巧妙地转化为连分数时,他是这样描述自己思路的:「其实很简单,我一听到这个问题,马上就意识到答案是一个连分数。我扪心自问:『会是哪一个连分数呢?』接着,答案就在脑海中浮现出来了。」
当然,这也许只是拉马努金自己的感受。事实的真相很可能是:为了钻研数学,他曾两度休学,直至通过刻苦学习,练就一种敏锐的数学直觉,才能够信手拈来,迎刃而解。
(还有一种说法是,在梦中,朦胧的印度教神祇化作血滴来到他的面前,传授给他各种数学公式。拉马努金确实是一个与众不同的奇人。)
然而,我仍然觉得,解决我在数学和钢琴方面不擅长的问题,并非只是「硬着头皮去克服内心的抗拒,强迫自己坚持下去」那么简单。读过拉马努金等著名数学家的传记,我从未感受到他们在数学上经历过如此挣扎。与弟弟交谈时,也不曾听他说练琴如此煎熬。如果我的写作水平够格让我就擅长的事情发表见解,那么回想起来,在写作上我似乎也从未经历过那般痛苦的过程。
所以,这也是我与自己的一份约定:我会尽全力把事情做好,但如果遇到真心讨厌、每一步都举步维艰的事情,那么表现平平也无可厚非。我不会因为没有强迫自己一边叫苦连天一边练琴而自责。相应地,我也不会因为下了苦功夫练习写作就洋洋得意。无论如何,个中或许总有「一些运气的成分」。
四、天赋与自我和解
我之前说过,这个问题不仅涉及穷人,更关乎出于一己私利而忧心忡忡的我自己。我可能给人一种错误的印象——我只是需要给自己找个借口,解释为什么在数学考试中拿不到 A,或是弹不好钢琴而已。但实际上,问题比那严重得多。
理性主义社区往往吸引着大批严于律己的人士,他们常常会因为没能做到超出自身能力的事情而备受折磨。这就是为什么我提倡将收入的10% 捐献给慈善事业,这并非是一个让人望而却步、需要承受内疚之苦才能达成的崇高目标,而是一种缓冲,让人们知道「捐出10%也很好,无需太过苛求自己」。这也是为什么大家如此强调「英雄式的责任感」,认为人人都有义务亲力亲为地去解决世界上的所有问题。一旦有人指责我们目中无人,我就感到异常气愤,因为这就像嘲笑一位厌食症患者太胖,显然是极不合适的。
我们如此苛待自己,其实并没有任何好处。比如 Nick Bostrom 就写道:
寻求治愈衰老的方法绝非只是一件我们应该择日去完成的美好事情,而是一项刻不容缓的道德要务。研究工作开展得越早,我们就能越早取得成果。能否提前一年找到治疗方法至关重要:因为即使是一年的差距,也意味着超过加拿大总人口数量的生命损失。
如果这段话令你感到不安,那你绝对不应该去读《天文数字般的浪费》一文。
然而,此时此刻我并没有投身于抗衰老研究,这是为什么呢?
我曾数次尝试做生物学研究,但过程异常艰难,令我备受折磨。在科学课上,当老师说「把白色药剂倒入灰色药剂中,它会变绿并冒泡」时,总有倒霉蛋倒来倒去,也只能得到一团死气沉沉的灰白混合物——而那个人,正是我。我讨厌实验,既无灵巧的双手,也缺缜密的头脑。好不容易完成必修实验课,我发誓此生再不碰这些玩意儿。即便是枯燥的数据分析,查阅长寿老人的基因、配体与受体数据,也恰巧需要我所不具备的数学能力。
如果这是天赋使然——有些人天生适合生物学研究,而我不是他们——那我可以问心无愧地去做自己擅长的工作。
但如果世上并无天赋,成功唯凭努力和毅力,那我就因懈怠成了残害他人性命的罪人——那些本可因我的努力而获救的生命,怕是比加拿大的人口还要多。
若世上无天赋之分,我没有任何借口不成为 Aubrey de Grey 那样的人。如果这个名字你不熟,换成 Norman Borlaug 如何?即便他俩你都没听说过,Elon Musk 总该知道吧。我没有任何理由不努力成为他们那样的人。
我曾听一位朋友在首次尝试莫达非尼时不禁感慨,服药后的体验或许就是埃隆·马斯克的日常状态。这一念头突然使我茅塞顿开,仿佛直观地理解了马斯克的「内在感受」。这也为我探讨生物差异提供了绝佳的切入点。大多数人认为,使用兴奋剂可带来常人难以企及的表现,而药物本身并无神奇之处,只是改变了大脑的多巴胺、组胺、去甲肾上腺素等物质水平。同时,大家普遍认同这些化学物质天然存在显著个体差异。因此,「服药后的我就是他清醒时的常态」似乎成为破解相关哲学难题的良方。
......我的讨论似乎跑题万里。我想表达的是,讨论天赋差异涉及的问题远不止因高中微积分考试没有拿 A 而感到挫败,或因音乐才华不及胞兄而自怨自艾。更重要的是,我是否因不如马斯克而深感失败。具体而言,我能否坦然接受「我并不适合成为马斯克」,转而去做更契合自身的事情,而无需担心辜负所有加拿大人的期望。
五、智力与自我价值
常言道:「除了两个例外,人人都有比自己日子更好或更差的人。」当我们承认我们都在「不是埃隆·马斯克」的船上(除了一个例外),许多关于先天才能的攀比之争似乎也就变得无关紧要了。
偶尔会有特别友善的读者在评论区盛赞我的聪明才智,言语间流露出自惭形秽之意,表示希望自己也能达到我这样的水平。但实际上,我时常因与 Scott Aaronson 相比而感到智力上的相形见绌。而 Scott Aaronson 曾直言自己常常『仰望』陶哲轩的才华,理解起他的工作来也常感到力不从心。至于那位陶哲轩,我不确定他是否笃信宗教,但也许他也会对上帝的智慧肃然起敬。就连上帝本尊,面对约翰·冯·诺依曼的超群才智,恐怕也难免要自叹弗如。
由此可见,我实在没必要因为不如弟弟的音乐天赋而灰心丧气。即便我的音乐造诣能与弟弟比肩,也难免会因为自己不是莫扎特而感到相形见绌吧。
如果有人问「如果你再努力一点儿,情况会不会有所不同?」这种想法或许可以掩盖一些小的差距,但无法改变大的差距。如果我只是为了维护自尊,我可以假设如果当初情况稍有不同,我可能会练琴更刻苦,最终达到和弟弟一样的水平。但很难想象我做出不同选择后就能变成莫扎特那样的天才。在几十亿人中,只有极少数人能达到莫扎特的造诣,凭什么偏偏是我呢?
如果我纯粹是因为热爱音乐本身而希望成为出色的音乐家,用音乐表达内心的感受,那么他人的看法都无关紧要。但如果我是因为别人比我更擅长音乐而不甘心,一味追求提高音乐水平,那就永远没有尽头了。
我对那些在博客评论区里抱怨自己不如其他评论者聪明的人也有同感。
根据你们之前参加的调查,我恰好掌握了所有人的智商分数。事实上,这里没有一个人的智商在平均水平以下。评论区智商最低的 1% ,相当于普通人群中的 85% 。所以,即使在这里处于相对弱势,放眼整个群体,大家的智力水平依然十分出众。
此时,我们又重新踏上了一条看不到尽头的道路。我敢肯定,无论我们把你的智商提高多少,你还是会觉得自己一文不值。如果我们把它提高 20 点,你会试着去读《自民主制以来的量子计算》,但还是会觉得自己一无是处。如果我们把它提高 40 点,你可能会访问陶哲轩的博客,但在那里你依然会有自卑感。即使你真的成为世界上智商最高的人,可能才会对自己感到满意。但是,任何一个只允许一个人自我感觉良好的评判体系都是有问题的。
有人说我们不应该讨论能力差异,免得让那些不够聪明的人感到沮丧。但我认为,无论是聪明人还是笨人,每个人都有充分的空间感到沮丧,回避这个话题无济于事。真正有帮助的,是从根本上剥离智商和自我价值之间的联系。
我的病人大多有认知障碍。他们不仅出身于底特律的贫民窟,还患有躁郁症和精神分裂症,这些疾病会以一种尚未完全了解的神经机制进一步降低他们的智商。
标准的精神科评估中包括对认知能力的测试,我常用的是一个包含三个问题的快速测验:一是「100 减去 7 等于多少」,二是「苹果和橘子有什么共同点」,三是「记住这三个词一分钟,然后重复给我:房子、蓝色、郁金香」。
有很多人——我指的不是那些精神错乱到连自己名字都不知道的人,而是像你我一样的正常人——可能都无法回答上述问题。我们知道他们为何无法回答,这其实有相当明确的生物学原因。
如果有人因智商不够高而自觉愚笨、一无是处,我们却安慰他说:「别担心,你很有价值,只要足够努力,就一定能成为伟大的科学家」,那我们就是在变相贬低所有那些无论如何努力都注定无法成为杰出科学家的人。谈论「再努力一点」或许能掩盖一些细微差异,但当我们谈到那个无家可归的精神分裂症患者,连「100 减 7」都无法回答以求生存的时候,你不能轻描淡写地假装问题不存在,然后说「我相信他只要保持积极乐观,就能成为下一个拉马努金」!要么你谴责他一钱不值,要么就请不要再把个人价值简单地与先天智力画等号了。
这与我在那篇关于负担的帖子中表达的观点非常接近。当我遇到一位有自杀倾向、认为自己是社会负担的患者时,如果能列举他们最近为社会做的十件重要事情,证明他们的想法是错误的,那自然是再好不过。但有时候事情没那么简单,你唯一能说的只有「去他妈的」。没错,社会已经演变成了一种模式,将那些在自然状态下也能靠采摘浆果和打猎快乐生活的人排斥在外,使他们陷入贫穷。这不是你的错,如果社会要给你补偿,你就拿着。我们最好现在就把这个问题说清楚,省得将来,当一切都实现自动化,由机器人来运行,我们所有人都跟不上时代的时候,还需要去争辩我们继续存在的合理性。
同样的道理也适用于智力水平。如果一个人因为不可能成为伟大的科学家而感到沮丧,能指出他们的种种智力优势,鼓励他们「只要下定决心,就一定能做到」,那固然很好。但事实往往并非如此。这时你必须斩钉截铁地说「去他妈的」,告诉他们不要把自我价值建立在能否成为杰出科学家的基础上。我们最好现在就把这个问题解决,免得未来超人类主义者真的创造出了超级智能,到时候我们所有人都必须接受自己在智力上的相对劣势。
六、比较优势与个人价值
然而我认为,情况也不一定就那么糟糕,甚至可能比上面说的要乐观许多。
Ozy 曾经告诉我,比较优势定律是他们读过的最鼓舞人心的理论之一。这个观点如此不同寻常,以至于我忍不住要求她解释一下其中的缘由。
Ozy 说,这个定律证明了每个人都能够做出贡献。即使你在所有方面都比不上其他人,你仍然可以通过参与全球贸易获得其他人支付的报酬。这笔钱可能不多,但总归会有一些,它衡量了你的行为如何使他人受益,以及他们有多感激你的存在。
(诚然,现实生活中这个定律的运作效果并非完美,但当我们拥有一个理论时,谁还会在意现实生活呢?)
经过深入思考,我也被这个定律所启发。
我永远不可能成为一名杰出的数学家或像埃隆·马斯克那样的企业家。但如果我在自己的比较优势领域——当下是医学——努力耕耘,我仍然可以获得收入。而且倘若我愿意,我可以把赚到的钱捐赠给数学研究、抗衰老研究,或者埃隆·马斯克捐款支持的事业。他们会用这些资金雇佣那些拥有我所欠缺的重要天赋的聪明人,而我至少要为这些人的成功承担部分责任。
如果我的智商只有 70,我想我仍然会追求自己的比较优势——即便那是挖沟渠,或者从事其他工作,我也会把挣到的钱捐给重要的事业。这笔钱或许不多,但总归会有一些贡献。
我们现代的「天赋」(talent)一词源自希腊语单词 talenton,指一定数量的贵金属,有时被用作货币单位。这个词的词源要追溯到耶稣的一则比喻。一位主人召来三个仆人,分别给了他们五个、两个和一个 talenton。前两个仆人投资了这笔钱,并获得了双倍的回报。第三个仆人却把钱埋在地里。后来主人回来了,他赞扬了前两个仆人,却将第三个仆人打入地狱(比喻?比喻了啥?)。
对这个故事有各种各样的解读,但最广为接受的说法是,上帝赋予我们每个人数量不等的资源,他会根据我们如何运用这些资源,而非根据他给予我们的数量多寡来评判我们。如果主人给第一个仆人五担银子,给第二个仆人两担银子,然后就因为第二个仆人的银子比第一个少而责备他,这是很不明智的。同样,如果两个仆人都明智地投资了他们的银子,主人却因为第二个仆人的收益比第一个少而指责他,也是不合理的,因为他一开始的本金就比较少。这个故事的寓意似乎是,如果你善用上帝所赐予你的才能,并明智地运用,就无可厚非。
现代英语中的「天赋」一词就源自这个比喻。它意味着「上帝赋予你的恩赐,你可以用来投资并回报」。
所以,如果我是一个挖沟的工人,我会努力挖沟,捐出我微薄收入的一部分,并相信我已经竭尽全力地运用了我所得到的天赋。
七、活出自己就好
犹太教也谈到上帝会如何依据你的天赋来评判你。拉比祖西亚曾说,临终之际他并不忧虑上帝会质问他「你为何不是摩西?」或「你为何不是所罗门?」但他的确担心上帝可能会问「你为何没能成为真正的祖西亚拉比?」
这也是我笃信天赋差异的重要原因之一。如果一切皆归于刻苦努力和积极态度,那么上帝大可质问我「你为何不是斯里尼瓦瑟·拉马努金?」或「你为何不是埃隆·马斯克?」
而若承认每个人生而不同,拥有独特的大脑、天赋和能力,上帝只能问我是否活出了 Scott Alexander 的人生。
这似乎是一个令人满意的低门槛。
愤怒的弓形虫
作者:Scott Alexander 发表于:2014年12月17日
I.
一条我最近才听说的旧闻:PETA(动物伦理对待组织)提出愿意为底特律贫困家庭支付水费,但条件是这些家庭必须同意不再食用肉类。
不出所料,这一举动引发了强烈抗议。《国际商业时报》用了一个似乎是双关语的表述,称他们"淹没在抗议的浪潮中"。Groundswell组织认为这是一个"重大失策"。Daily Banter网站直言这"正是为何所有人都厌恶PETA的原因"。而Jezebel则毫不客气地称他们为"混蛋"。
当然,这对PETA来说只是一贯作风。他们之前就曾发起过诸多类似活动,如向穿皮草的时装模特泼红漆、将动物图片与大屠杀受害者并排展示、将动物图片与非裔美国奴隶并排展示,以及制作几近色情的裸体广告。
人们称这些行为为"失策",但不妨考虑另一种可能性。Vegan Outreach是一个极其负责任的慈善组织,在与PETA相同的领域开展着卓越且无可指责的工作。然而没有人听说过他们。而每个人都知道PETA的存在,恰恰是因为那些关于"这次宣传噱头是否越界了?"的无休止争论。
尽管并非所有人都是素食主义者,但大多数了解工厂化养殖内幕的人都会对此感到不安。对PETA(动物道德对待组织)而言,几乎没有空间将人们从支持工厂化养殖转变为反对立场,因为根本就找不到任何激进的草根支持工厂化养殖的活动人士。他们的问题不是缺乏共识,而是缺乏关注度。
PETA制造了关注度,但这是有代价的。人人都在谈论PETA,这某种程度上等同于人人都在讨论动物的道德待遇,从某方面看是一种胜利。但大多数言论都是「我讨厌他们,他们让我非常愤怒」。有些人甚至宣称「我要多吃动物,就是为了激怒PETA」。
因此这里存在一个权衡取舍,一边是「纯素外展组织」,另一边是PETA。
「纯素外展组织」能让所有人原则上都同意工厂化养殖是不好的,但没有人会真正关注这个问题。
而PETA能让所有人都关注工厂化养殖,但许多原本会反对它的人反而会转而支持它,仅仅因为他们对宣传方式感到愤怒。
但至少他们引起了关注!
PETA自毁前程不是因为愚蠢。他们自毁前程是因为他们顺应了一种激励机制,这种机制会奖励他们这样做,即使这会摧毁他们的可信度。
II.
《滚石》杂志报道的弗吉尼亚大学强奸案已经分崩离析。这样一来,它加入了一长串已经崩塌的高度公开化的强奸案例行列。研究有时宣称只有2%到8%的强奸指控是虚假的。然而,在媒体中引发超级传播效应的指控,其虚假率必定高出这个数字一个数量级。正如那句老话所说,一次是偶然,两次是巧合,三次就是敌意行动。
这个谜题因一个现象而变得更加复杂:通常是女权主义活动家在推动这些故事广泛传播中扮演着最关键的角色。这并非是一些支持强奸行为的记者刻意选择最可疑的指控来破坏公众信任的阴谋。恰恰相反,是人们有意识地选择这些事件作为他们运动的标志性案例,用来宣传"强奸受害者应当被相信和信任"的理念。那么,为什么那些被广泛宣传的案例比那些几乎总是真实的普通案例更可能是虚假的呢?
有些人指出,虚假指控者有更大的自由来编造尽可能离奇和引人注目的故事。但我想重点关注两个较少被提及的问题。
《后果主义常见问题解答》是这样解释道德决策中的信号传递的:
当谈到信号传递,物品越昂贵且无实用价值,作为信号就越有效。虽然眼镜价格不菲,但它们作为财富象征却相当乏力,因为它们实用性太强;一个人可能购买眼镜不是为了炫富,而是因为真正需要视力矫正。相反,一颗巨大的钻石则是极佳的财富象征;没有人真正需要大钻石,所以任何购买它的人显然是有钱可挥霍的。
某些道德困境的回应也能传递类似信号。例如,一位反对使用避孕套的天主教徒向他人(甚至向自己!)展示了他作为教徒的忠诚与虔诚,从而在社交圈中赢得信誉。与钻石的例子类似,这种信号传递若围绕某些原本无用的事物,效果会更佳。如果这位天主教徒仅仅选择不杀人,尽管这符合天主教教义,却是个糟糕的信号,因为他完全可能出于非宗教的其他合理原因而不杀人——就像有人购买眼镜可能与炫富无关。正是因为反对避孕套这一决定如此不合常理,才使其成为如此有效的信号。
在更广泛的情况下,人们会利用道德决策来彰显自身的道德水准。他们基于某种道德原则做出灾难性的选择——他们支持的痛苦和破坏越多,所依据的原则越晦涩难懂,就越能彰显他们对道德原则的绝对忠诚。例如,伊曼纽尔·康德声称,如果一个持斧杀人犯询问你最好朋友的下落,而他明显意图找到并谋杀你的朋友,你也应该告诉他全部真相,因为说谎本身是错误的。这确实有力地展示了你的道德水准——此后没人会质疑你对诚实的承诺——但对你的朋友而言,这结果显然糟糕透顶。
同样地,公开宣称你多么强烈地相信一个明显真实的指控,这样做并不能传递任何信息。即使是坚定的反女权主义者也会相信一个被视频记录下来的强奸案。如果一个道德行为既能被内群体成员做到,也能被外群体成员做到,那它就是糟糕的信号传递和低劣的身份政治。如果你想表明自己多么重视受害者,你会选择在最不可信的案例背景下表达这一立场。
但除此之外,还存在「PETA原则」:一件事越具争议性,就越会被人们讨论。
一个显然发生过的强奸案?把它摆在人们面前,他们会承认这是一种暴行,就如同他们会承认工厂化养殖是一种暴行。但他们不会过多谈论它。每天都有数不清的暴行发生,你需要比这更有力的东西才能让人们走出麻木状态。
而另一方面,对可疑强奸指控的争议恰恰就是——一场争议。人们开始互相指责对方是厌女主义者或厌男主义者或其他什么标签,Facebook信息流被数百条全大写字母的评论填满,内容都是关于「我的群体如何被你的群体迫害」。每一步,都有越来越多的人被触发并感到愤怒。一些被触发的人通过转发文章来进行紧急的自我防御,这些文章宣称触发他们的群体有多么可怕,这又进一步触发了更多人,形成雪球效应,每一次循环都使问题在更广范围内扩散。
[来源]
只有具有争议性的事件才会被广泛传播。强奸指控只有在足够模糊不清,能够按照身份政治线路将人们一分为二时,才会引起广泛关注。而明显属实的强奸指控,只有当回应方式足够具有争议性,能够在身份政治立场上将人群对立分割时,才会受到广泛传播——这就是为何如此多的报道聚焦于「所有被指控的强奸犯应该被视为有罪,直到证明无辜」这一极具争议的主张。
人人都憎恶强奸,就像人人都反对工厂化养殖一样。「强奸文化」并非指大多数人支持强奸,而是指大多数人对此视而不见。这使女权主义者陷入了与动物权利组织PETA相同的两难境地。
首先,他们可以以克制而负责任的方式回应强奸事件,这种情况下,尽管所有人都会表示反对,但没有人会对此进行深入讨论。
其次,他们可以以极端而富有争议的方式回应强奸,这样虽然能引起广泛讨论,但也会自动催生出一批憎恨女权主义者的反对派,这些人会执着地试图证明尽可能多的强奸指控是虚假的。
我还未见过有人举着纸板标语,宣称要强奸他人只为激怒女权主义者,但这恐怕只是时间问题。与PETA一样,这种激励机制注定使他们一次又一次地搬起石头砸自己的脚。
III.
《Slate》杂志最近发表了一篇文章,探讨白人对弗格森迈克尔·布朗枪击案与纽约市埃里克·加纳窒息案的截然不同反应。而这种对比确实相当鲜明。
皮尤民调发现,在对弗格森案表达意见的白人中,73%站在警察一边。而在对埃里克·加纳案表达意见的白人中,63%支持黑人受害者。
媒体舆论也遵循着大致相同的模式。极端保守派比尔·奥莱利表示,他对"自由派媒体"和"种族煽动者"如何"扭曲"弗格森事件的真相,为"私刑式正义"服务并"侮辱美国警察群体——那些冒着生命危险保护我们的男男女女"感到"极度愤怒"。但在谈到加纳案时,奥莱利却表示他"非常困扰",认为"警方确实反应过度,这本应在法庭上得到裁决。"他在福克斯新闻频道的嘉宾、保守派评论员兼弗格森事件批评者查尔斯·克劳萨默补充道:"从视频看来,大陪审团的[不起诉]决定完全令人无法理解。"《周六夜现场》制作了一个小品,描绘艾尔·夏普顿谈论加纳案时变得越来越激动,因为"这是我一生中第一次,每个人都同意我的观点。"
这一切发生在美国大部分民众围绕弗格森事件几乎全天候相互攻讦的约三个月后。我们每天都被迫接收诸如弗格森抗议者谈白人:「你们都是魔鬼」、黑人在布朗枪击事件前本有能力解决弗格森问题——但他们失败了或美国绝大多数白人完全无知这样的文章,以及大量人士连续数月互相传递充满愤怒的种族主义评论和反驳言论。对种族关系造成的损害难以估量——据CBS报道,种族关系评价下降了十个百分点,跌至二十年来的最低水平,现在超过半数黑人将种族关系描述为「糟糕」。
而人们声称这一切都是值得的,因为它提高了对警察暴力对待黑人问题的认识,如果这让某些人感到不安,那么,这只能怪他们自己了。
然而,埃里克·加纳案同样能够提高对警察暴力对待黑人问题的认识,而且几乎所有人都会在这个问题上达成一致。越来越明显的是,只要有充分无可争议的证据表明警察对黑人施暴,全世界几乎所有人都会同样强烈地予以谴责。
这并不仅仅是因为埃里克·加纳案出现得太晚,以至于我们只能将就使用迈克·布朗案。事实上,加纳被掐死的时间比布朗被枪杀早了一个月,但这个故事当时被忽视了,后来才被重新挖掘出来,作为不断扩大的弗格森叙事的一个关联事件。
更为严峻的是,根据官方统计,无武装黑人大约每两周就会被警察或其他执法人员杀害一次约每两周一次,而实际频率可能远高于此。难道你是在说,在这些每年数百起的枪击事件中,竟然找不到一起比迈克尔·布朗案更适合作为标志性案例的吗?在这庞大的遇害者群体中,你找不到哪怕一位没有刚刚抢劫便利店的受害者?找不到一个没有十位目击证人和法医证据一致指向他是挑起事端者的案例?
我认为迈克尔·布朗案之所以能病毒式传播——而非埃里克·加纳案或其他数百起类似案件——是因为符合「PETA原则」。它极具争议性。一部分人认为这是不可容忍的暴行;另一部分人则坚称布朗完全是挑起事端的人,涉案警官反而是自由媒体的受害者,这些媒体急于将他的绝望自卫行为扭曲为种族歧视,因此那些谴责这是暴行的人本身才构成了真正的暴行。每个人都获得了绝佳机会来彰显对自己政治阵营的忠诚,并讨论对立阵营如何是可恶的种族主义者或邪恶的种族煽动分子。Facebook上源源不断地出现可能引发争议的文章供人分享,这些文章能激怒你的朋友和对手,促使他们反过来分享可能激怒你的文章。
弗格森抗议者表示,他们提出了一项具体的政策建议——要求警察佩戴随身摄像头。在弗格森事件成为热点之前,关于公众对警察随身摄像头看法的民调虽然零星,但现有结果却出奇地一致。今年2月,一项英国民调显示,该国90%的民众希望警察配备随身摄像头。美国的民调多以"新闻网站上粗糙的在线投票"形式呈现(1、2、3),但过去几年的支持率都在80%左右。我还发现《警察杂志》的一项调查显示,受访的警察中有相对多数也希望佩戴随身摄像头,可能是因为有证据表明这能减少针对他们的不实指控。甚至在弗格森事件发生前,你几乎找不到任何人——无论是否身着制服——认为警察佩戴摄像头是个坏主意。
而如今,在一切尘埃落定之后,仍有九成民众表示支持——考虑到调查方法的差异,这额外的十个百分点可能代表也可能不代表真实增长。白人与黑人之间的观点差异微不足道,仅仅是舍入误差的程度。民主党人和共和党人之间的差异也几乎可以忽略不计——仍有79%的共和党人表示支持。即使是那些坚信警官达伦·威尔逊完全清白、认为大陪审团不起诉他的决定正确的人,那些私下抱怨"种族煽动者"和"暴徒"的人群——这些人中也有八成希望他们的警察佩戴摄像头。
如果说弗格森抗议活动没有显著改变公众对警察随身摄像头的看法,那它确实改变了人们对其他一些事情的认知。我之前曾提到,初步民调显示,了解弗格森事件反而增强了白人对警察在种族问题上公正执法的信心。现在更为全面的民调结果出炉了,它们表明这种效应比我预想的还要明显。
[来源]
白人对警察在种族问题上保持公正的信心从这一事件广泛报道前的35%上升到如今的52%。就连警方精心策划的公关活动恐怕都难以取得如此成效吧?我对此深表怀疑。
这可能是由问题措辞导致的偏差——毕竟,调查询问的是人们对当地警察部门的看法,或许在见识了弗格森事件后,人们反而觉得自己当地的警察相比之下表现良好。但这又如何解释黑人群体呈现出的完全相反趋势呢?
我认为事实就是表面所见的样子。正如PETA那些极端争议性的素食主义宣传活动反而促使人们出于反抗而食用更多肉类一样,这场针对警察暴力和种族主义的争议性运动反而使白人更加支持当地警察部门,仅仅是为了对抗那些宣称所有白人都是种族主义者的言论。
我们再次看到了这种两难抉择。
如果反对警察暴力和种族主义的活动人士极为审慎,只坚持讨论像Eric Garner这样已有定论的案例,可能大家都会认同他们的观点,但同时也没人会真正关注这一议题。
而如果他们转而提出像Michael Brown这样极具争议性的案例,尽管能引发广泛讨论,却也会激发出强大的反对力量,导致人们出于抵触心理而更加支持警察。这完全是自己打自己脚的行为。
IV.
这是一张展示我博客文章常用标签的图表,显示了各个标签下每篇文章的平均点击量。尽管这张图表已经有些过时,但我不想费力去制作一个新的,而且这些趋势至今基本保持不变。
我很少在博客中讨论慈善话题,但这无疑是我在这里能写的最有意义的内容。即使只能说服多几个人向慈善机构捐款,或者将他们现有的捐款转向更有效的项目,哪怕以一个私人博客的有限影响力,也能切实挽救几十甚至上百条生命。这可能比我所有其他类别的文章对世界的贡献总和还要大。然而,这类内容却完全没有争议——人人都认同这是件好事——同时它也是浏览量最低的文章类型。
与之形成鲜明对比的是浏览量最高的三类文章:政治类不言自明;种族与性别话题则是比常规政治更具争议性、更容易引发愤怒的政治类型;而图表最右边的「后悔」标签是我为「我将后悔写下的内容」设置的,用于那些我明知会引发巨大争论并可能给我带来诸多麻烦的文章。这些文章通常也与种族和性别有关,但更深入探讨那些真正极具争议性的种族和性别相关问题。
在我的博客中,一篇文章越没有实用价值,越具争议性,就越可能为我带来大量的页面访问量。
对于那些认同我观点的人来说,我对身份政治的愤怒抨击实际上是一种自我防卫机制,仿佛在说:"你没问题,你所属的群体一直以来都是正确的。"分享这类内容既能提升他们作为圈内人的社会地位,又能作为对圈外人的潜在打击,因为后者现在面对着强有力的论据告诉他们自己是错的。而那些不认同我观点的人有时会在自己的博客上发表愤怒的反驳,这些反驳会链接到我的原文并进一步扩大其传播范围。或者他们会与持不同意见的朋友讨论,他们的朋友会感到愤怒并想要指出我的错误,于是就会来阅读我的文章以寻找更多反驳的素材。我有一个功能可以显示谁链接了我的文章,所以我能实时看到这一切的发生。
我从博客广告中获得的收入并不足以让我在意。但如果我依靠它们为生,你认为我会写更多哪种文章?那些只能吸引2,000名付费读者的慈善相关文章?还是那些能让所有人像一群疯狗般相互对立、为我带来16,000名读者的文章?
虽然我没有一张精美的条形图来说明这点,但我敢打赌,这种相同的"有趣性层级"同样适用于塑造整个社会的重要信息流和媒体渠道。活动家们的利益实际上在于通过关注最具争议的案例和原则来破坏他们自己的事业,这些争议混淆了问题的本质,使人们出于反感而反对他们。而媒体的利益则在于助长并鼓励这种行为。
V.
现在,让我们完全转换话题。
在"meme"(模因)成为doge和"all your base"这类网络文化现象之前,它其实是一次半严肃的尝试,试图将文化演化建立在寄生虫学的基础上。这一理念旨在用"观念如同寄生虫,以有利于自身传播的方式进化"的模型,来取代"人类选择自己喜欢的观念"的模型。这个概念从未真正流行起来,因为大多数人的反应是:"嗯,有意思。然后呢?"
不过,让我们来谈谈弓形虫。
弓形虫是一种精巧的小寄生虫,与多种人类疾病有关联,包括精神分裂症。它的生命周期是这样的:首先寄生在猫体内,随后通过猫的粪便排出体外。这些粪便和弓形虫污染水源,再被其他动物(通常是老鼠)摄入。弓形虫随即转变为适合老鼠体内生存的形态并开始繁殖。当数量足够多时,它会劫持老鼠的大脑,诱使老鼠在猫容易捕猎的区域明目张胆地活动。猫捕食老鼠后,弓形虫又变回适合猫体内生存的形态并继续繁殖。最终,它再次随猫的粪便排出,从而完成整个生命周期。
这就是生命的轮回!
如果一个模因(可复制的文化单位)拥有像弓形虫这般复杂的生命周期,这意味着什么?
以反恐战争为例。有人认为,每当美国轰炸巴基斯坦、阿富汗或其他地区时,我们实际上只是在激化当地年轻人的极端思想,培育更多恐怖分子。这些恐怖分子随后袭击美国人,引发美国民众的愤怒,进而促使他们呼吁对巴基斯坦和阿富汗发动更多轰炸。
从模因的角度看,这就像一种拥有两个宿主和两种形态的寄生虫。在阿富汗宿主中,它表现为「圣战」,驱使宿主牺牲自己以将其传播给美国这个第二宿主。在美国宿主中,它变形为「反恐战争」,驱使美国人献出他们自己的生命(和税款)通过轰炸的方式将其传回阿富汗宿主。
从人类的视角看,圣战和反恐战争是相互对立的力量。然而从模因的角度看,它们如同毛毛虫与蝴蝶般相辅相成。我们不做价值判断,只是观察到我们无意中创造了一个复制子,而复制子会不断自我复制,直到某种力量使其停止。
模因(复制子)也会进化。当某个阿富汗人想出特别有效的恐怖主义策略时,由此引发的公众愤怒会助长反恐战争,从而使这一模因传播给更多美国人。随着美国轰炸行动的升级,那些在袭击中被激进化的阿富汗村民会记住哈立德(Khalid)构思的那个特别有效的新策略,转而采用那一个,而非那些几乎杀不死任何美国人的陈旧无效战术。某位提出特别激动人心的复仇号召的美国电视评论员,会发现她的言论被纳入政党纲领,并被亲战派报纸反复引用。当双方和平主义者都在努力缓解紧张局势时,这些模因却在进行着相反的努力——试图变得尽可能具有毒性,甚至发展到有人建议在美国炸弹中添加猪油的地步,只为了让穆斯林更加愤怒。
让我们来谈谈Tumblr。
Tumblr的界面不允许你直接评论他人的帖子。相反,它允许你转发他人的内容并添加自己的评论。所以,如果你想告诉某人他们是个白痴,你唯一的选择就是将他们的整篇帖子转发给你所有的关注者,并在下面附上「你是个白痴」的评论。
设计这个系统的人要么完全不理解模因学,要么就是太过理解模因学了。
事情通常是这样发展的——有人发表了一条在Tumblr标准下具有争议性的言论,例如「不惜一切代价保护《神秘博士》粉丝免受猫咪图片分享者的骚扰」。某个猫咪图片分享者看到这句话后勃然大怒,并转发给自己的关注者,同时附上一连串针对《神秘博士》粉丝的激烈抨击。由于猫咪图片分享者们在社交网络中倾向于扎堆,很快所有猫咪图片分享者都看到了这个针对他们群体的侮辱——由于他们都觉得有必要添加自己的愤怒评论,不久他们便从十个不同方向看到了这条信息。这些愤怒的抨击又传回了《神秘博士》粉丝那里,现在他们感到深受冒犯,于是他们又在自己的圈子里转发,并附上更多对猫咪图片分享者的谴责。这些猫咪图片分享者不仅做了最初引起敌意的事情,而且因为他们充满仇恨的言论公开展示在帖子上,所有人都能看到,因此激起了更多的敌意。结果,你的信息流中约一半是你真正想看的内容,另一半则是如下图所示的互相辱骂的高塔:
实际上,我一开始提到的PETA故事几乎就是这种情况
看到这种情况,你只能叹口气,然后滚动屏幕看下一条内容。当然,如果你恰好是《神秘博士》粉丝,你会先叹口气,然后立即转发并评论:「明明是你们先联合起来攻击我们的,现在别想反过来指责我们」——因为你不能就这样让那个指控不受反驳。
我偶尔会嘲笑Tumblr上的社会正义运动,但问题并非出在Tumblr的社会正义本身,而是其结构性缺陷。Tumblr上的每个社区似乎都不可避免地与那些最热衷于让该社区成员痛苦的人纠缠在一起。那个小小的Tumblr理性主义社区不知何故吸引、聚集并持续转发来自更微小群体的内容,这些人憎恨理性主义者并希望他们痛苦(请注意,我并非指那些善意且有智慧的批评者)。这就像热带雨林的生态系统,每种稀有濒危的夜行蜘蛛都有一种专门为了寄生它而进化了数百万年的寄生虫,而这些寄生虫又有自己的寄生虫,后者进化了数百万年仅为了寄生在它们身上。如果Tumblr社会正义比其他任何事物都更糟糕,主要是因为每个人都有种族和性别,因此更容易发射广泛的炮弹并击中所有人。
Tumblr的转发机制使其成为"毒性梗"的温床,这些梗通过引起愤怒来传播。遵循进化的古老法则,如果梗通过愤怒传播,它们就会适应进化成尽可能引人愤怒的形式。
或者更准确地说,这只是它们众多适应方式中的一种。我意识到这种弓形虫的比喻可能有些牵强,所以我想用几乎是迷因学中唯一被广泛认可的例子来阐明这个愤怒驱动梗的概念。
迷因的教科书案例——实际上几乎是唯一被讨论的例子——就是连锁信。「将此信发给十个人,你将获得好运。如未能传递,明天你将死亡。」于是这封信便不断自我复制。
如果我们能找到证据表明这些愤怒驱动的梗以相同方式复制自身,那将是有力证据,证明我们关于毒性梗等概念的思路是正确的。
如果你不使用Tumblr,你可能错过了那场「所有不转发当日热点议题的人都是垃圾」的论战。在Ferguson事件讨论最激烈的几周期间,人们不断指责彼此没有转发足够多与Ferguson相关的内容,或者(天哪)竟敢表示他们厌烦了看到如此之多的Ferguson相关内容。情况恶化到连那些只发布精美绘画的艺术博客,或者仅仅转发小猫图片的博客也感受到了压力(你可能以为我在开玩笑说人们会憎恨小猫图片博主,我从不开玩笑)。而现在,当日的热点议题似乎变成了巴基斯坦。这里举几个例子:
"朋友们,如果你们现在正在转发与弗格森事件无关的内容,请将它们放入队列而不是立即发布。请把注意力放在更重要的事情上。现在不是讨论粉丝圈或笑话的时候,而是谈论社会不公的时刻。"[来源]
"你们能不能暂时放下转发粉丝圈或搞笑的垃圾内容,多了解并转发关于巴基斯坦的消息?因为你们所享有的安全泡沫特权,并不是每个人都有的。"[来源]
"如果你不了解情况,不要以此为借口。不要说'我不选边站队是因为我不了解全部事实',因为不选择立场就等于支持威尔逊。而支持他,就意味着你站在了种族主义的一边……忽视这种情况将让你陷入深渊,这使你成为种族主义者。如果你不是种族主义者,不要只是空喊'但我不是种族主义者!!',而是应该去了解情况并尽可能地转发相关内容。"[来源]
"你为什么这么让人失望?我以前真的很喜欢你。你对佩沙瓦尔事件完全保持沉默,只顾着关注什么该死的zutara或bellarke这些角色配对。你还转发了其他一些我没想到你会转发的帖子——不过那是另一个话题了。我知道你只有19岁,但也许你该考虑成为一个更好的人?"[来源]
"如果你是白人,在转发那些'我没有在博客上发布关于弗格森的内容并不代表我不关心!!!'的帖子之前,请花几秒钟思考:想想你拥有的特权,让你可以选择不关注这些事情。想想那些没有特权可以转移注意力的人们。问问自己为什么你认为让别人知道你'关心'比传播信息和表示支持更重要。然后认清现实,你就是个该死的废物。"[来源]
"对于那些转发弗格森、阿约齐纳帕、朝鲜等事件却不转发佩沙瓦尔事件的人,你们真应该为自己感到羞耻。"[来源]
"这可能是一个不受欢迎的观点,但我看到有些人不愿转发弗格森事件和世界各地的社会问题,理由是他们不想在生活中引入负面情绪,而且这会让他们产生焦虑。他们来tumblr是为了逃避现实和寻找快乐,我认为这完全是废话。有人真实地死去,生活在恐惧中,害怕一出门就会被枪击,而你却因为有点难受就不能发布一张该死的图片??我根本不在乎网上这些废物。"[来源]
你可能还想看看Tumblr上的标签"垃圾正在自行清除",那里有数百人在重复同一个笑话("我觉得有些人因为我过多谈论[当下的热点议题]而停止阅读我的博客了。看来垃圾正在自动清除了。")
这现象令人震惊。这是我在连锁信之外首次看到网络模因彻底抛弃伪装,赤裸裸地叫嚣:"传播我,否则你就是垃圾,人人都会厌恶你。"
但它之所以有效,是因为它已经找到了信息寄生生态系统能想象的最美味食物来源——争议。
我希望能够更频繁地撰写关于慈善的文章。女权主义者可能更愿意开始为了改变而关注那些「确实存在的」性侵案件。抗议警察暴力的人可能希望能够聚焦于那些不会让白人「更加」支持警察的明确无误的案例。甚至连PETA(动物保护组织)可能也希望能够难得成为一次好人。但成功的可能性不大。这并非因为参与其中的人是想要失败的坏人。甚至不是因为媒体受众愚笨。仅仅是因为信息生态系统不是你的盟友。
这个博客试图铭记Jai的祷文:"几乎没有人是邪恶的;几乎一切都是破损的"。我们几乎从不与血肉之躯搏斗;从始至终都是与权势和规则进行斗争。
VI.
前段时间,我写过一篇名为《莫洛克沉思录》的文章,在文中我指出,任何复杂的多人系统都会按照其自身混乱的激励机制运行,而这些机制往往与系统内任何个体的真实意愿不相符。最经典的例子就是囚徒困境,尽管两名囚犯都更希望双方合作,但博弈最终通常会落入双方都选择背叛的结局。我将这种恶性的协调失败比作金斯伯格笔下的莫洛克——那个象征着资本主义异化的恶魔精神。