(3/5) 高效学习的间隔重复——文献综述之间隔效应

总目录：

概述：https://zhuanlan.zhihu.com/p/420105707
文献综述

测试效应：https://zhuanlan.zhihu.com/p/420309917
间隔效应（现在在这儿）

应用指南：https://zhuanlan.zhihu.com/p/423065882
脚注：https://zhuanlan.zhihu.com/p/453406457

间隔效应（分散练习）

测试的时机至关重要。上文中，我们注意到学完知识之后测试是有些好处，但是同样数量的测试分散到不同时机进行，更能实现间隔效应或者间隔重复。有上百个研究涉及间隔效应：

Cepeda et al 2006 这篇综述对 184 篇文章共计 317 个实验做了总结；其他综述包括：
Ruch 1928, “Factors influencing the relative economy of massed and distributed practice in learning”
Crowder 1976, Principles of learning and memory
Dempster 1989, “Spacing effects and their implications for theory and practice”
Delaney et al 2010, “Spacing and testing effects: A deeply critical, lengthy, and at times discursive review of the literature”
Donovan & Radosevich 1999, “A meta-analytic review of the distribution of practice effect: Now you see it, now you don’t”
Greene 1992, Human memory: Paradigms and paradoxes
Janiszewski et al 2003, “A meta-analysis of the spacing effect in verbal learning: Implications for research on advertising repetition and consumer memory”
Pavlik & Anderson 2003, “An ACT-R model of the spacing effect”
Balota et al 2006, “Is Expanded Retrieval Practice a Superior Form of Spaced Retrieval? A Critical Review of the Extant Literature”
Carpenter et al 2012, “Using Spacing to Enhance Diverse Forms of Learning: Review of Recent Research and Implications for Instruction”

他们几乎一致地发现，若最终测试/测量在几天或几年后进行的话，间隔测试优于集中测试[30]⁠，尽管其中机制并未知晓[31⁠]。除了前面提到的研究外，我们还有：

Peterson, L. R., Wampler, R., Kirkpatrick, M., & Saltzman, D. (1963). “Effect of spacing presentations on retention of a paired associate over short intervals”⁠. Journal of Experimental Psychology, 66(2), 206-209
Glenberg, A. M. (1977). “Influences of retrieval processes on the spacing effect in free recall”⁠. Journal of Experimental Psychology: Human Learning and Memory, 3(3), 282-294
Balota et al 1989, “Age-related differences in the impact of spacing, lag and retention interval”⁠. Psychology and Aging, 4, 3-9

大量研究文献都在探究“什么样”的间隔安排是最好的，以及如此安排所反映出的记忆性质：是间隔固定不动好，还是间隔逐渐变大好？这对于理解记忆以及建立记忆模型都非常重要，同时也有助于将间隔重复融入课堂（比如Kelley & Whatson 2013年研究使用的安排是10分钟学习/10分钟休息，将同样材料重复三次，其意图是促使材料进入长期记忆？）但是对于实践来说，这个研究方向不是很有趣：总的来说，很多研究众说纷纭，但给出的安排效率虽有差异，也不算显著。大多数现存材料都模仿 Supermemo, 使用了间隔变大的算法，所以没什么好担心的； Mnemosyne 的开发者 Peter Bienstman 说，尚不清楚更复杂的算法能否有助益[32]⁠, Anki 开发者担心重新实现 Supermemo 的专有算法太难也太复杂，却看不到显著成效，同时 SM3+ 算法为了极尽优化可能造成更多错误。所以他们也有同感。

如果有人感兴趣，有 3 项研究发现固定间隔比递增间隔更好：

Carpenter, S. K., & DeLosh, E. L. (2005). “Application of the testing and spacing effects to name learning”⁠. Applied Cognitive Psychology, 19, 619-636[33]
Logan, J. M. (2004). Spaced and expanded retrieval effects in younger and older adults. Unpublished doctoral dissertation, Washington University, St. Louis, MO

这篇论文很有趣，因为洛根发现，一天之后测试，使用递增间隔复习的年轻人表现要差得多。
Karpicke & Roediger, 2006a

撇开固定间隔的问题与递增间隔的问题不谈，有更多通用研究指出间隔学习相对集中学习的好处，见下面的列表：

Cepeda et al 2006 （大综述，本页中其他地方用到）
Karpicke & Roediger 2006a
Rohrer & Taylor 2006. “The effects of over-learning and distributed practice on the retention of mathematics knowledge”⁠. Applied Cognitive Psychology, 20: 1209-1224 (参见 Rohrer & Taylor 2007⁠, Rohrer et al 2005)
Seabrook et al 2005. “Distributed and Massed Practice: From Laboratory to Classroom”
Keppel, Geoffrey. “A Reconsideration of the Extinction-Recovery Theory”⁠. Journal of Verbal Learning & Verbal Behavior. 6(4) 1967, 476-486

一周后，集中复习者从 5.9 正确 → 2.1；间隔复习者从 5.5 → 5.0。(请注意，通常的观察是集中学习最初更好，后来变得更差，正确率是最初的一半不到)
Bloom & Schuell 1981, “Effects of massed and distributed practice on the learning and retention of second-language vocabulary”

在两个高中组记住 16 个法语单词四天后，间隔组还记得 15 个，集中组还记得 11 个。
Rea, Cornelius P; Modigliani, Vito. “The effect of expanded versus massed practice on the retention of multiplication facts and spelling lists”⁠. Human Learning: Journal of Practical Research & Applications. Vol 4(1) Jan-Mar 1985, 11-18[34]

培训后立即进行测试，结果间隔组（70% 正确）比集中组（53% 正确）表现更好。这些结果似乎表明，间隔效应适用于学龄儿童，至少适用于学校通常教授的一些材料。[35]

Donovan & Radosevich 1999, “A meta-analytic review of the distribution of practice effect: Now you see it, now you don’t”:

根据多诺万和拉多塞维奇对间隔学习研究的元分析，间隔效应的效应量为 d = 0.42. 这意味着接受间隔练习后的平均记忆效果，优于约 67% 集中练习者的记忆效果。这个效应量不容小觑——在教育研究中，即使效应量低到 d = 0.2 都认为是“足够显著”，而高于 d = 1 的效应量则少之又少。[36]

例如，在 Donovan 和 Radosevich (1999) 的一项元分析中，随着任务的概念难度从低（如旋转追视）到平均（例如单词列表回忆）再到高（例如拼图），间隔效应的效应量急剧减少。根据这一发现，对于许多数学任务来说，间隔练习的好处可能会变得微不足道。[37]

（注：旋转追视是用于测试手眼协调和运动技能学习的测试，受试者需要用指示物追踪旋转圆盘上的圆点）

Donovan 的元分析指出，在使用更好方法的研究中，效应量虽然变小，但仍然不容小觑。

Bahrick, Harry P; Phelphs, Elizabeth. “Retention of Spanish vocabulary over 8 years”⁠. Journal of Experimental Psychology: Learning, Memory, & Cognition. Vol 13(2) April 1987, 344-349; 这篇研究初始训练之后的间隔特别长，很有意思

Harry Bahrick 和 Elizabeth Phelps (1987) 研究了 50 个西班牙语词汇在 8 年之后的保留情况。受试者被分成三组。每个人练习七到八次，间隔几分钟，1 天或 30 天。在每个环节中，受试者都会进行练习，直到他们可以一次性完美回忆出单词列表…8 年后，无延迟组的人能记住 6% 的单词，延迟 1 天组的人能记住 8% ，30 天组的人平均能记住 15%。每个人都参加了选择题测试，其中再次观察到了间隔效应。无延迟组得分为 71%，一天组得分为 80%，30 天组得分为 83%。

…Bahrick 和他的同事们改变了练习的间隔和练习量。练习环节之间有间隔 14 天、28 天或 56 天的，总共进行 13 或 26 次练习。他们测试了受试者在训练后一年、二年、三年和五年的记忆。有一次观察到，当练习环节间隔较长时，在每个练习环节中达到标准所需的时间稍长一些，但同样，这一小投资在几年后产生了回报。测试是在练习后一年、两年、三年还是五年进行的并不重要——56 天组总是记住最多的，28 天组次之，14 天组记忆最少。而且影响是比较大的。如果每 14 天练习一次单词，你需要的练习次数是每 56 天练习一次时的两倍，才能达到同样的表现水平！

Pashler et al, 2003; “Is Temporal Spacing of Tests Helpful Even When It Inflates Error Rates?”

测试之间的长间隔必然意味着你经常会回答错误；有人认为答错就会削弱学习效果。尽管短期内过多的错误的确会降低准确性，但长间隔的力量足以让他们仍然获胜。
间隔重复在患病人群中的研究：

让阿尔茨海默病患者进行短期复习的研究；间隔时间以秒和分钟为单位，在物体位置教学或日常任务方面取得了一定成功 38:

Camp, C. J. (1989). “Facilitation of new learning in Alzheimer’s disease”. In G. C. Gilmore, P. J. Whitehouse, & M. L. Wykle (Eds.), Memory, aging, and dementia (pp. 212-225)
Camp, C. J., & McKitrick, L. A. (1992). “Memory interventions in Alzheimer’s-type dementia populations: Methodological and theoretical issues”. In R. L. West & J. D. Sinnott (Eds.), Everyday memory and aging: Current research and methodology (pp. 152-172) -

针对创伤性脑损伤患者的研究; Goverover et al 2009, “Application of the spacing effect to improve learning and memory for functional tasks in traumatic brain injury: a pilot study”
和多发性硬化症患者的研究; Goverover et al 2009, “A functional application of the spacing effect to improve learning and memory in persons with multiple sclerosis”

数学[39]:

乘法 (Ria & Modigliani 1985)
遍历数列排列 (Rohrer & Taylor 2006)on
计算多面体体积 (Rohrer & Taylor 2007)
统计 (Smith & Rothkopf 1984)

初级微积分 (Revak 1997[40] 但也有一篇相关文章说明对微积分 I 无效) 和代数 (Mayfield & Chase 2002⁠, Patac & Patac 2013⁠; 可能没效果, Sutherland 2013)
医学 (Kerfoot & Brotschi 2009⁠, Shaw et al 2012⁠; Kerfoot 2009⁠, 是 Kerfoot et al 2007 两年后的跟进研究。Kerfoot 有其他一些相关研究⁠; Gyorki et al 2013) ；在手术方面 (Moulton et al 2006, “Teaching Surgical Skills: What Kind of Practice Makes Perfect? A Randomized, Controlled Trial”⁠, 微血管缝合的间隔重复实践；Spruit et al 2014)
心理学导论 (Balch 2006, “Encouraging Distributed Study: A Classroom Experiment on the Spacing Effect”[41⁠]. Teaching of Psychology, 33, 249-252)
8 年级美国历史 (Carpenter, Pashler, and Cepeda 2009)
用自然拼读法学习阅读 (Seabrook et al 2005)
音乐 (Stambaugh 2009)
生物 (中学生物；Kelly&Whatson 2013)
统计 (初步内容；Maas 等人于2015年)
记忆网站密码 (Bonneau & Schechter 2014⁠, Blocki et al 2014⁠, Blum & Vempala 2017)
可能不是澳大利亚宪法 (Colbran et al 2015 年)

间隔效应的通用性

我们已经看到，间隔重复在各种学术领域和媒介上都是有效的。除此之外，间隔效应还在下列领域有效：

各种「领域（例如，学习知觉运动任务或者单词表)」[42]比如空间记忆[43]
「跨物种 (例如，老鼠⁠，鸽子和人类[或苍蝇或大黄蜂⁠，和海蛞蝓，Carew et al 1972 & Sutton et al 2002])」
「跨年龄组[婴儿期[44]⁠，儿童期[45⁠]，成年期[46]⁠，老年期[47]]和具有不同记忆障碍的人」
「以及跨保留间隔，从秒[48][到天[49]]到月」(我们已经看到以年为单位的研究)

然而，生效的领域是有限的。Cepeda et al 2006:

[Moss 1995，回顾了 120 篇文章]得出的结论是，较长的 ISI 有助于学习言语型信息（例如拼写[50]）和运动技能（例如镜画实验）；在每种情况下，超过 80% 的研究都显示出分散练习有效果。相比之下，只有三分之一的智力技能（例如，数学计算）研究显示分散练习有效果，一半的研究显示分散练习没有效果。（注：镜画实验是指实验时，被试注视平面镜内的图形。用描绘笔学习画下画板上的图形）

…[Donovan 和 Radosevich (1999)] 低严格性研究中的低复杂性任务（如旋转追视、打字和翻转钉子）效应量最大，并且保留间隔不影响效应量。Donovan 和 Radosevich 只研究了 ISI 和任务领域之间的互相影响。值得注意的是，任务领域降低了分散练习的效果；根据任务领域和间隔的不同，ISI 的增加要么增加了效应量，要么降低了效应量。总体而言，Donovan 和 Radosevich 发现，间隔更长的分散练习在自由回忆、外语和言语辨别等言语型任务中产生的效应量更大，但这些任务也显示出反 U 函数，即非常长的间隔产生的效应量较小。相比之下，打字、体操和音乐表演等技能型任务中，递增间隔的效应量较小。

从体操和音乐表演等技能可以看出，测试效应和间隔重复有一个重要特点：两者只能维持记忆强度或技能水平的现状，而无法令其进一步提升。如果有人开始复习时是有小有水准的业余爱好者，那么复习之后，他仍然只是小有水准的业余爱好者。Ericsson 介绍了「提升」和精进所专所必需的概念：刻意练习[51⁠]。摘自「刻意练习的作用」：

有种观点认为，只要进行足够练习——无论练习组成如何——便能得到上佳表现。这个观点由来已久，也争议颇多。Bryan 和 Harter 在一系列针对摩尔斯电码操作员的经典研究(1897, 1899) 中，注意到技能习得存在平台期，也就是技能练习者很长一段时间内似乎无法进一步提升。然而，长久努力之后，练习者将能重组其技能，跨越平台期……面对继续精进的需求，即使是极富经验的摩尔斯电码操作员，经由刻意练习也能备受鼓舞，大幅提升其表现。对于更一般的领域， Thorndike (1921) 观察到很多成年人即使常常执行一些任务，他们在这些任务上的表现远称不上个人最佳水平。比如，一些成年人写字明明能写得又快又清楚，他们平常却没有这个水准。……对于[优化学习和提高成绩]，有一个前提条件广为提及，也就是练习者须有动机执行此项任务……练习者需能当即获知详尽反馈，以及练习结果……缺乏足够反馈，高效学习无从谈起。即便练习者干劲十足，进步也微乎其微，尤其是准确性上……与游戏相比，刻意练习是高度结构化的，其目标明确，就是提升表现。刻意练习中会制定具体的任务来克服缺点，并会仔细监控表现，来找出进一步提升的线索。我们认为刻意练习需要投入努力，其本质不是令人愉快的。

运动技能

应该指出的是，关于间隔重复多大程度上适用于运动技能，不少综述相互矛盾；Lee & Genovese 1988 认为有好处，而 Adams 1987 和更早的综述相反。区别可能在于，Shea & Morgan 1979 显示了（随机/间隔安排计划有益于）简单的运动任务，而 Wulf & Shea 2002⁠ 显示复杂的任务，即受试者已经在他的极限下操作的任务，则没有受益。Stambaugh 2009 提到了一些不同的研究：

情景干扰假说（Shea 和 Morgan 1979，Battig 1966 [技能的习得中的「促进和干扰」]）预测阻塞条件将在练习（习得）后立即展现出更好的表现，但随机条件在延迟保留率测试中表现更好。这一假设在实验室运动学习研究中基本一致（如 Lee & Magill 1983, Brady 2004），但在运动技能的应用研究方面不太一致（结果好坏都有，如 Landin & Hebert 1997, Hall et al 1994, Regal 2013）和精细运动技能（Ollis et al 2005, Ste-Marie et al 2004）。

一些支持间隔重复的研究（摘自 Son & Simon 2012）：

可能甚至在认知研究和间隔效应的实证工作之前，间隔学习的好处已经在一系列运动学习任务中显现出来，包括迷宫学习（Culler 1912 ）、打字（Pyle 1915 ）、射箭（Lashley 1915 ）和投掷标枪（Murphy 1916 ）；（见 Ruch 1928 对从间隔学习中获益的运动学习任务进行了更广泛的回顾；也见 Moss 1996 关于运动学习任务的最新综述）。因此，与认知文献一样，运动领域的分散练习研究早已确立（见 Adams 1987 综述；Schmidt & Lee 2005 综述），大多数兴趣都集中在改变运动技能的学习试验的间隔对学习和练习技能的保留率的影响。Lee & Genovese 1988 对有关分散练习的研究进行了综述和元分析，他们得出的结论是，大量练习往往会抑制即时表现和学习，而学习是在练习环节之后的某个时间段内被评估的。他们的主要发现是，和认知文献一样，间隔练习后的学习比集中练习后的学习相对更强（但这里也有些批评：见 Ammons 1988 ；Christina & Shea 1988 ；Newell et al. 1988）......最广泛引用的例子可能是 Baddeley & Longman 1978 关于如何最佳地教邮递员打字的研究。他们让学习者每天练习一次或两次，每次练习的时间长度为 1 或 2 小时。研究的主要结果是，当学习者处于最分散的练习状态时，他们用最少的累计练习时间就能达到打字的表现标准。这一发现为间隔练习对加强学习的好处提供了明确的证据。然而，正如人们所指出的（Newell et al. 1988；Lee & Wishart 2005），还需要考虑的是，从开始练习到达到标准的总时间（天数）在最分散的条件下要长很多....同样的基本结果在此后的几十年里被反复证明（见 Magill & Hall 1990 综述；Lee & Simon 2004），并且在各种各样的运动任务中，包括不同的羽毛球发球（Goode & Magill 1986年），步枪射击（Boyce & Del Rey 1990），预先建立的技能，棒球击球（Hall et al. 1994），学习不同的逻辑门配置（Carlson et al. 1989; Carlson & Yaure 1990），自动取款机的新用户学习（Jamieson & Rogers 2000），以及解决课堂作业中可能出现的数学问题（Rohrer & Taylor 2007; Le Blanc & Simon 2008; Taylor & Rohrer 2010）。

Culler, E. A. (1912). “The effect of distribution of practice upon learning”⁠. Journal of Philosophical Psychology, 9, 580-583
Pyle, W. H. (1915). “Concentrated versus distributed practice”
Lashley 1915, “The acquisition of skill in archery”
Murphy, H. H. (1916). “Distributions of practice periods in learning”⁠. Journal of Educational Psychology, 7, 150-162
Adams, J. A. (1987). “Historical review and appraisal of research on the learning, retention, and transfer of human motor skills”
Schmidt, R. A., & Lee, T. D. (2005). Motor control and learning: A behavioral emphasis (4th ed.). Urbana-Champaign: Human Kinetics
Lee, T. D., & Genovese, E. D. (1988). “Distribution of practice in motor skill acquisition: Learning and performance effects reconsidered”⁠. Research Quarterly for Exercise and Sport, 59, 277-287
Ammons, R. B. (1988). “Distribution of practice in motor skill acquisition: A few questions and comments”⁠. Research Quarterly for Exercise and Sport, 59, 288-290
Christina, R. W., & Shea, J. B. (1988). “The limitations of generalization based on restricted information”⁠. Research Quarterly for Exercise and Sport, 59, 291-297
Newell, K. M., Antoniou, A., & Carlton, L. G. (1988). “Massed and distributed practice effects: Phenomena in search of a theory?” Research Quarterly for Exercise and Sport, 59, 308-313
Lee, T. D., & Wishart, L. R. (2005). “Motor learning conundrums (and possible solutions)”
Lee, T. D., & Simon, D. A. (2004). “Contextual interference”
Goode, S., & Magill, R. A. (1986). “Contextual interference effects in learning three badminton serves”⁠. Research Quarterly for Exercise and Sport, 57, 308-314
Boyce, B. A., & Del Rey, P. (1990). “Designing applied research in a naturalistic setting using a contextual interference paradigm”. Journal of Human Movement Studies, 18, 189-200
Hall et al 1994, “Contextual interference effects with skilled baseball players”
Carlson, R. A., & Yaure, R. G. (1990). “Practice schedules and the use of component skills in problem solving”
Carlson, R. A., Sullivan, M. A., & Schneider, W. (1989). “Practice and working memory effects in building procedural skill”
Jamieson, B. A., & Rogers, W. A. (2000). “Age-related effects of blocked and random practice schedules on learning a new technology”
Le Blanc, K. & Simon, D. A. (2008). “Mixed practice enhances retention and JOL accuracy for mathematical skills”. Poster presented at the 2008 annual meeting of the Psychonomic Society, Chicago, IL
Wymbs et al 2016, “Motor Skills Are Strengthened through Reconsolidation”
Dayan & Cohen 2011, “Neuroplasticity subserving motor skill learning”
Landin et al 1993, “The Effects of Variable Practice on the Performance of a Basketball Skill”

在这一点上，有趣的是注意到交错可能对有心理成分的任务也有帮助：根据 Hatala et al 2003⁠，Helsdingen et al 2011⁠，Huang et al 2013，XBOX光环：Reach视频游戏玩家在技能比赛中的进步率从分布中很好地预测了：每周玩 4-8 场比赛的玩家，在每场比赛的技能进步，高于玩更多(分散)的玩家；但每周的进步速度低于打更多(集中)的比赛的玩家。(另见 Stafford & Haasnoot 2016⁠.)

摘要

另一个可能的反对意见[52]是，间隔重复从本质上阻碍了各种抽象学习和思考，因为相关的材料没有放在一起回顾——从而能比较、推理——而是分散到几天或几个月的间隔。Ernst A.Rothkopf 说：「间隔是回忆的朋友，却是归纳的敌人」(Kornell & Bjork, 2008, p. 585)。根据一些早期的研究[53]，这似乎是合理的，但我知道的最近的 4 个研究都直接检验了这个问题，这些研究都发现间隔重复有助于抽象和一般回忆：