原文:Forgetting index is a flawed metric in spaced repetition
遗忘指数只是一个平均值
在算法 SM-17 出现之前,所有间隔重复软件是围绕遗忘指数的概念而设计的。甚至神经网络的方法也使用平均回忆率作为优化标准。遗忘指数是学习效率和进步的有趣指标。但是,我们不能忘记这是一个平均值,并且没有表明重复样本的方差。
遗忘概率的分布对于学习效率和间隔重复算法的设计至关重要。这不仅是统计问题。准确的概率预测对于最大程度地提高记忆稳定性至关重要。
例子
以3个虚构的卡片为例,并在 SuperMemo 16 和 SuperMemo 17 中看看 3 个关于回忆概率(可提取性用 R 表示)的模拟预测(为便于说明,夸大了差异):
- SuperMemo 16(不准确):R = 70,R = 80,R = 90
- SuperMemo 17(准确的):R = 80,R = 80,R = 80
这三个卡片的样本均将产生 80% 的平均可提取性。
但是,对于这 3 个卡片,重复进行的(模拟)记忆稳定性增长可能存在显着差异:
- SuperMemo 16:SInc = 1.5,SInc = 2.2,SInc = 1.3(平均更低的增长:SInc = 1.66)
- SuperMemo 17:SInc = 2.3,SInc = 2.2,SInc = 2.1(平均更高的增长:SInc = 2.2)
译者注:这里的 SInc 即复习前后的间隔比例,SInc 越大间隔增长的倍数也越大。想了解记忆模型?请参阅:记忆的两个组成成分|浓缩通俗版
该实施例表明所述遗忘指数不是算法效率的最终测量。http://supermemo.com 上的一些较旧的资料可能在比较中过分强调了遗忘指数的价值。
解决方案
间隔重复软件设计的最佳度量是什么?我们有个主意。但是,我们希望保持讨论开放,直到我们确定最佳选择:间隔重复算法度量