间隔重复算法与FSRS


FSRS 是一种现代间隔重复算法,由 Jarrett Ye 开发。与 Anki 传统的 SM2 算法相比,它旨在学习你的记忆模式并更有效地安排复习。

什么是间隔重复
间隔重复是一种基于证据的学习技术,通常使用抽认卡来执行。新推出的和难度较大的抽认卡会更频繁地显示,而旧的和难度较低的抽认卡则不会频繁地显示,以利用心理间隔效应。已证明使用间隔重复可以提高学习速度。

尽管该原则在许多情况下都很有用,但间隔重复通常应用于学习者必须掌握许多项目并将它们无限期地保留在记忆中的情况。因此,它非常适合解决第二语言学习过程中的词汇习得问题。已经开发了许多间隔重复软件程序来帮助学习过程。还可以使用莱特纳系统通过物理抽认卡执行间隔重复。测试效果和间隔重复可以结合起来,以提高长期记忆。


间隔重复算法的目标是计算复习之间的最佳间隔。
但怎样才算 "最佳 "间隔呢?
在 FSRS 中,如果一个间隔与回忆卡片的特定概率相对应,那么它就被认为是最佳间隔。例如,如果你想有 90% 的把握在下一次看到卡片时成功回忆起卡片,那么最佳间隔就是回忆概率为 90% 的间隔。

FSRS 基于 "记忆三要素模型"。该模型认为,三个变量足以描述人脑中单元记忆的状态。这三个变量包括

  • 可检索性 (R):人在特定时刻成功回忆起特定信息的概率。它取决于上次复习后的时间和记忆的稳定性(S)。
  • 稳定性 (S):R 从 100% 下降到 90% 所需的时间(天数)。例如,S = 365 意味着一整年后,回忆某张卡片的概率才会下降到 90%。
  • 难度 (D):特定信息的内在复杂性。它表示复习后提高记忆稳定性的难度。

在 FSRS 中,这三个值统称为 "记忆状态"。用户每次审阅卡片时,与该卡片相关的记忆状态都会发生变化,除非是当天审阅。FSRS 每天只考虑一次审核,即按时间顺序排列的第一次审核。每张卡都有各自的 DSR 值,换句话说,每张卡都有自己的存储状态。

为了准确估算 DSR 值,FSRS 会分析用户的评论历史记录,并使用机器学习来计算与评论历史记录最匹配的参数。最新版本的 FSRS 在 D 和 S 的公式中使用了 17 个参数(可检索性公式不需要任何参数)。如果您对细节感兴趣,可以阅读以下维基页面:算法和优化机制。如果用户还没有足够的评论,则使用默认参数。这些参数是在 FSRS 优化程序运行过程中从约 2 万用户的数十亿条评论中找到的。即使使用默认参数,FSRS 也比 Anki 的默认算法更好。

请注意,用户不应手动调整参数。如果要调整调度,只需选择一个合适的所需保留率值即可。70% 到 97% 之间的值被认为是合理的。换句话说,有了 FSRS,用户可以锁定一个特定的保留值,从而在记忆量和必须进行的评论数量之间取得平衡。留存率越高,每天的回顾次数就越多。

间隔重复算法:从新手到专家的三天之旅
从学生时代起,大多数学生就直观地知道以下两个事实:

  1. 多次回顾信息可以帮助我们更好地记住它。
  2. 不同的记忆以不同的速度消失,我们不会一下子忘记一切。

这些见解提出了进一步的问题:
  1. 我们能估计一下我们已经忘记了多少知识吗?
  2. 我们忘记它的速度有多快?
  3. 安排复习以尽量减少遗忘的最佳方法是什么?

过去,很少有人尝试回答这些问题。开发间隔重复算法需要找到答案。
接下来三天,我们将从三个角度深入探讨间隔重复算法:
  1. 经验算法
  2. 理论模型
  3. 最新进展

今天,我们首先深入研究最简单但有影响力的经验算法。我们将揭示细节和指导它们的想法。但首先,让我们追溯一下“间隔重复”一词的根源。

当我们学到一些东西之后,无论是从书本上还是通过其他方式,我们开始忘记它。这是逐渐发生的。

遗忘曲线说明了我们的记忆保留知识的方式。它表现出一个独特的轨迹:在没有积极回顾的情况下,记忆衰退最初很快,然后随着时间的推移而减慢。

我们怎样才能抵消这种自然的遗忘倾向呢?让我们考虑一下评论的效果。

定期复习材料可以使遗忘曲线变平。换句话说,它降低了我们忘记信息的速度。

现在,出现了一个问题:如何优化这些复习间隔以实现有效的记忆保留?

您是否注意到,每次复习后,与一定程度的保留相对应的时间间隔都会增加?较短的间隔更适合不熟悉的内容,而较长的间隔则适用于更熟悉的内容。这种方法被称为间隔重复,可以增强长期记忆的形成。

但效果如何呢?以下是一些研究,显示了间隔重复的好处(来源):


训练后立即进行的测试显示,与集中组(正确率 53%)相比,分布式组(正确率 70%)的表现更出色。这些结果似乎表明,间距效应适用于学龄儿童,至少适用于学校通常教授的某些类型的材料。

总体平均加权效应大小为 0.46,95% 置信区间从 0.42 延伸至 0.50。...该效应大小的 95% 置信区间不包含零,表明就任务表现而言,间隔练习明显优于集中练习。
简单来说,这意味着 62% 到 64% 的使用间隔重复的人会比使用集中重复的人获得更好的结果。这种影响并不像其他一些研究报告的那么大,但无论是在统计意义上还是在实际意义上,它仍然很重要。

您可能会想“如果间隔重复如此有效,为什么它没有更受欢迎呢?”
主要障碍是必须学习的知识量巨大。每一条知识都有其独特的遗忘曲线,这使得手动跟踪和调度成为一项不可能完成的任务。
这就是间隔重复算法的作用:自动跟踪记忆状态并找到有效的复习时间表。
到现在为止,您应该对间隔重复有了基本的了解。但一些问题可能仍然存在,例如最佳间隔的计算和有效间隔重复的最佳实践。

在深入研究了间隔重复的概念后,您可能会发现自己正在思考这个指导原则:

较短的时间间隔用于不熟悉的内容,而较长的时间间隔用于更熟悉的内容,这会将评论分散在未来的不同时间。


究竟是什么定义了这些“短”或“长”间隔?此外,如何区分“熟悉”的材料和“不熟悉”的材料?

直观上,我们知道材料越熟悉,我们忘记的速度就越慢,因此我们可以对更熟悉的材料使用更长的间隔。但我们越不想忘记,间隔就应该越短。间隔时间越短,评论的频率越高。

看来复习频率和遗忘率之间存在着内在的矛盾。一方面,我们想做更多的回顾,记住更多。另一方面,我们不需要经常复习熟悉的材料。我们如何解决这个矛盾呢?

SM-0
1985 年,一位名叫 Piotr Wozniak 的年轻大学生正在与遗忘问题作斗争:
他整理了一年的复习数据,发现自己的遗忘率在40%到60%之间。这对他来说是无法接受的。他需要一个合理的学习时间表,既能降低他的遗忘率,又不会被复习压得喘不过气来。为了找到最佳的复习时间间隔,他开始了记忆实验。
Wozniak 希望找到尽可能长的评论间隔时间,同时将遗忘率保持在 5% 以下。

SM-0算法的目标很明确:尽可能延长复习间隔,同时最小化记忆衰退率。它的局限性也很明显,即它无法在粒度级别上跟踪记忆内存保留情况。

尽管如此,SM-0 算法的有效性是显而易见的。1986 年,沃兹尼亚克购买了第一台计算机后,对模型进行了模拟,并得出了两个关键结论:

  • 随着时间的推移,知识总量不减反增
  • 从长期来看,知识获取率保持相对稳定

这些见解证明该算法可以在记忆保留和复习频率之间实现折衷。沃兹尼亚克意识到,间隔重复并不一定会让学习者淹没在无边无际的复习海洋中。这一认识激励他继续完善间隔重复算法。

SM-2
尽管 SM-0 算法被证明对沃兹尼亚克的学习有益,但有几个问题促使他寻求改进:

  1. 如果一个单词在第一次复习时(1天后)被遗忘,那么与之前没有忘记的单词相比,在随后的复习(7天和16天后)中再次忘记的可能性更大。
  2. 即使复习时间表相同,由遗忘单词组成的新笔记页也更有可能被遗忘。

这些观察使他意识到并非所有材料都同样坚硬。不同难度的材料应该有不同的复习间隔。
因此,1987 年,在获得第一台计算机后,沃兹尼亚克利用他两年的记录和对 SM-0 算法的见解,开发了 SM-2 算法。Anki 的内置算法是 SM-2 算法的变体。

SM-2 算法将审阅反馈添加到您审阅问答对的频率。EF越低,间隔乘数越小;换句话说,间隔增长得越慢。

SM-2 算法具有三个主要优点,使其成为当今流行的间隔重复算法:

  1. 它将材料分解成小的问答对。这使得为​​每件材料创建单独的计划成为可能。
  2. 它使用“轻松系数”和等级。这使得算法能够区分简单和困难的材料并以不同的方式安排它们。
  3. 它相对简单且计算成本低廉,因此很容易在任何设备上实现。

SM-4
SM-4 的主要目标是提高其前身 SM-2 算法的适应性。尽管 SM-2 可以根据难易度因素和成绩微调各个抽认卡的复习时间表,但这些调整是孤立进行的,不考虑整体学习过程。 

换句话说,SM-2 将每个抽认卡视为一个独立的实体。为了克服这个问题,SM-4 引入了最佳间隔 (OI) 矩阵,取代了用于间隔计算的现有公式:

在最佳间隔 (OI) 矩阵中,行表示材料的难易程度,列表示您看过该材料的次数。最初,矩阵中的条目使用 SM-2 公式填充,该公式决定再次查看卡片之前需要等待多长时间。

为了让新卡能够从老卡的调整中受益,OI矩阵在审核过程中不断更新。主要思想是,如果 OI 矩阵说等待 X 天,而学习者实际上等待 X+Y 天并且仍然记得高分,那么 OI 值应该更改为 X 和 X+Y 之间的值。

原因很简单:如果学习者在等待 X+Y 天后还能记住一些东西并获得好分数,那么旧的 OI 值可能太短了。让我们把它拉长一点吧!

这个想法使 SM-4 成为第一个能够根据其他类似卡片的信息调整卡片时间表的算法。但它并没有像沃兹尼亚克所希望的那样发挥作用,原因如下:

  1. 每次审核仅更改矩阵的一项,因此需要花费大量时间来改进整个 OI 矩阵。
  2. 对于较长的审查间隔(多年甚至数十年),收集足够的数据来填充相应的矩阵条目需要很长时间。

为了解决这些问题,设计了SM-5算法。

概括
遗忘曲线于 1885 年首次被发现,它显示了我们如何记忆和遗忘。时间快进到 1985 年,当时第一个用于间隔重复的计算机算法被开发出来,旨在找到最佳的复习时间表。本节概述了基于经验的算法的发展进程:

  • SM-0 收集实验数据以确定给定个人和特定类型材料的最佳审查间隔(沃兹尼亚克在这里定义了“最佳”的含义)。
  • SM-2 对计算机应用程序的算法进行了数字化,引入了更细粒度的卡片级别并结合了自适应轻松因子和等级。
  • SM-4 进一步增强了算法对不同学习者的适应性,引入了最佳间隔矩阵以及调整间隔的规则。

尽管经验观察为理解间隔重复提供了一个有价值的视角,但如果没有良好的理论理解,就很难改进它们。接下来,我们将深入研究间隔重复的理论方面。

详细点击标题