← 返回目录


如何看待墨墨背单词在哈佛大学公开记忆数据?

钻研人类记忆,探索复习算法。改善教育公平,践行自由学习。

56 👍 / 1 💬

问题描述

我怎么有点担心中国人的记忆数据泄露哇


利益相关:我是墨墨背单词间隔重复记忆行为开源数据集的“泄露”者

Replication Data for: A Stochastic Shortest Path Algorithm for Optimizing Spaced Repetition Scheduling - MaiMemo Dataverse (harvard.edu)

不用担心,在我的努力下,已经把全世界的 Anki 用户的记忆数据“泄露”了个遍:

叶峻峣:目前世界最大的人类记忆行为数据集发布

关于墨墨背单词数据集的详细情况,请见:

Thoughts Memo:[开源+墨墨背单词] 时序记忆行为数据集介绍

墨墨的这份数据集已经进行脱敏处理,甚至连时间戳都删了,仅保留了复现论文实验结果所需的数据。

而 Anki 的数据集规模更大,数据量上是墨墨的 7 倍。而且还包含了精确到毫秒的时间戳、每次复习花费的时间(同样精确到毫秒),可以分析日内学习规律。

欢迎 follow 我的工作:

Thoughts Memo:KDD'22 | 墨墨背单词:基于时序模型与最优控制的记忆算法 [AI+教育]Thoughts Memo:IEEE TKDE 2023 | 墨墨背单词:通过捕捉记忆动态,优化间隔重复调度


← 返回目录