问题描述
我怎么有点担心中国人的记忆数据泄露哇
利益相关:我是墨墨背单词间隔重复记忆行为开源数据集的“泄露”者
Replication Data for: A Stochastic Shortest Path Algorithm for Optimizing Spaced Repetition Scheduling - MaiMemo Dataverse (harvard.edu)不用担心,在我的努力下,已经把全世界的 Anki 用户的记忆数据“泄露”了个遍:
叶峻峣:目前世界最大的人类记忆行为数据集发布关于墨墨背单词数据集的详细情况,请见:
Thoughts Memo:[开源+墨墨背单词] 时序记忆行为数据集介绍墨墨的这份数据集已经进行脱敏处理,甚至连时间戳都删了,仅保留了复现论文实验结果所需的数据。
而 Anki 的数据集规模更大,数据量上是墨墨的 7 倍。而且还包含了精确到毫秒的时间戳、每次复习花费的时间(同样精确到毫秒),可以分析日内学习规律。
欢迎 follow 我的工作:
Thoughts Memo:KDD'22 | 墨墨背单词:基于时序模型与最优控制的记忆算法 [AI+教育]Thoughts Memo:IEEE TKDE 2023 | 墨墨背单词:通过捕捉记忆动态,优化间隔重复调度