← 返回目录


做科研应该花时间专门补相关基础知识还是一边做科研一边补所缺的知识?

学校≠教育≠技能;文凭溢价=80%信号传递+20%人力资本

123 👍 / 8 💬

问题描述

如题,关于做科研有两种说法,一种是专门花点时间补习所需要的基础知识,还有一种(更多的)说法是,先上手再说,先做再说,有什么需要的知识边做边学。后者好像是很多老板逼你干活时的说法。请问哪一种更站得住脚?最佳科研策略是什么?

首先,很多领域的科研,如果你没有基础知识,可能啥也做不了,根本无处下手。我这里用外语学习来类比一下:

想象一下,你一个外语单词也不会,直接把你送去国外,你有办法直接上手交流吗?有办法边查单词边交流吗?显然是不行的。哪怕可以,效率也会非常低。

但是,也没谁会先把牛津词典上的所有单词背完,再去交流,这也是非常低效的,因为大部分单词日常交流中根本用不到。

那么,最合理的策略,就是先记忆一两千个常用词,也就是基础知识,然后开始听说读写,在这个过程中遇到不会的单词再记。

科研也是类似的,问题在于什么范围是基础知识。一般来说,看看这个科研方向的导论、经典文献,就可以大概知道哪些是基础知识,然后去学即可。也可以请教一下导师、师兄师姐。

如果你对我在本科时发顶会的经历感兴趣,可以看看我的这篇回答:

为什么有的计算机本科生就能发表顶会,但是许多博士生还是一篇都没有?

如果你想知道如何在学习过程中兼顾广度与深度,可以继续往下阅读。

以下内容摘自 @Thoughts Memo 汉化组的译文《论学习的广度与深度

研究了这么多关于记忆和理解的内容后,我发现它给我带来了一个滑稽的负面影响——一种纯真的丧失。我深刻体会到,如果我用平时默认的「休闲」方式去阅读,我对那些复杂想法的理解将会多么肤浅,记忆将会多不牢靠。我也了解到了一些能帮助我更深入、更牢固地理解的方法,比如记忆系统、主动阅读练习、精细笔记等等。

但这给我带来了两个新问题。第一个问题是,我总觉得自己「应该」始终或至少更经常用这种更慢的方式阅读。现在,在我休闲阅读非虚构类作品时,我都会感到一丝愧疚。我非常清楚自己真正吸收的知识是多么少。

第二个问题是,我开始感受到时间和资源的有限和稀缺。深入学习一篇文章需要很长时间!在这种模式下,我原本一分钟就能读完的一页,现在要花上十分钟、二十分钟,甚至一个小时。我可能会花费几十个小时仔细研究一本专著,但我的阅读清单却长得没完没了。照这个速度,我只能读完其中的一小部分。万一真正重要的洞见藏在书单的中间呢?

我该如何解决这些问题?我又该如何权衡阅读时的广度与深度,又或说数量与质量呢?我的观点无疑是基于个人的视角,侧重于我自己的偏好和优先级。但经常有人问我类似的问题,我希望这能有所帮助。

反对幼稚的「效率至上心态」

首先,我经常看到这类讨论走向非常错误的方向:它们将问题框定为一个简单的优化问题。比如,「我怎样才能读尽可能多的书?」或者「每周我有十小时的学习时间,怎样才能学到尽可能多的内容,同时保持足够的深度?」

如果把这种态度太当真,反而会被它损害到真正的好奇心和创造力,而这些才是产生优秀作品、深刻洞察和(对我而言的)美好生活的基础。

当我读到我认为对我有意义的想法,而且其解释引人入胜时,我会想沉浸在文本中。我想知道如何深入探索,而不是想着怎样更快「读完」。

真正的问题在于,我的大部分非虚构类阅读都被我贴上了「仅仅有用」的标签。某篇论文可能不值得深入关注,但它确实在某种程度上帮助我实现目标。为了改进优化的框架,我们可以提出这样的问题:「如何为特定目标找到最美的见解来源?是否存在一条阅读路径,只穿过那些值得沉浸其中的文本?」

而这种新框架的问题在于,这样的阅读路径通常并不存在。 如果我试图触及某个问题的人类知识边界,我会发现许多关键想法零散地埋藏在成堆原本平淡无奇的资料中。当然,世界上有许多关于美妙想法的精彩文本,足以让我们终生沉浸其中,但如果我只读这些,浅尝辄止地了解千百个主题,那我就牺牲了我个人的创意兴趣。

另一个问题是,我经常不确定自己的目标什么——我在探索,跟随直觉,寻找与自己不成熟的兴趣共鸣的想法。我还没准备好沉浸到任何事物中。有时,这是因为我在闲暇时间阅读,那时候我有探索的精力,但不足以进行深入研究。

这两个问题都需要我在深度上做出妥协。现在我已经把这些问题放在一个有意义的背景下,我更愿意探索我们如何「优化」。如果我已经探索完当前目标下最吸引人的资源,或者我不确定我的目标什么,又或者在我精力不济时,该如何安排阅读以支持我的创意实践和对美的追求?

绘制领域地图

当我开始钻研关于阅读理解干预的研究时,我对这个领域还不太了解,连我想认真读什么都不清楚。最开始的一两周,我更多是在四处摸索,我的问题过于模糊,无法明确表述。在这段时间里,我当然没有深入学习。我翻阅了好几十篇论文,记着一些关键词、人名和概念(大部分都记在心里)。同时,我也在留意自己内在的反应(「真无聊!」、「有意思…」、「靠谱吗?」等等),这些都帮我更清楚地了解自己到底想知道什么。

在这段时间,我主要是优先考虑广度。我对自己很诚实:我知道我吸收的不多。我偶尔写些笔记和记忆卡片,差不多像是路标,但我的目标是大致绘制这个领域的地图。我想弄明白主要「领域」有哪些,它们之间怎么联系,以及在这些区域内的哪里可以找到主要的想法。最终,一些问题逐渐清晰,尽管它们仍然相当宽泛:

利用这些问题,我开始更细致地阅读那些在我的初步扫荡中显得「经典」的一小部分论文和书籍。这一轮阅读帮我进一步提炼问题和阅读清单。例如,我开始提出更为具体的问题,比如怎么将阅读理解缺口与记忆编码和提取问题区分开来。

随着问题变得更加明确,我梳理出了一份更好的参考书目,并开始更加细致的阅读。我确保自己能够完全还原关键实验的过程。我仔细理解理论框架的细节,以便将它们应用到我自己的问题上。

在这个过程中,我阅读速度的「动态范围」相当广。起初,我只是阅读摘要,每篇文章大约花费一分钟。几周后,我会花一两个小时来阅读一篇论文。一个月后,我会花上一两天的时间深入研究一篇特别好的论文。

我在文章开头谈到了两个问题:我常常感觉自己「应该」始终慢速阅读;而当我慢速阅读时,又会感到焦虑,担心覆盖的内容太少。我做文献综述的例子展示了我解决这些问题的一种方式。当我不确定自己的目标时,我没必要坚持慢速阅读。实际上,在这种情况下,我应该是浅尝辄止地阅读,尝试构建一个索引,去了解哪些内容是重要的。这种方式可以让我快速覆盖广泛的内容,并且以较低的成本锁定少数几篇更值得深入研究的高质量作品。当我的精力不足时,这也是一种有建设性的阅读模式。但关键是,我不会自欺欺人,以为自己在目标层面上真的学到了很多。一旦我对自己的目标有了更清晰的认识,我对这些具体问题的情感联系就会增强,这让我更容易安排出专门的时间进行慢速、仔细的阅读。然后,当我穷尽了最吸引人的资料来源时,最好的办法是再次提速,浏览更广阔的领域,直到我再次找到令我流连忘返的想法。

无需计较卡片数量

当我开始使用记忆系统时,我有一种长期优化者的焦虑:考虑到复习成本,我应该把哪些内容加入到我的记忆系统中?需要多详细?幸运的是,这些问题已不再困扰我了。现在,我认为复习时间基本上是「免费」的。我用几个例子来说明这一点。

《量子国度》的第一篇文章大约有 25,000 词,包含 112 张卡片,大约每 225 词就有一张。一般读者需要大约四小时来阅读这篇文章。根据目前的复习安排,他们在第一年大约会花一个小时来复习这些卡片,未来花的时间则会更少。

我最近为 Jim Hefferon 的《线性代数》教科书的第一节编写了一些卡片。这一节大约有 2,500 词,我写了 28 张卡片,约每 90 词一张。我的测试者读完这一节大约需要 45 分钟。我没有这些卡片的复习时间的长期数据,但根据我对类似文本的经验,他们第一年复习这些内容大概需要 15 分钟。

这些例子综合起来表明,记忆练习所需的额外开销大约只有原始阅读时间的四分之一到三分之一。这实在不足以让我担心。我最初的优化者焦虑认为复习时间会让学习成本增加一倍甚至三倍,现在看来这完全是多虑了。如果我发现某些材料很有启发性或可能有用,那么额外的四分之一或三分之一的时间几乎在所有情况下都是值得的。

相比之下,完成那个线性代数章节的习题集花了我大约 2.5 小时,是记忆练习「额外开销」的十倍。如果提供了练习题,我应该做多少题呢?如果这些题目跟我真正想搞懂的想法有关,那么它们就是珍贵的礼物;我的大致策略是,只要在解答过程中我很投入或感到惊讶,就继续做下去。

如果我宁愿多看 25% 的内容,也不想确保自己真正内化了我认为重要的细节,那通常有几种可能:

  1. 我对自己认为重要的内容还不太确定,正在浅尝辄止地浏览以绘制领域的地图。只要这是有意为之的,就没问题!

  2. 我低精力状态下阅读,暂时不想太费脑筋。如果我是为了消遣而阅读,那这样做也挺好。

  3. 我在自欺欺人,以为不需要额外的帮助也能「足够好」地理解和记住这些内容。对于我真正关心的想法而言,这通常不太可能。

实际上,复习的时间成本比我们之前讨论的要低得多,因为复习的时间很少与认真阅读的时间冲突。我在碎片化的时间里复习,比如排队、坐公交、等人的时候。那种时候我本来就不会去认真阅读。所以对我来说,复习时间更多是跟像刷推特这样的时间相竞争。

因此,我现在不再担心复习的时间成本了。但还有两个相关的成本值得关注。第一个是,虽然复习成本不高,但编写优质卡片可能会使我的阅读时间增加一两倍。现在来看,这是一个略带误导性的观察——很多时候,编写卡片的过程迫使我更深入地理解内容,还能帮助我建立起在没有写卡片的情况下不会想到的联系和阐述。假设材料是有意义的,那么这些时间都花得很值。但其中也有相当一部分时间的工作是机械呆板的,而且这个成本要比复习的成本影响大得多。(后面会进一步讨论。)

「复习时间成本」问题的另一个更为显著的版本是复习的情绪成本。例如,当我初次涉足一个新领域时,我通常不太清楚哪些内容重要,需要多少重复强化。几个月后,我常会发现自己被那些早期写下的、现在看来有些幼稚的复习卡片围困,我会觉得无聊,情感上脱节,想做别的事情。这当然不是我想要的复习环节的感觉。我并不担心复习每张卡片的时间成本;我更担心的是,那些不再合适的卡片可能损害我与复习之间的关系。

推进动力边界

在教育科技领域,设计师经常讨论如何推进学习的帕累托边界。也就是说,给定学习时间,并使用现有的最佳方法,你能在给定主题上学习到一定的深度。但如果我们能开发出新方法,就能提高这个上限,让你在相同的时间里学得更加深入。反过来,如果你想在某个领域达到特定水平,新技术可能会缩短最佳路线所需的时间。

我认为,把这个框架中的时间轴换成「动力」、「精力」或「热情」,会让它更加贴切。

相比传统抽认卡学习法,用算法安排的间隔重复系统,可以让我在给定时间内学得更多、更深入。但我不认为时间是限制我使用传统抽认卡的最主要因素。更关键的问题是,传统抽认卡很快就会耗尽我的热情。几个环节下来,大多数卡片我都记得很清楚的,基本不用再复习。但这种方法还是要求我翻遍整套牌组,回答每张卡片,确保那些难点卡片能得到强化记忆。间隔重复系统的指数级增长的时间表减少了(但没有消除)这种动力税。而且因为它让我专注于复习那些我更可能忘记的卡片,让我更加深切地感受到复习的价值,从而激发了我的动力。这些机制让我更愿意用间隔重复系统,而不是传统抽认卡。

我喜欢把播客和演讲的播放速度调到 2-3 倍。这主要不是因为我想快点「听完它们」,而是正常速度下,这些媒体传达的洞见不够频繁,没办法让我保持注意力。如果按原速播放,我往往会心神飘忽,或者想换别的东西听。速度控制是一项技术,它推进了我的动力边界:它让我在给定的热情水平上从这些媒体中收获更多。

像可汗学院这种个性化学习系统,旨在通过算法安排练习,让每个学生在给定时间内都能做到最合适的题目。通常看待这个问题的角度是从单位时间内学得更多出发,但我认为最关键的问题是动力。没有什么比一长串你已经能流畅解决的问题更能消耗热情了。而如果题目太难,远远超出你的水平,也会让你的动力大打折扣。现在,当我们从动力而非时间的角度来看这个问题,我们就会发现,优秀的解决方案将需要不仅仅是估计成功答案的概率。它需要我们思考,怎样才能安排一些对学生来说既有意义又有回报的活动。

我对助记媒介和最近我提出的基于高亮笔的记忆系统[1]特别有热情,背后也源于类似的逻辑。确实,写出优质的记忆卡片需要时间和专业技巧,但很多时候,更关键的瓶颈在于动力。要写出详尽的卡片,既繁琐又累人;在许多情况下,我编写的卡片远远少于我愿意复习的数量。我希望能够推进这个帕累托边界——以较低的动力税达到给定的学习深度,或者在给定热情水平下增加我的学习深度。

从做中学与「看书学习」

我从小就是个程序员。和大多数程序员一样,我特别喜欢「从做中学」。面对新的编程语言,我不会先去啃手册,而是直接动手尝试写点什么,遇到问题时再现学现用。这种方法对我来说有很多好处。它让我得到快速的反馈和奖励,让我的学习活动更贴近我真正的目标(编写程序)。当我确实需要「看书学习」时,我也更有动力,因为那是为了解决我遇到的具体问题。而且,实际动手的过程在认知上也很有帮助:要在实践技能如编程方面建立流畅性,我们必须在许多经验中归纳并学习模式。

哪些材料可以用这种方式学习?这种学习风格会带来哪些问题?我还没有好的答案。目前,我只能分享一些粗略的观察。

我十几岁就开始写 C 语言,但总是遇到程序因为「错误的内存访问」崩溃的问题。我花了好长时间盯着代码,试探性地修改程序,想找出 bug 的原因。但我完全摸不着头脑。原因是我根本就不懂指针和内存分配这些概念。我写指针就像照搬,把别的程序里的代码复制过来用,自己却不知道它们是干嘛的。光靠「尝试写程序」是解决不了这个问题的。我需要静下心来好好学习这方面的概念知识,这些在我有的几本书里都讲到了,但我以前都没怎么看。不幸的是,那时候我已经养成了不好的习惯:依赖从做中学,没耐心去研究艰深的概念性材料。我用了好几年时间才慢慢补上这些知识漏洞。类似的问题在我后来「学习」OpenGL 的时候又出现了,那时我主要是通过模仿教程里的代码来学。尽管我有很多概念上的漏洞,但我还是做出了一些复杂的游戏。但越来越多时候,我遇到了难以克服的障碍。后来在大学,我自己实现了一些机器学习系统,但对它们如何运作一知半解。不久,我又陷入了困境,不知道问题出在哪里。

这个故事的寓意并不是说,在动手做一些严肃的项目之前,我应该先从头到尾读完一本教科书。实际上,那些动手实践的工作确实激发了我对这个领域的热情,并且也让我掌握了一些真正的技能。如果有一个导师能直接告诉我:「噢,你遇到困难是因为你不懂指针。读读这几页书,然后我们聊聊,我再建议你接下来看什么。」这样我就不用再沮丧几年了。

我的编程故事之所以可能,因为编程是个特殊的领域,哪怕你懂得很少,也能开始做些有意义的事。烹饪也是如此。有这种特性的主题特别适合从做中学。学习的问题大多变成了如何安排一些辅助活动,来弥补在理解概念上的空缺。根据我的经验,最可能的失败模式是,我在概念学习上花的时间太少,因为我无法觉察自己的知识缺口带来的影响,或者无法看到获得某些理解的潜在价值。

另一方面,对于大多数主题,我开始深入研究前,都需要一定程度的「看书学习」。面对这种情况,我有自己的一套方法。

一种方法是,我把最初的「看书学习」当作是画地图。我先粗浅地阅读,弄清楚我想做什么项目,需要学哪些东西才能做起来。这样一来,我再去深入阅读这些片段,相信我会得到一些有意义的活动作为回报。

还有一种方法是让自己爱上那些概念本身。我之前对数学不太感兴趣,主要是因为我只接触过糟糕的数学书和教师。我把数学当做工具,就像是为了编程而不得不吃的西兰花。但后来,我遇到了充满美感和震撼的数学讨论,发现自己很容易沉浸其中,不再需要特定的项目作为动力。我多希望早点遇到这样的数学呀。

大家经常问我,记忆系统真有必要吗?如果某个想法真的重要,难道不是自然就会在工作中用到吗?如果不重要,忘了不是更好?我常用的几个回答其实和之前的讨论有关:

  1. 很多时候,自然的学习环境并不会明显地暴露出我们对某个概念的理解漏洞。即便你现在对某个概念掌握得很好,但这种环境也不一定能全面巩固你的理解,尽管这些细节将来可能派上用场。

  2. 记忆系统能帮你更快地「启动」,达到能自然运用这些知识的水平。

  3. 当你觉得某个想法很有趣或引人深思时,即使你目前的项目用不到它,深入探究它本身也是有意义的。

但我认为,这些反对意见也揭示了记忆系统的一些重要问题。复习往往感觉枯燥乏味,跟我真正感兴趣的事情没什么关联。很经常,对某个想法的讨论让我着迷,但当记忆系统里的相关卡片出现时,我却提不起兴趣。而且,跟技能有关的练习似乎效果不佳,可能是因为我并不是在实际使用这些知识的环境中进行练习。我认为,无论是更熟练地运用现有系统,还是创造新的系统级改进,我们都有可能解决这些问题。

————————

我要感谢 Michael Nielsen、Alec Resnick 和 Gary Bernhardt,他们以前的很多讨论让我对这些观点有了更深的理解。还要特别感谢 José Luis Ricón,他的文章《大量输入和/或间隔重复》激发了我就这个主题写作的灵感。最后,还要感谢 Nick Barr,他提出的「虔诚学习」这个概念,我在这里有所借鉴。


Thoughts Memo 汉化组译制
感谢主要译者 YunnyYin、GPT-4,校对 Jarrett Ye
原文:On breadth vs. depth in learning | Patreon

参考

1. 高亮引导的实践与理解辅助 ./667239548.html

← 返回目录