诺贝尔奖得主 P.B. Medawar 曾在其著作《给年轻科学家的建议》中写道:「任何年龄的科学家,若想做出重要发现,就必须研究重要问题。」但什么样的问题才算「重要」?当你遇到它时,又该如何识别?答案并非来自书本,甚至无法通过明确的教导习得。更多时候,它是在榜样身边耳濡目染,通过导师不经意的嘟囔、偶尔的抱怨、会心的微笑、不满的皱眉和惊喜的感叹,在年复一年的紧密合作中,潜移默化地传递给门徒。(引自《天才的学徒》)
今年十月初,Ben Reinhardt 发布了下面这张图。它展示了「入门一个领域」的两种方式:一种被认为是「正道」(与人交流,即外圈),另一种则被描绘成一种误区(只顾埋头读核心论文)。「入门一个领域」可以有多种含义:它可以指学习该领域的具体内容,了解其学术圈生态(比如哪些是前沿方向、有哪些顶尖实验室、发展史如何),或是学会如何真正在这个领域开展研究。
作为一个正处于「内圈」的人,我认为很有必要就此展开讨论。随着思考的深入,这篇文章最终演变成了一篇关于隐性知识本质的、漫谈式的长文。如果你读完后仍不确定我的核心观点,别担心:文末的结论部分会逐条列出。本文大量使用了案例和类比,所有必要信息都已在文中附上链接,所以请大胆点击!如果你想直接看内容摘要,那就是:成为专家需要获取一定程度的个人私有知识和隐性知识。专业知识无法仅通过口头解释来传授。通过接触大量附带背景信息的实例,可以加速成为专家的过程。我们目前尚未充分利用这一方法,应当进行更多实验,探索其潜力。本文所描述的是一个有待验证的假设,我将为其可行性提供一些间接证据。
Ben 并非唯一一个推崇「与人交流优先」学习法的人:在同一条推文中,Alexey Guzey 也加入讨论,认为学习应该遵循 90% 与人交流、10% 阅读的比例。这并非因为书面文字在媒介上有什么天然缺陷。当然,有些人就是有阅读困难,比如 Rob Wiblin。但 Ben 和 Alexey 的观点则更进一步:是否存在某些知识,只有通过与专家交谈才能获得?或者说,通过与专家交谈,获取某些知识的速度是否会更快?

图 1 正在做研究的 Ben Reinhardt
需要说明的是,我并非只读论文,Ben 也不是只和研究人员交流(图的顶端就画着一个「正在读论文」的 Ben)。显然,读论文和与人交流都大有裨益。
那为什么我们要选择与人交流,而非仅仅阅读呢?阅读在信息获取速度上占有优势:我没见过谁说话比我读书还快。阅读还能整合图表、链接、表格和引用。更妙的是:你可以随心所欲地跳读,同时打开多个文档,来回翻阅,涉猎的知识远超任何个人大脑的容量;你也可以深入钻研某篇论文的细节,寻找相关的前沿工作。这些操作都很难在一次视频通话或一场线下会议的有限时间内完成。
然而,「阅读优先」的方法意味着,起初你可能要花很长时间才能弄明白一个问题,而这个问题若请教专家,可能只需几秒钟。举个例子,假如你只想知道「雷帕霉素能否延长小鼠寿命?」,要读懂相关文献可能得花上几个月。当然,你可以快速用谷歌学术(或普通谷歌)搜一下,找到一堆论文,但你对这些论文的可靠性又有多少把握呢?而与专家通个电话,你不仅能立刻得到答案,还能了解答案背后的逻辑、学界的争议(是否只对某些品系的小鼠有效?对人类是否有效?)、以及你最初未曾想到的考量或假设(比如雷帕霉素类似物(rapalogs)的概念,或是不同给药方案可能会影响结果),等等。你无法质问一篇论文,但你可以向专家提问(正如 Ben 所说,在对话中)。
当然,与专家的这种一次性交流也自带不确定性:你找的专家靠谱吗?他们自身是否存在需要被考虑进去的偏见?如果不同专家的说法相互矛盾怎么办?这种交流并不能让你入门一个领域,你获得的仅仅是关于雷帕霉素这个分子的一点零散知识。在这个具体案例中,「先花 10 分钟上网搜索,找不到答案再求助专家」的策略似乎是可行的,但前提是你得具备一定的背景知识,能够快速地查找和整合研究资料。
再举一个更复杂的例子:假设你想知道自己每天应该摄入多少盐。用谷歌搜索,答案是每天 2.3 克(FDA 指南)。但你当然不满足于此,于是继续深挖。你运用了逆向思考的策略(常识是盐吃得越少越好),试图寻找证据证明盐摄入过少也可能有害。你确实找到了一些 相关的 研究,甚至维基百科也有提及,它们显示盐摄入量与健康风险之间存在 U 型关系,或许合理的摄入量比官方指南建议的还要多。你感觉自己既得意又聪明。你咨询了一些医生,他们也含糊地提及了盐摄入与死亡率之间的 U/J 型关系。但不久后,你读到了一篇新鲜出炉、热气腾腾的元分析,Twitter 上的 Stephan J. Guyenet 对其进行了解读和背书,再次确认了主流观点:盐还是吃得越少越好。这便是我会采信的答案。但在这个问题上,我占了先机,因为我早已做足功课,找到了该领域值得信赖的专家(碰巧,我另一位信赖的营养学专家也与 Guyenet 的观点一致)。在这种情况下,能否得出正确结论,取决于你解读原始文献和寻找优秀专家的能力。但要注意,对于这种只探究两个变量之间关系的简单问题,我们其实不必亲自与专家对话,阅读他们写的简要分析就足够了。这些分析既会引用原始文献,也会解释不同研究结论之间产生矛盾的可能原因。从某种程度上说,这比直接对话更优越:专家们不大可能凭记忆引述所有相关论文,也无法立刻指出你早上刚看到的那篇结论相左的论文究竟问题何在。一个绝佳的例子是 Gary Taubes(「碳水有害论」的支持者)与 Guyenet(认为适量摄入碳水无妨)的一期播客。Guyenet 准备极为充分,他带来了一份论点和相关文献的清单,可以随时指出自己早已在何处预先回应了可能出现的反驳。现在,想象一下与他们二人对话,和阅读他们的著作,或是撰写一份关于他们观点的最佳证据综述,三者相比,显然阅读能带来更深刻的理解,但不一定能更快得到答案,而且肯定耗时更长。
然而,以上两个例子都还很简单,远未达到「入门一个领域」的层次,它们都只是关于非常具体的问题。如果我们想知道的是:这个领域有哪些悬而未决的问题?或者,什么样的项目能推动该领域的发展?诸如此类的问题,上面那些链接是给不出好答案的。通常,简单的谷歌搜索无法解决这类问题,你也无法通过阅读专家分析走捷径。你必须真正地掌握这个领域,而要做到这一点,确实需要获取那些更难通过阅读论文找到的知识。
1 隐性知识
对于「隐性知识」的含义,可谓众说纷纭。但广义上,它指的是那些极难获取的知识;狭义上,它特指那些内化于个人(或群体)之中,且无法被完全言传的知识。在后一种定义下,一个关键点在于,即便与专家对话,你也无法获得那种知识。一个典型的例子是骑自行车:你可以花上几个月埋头苦读骑行理论,或是与环法自行车赛的冠军们视频连线,但这并不能保证你第一次跨上自行车就能熟练骑行。隐性知识或许很难甚至无法从专家处直接获得,但这并非全然是坏事,因为在很多情况下,我们并不需要它。如果你只是想得到一个问题的确切答案,那么咨询一个专家组(只要他们对答案能达成共识)便能得出一个相当可靠的结论,即便我们并不完全清楚专家们在给出判断时所依赖的完整推理链和具体证据。
与专家交流的价值,并不仅仅在于他们拥有隐性知识。在之前的例子中,专家或许知道雷帕霉素是否有效的正确答案,但这恰好是一条公开信息(一种公共显性知识)。专家还掌握着私有的显性知识,这些知识可能非常重要,也是我们通过与专家的一次性通话所能获得的主要信息。他们可能会告诉你:「三十年前那篇看起来很有前景的论文?哦,我一个朋友当时就在那儿,他说里面的名堂多着呢,你去问问那个实验室出来的人,谁都会这么说。」
在理想世界里,我们应该能通过阅读后续的重复或拓展性研究来了解这些内幕,但现实往往并非如此。这类私有知识与纯粹的隐性知识不同,一旦我们获知,便可以将其公之于众,之后任何人都能毫不费力地学到,无需再找专家。像 Pubpeer 这样的平台,正是试图通过提供一个集中的科研成果评议(通常是批评)数据库,来规模化地传播这类知识。
为了本文的论述,我在此对相关知识做一个简要的分类。这个分类体系基于两个维度:第一,我们能否在没有导师的情况下规模化地学习该知识?第二,专家能否在不亲身示范的情况下教会你?
- 显性知识
- 公共知识
- 私有知识
- 隐性知识
- 公共知识
- 运动技能
- 智力技能
- 私有知识
- 社会性知识
- 个人知识
1.1 显性知识
1.1.1 公共知识
这些是唾手可得的事实,无需赘言。比如「英国的首都是哪里?」或「特斯拉今天的市值是多少?」,上网一查便知。
公共显性知识的问题在于,其数量浩如烟海,而其中真正有价值的部分,解读起来却并不简单。就像前面提到的盐摄入量与死亡率的关系一样,世上并不存在一个能自动吐出颠扑不破的真理的神谕。在某些情况下,要正确解读已有的公共知识,甚至仅仅是找到它们,都需要相当数量的其他类型的知识,其中不乏隐性知识。
1.1.2 私有知识
有些知识若有人愿意传授,其过程并不困难,但传授者可能缺乏这样做的动机,因此这些知识便停留在了私有领域。例如,在设计一项科学实验时,了解各种试剂、耗材和设备的价格会很有用。许多价格可以在网上查到,但另一些则隐藏在「联系销售」的按钮背后,或是需要你发邮件给某个关键人物才能问到。如果你身处相关社交圈,给同事发条信息就能轻松搞定。这些知识本可以公开,但由于激励机制的问题,现实往往并非如此。在定价的例子中,供应商可能会要求购买方签署保密协议(NDA),以防价格信息外泄。
1.2 隐性知识
Harry Collins 和 Robert Evans 在他们的著作《反思专业知识》中,将隐性知识定义为一种只有通过社交方式完全沉浸在拥有该知识的群体中才能获得的深刻理解。这是一种可能的定义,但就本文的目的而言,它过于狭隘。Collins 和 Evans 所说的隐性知识,大致对应我这里的个人私有隐性知识。需要注意的是,他们所说的「群体」也可以小到一个具体的人(例如在师徒关系中)。
1.2.1 公共知识
第一类隐性知识,我称之为公共知识,意指一个人可以利用公开可得的信息习得相关技能,而无需教练、导师或学徒的指导。
我将这类技能分为两组:运动技能和智力技能。在现实中,这两者的界限并不清晰,但大致上,你可以把「运动」想象成骑自行车,把「智力」想象成所有那些看起来像坐在电脑前敲键盘的活动。一个混合型的例子是乐器演奏,它既需要极其精細的运动技巧,也需要对何为动听音乐的感悟。你可以请老师来学乐器,但坊间流传,许多著名的吉他手都是自学成才的。
1.2.1.1 运动技能
有一种隐性知识,你必须亲身实践(而非纸上谈兵或与专家空谈)才能掌握。一位自行车理论家,即便花了一年时间研究理论、与专业车手交流,也别指望第一次尝试就能熟练骑行。但与此同时,一个人完全可以自己学会骑车。如果你观看这个视频,就能看到一系列能为你指明方向的步骤。你依然需要亲自练习,但视频提供了足以让你学会这项技能的指导。
然而,这类涉及新颖动作或精细运动协调的知识,并非本文关注的重点——大多数知识工作的核心。
1.2.1.2 智力技能
这方面的一个例子是判断食物(比如牛排或法式咸派)是否熟得恰到好处。经验丰富的厨师一眼就能看出火候,但若要他言传,他可能会指着食物表面说,要出现一些褐色的斑点,但又不能太多,或者要闻到某种特定的香气。尽管这种知识难以言表,我们仍然可以在一定程度上把它教给别人——在这种情况下,通过视频。反复观看别人烹饪的过程,能让你对「恰到好处」这个概念产生直观感受。这是一个简单的例子,说明了即使专家无法将其完全语言化,隐性知识依然可以被规模化地传播。这也揭示了实现隐性知识规模化的一个关键因素:是否存在可供我们观察的外部产物。一段某人冥想的视频,并不能教会你多少冥想的法门。
属于此类的技能还有国际象棋(我们有棋盘这一外部产物)或写作(其产出是可供阅读的文本)。
1.2.2 私有知识
这类知识只能通过学徒制和/或深度融入一个实践社群才能获得,它需要有人来传承。和私有显性知识一样,其「私有」属性并非必然是其内在特征。但假设我们能克服激励机制的障碍,真正与多位专家坐下来探讨,我们能否将私有隐性知识转化为一种适合个人学习、并因此能够规模化的形式呢?这是驱动本文写作的核心问题之一,但在回答之前,我们还需要绕一些弯路,看几个例子。
1.2.2.1 个人知识
这正是 Collins 和 Evans 在其定义中所指的那类知识。要获得它,仅当学徒还不够,你必须融入相关的社群。个人私有隐性知识是你作为学徒能够获得的知识。我想到的一个例子是,学习如何模仿某位小众艺术家的风格来设计玻璃雕塑,而这位艺术家的技艺并未被录像记录下来。
1.2.2.2 集体知识
这类知识很特别,它并非内化于知识工作者网络的「节点」(即个人),而是内化于网络的「连接」之中。它与其他类别的根本不同在于,知识不存于任何人的头脑里(因此任何学徒制都无法让你习得),而是内化在整个组织或体系中。举个例子,我敢说台积电的 CEO 并不完全知晓台积电的运作方式,也没有任何人能确切了解生产一支平平无奇的铅笔所涉及的全套流程。但不知何故,整个经济系统却做到了。与运动技能一样,这类知识也超出了本文的讨论范围。
在本节结束前,我想通过一个例子来简要探讨集体隐性知识,阐释它是什么,重建它有多么困难,以及我们通常如何看待这类现象。
1.2.2.2.1 Fogbank
假设你雇来一支由顶尖物理学博士组成的团队,他们对制造核武器一窍不通,然后你让他们设计一个。他们能做到吗?根据 Rohit Krishnan 最近一篇文章中提到的真实世界实验,答案似乎是肯定的。即便我们对这份报告心存疑虑,我认为只要让他们自己进行一些反复试验(他们毕竟只是设计,而非亲手制造),也终将走上正轨。但 Rohit 紧接着提到了 Fogbank 的案例:这是一种用于制造核武器的材料,最后一次生产是在几十年前。当人们试图重新制造它时,尽管手握原始的生产说明,甚至能与当年的项目成员交流,整个过程依然耗费了数年时间和数百万美元。结果发现,关键在于生产过程中无意间混入的某种杂质,而最初的团队中竟无一人意识到这一点!
有趣的是,这与 Collins (2001) 描述的案例极为相似。当时,美国的科研人员试图复制苏联同行对蓝宝石样品某个参数的测量,却屡试屡败。后来才发现,要想获得可比较的测量结果,关键在于:
Checkhov 演示了第二种给丝线涂抹油脂的方法,并与第一种交替使用,那就是直接用人体油脂来润滑。Checkhov 会将纤细的中国丝线在他的鼻翼两侧或耳后轻轻划过。格拉斯哥的研究小组采用了耳后涂抹法,但结果发现,并非每个人的皮肤都适用。事实证明,有些人的油脂非常有效可靠,有些人的则时灵时不灵,还有些实验员的皮肤太干,根本没用。所有这些都是通过反复试验才发现的,并催生了诸如「悬挂组 3:使用弗雷德的油脂润滑俄国丝线;悬挂组 12:从乔治的油脂换回弗雷德的油脂」这类不同寻常的实验记录。这不禁让人想起詹姆斯·焦耳对热功当量的著名测量——实验员的身体本身,似乎也可能成为一个至关重要的变量。
这个蓝宝石的例子被广为引用。Ben 的笔记以及大多数相关的讨论,都聚焦于论文的中心思想:有效传递隐性知识需要人际互动与信任。但论文的结论几乎同等重要:Collins 其实指明了前进的方向!我们不必满足于漫长而昂贵的反复试验,我们本可以做得更好:
报告一种「技能的二阶衡量标准」:如果我们能认识到并强调「了解一项实验技能或流程的难度」本身的重要性,科研工作会变得容易许多。传统的科学期刊论文(乃至书籍)的写作范式,往往会忽略这类细节。然而,对于一个无法亲临实验室、只能自己摸索着重现某个结果的人来说,如果能知道这项实验或测量最初做起来有多难,以及现在做起来依然有多难,那将会是巨大的帮助。这类信息可以被大致量化——我称之为「技能的二阶衡量标准」。实验者可以记录如下内容:
「我们最初花了大约 17 个月才得出这个结果,期间我们用不同的实验装置尝试了约 165 轮,每轮耗时约一天。如今,对新样品进行成功测量通常需要 7 轮左右,范围在 1 至 13 轮之间;每轮耗时约 2 小时。下图展示了我们最近测量的 10 个样品的实验轮次分布情况……」
这类信息无需从根本上改变传统的科学论文写作风格,只需简短的篇幅即可呈现,却能为那些试图复现工作的人带来莫大裨益。这无非是承认一个事实:大多数现在看似简单的事情,在最初都曾无比艰难,而有些事即便对经验丰富的实验者而言也依然不易。我们当然承认,在当前的科研写作惯例下,坦陈这些困难会被视作软弱的表现;人们习惯于将科学描绘得毫不费力,而学术界公认的风范也强化了这一印象。我们所建议的,正是对这种惯例和风范稍作改变——以期改善科学知识的传播。
这只是改进科学写作以方便成果复现的一种方法,但我们还可以构想更多其他方法。
对 Fogbank 的讨论也是如此:人们承认了其核心教训(隐性知识真实存在,且极难传递!),但这种承认是如此彻底,以至于将「困难」渲染成了「不可能」,结果便是无人再去提出解决隐性知识传递问题的方案。我们不应仅仅惊叹于隐性知识那错综复杂的丰富性,对其存在心怀敬畏。相反,我们应将隐性知识视为一个有待攻克的挑战!
2 案例分析
2.1 生命科学中的隐性(及私有)知识:以 Rejuvenome 项目为例
一个人可以找来一本分子生物学教科书啃读,从而掌握该领域的种种事实。但这是否意味着他就成了一名分子生物学家呢?并非如此,因为真正从业所需的知识,是另一码事。
举个简单的例子就明白了:假设你偶然拿到了一篇题为《单一组合基因疗法可治疗多种增龄性疾病 (2019)》的论文。你读完后,只要记住了论文的字面内容,便能回答以下问题:
- 论文作者是谁?
- 递送了哪几种基因?(FGF21、Klotho、sTGFbR2)
- 基因是如何递送的?(通过腺相关病毒 AAV,每种病毒携带一种基因)
- 哪项测试表明该疗法对某种疾病有效?(葡萄糖应答得到改善)
但还有第二类问题,如果你博览群文,或许能答上来,但若只读过这一篇,则会一头雾水:
- 递送这些基因还有哪些替代方法?
- 论文中使用的测试方法足够「好」吗?其结论站得住脚吗?
现在,更进一步。即便你对这篇论文的来龙去脉了如指掌,讨论起来足以冒充业内专家,但若让你在没有任何帮助的情况下,亲手重复他们的实验,你做得到吗?能做到和他们分毫不差吗?恐怕不行。你越是尝试去设计这个实验,这一点就越清晰。例如,你得给小鼠喂食,但论文只说对照组吃的是「正常饮食」,具体是什么,你只能自己猜。当然,你也可以去问作者(答案是:正常饮食指的通常是 NIH-31 这类标准饲料)。再比如,你能在未经训练的情况下,按照论文描述的方式(眶后注射)给小鼠注射病毒吗?你该用哪种麻醉剂?(论文没说;异氟烷可以吗?)做 qPCR 定量时,温度和时间参数又该如何设置?(论文也没说)。
但有一种信息,除了直接问作者,你用任何方法都无从知晓:这项研究当初为何要这么设计? 为什么偏偏选这三种基因?他们又为何要检测这些特定的指标?[1]
这里的知识显然存在一个层级结构:
- 学习核心事实(论文摘要和结论里的内容)。
- 了解事实之间的内在联系(例如,一个领域包含哪些子领域,某个技术选择有哪些替代方案,这项研究在该领域中处于什么位置)。
- 学习知识最初是如何产生的(深入到「方法」部分,一直追溯到具体的实验设备和操作)。
- 学习设计全新的实验。
第四层是最难被完全言传的。因为到了这一步,你已身处知识的前沿。在这里,你所依赖的「事实」,与其说是公开发表的成果,不如说是从某个同行的实验室里听来的小道消息,或是别人发给你的一些附带着「切勿外传」叮嘱的、尚未发表的 .csv 数据文件。
下面是关于第四层的一个具体例子:在设计 Rejuvenome 项目(该项目最终落地 Astera 研究所)时,一个核心的设计考量是使用遗传异质性的小鼠。通常,实验小鼠都是近交系的,通过连续多代的兄妹交配,最终获得基因完全一致的种群。为何要这样做?教科书上的理由是,统一的遗传背景可以降低实验的变异性,从而更好地控制变量。然而,这也可能导致某种疗法只对特定品系的小鼠有效,缺乏普适性。比如,某个品系的小鼠可能极易患上某种癌症,那么针对该癌症的疗法就会显示出夸张的延寿效果,但这种效果难以推广。正是基于这种考量,衰老研究领域的干预效果测试金标准——干预测试项目(ITP)——选用了名为 UM-HET3 的遗传异质性小鼠。但这种小鼠也有缺点:在当时,你必须自己繁殖,然后还要花 18 个月等它们衰老。基于 ITP 的权威性和以上推理,我们在 Rejuvenome 项目的最初草案中也选用了这种小鼠。在那个阶段,我对于它们该如何饲养(答案:大约 5 只一笼)或该喂什么(答案:这种饲料)一无所知,但我知道 ITP 也在做类似的项目,所以答案肯定在某个地方。因此,这些细节被当作「区区」执行层面的问题,留待日后解决,并不影响研究的顶层设计。
然而,在初始阶段过后,通过与领域内专家的交流,我们学到了一些仅靠读论文无法获知的新情况:
- 有些人认为「基因一致 = 变异更小」的论点其实是错的。他们认为,基因一致性反而使小鼠更脆弱,使其表型更多地受到环境因素的影响(如果效应 = 基因 + 环境 + 交互作用,那么交互作用这一项会变大),从而放大了噪音。这一观点并非学界共识。
- 存在其他类型的远交系小鼠,比如多样性远交系(DO)小鼠。这自然引出了一个新问题:我们是否该用那种小鼠?
- 不久后我们又了解到,雄性 DO 小鼠非常神经质且极具攻击性。既然雌性可以 5 只一笼,那如果雄性必须单笼饲养,成本和操作将如何变化?我们是否应该退而求其次,选择性情更温和的 HET3 小鼠?
- 有些研究者干脆选择只研究雌性小鼠。那些只使用雌性 DO 小鼠的论文,并不会解释为何只用雌性。事后看来,这是因为一个未被披露的事实(作者私下告诉我们,但没写进论文:他们认为雄性 DO 小鼠太具攻击性,难以管理)。
- HET3 小鼠的寿命数据是公开的,但 DO 小鼠的不是。我们是通过四处打听,才从一项即将发表的研究中拿到了一份 .csv 数据文件。而寿命数据对于计算样本量和统计功效至关重要。
- 我们计划对血液样本进行各种「组学」分析。但每种方法需要多少血量?一只小鼠总共有多少血?(1.7-2.4 毫升)多久能采一次血?(每月一次)这些信息不完全算隐性知识,大多是公开的,甚至有操作指南和视频。但在一开始,这些看似微不足道的细节根本没进入我们的考量,这意味着诸如「多少只小鼠、多久采一次样」、「是否对同一批小鼠进行连续采样」乃至「样本是否需要混合」等非常具体的问题,我们都未曾思考。而其中一些问题,足以影响整个研究设计!
- Altos!Altos Labs 的成立是当年该领域的一大新闻。但在圈内,人们其实已经谈论了好几个月。在各种线上研讨会和问答环节,你会听到有人提及一个由「某位」亿万富翁发起的、名为「银河基金会」的新机构。各路PI(项目负责人)也会偶尔提到自己拿到了他们的资助。这类知识并非关于衰老研究本身,而是关于这个研究领域本身,绝对不可能只通过读论文获得。甚至,如果你在圈子里不够资深,让对方觉得你还是个外行,那么即便你主动去问,也未必能问得出来。
- 衰老研究的某个子领域有一项很有前景的研究,显示了显著的延寿效果,但其普适性并未被学界完全接受,因为它用的是早衰(「快速衰老」)小鼠,所以这种干预可能对正常小鼠无效。领域内的许多人都想知道,如果在正常小鼠身上重复这个实验,结果会怎样。一次,我与该领域的一位科学家喝咖啡,在闲聊时他无意中向我透露,这个实验其实已经做完了(结果也有了),只是尚未发表。这个信息会让你对该干预的热情有所降温,而这对研究设计有直接影响:我们原本计划在 Rejuvenome 项目中亲自重复这项研究,但现在我们可以根据这项前人的工作,来决定是放弃还是在其基础上进行改进。
上述这些信息,大多数其实是私有显性知识,而非隐性知识,但在实践中,两者的界限往往是模糊的。没错,理论上,你所有关于研究设计的问题,答案都存在于某位专家的脑海里,只要你问,他们就能告诉你。但问题是,你根本不知道该问什么。 而知道该问什么问题,本身就是一种隐性知识。 一个研究设计的新手(比如最初的我),听到「我们准备对血液样本做 X、Y、Z 检测」,大概只会点头称是。而一个专家则可能会立刻反问每项检测各需多少血量,因为 X、Y、Z 听起来实在太多了。专家并非刻意去思考这个问题,而是随着专业能力的提升,那些关键问题会自然而然地变得更加凸显。
回到之前提到的 DO 小鼠的攻击性问题。其实你从这里就可以查到它们可能很神经质,雄性可能极具攻击性。神经质这一点,也可以从其他公开文献中了解到。至于雄性因攻击性强而需要单笼饲养(通常可以 5 只一笼)这件事,事实上本可以从公开渠道查到,但我们当时没有。直到有人告诉我们,这个问题很关键,我们才意识到。
然而!即便有了这些以及其他许多发现,最新版的 Rejuvenome 计划看起来依然与最初的设想非常相似。总的来说,我所获得的隐性知识更多地是扮演了微调的角色,而非为研究的核心愿景指明方向。
2.2 会议中的隐性知识
会议向来是众矢之的,鲜有拥趸。高效地主持会议,本身就是一种隐性知识。我们当然可以从中提炼出一些原则,但我认为仅仅陈述这些原则并无大用。举个例子,有人建议开会前要准备议程。初听此言,你可能会想:「何必多此一举,我们即兴发挥不就行了?」 对方可以进一步解释:「你需要议程,否则你想讨论的话题很可能被遗漏,会议容易跑偏,而且在会中临时调整议题的优先级只会更难。」 但即便如此,你心里可能还是会嘀咕:「我没那么笨,肯定能处理好。」 这种情况在生活其他领域也比比皆是。难道我们非得亲身经历失败,才能真正理解某些规范和框架存在的意义吗?
反过来说,即便你认同「如果会议陷入了兜圈子,就该出手阻止」是显而易见的道理,这种纸面上的认知也并不意味着你届时真会采取行动。至少以我个人经验而言,很多次我都是在会后才意识到会议一直在原地打转。随着经验的积累,我开始能在会中通过一些信号捕捉到这种「兜圈子」的状态:一种不安感(「这会开得不对劲」)、一种不耐烦(「这话我听过了」),以及一种疑虑(「我们是不是在重复自己的话?……或者,对方只是在进一步澄清?」)。渐渐地,你对何时该点明问题,何时该保持沉默(让大家继续澄清、权衡、补充信息)的判断会越来越清晰。最终,你会开始思考如何从根源上避免这种情况,研究那些令人沮丧的对话究竟为何发生,并总结出像我在这里描述的那套方法。关于如何高效开会,我并无新意可补充(虽然我可以另写一篇总结)。但在思考这个问题的过程中,我意识到,在给出建议时,解释其背后的缘由往往至关重要;而在接受建议时,则需要足够谦卑,有时甚至要刻意压制自己的理性判断(「我更懂;我看不出自己错在哪里」),而去选择相信一条原则(「在这种情况下,专家通常是对的」)。[2]
2.3 背景调查中的隐性知识
好吧,我作弊了,其实还有第三个例子,不过这个很简短。投资人 Graham Duncan(此处有其简介)写过一篇关于招聘的文章,题为《这个人,到底是怎么回事》,其中极力强调获取推荐信息的重要性。在文末,Duncan 给出了一份背景调查指南,包括该问什么问题以及如何面试。这便是作者试图将自己头脑中的经验提炼成的显性知识。读完这篇文章(以及 Commoncog 的简介),我彻底改变了对背景调查的看法。过去我认为:「何必做背景调查,推荐人肯定有偏见。」 现在我认为:「潜在的偏见中必然夹杂着某些真相,只要问对问题,就能挖掘出部分真相。通过向多人提出正确的问题,我们便能交叉验证,还原出这个人的真实面貌。」 但即便如此,我依然不知道该如何做出 Duncan 水准的背景调查!
2.4 广义上的科学文献中的隐性知识
科学知识的总量,远超某个领域所有已发表论文的白纸黑字。但与此同时,一组论文作为一个整体所蕴含的知识,也远超这些论文文字内容的简单相加。如果你读过这条推文,或许能体会到这种感觉:你读完一篇论文,明白了它的意思,但同时(基于过往经验)你也清楚,这种理解是非常浅薄的。去年我写过一篇关于理解生物学的文章,试图解释如何从这种浅薄走向更丰富的理解。当你读了足够多的论文后,你会开始注意到那些论文并未明说的东西:比如某些概念被提及的频率、哪些实验室倾向于发表何种类型的研究、哪些研究方法更为流行、某篇论文(与其他论文相比)是否严谨,甚至某个结果是否先验地可靠(例如,这个领域是充满了矛盾的结论,还是无论怎么测结果都一样)。阅读科研文献,就像我稍后要讨论的语言学习一样。你是在利用一篇篇论文作为数据点,来构建你对这个领域的模型。你的任务不是记住某篇具体的论文(毕竟它可能是错的),而是构建一个能让你预测论文内容的模型。举个简单的例子:如果一篇论文声称 A 与 B 相关,另一篇声称 B 与 C 相关,文献中可能从未提及 A 会导致 C,但如果你已经建立了 A→B 和 B→C 的认知,你便可以推断出 A→C 的可能性,并着手去寻找相关证据。
3 分享隐性知识
隐性知识无法通过口头或书面语言直接传授。我们可以用各种方法将其提炼、暗示,但仅此而已。但这并不意味着专家一旦故去,这些知识就注定失传:隐性知识依然可以被后人习得。问题在于,并非所有可教的东西,都是可解释的。专家可以内省,总结出一些试图捕捉其知识精髓的规则和原则,但那并非知识本身。这便是为何我们可以阅读那些顶级专家写的书,却依然无法达到他们那样的高度。
但在「让专家写下他们的知识(然后失败)」和「拜专家为师」这两种极端之间,一定存在某种中间地带。我们该如何加速一个领域的学习进程,促进其中隐性知识的传播?我认为,答案是让学习者接触一个包含专家实际表现(或范例)并附带情境的资料库。与其让专家写一本关于如何面试的书,不如让他看上几十个小时专家亲自面试的录像。专家并非在解释如何面试,而是在做这件事。这似乎是「坐在专家旁边当学徒」最接近的替代方案。录像很可能捕捉到了绝大部分的关键信息。软件工程的精通,或许也能用类似的方式传授。我推测,对于科学研究技能(如研究设计、文献评估、问题发现),如果能配上一些同步解说,此法同样有效。
这种学习方法看似新奇,实则古老:语言学习就是这样运作的!
3.1 语言学习
正如网上流传的各种个人经历所示(例如这篇),一个人完全可以在地下室里,与外界完全隔绝地学会一门语言,期间从未用目标语言与任何人交谈。我们也知道,被扔到一个陌生的国度,在环境中被迫交流,能极大地加速语言学习。说个趣事,前段时间我去日本,总是在出口处看到「出口」这两个汉字,于是我便将它与「exit」的概念联系了起来。我并未刻意去记,这种联系是在反复的视觉刺激中毫不费力地形成的。
语言学习最有趣的地方,在于它对儿童而言似乎是多么轻松自然。海量带有恰当情境的语言输入,使他们先记住最醒目的词汇,然后注意到整体的语言模式,接着推断出语法规则,最终能流利地使用该语言。成年人同样可以通过这种方式,在一年左右的时间里学会一门新语言:接触海量带有情境的范例。在一个案例中,有个人仅用了 18 个月,就从零基础达到了接近母语水平的日语能力。
我并非声称我们可以用学习语言的心智结构来学习一切。或许语言学习之所以更容易,是因为我们的大脑可能天生就为语言习得配置了特殊模块,而其他领域则没有这种「硬件支持」。我的意思是,既然存在一个领域,这种方法(大量带有情境的案例输入)显然是奏效的,那么我们就应该思考,能否将其推广到其他领域。
3.2 隐性知识的分形复杂性:以聚合酶链式反应(PCR)为例
下面这个例子,初看概念简单,细究之下却极其复杂。建议先阅读 David Chapman 关于 PCR 的这篇文章作为背景。在写作本节时,我查阅了大量在线视频和资料,但要真正理解 PCR 操作与原理所蕴含的全部复杂性,绝非一朝一夕之功。
聚合酶链式反应(PCR)是生物学中用于大量扩增特定 DNA 序列片段的技术。一个人能仅凭阅读就学会做 PCR 吗?或许吧。但即便不是绝无可能,我们也都同意这会异常艰难,原因已在 Chapman 的文章中阐明。那么,用视频辅助文字呢?观看别人实际操作 PCR,似乎是学习这门技术的更佳途径。甚至,更进一步:观看别人操作失败,并听他解释错在何处、如何补救。但即便如此,我也不认为新手能在第一次尝试时就获得成功,但至少能更快进步。有了视频、文字材料和成功的清晰范例,你最终应该能掌握它。但我并不认为这个过程会很轻松,因为对于一个从未进过实验室的人来说,做 PCR 意味着必须先掌握一系列配套的知识和技能。
Chapman 文中引用的视频一上来就说:「我们要用的第一个试剂是缓冲液」,然后便继续操作。对于从未做过 PCR 的人来说,这「缓冲液」究竟为何物,是一头雾水。「真实世界」里的解释是,这指的是「10X PCR 缓冲液」,如果你从赛默飞这样的公司购买 Taq 聚合酶(负责复制 DNA 的酶),它通常会附带提供。而赛默飞的这款缓冲液,又是盐酸(HCl)和氯化钾(KCl)的混合物。它之所以被称为缓冲液,是因为在加入少量强酸或强碱时,能保持体系的 pH 值基本恒定。而这之所以必要,是因为 Taq 聚合酶只有在特定的 pH 值下才能发挥最佳活性。此外,该聚合酶还需要镁离子,但赛默飞的产品将镁离子与缓冲液分开包装,把决定权交给了你:镁离子加多了,结果会有噪音;加少了,DNA 又扩增不起来。镁离子为何有此作用?我们确实可以一层层地深挖下去。而且,稳定 pH 值并非氯化钾存在的唯一理由,市面上也并非只有这一种缓冲液。但对于一个普通的 PCR 使用者来说,这些都不重要:他只需要知道,买来的聚合酶附带了一管缓冲液。当然,如果你想优化 PCR 实验方案,这些细节就至关重要了。例如,在 Lorenz (2012) 这篇论文的第 13 节中,就描述了一个为了扩增某个特定基因,不断尝试寻找最佳氯化镁浓度的案例。供应商推荐的浓度并不奏效,而目前最通行的做法就是多试几个浓度。在现实中,如果你刚到一个实验室,你什么都不用知道,只需记住有一瓶是缓冲液,另一瓶是聚合酶。这种复杂性被封装了起来。 最初,可能是一位有经验的前辈手把手地指导你,你跟着操作,犯错,被纠正,直到你能不假思索地完成整个流程。然后,你或许能独立操作,再然后,能为不同的 DNA 片段进行扩增,如此往复,直到你敢说自己真正掌握了这项技术。
Lorenz 论文的同一节中还有一个有趣的细节:作者为了观察实验现象,会故意把 PCR 做错。如果我们将学习一项任务看作是掌握一个核心区域,并探索其模糊的边界,那么学习这些任务的边界就显得尤为重要。边界既定义了任务的起点和终点(从哪获取材料?做完后该做什么?),也揭示了可能导致任务失败的陷阱:如果你某一步做错了,或者出现了意外,该怎么办?如果你的全部经验都来自教科书式的标准流程,那么一旦出错,你很可能会手足无措或选择从头再来,而不是采取恰当的补救措施继续进行。
PCR 包含许多在教学材料中被隐而不提的子技能。实验方案要求你使用微量移液器,将精确计量的各种试剂加入微小的 PCR 管中。使用移液器本身是一个相对简单的任务,但也必须经过学习(我们还可以将这个任务进一步分解为:更换移液管枪头、学会在不同类型的移液管上读取读数、调整体积,以及进行移液操作本身)。其他子技能还包括操作热循环仪,如果再扩大范围,还有引物设计、订购所有必需设备和试剂的知识,等等。
这样就够了吗?还差得远呢!关于 PCR 的门道,可以说上三天三夜。这个另一个 PCR 演示视频提到,如果你的 DNA 序列富含 GC,那么你应该延长变性步骤的时间,但你也可以通过提高温度来达到同样的效果。而温度的选择,又取决于所用引物的熔点;时间的选择,则取决于目标产物的长度和所用的聚合酶。引物也不是由目标序列唯一决定的,你必须对其进行精心的设计。一位经验丰富的专家,或许能凭借过往经验猜出正确的温度,或者对一个理想的结果应该是什么样有种直觉。
「抽象地」阅读关于 PCR 的资料,观看上面链接的那些视频,会让你意识到,如果你真想从零开始做一次 PCR——比如说,检测一个样本里是否含有新冠病毒——这一切几乎是无用的。但设想一下,如果你手头有一系列手把手的案例研究,涵盖了不同的引物、聚合酶和热循环参数。然后,你像学做一道新菜一样,跟着「食谱」一步步操作。起初,你只是机械地执行一串指令。但渐渐地,一种通透的理解便会油然而生:你不仅知道为何要有这一步,更明白这一步可以有多少种变化。
3.3 国际象棋:一个我们已解决隐性知识传播问题的领域
国际象棋是研究隐性知识的一个有趣领域。它的规则公开透明,极易学习。我们已有数百年时间来发展各种学习体系和框架。我们甚至已经通过机器学习「破解」了国际象棋。然而,要成为一名高手,依然需要多年苦功。而高超的棋艺,毫无疑问是一种隐性知识:即便让你和棋王马格努斯·卡尔森聊上 100 个小时,也无法让你立刻棋力大涨。
贯穿上文的一个主题是加速学习:是否存在某种训练方法,能让一个人在短短数月内达到卡尔森的水平?一番探寻之后,我认为答案是否定的。究其原因,是天赋与人类大脑在习得国际象棋所需技能(如图形组块与前瞻规划)方面固有局限性的结合。
首先要明确一点,国际象棋的技能在相当程度上是可遗传的。我在一篇关于学习的文章中曾引用过:
那么国际象棋呢?特级大师之所以出类拔萃,是因为勤奋练习,还是因为他们天生就具备适合下棋的才能?至少就智力而言,一项针对等级分(ELO)在 1311 至 2607 之间的业余及专业棋手的元分析显示,智力与棋艺的相关性系数不超过 r=0.35 (Burgoyne et al., 2016),这意味着智力能解释的棋艺方差(R^2)仅为 6% 左右。如果只看顶尖职业棋手,这个相关性更低,只有 0.14。但这并不意味着剩下的 94% 都可以归功于练习。实际上,如果从更广义的遗传性来看,国际象棋技能的遗传度可能高达 48% 左右 (Vinkhuyzen et al., 2009)。
那么,刻意练习的作用又有多大呢?一篇论文 (Burgoyne & Nye, 2019) 在一个中高水平棋手(等级分在 1150 至 2650 之间)的样本中发现,刻意练习能解释 34% 的棋艺差异。请注意,这绝不意味着练习对新手不重要!恰恰相反,对新手而言,练习几乎就是一切。更高的智力或记忆力或许能让棋手更好地评估棋盘,但练习本身,才让他们首先具备了进行评估的能力!只有当一个人跨过了新手阶段,天赋的影响才会逐渐显现。
我曾试图寻找快速成为象棋高手的例子,结果发现了 Max Deutsch 在 2017 年的一项极富创意的尝试:他计划在一个月内从零成为国际象棋大师。他失败了,但失败的方式很有趣。起初,他想当然地认为应该看棋谱、大量实战。但他很快意识到,这无法让他达到专家水平,因为:
国际象棋的专业水平,主要体现在专家能(通常是瞬间)识别出海量的棋局,并回忆或推导出每个局面下的最佳走法。
因此,如果我选择传统方法来训练,我基本上需要找到某种神奇的方式,来学习并内化卡尔森在他 20 多年棋手生涯中积累的同等数量的棋局。这便是为何我这个月的挑战看起来有点异想天开。
然而,他接下来的做法令人大跌眼镜:他没有选择慢慢培养棋感,而是试图用一种「暴力破解」的方式——先训练一个能预测最佳棋步的神经网络,然后将这个网络的权重背下来,在自己的大脑里运行它。至少,计划是这样的。这个计划也失败了(人的记忆能容纳的权重有限,每秒能进行的运算也有限)。不过,他最终确实和卡尔森下了一盘棋(然后输了)。
我们无从知晓 Deutsch 的棋力究竟提高了多少。但我们可以看看特级大师们在各个年龄段的等级分数据。他们似乎都以相似的速率进步,大约每年 40-50 分,但别忘了,他们 15 岁时就已经是顶级棋手了!以天才少年普拉格纳南达为例,他不到 10 岁时等级分就达到了惊人的 1500 分,之后每年大约能提升 200 分。他们进步速度相似这一点其实并不奇怪,毕竟我们已经有几十年甚至上百年的时间来研究如何学习国际象棋,他们使用的训练方法可能都大同小异。这个 Reddit 帖子也表明,对于初学者,每年提升 200 分并非天方夜谭。所以,区分这些特级大师的,与其说是学习速度,不如说是天赋本身。
但也有学习速度更快的例子。一位匿名的网友在 6 个月内将等级分从 1200 提升到 1600,甚至一度在短短 2 周内暴涨 150 分。阅读他的学习笔记,我们发现他的模式是:刷难度递增的习题库(象棋谜题),并背诵特级大师的棋局。为了背棋谱,你必须发展出相应的记忆策略,所以仅仅看书或看视频是远远不够的:
在尝试之前,我也会觉得这是浪费时间。诀窍在于,为了记住一盘棋,你必须在某种程度上理解它。像背单词一样死记硬背棋步当然也行,但那会比理解棋局的逻辑难上十倍。
如果你理解了棋局的逻辑,你最终会以一系列「组块」的方式来记忆,而不是一长串孤立的棋步。例如,我背过的一局短棋是 Peter De Bortoli 和 Botond Smaraglay 的对局。我虽然能一步步背出来,但在我脑海里,它大致是这样的:「史密斯·莫拉弃兵开局,出马,出象,逼退对方的象,威胁困后,对方马失误,成功困后」。背诵了几局王翼弃兵的棋谱后,给了我更多思路,我的王翼弃兵水平确实提高了。
非常有趣的是,这位网友认为,与做题和背谱相比,实际下棋对棋力提升的帮助并没有那么大。请教练也是如此。这似乎与这篇论文的发现不谋而合。该研究发现,预测棋艺水平的最强指标,恰恰是独自练习的时长,其作用甚至超过了参加比赛的时长。这对我来说也很有道理:在实战中,你并非总能遇到新情况,比如开局就非常套路化。而解题能让你直面困难局面,背谱则能帮你建立战略意识。
3.3.1 国际象棋教练的角色
我们找不到任何一个从未实战、只靠解题和背谱就成为象棋大师的例子。但我们确实能找到一些大师,他们成长过程中缺少了某个许多人认为必不可少的环节——教练辅导。
此外,教练所传授的大部分知识,在书籍和电脑程序中都能找到。对许多初学者而言,聘请教练的费用以及为定期课程做准备所需的自律,既不现实也不可取。实际上,一些著名的自学成才的棋手便认为,不靠教练的帮助来学习象棋是完全可能的,甚至可能更切实际。在一项关于各种象棋活动相对重要性的初步研究中,Charness 等人 (1996) 调查了欧、俄、加三地的职业棋手,……随后的回归分析显示,在一系列潜在的预测指标(包括参加比赛和接受辅导)中,累积的、严肃的、独自进行的象棋研究,是预测棋艺水平的最强单一指标。(Charness et al., 2005)
在 Campitelli & Gober (2008) 的研究样本中,大多数(80%)棋手都聘请了教练,且聘请教练与等级分呈正相关,尽管这种相关性不如拥有的象棋书籍数量那么强。那么,请教练究竟是认真程度的体现,还是其本身就能独立提升棋艺?这篇论文的检验并未能完全说服我。
无师自通成为特级大师的可能性是存在的,但这样的例子凤毛麟角。那么在现实中,棋手们为何要请教练呢?最直接的答案是,他们相信有教练能进步更快。当然也可能有其他原因:教练能督促棋手,确保每天投入足够的练习时间;或许有教练的陪伴能让练习过程更愉快;教练还能减轻棋手自己规划训练、选择资源的心理负担,虽然这又带来了选择哪位教练的新问题。我怀疑,单就棋艺的原始提升而言,教练并不能加速学习进程,除非你已经达到需要针对性分析特定对手(比如特级大师之间)的顶尖水平。在过去,当象棋引擎还很弱、训练方法也不那么体系化的时候,教练或许曾起到过加速作用,而这种对教练的信念一直延续至今。
我从国际象棋中得到的启示是,从乐观的方面看,我们已经成功地将这个领域的专家级表现规模化,甚至达到了无需手把手教导的程度:隐性知识得以有效传播。我们还找到了高效的传播方法,这些方法并非一遍遍地重复下棋,而是聚焦于这项活动中经过精心挑选的子集(即那些捕捉了关键局面的象棋谜题)。而悲观的一面是,这个过程依然极其耗时:似乎没有任何捷径或技巧能让人在短短数月内臻于化境。如果大多数领域都和国际象棋一样,那么「加速成为专家」就是个天方夜谭,你必须踏踏实实地投入数年光阴。但反过来看,在国际象棋(和语言学习)中发展出的这些技巧,依然可以推广到其他领域。我们或许无法速成大师,但至少可以批量培养出资深的熟练工,而这在过去没有导师是无法想象的。这本身也算是一种成功了!
3.3.2 所有领域都像国际象棋吗?
如果所有领域都像国际象棋一样,即使用上全世界最好的学习方法也需要漫长时间才能掌握,那我们就不该指望能在其他领域实现快速学习。但我们知道,有些领域的掌握要容易得多,比如学会熟练使用微量移液器就不需要数年时间。其他一些目前缺乏悠久教学传统的领域,掌握起来似乎需要很多年,并且看似无法缩短,但这不过是想象力的匮乏。我们甚至还未在大多数领域系统性地尝试过我认为会奏效的方法。唯一的例外是语言学习,在那里,用对方法,学习周期可以缩短到一年左右。我对于某件事「理应」花多长时间并没有一个很好的把握。直觉上,这个时间跨度应该与需要学习的知识点的数量及其内在关联度有关。或许某处已经有人建立了一个包含各种任务及其学习时间的数据库,我们可以通过实验来验证,并据此推断更复杂领域的情况。
3.4 软件工程
我曾是一名软件工程师。和业界相当一部分人一样,我是自学成才的。许多人可以在一天内学会编程的基础,比如条件、循环和函数,但这远不足以让他们用这门语言做出任何有意义的东西。那么,一位首席工程师比新手到底多懂些什么?其中相当一部分并非严格意义上的隐性知识,而是缓存的显性知识:比如知道该用哪个库(而不是花上一天时间在 Reddit 和 StackOverflow 上搜寻,在多个库之间反复试错)。但其中也有真正的隐性知识。例如:你需要写一段代码,从某个数据源获取数据,进行一些操作,然后把结果发送到别处。那么,这段代码的抽象程度应该多高?系统是否应该能兼容任何数据源?函数参数是该打包成一个大的「配置」对象传递,还是该逐个传递?数据库连接是否需要特殊处理(比如设计一个单例实例 (singleton instance),并知道保持连接开放以便复用会更高效)?考虑到项目要求,代码的效率又该做到什么程度?市面上有一些探讨这类问题的书籍(比如这篇的 2.6 节),但纸上谈兵是不够的,你必须亲身实践。专家级的工程师可以凭借多年积累的经验来思考这些问题。
但,如果我们有一个专家程序员现场演示的视频库呢?这种形式其实已经以一种粗糙的形态存在了:那就是直播编程。它具备了前文讨论的所有要素:专家并非在解释一个领域,而是在积极地实践他所要传授的技能。视频中包含了错误以及如何修正它们的过程。专家还会加上同步解说,这更是锦上添花,因为我们无法直接窥探他们的思维过程,只能看到屏幕。据我所知,观看这类视频在软件工程教育中仍是一个未被充分利用的工具。目前还没有一个精心策划的、能指导人通往卓越的视频库。但如果我们真的有这样一个资料库,问题就解决了吗?或许吧。
4 管理专家
在前文中,我一直用「隐性知识」来指代「专家的隐性知识」。而撰写本文的目标之一,便是对二阶知识进行思考:即并非关于 X 领域的知识本身,而是诸如「关于 X 领域的元知识」、「X 领域的历史」或「如何管理 X 领域的专家」这类问题。
Ben Reinhardt 在他的笔记中有一条启发式规则:做过某件事的人,应该来负责这件事。因为「若非亲身实践,你极难对一件事建立起直觉。所以归根结底,「做过」其实是「对此有直觉」的代名词。」
表面上看,这确实是一条很好的经验法则。但在权衡其他因素时,它的分量有多重就不好说了。例如,这条规则会告诫我们,埃隆·马斯克当初不该去做他那些「埃隆」做的事(比如创办 SpaceX),Ben 自己不该去搞 PARPA(他从未管理过研究机构),同理,一个律师也不该去创办一家大型且成功的制药公司。然而,与这条规则同样正确的是另一条规则:外行领导往往能带来方差更高的结果。在探索可能性边界时,这恰恰是好事。一个人辛辛苦苦积累的隐性知识和直觉,在另一个人看来可能就是偏见和毫无根据的预设。有时,一个「不合格」的外行最终确实能向老兵们证明他们错了:这本就是事物发展的自然规律。
这条规则还有另一个问题:管理本身就是一门技能,传授技能也是如此。一个顶尖的科学家,可能是一位糟糕的老师,也可能是一位拙劣的科研管理者。
Collins 和 Evans 在书中引用了 LIGO 项目经理 Gary Sanders 的一段话。LIGO 是一套为探测引力波而建造的、极其复杂的大型设备。Sanders 从未造过类似的东西,却被任命为负责人。他逐渐成长,最终能够成功管理一个他自己无法直接在其中「动手」的领域,并与专家们自如地谈论它:
我曾担心自己完全无法理解。但我惊奇地发现,你们所谓的交互式专业知识(interactional expertise)并不难获得。我虽然设计不出自适应光学系统,但在该领域工作了六到九个月后,我真的完全理解了不同类型的自适应光学及其工作原理,我能画出示意图,定义算法,并判断不同技术的技术成熟度——哪些已经可以实际应用,哪些还需验证,哪些组件尚待开发……
我可以和一群自适应光学专家坐下来开会。他们或许会上来对我说:「Gary 你错了,多目标自适应光学在项目启动时就能就绪,并且有如下优势……」而我则会说:「不,我们应该用多共轭自适应光学。」然后我能给出四条理由,说明为何我们该选择后者——基于我们的科研目标、技术组件的成熟度、我们需要它的时间等等。当我说完,我会看到满屋子的人看着我,心想:「他确实有自己的一套,他把问题想透了。」
但是,如果有人对我说:「好吧 Sanders,我们同意你,现在请你去设计一个多共轭自适应光学系统。」我是做不到的。我无法坐下来写出那些方程式……但我能画出示意图,说明每个部分的功能,评估其技术成熟度,指出难点所在——我懂这门语言,并且我确信自己有资格做出决策。
回顾他在 LIGO 的岁月,他说:
我设计不了 LIGO 的干涉仪。我无法像某某科学家那样,坐下来写出所有的传递函数,计算出噪声预算。但如果他做一场相关的报告,我能跟得上。我能理解哪些部分重要,哪些部分困难,这部分靠倾听,部分靠定量的理解。但我无法亲自谱写这首交响乐。然而,我身处一个必须做决策的位置。所以,这关乎我该听谁的,哪些论点更有说服力——最终,我们想要的是什么……这已经超越了「交互式」的范畴,但我觉得,按你们通常的理解,它也算不上真正的「贡献式」(contributory)。(Gary Sanders,LIGO 项目经理)
但 Collins 和 Evans 补充道:
那么,在他们所管理的大多数专业领域,这些管理者拥有的是交互式专业知识,而非贡献式专业知识(contributory expertise)。这是否意味着他们的技术专长并不比一个(比如)已经掌握了交互式专业知识的社会学家更高明呢?回答「是」似乎是错的——正如 Sanders 所言,这里面还有些更深层的东西。答案似乎是:虽然管理一个科研项目的科学层面本身无需贡献式专业知识,但管理工作确实需要从其他项目中引申而来的专业知识(referred expertise)。管理者必须从他们过往在其他科学领域的工作经验中,深刻理解在某个学科里拥有「贡献式专业知识」到底意味着什么;这使得他们能够,可以说,隔着一层去理解他们所领导的科学家们要做出贡献需要付出什么。拥有这种引申专业知识的科研项目管理者,会比没有的人管理得更好(也更有权威和合法性)。
这些跨领域的经验体现在多个方面。例如,他们见过太多次,当初狂热分子们坚称不容置辩的技术论点,最终被证明是可以商榷的;这意味着他们知道该给技术论点打多少折扣。他们知道那些信誓旦旦的技术承诺为何以及会以多大概率落空。他们知道让追求完美扼杀了够用就好的危险。他们对一场争论该持续多久,何时该果断叫停,有种直觉。他们能感觉到,何时一个技术决策至关重要,何时则不值一驳。他们还能判断,一个难题究竟只是工程问题,还是根本性的挑战。
这也与另一则笔记不谋而合:Ben 为 PARPA 项目经理设定的经验法则是,候选人必须在某个实体科学领域(而非数学或计算机科学)做过研究。不一定是完全相同的领域,但你必须亲身体会过科研活动是怎么一回事,懂得预料意外,习惯失败、试错和调试实验。然而,Collins 和 Evans 随即又指向了 Leslie Groves,一个离物理学家十万八千里,却成功领导了曼哈顿计划的人。Groves 是管理大型建筑项目的专家,他慧眼识珠,挑选了奥本海默来主管科研。曼哈顿计划的例子表明,第二条启发式规则——「管理者应具备管理经验」——可以和「做过 X 才能管 X」同样有效。理想情况下,我们当然想找一个既懂 X 又懂管理 X 的人。但和许多事一样,哪条规则更优,取决于情境:曼哈顿计划是一个重建设的项目,而且 Groves 从未试图去微操科学家,他把这部分工作完全交给了真正的科学家奥本海默。在那种特殊情况下,让奥本海默去管理整个庞大的工程,很可能会让他不堪重负(或者觉得无聊,或者浪费才华,任选其一)。但对于一个类似研究项目这样规模较小的行动,熟悉领域本身的重要性可能会重新占据上风,成为更优的选人标准。
最后是埃隆·马斯克。马斯克打破了常规,因为他创办 SpaceX 时,既非火箭工程师,也无任何实体项目的管理经验(他来自支付行业)。马斯克的核心能力在于超凡的学习速度和识人善任的眼光。当然,他读了关于火箭推进的书,但他并没有费力去从零开始亲自设计,而是找到了当时极具潜力的推进工程师 Tom Mueller 并雇用了他。Blake Scholl 的例子也是如此。按常理,你不会选择一个 Groupon 的高级总监去领导一家超音速飞机公司。但如果这个人愿意花时间去理解领域,有足够的自知之明去了解自己的不懂,并且——至关重要的是——能够判断他人的才华,那么情况就完全不同了。
5 规模化专业知识
那么,我们该如何规模化地传播隐性知识(以及与之相关且同等重要的私有显性知识)呢?既然这些知识正是专家之为专家的部分原因,那么这个问题就等同于在问:我们该如何加速成为专家?美国国防部为此已努力多时。
他们得出的结论似乎是:你确实可以在一定程度上加速专家的培养,但要做到这一点,你需要极其丰富的环境,即对专业领域进行模拟。构建模拟环境远比仅仅观看专家录像要困难,但他们的共同点是,都放弃了试图将专家的行为总结为一系列原则,然后灌输给新手的做法。你永远无法通过灌输原则,就让一个士兵学会「与平民打交道」(前述链接中美国国防部尝试做的事)。正确的做法是,你与专家坐下来,让他们进行情景推演,并记录下他们所注意到的细节;然后,让新手也进行同样的推演;最后,向新手展示专家们所捕捉到的、而他们自己忽略了的信息。专家或许会解释他们为何注意到这些细节(比如,消防员可能会说「在那种情况下,烟雾比预期的要浓」),但即便没有解释,仅仅是将自己的判断与专家的判断进行对比,本身就能引发学习。
综合全文的各个案例,我理想中的学习系统应包含以下关键要素:
- 一个庞大的案例库:其中包含专家在真实情境下执行某项技能的大量范例,而非刻意编排的教学材料或课堂录像。
- 专家同步解说:如果可能,专家应在操作的同时,提供一些即时的评论或思路说明。
- 学习者主动参与:学习过程不能是被动的观看或阅读,必须在某个节点要求学习者参与进来。最起码,可以要求某种形式的记忆;更进一步,可以让他们预测下一步操作,或者猜测专家会认为哪些信息是关键。
- 定期实践检验:应通过亲身实践所学的技能,来定期检验学习进度。
- 借鉴成熟教学法:课程的设计应从那些已有深厚教学传统的领域(如语言学习或国际象棋)中汲取灵感。
6 结论
上文的论述有些蜿蜒,如果你想抓住核心观点,以下便是一系列脱离上下文但现在应能理解的论断:
- 隐性知识是真实存在的。专家们拥有一些他们自己也无法完全解释或写下的知识。
- 专家拥有的不只是隐性知识,还有极其重要的私有显性知识。后者可以通过与专家交谈在一定程度上获得。
- 由于激励机制的问题,私有显性知识难以规模化传播:它之所以「私有」,是有原因的。有时是保密协议,有时则是因为分享知识对专家本人毫无益处,甚至可能损害其职业优势。
- 学习一个科学领域的绝大部分知识,确实已被编码在公开信息中。但这与能真正在该领域从业所需的知识是两回事。越接近具体的执行层面,公开可得的知识就越少。
- 这一点不适用于那些缺乏广泛知识编码传统的领域,比如工程学。
- 仅仅罗列一堆论文的结论,不足以让你掌握一个领域。但当你观察了足够多的论文后,你便能洞悉其背后的深层逻辑。你可以把自己想象成一个人类版的 GPT-3:互联网本身不教你如何思考,但海量的阅读不知何故却让 GPT-3 变得有些聪明。我敢说,大量阅读论文也是同理。
- 提升某项技能,不一定非要反复练习这件事本身。在提升棋艺方面,解象棋谜题和背棋谱的效果,胜过实际下棋。领域鉴赏家由于不必亲自动手做研究(从而节省了时间),可以迅速掌握与一线从业者相当的知识,即便他们从未获得从业的能力。新手花在移液或重复操作热循环仪上的时间,本可以用来获取更多信息。
- 我们可以通过海量带有情境的案例输入来加速学习。
- 在网络搜索如此便捷的今天,死记硬背看似毫无意义。但记忆的目的不只是为了快速检索,更是为了在一个领域内构建起内在的结构、地图、框架和组块,从而让你能更好地驾驭这个领域。在某些领域,这正是规模化专业知识的解决方案的一部分。
- 如何学习一个领域,应取决于你的目标。如果你只是想了解某个领域的公司以便投资,或是想找出该领域悬而未决的问题并寻找人才来解决它们,那么完全没必要花上三年时间去啃读衰老生物学的论文。
- 与足够多的专家交流,能让你获得足够的知识,来快速验证一个想法、回答一个问题,并对一个领域建立起足够好的感觉。
- 要管理一个领域的项目,或找出该领域大致的开放问题,你并不需要专家那样深厚的知识。但你得出的问题清单,应由专家来验证,这是流程的一部分。
- 识别专家是一门艺术,而这门艺术的关键,在于知道该问什么问题!
- 从与专家交谈中获得的理解,比从阅读论文中获得的要浅。而这两种理解,都比不上真正融入一个领域或在其中工作。
- 「做过才能管」的经验法则是对的,同理,「是好经理才能管」也是对的。但在面对那些既能快速学习又能识人善任的聪明通才时,这些规则并不总是奏效。
- 隐性知识无法通过常规方式(解释)来传授,而只能通过演示、学徒、模拟、视频或案例库等间接方式来传递。
- 故事、案例研究、乃至商业书籍,很容易被当作「N=1 的轶事」而不屑一顾。我过去也这么想。但我们这些有理工科思维的人所习惯的、整洁的表格化数据,根本无法捕捉现实世界中复杂技能的全貌。一系列轶事的集合,本身就是我们传递隐性知识所需的那种数据。
- 融入一个领域,对于掌握该领域最后 10-20% 的知识至关重要。因为没有人能一下子列出所有相关事实,所以常与圈内人交往(无论是在会议、线上研讨会,还是在当地的酒吧或咖啡馆),会增加你从他们不经意的言谈中捕捉到新信息的概率。不同的情境会激发专家联想到不同的事实,因此,与专家足够多的互动,将不断拓展你对他们知识空间的探索。
7 参考文献
在撰写本文过程中,我阅读过的一些书籍和文章:
- Klein, Gary A. 《权力之源:人们如何做决策》。麻省理工学院出版社,2017年。
- Hoffman, Robert R., et al. 《加速专业知识:为复杂世界中的高熟练度进行训练》。心理学出版社,2013年。
- Collins, Harry & Evans, Roberts. 《反思专业知识》。芝加哥大学出版社,2008年。
- Cedric Chin 的博客 Commonplace
- Salvatier, John. 《现实拥有惊人数量的细节》
- Reinhardt, Ben. 工作笔记
8 更新日志
- 2022/04/08: 感谢 Max Krieger 指出拼写错误和奇怪的句子
- 2022/05/24: 感谢 Barry Cotter 指出拼写错误和奇怪的句子
引用
在学术著作中,请按如下方式引用本文:
Ricón, José Luis, “Scaling tacit knowledge”, Nintil (2021-12-10), available at https://nintil.com/scaling-tacit-knowledge/.
脚注
[1] 如果你好奇,我确实问了。答案并非来自某个成体系的理论,而是一些零散的背景知识(论文中也引用了):过去的研究表明,过表达这些基因能带来一些健康益处,且其证据似乎比其他成千上万种基因更强。但并没有一个模型能明确指出这三者的组合就是最优解。然而,作者当初究竟是如何从浩如烟海的文献中,一步步筛选并最终锁定这三种基因的——其确切的思维路径,本身就是一种隐性知识。即便他们想告诉我,恐怕也说不清楚。
[2] 如果这听起来很奇怪,不妨想一个视错觉的例子。你的眼睛告诉你两根木棍不一样长,所以你有理由相信它们确实不一样长。但你也可以将当前情景与过往的经验进行模式匹配(「哦,这是一种视错觉」),然后,尽管内心深处依然觉得「它们不一样」,你却会说出并表现得好像它们一样长。即便你开口说「它们是一样长的」,回答时也会感到一种别扭,内心有个声音在呐喊:「但它们明明不一样!」 在某些情况下,听取专家的建议,就需要我们去抑制内心那个同样的声音。懂得何时该这样做,本身就是一门艺术。
Thoughts Memo 汉化组译制
感谢主要译者 geimini-2.5-pro,校对 Jarrett Ye
原文:Nintil - Scaling tacit knowledge
发布于 2021-12-10;最后更新时间:2022-05-24