比科学更快

❦

我有时会说，科学的方法，就是去积累一座大到连科学家自己都无法忽视的证据高山；而这正是科学家的区别性特征。（非科学家反正还是会忽视它。）

Max Planck 甚至还要更不乐观一些：1

一项新的科学真理并不是靠说服它的反对者、让他们恍然大悟而取得胜利的；它之所以获胜，反倒是因为它的反对者最终都会死去，而新成长起来的一代人从一开始就对它习以为常。

我特别喜欢这个说法，因为它意味着，科学区分真与假的力量，归根结底竟然是建立在研究生口味是否够好这件事上的。

在学术物理学中，对多世界的接受是渐进地增加的；这表明，有些物理学家只有在认识论上的正当性与足够大的学术同侪群体形成某种组合时，才会接受一个新观念；只有当他们待在那个群体中足够安心时，才会转变。随着越来越多的物理学家接受它，那个群体本身也会不断变大，于是更多人跨过各自转变所需的心理阈值——而此时认识论上的正当性，基本保持不变。

但 Science 终究还是会最终抵达那里，而这就足以让 Science 的棘轮继续向前转动，并托举起一个技术文明。

科学家可能会受到毫无根据的偏见、已经被动摇的直觉，以及赤裸裸的从众行为的影响——整整一套人类缺陷全都会起作用。每当一位科学家因为认识论上不正当的理由而改变了信念，你就需要更多证据，或新的论证，来把这份噪声重新抵消掉。

“波函数坍缩”并没有任何实验上的正当依据，但它迎合了“单一世界”这一（已经被动摇的）直觉。于是，你可能还得额外补上一条论证——比如说，坍缩违反了狭义相对论——才能开始让这个从一开始就根本不该被赋予不可忽略概率的想法，在学术界缓慢瓦解。

从贝叶斯的视角来看，整个人类学术科学体系，是一个处理证据效率极低的处理器。每当某个不正当论证让信念发生偏移，你就需要一个额外的正当论证，才能把它再偏回来。科学这一社会过程，依赖额外证据去压过认知噪声。

用一种更宽容的方式来说，就是：与科学家本来会采取的理想立场相比——如果他们是贝叶斯 AI，并且能够信任自己进行清晰推理的话——科学家往往会采纳在理论上不够极端的立场。

但也别宽容过头。我们这里说的噪声，并不全是无辜的错误。在很多领域里，本来早就该结束的争论，仍会拖上几十年。而且这并不是因为双方科学家都拒绝信任自己、并一致同意应当寻找更多证据。而是因为其中一方在学术权力早已盘根错节的情况下，源源不断抛出越来越荒谬的反对意见、要求越来越多的证据，哪怕证据之风究竟是从哪个方向吹来的，早就已经一清二楚了。（我这里想到的是围绕进化心理学诞生时展开的那些争论，而不是多世界。）

个体人类，或者一些群体，有可能比整个人类学术科学体系更高效地处理证据——更快地得出正确结论吗？

“观念要靠实验来检验。这才是科学的核心。” 这话一定是真的，因为如果连僵尸 Feynman 都不能信，那你还能信谁？

可那些观念又是从哪里来的？

你可能会忍不住回答说：“它们来自科学家。你还有别的问题吗？” 在 Science 里，你本来不该在乎假说来自何处——你只该在乎它们能否通过实验检验。

好吧，但如果你把所有新想法都拿掉，整个科学过程就会停止运作，因为它将没有任何可供检验的备选假说。因此，发明新想法并不是这个过程里可以被省略的部分。

现在，把你的贝叶斯护目镜重新戴上。正如在《Einstein 的傲慢》中所描述的那样，有些问题不是二元的——答案不是 “Yes” 或 “No”，而是从一个更大的结构空间中抽出来的，例如方程空间。在这种情况下，要把某个假说提升到你的注意范围内，所需的贝叶斯证据，远远多于把这个假说进一步确认所需的证据。

如果你正在一个由所有 32 比特以内可表述方程组成的空间里工作，那么你面对的是一个包含 40 亿个方程的空间。要把其中某一个假说提升到 10% 的概率水平，所需要的贝叶斯证据，远远多于把这个假说从 10% 概率进一步提高到 90% 概率所需要的证据。

当创意空间很大时，提出那些值得检验的想法，所需要做的工作——用贝叶斯—热力学意义上的“工作”来说——会远远多于仅仅得到一个 p < 0.0001 的实验结果，让新假说胜过旧假说。

如果这一点看上去还不是一眼就明白，那就在这里停下来，重新看一遍《Einstein 的傲慢》。

科学过程一直都依赖科学家通过某种 Science 并未进一步规定的过程，去想出可供检验的假说。假设你发明了一种生成假说的方法，而那方法简直疯狂透顶——比如说，用圆周率的数字去驱动一块机器人控制的通灵板——而它给出的建议却不断被实验验证。纯粹而理想的 Science 本身不会有丝毫停顿。纯粹而理想的 Bayes 则会当场起火烧死。

（与 Science 相比，Bayes 会被更多可能结果所证伪。）

这并不意味着：决定该检验哪些想法的过程，对 Science 来说不重要。它的意思是：Science 并没有规定这个过程。

在实践中，机器人控制的通灵板并不起作用。在实践中，确实存在一些科学问题，它们的答案空间大到如果你随机挑选模型去检验，那么你得花上天文数字般久的时间，才可能撞上一个能作出好预测的模型——这就像让猴子敲出 Shakespeare 一样。

在科学的前沿——也就是无知与知识的边界，科学在这里推进——整个过程依赖于至少某些个别科学家（或工作小组）先看见某些尚未被 Science 确认的东西。正因为如此，他们才能在检验发生之前，知道该去检验哪些假说。

如果你摘下贝叶斯护目镜，你可以说：“嗯，他们不一定非得知道，他们只要会猜就行。” 如果你重新把贝叶斯护目镜戴上，你就会意识到：在一个大答案空间里，以 10% 的概率“猜中”，其背后所要求的认识论工作量，几乎和以 80% 的概率“猜中”一样大——至少在答案空间足够大的情况下确实如此。

科学家在实验之前，也许并不知道自己已经成功完成了这种认识论工作；但事实上，他们一定已经把它成功完成了！否则，他们甚至都不会想到那个正确假说。至少，在答案空间很大的情况下是如此。

于是，科学家提出一个新预测，做出实验，发表结果，而现在 Science 也知道了。这时，它已经成为全人类可公开获取的知识的一部分，任何人都能亲自验证。

在这中间，存在着一个时间区间：在那段时间里，科学家已经理性地知道了某件尚未被科学这一公共社会过程所确认的事情。而这段区间并不微不足道，哪怕它可能很短；因为那正是科学前沿所在之处，是那道正在前进的边界。

对于非常规科学而言，以上说法比对常规科学更为真实，因为这里讨论的是一种“大答案空间”的概念，在那种空间中，答案不是 “Yes” 或 “No”，也不是从一小组显而易见的备选项中挑出来的。训练人们去检验想法，要比让他们提出值得检验的好想法容易得多。

Max Planck, Scientific Autobiography and Other Papers (New York: Philosophical Library, 1949). ↩︎

Thoughts Memo 翻译合集

比科学更快