对被蕴含的不可见之物的信念

Belief in the Implied Invisible

从反僵尸论证中不应汲取的一条普遍教训是:“凡是你看不见的东西都不存在。”

人很容易把这条普遍规则总结出来。要是将来我们能把它当作前提,反僵尸论证就会简单得多。但遗憾的是,这恰恰不符合贝叶斯主义。

假设我把一个光子朝无穷远处发射出去,不瞄准任何恒星,也不瞄准任何星系,而是把它指向超星系团之间的一片巨大虚空。换句话说,根据标准物理学,我并不预期这个光子在飞出去的路上会撞上任何东西。这个光子以光速运动,所以我无法追上它并再次把它捕获回来。

如果宇宙的膨胀正在加速,而当前宇宙学正是这么认为的,那么未来会到来一个时刻:到那时,即使在原则上,我也不再预期自己能与这个光子发生相互作用——在那之后,我不再预期这个光子未来的光锥会与我的世界线相交。即便某个外星种族捕获了这个光子并飞速赶回来告诉我们,他们的旅行速度也不足以弥补宇宙加速膨胀所造成的差距。

我是否应该相信,在我连原则上都无法再与它相互作用的那一刻,这个光子就消失了?

不。

那会违反能量守恒定律,也会违反热力学第二定律,还会违反几乎所有其他物理定律。它大概甚至还会违反机器人三定律。这将意味着,这个光子知道我在乎它,还知道究竟该在什么时候消失。

这是个荒唐的想法。

但如果你能够相信那些对你来说在实验上已经无法探测到的光子仍然继续存在,这为什么不意味着你就获得了一张可以普遍相信不可见之物的许可证呢?

(如果你想先自己想想这个问题,那就在继续读下去之前先想一想……)

虽然我没能用 Google 找到来源,但我记得自己曾读到过:当“银河其实就是我们的星系”这一观点最初被提出时——也就是说,夜空中那条朦胧的光带其实是由数百万(甚至数十亿)颗恒星构成的——有人曾援引奥卡姆剃刀来反对这一新假说。因为你看,这个假说大幅增加了人们所信宇宙中的“实体”数量。又或者,也许是“星云”——那些通过望远镜看到的朦胧斑块——也可能是充满恒星的星系,这一提议招来了奥卡姆剃刀。

Lex parsimoniae: Entia non sunt multiplicanda praeter necessitatem.

这就是奥卡姆最初的表述,也就是简约法则:如无必要,不应增添实体。

如果你假定存在数十亿颗此前从未有人相信过的恒星,你不就是在增添实体吗?

不是。奥卡姆剃刀有两种贝叶斯形式化:所罗门诺夫归纳(Solomonoff induction)和最小消息长度(Minimum Message Length)。这两者都不会因为星系很大而惩罚星系。

它们最好别这样做!历史给我们的一个教训就是:我们所谓的现实,总是一再显得越来越大、越来越广袤。还记得地球曾位于宇宙中心的时候吗?还记得没人发明阿伏伽德罗常数的时候吗?如果奥卡姆剃刀每次都在反对实体数量的增加,那我们就不得不开始怀疑奥卡姆剃刀本身了,因为它会始终被事实证明是错的。

在所罗门诺夫归纳中,你的模型复杂度,取决于你必须写出多少代码来让计算机模拟你的模型。关键是代码量,而不是它占用了多少 RAM,也不是它要花多少计算周期。一个宇宙模型里,包含数十亿个星系,每个星系里有数十亿颗恒星,而每颗恒星又由天文数字般多的夸克组成;这样的模型运行起来会吃掉大量 RAM——但代码只需要描述夸克的行为,而恒星和星系可以让它们自己运行。我这里说得有点半比喻——宇宙里并不只有夸克——但重点是:如果你已经描述过一个星系,那么再假定额外增加十亿个星系,并不会增加你的代码规模。它只不过多占一点 RAM,而奥卡姆剃刀并不在乎 RAM。

为什么不在乎?与所罗门诺夫归纳几乎等价的最小消息长度形式化,可能会把这个原则说得更清楚:如果你必须告诉某个人,你的宇宙模型是如何运作的,那么你不需要逐一指明每个星系里每颗恒星中每个夸克的位置。你只需要写下几条方程。服从这些方程的“东西”有多少,并不会影响你把方程写下来的长度。如果你把这些方程编码进一个文件,而这个文件有 100 比特长,那么与它文件大小大致相同的其他模型就有 2^100 个,而你大约就需要 100 比特的支持性证据。你的概率质量是有限的;并且在先验上,你必须把这部分质量分摊给所有你可能发送的消息;因此,在一个包含 2^100 个候选项的模型空间中假定某个模型,意味着你必须接受一个 2^-100 的先验概率惩罚——但拥有更多星系并不会增加这项惩罚。

在描述所有那些星系整体行为时,假定数十亿个星系中存在数十亿颗恒星,并不会增加你那条消息的长度。所以,用同样的方程去描述更多东西,并不会让你的概率受损。(前提是,你模型的预测成功并不敏感于精确的初始条件。如果你的模型之所以能预测得这么好,必须依赖于你去指定所有夸克的精确位置,那么额外的夸克就确实算作一次打击。)

如果你假设光子会在你不再看着它时消失,那就在你的宇宙模型中加入了一条额外定律。在简约法则之下,真正昂贵、真正算作“实体”的,是这些定律。额外的夸克是免费的。

那么,这是否归结为:“我相信那个光子会继续存在,一路飞向虚无之处,只是因为我的先验告诉我,让它继续存在比让它消失更简单?”

我起初也是这么想的,但再仔细一想,这并不完全对。(而且不仅仅是因为这样会给显而易见的滥用打开大门。)

我会把它归结为这样一区分:对被蕴含的不可见之物的信念,与对额外添加的不可见之物的信念。

当你相信那个光子会继续存在,一路飞向无穷远时,你并不是把这当作一个额外的事实来相信。

你所相信的(也就是你赋予概率的)是一组简单方程;你相信这些方程描述了宇宙。你之所以相信这些方程,是因为在你所能找到的描述证据的方程中,它们是最简单的。这些方程在实验上是高度可检验的;它们解释了过去可见的大量证据,并预测了未来许多观察的结果。

你相信这些方程,而“那个光子会继续存在,一路飞向虚无之处”正是这些方程的一个逻辑蕴含,所以你也就同样相信这一点。

你的先验,甚至你的概率,并不直接谈论那个光子。你赋予概率的对象不是光子,而是一般性定律。当你把概率赋给我们所知的物理定律时——如果你会相信自己所相信之事的逻辑蕴含——你就会自动把同样的概率赋给“那个光子正在继续存在、一路飞向虚无之处”这件事。

并不是说,你是在针对不可见之物本身进行推理,因此才相信不可见之物。恰恰相反,实验性证据支持某些定律,而对这些定律的信念在逻辑上蕴含了某些你无法与之相互作用的实体的存在。这就是对被蕴含的不可见之物的信念。

另一方面,如果你相信那个光子是被 Flying Spaghetti Monster(飞天意面怪兽)吃得不复存在了——也许只是在这一次——或者即便你只是毫无理由地相信那个光子在飞出去的路上撞上了一粒尘埃,那么你就是在单独相信某个特定的额外不可见事件。如果你认为这种事情普遍发生,那么你就是在相信一条特定的额外不可见定律。这就是对额外添加的不可见之物的信念。

为了说明为什么有时你确实会想要去思考那些被蕴含的不可见之物,假设你打算发射一艘宇宙飞船,以接近光速的速度飞向一个遥远的超星系团。等到这艘飞船抵达那里并建立起殖民地时,宇宙膨胀的加速程度将已经高到他们永远无法把消息再发回来了。为了所有将在那里生活并幸福地活着的人,你会觉得建立这个殖民地、做出这种纯粹利他的努力是值得的吗?还是说,你认为这艘飞船会在抵达之前就突然从存在中消失? 这在某个时刻很可能会成为一个非常现实的问题。

承认吧,如果我们能一劳永逸地把那些我们无法与之相互作用的实体排除掉——让宇宙在我们的望远镜边缘处停止存在——那整件事会简单得多。但那要求我们变得非常荒唐。

如果你说,你永远都不应需要对不可见之物形成一种独立的、额外的信念——你只相信那些作为一般性定律之逻辑蕴含的不可见之物,而这些一般性定律本身又是可检验的;并且即便如此,你对这些不可见之物也不再拥有任何不是从那些可见地可检验的一般规则中逻辑推出的进一步信念——那么,正确地运用这一原则时,它似乎确实能够排除掉一切关于不可见之物的信念滥用。

也许我应该说的是:“你应当把未经改动的先验概率分配给额外添加的不可见之物”,而不是说“不要相信它们”。但如果你把一种信念看成某种在证据上额外添加的东西,看成某种你值得去追踪、值得去统计支持或反对理由的东西,那么,我们是否真的应该对额外添加的不可见之物拥有额外信念,本身就是可疑的。

理论上,确实存在一些会打破这一原则的奇异案例。(例如:附带现象恶魔正在监视你;如果你说出 “Niblick” 这个词,它们就会在某个你永远无法核实的地方,折磨 3↑↑↑3 个受害者长达一年。)但我想不出有什么案例会让这一原则在人类实践中失效。