什么是证据筛选?

原文:https://www.readthesequences.com/What-Evidence-Filtered-Evidence

我曾讨论过这样一个困境:一位能言善道的说客,受雇向你兜售一个盒子;盒中可能有钻石,也可能是空的。这位说客指出,盒子上印有蓝色印章,而根据已知事实,装有钻石的盒子比空盒子更可能带有蓝色印章。从贝叶斯理论的角度来看,此刻你会如何反应?你是否一定要如说客所愿,无奈地以此调整自己的概率判断?

若能亲自检查盒子,自然可以自行评估所有线索。但如果你无法亲自检查呢?倘若你唯一能得到的证据只有来自说客的只言片语——受法律约束只能陈述真相,却又不将一切和盘托出——你又当作何反应?这位说客提出的每一条论据都确实构成了有效证据——你怎能无动于衷,不去调整自己相应的概率判断?在特定比例的 Everett 分支或 Tagmark 世界的平行宇宙中,带蓝色印章的 B 盒内确实存在钻石——这一事实难道就不成立了吗?根据 Jaynes 的观点,贝叶斯主义者必须始终根据所有已知证据作出判断,否则就会自相矛盾。但这样一来,只要有足够多的线索可供选择性报告,这位说客就能诱导你相信他们希望你相信的任何事。这听起来似乎不太对劲。

一个更简单的例子:一枚有偏差的硬币,要么偏向正面(正面概率 2/3,反面概率 1/3),要么偏向反面(正面概率 1/3,反面概率 2/3)。这两种情况的先验概率相等。每观察到一次正面,就有 1 比特的证据支持硬币偏向正面;每观察到一次反面,就有 1 比特的证据支持硬币偏向反面。假设我抛了这枚硬币十次,然后告诉你:「第 4 次、第 6 次和第 9 次都是正面。」现在,你认为这枚硬币偏向正面的后验概率是多少?

答案是,这个概率几乎可以是任何值,完全取决于我话语背后的因果动机——也就是说,我在报告时筛选抛掷结果的方式。

  • 我或许是在按这样一种规则行事:只报告第 4、6、9 次抛掷结果,无论其他抛掷的结果如何。假设你知道了我所采用的报告规则,就能得出后验概率比为 8:1,即硬币偏向正面的可能性是偏向反面的 8 倍。

  • 我可能是在报告所有正面朝上的结果,且只报告正面。在这种情况下,你能就此推断出其他 7 次均为反面朝上,后验概率因此变成 1:16,即硬币偏向正面的可能性仅为偏向反面的 1/16。

  • 我也可能事先决定,只有当硬币偏向正面的概率超过 98% 时,才报告第 4、6、9 次的结果。诸如此类。

再来看看 Monty Hall 问题:

你参加一个游戏节目,面前有三扇门,分别通向三个房间。已知其中一个房间里有 10 万美元大奖,而另外两个房间则是空的。主持人请你选一扇门,你选了 1 号门。接着主持人打开了 2 号门,展示里面空无一物。现在你是否要改选 3 号门,还是坚持最初的 1 号门呢?

答案取决于主持人的行为规则。如果主持人每次都会打开一扇门,而且总是选择一扇通向空房间的门,那么你应该换到 3 号门。如果无论门后是什么,主持人都会打开 2 号门,那么 1 号门和 3 号门各有 50% 的机会藏有奖金。如果主持人只在你最初选中了有奖金的门时才会打开另一扇门,那么你绝对应该坚持 1 号门不变。

在做判断时,你不应该仅仅考虑 「2 号门为空」这一事实,还得考虑「主持人选择打开 2 号门」这一行为。许多人之所以对经典的 Monty Hall 问题感到困惑,是因为他们在更新自己的概率判断时,只考虑到了 「2 号门为空」;单看这一条,1 号门和 3 号门确实各有 50% 的机会藏有奖金。这就是为什么,贝叶斯学派强调,我们必须根据所有已知信息来进行条件概率推理,否则就可能陷入自相矛盾。

当有人说出「第四次抛掷结果为正面」时,我们要考虑的并非「第四次抛掷结果为正面」这一事实本身。如果我们想从所有可能性的平行宇宙中找出自己所身处的宇宙,使用的筛选条件并非「硬币的第四次抛掷结果为正面」,而是「有一位遵循特定发言规则的发言人,说出了『第四次抛掷结果为正面』这句话」。说出的话语本身不等同于事实;不要被词语的字面意思所误导。

大多数法律程序都基于这样一种理论:每一个案件有且仅有双方对立,以及找两个各有偏见的人比找一个完全中立的人更容易。对于任意一项证据,控辩双方总有一方会有动机提出,如此法庭便能看到案件的全貌,这就是该理论的核心。在前文「两盒一钻」的困境中,如果能有两位能言善辩的说客各站一方,虽不如一位好奇的探索者那么理想,但效果也算是接近了。然而,这仅适用于只存在两个盒子的情况。现实中的问题往往涉及多方利益,矛盾错综复杂,答案也非昭然若揭,不是靠着对立双方彼此争吵叫嚣就能轻易解决的。

务必小心,千万不要滥用「证据筛选」这一概念,将其变成一个万能论据,用来排除所有不合己意的证据,比如说:「这个论点经过筛选,所以我可以置之不理。」如果某个反论令你感到不快,这恰恰说明你对该问题很熟悉,而且关心到足以站边。你可能已经了解过自己这一方最有力的论据。你不能从某一反论中凭空推断出有自己尚未发现的新的有利证据存在。(*译注:就是说你不能用「反方肯定筛选掉了对我有利的新证据」这种想法,来自我安慰或逃避反方的论证)因此,你只能面对这些令人不适的事实本身——B 盒上的蓝色印章依然是不可忽视的证据。

但是,如果你是首次听到某个论点,而且只听过一方的说法,那么你确实应该保持警惕!从某种意义上说,没有人会真正信服自然选择理论,除非他们先花五分钟时间听听神创论者的观点;之后他们就知道自然选择理论有多坚实了。