想象一下你在一家奇特的工厂里做着一份奇特的工作:你的任务是从一条神秘的传送带上取下物体,并将它们分拣到两个不同的箱子里。当你刚入职时,高级分拣员 Susan 向你解释说,蓝色的蛋形物体被称为「蓝蛋(blegg)」,要放进「蓝蛋箱」;而红色的立方体被称为「红方(rube)」,要放进「红方箱」。
开始工作后,你很快注意到蓝蛋和红方之间除了颜色和形状,还有其他的区别。蓝蛋表面有绒毛,而红方则是光滑的。蓝蛋捏起来有点弹性,红方则是坚硬的。蓝蛋是不透明的,而红方的表面微微透光。
工作没多久,你遇到了一个呈现异常深蓝色的蓝蛋——事实上,凑近一看,它的颜色是紫色的,介于红色和蓝色之间。
可是等等!你为什么要把这个东西叫做「蓝蛋」?「蓝蛋」最初的定义是蓝色(blue)和蛋形(egg-shaped)——实际上,「蓝色」这个限定条件就直接体现在「蓝蛋」这个名字里。而这个物体并不是蓝色的。既然缺少了一个必要条件,你应该叫它「紫色的蛋形物体」,而不是「蓝蛋」。
但碰巧的是,除了是紫色的和蛋形的之外,这个物体也长着绒毛、有弹性并且不透明。所以当你看到它时,你心想:「哦,一个颜色奇怪的蓝蛋。」它肯定不是一个红方……对吧?
尽管如此,你还是不太确定接下来该怎么处理。于是你叫来了高级分拣员 Susan。
「哦,没错,这是一个蓝蛋,」Susan 说,「你可以把它放进蓝蛋箱。」
你正要把紫色的蓝蛋扔进蓝蛋箱,但又停了下来。「Susan,」你问,「你怎么知道这是一个蓝蛋?」
Susan 奇怪地看着你。「这不是很明显吗?这东西虽然是紫色的,但它依然是蛋形的、长着绒毛、有弹性且不透明,跟所有其他的蓝蛋一样。你总得允许有点颜色瑕疵吧。还是说,你在拿那种哲学难题考我,比如『你怎么知道世界不是在五分钟前连同我们虚假的记忆一起被创造出来的?』在哲学层面上,我也无法绝对确定它是一个蓝蛋,但这看起来是个合理的猜测。」
「不,我的意思是……」你停顿了一下,斟酌着措辞。「为什么会有一个蓝蛋箱和一个红方箱?蓝蛋和红方之间究竟有什么区别 ?」
「蓝蛋是蓝色的蛋形物体,红方是红色的立方体,」Susan 耐心地回答。「你参加过标准的新员工入职培训了吧?」
「为什么蓝蛋和红方需要被分拣出来?」
「呃……因为不然它们就会混在一起?」Susan 说。「因为没人会付钱让我们整天坐在这里却不去分拣蓝蛋和红方?」
「那是谁最开始决定第一个蓝色的蛋形物体叫做『蓝蛋』的,他们又是怎么决定的?」
Susan 耸了耸肩。「我想你大可以把红色的立方体叫『蓝蛋』,把蓝色的蛋形物体叫『红方』,只是现在的叫法比较容易记住罢了。」
你想了一会儿。「假设传送带上下来一个彻底混合的物体呢?比如,一个橙色、球形、长着绒毛、半透明,还带有扭动着的绿色触手的物体。我该怎么判断它是蓝蛋还是红方?」
「哇哦,还从来没人发现过混得这么离谱的物体,」Susan 说,「但我猜我们会把它拿去给分拣扫描仪看看。」
「分拣扫描仪是怎么工作的?」你追问道。「X 光?核磁共振成像?快中子透射光谱仪?」
「我听说是根据贝叶斯法则(Bayes's Rule)工作的,但我也不太懂是怎么回事,」Susan 说。「不过,我挺喜欢念叨这个词的。贝叶斯、贝叶斯、贝叶斯、贝叶斯、贝叶斯。」
「分拣扫描仪会告诉你什么?」
「它会告诉你该把这东西放进蓝蛋箱还是红方箱。不然怎么叫分拣扫描仪呢。」
听到这里,你陷入了沉默。
「顺便说一句,」Susan 漫不经心地补充道,「你可能会感兴趣,蓝蛋里面含有小块的钒矿石,而红方里面含有少量的钯,这两种物质在工业上都很有用。」
「Susan,你简直是个恶魔。」
「谢谢夸奖。」
好,现在看来我们终于发现了蓝蛋的核心与本质属性:蓝蛋就是一个内部含有钒矿石的物体。诸如蓝色和长绒毛这些表面特征,并不能决定一个物体是否是蓝蛋;表面特征之所以重要,仅仅是因为它们能帮你推断一个物体是不是蓝蛋——也就是说,推断这个物体里面是否含有钒。
「含有钒」就是一个充要定义:所有蓝蛋都含有钒,而且所有含有钒的物体都是蓝蛋:「蓝蛋」只不过是「含钒物体」的一种简写说法。对吗?
别急着下结论,Susan 说道:大约 98% 的蓝蛋含有钒,但有 2% 的反而含有钯。准确地说(Susan 继续讲),大约 98% 的蓝色、蛋形、长绒毛、有弹性、不透明的物体含有钒。对于那些不太典型的蓝蛋,这个比例可能会有所不同:95% 的紫色蓝蛋含有钒,92% 的坚硬蓝蛋含有钒,依此类推。
现在假设你发现了一个蓝色、蛋形、长绒毛、有弹性、不透明的物体,从所有可见特征来看都是一个再普通不过的蓝蛋,你一时兴起把它拿去分拣扫描仪测试,扫描仪却显示「钯」——这是那罕见的 2% 之一。那么,它是个蓝蛋吗?
起初你可能会回答,既然你打算把这玩意儿扔进红方箱(用来提取钯),那你干脆就叫它「红方」得了。然而,事实证明,如果你关掉灯,几乎所有的蓝蛋都会在黑暗中发出微弱的光,而几乎所有的红方都不会。并且,对于那些含有钯(而非钒)的蓝色蛋形长绒毛有弹性不透明物体,它们在黑暗中发光的比例与普通蓝蛋的比例并没有显著差别。因此,如果你要猜测这个物体是像蓝蛋一样发光,还是像红方一样黯淡,你应该猜它会像蓝蛋一样发光。
那么这个物体到底是一个蓝蛋还是一个红方?
一方面,无论你还了解到关于它的什么其他信息,你最终都会把它扔进红方箱。另一方面,如果这个物体还有任何你需要去推测的未知特征,你会把它当成一个蓝蛋(而不是红方)去进行推测——你会把它归入「蓝色蛋形长绒毛有弹性不透明物体」的相似性聚类中,而不是归入「红色立方体光滑坚硬半透明物体」的相似性聚类中。
「这个物体是一个蓝蛋吗?」这个问题,在不同的场合下,其实代替了不同的查询(queries)。
如果它没有代替某种实际的查询,你就没有任何理由去关心这个问题。
无神论是一种「宗教」吗?[1] 超人类主义是一个「邪教」吗?[2]那些辩称无神论是一种宗教(「因为它也陈述了关于上帝的信仰」)的人,真正试图争辩的其实是(我认为):无神论所使用的推理方法和宗教使用的推理方法处于同一水平;或者在导致暴力的可能性上,无神论并不比宗教更安全,等等……这里真正受到威胁的,是无神论者声称自己相对于宗教具有实质性差异和优越性;而宗教人士试图通过否认这种差异(而不是否认这种优越性!)来驳斥这一点。
但这还不是从根本上最不理性的部分:最不理性的部分是,在争论的过程中,有人掏出了一本字典,查阅了「无神论」或「宗教」的定义。(而且没错,无论是无神论者还是宗教人士这么做,都同样愚蠢。)一本字典怎么可能决定无神论者的经验聚类(empirical cluster)是否真的与神学家的经验聚类有着实质性的不同?现实怎么可能随着一个词语的含义而改变?当我们重新划定边界时,事物空间(thingspace)中的点并不会跟着跑来跑去。
但人们常常没有意识到,他们关于「如何划定定义边界」的争论,实际上是在争论「要不要推断某个特征被该经验聚类内的大多数事物所共享」……
这就是「伪装的查询」(disguised query)这句话的由来。
上一篇:
事物空间的聚类结构下一篇:
神经类别Thoughts Memo 汉化组译制
感谢主要译者 gemini-3.1-pro,校对 Jarrett Ye
原文:Disguised Queries
参考
1. 不加批判的超临界状态 ./1972605380472334329.html2. 邪教式反邪 ./2004256642078884961.html