贝叶斯主义者 vs. 野蛮人

❦

假设我们有两组士兵。第 1 组里，列兵不懂战术与战略；只有中士懂一点战术，只有军官懂一点战略。第 2 组里，则是所有层级的人都完全懂战术与战略。

我们是否应该预期第 1 组会打败第 2 组，因为第 1 组会服从命令，而第 2 组里的每个人都会想出比他们接到的命令更好的主意？

在这种情况下，我就不得不怀疑第 2 组究竟在多大程度上真的理解军事理论，因为「一盘散沙会被屠杀殆尽」乃是一个最基本的命题。

假设一个理性主义者国家，遭到了一个对概率论和决策理论一无所知的邪恶野蛮人国家的攻击。

现在，关于「理性」或「理性主义」，存在着某种观点，大概会这样说：

「显然，理性主义者会输。野蛮人相信有来世，勇敢的人会在那里得到奖赏；所以他们会毫不犹豫、毫不悔恨地投身战斗。由于他们围绕自己的事业和伟大领袖 Bob 形成了情感死亡螺旋，他们的战士会服从命令，而他们后方的公民也会满怀热情、全负荷地为战争生产；谁若被抓到中饱私囊或出工不出力，就会按照野蛮人的传统被绑上火刑柱烧死。他们会相信彼此的善良，也会比任何理智的人更强烈地仇恨敌人，从而把自己紧紧捆成一个整体。与此同时，理性主义者会意识到，战死沙场根本没有任何可设想的奖赏；他们会希望别人去战斗，却不想自己上战场。就算他们能找到士兵，他们的平民也不会那么配合：只要任何一根香肠几乎都不可能直接导致整个战争机器崩溃，他们就会想把那根香肠留给自己，因此不会像本可以做到的那样贡献出更多。无论他们的文化起点多么精致、优雅、文明、高产、非暴力，他们都无法抵挡野蛮人的入侵；理性讨论根本不是一个持枪狂徒的对手。最终，野蛮人会胜出，因为他们想要战斗，他们想要伤害理性主义者，他们想要征服，而他们整个社会都围绕征服而团结起来；他们对这件事的在乎程度，超过了任何一个理智的人。」

战争并不好玩。自有文字记载以来，无数无数人已经发现了这一点；在有文字记载之前，也有无数无数人已经发现了这一点；就在此时此刻，在某个可悲的小国里，也总有某个社群正在发现这一点，而那个国家自身的苦难甚至早已上不了头版了。

战争并不好玩。输掉一场战争就更不好玩。古人早就说过：「欲求和平，必先备战。」你的对手不必相信你会赢、会征服；但他们必须相信，你会抵抗得足够顽强，以至于让他们觉得不值得动手。

你于是就会明白：如果所谓「理性主义者」的命运，真的注定是在战争中永远失败，那么我就绝不可能凭良心去倡导让「理性」在公众中广泛传播。

这大概是我在这里讨论过、或者打算讨论的最肮脏的话题。战争并不干净。当前的高科技军队——这里我指的是美军——之所以独特，是因为它们能够对对手施加压倒性的优势武力；而这反过来又使它们得以对敌方伤亡和平民伤亡表现出一种在历史上极其罕见的关注程度。

赢得战争并不总意味着要把一切道德都扔掉。历史上也有不靠酷刑取胜的战争。战争不好玩，并不意味着例如质疑总统就等于不爱国。我们之所以已经习惯于看到「战争」被拿来当坏行为的借口，是因为在美国近代史里，它基本上确实一直就是这么被用的……

但把愚蠢反过来并不等于聪明。把邪恶反过来，也同样不等于聪明。真正的战争，依然不可能靠精致的礼貌赢下来。如果「理性主义者」连这种心理冲击都无法提前让自己做好准备，那么野蛮人就真的会赢；而那些「理性主义者」……我不想说他们是「活该输掉」。但他们将会在自己社会的生存测验中失败。

先让我从一个想法说起：在原则上，理想的理性行动者不可能打仗，因为他们每个人都宁愿当平民而不是当士兵。这个想法是错的。

正如前面已经较为详细地讨论过的那样，我在纽科姆问题里会只拿一个盒子。

与此一致，我不认为：如果一场选举最终的票数是 100,000 比 99,998，那么所有去投票站投票的人，都是非理性的，只因为「我待在家里也不会影响结果」。（我也不认为，如果选举结果是 100,000 比 99,999，那 100,000 个人就会全都在个体层面上、单独地对这个结果负全部责任。）

与此一致，我也主张：两个理性 AI（使用我这类决策理论的那种），哪怕它们的效用函数完全不同，哪怕它们是由不同创造者设计出来的，只要它们对彼此的源代码拥有公共知识，它们就会在真正的囚徒困境中合作。（或者，哪怕只是对彼此在恰当意义上的理性拥有公共知识，也一样。）

与此一致，我相信：只要一个群体项目在（概率期望意义上的）结果上优于缺乏协调时的结果，理性行动者就有能力在群体项目上达成协调。一个由使用我这类决策理论的行动者组成、并且对这一事实拥有公共知识的社会，最终会落在帕累托最优点上，而不是纳什均衡上。如果所有理性行动者都同意：战斗比投降对他们更有利，那么他们就会选择与野蛮人作战，而不是投降。

想象一个由可自我修改 AI 组成的社群：它们在集体层面上更偏好作战而不是投降，但在个体层面上每一个都更偏好当平民而不是上战场。一个解决办法是运行一次抽签，由任何行动者都无法预先预测的随机机制来选出战士。在抽签运行之前，所有 AI 就会预先修改自己的代码：这样一来，如果自己被抽中，它们就会以对整个社群而言效率最高的方式去作战——哪怕那意味着平静地走向自己的死亡。

（反思一致的决策理论，运作方式与此相同，只不过不需要真正进行自我修改。）

你会回答说：「可是在现实的人类世界里，行动者并不完美理性，他们也并不对彼此的源代码拥有公共知识。按照你的决策理论，在囚徒困境中实现合作需要满足某些条件（此处页边太窄，写不下这些条件），而现实生活中这些条件并不满足。」

我会回答：现实生活中的纯粹、真正的囚徒困境极其罕见。在现实生活中，通常总会有连锁效应——你的行为会影响你的声誉。在现实生活中，大多数人或多或少都在乎别人身上会发生什么。而且在现实生活中，你还有机会去建立激励机制。

而且在现实生活中，我确实认为，一个由人类理性主义者组成的社群，是可以培养出愿意为了保卫社群而赴死的士兵的。前提只是：不要在学校里告诉孩子们，理想的理性主义者在囚徒困境中就该彼此背叛。应该让这样一种观念被广泛相信——而我也正是出于和我在纽科姆问题中只拿一个盒子完全相同的理由而相信它——那就是：如果人们以个体身份决定不去当士兵，或者士兵决定临阵逃跑，那么这就等于是在替野蛮人作出胜利的决定。其理由与以下理论相同：如果一场选举以 100,000 比 99,998 结束，那么让每一个选民都说「我这一票无关紧要」并不合理。应该把这句话明确说出来（因为它是真的）：效用函数不必是唯我主义的；如果一个理性行动者足够在乎自己正在守护的东西，那他就可以为一项事业战斗到死。不要告诉他们，理性主义者理应合理地预期自己会输。

如果这就是那个理性主义社会的文化与风俗，那么我认为，那个社会里的普通人类就会自愿报名去当士兵。毕竟，这似乎同样也是写在人类身上的一部分。你只需要确保文化训练不会妨碍这一点。

如果我错了，而这样仍然无法给你带来足够多的志愿者呢？

那么，只要人们整体上仍然偏好战斗而不是投降，他们就有机会建立激励机制，从而避开真正的囚徒困境。

你可以为谁会被选为战士而进行抽签。有点像上面那个 AI 自改代码的例子。只不过，如果「保持反思一致；去做那个你会预先承诺自己去做的事」对人类而言还不足以构成服从抽签结果的动机，那么……

……那么，在抽签真正运行之前，我们或许都可以同意：给被抽中的人服用能额外激发勇气的药物，并在他们逃跑时将其击毙，是个好主意。即便要考虑到我们自己也可能会在抽签中被选上。因为在抽签之前，这才是那项能让我们拥有最高生存预期的一般政策。

……就像我说过的：真正的战争 = 不好玩，输掉战争 = 更不好玩。

顺便说清楚，我并不是在支持当今实践中的征兵制。那些征兵制，并不是一个民众整体试图把自己从纳什均衡移动到帕累托最优的集体尝试。征兵制只是国王们玩游戏时，用来征召玩具士兵的工具。那些逃去加拿大的越战应征者，在我看来是对的。但一个认为自己聪明到不需要国王的社会，并不必须聪明到无法生存。哪怕野蛮人的大军正在入侵，哪怕野蛮人确实实行征兵制。

理性的士兵会服从命令吗？如果指挥官犯了错呢？

士兵会行军。每个人的脚都以同样的节奏落在地面上。甚至，也许还是违逆他们自己的倾向去这么做，因为若任由人们自行其是，他们会各走各的步子。由人构成的激光束。这就是行军。

如果有可能发明出某种群体决策方法，且它优于由上尉直接下达命令，那么一支由理性士兵组成的连队就可能会实施那套程序。如果并不存在任何被证明优于上尉的更好方法，那么一支由理性士兵组成的连队就会承诺服从上尉，哪怕这违背他们各自分散的倾向。而如果人类并没有那么理性……那么在抽签之前，那种能给你带来最高个人生存预期的一般政策，就是击毙那些抗命的士兵。这并不是说，那些在越战中用手雷炸自己长官的人就错了；因为他们也完全可能一贯地主张：他们更希望没有任何人参与那场征兵抽签。

但一盘散沙会被屠杀殆尽，所以士兵们必须拥有某种办法，在追求同一目标时，于同一时刻去做同一件事；否则，若任由他们自行其是，他们就会朝四面八方各自散去。命令未必要像来自高高在上的部落首领那样，出自某个上尉；但统一的命令必须来自某个地方。一个士兵聪明到不愿服从命令的社会，是一个聪明到无法生存的社会。一个人们聪明到不愿成为士兵的社会，也是如此。这就是为什么我这里说的是「聪明」，而不是「理性」；「聪明」这个词，我常常是带着贬义来用的。

（不过，我确实认为，有一个问题非常重要：你是否能够想出一种真正、切实地比「有个领袖」运作得更好的小群体协调方法。人们越能信任这种群体决策方法——越能相信它的确优于大家各走各路——那么即便在不存在可执行的抗命惩罚时，他们也越能以更连贯的方式行动。）

我之所以说这些——尽管我当然并不指望理性主义者会在短期内接管某个国家——是因为我觉得：我们对一个「由像我们这样的人组成的社会」抱有什么看法，某种程度上也反映了我们如何看待自己。如果你相信，一个由像你这样的人组成的社会，会因为过于讲道理而无法长期生存……那是一种自我形象。而如果你相信，一个人人都像你一样的社会，能够与那群邪恶而凶残的野蛮人作战，并且赢下来——不只是凭借更优越的技术，而且还因为你的人彼此关心，也关心他们共同的社会——而且还因为他们能够直面战争的现实，却不因此迷失自己——而且还因为他们会算出群体理性要求做什么，并确保那件事真的被做成——而且还因为概率论和决策理论的规则里，没有任何一条说你不能为了某个事业而牺牲自己——而且还因为，如果你真的比敌人更聪明，而不是只是在自我吹捧，那么你就应该能够利用敌人不允许自己去思考的那些盲点——而且还因为，不管敌人在战前把自己鼓动得多么夸张，你都会觉得：一个内在连贯、不自我分裂的心智，也许再加上一点类似冥想或自我催眠的练习，在实战中完全可能打得和那个在理论上相信自己死后会有七十二个处女等着的人一样狠——

那么，你就会对自己、以及那些像你一样在群体中行动的人，抱有更高的期望；然后，你就能把自己看成某种不只是文化死胡同的存在。

所以，就这样来看吧：Jeffreyssai 如果是单独作战，大概是不会向邪恶野蛮人认输的。那么，一整支 beisutsukai 大师的军队，理应成为一股谁都不敢招惹的力量。这就是那个激励性的愿景。问题只在于：它究竟是如何运作的。

Thoughts Memo 翻译合集

贝叶斯主义者 vs. 野蛮人