← 返回目录


利特尔伍德定律与全球媒体

钻研人类记忆,探索复习算法。改善教育公平,践行自由学习。

7 👍 / 0 💬

随着人口和媒体规模的扩张,媒体的选择效应日益增强。这意味着,由精神病患或恶作剧者等非常规因素驱动的罕见数据点,作为任何形式的证据都愈发不可靠,我们必须对其视而不见。在宏大的尺度上,任何可能之事,都必将发生——次数稀少,但绝不为零。

无论是线上媒体、主流媒体还是社交网络,它们都愈发倾向于关注“故事”和“事件”,而非趋势与平均值,从而严重歪曲了我们对世界状况的认知。这是因为,随着全球人口与媒体覆盖范围的同步增长,媒体对叙事的渴求会自然地聚焦于最极端的数据点。然而,在全球尺度下,这些极端个例具有极强的误导性,因为它们的驱动因素往往是精神疾病或恶意骗局等非常规力量。
在全球尺度上,任何可能发生之事,都必将发生——次数稀少,但绝不为零。这被概括为「利特尔伍德定律:在任何普通人的一生中,奇迹大约以每月一次的频率发生。」如今,这一定律必须被扩展至全球范围,用以审视一个覆盖 80 亿人口、高度互联的全球媒体所报道的种种异常现象——无论是巧合、骗局、精神疾病、心理怪癖、极端人格、错误、误解、恐怖主义,还是未解之谜。因此,世上将有足够多的“奇迹”发生,以至于所有媒体报道都可能完全由极端个例构成——尽管宣称所有经媒体报道的事件都可能只是侥幸的偶发事件,听起来像是一种“耸人听闻”的说法。
这创造了一种极其不利于我们理解现实的认知环境,它致力于搜寻并放大那些最不具代表性的数据点。
鉴于此,我们必须对任何经过选择性报道,却(通常是隐晦地)宣称能代表某种普遍趋势或世界真相的个别轶事或故事,保持极度的怀疑。运用批判性思维、强调趋势与平均值、要求核查原始来源等标准方法,有助于我们抵御新闻所带来的偏见效应。

新闻的悖论在于,其设计本身就可能让你越读越无知。你积累了海量的“事实”和“案例”,它们(通常)是真实的,但你对它们的解读却与现实渐行渐远。这一点向来如此,但在更迭速度极快的网络媒体、主流媒体和社交网络时代,问题似乎愈发严重。媒体倾向于聚焦“故事”和“事件”,而非趋势与平均值,这些热点来了又去,如同「议题-关注周期」中的一阵风潮,远在后续的深度报道、事实核查或证伪研究跟上之前就已消失(而且这个周期可能还在加速——谁还记得上个月的义愤填膺,更别提一年前的滔天危机了?)。Scott Alexander 在 2017 年 3 月就曾指出一则新闻后续报道中的叙事反常(这则后续报道获得的关注远不及最初的新闻):

还记得当时人人都在讨论,说特朗普一定是在其支持者中煽起了一股反犹主义犯罪浪潮吗?还记得其中一些事件的始作俑者被查出是一位在左翼杂志工作的反特朗普社会主义者吗?好吧,其余事件的罪魁祸首,似乎是一名以色列犹太人,他可能患有足以改变人格的脑瘤。《大西洋月刊》对整起事件发表了一篇相当不错的复盘。⁠[⁠1⁠]

利特尔伍德定律

这个案例之所以有趣,因为它诠释了「利特尔伍德奇迹定律」的一个变体:在一个拥有近 80 亿人口、且日益网络化、移动化和富裕的世界里,一件「十亿分之一」概率的事件,每个月就会发生 8 次。利特尔伍德定律本身又是 Diaconis & Mosteller 在 1989 年提出的「巨数法则」的一个特例:

巨数法则(The Law of Truly Large Numbers)。简言之,巨数法则指出:只要样本足够大,任何骇人听闻之事都可能发生。重点在于,那些真正罕见的事件,比如[数学家利特尔伍德 (195372ya) 定义的]需要达到百万分之一概率才称得上惊奇的事件,在一个拥有 2.5 亿人口的国度里注定会频繁发生。如果一件巧合每天降临在百万分之一的人身上,那么我们预计每天会发生 250 次,每年将近 10 万次。
将时间尺度从一年扩展到人的一生,将人口基数从美国扩展到全世界(本文写作时为 50 亿),我们可以绝对肯定,我们将见证无数令人难以置信的奇事。当这类事件发生时,它们往往会被注意到并记录下来。如果它们发生在我们自己或熟人身上,那种诡异的感觉便挥之不去。

人类的极端行为不仅比我们想象的更离奇,甚至比我们所能想象到的极限还要离奇。

政治

……欧洲接连发生气候活动家向名画投掷汤或土豆泥的事件,这促使大都会艺术博物馆的警卫们重新审视了安保流程:警报指挥中心,清空展厅。她环顾四周,没看到手持汤罐的人。「假设某种人格是百万里挑一的。那就意味着我们每年至少会遇到 7 个这样的人」,Bringley 说道。
Patrick Bringley

在美国(一个超过 3.25 亿人口的国家),仇恨犯罪和反犹攻击在绝对数量上是相当罕见的,因此我们不需要一个普遍的理由来解释这些稀有的事件。数量惊人的仇恨犯罪最终被证实是骗局,且由受害群体的成员自己策划。比如说,一个黑人在自家草坪上伪造一个燃烧的十字架或悬挂的绞索,这听起来很疯狂,但显然,总有那么一两个黑人有足够的动机去这么做。但问题在于,动机甚至都不是必需的。在关于诈骗犯的记述中,一个反复出现的主题是,一旦你意识到我们日常交往中默认并依赖了多少善意,他们的骗局就显得多么可以理解,而他们本人及其恶意又是何等的可悲可怜(借用和窃取财富与权力来填补内心的空虚);而在关于伪造者、骗子和捏造者的记述中,最一致的主题却是:调查者在穷尽所有线索、审视所有次要因素、不甚信服地列出所有看似合理的动机(如职业发展)、并与当事人进行了漫长而徒劳的访谈(只得到搪塞和谎言)之后,最终只剩下沉默。他们为什么要这么做?无人知晓。

如果有人说:「我不太相信这些反犹骗局是真的,我不认为是一群反犹分子因特朗普当选而变得猖獗,我觉得另有隐情,比如可能是某个员工为了骗取捐款而捏造的。」你大概会觉得这人在找借口。如果他又说:「我不信,这些事可能是假的,说不定是某个患有精神分裂症的疯子,或者某个脑部长了肿瘤、又精通网络电话恶作剧的犹太人一手包办的。」你肯定会认为他是在拼命地编造借口、否认事实,并且——说白了——他真该为自己如此缺乏理智、党同伐异而感到羞耻。

然而,事实就是如此!这显然是真实发生过的:一个远在世界另一端以色列的(自我憎恨的?)犹太人,决定在特朗普当选后,将自己所有的业余时间都投入到通过网络向美国数十个犹太机构发动仇恨犯罪骗局上,部分原因是他是一个反社会、患有自闭症的罪犯,而其行为动机可能又部分源于一个导致严重人格障碍的脑瘤。这听起来荒谬得难以置信,完全是编造的——然而,在近 80 亿人中,确实至少存在一个邪恶的、患有脑瘤的电话骇客犹太人,而我们所有人都听闻了他的“杰作”。「哎呀,地球上可真是无奇不有啊。」[⁠2⁠](顺便一提,那些反犹炸弹威胁的另一位罪魁祸首是一位自由派记者。)

再想想 Nasim Najafi Aghdam 制造的 YouTube 总部枪击案,此案因其是女性实施的大规模枪击而不同寻常,但更离奇的是,这位自称「第一位波斯裔女性素食健美者」[⁠3⁠]的作案动机,竟然似乎是因为 YouTube 移除了她在伊朗颇受欢迎的素食主义和健身视频中的广告。或者那个说服朋友按英国情报部门命令谋杀自己的英国男孩的故事呢?还有达尔文奖、像企图行刺卡瓦诺大法官的刺客那样的「随机恐怖主义」,以及普遍存在的网络准社会关系?又或者,当有人(或许是利用大语言模型)复制了某件事,并抹去了来源信息,导致你听说了一件又一件骇人听闻的事件,这些事确实可能发生,也的确发生了……但其实只发生了一次,而非你听到的几十次?

技术

工业事故亦是同理。罕见的后果无需普遍的原因;一次反常的事故可能源于一个反常的起因。在工业事故的复盘报告中,我们常常看到一长串不幸的巧合与环环相扣的故障,它们共同导致了最终的爆炸。「瑞士奶酪模型」将系统的每一层防护都比作一片瑞士奶酪,只有当六七层奶酪上的孔洞恰好对齐时,危险才会穿透而过:系统在某种程度上总是在失效,但其高度的冗余性避免了整体崩溃——直到那一天真的来临,我们才惊叹于七个截然不同的环节竟然会同时出错。

正因为飞机如此安全,它们才不再因为「螺旋桨脱落」或「飞行员在雾中看不见地面」这类平淡无奇的合理原因而坠毁。如今残存的航空事故,往往都以某种方式令人瞠目结舌:德国之翼航班的自杀式坠机,不仅需要一个决意与全机人同归于尽的飞行员,还需要他滥用 9/11 之后旨在防止劫机坠机的安全机制;还有法航 447 航班副驾驶那令人难以置信的愚蠢操作;又或者……马航 MH-370 身上究竟发生了什么。在科技领域,那些从事全球规模系统(有时被称为「超大规模系统」)开发的软件工程师,被迫直面一个事实:在巨大的尺度上,任何可能发生的事,最终都将发生——诚然,概率极低(否则问题早就被修复了),但次数绝不为零。而这零星的发生,就足以触发一种全新的故障模式,从而损坏甚至摧毁整个计算机系统(相比其他系统,计算机系统至今仍相当脆弱)。这些由异常情况触发的 bug 成了工程师们津津乐道的「战争故事」,但也揭示了一个更重要的道理:当系统以人们未曾想过可能的方式崩溃,或出现了人们认为绝无可能的数据点时,现实便超越了设计者的想象力(「你什么意思,『一个字节可以有 1 到 48 个比特』‽」)。

科学

我们再来想想科学论文。想象一个理想情境:所有模型都永远正确,所有研究计划都经过预注册等等。二战后,全球学术-工业复合体经历了指数级的大扩张,如今每年发表的论文数量高达百万篇级别。假设研究者们遵循着(不幸地)相当普遍的做法:在几个数据子集上测试几种模型配置,使用几个协变量,并在决定统计方法前凭肉眼“观察”一下数据,那么每篇论文都相当于进行了数千次 NHST 检验(零假设显著性检验)。因此,即便在零假设为真(当然,它从不为真)的情况下,也完全有可能合理地观察到一个 p =(十亿分之一)或 p < 0.00000005 的显著性水平。如果只考虑过去十年左右的最新论文,你甚至可能看到 p < 0.0000000005。所有这一切,都可能发生在零假设为真的前提下。当然,在现实中,情况比这要糟糕得多。再考虑到虽低但不为零的学术欺诈率、有问题的研究实践、错误的参数化建模假设、普遍存在的发表偏见,以及调查研究中类似「蜥蜴人常数」的怪现象(即总有小部分受访者会胡乱作答或给出捣乱的答案,被追问时还会给出荒谬的辩解)等等,我们就会触及一个临界点:无论关于某个特定效应的研究有多少,你都无法对其产生特别强烈的信念。因为这些数据可能只是在越来越精确地测量该研究领域中的固有噪音水平,而不是你希望解读出的那个实质效应(这就像是应用于偏见问题的迪昂-蒯因论题)。

媒体

你当真觉得会有人干这种事?就是上上网,然后胡说八道?
——亚瑟

我们能因为电影或照片看起来逼真就相信它们吗?我们总觉得,「毕竟,没有哪个骗子有能力或财力制作出如此逼真的视频」,对吧?当然不能信。这无关「深度伪造」(Deep Fakes),而是因为全人类一直以来都以极大的热情,致力于生产数以百万计的高度复杂的「假新闻」——倾其才智,耗费巨资,去……制作虚构事件的虚构影像,比如好莱坞电影。许多骗局或伪造品之所以质量高,仅仅因为它们是从商业媒体、特效制作、伪纪录片等内容中回收再利用的,而这些原始内容本身就有着极高的制作标准,且往往被刻意设计来抹去一切虚构的痕迹。

事实核查网站每天都在和那些从政治讽刺网站(如《洋葱新闻》或《巴比伦蜜蜂》)抄袭来的文章作斗争。这些文章被转发后,新的读者往往意识不到这只是个玩笑。这种情况贯穿历史,甚至出现在最受人尊敬的信息来源中。

举个例子,西奥多·罗斯福总统从未骑过驼鹿。但当初在备受敬重的 Underwood & Underwood 图片社,那位编辑创作这张照片时,并无「伪造」之意:这不过是一种政治幽默,是包含三张合成照片的系列作品之一,另外两张的主角是罗斯福的总统竞选对手——威廉·塔夫脱(骑着大象)和伍德罗·威尔逊(骑着驴)。这张照片后来被人翻出,并重新用于网络表情包。(说起大象,你可能见过一张据称拍摄于 1970 年代爱尔兰暴乱现场的大象照片——那其实是为一个有趣的爱尔兰讽刺系列 P 的图,后来却被信以为真。又或者那张「三岁的扫烟囱小男孩」的照片?)近来,可能已有数十万人被一段视频所蒙蔽,视频内容是某学校食堂的饮料被投入泻药,导致学生们当众呕吐和排泄。毕竟,这场恶作剧看起来如此逼真:手持设备拍摄的晃动画面,如此多学生同时遭殃……一个普通网民用 Photoshop 怎么可能伪造得出来?——骗子们确实没用 Photoshop,因为这些镜头本就出自一部Netflix 制作的多季伪纪录片连续剧。再比如那段构思巧妙的监控录像,记录了几个商店扒手如何联手制服一名劫匪?同样来自另一部剧集。视频最初发布在该剧的官方账号上,并附有一段明确说明其为虚构的结尾,但在病毒式传播中,这段结尾被转发者们「贴心」地删掉了。是哪部剧?嗯,你几乎肯定没听过(更别提看过)的那种。因为得益于 Netflix 等平台的崛起,仅在美国,现在每年就有超过 400 部有剧本的电视剧集问世。没人能看完这些剧集的哪怕一小部分,但每年都有更多高质量的虚构视频素材被累积下来,随时可能被武器化。

幸运的是,一场泻药恶作剧无伤大雅。但想象一下,某天,一位满怀理想的年轻自由派导演决定拍一部关于特朗普政府的伪纪录片,里面甚至包含了那段传说中的「小便录像带」?(或者看看那些关于活摘器官的伪造视频?)又或者,当备受喜爱的经典绘本《好饿的毛毛虫》的作者 Eric Carle 去世时,一个故事流传开来,称曾有编辑试图篡改故事,加入关于肥胖的说教。这个故事的来源无可指摘,出自一本 Carle 的传记,书中援引了《巴黎评论》的一篇访谈(该杂志以深度访谈闻名),Carle 在访谈中确实说了这番话——然而,那篇访谈其实是(非常)一本正经的讽刺作品,不仅骗过了传记作者,甚至连《巴黎评论》自己的员工都未察觉,他们还授权传记作者引用了这篇访谈!

骗局的产生甚至不需要一个蓄意的「骗子」:它们可以自发涌现(形成某种「孤立个体集合」?)——也许有人看到一个视频片段,没注意元数据,就直接发布了;又或许,一个观众看到没有元数据的视频,便想当然地认为它是真实的,并加以转发。病毒式骗局就此诞生。Snopes 网站上充斥着这类案例。在媒体的世界里,向来是「三人成虎」。请记住:「内容故意做得那么烂,就是为了骗你点击。」

规模下的长尾效应

「古人曾用它们[真知晶球]做什么?」皮平问道,他为这么多问题都能得到解答而又惊又喜……「为了远望,也为了在思想中彼此交谈,」甘道夫说……在迪耐瑟尚有智慧的岁月里,他自知力量有限,不敢用它来挑战索伦。但他的智慧终究是衰退了……他的意志足够强大,不至被黑暗魔君所征服,然而,他所见的,终究只是魔君允许他看见的那些景象。他由此获得的知识,无疑时常对他有所助益;可他所见的魔多那庞大力量的幻象,却不断滋养着他内心的绝望,直至心智彻底崩溃。
——甘道夫,《王者归来》

随着时间推移,要凭表面价值去相信罕见事件,变得越来越困难,我们必须学会「公然反抗数据」。没错,那段视频看起来是真的,但它很可能不是;有人费尽心机搞那么多炸弹骗局确实匪夷所思,但或许真的就有人这么做了,而这并不代表一场席卷全国的反犹恐怖浪潮;或许那名副驾驶就是决意要坠机,而这终究不是一次 ISIS 袭击。在某个临界点,你可能必须开始彻底忽略所有的坊间传闻和孤立的数据点,因为它们近乎于零证据,并且从先验概率上讲,它们很可能就是假的。

这就是生活在一个宏大世界中的常态,并且随着全球人口、财富与闲暇的增长,以及技术的进步,这个世界只会变得更大。(如果你觉得人类的想法、行为和犯错方式已经够离奇了,等着瞧吧,一旦每个人都用上好用的人工智能技术!)这世上有数十亿人,任何可能出错的地方,就一定会出错。这便是极权主义原则——「凡不被禁止的,皆为强制。」

认识论的启示

然而,「这一切最终都归于常态」

因为怪诞之事,无论多么离奇,或被报道得多么频繁,都越来越无法告诉我们关于整个世界的任何信息。如果你生活在一个百人小村,听说了 10 件劣迹,这些极端行为并不会太极端,你可以从中吸取教训(它们甚至能让你大致了解普遍的人性)。但如果你生活在一个百亿人口的“地球村”,听到了 10 件轶事,你……真的什么也学不到。因为那少数几个极端轶事,代表的是无数偶然因素汇合而成的极端巧合,它们永远不会以完全相同的方式重演(我们可以断言,再也不会有一个伊朗裔的健身教练去枪击 YouTube 总部了),也无法为其他数十亿人提供任何可借鉴的教训。一个人或许可以活上一千次,也无法亲身经历此等极端,而只能通过媒体间接窥见。

这并非“社交媒体”或“俄罗斯水军”这类替罪羊的过错——即便没有它们,问题依然存在。媒体可以对每一起(真实的)事件进行完美精确的报道,但仅仅是报道它们、让我们了解到这些近乎绝迹的离奇事件这一行为本身,就是问题所在——我们无法在心理上给予它们恰当的权重。这不仅仅是选择性偏差[⁠4⁠],这是一种随着时间推移而不断恶化的选择性偏差。

应对之策

1939 年秋,路德维希·维特根斯坦与他在剑桥的年轻学生兼朋友诺尔曼·马尔科姆沿河散步时,看到报摊的牌子上写着,德国指控英国政府煽动了近期一起刺杀希特勒的阴谋。维特根斯坦表示,此事若为真,他一点也不会惊讶。马尔科姆却反驳说这绝无可能,因为“英国人太文明、太正派了,不会搞这种下三滥的勾当,……这种行为与英国的‘民族性格’格格不入。”维特根斯坦勃然大怒。大约五年后,他致信马尔科姆:
每当我想起你,总会想起一件在我看来至关重要的往事。……你当时关于‘民族性格’的评论,其观念之原始令我震惊。我那时想:学习哲学又有什么用呢?如果它带给你的,仅仅是让你能头头是道地谈论一些深奥的逻辑问题;如果它不能改善你对日常生活中重要问题的思考;如果它不能让你在使用那些被某些人为了自身利益而滥用的危险词句时,比任何……记者都更严谨。你看,我知道要出色地思考‘确定性’、‘概率’、‘知觉’等问题很难。但是,如果可能的话,要真正诚实地去思考,或尝试去思考,你自己的生活与他人的生活,则更加困难。
——诺尔曼·马尔科姆[⁠5⁠]

我们能做些什么来保护自己呢?

我们可以尝试构建一种新的交流方式,使其能够体现事物的真实比例,内置一种我们凭直觉无法做到的权重机制。这类似于感觉小人等时线图等可视化技术:

更直接的建议是,你应该抓住重点:定期反思消费新闻究竟给你带来了多少实际效用。如果你将其辩解为一种娱乐,那么它让你感觉如何(事后你真的感到愉悦或精神焕发吗?),你是否应该花这么多时间在上面?采纳多贝里的建议,尝试减少或忽略即时新闻(比如用《经济学人》这样的周刊代替日报订阅,尤其要戒掉有线电视新闻!);将注意力从高频噪音转向具有长期重要性的话题(例如,多读科学文章,少看民调或股市分析);不要依赖他人为你筛选好的新闻/观点/评论/轶事的便利样本,而应建立自己的信息源,它至少会带有不同的偏见,且不那么极端(也就是说,不要看了 10 条网评就下结论,去问问你自己的 10 个关注者,或者去读 10 篇随机报道,而不是热搜前十);在读到全文之前,不要轻易下定论——坚持追溯和获取全文信源(如果你没时间追溯信源,那么你的关注者们加起来也没时间去读它)[⁠8⁠];把文章读完(许多报纸,如《纽约时报》,有个坏习惯,总把关键的保留意见放在文章末尾,而大多数读者根本不会读到那里);对那些“好得不像话”的事情保持警惕;专注于直接的效用;尝试减少对个例和故事的依赖;考虑一些认识论上类似于稳健统计学的方法,比如直接忽略数据中最高和最低的百分位;最后,关注趋势、大局和中心倾向,而非异常值。

这个世界只会变得越来越大。

天地万物,一由天成,一由人造。时间的瑰宝深藏于古瓮、钱币与碑石之中,其位之高, едва 触及草木之根。时间拥有无穷的奇珍,尽显万般形态;它揭示天穹的往事,促成大地的发现,甚至让大地本身,也成为一个新的发现。那伟大的古迹美洲,曾被埋没千年;而地球的广袤疆域,于我等而言,仍大部分封存于未知的瓮中。
— 托马斯·布朗爵士,《水瓮葬》

另请参阅

外部链接

附录

脚注

反向链接


Thoughts Memo 汉化组译制
感谢主要译者 gemini-2.5-pro,校对 Jarrett Ye
原文:Littlewood’s Law and the Global Media · Gwern.net
标签:洞见色情认识论政治认知偏见精神病态蜥蜴人调查常数准社会关系科学偏见
2018-12-15–2022-01-02

专栏:Jarrett Ye的文章


← 返回目录