← 返回目录


人工加法智能

学校≠教育≠技能;文凭溢价=80%信号传递+20%人力资本

19 👍 / 0 💬

试想以下场景:人类完全不知道自己到底是如何进行四则运算的。人类能数清羊有几只,能把两组数加起来,但这种能力是自然进化而来,而非后天学习所得。这种能力与生俱来,人类能加以运用,但并不知其内在机制;正如亚里士多德能看见东西,但并不知道视觉皮层的运作原理。我们所熟知的皮亚诺算数公理体系没有被发明出来。有一些哲学家正致力于形式化对数字的直觉,但他们会使用如下记号——

加起来(七,六)= 十三

他们想使用诸如此类的记号,形式化一件看起来很直白的事:把「七」加上「六」,就会得出「十三」。

在这个世界里,袖珍计算器的工作原理,是存储一张巨大的算术结果对照表;这张表由一支专业的「人工算术家」队伍手动录入,涵盖了从「零」到「一百」的初始输入值。尽管这些计算器从实用层面上来说也许有其价值,但许多哲学家认为,它们只是在模拟加法,而不是真的在做加法。机器不可能真的计数——这就是为什么人类必须先数清「十三」只羊,然后再把「十三」输入计算器。计算器只能复述预存数据,却永远无法理解这些语句的含义——如果你输入「两百加上两百」,计算器会说「错误:超出范围」;然而,只要你知道这些词具体是什么意思,那答案显然就是「四百」。

译注:本文全篇采用将计算机拟人为智慧生物的手法来进行隐喻和故事。此处「算术家(Artificial Arithmetician)」是刻意为之的拟人化表达,用以对应现实语境中的「人工智能(Artificial Intelligence)」。

当然,也有一些哲学家不会被这种直觉轻易欺骗。数字其实是一个纯形式系统——「三十七」这个标签之所以有意义,并不是因为这些词本身具有某种内在属性,而是因为这个标签指涉了外部世界中的三十七只羊。一个数字之所以具备这种指涉属性,是因为它与其他数字之间相互关联所构成的语义网络。因此,在计算机程序中,用于表示「三十七」的语法单元( LISP token) 不需要任何内部结构——它的意义仅仅来源于指涉和关联,而不是说「三十七」本身具有某种计算属性。

至今为止,还没有人研发出「通用人工算术家」;当然,针对特定领域的「狭义人工算术家」倒是有很多,只会处理「二十」到「三十」之间的数字,诸如此类。并且,只要看看在处理「二百」这一区间的数字时,研究进展有多么缓慢,就不难发现,「通用人工算术」在短期内是不可能实现的。业内顶尖专家估计,计算器要想赶上一个十二岁人类孩子做加法的能力,至少还需要一百年。

然而,并非所有人都同意专家的预估,也不是所有人都认同关于人造算术的平庸俗见。人们经常能听到类似以下的说法:

这个寓言的寓意不止一个,在不同的语境下,我在讲述这个故事时想表达的寓意也有所不同。比如,它阐明了组织层级的概念——一个 CPU 能够将两个大数字相加,是因为这些数字并非不透明的黑盒对象,而是由 32 个比特组成的有序结构。 但出于克服偏见的目的,让我们从中提炼出两条寓意:

为免有人指责我在从虚构证据中做归纳[1],这两条教训同样可以从人工智能的真实历史中得出。

第一种危险,是「人工算术家」设备在对象层级上遇到的问题:它们像磁带录音机一样,只会播放那些系统外部生成的「知识」,而无法在内部掌握生成这些知识的过程。一个人可以告诉设备「二十一加十六等于三十七」,设备可以记录并回放这句话,甚至还能通过模式匹配,在遇到「二十一加十六」时输出「三十七!」——但设备本身无法仅凭自身生成这样的知识。

这让人不禁联想到,你相信一位物理学家告诉你「光是波[2]」,你记录下这些迷人的词句;当有人问「光是由什么构成的?」时,你再把这些词句回放出来;然而,你无法仅凭自己推导出这一知识。

第二条寓意,是让「人工算术」研究者与指手画脚的外行都深陷其中的元层级危险——一遇到认知中令人困惑的空白,就试图绕着走;宁愿做任何其它事,唯独 不愿咬紧牙关、俯身填补那个该死的知识缺口。

无论是说「这是涌现[3]出来的!」,还是说「这是不可知[4]的!」,这两种说法都没有承认这样一个事实:存在着某种目前人们还不具备,但其实是可以掌握的基础洞见。

如何才能知道自己什么时候能掌握一个新的基本洞见?没有什么好方法,只能正面迎战问题,学习与之相关的一切,尽可能从各种角度去研究,如此种种数年。学术界每月至少得发表一篇论文,不是追求这种东西的地方。风险投资者也不可能为此买单。大家想要的是,要么现在就把东西造出来,要么就干脆放弃,转行去做别的事。

看看上面的评论:没有一条试图去探寻那个缺失的洞见——那个能让数字不再神秘、让「二十七」不再只是黑箱的洞见。没有任何评论者意识到,他们的困难实际上源于自己头脑中的无知或困惑,而不是算术本身的内在属性。他们没有努力让那个令人困惑的东西不再令人困惑[5]

如果你读过 Judea Pearl 的 Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference[1],就会明白,对于那些需要图模型来解决的难题,其背后的基本洞见是不可或缺的。(恐怕这不是什么能几句话讲清楚的东西,所以你只能自己去读这本书了。我还没见过哪篇关于贝叶斯网络的在线科普文章,能把这些原理背后的原因,或者是其数学形式必须如此的必要性讲得如此透彻;但 Pearl 的书确实精彩。)曾经有几十种「非单调逻辑」,笨拙地试图捕捉这样一种直觉:「如果我家的防盗警报响了,那可能有窃贼;但如果我随后得知我家附近发生了一次小地震,那可能就不是窃贼」。一旦掌握图模型这一洞见,你就能用数学语言准确地解释为什么一阶逻辑在这个问题上不适用,并能以一种极其紧凑的方式表达正确的解决方案,优雅地囊括进所有的常识细节。而在获取这一洞见之前,你只能不断地缝缝补补,添加越来越多的补救措施,强行让逻辑与一切看起来「显然为真」的东西相符合。

在没有取得窍门之前,你是不可能知道人造算术问题是否无解的。如果你不懂规则,你就更不可能知道那条「做任何事都必须先懂规则」的规则。于是,就会出现各种看似可能奏效的聪明点子,例如去制造一个能阅读自然语言、并从互联网下载数百万条算术断言的「人工算术家」。

然而不知为何,这些聪明点子总是行不通。不知为何,结果往往证明,你之所以「看不出任何行不通的理由」,纯粹是因为你对眼前的障碍一无所知,而不是因为障碍不存在。这就像蒙着眼睛朝远处的靶子射击——你可以盲射一次又一次,喊着:「你无法证明我打不中靶心!」但在摘下眼罩之前,你连瞄准都做不到。当「没人能证明」你珍爱的点子不对时,意味着你并没有足够的信息,去命中浩瀚的答案空间里那个小小的目标[6]。在你确切知道你的点子会奏效之前,它就是行不通的。

回顾人工智能发展史上那些关键洞见的诞生过程,以及在这些洞见出现之前曾被提出的种种乱象中,我得出了一个重要的现实教训:当最核心的问题在于你的无知时,任何试图绕开这种无知的聪明策略,最终只会让你搬起石头砸自己的脚。


[1] Pearl, Probabilistic Reasoning in Intelligent Systems.



上一篇:

机器中的幽灵

下一篇:

终极价值与工具价值
Thoughts Memo 汉化组译制
感谢主要译者 bstiat,校对 Shom潜艇
原文:Artificial Addition

参考

1. 从虚构证据中归纳:一种逻辑谬误 ./1935633364460766155.html
2. 猜老师的密码 https://hpmor.xyz/ai2zb_31/
3. 毫无意义的"涌现" https://hpmor.xyz/ai2zb_36/
4. 神秘问题的神秘答案 https://hpmor.xyz/ai2zb_35/
5. 未能从历史中吸取教训 https://hpmor.xyz/ai2zb_41/
6. 爱因斯坦的傲慢 https://hpmor.xyz/ai2zb_24/

专栏:理性 & 克服偏见


← 返回目录