把握科技时机:来自媒体实验室的启示

原文:Timing Technology: Lessons From The Media Lab · Gwern.net

神经网络, 比特币, 经济, 历史, 深度洞察, 科技社会学, 决策理论, 虚拟现实

技术发展趋势虽可预见,但这类知识在很大程度上并无用武之地,因为初创企业本身就存在风险,且极度依赖最佳时机。更实用的方法是从强化学习的视角出发拥抱不确定性。

2012-07-12–2019-06-20 完成 确定性: 有可能 重要性: 6 反向链接 相似内容 参考文献

你如何为你的初创公司把握时机?技术预测在判断某事具有可能性和可取性方面,往往惊人地具有先见之明,并且它们预测的事情最终也会发生;但它们在预测时机方面却远没有那么成功,几乎总是失之交臂,而成功(以及财富)往往花落别家。

为何这些知识如此不管用?为何在科技行业,成功与失败总是如影随行?准确的入场时机无法事先精确知晓,因此任何预测尝试通常都会有长达数年甚至更久的偏差。对于许多创意而言,除了倾尽所有去创办一家公司,并没有其他投资方式,这便导致了结果的极端差异性,即便创意本身很好,且预测对(最终)结果的判断是正确的。

进步可以发生,也可以在很久以前就被预见到,但由于瓶颈因素的存在,相关的细节和确切时机却极难准确把握。启动过早意味着失败,然而采取保守策略、稍晚启动同样糟糕,因为无论预测如何,一个好的创意总会像飞蛾扑火一般吸引那些过度乐观的研究人员或企业家:所有人都化为灰烬,唯有那个凭着傻运气在完美瞬间触碰到火焰的人幸存并赢得一切,而到那时,所有人都会明白最佳时机已然逝去。所有重大的成功故事,都掩盖了其背后一长串做过同样事情却时运不济的先行者。历史的教训在于,每一个教训都对应着一个与之相当且截然相反的教训。因此,各种想法可以被划分为:要么是过于乐观且很可能注定失败的,要么是已成定局的。在个人层面上,创意是毫无价值的,因为有太多其他人也同时拥有它们——「多重独立发明」是常态,而非例外。如此说来,进步则有赖于那些「不按常理出牌的人」。

这个整体性问题属于强化学习的范畴,其成功方法类似于汤普森采样/后验采样:即便是深思熟虑的策略也无法稳定地胜过随机探索——后者会逐渐向成功的领域倾斜,同时继续进行偶然性的长线尝试。既然人们倾向于系统性地过度利用(已知成功路径),那么这种机制是如何实现的呢?显然是通过个体在个人层面采取次优行为,但通过充当随机探索的角色,在社会层面却达到了最优效果。

因此,研发的一大益处在于,在能够以先前无法预测的方式即时利用的「成熟时机」到来之前,让其暂时搁置,如同休耕的土地;应用型研发或风险投资策略应着重于保持投资的多样性,同时持续灵活地重新评估那些预测显示可能已达到「成熟时机」的过往失败案例。这在整体上平衡了对已知领域的利用和对未知领域的探索,从而尽可能快地推动进步,这表明了技术预测在全局层面上的有效性,尽管它对个体而言可能毫无用处。

在 20 世纪 80 年代,著名的技术专家 Stewart Brand 拜访了同样享有盛誉的 MIT 媒体实验室(它或许是 MIT 人工智能实验室 最纯正的精神继承者)及其灵魂人物 Nicholas Negroponte,并于 1988 年出版了名为**《媒体实验室:在麻省理工学院发明未来》**(The Media Lab: Inventing the Future at M.I.T.)(简称 TML)的著作。Brand 在书中总结了他在那里看到的项目以及实验室成员们用以指导其项目的对未来的推演,并加入了自己对未来的预测性思考。

参观媒体实验室

三十年后回看,这本书已显得非常过时,其中对各种技术(尤其是在 20 世纪 90 年代)发展的描述,主要只具有历史研究价值。但是,自 1988 年以来已流逝了足够的时间,足以让我们评判像 Nicholas Negroponte 这样的梦想家们所持有的预测和期望的基本准确性:它们惊人地准确!而且,媒体实验室并非独此一家,成立于 1989 年的 General Magic 公司,对于一个由小型触摸屏设备驱动的互联未来,也抱有几乎完全相同的愿景。(那么,Douglas Engelbart 又如何呢?还有明确以「滑向冰球将要到达之处」(意指预见未来趋势)为目标的 Alan Kay 和施乐帕克研究中心呢?)如果你在阅读此书时没有油然而生一种似曾相识之感或同情之心,那么不妨将媒体实验室成员们的论断与 Clifford Stoll 的**《硅谷万金油》**(Silicon Snake Oil)等同时代——或者更晚些时候——的作品进行一番比较,你就会明白他们当初是多么正确。

似曾相识之感油然而生,是因为 TML 书中几乎每一页所描述的景象,在 20 世纪 90 年代和 21 世纪初都已成为显而易见的日常生活,更不用提 2010 年代了——从宽带的普及到智能手机的最终影响,莫不如此。

而可惜的是,遗的注意到 TML 书中提及的未来百万富翁或亿万富翁是何其之少——人们很快就会意识到,是的,某人 X 对于 Y 事件将会发生的判断百分之百正确,即便当时所有人都认为这纯属天方夜谭;只不过,X 在时机上略有偏差,早了或晚了几年,结果要么操之过急,要么错失良机,于是某个甚至从未在 TML 中出现过的 Z 最终攫取了所有的胜利果实。我阅读此书时,脑海中不断浮现这样的念头:「是的,是的,你是对的——可这对你又有什么实际好处呢!」,或者「不尽然,那玩意儿实际上还得再过十年才能真正行得通」。

凡事皆有其时

我基本上认为,20 世纪 90 年代大家对于这些技术将如何发展的种种设想,它们全都是对的,全都正确无误。我只是觉得它们出现得太早了。

Marc Andreessen,2014 年

对于任何声称自己知道更好方法的人(未来学家们就常常不言自明地扮演着这样的角色),人们总会反复质问:「你既然那么聪明,为什么还没发财呢?」我从中得到的教训是:仅仅预测未来是远远不够的,一个人还必须精准地把握时机以免倾覆,然后付诸实施,并且在数不清的方面都得有好运气。

许多所谓的「泡沫」,可以被解读为人们对未来趋势的判断百分之百正确——只是错失了时机(例如 Thiel 关于中国与泡沫的文章1《经济学人》关于鲜为人知的房地产热潮的报道,以及 Garber 的著作**《著名的早期泡沫》**(Famous First Bubbles))。你可以阅读过去那些关于技术远见卓识者的书籍,并注意到他们中有多少人对于未来将发生何事的信念是何其精准(TML 便是一个绝佳的例子,但远非孤例),然而在那些情况下,一个人若根据那些正确的预测贸然行动,反倒是不明智的。

捷足未必先登

凡是不知道如何一语中的之人,就该恳请他干脆别动手。

弗里德里希·尼采[2]

许多初创公司的背后,都有一长串曾尝试做着大致相同事情却最终失败的先行者,他们往往与若干其他竞争者同时起步(初创公司与一般的科学/技术领域一样,同样容易出现「多重独立发现」的现象[3])。他们之所以能够成功,是因为恰好在某些 S 型曲线或关键事件发展到恰当节点的那一刻,猛击了一下「皮纳塔」(一种墨西哥传统游戏,此处比喻抓住机遇)。不妨看看命运多舛的 eToys.comPets.com:当初投资者相信美国人会在网上大笔消费,例如购买玩具或狗粮,这个判断正确吗?绝对正确。亚马逊(该公司鲜有盈利,且吸纳的投资额远超 Pets.com 当年区区约 3 亿 [2002 年;折合 2025 年 5.58 亿] 美元的规模)便是一家成功的在线零售企业,其库存的狗粮品种多达数千种,更不用提它销售的其他所有宠物相关商品了;而主要经营宠物食品的 Chewy 公司,则凭借其数十亿美元的营收(其市值在 2021 年年中膨胀至 300 亿 [2021 年;折合 2025 年 370 亿]美元),于 2019 年申请了数十亿美元规模的首次公开募股。但 Pets.com 的股票价值最终还是跌至了约 0 美元。Facebook 是有史以来最大的照片档案库,其存储需求确实堪称海量;但它能在 20 世纪 90 年代取得成功吗?答案是否定的,甚至在更晚些时候也不行,正如 OrkutFriendster 的失败以及 MySpace 的苟延残喘直至消亡所证明的那样。20 世纪 90 年代最臭名昭著的科技商业失败案例之一是铱星卫星星座计划,但该计划的失败归咎于摩托罗拉方面做出的各种离奇的、自我毁灭性的决策;当摩托罗拉最终被排除出局后,铱星计划找到了自己的市场,并且在 2017 年见证了其第二个卫星星座 Iridium NEXT 的发射,同时还面临着此后发射的其他卫星星座的竞争,包括 SpaceX 自己羽翼未丰的「星链」(Starlink)计划(旨在提供全球宽带互联网服务),该计划旨在 2019 年 5 月就发射了不少于 60 颗卫星。再看看计算机领域:想象一下,一位苹果电脑的早期用户宣称:「每个人最终都会使用计算机!」是的,没错,但这还需要再等上几十年,而且,「从长远来看,我们都将作古」。早期个人电脑发展史中,充斥着有先见之明者最终失败的案例

智能手机则是一个更为显著的例证。在 20 世纪 90 年代和 21 世纪初,我常读到关于日本手机何其先进、一部优秀的智能手机将会何其神奇的论述,尽管年复一年,那些手机都形同鸡肋,几乎只用于语音通话。你可以看到智能手机在 TML 中被反复提及,因为远见卓识者们早已意识到一部可放入口袋的移动计算机会带来多么翻天覆地的变化。然而,直到 21 世纪初中期,智能手机的承诺才仿佛一夜之间得以实现,而其成功主要归功于后来者苹果和谷歌,将先前极为成功的诺基亚排挤出局,更不用说像 General Magic 那样的先行者了。(你也可以在辛勤耕耘数十年后一举成名……)2013 年对 Eric Jackson 的一次采访回顾了智能手机的普及率:

:「您如何看待他们[苹果公司]在中国、印度及其他新兴市场的扩张策略?」

:「这方面进展之缓慢着实令人沮丧。我们可以在图表上画出趋势线,但我们并不了解其中的制约因素。再说一次,普及的关键问题在于时机把握实在太他妈难了。我曾预计智能手机会在 2004 年中期爆发,结果却一次又一次地失望。然后突然间,一个催化剂发挥作用,普及率便急剧飙升。库克称之为「攻克难关」。我不知道他们能做些什么来加快步伐,但我怀疑这与铺货(分销渠道)以及网络建设有关,而这两者都依赖于(腐败的)实体机构。」

2012 年,我印象深刻地看着我的姑姑使用 iPhone 的 FaceTime 应用与远在半个大陆之外的女儿进行视频聊天。换句话说,她的智能手机就是一部可视电话可视电话曾是技术失败的经典案例之一,其概念源于它在 1964 年纽约世界博览会及电影**《2001 太空漫游》(2001: A Space Odyssey)中的亮相,但随后未能成功取代传统电话。这常被引为例证,说明技术狂热分子未能理解人们并不真正**想要可视电话——「谁想在打电话前还得特意化个妆呢?」,人们一本正经地以此作为解释——但实际情况似乎是,当时的可视电话本身确实不够好用。

再来看看 VR 领域;我注意到技术爱好者们对 Oculus Rift(以及 VivePlayStation VRGoQuest 等等)将虚拟现实带给大众的创举惊叹不已,这难道不是对 Cliff Stolls 和 Jaron Laniers(他们在几十年前就已宣判了 VR 的死刑)的一记响亮耳光吗?《The Verge》(The Verge)杂志 2012 年一篇关于 VR 的文章回顾了历史上许多失败的尝试,其中引人注目的一点是:虚拟现实(VR)早在 20 世纪 50 年代就被清晰地预见到了,这比互联网等许多其他技术的出现还要早,并且比计算能力或显示器技术达到我们现在所知的、真正可用的 VR 所需的水平,早了半个多世纪。VR 的概念就是对计算机显示器如此直接的延伸推想,其发展方向是如此的明确,其前景是如此的引人入胜,以至于 VR 领域的先驱们前赴后继,宛如飞蛾扑火一般,不断争取研究经费,寄望于这一次情况能有所改观。而在某个时刻,技术确实进步了,第一个在恰当时机尝试的人或许就能中得头彩;Palmer Luckey(Oculus 创始人,该公司于 2014 年 3 月以 23 亿[2014年;折合 2025 年 33.9 亿]美元的价格出售给了 Facebook[4]):

这是一个秘密:阻碍人们制造出优质 VR 并解决这些问题的,并非技术本身。其实早在 2007 年中后期,就有人能以几千美元的成本造出 Rift,到 2008 年中期,成本大约只需 500 美元[2008年;折合 2025 年 775 美元]。只不过当时根本没人关注这一点罢了。

去看看蚂蚁吧,你个懒汉

是的,可当我发现它的时候,它就已经处于被发现的状态了。

Lawrence Shepp(引自;「为发现了已被发现之物的科学家惋惜」

重要的是成为最后一个发现某事物的人。

Stanley Osher引自

任何好点子都能被说成是馊主意,而且在当时很可能听起来确实如此[5],而 Bessemer 风险投资公司的「反向投资案例集」便是一份罗列了 Bessemer 当初拒绝投资的成功创意的清单。Michael Wolfe 提供了一些这方面的例子:

Facebook:世界需要又一个 MySpace 或 Friendster(或者 PlanetAll 等等),只不过晚了好几年。我们只对几千名课业繁重、不擅社交的常春藤盟校学生开放。然后其他人自然会跟风加入,因为哈佛的学生实在太酷了。[6]

Dropbox:当市场上已经有十几个没人用、并且由微软等大公司支持的文件共享和同步解决方案时,我们还要再做一个。它只会把一件事做到极致,而且你必须迁移所有内容才能使用它。

维珍大西洋航空:航空公司听起来很酷。我们来创办一家吧。能有多难呢?我们将通过播放有趣的飞行安全演示视频和不像其他航空公司那样混蛋来脱颖而出。

……iOS:一个全新的操作系统,无法运行任何一个为 Mac OS、Windows 或 Linux 开发的数以百万计的应用程序。只有苹果公司能为它开发应用。它甚至不支持复制粘贴功能。

谷歌:在其他大多数搜索引擎都因被视为同质化的亏钱玩意儿而被抛弃时,我们正在打造世界上第二十个搜索引擎。我们将剥离所有靠广告支撑的新闻和门户网站功能,这样你就不会在使用免费搜索时分心了。

特斯拉:我们不只是制造电池卖给底特律的汽车厂商,而是要从零开始打造自己的汽车,并且还要自建分销网络。而且是在经济衰退和清洁技术遭受强烈抵制的背景下。[7]

……Firefox:我们要打造一个更好的网页浏览器,即便世界上 90% 的电脑已经内置了免费浏览器。且大部分工作将仅由一人完成。

这样的例子我们可以举上一整天:

  • Netflix 怎么样?「我们将以一种比我们老牌竞争对手百视达(它将选择通过完全忽视邮购和互联网业务,直到 2010 年破产倒闭的方式来自我毁灭[8])更差的方式,向人们出租一种注定要被淘汰的媒介格式;这将(不知怎么地)让我们转型做流媒体,届时我们将从我们最大的敌人那里获得所有内容的授权,而一旦我们过于成功,他们就会立刻摧毁我们,并且他们早已计划运营自己的流媒体服务了——但这没关系,因为我们只需要说服华尔街耐心等待几十年,同时给我们几千亿美元,让我们通过自己制作成千上万的电影和电视剧来取代好莱坞(尽管我们以前从未做过类似的事情,也没有任何理由认为我们会比他们做得更好)。」

  • 或者 Github:「我们将提供像 SourceForge 或 Google Code 那样的代码托管服务,却要求开发者使用一款对用户最不友好的分布式版本控制系统(DVCSes),而且只面向那些出了名小气的自由/开源软件(FLOSS)开发者,并只收他们几美元的私有版本费。」

  • SpaceX:「轨道科学公司虽然有几十年的先发优势,但他们臃肿迟缓、不思进取;我们将通过购买一些俄罗斯的闲置火箭来追赶他们,同时我们自己发明具有未来感的可重复使用火箭。这不过是火箭科学嘛(小菜一碟)。」

  • Uber/Lyft/DiDi:「出租车和公交车。你们不过是重新发明了出租车和公交车。外加共享单车。」

  • Instacart/Ocado/Uber Eats:「我们要重蹈 Kozmo.comWebvan 的覆辙,只不过这次不会破产。」

  • PayPal:「既然其他所有人的在线支付都失败了,那我们就再来一次,而且要用匿名加密技术!还要在手机上实现!在 1998 年!最终用户肯定超爱加密技术的,对吧?如果这个软件搞不定,呃,我想我们就……干点别的。具体干啥还没想好。」后来:「哦,显然 eBay 上的卖家非常喜欢我们,甚至自发为我们制作宣传材料了?嗯。要不……我们别「威胁要告他们」,而是试试「跟他们合作」?」

  • Venmo:「TextPayMe 当年不是很成功嘛,对吧?」

  • Patreon:「在线小额支付和内容赞助模式已经失败了无数次,都成了 90 年代的笑柄了;不妨再试一次嘛。」

  • 比特币:「从 DigiCash 到 Flooz.com 再到 e-gold,以及其他[数不胜数]的纯在线货币,要么已经失败,要么被政府叫停了;所以,我们要用「工作量证明」——这是我们刚编造出来的一种贵得离谱的加密玩意儿,它在真正确保去中心化和抗审查方面毫无理论依据,并且几乎遭到了每一位费心阅读了白皮书的电子货币爱好者的无情嘲讽。」

  • Seamless/Grubhub/Uber Eats/DoorDash/Slice (!):「CyberSlice 当初想在网上卖披萨,结果烧掉了一个多亿 [2000 年;折合 2025 年 2 亿]美元,但这次肯定不一样。」

  • FedEx:「经验丰富、资金雄厚的 Emery Air Freight 已经在尝试轴辐式空运模式并且屡屡受挫;我要倾尽我的家产去跟他们竞争,即便资金短缺到我不得不铤而走险,犯下好几桩罪行来让 FedEx 维持下去,比如如字面意义用公司的钱去拉斯维加斯赌博。」

  • Lotus 1-2-3:「VisiCalc 是电子表格的鼻祖,尽管有微软等公司的仿制品,但它已经霸占市场长达 4 年,并且一手将 Apple II 个人电脑推向了巨大成功;我们要从零开始编写自己的电子表格,修复 VisiCalc 的一些问题,并且抢在他们之前登陆 IBM PC 平台。大家肯定会买我们的产品,就因为它会好那么一点点。」

  • Airbnb:「我们要刷爆我们的信用卡,让人们把自家的气垫床非法出租出去,最终颠覆整个酒店行业。风险投资家们会真的从洗手间溜走来躲避和我们交谈。」

  • Stripe:「银行以及像 PayPal 这样的在线支付处理机构都是受到严格监管、效率低下的垄断者,体验糟糕透顶;我们要和一些银行搞好关系,然后运营一个体验不那么糟糕的支付处理服务。我们标志性的卖点将是接入代码行数更少,所以程序员们会喜欢我们的。」

  • LinkedIn:「我们将模仿 SixDegrees.com 那种早已被他们申请了专利的社交网络模式,结果是还得花钱买下他们的专利。」

  • Slack:「本质上就是 IRC 加电子邮件的组合,但速度非常慢,且封闭性更强。企业会对此趋之若鹜;而员工们则会边骂一边用。」

  • 英文维基百科:「我们要通过允许任何人编辑 Nupedia 的一些草稿文章,来和 微软英卡特百科全书《大英百科全书》H2G2Everything2Interpedia、分布式百科全书项目(TDEP)、TheInfo 以及 GNU 的 GNE 等一众前辈竞争。」[9]

  • Zoom:「Skype 的确领先了我们整整 15 年,但我们能做得比它好得多,而且说不定会发生点什么,让大家在尽可能回避了这么久的视频会议之后,突然间都抢着用起来了呢?」

  • 二维码」?哥们,你难道一点儿都不记得当年的 CueCat 了吗?

你不必非得是躁郁症患者才能成为一名企业家,但这或许会有所助益。(「我所认识的最成功的人士,他们对自己的信念几乎达到了近乎妄想的程度……」

然而,时也,命也

在解决了一个问题之后,人类便以为自己在类似的解决方案中找到了通往所有问题答案的钥匙。每种真正有效的解决方案,都会带来一连串荒诞不经的解决办法。

Nicolás Gómez DávilaNicolás Gómez Davila: An Anthology(原文:Escolios a un Texto Implícito: Selección》,第 430 页

没有经历大量的失败,你根本不可能让一项优秀的技术真正运转起来。这是一条普适的法则。以自行车为例,在人们找到真正实用的那款设计之前,曾有成千上万种稀奇古怪的模型被制造出来并加以尝试。你永远无法从纯理论上设计出一辆自行车。即便在今天,在我们已经制造自行车长达百年之后,要完全理解自行车为何能够保持平衡依然是非常困难的——甚至很难将其表述为一个数学问题。但正是通过不断的试错,我们才摸索出了制造方法,而那些错误是其中不可或缺的一环。

Freeman Dyson「弗里曼·戴森的大脑」 1998 年(参见「我们为何为自行车等待了如此之久?」

为何会有如此众多的先行者最终归于失败?

部分解释是幸存者偏差导致了后见之明偏误。我们只记得那些成功者,并且只看到他们当初是如何注定成功的,却忘记了那些失败者——他们在记忆中淡去,倘若我们重温他们当年摸索着走向我们如今看来如此清晰的目标时的窘态,只会觉得既可笑又荒诞。

许多初创企业的起源都极具独特性且充满偶然性;例如,为何一家播客公司 Odeo 最终会孵化出 Twitter?仅仅是存活下来本身就极具偶然性,创始人们常常能回忆起那些成败仅系于一掷的时刻。[10] 就像一般的历史事件一样(Risie 等人 2019),一个事件或变革的重要性,往往只有在事后回顾时才能真正显现。总而言之,成功的几率很低,且对大多数人而言回报并不丰厚——尽管偏态分布使得少数案例能产生偶尔令人瞠目结舌的巨额回报,但科技行业或风险投资基金的风险调整后回报率,其实并不比整体经济的平均水平高出太多。

「谷歌凭借 PageRank 以及(此处省略若干事后诸葛亮式的理论)Z、Y 等等,当然注定会取得巨大成功」——这种说法忽略了一个小问题:谷歌当初不过是众多搜索引擎中的一个,技术或许出色[11],但并盈利,也没有找到一个有利可图的商业模式,直到四年后抄袭了 Overture 的广告竞价模式——这才是它的救命稻草(《深入 Plex:谷歌的思考、工作及塑造我们生活的方式》(In The Plex))——才偶然撞上了能盈利的商业模式,更不用说达到独角兽级别的模式了;在此期间,当一些微小的技术故障导致关键交易流产时,谷歌不得不签署一些可能致命的协议,否则就有耗尽最后资本的风险。毫无疑问,这正是为什么佩奇和布林早期曾试图将谷歌出售给 AltaVista、Excite 和雅虎均告失败,并且直到 2002 年还在与雅虎就可能的出售事宜进行谈判(尽管最终他们拒绝了)。在一个平行世界里,无论你多么推崇 PageRank,谷歌都很可能轻易地就销声匿迹了,因为它从未碰巧发现那些拯救了它的广告创新模式;任何其他说法都不过是后见之明。FedEx 在早期曾发不出工资,其创始人更是以在拉斯维加斯用公司仅存的资金赌博来维持飞机运营而闻名,这只是其众多濒死经历和不法行为中的一部分——也是众多初创公司做出极具争议行为的一个缩影。[12] SpaceX 和特斯拉都曾在 2008 年和 2013 年数日(甚至数小时)之内濒临破产;在前一个案例中,马斯克在连续三次火箭发射失败后,不得不向朋友借钱支付房租;而在后一个案例中,据报道马斯克甚至获得了谷歌承诺直接收购特斯拉以免其破产的保证(Vance 2015)。特斯拉的种种困境更是人尽皆知(例如,在 2017 年特斯拉 Model 3 生产危机最深重、公司距离崩溃仅有数周之遥时,马斯克曾请求苹果公司收购特斯拉)。2004 年的马克·扎克伯格,一心只想以几百万美元的价格卖掉 Facebook,以便能专心开发他的 P2P 文件共享程序 Wirehog,他当时的说法是,出售价格只需要足够高,能够「给 Wirehog 提供动力」就行。Youtube 最初是个约会网站Stewart Butterfield 最初想做一款大型多人在线角色扮演游戏(MMORPG),但失败了,他能从中挽救的只有照片分享功能,这便成了 Flickr;但他仍然非常想做 MMORPG,所以在 Flickr 之后,他又成立了一家公司来开发 MMORPG 游戏**《Glitch》**(Glitch),结果……又失败了。于是,在他试图关闭公司却被他的投资者劝阻之后,他从失败的项目中挽救出了聊天功能,这便成了 Slack。并且,与成功存在大量无法消除的偶然性因素这一观点相符的是,对初创企业的调查显示:尽管成功的几率因人而异(即所谓的「技能」差异),但任何创始人的学习曲线(「边做边学」效应)都十分有限,无论经验多寡,成功概率依然很低(Gompers 2010,[Parker 2011](https://effectuation.org/hubfs/Journal Articles/2017/05/Do-serial-entrepreneurs-1.pdf),Gottschalk 2014),即使是经验丰富的企业家,在预测初创企业能否最终实现商业化方面,其准确率依然不高,在「非研发密集型行业」中,其预测结果甚至接近于随机猜测(例如 Scott 等人 2019McKenzie 和 Sansone 2019)。

Thiel (《从 0 到 1》原文链接):「商业领域的每一刻都独一无二,仅会发生一次。下一个 Bill Gates 不会再开发操作系统。下一个 Larry Page 或 Sergey Brin 不会再创造搜索引擎。而下一个 Mark Zuckerberg 也不会再创建社交网络。如果你只是模仿这些人,那你并没有从他们身上学到任何东西。」。此言不虚,但我认为这颠倒了顺序(或许是「从N到N+1」?):你不会成为下一个 Bill Gates,因为 Bill Gates 并非开天辟地的第一人,也非独一无二的 Bill Gates;套用 斯蒂格勒定律 的说法,他是最后一位 Bill Gates[13];有许多人在 Gates 之前和之后都凭借操作系统积累了巨额财富——你或许忘记了 王安,但希望你还记得(之前凭借 Mac,之后凭借 NeXT 的)Steve Jobs。同理,Mark Zuckerberg 也不是第一个且唯一的 Zuckerberg,他是最后一个 Zuckerberg;在他之前,许多人已通过社交网络发家致富——或许 Orkut 并未给它在 Google 的发明者带来财富,但可以肯定的是,MySpace 的 DeWolfe 和 Anderson 都赚得盆满钵满。而且,成功的搜索引擎创始人也大有人在(杨致远现在还是亿万富翁吗?是的)。

然而,盖茨验证了市场的可行性,并将盖茨策略发挥到极致,这一招也就用尽了;再没有人能够通过销售操作系统外加一些商业办公软件来获取历史性的财富,因为有太多的竞争者和太多利益相关方致力于确保不会再出现下一个盖茨,所以机会已经转向了其他领域。

一个成功的公司会重塑历史叙事及其先行者[14];历史的车轮必须滚滚向前,驶向未知的远方,但我们回顾往昔时,却总是以后见之明,认为一切发展都是为了清晰的现在铺路。

智者深藏的狡黠

人们普遍承认独角兽是一种超凡脱俗的生灵,并且是祥瑞之兆;这一点在《诗经》、《春秋》、名流列传以及其他不容置疑的权威典籍中均有记载。即便是寻常百姓家的妇孺也知晓独角兽是吉兆。然而,这种动物并非寻常家畜,它难得一见,也无法归入任何已知的类别。它不像马或牛,也不像狼或鹿。如此一来,即便我们与独角兽不期而遇,也可能无法断言其身份。我们知道有鬃毛的动物是马,有犄角的是牛,但我们并不知道独角兽究竟是何模样。

Jorge Luis Borges「卡夫卡及其先驱」 (1951)

你能问研究人员时机是否成熟了吗?嗯:研究人员在这件事上多少存在一些利益冲突,他们乐于在那些毫无成果的课题上投入大笔资金。毕竟,他们又怎会拒绝呢?

Scott Fisher:

我最终在日本做的工作比在其他任何地方都多,因为日本整体上对技术非常着迷和狂热,他们就是喜欢它 [VR 技术]。日本政府当时普遍在资助相关研究,并建造了大型综合研究中心专门攻克这一领域。当美国在这方面毫无进展时,日本却已采取了大规模的行动。我最终搬到了日本,并在那里工作了很多年。

确实,这让人联想到日本那个劳民伤财的第五代计算机项目(值得注意的是,尽管日本以其机器人技术实力闻名,但无论是进入福岛核电站的机器人,还是在中东地区飞行的无人机,亦或是在农业和建筑业带来革命性变化的机器人,都不是日本的产品)。所有那些「宏伟计划」最终结果如何呢……?别问 Fisher,他几乎不可能承认:「哦,是的,那些钱完全打了水漂,我们动手太早了;都怪我们。」而 Lanier 则暗示,单是日本就为此投入了巨额资金:

Jaron Lanier:「相关部件的成本终于降下来了,我们总算可以开始讨论让它们以大众一直期望的方式普及开来……摩尔定律之所以如此引人入胜,不仅仅在于它让同样的部件变得更便宜,更在于它实实在在地改变了你的行事方式。举个例子,在过去,为了确定你头部的位置,以便让虚拟内容能够相对于你保持静止,我们不得不依赖某种外部参考点,比如磁力、超声波或光学设备。而如今,你只需在头上戴个摄像头,环顾一下房间,设备就能计算出你所在的位置——头戴设备实现了自给自足,不再依赖外部参考设施。这在以前是难以想象的,因为单是进行这种计算的成本就高得惊人。摩尔定律确实一次又一次地带来变革,它以极其微妙而有趣的方式重塑了你的选择空间。」

Kevin Kelly:「我们对这个世界的历史感知既模糊又短暂。我们刚才谈到过去:虚拟现实(VR)在很长一段时间里无人问津,不是吗?长达 35 年。大多数人根本不知道这已经是 35 年前的技术了。30 年后,新闻报道的标题依然如故。难道仅仅是因为 30 年前的技术实力还不够吗?」

……[关于基于 VPL 数据手套设计的任天堂能量手套:][15]

JL:「我和其他许多人都非常、非常渴望能把这类设备的消费级版本推向市场。我们曾通过一款名为『能量手套』的产品让人们初步体验了一下……索尼(Sony)实际上也推出过一款小型的近眼显示设备,叫做 Virtual Boy;效果虽然不怎么样,但他们已经尽力了。此外,还有一些耗资巨大的项目,旨在打造消费级的 [VR 产品],但从未向公众披露过。如果算上通货膨胀,当时投入的资金可能比 Facebook 最近收购 Oculus 的花费还要多。我们就是一直、一直、一直无法让它真正成功面市。」

KK:「原因是?」

JL:「部件成本。(这和)摩尔定律(息息相关)。传感器、显示器……还有电池!电池是个大问题。」

诸如部件成本这类问题,并非任何虚拟现实(VR)研究项目——无论其多么雄心勃勃——所能解决的。这些是难以逾越的硬性制约,要突破它们,例如为智能手机制造微型高分辨率 LED/LCD 屏幕,则有赖于数十年来摩尔定律的持续推进,以及数十亿部智能手机生产所积累的经验曲线效应。

研究人员通常并没有动力去公布:「现在时机未到,再等上 20 年,让摩尔定律使其具备可行性吧」,即便领域内的每个人都对此心知肚明——正如 Palmer Luckey 所说:

我投入了大量时间进行阅读……我认为,许多人对 VR 的评价过高,只因为他们本身就是 VR 领域的研究者。你总不希望发表一篇论文,结论是:『经过研究,我们认为 VR 目前毫无用处,我们未来 20 年都该待业。』但确实有少数人基本上得出了这样的结论。他们说:『目前的 VR 设备视场角太小、延迟太高、价格太昂贵、体积太笨重,无论是消费级计算机还是专业级计算机都无法良好驱动。』结果我发现,我并非第一个意识到这些问题的人。这些问题其实早已为人所知数十年了。

人工智能研究员 Donald Michie 在 1970 年时,依据 1969 年的一项调查声称,大多数人工智能研究人员估计通用人工智能(AGI)的实现需要 10 到 100 年的时间(即 1979 年至 2069 年之间),并且「学界也普遍认为,主要的障碍并非来自硬件限制。」[16] 尽管如今人工智能研究者的调查结果仍然显示,当年的预测时间范围并非完全不合理(Gruetzemacher 等人,2019),但深度学习的成功明确揭示了硬件曾是一个巨大的制约因素,五十年前的计算资源至少相差了 6 个数量级。Michie 接着指出,在更早的 Charles Babbage 的案例中,其工作正是因为硬件条件的限制导致「时机尚未成熟」而注定失败,代表了时间和金钱的彻底浪费[17]。可以说,Michie 本人的研究在某种程度上也是如此。

智者未必富有

然而,正如科学史所昭示的那样,洞悉一个正确的理论与掌握其精确应用,完全是两码事。所有重要的见解,在真正发现它的人之前,都曾被某些未能领悟其真谛的人提及过。

Alfred North Whitehead《思维的组织》 (1917)

所以,你无法准确把握时机以确保成功启动。你无法模仿成功的企业家,因为时过境迁。你无法根据过去的成功预测未来的成功;你甚至无法根据过去的失败预测未来的失败;你也无法求助于研究人员,因为他们的激励机制决定了他们对时机的判断并不比其他人更高明。

那么,至少你能从预知结果中获利吗?对此我们仍需保持悲观。

即便确切知晓未来,你仍然难以利用这些知识。例如:事后看来,我们知道人人都需要计算机、操作系统、社交网络——但这些领域的发展史却充斥着无数失败的残骸。假设你在 2000 年就以某种方式预知到「2010 年,最成功的社交网络创始人身价至少将达到 100 亿美元」;这是一个与所有传统观念相悖、可被证伪的信念,并且关乎一项让所有人都始料未及的技术。然而,这种预知究竟有多大用处呢?你会如何利用它?你是否有足够的资本创办自己的风险投资基金,向每一个社交媒体项目投入数百万美元,直到 2010 年你最终确定 Facebook 就是那个赢家,然后通过其首次公开募股(IPO)套现?我对此表示怀疑。

投资于「计算机」、「人工智能」、「社交网络」或「虚拟现实」这类宽泛领域是很困难的;并没有针对这些领域的指数基金,而且很难想象如何才能有这样的东西存在。(你如何能迫使所有相关公司都出售可交易股份呢?正如 Yogi Berra 所问:「如果人们不想去看球赛,你又能如何阻止他们呢?」)并不存在一只方便的「计算机行业综合股」(CMPTR),让你能买入 100 股并无限期持有,以从你对计算机的乐观情绪中获得收益。IBM 和 Apple 都曾一度濒临破产,而微软的股价自 1999 年左右以来也一直停滞不前(这对长期持有者而言意味着巨大的实际损失和机会成本)。即便你确切知道 Facebook 将会如此成功,在它 IPO 之前,你究竟能投资哪些股票来从其增长中获得红利呢?记住,你对 2000 年代的科技行业格局一无所知,比如你不知道 Google 会在 IPO 后股价大涨,也不知道 Apple 会在 Jobs 的带领下复兴——你所知道的仅仅是某个社交网络将会出现并迅猛发展。谁又能想到智能手机的未来会被「一家 1980 年代过气的个人电脑制造商和一家名不见经传的搜索引擎公司」所主宰呢?(我能想到的最佳策略或许是,当你听说默多克新闻集团收购 MySpace 时,就抛售你持有的所有该集团股票,但我不能确定默多克的股价是否仅仅是停滞不前,而不是随着 MySpace 日益明显地成为一笔失败投资而下跌。)在假设你不知道具体是哪家公司会胜出的情况下,你可能会大量买入 Google 股票,期望 Orkut 能成为赢家,然而,尽管这本身可能是一笔不错的投资(太棒了!),但这笔收益却与 Orkut 毫无关系(哎呀)……

即便有股票可供购买,你的收益也取决于具体情况——例如,是某只现有股票成为赢家,而不是所有持有股票都被一家新兴创业公司所吞噬。让我们设想另一种情景:你坚信家用机器人行业即将迎来爆发式增长。这真的算是什么内幕消息吗?全球经济年增长率约为 2%,劳动力成本普遍上涨,计算机和机器人技术的价格通常在下降……难道行业预测其年销售额增长会低于 25% 吗?

但假设市场确实错误地持悲观态度。果真如此,你可能会将你假设中的资金投入到你能找到的最接近机器人行业指数基金的投资上,这算是一堆糟糕选择中相对较好的一个。(查阅维基百科上的一些随机条目,截至 2012 年,大约只有五分之一的机器人公司是上市公司,而那些你可能听说过的公司,如 Boston Robotics 或 Kiva,都还是私营企业,所以……这只会是一个规模小且缺乏代表性的指数。)假设家用机器人的增长集中在某家私营公司,该公司年收入飙升至数十亿美元,并蚕食了其他所有公司的市场份额,迫使它们破产、合并或萎缩。家用机器人行业确实如你所料实现了增长——计划通(keikaku doori)!——然而你的「指数基金」却破产了(当其中一家机器人公司倒闭时,如何调整指数?将其调整纳入另一家注定失败的公司吗?)。然后,在你的独家消息变成公开信息之后,这家机器人公司上市了,根据有效市场假说(EMH),其股票也就变成了一项普通的投资。

Morgan Housel

1909 年曾有 272 家汽车公司。经过整合与淘汰,最终只有 3 家公司脱颖而出,而这 3 家中的 2 家后来也破产了。发现一个有前景的趋势与找到一项能盈利的投资,完全是两码事。

这种情况难道罕见得不合常理吗?听起来就像 Facebook 的故事!他们发展迅猛,轻松碾压了其他社交网络,长期保持私有状态,而在其首次公开募股(IPO)之后,相比于那些即便是较晚进入的早期投资者,公众投资者获利并不算多。

由于赢家通吃的市场动态,根本无法解决这样一个协调难题:即等到所有先决条件都成熟之后再采取行动。企业家和创始人会持续不断地涌向社交网络或虚拟现实(VR)这样的共同目标,仅仅是为了抓住那万一的机会——或许先决条件刚刚成熟,他们就能抢占整个市场。这或许是一种可预见的资源浪费,但激励机制就是如此运作的。从这个角度看可能有些奇怪,但我们可以想到其他一些技术领域也可能存在类似情况。

比特币便是一个当前的热门例子:它仍处于早期阶段,看起来要么是一项天才般的投资,要么就是傻瓜的乐园/庞氏骗局。在我 2012 年撰写本文初稿时,我曾指出,随着比特币价格从约 0 美元飙升至 130 美元 [2012 年数据;折合 2025 年为 197 美元],我们似乎看到了比特币泡沫——然而,如果比特币果真是货真价实的东西,我们本就预期其价格会随着人们的了解而大幅上涨,其价值也会因使用增加而直接提升,其生态系统会逐步解锁那些精妙的加密功能等等。而到了 2019 年,2012 年已恍如隔世,嗯,人们大概会说出类似的话,只不过数字更大了……

再以那些小众的、富有远见的技术为例:假如人体冷冻技术在原理上是正确的,但结果却证明,对于 2030 年前所有尝试者而言都毫无价值(原因可能是使用了错误的灌注技术或冷冻保护剂,导致某些关键的生物组织未能成功玻璃化),而比如说在 2030 年后才变得切实可行,那么它不过又是一项这样的技术——远见卓识者们最终被证明是对的,尽管曾饱受大众的否定和质疑,但从实践意义上说他们还是错了,因为他们行动过早,结果只是浪费了金钱。

的确,世事常如此。

驾驭不确定性

凡你手里所当做的事,要尽力去做;因为在你所去的坟墓,没有工作,没有设备,没有知识,也没有智慧。

传道者,《传道书》

云门文偃禅师示众云:『十五日以前的事我就不问了,你们且来说说十五日以后会怎样?』他自问自答道:『日日是好日。』

第六则《碧岩录》 18

那么,这一切将我们引向何方呢?借用蒂尔(Thiel)关于「明确的乐观」与「不明确的乐观」的说法,我称之为明确的或许乐观主义。进步终将发生,并且可以被远早地预见到,但其细节和确切时机却极难把握,而研发的益处在于其成果如同休耕的土地,静待成熟时机,并以不可预知的方式被发掘利用。

回到 Donald Michie 的例子:人们固然可以取笑他那些极端过度乐观的人工智能预测,并将他归为那种典型的、受「马斯-加罗定律」(即人工智能的实现总是被预测在研究者即将退休之时)蒙蔽的、带有偏见的人工智能研究者形象[19]。然而,尽管他的预测错了,但这是否算是一个错误尚不明确,因为在其他案例中,一些看似注定失败的研究项目——比如马可尼试图用无线电信号横跨大西洋——却因为某个「未知的未知因素」——肯涅利-亥维赛层[20]——的出现而意外成功。我们无法百分之百确定这类预测就是错误的,况且当时投入到人工智能研究的资金确实微不足道(而且其商业衍生品的收益很可能早已覆盖了所有成本)。

此外,更重要的一点是,Michie 指出,像巴贝奇那样的研究工作,不应被视为期望能立即产生回报的商业研发,而应被看作是购买期权性的原型项目。这些原型能够证明某项特定技术正接近其「成熟时机」,并揭示出瓶颈所在,从而社会可以集中力量攻克这些瓶颈,一旦瓶颈被突破,便可以选择将原型规模化[21]。Richard Hamming 曾描述道,所谓的成熟时机,就是新的思想或方法最终使我们能够着手解决那些具有重大影响的问题(即具有高信息价值的问题)的时刻。Edward Boyden光遗传学膨胀显微镜技术的发展描述为「失败重启」的过程,即重新审视过去那些(失败了的)想法,这些想法在其他领域取得进展的背景下,如今可能变得可行。随着时间的推移,可能会出现更多的选择,其中任何一种选择都可能绕过以往那些曾是致命障碍的必要或串行依赖关系。某一领域(尤其是计算能力)的足够进步,有时可以弥补另一领域的停滞不前。

因此,巴贝奇当初的目标不应该是制造一台能够大量产出航海表的实用型思维机器,而应该是证明这样一种可编程思维机器的可能性与实用性,并指出其当前受限于机械逻辑的速度和体积——如此一来,政府便可能以更高的优先级推动晶体管的研究,从而使可编程计算机能在晶体管问世后尽快被创造出来,而不是像历史上那样,巴贝奇的工作被遗忘,导致后续发展走了许多弯路,经历了反复的、带有延迟的重新发明(例如 Konrad Zusevon Neumann 的工作)。类似地,认真对待摩尔定律的好处在于,即便人们不确切知道它何时会(或者说是否会)持续下去,也能提前规划以利用其带来的优势[22]。

这种态度类似于 DARPA(美国国防高级研究计划局)在扶持人工智能与计算技术发展时所采用的范式,即一个「连接当下与未来的理性过程」,旨在「统筹推进一整套技术的发展」,其责任被分配给多位项目经理,每位经理在数年内都享有相当大的自主权。这些项目经理倾向于选择那些更具争议性、而非意见一致的项目(Goldstein & Kearney 2017),即那些会在评审或评论界引发分歧的项目。每一位经理都会规划、投资并致力于尽可能地将成果推向商业化,然后在计划不可避免地失败时,根据需要灵活调整方向。(DARPA 确实也常将自身视为一家风险投资公司。)

对于像 DARPA 这样的机构而言,摩尔定律这类预测的益处在于,它提供了一个固定的趋势,用以在十年左右的时间尺度内评估整体时机,并找出那些已经滞后并成为反向突出部(即瓶颈环节)的技术点[23]。而对于企业家来说,指数思维的优势则更带有一种宿命论色彩:即能够在技术刚刚可行之后、其他人随机尝试之前的那段短暂窗口期内启动项目;如果判断失误,项目本身就根本不可行,那么何时启动都无关紧要;如果是因为时机不对而判断失误,那么其选择实际上也是随机的,延迟造成的损失微乎其微。

试试,再试试(但越来越少)

通往智慧之路?——嗯,它清晰明了

​ 且易于言表:

​ 犯错,

​ 再犯错,

​ 不断犯错,

​ 但越来越少,

​ 越来越少,

​ 越来越少。

Piet Hein《俳句诗集》 (Grooks)

这揭示了个人激励与社会激励之间的冲突。从社会层面看,人们期望不断有人投身市场洪流,任凭无情的市场力量践踏,只为抓住那万分之一的机会——或许这一次就能成功;并且由于关键成功因素未知且瞬息万变,社会需要不时地出现一些「牺牲品」式的创业公司来进行试探(对于一个好点子而言,再多次的失败也不足以证明它永远不该被尝试——多次失败仅仅意味着应该暂时退避、调整策略)。而从个人层面看,考虑到回报的高度不确定性、递减的边际效用、巨大的负面影响(一次失败的创业可能毁掉人的一生,甚至导致自杀)、个人能够参与的创业次数有限(可能导致赌徒困境)[24],以及创业公司和风险投资机构从任何成功项目中获取的收益仅占总收益的极小部分(大部分将转化为消费者剩余或正外部性)这一事实,唯一符合理性、不需要你孤注一掷去尝试的,是那些显而易见、人人都认为是好主意的创业项目。然而,这恰恰是那些「疯子们」会做的创业公司,在多年前,当它们看起来还是糟糕主意时就已经付诸实践的创业项目,避免了因延迟而造成的浪费。此外,人们普遍表现出过度利用现有成果而探索不足的倾向,这进一步加剧了问题——即便创业(或实验、或广义上的研发)的期望价值对个人而言是正向的。

所以,看起来快速的进步依赖于「疯子」们

我认为,这与汤普森采样[25](Thompson sampling)/后验采样(PSRL)这类贝叶斯强化学习方法之间,存在着远超表象的深刻类比。在强化学习的多臂老虎机(multi-armed bandit)问题设定中,每一轮决策者都面临一组「摇臂」(即选项),这些选项的收益未知,目标是最大化长期总回报。其难点在于如何处理失败:即便是好的选项也可能连续多次失败,而坏的选项也可能偶尔成功,因此不能在一两次失败后就简单地排除某个选项;如果过早地放弃一个选项,可能需要很长时间才能意识到其价值,最终在多轮决策中错失良机。

多臂老虎机问题最简洁且高效的解决方案之一,便是汤普森采样及其推广形式 PSRL[26],它能长期使回报最大化并最小化「遗憾」(即机会成本):其策略是,根据当前估计的各个选项成为最优选择的概率,来随机选择下一个要尝试的选项。这种方法在初期会探索所有选项,但会逐渐聚焦于那个最有利可图的选项,在大部分时间里利用它,同时仍会偶尔探索所有其他选项,以防万一;严格来说,汤普森采样永远不会永久排除任何一个选项,只是选择某个选项的概率会变得极其微小。老虎机问题还可以进一步假设选项是「不稳定的」(restless),即最优选项可能随时间「漂移」、「耗尽」或「切换」。在这种情况下,决策者还需要估计某个选项已经发生切换的概率,一旦发生切换,就转而选择新的最优选项;与常规汤普森采样中那些表现不佳的选项被尝试的概率越来越低不同,「不稳定老虎机」会导致持续的低强度探索,因此决策者必须不断检查,以免错过了选项的切换。

这与创业公司在不同时期的出现频率有相似之处:当一个新的「选项」(即创业方向)刚出现,其在当下成为最有利可图选项的先验概率较高时,会引发一股创业热潮,许多创业公司会选择该方向;但当它们失败后,该方向的后验概率便会大幅下降。然而,即便某个方向现在看起来像是个坏主意,也总会时不时有人坚持再次尝试;并且,由于成功的概率并非为零,偶尔他们会出人意料地大获成功,令所有人惊叹:「原来,X 现在真的可行了!」

在 DARPA 的研究资助和风险投资实践中,他们通常寻找的并非那种让每个人都觉得尚可、或挑不出什么毛病的方案,而是更接近于那种至少有一个人基于某种原因认为其潜力无限的方案。强化学习领域的另一个类比是后验采样强化学习(PSRL),它通过选定一个策略并坚持到底(无论成败)来处理更复杂的问题。一个简单的汤普森采样在处理长期问题时会表现不佳,因为它在每一步都可能「改变主意」,无法持续遵循任何一个计划足够长的时间以观察其效果;此时,进行「深度探索」变得至关重要,即便是对于一个你认为几乎肯定错误的计划,也必须坚持足够长的时间以观察其运作方式,必须做到「即便不同意,也要承诺执行」。多个计划的平均效果往往不如任何单个计划。最具信息价值的计划,往往是那些最具争议性的计划。[27]

整个系统可以用强化学习的视角来审视。我在许多系统中观察到一个共同主题:它们遵循一种多层次优化结构,其中缓慢的黑箱方法能够催生出更高效的贝叶斯推断方法。dropout 这样的集成学习方法或多智能体优化也可以遵循这种模式。

一个特别贴切的例子是 Krafft 等人在 2016 年2017年的研究(相关讨论),该研究分析了 eToro 平台上在线交易者进行的大量交易数据,这些交易者能够复制更成功交易者的金融交易策略;当一些交易者发现成功的策略后,其他人会逐渐模仿他们,因此整个系统会趋向于采纳更优的策略,研究者将此过程识别为一种类似粒子滤波器的「分布式汤普森采样」实现,并称之为「社会采样」。因此,在大多数情况下,交易者会复制流行的策略,但他们也会以一定的概率随机探索那些较为罕见、且表面上看起来不成功的策略。

这听起来很像个人在追求传统职业道路的同时,偶尔会探索像创业这样不寻常的策略;他们有时会探索那些过往表现不佳的策略(例如,先前类似的创业项目失败了)。企业家们凭借他们的推测和乐观偏见,充当了随机化装置的角色,无论「传统智慧」如何,他们都会去尝试某种策略,而此时的「传统智慧」可能仅仅是一种信息瀑布效应;然而,信息瀑布效应可以被那些离群者的存在所打破,这些离群者要么掌握了内幕信息,要么纯粹是随机行事(即所谓的「异类」)。尽管每次尝试一个已失败的选项时,可能看起来不合常理(「虚拟现实究竟要失败多少次,人们才会最终放弃它?!」),但从宏观角度看,进行尝试仍然是理性的,因为这种集体策略共同最小化了遗憾,并最大化了集体的长期总回报——只要那些失败的选项不被过于频繁地尝试。

减少遗憾

这种类比揭示了什么呢?多臂老虎机(MAB)算法的两种失败模式是:早期在某个选项上投入过多,以及后期投入过少。前者是指,你低效地在某个碰巧运气好但并非一定是最佳的选项上获取了过多信息,牺牲了其他可能实际上是最佳的选项;而后者则是指,你获取的信息太少,并因过早放弃一个表面上看起来不佳(实则只是初期运气不好)的选项而冒着犯下永久性错误的风险。就风险投资/初创企业蜂拥进入特定领域而言,这便导致了第一种类型的低效——真的有必要出现那么多「绿色能源」初创公司吗?当它们开始扎堆失败时,从信息获取的角度来看,这是高度冗余的。而另一方面,如果一个创业点子被普遍认为「行不通」,再也没有人愿意投资,那么这个点子可能在早已过了其成熟期后仍得不到投资,这意味着巨大的「遗憾」(机会成本)。

我想大多数人都意识到了投资领域中的跟风/一窝蜂现象,但后一种错误却不常被讨论。一种思路是,风险投资公司可以明确地追踪那些看起来很棒但已有数个失败先例的创业点子,并尝试以不断加大的时间间隔来安排后续投资(类似于延迟采样后验强化学习 DS-PRL 的策略),这样做既能控制损失(如果该点子最终确实不行),又能确保最终的成功(如果它确实是个好点子)。例如,即便在线披萨外卖的尝试屡屡失败,但人们仍希望通过智能手机在线订购披萨,这似乎依然是个不错的点子,所以可以考虑在 2.5 年后、5 年后、10 年后、20 年后再次尝试披萨创业项目,或者也可以考虑在计算机成本每下降一个数量级时、或相关市场规模每扩大一倍时进行尝试。由于想要再次尝试该业务的人未必会在恰当的时机出现,风险投资公司可能需要通过激励他人来亲自创造这样一个创业机会。

如果我们以这种方式思考技术,还能得出哪些其他启示呢?采用抽签式科研资助是被提议的一种方法,旨在打破同行评审机制所助长的对已有成果的过度开发;随机化使得那些不受青睐的、成功概率较低的提案(及其提出者)也能获得机会。如果我们考虑到多层次优化系统和基于群体的训练方法,以及像高效放大器(类似于小型但紧密联系的社群:Pavlogiannis 等人 2018)那样的进化优化机制,那么这可能意味着我们应该对过大过小的团体/机构/资助方都抱有审慎态度,因为小规模的单位容易受到随机噪音和趋势漂移的干扰,且无力承担统计功效充足的实验,而大规模的单位则往往思维固化。[28] 然而,一个由中等规模单位组成的网络,既能进行良好的探索,又能有效地在网络内复制最佳发现并加以利用。