宣言准备笔记

原文:Preparatory notes for a manifesto | Patreon

我最近投入了大量时间,试图清晰阐述我研究工作的核心视角。这些看似零散的项目,在我看来都构成了一个更宏大愿景的组成部分,但我一直未能将其清晰解释。这不仅仅是向他人传达的问题:我自己也未能将其清晰表述,这使得我难以把握方向。

因此,这个月我希望分享一些准备性的笔记,以期能更清晰阐明我目前工作的方向。这些笔记在很多方面尚不完善,甚至存在谬误,但在许多地方,它们确实代表了我思考的真实进展。而关于研究,我学到的一点是,通常我所能期望的,不过是逐步加深理解,一点一滴地前进。

敬畏之源

我深深着迷于人类超越自身的能力:那种创造出各种外在形式,使其融入我们自身,进而重新定义我们内在潜能的能力。从生物学角度看,我们与远古那些尚无文字、缺乏图像符号的祖先并无二致,但我们的心智却已截然不同,仿佛来自异域。

更能直接激励我的是,单个个体和小团体亦能创造出这样的形式。书面语言的发明,感觉上是抽象而弥散的。作为一名设计师,我从 Playfair、Mendeleev、Lumière 兄弟、Sutherland 等先驱身上获得了巨大的启发。我渴望为那座宏伟的殿堂添砖加瓦。我希望延续那条由书面语言和洞穴壁画开启的人类演进之路。

挫败之源

语言、纸张、墨水、图形、视频——这些都令人惊叹,的确如此。然而:它们仍不够好。对于我们用于知识工作的媒介之不足,我感到一种深切的挫败。我能感受到其中的消耗与浪费。我最核心的不满在于:这些媒介是惰性的。我必须主导一切:调配我的注意力、去理解、去内化、去实践、去构建意义、去建立联系、去重新创造。文字在纸页上是死的;我们所处的环境,在很大程度上忽略了认知、学术研究和创造活动的实践机制。

因此,我费力地理解复杂的材料,却所记寥寥,而能深刻内化的更是少之又少。我在浩如烟海的「待读」资料中迷失了论文和视频的踪影,正如我常常找不到记录自己想法的笔记。当我研究某个主题时,我会阅读并批注数十篇文章,但这些标记最终却湮没在页边的空白处;要纵览全局、理解其意、并将其与持续的讨论和长期的笔记联系起来,这其中存在着巨大的耗损。

我渴望拥有能够主动支持知识工作的材料与工作空间,它们的设计应能具体体现我们对人类认知、学术研究和创造性工作的最深刻理解。如果纸和笔能使我对于史前人类而言如同异类,那么我希望能创造出一种界面,这种界面之于纸张,正如纸张之于没有纸张的时代。当我伏案钻研时,我希望那份艰辛源于思想本身的内在复杂性,而非因为我不必要地耗费着工作记忆或元认知能力。

「书本无用论」,广义而言

所谓「书本无用」,并不仅仅指我读过的东西大多过目即忘。我也常常在不知不觉中错失要点。我的理解往往流于表面,非常肤浅。面对那些用呆板的文字和符号描述的复杂动态系统,我尽力去构想和驾驭,却往往力不从心。我无法发现所读内容与其他读物之间的关联。我无法将自己的感悟与同朋友、同事正在进行的交流联系起来。我会在页边写下笔记,但它们通常就遗失在书页的角落,毫无用处。我有上百篇论文散落在打开的浏览器标签页中,但我最终读的却往往是最近推特上链接的一篇,而非那些我本认为最相关或最有意义的。我有一些思维习惯和实践方法可以帮助应对这些问题中的大多数,但它们既耗时又不可靠,所以我用得断断续续。

所谓「书本无用」,其意义也不仅仅局限于学习本身。我所崇尚的,是那种理解了复杂而美好的事物后的感受,然后将其内化为己有,并从中创造出新事物的过程。我的兴趣在于以创造性的方式与思想互动,在于赋能,在于实践。因此,问题不仅仅在于单本书籍孤立的惰性,更在于我整个创造性与学术性的工作空间:包括各种材料之间的联系、散落在桌面上的索引卡片、我自己正在撰写的文稿,以及我基于这些写作所构建的计算系统。

所谓「书本无用」,也不仅仅指传统意义上的实体书籍。当我说「阅读与写作」时,我指的是包括静态图表、视频、音频讲座、白板上的草图等等在内的一切。真正的目标,是构建一个认知上友好的交流环境,能够主动支持创造性思维的汲取、整合与产出。

可能性的感知

关键并不在于数字化阅读或数字化知识工作本身。如同许多个人计算领域的先驱一样,我将计算机视为达成目标的手段:传感器用于收集情境信息和富有表现力的输入;计算能力可以实时决定如何处理这些情境信息和输入;显示设备可以呈现动态信息,从而主动支持知识工作;网络则将信息置于社交与协作的背景之下。

我已经目睹过,当我们认真对待这些基本要素时,会发生怎样的变革。我们拥有了像现代数字音频工作站和 CAD 工具这样的环境,它们彻底改变了这些领域内创造性工作的本质。我对此处可能性的感知,源于一种类似的挫败感:在知识工作与学术研究领域,几乎没有真正胜任的人尝试去复制那些成功。

当然,许多学者已经进行过尝试。但我还有一个更深层的信念——此处的成功,离不开独具匠心的界面设计工作。而学者们通常并不擅长此道。我相信,我们所需要的,是那种曾创造出 iPhone 和 Facebook Paper 的富有想象力的设计能量,但其目标应致力于赋能。我曾参与 Apple 在阅读界面上最具创造性的贡献之一:翻页时的 3D「卷页」交互效果。然而令人遗憾的是,我在那里遇到的人,几乎没有人真正阅读或在乎阅读。但我确实目睹了设计师们凭借非凡的想象力和热情创造出 Final Cut Pro 和 Logic。这正是我们当前所需要的。也正因如此,我才如此强烈地感知到未来的可能性。

启蒙琼林的愿景

我的目标是挑战那些死气沉沉的页面。我们可以将其视为两个层面:文字本身——即内容——以及承载这些文字的页面或桌面——即工作空间。我之前主要讨论的是后者:那些能够增强记忆与学习、揭示内在联系、引导注意力的额外工具和层面。这些元素存在于内容之上以及内容之间。

然而,我对那些惰性的内容本身也深感失望。这正是我与启蒙琼林(the Primer)愿景产生深层共鸣的原因之一。那是一个关于情境化交流的愿景,是我们真正应得的「多媒体」体验。文字应无缝地融入使用环境之中,成为可直接操纵的、能够即时响应的表征形式。

我不想只是看着 Grant Sanderson 用一个我无法亲自动手操作的精美 3D 可视化来解释四元数。我不想观看一个关于如何在 Logic 中调整音轨均衡的视频教程,却需要不停地暂停播放、切换窗口,以便将视频画面中的旋钮与我自己软件界面中的实际旋钮进行比对。我不想阅读一篇阐述新颖界面设计的论文,费力地放大 PDF 中那些微小而呆板的示意图,然后再努力将文字解释与浏览器中运行的实时演示对应起来。我不想看到一篇机器学习论文中的某个统计数据,却不得不翻阅冗长繁杂的 Python 脚本,才能找到产生该数据的评估细节。

我渴求一种普适的指代参照(universal deixis)。我希望能打破围绕动态表征的讨论与动态表征本身之间的壁垒。正如 Tufte 所言,不应「因生产方式而割裂」,这不仅适用于静态解释的生成,更应贯穿于整个创造过程。

这个愿景的一部分在于,创建乃至即兴创作动态表征需要变得远比现在容易。不过,包括 Bret 在内的其他人正在致力于此;这感觉不完全是我个人追求的核心。

与先驱们的差异

相较于 Bush 在《诚如所思》(As We May Think)中的观点。 Memex 主要是一个数据库,其核心在于即时访问。它主要的「写入」操作是在文档之间建立粗略的连接。我认为这很好地隐喻了计算技术为知识工作和学术研究核心要素所带来的大部分改变:无限的存储空间、即时的访问速度以及搜索功能。机器可以呈现你想要的任何信息,但决定呈现什么以及如何利用这些信息,则取决于你。

相较于 JCR Licklider 在《人机共生》(Man-computer symbiosis)中的观点。 在他看来,计算机用于计算和处理信息。我们将高成本的计算任务外包给计算机,但假设的提出与探索仍由我们自己完成。读他的文章时,我脑海中浮现的是一台极其精密的台式计算器的形象。而我所感兴趣的,是一种不同类型的共生关系。我渴望一种交流媒介环境,它能够提供主动的认知支持,能够理解思考、学习、意义构建和创造的过程——既包括普遍的人类认知规律,也针对我个体的特点——并据此提供相应的启示、适应性调整和信息层次。它不是一台台式计算器;它更像是一张神奇的纸,能够改变你与纸上所书内容的互动方式。

相较于 Alan Kay。 他的愿景是一种全新的、普适的读写能力——我们都应该能够阅读和编写动态系统。我对这个项目很感兴趣,但我的关注点并不完全在于本质上的计算内容(例如模拟程序),而更多地在于如何利用计算技术,使交流媒介能够更主动地参与到理解和创造的过程中。他的本能是关注儿童,认为新的读写能力可以塑造他们对整个世界的认知。而我的本能是关注成年专家,因为我看到那才是最具影响力的切入点。此外,试图影响儿童意味着需要(在自身意识中)警惕并克服那种有害的居高临下感和家长式作风,还要应对庞大而根深蒂固的社会文化体制。

人工智能的角色

在当前这波人工智能浪潮到来之前,我对这个领域可能性的感知就已经非常强烈了。大多数对人工智能应用于知识工作感兴趣的人,其焦点在于生成输出,在于自动化部分创造过程。在这种模式下,用户扮演着管理者的角色,驱动那些执行实质性工作的代理程序。我乐于将那些琐碎重复的工作自动化,但我认为创造的核心在于用户自身。我希望支持用户头脑内部发生的复杂过程——包括理解、意义构建、构思和表达。这更像是一种共生和延展认知的模式,而非简单的外包。

话虽如此,我期望我的认知工作空间拥有意识,并在一定程度上拥有能动性——以便在我进行理解、整合和创造时提供主动的支持。我希望这种支持能够深植于我的具体情境,包括我正在阅读和写作的一切内容,以及我自身的目标和活动。我认为人工智能很可能成为实现这一目标的重要工具性组成部分。

例如,假设我正在就一个新想法撰写笔记。一篇深埋在我「待读」清单中被遗忘的论文,恰好包含了一些相关的背景知识。在当下,它与我的兴趣点的关联度骤然提升,不再是那种「嗯,也许哪天我该看看这个」的状态了。我希望我的工作环境能够察觉到这种联系,并以一种不打扰的方式将其呈现给我。大多数「阅读列表」给人的印象是一个无穷无尽的、抽象的待办事项清单。而我想要的「阅读列表」,能够深化我对于当下所关注事物的认知定位,其条目的呈现方式并非静态的数据库查询结果,而是能够响应我当前的情境。

再举一例:假设我针对一些我认为特别有趣的细节制作了若干抽认卡。我希望针对这些卡片的实质内容进行提取练习,而非它们的形式。但一段时间后,我会不自觉地根据其形式进行模式匹配。人工智能可以改变其表述方式以避免这种情况——并且,或许还能随着时间的推移,有益地丰富和深化其实质内容。

还有更多相关的例子:对文本进行多层次的摘要,重新浮现可能与新工作相关的旧笔记,页边笔记能够指出文本中可能与我工作最为相关的部分,自动将静态描述合成为动态表征,等等不一而足……

项目总览

难以一言概括。其目标在于超越纸张、墨水、书面语言、静态图形与视频的局限。构建一个为人类认知量身打造的环境,能够主动地增强阅读、写作与思考的过程。(这好比为思维打造的一副全功能外骨骼?)让「纸张」为你服务,以支持理解和创造。


感谢 Ozzie Kirkby、Geoffrey Litt、Michael Nielsen 和 Sara LaHue,在我梳理这些思路的过程中与我进行了富有助益的对话。