恩格尔巴特会如何看待生成式AI
近两年兴起的生成式 AI,到底是增强人类心智的强大杠杆,还是一个让我们自身能力萎缩、过于迷人的幻象?
道格拉斯·恩格尔巴特 (Douglas Engelbart) 被誉为“鼠标之父”,但这个简单的标签掩盖了他一生工作的真正广度和深度。他的众多发明,从鼠标到超文本,再到图形用户界面(GUI)的先驱,并非孤立的技术创造,而是一个宏大、统一且具有深刻道德驱动力愿景的物理体现。
1962年的宣言:《增强人类智慧:一个概念框架》
1962年,在斯坦福研究院(SRI),恩格尔巴特发表了他职业生涯中最重要的文献——《增强人类智慧:一个概念框架》(Augmenting Human Intellect: A Conceptual Framework) ,系统地阐述了他酝酿已久的革命性思想。
在这篇文章中,他明确定义了“增强人类智慧”的含义:“提升一个人处理复杂问题情境、获得符合其特定需求的理解,以及推导出问题解决方案的能力”。其具体目标包括:更快速的理解、更透彻的理解、在以往过于复杂以至于无法理解的情境中获得有效理解的可能性、更快的解决方案、更好的解决方案,以及找到更多问题解决方案的可能性。
这份报告堪称他毕生工作的蓝图。它清晰地表明,恩格尔巴特的关注点并非孤立的工具或技术,而是一种系统性的方法。他强调,我们应该将“一个人类和他的增强手段组成的整个系统”视为一个整体来研究。在这个系统中,人和工具是相互作用、不可分割的组成部分,系统的整体性能提升,来源于各组成部分的协同优化,而非孤立地改进某一个部分。这一系统性、整体性的观点,是恩格尔巴特思想的基石,也是他与当时乃至现在许多技术思想家最根本的区别。
H-LAM/T系统:一个协同进化模型
恩格尔巴特的概念框架中最核心,也最常被误解的部分,是他提出的“H-LAM/T”系统模型。这个模型深刻地揭示了他对“增强”的理解远不止于提供更好的工具。H-LAM/T是一个由五个相互关联、协同进化的元素组成的完整生态系统:
人类 (Human, H): 这是系统的核心,即拥有内在感知、运动和心智能力的人类个体或群体。
语言 (Language, L): 这不仅指自然语言,更广泛地包括人类用来思考和交流的所有符号系统、概念和模型。
工件 (Artifacts, A): 这是指人类使用的物理工具,从一支铅笔到一台计算机,再到恩格尔巴特发明的鼠标。
方法 (Methodology, M): 这是指人类组织工作、运用语言和工件来完成任务的流程、策略和工作方式。
培训 (Training, T): 这是指人类学习如何有效利用语言、工件和方法以提升自身能力的过程。
这个模型的革命性在于,它将技术(工件)置于一个更广阔的生态系统中。举世闻名的鼠标(工件)本身并无太大意义,它的价值只有在与其他元素协同作用时才能体现。
恩格尔巴特坚信,任何一个元素的突破都会为其他元素带来新的可能性,从而驱动整个系统的正向循环和进化。这个模型解释了为什么他不仅仅发明硬件,还同时开发了全新的软件系统(NLS)、工作流程和社区文化。他所构建的,是一个完整的、旨在提升集体智慧的社会技术系统。
增强IA与自动化AI的永恒分歧
自计算机科学的黎明起,这两股思潮便并行发展,其根本分歧在于一个核心问题:我们发展技术的最终目的是什么?是为了创造出能够替代人类的自主机器,还是为了打造出能够增强人类能力的共生工具?
智能增强 (Intelligence Augmentation, IA): 这是恩格尔巴特的范式。其核心目标是设计出能够提升和扩展人类能力的技术。在这种模式下,技术被视为一种强大的工具或媒介,人类在使用它的过程中,自身的能力会得到提升。最终的结果是创造出能够借助机器完成更多、思考更深、解决更复杂问题的人。人类始终是这个系统中的核心行动者,处于主导和控制地位。技术是人类心智和身体的延伸,是一种共生伙伴关系。
自动化 (Automation) / 人工智能 (Artificial Intelligence, AI): 这是主流的AI范式。其核心目标是替代人类的工作,以节省时间、降低成本、提高效率。在这种模式下,技术被设计成一个能够自主完成任务的代理(agent)。它旨在模拟或复制人类的智能,但并不从根本上改变使用者的能力。人类的角色可能是监督者、使用者,或者被完全从流程中移除。技术是一个自主的行动者,是人类劳动力或智力的替代品。
今天的生成式AI,正站在这个十字路口中央。它既可以被用作一个黑箱,为我们提供看似完美的答案,让我们停止思考;也可以被用作一个交互式的思维伙伴,激发我们的创造力,挑战我们的假设,从而深化我们的理解。
以H-LAM/T框架剖析LLM
要真正理解LLM的潜力与风险,我们必须超越对其技术本身的迷恋,并将其置于恩格尔巴特所提出的H-LAM/T(人类、语言、工件、方法、培训)协同进化系统中进行审视:
人类 (Human): 我们必须警惕一种危险:对LLM的过度依赖可能会增强我们“表现出的智能”(即在AI辅助下产出的成果质量),却削弱了我们“习得的智能”(即我们独立思考和解决问题的能力)。如果一个学生能用AI写出一篇完美的论文,但其自身的写作和批判性思维能力却因此而退化,那么我们得到的不是增强,而是智力上的萎缩。
语言 (Language): 一种全新的语言——提示工程(Prompt Engineering)——正在诞生。我们正在学习如何用自然语言的变体来精确地指导和塑造这些模型的输出。这正是恩格尔巴特提出“新沃尔夫假说”的现代印证:我们用来操作外部符号的工具,会反过来深刻地影响我们的语言和思维方式。
工件 (Artifacts): 我们拥有了前所未有的强大工件。从ChatGPT的聊天界面到能够处理文本、图像和代码的多模态模型,这些工具在信息处理能力上远超我们当年的想象。
方法 (Methodology): 新的工作方法正在涌现。我们可以采用“翻转互动”,让AI向我们提问以澄清我们的思路;或者使用“思维链提示”,迫使AI展示其推理过程,从而让我们能够批判性地评估其逻辑。这些方法论的创新,是将LLM从自动化工具转向增强工具的关键。
培训 (Training): 我们的重点必须放在对人类的培训上——不是培训如何获得答案,而是培训如何与这些新工具进行有意义的、能提升我们自身能力的协作。
关键区别:“表现出的”智能 vs “习得的”智能
这是一个对于评估AI影响至关重要的概念区别。
“表现出的”智能,指的是在AI的辅助下,个体或团队最终产出的成果的质量。例如,一个学生在LLM的帮助下,可以写出一篇语言流畅、结构严谨的论文。这篇论文展示了高质量的批判性思维。
“习得的”智能,指的是在使用AI之后,个体独立思考和解决问题的能力是否得到了真正的提升。例如,那个学生在脱离LLM后,自己独立写作和思考的能力是否变强了?
这个区别是恩格尔巴特哲学在现代最重要、最深刻的延伸。当前的LLM非常擅长于增强表现出的智能。然而,一个巨大的风险在于,对这些工具的过度依赖,可能会导致我们习得的智能发生萎缩。如果我们总是让AI为我们思考,我们自己的思考能力就可能退化。
从恩格尔巴特的角度看,一个真正意义上的“增强”工具,其设计的终极目标不应仅仅是帮助用户产出更好的结果,更应该是让用户本人成为一个更好的思考者。增强的目标是提升人类,而不仅仅是提升“人机混合体”的输出。
这一观点对当前AI的发展提出了尖锐的挑战。
例如,LLM的“黑箱”特性——其内部推理过程不透明,输出结果难以溯源——是根本上反恩格尔巴特式的。一个无法让用户理解其工作原理的工具,更像是一个神秘的“神谕”,而非一个透明的、可供协作的思维伙伴。它阻碍了用户获得真正的“理解”(comprehension),而这正是恩格尔巴特定义“增强”的核心要素之一。
因此,一个真正追求增强的AI发展路径,应该将“可解释性”(explainability) 和“可追溯性”置于与模型规模同等重要的位置。
巨头垄断生态 vs 协同进化生态
当前LLM由少数几家大型科技公司集中开发的模式,也与恩格尔巴特关于分布式、协同进化的社区愿景背道而驰。
他设想的是一个分布式的用户社区,共同为系统的进化做出贡献。而当前的模式,用户主要是技术的消费者,而非共同开发者。这引发了关于权力、控制和技术发展方向的严重问题。
恩格尔巴特的愿景是民主化和集体赋能的;而当前的模式则有创造一种对少数私有、中心化“智能”的依赖的风险,这与他增强全人类解决自身问题能力的初衷相去甚远。
幸运的是,目前大模型的开源社区如 HuggingFace、Modelscope 给开发者与技术爱好者带来了一些希望。人们可以在开源社区发布模型参数、模型数据,讨论训练时的注意事项。
完成那场未竟的革命
今天,我们拥有了比六十多年前所能想象的更强大的技术,但我们似乎正在偏离这个核心目标。当前对更大模型、更高基准分数的狂热追求,正是自动化思维的体现——我们仍在问“机器能做什么?”,而不是问“这些机器能帮助我们成为什么?” 。
因此,我向今天的创新者、教育者和思想家们发出呼吁:
将人类置于中心:评估一项AI技术的首要标准,不应是它能替代多少人类工作,而应是它能在多大程度上提升人类的洞察力、创造力和协作能力。
拥抱透明与可控:抵制“黑箱”的诱惑。一个真正的增强工具,应该让使用者能够理解其工作过程,从而建立信任并与之协同进化。
投资于方法与培训:最大的机遇不在于构建更庞大的模型,而在于开发新的方法论和培训体系,教会我们如何成为这些强大工具的“专家用户”,而非被动的消费者。
前方的道路需要远见、勇气和一种深刻的信念——相信技术的最高使命,永远是服务于人类潜能的无限扩展。
恩格尔巴特试图展示的是一种全新的知识工作“生活方式”,一个旨在增强集体智慧的完整社会技术系统。
“你们要为机器做所有那些事?那你们要为人类做什么呢?” (You’re going to do all that for the machines? What are you going to do for the people?)