Post

AI时代前三年,我的啊哈时刻,我的改变,以及我的担忧

我们正在经历的,不仅是技术的革命,更是对“何以为人”这一古老哲学命题的重新定义。

AI时代前三年,我的啊哈时刻,我的改变,以及我的担忧

从 2022 年 11 月 30 日那天开始,一个全新的时代开启了。

过去三年,我持续地观察、研究、实践着,热情地拥抱着这次技术变革。

我想,也许这将是我此生遇到最大的机遇。

如今,AI 领域依旧变化迅速,前两日 Google 刚刚发布了 Gemini3,能力突破引发了圈内狂欢。

是时候做一次回顾了,盘点那些真正重要的理解与改变。

6 个 啊哈时刻 Aha moments!

过去三年 AI 领域的关键突破,让我兴奋不已的啊哈时刻:

1. 我竟然能和 AI 直接对话和聊天了!(以 ChatGPT 为代表)

2022 年 11 月 30 日,OpenAI 发布 ChatGPT,第一次让 AI 融入了普通人的生活——无论是解释概念、头脑风暴创意,还是陪你闲聊解闷,ChatGPT 都展现出前所未有的实用性和亲和力。我的感受是:原来人类可以如此自然地与强大的AI对话,这在以前是难以想象的体验。

2. AI 不再是孤岛,它可以调用工具帮我联网搜索、做数据分析了!(以 GPTs 为代表)

过去,聊天 AI 受限于自身训练语料,遇到超出知识范围的问题就束手无策。而现在,LLM 可以像人一样去查找信息、使用软件 API,弥补自身短板。每个人都可以定制属于自己的专用AI助手,教会它使用特定工具来满足个人或工作的需要。

3. AI 不仅脑子里有知识,还能看我喂给它的私人资料来回答问题!(以 NotebookLLM 为代表)

LLM + 私人知识库。NotebookLM 允许我们上传各种文件(PDF、幻灯片、Markdown、网页链接,甚至 YouTube 视频或音频等),系统会将这些资料构建成一个私有知识库。然后,我们就能在 NotebookLM 的聊天界面向 AI 提问,它会基于这些上传材料给出详细解答。更重要的是,AI 的回答不仅有结果,还会自动附上引用来源,用户点一下引文就能跳转查看原文片段,方便核实。这让 AI 从一个博学却闭塞的专家,进化成了真正理解我需求、掌握我专属知识的定制顾问。

4. AI 居然会一步步推理,还能把思考过程展示给我!(以 DeepSeek R1 为代表)

还记得 2025 年的春节,DeepSeek 爆火出圈。之前的大模型给答案往往像个黑箱,让人摸不清它是如何得出结论的。而推理模型 DeepSeek-R1 在回答问题前会先输出一段详细的思维链(Chain-of-Thought, CoT),模拟人类解题的推理步骤,让 AI 的“想法”对用户可见。我从这些推理过程中,发现了许多自己在思考中可能存在的遗漏。好像 AI 终于有了“元认知”。它开始知道自己“不知道”什么,并且懂得在开口说话前,先在脑子里“打草稿”。这是通往更高级智能的必经之路。

5. AI 已经能当我的研究助理,自主上网查资料、写出完整的、高质量的分析报告了!(以 Gemini Deep Research 代表)

当我把一个开放性的课题交给 Gemini Deep Research,它会先生成一个多步骤的研究计划:列出要调查的方面和步骤,等待我确认。获得许可后,它就像一名勤奋的研究员那样,在网络上搜索相关信息:通过多轮搜索-阅读-再搜索的迭代方式,不断挖掘更详实的材料。

短短几分钟内,AI 可能浏览数百个网页、论文甚至我的云端资料,然后开始整理分析。最终呈现给我的是一份结构清晰、引经据典的研究报告:包含针对问题的要点分析,每个关键结论都附有原始来源链接。整个过程,相当于 AI 替我完成了传统上需要几小时甚至几天的人力调研工作,而且结果有理有据、一目了然。我可以进一步追问细节,或者让 AI 对报告做调整扩展。

这对知识工作者来说意义非凡:每个人都可以拥有一个24小时待命的“智囊”,帮你做市场调研、论文综述、竞品分析等繁杂工作。

6. AI 能自己动手做计划、写代码、调试、搞定整个开发任务!(以 Claude Code 为代表)

这是最近的一次无比大的震撼。我不再在网页上复制粘贴代码,Code Agent 直接住进了我的电脑终端。它像一个自动化程序员那样分析需求、编写代码、运行测试,甚至管理项目版本控制。一开始我还有些将信将疑,直到真正体验后才发现这次技术突破的颠覆性。

Claude Code 运行于命令行界面,能够访问开发者的终端环境,这意味着它可以读取项目文件、调用 shell 命令、执行脚本,甚至通过 API 使用更复杂的工具。当然,出于安全考虑,它每次执行影响系统的操作(如写入文件、运行 git commit 等)都会征求用户许可。但一旦赋予权限,AI 就真的开始在电脑上“动手干活”了!

这三年,我建立的 6 个新习惯

作为一个典型的知识工作者,日常与文字打交道非常多,总结我个人使用 AI 的一些习惯:

  • 大量阅读英文资料,借助浏览器插件沉浸式翻译实现一键中英文对照翻译,论文 PDF 则通过 Zotero 结合插件翻译。

  • 在阅读或学习的时候,产生了一些联想或思考,立刻打开 AI 对话,讨论,有时它能给你提供更广、更深的视角。或者结合经典的思维模型,让 AI 从不同的思维模型角度来分析问题。

  • 让 AI 列举出更多的问题、更多可能的思考方向、更多版本的答案。

  • 对于自己不熟悉的领域,先用 Deep Research 生成一份报告,浏览一遍,建立对该领域的概念术语、关键人物、历史发展等的基本认知。

  • 对于自己日常的特定小需求,会尝试用 AI 是否能轻松完成。如果能完成得很好,那就可以立即用上。如果无法完成,自己也更明白了AI 当前的能力边界。

  • 文章配图,课件配图,会使用 GPT 或 Gemini 结合特定内容来生成相关的信息图。

总体而言,较深的一点感触是:AI 大大加速了创作,是因为它减轻了一些创作过程中的痛苦和阻碍。

我对 AI 时代的两点担忧

认知卸载与技能萎缩的风险

随着 AI 接管越来越多的认知任务,人类面临“元认知懒惰”(Metacognitive Laziness)的风险 。  

  • 认知卸载:将记忆、导航、计算等任务外包给 AI 可以减轻认知负荷,让我们专注于更高级的创造性工作。然而,过度依赖可能导致大脑相应神经回路的萎缩。 
  • 批判性思维的侵蚀:研究显示,虽然使用 AI 辅助的学生在短期任务上表现更好,但他们可能无法内化解决问题所需的批判性思维技能。为了保持人类智能的独立性,教育体系必须重新强调基础认知能力的训练,而非仅仅教授工具的使用。

认识论危机:什么才是真相?

AI 能够以极低的成本生成逼真的图像、音频和文本,这对人类社会的信任基石构成了严峻挑战。

  • 深伪技术(Deepfakes)与现实的消解:逼真的 AI 生成内容使得“眼见为实”不再成立。这不仅用于制造虚假内容,更被用于操纵和诈骗。  
  • 说谎者的红利:深伪技术的存在产生了一个次生灾害:恶意行为者可以轻易否认真实证据的真实性,声称其为 AI 伪造。这种普遍的怀疑主义会导致社会信任的全面崩塌。 
  • 信息洪流与审查:威权主义政权利用 AI 生成海量虚假信息“淹没”网络空间,这种“噪音审查”比传统的删除封锁更为有效且难以察觉。个性化算法过滤气泡进一步加剧了社会极化,使得民主协商变得愈发困难。

人类智能与数字智能共生的未来

在地球长达 45 亿年的历史长河中,智能的演化始终受到生物化学法则的严格约束。从单细胞生物的趋化性到灵长类动物的社会性认知,碳基生物的每一次认知飞跃都伴随着数百万年的自然选择与代谢优化。

然而,随着大语言模型(Large Language Models)技术的爆发,我们见证了一种全新的、非生物的智能形式的崛起。这种智能并非诞生于温暖的原始汤,而是涌现于冰冷的硅基芯片与海量数据的数学高维空间之中。

在这场硅基与碳基的博弈中,人类智能该何去何从?

此处简单谈谈两点可能性:

科学发现的自动化与加速

AI 正在从科学家的“工具”(如显微镜)转变为“合作者”。

  • 假设生成与验证:LLM 能够阅读海量文献,发现人类研究者可能忽略的跨学科联系,并提出新的科学假设。这突破了人类认知带宽的限制。  
  • 模拟与发现:AlphaFold(蛋白质结构预测)和 GNoME(材料科学)等工具的出现,将数个世纪的研究进程压缩到了几年。GNoME 发现了 220 万种新晶体结构,其中 38 万种是稳定的,这在传统实验方法下是难以想象的。  
  • 全自动实验室:AI 与机器人技术的结合催生了全自动实验室。AI 提出假设,控制机器人进行实验,分析结果并修正模型,形成闭环。这种“工业化”的科学发现模式将极大加速新材料和新药物的研发。

脑机接口(BCI):带宽的突破与融合

如果无法打败它,就加入它。脑机接口技术代表了人类与 AI 共存的激进路径。

  • 带宽瓶颈:目前人机交互主要通过键盘和语音,带宽极低(每秒几比特)。而人类思维的速度和 AI 的处理速度远超于此。BCI 旨在建立大脑与硅基芯片之间的高带宽通道,实现“思维速度”的信息传输。
  • 赛博格化:Neuralink 和 Synchron 等公司的进展表明,未来人类可能通过植入设备直接扩展记忆、增强感知甚至实现意念控制。这种“混合智能”可能是对抗 AI 霸权、保持人类主体性的终极手段。

我们可以构建一种人类智能与数字智能共生的未来。

在这个未来中,硅基智能作为强大的外脑,承担计算、模拟与预测的重任;而碳基智能则坚守价值判断、意义赋予与情感体验的高地。

我们正在经历的,不仅是技术的革命,更是对“何以为人”这一古老哲学命题的重新定义。

小结

过去三年的旅程,留给我最重要的,并不是学习了多少新知识,因为有些当初看上去很厉害的东西现在已经无人谈论。而是这一路上的经历,感受风云变幻、思考与复盘、用行动实践试图建立更深层的理解。我沉浸其中、专注玩耍、拥抱变化。

未来,对人类来说,用更优质的信息(甚至可能是 AI 生产的优质信息)来训练独属于自己的神经网络,变得更有必要,也更加容易了。而独特主体性、心理韧性、判断力、可扩展性(想象力),将成为区分人与人的重要特质。

This post is licensed under CC BY 4.0 by the author.