Karpathy万字演讲精髓:欢迎来到“对话即编程”的软件3.0时代
引言
- Andrej Karpathy:曾担任特斯拉人工智能和自动驾驶视觉总监、OpenAI创始成员
- 演讲:6 月 16 日旧金山举行的 YC AI Startup School (YC的AI创业者学校)上,主题为:Software is changing
- 核心观点:软件正在经历继“软件2.0”之后的又一次根本性变革,我们正在进入软件3.0时代 。

软件的三次进化:从指令、权重到语言
- 在他的演讲中,提到软件开发的三次演进

软件1.0时代:指令的艺术 (古典编程时代)
- 定义:由人类程序员使用C++、Python等语言,一行行编写明确、详细的指令来控制计算机 。
- 本质:人类是逻辑的设计者,代码是逻辑的载体 。
- 特点: 逻辑明确,由人类工程师编写精确指令,代码是确定性的。像是在写一本详尽的菜谱,每一步都清晰无误。
- 编程语言/工具: C++, Python, Java等形式化语言。
- 例子 (情感分析):程序员需要创建积极词库(如 “good”, “happy”)和消极词库(如 “bad”, “sad”),然后通过代码统计文本中各类词汇的数量来做判断 。
- 局限:对规则明确的任务有效,但难以处理模糊、复杂的任务,如图像识别 。
软件2.0时代:数据的力量(神经网络时代)
- 定义:软件不再是人类编写的代码,而是通过数据训练出的神经网络权重 (weights) 。
- 本质:人类从“逻辑设计者”转变为“数据和架构的提供者”,通过数据来“教”会神经网络如何编写自己的代码(即权重) 。
- 特点: 开发者设计模型架构,但程序的“逻辑”(即模型权重)是由数据通过优化算法“寻找”出来的。代码是概率性的、模糊的。
- 编程语言/工具: TensorFlow, PyTorch以及海量数据。
- 例子 (情感分析):收集成千上万条标记好的评论,将它们“喂”给一个神经网络,通过优化过程(如梯度下降)让网络自动学习如何判断情感 。另外,抖音/TikTok等推荐产品,也属于软件2.0时代的产品,也可以叫判别式AI。
- 类比:HuggingFace就像是软件2.0时代的GitHub,上面托管的是预训练好的模型(权重文件)而非源代码 。
软件3.0时代:对话即编程(大语言模型时代)
- 定义:随着Transformer架构和LLM的崛起,软件的载体变成了自然语言的提示词 (Prompt) 。
- 本质:Karpathy引用自己的名言:“The hottest new programming language is English.” (最热门的新编程语言是英语)。开发者不再需要编写复杂代码或收集海量数据,只需用自然语言描述需求 。
- 特点: LLM本身就是一个预训练好的、通用的“计算机”或“操作系统(LLM OS)”。开发者通过编写提示词(Prompt)来指挥LLM完成任务。开发过程从编写复杂算法转变为与AI进行高效沟通。
- 编程语言/工具: 自然语言(英语、中文等)和提示工程(Prompt Engineering)。
- 例子 (情感分析):直接向ChatGPT这样的LLM下达指令,如“你是一个情感分类器,请判断以下评论是积极或消极”,并提供几个例子,模型就能立刻开始工作 。
- 影响:极大地降低了软件开发的门槛,将创造的权利下放给了每一个会使用自然语言的用户 。
软件3.0的特征和愿景
LLM:一个全新的操作系统 (LLM OS)
Karpathy提出了一个精彩的类比,将LLM视为一种新的操作系统,这有助于理解如何与它协作 。
- RAM (内存):LLM的上下文窗口。所有指令和对话都存在于此。当新的聊天会话开始,内存是空的,导致LLM会“忘记”之前的内容。Karpathy称之为“顺行性遗忘症”,就像电影《记忆碎片》的主角,长期记忆(权重)固定,但短期记忆(上下文)每次都重置 。
- 外围设备 (Peripherals):为了弥补LLM不擅长精确计算、无法访问实时信息的短板,可以为其配备工具,如计算器、浏览器、代码解释器。LLM会智能地判断何时调用这些工具 。
- 文件系统/硬盘 (File System):向量数据库和RAG(检索增强生成)技术,为LLM提供了长期存储和检索知识的地方 。
- 结论:未来的AI应用需要围绕这个“LLM操作系统”构建一个集成了各种工具和数据源的复杂生态系统 。
了解LLM的心智模型:如何与“有认知缺陷的博学专家”相处
- Karpathy 用“人的精神的随机模拟体(stochastic simulations of people)”来定义 LLM。它并不是传统意义上的计算系统,而是某种泛人类语言经验与推理模式的集合体,由 Transformer 架构实现,每个 token 的预测消耗相似计算量,模拟出对话与推理过程。
- 优点:拥有百科全书式的知识和海量的记忆能力 。
- 缺点:
- 锯齿状的智力:在某些领域是超人,但在看似简单的问题上(如数单词里的字母)会犯低级错误 。
- 遗忘症:没有持续学习的能力,关闭会话后会完全忘记之前的内容 。
- 容易被骗:易受“提示词注入攻击”的影响而泄露信息 。
- 幻觉:会一本正经地胡说八道,编造完全错误但听起来很有道理的事实 。
- 核心:我们不能完全放任LLM,需要设计机制来扬长避短 。

未来的产品形态:“钢铁侠战衣”与“自主滑块”
- 错误方向:钢铁侠机器人 (完全自主的AI代理)
- 定义:给AI一个任务,它就能完全自主完成,无需人类干预 。
- 问题:由于LLM存在太多认知缺陷,目前离这个目标还很遥远,过度宣传的产品往往华而不实 。
- 正确方向:钢铁侠战衣 (部分自主产品)
- 定义:AI极大地增强了人类的能力,但人类始终在控制回路中,负责验证和决策 。
- 核心机制:“自主滑块 (Autonomy Slider)”,像音量滑块一样,用户可以根据任务和信任度,自由调整AI的自主程度 。
- 案例:
- 编程助手Cursor:提供从“按Tab键补全代码”的低自主级别,到“用CMD+I进入代理模式”的高自主级别 。
- 特斯拉Autopilot:从基本的车道保持到在交叉路口转弯,也是一个逐步提升自主度的过程 。
- Karpathy给创业者的四点建议:
- 打包好上下文:帮用户整理好所有相关信息喂给LLM 。
- 精心编排LLM调用:在幕后协同调用多种模型(聊天、嵌入、代码生成等) 。
- 设计定制化UI:设计专门的图形界面,让“验证”步骤(如一键接受/拒绝)变得极其简单快速 。
- 提供自主滑块:让用户始终掌控全局 。

宏大愿景:创造方式与技术扩散的变革
- 氛围编程 (Vibe Coding)
- 定义:Karpathy创造的新词,指开发者不再关心具体实现细节,只需向AI描述想要的“感觉”或“氛围”,如“把这个侧边栏的内边距减少一半”,然后直接接受修改,无需阅读代码 。
- 为AI代理而建 (Building for Agents)
- AI代理是继人类用户(使用GUI)和计算机程序(使用API)之后的第三种用户 。
- 未来网站可能需要一个
lms.txt文件,用对LLM友好的Markdown格式告诉AI代理网站的功能和用法 。
- 技术扩散的路径逆转
- 传统技术(电力、计算机、GPS)的路径是:军事 -> 企业 -> 消费者 。
- LLM的路径被彻底颠覆:通过ChatGPT等产品,路径变为消费者 -> 企业 -> 军事/政府。这种自下而上的扩散是史无前例的 。
- 演讲结尾:Karpathy播放了一段9-13岁的孩子用自然语言创造网页的视频,这些孩子不懂代码,但能将想法变为现实,展示了软件3.0时代创造门槛的极大降低和创造权利的普及 。
启发
首先,一句话总结 Karpathy 演讲的精髓:我们正站在一场软件开发范式革命的门槛上。软件3.0并非简单的新工具,而是一种全新的思想体系——将开发的核心从“编写精确指令”转向“与通用人工智能进行高效对话”。
个体的生存法则:新一代开发者的“三栖”能力
- 技能融合是关键: 参考 Karpathy 的核心建议,未来的顶尖开发者必须是“三栖全才”。我们需要像指挥官一样,根据战场(问题场景)的不同,灵活调度三支军队:
- 软件1.0部队: 用传统代码构建稳定、高效的系统框架。
- 软件2.0部队: 用定制化模型处理特定领域的、数据密集型的任务。
- 软件3.0部队: 用提示(Prompt)快速驱动LLM,完成需要通用知识和复杂推理的创新功能。
- 思维模式的跃迁: 开发者角色的发生巨大的变化,从一个埋头苦干的“实现者”,进化为一个高瞻远瞩的“问题描述者”和“AI 指挥家”。核心竞争力不再仅仅是写出好代码,更是定义好问题和目标。
商业的决胜之道:重塑价值与护城河
- 创新的“加速度”: 软件3.0时代,将产品原型和创新的周期从“月”压缩到“天”,甚至“小时”。企业能以前所未有的速度验证想法、响应市场。
- 价值护城河的转移: 在3.0时代,企业的核心竞争力不再仅仅是私有代码库或某个模型,而是:
- 高质量的专有数据
- 精妙、高效的提示资产库(Prompt Library)
- 围绕LLM构建的、难以复制的独特业务工作流(Workflow)
最后,我再回看Karpathy 说的:”The hottest new programming language is English.”(英语是目前最热门的编程语言。)事实上,当编程的门槛从学习复杂语法降低到掌握母语时,每个人都有潜力成为创造者。在这场由语言驱动的技术浪潮中,你,准备好扮演什么角色?这不仅是软件的再次变革,更是创造力的全面解放。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 明立非|Mingnify的博客!

