AI 圈最知名的技术布道者,"Vibe Coding 之父 ",选择了 OpenAI 最强劲的对手。
5 月 19 日深夜 11 点,Andrej Karpathy 在 X 上发了四句话,宣告了 AI 人才格局的又一次重新洗牌。
这条帖子一小时内浏览量接近 300 万。Karpathy 写道:
个人动态:我已加入 Anthropic。我认为未来几年大语言模型的前沿发展将尤为重要。很高兴能加入这个团队,重返研发工作。同时,我依然对教育事业充满热忱,计划适时恢复相关工作的推进。

美媒 Axios 将此次招募定性为 "Anthropic 在人才争夺中的重大胜利 "。
Karpathy 是谁:一个能用一个词改变行业的人
要理解这次加入的分量,先要理解 Karpathy 的稀缺性在哪里。
1986 年生于斯洛伐克,15 岁移民加拿大。本科在多伦多大学选修了深度学习之父 Geoffrey Hinton 的课程,随后在斯坦福师从李飞飞攻读博士,期间创建了计算机视觉课程 CS231n ——从 2015 年的 150 名学生增长到 2017 年的 750 人,全部视频公开上网,成为全球工程师自学深度学习的入门首选。
2015 年,他成为 OpenAI 创始研究科学家。2017 年被马斯克挖至特斯拉担任 AI 高级总监,主导自动驾驶纯视觉方案。同年他在 Medium 发表 "Software 2.0",提出神经网络权重就是新的代码、数据集就是新的源代码——这个框架重塑了整个行业对 " 什么是编程 " 的认知。
2022 年离开特斯拉后,他在 YouTube 创建 "Neural Networks: Zero to Hero" 系列,频道突破百万订阅。开源项目 micrograd、nanoGPT 代码量极少,却被称为 " 可运行的教科书 "。
2025 年 2 月,他在 X 上造出了 "Vibe Coding" 一词—— " 完全顺应直觉,拥抱指数级增长,忘掉代码本身的存在 "——随后被柯林斯词典选为年度词汇,引发了关于 SaaS 公司生死存亡的广泛讨论,数百亿美元市值随之蒸发。
TIME 在 2024 年将他列入 "AI 领域最具影响力 100 人 "。他在 X 上拥有 250 万粉丝。
正如 X 用户 @sa_vatsa 所评论的:
Andrej 给人的感觉从来不像一个 AI 网红,更像是这个领域的公共解读者。他翻译现实,而不是兜售立场。

Karpathy 加入 Anthropic 的具体任务,指向一个明确方向:用 Claude 加速预训练研究本身。
预训练是大模型获得核心知识和能力的基础阶段,也是算力消耗最密集的环节。据 Anthropic 向 TechCrunch 确认,Karpathy 将组建团队,探索让 Claude 自主发现更优训练架构、数据配比和实验方向的方法——也就是 "AI 改进 AI" 的路线。
这并非凭空而来。今年 3 月,Karpathy 曾做过一个实验:将一个 AI 编程智能体接入一个小型语言模型,让它无监督运行两天,自主测试和调整训练代码。经过 700 次实验、20 项自主发现的优化后,他表示同样的调整应用到更大模型上,训练时间缩短了 11%。他将这个方法称为 "autoresearch",该项目随后成为 GitHub 热门项目,这套方法也被称为 "Karpathy Loop"。
他在 Anthropic 要做的,正是将这套思路系统化、规模化。
Nicholas Joseph 在 X 上写道:
他将建立一个团队,专注于用 Claude 加速预训练研究本身。我想不出还有谁比他更适合做这件事——期待我们一起构建的东西!!
TechCrunch 评价称,"Karpathy 是少数能在 LLM 理论与大规模训练实践之间架起桥梁的研究者之一。"
为什么是 Anthropic,而不是回 OpenAI
Karpathy 的职业轨迹有一条清晰的逻辑:哪里是当下最大的实验,他就去哪里。
2017 年去特斯拉,因为自动驾驶是 Software 2.0 最大的实验场。2022 年离开,因为架构已定,剩下的是工程优化。2023 年回 OpenAI,因为 GPT-4 带来的爆发期是最刺激的前沿。2024 年创办 AI 教育公司 Eureka Labs,想验证 AI 原生教育的假设。
这一次选择 Anthropic,他的判断是:" 用 AI 研究 AI" 的预训练革命正在这里发生。
而他没有回 OpenAI,背后有一个不可忽视的结构性信号:
2024 年 5 月,OpenAI 前对齐负责人 Jan Leike 加入 Anthropic;
2024 年 8 月,OpenAI 联合创始人 John Schulman 跟进;
2026 年 5 月,Karpathy 加入。
三年,三位 OpenAI 核心人物,全部单向流入 Anthropic,没有任何可比的反向案例。
与此同时,OpenAI 的战略重心已明显转向平台化——相继收购 Chat.com、io Products、Windsurf 等,节奏越来越快,金额越来越大。对于一个想 " 回归研发 " 的研究者而言,Anthropic" 以研究质量取胜 " 的路线,显然更有吸引力。
据 Business Insider 报道,Anthropic 的估值在二级市场近期已超过 1 万亿美元,超越 OpenAI。Anthropic 目前正在以约 9000 亿美元估值洽谈 300 亿美元新一轮融资。据新智元援引 Polymarket 数据,交易者给 Anthropic 在 6 月底拥有最佳 AI 模型的概率定价为 65%,而 OpenAI 为 4%。
"Anthropic 正在赢得 AI 竞赛 "
对于这则重磅人事变动,X 用户 @Shashank 评论道:
Anthropic 开始看起来像 2000 年代中期的皇家马德里,把所有 AI 传奇人物和 CTO 都招进来当技术成员。Anthropic 正在打造一支绝对的超级战队。

天哪,太疯狂了,完全没想到。Anthropic 正在赢得 AI 竞赛。

Anthropic 发展势头良好,我认为在未来三四年内他们会超越 OpenAI。



Anthropic 的招募动机可以分几层来看。
技术层面:Anthropic 的算力预算无法与微软支持的 OpenAI 或坐拥 TPU 的谷歌正面竞争。它必须找到用更少算力训出更好模型的方法。Karpathy 同时具备预训练理论深度、大规模工程经验和对 AI 辅助研究的直觉,三者兼备的人极少。
人才信号层面:每一个 Karpathy 级别的加入,都在降低下一个顶级人才加入的心理门槛。人才吸引人才,飞轮自转。
IPO 叙事层面:Karpathy 是 AI 领域公众辨识度最高的技术人物之一——百万 YouTube 订阅,年度词汇造词者,GitHub 上 22 万星标的 CLAUDE.md 仓库。他的名字出现在员工名单上,本身就是一句可以写进招股书的话。
但据新智元分析,最深层的价值可能是 Anthropic 没有明说的:Karpathy 定义范式的能力。他在 Anthropic 做的任何技术探索,都会通过他的推文、博客和 YouTube 视频公开传播。当他用他特有的方式给正在发生的事情命名时,Anthropic 就自然成为那个范式的原产地。
招了一个顶级预训练研究者,附带获得了行业最有影响力的技术叙事者。