关于ZAKER 合作
虎嗅APP 10小时前

中美 AI 行业的关键时刻

本文来自微信公众号:卫诗婕-漫谈Light the Star,作者:卫诗婕,原文标题:《【中美AI核心笔记】有点晚了,但还想再谈谈2025》,头图来自:视觉中国

有点晚了,但还是想回顾一下 2025。

如题,2025 ,我们站在 1/4 世纪的交界处。

这是一个"硅谷大年":科技巨头继续搅动世界,但 Deepseek、Manus、Qwen、K2 等中国 AI 力量,也开始赢得世界认可,生出一股华人春风。

这也是中国"十四五"收官与"十五五"的衔接之年:"人工智能 + 行动"中,一系列新的风向与趋势暗流涌动。

技术上,2025 ,可能也酝酿着深刻的范式转移。

本文串联了 2025 AI 行业的一些关键时刻,以及漫谈Light the Star 所收集的不同行业视角,取材自近 30 位中美 AI 创业浪潮中关键人物的对话,其中包含 AI 创业者、投资人、生态建设者与观察者,试图记录 2025 中美 AI 跃进的轨迹,也埋下 2026 值得关注的伏笔。

一、不平凡的春节

2025 那个不平凡的春节,Deepseek 和宇树让整个硅谷都意识到,要看工程能力的实力,还得看中国人。

一位在英伟达工作的程序员在查阅 Deepseek R1 的源代码后感慨,"太漂亮了"。

华人数学好,这早已成为共识。但在 AI 时代,另一个让华人撑起大模型主力军的重要原因则是,"硅谷早年都是华人在做 Infra,Infra 很苦,白人不愿意干。但 Infra 对大模型来说,又刚好很关键。"

这些拥有超强工程能力、聪明勤奋,且见识过现象级增长的华人,成了 AI 战局中的香饽饽。

Deepseek 的出现,进一步点燃了某种对华人的期待:美国自 2022 年开始对华实施全面的算力卡脖子,中国 AI 市场上,创业公司们至今只能使用一些芯片水货。即便如此,中国人还是做出了 Deepseek R1 ——以更少算力、更高的效率做出了能够媲美 GPT-4o 的大模型。

美国政界和科技界也因此出现两派分歧的声音:一派认为,Deeepseek 的出现,宣告着过往的算力卡脖子无效,不应再以这样的方式"防"下去了。另一派,则以 Anthropic 的 CEO Dario 的发声为代表,一种"对华加强管制论"正在抬头:此前美国对华的算力封锁,不是防的无用,而是防得不够。

很快,"加强管制论"的声音迅速发展——随着川普上台,针对中国 AI 的算力限制升级、投资限制的加强落地,以及 AI 扩散规则,一起将中美科技竞争推向一个新的高潮。

二、Manus的7500万美元融资

2025 的 Q1,从 Deepseek、宇树到 Manus,整个硅谷都在谈论中国。多名硅谷的美元投资人表示:"市场上的情绪到了。"

据称,Manus 爆火之后,Benchmark 创始人随即决定来华寻找项目,并在几个月后以 7500 万美元大手笔投资了 Manus 的母公司蝴蝶效应,将后者的估值推高至 5 亿美元。

事实上,顶尖的美元机构一直在通过数据检测中国市场的潜力公司。上述投资人告诉我,A16z 曾主动询问一个位于成都的 AI 项目,后者据称和 OpenAI 有着深度合作。顶尖机构们对华人背景的项目有着浓厚兴趣,毕竟,美国 AI 项目的估值涨得太快了;相较之下,中国 AI 资产显得划算无比。

一个背景是:在这一轮 AI 浪潮故事的开始,美国 VC 几乎集体错过了大模型,"底层基模几乎是巨头大厂之间的游戏,VC 根本没机会参与;"就在 2024 年底,许多人还对基础模型的未来持有怀疑甚至略显悲观。但时间来到 2025 年初,Deepseek 和 Qwen 这两个来自中国的成熟模型, 一举将 AI 推入普惠的推理时代——开源的 Deepseek 和 Qwen 把使用大模型的成本打了下来,而 Manus 则演绎了套壳、产品定义和工程创新的力量。

AI 的应用时代正式到来。美元 VC 们又活跃起来。

一位硅谷的美元投资人这样评价 Manus 的"里程碑效应":尽管 Benchmark 所投资的这 7500 万美元,放在硅谷并不算什么惊人的大数目,"但这却是顶级美元机构创始人亲自投的、针对中国背景的 AI 项目开出的一单 super check。给了无数华人 AI 创业者以无限的想象。"

一家 FA 机构也向我们透露,Q2 开始,许多创始人开始询问,是否最好能够拿到硅谷本土美元的钱?毕竟,那意味着更高的估值、更宽松的投资条款限制……

某种信心被点燃了 。到硅谷去,成为许多 AI 创业者的心声。

三、Reverse CFIUS下,华人的AI创业

客观上,本土美元投资中国 AI 的风险在上升。

今年 5 月,Manus 收到美国财政部的问询函——这封问询函的出处,来自于被称为 "Reverse CFIUS(反向投资审查)"的对外投资规则(Outbound Investment Rule),该规则规定,美国资本投资特定行业(半导体、AI、量子计算)的中国公司,符合一定条件的必须进行申报(达到某些条件则被禁止),否则,美国财政部将保留追究权利,严重者将可能被要求撤回投资——简单来说,这项规则的核心,在于限制美国资本投资中国 AI 公司。

值得注意的是,OIR 中,"中国公司"的界定范围被扩大了:总部在中国、中国人或中国公司持有大部分股权、控制子公司、财务数据判定等,都有可能被界定为是中国公司——因此,美元基金 Benchmark 此前对 Manus 的 7500 万美元投资,被美国财政部认为,可能存在禁止投资的嫌疑。

事实上,包含 Manus 在内的多笔投资,正遵循 OIR 规则落地并执行。这客观上营造出一种"寒蝉效应":面对中国背景的 AI 项目,美国本土的美元基金,既兴奋,又谨慎。

"顶级的美元机构早已完成拆分。"上述人士说。例如红杉、GGV 等顶级机构,早已为华设立独立分支,但对于那些从美国基金直接出手的纯美元机构而言,在操作上,选择中国项目的风险则难以忽视。

目前,顶级美元机构(如 Benchmark, Sutter Hill, Greylock)正在形成一种默契—— 在微妙的地缘政治面前,"Decoupling of Capital and Talent(实现资本与人才的脱钩)"。具体来说,美元依然热爱着中国背景的顶级工程师、创始人和产品团队,但前提是,这些项目必须在法律架构、数据存储和市场重心上,彻底剥离"中国属性",成为一家 Day 1 的全球化公司,或是美国公司。

"Manus 完成了一场彻底的示范。"上述人士说,他指的是,在 Manus 收到美国财政部的问询函后,裁撤了公司位于武汉的团队,并将总部搬迁至新加坡——"干脆、利落。"事实上,认为 Manus 起到示范作用的人还有很多。今年 10 月,我在硅谷一场科技大会的现场,于在场不同人士的谈话间多次听到关于 Manus 的讨论,其中一位也在硅谷做 AI 创业的华人认为:

"Manus 很好地示范了一家中国公司,如何摇身一变,成为一家美国公司。"

但这不是事实。

事实上,Manus 是开曼架构,且将总部搬去新加坡(而非美国),这并不是要成为一家美国公司的定性。

清律纽约律师事务所合伙人黄敏达在《漫谈》的节目中曾提醒众多创业者:不建议照搬 Manus 的行为、将之视作标准的 AI 创业样本:

选择把总部搬到新加坡——在美国眼中,新加坡已经不是一个绝对信任之地。换言之,将总部搬到新加坡而非美国,可能呈现一种暧昧之姿。

裁撤中国团队——也并不根本上解决问题。

甚至假如创始人们都变更了国籍(只是假如)——这也不是最重要的。

"美国人更在乎的是,当有一天中美两地发生不可调和的分歧,这家企业是否会完全站在美国这边,并为美国所控制。"从这个角度看,国籍、总部所在地、运营支出大头所在地——这些重要,但终究不是最重要。

黄敏达指出,如果只是根据 A 法设计一个规避方案——这样是头痛医头、脚痛医脚。要知道,中美的科技对阵会是动态变化的,而法案作为对阵的武器,也将是动态变化的。(注:2025年底,Meta 收购 Manus ,但据最新消息,Meta 对 Manus 的这笔收购也正在接受中国有关部门的评估,暂未决定是否审查。)

此时此刻,选择成为一家中国公司还是美国公司,成为一个敏感、重要但艰难的选择。

据漫谈 Light the Star 了解,今年,具身智能领域里一名绝对权威的华人学者正是因此决定归国创业——知情人士告诉我们,"教授原本在美国创业,但美国要求它与中国彻底完成切割。教授本人30多岁才到美国,对美国的归属感没有那么强烈。挣扎之下,最终才决定回国创业。"

"上一代的全球化创业已经彻底画上终结。"上述人士表示。过去,华人创业者会充分利用成本洼地的优势,把工程师团队放在中国(中国工程师的薪资远低于美国),"现在没人敢这么做了。"

在充满张力的两地局势下,立场已经不再允许暧昧不清,"但凡本土美元要投,必须要接受,彻底地成为一家美国公司。"

四、3亿美金前很热闹,3亿美金后融不到

"1 亿美金融资额以上,就面临着和中国切割的选择。"一位中国的双币机构掌门人补充道。

她指出,创业者去硅谷,本身就是资本驱动的——"国内的情况是:3亿美金前很热闹,3亿美金后融不到。"原因在于,市场化的钱里,只有 VC 和投机的资金,而 PE 的资金真空了。

当逼近 3 亿美金估值的天花板时,不少创始人(具身智能除外,原因见后文)就会意识到,去硅谷,成为继续融资的一个选项。

但硅谷的钱并没有想象中好拿。

语言是第一道关。

口音其实不重要——硅谷本就汇聚了全球人才,是各类族裔的大熔炉。Llama Ventures 合伙人周航指出,"你可以满口口音,但不能表达不好。"另一个现实是,在中国被视作佼佼者的人才,放在硅谷的人才堆里,可能并不如人们想象中的出色和扎眼。更重要的是,中美文化差异巨大,许多中国创始人虽然人已来到硅谷,思维却仍是中国式的。

在见了数不清的中国创业者后,周航感慨,"许多创始人来了就马不停蹄开工,与时间赛跑。但都是瞎忙。"他给华人创业者的建议是,来到硅谷,要有充分的耐心和心理准备,"至少要有两三年的时间,才有可能真正适应美国。"

本质上,身份问题不是无法解决——"如果真的有大美元机构愿意开 big check(大笔投资),一堆投资机构会帮你想办法。"

上述不愿具名的投资人举了 Hygen 的例子,可能是近年来华人 AI 创业"硅谷化"最成功的"范本"之一:

2020 年,在 Snapchat 工作六年的徐卓(Joshua Xu)在疫情期间回国,在深圳创立"诗云科技(Hygen前身)",旨在探索视频生成技术的商业化,起初接受了红杉、真格与百度的投资。三年后,Hygen 产品跑通,在海外画出一条恐怖的增长曲线,ARR 从百万美元一路飙升至逼近 1 亿美元门槛,成为准独角兽。

极强的现金流属性自然吸引来顶级的美元机构,Benchmark 合伙人 Victor Lazarte 亲自加入 Hygen 董事会,这在硅谷意味着某种"血统认证"——不过,在顶级美元入场之前,华人创业者也必须交出自己的"投名状":从 2023 年底开始,Hygen 就开始游说早期股东接受回购,并取消个别董事的董事会席位,以实现彻底的资本隔离(确保在OIR界定的安全地带);另一方面,公司也将总部搬至洛杉矶,创始人常驻美国,以实现物理隔离。

就此,Hygen 跑通了一条"华人团队 + 中国技术红利 + 硅谷资本 + 全球市场"的极窄通道:在中美 AI 投资限制的冰点下,为众多华人创业者,真正提供了一场果决却有效的生存模板。

前述人士认为,对于 Hygen 来说,这并不是一个艰难的决定——第一步,你的用户和市场本就在海外,并找到了 PMF。第二步,吸引来本土美元愿意给你砸足够大的钱——一张两亿美金的 check;第三步,顺理成章成为一家美国公司。

但,绝大多数项目并不是 Hygen。在她看来,Hygen 享受了一段窗口期,即在大模型浪潮真正来临之前就已投入AIGC试水。显然,这个窗口期已然过去,今天的 AI 应用战场上,无疑是过分饱和的。

据漫谈light the star 了解,在硅谷,存在不少国内的 AI 创始人拿着旅签落地,意图在美国创业。这客观上违反了移民法。在合规的路上,也遍地是坑——但相比全球化这条漫长的征程,身份问题显然只是第一个、甚至是最小的挑战。

另一名常驻硅谷的美元投资人说,"那些抱着硅谷"人傻钱多"的心态来这里找钱的,多半会铩羽而归。"

但周航也觉得,新一代年轻的华人创业者不同以往,"(大家看到)像米哈游创始人,国内那么大的成就不要了,跑到美国来重新开始。这些都是很好的榜样力量。"这是独属于这一代华人创业者的野心、见识和抱负。

"硅谷的 Bamboo Celing(竹子天花板,以"熊猫"暗喻华人,特指华裔因种族身份而在职业晋升中受阻)本来就在消弭,"前述人士认为,"当 Deepseek、Qwen、Manus 和 K2 这些中国大模型项目出现,Bamboo Celing 似乎彻底消失了。"

五、中国一级市场的短暂春天

国内一级市场这边,也迎来了 AI 早期项目的短暂春天。

一级市场的本质是,有情绪才会有 fomo。

国内不少投资人也都能感知到,2025 年初,"市场的情绪和氛围到了。"

这种氛围是多种因素的混合作用:

美股 AI 龙头的溢出效应:美国的 AI 资产估值飙升,给中国这些 AI 项目很好的对标作用;

港股和科创板 IPO 恢复,且在 2025 的表现都很不错,投资机构们在退出通道层面看到了曙光,于是,二级带动一级,上半年,美元基金们"手很松"。

具身领域,宇树在春晚的爆火有着很长的长尾效应,机构们热情更高,催生更多创业项目诞生。

消费硬件层面, 影石 · Insta 360 上市,华米、安克在资本市场都有着不错的表现——冲到了较高的 PE 倍数。这使得出海消费硬件领域,投资人们更 fomo 了。

从年头到年尾,钱的流向主要汇集在四个方向:具身智能、AI 应用与 Agent、多模态、AI 硬件。CVC 在 2025 "疯狂扫货":原因在于,面对日新月异的AI浪潮,手握充裕现金的巨头倾向以财务投资交朋友、补认知。

具身智能

2025 的春节,宇树机器人在春晚一舞的后效应,带动了整个具身智能领域的火热——使具身智能成为 2025 中国资本市场上无可争议的关键词。

"你能喊得上的每一家具身智能创业公司,账上都趴着不少于 10 亿元的现金流。"多名具身投资人、从业者验证了这一信息。如前文所述,具身智能不会面临"3 亿美金估值以上融不到"的问题——在中国,具身的头部企业虹吸着大量国资的人民币基金。这与国资的特性有关:

人民币基金偏好长周期的底层与硬件(芯片、具身智能)——周期长,免责,不出错;对应用层(Agent、软件)则非常谨慎——周期短、易被证伪、失败率高。

另一层面的原因是,国家期待具身智能等硬件领域能够带动实体经济,并牵引中国从劳动力红利,转向具身智能红利。

但也有从业者指出,"机器人大脑"与 Agent 的本质相近,"抓手虚且烧钱重",尽管国家队很积极,但认知仍在磨合。

AI 应用与 Agent

而美元一直偏爱的应用叙事,在 2025 迅速升温。

一方面因为,基模的故事已经基本收敛,国内比较共识的答案是:千问、Deepseek、豆包、Kimi ,仍在牌桌(Minimax 技术实力很强,但面临着和大厂的竞争,因此看法不一)。年初,模型的底层能力(推理、coding)跃迁以及开源的燎原,一举将大模型推入应用时代,再加上模型价格战的普惠,AI 应用的时机成熟了。

上半年,头部美元基金明显活跃起来。"红杉、高瓴非常积极,上半年一个月可能投资 20 个项目,每个项目投资金额在一两百万美金左右。"

另一方面,对中国 AI 应用和 Agent 感兴趣的钱在变多。

"中东的钱也很乐意投资在中国的 AI 应用资产上。"一名接近中东主权基金的人士告诉我们。2024 年,由于美国方面的施压,限制中东主权基金直接投资中国 AI ,因此,彼时基模的投资的确会受限。"但是到了 AI 应用和 agent 这一波,就没关系。"

AI 早期浪潮中,好的应用产品常常带来指数级的增长(如前文提到的Hygen、Manus 等),而事实一再证明,好的数据能够带来超高的融资额——一个最新的贴切案例是,由字节 90 后产品经理陈冕所创立的 liblib 日收入达到 15 万美金且仍在增长,知情人士透露,liblib 的下一轮融资额将达到惊人的 8 亿美金。"尽管他们亏损也很厉害,但 liblib的社区粘性很高,这份高潜力还是让投资人愿意买单。"

一个小八卦是,在 liblib 估值 5 亿美金时,阿里曾经 drop 掉这个项目,而当项目涨到了 8 亿美金时,阿里一个回马枪又重新入场。

多模态

到了下半年,Google 有了自己的 Nano banana,那么中国也得有。

中国市场急需一个能够代表中国视觉 AI 最高水平、且具备独立自主能力的底座模型——二级市场上,快手因为做出了可灵而迎来一轮市值的重估。中国已有的多模态模型创业项目里,生数科技和爱诗科技是其中的佼佼者——前者更侧重研究,后者已经完成不错的商业化。

但新的潜力选手还在被重注。从商汤秒画离职的刘宇创立的 Vivix.AI,迅速成为 2025 最受关注的 AI 项目之一。

刘宇毕业于香港中文大学多媒体实验室(MMLab),该实验室被誉为"计算机视觉界的黄埔军校",由汤晓鸥教授创办。而刘宇本人,在商汤时曾主导过大规模视觉基座模型的训练,曾是几千张算力卡的"总指挥"——这种对底层算力调度和大规模参数模型的实操经验,是目前 AI 创业者中的稀缺能力。也因此,短短一年时间,Vivix.AI 的估值从 1 年前的 1-2 亿美金,飙升至最新一轮的 13.4 亿美金。而这个项目甚至还从未公开亮过相。

不过,据漫谈Light the Star了解,Vivix.AI 也将主攻海外市场开始起步。

AI 硬件

这一年 ,也是 AI 硬件投资爆发的元年。

如果说,从 2023-2024,一级市场是在买"大脑"(模型),那么2025 年则是在买"身体(硬件载体)"。

2025,是由技术、政策、和中国供应链红利,三者共同掀起的一场围绕硬件的投资热潮。

技术层面,推理、coding、Agent 的成熟,共同带来了 AI 硬件成熟的核心支点——当大模型"大脑"足够成熟,并有条件接入硬件后,智能硬件便开始具备"主动"服务的能力——这使得谈论多年的"人工智能助手",开始成为现实。

以全球增速最快的 AI 硬件 Plaud 为例,表面看,这是最快将大模型接入录音传感器的团队,并因此获得了现象级的成功——成为全球增速最快的AI硬件;实质上,Plaud 产品背后,蕴含了团队对基座模型的精细化工程、下一代智能设备的深度理解,甚至包括对下一代智能基础设施的理解。

Plaud 的故事背后,市场因此见识到一款高完成度的 AI 原生硬件作为消费品的爆发潜力,更重要的是,巨头们也纷纷意识到,一款贴身的消费硬件,作为收集线下用户数据和下一代交互的入口,在大模型的智能之争中,将起到极为关键的战略作用。

越来越多的玩家意识到,硬件爆发的背后,会是一场大模型的入口之战,也将是一次划时代的机遇。

而在这场战争中,可穿戴设备将成为最核心的战场——试想一下,当一款穿戴式设备能够实现 24 小时 always on,这将是大模型能够"宿主"的最佳载体。

其中,又以 AI 眼镜赛道,成为 2025 的最大黑马。

这一年的春天,Rokid 创始人祝铭明(Misa)为国家领导人试戴了自家产品 Rokid Glasses,照片很快登上了权威媒体——2025,智能眼镜在中国极速升温:阿里、字节、百度、小米等巨头纷纷入局开打。根据 IDC 预测,2025 年中国智能眼镜同比增长121%。

除了商业层面的时机成熟,政策的推动也是宏观上不可忽视的风向。

2025,作为"十四五"收官与"十五五"的衔接之年,AI 硬件作为"新质生产力"的核心载体,获得了大量政府引导基金和专项补贴的倾斜。据漫谈Light the Star 了解,一家头部智能眼镜公司最新一轮融资达到惊人的 20 亿人民币。而在国家出台的"人工智能+行动"里,也明确提到,2027 年,新一代智能终端普及率要超过 70%。

"今年硬件投资 fomo 情绪极强,项目被疯抢。"上述人士告诉我们,在多重因素的影响下,资本流向发生了结构性偏移——仅在 2025 年 5 月,流向 AI 硬件的资金就占到了 AI 领域总投融资额的 50% 以上。而截至 2025 年8月,中国在具身智能(机器人)与 AI 硬件领域的投融资总额已突破 386 亿元。

多名投融资从业者都认为,市场上许多项目的估值"疯狂到不可思议"——一种通俗做法是:适当地利用一级市场的 fomo 情绪,营造一种饥饿效应:先以额度紧俏与滚动估值制造项目的势能,后由 CVC 在 1-2 亿美元阶段承接。

"适当的泡沫是行业繁荣的标志,这是自然现象,只是其中一定存在押错注的个案。"上述人士说。

也正因为技术、政策和资本的三重汇合,硬件的创业潮在 2025 大爆发——"VC 们就差把工位搬到大疆门口了。"

说服大疆、拓竹、安克、影石、小米这些大厂中的技术和产品精英出来创业,是许多机构都在努力尝试的事。这种"孵化"做法,通常由投资机构提供明确的创业方向,给予候选人 2-3 个月的时间验证其执行力,如果项目推进顺利,则决定投资,反之则放弃。

"高瓴的口袋深,(像这种打法)一投可以投三五十家。"一名美元投资人说。

而对于更多的美元 VC 机构来说,投资上述这些大厂中的年轻人,成为一种不错的选择。

比起大厂高P,年轻人们在这些大厂中难以获得可观的股权分红,创业动力更强;这些非顶级高管的"草根"实干型人才,也具有更高的潜力和估值性价比。

以云启为例,2025 年,云启发起了一项专投 "98后" 创业者的投资计划。发起之时,"98后"的年龄上限恰好是27岁——"27岁是个神奇的数字,"云启资本管理合伙人陈昱说,纵观美国的商业史,无论是 Google、Facebook,还有当年 Microsoft 的 Bill Gates——他们当年创业的时候都没有超过 27 岁。

越来越多人正在相信,年轻人将带给这个世界无穷的可能性。

六、顶尖项目的融资窗口,只在几个月内

AI 时代,形成共识的窗口期极速缩短,投中顶尖项目越来越难。

这个时代的创业不再像上一个时代那样如此倚赖融资。创业的底层逻辑开始改变。

一位硅谷的投资人形容当下顶尖华人 AI 创业的三类画像,某种程度上就像美国的留学生:

刷盘子模式:指创业公司自有与主营业务不相关的现金流,如爆火之前的 Deepseek 主要靠量化交易获得收入,米哈游创始人蔡浩宇再创业等。

奖学金模式:因项目或技术团队的卓越表现,而获得全球顶级机构的融资,如 Manus,是所有基金都希望投中的目标。

集资模式:项目有"国家队"或是人民币基金的支持,通常与国家战略绑定,路径有所不同。

但客观来说,以上三者都不缺资金,资本呈现集中化。事实上,市场上绝大部分的钱,也都被少数项目拿走了。

优质标的稀少,出手也相对更难。市场上也因此延伸出两种投资风格:

一种是在热门赛道中"矮子里面拔将军"——重在参与。

另一种,则是坚持寻找真正有颠覆性、能够定义未来的项目,即使这意味着很长一段时间内不出手——上述投资人这样评价市场上的绝大多数项目,"只是把上一个时代的传统应用,用新 AI 技术再做一遍,就像在 ipad 上看报纸——可实际上,今日头条还没出现呢。"

而在这一轮应用投资热潮中,年轻一代格外积极。上一轮基模主要是基金管理人们的游戏,新一代投资人们在 AI 浪潮中也跃跃欲试,渴望投出代表作。"年轻一代的投资人们在机构里并非管理层,相比项目后续的发展和投资回报,他们更在意投出去了多少。"一位 FA 从业者说,"任何一个项目跑出来,能写在日后的履历里,就很值了。"

陈昱形容,当下的大模型时代就像是 10 年前的自动驾驶,"融资窗口往往就在那几个月内"——事后回看,最终留在牌桌上的数家企业,早在几个月内都集中亮相了。

七、硅谷风云:属于巨头的棋局

简短回顾一下,2025 的基础大模型之争,像是一场季度排位赛。

年初(Q1)被行业高度讨论的是 Deepseek,年中是 Anthropic,到了下半年,则变成 Gemini ——"变得太快,"一位二级市场分析师坦言,硅谷巨头大厂之间激烈的竞争与博弈,牵动着美股市场的变化,局面发展变幻莫测,"看不清(走势),二级市场都不知道怎么做明年的定价。"

年初,Deepseek 和 Qwen 的开源开启了大模型普惠时代,直接带动英伟达股价暴跌。5月,Claude 发布 Sonet 3.7 ,催生了大批 coding 项目以及 Agent 项目爆发,在很多人看来,这也是一次标志性的分化——一种具代表性的声音认为,"基模最终仍会是巨头大厂之间的 PK,创业公司要尽早聚焦,发展自己的差异化优势。"Claude 选择放弃 toC 和多模态,而选择聚焦 coding 与 Agentic ,是基于竞争局面的一种选择。

该如何看待硅谷几家头部巨厂之间的模型之争呢?

王者对决:OpenAI 与 谷歌

坐上王座的巅峰对决,目前仍然只属于 OpenAI 和 Google 之间:

作为先发者,OpenAI 始终保有先发优势,这家公司一边训练模型冲击 SOTA,一边全力加速产品化——一份二级市场流传的 OpenAI 算力消耗财务表上显示,这家公司仍然将更大比例的算力消耗在训练模型,而非推理,"这意味着,OpenAI 还在拼命训模型。"

但随着 GPT-5 发布(2025.8.8),现有 Transformer 架构下的 Scaling Law 的天花板初现:不止一位业内人士指出,GPT-4 开始有些"挤牙膏"的现象,"模型能力的提升幅度没有想象中大。"

而作为本年度大放异彩的谷歌,则实实在在地打出一场翻身仗:Gemini 2.5 Pro 横扫各大榜单,其 Elo 评分一度超越了包括 GPT-4o 和 Claude 3 Opus 在内的所有对手,是史上首次有模型同时制霸文本、视觉和 Web 开发三大榜单;8月底,Nano Banana 爆火出圈,而到了 Gemini 3 pro,不少业内人士认为其回答效果已经超过了 GPT-5.1——"Gemini 的多模态效果远比 GPT 稳定,而 memory 的部分早在 2.5 时期就优于 GPT-4了"。

10 月在硅谷,我与谷歌 Deeepmind 的研究员有过一次交流,他告诉我,作为最早喊出 AI First 的公司,看着自己发明的 Transformer 被 OpenAI 应用到极致(并成为硅谷权力的中心),谷歌的过去两年一度是煎熬的——"更早之前,谷歌的研究方向更发散和前沿。"这位研究员透露,自 2022 年底开始,谷歌开始了对 OpenAI 的全面追赶之路——代价是,暂缓其他前沿研究方向,举全公司上下之力高度聚焦于现有 LLM 方向。过程中,原 Google Brain 团队与 DeepMind 团队在合并(2023.4)后,也经历过一段磨合和阵痛期。

现在看来,谷歌胜利了吗?

这位研究员却摇摇头,"当下的胜利只是阶段性的成果。如果拉长时间来看,无法确定此刻所选择的"聚焦",究竟是彻底的胜利,还是牺牲了其他前沿方向的、更大的机会成本。"

但随着谷歌重回王座,带给 OpenAI 的压力陡增,现在,换 OpenAI 拉响红色警报了。

"谷歌今年这一通操作,会让 OpenAI 的压力非常大。"多位身居硅谷的 AI 从业者表示,谷歌凭借 TPU、云设施和AI 技术的深厚底蕴,其优势会更长尾。而表面看,当下,与谷歌对阵的是 OpenAI,其实,一名隐身的大玩家微软,一直坐在牌桌的暗处——通过投资 OpenAI ,微软成功转型为生态的"托举者",一系列 AI 布局的投资让它始终占据 AI 时代的核心位置。

但有趣的是,OpenAI 与微软之间已生嫌隙:"因为不想和 Azure(微软的云平台) 绑定,Sam 找来了新的盟友黄仁勋——两者一起搞了"星际之门",希望把 AI 的泡沫吹得更大"———在许多观察者看来,这标志着 OpenAI 的去微软化,"这是今年硅谷巨头的 AI 大战中,最可堪回味的一幕。"

英伟达的合作连横

另一位可被视作大 BOSS 的重要玩家英伟达,则延续一贯的合纵连横:左手与 OpenAI 达成深度战略合作,右手将马斯克的 AI 推理芯片团队 Groq 收入囊中。

2025 年 9 月 ,NVIDIA 给出向 OpenAI 分批投资高达1000 亿美元的承诺,前提是这些资金要用于部署 NVIDIA 的系统,而在这场深度同盟的战略中,还有一个重要的角色——"Oracle(甲骨文)作为小弟,成为了一个带资进组的超级基建承包商,为星际之门的三角关系完成了一个完美的闭环"。

根据这场三方的约定,这个闭环可以简单理解为:

NVIDIA投钱给OpenAI。

OpenAI用这笔钱向Oracle购买云服务。

Oracle转手就得把这些收入(甚至更多)交给NVIDIA,用来购买数以十万计的 GB200 等顶级芯片来搭建数据中心。

市场一度认为,只要成为 OpenAI 的基建商,Oracle 就会成为下一个英伟达——因为"星际之门",甲骨文的股价一度在 9 月一飞冲天,单日股价涨幅接近40%,创始人 Larry Ellison 甚至短暂超越马斯克成为世界首富——但不到一个季度,市场便发现,"大哥(OpenAI 和 Nvidia)的小弟不好当。"

2025 年底的财报显示,Oracle 的自由现金流开始转负——这是"星际之门"的代价。进入第四季度,Oracle 的股价遭遇了剧烈的回调,距最高点又跌去了近40%。一个更重要的信号是:对这些云公司来说,目前,云服务的收入抵不上租卡的成本。

而另一边,英伟达也正在花 200 亿收购 Groq 的 AI 芯片资产 LPU ——原因在于,市场需要一款基于大模型的原生芯片:Groq 的 LPU 宣称在运行大模型推理时,比 Nvidia 的 GPU 速度更快、成本更低,剑指千亿美元规模的 AI 推理市场。面对这样的威胁,英伟达选择直接以"钞能力"化解技术威胁,将对手转化为生态伙伴。

这也是2025,硅谷 AI 领域正在发生的故事:在 LLM 领域,市场叙事正在从单项的技术挑战,转向现有技术的生态团战。

这个趋势背后的另一面是:即便在 SOTA 的模型之中,差异化也在变小,各家优势领先的窗口正在快速缩短——比如上半年,Anthropic 在 coding 能力上曾大幅领先,但到了下半年,其他头部模型厂商也将将追平了: Groq 4、Gemini 等模型在 Benchmark 上追赶迅速,国内智谱也宣称在 coding 能力上能与之齐平。

马斯克与扎克伯格,仍在奋力争取上船

徘徊在王座周围的另两个玩家:马斯克和扎克伯格,正在全力争夺大模型决赛圈的门票。

X.AI 正通过情感陪伴平台、编程模型等打造产品矩阵,利用 Twitter 数据源和自身工程能力,积极进行着错位竞争。

Meta 呢。可能是当下最着急的大厂。

作为曾经的开源王者,自 LLAMA 3 之后,Meta 的风光不再——在 AI 基础模型的正面战场,Meta 目前几乎是全面溃败——多位在硅谷的观察者都表达了同一观点,目前的顶级模型圈中,Meta 已全面掉队。

"(基础模型)Meta 已经落后了,(至少)未来半年也一定会是落后的。"上述从业者认为。

面对落后局面,Meta 不惜 10 倍重金挖人,掀起硅谷 AI 人才争夺战——被认为是扎克伯格为了追赶 SOTA 所下的一剂猛药。但许多人认为,"这极可能破坏了原本内部共事的文化。"

在 Meta 内部,组织的专注度被认为不足,且存在整合困难等问题——PPIO 创始人姚欣今年在硅谷了解到的信息是,在 Leceun 离开 Meta 之前(2025.11),Meta 内部围绕 AI 同时并行着四个团队:1. 原 LLAMA 团队继续保留 2.另成立一个约40-50人团队,将整个闭源模型的预训练重做一遍 3. Lecun 带领研究团队继续搞前沿研究 4.新建一个围绕 AI 做基础设施的团队。

在姚欣看来,当下所有大厂的问题并非创新,而在组织。某种程度上,Meta 正在经历 2023-2024 时期的谷歌——"Google brain 和 Google Deep mind 组织上合并后,并不意味着战略和执行力也都合一了。"面对当下的变局,Meta 的上层组织,需要一位既有技术威望(能统一不同技术路线且能服众)、又有足够手腕(能应对组织之变)的一号位领袖。而当下,扎克伯格所选择的 Alexander Wang(原 Scale.ai 创始人)能否担此重任,仍是一个未知数。

一个客观事实是,二级市场,又开始出现做空 Meta 的力量。

在以上的背景下,2025 的最后几天,Meta 再次投掷下一枚科技圈炸弹——豪掷数十亿美元收购 Manus 。

这又是一次用资本,兑换技术时间和市场势能的竞速赛,也可能是一种重要的暗示:在模型与智能体之间,Meta 可能正在腾挪重心,向后者靠拢——毕竟,在自己并未训练模型的情况下,Manus 仍然实现了 SOTA 级别的智能体性能。

这意味着,即便没有造出最强的模型,如果打造出最强的智能体执行层,也有机会写下另一种剧本——在智能体这片全新的战场,Meta 已经挑中一片新的山头。

八、中国的开源之路

作为行业风向标式的年度报告,由知名 AI 投资人内森·贝纳克(Nathan Benaich)和伦敦的 AI 专项基金 Air Street Capital 联合发布的《State of AI Report 2025》中,首次将"中国AI体系"从"外围追赶者"提升为"平行竞争者"。报告写道,2025年,中国不再是追赶者—"它正在开源 AI 和商业化部署方面设定节奏"。

客观上,中国的大模型能力仍然无法引领世界 SOTA 水平,这是基础设施决定的——"美国公司们都在用 blackwell 了,明年甚至会用上 Rubin ,中国创业公司还只能用水货。"

落后便会走向开源,但开源,正带来全新的叙事。

在开源领域,以 DeepSeek、Kimi、Qwen 为代表的中国模型,在多项关键性能指标上实现了对曾经的开源王者 Meta(Llama系列)的全面反超。开源看中国,正在成为全球的共识。

中国模型梯队,也在 2025 年,完成了一场商业意义上的"超车"——凭借更高的模型性价比,中国模型正在成为全球的选择。以智谱为例,其 coding 能力在全球排名靠前,但定价仅为 Anthropic的 1/7,凭借这样的价格优势,智谱拿下不少国家主权大模型的订单。据姚欣介绍,"下半年,硅谷的创业公司都开始切换 Qwen、Deepseek 和 K2。"

九、技术的演进:从2023~2025,以及2026的预判

当时间行进到 2026,大模型浪潮已经足足演进了三年有余。

从时间线来看,大模型的能力分别经历了:2022年底预训练(Pre-training)的爆发,以及 2024 年底强化学习的爆发。

据了解,2025 年,看到 Deepseek 等中国模型通过后训练大幅降低了成本,海外模型公司正在加强对后训练(post-training)的投入,而中国模型也开始补课,为了追赶底层的泛化能力,大多仍以预训练为主,其中,阿里和 Deepseek 正在大力投入 post-training。(注:预训练聚焦习得知识与常识,学习语言的规律;后训练则聚焦指令追随、对话、推理以及对齐人类价值观。)

"目前还没有迹象能够证明后训练是未来,"一位从业者称,"大家都在探索下一个 Scaling law 在哪里。"

但 2025 年尾,围绕 Scaling Law 是否已经到达天花板的争论,硅谷产生了两种思潮。

以LeCun (Meta) 和 Ilya 为代表的"撞墙派"认为,单纯堆算力和数据(Pre-training)的边际效应正在递减,必须转换新的范式。

而以Hinton 和 Dario Amodei (Anthropic CEO)为代表的"Scaling Law 不死派",则认为,Scaling Law 仍然有效,只是形式会变,且正在转向 Inference-time Scaling (推理侧扩展)。比如,Anthropic 的路线图显示,通过改进数据质量和训练方法,模型在未来几年内依然会以指数级速度变强。Claude 3.7 的发布(混合推理)正是这一理念的体现。

围绕这个问题(Scaling Law 是否已逼近了天花板),我访谈了诸多行业从业者,其中一种声音可能具有很大的价值,在此分享给大家:

Scaling Law 正经历从"模型尺寸大小"的 scaling(已经开始放缓),过渡到"模型思考深度"的 scaling(正在发生),未来还将产生 agent 智能体之间协作所诞生的网络效应的 scaling——这是非常值得期待的。

只靠堆砌预训练数据和参数量 (Pre-training Scaling)的时代已经接近尾声。这意味着,低垂的果实快被摘完了。

且在大家抢夺低垂果实(疯狂怼算力和数据)的过程中,训练成本过高,代价可能过大。

另一个趋势是,AI 正在从数字世界,迈向物理世界。更多的商业公司试图在现实世界与数字世界间架设起高速公路:

一边,是在现实世界中添置更多传感器,以便从现实世界获取更多数据,也为现实世界搭建一个孪生的数字世界;便于更好地训练AI,让 AI 更懂用户,以便更具主动性。

另一边,让 AI 理解物理世界的运作规律,也成为重要的前沿研究方向,其中,世界模型为一个代表,从语言模型的"Next-token prediction",过渡到多模态和世界模型的"Next-state prediction"。

十、回归商业的现实

回顾大模型过去两年演进的进程,底层能力的跃迁虽然带来应用窗口,但行业仍处于萌芽而未爆发的早期。

大模型像巨兽一样吞噬着金钱和算力,但随着战线的拉长,所有的巨额投入都会蒙上更大的压力。

即便 OpenAI 被认为是全球最成功的 AI 公司之一,根据其 Q4 在一级市场流传的数据,OpenAI 2025 的年化收入达 200 亿美金——已属一骑绝尘,但今年仅算力租卡成本就高达 160 亿美金——这是令市场倒吸一口凉气的数字,其经营性利润亏损 119.2 亿美金。

这意味着,OpenAI 每赚到 1 美元,就净亏损 0.6 美元(比起 2024 年每赚 1 美元约亏损 1.35 美元,盈利情况有所好转)。相比之下,拥有算力和更成熟基建的谷歌和 Meta,利润则好看很多——这是一个对创业公司的警告。

乐观者认为,目前AI 技术成本虽高,但 TOKEN 性价比却在以十倍速提升,预计 2026,很多场景就能充分应用。

但除了模型训练成本外,推理成本也在暴涨(也就是前文所述的,推理侧扩展的 scaling)——这将是全行业的趋势,当模型进入推理时代,会消耗比"训练"更海量的算力——这意味着大模型技术的成本会更大,但,新时代 AI 的商业模式却仍在探索。

注:除了订阅制、广告等传统模式外,RaaS(Result as a Service,按结果计费)和按 token 计费,成为新的探索路径。

PPIO创始人姚欣指出,2025,模型能力的提升其实有限,但 agent 的基础设施正在丰富,未来,可能通过并行开启多个 agent 来解决问题(即前文所述 agent 网络效应的 scaling),突破智能天花板。不过,这种方式成本高昂,对底层硬件芯片也提出了挑战。

在大模型的竞争叙事中,底层算力和基建的自控权,仍然是决定性因素极强的一组牌。

美国已经开始大规模用债券、私募债等形式来支持算力资产(数百亿美元级别),这些举动的共同目标,就是把算力资产化。

国内的算力供给,则面临另一种现实瓶颈:由于政策叠加,进口算力买不到,且不允许买。市场关注的重点从"谁的卡更多",转向了"算力可得性"。自建算力开始成为一种趋势:越来越多大企业意识到,若芯片与底层不自控,模型训练与推理的优化空间则受限。据了解,蚂蚁和米哈游,都在自建算力。当然,有条件自建算力的企业,屈指可数。

这些趋势共同指向:从底层到架构,再到模型,仍然是属于巨头之间的游戏。也因此,中国的云+基模层面,目前看来只剩下两家选手的对决:阿里(Qwen)与字节(豆包),其中,阿里的超算集群仍具有稀缺性。

据业内人士交流,中国基模的创业公司们,普遍面临着研发算力成本重,与现金紧张的问题,原因在于,大模型的融资中,算力折现和 PR 口径放大是普遍存在的现象,创业公司的名义融资金额与实际到账的金额存在差距。

对于这些创业公司而言,追求模应一体,走产品化的路,成为一种现实主义的选择。

"我们现在看的是 model orchestration(模型编排),"Minimax 天使投资人陈昱说,模型编排是指,协调多个模型工作,以完成复杂的任务或实现更高效经济的更优解。从这个层面出发,创业公司的优势就能显现。

而卷 benchmark 也不再有意义,"每一家都会宣称是最厉害的模型,但面对应用与 Agent ,用户会用脚投票。"增长与留存,仍然是检验大模型产品的金线。一种声音认为,AI 应用的发展将会经历模型主导、模型与应用分离,以及产业结合三个阶段。

以上,是漫谈 Light the Star 在 2025 所获得的行业观察与趋势判断。与大模型一样,无法保证绝对准确,但求创造碰撞与启发。

本文来自微信公众号:卫诗婕-漫谈Light the Star,作者:卫诗婕

相关标签
虎嗅APP

虎嗅APP

有视角的商业资讯与交流平台

订阅

觉得文章不错,微信扫描分享好友

扫码分享