文 | AI 唱反调
5 月 14 日上午 9 点 30 分,纳斯达克的电子盘上,CBRS 的开盘价第一个跳了出来:350 美元。
这是 Cerebras Systems 上市发行价 185 美元的 1.89 倍,是 3 个月前 Tiger Global 领投 H 轮融资时 230 亿美元估值的 4 倍,也是 18 个月前阿联酋投资方 G42 持股引爆美国外资审查、招股书被迫撤回时账面估值 40 亿美元的 23 倍。
盘中股价一度冲到 386 美元,收盘报 311.07 美元,全稀释市值约 950 亿美元,单日涨幅 68.2%——成为继 2019 年 Uber 之后美国规模最大的科技公司上市事件(CNBC,2026/5/14)。

同一时刻,英伟达总部里,似乎没有人召集应急会议。
第二天 5 月 15 日,CBRS 高开后一路走低,盘中下探 275 美元,收盘约 280 美元,单日跌 10%(CNBC,2026/5/15)。两个交易日的振幅是 109%,从首日收盘的回吐幅度是 28%。市值 36 小时内从 950 亿美元跌回 850 亿美元区间。
媒体的叙事一边倒地从 "AI 上市潮复苏 " 切换到 "AI 估值泡沫 "。但真正值得追问的不是 Cerebras 的价格,而是英伟达那边为什么没有动静—— Cerebras 的旗舰芯片,第三方测试里推理 Llama 3 70B 模型比英伟达旗舰 GPU B200 快 21 倍(Cerebras 官方 vs NextBigFuture 复测,2026),Feldman 的履历漂亮、产品参数惊人。
讲真,按 "AI 时代的硬件颠覆 " 剧本,老黄应该至少召集一次内部会议。
但他没有。
他还在北京吃,吃得不亦乐乎。

Cerebras 卖的是 " 算力的奇观 "。
英伟达的 B200 是把多颗芯片用高速互连技术拼起来,每颗芯片 2080 亿个晶体管。Cerebras 反其道——把整张 12 英寸晶圆当成一颗芯片用。
一张晶圆通常会被切成几百颗 GPU,Cerebras 不切,整张做成单芯片,叫做 " 晶圆级芯片 "(Wafer Scale Engine,简称 WSE)。
第三代 WSE-3 单片集成 4 万亿个晶体管、90 万个计算核心、44GB 片上高速缓存、5 纳米制程,是地球上现存最大的单芯片。
这两条技术路线的差距,集中在内存带宽这一个核心指标上:

Cerebras 直接绕开了这道坎——它把整个模型权重塞进 44GB 的片上缓存,根本不需要搬运,计算核心就在权重旁边。所以在跑 70B 到 405B 量级的模型时,单台 Cerebras 系统的吞吐量比一台装 8 块英伟达 B200 的服务器还高。
这是技术意义上的奇观。Feldman 把 11 年前在 SeaMicro 做 " 高密度微型服务器 " 的逻辑(同一套人马)放大到了 AI 芯片—— SeaMicro 当年以 3.34 亿美元卖给 AMD 时,AMD 给的判断是 " 微型服务器路线赌错了 ",5 年后产品线被关停。Feldman 这次把 " 集成度极限 " 的玩法换了个赛道做了一遍。
但这里有个关键前提藏在 Cerebras 自家白皮书最末页的但书里:
" 如果跑的模型装不进单张晶圆,性能会远远差于带高速互连的英伟达 B200 和 B300 系统。"(NextBigFuture 复测原文)
总的来说,模型必须能装进一张晶圆才能跑得快。44GB 片上缓存听起来很大,但 GPT-4 量级(1.8 万亿参数)、Llama 3.1-405B、Grok 3 这种参数规模的前沿模型,要么需要切分到多张晶圆上(损失了 " 全在片上 " 的优势)、要么需要走晶圆和晶圆之间的链路(损失了 " 省掉外部显存搬运 " 的优势)。
Cerebras 的 21 倍速度优势成立的工作负载,集中在 70B 到 405B 的中型模型推理 + 科学超算仿真——这是个真实的市场,但不是英伟达在的那个市场。
英伟达 2026 财年第四季度单季的数据中心收入是 623 亿美元(计算业务 513 亿 + 网络业务 110 亿),同比增长 58%。Cerebras 2025 年全年总营收是 5.1 亿美元(招股书,Tom's Hardware 转引)。两个数字的倍数关系是 122 倍——而且英伟达这 623 亿里,没有任何一个工作负载是 Cerebras 能完整替代的:
训练:超大模型训练需要数千卡互联,Cerebras 的晶圆间链路成熟度远远不够;
推理:Cerebras 只能打中型模型,前沿模型(GPT-5、Claude Opus 4.7、Gemini 3.1 Ultra)跑不进 44GB;
多模态 / 视频生成:需要高速互连配合大显存;
客户多样性:B200 装在亚马逊、微软、谷歌、甲骨文四朵公有云里,每家自己的工作负载都不一样。
Cerebras 在中型模型推理这块确实赢了。问题是这块占英伟达数据中心收入的 5%-8% ——老黄一个季度的零头。
阿布扎比的房间
Cerebras 的招股书中藏着一组比技术更扎眼的数字:

更要命的是 MBZUAI 一家占应收账款 77.9%。换句话说,Cerebras 不仅在赚阿联酋的钱,连账期都押在阿联酋身上。
美国外资投资委员会 2024 年 9 月之所以让 Cerebras 撤回第一版招股书,就是因为 G42 持有 Cerebras 投票权股份,触发了 " 国家安全审查 "。
直到 G42 把持股改为非投票权(2025 年 10 月),Cerebras 才能重新进入上市流程。Cerebras 的客户和股东曾经是同一家阿布扎比公司——这种结构在传统二级市场会被打 30%-40% 估值折扣。
英伟达的客户结构是另一个极端:2024-2025 年它的数据中心收入里没有任何单一客户超过 13%(年报披露),微软、Meta、亚马逊、谷歌、甲骨文、特斯拉、xAI、Anthropic(5 月 6 日刚把 Anthropic 加进来,整租了 Musk 在田纳西州孟菲斯建的算力中心)排排坐。
Blackwell GPU 的在手订单是 360 万台,售罄到 2026 年中(Yahoo Finance,2026)。老黄上一次电话会议给出的判断是:Blackwell + Rubin 两个世代累计收入将达到 1 万亿美元(2025-2027 三年)。
把 Cerebras 的 86% 阿联酋集中度和英伟达 " 全球公有云 + 全球前沿实验室 " 的客户矩阵放在一起,你就懂老黄为什么不开会:Cerebras 在跑的赛道,英伟达不仅没在跑,而且不打算去跑。
中东主权基金的 AI 算力采购,2024-2026 年是一个真实的需求池(沙特公共投资基金 + 阿布扎比穆巴达拉 + G42 加起来公开承诺的 AI 基础设施投入超过 5000 亿美元),但这是个由政治订单驱动的市场,不是技术性能驱动的市场。MBZUAI 选 Cerebras 不是因为速度快 21 倍,是因为 G42 是 Cerebras 股东、Cerebras 是 G42 的国家级 AI 工程合作伙伴。这种关系一旦因为地缘政治翻车——美国二次审查、Trump 中东政策转向、阿联酋倒向中国 AI 供应链——Cerebras 86% 的营收会在一个季度内蒸发。
而英伟达没有这个风险。它的客户分散度足以吸收任何单一客户、单一地区、单一应用的崩溃。
CUDA 的院墙
Cerebras 撼不动英伟达的最后一道墙,叫 CUDA。
CUDA 是英伟达 2007 年开始推的 GPU 编程平台——所有用 GPU 跑深度学习的代码,必须先用 CUDA 写、用 CUDA 编译、调用 CUDA 的算子库。英伟达过去 18 年的真正护城河,从来不是 GPU 性能,是这套 CUDA 软件生态。

Cerebras 比 AMD 更难,因为它根本不是 GPU 架构。晶圆级芯片用的是 " 数据流 " 架构,不能直接跑 CUDA 代码,必须用 Cerebras 自家的开发工具。一个客户从英伟达迁到 Cerebras 不是写几个接口适配,是要把整套训练和推理流程重写一遍。
MBZUAI 愿意这么做,是因为它本来就是 Cerebras 的合作伙伴,没有历史包袱。但任何一家已经在英伟达上跑了 2 年模型的公司——微软、Meta、Anthropic、xAI、OpenAI ——都不会做这个迁移。
老黄过去几次财报会议反复强调一个观点:" 英伟达是一家软件公司,顺便做芯片。"("NVIDIA is a software company that happens to build chips.")从财务结构上看这话是真的:英伟达数据中心收入里网络业务 + 软件业务的占比正在快速上升,2026 财年第四季度网络业务单项收入 110 亿美元,同比 +263% ——这部分跟 GPU 算力没关系,是生态税。
Cerebras 卖的是快 21 倍的飞机,英伟达卖的是机场 + 油料 + 维修 + 飞行员培训 + 空中交通管制。当一家航空公司可以选 " 快 21 倍但只有一个机场可以起降 " 或者 " 普通速度但全球任意机场 " 时,它会选哪个,老黄心里跟明镜似的。
所以老黄为什么不慌这件事,到这里就讲完了。
赛道不重合—— Cerebras 赢的是中型模型推理和超算仿真,占英伟达数据中心收入 5%-8%,老黄的训练、多模态、前沿模型推理三大主业,Cerebras 进不去。客户不重合—— Cerebras 86% 营收押在阿布扎比一个家族手里,英伟达把客户分散到 4 大公有云 + 8 家前沿实验室 + 全球整机厂。生态不重合—— 300 万 CUDA 开发者构成的肌肉记忆,从来不是 " 快 21 倍的硬件 " 能跨过去的。
话说回来,Cerebras 上市这件事,本身对英伟达不是威胁,对排队上市的 AI 公司才是预警。
Cerebras 招股书里那个 24%(G42)+ 62%(MBZUAI)的客户集中度结构,是 OpenAI / Anthropic 在做路演时一定会被问到的镜像问题—— OpenAI 的 ChatGPT 个人订阅 + 接口收入里,有多少来自微软 Azure 的转售?
Anthropic 季度增长 80 倍里,有多少来自普华永道、摩根大通这几家关联客户?SpaceX 旗下的 xAI 把 Grok 推给 Apollo 资本和摩根士丹利内部试用,最后的付费转化率有多少?
二级市场用 Cerebras 上市次日跌 10% 这件事,给一级市场写了一张警告条:950 亿美元估值的 AI 公司,没有清晰的非关联客户结构 + 不能跨越英伟达生态壁垒的话,二级市场只给 24 小时蜜月期。
更有意思的是,站在 Cerebras 对面冷眼旁观的不只是老黄。Anthropic 在 5 月 6 日宣布整租 Musk 在孟菲斯建的 Colossus 1 算力中心——那个数据中心装的不是 Cerebras 的晶圆级芯片,是英伟达的 H100 + B200。
Anthropic 选择把 Claude Code 的算力扩张押在英伟达上,而不是 Cerebras。这是 5 月这一周对 Cerebras 故事最沉默也最致命的一票反对。
讲真,CBRS 周一 5 月 18 日开盘还能不能撑住 280 美元,已经是个次要问题。Feldman 11 年前在 SeaMicro 学过一遍的事——做出最快的硬件,不等于做出最赚钱的硬件——这次会不会再来一遍,没人替他说话。
老黄连头都没回。这场比赛的胜负不在跑道上,在售票处——这一点,他比谁都清楚。