
每一次新品发布会,PPT 上反复强调:晶体管数量又翻了多少倍、算力飙升了多少。所有人都在为这颗 " 大脑 " 的聪明程度欢呼。
但仔细翻开这笔算力账单,你会发现一个值得警惕的错位:全行业的总开销翻了一倍多,但给 " 大脑 " 的预算占比却几乎没有增长。
根据知名研究机构 Epoch AI 的最新拆解数据,从 2024 年初到 2025 年底,全球 AI 芯片的总组件支出从 220 亿美元激增至 520 亿美元。然而,代表着最顶尖制造工艺的 " 计算大脑 "(主逻辑裸片),其成本占比却始终停留在 13% 至 14%。

数据显示,高带宽内存(HBM)在 AI 芯片组件中的成本占比,已经从 52% 一路攀升至 63%。在这 300 亿美元的总支出增量里,单单是 HBM 这一项,就贡献了约 200 亿美元。

因为大众只看到了云端 AI 芯片的算力狂欢,却不知道这场看似高大上的算力竞赛,已经变成了一场深刻的产业重构。它不仅在重塑全球半导体资金的流向,甚至直接导致了我们身边的廉价智能手机,正在大规模萎缩。
大脑越来越便宜," 记忆 " 为何成了刺客?
大众往往以为,眼下的 AI 争夺战依然停留在算法、架构等 " 脑力 " 层面的比拼。但实际上,真正的战争早已悄然演变成了一场客观的、物理的、生产线上的肉搏战。
要搞懂这个错位,我们得先降维通俗地弄明白:AI 芯片到底是个什么构造?它和以前的电脑芯片有啥区别?
在传统的通用芯片(CPU)时代,所有的架构设计都在追求 " 单兵作战能力 "。你可以把 CPU 想象成一位绝顶聪明的顶级学者。为了不让他浪费时间去远处的图书馆(主内存)找资料,工程师在学者的手边塞满了各种私人书架(缓存),甚至允许他 " 乱序执行 ",随时找活干,绝对不让他闲着。
但 AI 大模型根本不需要这种复杂的逻辑判断,它要的是简单粗暴的暴力算术矩阵。
于是,GPU 和 TPU 等 AI 加速芯片上场了。它们不再是单打独斗的学者,而是数万名同时做加减乘除的流水线工人。这些芯片同样是从硅晶圆(Wafer)上光刻下来的,但内部结构全是大规模并行的计算核心。
瓶颈随之出现:这群工人算得实在太快了!
打个比方,现在的各大 AI 芯片就像是一个班级里的尖子生,大家的计算能力都已经极其强大。数据表明,过去 20 年里,硬件的峰值计算能力飙升了 60,000 倍,但内存容量仅仅提升了 100 倍,互连带宽更是只提升了 30 倍。既然大家的做题速度(计算逻辑)都差不多且难以拉开巨大差距,比拼的重点自然就变成了最现实的物理条件:谁能搞到最高规格的高带宽内存(HBM),以及谁能在纳米级的物理流水线上把这些数据最快地 " 喂 " 给大脑。
由于计算性能的提升速度,远远超过了内存带宽的改善速度,搬运原材料(数据)的通道彻底瘫痪了。这就是困扰了计算机界几十年的物理学幽灵—— " 内存墙 "(Memory Wall)。
通道不够宽怎么办?行业祭出了一种技术难度极高、成本也极高的解法:高带宽内存(HBM)。
既然平铺的通道不够宽,那就把 DRAM 存储芯片像盖摩天大楼一样垂直堆叠起来,并在微观层面上打穿无数孔洞与计算核心直接相连,实现超宽的数据通道。
但这玩意儿,大量消耗底层晶圆产能。生产 1GB 的 HBM,需要吃掉相当于普通 DRAM 三倍以上的晶圆产能。
利润分化与产业链重塑
当底层晶圆变成了零和博弈,整个产业链的资金流向就彻底变了。
原因很简单:普通商品内存(就是你买电脑和手机里的内存)的毛利率常年在 20% 至 30% 区间,而 HBM 的毛利率则达到 70% 以上。
面对这种级别的利润差异,存储三巨头(美光、SK 海力士、三星)的动作果断而激进。
老牌存储大厂美光(Micron)在 2025 年 12 月发布了一份引发广泛关注的决定,宣告其运营了 29 年的消费级品牌 Crucial(英睿达)即将终结。随后在 2026 年 2 月,美光正式停止了消费端的所有发货,将所有空出来的产能全面转向利润更高、更具定价权的 AI 和企业级数据中心市场。

现实代价:消失的廉价手机
巨头在云端数钱,终端手机厂商却面临直接冲击。
晶圆都被抽走去造 AI 用的 HBM 了,普通手机用的标准内存自然面临断崖式的缺货。短短一年间,老一代的 LPDDR4 价格大幅上涨了 250%,LPDDR5 也上涨了 220%。

结果就是,低端智能机在商业上已难以为继。分析师指出,低于 100 美元的智能手机已经 " 永久性不再经济 "。原本卖 50 美元的手机,现在因为内存太贵,被迫涨到 120 美元以上。
占据非洲近半壁江山的手机品牌传音,2025 年净利润暴跌 54%,被迫砍掉 40% 的出货目标。Oppo 和 Vivo 也分别削减了超 20% 和近 15% 的预期。在印度,100 美元以下的手机市场在 2026 年一季度同比萎缩了 59%。
硅谷扇动了一下名为 AI 的翅膀,使得亚非拉低价位市场用户的数字接入门槛大幅抬高。
下半场:封装瓶颈与 AI 创投的 " 破局 " 之路
内存吃掉了 AI 芯片 63% 的成本,但这还不是唯一的门槛。
再贵的 HBM 和逻辑计算芯片,也必须通过台积电的 CoWoS 等先进封装工艺,极其精密地缝合在微缩底板上。这道工序目前是真正的物理卡脖子环节。台积电 CEO 魏哲家直言,CoWoS 产能极度吃紧,到 2026 年都已完全售罄。英伟达甚至提前包揽了超过 60% 的产能。
那么,未来的商机和趋势究竟在哪?
随着行业从早期的 " 模型训练 " 走向大规模的 "AI 代理(Agentic AI)" 推理,模型需要保持长时间的记忆和极长的上下文,这让 " 内存墙 " 的压力成倍放大。为了破局,行业分化出了两条路:
第一条路,是英伟达的 " 暴力加码 "。
2026 年投产的新一代 Rubin 架构,就是为极致吞吐量而设计的。单颗 Rubin GPU 不仅塞进了 3360 亿个晶体管(是上一代的 1.6 倍),更首发搭载了容量高达 288GB 的 HBM4 内存,带宽达到惊人的 22 TB/s。而美光的 HBM4 目前正以两倍于上一代的速度快速爬坡,专供 Rubin。英伟达的目标是用极高的内存带宽,把推理成本打下来。
第二条路,是初创公司的 " 从架构底层破局 "。
既然逻辑计算本身只占 13% 的成本,那只要能尽量绕开昂贵的 HBM,就能重塑整个算力市场的利益分配。2026 年,初创公司 MatX 拿到了 5 亿美元 B 轮巨额融资。他们设计了一款基于 " 可拆分脉动阵列 " 的专用芯片,利用 SRAM(静态随机存取存储器)的超低延迟特性来直接搞定长文本推理。欧洲初创公司 Semidynamics 也刚刚在台积电 3nm 工艺上流片,主攻减少数据移动的 AI 推理新架构。
而在终端租赁市场,算力正在逐渐褪去神秘且昂贵的光环。
华尔街已经推出了追踪 GPU 租赁价格的 " 硅数据指数 "(Silicon Data Indices),像炒大豆、炒原油一样每天盯盘算力的现货价格。在 2026 年的现货平台上,曾经一卡难求的 H100,其小时租赁底价已经被 Thunder Compute 等平台打到了惊人的 1.38 美元 / 小时。
算力大宗商品化的时代已加速到来。在这个剧烈的周期波动中,真正稀缺且昂贵的,不再是单纯的 " 大脑计算能力 ",而是数据的流转、存储的吞吐,以及纳米级基板上的物理封装手艺。看懂这张被内存主导的错位账单,才是真正摸清巨头底牌的开始。(本文首发钛媒体 APP,作者 | 硅谷 Tech_news,编辑 | 林深)