关于ZAKER Skills 合作
钛媒体 22分钟前

英特尔与英伟达互抢地盘,乱了,都乱了

文 | 半导体产业纵横

这一周,台北国际电脑展 COMPUTEX 可谓精彩。

前一天,黄仁勋站在 GTC 大会的舞台上,出人意料的接连发布 Vare CPU、RTX Spark,宣布 " 这是 40 年来,PC 产品线首次全面重新设计。" 台下坐着微软、戴尔、惠普、联想、华硕的全球高管,他们将在今年秋季推出搭载英伟达 RTX Spark 芯片的笔记本电脑。

后一天,英特尔反手杀入英伟达的腹地,发布:数据中心 CPU 至强 6+,288 核,18A 制程;Crescent Island 数据中心 GPU,160GB 显存,风冷部署。

作为全球 GPU 霸主,英伟达杀入了英特尔的主场:CPU 和 PC;而英特尔这个 CPU 老牌王者,也盯上了英伟达的 AI 算力地盘。

AMD 倒是乐得坐山观虎斗。AMD 客户端业务高级副总裁拉胡尔 · 蒂库(Rahul Tikoo)表示欢迎竞争。不过,之前 AMD 一直宣称自己是全球唯一一家同时具备高性能 CPU 和高性能 GPU 研发能力的半导体公司。现在好了,全球唯三。

这一周的数据中心,算是彻底乱起来了。如果只是把这场交锋解读为产品矩阵的完善或技术路线的竞争,那就太浅了。更关键的核心是:为什么两大巨头,双向奔赴彼此的主场?

复仇者联盟,归来

历史上,英伟达试图做过 PC 处理器。

2011 年,英伟达在 CES 上宣布 Project Denver,这是老黄首次公开涉足 PC 处理器领域。2012 年,微软推出 Surface RT,搭载英伟达 Tegra 3 芯片。2013 年 Surface 2 沿用 Tegra 4。这两款设备是英伟达 ARM SOC 首次进入 Windows PC 的尝试。但因为 Windows RT 生态不成熟、应用兼容性差,英伟达最终铩羽而归。

这次推出 RTX Spark 是在一个很特殊的历史节点上。

三个理由。

第一,GPU 市场的到顶了。现在英伟达在 GPU 市场的占有率超过 80%,在 AI 训练芯片市场超过 90%,数字是非常强势,但天花板肉眼可见,英伟达在这个赛道上已经没有太多增长空间。欲登更高山,必须先下山。

第二,AI PC 是全新的入口。传统 PC 的逻辑是:CPU 是核心,GPU 是配角。所有软件为 x86 设计,所有计算经过 CPU 调度。英特尔是这个生态的定义者,英伟达最多是个 " 增强显卡 " 的供应商。但是 AI PC 不一样,现在 AI PC 成为了 AI 本地运行载体,这时候 GPU 的并行计算能力变的关键。英伟达既掌握着 CUDA 生态,又掌握着全球最强的 GPU 技术,还掌握着 AI 开发者最熟悉的工具链。在 AI PC 这个新赛道上,英伟达有天然的起点优势,他不需要从头建立生态,只需要把现有的 AI 能力封装成 PC 可以使用的形态。

第三,苹果的前车之鉴。苹果用 M 系列芯片证明了:当你同时掌握硬件和软件的定义权,你就能打造出竞争对手无法复制的体验。英伟达做的同样是这个模式,桌面、笔记本、工作站三件套,全部 100% Windows 兼容、100% CUDA、100% Tensor Core。按照英伟达的说法,微软会为此修改 Windows 任务栏用户界面。上百家软件供应商和游戏开发商同意开发 Arm 移植版。Adobe 正在 " 从底层重构 "Photoshop 和 Premiere 来适配 RTX Spark。

这一次,黄仁勋显然是有备而来,组合了一个 " 复仇者联盟 ":微软、联发科、ARM。联发科,长期主导入门级消费芯片市场,高端始终难以突破,PC 芯片领域一直徘徊在中低端梯队。Arm,在移动端称王,但是 PC 市场被 X86 垄断,高通也和微软带头做 Windows on Arm,但 Windows 用户对 Arm PC 一直有顾虑。微软,Copilot+ PC 已经把 AI 电脑的概念打了出来,但目前很多 AI PC 体验仍然偏轻,云端 Copilot 到本地 Copilot 之间缺一座桥。

英伟达的加入,刚好补上了这块短板。AI 性能高达 1 PetaFLOP,128GB 统一内存,可本地运行 120 亿参数、上下文长度达 100 万 token 的大语言模型。

1 PetaFLOP 是什么概念?英伟达 2020 年卖的数据中心 GPU A100 的 FP16 峰值是 312 TFLOPS。一颗笔记本芯片,四年后翻了不止三倍。这对微软来说是 Windows AI PC 体验质变的机会,对 ARM 是打穿 x86 垄断的机会,对联发科是切入高端 PC 市场的机会。四方的利益,在 AI PC 上形成了交集。但很微妙的是,在数据中心市场,英伟达最大的客户是:Azure、AWS、Google Cloud。英伟达是 " 卖铲人 ",把产品卖给所有人。RTX Spark 的核心卖点是本地 AI 算力,1 PetaFLOP 的 AI 推理能力,本地跑模型、本地跑 Agent。如果本地算力足够强,用户为什么还要上云?为什么还要 Azure?黄仁勋在帮微软站台的同时,其实也在松动微软云业务的地基。这就是今天科技行业悖论的地方,所有人都是合作伙伴,所有人也都是潜在对手。

再来看英伟达的 Vare CPU。英伟达为什么要花费巨大资源自研数据中心 CPU?黄仁勋在发布 Vera CPU 时说了一句话,被业界反复引用:"CPU 不再仅仅是支持模型运行;它正在驱动模型。" 这句话背后,是英伟达对 AI 时代计算架构的重新理解。

英伟达做 Vera CPU,不是为了抢英特尔传统 CPU 的市场,而是不能让 CPU 成为自己 GPU 的绊脚石。在智能体 AI 工作负载中,CPU 需要频繁调度 GPU 资源、处理超长上下文、管理海量的工具调用。这些任务的延迟要求是纳秒级的,如果 CPU 响应慢,整个系统的吞吐量都会下降。现在的瓶颈在于:任务编排、工具调用、超长上下文管理、海量状态维护,这些全都压在 CPU 上,PU 集群价值数百亿美元,但如果 CPU 跟不上调度节奏,这些 GPU 会因为等待任务分配而大量闲置。

算力越强,浪费越多。所以,Vera CPU 定位很清晰:不是 x86 的替代品,而是 " 为 Agent 制造的 CPU"。我们来看 Vare CPU 的设计重点:第一,极致带宽,1.2TB/s 内存带宽,比高端 x86 CPU 高出 2-3 倍;第二,超低延迟,通过 NVLink 与 GPU 直接互联,避免 PCIe 瓶颈;第三,高能效,LPDDR5X 内存,功耗比传统 DDR5 低 50%。

英伟达不会让自己的算力帝国被一颗 CPU 卡住。老黄的意思很明显:未来的数据中心建立在 " 英伟达 inside" 的基础上,而不是 "x86 inside" 的基础上。Vera CPU 目前已进入全面量产阶段,预计今年第三季度正式投产。OpenAI、Anthropic、SpaceX 已确认成为首批部署客户。英伟达预计,本财年 CPU 营收将达到 200 亿美元,这意味着英伟达将在 CPU 市场与 AMD、英特尔形成正面竞争。

数据中心,才是主战场

陈立武接英特尔 CEO 的时候,这家公司正陷在泥潭里。制程工艺被台积电甩开,股价低迷,核心员工流失。他需要做的事情很多,但他必须先回答一个问题:英特尔的核心价值到底是什么?陈立武在 COMPUTEX 上说了一个核心的观点:CPU(尤其是 x86 架构 CPU)是整个算力体系的基石。英特尔将在四个核心领域创造万亿美元的价值,分别是,个人电脑、边缘市场和代理式 AI、数据中心、新兴的智能中心。

这次,英特尔亮相的数据中心 CPU 和 GPU,打的是是英伟达的腹地——数据中心。

首先来看英特尔的至强 6+。CPU 本来就是英特尔的主场,几十年的 x86 生态、数十年的客户关系、无数企业级软件为至强优化,这是 AMD 和英伟达都难以复制的优势。

至强 6+采用 288 核,18A 制程,超大规模并行设计。配备最高 576MB 三级缓存,面向云原生、AgenticAI 和网络密集型等负载需求,可以提供更高的能效和更稳定的持续性能。单个液冷机架占用 32U 计算空间,就能提供 36864 个核心;机架功耗仅约 100kW,足以承载高密度智能体部署。与过往同等性能的服务器机架相比,功耗已经大幅降低。据新华三相关工作人员介绍,新华三与英特尔合作,推出了 UniServer R6900 G7 AI 训推一体化方案,由于至强 6+ 的多核优势,方案采用纯 CPU 部署 35B 参数大语言模型,能够实现价格仅为常规 GPU 方案的一半。在至强 6+ 之后,英特尔又亮出了 Crescent Island。具体来看,Crescent Island 基于 Xe3P 微架构,属于 Xe 系列高性能方向,采用 LPDDR5X 显存(不是 HBM),最高达到 480GB,同时 350W 风冷部署(不是液冷),主打能效比。英特尔的核心策略是:避开英伟达在高端训练市场的绝对优势,选择推理赛道作为突破口。

这是英特尔明智的地方,不直接做高端训练 GPU 与英伟达 GB300 正面竞争。

为什么?答案很简单:挑战太大。

英伟达有完整的 GPU 产品线,包括:H100、H200 和 H20,以及 Blackwell 架构的 GB200 和 GB300。英伟达的优势建立在三个基础上:第一,CUDA 生态。所有训练框架(PyTorch、TensorFlow、JAX)和推理框架(TensorRT、vLLM、TGI)都针对英伟达 GPU 做了深度优化。第二,高带宽显存。GB300 的 HBM3e 显存带宽达 8TB/s,GB300 集群可支撑万亿参数大模型的实时训练。第三,软件栈完整性。从驱动到框架到部署工具,英伟达提供一站式解决方案。

高端训练 GPU 的核心竞争要素从来不是硬件参数,而是软件生态。这种生态壁垒,不是英特尔花几年时间就能建立的。Gaudi 系列的表现已经证明了这一点。尽管硬件规格不差,但软件生态的短板让 Gaudi 在市场上始终未能形成气候。

这次英特尔的战略有点类似:农村包围城市。英特尔选择推理赛道的原因很很明显,训练市场的窗口已经关闭了。英伟达和 AMD 建立了足够深的护城河,但是推理市场随着大模型落地带来了海量的中小规模推理需求,这些需求对成本敏感、对部署简便性要求高,恰好是 Crescent Island 的用武之地。我们回头来看 Crescent Island 的关键词:480GB LPDDR5X 显存、350W 热设计功耗、风冷部署。解决的正是企业客户最关心的问题:功耗、散热、部署成本。

如果说,英伟达的推理 GPU 是高端市场的低成本方案,用性能收取相对合理的价格。那么,英特尔的 Crescent Island 是低端市场的高端方案。用相对低的功耗和部署成本,提供 " 足够用 " 的 AI 推理能力。英特尔赌的是当推理成为 AI 应用的主流场景时,今天积累的市场份额将转化为更大的话语权。

AMD 怎么办?

在本周的这场交锋里,AMD 没有出现,但是 AMD 也在暗中经历价值重估。

2026 年第一季度,AMD 交出了一份令人惊艳的财报:营收 103 亿美元,同比增长 38%,净利润 13.8 亿美元,同比增长 95%。数据中心业务营收 58 亿美元,同比暴增 57%,占公司总营收的比例已上升至约 57%。

从 2025 年 Q1 到 2026 年 Q1,AMD 数据中心业务走过了一条教科书式的加速曲线:37 亿美元→ 43 亿美元→ 58 亿美元。AMD 数据中心业务的增长由两条腿驱动:EPYC 服务器 CPU 和 Instinct GPU 加速卡。两者在 2025 至 2026 年的 AI 基础设施投资潮中均获得了强劲的市场需求。Oracle Cloud、谷歌云相继宣布采用第五代 EPYC 处理器构建新一代实例;Instinct GPU 方面,MI300 系列在 AI 推理和训练市场中持续扩大客户基础。AMD 在 2026 年最具战略意义的产品动作,是一个名为 Helios 的全机柜 AI 系统。这套系统被定位为直接对标英伟达 Grace Blackwell 和 Vera Rubin 系统的竞品——后者的整机柜售价超过 300 万美元。

Lisa Su 在财报电话会上说了一句超出常规财报措辞尺度的话:"AMD 有信心 2027 年实现数据中心人工智能业务年营收数百亿美元。"

这是一个相当激进的承诺。但如果 AMD 能够将 Helios 系统成功推向市场,并在 ROCm 软件生态上持续缩小与 CUDA 的差距,这个承诺并非不可能实现。

算力新秩序的黎明

2026 年的数据中心芯片市场,呈现出一幅前所未有的图景。

英伟达从 GPU 霸主向系统级算力平台供应商转型,携 RTX Spark 和 Vera CPU 双线进攻。英特尔以至强 6+ 和 Crescent Island 反击,同时在制程工艺和架构设计上寻求突破。AMD 在 CPU 和 GPU 双线并进,以 Helios 和 ROCm 生态为抓手,试图在两强之间开辟自己的生态位。

这是一场关乎未来十年数字经济主导权的交锋。谁能赢得智能体 AI 时代的算力基础设施,谁就能在下一个计算时代占据核心位置。

目前来看,但变数依然存在。芯片通胀正在推高整个产业成本,供应链紧张态势短期难以缓解。Arm 与 x86 的架构之争鹿死谁手,尚未可知。芯片政策变数和中国本土芯片厂商的崛起,将为这场比拼增添更多不确定性。

唯一确定的是,在 AI 变幻莫测的时代,没有厂商敢继续安于一隅。

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容