文 | 半导体产业纵横
数据中心眼下是整个科技行业最热闹的赛道。
英伟达数据中心业务连续多个季度创纪录,AMD EPYC 系列增长强劲,AI 推理需求正在引爆一场算力军备竞赛。而在这个时间节点,英特尔 Intel 18A 工艺正走向成熟,代工业务转型进入深水区。
今日,英特尔首次集中展示数据中心领域的全线产品—— CPU、GPU、网卡,一样不缺。这不只是产品的展示,更是战略方向的发布。三件事交织在一起,让这次发布会变成了一个观察英特尔战略走向的绝佳窗口。


这是英特尔首次将 Intel 18A 制程工艺应用于数据中心处理器。更重要的是,它采用了 Foveros Direct 3D 封装技术,将基于 18A 的计算晶片堆叠在 Intel 3 的基底晶片之上,再用 EMIB 技术完成互联。整个封装由 29 个组件构成:12 个计算晶片、3 个 Active 基底晶片、2 个 I/O 晶片、12 个 EMIB 互联 Tile。

18A 工艺带来了两项关键技术升级:PowerVia 实现更短、更直接的供电路径,有效降低功耗;RibbonFET 则在降低待机功耗的同时增强性能一致性。

英特尔还带来了一个全新的硬功能:Intel AET(应用能效遥测技术)。它可以在工作负载层级实时监测 CPU 功耗,让数据中心运营商实现更精细的能效优化和成本分摊。对云服务提供商和大型企业数据中心来说,这意味着更可控的 TCO 和更精准的资源调度。
首款数据中心 GPU,480GB 显存降维打击

480GB 这个数字有特殊含义。以 DeepSeek-V4(1.6T 参数)为例,在 FP8 量化精度下仅需 4 张 Crescent Island 即可支持部署。更长的上下文窗口、更多的模型切换,这些在 Agent 工作流中频繁发生的场景,因为超大容量内存而变得更具操作性。LPDDR 而非 HBM 的选择,让功耗降至 350W,意味着它可以在现有风冷数据中心中直接运行,不需要液冷改造。
同时,Crescent Island 支持原生 FP64。 这让它不仅仅是一款 AI 推理卡,也为未来进入 HPC 市场埋下了伏笔。英特尔内部正在推进 CPU 与 Crescent Island 联合的软件栈,以支持更好的 HPC 应用。英特尔显然在刻意控制产品边界。他们去掉了对部分通用场景不必要的能力,把晶体管面积释放出来给 AI 性能。
软件层面,英特尔围绕四个原则构建统一的 Xe 软件栈:开放、规模化性能、优秀的用户体验、支持异构基础设施。英特尔选择了上游优先的策略:PyTorch、vLLM、SGLang 等主流框架,都会在 Day 0 就获得支持。他们还与 SambaNova 达成合作,后者侧重大型系统级的高吞吐、低延迟集中式推理,而 Crescent Island 则主攻端侧和企业级的小规模部署(如 8 卡或 16 卡一体机)。
目前已有超过 20 家 OEM 和 ODM 厂商在针对 Crescent Island 进行开发。这个数字背后,是英特尔生态正在加速扩张的信号。

Agentic AI 时代,CPU 重回 C 位
过去两三年,AI 推理几乎等同于 GPU 的工作。但随着 Agentic AI 的崛起,游戏规则正在被改写。英特尔公司执行副总裁兼数据中心事业部(DCG)总经理 Kevork Kechichian 表示:"CPU 现在处于所有这些流程的中心,试图去编排和调度整个大局。"
Agent 工作流是多步骤、多推理、多计算的,需要维持极长的上下文窗口,多个专家 Agent 会繁衍出多个子 Agent 协同完成复杂任务,这导致 Token 消耗量呈指数级增长。在这种场景下,GPU 负责思考(推理、代码生成),而 CPU 负责执行(编排、调度、模拟、上下文管理)。两者的关系从传统的 1:8 配比,正在向 1:4、1:2 甚至 1:1 演进,在强化学习场景中甚至出现反转。
这解释了为什么至强 6+ 的高内核密度变得如此重要。英特尔实测,基于 288 核心的 Clearwater Forest,可以轻松部署 400 到 500 个以上的 Agent 并发运行。更重要的是,CPU 内置的加速器(矩阵引擎、向量引擎)和机密计算能力(TDX、SGX),正好契合 Agent 场景对数据隐私和安全隔离的严格要求。当多个 Agent 并行运行、多租户并行调度时,TDX 和 SGX 可以在可信平台上确保隐私信息在安全可控范围内运行。
x86 仍将统治 2030 年
x86 架构在数据中心的影响力,并没有因为 AI 浪潮而削弱,反而在某些关键场景下被重新强化。
英特尔将工作负载分为三大类:需要高密度计算的横向扩展(Scale-out)场景、平衡性能和数据吞吐量的通用场景,以及计算密集型的 AI 训练场景。但在这些传统分类之外,一个新的中间地带正在形成。推理侧的混合场景:GPU 级加速,但主体仍以 CPU 为核心。
这个第三类场景的崛起,意义远超表面。AI 推理与训练存在显著差异,训练需要大规模并行计算,GPU 是绝对主力;但推理阶段,尤其是企业级的 Agent 工作流,涉及多步骤推理、上下文管理、调度和模拟,这些恰恰是 CPU 的强项。当 Token 消耗量呈指数级增长,当多个 Agent 并行运行、当极长上下文窗口需要被持续维持,CPU 不再是旁观者,而是整个系统的编排中枢。


广泛 x86 软件生态与开发者社区的积累、多年打磨的硬件加速能力(IAA 内存压缩、CXL 内存扩展等)、以及成熟的可管理性和安全特性,这些积累在过去或许只是 " 基本功 ",但在 Agent AI 时代,它们突然变成了宝藏。内存成本高企、容量需求激增,让 IAA 技术重新进入客户视野;CXL 内存池的能力,使得跨 CPU 共享缓存层级成为可能。
英特尔也在通过架构层面的精细化应对这种分化。针对不同工作负载,他们同时推进 P-core(性能核)和 E-core(能效核)两条路线:P-core 在通用计算中性能优势突出,客户反馈积极;而 E-core 在高密度、低功耗的 Agent 场景中正变得越来越不可或缺。两种核心并行推进,而非非此即彼,为 x86 在 AI 时代的市场定位提供了更弹性的支撑。ARM 在服务器领域布局多年,但 x86 的生态壁垒和成熟度,在可预见的未来依然难以撼动。
从芯片到机架级,英特尔的野望


从至强 6+ 到 Diamond Rapids,制程节点、产品密度、内存带宽、I/O 性能,每一代都在系统性提升。值得一提的是,支撑英特尔数据中心产品的,是 Intel 18A 工艺的快速成熟。从至强 6+ 开始,所有核心产品均基于 18A 工艺,这不仅意味着更高的性能和能效比,更意味着英特尔的产品规划和制程节点,终于回到了同频共振的状态。
2026 年的数据中心市场,正在经历一场深刻的变革。AI 工作负载的爆发,改变了 CPU 与 GPU 的关系,重塑了数据中心的设计逻辑。
英特尔又站回了舞台中央。