关于ZAKER Skills 合作
钛媒体 20分钟前

COMPUTEX 2026:英特尔数据中心首次亮相 288 核 CPU、480GB 显存 GPU,18A 来了

文 | 半导体产业纵横

数据中心眼下是整个科技行业最热闹的赛道。

英伟达数据中心业务连续多个季度创纪录,AMD EPYC 系列增长强劲,AI 推理需求正在引爆一场算力军备竞赛。而在这个时间节点,英特尔 Intel 18A 工艺正走向成熟,代工业务转型进入深水区。

今日,英特尔首次集中展示数据中心领域的全线产品—— CPU、GPU、网卡,一样不缺。这不只是产品的展示,更是战略方向的发布。三件事交织在一起,让这次发布会变成了一个观察英特尔战略走向的绝佳窗口。

至强 6+:288 核怪兽登场,18A 工艺首秀

本次最重磅的产品,当属至强 6+。

这是英特尔首次将 Intel 18A 制程工艺应用于数据中心处理器。更重要的是,它采用了 Foveros Direct 3D 封装技术,将基于 18A 的计算晶片堆叠在 Intel 3 的基底晶片之上,再用 EMIB 技术完成互联。整个封装由 29 个组件构成:12 个计算晶片、3 个 Active 基底晶片、2 个 I/O 晶片、12 个 EMIB 互联 Tile。

单处理器最多 288 个能效核。这是业界目前最高的核心密度。配合高达 576MB 的末级缓存(LLC,较上一代提升超过 5 倍)和 8000 MT/s 的 DDR5 内存,内存子系统实现了大幅升级。在主流工作负载下,整体性能最高提升至 2.26 倍,每瓦性能最高提升至 1.55 倍。与竞品横向比较,至强 6+ 的每线程性能高出 1.3 倍,每线程每瓦性能同样高出 1.3 倍。

18A 工艺带来了两项关键技术升级:PowerVia 实现更短、更直接的供电路径,有效降低功耗;RibbonFET 则在降低待机功耗的同时增强性能一致性。

一个比较直观的数据:与第二代至强相比,至强 6+ 可实现 9:1 的服务器整合比,减少近 80% 的机架空间占用,同时降低 73% 的能耗。对于正在头疼数据中心能耗和散热问题的运营商来说影响巨大。爱立信在真实运营商部署中测试了至强 6+ 的分组核心网:与上一代 E-core 相比,相同内核数量下性能提升 30%,机架功耗降低 38%,每瓦性能提升超过 60%。

英特尔还带来了一个全新的硬功能:Intel AET(应用能效遥测技术)。它可以在工作负载层级实时监测 CPU 功耗,让数据中心运营商实现更精细的能效优化和成本分摊。对云服务提供商和大型企业数据中心来说,这意味着更可控的 TCO 和更精准的资源调度。

首款数据中心 GPU,480GB 显存降维打击

如果说至强 6+ 是英特尔守住了基本盘,那 Crescent Island 就是他们第一次正式进入数据中心 GPU 战场。这是首款基于 Xe3P 架构的数据中心 GPU,专为 AI 推理和 Agent 工作负载优化。它的核心参数非常炸裂:480GB LPDDR5 内存,350W TDP。

480GB 这个数字有特殊含义。以 DeepSeek-V4(1.6T 参数)为例,在 FP8 量化精度下仅需 4 张 Crescent Island 即可支持部署。更长的上下文窗口、更多的模型切换,这些在 Agent 工作流中频繁发生的场景,因为超大容量内存而变得更具操作性。LPDDR 而非 HBM 的选择,让功耗降至 350W,意味着它可以在现有风冷数据中心中直接运行,不需要液冷改造。

同时,Crescent Island 支持原生 FP64。 这让它不仅仅是一款 AI 推理卡,也为未来进入 HPC 市场埋下了伏笔。英特尔内部正在推进 CPU 与 Crescent Island 联合的软件栈,以支持更好的 HPC 应用。英特尔显然在刻意控制产品边界。他们去掉了对部分通用场景不必要的能力,把晶体管面积释放出来给 AI 性能。

软件层面,英特尔围绕四个原则构建统一的 Xe 软件栈:开放、规模化性能、优秀的用户体验、支持异构基础设施。英特尔选择了上游优先的策略:PyTorch、vLLM、SGLang 等主流框架,都会在 Day 0 就获得支持。他们还与 SambaNova 达成合作,后者侧重大型系统级的高吞吐、低延迟集中式推理,而 Crescent Island 则主攻端侧和企业级的小规模部署(如 8 卡或 16 卡一体机)。

目前已有超过 20 家 OEM 和 ODM 厂商在针对 Crescent Island 进行开发。这个数字背后,是英特尔生态正在加速扩张的信号。

除去 CPU 和 GPU,本次一同发布的还有全新的 E835 以太网网卡。高达 200GbE 吞吐量,支持 RDMA 和动态设备个性化(DDP),在满载 200G 双向线速运行时,功耗比同类产品低 28% 至 47%,能效比达到竞品的 1.4 至 1.9 倍。内置硅芯片信任根和固件证明等硬件级安全能力,超过 10 年的产品生命周期,让数据中心在长期运营中拥有更稳定的技术投资保障。

Agentic AI 时代,CPU 重回 C 位

过去两三年,AI 推理几乎等同于 GPU 的工作。但随着 Agentic AI 的崛起,游戏规则正在被改写。英特尔公司执行副总裁兼数据中心事业部(DCG)总经理 Kevork Kechichian 表示:"CPU 现在处于所有这些流程的中心,试图去编排和调度整个大局。"

Agent 工作流是多步骤、多推理、多计算的,需要维持极长的上下文窗口,多个专家 Agent 会繁衍出多个子 Agent 协同完成复杂任务,这导致 Token 消耗量呈指数级增长。在这种场景下,GPU 负责思考(推理、代码生成),而 CPU 负责执行(编排、调度、模拟、上下文管理)。两者的关系从传统的 1:8 配比,正在向 1:4、1:2 甚至 1:1 演进,在强化学习场景中甚至出现反转。

这解释了为什么至强 6+ 的高内核密度变得如此重要。英特尔实测,基于 288 核心的 Clearwater Forest,可以轻松部署 400 到 500 个以上的 Agent 并发运行。更重要的是,CPU 内置的加速器(矩阵引擎、向量引擎)和机密计算能力(TDX、SGX),正好契合 Agent 场景对数据隐私和安全隔离的严格要求。当多个 Agent 并行运行、多租户并行调度时,TDX 和 SGX 可以在可信平台上确保隐私信息在安全可控范围内运行。

x86 仍将统治 2030 年

x86 架构在数据中心的影响力,并没有因为 AI 浪潮而削弱,反而在某些关键场景下被重新强化。

英特尔将工作负载分为三大类:需要高密度计算的横向扩展(Scale-out)场景、平衡性能和数据吞吐量的通用场景,以及计算密集型的 AI 训练场景。但在这些传统分类之外,一个新的中间地带正在形成。推理侧的混合场景:GPU 级加速,但主体仍以 CPU 为核心。

这个第三类场景的崛起,意义远超表面。AI 推理与训练存在显著差异,训练需要大规模并行计算,GPU 是绝对主力;但推理阶段,尤其是企业级的 Agent 工作流,涉及多步骤推理、上下文管理、调度和模拟,这些恰恰是 CPU 的强项。当 Token 消耗量呈指数级增长,当多个 Agent 并行运行、当极长上下文窗口需要被持续维持,CPU 不再是旁观者,而是整个系统的编排中枢。

英特尔在发布会上给出了一个数字:预计到 2030 年,全球超过 8000 万台在网服务器中,80% 仍将基于 x86 架构。当前,推理和 Agent AI,几乎完全运行在 x86 上。

广泛 x86 软件生态与开发者社区的积累、多年打磨的硬件加速能力(IAA 内存压缩、CXL 内存扩展等)、以及成熟的可管理性和安全特性,这些积累在过去或许只是 " 基本功 ",但在 Agent AI 时代,它们突然变成了宝藏。内存成本高企、容量需求激增,让 IAA 技术重新进入客户视野;CXL 内存池的能力,使得跨 CPU 共享缓存层级成为可能。

英特尔也在通过架构层面的精细化应对这种分化。针对不同工作负载,他们同时推进 P-core(性能核)和 E-core(能效核)两条路线:P-core 在通用计算中性能优势突出,客户反馈积极;而 E-core 在高密度、低功耗的 Agent 场景中正变得越来越不可或缺。两种核心并行推进,而非非此即彼,为 x86 在 AI 时代的市场定位提供了更弹性的支撑。ARM 在服务器领域布局多年,但 x86 的生态壁垒和成熟度,在可预见的未来依然难以撼动。

从芯片到机架级,英特尔的野望

英特尔数据中心的布局不止于此,从路线图来看,英特尔下一步会推出 Diamond Rapids,预计 2027 年推出,采用 18A P 工艺,比至强 6+ 的 18A 更进一步的制程节点。它采用 Scalable SOC 架构,引入统一内存延迟(Uniform Memory Latency)设计。在关键的内存和 I/O 上,Diamond Rapids 的通道数量相比前代增加 2 倍,内存速度全面提升,PCIe 支持到 Gen6,为带宽受限和 I/O 密集型应用提供更强的支撑。

从应用场景来看,Diamond Rapids 瞄准的是高需求 IaaS 环境、高性能计算、带宽密集型应用和 I/O 密集型工作负载,这些正是 AI 推理和 Agent 工作流正在倒逼的基础设施升级方向。

从至强 6+ 到 Diamond Rapids,制程节点、产品密度、内存带宽、I/O 性能,每一代都在系统性提升。值得一提的是,支撑英特尔数据中心产品的,是 Intel 18A 工艺的快速成熟。从至强 6+ 开始,所有核心产品均基于 18A 工艺,这不仅意味着更高的性能和能效比,更意味着英特尔的产品规划和制程节点,终于回到了同频共振的状态。

2026 年的数据中心市场,正在经历一场深刻的变革。AI 工作负载的爆发,改变了 CPU 与 GPU 的关系,重塑了数据中心的设计逻辑。

英特尔又站回了舞台中央。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容