文 | 半导体产业纵横
一直以来,LPDDR(低功耗双倍数据率同步动态随机存储器)主要被用于智能手机、轻薄本等低功耗消费电子设备中。但近年来,随着全球 AI 推理需求的爆发式增长,LPDDR 却正快速向数据中心领域渗透,并逐渐成为端侧、边缘到云端全场景 AI 推理芯片的共同选择。
无论是国际大厂,还是国内企业,纷纷采用 LPDDR 作为推理产品的内存方案,背后是成本、功耗、性能的多方面权衡。
LPDDR 正成为 AI 推理的 " 通解 "
当前,LPDDR 从消费电子领域全面切入 AI 芯片市场,不仅成为推理 GPU 的主流内存选项,更延伸至 AI 专用 CPU、桌面 AI 超级计算机等多个品类。
数据中心
高通AI200/AI250 几乎是目前最激进的 LPDDR 数据中心方案。作为高通首款数据中心级推理系统,Qualcomm AI200 加速卡带来专为机架级 AI 推理打造的解决方案,旨在为大语言模型(LLM)与多模态模型(LMM)推理及其他 AI 工作负载提供低总体拥有成本与优化性能。每张加速卡支持 768GB LPDDR 内存,实现更高内存容量与更低成本,为 AI 推理提供卓越的扩展性与灵活性。该解决方案预计将于 2026 年正式面向市场发售。将于 2027 年推出的 AI250 加速器,在继承 AI200 核心架构优势的基础上实现了关键技术升级。
英特尔则推出了首款基于 Xe3P 架构的数据中心 GPU,代号为 "Crescent Island"(新月岛)。据了解,该产品专为 AI 推理和 Agent 工作负载优化,采用了 480GB LPDDR5 内存,TDP 仅 350W。由于舍弃 HBM,它可以在现有风冷数据中心直接部署,无需液冷改造。
国内曦望科技的启望 S3 则是国产芯片的代表。作为国内首款 LPDDR6 显存的 GPGPU,曦望宣称其推理性价比提升 10 倍以上,单位 token 成本降 90%。
端侧 AI
端侧 AI 是 LPDDR 最成熟的领域。
DEEPX是一家专注于边缘计算与端侧 AI 的韩国半导体企业。就在最近 DeepX 首席执行官表示,该企业的产品将导入 LPDDR-PIM 存内计算解决方案。PIM 将专用的数据处理器直接集成在 DRAM 中,可将部分数据计算工作从主机处理器卸载到存储器当中。这可以减少数据的移动,提高 AI 加速器系统的能效和数据处理效率。三星电子是 LPDDR5X-PIM 的唯一供应商,因此 DeepX 将把其 80TOPS 算力 2nm 端侧 AI 芯片 DX-M2 与三星电子的 LPDDR5X-PIM 解决方案相匹配。后续的 DX-M3 也将搭配 JEDEC 标准化的 LPDDR6-PIM。
作为上游供应商,江波龙更是推出两款专为端侧 AI 推理打造的 LPDDR 内存方案,即 AIDIMM(插槽式)和 AILPBGA(焊接式)。AIDIMM 采用 4 颗 LPDDR5x 同面布局设计,具有最高 128GB 容量、256bit 位宽和 307.2GB/s 单通道超高带宽。AILPBGA 采用自研技术标准与创新架构,单颗原生 256bit 位宽设计,带宽可达 307GB/s,容量覆盖 24GB~64GB,全面适配 LPDDR 标准接口;同时采用 22 × 22mm 的 BGA1764 紧凑封装设计。
桌面与 AI PC
除了专用的 AI 推理芯片,LPDDR 还正通过 " 统一内存架构 " 重新定义 AI PC 的性能边界。
AMD Strix Halo(Ryzen AI MAX 系列)采用 256-bit LPDDR5X 接口,支持最高 128GB LPDDR5X-8000 内存,带宽达 256GB/s。更激进的苹果 M4 Max 则采用 512-bit LPDDR5X 内存总线(32 × 16-bit 控制器),通过 Memory-on-Package ( MoP ) 封装实现 546GB/s 带宽,成为本地运行大语言模型的性能标杆。英伟达也不甘落后,其最近发布的 RTX Spark 超级芯片,面向轻薄笔记本和小型台式机,集成 Blackwell 架构 RTX GPU 和 20 核 Grace CPU,最高 128GB LPDDR5X 统一内存,AI 算力达 1 PFLOP,实现了在低功耗、小体积设备上的高性能 AI 计算。
此外,英伟达还发布了 " 全球最强大的桌面 AI 超级计算机 "DGX Station for Windows。DGX Station 由 GB300 Grace Blackwell Ultra 桌面超级芯片提供支持,通过 NVIDIA NVLink-C2C 互连将 Blackwell Ultra GPU 连接到 72 核 Grace CPU。其配备高达 748GB 的相干内存和高达 20 petaflops 的 FP4 性能。而这 748GB 相干内存包括 496 GB LPDDR5X(396 GB/s)的 CPU 内存和 252 GB 的 HBM3e GPU 显存,通过 NVLink-C2C 互连技术实现 CPU 与 GPU 之间的高带宽相干数据交换。
为什么是 LPDDR?
LPDDR 的全称是 Low Power Double Data Rate SDRAM(低功耗双倍数据率同步动态随机存取存储器)。顾名思义,它的一切设计都围绕着 " 省电 " 展开。它通常以芯片的形式,直接焊接在手机或超薄本的主板上,与处理器紧挨着,几乎不可更换。那么,为什么如今这些厂商不约而同的向 LPDDR 内存倒戈?

其次,LPDDR 的容量更大,单张卡可以加载更大的模型,上下文也可以更长。高通 AI200 的 768GB LPDDR 是行业最大容量。作为对比,NVIDIA GB300 单 GPU 仅 288GB HBM3e,AMD MI450X 为 432GB HBM4。由于 HBM 主要通过硅中介层与处理器进行 2.5D 封装,必须紧邻核心排布,这不仅限制了单系统的总容量上限,其 PHY 的固定宽度与接口位置还限制了布局。反观 LPDDR5X,控制器 IP 生态成熟、获取门槛低,PCB/ 基板布线及信号训练(Training)流程高度标准化。系统扩展也极为灵活,需要带宽可通过多通道并行实现,需要容量也可以堆,不过是多增加一些引脚数量。
此外,LPDDR 的功耗更低。以英特尔的 Crescent Island 为例,由于采用 LPDDR 而非 HBM 的选择,功耗降至 350W,意味着它可以在现有风冷数据中心中直接运行,不需要液冷改造。这也省去了数据中心的液冷改造投入,降低投资成本和建设周期。
最后,推理对于存储的大带宽的要求要低于训练。在训练场景中,处理大量数据的反向传播需要极高的内存带宽,使得 HBM 不可替代。但在推理场景中,模型参数是固定的,重点在于大容量存储和高效检索;LPDDR 的容量和成本优势远远超过了带宽方面的缺点。今年的 GTC 大会上,黄仁勋表示,AI 推理市场拐点已经到来,AI 从训练阶段全面进入推理与执行阶段,推理算力需求呈指数级爆发。相较于传统训练芯片,推理芯片更强调功耗控制、成本效率以及部署灵活性,LPDDR 显然更具优势。
芯片巨头同时转向 LPDDR 并非巧合,而是整个行业的调整。一些组织指出,到 2030 年,推理工作负载的数量将是训练工作负载的 100 倍。数据中心 AI 芯片采用 LPDDR 是一个明确的推理导向设计选择。在 HBM 供应紧张、价格高昂的背景下,高通、Intel 等厂商通过 LPDDR 实现了 " 单卡大容量、低 TCO、风冷部署 " 的差异化路线,尤其适用于 LLM 推理、视频分析、推荐系统等带宽需求相对可控、容量需求极高的场景。当然,LPDDR 解决方案也并非没有成本。与 HBM 相比,它存在较低的内存带宽、因接口更窄导致的延迟较高,以及在 24 小时高温服务器环境中尚未被证明的可靠性。
LPDDR 需求暴涨
厂商集体转向的直接后果,是 LPDDR 需求的几何级增长。
以高通的 AI200 为例,单个机架可能包含数十张加速卡,每张拥有 768GB 内存,总内存容量达数十 TB。这相当于数十万甚至数百万智能手机的内存使用量。而这只是一家公司出品的一款产品。当高通、英特尔、英伟达以及其他潜在竞争者(如 AMD 和博通)在 2026-2027 年大规模生产 LPDDR 解决方案时,LPDDR 的需求将呈指数增长。
还有分析师指出,英伟达 Vera Rubin AI 服务器所需的 LPDDR 使用量将从 2026 年的 31.44 亿 GB 攀升至 2027 年的 60.41 亿 GB,占 2027 年全球 LPDDR 总供应能力的 36%。这一数字将首次超越苹果 29.66 亿 GB 与三星 27.24 亿 GB 的用量总和。
Vera Rubin 是英伟达在 GTC 2026 上宣布全面投产的最新 AI 平台,由 Vera CPU 和 Rubin GPU 构成。其中,Vera CPU 搭载 88 个定制 ARMv9.2"Olympus" 核心,系统支持高达 1.5TB(约 1536GB)的 LPDDR5X 内存,采用新一代 SOCAMM2 封装形态。相比之下,一部旗舰智能手机通常只配备 12-16GB LPDDR5X 内存——这意味着单颗 Vera CPU 的 LPDDR 配备量约为一部手机的 90 倍。
AMD 同样在推升 LPDDR 需求。其将于 2027 年推出的第六代 EPYC 服务器处理器 "Verano" 将首次支持 SOCAMM2 形态的 LPDDR5X 内存。
LPDDR 的供应逻辑与 HBM 完全不同。HBM 由 SK 海力士、三星、美光三巨头垄断,产能高度受限;而 LPDDR 拥有更庞大的消费电子产能基底和更成熟的供应链。当 AI 巨头集体转向,LPDDR 的产能将成为 AI 基础设施扩张的关键变量。
LPDDR6:从 " 够用 " 到 " 好用 "
JEDEC 固态技术协会于 2026 年 4 月正式预览 LPDDR6 路线图。
此次路线图,其中最令人瞩目的是:LPDDR6 单颗内存芯片的容量有望达到 512GB。这一容量规格直接大幅超越当前主流服务器 DDR5。目前主流服务器 DDR5 单根容量普遍停留在 64GB — 128GB,单颗 Die 容量差距更为悬殊。之所以能实现如此夸张的容量突破,主要是因为 JEDEC 新增了更窄的 x6 子通道模式,让单个封装能容纳更多内存 die。再配合更先进的制程工艺带来单颗 die 的密度提升,最终使单颗芯片就能承载以往整根内存条才能达到的容量。
LPDDR6 的性能规格较上一代产品实现显著跃升。这一代产品的带宽可达 10.6Gbps 至 14.4Gbps,而上一代 LPDDR5X 的带宽范围为 8.5Gbps 至最高 10.7Gbps,性能提升约 1.5 倍。SK 海力士已成功开发出采用 1cnm 工艺的 16Gb LPDDR6 DRAM,并完成了全球首个相关认证。这款全新的 16Gb LPDDR6 DRAM 在性能上实现了显著提升。其运行速度达到 10.7Gbps,数据处理速度较上一代 LPDDR5X 产品提高了 33%。
同时,基于 LPDDR6 的 SOCAMM2 紧凑型模块标准已在同步开发中,用以替代传统又厚又大的 DDR5 条,为 AI 服务器提供更高集成度的低功耗内存底座。对普通游戏和创作玩家而言,LPDDR6 的进阶不在一蹴而就,但未来三年内,高端游戏本、平板或 AIPC 都有望获得超大内存。更关键的是,在保持轻薄续航的前提下,端侧运行数百亿参数的大模型甚至大型仿真渲染将成为常态。
采用 LPDDR,是一个明确的推理导向设计选择。它标志着 AI 算力竞争从 " 训练时代的 HBM 带宽竞赛 " 转向 " 推理时代的容量与 TCO 竞赛 "。随着 LPDDR6 的 512GB 单颗容量、14.4Gbps 速率、SOCAMM2 模块化封装和 PIM 存内计算的成熟,AI 服务器将轻松构建 TB 级内存池。模型权重与 KV Cache 不再需要在内存与 SSD 之间 " 痛苦搬家 ",端侧运行数百亿参数大模型、车载实时多模态推理、桌面 AI Agent 常驻后台——都将成为常态。