
超级计算产业的竞争规则,正在被 AI 彻底重写。
算力竞赛的规则已经变了
过去十年,算力竞赛的叙事简单而直接:堆更多的核心、跑更高的 FLOPS、建更大的集群。但如今,这套逻辑正在失效。IDC 与浪潮信息联合发布的《2025 年中国人工智能计算力发展评估报告》显示,2024 年中国智能算力规模达 725.3EFLOPS,同比增长 74.1%,预计 2028 年将达到 2781.9EFLOPS。中国信通院的数据则表明,截至 2025 年 6 月,智能算力已占我国总算力的 81%。
算力不再稀缺,稀缺的是驾驭算力的能力。这场变革的底色,是 " 超智融合 " 从实验室概念走向产业主流的加速过程。而站在变革中心的,是国产算力厂商,它们正在用各自的方式回答同一个问题:当 AI 重新定义计算,什么样的算力基础设施才能撑起下一个十年?
2025 年初,中科曙光提出了 "AI 计算开放架构 " 的战略方向。同年,浪潮信息发布了超节点 AI 服务器元脑 SD200,在单机内实现 64 路本土 AI 芯片的高速统一互联。两家公司几乎同步的动作并非巧合,而是产业对同一个趋势的回应——算力规模仍在狂飙,但增长逻辑已变。
IDC 数据显示,2025 年中国智能算力规模预计达 1037.3EFLOPS,较 2024 年增长 43%。中国信通院发布的《先进计算暨算力发展指数蓝皮书(2025 年)》则指出,截至 2025 年 6 月,全球计算设备算力总规模为 4495EFlops,智能算力占总算力比例达到 85%。
但数字的增长掩盖了一个更深层的变化。中国农业大学信息中心计算中心主任、教授级高级工程师劳凤丹指出,过去评价超算看重的是单精度或双精度的绝对算力峰值,但在 AI 应用落地阶段," 算力的本质是‘产出智能’ "。考核指标正从单纯的算力大小,转变为 " 每瓦特电力能产出多少 Token"" 每单位成本的推理延迟是多少 "。
此外,算力评价体系也在重构,而这也在倒逼整个产业链重新思考 " 什么是好的算力 "。
以国家超算互联网核心节点为例,中科曙光部署的 scaleX 万卡超集群,最大可对外提供超过 6 万张 AI 加速卡的算力。更值得关注的是其技术指标:采用超高密度刀片和浸没相变液冷技术,单机柜算力密度提升 20 倍,PUE 值降至 1.04;通过 " 超级隧道 "、AI 数据加速等设计,AI 加速卡资源利用率提高 55%。
这些数字指向同一个结论:算力竞争已从 " 单点性能 " 转向 " 系统效率 "。正如 ISC 2026 现场多位专家所达成的共识:超级计算的竞争重心正在从单点性能转向系统级效率。
对此,广州国家实验室大湾区生物信息中心主任、研究员李亦学指出,大模型推动 GPU 算力快速增长,但科学计算的底层仍然依赖物理规律与数学模型,CPU 与 GPU 对应不同的计算范式,两者并非替代关系,而是走向协同。生命科学与计算生物学专家张骏则进一步补充,未来超算平台必须同时支持多精度、多架构与多任务混合负载,而不是仅围绕单一 AI 模型进行优化。
这意味着,未来的算力基础设施不能是只擅长高精度科学计算或只擅长低精度 AI 训练的 " 偏科生 ",而是要成为 " 六边形战士 "。
超智融合是产业重构
2025 年 8 月,我国高性能计算领域首部超智融合行业标准《超智融合集群能力要求》正式发布。紧随其后,遵循该标准设计的首个标准化超智融合算力平台,曙光 Nebula800 高性能计算集群系统亮相。
标准的出台意味着 " 超智融合 " 已从个别企业的技术探索,上升为全行业的共识与规范。但 " 超智融合 " 究竟是什么?它远不止 " 超算 + 智算 " 的简单叠加。
对此,上海交通大学信息办主任林新华表示,在 AI for Science 全自动科研的时代,可能都不是人在用超算,而是 AI Agent 在用。因此,超算亟需实现从底层的硬件到中间的系统软件的重构,这些环节都要面向 AI Agent 去设计。
进一步来看,数学模型驱动的高精度科学计算与数据模型驱动的低精度智能计算紧耦合的系统化协同,将成为新一代计算和 AI 基础设施演进的重要方向。业内专家也进一步表示," 算力就是 AI4S 时代的‘电力’ "。
电力之所以成为工业化的通用能源,不是因为发电厂够多,而是因为电网够智能,能够将不同来源的电能统一调度、按需分配。算力要想成为数字时代的 " 电力 ",同样需要一张 " 算力网 "。中科曙光相关负责人将这一逻辑概括为:" 就像电力系统,如果不同电厂发出的电无法并入同一张网,电力就无法成为驱动工业化的通用能源 "。他主张建立一个开放的产业格局," 让国产芯片、整机、软件和大模型等产业链上下游的企业能够解耦协作 "。
如何打通 " 最后一公里 "?
算力再强,如果不能转化为产业能力,就只是空中楼阁。2025 年,中国算力租赁市场规模从约 1480 亿元涨至约 2116 亿元。IDC 预测 2026 年全球人工智能服务器市场规模将达 1587 亿美元。但规模扩张的同时,一个结构性问题正在浮现:算力、算法、模型、应用四个环节之间,存在明显的断裂。
首当其冲的就是算力碎片化,在很长一段时间里,国内算力产业面临着结构性的矛盾,需求侧急需大规模、稳定的算力,供给侧却呈现出严重的碎片化特征 "。各家厂商在硬件设计、软件栈和互连协议上自成体系,导致算力资源难以跨平台调度,用户迁移成本居高不下。
这一矛盾在 AI 推理爆发后变得更加尖锐。当 AI 应用从模型训练走向推理和行业落地,算力需求从 " 集中式、大集群 " 转向 " 分布式、高并发 "。而当企业对算力的需求从训练侧逐渐转向推理侧之时,算力必须从超算中心 " 下沉 " 到企业车间、研发一线,而碎片化的供给格局无法支撑这一下沉。
其次就是数据。数据一直是困扰着 AI 发展的一大掣肘。劳凤丹指出,高校在推进 AI4S 过程中遇到的一大瓶颈是 " 高质量的科学数据缺乏,数据分散在不同课题组之间,科学数据的碎片化、不共享、不标准的问题比较明显 "。李亦学也表达了类似担忧:" 从数据模型算法算力四位一体相互融合的角度来协同推进……目前这件事情做的并不好 "。
数据是 AI 的燃料。如果燃料散落各处、无法汇聚,再强的引擎也无法驱动。
最后是应用落地能力不足。从产业角度可以看见,目前 AI 技术很火热,但却没有什么杀手级的应用出现,即便有一些应用落地,大多也只是辅助企业降本增效,并没有实际的改变什么。这点在科学、科研领域尤为明显,张骏指出,当前主流大模型高度依赖 Transformer 架构与低精度计算,但在生命科学、材料科学等领域,高精度计算与复杂系统模拟仍然不可替代。这意味着,不能把 AI 大模型直接 " 扔 " 给产业用户,而是需要针对具体场景做适配、优化和封装。
只有解决了上面这三个难题,才能真正打通落地的 " 最后一公里 "。李亦学给出的建议是:" 需要我们的硬件厂商、做软件开发的技术人员、还有我们的科研工作人员,我们要打破边界,协同工作 "。他特别强调,不能 " 在整个技术体系的某一个环节上单独发力 "。
更深层的挑战在于算力、算法、模型、应用之间的循环尚未建立。理想的模式应该是:应用层在产业中产生数据,数据回流优化模型,优化后的模型需要更强算力,更强算力支撑更好的应用。这是一个 " 飞轮效应 "。但现实是,四个环节往往各自为政。
破局的方向正在变得清晰。首先是从 " 各自为战 " 走向 " 芯模协同 "。过去,国产算力生态长期处于 " 芯片被动适配模型 " 的单向奔赴状态,芯片厂商做出硬件,模型厂商再去适配,周期长、效率低。DeepSeek V4 的发布成为一个标志性节点:这是第一次在大规模、高强度的工程化尺度上,验证了 " 芯模协同 " 的可行性与效率。
与此同时,产业链的 " 抱团 " 趋势也在加速。2026 年 MWC 上海展上,兆芯展出的并非孤立的芯片,而是由中兴、联想开天等生态伙伴共同打造的服务器、工作站及云终端整机产品矩阵。这种 " 从芯到整机 " 的协同模式,有效解决了用户在迁移和部署过程中的兼容性与适配性难题。
其次是真正让国产算力从 " 实验室 " 走向实际应用场景中。海光信息与同济大学签署战略合作协议,推出国内首个国产千卡工科智算集群。集群以国产海光 DCU 为算力底座,采用超智融合架构,可同步承载高端计算与 AI 训练推理任务,主要面向工程仿真、智能建造等实体产业场景。
更深层的突破在于 " 飞轮 " 正在转动。基于昆仑芯等国产算力底座,招商银行上线超 800 个 AI 智能体应用,覆盖风控、营销、研发、办公等核心场景。国产大模型与国产算力的 " 双向奔赴 ",正在让 " 国芯 + 国云 + 国模 " 所构筑的生态基石愈发坚实。正如沐曦股份高级副总裁孙国梁所言:" 国产算力一定要靠开源生态,才能与全球最优秀的产品竞争 "。
这些拼图正在拼出一个完整的答案:国产算力不再只是 "Plan B",而是正在成为支撑中国 AI 产业的主干道。
打通 " 最后一公里 ",从来不是某一家企业的事。它需要芯片厂商、模型厂商、应用厂商、科研机构打破边界,协同作战。李亦学说得直白," 不能在整个技术体系的某一个环节上单独发力 "。当产业链的每个环节都开始转动,那个从算力到产业的闭环,终将形成。
同理,超智融合也不是简单的超算与 AI 的叠加,而是算力产业底层范式的全面重构,重塑了超算的定位、能力与使命,也改写了全球算力竞争的核心规则。
(文|Leo 张 ToB 杂谈,作者|张申宇,编辑丨杨林)