关于ZAKER Skills 合作
钛媒体 2小时前

AI 进入万亿 Token 时代,国产芯片如何构建行业壁垒?

当 AI 正式迈入万亿 Token 时代,算力需求迎来爆发式增长,国产 GPU 行业也从 " 单点突围 " 进入 " 全域竞争 " 的关键周期,AI 算力从 " 稀缺资源 " 加速迈向 " 结构性过剩 ",当国内市场 " 国产替代 " 的红利窗口期开始收窄,中国 GPU 行业的竞争逻辑正在发生根本性转变。单纯比拼单卡峰值算力、简单对标英伟达的技术路线,正走向同质化的价格泥潭。

云边端协同构建算力闭环

GPU 行业的竞争,早已从单一芯片性能比拼,升级为全场景产品能力与生态适配能力的综合较量。摩尔线程的核心竞争力,在于其坚持 " 全功能 GPU" 的技术路线,打破了 AI 芯片、图形芯片、通用计算芯片的场景壁垒,构建起覆盖云端智算、端侧应用的完整产品矩阵,形成了 " 算力底座 + 场景应用 " 的双向赋能格局。

云端算力作为摩尔线程的核心布局领域,承担着大模型训练、大规模仿真、科学计算等高端算力需求,其产品组合以 " 夸娥(KUAE)智算集群 " 为核心,搭配 MTT S5000 旗舰智算卡与智算一体机,形成了从单卡到万卡级集群的完整解决方案。

在端侧领域,摩尔线程以自研 " 长江 " 智能 SoC 芯片为核心,构建起覆盖个人、家庭、行业的端侧 AI 产品矩阵,实现了 " 云端训练—端侧部署 " 的算力闭环。" 长江 "SoC 芯片作为端侧算力基石,采用异构计算架构,集成 8 个主频高达 2.65GHz 的全大核 CPU、全功能 GPU 及高能效 NPU,提供 50TOPS 的异构 AI 算力,支持 INT8/FP16/FP32 等混合精度计算,可在端侧流畅运行百亿参数大模型,配合 136GB/s 的超高内存带宽与最高 64GB 的 LPDDR5X 高速统一内存,兼顾了高性能与低功耗,适配各类端侧设备的部署需求

基于 " 长江 "SoC 芯片,摩尔线程在本次产品发布会上推出了三大端侧核心产品:MTT AIBOOK AI 算力本、MTT AICUBE 家庭 AI 中枢与 MTT E300 边缘 AI 模组。

全功能 GPU 是核心竞争力

在 AI 芯片集体对标英伟达的拥挤赛道中,任何仅仅是 " 对标 " 的路径最终都将陷入价格战。真正的护城河,来自于竞争对手难以同时复制的多重能力组合。除了云端边的全场景布局之外,摩尔线程真正的护城河在于 " 全功能 GPU" 这条技术路径。所谓全功能 GPU,是指在统一架构的单颗芯片上,同时具备 AI 计算、3D 图形渲染、物理仿真和超高清视频编解码四大核心能力。这种 " 算、渲、仿 " 一体化的架构设计,在业内极少数企业(如英伟达)之外尚无人具备规模化量产能力。

这个选择的战略代价非常清晰:设计复杂度极高、兼容挑战巨大、研发战线极长。一款图形 GPU 的设计复杂度本已不亚于 AI 芯片,而将两者统一到同一架构并兼顾物理仿真与编解码,意味着在指令集、缓存层级、计算单元调度等多维度都要做架构层面的融合设计。从 2025 年 MUSA 软件栈已实现 700 多个 API 兼容、PyTorch 算子层面 100% 兼容的进展来看,摩尔线程正在逼近这个 " 不可能三角 " 的平衡点。

为什么值得付出这样的代价?因为物理 AI 和具身智能的崛起正在改变算力需求的底层逻辑。正如发布会上摩尔线程 CEO 张建中所述,具身智能体的训练不仅需要 AI 算力来 " 思考 ",更需要图形渲染来 " 看见 " 虚拟环境,还需要物理仿真来 " 触碰 " 物体的运动规律。将三者分立在不同芯片上完成,意味着数据的跨芯片搬运、异构编程和仿真到现实(Sim-to-Real)的巨大鸿沟——而统一架构让这三者在同一芯片上实现 " 零拷贝 ",数据延迟和转换损耗被压缩到最低。

这种架构优势在夸娥万卡集群上得到了验证。基于 MTT S5000 构建的集群实现了 Dense 大模型训练 MFU 达 40%、MoE 大模型达 60%、训练线性扩展效率达 95%、有效训练时间占比超过 90%。这些技术指标之所以重要,是因为它们共同回答了一个问题:国产 GPU 集群是否真正解决了大规模分布式训练中最令人头疼的两个问题:效率损耗和故障中断。

MFU(Model FLOPs Utilization)衡量的是硬件算力被模型训练实际利用的效率,95% 的线性扩展率意味着在集群规模扩大时性能不会断崖式下降。这些背后离不开从芯片层面的高速互联设计到集群管理调度算法的全栈优化。

但必须指出,万卡集群能力的建立只是起点,不是终点。据行业数据,截至 2025 年底中国已建成 42 个万卡级智算集群,智能算力总规模超过 1590EFLOPS。随着深圳、郑州等地超大规模集群的密集上线,未来两到三年内,国内智算市场将从 " 稀缺状态 " 快速转向 " 结构性过剩 " ,市场对芯片的需求将从 " 能跑通模型 " 升级为 " 每 Token 的边际成本最低 "。这迫使 AI 芯片厂商的竞争焦点从单卡性能转向系统级的 TCO(总拥有成本)竞争,包括功耗效率、集群调度算法、容错恢复能力、软件栈开发效率等。对摩尔线程而言,最新发布的 " 花港 " 架构推进十万卡级集群的规划,是应对这一趋势的战略布局——十万卡规模下,哪怕是 0.01% 的故障率,每小时也意味着数十张卡的失效,而每张卡的宕机都意味着数十万元的算力浪费。

国产芯片绕不开的商业化

技术再好,脱离商业化也只能停留在实验室阶段。在技术的背后,困扰国产芯片的还有一个更高层级的问题:商业化之路怎么走?

而判断一家技术驱动型企业是否真正步入正轨,不能只看营收增速,更要看其研发投入与商业化变现之间的节奏是否能形成正向循环。

摩尔线程最新披露的财报则为理解其当前的战略位置提供了关键的数据切口。从营收规模来看,摩尔线程 2025 年实现营业收入 15.05 亿元,同比增长 243.37%;毛利总额达到 9.87 亿元,整体毛利率水平达 65.57%。2026 年一季度实现营收 7.38 亿元,同比增长 155.35%,归母净利润 2935.92 万元,是公司上市以来首次实现单季盈利。数据的背后隐含一个值得关注的结构性变化:2026 年 3 月,摩尔线程签订了 6.6 亿元的夸娥智算集群大单。这意味着,公司已从 " 卖卡 " 向 " 交付系统级 AI 基础设施 " 完成关键跃迁——单一大单金额即占全年营收近四成,大客户集中度的提升既是商业能力的体现,也意味着大客户续约和复购将成为未来业绩的重要观察指标。

当然,首次单季盈利需要冷静看待。财报显示一季度有 7006 万元政府补助,而同期研发费用约 3 亿 -4 亿元,毛利率水平约 65.6%,单季营收需达 8 亿 -10 亿元以上方能覆盖当期研发支出。

这些财务表象之上,真正塑造公司长期价值的是研发投入的 " 纵深 "。2025 年研发费用 13.05 亿元,占营收比重 86.68%。截至 2025 年底,累计申请知识产权 2014 项,其中发明专利 1743 项。这也恰恰说明,摩尔线程选择了将绝大多数资源投入底层技术而非短期营销,这种 " 逆周期投入 " 将决定它能否在下一代算力竞争中占据主动。2025 年,公司基于 MTT S5000 的夸娥万卡级智算集群实现了商业化部署,成为国内极少数真正具备万卡级大规模集群交付能力的 GPU 供应商。从五年五代架构五颗芯片的产品迭代节奏来看,这是一种典型的 " 用研发换时间、用架构换代换弯道 " 的打法。

从夸娥万卡集群的万卡工程能力,到 MT Lambda 仿真平台的三大引擎融合,再到 " 小麦 " 全域智能体的端侧闭环,以及 AIBOOK、AICUBE、E300 对 " 云 - 边 - 端 " 全场景的覆盖——这些产品线揭示了摩尔线程的系统级战略:不把自己定位为 " 卖卡的 ",而是做 "AI 基础设施的系统级供应商 "。

但客观来看,挑战同样严峻。英伟达已进入 Rubin 架构的新周期,而国内市场的 " 国产替代 " 红利窗口期也在收窄。当华为昇腾有望在 2026 年占据中国市场 50% 份额,当海光、寒武纪、燧原等企业纷纷在各自细分市场发力时,摩尔线程面临的竞争格局将比过去几年更加激烈。 研发费用率 86.68% 虽然在技术攻坚期可以理解,但一旦营收增长放缓,这一比例将直接冲击现金流。26.68 亿元的存货 + 预付款意味着市场对产品需求的判断一旦发生偏差,公司将面临沉重的资产减值风险。

但张建中在 2025 年年度业绩说明会上对存货问题作出了解释,他表示,当前国内算力需求持续放量,叠加芯片行业普遍存在的交期波动、原材料价格浮动、核心产能紧缺等不确定性风险,稳定的供应链体系成为企业核心竞争力。通过储备充足库存、锁定上游产能,摩尔线程有效规避了行业供应链风险,筑牢交付护城河,同时能够快速响应下游批量订单,大幅缩短产品交付周期,稳固市场基本盘。

综合来看,摩尔线程真正的护城河不在于某款芯片或者某个集群,而在于能否把 " 统一架构 " 的技术路线坚持到临界点——让全功能 GPU 在物理 AI 时代成为不可或缺的算力基础设施。当训练芯片在中国市场不再稀缺、而是过剩时,决定胜负的可能不再是单卡峰值算力,而是谁能在同一个芯片上承载 AI、仿真、渲染等更多维的计算任务,谁能以最低的 Token 成本交付最多的智能。这恰恰是 " 全功能 GPU" 这条看似更艰难的路,所能提供的长期壁垒。

(文|Leo 张 ToB 杂谈,作者|张申宇,编辑丨杨林)

相关标签

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容