关于ZAKER 合作
科创板日报 47分钟前

英伟达斥资 200 亿美金布局 AI 极致推理芯片迎风口?

《科创板日报》2 月 1 日讯(记者 黄心怡)随着大模型行业逐渐从大规模训练阶段走向推理落地阶段,业内分析普遍认为,2026 年全球 AI 推理的需求将超过 AI 训练场景。

不久前,英伟达以 200 亿美元收购一家 AI 推理芯片初创企业 Groq 的技术授权,并把 Groq 核心团队招入囊中,来补全推理算力拼图。

在近日的采访中,曦望董事长徐冰向《科创板日报》记者判断称,至 2030 年,预计 AI 推理在整个 AI 计算市场将占到 80% 的份额,而聚焦于极致推理的 AI 芯片,未来会有更强的爆发性,并会对现有的算力系统造成冲击。

另有 AI 芯片产业链人士也对《科创板日报》记者表示,未来,推理请求量与并发数将大幅增加,推理算力需求呈指数级攀升。

▍推理算力需求呈指数级攀升

" 现阶段正处于以智能体为代表的人工智能新应用爆发初期,未来推理请求量与并发数大幅增加,推理算力需求呈指数级攀升。" 一名 AI 产业链人士向《科创板日报》记者表示," 随着推理范式变化,AI 智能体将加速落地,其整体算力消耗可达同参数规模大语言模型的 10 倍以上,对智能算力的需求呈数量级跃迁。

目前,全球 AI 算力龙头正处于由训练转向推理的阶段。英伟达此前完成了对 AI 推理芯片公司 Groq 的收购,也是其迄今规模最大的一笔收购。

Groq 是一家专注极致推理的 AI 芯片企业,其创始人 Jonathan Ross 带领的谷歌 TPU 原班人马,用七年时间打造出 LPU(语言处理单元)架构,曾宣称其推理性能是英伟达 H100 GPU 10 倍,而成本仅为其十分之一。

此外,美国的 Etched.ai、Groq 等也是主打极致推理芯片路线的企业。这类公司的核心逻辑是,大模型架构已经收敛,因此放弃通用训练 GPU,更专注于打造最快的 AI 推理芯片。

在国内,也有企业瞄准这一方向。

近日,从商汤科技拆分独立的 AI 芯片企业——曦望 Sunrise,推出了聚焦于大模型推理的 GPGPU 芯片启望 S3。在 DeepSeek V3/R1 满血版等主流大模型推理场景中,S3 的单位 Token 推理成本较上一代降低约 90%。曦望的目标是把百万 Token 的推理成本降低至 1 分钱。为此,曦望联合商汤科技、第四范式等,发起 " 百万 Token 一分钱 " 推理成本计划。

曦望联席 CEO 王勇认为,AI 训练芯片赛道逐渐收敛,已经变成头部玩家的游戏。

" 如今,市场格局越来越清晰,能做预训练大模型的公司数量是有限的,因为门槛越来越高。而推理赛道还没有收敛。既有 AI 智能体,大语言模型,也有具身智能模型、世界模型等等,都会需要芯片来做推理任务。如果能把算力做到极致性价比,那么在下一代的芯片就占据了极有利的生态。"

▍ AI 应用或借力春节加速落地

从市场格局来看,相比英伟达在训练端一家独大。在推理端,由于对成本和能效的极致追求,技术路线呈现出百花齐放的态势,为国产 AI 芯片厂商带来机遇。

对于后续国产 AI 芯片的市场格局,曦望联席 CEO 王湛认为,英伟达的市值达到 4 万亿美金,而中国或许将出现多家市值数千亿,甚至万亿人民币的 GPU 公司。

"相较于美国,中国 AI 产业呈现出较为明显的区域化发展特征 , 国内不同 GPU 企业在各自优势地域市场占据主导. 而互联网巨头们除自研芯片外,也在采购国产芯片,并已形成各自的深度合作伙伴关系。尽管中国 GPU 企业的总市值可能难以达到英伟达 4 万亿美元的高度,但即便以 4 万亿人民币计算,市场依然蕴藏着巨大的增长空间。"

当前,AI 产业链企业的高估值,也引发了市场担忧。曾领导瑞士银行商品策略团队的英国分析师朱利安 · 加兰认为,美国的资本配置不当,AI 泡沫的狂热是互联网泡沫的 17 倍,2008 年房地产泡沫的 4 倍。

曾经历过互联网泡沫破灭的王湛认为,"当时的互联网泡沫之所以形成,很大程度上是因为尽管市场概念火热,实际用户规模却非常有限。如今,AI 应用的月活用户规模已经破亿,其增长速度和行业渗透率,远超当年的互联网产品,也比整个互联网浪潮来得更快、更迅猛。"

目前,百度、腾讯先后宣布旗下 AI 应用将在今年春节期间发放数亿元红包。阿里旗下的通义千问也计划加入红包促销行列。花旗在研报中表示,回顾以往,春节活动能有效帮助互联网大厂为其消费级应用吸引大量关注。预计在今年的一系列新春推广活动后,中国 AI 应用的普及进程有望进一步加速。

王湛也看好春节对于 AI 应用的助推作用。" 除了腾讯、百度等的红包促销,不少机器人也要上春晚。今年春节过完,中国的 AI 渗透率、使用率会进一步的提升,这也代表整个 AI 产业价值的提升。"

在现阶段的 AI 产业架构中,最底层的芯片拿到了绝大部分价值。徐冰表示,AI 芯片占据了整个 AI 产业价值 70% 甚至 90%,这是现状。展望未来, AI 芯片或许仍会占据整体 AGI(通用人工智能)价值的大头。

" 试想一下,一旦 AGI 时代真的到来,机器人的数量会超过人类。这些机器人需要进行 7 × 24 小时的推理,所有的这些应用,包括物理 AI、多模态等,会让推理的需求变得没有天花板。随着 AGI 时代的来临,我们需要构建一个推理的算力网络,让普惠的推理算力,能够为每一台机器人,每一台终端设备,每一个消费者,每一个企业所用。"

相关标签

相关阅读

最新评论

没有更多评论了
科创板日报

科创板日报

上交所科创板电报,股市行情报道

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容