
在 Artificial Analysis 综合榜单上,GLM-5.2 取得了 51 分的高分成绩,在所有可用模型中排名前列,表现比肩 Claude Opus 4.8,同时位居全球开源模型第一。
而随着 GLM-5.2 的发布,加之此前 Anthropic 前沿模型突遭美国出口管制禁令,一场关于中美大模型 " 追赶时间表 " 的公开辩论,也在海外社交媒体上激辩上演,甚至吸引到了全球首富马斯克和智谱创始人唐杰的参与。
6 月 18 日,一名 X 平台用户向独立 AI 研究员 Teortaxes 抛出核心疑问:" 中国大模型何时能达到 Anthropic ‘ Fable ’级别的能力?"
Fable 5 是 Anthropic 迄今向公众开放的最强模型,因强大的长任务处理与代码工程能力引发关注。它属于 Mythos 模型的子模型,此前只对少数安全机构、关键基础设施公司和受信任研究者开放。该模型在网络安全方向能力极强,可以帮助防御者寻找软件漏洞,也可能帮助攻击者降低攻击成本。本月早些时候,美国政府以国家安全为由,要求暂停外国主体访问 Fable 5 和 Mythos 5。
对此,Teortaxes 给出的答案是 7 个月。

相比之下,马斯克的预判则相对更为保守。他给出的时间表是可能在明年一季度 ( Probably Q1 ) 。



据智谱方面本周早些时候向《科创板日报》记者介绍,GLM-5.2 是该公司迄今能力最强的开源模型,核心只做了两件事:即把 1M token 上下文从 " 纸面参数 " 做成 " 生产可用 ";同时把长程 Coding 能力再往前推了一步。
北京计算机学会 AI 专委会秘书长、北京大学特聘研究员张有鱼告诉《科创板日报》记者,智谱 GLM-5.2 的发布标志着国产模型在编程细分场景取得了关键性突破。
首先,打破双寡头垄断,依托登顶全球编程基准的实测表现与高性价比,GLM-5.2 在长上下文编程场景下优势显著,正在重塑行业格局,催生智谱、OpenAI、Anthropic 三方鼎立的 " 新御三家 "。
其次,虽未能实现全维度超越,但在目前多数中高频的实际开发场景下,该模型已完全可以作为海外头部模型的替代方案。" 但是核心短板仍存,在深度的数理逻辑推理与跨领域知识的复杂融合上,GLM-5.2 与海外最顶尖水平相比仍存在一定的技术代差,这是下一步需要重点攻坚的方向。"
惊人的低成本
即便依然存在部分性能上的短板,但中国 AI 大模型在另一领域的优势,其实已经愈发受到了全球 AI 行业的瞩目——那就是成本。
X 平台用户 Hassan 周四就表示,GLM-5.2 模型在设计方面简直太疯狂了。
" 我让 GLM 5.2 ( 左图 ) 和 Opus 4.8 ( 右图 ) 帮我做一个登陆页面,你甚至分不出两者的区别。GLM 成本 0.06 美元,而 Opus 成本高达 0.49 美元。成本低了 6 倍以上,同时还更快、更节省 token。这是开源 AI 的又一次胜利。"

据初创公司 Vercel 披露,在其平台上,DeepSeek 的 AI 使用份额已从 4 月份的区区 1% 飙升至 5 月份的 17%。在另一家处理 AI 查询的初创公司 OpenRouter 平台上,自 5 月中旬以来,DeepSeek 已经牢牢霸占了最常用 AI 模型厂商的宝座。
对此,知名财经博客网站 zerohedge 表示,这也许是世界上最重要的图表:人工智能军备竞赛。

无论如何,当大模型的竞赛从单纯的 " 参数与高墙 " 转向 " 实用、开源与性价比 ",以智谱 GLM-5.2 为代表的中国力量,正在用超出外界预期的迭代速度,重写全球 AI 竞争的游戏规则。