关于ZAKER Skills 合作
硅星人 9分钟前

GLM 5.2:给国产模型追赶 Anthropic 又提了一口气

开源,曾是美国科技产业最值得骄傲的发明之一。

1984 年,麻省理工学院人工智能实验室里,一位留着大胡子、眼神倔强的程序员彻底被激怒了。打印机坏了,厂商却不肯交出源码。他一气之下辞掉体面的工作,写下 GNU 宣言。Richard Stallman 或许不会想到,这份带着理想主义怒气的檄文,会在接下来的四十年里,重塑整个软件世界的权力格局。

美国曾经是开源运动最肥沃的土壤。1991 年,一个芬兰学生在 Usenet 上发布了一段操作系统内核代码,但真正让 Linux 从极客玩具变成全球互联网基础设施的,是美国企业的接力和背书。IBM 投入十亿美元,Red Hat 靠它上市,Google 用它跑起了搜索帝国。

然后,时间来到 2026 年 6 月 11 日。

一封来自美国商务部长的信,寄到了 Anthropic CEO Dario Amodei 的案头。信件内容很短,语气却不容置疑:以国家安全权限为由,暂停所有外国人对 Fable 5 和 Mythos 5 模型的访问。限制范围极广,不仅包括境外用户,也包括身在美国境内的外国人,甚至包括 Anthropic 自己的外籍员工。没有公开技术细节,没有申诉窗口,48 小时内执行。

两天后,6 月 13 日,智谱发布声明:GLM-5.2,将于下周正式开源。它支持 100 万 token 上下文,是智谱目前最强模型,采用 MIT 协议,无任何地域限制。

官方声明里这样写到:

" 在一些前沿模型突然变得不可用的时刻,我们选择了另一条路:前沿智能不应只属于少数人,也不应被少数规则随时收回。它应该开放、可用、可构建,并服务于每一位开发者。"

来自中国的开源模型,已经成了这一轮 AI 浪潮里,开放普惠的代表。他们在努力提供紧跟前沿闭源模型的能力给所有人,而现在是时候更加高举高打和更激进的推动这件事了。

当然,宏大叙事归宏大叙事。GLM-5.2 到底好不好用,最终还是要靠实测说话。

以下是我们第一时间的实测。

我们选了智谱刚刚发布的 ZCode 3.0 作为测试台。它全面切换了自研的 ZCode Agent 内核,对满血 GLM 做了深度优化,长程推理、工具调用和大型工程执行链路都针对 GLM 系列做了专门调校。

测试 1:动态月相时钟

Plain Text 请用 HTML/CSS/JavaScript 写一个复杂的纯 SVG 动画,不使用 Canvas,不使用外部图片。主题是 " 机械天文钟 "。要求:SVG 中包含至少 5 个同心圆层级:外圈刻度环、星轨环、齿轮层、月相层、中心指针层。至少有 6 个齿轮,其中相邻齿轮旋转方向相反,转速不同,齿轮必须有真实齿形,不要只画普通圆。外圈要有 60 个分钟刻度和 12 个小时刻度,刻度必须用程序生成或结构化生成。星轨上有若干光点沿椭圆轨道运动,运动路径要平滑。月相盘需要周期性变化,至少表现新月、半月、满月之间的过渡。中心有三根指针,分别以不同速度旋转。加入 hover 交互:鼠标移到不同环层时,该层高亮并显示简短标签。加入控制面板:暂停 / 继续动画、调节速度、切换日夜主题。视觉上要精致,有渐变、阴影、发光或滤镜,但不能影响可读性。代码要结构清晰,避免重复,动画性能稳定。最终输出一个可直接运行的完整 HTML 文件。

GLM5.2 以单 HTML 文件完成了一座机械天文钟,约 925 行纯前端代码,零外部依赖。技术栈越薄,视觉的担子越重——齿轮齿形、月相明暗线、星轨椭圆,全靠 SVG path 一笔笔算出来,没有贴图,没有 Canvas 兜底。

它没有走 " 挤牙膏 " 式的增量开发,第一发就一口气写完整整 900 行骨架:五层同心 SVG、七颗齿轮、60 分钟刻度、椭圆星轨、月相盘、三速度指针、控制面板全部搭通,首版打开即转。

随后它自己 review 了一遍代码,挖出三个真 bug 并逐一修复。

最值得一提的是,GLM5.2 不堆屎山,发现错了敢整段重写

以月相为例,第一个版本 GLM5.2 用的是 mask 配一个位移缩放的阴影圆,函数里还留着多行被注释掉的试错推导,半月时分界不是直线,新月时压根遮不住。它没有继续在 mask 上凑手感,而是直接推倒,换成 terminator 双弧 path。改完不靠感觉验收,而是拿四个边界相位打表验证:新月亮区恰好为零、上弦右半圆、满月整圆、下弦左半圆,全部吻合。

但 GLM5.2 生成的时钟,颜值上就很有进步空间了。

测试 2:互动点球大战

Plain Text

写一个单文件 HTML,用 Three.js + Cannon.js 做 3D 互动点球大战游戏。

场景:

- 逼真的球门和点球点,球场草地,后方看台有模糊的观众剪影

- 3D 足球(带纹理),守门员(简化骨骼模型或人形)站在门线上

玩法:

- 射门阶段(玩家):

- 鼠标拖拽控制射门方向(左右 + 上下弧线),拖拽距离决定力量

- 松开鼠标射门,足球按物理轨迹飞行(初速度 + 旋转引起的马格努斯效应弧线)

- 显示瞄准辅助线(虚线抛物线预测轨迹)

- 扑救阶段(AI):

- 守门员根据射门方向实时判断扑救方向

- AI 难度可调:简单(扑救延迟 0.3s)、普通(0.15s)、困难(几乎瞬发但有 5% 失误率)

- 五轮制,每轮交替玩家射门和 AI 射门(AI 射门时玩家控制守门员左右移动 + 起跳扑救)

视觉效果:

- 足球旋转时纹理清晰可见

- 射门力量大时镜头轻微震动

- 进球后:球网物理摆动(Cannon.js 软体模拟或顶点动画),观众席粒子欢呼特效,比分牌翻转

- 扑出后:守门员做出扑球动作,球弹出底线

计分板:左上角显示玩家 vs AI 比分,射进 / 射失统计

输出:完整可运行的单 HTML 文件(Cannon.js CDN)。

GLM5.2 生成的游戏内容相当完整:五轮攻防、三档 AI 难度、拖拽射门配马格努斯弧线、AI 预判扑救、加时赛一应俱全。视觉上,草地是程序生成的,足球用真五边形拼接而成,1400 个观众剪影批量渲染。

值得关注的,是 GLM5.2 的开发思路:先让游戏能玩,再慢慢打磨。

第一步就把完整骨架搭了起来:射门、扑救、判定、回合切换全部跑通。后续遇到问题,每次修复都遵循一套清晰流程:发现问题 → 挖根因 → 给方案 → 调数值 → 跑语法检查。

举个例子。CapsuleGeometry 在老版本 Three.js 里并不存在,GLM5.2 直接诊断出 r128 的 LatheGeometry 是 ES6 class、不能用 .call ( ) 借调,于是改用 extends + super,然后逐个验证:构造成功、形状正确、node --check 通过。

GLM5.2 还会根据语言特性做针对性设计,像个有经验的老手。比如守门员被刻意不放进物理引擎,而是手写距离检测,巧妙避开了 Cannon.js 那种鬼畜弹跳,彻底解决了 " 球穿门将 " 的 bug。

最值得一提的,是它做动画优化的方式,直接找专业文献。

门将扑救动作的早期版本很僵硬:先是 " 起跳 ",再改成 " 横飞 ",还是不够自然。GLM5.2 没有凭感觉硬调,而是去查了 Ibrahim et al。 (2019) 等关于西甲精英门将扑救生物力学的研究,直接从论文里提取出真实的时间参数——对侧腿蹬地发力 0.12 秒 → 重心横移 0.18 秒 → 手臂鞭打伸展 0.25 秒。

据此,它把动画拆成三阶段重写:身体压缩蓄力 → 躯干弹射横移 → 手臂直线伸展够球。每一帧的旋转方向都用数值方法验证过,确保脚、腿、躯干、手始终成一条直线、朝着球飞去。

我把 GLM5.2 引用的每个数据源都打开检查过,一个也没有瞎编,都是真实存在的网页。

测试 3:做一个迷你 Excel

这个项目主要让 GLM5.2 做一个零依赖、单文件 HTML 的简化版 Excel,可在浏览器中直接打开运行,具备核心电子表格能力:网格编辑、公式引擎、撤销重做、剪贴板、CSV 导入导出等,是一个比较综合的项目。

GLM-5.2 跑了一小时,把 Excel 桌面端核心体验——用浏览器还原。

可以实现完整的编辑功能,单击 / 双击 /Enter 切换状态,方向键、Tab、PageUp/Down、Ctrl+Home 全套快捷键等。用 TS 实现公式引擎,递归下降解析 + 相对 / 绝对 / 混合引用 + 30+ 函数。常用的工具栏,像加粗 / 斜体 / 对齐、5 种数字格式、60 步撤销重做。

参考这个项目来看,GLM-5.2 并非没有问题,它在架构设计上有相当扎实的工程能力,但执行节奏严重失衡。比如 14 分钟过去,可见产出还停留在 " 设计讨论 + 零散代码片段 ",从未真正写出可运行的 HTML 文件。

换句话说,GLM-5.2 是一个想得很多的模型。三思而后行是优点,但如果最后没把功能跑出来,再深的思考也只停留在原地。

我在使用的时候,经常会怀疑是不是模型卡住了,忍不住让其暂停,再输入继续指令。

写在最后

客观来看,GLM-5.2 与 Claude 等国际顶尖模型相比,仍然存在差距。它的界面审美有待提升,复杂任务中有时会长时间思考,迟迟不输出可运行代码。

但重要的是,它证明了另一件事:国产大模型已经具备了实实在在的工程能力。

GLM-5.2 能在无外部依赖的情况下,一次生成 900 多行可运行的 SVG 机械钟代码;能在发现自身 bug 后主动推倒重写;能在 Three.js 和 Cannon.js 的技术坑里自主定位问题;也能花费一小时,在纯浏览器环境中复刻 Excel 的核心体验。

更关键的是,智谱选择了一条稳定开源的路线。

GLM-5.2 让 " 能用的国产模型 " 从口号变成了可运行的代码。用户不需要申请特殊权限,不必担心某天清晨醒来发现 API 被突然掐断,也不需要在阅读文档前签署一份出口合规声明。

它在此前已经是国产模型 coding 最强的 GLM-5.1 基础上,又有明显进步,整体变得更加能打。

在 Anthropic 和 OpenAI 最近的模型眼看又要拉开差距的时刻,它的确能给所有国产模型提一口气。

相关标签
ai

最新评论

没有更多评论了
硅星人

硅星人

硅是创造未来的基础,欢迎登陆硅星球。

订阅

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容