文 | wiwi
7 月 1 日,Anthropic 正式向 Claude 免费版和 Pro 版用户推送 Sonnet 5,将其设为默认模型。这是 Anthropic 在过去十个月里第三次刷新旗舰编程模型,也是最 " 平价 " 的一次——但对相当一部分中国开发者来说,这条更新推送可能根本不会出现在他们的客户端里。
一、更便宜、更能 " 自己检查自己 " 的 Sonnet 5
按照 Anthropic 公布的信息,Sonnet 5 的定位是 " 用更低成本跑智能体 ":8 月 31 日前,输入 token 报价为每百万 2 美元、输出为每百万 10 美元;9 月 1 日起涨至 3 美元和 15 美元,即便如此,仍低于 Opus 4.8、GPT-5.5 和 Gemini 3.1 Pro 的同期价格。
能力上,Sonnet 5 在编码基准测试中拿到 63.2% 的成绩,介于上一代 Sonnet 4.6 的 58.1% 和旗舰 Opus 4.8 的 69.2% 之间;在知识型工作任务上,它的表现甚至略微超过了体量更大的 Opus 4.8。Anthropic 官方给出的产品叙事是 " 推理、工具使用、代码编写能力显著提升 ",能够自主完成多步骤任务,并且 " 不需要明确指示就会检查自己的输出 "。安全性方面,相较 Sonnet 4.6,新模型的不当行为、幻觉和 " 讨好式 " 回答倾向有所下降,但在高风险网络安全任务上的表现仍弱于 Opus 系列。
一句话概括:这是一款瞄准 " 日常自动化工作 " 的性价比模型,试图在成本和性能之间找一个更多开发者愿意付费的中间点。
问题在于,这个 " 更多开发者 " 的版图里,中国正在被逐步排除出去。
二、过去十个月,Claude 与中国渐行渐远
时间拨回 2025 年 9 月 5 日。Anthropic 刚完成 130 亿美元 F 轮融资两天,就宣布不再向中资持股超过 50% 的公司提供服务——不管这家公司注册在境内、香港,还是绕道新加坡子公司或第三方云服务中转,只要往上查股权最终由中国实体控制,都在被限制之列,俄罗斯、伊朗、朝鲜的企业也适用同一条规则。Anthropic 高管给出的解释是 " 堵住中国公司借道拿到前沿 AI 技术的口子 ",CEO 达里奥 · 阿莫迪此前也不止一次公开主张对中国采取技术遏制立场,尤其是在 DeepSeek 用高性价比模型搅动行业之后。当天,中国外交部发言人郭嘉昆在例行记者会上回应,中方 " 反对将科技与经贸问题政治化、工具化、武器化 ",这类做法 " 不利于任何一方 "。
这一纸禁令的直接后果,是大量中国开发者和企业 " 一夜之间被挡在全球头部大模型之外 ",尤其是失去了当时业界公认最强的编程模型 Claude Code 的使用权限。消息传开当天,X 平台上就有用户翻出旧账冷嘲:"Anthropic 融资的时候,拿的是中国私募股权基金的钱,现在他们不再为中国实体提供服务了,真是很搞笑。" 另一条被广泛转发的评论则直指双重标准:"Anthropic 作为一家模型公司,是可以审计所有对话与使用情况的。在明知这些海量中国用户既无恶意也无害处的情况下,还对国内用户采取了比 Google 更严格的风控措施,这是令人生厌的行为。"
如果说 2025 年 9 月是第一道闸门,那么 2026 年 3 月的政策收紧就是第二道。有报道指出,Anthropic 今年 3 月进一步升级了针对中国控股企业的风控措施,管得比第一次更宽、查得也更严;差不多同一时间,Anthropic 还公开指控部分中国大模型厂商通过 " 蒸馏 " 等手段套用其模型能力,一下把商业上的竞争摩擦捅成了公开对抗——这也引来了包括马斯克在内的海外舆论场不少争议声音。到这一步," 用 Claude 做产品 " 对中国团队来说,已经从 " 体验最好的选择 " 变成了一件要担心随时被断供、被查的事。
值得注意的是,这轮限制波及的不只是头部大厂。据相关报道,真正首当其冲的反而是些体量更小的团队:靠 Claude 做多语言客服优化的跨境 SaaS 公司、用它生成剧情脚本的游戏公司、拿它快速搭原型的 AI 初创团队——这些企业议价能力更弱,也更难在短时间内换掉整套技术栈。
三、社区逆向曝出的疑似检测逻辑:一次尚未被官方完整证实的争议
就在 Sonnet 5 上线前一天,Claude 和中国用户之间又添了一层疙瘩。需要先说明的是,以下内容主要来自 Reddit、GitHub 上的社区逆向分析,而非 Anthropic 官方的完整技术披露,本文统一采用 " 疑似 "" 据称 " 等克制措辞呈现,具体细节仍待公司方面进一步确认。
这件事最初的发现者,是一位 Reddit 用户 LegitMichel777。据报道,他本来只是想把 2.1.196 版本里被禁用的一个远程控制功能恢复回来,在反编译代码排查的过程中,意外碰到了一段和这个功能完全无关的逻辑——专门检查代理设置、系统时区、还有一份长长的域名清单。顺着这条线往下挖,他把结果整理成帖子发到了 Reddit 和 GitHub 上,才有了 2026 年 6 月 30 日这场风波。多篇逆向分析帖子和一份公开的 gist 指出,这段疑似检测逻辑最早可追溯到 2026 年 4 月 2 日发布的 2.1.91 版本,此后在 2.1.193、2.1.195、2.1.196 等版本中依然存在,但相关行为未出现在任何一份官方更新日志里。
根据这些逆向材料的描述,其运作方式大致是:当用户修改 ANTHROPIC_BASE_URL 环境变量、将 Claude Code 指向非官方 API 中转端点时,程序会读取代理域名,并与一份社区还原出的、约 147 条条目的清单进行比对——有分析者称,清单中出现了百度、阿里巴巴、蚂蚁集团、字节跳动、Moonshot AI、MiniMax、Stepfun 等公司名称相关的域名,以及一些 Claude 转售、镜像服务地址;需要强调的是,域名出现在这份检测清单里,并不等同于上述公司 " 实施了蒸馏攻击 " 或 " 被 Anthropic 认定为攻击者 ",这是两件需要严格区分的事。同时,系统还会读取本机时区,看是不是 Asia/Shanghai、Asia/Urumqi 这类中国时区。据称,这些标记信息不走常规的 telemetry 接口上报,而是藏进系统提示词里一些不易察觉的字符差异(比如日期格式、特殊标点)中,跟着正常请求一起传回服务器——这也是社区把它叫作 " 隐写术 " 的原因。
事件曝光后,Anthropic 员工 Thariq Shihipar 在 X 平台上作出回应,称这是公司今年 3 月启动的一项 " 内部实验 ",目的是 " 防止未经授权的经销商滥用账户,并抵御模型蒸馏行为 ",并表示团队已经想出了别的防护办法," 一直打算下线这项功能 ",相关回滚代码已经合并,将在后续版本中移除。这段回应等于确认了公司确实有一套针对代理滥用和模型蒸馏的防护机制,但没有逐条证实社区提到的 " 隐写编码 ""147 条清单 " 这些具体技术细节。
另一个背景是:Anthropic 此前向美国参议院银行委员会提交报告,指控与阿里巴巴 Qwen 团队相关的操作者,在 2026 年 4 月至 6 月间使用约 2.5 万个虚假账户对 Claude 发起大规模交互,试图借此提取模型能力。这目前仍主要是 Anthropic 一方的单方面指控,尚未见到独立的第三方核实,海外媒体报道多采用 "Anthropic 指控 ""Anthropic claims" 这类表述,本文同样只作为一方说法呈现。
这场风波之所以让开发者社区反应这么大,一部分原因是 Claude Code 手里握着用户完整的本地文件系统和 Shell 执行权限,用户愿意把这些权限交出去,前提就是相信它的行为是透明、可预期的。哪怕 Anthropic 的隐私政策里确实写了会收集系统与代理相关设置信息,社区还是普遍觉得:如果这些信息真是用不透明的方式编码回传、又长期没写进更新日志,光这一点本身就足够伤害用户的知情权了。
四、国产编程模型的 " 中场战事 "
断供之后留出的市场空白,几乎是被国内厂商用几周时间填上的。
Kimi K2 率先宣布兼容 Claude Code 协议,随后的更新版本将上下文窗口从 128K 提升到 256K;阿里 Qwen3-Coder 跟进推出编程模型并配套免费调用活动;智谱 GLM-4.5 不仅支持 Claude Code 生态,还打出 "50 元包月 " 的价格牌;DeepSeek V3.1 也开通了对 Anthropic API 协议的兼容支持。据行业媒体统计,目前国内可用的大模型数量已经超过 300 个,部分厂商提供的 Claude Code 兼容方案,价格仅为原版的七分之一左右。
这场 " 平替 " 竞赛已经不只是拼价格了。多家国产模型厂商不再满足于跟 Claude Code 比编程能力,而是把工具调用、多步骤自主决策、长任务连续执行这些 Agent 能力当成下一阶段的争夺焦点,想在智能体这个普遍被看作 " 下一个决胜场 " 的赛道上,从追赶者变成有话语权的一方。
对国内 AI 生态来说,这段被迫 " 断供 " 的经历有点像一体两面:一边是依赖 Claude 的中资企业要扛住性能下降、迁移成本上升、国际竞争力短期承压这些实打实的代价;另一边,禁令客观上把国产大模型的验证周期和商业化节奏都推快了,不少业内人士干脆把它称为 " 自主创新的历史机遇 "。
五、代码标注产业:被卷入的另一条战线
如果把镜头从模型本身拉远一点,会发现这场博弈还牵动着更基础的一层——数据与代码标注产业。
大模型练得好不好,说到底离不开标注数据喂得够不够、够不够好,编程模型尤其吃代码标注、指令微调数据和人工反馈这几样 " 原料 "。今年以来,国内数据标注行业正赶上政策和技术一起发力的窗口期:国家层面出台了专门文件推动这个行业往高质量方向走,行业内也在统一标注标准、评估各家做多场景落地的能力,想把过去那种偏体力活的人工标注,升级成能真正支撑大模型训练——尤其是代码和智能体训练——的专业服务。
Claude 这条路一步步收窄,国内编程模型厂商要靠自己的语料和标注体系去补上 Agent 能力、复杂代码理解能力这些短板,这客观上给国内代码标注、指令数据构建这类基础工作带来了新的需求。换句话说,模型这一层被 " 卡脖子 " 的压力,正在往上游的数据标注产业传导——谁能更快把高质量、大规模、面向智能体场景的代码标注能力建起来,谁就更有希望在下一轮国产编程模型的竞争里占到先手。
六、写在最后
Sonnet 5 的发布,从产品逻辑上看是 Anthropic 一次典型的 " 降本增效 " 动作:用更低的价格,把智能体能力铺得更广。但放在中美 AI 竞争的大背景下看,这次更新更像是一面镜子——它照出的不是 Claude 有多强,而是那些原本用惯了 Claude 的中国开发者,在过去十个月里已经走出了一条自己的路。
从 2025 年 9 月的第一次限制,到 2026 年 3 月的政策收紧,再到 6 月底社区曝出的疑似检测逻辑争议(这一环节仍待官方进一步说明),最后是眼下国产模型在编程与 Agent 赛道上的集体反扑,这条时间线正在讲述一个越来越清晰的故事:外部的技术闸门关得越紧、双方的信任摩擦越明显,国内大模型、编程工具乃至上游的数据标注产业链,被推着跑得也越快。
Sonnet 5 更新与否,对很多中国团队来说,可能已经不再是那道决定性的选择题了。
参考来源:
Anthropic launches Claude Sonnet 5 as a cheaper way to run agents - TechCrunch
美国 AI 公司 Anthropic 禁止中国控股企业使用服务,外交部回应 - 中国基金报
Claude Code apparently uses code to detect Chinese users: Is this fine? - Cybernews
Hidden code in Claude Code secretly flagged Chinese users - The Decoder
Anthropic's Claude Code Reportedly Uses Hidden Code to Detect Chinese Users - Cybersecurity News
国家发展改革委等部门关于促进数据标注产业高质量发展的实施意见 - 中国政府网