文 | 字母 AI
Anthropic 终于把 Mythos 推向了公开市场,但分层发售。
凌晨,Anthropic 正式发布 Claude Fable 5 和 Claude Mythos 5。前者面向普通用户开放,后者则继续限制在 " 受信任的安全合作伙伴 " 范围内。

从 Haiku(俳句)到 Sonnet(十四行诗)再到 Opus(艺术巨著),Anthropic 一直在用文学和艺术概念给模型分层,到了 Mythos,名字已经从文学作品膨胀到 " 神话 " 本身。
Fable 来自拉丁语 fabula,意思是 " 被讲述之物 ",和希腊语 mythos 同源,直译过来的话一般被称为 " 寓言 "。这个名字正如新模型的定位,一个 "Mythos 级 " 的模型,一个 " 公开的神话 "。
按照 Anthropic 的描述,Fable 5 和 Mythos 5 共享同一个底层模型,只是被装进了更适合公开分发的安全壳里。在官方给出的模型能力上,它们两个被放在同一个位置。

01 被改写的 " 神话 "
神话被改写、被压缩、被加上训诫之后,变成了寓言。
按照官方文档,Fable 5 是公开版本。它面向普通用户和开发者开放,但在网络安全、生物、化学以及模型蒸馏等高风险领域,会由额外的安全分类器介入。一旦系统判断请求可能涉及这些敏感方向,回答就不会由 Fable 5 继续完成,而是自动回退到 Claude Opus 4.8。
Mythos 5 基于同样的底层模型,但在部分领域解除了 Fable 5 的护栏。Anthropic 称,Project Glasswing 里的网络安全合作伙伴可以使用 " 满血版 "Mythos 5;未来,部分生命科学研究者也可能通过受信任访问计划,使用解除生物和化学限制的版本。
用不到的 Mythos 我们暂时不提,先看点实在的东西。
首先是定价,一个字,贵。
Fable 5 的定价是输入 10 美元 / 百万 token,输出 50 美元 / 百万 token。开发者现在就可以通过 Claude API 调用 claude-fable-5(模型名)。
这个价格刚好是 Opus 4.8 的两倍,和 Opus 4.8 的 fast mode 相同,Anthropic 显然把它放在了比 Opus 更高一档的价格层级里。
不过 Anthropic 称,这一价格不到此前 Claude Mythos Preview 的一半——但由于 Mythos Preview 并非公开 API 模型,官方并未给出面向公众的标准价,这句话也无从验证。
订阅用户也需要注意,Fable 5 不一定会长期直接包含在基础订阅包里。
Anthropic 在官方说明中提到,6 月 23 日以后,即使用户已经订阅 Claude,Fable 5 也可能根据算力情况按量提供,不一定会直接包含在基础订阅服务中。
这公司越来越吝啬了,不过好歹还留了小半个月试用期。官方也留了一点余地:如果 6 月 23 日以后算力资源足够,Anthropic 会尽量把 Fable 5 继续包含在 Pro、Max 等订阅服务里。

从跑分上看,Fable 5/Mythos 5 基本是 Anthropic 目前公开表里最强的一档。
不过官方表格有一个说明,Claude Fable 5 和 Claude Mythos 5 的分数一般只差 1 – 3 个百分点(除了带星号的网络安全、生物相关测试),所以表里显示的是两者更高的分数。这一点很难不让人想要吐槽。

软件工程是最突出的场景之一,根据表格,Fable/Mythos 5 在 SWE-Bench Pro 上达到 80.3%,明显高于 Opus 4.8 的 69.2%;在更难的 FrontierCode Diamond 上,它拿到 29.3%,而 Opus 4.8 只有 13.4%,GPT-5.5 只有 5.7%。


一类是标准化 benchmark。官方表格显示,Fable/Mythos 5 在 GDPval-AA 上得分 1932,高于 Opus 4.8、GPT-5.5 和 Gemini 3.1 Pro;在 GDP.pdf 这种带视觉理解的文档任务上,它达到 29.8%,也超过其他主要模型。
另一类是早期客户测试。Anthropic 称,Fable 5 在 Hebbia 的高级金融推理基准上取得最高分,优势集中在文档推理、图表和表格理解、问题求解;IMC 也反馈,它在交易分析评估中几乎全面通过。
为了展示 Fable 5 的视觉能力,Anthropic 举的例子是:此前 Claude 模型需要复杂辅助工具才能玩《宝可梦 火红》,而 Fable 5 只靠视觉输入就可以通关。

在《杀戮尖塔》这类需要连续决策和长期策略的游戏里,如果给 Fable 5 接入持久文件记忆,让它能记录前面的选择和经验,它的表现会明显提升。提升幅度是 Opus 4.8 的三倍,到达最终关卡的次数也提高了三倍。
顺便一提,Fable 也是一款经典 RPG 游戏的名字,中文译作《神鬼寓言》——或许某天我们能看到 Fable 玩《Fable》。
另外,网络安全能力方面,Fable/Mythos 5 在 ExploitBench Cap% 上达到 78.0%,超过 Claude Mythos Preview 的 69.0%,接近 Opus 4.8 的两倍。
这里用的应该是 Mythos 5 的得分,因为 Fable 5 在高风险请求上会回退到 Opus 4.8。
02 强大的模型必须分层
Anthropic 这次把模型能力的直观展示放到了一个类似 " 作品集 " 的滑页里,并且每个 demo 只给了一小段注释。


Anthropic 用这个例子说明,Fable 5 可以在一个开放环境里制定策略,并持续推进一个复杂系统的建设。

这个 demo 的重点在于 Fable 5 完成了一个闭环:先创造工具,再使用工具,最后完成一个实体设计任务。


如果说这部分展示的还是 Fable 5 在开发者手里能做到什么程度,后面的部分说的就是 Mythos 5 在研究者手里能做什么——以及 Anthropic 为什么要把 Fable 和 Mythos 分开。
Anthropic 称,在内部蛋白设计专家的评估中,Mythos 5 把药物设计流程中的部分环节加速了大约 10 倍。其中一个案例里,Mythos 5 接入蛋白设计和生物信息学工具、没有人类帮助,就可以匹配甚至超过熟练人类操作员。
在该任务中,Mythos 5 做的不是简单问答,而是完成一整套科学工作流:选择结合位点,选择并运行蛋白设计工具,在失败后自己恢复。官方称,在这项研究的 14 个蛋白靶点中,有 9 个产生了强候选分子,目前正在进一步研究。

与此同时,Mythos 5 的一个关于大肠杆菌蛋白的新机制的假设,在另一家独立研究同一问题的实验室的研究中得到了证实。
它甚至还做了一项基因组学研究。
Anthropic 称,Mythos 5 在一周多的时间里,几乎自主完成了一项新的基因组学研究。它整理了横跨 138 种动物、数百万个细胞的单细胞数据,并设计、训练了一个定制机器学习模型,用来识别不同物种中执行相同角色的细胞。
更夸张的是,Anthropic 称,Mythos 5 训练出的模型性能超过了近期发表在《Science》上的一个模型,尽管它的规模只有后者的百分之一。Anthropic 表示,计划在未来几个月发表这些结果。
当然,这部分还需要等待论文和外部复核。但如果只看 Anthropic 官方给出的信息,Mythos 5 在生命科学里展示的能力已经接近科研 Agent:能读问题、用工具、处理数据、训练模型、提出假设,并把一项研究推进到可以发表的程度。
而一旦模型可以在药物设计、病毒载体、蛋白设计、基因组学研究这些方向里真正推进任务,它就天然具备双重用途。
可以认为,生命科学这部分不是 Fable 5 的普通功能演示,而是 Mythos 5 的能力上限展示。
但它被展示出来,是为了说明 Anthropic 手里的这套底层模型,已经强到了必须通过受信任访问来分发。
有意思的是,过去的模型发布更像是一件技术产品的事:参数、跑分、价格、上下文长度、API 名称。强就是强,发布就是发布。
但到了 Mythos 这里,事情开始变得复杂。同一个底层模型被分为两个版本,普通用户拿到的是 Fable 5,安全研究者和部分生命科学研究者拿到的是 Mythos 5;前者被装进更严格的护栏里,后者则需要受信任访问。
模型能力不再只有高低之分,也开始有权限、场景和责任之分。
某种意义上来讲,可以看作前沿模型商业化进入新阶段的信号——越强的模型,越不可能直接扔给所有人。它们会被拆成不同版本,放进不同安全边界,再交给不同类型的用户。
Anthropic 先这么做了,因为它们的模型 " 强到不能完全公开 "。未来其它想要讲故事的公司,想要证明自己的模型也很强,或许也会效仿这种方式。