公开版 Mythos 上线，Claude 最强模型开始分层发售

文 | 字母 AI

Anthropic 终于把 Mythos 推向了公开市场，但分层发售。

凌晨，Anthropic 正式发布 Claude Fable 5 和 Claude Mythos 5。前者面向普通用户开放，后者则继续限制在 " 受信任的安全合作伙伴 " 范围内。

新模型的命名可以说很符合 Claude 一贯的风格。

从 Haiku（俳句）到 Sonnet（十四行诗）再到 Opus（艺术巨著），Anthropic 一直在用文学和艺术概念给模型分层，到了 Mythos，名字已经从文学作品膨胀到 " 神话 " 本身。

Fable 来自拉丁语 fabula，意思是 " 被讲述之物 "，和希腊语 mythos 同源，直译过来的话一般被称为 " 寓言 "。这个名字正如新模型的定位，一个 "Mythos 级 " 的模型，一个 " 公开的神话 "。

按照 Anthropic 的描述，Fable 5 和 Mythos 5 共享同一个底层模型，只是被装进了更适合公开分发的安全壳里。在官方给出的模型能力上，它们两个被放在同一个位置。

但跑分归跑分，如果 Fable 和 Mythos 的表现完全一样，我想应该也不用分成两个名字了。

01 被改写的 " 神话 "

神话被改写、被压缩、被加上训诫之后，变成了寓言。

按照官方文档，Fable 5 是公开版本。它面向普通用户和开发者开放，但在网络安全、生物、化学以及模型蒸馏等高风险领域，会由额外的安全分类器介入。一旦系统判断请求可能涉及这些敏感方向，回答就不会由 Fable 5 继续完成，而是自动回退到 Claude Opus 4.8。

Mythos 5 基于同样的底层模型，但在部分领域解除了 Fable 5 的护栏。Anthropic 称，Project Glasswing 里的网络安全合作伙伴可以使用 " 满血版 "Mythos 5；未来，部分生命科学研究者也可能通过受信任访问计划，使用解除生物和化学限制的版本。

用不到的 Mythos 我们暂时不提，先看点实在的东西。

首先是定价，一个字，贵。

Fable 5 的定价是输入 10 美元 / 百万 token，输出 50 美元 / 百万 token。开发者现在就可以通过 Claude API 调用 claude-fable-5（模型名）。

这个价格刚好是 Opus 4.8 的两倍，和 Opus 4.8 的 fast mode 相同，Anthropic 显然把它放在了比 Opus 更高一档的价格层级里。

不过 Anthropic 称，这一价格不到此前 Claude Mythos Preview 的一半——但由于 Mythos Preview 并非公开 API 模型，官方并未给出面向公众的标准价，这句话也无从验证。

订阅用户也需要注意，Fable 5 不一定会长期直接包含在基础订阅包里。

Anthropic 在官方说明中提到，6 月 23 日以后，即使用户已经订阅 Claude，Fable 5 也可能根据算力情况按量提供，不一定会直接包含在基础订阅服务中。

这公司越来越吝啬了，不过好歹还留了小半个月试用期。官方也留了一点余地：如果 6 月 23 日以后算力资源足够，Anthropic 会尽量把 Fable 5 继续包含在 Pro、Max 等订阅服务里。

定价高本身并非难以理解，但它最好保证它的能力配得上它的价格。

从跑分上看，Fable 5/Mythos 5 基本是 Anthropic 目前公开表里最强的一档。

不过官方表格有一个说明，Claude Fable 5 和 Claude Mythos 5 的分数一般只差 1 – 3 个百分点（除了带星号的网络安全、生物相关测试），所以表里显示的是两者更高的分数。这一点很难不让人想要吐槽。

Anthropic 把 Fable 5 的重点放在几个方向：软件工程、知识工作、视觉、长上下文记忆和生命科学研究。

软件工程是最突出的场景之一，根据表格，Fable/Mythos 5 在 SWE-Bench Pro 上达到 80.3%，明显高于 Opus 4.8 的 69.2%；在更难的 FrontierCode Diamond 上，它拿到 29.3%，而 Opus 4.8 只有 13.4%，GPT-5.5 只有 5.7%。

知识工作和视觉任务上，Anthropic 给出了两类证据。

一类是标准化 benchmark。官方表格显示，Fable/Mythos 5 在 GDPval-AA 上得分 1932，高于 Opus 4.8、GPT-5.5 和 Gemini 3.1 Pro；在 GDP.pdf 这种带视觉理解的文档任务上，它达到 29.8%，也超过其他主要模型。

另一类是早期客户测试。Anthropic 称，Fable 5 在 Hebbia 的高级金融推理基准上取得最高分，优势集中在文档推理、图表和表格理解、问题求解；IMC 也反馈，它在交易分析评估中几乎全面通过。

为了展示 Fable 5 的视觉能力，Anthropic 举的例子是：此前 Claude 模型需要复杂辅助工具才能玩《宝可梦火红》，而 Fable 5 只靠视觉输入就可以通关。

长任务和记忆能力上，Anthropic 称，Fable 5 可以在数百万 token 的长期任务中保持专注，并利用自己的笔记改进输出。

在《杀戮尖塔》这类需要连续决策和长期策略的游戏里，如果给 Fable 5 接入持久文件记忆，让它能记录前面的选择和经验，它的表现会明显提升。提升幅度是 Opus 4.8 的三倍，到达最终关卡的次数也提高了三倍。

顺便一提，Fable 也是一款经典 RPG 游戏的名字，中文译作《神鬼寓言》——或许某天我们能看到 Fable 玩《Fable》。

另外，网络安全能力方面，Fable/Mythos 5 在 ExploitBench Cap% 上达到 78.0%，超过 Claude Mythos Preview 的 69.0%，接近 Opus 4.8 的两倍。

这里用的应该是 Mythos 5 的得分，因为 Fable 5 在高风险请求上会回退到 Opus 4.8。

02 强大的模型必须分层

Anthropic 这次把模型能力的直观展示放到了一个类似 " 作品集 " 的滑页里，并且每个 demo 只给了一小段注释。

比如，Fable 5 写了一个太阳系模拟，从物理第一性原理推导行星轨道运动，并用它预测日食。

又比如，它可以自主玩《异星工厂》。这是一款工程师很爱的工厂自动化游戏，玩家要采集资源、规划生产线、搭建物流和能源系统。

Anthropic 用这个例子说明，Fable 5 可以在一个开放环境里制定策略，并持续推进一个复杂系统的建设。

在另一个 demo 里，Fable 5 先做了一个基于浏览器的 CAD 编辑器，然后又使用这个由自己开发的 CAD 工具，设计了一个可以 3D 打印的完整模型。这个编辑器里还内置了 AI copilot，用来辅助建模。

这个 demo 的重点在于 Fable 5 完成了一个闭环：先创造工具，再使用工具，最后完成一个实体设计任务。

最后一个 demo，Anthropic 展示了一个由 Fable 5 写出来的流体模拟，运动节奏和一段古典音乐 EDM remix 同步。官方还特意提到，音乐也是 Fable 5 用代码生成的。

这些案例看起来挺花哨，但意思是一样的：Fable 5 很擅长把代码、视觉、物理、设计和长期规划混在一起做任务。

如果说这部分展示的还是 Fable 5 在开发者手里能做到什么程度，后面的部分说的就是 Mythos 5 在研究者手里能做什么——以及 Anthropic 为什么要把 Fable 和 Mythos 分开。

Anthropic 称，在内部蛋白设计专家的评估中，Mythos 5 把药物设计流程中的部分环节加速了大约 10 倍。其中一个案例里，Mythos 5 接入蛋白设计和生物信息学工具、没有人类帮助，就可以匹配甚至超过熟练人类操作员。

在该任务中，Mythos 5 做的不是简单问答，而是完成一整套科学工作流：选择结合位点，选择并运行蛋白设计工具，在失败后自己恢复。官方称，在这项研究的 14 个蛋白靶点中，有 9 个产生了强候选分子，目前正在进一步研究。

Anthropic 还提到，Mythos 5 可以稳定提出新颖、有吸引力的分子生物学假设。在和 Opus 级模型的盲测对比中，内部科学家大约 80% 的时候更偏好 Mythos 提出的假设，其中一些已经进入实验评估。

与此同时，Mythos 5 的一个关于大肠杆菌蛋白的新机制的假设，在另一家独立研究同一问题的实验室的研究中得到了证实。

它甚至还做了一项基因组学研究。

Anthropic 称，Mythos 5 在一周多的时间里，几乎自主完成了一项新的基因组学研究。它整理了横跨 138 种动物、数百万个细胞的单细胞数据，并设计、训练了一个定制机器学习模型，用来识别不同物种中执行相同角色的细胞。

更夸张的是，Anthropic 称，Mythos 5 训练出的模型性能超过了近期发表在《Science》上的一个模型，尽管它的规模只有后者的百分之一。Anthropic 表示，计划在未来几个月发表这些结果。

当然，这部分还需要等待论文和外部复核。但如果只看 Anthropic 官方给出的信息，Mythos 5 在生命科学里展示的能力已经接近科研 Agent：能读问题、用工具、处理数据、训练模型、提出假设，并把一项研究推进到可以发表的程度。

而一旦模型可以在药物设计、病毒载体、蛋白设计、基因组学研究这些方向里真正推进任务，它就天然具备双重用途。

可以认为，生命科学这部分不是 Fable 5 的普通功能演示，而是 Mythos 5 的能力上限展示。

但它被展示出来，是为了说明 Anthropic 手里的这套底层模型，已经强到了必须通过受信任访问来分发。

有意思的是，过去的模型发布更像是一件技术产品的事：参数、跑分、价格、上下文长度、API 名称。强就是强，发布就是发布。

但到了 Mythos 这里，事情开始变得复杂。同一个底层模型被分为两个版本，普通用户拿到的是 Fable 5，安全研究者和部分生命科学研究者拿到的是 Mythos 5；前者被装进更严格的护栏里，后者则需要受信任访问。

模型能力不再只有高低之分，也开始有权限、场景和责任之分。

某种意义上来讲，可以看作前沿模型商业化进入新阶段的信号——越强的模型，越不可能直接扔给所有人。它们会被拆成不同版本，放进不同安全边界，再交给不同类型的用户。

Anthropic 先这么做了，因为它们的模型 " 强到不能完全公开 "。未来其它想要讲故事的公司，想要证明自己的模型也很强，或许也会效仿这种方式。

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

公开版 Mythos 上线，Claude 最强模型开始分层发售

宙世代

一起剪

相关阅读

iOS 27新增多项功能 钱包、照片、地图迎来显著升级

台积电CFO：不排除调涨芯片价格 但不会突然暴涨四、五倍

张雪的机车，董路的足球，李亚鹏的医院，给阿嬷的情书，梁文锋的模型

雷军推荐的米家手持风扇今日开售：199元！100档风力可调

苹果iOS 27状态栏全面升级：电池/信号/Wi-Fi图标更圆润

Anthropic发布不具备执行网络安全任务能力的Mythos模型

政策+量产双重加持 机器人产业链公司有望逐步兑现业绩

iOS 27发布 苹果晒iOS 26升级率：79%的iPhone已升级 不及iOS 18

FPV无人机追拍朱雀二号起飞瞬间 网友：怎么追不上？

10轮融资、40亿估值 中科闻歌通过港交所聆讯 “通用决策大模型第一股”来了

贝莱德推出太空ETF，该行业已吸引80亿美元资金流入

GreenDot与osapiens达成战略合作，在欧洲推出AI驱动的EPR合规解决方案

腾讯、阿里等入股脑机接口研发商阶梯医疗；飞猪：端午假期入境游预订量同比增长超6倍；1—5月全国期货市场累计成交额同比增长40.13%

从机舱到户外，广东美妆在拼多多重新定义防晒

从章鱼保罗到300个AI：世界杯预测终于不是玄学

最新评论

钛媒体

热门推荐

企业资讯

iOS 27新增多项功能钱包、照片、地图迎来显著升级

台积电CFO：不排除调涨芯片价格但不会突然暴涨四、五倍

政策+量产双重加持机器人产业链公司有望逐步兑现业绩

iOS 27发布苹果晒iOS 26升级率：79%的iPhone已升级不及iOS 18

FPV无人机追拍朱雀二号起飞瞬间网友：怎么追不上？

10轮融资、40亿估值中科闻歌通过港交所聆讯 “通用决策大模型第一股”来了