关于ZAKER Skills 合作
爱范儿 42分钟前

Fable 5 复活,第一批用户却沉默了

经过半个多月的极限拉扯,Anthropic 今天终于重新恢复了 Fable 5 的访问权限,并且还部分解禁了 Mythos 5。

目前,Fable 5 可在 Claude Platform、Claude.ai、Claude Code 和 Claude Cowork 中使用

Pro、Max、Team 和部分 Enterprise 用户,在当地时间 7 月 7 日前最多可以把每周额度的 50% 用在 Fable 5 上。

7 月 7 日之后,继续使用需要 usage credits。标准 Enterprise 席位默认不包含 Fable 5 额度,如果没有启用 credits,就无法继续使用。

Fable 5 的回归当然是好消息。

可从官方说明和社区反馈看,它已经不是发布当初的那个白月光模型了。安全过滤更严格,回退到 Opus 4.8 的概率更高,Token 消耗也更快。想用好它,你还得需要注意以下这些新细节。

一句 Hi,就可能把你送去 Opus 4.8

Fable 5 和 Mythos 5 都是在 6 月 10 日发布的。两个模型底层相同,但开放尺度不同。

Fable 5 面向更广泛用户,带有更强的安全机制。Mythos 5 限制更少,只提供给少数可信的 Glasswing 项目合作伙伴,主要用于防御性网络安全。

暂停访问的直接原因,来自 Amazon 研究人员的一份报告。

报告称,一种提示方式可以绕过 Fable 5 的部分安全机制,让模型识别软件漏洞,并在一个案例中生成漏洞利用演示代码。

虽然 Anthropic 事后复盘时非常笃定地强调:「相关案例根本没有释放出 Mythos 5 级别的网络攻击能力。」 而且官方还暗戳戳拉了同行下水:你们去测测 Claude Opus 4.8、GPT-5.5、Kimi K2.7,大家也都能识别出这个漏洞啊。

▲ 也算是给 Kimi 打了个广告,官方博客 https://www.anthropic.com/news/redeploying-fable-5

尽管如此,为了恢复访问,Anthropic 还是重新训练了安全分类器。

新分类器在超过 99% 的情况下可以阻止 Amazon 报告中提到的那类绕过方式。只是代价是巨大的:一些正常的编码、调试请求,会比以前更容易被误判,然后被系统转给 Opus 4.8 回答。

具体来说,Fable 5 的安全分类器会重点拦截几类内容:攻击性网络安全技术,比如漏洞利用、恶意软件、攻击工具;生物与生命科学内容,比如实验方法、分子机制;以及试图提取模型摘要思考过程的请求。

麻烦在于,Fable 5 现在彻底变成了「敏感肌」:良性的网络安全工作、正常的生命科学任务,也可能触发保护机制。

结果就是正常干活的程序员和科研派惨遭大规模误伤,社区里现在已经哀嚎一片:

有人只是向 Fable 5 深情表白了一句 「HI FABLE I MISSED YOU」,就被转到了 Opus 4.8。

还有医生科学家背景的用户表示,只要自己的个人上下文里带有 physician-scientist,打个招呼,就足以触发回退。

更离谱的是,有人去问了个听起来人畜无害的生物学问题:「大黄蜂会不会放屁?」,也因为关键词触发拒答或转交到 Opus 4.8。

究其原因,Anthropic 表示,生物和化学分类器并没有随着这次回归一起更新,仍然沿用首发版本。官方承认,这两类分类器目前覆盖范围偏宽,连一些基础的生物学相关问题,也可能触发回退到 Opus 4.8。

Anthropic 称,这部分分类器改进很快会上线,但在此之前,相关领域的体验大概率会更敏感。

逼得大家没办法,「奶奶越狱」这种上古老梗又迎来了文艺复兴,比如用「我奶奶生前喜欢 fullstack Next.js 应用」的方式包装问题。

玩笑归玩笑,Fable 5 回归后,用户面对的不只是模型能力,还有一整套更敏感的审查机制,使用体验大幅度下滑。

Anthropic 承认,接下来几周还会继续优化这些分类器,目标是减少误报,更准确地区分真正的滥用和合法请求。

一个简单问题,Pro 额度先少 2%

当请求触发安全分类器后,系统不一定只是拒绝回答,也可能把请求转给 Claude Opus 4.8。

问题在于,Fable 5 的价格明显更高。

Fable 5 每百万 tokens 输入 10 美元、输出 50 美元,约为 Opus 4.8 的两倍。如果用户付的是 Fable 5 的价格,等待的是 Fable 5 的分类器审查,最后经常拿到 Opus 4.8 的回答,这显然是不合理的。

▲ API 价格 https://platform.claude.com/docs/en/about-claude/pricing

( 你一个开水果摊的,卖给我生瓜蛋子,这谁能接受 .jpg )

不仅如此,Token 的燃烧速度也快到了令人发指的地步。

有网友实测,自己只试了约 3 个大型提示词,每个都用了大量子 Agent,总 API 账单接近 90 美元。开始时 5 小时额度还剩约 90%,30 分钟后只剩 30%。

还有用户说,一个简单问题就消耗了 Pro 计划 5 小时额度里的 2%。

用网友的话来说,Fable 5 消耗使用量太快,产出结果没有明显拉开差距,还过于频繁地转到 Opus 4.8,完全是灾难性的。

对此,T3 Chat 的 CEO Theo Browne 给出了一套非常接地气的「省钱防坑指南」:。

他表示,只在 high effort 下使用 Fable 5,少用 xhigh。他认为 xhigh 很吃 tokens,max 或 extra 档位消耗更大,输出质量也不一定更好。

他的第二个做法,是让 Claude Code 学会把 Codex 当作大量实现任务的备用模型。

第三,在 CLAUDE.md 里写清楚不同任务该优先用哪个模型。第四,把代码库分析、上下文整理、计算机使用这类高消耗任务交给其他模型完成,再把结果交回 Fable 5。

顺便提个有趣的冷知识,知名 AI 博主 Simon Willison 昨天借助 Claude Sonnet,对 Anthropic 新一代 tokenizer 进行测试,结果显示同样文本在不同语言里的 token 膨胀程度差异很大。

▲ https://simonwillison.net/2026/Jun/30/claude-sonnet-5/

英文大约变成上一代的 1.4 倍,西班牙语约 1.33 倍,Python 代码约 1.28 倍,简体中文几乎没有明显变化。

这说明中文内容的信息密度优势依然存在。全中文沟通,反而成了最省钱的物理外挂。

最贵的模型,应该留给最难的活

吐槽归吐槽,Fable 5 敢收这么贵,底子还是毋庸置疑地强。

Anthropic 对 Fable 5 的定位很明确:长周期自主任务、复杂问题一次通过、视觉理解、企业工作流、代码审查和调试、模糊任务处理、多代理协作。

早期测试者还报告过,一些原本需要多天迭代的系统实现,Fable 5 可以一次完成。视觉能力也是重点。Anthropic 称,Fable 5 对密集技术图、网页应用、复杂截图的理解更准确,还被训练成会使用 bash 和 crop 工具处理翻转、模糊、带噪点的图片。

企业工作流方面,它更擅长金融分析、表格、幻灯片、文档等任务。在代码审查和调试方面,除去安全分类器覆盖的敏感网络安全领域,Fable 5 的 bug 查找召回率高于 Opus 4.8,也更会查代码库和历史提交。

Fable 5 回归后,网友也使劲地玩上了。

有人用 Fable 5 一次生成了一个《火箭联盟》克隆版游戏,效果让测试者相当惊讶。也有人用它在 Godot 里做出蜘蛛侠荡网游戏,并评价 Fable 5 在 Godot 编码时比 GPT-5.5 少出错。

难怪 Cursor 官方也赶紧宣布 Fable 5 重新接入,并表示:它在 CursorBench 榜单上依然稳居第一(虽然也是单任务成本最高的一个)。

当然,它也不是所有场景都占优。

有网友 @AiBattle_ 拿 Fable 5 和 GPT-5.6 Pro 做 3D 房屋提示对比,结论是 GPT-5.6 Pro 的 3D 模型和房屋构图更好;Fable 5 的版本无法移动,但光照效果更好,生成速度更快。

该网友还提到,GPT-5.6 Sol 将部署在 Cerebras 上,按 OpenAI 说法速度可达 750 tokens/s,速度优势会很明显。在他的判断里,Fable 5 在很多领域表现很好,但 3D 方向 GPT-5.6 可能更强。

所以,Fable 5 最适合的任务,是复杂工程、长期 agent、代码审查、多文件调试、游戏原型、企业文档和多 Agent 协作。拿它做简单聊天和普通问答,性价比不高,更适合把它留给真正复杂、真正值得花钱的任务。

长任务时代,提示词也要升级

在 Fable 5 回归之际,Anthropic 也发布了官方提示指南,明确建议用户调整提示词和工作流。

第一,不要要求模型展示内部思考过程。

过去很多人喜欢让模型「写出推理过程」,用来提高答案可信度。但在 Fable 5 里,要求模型回显、转录或解释内部推理,可能触发 reasoning_extraction 相关拦截,进而导致拒答或转到 Opus 4.8。

如果应用需要展示过程,官方更建议读取结构化 thinking blocks,或者通过 send-to-user 一类工具展示阶段性进展,而不是让模型把内部推理写成正文。

第二,要给模型明确边界。

Fable 5 更积极,也更容易做过头。官方建议用户说明:不要添加额外功能,不要进行无关重构,不要为假设需求设计复杂抽象。任务足够明确时,直接行动,不要反复讨论已经确认过的事实。

如果用户只是描述问题、询问判断、思考方案,也最好明确要求模型只输出评估,不要直接修改代码或执行操作。

第三,长任务要让模型核对证据。

Anthropic 建议,在长任务里要求模型汇报进度前,先核对当前会话里的工具结果。测试失败就说失败,没验证就说没验证,跳过的步骤也要说清楚。

第四,可以建立外部记忆系统。

官方建议,把每次任务里确认过的做法、需要长期遵守的规则、过去犯过的错误写成 Markdown 文件,后续任务再引用。对于长期 agent 来说,这比单纯依赖上下文更可靠,也更省成本。

第五,合理使用子 Agent。

Fable 5 更擅长调用并维持并行子 Agent。适合把独立子任务交给子 Agent,主模型继续推进工作。长生命周期子 Agent 还能保留上下文,减少重复消耗。

真正决定 Fable 5 上限的,不光是模型能力,还有你的使用方式。

Claude 的桌面工作流,开始覆盖 Linux

Fable 5 回归之外,Claude 产品线还有一个值得关注的更新:Claude Desktop 终于推出 Linux 测试版了。

Linux 版支持 Ubuntu 22.04 及以上、Debian 12 及以上,覆盖 x86_64 和 arm64。桌面应用提供 Chat、Cowork 和 Code 三个标签页,包括并行会话、可视化 diff 审查、集成终端和编辑器、实时应用预览等功能。

安装方式也比较标准。用户可以通过 Anthropic 的 apt 仓库安装并接收系统更新,也可以下载 .deb 包手动安装。

不过,Linux 测试版暂时没有 Computer Use 的应用和屏幕控制,没有桌面语音输入。

Quick Entry 全局快捷键在 X11 下可用,在 Wayland 下取决于桌面环境的 GlobalShortcuts portal。Fedora 和 RHEL 目前还不在官方支持范围内。

▲ https://code.claude.com/docs/en/desktop-linux

Linux 版的到来,像是 Anthropic 给这座 AI 兽笼又开了一扇门。Claude 不再只待在网页聊天框里,而是一步步走进终端、编辑器、本地应用和开发者的日常工作台。

问题是,门开得更多了,笼子也加得更密了。

Anthropic 一方面想向世界证明,他们能造出最强的安全模型;另一方面,他们又因营销恐惧这种力量失控而遭到反噬,最终不得不为这头 AI 猛兽加上层层限制。

属实是求锤得锤。

而在这种风声鹤唳的安全叙事之下,大多数用户更关心的是:花了这么多钱、操作又如此谨慎,它是否能够稳定地完成任务。显而易见的是,只要 Fable 5 依旧频繁误判、回退,就很难说是当下最优的模型选择。

相关阅读

最新评论

没有更多评论了
爱范儿

爱范儿

发现创新价值的科技媒体

订阅

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容