6月9日，Anthropic 同时发布了两个新模型——Claude Fable 5 和 Claude Mythos 5。值得注意的是，它们实际上基于同一个底层模型，唯一差别在于“安全防护”的紧密程度。这也是 Anthropic 最强能力的模型首次公开可用，同时还是一次罕见的“分层发布”实验。
本文将帮助你理解：是什么让它如此强大、为何它有两个名字，以及你现在应该如何使用它。
1. 首先澄清：什么是“Mythos 级”模型？
熟悉 Claude 吗？读者知道，Anthropic 的模型总是分为三个层级：Haiku（快速）、Sonnet（均衡）、Opus（最强）。今年 4 月，Anthropic 悄悄在 Opus 之上引入了一个新层级——Mythos 级。第一个 Mythos 级模型（Claude Mythos Preview）并未公开出售，而是通过一个名为 Project Glasswing 的项目发布，与美国政府合作，并且仅向少数网络安全机构和关键基础设施提供者开放。
原因很简单：这一层级的模型太强，可能被滥用于网络攻击、生物研究等领域，因此 Anthropic 认为不应直接对外发布。
这次发布的两款模型是官方的 Mythos 级版本：
◆ Claude Fable 5：面向所有人开放，配备一套新的安全防护；
◆ Claude Mythos 5：部分防护解除，仅向像 Glasswing 这样的可信合作伙伴开放。两者都基于同一个核心模型。名字也经过精心挑选：Fable 来自拉丁语 fabula（“讲述的故事”），并与希腊 mythos 有共同根源——相同的起源——只是在“自由表达能力”上有所不同。
2. 它有多强大？
据 Anthropic 介绍，Fable 5 超越了公司迄今为止公开发布的任何模型，在几乎所有 AI 基准测试中都达到最先进水平（SOTA），尤其在软件工程、知识工作、视觉理解和科学研究方面表现突出。任务越长、越复杂，它相对旧模型的领先优势就越大。
编码：把两个月压缩成一天。支付公司 Stripe 在早期测试中报告称，Fable 5 在一天内完成了对一个 50 million 行 Ruby 代码库的完整迁移——这通常需要一个团队超过两个月的手工工作。在 Cognition（Devin 的开发者）FrontierCode 评测中，Fable 5 在最前沿模型中得分最高，而且使用的令牌更少。
视觉：无需帮助就能击败 Pokémon FireRed。此前的 Claude 模型需要借助复杂的辅助工具（地图、导航、游戏状态信息）才能在 Pokémon 中勉强推进，但 Fable 5 只要看原始游戏屏幕就能通关。它还可以直接从截图重建网页应用的源代码。
记忆：一边玩《Slay the Spire》，一边做笔记。在拥有数百万令牌的任务中，Fable 5 能通过使用自己的笔记来保持专注，并提升性能。在对卡牌游戏《Slay the Spire》的测试中，赋予持续记忆后，它相对 Opus 4.8 的表现提升了三倍。
科学研究：让药物设计速度提升约 10 倍。Anthropic 内部的蛋白质设计专家使用 Mythos 5，将药物开发流程中的部分环节加速了大约十倍——模型能够在没有人类协助的情况下独立完成任务，例如选择结合位点、运行蛋白质设计工具、从失败中恢复。在 14 个蛋白靶点中，有 9 个产出了值得进一步开发的潜在候选药物。它还提出了关于 E. coli 蛋白的新机制假说，随后由一家独立研究实验室证实。
3. 安全防护如何工作：触发“降级”到 Opus 4.8
这是本次发布中最引人关注的部分。Fable 5 配备了一套新的分类器——一个独立于主模型的 AI 系统——用于检测潜在的滥用。当分类器检测到你的请求涉及以下三个敏感领域中的任何一项时，响应就不再来自 Fable 5，而会自动切换到更弱的模型 Claude Opus 4.8（并附带一段提示通知用户）：
1. 网络安全：Mythos 级模型具备高度强大的能力，能够发现并利用软件漏洞，也可以实现“自主黑客”——在同一个流程中完成侦察与横向移动。这些能力会显著降低网络攻击的成本，因此重点自然放在防御上。
2. 生物与化学：模型现在可以执行现实世界中的科学任务（例如预测病毒衣壳组装）。这种双重用途能力在恶意手中十分危险，因此生物技术领域的大多数请求都会降级到 Opus。
3. 蒸馏攻击：防止将 Fable 5 的能力大规模“提取”出来，用于训练竞争模型。
关键数据：防护触发在不到 5% 的会话中发生，这意味着超过 95% 的用户几乎能够体验到 Mythos 5 的全部能力。Anthropic 承认该防护经过保守调校，可能会产生误报，并计划很快降低误报率。关于越狱（jailbreak），超过 1,000 小时的外部漏洞赏金测试没有发现“通用越狱”。
另一个值得注意的变化是：所有来自 Mythos 级模型的流量都会被保留 30 天（包括企业客户），用于防御新的攻击方式与越狱——Anthropic 承诺这些数据不会用于训练，并提供诸如访问审计之类的隐私保护措施。
4. Mythos 5：无防护的“可信圈”版本
Mythos 5 本质上是将部分防护移除后的 Fable 5，并声称拥有全球最强的网络安全能力。目前，它仅通过 Project Glasswing 向网络安全机构提供，作为从 Mythos Preview 升级的选项。Anthropic 计划逐步扩展：与美国政府谈判以增加合作伙伴；为网络安全组织推出更系统的可信访问计划；并开放生物研究的可信方案（移除生物技术防护，但保留网络安全防护），以加速新疗法的研发。这种“同一个模型，以身份进行分层解锁”的做法是前沿 AI 发布中的首次尝试。
5. 价格与访问：6 月 22 日前免费 API 窗口
免费窗口期间的 API 定价：输入 $10 / 每百万 tokens，输出 $50 / 每百万 tokens——低于 Mythos Preview 的一半。模型标识符是 claude-fable-5，API 以及按量计费的企业计划从今天开始可用。订阅用户请注意：
◆ 从现在起至 6 月 22 日：Pro、Max、Team 和企业套餐免费包含 Fable 5；
◆ 从 6 月 23 日起：将从套餐中移除，继续使用需要购买用量额度；若产能允许，免费窗口可能会延长；
◆ 之后：随着算力提升，Anthropic 计划将 Fable 5 重新整合回标准订阅套餐。换句话说，接下来的两周是免费体验最强模型的最佳窗口，感兴趣的读者应当抓住机会。
6. 最后的思考：能力与安全上的“一种新方法”
近年来，前沿实验室在“如果模型太强会怎样”这一问题上，往往只有两个选择：延迟发布，或削减能力。Anthropic 给出了第三种方案——对公众版本进行全面发布并启用动态防护，同时把完整版本留给可信机构。
这种做法并不完美：5% 的误报可能会让一些专业用户感到沮丧（尤其是安全研究人员和生物学家），而 30 天的数据保留也可能引发隐私方面的担忧。但它确实让“最强能力”不必被锁在政府项目背后，而是以可控的方式进入每个人的对话当中。当 AI 能在一天内完成两个月的团队工作，或独立设计蛋白药物候选，“如何发布”就和“要构建什么”同样重要。Fable 与 Mythos 的共同根源或许也会为未来前沿模型的发布策略树立先例。

查看原文