📢 Gate 广场认证创作者招募中,入驻瓜分每月 $20,000 创作大奖!
📌 参与方式
站内创作者: 成功申请“创作者认证徽章”即可自动参与。
新入驻创作者: 需填写入驻表单申请 👉️ https://www.gate.com/questionnaire/7698
🎁 创作者福利
1️⃣ 首帖见面礼: 新入驻/回归创作者发首帖,即得 $50U 奖励!
2️⃣ 周度发帖奖: 完成周发帖任务,轻松瓜分 $10,000 奖池!
3️⃣ 月度创作奖: 赛道更多样,完成月度任务瓜分 $1,600 GT 奖池!
4️⃣ 专属推广任务:进入专属创作者社群,享专属推广任务和节日礼包!
让您的优质内容被更多人看到,携手共建高质量创作者社区!
活动细节:https://www.gate.com/announcements/article/51536
#Anthropic发布Fable5模型 一个模型,两种名字:Anthropic 发布 Fable 5 和 Mythos 5,这是首次向公众开放的最强模型
6月9日,Anthropic 同时发布了两个新模型——Claude Fable 5 和 Claude Mythos 5。值得注意的是,它们实际上基于同一个底层模型,唯一差别在于“安全防护”的紧密程度。这也是 Anthropic 最强能力的模型首次公开可用,同时还是一次罕见的“分层发布”实验。
本文将帮助你理解:是什么让它如此强大、为何它有两个名字,以及你现在应该如何使用它。
1. 首先澄清:什么是“Mythos 级”模型?
熟悉 Claude 吗?读者知道,Anthropic 的模型总是分为三个层级:Haiku(快速)、Sonnet(均衡)、Opus(最强)。今年 4 月,Anthropic 悄悄在 Opus 之上引入了一个新层级——Mythos 级。第一个 Mythos 级模型(Claude Mythos Preview)并未公开出售,而是通过一个名为 Project Glasswing 的项目发布,与美国政府合作,并且仅向少数网络安全机构和关键基础设施提供者开放。
原因很简单:这一层级的模型太强,可能被滥用于网络攻击、生物研究等领域,因此 Anthropic 认为不应直接对外发布。
这次发布的两款模型是官方的 Mythos 级版本:
◆ Claude Fable 5:面向所有人开放,配备一套新的安全防护;
◆ Claude Mythos 5:部分防护解除,仅向像 Glasswing 这样的可信合作伙伴开放。两者都基于同一个核心模型。名字也经过精心挑选:Fable 来自拉丁语 fabula(“讲述的故事”),并与希腊 mythos 有共同根源——相同的起源——只是在“自由表达能力”上有所不同。
2. 它有多强大?
据 Anthropic 介绍,Fable 5 超越了公司迄今为止公开发布的任何模型,在几乎所有 AI 基准测试中都达到最先进水平(SOTA),尤其在软件工程、知识工作、视觉理解和科学研究方面表现突出。任务越长、越复杂,它相对旧模型的领先优势就越大。
编码:把两个月压缩成一天。支付公司 Stripe 在早期测试中报告称,Fable 5 在一天内完成了对一个 50 million 行 Ruby 代码库的完整迁移——这通常需要一个团队超过两个月的手工工作。在 Cognition(Devin 的开发者)FrontierCode 评测中,Fable 5 在最前沿模型中得分最高,而且使用的令牌更少。
视觉:无需帮助就能击败 Pokémon FireRed。此前的 Claude 模型需要借助复杂的辅助工具(地图、导航、游戏状态信息)才能在 Pokémon 中勉强推进,但 Fable 5 只要看原始游戏屏幕就能通关。它还可以直接从截图重建网页应用的源代码。
记忆:一边玩《Slay the Spire》,一边做笔记。在拥有数百万令牌的任务中,Fable 5 能通过使用自己的笔记来保持专注,并提升性能。在对卡牌游戏《Slay the Spire》的测试中,赋予持续记忆后,它相对 Opus 4.8 的表现提升了三倍。
科学研究:让药物设计速度提升约 10 倍。Anthropic 内部的蛋白质设计专家使用 Mythos 5,将药物开发流程中的部分环节加速了大约十倍——模型能够在没有人类协助的情况下独立完成任务,例如选择结合位点、运行蛋白质设计工具、从失败中恢复。在 14 个蛋白靶点中,有 9 个产出了值得进一步开发的潜在候选药物。它还提出了关于 E. coli 蛋白的新机制假说,随后由一家独立研究实验室证实。
3. 安全防护如何工作:触发“降级”到 Opus 4.8
这是本次发布中最引人关注的部分。Fable 5 配备了一套新的分类器——一个独立于主模型的 AI 系统——用于检测潜在的滥用。当分类器检测到你的请求涉及以下三个敏感领域中的任何一项时,响应就不再来自 Fable 5,而会自动切换到更弱的模型 Claude Opus 4.8(并附带一段提示通知用户):
1. 网络安全:Mythos 级模型具备高度强大的能力,能够发现并利用软件漏洞,也可以实现“自主黑客”——在同一个流程中完成侦察与横向移动。这些能力会显著降低网络攻击的成本,因此重点自然放在防御上。
2. 生物与化学:模型现在可以执行现实世界中的科学任务(例如预测病毒衣壳组装)。这种双重用途能力在恶意手中十分危险,因此生物技术领域的大多数请求都会降级到 Opus。
3. 蒸馏攻击:防止将 Fable 5 的能力大规模“提取”出来,用于训练竞争模型。
关键数据:防护触发在不到 5% 的会话中发生,这意味着超过 95% 的用户几乎能够体验到 Mythos 5 的全部能力。Anthropic 承认该防护经过保守调校,可能会产生误报,并计划很快降低误报率。关于越狱(jailbreak),超过 1,000 小时的外部漏洞赏金测试没有发现“通用越狱”。
另一个值得注意的变化是:所有来自 Mythos 级模型的流量都会被保留 30 天(包括企业客户),用于防御新的攻击方式与越狱——Anthropic 承诺这些数据不会用于训练,并提供诸如访问审计之类的隐私保护措施。
4. Mythos 5:无防护的“可信圈”版本
Mythos 5 本质上是将部分防护移除后的 Fable 5,并声称拥有全球最强的网络安全能力。目前,它仅通过 Project Glasswing 向网络安全机构提供,作为从 Mythos Preview 升级的选项。Anthropic 计划逐步扩展:与美国政府谈判以增加合作伙伴;为网络安全组织推出更系统的可信访问计划;并开放生物研究的可信方案(移除生物技术防护,但保留网络安全防护),以加速新疗法的研发。这种“同一个模型,以身份进行分层解锁”的做法是前沿 AI 发布中的首次尝试。
5. 价格与访问:6 月 22 日前免费 API 窗口
免费窗口期间的 API 定价:输入 $10 / 每百万 tokens,输出 $50 / 每百万 tokens——低于 Mythos Preview 的一半。模型标识符是 claude-fable-5,API 以及按量计费的企业计划从今天开始可用。订阅用户请注意:
◆ 从现在起至 6 月 22 日:Pro、Max、Team 和企业套餐免费包含 Fable 5;
◆ 从 6 月 23 日起:将从套餐中移除,继续使用需要购买用量额度;若产能允许,免费窗口可能会延长;
◆ 之后:随着算力提升,Anthropic 计划将 Fable 5 重新整合回标准订阅套餐。换句话说,接下来的两周是免费体验最强模型的最佳窗口,感兴趣的读者应当抓住机会。
6. 最后的思考:能力与安全上的“一种新方法”
近年来,前沿实验室在“如果模型太强会怎样”这一问题上,往往只有两个选择:延迟发布,或削减能力。Anthropic 给出了第三种方案——对公众版本进行全面发布并启用动态防护,同时把完整版本留给可信机构。
这种做法并不完美:5% 的误报可能会让一些专业用户感到沮丧(尤其是安全研究人员和生物学家),而 30 天的数据保留也可能引发隐私方面的担忧。但它确实让“最强能力”不必被锁在政府项目背后,而是以可控的方式进入每个人的对话当中。当 AI 能在一天内完成两个月的团队工作,或独立设计蛋白药物候选,“如何发布”就和“要构建什么”同样重要。Fable 与 Mythos 的共同根源或许也会为未来前沿模型的发布策略树立先例。