扬帆创投微信小程序
更聚焦的出海投融资平台
精准高效领先的融资对接服务
微信扫一扫进入小程序

Anthropic 发布 Fable 5 和 Mythos 5 双模型,长程任务执行能力突破,采用按风险分级发布新范式,聚焦网络安全等高风险场景,推动 AI 行业竞争从模型性能扩展至安全治理与能力分发制度。

核心结论

Anthropic 此次双模型发布,实质上有三件事同时发生了:

长程 Agent 能力进入新阶段,AI 能够承担更完整的工程、研究、分析任务;

前沿模型进入分权限发布时代,同一底层模型被拆分为公共版 Fable 和受信任版 Mythos;

AI 公司的核心竞争力从 "卖模型" 转向 "治理能力",行业竞争焦点从模型性能扩展到危险能力的安全、可审计、可商业化释放能力。

长程任务执行能力实现突破

Anthropic Fable 5 和 Mythos 5 的核心能力聚焦于 long-horizon autonomy(长程任务执行)。

官方强调,这两款模型能够比此前任何 Claude 模型更长时间自主工作。

早期测试中,Stripe 使用该模型在 5000 万行 Ruby 代码库中完成代码迁移,这项原本需要一个团队两个月的工作,模型一天完成。

Fable 5 在软件工程、金融分析、视觉理解、长上下文、记忆、生物研究等场景均有明显提升。

AI 编程已从 "补全代码" 阶段进入 "接管工程单元" 阶段。

Copilot 主要负责写函数,Claude Code 可以改文件、跑测试、修 bug,Fable 5 这类模型能够接收更大的工程目标,包括迁移代码库、重构系统、分析复杂文档、设计实验路径、维护长任务记忆。

这种能力改变了软件组织分解任务的方式。

人类负责提出目标、边界、验收标准;AI 负责拆任务、读代码、改系统、跑验证、写报告;人类从执行者转变为审查者、架构者、风险负责人。

这是软件组织形态的变化,而非简单的效率提升。

按风险划分模型的新产品范式

此前模型公司通常以参数、榜单、上下文长度、推理能力区分产品。

Anthropic 此次采用新的划分方式:按风险分模型。

Fable 5 和 Mythos 5 底层技术相同。Fable 是公共版,配备更强安全防护;Mythos 是受信任版,部分限制解除。

Anthropic 同时设置安全分类器,对高风险请求进行识别、拦截或回退。

官方数据显示,当前这些防护平均在不到 5% 的会话中触发,超过 95% 的 Fable 会话不会回退,体验接近 Mythos。

前沿模型将形成能力 - 权限矩阵:

产品逻辑:同一底层模型,不同权限等级

风险控制:依靠分类器、路由、回退、审计机制

用户差异:普通用户、研究者、安全团队、政府合作方

商业模式:按任务价值和风险等级售卖能力

模型本身逐渐成为基础设施,能力分发权成为核心价值。决定不同用户使用不同能力的主体,将掌握下一代 AI 平台的入口。

网络安全行业价值链重构

Anthropic 优先将 Mythos 应用于 Project Glasswing 项目。

网络安全是典型的双刃剑场景,模型既能帮助防守方找漏洞、写补丁、做自动审计,也能帮助攻击者实现相同操作。

Anthropic 6 月 2 日公布的数据显示,Project Glasswing 早期约 50 个合作伙伴使用 Claude Mythos Preview 扫描代码库,发现超过 1 万个高危或严重级别安全缺陷。

该项目已扩展至约 150 个新组织,覆盖 15 个以上国家,包括电力、水务、医疗、通信、硬件等关键行业。

AI 安全行业的瓶颈从 "发现漏洞" 转向 "验证、披露、修复和部署补丁"。

漏洞发现不再是稀缺能力,真正稀缺的是漏洞判断、披露协调、补丁编写、补丁验证以及责任承担能力。

安全公司的价值链发生变化。

传统安全厂商的核心业务是售卖扫描器、情报和检测服务,当前更具价值的是 AI 发现漏洞后的治理闭环,包括确认、排序、修复、回归测试、合规记录和责任归属。

AI 推动安全行业重心从 "找问题" 转向 "处理问题"。

Fable 5 的企业价值在于降低综合任务成本

Fable 5 定价为每百万输入 token 10 美元、每百万输出 token 50 美元。

该模型已在 Claude API 和消费型企业计划中立即可用;6 月 9 日至 6 月 22 日的订阅计划包含 Fable 5 使用权,6 月 23 日后使用需要消耗 usage credits,后续视容量再恢复为标准订阅权益。

前沿模型的商业价值不能仅通过 token 单价衡量。

一个任务的综合成本包括对话轮次、人工返工、上下文切换和失败重试等多个维度。

如果一个模型单次 token 价格更高,但能显著减少对话轮次、调试时间和团队协作成本,其每任务综合成本可能更低。

前沿模型定价形成新逻辑,强模型通过降低人工协调成本、返工成本和管理成本,形成相对于弱模型的竞争优势。

企业客户的核心关注点从 "每百万 token 多少钱" 转向 "这个模型能否独立完成一个业务单元"。

这是 Fable 5 对企业客户的核心吸引力。

Anthropic 开展 "可控危险能力" 制度实验

Fable 5/Mythos 5 发布的核心价值在于制度设计,而非单纯的技术进步。

Anthropic 实施了五项关键措施:

承认模型具备高风险能力

不直接公开完整能力

将同一底层模型拆分为公共版和受信任版

对敏感任务实施分类器识别、回退和限制

对 Mythos 级模型流量要求 30 天保留,不用于训练新 Claude 模型,主要用于安全防御、识别复杂攻击、降低误报。

这套设计将成为未来前沿模型发布的参考模板。

AI 公司发布最强模型时,将采用分级发布机制:普通用户使用公共版,企业客户使用审计版,安全研究者使用受信任版,生物研究者使用专项许可版,政府合作方使用特殊通道,高风险请求进入回退模型,全部高能力流量保留、审计、复盘。

模型能力越接近真实世界行动能力,发布方式越接近药品、金融、航空、军工等受管制行业。

大模型正在从互联网产品转变为受管制的通用能力。

行业竞争维度扩展

这次发布为整个行业设立了新的压力测试标准。

拥有同级能力的公司面临选择:直接公开、分权限发布或不公开。

不同选择对应不同的风险:直接公开可能被质疑安全不足,不公开可能被认为能力落后,分权限公开需要建立完整的分类器、审计、合规、身份验证、受信任访问计划和政府沟通机制。

前沿模型竞争从 "三件套" 扩展为 "五件套"。

此前竞争维度包括模型能力、算力、产品体验,当前新增安全治理和能力分发制度两个维度。

Anthropic 的优势在于将 "安全叙事" 转化为品牌资产。

Fable 5/Mythos 5 是这套叙事的产品化体现,将安全理念融入产品结构。

同时 Anthropic 也面临多重挑战:防护过严会导致用户体验下降,防护过松会引发安全质疑,Mythos 权限范围过窄会被指责创造能力特权,开放过快会面临监管压力。

AI 公司掌握认知能力分发权

Mythos 级模型在网络安全、生物研究、软件工程、复杂推理等领域的能力,接近某些高技能专家团队的压缩版本。

这种能力的产品化,使核心问题从 "模型会不会回答" 转变为能力分发规则的制定。

核心问题包括:谁有资格调用完整能力,谁只能使用受限能力,谁可以解除特定领域限制,谁来审计调用记录,谁来判断请求的性质和风险。

这些问题共同指向能力分发权。

最强 AI 公司的核心权力不仅包括训练模型,还包括决定哪些人、哪些组织、在哪些场景下,可以使用哪些级别的智能。

这种权力的重要性超过模型榜单排名。

原文链接:点击前往 >

文章作者:清新研究

版权申明:文章来源于清新研究。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/

{{likeNum}}

好文章,需要你的鼓励

请前往扬帆出海小程序完成个人认证
认证通过后即可申请入驻
扫码添加小助手
微信扫描二维码,添加小助手
微信号:yfch103
APP
小程序
微信公众号
微信小程序
扬帆出海APP
扬帆出海APP
微信
公众号
微信公众号
关注扬帆出海
专注服务互联网出海!
出海人
社群
微信公众号
扫码进群
与16万+出海人同行!