Claude Mythos(Opus 5)泄露:我们目前所知道的一切
Anthropic 的下一代 Claude Mythos 模型在一次数据泄露中被曝光。以下是泄露文件中关于其编码、推理和网络安全能力的内容——以及这对 AI 意味着什么。
Anthropic 迄今最强大的 AI 模型已经曝光——不是通过发布活动,而是通过一次数据泄露。描述 Claude Mythos(内部代号”Capybara”)的内部文件在 Anthropic 内容管理系统发生配置错误后遭到泄露,近 3,000 个文件在无需身份验证的情况下可被公开访问。
以下是我们已知的信息、尚未确认的内容,以及为何此事意义重大。
事件经过
2026 年 3 月下旬,一名安全研究员发现 Anthropic 基础设施上一个配置错误的数据存储在向公共互联网暴露内部文件——包括博客草稿、PDF 文件、图片和内部备忘录。Anthropic 在收到通知后迅速封锁了访问权限,但文件已在安全论坛和社交媒体上广泛传播。
Anthropic 随后确认泄露属实。一位发言人承认,公司已完成对一个名为 Claude Mythos 的模型的训练,并正在向早期访问客户进行试用,称其为 AI 性能的**“阶跃式突破”,是”我们迄今构建的能力最强的模型”**。
Claude Mythos 是什么?
根据泄露文件,Claude Mythos 位于现有 Opus 级别之上——完全是一个全新的模型类别,而非简单的版本升级。尽管互联网上将其称为”Opus 5”,但内部定位表明 Mythos 旨在成为一个独立的更高层级。
泄露材料中的核心声明如下:
编程与推理能力
据报道,Mythos 在编程基准测试和学术推理任务上相比 Claude Opus 4.6 取得了重大性能提升。鉴于 Opus 4.6 已在 SWE-bench Verified(约 80.8%)、Terminal-Bench 2.0 和 Humanity’s Last Exam 上领先,这意味着 Mythos 将这些数字推向了更高水平。
网络安全能力
这是泄露内容中最令人担忧的部分。内部文件将 Mythos 描述为**“在网络能力方面目前远超任何其他 AI 模型”**——能够以远超人类防御者的速度发现并利用软件漏洞。
据报道,文件还警告称,Mythos “预示着即将到来的一波模型,其利用漏洞的能力将远超防御者的努力”——来自模型开发公司的这一评估坦率得令人震惊。
中国国家支持的渗透行动
或许是最具爆炸性的说法:据报道,Anthropic 发现一个中国国家支持的组织一直在使用 Claude Code 运行协调行动,渗透了约 30 个组织,包括科技公司、金融机构和政府机构。Anthropic 检测并关闭了该行动,但这一事件似乎影响了 Mythos 谨慎的推出策略。
市场影响
此次泄露产生了立竿见影的金融后果。对 AI 驱动网络威胁的担忧引发了美国软件和网络安全股的抛售潮。风险规避情绪蔓延至加密货币市场,比特币跌至 66,000 美元。日本媒体对此次泄露的国家安全影响进行了大量报道。
尚未确认的内容
尽管发生了泄露且 Anthropic 已部分确认,但仍有几个关键问题悬而未决:
- 基准测试数据。 尚未公布具体分数。有关 Mythos 在所有基准测试中占主导地位的说法基于泄露的内部描述,而非经过验证的第三方评估。
- 定价与可用性。 没有关于 API 定价、上下文窗口大小或正式发布时间表的信息。
- “Opus 5”命名。 社区一直将其称为”Opus 5”或”Claude 5”,但泄露文件将 Mythos 定位为高于 Opus 的新层级,而非直接继任者。最终命名尚不明确。
- 界面目击报告。 部分用户报告在 Claude 界面中看到”Mythos 5(实验性)“及”更大更智能”的描述。这些可能是有限的 A/B 测试、内部测试产物,或伪造的截图。目前尚无广泛确认。
Anthropic 的推出策略
根据泄露文件和 Anthropic 的公开声明,推出过程将是有意为之的谨慎:
- 首先面向特定网络安全合作伙伴。 初始访问群体专注于安全研究人员和防御者——目标是在模型的攻击性能力广泛普及之前做好防御准备。
- 分阶段扩展。 更广泛的访问权限将随后开放,可能通过 API 以及 Claude Pro/Team/Enterprise 计划提供。
- 无公开发布日期。 Anthropic 尚未承诺任何时间表。
这一方式与 Anthropic 处理此前安全顾虑较高发布版本的方式如出一辙——缓慢、受控,优先考虑防御性用例。
这意味着什么
无论你称之为 Opus 5、Mythos 还是 Capybara,其影响都是深远的:
对于开发者: 一个在编程能力上显著超越 Opus 4.6 的模型,将成为软件开发、调试和智能体工作流的重要工具。问题在于何时上线以及价格几何。
对于网络安全: 泄露文件描绘了一个能够比人类修补漏洞更快发现并利用漏洞的 AI 模型。如果属实,这将从根本上改变网络安全格局——防御者将需要借助 AI 工具才能跟上节奏。
对于 AI 安全: Anthropic 公开承认其自身模型对网络防御构成风险,这一点值得关注。谨慎的推出计划表明该公司认真对待其负责任扩展政策,但同时也引发了疑问:一旦部署,任何分阶段发布是否真的能够遏制其能力。
对于整个行业: 如果 Mythos 能兑现泄露文件中的承诺,将为前沿 AI 模型树立新标杆。竞争对手将需要作出回应——而网络安全方面的影响可能会加速监管层面的讨论。
结语
Claude Mythos 的泄露是真实的。Anthropic 已确认该模型的存在,并表示其代表着重大的能力飞跃。但细节——基准测试数据、定价、可用性、具体能力——除泄露的内部文件所载内容外,仍未经核实。
目前我们所掌握的是:一个来自 Anthropic 的经确认的下一代模型,内部文件显示其具备前所未有的能力(尤其是在网络安全领域),一个谨慎的推出计划,以及大量填补空白的猜测。
我们将在 Anthropic 发布官方公告时更新本文。与此同时,Claude Opus 4.6 和 Sonnet 4.6 依然是目前可公开使用的能力最强的 Claude 模型——在编程、推理和复杂任务方面已经相当强大。
