Claude Mythos（Opus 5）泄露：我们目前所知道的一切

Anthropic 迄今最强大的 AI 模型已经曝光——不是通过发布活动，而是通过一次数据泄露。描述 Claude Mythos（内部代号”Capybara”）的内部文件在 Anthropic 内容管理系统发生配置错误后遭到泄露，近 3,000 个文件在无需身份验证的情况下可被公开访问。

以下是我们已知的信息、尚未确认的内容，以及为何此事意义重大。

事件经过

2026 年 3 月下旬，一名安全研究员发现 Anthropic 基础设施上一个配置错误的数据存储在向公共互联网暴露内部文件——包括博客草稿、PDF 文件、图片和内部备忘录。Anthropic 在收到通知后迅速封锁了访问权限，但文件已在安全论坛和社交媒体上广泛传播。

Anthropic 随后确认泄露属实。一位发言人承认，公司已完成对一个名为 Claude Mythos 的模型的训练，并正在向早期访问客户进行试用，称其为 AI 性能的**“阶跃式突破”，是”我们迄今构建的能力最强的模型”**。

Claude Mythos 是什么？

根据泄露文件，Claude Mythos 位于现有 Opus 级别之上——完全是一个全新的模型类别，而非简单的版本升级。尽管互联网上将其称为”Opus 5”，但内部定位表明 Mythos 旨在成为一个独立的更高层级。

泄露材料中的核心声明如下：

编程与推理能力

据报道，Mythos 在编程基准测试和学术推理任务上相比 Claude Opus 4.6 取得了重大性能提升。鉴于 Opus 4.6 已在 SWE-bench Verified（约 80.8%）、Terminal-Bench 2.0 和 Humanity’s Last Exam 上领先，这意味着 Mythos 将这些数字推向了更高水平。

网络安全能力

这是泄露内容中最令人担忧的部分。内部文件将 Mythos 描述为**“在网络能力方面目前远超任何其他 AI 模型”**——能够以远超人类防御者的速度发现并利用软件漏洞。

据报道，文件还警告称，Mythos “预示着即将到来的一波模型，其利用漏洞的能力将远超防御者的努力”——来自模型开发公司的这一评估坦率得令人震惊。

中国国家支持的渗透行动

或许是最具爆炸性的说法：据报道，Anthropic 发现一个中国国家支持的组织一直在使用 Claude Code 运行协调行动，渗透了约 30 个组织，包括科技公司、金融机构和政府机构。Anthropic 检测并关闭了该行动，但这一事件似乎影响了 Mythos 谨慎的推出策略。

市场影响

此次泄露产生了立竿见影的金融后果。对 AI 驱动网络威胁的担忧引发了美国软件和网络安全股的抛售潮。风险规避情绪蔓延至加密货币市场，比特币跌至 66,000 美元。日本媒体对此次泄露的国家安全影响进行了大量报道。

尚未确认的内容

尽管发生了泄露且 Anthropic 已部分确认，但仍有几个关键问题悬而未决：

基准测试数据。 尚未公布具体分数。有关 Mythos 在所有基准测试中占主导地位的说法基于泄露的内部描述，而非经过验证的第三方评估。
定价与可用性。 没有关于 API 定价、上下文窗口大小或正式发布时间表的信息。
“Opus 5”命名。 社区一直将其称为”Opus 5”或”Claude 5”，但泄露文件将 Mythos 定位为高于 Opus 的新层级，而非直接继任者。最终命名尚不明确。
界面目击报告。 部分用户报告在 Claude 界面中看到”Mythos 5（实验性）“及”更大更智能”的描述。这些可能是有限的 A/B 测试、内部测试产物，或伪造的截图。目前尚无广泛确认。

Anthropic 的推出策略

根据泄露文件和 Anthropic 的公开声明，推出过程将是有意为之的谨慎：

首先面向特定网络安全合作伙伴。 初始访问群体专注于安全研究人员和防御者——目标是在模型的攻击性能力广泛普及之前做好防御准备。
分阶段扩展。 更广泛的访问权限将随后开放，可能通过 API 以及 Claude Pro/Team/Enterprise 计划提供。
无公开发布日期。 Anthropic 尚未承诺任何时间表。

这一方式与 Anthropic 处理此前安全顾虑较高发布版本的方式如出一辙——缓慢、受控，优先考虑防御性用例。

这意味着什么

无论你称之为 Opus 5、Mythos 还是 Capybara，其影响都是深远的：

对于开发者： 一个在编程能力上显著超越 Opus 4.6 的模型，将成为软件开发、调试和智能体工作流的重要工具。问题在于何时上线以及价格几何。

对于网络安全： 泄露文件描绘了一个能够比人类修补漏洞更快发现并利用漏洞的 AI 模型。如果属实，这将从根本上改变网络安全格局——防御者将需要借助 AI 工具才能跟上节奏。

对于 AI 安全： Anthropic 公开承认其自身模型对网络防御构成风险，这一点值得关注。谨慎的推出计划表明该公司认真对待其负责任扩展政策，但同时也引发了疑问：一旦部署，任何分阶段发布是否真的能够遏制其能力。

对于整个行业： 如果 Mythos 能兑现泄露文件中的承诺，将为前沿 AI 模型树立新标杆。竞争对手将需要作出回应——而网络安全方面的影响可能会加速监管层面的讨论。

结语

Claude Mythos 的泄露是真实的。Anthropic 已确认该模型的存在，并表示其代表着重大的能力飞跃。但细节——基准测试数据、定价、可用性、具体能力——除泄露的内部文件所载内容外，仍未经核实。

目前我们所掌握的是：一个来自 Anthropic 的经确认的下一代模型，内部文件显示其具备前所未有的能力（尤其是在网络安全领域），一个谨慎的推出计划，以及大量填补空白的猜测。

我们将在 Anthropic 发布官方公告时更新本文。与此同时，Claude Opus 4.6 和 Sonnet 4.6 依然是目前可公开使用的能力最强的 Claude 模型——在编程、推理和复杂任务方面已经相当强大。

事件经过

Claude Mythos 是什么？

编程与推理能力

网络安全能力

中国国家支持的渗透行动

市场影响

尚未确认的内容

Anthropic 的推出策略

这意味着什么

结语

相关文章

GLM-5.1 vs Claude、GPT、Gemini、DeepSeek：智谱AI最新模型综合评测

Claude Opus 4.6 与 Sonnet 4.6：你需要了解的一切

MiniMax M2.7：能与Claude和GPT媲美的自进化AI模型，价格仅为其一小部分

BitDance 14B：比其他自回归模型快30倍的AI图像生成

Qwen Image 2.0：排名第一的AI图像生成与编辑模型

Qwen Image 2.0 即将登陆WaveSpeedAI