什么是Claude Mythos？泄露信息、Capybara等级及Anthropic官方确认内容

某天早上我在刷信息流时，一条财富杂志的头条让我猛地停了下来：Anthropic 意外将近 3,000 份内部文件遗留在一个可公开搜索的数据存储中——其中包括一篇宣布其下一个模型的草稿博客文章。当我点进去时，这个消息已经广泛传播。模型名称：Claude Mythos。与之关联的内部层级名称：Capybara。而 Anthropic 自己的草稿称其为”迄今为止我们开发过的最强大的 AI 模型”。

我是 Dora。本文是为开发者和 AI 产品负责人提供的事实性摘要，帮助大家清晰了解哪些内容已被证实、哪些来自泄露草稿，以及哪些仍不确定。目前尚无官方基准测试数据可引用——我也不会凭空捏造任何数字。

Claude Mythos 数据泄露事件究竟披露了什么

谁发现的，如何发现的

此次泄露源于 Anthropic 内容管理系统的配置错误。CMS 配置失误导致近 3,000 份未发布的资产暴露在可公开访问的可搜索数据存储中。两位安全研究人员独立发现了这批暴露的材料：LayerX Security 的 Roy Paz 和剑桥大学的 Alexandre Pauwels 发现了这个暴露的数据存储，其中包含一篇详细描述该模型的草稿博客文章。《财富》杂志审阅了相关文件并通知了 Anthropic，随后访问权限被限制。

Anthropic 将此事件归因于 CMS 配置中的”人为错误”，并将暴露的材料描述为”考虑发布的内容的早期草稿”。数天后发生了第二起独立的泄露事件：Anthropic 意外将 Claude Code 的全部原始源代码上传至 NPM，而非仅上传编译版本，暴露了约 1,900 个文件中的大约 50 万行代码。第二次泄露进一步证实了**Capybara 模型**正在积极准备中。

暴露草稿中包含什么

实际上存在同一篇博客文章的两个版本，两者仅在模型名称上有所不同：“Mythos”（v1）和”Capybara”（v2）。在 Capybara 版本中，标题和正文中的名称被全部替换，但副标题仍写道：“我们已完成一个新 AI 模型的训练：Claude Mythos。“Anthropic 告诉《财富》杂志，这些文件是”正在考虑发布的内容的早期草稿”，这表明该公司当时仍在为同一模型决定候选名称。

草稿还概述了一项发布策略。根据文件内容，Anthropic 计划采取比以往模型更为谨慎缓慢的发布方式，首先面向一小批负责评估网络安全应用的早期访问客户，然后通过 Claude API 逐步扩大访问范围。草稿还承认该模型”服务成本非常高”，Anthropic 正致力于在任何公开发布之前使其”效率大幅提升”。

Claude Mythos 与 Capybara——同一模型，两个名称

Capybara 作为新层级意味着什么

这是需要正确理解的最重要结构性要点。Mythos 和 Capybara 并非两个不同的模型。“Claude Mythos”是产品/世代名称（类似”Claude 4”），而”Capybara”是层级名称（类似 Haiku、Sonnet、Opus）。完整名称应类似于”Claude Mythos Capybara”。

层级区分之所以重要，是因为它代表着 Anthropic 模型阵容架构的变化。目前，Anthropic 的模型层级从 Haiku（最小、最快、最便宜）经 Sonnet 到 Opus（能力最强）。Capybara 将在三者之上增加第四个更高价的层级——根据泄露草稿，这是”比我们的 Opus 模型更大、更智能的模型——而 Opus 模型迄今为止一直是我们最强大的”。

这是结构性扩展，而非单纯的版本递增。与其将其视为”Opus 5”，不如将其理解为位于现有阵容之上的全新产品类别。

公开发布前命名可能如何演变

两个草稿版本使用了相同的名称理由，称其被选中是为了唤起”连接知识与思想的深层纽带”。该模型是否会以”Claude Mythos”、“Claude Capybara”或完全不同的面向公众的名称发布，尚未得到确认。两份草稿的存在——一份名为 Mythos，一份名为 Capybara——表明在泄露发生时这一问题仍处于讨论之中。

“Claude Mythos 5”并非官方名称。 它在报道中作为简称流传，但既未出现在泄露文件中，也未出现在任何 Anthropic 声明中。请勿将其视为已确认的名称。

声称的能力与 Claude Opus 4.6 的对比

以下所有能力声明均来源于泄露的草稿博客文章，并相应标注出处。截至 2026 年 4 月，Anthropic 尚未发布官方基准测试结果。

编程与智能体推理

根据泄露草稿，“与我们之前的最佳模型 Claude Opus 4.6 相比，Capybara 在软件编程、学术推理和网络安全等测试中的得分大幅提升。“草稿未给出具体基准测试数字——仅使用了”大幅提升”这一定性描述。目前尚无这些分数的外部验证。

关于改进的智能体推理能力的声明，与现有 Claude 模型家族的发展轨迹相符——该系列一直在逐步扩展工具使用和多步骤任务处理能力。Claude Code 在企业中的快速普及已建立在 Opus 4.6 的智能体能力之上；Mythos 应该会进一步拓展这一能力。

学术推理能力提升

泄露草稿将学术推理列为相较 Opus 4.6 表现”大幅提升”的领域之一。在经过核实的报道中，尚未出现关于涉及哪些基准测试（GPQA、MMLU、MATH 等）或声称的分数范围的具体信息。这是官方数据缺失至关重要的领域：基于草稿文件中未经核实的基准声明做出决策，存在真实的评估风险。

网络安全性能——以及为何引发担忧

这正是此次泄露引发最多讨论——也最需谨慎对待的地方。泄露草稿指出，该模型”预示着一波即将到来的模型浪潮，这些模型利用漏洞的能力将远远超过防御者的应对能力”。

泄露文件将 Mythos 描述为目前在网络安全能力方面远超任何其他 AI 模型，引发了严重的双重用途担忧。Anthropic 自己的声明直接承认了这一风险：“在准备发布 Claude Capybara 时，我们希望格外谨慎，了解它带来的风险——甚至超出我们自己测试所了解的范围。”

这里的背景并不抽象。Anthropic 此前曾报告，一个中国国家支持的组织已在利用 Claude Code 对约 30 个组织——包括科技公司、金融机构和政府机构——发动协调攻击，直到公司检测到为止。Mythos 声称的网络安全能力大幅放大了这种双重用途风险，这直接推动了谨慎的发布策略。

对于将前沿模型集成到安全工具中的团队而言，这是一个真实因素，而非仅仅是监管语言。现在就值得审阅 Anthropic 的使用政策，然后再基于当前或未来模型构建任何涉及网络安全的应用。

当前可用性：现在谁可以访问

早期访问计划详情

Anthropic 正在与一小批早期访问客户合作测试该模型。泄露草稿表明，该群体专门关注网络安全应用的评估，这意味着早期访问群体的选择基于相关领域专业知识，而非单纯基于客户规模。

根据面向早期访问客户的泄露产品信息，新模型可能被威胁行为者用于实施更强大的攻击。早期访问设计在一定程度上是受控风险评估，而非单纯的功能预览。

目前没有公开候补名单、没有已公布的申请流程，也没有扩大初始群体以外访问范围的确认时间表。如果您看到第三方网站提供”Capybara 访问”，这些网站与 Anthropic 没有关联。

未确认公开 API 或发布日期

Anthropic 的官方声明是唯一确认的公开立场：“我们正在开发一个在推理、编程和网络安全方面取得有意义进步的通用模型。鉴于其能力的强大，我们正在审慎地考虑如何发布它。”

没有 API 端点、没有定价、没有发布季度。草稿指出该模型”运行成本高昂”，尚未针对通用场景进行优化。对于围绕该模型规划路线图的团队而言，诚实的答案是：目前还没有可供规划的日期。

这对评估前沿模型的团队意味着什么

如果您正在为产品或基础设施决策进行模型评估，以下几点值得深思：

命名的模糊性是一个实际问题。 如果您的评估框架引用了”Claude Mythos 5”或将 Capybara 视为已确认的公开产品，您就是在基于 Anthropic 在发布前可能完全更改的草稿语言构建体系。在官方发布之前，请保持内部文档中命名的灵活性。

网络安全能力声明改变了某些使用场景的风险计算。 如果您的应用涉及漏洞扫描、渗透测试或代码安全分析，Mythos 声称的能力既提升了价值上限，也增加了合规负担。现在就开始评估，而不是等访问权限开放后再说。

Claude Opus 4.6 仍是生产级选项。 对于需要立即交付的团队，Opus 4.6 仍然是 Anthropic 公开可用的旗舰产品，在复杂推理任务上表现出色。为当前项目追逐一个尚未发布的模型并不明智。请查阅 Anthropic 当前的模型文档了解 API 访问和能力规格。

双重泄露事件是一个信号，而非仅仅是新闻。 一周内发生的两起重大意外披露事件——CMS 文件和 Claude Code 源代码——表明内部发布协调正承受压力。该模型可能比谨慎的公开姿态所暗示的更接近发布。或者，如果安全测试发现问题，它可能会推迟很长时间发布。两种解读都不是错的；不确定性才是实际状态。

常见问题

Claude Mythos 是否公开可用？

不。截至 2026 年 4 月，Claude Mythos / Capybara 仅对 Anthropic 选定的一小批早期访问客户开放。没有公开 API、没有已公布的定价，也没有确认的发布日期。

它与 Opus 4.6 相比如何？

根据泄露的草稿博客文章，Capybara 在软件编程、学术推理和网络安全基准测试上获得了比 Claude Opus 4.6”大幅更高的分数”。目前尚未发布具体数字。所有能力比较目前均来自该草稿来源，而非官方基准测试发布。

是否会有公开的 Claude Mythos API？

在某个时间点很可能会有——泄露草稿描述了通过 Claude API 分阶段发布的计划——但尚未确认时间表。该模型目前被描述为服务成本高昂，尚未针对通用场景进行优化。请关注 Anthropic 的官方新闻频道获取公告。

往期文章：

Claude Mythos 数据泄露事件究竟披露了什么

谁发现的，如何发现的

暴露草稿中包含什么

Claude Mythos 与 Capybara——同一模型，两个名称

Capybara 作为新层级意味着什么

公开发布前命名可能如何演变

声称的能力与 Claude Opus 4.6 的对比

编程与智能体推理

学术推理能力提升

网络安全性能——以及为何引发担忧

当前可用性：现在谁可以访问

早期访问计划详情

未确认公开 API 或发布日期

这对评估前沿模型的团队意味着什么

常见问题

相关文章

Claude Code源码泄露：BUDDY、KAIROS及所有隐藏功能全解析

什么是 Claw Code？Claude Code 重写详解

Qwen3.5-Omni 是什么：功能、版本与 API 访问指南

PixVerse V6 Extend 现已登陆WaveSpeedAI

PixVerse V6图生视频现已登陆WaveSpeedAI

PixVerse V6 Transition 现已登陆WaveSpeedAI