← 博客

什么是Claude Mythos?泄露信息、Capybara等级及Anthropic官方确认内容

Claude Mythos是Anthropic泄露的下一代模型。以下是数据泄露所揭示的内容以及该公司官方确认的信息。

2 min read
什么是Claude Mythos?泄露信息、Capybara等级及Anthropic官方确认内容

某天早上我在刷信息流时,一条财富杂志的头条让我猛地停了下来:Anthropic 意外将近 3,000 份内部文件遗留在一个可公开搜索的数据存储中——其中包括一篇宣布其下一个模型的草稿博客文章。当我点进去时,这个消息已经广泛传播。模型名称:Claude Mythos。与之关联的内部层级名称:Capybara。而 Anthropic 自己的草稿称其为”迄今为止我们开发过的最强大的 AI 模型”。

我是 Dora。本文是为开发者和 AI 产品负责人提供的事实性摘要,帮助大家清晰了解哪些内容已被证实、哪些来自泄露草稿,以及哪些仍不确定。目前尚无官方基准测试数据可引用——我也不会凭空捏造任何数字。

Claude Mythos 数据泄露事件究竟披露了什么

谁发现的,如何发现的

此次泄露源于 Anthropic 内容管理系统的配置错误。CMS 配置失误导致近 3,000 份未发布的资产暴露在可公开访问的可搜索数据存储中。两位安全研究人员独立发现了这批暴露的材料:LayerX Security 的 Roy Paz 和剑桥大学的 Alexandre Pauwels 发现了这个暴露的数据存储,其中包含一篇详细描述该模型的草稿博客文章。《财富》杂志审阅了相关文件并通知了 Anthropic,随后访问权限被限制。

Anthropic 将此事件归因于 CMS 配置中的”人为错误”,并将暴露的材料描述为”考虑发布的内容的早期草稿”。数天后发生了第二起独立的泄露事件:Anthropic 意外将 Claude Code 的全部原始源代码上传至 NPM,而非仅上传编译版本,暴露了约 1,900 个文件中的大约 50 万行代码。第二次泄露进一步证实了**Capybara 模型**正在积极准备中。

暴露草稿中包含什么

实际上存在同一篇博客文章的两个版本,两者仅在模型名称上有所不同:“Mythos”(v1)和”Capybara”(v2)。在 Capybara 版本中,标题和正文中的名称被全部替换,但副标题仍写道:“我们已完成一个新 AI 模型的训练:Claude Mythos。“Anthropic 告诉《财富》杂志,这些文件是”正在考虑发布的内容的早期草稿”,这表明该公司当时仍在为同一模型决定候选名称。

草稿还概述了一项发布策略。根据文件内容,Anthropic 计划采取比以往模型更为谨慎缓慢的发布方式,首先面向一小批负责评估网络安全应用的早期访问客户,然后通过 Claude API 逐步扩大访问范围。草稿还承认该模型”服务成本非常高”,Anthropic 正致力于在任何公开发布之前使其”效率大幅提升”。

Claude Mythos 与 Capybara——同一模型,两个名称

Capybara 作为新层级意味着什么

这是需要正确理解的最重要结构性要点。Mythos 和 Capybara 并非两个不同的模型。“Claude Mythos”是产品/世代名称(类似”Claude 4”),而”Capybara”是层级名称(类似 Haiku、Sonnet、Opus)。完整名称应类似于”Claude Mythos Capybara”。

层级区分之所以重要,是因为它代表着 Anthropic 模型阵容架构的变化。目前,Anthropic 的模型层级从 Haiku(最小、最快、最便宜)经 Sonnet 到 Opus(能力最强)。Capybara 将在三者之上增加第四个更高价的层级——根据泄露草稿,这是”比我们的 Opus 模型更大、更智能的模型——而 Opus 模型迄今为止一直是我们最强大的”。

这是结构性扩展,而非单纯的版本递增。与其将其视为”Opus 5”,不如将其理解为位于现有阵容之上的全新产品类别。

公开发布前命名可能如何演变

两个草稿版本使用了相同的名称理由,称其被选中是为了唤起”连接知识与思想的深层纽带”。该模型是否会以”Claude Mythos”、“Claude Capybara”或完全不同的面向公众的名称发布,尚未得到确认。两份草稿的存在——一份名为 Mythos,一份名为 Capybara——表明在泄露发生时这一问题仍处于讨论之中。

“Claude Mythos 5”并非官方名称。 它在报道中作为简称流传,但既未出现在泄露文件中,也未出现在任何 Anthropic 声明中。请勿将其视为已确认的名称。

声称的能力与 Claude Opus 4.6 的对比

以下所有能力声明均来源于泄露的草稿博客文章,并相应标注出处。截至 2026 年 4 月,Anthropic 尚未发布官方基准测试结果。

编程与智能体推理

根据泄露草稿,“与我们之前的最佳模型 Claude Opus 4.6 相比,Capybara 在软件编程、学术推理和网络安全等测试中的得分大幅提升。“草稿未给出具体基准测试数字——仅使用了”大幅提升”这一定性描述。目前尚无这些分数的外部验证。

关于改进的智能体推理能力的声明,与现有 Claude 模型家族的发展轨迹相符——该系列一直在逐步扩展工具使用和多步骤任务处理能力。Claude Code 在企业中的快速普及已建立在 Opus 4.6 的智能体能力之上;Mythos 应该会进一步拓展这一能力。

学术推理能力提升

泄露草稿将学术推理列为相较 Opus 4.6 表现”大幅提升”的领域之一。在经过核实的报道中,尚未出现关于涉及哪些基准测试(GPQA、MMLU、MATH 等)或声称的分数范围的具体信息。这是官方数据缺失至关重要的领域:基于草稿文件中未经核实的基准声明做出决策,存在真实的评估风险。

网络安全性能——以及为何引发担忧

这正是此次泄露引发最多讨论——也最需谨慎对待的地方。泄露草稿指出,该模型”预示着一波即将到来的模型浪潮,这些模型利用漏洞的能力将远远超过防御者的应对能力”。

泄露文件将 Mythos 描述为目前在网络安全能力方面远超任何其他 AI 模型,引发了严重的双重用途担忧。Anthropic 自己的声明直接承认了这一风险:“在准备发布 Claude Capybara 时,我们希望格外谨慎,了解它带来的风险——甚至超出我们自己测试所了解的范围。”

这里的背景并不抽象。Anthropic 此前曾报告,一个中国国家支持的组织已在利用 Claude Code 对约 30 个组织——包括科技公司、金融机构和政府机构——发动协调攻击,直到公司检测到为止。Mythos 声称的网络安全能力大幅放大了这种双重用途风险,这直接推动了谨慎的发布策略。

对于将前沿模型集成到安全工具中的团队而言,这是一个真实因素,而非仅仅是监管语言。现在就值得审阅 Anthropic 的使用政策,然后再基于当前或未来模型构建任何涉及网络安全的应用。

当前可用性:现在谁可以访问

早期访问计划详情

Anthropic 正在与一小批早期访问客户合作测试该模型。泄露草稿表明,该群体专门关注网络安全应用的评估,这意味着早期访问群体的选择基于相关领域专业知识,而非单纯基于客户规模。

根据面向早期访问客户的泄露产品信息,新模型可能被威胁行为者用于实施更强大的攻击。早期访问设计在一定程度上是受控风险评估,而非单纯的功能预览。

目前没有公开候补名单、没有已公布的申请流程,也没有扩大初始群体以外访问范围的确认时间表。如果您看到第三方网站提供”Capybara 访问”,这些网站与 Anthropic 没有关联。

未确认公开 API 或发布日期

Anthropic 的官方声明是唯一确认的公开立场:“我们正在开发一个在推理、编程和网络安全方面取得有意义进步的通用模型。鉴于其能力的强大,我们正在审慎地考虑如何发布它。”

没有 API 端点、没有定价、没有发布季度。草稿指出该模型”运行成本高昂”,尚未针对通用场景进行优化。对于围绕该模型规划路线图的团队而言,诚实的答案是:目前还没有可供规划的日期。

这对评估前沿模型的团队意味着什么

如果您正在为产品或基础设施决策进行模型评估,以下几点值得深思:

命名的模糊性是一个实际问题。 如果您的评估框架引用了”Claude Mythos 5”或将 Capybara 视为已确认的公开产品,您就是在基于 Anthropic 在发布前可能完全更改的草稿语言构建体系。在官方发布之前,请保持内部文档中命名的灵活性。

网络安全能力声明改变了某些使用场景的风险计算。 如果您的应用涉及漏洞扫描、渗透测试或代码安全分析,Mythos 声称的能力既提升了价值上限,也增加了合规负担。现在就开始评估,而不是等访问权限开放后再说。

Claude Opus 4.6 仍是生产级选项。 对于需要立即交付的团队,Opus 4.6 仍然是 Anthropic 公开可用的旗舰产品,在复杂推理任务上表现出色。为当前项目追逐一个尚未发布的模型并不明智。请查阅 Anthropic 当前的模型文档了解 API 访问和能力规格。

双重泄露事件是一个信号,而非仅仅是新闻。 一周内发生的两起重大意外披露事件——CMS 文件和 Claude Code 源代码——表明内部发布协调正承受压力。该模型可能比谨慎的公开姿态所暗示的更接近发布。或者,如果安全测试发现问题,它可能会推迟很长时间发布。两种解读都不是错的;不确定性才是实际状态。

常见问题

Claude Mythos 是否公开可用?

不。截至 2026 年 4 月,Claude Mythos / Capybara 仅对 Anthropic 选定的一小批早期访问客户开放。没有公开 API、没有已公布的定价,也没有确认的发布日期。

它与 Opus 4.6 相比如何?

根据泄露的草稿博客文章,Capybara 在软件编程、学术推理和网络安全基准测试上获得了比 Claude Opus 4.6”大幅更高的分数”。目前尚未发布具体数字。所有能力比较目前均来自该草稿来源,而非官方基准测试发布。

是否会有公开的 Claude Mythos API?

在某个时间点很可能会有——泄露草稿描述了通过 Claude API 分阶段发布的计划——但尚未确认时间表。该模型目前被描述为服务成本高昂,尚未针对通用场景进行优化。请关注 Anthropic 的官方新闻频道获取公告。

往期文章: