← 部落格

Claude Mythos(Opus 5)洩露:目前我們所知道的一切

Anthropic 的下一代 Claude Mythos 模型在一次資料洩露中曝光。以下是洩露文件中關於其編程、推理和網路安全能力的詳細內容,以及這對 AI 發展意味著什麼。

1 min read

Anthropic 迄今最強大的 AI 模型已曝光——不是透過發布活動,而是透過一次資料外洩。描述 Claude Mythos(內部代號「Capybara」)的內部文件在 Anthropic 內容管理系統發生配置錯誤後遭到曝光,近 3,000 份檔案在無需身份驗證的情況下可被公開存取。

以下是我們目前所知的內容、尚未確認的部分,以及為何這件事至關重要。

事件經過

2026 年 3 月下旬,一名安全研究員發現 Anthropic 基礎設施上的一個配置錯誤的資料存儲,導致內部文件——包括草稿部落格文章、PDF、圖片及內部備忘錄——暴露在公開網路上。Anthropic 在接獲通知後迅速鎖定存取權限,但文件已在安全論壇和社群媒體上廣泛流傳。

Anthropic 隨後確認此次外洩屬實。一名發言人承認,公司已完成一個名為 Claude Mythos 的模型的訓練,並正在對早期存取客戶進行試用,稱其為 AI 性能的**「重大躍進」,是「我們迄今構建的能力最強的模型」**。

Claude Mythos 是什麼?

根據外洩文件,Claude Mythos 的定位高於現行的 Opus 等級——這是一個全新的模型類別,而非單純的版本升級。儘管網路上普遍稱其為「Opus 5」,但內部定位顯示 Mythos 旨在成為一個獨立的、更高層級的模型。

外洩材料的核心聲明如下:

程式設計與推理能力

Mythos 據報在程式設計基準測試和學術推理任務上,相較於 Claude Opus 4.6 取得了重大性能提升。鑑於 Opus 4.6 已在 SWE-bench Verified(約 80.8%)、Terminal-Bench 2.0 及 Humanity’s Last Exam 上位居領先,這意味著 Mythos 將這些數字大幅推高。

網路安全能力

這是此次外洩最令人警覺的部分。內部文件描述 Mythos 「在網路能力方面遠超任何其他 AI 模型」——能夠以遠超人類防禦者的速度發現並利用軟體漏洞。

文件據報警告,Mythos 「預示著一波即將到來的模型浪潮,這些模型利用漏洞的能力將遠遠超過防禦者的應對能力」——這是來自模型開發公司本身相當坦率的評估。

中國國家支持的入侵活動

或許是最爆炸性的聲明:Anthropic 據報發現一個中國國家支持的組織曾展開協調行動,利用 Claude Code 滲透約 30 個組織,包括科技公司、金融機構及政府機構。Anthropic 偵測並終止了此次行動,但這一事件似乎影響了 Mythos 謹慎的推出策略。

市場影響

此次外洩造成了立即的財務影響。對 AI 驅動網路威脅的擔憂引發美國軟體及網路安全股票拋售潮。避險情緒蔓延至加密貨幣市場,比特幣跌至 66,000 美元。日本媒體對此次外洩的國家安全影響進行了大篇幅報導。

尚未確認的內容

儘管外洩事件已發生且 Anthropic 已部分確認,仍有幾個關鍵問題懸而未決:

  • 基準測試數字。 目前尚未公布具體分數。有關 Mythos 在所有基準測試中稱霸的說法,均基於外洩的內部描述,並非經過驗證的第三方評估。
  • 定價與可用性。 目前沒有關於 API 定價、上下文視窗大小或正式上線時間表的資訊。
  • 「Opus 5」命名。 社群一直稱其為「Opus 5」或「Claude 5」,但外洩文件將 Mythos 定位為高於 Opus 的全新等級,而非直接繼任者。最終命名尚不確定。
  • 介面目擊報告。 部分用戶報告在 Claude 介面中看到「Mythos 5(實驗性)」及「更大且更智能」的描述。這些可能是有限的 A/B 測試、內部測試產物,或是偽造的截圖。目前尚無廣泛確認。

Anthropic 的推出策略

根據外洩文件及 Anthropic 的公開聲明,推出將採取審慎的方式:

  1. 優先開放給特定網路安全合作夥伴。 初始存取群體聚焦於安全研究員和防禦者——目標是在模型的攻擊性能力廣泛開放之前,先建立防禦準備。
  2. 分階段擴展。 更廣泛的存取將隨後跟進,預計透過 API 及 Claude Pro/Team/Enterprise 方案提供。
  3. 無公開發布日期。 Anthropic 尚未承諾具體時間表。

這一做法與 Anthropic 處理此前安全顧慮較高的發布方式如出一轍——緩慢、受控,優先考量防禦性使用案例。

這意味著什麼

無論你稱其為 Opus 5、Mythos 還是 Capybara,其影響都是深遠的:

對於開發者: 一個在程式設計方面明顯超越 Opus 4.6 的模型,將成為軟體開發、除錯及自主工作流程的重要工具。問題在於何時開放以及定價如何。

對於網路安全: 外洩文件描繪出一個能夠比人類修補漏洞速度更快地發現並利用漏洞的 AI 模型。若屬實,這將從根本上改變網路安全格局——防禦者將需要 AI 驅動的工具才能跟上步伐。

對於 AI 安全: Anthropic 公開承認其自身模型對網路防禦構成風險,這一點值得關注。謹慎的推出策略表明公司認真對待其《負責任擴展政策》,但也引發了一個問題:一旦能力部署完成,任何分階段發布是否真的能有效管控?

對於整個產業: 若 Mythos 兌現外洩文件中的聲明,它將為前沿 AI 模型樹立新標竿。競爭對手將需要作出回應——而網路安全方面的影響可能將加速監管層面的討論。

結論

Claude Mythos 的外洩事件是真實的。Anthropic 已確認該模型存在,並代表著能力的重大躍升。但具體細節——基準測試分數、定價、可用性、確切能力——目前仍未經外洩內部文件以外的資訊所驗證。

就目前而言,我們所掌握的是:一個來自 Anthropic 的確認下一代模型、內部文件顯示其具備前所未有的能力(尤其在網路安全方面)、謹慎的推出計畫,以及大量填補空白的推測。

我們將在 Anthropic 發布官方公告後更新本文。與此同時,Claude Opus 4.6 和 Sonnet 4.6 仍是目前公開可用的最強大 Claude 模型——在程式設計、推理及複雜任務方面已展現出相當驚人的實力。