← 部落格

什麼是Claude Mythos?洩露資訊、Capybara等級及Anthropic的官方確認

Claude Mythos是Anthropic洩露的下一代模型。以下是資料洩露所揭露的內容以及該公司的官方確認。

2 min read
什麼是Claude Mythos?洩露資訊、Capybara等級及Anthropic的官方確認

那天早上我在刷訊息流時,一個《財富》雜誌的標題讓我猛然一頓:Anthropic 竟然意外將近 3,000 個內部文件留在了一個可公開搜尋的資料存儲庫中,其中包括一篇宣布其下一個模型的部落格草稿。我點進去的時候,這則新聞已經廣泛流傳。模型的名字:Claude Mythos。與之關聯的內部版本名稱:Capybara。而 Anthropic 自家的草稿稱其為「迄今為止我們開發的最強大的 AI 模型」。

我是 Dora。本文是為開發者和 AI 產品負責人撰寫的事實摘要,旨在梳理哪些內容已獲確認、哪些來自洩露草稿、哪些仍屬未知。目前尚無官方基準測試數據可引用,我也不會憑空捏造。

Claude Mythos 資料洩露究竟揭露了什麼

誰發現的,如何發現的

此次洩露源於 Anthropic 內容管理系統中的一個配置錯誤。CMS 的錯誤配置導致近 3,000 個未發布的資產被置於可公開存取和搜尋的資料存儲庫中。兩名安全研究人員獨立發現了這批暴露的材料:LayerX Security 的 Roy Paz 和劍橋大學的 Alexandre Pauwels 找到了這個外洩的資料存儲庫,其中包含一篇詳細描述該模型的部落格草稿。《財富》雜誌審閱了相關文件並通知了 Anthropic,隨後存取權限被限制。

Anthropic 將此次事件歸因於 CMS 配置中的「人為錯誤」,並將暴露的材料描述為「考慮發布的內容早期草稿」。數天後又發生了第二起獨立洩露事件:Anthropic 意外將 Claude Code 的全部原始碼上傳至 NPM,而非僅上傳編譯版本,在約 1,900 個文件中暴露了大約 50 萬行程式碼。第二次洩露進一步印證了 Capybara 模型 正在積極準備中。

外洩草稿中包含哪些內容

實際上存在同一篇部落格文章的兩個版本,兩者僅在模型名稱上有所不同:「Mythos」(v1)和「Capybara」(v2)。在 Capybara 版本中,標題和正文中的名稱均已替換,但副標題仍然寫道:「我們已完成一個新 AI 模型的訓練:Claude Mythos。」Anthropic 告訴《財富》雜誌,這些文件是「正在考慮發布的內容早期草稿」,這表明公司當時仍在為同一模型決定名稱候選方案。

草稿中還概述了發布策略。根據文件,Anthropic 計劃採取比以往模型更為謹慎的發布節奏,從一小群負責評估網路安全應用的早期存取客戶開始,逐步通過 Claude API 擴大存取範圍。草稿中還承認該模型「服務成本非常高昂」,Anthropic 正在努力使其「在任何全面發布之前更加高效」。

Claude Mythos 與 Capybara——同一模型,兩個名稱

Capybara 作為新版本層級意味著什麼

這是最重要的結構性要點。Mythos 和 Capybara 並非兩個不同的模型。「Claude Mythos」是產品/世代名稱(類似「Claude 4」),而「Capybara」是版本層級名稱(類似 Haiku、Sonnet、Opus)。完整稱謂類似「Claude Mythos Capybara」。

版本層級的區別至關重要,因為它代表著 Anthropic 模型陣容架構的調整。目前,Anthropic 的模型層級從 Haiku(最小、最快、最便宜)依次排列到 Sonnet 再到 Opus(最強大)。Capybara 將在這三者之上新增第四個更高價的層級——根據洩露草稿,它「比我們的 Opus 模型更大、更智能——而 Opus 模型直到現在都是我們最強大的」。

這是一次結構性擴展,而非單純的版本迭代。不妨將其理解為一個全新的產品類別,而非「Opus 5」。

公開發布前命名可能如何演變

兩個草稿版本使用了相同的命名理由,稱其名稱旨在喚起「連結知識與思想的深層紐帶」。該模型最終以「Claude Mythos」、「Claude Capybara」還是完全不同的公開名稱發布,目前尚未獲得確認。兩個草稿並存的事實——一個叫 Mythos,一個叫 Capybara——表明在洩露發生時這仍未確定。

「Claude Mythos 5」並非官方名稱。 它在報導中作為簡稱流傳,但在洩露文件或任何 Anthropic 聲明中均未出現。請勿將其視為已確認的稱謂。

聲稱的能力與 Claude Opus 4.6 的比較

以下所有能力聲明均來自洩露的草稿部落格文章,並已相應標注來源。截至 2026 年 4 月,Anthropic 尚未發布任何官方基準測試。

程式設計與代理推理

根據洩露草稿,「與我們之前最佳的模型 Claude Opus 4.6 相比,Capybara 在軟體程式設計、學術推理和網路安全等測試中的得分顯著更高。」草稿未提供具體的基準測試數字,僅使用了「顯著更高」這一定性描述。目前還沒有這些分數的外部驗證。

關於代理推理改進的聲明,與現有 Claude 模型家族的發展軌跡一致,後者一直在持續擴展工具使用和多步驟任務處理能力。Claude Code 在企業中的快速普及已建立在 Opus 4.6 的代理能力之上;Mythos 預計將進一步延伸這些能力。

學術推理改進

洩露草稿將學術推理列為相對 Opus 4.6「顯著更高」的領域之一。目前尚無關於具體使用哪些基準測試(GPQA、MMLU、MATH 等)或聲稱的分數範圍的經核實報導。在缺乏官方數字的情況下,這一領域尤為值得關注:基於草稿文件中未經驗證的基準聲明做出決策,存在真實的評估風險。

網路安全性能——以及為何引發擔憂

這是洩露事件引發最多討論——也最為謹慎對待——的領域。洩露草稿聲稱,該模型「預示著即將到來的一波能夠以遠超防禦者努力的方式利用漏洞的模型」。

洩露文件描述 Mythos 在網路安全能力上目前遠超任何其他 AI 模型,引發了嚴重的雙重用途擔憂。Anthropic 自己的聲明直接承認了這一風險:「在準備發布 Claude Capybara 的過程中,我們希望格外謹慎,了解它帶來的風險——甚至超越我們自身測試所得出的結論。」

這裡的背景並非抽象。Anthropic 此前曾報告,一個中國國家支持的組織已在公司察覺之前,利用 Claude Code 對約 30 個組織——包括科技公司、金融機構和政府機構——發動了一場有組織的滲透行動。Mythos 聲稱的網路安全能力大幅放大了這種雙重用途風險,這也是謹慎發布策略的直接驅動因素。

對於將前沿模型整合到安全工具中的團隊而言,這是一個真實的因素,而非僅僅是監管用語。現在就值得審閱 Anthropic 的使用政策,再著手在現有或未來模型上構建任何涉及網路安全的應用。

當前可用性:現在誰能存取

早期存取計劃詳情

Anthropic 正與一小群早期存取客戶合作測試該模型。洩露草稿顯示,這一群體專門聚焦於評估網路安全應用,表明早期存取群體的選擇基於相關領域專業知識,而非單純依據客戶規模。

根據洩露的早期存取客戶產品資訊,新模型可能被威脅行為者用來實施更強大的攻擊。早期存取的設計在一定程度上是受控的風險評估,而不僅僅是功能預覽。

目前沒有公開候補名單,沒有已宣布的申請流程,也沒有確認的超出初始群體的擴展時間表。如果您看到第三方網站提供「Capybara 存取」,這些均與 Anthropic 無關。

尚未確認公開 API 或發布日期

Anthropic 的官方聲明是唯一已確認的公開立場:「我們正在開發一個在推理、程式設計和網路安全方面有重大進展的通用模型。鑑於其能力的強大,我們正在謹慎考量發布方式。」

沒有 API 端點,沒有定價,沒有發布季度。草稿指出該模型「運行成本高昂」,尚未針對全面可用性進行優化。對於圍繞此模型規劃路線圖的團隊而言,誠實的答案是:目前尚無任何日期可供規劃。

這對評估前沿模型的團隊意味著什麼

如果您正在為產品或基礎設施決策進行模型評估,以下幾點值得深思:

命名的模糊性是一個實際問題。 如果您的評估框架引用了「Claude Mythos 5」或將 Capybara 視為已確認的公開產品,您是在基於 Anthropic 在發布前可能完全更改的草稿語言構建框架。在官方發布之前,請保持內部文件命名的靈活性。

網路安全能力聲明改變了某些使用場景的風險計算。 如果您的應用涉及漏洞掃描、滲透測試或程式碼安全分析,Mythos 聲稱的能力既提升了潛在價值,也增加了合規負擔。現在就開始評估,而不是等到存取開放之後。

Claude Opus 4.6 仍是生產級選項。 對於需要立即交付的團隊,Opus 4.6 仍是 Anthropic 公開可用的旗艦產品,在複雜推理任務上表現出色。為了當前項目而追逐一個未發布的模型並不明智。請參閱 Anthropic 目前的模型文件了解 API 存取和能力規格。

雙重洩露事件是一個信號,而不僅僅是一則新聞。 一週內發生兩起重大無意間披露事件——CMS 文件和 Claude Code 原始碼——表明內部發布協調面臨壓力。該模型的發布時間可能比謹慎的公開姿態所暗示的更近。或者,如果安全測試發現問題,發布時間也可能大幅推遲。兩種解讀都不算錯;不確定性才是事情的實際狀態。

常見問題

Claude Mythos 現在可以公開使用嗎?

不可以。截至 2026 年 4 月,Claude Mythos / Capybara 僅對 Anthropic 選定的一小群早期存取客戶開放。沒有公開 API,沒有已宣布的定價,也沒有確認的發布日期。

它與 Opus 4.6 相比如何?

根據洩露的草稿部落格文章,Capybara 在軟體程式設計、學術推理和網路安全基準測試中比 Claude Opus 4.6 獲得「顯著更高的分數」。目前尚未發布具體數字。所有能力比較目前均來自該草稿來源,而非官方基準測試發布。

會有公開的 Claude Mythos API 嗎?

某個時間點大概率會有——洩露草稿描述了通過 Claude API 分階段發布的計劃——但尚未確認具體時間表。該模型目前被描述為服務成本高昂,尚未針對全面可用性進行優化。請關注 Anthropic 官方新聞頻道以獲取公告。

往期文章: