Claude Mythos(Opus 5)がリーク:現時点で判明していること
AnthropicのClaude Mythosモデルがデータ漏洩によって明らかになりました。リークされたドキュメントには、コーディング、推論、サイバーセキュリティにおける性能についての情報が含まれています。AIの未来にとって何を意味するのかをまとめます。
Anthropicの最も強力なAIモデルが明らかになった——ローンチイベントではなく、データ漏洩によって。Anthropicのコンテンツ管理システムの設定ミスにより、約3,000件のファイルが認証なしに公開アクセス可能な状態になり、Claude Mythos(内部コードネーム「Capybara」)を説明する内部文書が流出した。
ここでは、判明していること、まだ未確認のこと、そしてその意義について解説する。
何が起きたのか
2026年3月下旬、セキュリティ研究者がAnthropic社のインフラ上で設定ミスのあるデータストアを発見。内部文書——ブログ投稿の下書き、PDF、画像、内部メモ——がインターネット上に公開されていた。Anthropicは通報を受けてすぐにアクセスを制限したが、その前に文書はセキュリティフォーラムやソーシャルメディア上に拡散してしまった。
Anthropicはその後、この漏洩が本物であることを認めた。広報担当者は、同社がClaude Mythosというモデルのトレーニングを完了し、早期アクセス顧客との試験運用を行っていることを認め、これをAIパフォーマンスにおける**「段階的な変化」であり「これまでに構築した中で最も有能なモデル」**と表現した。
Claude Mythosとは何か
流出した文書によると、Claude Mythosは現在のOpusティアの上位に位置する——単なるバージョンアップではなく、全く新しいクラスのモデルだ。インターネット上では「Opus 5」と呼ばれているが、内部のポジショニングでは、MythosはOpusの直接の後継ではなく、より上位の独立したティアとして位置づけられている。
流出した資料の主な主張:
コーディングと推論
Mythosはコーディングベンチマークや学術的推論タスクにおいて、Claude Opus 4.6を大幅に上回るパフォーマンスを発揮すると報告されている。Opus 4.6がすでにSWE-bench Verified(約80.8%)、Terminal-Bench 2.0、Humanity’s Last Examでリードしていることを考えると、Mythosはこれらの数値をさらに大幅に押し上げることを意味している。
サイバーセキュリティ能力
これが漏洩の中で最も衝撃的な部分だ。内部文書では、Mythosを**「サイバー能力において他のいかなるAIモデルをも大幅に凌駕している」**と説明——ソフトウェアの脆弱性を人間の防御者をはるかに上回る速度で発見・悪用できるとしている。
文書には、Mythosが**「防御者の取り組みを大幅に上回るペースで脆弱性を悪用できるモデルの来たるべき波を予告している」**という注目すべき自社評価が記されている。
中国の国家支援によるサイバー攻撃への悪用
おそらく最も衝撃的な主張は:Anthropicが、中国の国家支援グループがClaude Codeを使用して、テック企業、金融機関、政府機関を含む約30の組織に侵入する組織的なキャンペーンを実行していたことを発見したというものだ。Anthropicはこのキャンペーンを検知して阻止したが、この事件はMythosの慎重な展開戦略に影響を与えているようだ。
市場への影響
この漏洩は即座に経済的な影響をもたらした。AIを活用したサイバー脅威への懸念から、米国のソフトウェア株およびサイバーセキュリティ株が売られた。リスク回避の動きは暗号資産市場にも波及し、ビットコインは66,000ドルまで下落。日本のメディアも漏洩の国家安全保障上の意味合いを広く報道した。
まだ未確認のこと
漏洩とAnthropicの部分的な確認にもかかわらず、いくつかの重要な疑問が残っている:
- ベンチマーク数値。 具体的なスコアは公表されていない。Mythosがあらゆるベンチマークを制するという主張は、検証済みのサードパーティ評価ではなく、流出した内部文書の記述に基づいている。
- 価格と提供状況。 APIの価格、コンテキストウィンドウのサイズ、一般提供のタイムラインに関する情報はない。
- 「Opus 5」という名称。 コミュニティでは「Opus 5」や「Claude 5」と呼んでいるが、流出した文書ではMythosをOpusの直接の後継ではなく、その上位の新しいティアとして位置づけている。最終的な名称は不明だ。
- UIでの目撃情報。 一部のユーザーがClaudeのインターフェースで「Mythos 5 (experimental)」や「より大規模でより知的」という説明を見たと報告している。これらは限定的なA/Bテスト、内部テストの痕跡、あるいは偽造スクリーンショットの可能性がある。広く確認されているわけではない。
Anthropicの展開戦略
流出した文書とAnthropicの公式声明を踏まえると、展開は意図的に慎重に進められる:
- まず特定のサイバーセキュリティパートナーへ。 初期アクセスグループはセキュリティ研究者と防御者に焦点を当てており——モデルの攻撃的な能力が広く利用可能になる前に防御の準備を整えることが目的だ。
- 段階的な拡大。 その後、APIおよびClaude Pro/Team/Enterpriseプランを通じて、より広範なアクセスが提供される予定だ。
- 公開ローンチ日は未定。 Anthropicはタイムラインを明示していない。
このアプローチは、安全上の懸念が高まった際の過去のリリース方法——緩やかで管理された、防御的なユースケースを優先する——を踏襲している。
これが意味すること
Opus 5、Mythos、Capybaraのいずれと呼んでも、その意味合いは重大だ:
開発者にとって: コーディングにおいてOpus 4.6を大幅に超えるモデルは、ソフトウェア開発、デバッグ、エージェント型ワークフローにとって主要なツールとなる。問題は、いつ利用可能になり、どのような価格で提供されるかだ。
サイバーセキュリティにとって: 流出した文書は、人間がパッチを当てるより速く脆弱性を発見・悪用できるAIモデルの姿を描き出している。これが正確であれば、サイバーセキュリティの状況は根本的に変わる——防御者は対抗するためにAI活用ツールを必要とするだろう。
AI安全性にとって: Anthropicが自社のモデルがサイバー防御にリスクをもたらすと公式に認めたことは注目に値する。慎重な展開はRespnsible Scaling Policyを真剣に受け止めていることを示唆するが、一方で、段階的なリリースが一度展開された能力を本当に制御できるのかという疑問も提起する。
業界にとって: Mythosが流出した文書の主張を実現するならば、フロンティアAIモデルの新たな基準を打ち立てることになる。競合他社は対応を迫られ、サイバーセキュリティへの影響は規制に関する議論を加速させるだろう。
結論
Claude Mythosの漏洩は本物だ。Anthropicはモデルが存在し、重大な能力の向上を意味することを確認した。しかし詳細——ベンチマーク、価格、提供状況、具体的な能力——は、流出した内部文書の内容を超えては未確認のままだ。
現時点で分かっていることは:Anthropicによる次世代モデルの存在の確認、前例のない能力(特にサイバーセキュリティにおける)を示唆する内部文書、慎重な展開計画、そして空白を埋める多くの憶測、だ。
Anthropicが公式発表を行い次第、この記事を更新する予定だ。それまでの間、Claude Opus 4.6とSonnet 4.6は公式に利用可能な最も有能なClaudeモデルであり続ける——そして、コーディング、推論、複雑なタスクにおいてすでに非常に強力なモデルだ。
