Muse Sparkとは?MetaのAIの新モデル

MetaはSuperintelligence LabsからMuse Sparkをリリースした。その機能、確認済みの情報、そして開発者が注目すべき点を解説する。

By Dora 1 min read
Muse Sparkとは?MetaのAIの新モデル

4つのタブ。火曜日の夜に開いていたタブの数だ——通常の仕事週にローテーションしているAIアシスタントがそれぞれ1つずつ。水曜日の朝、フィードに5番目の名前が現れた。Muse Spark。Metaの新モデル、即日公開、1年前には存在しなかったチームによって構築された。

どうも、Doraです!最初の直感は興奮ではなかった。思ったのは:5番目のタブを開く必要があるのか?この記事は、確認された事実、不明な点、そして今AIの上に何かを構築しているなら重要なことを1日かけて分析した結果をまとめたものだ。

Muse Sparkとは何か——そしてどこから来たのか

Meta Superintelligence Labs:Alexandr Wangが率いる新ユニット

Muse Sparkは、Meta Superintelligence Labs(MSL)から生まれた最初のモデルだ。このAIユニットはAlexandr Wangが率いており、彼はScale AIの共同創業者として9ヶ月前にMetaに加わった。Metaはこのラボを、以前のAIモデルが期待を下回るという批判への対応として設立し、CEOのMark ZuckerbergがOpenAI、Anthropic、GoogleからAI研究者を採用した。その投資規模は小さくない——MetaはWangを初代チーフAIオフィサーとして迎えるために、Scale AIの49%議決権なし株式を取得するために143億ドルを費やした。

Llamaの問題:なぜMetaはゼロから再構築したのか

昨年4月のLlama 4ローンチを追っていたなら、背景はすでにご存知だろう。Llama 4は広く「失敗作」と批判され、Metaは後に特定タスク向けにファインチューニングされた特殊な未公開モデルバージョンを使ってベンチマークスコアを水増ししていたことが発覚した。この信頼失墜こそが、Muse Sparkが取り組もうとしているすべての文脈だ。MSLは過去9ヶ月間でMetaのAIスタックをゼロから再構築し、これまでで最速の開発サイクルと呼んでいる。

コードネームAvocado、9ヶ月で構築

内部コードネームはAvocado。Muse SparkはMetaの新しいMuseシリーズの最初のモデルだ。Metaはこれを意図的に小型で高速なモデルとして説明している——技術ブログには、改善されたトレーニング技術により、桁違いに少ないコンピューティングで以前の中規模Llama 4のパフォーマンスに匹敵する小型モデルを作成できたと述べている。

この効率性の主張は注目に値する。生のベンチマーク支配ではない。コスト構造の話だ。

Muse Sparkが実際にできること

インスタントモードvs思考モード:それぞれの適用場面

Muse Sparkは段階的な推論モードで動作する。インスタントモードは、1日に何度も使うような素早い回答が必要なカジュアルな質問を処理する。思考モードは、法的文書の分析、写真からの栄養素の分析、多段階の数学など、より複雑なタスクに段階的な推論を加える。Meta AIアプリのユーザーは、プロンプトの複雑さに応じてモードを切り替えることができる。

マルチモーダル理解:画像・音声・テキスト入力→テキストとインタラクティブな出力

モデルは音声、テキスト、画像の入力を受け付けるが、テキストのみを出力する。これは重要な区別だ。ここでいう「マルチモーダル」は認識を意味し、生成ではない。写真を撮る、質問を話す、スクリーンショットを貼り付ける——Muse Sparkはこれらすべてを処理する。しかし返ってくるのはテキストとインタラクティブな要素(ウェブサイト、ダッシュボード、ゲーム)であり、画像や動画ではない。

Metaは強力なマルチモーダル認識をMuse Sparkに組み込んだ。アシスタントがあなたが見ているものを見て理解できるようにするためであり、単に入力を読むだけではない。例として挙げられているのは:空港のスナック棚を撮影してラベルを読まずにタンパク質別のランキングを取得するというものだ。

ビジュアルSTEM、ビジュアルコーディング、ミニゲーム:確認されたインタラクティブな出力機能

これは多くのメディアが過小評価している部分だ。Muse Sparkは自然言語のプロンプトから直接カスタムのインタラクティブなウェブサイト、ダッシュボード、ミニゲームを生成できる——Metaが「ビジュアルコーディング」と呼ぶものだ。公式ブログ記事では、1文からレトロアーケードゲーム、フライトシミュレーター、パーティー計画ダッシュボードを構築することが説明されている。モデルはまた、楽しいミニゲームの作成や家電製品のトラブルシューティングなどのインタラクティブな体験につながるビジュアルSTEMの質問も処理する。

これは画像生成ではない。ビジュアル出力レイヤーを持つコード生成だ。異なるカテゴリ、異なるユースケースである。

複雑なリクエストのためのマルチサブエージェント協調

Muse Sparkは複数のサブエージェントを並行して起動し、質問に取り組むことができる——例えば、家族旅行を計画する際に、1つのエージェントが旅程を作成し、別のエージェントが目的地を比較し、3番目のエージェントが子供向けのアクティビティを見つける、これらすべてを同時に行う。私はまだこれを自分でテストしていない。アーキテクチャは興味深いが、実際の信頼性は未検証だ。

熟考モード:確認済みの予定機能、タイムライン未定

Metaは、より複雑な問題に取り組むために並行推論のためにAIエージェントのグループを調整する「熟考」モードを展開する計画だ(TechCrunch)。WangはXで、熟考モードはGemini Deep ThinkやGPT Proなどの他の極限推論モデルと競争力があると述べた。公開タイムラインはない。Artificial Analysisのベンチマークデータは、Humanity’s Last Examで熟考モードの初期スコアが50.2%を示しているが——これはMetaが提供した条件下でテストされたものであり、大規模に独立して再現されたものではない。

Muse Sparkではないもの

スタンドアロンの画像/動画生成モデルではない

複数の記事でこれが混同されているのをすでに見ているので、はっきり言いたい。Muse Sparkは画像や動画を生成しない。Meta AIアプリのVibes AI動画機能は現在Black Forest Labsなどのサードパーティからのモデルを使用しており、MetaはMuse Sparkが「いずれ」それを動かすことを計画しているだけだ。ローンチ時点では、Meta AIを通じて動画を生成している場合、それはMuse Sparkが行っているわけではない。

オープンウェイトではない——Llama戦略からの意図的な転換

誰でもダウンロード、修正、実行できるオープンウェイトモデルとしてリリースされたMetaの以前のLlamaモデルとは異なり、Muse Sparkは独自モデルだ。Metaは「将来のバージョンをオープンソース化することを望む」と述べており、Axiosが報じたところによればオープンソースリリースが計画されている。しかし現時点では、ウェイトはクローズドだ。Llamaのオープン性の上に構築したチームにとって、これは重要な転換だ。

パブリックAPIではない(プライベートプレビュー、一部パートナーのみ)

MetaはMuse Sparkを一部のパートナーのみにAPIを通じてプライベートプレビューとして提供している。公開APIの価格設定なし、一般アクセスの発表済みタイムラインなし。これを統合したいと思っているビルダーは待機中だ。

現在利用可能な場所

meta.aiとMeta AIアプリ:2026年4月8日時点で公開

Muse SparkはMeta AIアプリとmeta.aiウェブサイトを現在動かしており、モデルのアップグレードと同時に新しいルックが展開されている。すべてのモードは無料で使用できるが、Metaはレート制限を課す可能性がある。

WhatsApp、Instagram、Facebook、Messenger、AIメガネ:展開中

Muse SparkはWhatsApp、Instagram、Facebook、Messenger、AIメガネに今後数週間で展開される予定だ。

API:一部のパートナーのみのプライベートプレビュー

パブリックアクセスなし。価格設定なし。ここで私のデータは終わる。

パフォーマンスの文脈

Artificial Analysis Intelligence Index:52

Muse SparkはArtificial Analysis Intelligence Indexで52点を獲得し、トップ5に入っている——Gemini 3.1 Pro Preview(57)、GPT-5.4(57)、Claude Opus 4.6(53)の後ろだ。重要な注意点として:Artificial AnalysisはMetaからモデルを独立してベンチマークするための早期アクセスを受け取った。独立しているが、Metaの条件とタイムラインに基づいている。

Metaがどれだけ進歩したかの文脈として:Llama 4 MaverickとScoutは同じインデックスでそれぞれ18と13を記録していた。これは3倍のジャンプだ。

私の注目を引いた数字の1つ:Muse Sparkは完全な評価を完了するために5800万の出力トークンしか使用しなかったが、これはClaude Opus 4.6の1億5700万、GPT-5.4の1億2000万と比較してのことだ。そのスケールでのトークン効率は脚注ではない——コストの話だ。

Metaが認める現在のギャップ

Metaはロングホライズンのエージェントシステムとコーディングワークフローにおけるパフォーマンスのギャップを公然と認めている。VentureBeatの分析がこれを確認している:Muse SparkはTerminal-Benchなどのコーディングベンチマークとエージェントタスク評価で大きく遅れをとっている。コードが多いワークフローであれば、これはあなたのモデルではない。まだ。

プライバシーとデータの考慮事項

Metaアカウントログインが必要

Muse Sparkユーザーは、FacebookやInstagramなど既存のMetaアカウントでログインする必要がある。匿名アクセスの方法はない。

Metaのデータポリシー:ユーザーが知っておくべきこと

Axiosは、MetaのプライバシーポリシーがAIシステムと共有されたデータの使用方法についてほとんど制限を設けていないことを指摘した。MetaはFacebookやInstagramアカウントの個人情報がAIによって使用されるとは明示していないが、Metaは一般的に公開ユーザーデータでトレーニングしており、Muse Sparkをパーソナル超知能製品として位置付けていることを考えると、その可能性は高い。

クライアントデータ、健康上の質問、内部文書など、機密性の高い入力を含むワークフローでこれを評価する場合は、そのボックスに何かを入力する前にMetaプライバシーポリシーを読んでほしい。これは警告ではない。ワークフローのステップだ。

よくある質問

Muse Sparkは無料で使えますか?

はい。モデルのすべてのモードはmeta.aiとMeta AIアプリを通じて無料で利用できるが、Metaはレート制限を課す可能性がある。

Muse Sparkはオープンソースですか?

いいえ。Muse Sparkは独自モデルだが、Metaは「将来のバージョンをオープンソース化することを望む」と表明している。これはLlama戦略からの転換だ。

Muse Sparkは画像や動画を生成できますか?

いいえ。Muse Sparkはテキスト、画像、音声の入力を処理し、テキストとインタラクティブな出力(ウェブサイト、ミニゲーム、ダッシュボード)を生成する。Vibes動画機能は現在Black Forest Labsのサードパーティモデルに依存している。

Muse Spark APIはいつ公開されますか?

確認された日程はない。現在、一部のパートナーのみのプライベートプレビュー中だ。MetaはAPIアクセスの拡大を示唆しているが、タイムラインにはコミットしていない。

Muse SparkはGPT-5.4やGeminiと比べてどうですか?

Artificial Analysis Intelligence Indexでは、Muse Spark(52)はGPT-5.4(57)、Gemini 3.1 Pro(57)、Claude Opus 4.6(53)に遅れをとっている。健康ベンチマークとマルチモーダルビジョンでは優位に立つが、コーディングとエージェントタスクでは後れをとる。比較はあなたのユースケース次第だ。

熟考モードが公開されたときのパフォーマンスと、APIがサードパーティビルダーにとって実際に使いやすい形で開放されるかどうかを注視し続けるつもりだ。現時点では、Muse SparkはMetaの方向性について何を示唆しているかという点で興味深い——しかし、ほとんどのビルダーワークフローにとっては、まだ統合できるものではない。それは急速に変わるかもしれないし、変わらないかもしれない。APIがリリースされたら自分で試してほしい。私が言うことより、それが多くを語るだろう。

以前の記事: