Muse Spark是什麼?Meta的全新AI模型

Meta從其全新超級智能實驗室推出了Muse Spark。以下是其功能介紹、已確認的內容,以及開發者應關注的事項。

By Dora 3 min read
Muse Spark是什麼?Meta的全新AI模型

四個分頁。那是我週二晚上開著的數量——每個都對應著我平常工作週裡輪替使用的 AI 助理。週三早上醒來,我的動態消息裡多了第五個名字:Muse Spark。Meta 的新模型,立即上線,由一個一年前還不存在的團隊打造。

嗨,我是 Dora!我的第一反應不是興奮,而是:我需要開第五個分頁嗎?這篇文章記錄了我花了一天時間深入研究已確認的事實、資訊空白,以及對於任何正在 AI 上構建產品的人來說真正重要的事情之後所發現的結果。

Muse Spark 是什麼——以及它從何而來

Meta Superintelligence Labs:由 Alexandr Wang 領導的新部門

Muse Spark 是 Meta Superintelligence Labs(MSL)推出的第一個模型,這個 AI 部門由 Alexandr Wang 領導。他在九個月前加入 Meta,此前曾共同創辦 Scale AI。Meta 創建這個實驗室是為了回應外界對其先前 AI 模型表現不佳的批評,CEO Mark Zuckerberg 隨後從 OpenAI、Anthropic 和 Google 招募了 AI 研究人員。背後的投資規模不小——Meta 斥資 143 億美元收購 Scale AI 49% 的無投票權股份,以延攬 Wang 擔任史上首位首席 AI 官。

Llama 的問題:為何 Meta 從頭重建

如果你關注過去年四月的 Llama 4 發布,你已經知道背景故事。Llama 4 被廣泛批評為失敗之作,Meta 後來被發現使用針對特定任務進行微調的專屬未發布模型版本來虛報基準測試分數。這次的信譽打擊,正是 Muse Spark 所有努力的背景脈絡。MSL 在過去九個月內從頭重建了 Meta 的 AI 架構,稱其為他們有史以來執行最快的開發週期。

代號 Avocado,歷時 9 個月打造

內部代號為 Avocado 的 Muse Spark 是 Meta 新 Muse 系列的第一個模型。Meta 將其描述為刻意設計成小型且快速——他們的技術部落格指出,改進的訓練技術使他們能夠以少一個數量級的運算量,創建出與舊款中型 Llama 4 效能相當的更小模型。

這個效率主張值得持續關注。重點不在於原始基準測試的主導地位,而在於成本結構。

Muse Spark 實際能做什麼

即時模式 vs. 思考模式:各自的適用時機

Muse Spark 以分層推理模式運作。即時模式處理日常、快速周轉的查詢——那種你每天會向助理提問十次的類型。思考模式則為更複雜的任務加入逐步推理:法律文件分析、從照片進行營養分析、多步驟數學題。Meta AI 應用程式的使用者可以根據提示的複雜程度在兩種模式之間切換。

多模態理解:圖像、音訊、文字輸入 → 文字和互動式輸出

該模型接受語音、文字和圖像輸入,但僅產生文字輸出。這是一個重要的區別。這裡的「多模態」指的是感知,而非生成。拍張照片、說一個問題、貼上截圖——Muse Spark 都能處理。但回傳的是文字和互動元素(網站、儀表板、遊戲),而非圖像或影片。

Meta 在 Muse Spark 中內建了強大的多模態感知能力,讓助理能夠看見並理解你所看到的內容,而不僅僅是閱讀你輸入的文字。他們的範例:拍攝機場零食架的照片,無需閱讀標籤就能獲得按蛋白質排名的分析。

視覺 STEM、視覺程式設計、迷你遊戲:已確認的互動式輸出功能

這是大多數報導低估的部分。Muse Spark 可以直接從自然語言提示生成客製化的互動式網站、儀表板和迷你遊戲——Meta 稱之為「視覺程式設計」。他們的官方部落格文章描述了用一句話構建復古街機遊戲、飛行模擬器和派對規劃儀表板的案例。該模型還能處理視覺 STEM 問題,並引導至互動式體驗,例如創建有趣的迷你遊戲或排除家電故障。

這不是圖像生成,而是帶有視覺輸出層的程式碼生成。不同的類別,不同的使用場景。

多子代理協調以處理複雜請求

Muse Spark 可以平行啟動多個子代理來解決問題——例如,規劃一次家庭旅行時,一個代理起草行程,另一個比較目的地,第三個尋找適合兒童的活動,全部同時進行。我自己尚未測試過這個功能。架構很有趣;實際的可靠性尚未經過驗證。

沉思模式:已確認即將推出,無時間表

Meta 計劃推出「沉思」模式,允許模型透過協調一組 AI 代理進行平行推理來處理更複雜的問題,TechCrunch 對此有所報導。Wang 在 X 上表示,沉思模式可與 Gemini Deep Think 和 GPT Pro 等其他極限推理模型相媲美。目前沒有公開時間表。Artificial Analysis 基準測試數據顯示,沉思模式在 Humanity’s Last Exam 上的早期得分為 50.2%——但這是在 Meta 提供的條件下測試的,並非大規模獨立複製的結果。

Muse Spark 不是什麼

不是獨立的圖像/影片生成模型

我想直說,因為我已經在多篇文章中看到這種混淆。Muse Spark 不生成圖像或影片。 Meta AI 應用程式中的 Vibes AI 影片功能目前使用來自 Black Forest Labs 等第三方的 AI 模型,Meta 只計劃讓 Muse Spark「最終」為其提供支援。截至發布時,如果你透過 Meta AI 生成影片,那不是 Muse Spark 在處理這項工作。

不是開放權重——刻意從 Llama 策略轉向

與 Meta 先前的 Llama 模型不同(任何人都可以下載、修改和運行的開放權重模型),Muse Spark 是專有的。Meta 表示他們「希望開源未來版本」,Axios 報導計劃進行開源發布。但目前,權重是封閉的。對於建立在 Llama 開放性之上的團隊來說,這是一個重大轉變。

不是公開 API(僅限私人預覽,精選合作夥伴)

Meta 僅向精選合作夥伴提供 Muse Spark 的 API 私人預覽。沒有公開的 API 定價,也沒有宣布的全面開放時間表。如果你是希望整合這項功能的開發者,你需要等待。

今日可用的平台

meta.ai 和 Meta AI 應用程式:2026 年 4 月 8 日起上線

Muse Spark 目前為 Meta AI 應用程式和 meta.ai 網站提供支援,隨著模型升級同步推出全新外觀。所有模式均可免費使用,但 Meta 可能會設定使用頻率限制。

WhatsApp、Instagram、Facebook、Messenger、AI 眼鏡:陸續推出

Muse Spark 將在未來幾週內陸續推出至 WhatsApp、Instagram、Facebook、Messenger 和 AI 眼鏡。

API:僅限精選合作夥伴的私人預覽

無公開存取,無定價資訊。我的數據到此為止。

效能背景

Artificial Analysis 智能指數:52 分

Muse Spark 在 Artificial Analysis 智能指數上得分 52,位居前五——落後於 Gemini 3.1 Pro Preview(57 分)、GPT-5.4(57 分)和 Claude Opus 4.6(53 分)。重要注意事項:Artificial Analysis 獲得了 Meta 的早期存取權限以獨立對模型進行基準測試。獨立,是的,但在 Meta 的條件和時間表下進行的。

關於 Meta 進步了多遠的背景數據:Llama 4 Maverick 和 Scout 在同一指數上分別得分 18 和 13。這是 3 倍的躍升。

有一個數字引起了我的注意:Muse Spark 僅使用了 5800 萬個輸出 token 就完成了完整的評估,而 Claude Opus 4.6 使用了 1.57 億個,GPT-5.4 使用了 1.2 億個。在這種規模下的 token 效率不是小事——這是一個關於成本的故事。

Meta 坦承的當前差距領域

Meta 公開承認在長期代理系統和程式設計工作流程方面存在效能差距。VentureBeat 分析確認了這一點:Muse Spark 在 Terminal-Bench 等程式設計基準測試和代理任務評估上明顯落後。如果你的工作流程以程式設計為主,這不是你的模型。至少現在還不是。

隱私與數據考量

需要 Meta 帳戶登入

Muse Spark 使用者需要使用 Facebook 或 Instagram 等現有 Meta 帳戶登入。沒有匿名存取途徑。

Meta 的數據政策:使用者須知

Axios 指出,Meta 的隱私政策對公司如何使用其 AI 系統所分享的任何數據幾乎沒有限制。Meta 沒有明確表示 Facebook 或 Instagram 帳戶中的個人資訊將被 AI 使用,但這很可能發生,考慮到 Meta 通常會對公開用戶數據進行訓練,且已將 Muse Spark 定位為個人超級智能產品。

如果你在評估任何涉及敏感輸入的工作流程——客戶數據、健康問題、內部文件——在你在那個框裡輸入任何內容之前,請先閱讀 Meta 隱私政策。這不是警告,這是工作流程中的一個步驟。

常見問題

Muse Spark 是免費使用的嗎?

是的。透過 meta.ai 和 Meta AI 應用程式,模型的所有模式均可免費使用,但 Meta 可能會設定使用頻率限制。

Muse Spark 是開源的嗎?

不是。Muse Spark 是專有的,儘管 Meta 表示「希望開源未來版本的模型」。這是與 Llama 策略的決裂。

Muse Spark 可以生成圖像或影片嗎?

不能。Muse Spark 處理文字、圖像和語音輸入,並產生文字和互動式輸出(網站、迷你遊戲、儀表板)。Vibes 影片功能目前依賴來自 Black Forest Labs 的第三方模型。

Muse Spark API 何時將公開開放?

沒有確認日期。目前僅對精選合作夥伴提供私人預覽。Meta 已表示有意提供更廣泛的 API 存取,但尚未承諾時間表。

Muse Spark 與 GPT-5.4 和 Gemini 相比如何?

在 Artificial Analysis 智能指數上,Muse Spark(52 分)落後於 GPT-5.4(57 分)、Gemini 3.1 Pro(57 分)和 Claude Opus 4.6(53 分)。它在健康基準測試和多模態視覺方面領先,但在程式設計和代理任務上落後。比較結果完全取決於你的使用場景。

我將持續關注沉思模式公開開放後的表現,以及 API 是否以對第三方開發者真正可用的方式開放。目前 Muse Spark 的有趣之處在於它所傳達的關於 Meta 方向的訊號——但對於大多數開發者的工作流程來說,它還不是可以整合的東西。這可能很快改變,也可能不會。當 API 開放時自己測試看看,那比我說的任何話都更能告訴你答案。

相關文章: