Muse Spark против Llama 4: стратегический сдвиг Meta

Meta только что выпустила новую серию моделей. Если вы что-то строили на Llama 4 в прошлом году, вероятно, вы уже думаете — продолжать или начинать планировать миграцию.

Меня зовут Дора. Вчера я провела весь день, изучая всю документацию, опубликованную Meta, сопоставляя её со сторонними бенчмарками и пытаясь понять, что всё это означает для тех, у кого Llama уже в стеке. Этот материал разбирает, что изменилось, что осталось прежним и в какой ситуации сейчас находятся разработчики.

Что изменилось между Llama 4 и Muse Spark

Архитектура: девять месяцев с нуля

Meta Superintelligence Labs — подразделение, сформированное после того, как Александр Ванг стал главным директором по ИИ в середине 2025 года, — полностью перестроила весь AI-стек с нуля. Новая инфраструктура, новая архитектура, новые конвейеры данных. Это не маркетинговые слова — именно так написано в официальном техническом блоге Meta. Muse Spark — первая модель, вышедшая из этой перестройки.

Llama 4 использовала архитектуру Mixture-of-Experts с открытыми весами. Muse Spark — это нативно мультимодальная модель рассуждений: зрение не было добавлено постфактум, оно интегрировано с самого начала. Поддерживаются использование инструментов, визуальная цепочка рассуждений и оркестрация мульти-агентов. У Llama 4 ничего из этого не было в качестве нативных возможностей.

Модель также вводит многоуровневые режимы рассуждений: Instant для простых запросов, Thinking для пошаговой работы и режим Contemplating, запускающий несколько суб-агентов параллельно. Последний — ответ Meta на Gemini Deep Think и расширенное рассуждение GPT Pro.

Эффективность: заявление Meta, а не независимый вывод

Meta утверждает, что Muse Spark достигает уровня возможностей Llama 4 Maverick, используя более чем в десять раз меньше вычислительных ресурсов. Описываемый механизм — «сжатие мыслей»: в процессе обучения с подкреплением модель штрафуется за избыточное время рассуждения, что вынуждает её рассуждать с меньшим числом токенов без потери точности.

Хочу быть точной: это заявление Meta. Независимого воспроизведения не было. Тем не менее данные по токенной эффективности от Artificial Analysis показывают, что Muse Spark использовала 58 миллионов выходных токенов для полного прохождения их Intelligence Index — сопоставимо с 57 миллионами Gemini 3.1 Pro и значительно меньше 157 миллионов Claude Opus 4.6 и 120 миллионов GPT-5.4. Так что история с эффективностью имеет определённое независимое подтверждение, по крайней мере со стороны выходных данных.

Разрыв в бенчмарках: 18 против 52

По данным Artificial Analysis, Llama 4 Maverick набрала 18 баллов в Intelligence Index на момент запуска. Muse Spark набрала 52. Это четвёртое место в общем зачёте — позади Gemini 3.1 Pro Preview и GPT-5.4 (оба по 57) и Claude Opus 4.6 (53).

Важная оговорка: Artificial Analysis получила ранний доступ от Meta для тестирования модели. Оценки они проводили самостоятельно, но сам доступ предоставила Meta. Это ещё не полностью независимые публичные бенчмарки. Результаты полезны как ориентир, но не как истина в последней инстанции.

Где Muse Spark лидирует: медицинские бенчмарки (42,8 на HealthBench Hard, впереди 40,1 у GPT-5.4), визуальное рассуждение (80,5% на MMMU-Pro, второе место после Gemini 3.1 Pro), понимание графиков.

Где уступает: программирование (Terminal-Bench Hard, позади Claude Sonnet 4.6 и GPT-5.4), агентные задачи (GDPval-AA — 1427 ELO против 1676 у GPT-5.4) и абстрактное рассуждение (ARC-AGI-2 — 42,5 против 76+ у ведущих конкурентов). Meta явно признала эти пробелы в своём техническом блоге, указав, что продолжает инвестировать в «долгосрочные агентные системы и рабочие процессы кодирования».

Переход от открытого к закрытому

Модель Llama: открытые веса, экосистема сообщества

Ценностное предложение Llama было простым. Скачайте веса, запустите на собственном железе, дообучите под свой сценарий, платите только за вычисления. Подход с открытыми весами создал целую экосистему — тысячи дообученных вариантов на Hugging Face, self-hosted-развёртывания в стартапах и корпорациях, целая отрасль квантизованных моделей на потребительских GPU. Llama 4 Scout помещается на одном H100. Maverick запускается на RTX 5090 с квантизацией.

Эта экосистема никуда не делась. Модели не удалены.

Модель Muse Spark: закрытая, только частный превью API

Muse Spark является проприетарной. Никаких загружаемых весов. Никакого самостоятельного хостинга. Сейчас она работает в Meta AI во всех приложениях компании — на сайте Meta AI и в ближайшее время в WhatsApp, Instagram, Facebook, Messenger и очках Ray-Ban AI. Сторонние разработчики могут подать заявку на частный превью API. Вот и всё.

Это более закрытый вариант, чем у OpenAI или Anthropic, которые хотя бы предоставляют публичный API-доступ. Как отметило издание Fortune в своём материале, Muse Spark «ещё более проприетарна, чем платные проприетарные модели конкурентов Meta».

«Мы надеемся открыть исходный код будущих версий»

Блог Meta включает эту фразу. Цукерберг написал в Threads о планах выпускать «всё более продвинутые модели, расширяющие горизонты интеллекта и возможностей, включая новые модели с открытым исходным кодом». Ванг упомянул открытие будущих версий в X.

Никаких сроков. Никаких конкретных обязательств — о какой модели и когда. Нет понимания, означает ли «будущие версии», что сама Muse Spark со временем будет открыта, или параллельно продолжится отдельная ветка с открытыми весами.

Сравните это с манифестом Цукерберга 2024 года под названием «Открытый исходный код ИИ — путь вперёд», где он утверждал, что открытие Llama не подрывает доходы Meta. Это было восемнадцать месяцев назад. Стратегический расчёт явно изменился. Как сформулировал в своём анализе The Next Web, закрытие — сигнал того, что Meta теперь считает себя участником гонки, в которой отдавать архитектурные инновации бесплатно стоит больше, чем приносит.

Здесь мои данные заканчиваются. Откроют ли будущие модели Muse — вопрос спекуляций. Обновлю материал, когда появится что-то конкретное.

Что это означает для разработчиков, использующих Llama сегодня

Self-hosted Llama: по-прежнему жизнеспособна, не устарела

Когда VentureBeat напрямую спросил Meta, завершена ли разработка Llama, представитель ответил: «Наши текущие модели Llama продолжат быть доступны как open source». Эта формулировка тщательно подобрана. Она подтверждает, что существующие модели остаются доступными. О будущем развитии Llama — ни слова.

Если вы сегодня запускаете Llama 4 Scout или Maverick в продакшене, операционно ничего не изменилось. Веса по-прежнему на Hugging Face. Дообученные версии от сообщества работают. Инфраструктуру трогать не нужно.

Операционные компромиссы: сейчас против ожидания

Вот практическая ситуация. Если у вас работает развёртывание Llama — конвейер инференса настроен, затраты предсказуемы, команда знает параметры — у вас есть нечто понятное и предсказуемое. Ценообразование API для Muse Spark не объявлено. Публичный доступ к API не объявлен. Частный превью только по приглашениям.

Переход с self-hosted модели с открытыми весами на закрытый API означает отказ от контроля над задержками, доступностью, структурой затрат и обработкой данных. Для одних команд этот компромисс оправдан. Для других — нет. Суть в том, что вы пока даже не можете оценить компромисс, потому что условия API Muse Spark публично не существуют.

Рабочие процессы кодирования: признанный пробел

Если ваше развёртывание Llama занимается генерацией кода, code review или любыми задачами для разработчиков, сейчас нет смысла смотреть в сторону Muse Spark. Meta сами это признали — кодирование пока слабое место. На Terminal-Bench Hard Muse Spark уступает Claude Sonnet 4.6 и GPT-5.4. На GDPval-AA, измеряющем реальные рабочие задачи, она набирает 1427 ELO против 1648 у Claude Sonnet 4.6.

Подходит для моих сценариев. Для ваших может быть иначе. Но данные здесь однозначны.

Почему Meta сделала этот шаг

Llama 4: признанный провал

Llama 4 вышла в апреле 2025 года и встретила неоднозначный приём. Скандал с бенчмарками — Meta использовала специализированную, нераскрытую «экспериментальную чат-версию» для накрутки результатов на LMArena — ударил по репутации. Сами модели были добротными для своего весового класса, но не продвигали фронтир. К середине 2025 года нарратив сводился к тому, что Meta отстала от OpenAI, Anthropic и Google.

Мандат Ванга

В июне 2025 года Meta потратила 14,3 миллиарда долларов на приобретение 49% неголосующей доли в Scale AI и привлекла сооснователя Александра Ванга в качестве главного директора по ИИ. Мандат был прямым: догнать. Был создан Meta Superintelligence Labs. Исследователи привлекались из OpenAI, Anthropic и Google на пакеты вознаграждения, которые по слухам достигали сотен миллионов с учётом акций.

Девять месяцев спустя Muse Spark — первый результат. Оправдает ли она инвестиции, зависит от того, что будет дальше — эта модель намеренно небольшая и быстрая, при этом более крупные версии уже в разработке.

Конкурентное давление

Математика проста. OpenAI и Anthropic вместе оцениваются более чем в 1 триллион долларов. Gemini от Google набирает позиции как в потребительском, так и в разработческом рынке. Meta тратила 72 миллиарда долларов на AI-инфраструктуру в 2025 году, с ростом до прогнозируемых 115–135 миллиардов в 2026-м, — и не имела конкурентоспособной фронтирной модели. Что-то должно было измениться.

Система принятия решений для разработчиков

Оставайтесь с Llama, если:

Вам нужны открытые веса — для self-hosting, дообучения, on-premises-соответствия требованиям или контроля затрат. Вы выполняете задачи с интенсивным кодированием, где у Muse Spark признанные пробелы. Вам нужна предсказуемая, самостоятельно управляемая инфраструктура, не зависящая от листа ожидания частного API. Вы уже вложились в инструментарий для Llama (конвейеры квантизации, LoRA-адаптеры, кастомные оценки).

Следите за Muse Spark, если:

Вы строите внутри экосистемы продуктов Meta — всё, что интегрируется с Instagram, WhatsApp, Facebook или Messenger. Вам нужно сильное мультимодальное понимание, особенно визуальное рассуждение или медицинские задачи. Вы готовы ждать публичного API-доступа и сможете оценить его, когда появятся цены и условия.

Ни то ни другое не покрывает:

Генерацию изображений. Генерацию видео. Это отдельные категории моделей. Muse Spark работает только с текстовым выводом, и Llama 4 тоже. Если вам нужны возможности генерации, вы смотрите на совершенно другие инструменты.

FAQ

Могу ли я всё ещё использовать Llama 4 после выхода Muse Spark?

Да. Llama 4 Scout и Maverick по-прежнему доступны на Hugging Face и через API-партнёров Meta. Ничего не устарело и не удалено.

Выпустит ли Meta веса Muse Spark?

Meta заявила, что «надеется открыть исходный код будущих версий модели». Никаких сроков, никаких конкретных обязательств в отношении самой Muse Spark, никакого понимания, что на практике означает «будущие версии». Воспринимайте это как стремление, а не план.

Лучше ли Muse Spark Llama 4 для программирования?

Нет. Meta прямо признаёт кодирование текущим слабым местом. На специализированных бенчмарках по кодированию Muse Spark уступает Claude Sonnet 4.6 и GPT-5.4. Если кодирование — ваш основной сценарий, Llama 4 Maverick с дообучением или специализированная модель для кода сегодня подходят лучше.

Когда выйдет следующая модель Muse?

Meta описала Muse Spark как «первый шаг» при том, что «более крупные модели уже в разработке». Никаких дат. Никаких названий. Никаких характеристик, кроме подтверждения факта их существования.

Влияет ли это на более широкую экосистему open-source ИИ?

Это сигнал, но не смертельный удар. Llama-модели Meta с открытыми весами остаются доступными. Другие организации — Mistral, DeepSeek, Qwen от Alibaba — продолжают выпускать открытые модели. Но Meta была единственным крупнейшим корпоративным спонсором фронтирных моделей с открытыми весами. Если их фронтирные инвестиции постоянно смещаются в сторону закрытых моделей, экосистема теряет своего наиболее финансово обеспеченного участника. Это важно в перспективе лет, а не недель.

На этом всё. Продолжение следует, когда API станет публичным.

Предыдущие материалы: