Kimi K2.5: Всё, что мы знаем о визуальной агентной модели Moonshot

Moonshot AI утвердилась как крупная сила в ландшафте открытого исходного кода ИИ, и их последний выпуск представляет самую амбициозную модель на сегодняшний день. Kimi K2.5, запущенная 27 января 2026 года, представляет революционную технологию Agent Swarm и встроенные мультимодальные возможности, которые бросают вызов даже закрытым моделям.

Выпуск и доступность

Kimi K2.5 официально запущена 27 января 2026 года как модель открытого исходного кода по лицензии MIT. Это делает её одной из наиболее разрешительных моделей с триллионом параметров, позволяющей как научные исследования, так и коммерческое использование без ограничений.

Модель доступна через несколько каналов:

Kimi.com: интерфейс чата на основе браузера
Kimi App: мобильные приложения для iOS и Android
moonshot.ai API: доступ через API разработчика
Kimi Code CLI: помощник по кодированию на основе терминала
Hugging Face: полные веса модели для самостоятельного развёртывания
NVIDIA NIM: оптимизированное развёртывание вывода

Спецификации архитектуры

Kimi K2.5 использует сложную архитектуру Mixture-of-Experts (MoE):

Спецификация	Значение
Всего параметров	1 триллион
Активные параметры	32 миллиарда
Слои	61 (включая 1 плотный слой)
Головы внимания	64
Экспертные модули	384 всего (8 выбранных на токен, 1 общий)
Словарь	160K токенов
Окно контекста	256K токенов
Механизм внимания	MLA (Multi-head Latent Attention)
Кодер видения	MoonViT (400M параметров)

Конфигурация с 384 экспертами примечательна тем, что на 50% больше, чем 256 экспертов DeepSeek-V3, что позволяет более тонкую специализацию при сохранении эффективного вывода благодаря разреженной активации.

Обучение

Kimi K2.5 была обучена примерно на 15 триллионах смешанных визуальных и текстовых токенов, создавая истинно встроенную мультимодальную архитектуру. В отличие от моделей, которые добавляют возможности видения к текстовой базе, совместное предварительное обучение K2.5 обеспечивает беспрепятственную интеграцию визуального и текстового понимания.

Визуальные признаки сжимаются через пространственно-временное объединение перед проецированием в языковую модель, позволяя эффективно обрабатывать изображения и видео без чрезмерной нагрузки на токены.

Производительность бенчмарков

Kimi K2.5 демонстрирует сильную производительность на различных направлениях:

Бенчмарки рассуждений

Бенчмарк	Оценка
AIME 2025	96.1%
HMMT 2025	95.4%
GPQA-Diamond	87.6%

Визуальные бенчмарки

Бенчмарк	Оценка
OCRBench	92.3%
MathVista	90.1%
OmniDocBench 1.5	88.8%

Бенчмарки кодирования

Бенчмарк	Kimi K2.5	Claude Opus 4.5
SWE-Bench Verified	76.8%	80.9%
LiveCodeBench	85.0%	64.0%
TerminalBench	Лидирует	Второе место

Хотя Claude Opus 4.5 сохраняет небольшое преимущество в SWE-Bench Verified (80.9% против 76.8%), Kimi K2.5 значительно превосходит в LiveCodeBench (85.0% против 64.0%), демонстрируя более сильные возможности интерактивного кодирования в реальном времени.

Цены

Kimi K2.5 предлагает агрессивное ценообразование, которое недорого по сравнению с большинством моделей:

Модель	Ввод (за 1M токенов)	Вывод (за 1M токенов)
Kimi K2.5	$0.60	$2.50–$3.00
Claude Opus 4.5	$15.00	$75.00
Claude Sonnet 5	$3.00	$15.00

Примерно в 9 раз дешевле, чем Claude Opus 4.5, и в 5 раз дешевле, чем Claude Sonnet 5, Kimi K2.5 предлагает убедительную ценность для высокообъёмных рабочих нагрузок.

Технология Agent Swarm

Самой инновационной особенностью Kimi K2.5 является система Agent Swarm — прорыв в параллельном выполнении ИИ.

Как работает Agent Swarm

Agent Swarm позволяет самоуправляемому рою из до 100 подагентов выполнять параллельные рабочие процессы с до 1500 вызовами инструментов:

Оркестратор: обучаемый оркестратор динамически создаёт специализированные подагенты
Декомпозиция задач: сложные задачи разбиваются на параллелизуемые рабочие единицы
Параллельное выполнение: несколько агентов одновременно работают над различными компонентами
Координация: результаты синтезируются обратно в связные выходы

Инновация в обучении

Система использует Parallel-Agent Reinforcement Learning (PARL) с поэтапным формированием награды для предотвращения «последовательного коллапса» — тенденции агентов по умолчанию использовать последовательное выполнение с одним агентом. Этот подход обучения способствует истинной параллелизации.

Выигрыш в производительности

Agent Swarm достигает сокращения времени выполнения до 4.5x по сравнению с последовательными подходами с одним агентом. Для крупных проектов кодирования это означает значительно более быстрое завершение.

Система использует измерение “Critical Steps”, вдохновленное анализом критического пути параллельных вычислений, для оптимизации стратегий выполнения.

Рабочие режимы

Kimi K2.5 поддерживает четыре отдельных режима работы:

K2.5 Instant: быстрые ответы с отключённым мышлением (температура 0.6)
K2.5 Thinking: расширенное рассуждение с цепочкой мысли (температура 1.0, top-p 0.95)
K2.5 Agent: автономное выполнение задач с одним агентом
K2.5 Agent Swarm (Бета): многоагентные параллельные рабочие процессы

Каждый режим может быть настроен через параметры API, позволяя разработчикам сбалансировать скорость, глубину и возможности для конкретных вариантов использования.

Ключевые возможности

Визуальный интеллект агентов

Kimi K2.5 превосходит в задачах, основанных на видении, которые объединяют визуальное понимание с генерацией кода:

Видео-в-код: преобразование видеопроцессов в работающий код
Реконструкция веб-сайтов: воссоздание веб-сайтов на основе скриншотов
Визуальная отладка: выявление и устранение проблем с пользовательским интерфейсом на основе скриншотов
Пространственное рассуждение: решение визуальных головоломок и понимание макетов

Разработка интерфейса

Модель демонстрирует особую силу в разработке интерфейса:

Реализация интерактивного макета с анимацией, запускаемой прокруткой
Сложная генерация CSS и JavaScript из визуальных описаний
Реализация адаптивного дизайна на различных размерах устройств
Эффекты богатой анимации и переходы

Офисная производительность

K2.5 Agent обрабатывает корпоративные рабочие процессы через координацию многошаговых инструментов:

Генерация документов, электронных таблиц, PDF и презентаций
Обработка статей объёмом 10 000 слов или документов на 100 страниц
Координация многошаговых рабочих процессов с цепочками инструментов
Улучшение на 59.3% по сравнению с K2 Thinking в бенчмарке AI Office
Улучшение на 24.3% в General Agent Benchmark

Kimi Code CLI

Наряду с K2.5 Moonshot выпустила Kimi Code — помощник по кодированию на основе терминала, интегрирующийся с популярными редакторами:

VSCode: полная поддержка расширений
Cursor: встроенная интеграция
Zed: доступен плагин

Kimi Code предоставляет рабочие процессы терминала, подобные Claude Code, с использованием возможностей агентов K2.5, позволяя разработчикам использовать Agent Swarm непосредственно из своей среды разработки.

Варианты развёртывания

Самостоятельное развёртывание

С лицензией MIT и полной доступностью весов организации могут развёртывать K2.5 на собственной инфраструктуре:

Рекомендуемые ядра: vLLM, SGLang, KTransformers
Требования: transformers ≥4.57.1
Оборудование: масштабируется от потребительских GPU (квантованных) до развёртываний центра обработки данных

Облачное развёртывание

NVIDIA NIM: оптимизированные контейнеры для корпоративного развёртывания
Hugging Face Inference: управляемые точки доступа
Крупные облачные поставщики: доступны через стандартные API вывода

Сравнение с конкурентами

против Claude Opus 4.5

Аспект	Kimi K2.5	Claude Opus 4.5
SWE-Bench	76.8%	80.9%
LiveCodeBench	85.0%	64.0%
Цены	$0.60/$2.50	$15/$75
Открытый исходный код	Да (MIT)	Нет
Контекст	256K	200K
Agent Swarm	Да (100 агентов)	Нет

Claude Opus 4.5 лидирует в традиционных бенчмарках исправления кода, а Kimi K2.5 превосходит в интерактивном кодировании и предлагает значительно лучшее ценообразование с открытым исходным кодом.

против DeepSeek V3

Обе модели разделяют философию архитектуры MoE, но K2.5 привносит:

Встроенные мультимодальные возможности (DeepSeek V3 только текст)
Agent Swarm для параллельного выполнения
384 эксперта против 256 у DeepSeek
Возможности кодирования, основанные на видении

против Claude Sonnet 5

Аспект	Kimi K2.5	Claude Sonnet 5
Цены	$0.60/$2.50	$3/$15
Контекст	256K	1M
Открытый исходный код	Да	Нет
Agent Swarm	Да	Dev Team Mode

Sonnet 5 предлагает более крупный контекст и аналогичные функции агентов, но открытый характер K2.5 и более низкие цены делают её привлекательной для развёртываний, чувствительных к затратам.

Что это значит для разработчиков

Kimi K2.5 представляет значительный рубеж для открытого исходного кода ИИ:

Истинный открытый исходный код: модель с триллионом параметров по лицензии MIT
Эффективность затрат: в 9 раз дешевле, чем сравнимые закрытые варианты
Параллельное выполнение: Agent Swarm обеспечивает беспрецедентную параллелизацию задач
Встроенный мультимодальный: видение и текст объединены с предварительного обучения
Самостоятельное развёртывание: полная гибкость развёртывания для корпоративных требований

Для организаций, которым требуется локальное развёртывание, воздушно-разделённые среды или просто хотят избежать привязки к API, Kimi K2.5 предлагает возможности, которые ранее были доступны только через закрытые поставщиков.

Перспектива на будущее

Moonshot AI утвердилась как грозный конкурент в ландшафте ИИ. Благодаря технологии Agent Swarm и встроенным мультимодальным возможностям, Kimi K2.5 расширяет границы того, что могут достичь модели открытого исходного кода.

Ключевые вопросы на будущее:

Повлияет ли парадигма параллельного выполнения Agent Swarm на то, как другие лаборатории подходят к агентному ИИ?
Могут ли визуальные возможности кодирования K2.5 привести к более широкому внедрению в разработку интерфейса?
Как давление цен повлияет на поставщиков закрытого кода?

На сегодняшний день Kimi K2.5 стоит как самая способная модель открытого исходного кода — истинная альтернатива закрытым моделям для многих случаев использования.