Цены на Claude Managed Agents и ограничения бета-версии

Вчера я открыла таблицу затрат на нашу агентную инфраструктуру и долго её изучала. Меня зовут Дора. Мы запускаем собственный цикл агентов — оркестровка инструментов, изолированная среда, восстановление после ошибок, логика контрольных точек — и на поддержку всего этого в рабочем состоянии уходит примерно 0,4 инженерного времени. Когда Anthropic 8 апреля представила Claude Managed Agents, первое, что я сделала — не читала список функций. Я открыла страницу с ценами.

В этой статье я документирую, как выглядит структура тарификации при реальных расчётах, где находятся ограничения по частоте запросов и что пока остаётся неопределённым из-за статуса бета-версии.

Как работает тарификация Claude Managed Agents

Двухкомпонентная оплата: токены + время сессии

Тарификация Managed Agents имеет два измерения: токены и время работы сессии. Токены тарифицируются по стандартным ценам модели Claude API — та же цена за миллион токенов, что и через Messages API. Opus 4.6 стоит $5 за входящие / $25 за исходящие на MTok. Sonnet 4.6 — $3 / $15. Множители кэширования промптов переносятся идентично: чтение из кэша стоит 10% от базовой цены входящих токенов.

Второе измерение — инфраструктурная плата за управляемый контейнер.

Время сессии: $0,08 за сессио-час

Плата за время работы составляет $0,08 за сессио-час активного времени, начисляется по факту потребления. Это стоимость инфраструктуры изолированного контейнера, в котором работает ваш агент.

Один важный момент: время сессии заменяет модель тарификации контейнеро-часов Code Execution при использовании Managed Agents — двойного списания не происходит.

Веб-поиск: $10 за 1 000 запросов

Веб-поиск, запущенный внутри сессии Managed Agents, стоит стандартные $10 за 1 000 запросов. Та же ставка, что и в отдельном API. Исследовательский агент, выполняющий десятки веб-поисков за сессию, ощутит эту статью расходов.

Доступно только через Claude API напрямую

Managed Agents тарифицируется через Claude Platform напрямую. Тарификация сторонних платформ — Bedrock, Vertex AI, Foundry — здесь не применяется. Если вы запускаете агентов через одного из этих провайдеров, это отдельные тарифные отношения.

Стоимость времени сессии: что это значит на практике

Что считается временем сессии

Время измеряется с точностью до миллисекунды и накапливается только пока статус сессии — running. Простой — ожидание следующего сообщения, подтверждения инструмента или завершённая сессия — не считается. Счётчик останавливается, когда агенту нечего делать.

Это важнее, чем кажется. Агент, завершивший задачу и ожидающий ввода пользователя 20 минут, не сжигает $0,08/ч в течение этих 20 минут.

Агенты для длительных задач vs. коротких задач

10-минутная задача обработки файлов на Sonnet 4.6 обходится примерно в $0,013 по времени. Практически незаметно. Доминирует стоимость токенов.

4-часовая исследовательская сессия на Opus 4.6 — другое дело. Это $0,32 за время, но если агент активно рассуждает в сложных цепочках инструментов, вы можете сжечь 200k+ входящих токенов и 50k+ исходящих. Один только счёт за токены может превысить $1,25 до вступления кэширования в силу.

Пример оценки стоимости

Вот подробный пример из документации Anthropic по ценообразованию: часовая сессия кодирования на Opus 4.6, потребляющая 50 000 входящих токенов и 15 000 исходящих, обходится примерно в $0,70 всего. При активном кэшировании промптов, когда 40 000 из этих входящих токенов попадают в кэш, стоимость заметно снижается. На время работы приходится $0,08 от этой суммы.

Реальный вопрос не в том, “дорого ли $0,08/час?” — а в том, “насколько прожорлив мой агентный цикл по токенам?” Каждая команда bash, чтение файла, веб-запрос и веб-поиск вносят токены. Интенсивная агентная сессия с десятками вызовов инструментов быстро сжигает контекст.

Ограничения по частоте запросов и квоты

Создание конечных точек: 60 запросов в минуту

Конечные точки Managed Agents ограничены по частоте на уровне организации, и эти лимиты отделены от лимитов Messages API. Конечные точки создания допускают 60 RPM на уровне организации.

Чтение конечных точек: 600 запросов в минуту

Конечные точки чтения ограничены 600 RPM на уровне организации. Если вы часто опрашиваете статус сессии в множестве одновременно работающих агентов, это потолок, который вы достигнете первым.

Также применяются лимиты трат на уровне организации и тарифные лимиты

Поверх этого накладываются стандартные тарифные ограничения. Лимиты токенов в минуту и запросов в минуту вашего тарифного уровня API по-прежнему применяются к базовым вызовам модели, которые делают ваши агенты.

Как запросить более высокие лимиты

Для производственных нагрузок, которым нужен больший запас, Anthropic предлагает Priority Tier с фиксированными расходами. Свяжитесь с их отделом продаж через Claude Console для индивидуальных договорённостей по лимитам. Графики лимитов в Console показывают запас в реальном времени — используйте их, чтобы видеть, когда вы приближаетесь к лимитам, до получения ошибок 429.

Бета-заголовок и что изменится при GA

managed-agents-2026-04-01: обязателен в каждом запросе

Все конечные точки Managed Agents требуют бета-заголовка managed-agents-2026-04-01. SDK устанавливает его автоматически. Если вы используете прямые вызовы cURL или кастомный HTTP-клиент, добавляйте его вручную в каждый запрос.

Неопределённость в период бета-тестирования

В официальной документации указано, что поведение может быть скорректировано между релизами для улучшения результатов. Это стандартная оговорка для бета-версии.

Хочу быть точной в отношении того, что это означает для ценообразования. Это не объявление о том, что Anthropic планирует изменить цены при GA. Это означает, что текущие цифры не являются постоянным договорным обязательством — что справедливо для любого ценообразования в период бета, везде. Стройте модели затрат с учётом этой неопределённости, но не воспринимайте это как сигнал о предстоящих изменениях цен.

Функции в режиме исследовательского превью остаются ограниченными

Некоторые функции — outcomes, мультиагентная координация и память — находятся в исследовательском превью и требуют отдельных запросов на доступ. При выходе из превью они могут повлечь дополнительные расходы. Я пока не знаю. Никто за пределами Anthropic тоже не знает.

Взаимодействие Batch API и кэширования

Batch API: недоступен для Managed Agents

Именно это может вас подловить. Модификаторы Messages API, включая Batch API, не применяются к сессиям Claude Managed Agents. Если вы полагались на скидку 50% для массовой обработки, вы не можете воспроизвести эту структуру затрат с Managed Agents. Это подтверждённое ограничение, а не пункт дорожной карты.

Кэширование промптов: встроено

Кэширование промптов встроено в обвязку Managed Agents. Применяются стандартные множители — запись в кэш по 1,25x от базовой входящей цены при TTL 5 минут, чтение из кэша по 0,1x. Для длительных сессий, где системный промпт и ранний контекст повторно используются в множестве вызовов инструментов, кэширование может существенно снизить счёт за токены.

Компактизация: встроена

Обвязка поддерживает встроенную компактизацию и другие оптимизации производительности для эффективных выходных данных агентов. Для сессий, которые работают достаточно долго, чтобы приблизиться к лимитам контекстного окна, компактизация автоматически резюмирует ранние ходы разговора. Это помогает управлять накоплением токенов без необходимости строить собственную стратегию усечения.

Скрытые статьи расходов

Накладные расходы выполнения инструментов

Каждый вызов инструмента генерирует токены. Команды bash, чтение файлов, веб-запросы — каждый добавляет входящие и исходящие токены к общему итогу сессии. Исследовательский агент, выстраивающий цепочку из 30+ вызовов инструментов в одной сессии, накопит расходы на токены, которые затмят плату $0,08/час за время работы.

Веб-поиск по $10/1 000 вызовов — наиболее заметная стоимость за вызов. Но менее заметная — накладные расходы на токены от результатов инструментов, поступающих обратно в контекст. Веб-запрос, возвращающий длинную страницу, сбрасывает тысячи токенов в вашу сессию.

Функции исследовательского превью: потенциальный мультипликатор затрат

Мультиагентная координация — когда агенты могут запускать других агентов и направлять их — доступна в исследовательском превью. Каждый подагент запускает свою сессию с собственным потреблением токенов и счётчиком времени. Мультипликатор затрат зависит от количества порождённых подагентов и длительности работы каждого. Мне не удалось выяснить, несут ли сессии подагентов отдельную плату за время или разделяют родительскую. За этим нужно следить.

FAQ

Бесплатен ли Claude Managed Agents в период бета?

Нет. Тарификация по потреблению активна прямо сейчас — стандартные ставки токенов плюс $0,08 за сессио-час активного времени. Бесплатного уровня специально для Managed Agents нет. Новые пользователи API получают небольшое количество бесплатных кредитов для первоначального тестирования, но это стандартные кредиты при регистрации в API, а не бонус Managed Agents.

Как работает тарификация времени сессии для асинхронных агентов?

Время начисляется только пока статус сессии — running. Если агент завершил задачу и перешёл в режим ожидания — ожидает следующего сообщения пользователя или подтверждения инструмента — это время не стоит ничего. Счётчик останавливается и возобновляется при перезапуске обработки. Измерение ведётся с точностью до миллисекунды.

Могу ли я использовать скидку Batch API с Managed Agents?

Нет. Скидка Batch API 50% не применяется. Если экономия на уровне пакетной обработки критична для вашего рабочего процесса, оцените, компенсирует ли экономия инфраструктуры от управляемого хостинга потерю скидки на пакетную обработку. Для некоторых нагрузок запуск собственного цикла агентов через Messages API с пакетной обработкой по-прежнему будет дешевле.

Что происходит с тарификацией после окончания бета?

Anthropic не взяла на себя обязательства по конкретным ценам GA. Текущие $0,08/сессио-час и стандартные тарифы токенов — это цифры периода бета. Модель тарификации, вероятно, сохранится в какой-то форме, но конкретные цифры могут измениться. Учитывайте эту неопределённость в любых долгосрочных прогнозах затрат.

Есть ли бесплатный уровень или пробный период?

Выделенного пробного периода Managed Agents не существует. Применяются стандартные бесплатные кредиты API. Для корпоративной оценки отдел продаж Anthropic может обсудить расширенные пробные договорённости — свяжитесь с ними через Claude Console или по адресу sales@anthropic.com.

Это всё, что я могу подтвердить по состоянию на 9 апреля 2026 года. Структура ценообразования понятна, как только вы разделяете два измерения тарификации, но реальная переменная — накопление токенов при вызовах инструментов — именно там ваши оценки будут расходиться с реальностью. Я продолжаю проводить тестовые сессии, чтобы лучше понять взаимодействие компактизации и кэширования на отметке 2+ часа. Продолжение следует.

Предыдущие публикации: