Claude Managed Agentsの価格設定とベータ制限

昨日、エージェントインフラのコストシートを開いて、しばらく眺めていた。私はDoraと申します。私たちはセルフホストのエージェントループ——ツールオーケストレーション、サンドボックス化、エラー回復、チェックポイントロジック——を運用しており、それが崩壊しないよう維持するだけでエンジニアの工数の約0.4人分を消費している。Anthropicが4月8日にClaude Managed Agentsをリリースしたとき、私が最初にしたことは機能一覧を読むことではなかった。価格ページを開いた。

この記事では、実際に数字を計算したときの料金体系がどうなっているか、レート制限の位置、そしてベータラベルのせいでまだ不明な点について記録する。

Claude Managed Agentsの料金体系

二段階請求：トークン＋セッション実行時間

Managed Agentsの請求には二つの次元がある：トークンとセッション実行時間だ。トークンは標準のClaude APIモデル料金で課金される——Messages APIで支払うのと同じ100万トークンあたりの価格だ。Opus 4.6は入力$5／出力$25（100万トークンあたり）。Sonnet 4.6は$3／$15。プロンプトキャッシングの乗数も同様に適用される：キャッシュ読み取りは基本入力価格の10%。

二番目の次元は、マネージドコンテナのインフラ料金だ。

セッション実行時間：$0.08／セッション時間

実行時間の料金は、アクティブな実行時間に対して$0.08／セッション時間で、消費量ベースで請求される。これがエージェントが動作するサンドボックスコンテナのインフラコストだ。

注目すべき点が一つある：Managed Agentsを使用する場合、セッション実行時間はCode Executionのコンテナ時間課金モデルを置き換える——二重請求はされない。

ウェブ検索：1,000回あたり$10

Managed Agentsセッション内でトリガーされるウェブ検索は、標準の1,000回あたり$10で課金される。スタンドアロンAPIと同じレートだ。1セッションで数十回のウェブ検索を実行するリサーチエージェントには、この項目がのしかかってくる。

Claude APIからのみ利用可能

Managed AgentsはClaude Platformから直接請求される。サードパーティプラットフォームの料金——Bedrock、Vertex AI、Foundry——はここには適用されない。これらのプロバイダーを通じてエージェントを実行している場合、これは別の請求関係になる。

セッション実行時間コスト：実際の意味

セッション実行時間としてカウントされるもの

実行時間はミリ秒単位で計測され、セッションのステータスがrunningの間のみ発生する。アイドル時間——次のメッセージ待ち、ツール確認待ち、または終了済みの状態——はカウントされない。エージェントに何もすることがないとき、メーターは一時停止する。

これは見た目以上に重要だ。タスクを完了してユーザーの入力を20分待っているエージェントは、その20分間$0.08/時を消費しない。

長時間実行 vs 短時間タスクのエージェント

Sonnet 4.6での10分間のファイル処理ジョブの実行時間コストは約$0.013。ほとんど気にならない。トークンコストが支配的だ。

Opus 4.6での4時間のリサーチエージェントセッションは話が違う。実行時間だけで$0.32になるが、エージェントが複雑なツールチェーンを活発に処理していれば、20万以上の入力トークンと5万以上の出力トークンを消費するかもしれない。キャッシングが効く前に、トークン代だけで$1.25を超える可能性がある。

コスト見積もりの例

Anthropicの価格ドキュメントにある計算例：Opus 4.6で50,000入力トークンと15,000出力トークンを消費する1時間のコーディングセッションの合計コストは約$0.70。プロンプトキャッシングが有効で、4万トークンがキャッシュにヒットすれば、大幅に下がる。実行時間はその合計の$0.08を占める。

本当の問題は「$0.08/時間は高いか？」ではない。「エージェントのツールループはどれだけトークンを消費するか？」だ。 bashコマンド、ファイル読み取り、ウェブフェッチ、ウェブ検索——すべてがトークンに貢献する。数十回のツール呼び出しを伴う高度なエージェントセッションは、コンテキストを急速に消費する。

レート制限とクォータ

作成エンドポイント：1分あたり60リクエスト

Managed Agentsエンドポイントは組織単位でレート制限されており、これらの制限はMessages APIのレート制限とは別物だ。作成エンドポイントでは組織レベルで60 RPMが許可される。

読み取りエンドポイント：1分あたり600リクエスト

読み取りエンドポイントは組織レベルで600 RPMに制限されている。多数の並行エージェントにわたってセッションステータスを頻繁にポーリングしている場合、最初にぶつかる上限はこれだ。

組織レベルの支出制限とティアベースのレート制限も適用

標準のティアベースのレート制限が上乗せされる。APIティアからのトークン/分およびリクエスト/分の制限は、エージェントが行う基盤モデル呼び出しにも引き続き適用される。

より高い制限をリクエストする方法

より多くのヘッドルームを必要とする本番ワークロードには、AnthropicはコミットされたスペンドによるPriority Tierを提供している。カスタムレート制限の取り決めについては、Claude ConsoleからAnthropicのセールスチームに連絡すること。Consoleのレートリミットチャートはリアルタイムのヘッドルームを表示する——429エラーにぶつかる前に制限に近づいていないか確認するために使おう。

ベータヘッダーとGA時の変更点

managed-agents-2026-04-01：すべてのリクエストに必須

すべてのManaged Agentsエンドポイントにはmanaged-agents-2026-04-01ベータヘッダーが必要だ。SDKは自動的にこれを設定する。生のcURLやカスタムHTTPクライアントを使用している場合は、すべてのリクエストに手動で追加すること。

ベータ期間中の不確実性

公式ドキュメントには、出力を改善するためにリリース間で動作が改良される場合があると記載されている。これは標準的なベータの注意事項だ。

これが価格に対して何を意味するかについて正確に述べたい。AnthropicがGA時に価格を変更する予定であるという発表ではない。 現在の数字が永続的な契約上のコミットメントではないということを意味する——これはどこであれベータ期間中の価格には当てはまる。その不確実性を織り込んだコストモデルを構築すること。ただし、それを価格変更が迫っているシグナルとして読み取らないでほしい。

リサーチプレビュー機能は引き続きゲートされている

特定の機能——アウトカム、マルチエージェント調整、メモリ——はリサーチプレビュー中であり、個別のアクセスリクエストが必要だ。これらがプレビューを離れる際に追加のコスト影響をもたらす可能性がある。まだわからない。Anthropic外部の誰もわからない。

Batch APIとキャッシングの相互作用

Batch API：Managed Agentsでは利用不可

これが人々を混乱させる点だ。Batch APIを含むMessages APIの修飾子はClaude Managed Agentsセッションには適用されない。バルク処理の50%割引を利用してきた場合、Managed Agentsではそのコスト構造を再現できない。これは確認済みの制限であり、ロードマップ項目ではない。

プロンプトキャッシング：組み込み済み

プロンプトキャッシングはManaged Agentsハーネスに組み込まれている。標準の乗数が適用される——キャッシュ書き込みは5分TTLで基本入力の1.25倍、キャッシュ読み取りは0.1倍。システムプロンプトと初期コンテキストが多くのツール呼び出しにわたって再利用される長時間セッションでは、キャッシングによってトークン代を大幅に削減できる。

コンパクション：組み込み済み

ハーネスは効率的なエージェント出力のための組み込みコンパクションおよびその他のパフォーマンス最適化をサポートしている。コンテキストウィンドウの制限に近づくほど長く実行されるセッションでは、コンパクションが以前の会話ターンを自動的に要約する。これにより、カスタムの切り詰め戦略を構築することなくトークンの蓄積を管理できる。

隠れたコストの考慮事項

ツール実行のオーバーヘッド

すべてのツール呼び出しがトークンを生成する。bashコマンド、ファイル読み取り、ウェブフェッチ——それぞれがセッション合計に入力と出力トークンを追加する。1つのセッションで30回以上のツール呼び出しをチェーンするリサーチエージェントは、$0.08/時間の実行時間料金をはるかに上回るトークンコストを積み上げる。

ウェブ検索の$10/1,000回は最も目に見える呼び出しごとのコストだ。しかし、より見えにくいのは、ツール結果がコンテキストに流れ込むことによるトークンオーバーヘッドだ。長いページを返すウェブフェッチは、数千のトークンをセッションに投入する。

リサーチプレビュー機能：潜在的なコスト乗数

マルチエージェント調整——エージェントが他のエージェントを起動して指示できる——はリサーチプレビューで利用可能だ。各サブエージェントは独自のセッションを実行し、独自のトークン消費と実行時間メーターを持つ。コスト乗数は、生成されるサブエージェントの数と各エージェントの実行時間に依存する。サブエージェントセッションが別個の実行時間料金を持つのか、親のものを共有するのかを確認できていない。これは要注目だ。

FAQ

Claude Managed Agentsはベータ期間中は無料か？

いいえ。消費量ベースの価格設定は現在アクティブだ——標準トークンレートにアクティブな実行時間に対して$0.08/セッション時間が加算される。Managed Agents専用の無料ティアは存在しない。新規APIユーザーは初期テスト用に少量の無料クレジットを受け取るが、これは標準的なAPIオンボーディングクレジットであり、Managed Agentsの特典ではない。

非同期エージェントのセッション実行時間課金はどう機能するか？

実行時間はセッションステータスがrunningの間のみ発生する。エージェントがタスクを完了してアイドル状態に入った場合——次のユーザーメッセージやツール確認を待っている場合——そのアイドル時間は無料だ。メーターは一時停止し、処理が再開されると再び動き始める。計測はミリ秒単位だ。

Managed AgentsでBatch API割引を使えるか？

いいえ。50%のBatch API割引は適用されない。バッチレベルの節約がワークフローにとって重要な場合、マネージドホスティングからのインフラ節約がバッチ割引を失うことを相殺するかどうかを評価してほしい。ワークロードによっては、バッチ処理を伴うMessages API上で独自のエージェントループを実行する方が依然として安くなる場合がある。

ベータ終了時に課金はどうなるか？

AnthropicはGA時の具体的な価格を確約していない。現在の$0.08/セッション時間と標準トークンレートはベータ期間中の数字だ。課金モデルは何らかの形で継続するだろうが、具体的な数字は変わる可能性がある。その不確実性を長期的なコスト予測に織り込むこと。

無料ティアや試用版はあるか？

Managed Agents専用の試用版は存在しない。標準APIの無料クレジットが適用される。エンタープライズ評価については、Anthropicのセールスチームが拡張試用の取り決めについて話し合える——Claude Consoleまたはsales@anthropic.comから連絡してほしい。

以上が2026年4月9日時点で確認できることだ。二つの課金次元を分離すれば価格体系は明快だが、本当の変数はツール呼び出しのトークン蓄積だ——そこで見積もりが現実と乖離する。コンパクションとキャッシングが2時間以上のマークでどのように相互作用するかをより詳しく把握するため、まだテストセッションを実行している。続報を待ってほしい。

過去の投稿：