Claude Managed Agents 定價與 Beta 限制

昨天我打開了我們的 agent 基礎設施費用表，盯著它看了一會兒。我是 Dora。我們一直在運行自架的 agent 迴圈——工具編排、沙箱隔離、錯誤恢復、檢查點邏輯——光是維持它不崩潰就耗費了大約 0.4 個工程師的時間。當 Anthropic 在 4 月 8 日推出 Claude Managed Agents 時，我第一件事不是去看功能清單，而是打開了定價頁面。

這篇文章記錄了實際計算後的計費結構、速率限制的位置，以及由於測試版標籤而仍不確定的事項。

Claude Managed Agents 的定價方式

雙維計費：Token 加會話執行時間

Managed Agents 計費有兩個維度：Token 和會話執行時間。Token 按照標準 Claude API 模型費率收費——與您透過 Messages API 支付的每百萬 Token 定價相同。Opus 4.6 為輸入 $5 / 輸出 $25（每百萬 Token）。Sonnet 4.6 為 $3 / $15。提示快取倍率完全相同：快取讀取費用為基本輸入價格的 10%。

第二個維度是受管容器的基礎設施費用。

會話執行時間：每會話小時 $0.08

執行時間費用為每會話小時 $0.08，按實際消耗計費。這是您的 agent 運行所在的沙箱容器的基礎設施成本。

有一點值得特別說明：使用 Managed Agents 時，會話執行時間取代了 Code Execution 容器小時計費模式——不會重複收費。

網路搜尋：每 1,000 次搜尋 $10

在 Managed Agents 會話中觸發的網路搜尋，費率為標準的每 1,000 次搜尋 $10，與獨立 API 相同。一個每次會話執行數十次網路搜尋的研究型 agent，這一費用項目將相當可觀。

僅可透過 Claude API 直接使用

Managed Agents 透過 Claude Platform 直接計費。第三方平台定價——Bedrock、Vertex AI、Foundry——不適用於此。如果您透過上述提供商之一運行 agent，這是一個獨立的計費關係。

會話執行時間成本：實際意義

什麼算作會話執行時間

執行時間精確到毫秒，且僅在會話狀態為 running 時累積。閒置時間——等待您的下一條訊息、工具確認，或已終止的狀態——不計入費用。當 agent 無事可做時，計時器暫停。

這比聽起來更重要。一個完成任務後等待使用者輸入 20 分鐘的 agent，在這 20 分鐘內不會產生 $0.08/小時的費用。

長時運行與短任務 agent 的比較

在 Sonnet 4.6 上運行10 分鐘的文件處理任務，執行時間費用約為 $0.013，幾乎可以忽略不計，Token 費用才是主要開銷。

而在 Opus 4.6 上進行4 小時研究型 agent 會話則截然不同。執行時間費用達 $0.32，但如果 agent 正在積極地通過複雜工具鏈進行推理，您可能消耗超過 20 萬輸入 Token 和 5 萬輸出 Token。光是 Token 費用在快取生效前就可能超過 $1.25。

費用估算範例

以下是 Anthropic 定價文件中的計算範例：在 Opus 4.6 上進行一小時編碼會話，消耗 50,000 輸入 Token 和 15,000 輸出 Token，總費用約為 $0.70。若啟用提示快取，且其中 40,000 個輸入命中快取，費用會顯著降低。執行時間在總費用中佔 $0.08。

真正的問題不是「每小時 $0.08 貴不貴？」而是「我的 agent 工具迴圈有多消耗 Token？」 每個 bash 指令、文件讀取、網路請求和網路搜尋都會產生 Token。一個包含數十次工具呼叫的高度 agent 化會話，會迅速消耗大量上下文。

速率限制與配額

建立端點：每分鐘 60 次請求

Managed Agents 端點按組織設置速率限制，這些限制與 Messages API 的速率限制相互獨立。建立端點在組織層級允許每分鐘 60 次請求。

讀取端點：每分鐘 600 次請求

讀取端點在組織層級上限為每分鐘 600 次請求。如果您在許多並發 agent 中頻繁輪詢會話狀態，這將是您首先觸及的上限。

組織層級消費限額和基於層級的速率限制同樣適用

標準基於層級的速率限制疊加其上。來自您 API 層級的每分鐘 Token 和每分鐘請求限制，仍然適用於您的 agent 所發起的底層模型呼叫。

如何申請更高限額

對於需要更大空間的生產工作負載，Anthropic 提供帶有承諾消費的優先層級。請透過 Claude Console 聯繫他們的銷售團隊，洽談自訂速率限制安排。Console 的速率限制圖表可顯示即時餘量——在觸發 429 錯誤之前，使用它們來了解您何時接近限制。

Beta 標頭及 GA 時的變化

managed-agents-2026-04-01：每次請求必須包含

所有 Managed Agents 端點都需要 managed-agents-2026-04-01 beta 標頭。SDK 會自動設置它。如果您使用原始 cURL 或自訂 HTTP 客戶端，請手動將其添加到每個請求中。

測試版期間的不確定性

官方文件指出，在版本之間可能會對行為進行調整以改善輸出。這是標準的測試版說明。

我想對這意味著什麼在定價方面說得更精確。這並不是 Anthropic 計劃在 GA 時更改定價的公告。 它意味著當前數字不是永久性的合約承諾——這對任何地方的測試版定價都是如此。在建立成本模型時應將這種不確定性納入考量，但不要將其解讀為即將漲價的信號。

研究預覽功能仍受限制

某些功能——成果、多 agent 協調和記憶——處於研究預覽階段，需要單獨申請存取權限。這些功能在離開預覽階段時可能帶來額外的成本影響。目前我還不清楚，Anthropic 以外的人也不知道。

Batch API 與快取的交互作用

Batch API：不適用於 Managed Agents

這是會讓人犯錯的地方。包括 Batch API 在內的 Messages API 修飾符不適用於 Claude Managed Agents 會話。如果您一直依賴50% 折扣進行批量處理，您無法在 Managed Agents 中複製該成本結構。這是已確認的限制，而非路線圖項目。

提示快取：內建支援

提示快取已內建於 Managed Agents 框架中。標準倍率適用——快取寫入為基本輸入的 1.25 倍（5 分鐘 TTL），快取讀取為 0.1 倍。對於系統提示和早期上下文在多次工具呼叫中被重複使用的長時間會話，快取可以顯著降低 Token 費用。

壓縮：內建支援

框架支援內建壓縮和其他效能最佳化，以實現高效的 agent 輸出。對於長到足以接近上下文視窗限制的會話，壓縮會自動摘要早期對話輪次。這有助於管理 Token 累積，無需您自行建立自訂截斷策略。

隱性成本考量

工具執行開銷

每次工具呼叫都會產生 Token。Bash 指令、文件讀取、網路請求——每一個都會將輸入和輸出 Token 加入您的會話總計。一個在單次會話中鏈接 30 次以上工具呼叫的研究型 agent，累積的 Token 費用將遠超每小時 $0.08 的執行時間費用。

網路搜尋每 1,000 次 $10 是最明顯的單次呼叫成本。但不那麼明顯的是工具結果回流到上下文所產生的 Token 開銷。一次返回長頁面的網路請求，會將數千個 Token 傾倒入您的會話。

研究預覽功能：潛在的成本倍增器

多 agent 協調——agent 可以啟動並指揮其他 agent——在研究預覽中可用。每個子 agent 運行自己的會話，有自己的 Token 消耗和執行時間計費。成本倍增因素取決於啟動了多少子 agent 以及每個運行多長時間。我尚無法確認子 agent 會話是否收取獨立的執行時間費用，還是共享父 agent 的費用。這是需要持續關注的問題。

常見問題

Claude Managed Agents 在測試版期間免費嗎？

不免費。基於消費的定價現已生效——標準 Token 費率加上每會話小時 $0.08 的活躍執行時間費用。Managed Agents 沒有專屬免費層級。新 API 使用者會收到少量免費額度用於初始測試，但那是標準 API 入門額度，不是 Managed Agents 的專屬優惠。

非同步 agent 的會話執行時間如何計費？

執行時間僅在會話狀態為 running 時累積。如果 agent 完成任務並進入閒置狀態——等待下一條使用者訊息或工具確認——該閒置時間不收費。計時器暫停，並在處理重新開始時恢復。計費精確到毫秒。

我可以在 Managed Agents 中使用 Batch API 折扣嗎？

不行。50% 的 Batch API 折扣不適用。如果批量節省對您的工作流程至關重要，請評估受管托管節省的基礎設施成本是否能抵消失去批量折扣的損失。對於某些工作負載，在 Messages API 上運行自己的 agent 迴圈並使用批量處理，費用仍然更低。

測試版結束後計費會有什麼變化？

Anthropic 尚未承諾具體的 GA 定價。當前的每會話小時 $0.08 和標準 Token 費率是測試版期間的數字。計費模式可能會以某種形式延續，但具體數字可能會改變。在任何長期成本預測中，請將這種不確定性納入考量。

是否有免費層級或試用？

沒有專屬的 Managed Agents 試用。標準 API 免費額度適用。對於企業評估，Anthropic 的銷售團隊可以討論延長試用安排——透過 Claude Console 或發送郵件至 sales@anthropic.com 聯繫他們。

以上是我截至 2026 年 4 月 9 日可以確認的內容。一旦將兩個計費維度分開，定價結構就相當清晰，但真正的變量是工具呼叫的 Token 累積——這是您的估算與現實產生偏差的地方。我仍在運行測試會話，以更好地了解壓縮和快取在超過 2 小時後的交互方式。後續將有更多內容。

往期文章：