arcee-ai/maestro-reasoning
131,072 context · $0.90/M input tokens · $3.30/M output tokens
Maestro Reasoning is Arcee's flagship analysis model: a 32 B‑parameter derivative of Qwen 2.5‑32 B tuned with DPO and chain‑of‑thought RL for step‑by‑step logic. Compared to the earlier 7 B...
Оплата по факту использования
Никаких авансовых платежей — платите только за то, чем пользуетесь
Используйте следующие примеры кода для интеграции с нашим API:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="arcee-ai/maestro-reasoning",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)arcee-ai/maestro-reasoning
Maestro Reasoning is Arcee's flagship analysis model: a 32 B‑parameter derivative of Qwen 2.5‑32 B tuned with DPO and chain‑of‑thought RL for step‑by‑step logic. Compared to the earlier 7 B...
Ввод
$0.9 /M
Вывод
$3.3 /M
Контекст
131K
Макс. вывод
32K
Доступ к Maestro Reasoning через наш единый API — совместимость с OpenAI, без холодных стартов, прозрачные цены.
Цены на WaveSpeedAI: $0.90 за миллион входных токенов и $3.30 за миллион выходных токенов. Prompt caching и batch processing тарифицируются отдельно и снижают эффективную стоимость длинных повторяющихся нагрузок.
Maestro Reasoning поддерживает до 131K токенов контекста и до 32K токенов вывода на запрос.
Да. WaveSpeedAI предоставляет Maestro Reasoning через OpenAI-совместимый endpoint по адресу https://llm.wavespeed.ai/v1. Направьте официальный OpenAI SDK на этот base URL с ключом API WaveSpeedAI — других изменений в коде не требуется.
Войдите в WaveSpeedAI, создайте API-ключ в Access Keys и отправьте запрос на https://llm.wavespeed.ai/v1/chat/completions с указанным выше model id. Новые аккаунты получают бесплатные кредиты для оценки Maestro Reasoning.