arcee-ai/maestro-reasoning
131,072 context · $0.90/M input tokens · $3.30/M output tokens
Maestro Reasoning is Arcee's flagship analysis model: a 32 B‑parameter derivative of Qwen 2.5‑32 B tuned with DPO and chain‑of‑thought RL for step‑by‑step logic. Compared to the earlier 7 B...
Pagamento por uso
Sem custo inicial, pague apenas pelo que usar
Use os exemplos de código abaixo para integrar com nossa API:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="arcee-ai/maestro-reasoning",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)arcee-ai/maestro-reasoning
Maestro Reasoning is Arcee's flagship analysis model: a 32 B‑parameter derivative of Qwen 2.5‑32 B tuned with DPO and chain‑of‑thought RL for step‑by‑step logic. Compared to the earlier 7 B...
Entrada
$0.9 /M
Saída
$3.3 /M
Contexto
131K
Saída máx.
32K
Acesse Maestro Reasoning através da nossa API unificada — compatível com OpenAI, sem inicializações a frio, preços transparentes.
Preços no WaveSpeedAI: $0.90 por milhão de tokens de entrada e $3.30 por milhão de tokens de saída. Prompt caching e batch processing são cobrados separadamente e reduzem o custo efetivo em cargas longas e repetitivas.
Maestro Reasoning suporta até 131K tokens de contexto e até 32K tokens de saída por requisição.
Sim. O WaveSpeedAI expõe o Maestro Reasoning através de um endpoint compatível com OpenAI em https://llm.wavespeed.ai/v1. Aponte o SDK oficial da OpenAI para esta base URL com sua chave API do WaveSpeedAI — sem outras alterações no código.
Entre no WaveSpeedAI, crie uma chave API em Access Keys, então envie uma requisição para https://llm.wavespeed.ai/v1/chat/completions com o model id mostrado acima. Contas novas recebem créditos grátis para avaliar o Maestro Reasoning.