arcee-ai/maestro-reasoning
131,072 context · $0.90/M input tokens · $3.30/M output tokens
Maestro Reasoning is Arcee's flagship analysis model: a 32 B‑parameter derivative of Qwen 2.5‑32 B tuned with DPO and chain‑of‑thought RL for step‑by‑step logic. Compared to the earlier 7 B...
按量付费
无需预付费用,仅按实际使用量付费
使用以下代码示例接入我们的 API:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="arcee-ai/maestro-reasoning",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)arcee-ai/maestro-reasoning
Maestro Reasoning is Arcee's flagship analysis model: a 32 B‑parameter derivative of Qwen 2.5‑32 B tuned with DPO and chain‑of‑thought RL for step‑by‑step logic. Compared to the earlier 7 B...
输入
$0.9 /M
输出
$3.3 /M
上下文
131K
最大输出
32K
通过我们的统一 API 接入 Maestro Reasoning — 兼容 OpenAI、无冷启动、透明计费。
WaveSpeedAI 定价:输入每百万 token $0.90,输出每百万 token $3.30。Prompt 缓存和批处理单独计费,可显著降低长上下文、高重复任务的实际成本。
Maestro Reasoning 单次请求最多支持 131K 上下文 token,输出最多 32K token。
是的。WaveSpeedAI 通过 https://llm.wavespeed.ai/v1 的 OpenAI 兼容端点提供 Maestro Reasoning。把官方 OpenAI SDK 的 base URL 指向该地址,使用 WaveSpeedAI 的 API Key 即可,无需任何其他代码改动。
登录 WaveSpeedAI,在 Access Keys 中生成 API Key,使用上方显示的 model id 向 https://llm.wavespeed.ai/v1/chat/completions 发送请求。新账户可获得免费额度,用于试用 Maestro Reasoning。