qwen/qwen3.7-max
1,000,000 context · $2.50/M input tokens · $7.50/M output tokens
Qwen3.7-Max is Alibaba’s flagship model in the Qwen3.7 series, built for agent-centric text workflows. It is optimized for coding, debugging, office automation, productivity tasks, tool use, and long-horizon autonomous execution. With a 1M-token context window and up to 64K output tokens, it is well suited for large documents, repository-scale coding, multi-step planning, structured generation, and workflows that require sustained reasoning across hundreds or thousands of steps.
Paiement à l'usage
Aucun coût initial, payez uniquement ce que vous utilisez
Utilisez les exemples de code suivants pour intégrer notre API :
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="qwen/qwen3.7-max",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)Qwen3.7-Max is Alibaba’s flagship model in the Qwen3.7 series, designed for agent-centric text workflows. It is optimized for coding, debugging, office automation, productivity tasks, tool use, and long-horizon autonomous execution.
| Specification | Value |
|---|---|
| Provider | alibaba |
| Model Type | Chat Completions model |
| Architecture | text->text |
| Context Window | 1,000,000 tokens |
| Max Input | 934,464 tokens |
| Max Output | 65,536 tokens |
| Input | Text |
| Output | Text |
| Vision | Not listed |
| Function Calling | Supported |
| Structured Outputs | Supported |
| Thinking Mode | Supported |
| Primary Use Cases | Coding, office automation, productivity workflows, long-horizon agents, tool use |
| Release | May 2026 |
| Token Type | Cost |
|---|---|
| Input | $2.50 per million tokens |
| Output | $7.50 per million tokens |
| Cache Write | $3.125 per million tokens |
Base URL: https://llm.wavespeed.ai/v1
API Endpoint: chat/completions
Model ID: qwen/qwen3.7-max
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="qwen/qwen3.7-max",
messages=[{"role": "user", "content": "Hello!"}]
)
print(response.choices[0].message.content)
curl https://llm.wavespeed.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "qwen/qwen3.7-max",
"messages": [{"role": "user", "content": "Hello!"}]
}'
qwen/qwen3.7-max
Qwen3.7-Max is Alibaba’s flagship model in the Qwen3.7 series, built for agent-centric text workflows. It is optimized for coding, debugging, office automation, productivity tasks, tool use, and long-horizon autonomous execution. With a 1M-token context window and up to 64K output tokens, it is well suited for large documents, repository-scale coding, multi-step planning, structured generation, and workflows that require sustained reasoning across hundreds or thousands of steps.
Entrée
$2.5 /M
Sortie
$7.5 /M
Contexte
1000K
Sortie max.
66K
Utilisation d'outils
Pris en charge
Accédez à Qwen3.7 Max via notre API unifiée — compatible OpenAI, sans démarrages à froid, prix transparents.
Tarification sur WaveSpeedAI : $2.50 par million de tokens d'entrée et $7.50 par million de tokens de sortie. Le prompt caching et le traitement par batch sont facturés séparément et réduisent le coût effectif sur les charges longues et répétitives.
Qwen3.7 Max prend en charge jusqu'à 1000K tokens de contexte et jusqu'à 66K tokens de sortie par requête.
Oui. WaveSpeedAI expose Qwen3.7 Max via un endpoint compatible OpenAI à https://llm.wavespeed.ai/v1. Pointez le SDK officiel d'OpenAI vers cette base URL avec votre clé API WaveSpeedAI — aucune autre modification de code requise.
Connectez-vous à WaveSpeedAI, créez une clé API dans Access Keys, puis envoyez une requête à https://llm.wavespeed.ai/v1/chat/completions avec l'id du modèle affiché ci-dessus. Les nouveaux comptes reçoivent des crédits gratuits pour évaluer Qwen3.7 Max.