qwen/qwen3.6-max-preview
262,144 context · $1.30/M input tokens · $7.80/M output tokens
Qwen3.6-Max-Preview is a proprietary frontier model from Alibaba Cloud built on a sparse Mixture-of-Experts architecture with approximately 1T total parameters. It is optimized for high-end reasoning, agentic coding, tool use, instruction following, and complex text generation workflows. The model supports a 262K-token context window, up to 64K output tokens, thinking mode, function calling, and structured outputs, making it suitable for demanding production tasks that require stronger reasoning capability over raw throughput.
จ่ายตามการใช้งาน
ไม่มีค่าใช้จ่ายล่วงหน้า จ่ายเฉพาะสิ่งที่คุณใช้
ใช้ตัวอย่างโค้ดต่อไปนี้เพื่อผสานรวมกับ API ของเรา:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="qwen/qwen3.6-max-preview",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)Qwen3.6-Max-Preview is a proprietary frontier model from Alibaba Cloud built on a sparse Mixture-of-Experts architecture with approximately 1T total parameters. It is optimized for high-end reasoning, agentic coding, tool use, instruction following, and complex text generation workflows.
| Specification | Value |
|---|---|
| Provider | alibaba |
| Model Type | Chat Completions model |
| Architecture | Sparse Mixture-of-Experts |
| Parameters | approximately 1T |
| Modalities | text->text |
| Context Window | 262,144 tokens |
| Max Input | 196,608 tokens |
| Max Output | 65,536 tokens |
| Thinking Budget | 128K tokens |
| Input | Text |
| Output | Text |
| Vision | Not listed |
| Function Calling | Supported |
| Structured Outputs | Supported |
| Thinking Mode | Supported |
| Release | April 2026 |
| Token Type | Cost |
|---|---|
| Input | $1.04 per million tokens |
| Output | $6.24 per million tokens |
| Cache Write | $1.30 per million tokens |
Base URL: https://llm.wavespeed.ai/v1
API Endpoint: chat/completions
Model ID: qwen/qwen3.6-max-preview
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="qwen/qwen3.6-max-preview",
messages=[{"role": "user", "content": "Hello!"}]
)
print(response.choices[0].message.content)
curl https://llm.wavespeed.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "qwen/qwen3.6-max-preview",
"messages": [{"role": "user", "content": "Hello!"}]
}'
qwen/qwen3.6-max-preview
Qwen3.6-Max-Preview is a proprietary frontier model from Alibaba Cloud built on a sparse Mixture-of-Experts architecture with approximately 1T total parameters. It is optimized for high-end reasoning, agentic coding, tool use, instruction following, and complex text generation workflows. The model supports a 262K-token context window, up to 64K output tokens, thinking mode, function calling, and structured outputs, making it suitable for demanding production tasks that require stronger reasoning capability over raw throughput.
อินพุต
$1.3 /M
เอาต์พุต
$7.8 /M
คอนเท็กซ์
262K
เอาต์พุตสูงสุด
66K
การใช้เครื่องมือ
รองรับ
เข้าถึง Qwen3.6 Max Preview ผ่าน API แบบรวมของเรา — เข้ากันได้กับ OpenAI ไม่มี cold start ราคาโปร่งใส
ราคาบน WaveSpeedAI: $1.30 ต่อล้านโทเคนอินพุต และ $7.80 ต่อล้านโทเคนเอาต์พุต Prompt caching และ batch processing คิดค่าบริการแยกและช่วยลดต้นทุนที่แท้จริงสำหรับภาระงานที่ยาวและทำซ้ำ
Qwen3.6 Max Preview รองรับสูงสุด 262K โทเคนคอนเท็กซ์ และสูงสุด 66K โทเคนเอาต์พุตต่อคำขอ
ใช่ WaveSpeedAI ให้บริการ Qwen3.6 Max Preview ผ่าน endpoint ที่เข้ากันได้กับ OpenAI ที่ https://llm.wavespeed.ai/v1 ชี้ OpenAI SDK ทางการมาที่ base URL นี้ด้วย API key ของ WaveSpeedAI — ไม่ต้องแก้ไขโค้ดอื่น
ลงชื่อเข้าใช้ WaveSpeedAI สร้าง API key ใน Access Keys จากนั้นส่งคำขอไปยัง https://llm.wavespeed.ai/v1/chat/completions พร้อม model id ที่แสดงด้านบน บัญชีใหม่จะได้รับเครดิตฟรีสำหรับทดลองใช้ Qwen3.6 Max Preview