qwen/qwen3-vl-8b-thinking
131,072 context · $0.12/M input tokens · $1.36/M output tokens
Qwen3-VL-8B-Thinking is the reasoning-optimized variant of the Qwen3-VL-8B multimodal model, designed for advanced visual and textual reasoning across complex scenes, documents, and temporal sequences. It integrates enhanced multimodal alignment and...
Kullandıkça öde
Ön ödeme yok, yalnızca kullandığınız kadar ödeyin
API'mizle entegre etmek için aşağıdaki kod örneklerini kullanın:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="qwen/qwen3-vl-8b-thinking",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)qwen qwen3-vl-8b-thinking
| Specification | Value |
|---|---|
| Provider | Qwen |
| Model Type | Large Language Model (LLM) |
| Architecture | N/A |
| Context Window | 256000 tokens |
| Max Output | 32768 tokens |
| Input | Text |
| Output | Text |
| Vision | Supported |
| Function Calling | Supported |
| Token Type | Cost per Million Tokens |
|---|---|
| Input | $0.2 |
| Output | $2.3 |
Base URL: https://llm.wavespeed.ai/v1 API Endpoint: chat/completions Model ID: qwen/qwen3-vl-8b-thinking
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="qwen/qwen3-vl-8b-thinking",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)
curl https://llm.wavespeed.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "qwen/qwen3-vl-8b-thinking",
"messages": [{"role": "user", "content": "Hello!"}]
}'
qwen/qwen3-vl-8b-thinking
Qwen3-VL-8B-Thinking is the reasoning-optimized variant of the Qwen3-VL-8B multimodal model, designed for advanced visual and textual reasoning across complex scenes, documents, and temporal sequences. It integrates enhanced multimodal alignment and...
Giriş
$0.117 /M
Çıkış
$1.365 /M
Bağlam
131K
Maks. Çıkış
33K
Vision
Destekleniyor
Araç Kullanımı
Destekleniyor
Birleşik API'miz aracılığıyla Qwen3 Vl 8b Thinking'e erişin — OpenAI uyumlu, soğuk başlatma yok, şeffaf fiyatlandırma.
WaveSpeedAI fiyatlandırması: milyon giriş tokenı başına $0.12 ve milyon çıkış tokenı başına $1.36. Prompt caching ve toplu işleme ayrı faturalanır ve uzun, tekrar eden yüklerde etkin maliyeti düşürür.
Qwen3 Vl 8b Thinking istek başına 131K bağlam tokenını ve 33K çıkış tokenını destekler.
Evet. WaveSpeedAI, Qwen3 Vl 8b Thinking modelini https://llm.wavespeed.ai/v1 adresindeki OpenAI uyumlu endpoint üzerinden sunar. Resmi OpenAI SDK'sını WaveSpeedAI API anahtarınızla bu base URL'ye yöneltin — başka kod değişikliği gerekmez.
WaveSpeedAI'a giriş yapın, Access Keys'te bir API anahtarı oluşturun, ardından yukarıda gösterilen model id ile https://llm.wavespeed.ai/v1/chat/completions adresine bir istek gönderin. Yeni hesaplar Qwen3 Vl 8b Thinking'i değerlendirmek için ücretsiz krediler alır.