50% zniżki na modele Vidu Q3 i Q3 Pro · Tylko w WaveSpeedAI | 20 maja – 2 czerwca
alibaba
qwen/qwen3-vl-8b-instruct

qwen/qwen3-vl-8b-instruct

131,072 context · $0.08/M input tokens · $0.50/M output tokens

Qwen3-VL-8B-Instruct is a multimodal vision-language model from the Qwen3-VL series, built for high-fidelity understanding and reasoning across text, images, and video. It features improved multimodal fusion with Interleaved-MRoPE for long-horizon...

Cennik

Płać za użycie

Bez kosztów początkowych, płacisz tylko za to, czego używasz

Wejście$0.08 / M Tokens
Wyjście$0.50 / M Tokens

Wypróbuj model

qwen/qwen3-vl-8b-instruct
Online
alibaba
Cześć! Jestem pomocnym asystentem AI. W czym mogę pomóc?

Użycie API

Użyj poniższych przykładów kodu, aby zintegrować się z naszym API:

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://llm.wavespeed.ai/v1"
)

response = client.chat.completions.create(
    model="qwen/qwen3-vl-8b-instruct",
    messages=[
        {"role": "user", "content": "Hello!"}
    ]
)

print(response.choices[0].message.content)

Wprowadzenie do modelu

Qwen qwen3-vl-8b-instruct

**Qwen3-VL-8B-Instruct is a multimodal vision-language model from the Qwen3-VL series, built for high-fidelity understanding and reasoning across text, **

Qwen3-VL-8B-Instruct is a multimodal vision-language model from the Qwen3-VL series, built for high-fidelity understanding and reasoning across text, images, and video. It features improved multimodal fusion with Interleaved-MRoPE for long-horizon temporal reasoning, DeepStack for fine-grained visual-text alignment, and text-timestamp alignment for precise event localization.

The model supports a native 256K-token context window, extensible to 1M tokens, and handles both static and dynamic media inputs for tasks like document parsing, visual question answering, spatial reasoning, and GUI control. It achieves text understanding comparable to leading LLMs while expanding OCR coverage to 32 languages and enhancing robustness under varied visual conditions.


Why It Looks Great

  • Large Language Model architecture for efficient processing
  • 131072 context window for long document handling
  • Competitive pricing at $0.1/$0.5 per million tokens

Key Features

  • Context Window: 131072 tokens
  • Max Output: 32768 tokens
  • Vision: Supported
  • Function Calling: Supported

Specifications

SpecificationValue
ProviderQwen
Model TypeLarge Language Model (LLM)
ArchitectureN/A
Context Window131072 tokens
Max Output32768 tokens
InputText
OutputText
VisionSupported
Function CallingSupported

Pricing

Token TypeCost per Million Tokens
Input$0.1
Output$0.5

How to Use

  1. Write your prompt — describe the task, provide context, and specify desired output format.
  2. Submit — the model processes your request and returns the response.

API Integration

Base URL: https://llm.wavespeed.ai/v1 API Endpoint: chat/completions Model ID: qwen/qwen3-vl-8b-instruct


API Usage

Python SDK

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://llm.wavespeed.ai/v1"
)

response = client.chat.completions.create(
    model="qwen/qwen3-vl-8b-instruct",
    messages=[
        {"role": "user", "content": "Hello!"}
    ]
)

print(response.choices[0].message.content)

cURL

curl https://llm.wavespeed.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "qwen/qwen3-vl-8b-instruct",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Notes

  • Model: qwen/qwen3-vl-8b-instruct
  • Provider: Qwen

Info

Dostawcaalibaba
Typllm

Obsługiwane funkcje

Wejście
TekstObraz
Wyjście
Tekst
Kontekst131,072
Maks. wyjście32,768
Vision✓ Obsługiwane
Function Calling✓ Obsługiwane

Przewodnik dostępu do API

Base URLhttps://llm.wavespeed.ai/v1
API Endpointchat/completions
ID modeluqwen/qwen3-vl-8b-instruct

Qwen3 Vl 8b Instruct API

qwen/qwen3-vl-8b-instruct

Qwen3-VL-8B-Instruct is a multimodal vision-language model from the Qwen3-VL series, built for high-fidelity understanding and reasoning across text, images, and video. It features improved multimodal fusion with Interleaved-MRoPE for long-horizon...

Wejście

$0.08 /M

Wyjście

$0.5 /M

Kontekst

131K

Maks. wyjście

33K

Vision

Obsługiwane

Użycie narzędzi

Obsługiwane

Wypróbuj Qwen3 Vl 8b Instruct w WaveSpeedAI

Uzyskaj dostęp do Qwen3 Vl 8b Instruct przez nasze ujednolicone API — kompatybilne z OpenAI, bez zimnych startów, przejrzyste ceny.

Najczęstsze pytania o Qwen3 Vl 8b Instruct

Ile kosztuje API Qwen3 Vl 8b Instruct?+

Cennik na WaveSpeedAI: $0.08 za milion tokenów wejściowych i $0.50 za milion tokenów wyjściowych. Prompt caching i przetwarzanie wsadowe są rozliczane oddzielnie i obniżają efektywny koszt długich, powtarzalnych obciążeń.

Jakie jest okno kontekstu Qwen3 Vl 8b Instruct?+

Qwen3 Vl 8b Instruct obsługuje do 131K tokenów kontekstu i do 33K tokenów wyjściowych na zapytanie.

Czy Qwen3 Vl 8b Instruct jest kompatybilny z OpenAI?+

Tak. WaveSpeedAI udostępnia Qwen3 Vl 8b Instruct przez endpoint kompatybilny z OpenAI pod https://llm.wavespeed.ai/v1. Skieruj oficjalny OpenAI SDK na ten base URL ze swoim kluczem API WaveSpeedAI — bez innych zmian w kodzie.

Jak zacząć z Qwen3 Vl 8b Instruct?+

Zaloguj się do WaveSpeedAI, utwórz klucz API w Access Keys, a następnie wyślij żądanie na https://llm.wavespeed.ai/v1/chat/completions z id modelu pokazanym powyżej. Nowe konta otrzymują darmowe kredyty na ocenę Qwen3 Vl 8b Instruct.

Powiązane API LLM