z-ai/glm-4.6v
131,072 context · $0.30/M input tokens · $0.90/M output tokens
GLM-4.6V is a large multimodal model designed for high-fidelity visual understanding and long-context reasoning across images, documents, and mixed media. It supports up to 128K tokens, processes complex page layouts...
Płać za użycie
Bez kosztów początkowych, płacisz tylko za to, czego używasz
Użyj poniższych przykładów kodu, aby zintegrować się z naszym API:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="z-ai/glm-4.6v",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)z-ai glm-4.6v
| Specification | Value |
|---|---|
| Provider | Z-Ai |
| Model Type | Large Language Model (LLM) |
| Architecture | N/A |
| Context Window | 131072 tokens |
| Max Output | 24000 tokens |
| Input | Text |
| Output | Text |
| Vision | Supported |
| Function Calling | Supported |
| Token Type | Cost per Million Tokens |
|---|---|
| Input | $0.3 |
| Output | $0.10 |
Base URL: https://llm.wavespeed.ai/v1 API Endpoint: chat/completions Model ID: z-ai/glm-4.6v
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="z-ai/glm-4.6v",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)
curl https://llm.wavespeed.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "z-ai/glm-4.6v",
"messages": [{"role": "user", "content": "Hello!"}]
}'
z-ai/glm-4.6v
GLM-4.6V is a large multimodal model designed for high-fidelity visual understanding and long-context reasoning across images, documents, and mixed media. It supports up to 128K tokens, processes complex page layouts...
Wejście
$0.3 /M
Wyjście
$0.9 /M
Kontekst
131K
Maks. wyjście
131K
Vision
Obsługiwane
Użycie narzędzi
Obsługiwane
Uzyskaj dostęp do GLM 4.6v przez nasze ujednolicone API — kompatybilne z OpenAI, bez zimnych startów, przejrzyste ceny.
Cennik na WaveSpeedAI: $0.30 za milion tokenów wejściowych i $0.90 za milion tokenów wyjściowych. Prompt caching i przetwarzanie wsadowe są rozliczane oddzielnie i obniżają efektywny koszt długich, powtarzalnych obciążeń.
GLM 4.6v obsługuje do 131K tokenów kontekstu i do 131K tokenów wyjściowych na zapytanie.
Tak. WaveSpeedAI udostępnia GLM 4.6v przez endpoint kompatybilny z OpenAI pod https://llm.wavespeed.ai/v1. Skieruj oficjalny OpenAI SDK na ten base URL ze swoim kluczem API WaveSpeedAI — bez innych zmian w kodzie.
Zaloguj się do WaveSpeedAI, utwórz klucz API w Access Keys, a następnie wyślij żądanie na https://llm.wavespeed.ai/v1/chat/completions z id modelu pokazanym powyżej. Nowe konta otrzymują darmowe kredyty na ocenę GLM 4.6v.