Seedance 2.0 15% TANIEJ | Twórz w Video Generator →
chatglm
z-ai/glm-5.2

z-ai/glm-5.2

Data publikacji: 2026-06-17

1,048,576 context · $1.40/M input tokens · $4.40/M output tokens

GLM 5.2 is Z.ai’s most advanced reasoning model, built for long-context, agentic, and engineering-intensive workloads. With support for a 1M-token context window and configurable High/XHigh reasoning modes, it delivers state-of-the-art performance in coding, tool use, and complex task execution.From requirements gathering and architecture design to implementation, testing, and multi-platform deployment, GLM 5.2 can maintain project-level context and consistently follow engineering best practices throughout the entire software development lifecycle.

Cennik

Płać za użycie

Bez kosztów początkowych, płacisz tylko za to, czego używasz

Wejście$1.40 / M Tokens
Wyjście$4.40 / M Tokens
Cache Read$0.26 / M Tokens

Wypróbuj model

z-ai/glm-5.2
Online
chatglm
Cześć! Jestem pomocnym asystentem AI. W czym mogę pomóc?

Użycie API

Użyj poniższych przykładów kodu, aby zintegrować się z naszym API:

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://llm.wavespeed.ai/v1"
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[
        {"role": "user", "content": "Hello!"}
    ]
)

print(response.choices[0].message.content)

Wprowadzenie do modelu

Z.ai: GLM 5.2

GLM 5.2 is Z.ai’s latest large-scale reasoning model, designed for long-context understanding, advanced coding, and complex agent workflows. With support for a 1M-token context window and configurable reasoning levels, it can maintain project-scale context across extended interactions, making it well-suited for software engineering, research, automation, and multi-step problem solving.

The model supports both High and XHigh reasoning modes, with XHigh enabling its maximum reasoning capability. GLM 5.2 excels at code generation, tool use, structured outputs, and long-horizon task execution, allowing developers to build sophisticated AI agents and automation systems that operate reliably over large amounts of context.

This model is available through the WaveSpeed AI OpenAI-compatible API and can be integrated into existing applications with minimal changes.


Why Choose GLM 5.2

  • Massive 1M-token context window for large documents, repositories, and long-running workflows
  • Strong reasoning performance for coding, planning, and complex multi-step tasks
  • Optimized for agentic applications with function calling and tool-use support
  • Structured output generation for JSON-based workflows and schema-constrained responses
  • Flexible reasoning controls for balancing speed, cost, and reasoning depth
  • Competitive pricing for large-context production workloads

Key Features

  • Context Window: 1,048,576 tokens
  • Max Input: 786,432 tokens
  • Max Output: 262,144 tokens
  • Architecture: Text → Text
  • Function Calling: Supported
  • Structured Outputs: Supported
  • Reasoning Controls: Supported
  • Vision: Not listed
  • Audio Input: Not listed
  • Image Generation: Not listed

Specifications

SpecificationValue
Providerchatglm
Model TypeChat Completions
ArchitectureText → Text
Context Window1,048,576 tokens
Max Input786,432 tokens
Max Output262,144 tokens
InputText
OutputText
Function CallingSupported
Structured OutputsSupported

API Integration

Base URL

https://llm.wavespeed.ai/v1

Endpoint

POST /chat/completions

Model ID

z-ai/glm-5.2

Common Use Cases

  • AI coding assistants
  • Software engineering agents
  • Large-scale codebase analysis
  • Research and document intelligence
  • Workflow automation
  • Multi-agent systems
  • Structured data extraction
  • Long-context reasoning applications

Notes

  • Model ID: z-ai/glm-5.2
  • Provider: chatglm

Info

Dostawcachatglm
Typllm

Obsługiwane funkcje

Wejście
Tekst
Wyjście
Tekst
Kontekst1,048,576
Maks. wyjście262,144
Vision-
Function Calling✓ Obsługiwane

Przewodnik dostępu do API

Base URLhttps://llm.wavespeed.ai/v1
API Endpointchat/completions
ID modeluz-ai/glm-5.2

GLM 5.2 API

z-ai/glm-5.2

GLM 5.2 is Z.ai’s most advanced reasoning model, built for long-context, agentic, and engineering-intensive workloads. With support for a 1M-token context window and configurable High/XHigh reasoning modes, it delivers state-of-the-art performance in coding, tool use, and complex task execution.From requirements gathering and architecture design to implementation, testing, and multi-platform deployment, GLM 5.2 can maintain project-level context and consistently follow engineering best practices throughout the entire software development lifecycle.

Wejście

$1.4 /M

Wyjście

$4.4 /M

Kontekst

1049K

Maks. wyjście

262K

Użycie narzędzi

Obsługiwane

Wypróbuj GLM 5.2 w WaveSpeedAI

Uzyskaj dostęp do GLM 5.2 przez nasze ujednolicone API — kompatybilne z OpenAI, bez zimnych startów, przejrzyste ceny.

Najczęstsze pytania o GLM 5.2

Ile kosztuje API GLM 5.2?+

Cennik na WaveSpeedAI: $1.40 za milion tokenów wejściowych i $4.40 za milion tokenów wyjściowych. Prompt caching i przetwarzanie wsadowe są rozliczane oddzielnie i obniżają efektywny koszt długich, powtarzalnych obciążeń.

Jakie jest okno kontekstu GLM 5.2?+

GLM 5.2 obsługuje do 1049K tokenów kontekstu i do 262K tokenów wyjściowych na zapytanie.

Czy GLM 5.2 jest kompatybilny z OpenAI?+

Tak. WaveSpeedAI udostępnia GLM 5.2 przez endpoint kompatybilny z OpenAI pod https://llm.wavespeed.ai/v1. Skieruj oficjalny OpenAI SDK na ten base URL ze swoim kluczem API WaveSpeedAI — bez innych zmian w kodzie.

Jak zacząć z GLM 5.2?+

Zaloguj się do WaveSpeedAI, utwórz klucz API w Access Keys, a następnie wyślij żądanie na https://llm.wavespeed.ai/v1/chat/completions z id modelu pokazanym powyżej. Nowe konta otrzymują darmowe kredyty na ocenę GLM 5.2.

Powiązane API LLM