Seedance 2.0 −15 % | Créez dans le Video Generator →
chatglm
z-ai/glm-5.2

z-ai/glm-5.2

Date de publication: 2026-06-17

1,048,576 context · $1.40/M input tokens · $4.40/M output tokens

GLM 5.2 is Z.ai’s most advanced reasoning model, built for long-context, agentic, and engineering-intensive workloads. With support for a 1M-token context window and configurable High/XHigh reasoning modes, it delivers state-of-the-art performance in coding, tool use, and complex task execution.From requirements gathering and architecture design to implementation, testing, and multi-platform deployment, GLM 5.2 can maintain project-level context and consistently follow engineering best practices throughout the entire software development lifecycle.

Tarification

Paiement à l'usage

Aucun coût initial, payez uniquement ce que vous utilisez

Entrée$1.40 / M Tokens
Sortie$4.40 / M Tokens
Cache Read$0.26 / M Tokens

Essayer le modèle

z-ai/glm-5.2
En ligne
chatglm
Bonjour ! Je suis un assistant IA utile. Que puis-je faire pour vous ?

Utilisation de l'API

Utilisez les exemples de code suivants pour intégrer notre API :

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://llm.wavespeed.ai/v1"
)

response = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[
        {"role": "user", "content": "Hello!"}
    ]
)

print(response.choices[0].message.content)

Introduction au modèle

Z.ai: GLM 5.2

GLM 5.2 is Z.ai’s latest large-scale reasoning model, designed for long-context understanding, advanced coding, and complex agent workflows. With support for a 1M-token context window and configurable reasoning levels, it can maintain project-scale context across extended interactions, making it well-suited for software engineering, research, automation, and multi-step problem solving.

The model supports both High and XHigh reasoning modes, with XHigh enabling its maximum reasoning capability. GLM 5.2 excels at code generation, tool use, structured outputs, and long-horizon task execution, allowing developers to build sophisticated AI agents and automation systems that operate reliably over large amounts of context.

This model is available through the WaveSpeed AI OpenAI-compatible API and can be integrated into existing applications with minimal changes.


Why Choose GLM 5.2

  • Massive 1M-token context window for large documents, repositories, and long-running workflows
  • Strong reasoning performance for coding, planning, and complex multi-step tasks
  • Optimized for agentic applications with function calling and tool-use support
  • Structured output generation for JSON-based workflows and schema-constrained responses
  • Flexible reasoning controls for balancing speed, cost, and reasoning depth
  • Competitive pricing for large-context production workloads

Key Features

  • Context Window: 1,048,576 tokens
  • Max Input: 786,432 tokens
  • Max Output: 262,144 tokens
  • Architecture: Text → Text
  • Function Calling: Supported
  • Structured Outputs: Supported
  • Reasoning Controls: Supported
  • Vision: Not listed
  • Audio Input: Not listed
  • Image Generation: Not listed

Specifications

SpecificationValue
Providerchatglm
Model TypeChat Completions
ArchitectureText → Text
Context Window1,048,576 tokens
Max Input786,432 tokens
Max Output262,144 tokens
InputText
OutputText
Function CallingSupported
Structured OutputsSupported

API Integration

Base URL

https://llm.wavespeed.ai/v1

Endpoint

POST /chat/completions

Model ID

z-ai/glm-5.2

Common Use Cases

  • AI coding assistants
  • Software engineering agents
  • Large-scale codebase analysis
  • Research and document intelligence
  • Workflow automation
  • Multi-agent systems
  • Structured data extraction
  • Long-context reasoning applications

Notes

  • Model ID: z-ai/glm-5.2
  • Provider: chatglm

Infos

Fournisseurchatglm
Typellm

Fonctionnalités prises en charge

Entrée
Texte
Sortie
Texte
Contexte1,048,576
Sortie max262,144
Vision-
Function Calling✓ Pris en charge

Guide d'accès API

Base URLhttps://llm.wavespeed.ai/v1
API Endpointchat/completions
ID du modèlez-ai/glm-5.2

GLM 5.2 API

z-ai/glm-5.2

GLM 5.2 is Z.ai’s most advanced reasoning model, built for long-context, agentic, and engineering-intensive workloads. With support for a 1M-token context window and configurable High/XHigh reasoning modes, it delivers state-of-the-art performance in coding, tool use, and complex task execution.From requirements gathering and architecture design to implementation, testing, and multi-platform deployment, GLM 5.2 can maintain project-level context and consistently follow engineering best practices throughout the entire software development lifecycle.

Entrée

$1.4 /M

Sortie

$4.4 /M

Contexte

1049K

Sortie max.

262K

Utilisation d'outils

Pris en charge

Essayez GLM 5.2 sur WaveSpeedAI

Accédez à GLM 5.2 via notre API unifiée — compatible OpenAI, sans démarrages à froid, prix transparents.

Questions fréquentes sur GLM 5.2

Combien coûte l'API GLM 5.2 ?+

Tarification sur WaveSpeedAI : $1.40 par million de tokens d'entrée et $4.40 par million de tokens de sortie. Le prompt caching et le traitement par batch sont facturés séparément et réduisent le coût effectif sur les charges longues et répétitives.

Quelle est la fenêtre de contexte de GLM 5.2 ?+

GLM 5.2 prend en charge jusqu'à 1049K tokens de contexte et jusqu'à 262K tokens de sortie par requête.

GLM 5.2 est-il compatible avec OpenAI ?+

Oui. WaveSpeedAI expose GLM 5.2 via un endpoint compatible OpenAI à https://llm.wavespeed.ai/v1. Pointez le SDK officiel d'OpenAI vers cette base URL avec votre clé API WaveSpeedAI — aucune autre modification de code requise.

Comment démarrer avec GLM 5.2 ?+

Connectez-vous à WaveSpeedAI, créez une clé API dans Access Keys, puis envoyez une requête à https://llm.wavespeed.ai/v1/chat/completions avec l'id du modèle affiché ci-dessus. Les nouveaux comptes reçoivent des crédits gratuits pour évaluer GLM 5.2.

APIs LLM associées