moonshotai/kimi-k2.6
Date de publication: 2026-04-20
262,144 context · $0.95/M input tokens · $4.00/M output tokens
Kimi K2.6 is Moonshot AI’s open-source native multimodal agentic model, designed for long-horizon coding, coding-driven UI/UX generation, proactive autonomous execution, and multi-agent orchestration. Built on a 1T-parameter Mixture-of-Experts architecture with 32B active parameters, it supports text and image inputs, a 262K-token context window, thinking mode, preserve-thinking workflows, function calling, and structured outputs. It is especially strong for complex end-to-end coding tasks across Python, Rust, Go, front-end engineering, DevOps, performance optimization, and agentic workflow automation.
Paiement à l'usage
Aucun coût initial, payez uniquement ce que vous utilisez
Utilisez les exemples de code suivants pour intégrer notre API :
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.6",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)Kimi K2.6 is Moonshot AI’s open-source native multimodal agentic model, designed for long-horizon coding, coding-driven UI/UX generation, proactive autonomous execution, and multi-agent orchestration. Built on a 1T-parameter Mixture-of-Experts architecture with 32B active parameters, it is optimized for complex coding, visual understanding, tool use, and large-scale agent workflows.
| Specification | Value |
|---|---|
| Provider | moonshot |
| Model Type | Chat Completions model |
| Architecture | Mixture-of-Experts |
| Parameters | 1T total / 32B active |
| Experts | 384 experts, 8 selected per token |
| Attention | MLA |
| Vision Encoder | MoonViT |
| Context Window | 262,144 tokens |
| Input | Text, Image |
| Output | Text |
| Vision | Supported |
| Function Calling | Supported |
| Structured Outputs | Supported |
| Thinking Mode | Supported |
| Token Type | Cost |
|---|---|
| Input | $0.73 per million tokens |
| Output | $3.49 per million tokens |
| Cached Input | $0.25 per million tokens |
Base URL: https://llm.wavespeed.ai/v1
API Endpoint: chat/completions
Model ID: moonshotai/kimi-k2.6
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.6",
messages=[{"role": "user", "content": "Hello!"}]
)
print(response.choices[0].message.content)
curl https://llm.wavespeed.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "moonshotai/kimi-k2.6",
"messages": [{"role": "user", "content": "Hello!"}]
}'
moonshotai/kimi-k2.6
Kimi K2.6 is Moonshot AI’s open-source native multimodal agentic model, designed for long-horizon coding, coding-driven UI/UX generation, proactive autonomous execution, and multi-agent orchestration. Built on a 1T-parameter Mixture-of-Experts architecture with 32B active parameters, it supports text and image inputs, a 262K-token context window, thinking mode, preserve-thinking workflows, function calling, and structured outputs. It is especially strong for complex end-to-end coding tasks across Python, Rust, Go, front-end engineering, DevOps, performance optimization, and agentic workflow automation.
Entrée
$0.95 /M
Sortie
$4 /M
Contexte
262K
Sortie max.
262K
Vision
Pris en charge
Utilisation d'outils
Pris en charge
Accédez à Kimi K2.6 via notre API unifiée — compatible OpenAI, sans démarrages à froid, prix transparents.
Tarification sur WaveSpeedAI : $0.95 par million de tokens d'entrée et $4.00 par million de tokens de sortie. Le prompt caching et le traitement par batch sont facturés séparément et réduisent le coût effectif sur les charges longues et répétitives.
Kimi K2.6 prend en charge jusqu'à 262K tokens de contexte et jusqu'à 262K tokens de sortie par requête.
Oui. WaveSpeedAI expose Kimi K2.6 via un endpoint compatible OpenAI à https://llm.wavespeed.ai/v1. Pointez le SDK officiel d'OpenAI vers cette base URL avec votre clé API WaveSpeedAI — aucune autre modification de code requise.
Connectez-vous à WaveSpeedAI, créez une clé API dans Access Keys, puis envoyez une requête à https://llm.wavespeed.ai/v1/chat/completions avec l'id du modèle affiché ci-dessus. Les nouveaux comptes reçoivent des crédits gratuits pour évaluer Kimi K2.6.