minimax/minimax-m3
1,048,576 context · $0.60/M input$0.42/M input · $2.40/M output$1.68/M output30% off
MiniMax-M3 is MiniMax’s latest M-series multimodal foundation model for agent reasoning, tool use, coding, and long-context tasks. It supports text, image, and video inputs with text output, a 1M-token context window, thinking content, function calling, and structured outputs. With support for long-horizon agentic work, coding workflows, multimodal understanding, and very long responses, MiniMax-M3 is well suited for building autonomous agents, code assistants, document/video analysis tools, and production workflows that need large context at efficient pricing.
Paiement à l'usage
Aucun coût initial, payez uniquement ce que vous utilisez
Utilisez les exemples de code suivants pour intégrer notre API :
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="minimax/minimax-m3",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)MiniMax-M3 is MiniMax’s latest M-series multimodal foundation model for agent reasoning, tool use, coding, and long-context tasks. It supports text, image, and video inputs with text output, a 1M-token context window, thinking content, function calling, and structured outputs.
| Specification | Value |
|---|---|
| Provider | minimax |
| Model Type | Chat Completions model |
| Architecture | text+image+video->text |
| Context Window | 1,048,576 tokens |
| Max Input | 536,576 tokens |
| Max Output | 512,000 tokens |
| Input | Text, Image, Video |
| Output | Text |
| Vision | Supported |
| Video Input | Supported |
| Function Calling | Supported |
| Structured Outputs | Supported |
| Thinking Mode | Supported |
Base URL: https://llm.wavespeed.ai/v1
API Endpoint: chat/completions
Model ID: minimax/minimax-m3
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="minimax/minimax-m3",
messages=[{"role": "user", "content": "Hello!"}]
)
print(response.choices[0].message.content)
curl https://llm.wavespeed.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "minimax/minimax-m3",
"messages": [{"role": "user", "content": "Hello!"}]
}'
minimax/minimax-m3
MiniMax-M3 is MiniMax’s latest M-series multimodal foundation model for agent reasoning, tool use, coding, and long-context tasks. It supports text, image, and video inputs with text output, a 1M-token context window, thinking content, function calling, and structured outputs. With support for long-horizon agentic work, coding workflows, multimodal understanding, and very long responses, MiniMax-M3 is well suited for building autonomous agents, code assistants, document/video analysis tools, and production workflows that need large context at efficient pricing.
Entrée
$0.6$0.42 /M
Sortie
$2.4$1.68 /M
Remise
30% de remise
Contexte
1049K
Sortie max.
512K
Vision
Pris en charge
Utilisation d'outils
Pris en charge
Accédez à Minimax M3 via notre API unifiée — compatible OpenAI, sans démarrages à froid, prix transparents.
Tarification sur WaveSpeedAI : $0.42 par million de tokens d'entrée et $1.68 par million de tokens de sortie. Le prompt caching et le traitement par batch sont facturés séparément et réduisent le coût effectif sur les charges longues et répétitives.
Minimax M3 prend en charge jusqu'à 1049K tokens de contexte et jusqu'à 512K tokens de sortie par requête.
Oui. WaveSpeedAI expose Minimax M3 via un endpoint compatible OpenAI à https://llm.wavespeed.ai/v1. Pointez le SDK officiel d'OpenAI vers cette base URL avec votre clé API WaveSpeedAI — aucune autre modification de code requise.
Connectez-vous à WaveSpeedAI, créez une clé API dans Access Keys, puis envoyez une requête à https://llm.wavespeed.ai/v1/chat/completions avec l'id du modèle affiché ci-dessus. Les nouveaux comptes reçoivent des crédits gratuits pour évaluer Minimax M3.