xiaomi/mimo-v2-flash
262,144 context · $0.09/M input tokens · $0.29/M output tokens
MiMo-V2-Flash is an open-source foundation language model developed by Xiaomi. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, adopting hybrid attention architecture. MiMo-V2-Flash supports a...
Kullandıkça öde
Ön ödeme yok, yalnızca kullandığınız kadar ödeyin
API'mizle entegre etmek için aşağıdaki kod örneklerini kullanın:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="xiaomi/mimo-v2-flash",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)MiMo-V2-Flash is an open-source foundation language model developed by Xiaomi
MiMo-V2-Flash is an open-source foundation language model developed by Xiaomi. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, adopting hybrid attention architecture. MiMo-V2-Flash supports a hybrid-thinking toggle and a 256K context window, and excels at reasoning, coding, and agent scenarios. On SWE-bench Verified and SWE-bench Multilingual, MiMo-V2-Flash ranks as the top #1 open-source model globally, delivering performance comparable to Claude Sonnet 4.5 while costing only about 3.5% as much.
Users can control the reasoning behaviour with the reasoning enabled boolean. Learn more in our docs.
| Specification | Value |
|---|---|
| Provider | Xiaomi |
| Model Type | Large Language Model (LLM) |
| Architecture | N/A |
| Context Window | 262144 tokens |
| Max Output | tokens |
| Input | Text |
| Output | Text |
| Vision | Supported |
| Function Calling | Supported |
| Token Type | Cost per Million Tokens |
|---|---|
| Input | $0.1 |
| Output | $0.3 |
Base URL: https://llm.wavespeed.ai/v1 API Endpoint: chat/completions Model ID: xiaomi/mimo-v2-flash
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="xiaomi/mimo-v2-flash",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)
curl https://llm.wavespeed.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "xiaomi/mimo-v2-flash",
"messages": [{"role": "user", "content": "Hello!"}]
}'
xiaomi/mimo-v2-flash
MiMo-V2-Flash is an open-source foundation language model developed by Xiaomi. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, adopting hybrid attention architecture. MiMo-V2-Flash supports a...
Giriş
$0.09 /M
Çıkış
$0.29 /M
Bağlam
262K
Maks. Çıkış
66K
Araç Kullanımı
Destekleniyor
Birleşik API'miz aracılığıyla Mimo V2 Flash'e erişin — OpenAI uyumlu, soğuk başlatma yok, şeffaf fiyatlandırma.
WaveSpeedAI fiyatlandırması: milyon giriş tokenı başına $0.09 ve milyon çıkış tokenı başına $0.29. Prompt caching ve toplu işleme ayrı faturalanır ve uzun, tekrar eden yüklerde etkin maliyeti düşürür.
Mimo V2 Flash istek başına 262K bağlam tokenını ve 66K çıkış tokenını destekler.
Evet. WaveSpeedAI, Mimo V2 Flash modelini https://llm.wavespeed.ai/v1 adresindeki OpenAI uyumlu endpoint üzerinden sunar. Resmi OpenAI SDK'sını WaveSpeedAI API anahtarınızla bu base URL'ye yöneltin — başka kod değişikliği gerekmez.
WaveSpeedAI'a giriş yapın, Access Keys'te bir API anahtarı oluşturun, ardından yukarıda gösterilen model id ile https://llm.wavespeed.ai/v1/chat/completions adresine bir istek gönderin. Yeni hesaplar Mimo V2 Flash'i değerlendirmek için ücretsiz krediler alır.