Kimi K2.5: Semua yang Perlu Anda Ketahui tentang Model Visual Agentic Moonshot
Moonshot AI telah muncul sebagai kekuatan utama dalam lanskap AI open-source, dan rilis terbaru mereka merepresentasikan model paling ambisius mereka hingga saat ini. Kimi K2.5, diluncurkan pada 27 Januari 2026, memperkenalkan teknologi Agent Swarm yang terobosan dan kemampuan multimodal native yang menantang bahkan model frontier closed-source.
Peluncuran dan Ketersediaan
Kimi K2.5 secara resmi diluncurkan pada 27 Januari 2026, sebagai model open-source di bawah lisensi MIT. Ini menjadikannya salah satu model triliunan parameter paling permisif yang tersedia, memungkinkan penggunaan penelitian dan komersial tanpa pembatasan.
Model tersebut tersedia melalui berbagai saluran:
- Kimi.com: Antarmuka obrolan berbasis browser
- Aplikasi Kimi: Aplikasi mobile untuk iOS dan Android
- API moonshot.ai: Akses API pengembang
- Kimi Code CLI: Asisten pengkodean berbasis terminal
- Hugging Face: Bobot model lengkap untuk self-hosting
- NVIDIA NIM: Penyebaran inferensi yang dioptimalkan
Spesifikasi Arsitektur
Kimi K2.5 menggunakan arsitektur Mixture-of-Experts (MoE) yang canggih:
| Spesifikasi | Nilai |
|---|---|
| Total Parameter | 1 triliunan |
| Parameter Aktif | 32 miliar |
| Lapisan | 61 (termasuk 1 lapisan padat) |
| Kepala Perhatian | 64 |
| Ahli | 384 total (8 dipilih per token, 1 dibagikan) |
| Kosakata | 160K token |
| Jendela Konteks | 256K token |
| Mekanisme Perhatian | MLA (Multi-head Latent Attention) |
| Pengenkode Visi | MoonViT (400M parameter) |
Konfigurasi 384-ahli sangat luar biasa 50% lebih banyak dari 256 ahli DeepSeek-V3, memungkinkan spesialisasi yang lebih halus sambil mempertahankan inferensi yang efisien melalui aktivasi sparse.
Pelatihan
Kimi K2.5 dilatih pada sekitar 15 triliunan token visual dan teks campuran, menciptakan arsitektur multimodal yang benar-benar native. Berbeda dengan model yang menambahkan kemampuan visi ke basis text-only, pretraining bersama K2.5 memungkinkan integrasi yang mulus dari pemahaman visual dan tekstual.
Fitur visual dikompres melalui pooling spatio-temporal sebelum proyeksi ke dalam model bahasa, memungkinkan pemrosesan gambar dan video yang efisien tanpa overhead token yang berlebihan.
Kinerja Benchmark
Kimi K2.5 menunjukkan kinerja kuat di berbagai domain:
Benchmark Penalaran
| Benchmark | Skor |
|---|---|
| AIME 2025 | 96,1% |
| HMMT 2025 | 95,4% |
| GPQA-Diamond | 87,6% |
Benchmark Visi
| Benchmark | Skor |
|---|---|
| OCRBench | 92,3% |
| MathVista | 90,1% |
| OmniDocBench 1.5 | 88,8% |
Benchmark Pengkodean
| Benchmark | Kimi K2.5 | Claude Opus 4.5 |
|---|---|---|
| SWE-Bench Verified | 76,8% | 80,9% |
| LiveCodeBench | 85,0% | 64,0% |
| TerminalBench | Terdepan | Kedua |
Meskipun Claude Opus 4.5 mempertahankan keunggulan kecil di SWE-Bench Verified (80,9% vs 76,8%), Kimi K2.5 secara signifikan melampaui di LiveCodeBench (85,0% vs 64,0%), menunjukkan kemampuan pengkodean interaktif real-time yang lebih kuat.
Harga
Kimi K2.5 menawarkan harga agresif yang mengalahkan sebagian besar model frontier:
| Model | Input (per 1M token) | Output (per 1M token) |
|---|---|---|
| Kimi K2.5 | $0,60 | $2,50-$3,00 |
| Claude Opus 4.5 | $15,00 | $75,00 |
| Claude Sonnet 5 | $3,00 | $15,00 |
Dengan harga kira-kira 9 kali lebih murah daripada Claude Opus 4.5 dan 5 kali lebih murah daripada Claude Sonnet 5, Kimi K2.5 menawarkan nilai yang menarik untuk beban kerja volume tinggi.
Teknologi Agent Swarm
Fitur paling inovatif dari Kimi K2.5 adalah sistem Agent Swarm—terobosan dalam eksekusi AI paralel.
Bagaimana Agent Swarm Bekerja
Agent Swarm memungkinkan kawanan sub-agen yang mengarahkan diri sendiri hingga 100 yang mengeksekusi alur kerja paralel di seluruh hingga 1.500 pemanggilan alat:
- Orchestrator: Orchestrator yang dapat dilatih secara dinamis membuat subagen khusus
- Dekomposisi Tugas: Tugas kompleks dipecah menjadi unit kerja yang dapat diparalelkan
- Eksekusi Paralel: Beberapa agen bekerja secara bersamaan pada komponen yang berbeda
- Koordinasi: Hasil disintesis kembali menjadi output yang koheren
Inovasi Pelatihan
Sistem menggunakan Parallel-Agent Reinforcement Learning (PARL) dengan pembentukan reward berjenjang untuk mencegah “serial collapse”—kecenderungan agen untuk kembali ke eksekusi sekuensial single-agent. Pendekatan pelatihan ini mendorong paralelisasi asli.
Peningkatan Kinerja
Agent Swarm mencapai pengurangan waktu eksekusi hingga 4,5x dibandingkan dengan pendekatan single-agent sekuensial. Untuk proyek pengkodean skala besar, ini diterjemahkan ke waktu penyelesaian yang jauh lebih cepat.
Sistem menggunakan pengukuran “Critical Steps” yang terinspirasi dari analisis critical path dalam komputasi paralel untuk mengoptimalkan strategi eksekusi.
Mode Operasional
Kimi K2.5 mendukung empat mode operasional yang berbeda:
- K2.5 Instant: Respons cepat dengan pemikiran dinonaktifkan (temperature 0,6)
- K2.5 Thinking: Penalaran diperluas dengan chain-of-thought (temperature 1,0, top-p 0,95)
- K2.5 Agent: Eksekusi tugas otonom single-agent
- K2.5 Agent Swarm (Beta): Alur kerja paralel multi-agent
Setiap mode dapat dikonfigurasi melalui parameter API, memungkinkan pengembang menyeimbangkan kecepatan, kedalaman, dan kemampuan untuk kasus penggunaan spesifik.
Kemampuan Utama
Kecerdasan Agentic Berbasis Visual
Kimi K2.5 unggul dalam tugas berbasis visi yang menggabungkan pemahaman visual dengan pembuatan kode:
- Pembuatan video-to-code: Konversi demonstrasi video menjadi kode yang berfungsi
- Rekonstruksi website: Buat ulang website dari screenshot
- Debugging visual: Identifikasi dan perbaiki masalah UI dari screenshot
- Penalaran spasial: Selesaikan teka-teki visual dan pahami tata letak
Pengembangan Front-End
Model menunjukkan kekuatan khusus dalam pengembangan front-end:
- Implementasi tata letak interaktif dengan animasi yang dipicu scroll
- Pembuatan CSS dan JavaScript yang kompleks dari deskripsi visual
- Implementasi desain responsif di berbagai ukuran perangkat
- Efek animasi dan transisi yang kaya
Produktivitas Kantor
K2.5 Agent menangani alur kerja enterprise melalui koordinasi alat multi-langkah:
- Hasilkan dokumen, spreadsheet, PDF, dan presentasi
- Proses makalah 10.000 kata atau dokumen 100 halaman
- Koordinasikan alur kerja multi-langkah dengan rantai alat
- Peningkatan 59,3% dibandingkan K2 Thinking di AI Office Benchmark
- Peningkatan 24,3% di General Agent Benchmark
Kimi Code CLI
Seiring dengan K2.5, Moonshot merilis Kimi Code—asisten pengkodean berbasis terminal yang terintegrasi dengan editor populer:
- VSCode: Dukungan ekstensi lengkap
- Cursor: Integrasi native
- Zed: Plugin tersedia
Kimi Code menyediakan alur kerja terminal seperti Claude Code yang didukung oleh kemampuan agentic K2.5, memungkinkan pengembang memanfaatkan Agent Swarm langsung dari lingkungan pengembangan mereka.
Opsi Penyebaran
Self-Hosting
Dengan lisensi MIT dan ketersediaan bobot lengkap, organisasi dapat menggunakan K2.5 di infrastruktur mereka sendiri:
- Engine Direkomendasikan: vLLM, SGLang, KTransformers
- Persyaratan: transformers ≥4.57.1
- Hardware: Skala dari GPU konsumen (quantized) hingga penyebaran data center
Penyebaran Cloud
- NVIDIA NIM: Container yang dioptimalkan untuk penyebaran enterprise
- Hugging Face Inference: Endpoint terkelola
- Penyedia Cloud Utama: Tersedia melalui API inferensi standar
Perbandingan dengan Pesaing
vs. Claude Opus 4.5
| Aspek | Kimi K2.5 | Claude Opus 4.5 |
|---|---|---|
| SWE-Bench | 76,8% | 80,9% |
| LiveCodeBench | 85,0% | 64,0% |
| Harga | $0,60/$2,50 | $15/$75 |
| Open Source | Ya (MIT) | Tidak |
| Konteks | 256K | 200K |
| Agent Swarm | Ya (100 agen) | Tidak |
Claude Opus 4.5 memimpin dalam benchmark perbaikan kode tradisional, sementara Kimi K2.5 unggul dalam pengkodean interaktif dan menawarkan harga yang jauh lebih baik dengan ketersediaan open-source.
vs. DeepSeek V3
Kedua model berbagi filosofi arsitektur MoE, tetapi K2.5 membawa:
- Kemampuan multimodal native (DeepSeek V3 hanya teks)
- Agent Swarm untuk eksekusi paralel
- 384 ahli vs 256 DeepSeek
- Kemampuan pengkodean berbasis visi
vs. Claude Sonnet 5
| Aspek | Kimi K2.5 | Claude Sonnet 5 |
|---|---|---|
| Harga | $0,60/$2,50 | $3/$15 |
| Konteks | 256K | 1M |
| Open Source | Ya | Tidak |
| Agent Swarm | Ya | Mode Tim Pengembang |
Sonnet 5 menawarkan konteks lebih besar dan fitur agentic serupa, tetapi sifat open-source K2.5 dan harga yang lebih rendah membuatnya menarik untuk penyebaran yang sensitif terhadap biaya.
Apa Artinya Ini untuk Pengembang
Kimi K2.5 mewakili pencapaian penting untuk AI open-source:
- Frontier open-source asli: Model triliunan parameter dengan lisensi MIT
- Efisiensi biaya: 9 kali lebih murah dari opsi closed-source yang sebanding
- Eksekusi paralel: Agent Swarm memungkinkan paralelisasi tugas yang belum pernah terjadi sebelumnya
- Multimodal native: Visi dan teks bersatu dari pretraining
- Self-hosting: Fleksibilitas penyebaran lengkap untuk persyaratan enterprise
Bagi organisasi yang membutuhkan penyebaran on-premises, lingkungan air-gapped, atau hanya ingin menghindari API lock-in, Kimi K2.5 menawarkan kemampuan yang sebelumnya hanya tersedia melalui penyedia closed-source.
Menuju Depan
Moonshot AI telah memposisikan dirinya sebagai pesaing yang tangguh dalam lanskap AI. Dengan teknologi Agent Swarm dan kemampuan multimodal native, Kimi K2.5 mendorong batas-batas dari apa yang dapat dicapai model open-source.
Pertanyaan kunci ke depan:
- Akankah paradigma eksekusi paralel Agent Swarm mempengaruhi cara lab lain mendekati AI agentic?
- Bisakah kemampuan pengkodean visual K2.5 diterjemahkan ke adopsi yang lebih luas dalam pengembangan front-end?
- Bagaimana tekanan harga akan mempengaruhi penyedia closed-source?
Untuk saat ini, Kimi K2.5 berdiri sebagai model open-source paling mampu yang tersedia—alternatif asli untuk model frontier closed-source dalam banyak kasus penggunaan.





