Claude Opus 4.6 dan Sonnet 4.6: Semua yang Perlu Anda Ketahui

Anthropic kembali menaikkan standar. Dengan peluncuran Claude Opus 4.6 (5 Februari 2026) dan Claude Sonnet 4.6 (17 Februari 2026), keluarga model Claude menghadirkan peningkatan besar dalam coding, alur kerja agentic, penalaran konteks panjang, dan penggunaan komputer — semuanya dengan harga yang tidak berubah dari generasi sebelumnya.

Berikut ini yang membuat generasi 4.6 menjadi lompatan signifikan ke depan.

Claude Opus 4.6: Claude Paling Canggih yang Pernah Ada

Opus 4.6 adalah model unggulan Anthropic, dirancang untuk tugas-tugas paling menuntut dalam coding, riset, dan penalaran kompleks.

Jendela Konteks 1 Juta Token dengan Harga Standar

Untuk pertama kalinya, model kelas Opus hadir dengan jendela konteks 1 juta token — dan tidak ada biaya tambahan untuk konteks panjang. Ini berarti Anda dapat memasukkan seluruh basis kode, dokumen hukum yang panjang, atau kumpulan data besar ke dalam satu prompt tanpa khawatir tentang biaya tambahan.

128K Token Output

Opus 4.6 menggandakan output maksimum dari 64K menjadi 128K token, menjadikannya jauh lebih praktis untuk menghasilkan konten berformat panjang, kode terperinci, atau analisis komprehensif dalam satu respons.

Pemikiran Adaptif

Masa-masa menyetel anggaran extended thinking secara manual sudah berlalu. Opus 4.6 memperkenalkan pemikiran adaptif, di mana Claude secara dinamis memutuskan kapan dan seberapa dalam untuk bernalar. Anda dapat menetapkan salah satu dari empat tingkat upaya — rendah, sedang, tinggi (default), atau maksimum — dan biarkan model mengalokasikan anggaran penalarannya sesuai.

Pemikiran Terselingi

Dalam alur kerja agentic, Claude kini dapat berpikir di antara pemanggilan alat. Alih-alih merencanakan segalanya di awal lalu mengeksekusi, model bernalar di setiap langkah, menyesuaikan pendekatannya berdasarkan hasil antara. Ini membuat tugas multi-langkah jauh lebih andal.

Pemadatan Konteks

Ketika percakapan mendekati batas konteks, Opus 4.6 secara otomatis merangkum dan menggantikan konteks yang lebih lama alih-alih memotongnya begitu saja. Ini memungkinkan interaksi yang lebih panjang dan berkelanjutan — sangat berharga untuk sesi coding, debugging, dan alur kerja riset yang mencakup banyak giliran.

Claude Sonnet 4.6: Menutup Kesenjangan

Sonnet 4.6 kini menjadi model default untuk pengguna Free dan Pro di claude.ai. Yang luar biasa dari rilis ini adalah seberapa dekat Sonnet mendekati performa level Opus — kesenjangan antara keduanya adalah yang tersempit yang pernah ada.

Sonnet 4.6 berbagi peningkatan inti yang sama: jendela konteks 1 Juta token, pemikiran adaptif, extended thinking, dan pemikiran terselingi. Semua dengan harga yang jauh lebih terjangkau.

Sorotan Benchmark

Angka-angkanya bercerita secara meyakinkan:

Benchmark	Opus 4.6	Sonnet 4.6
SWE-bench Verified (isu GitHub nyata)	~80,8%	79,6%
OSWorld-Verified (penggunaan komputer)	72,7%	72,5%
Terminal-Bench 2.0 (coding agentic)	#1 keseluruhan	59,1%
Humanity’s Last Exam	#1 keseluruhan	—
ARC-AGI-2	—	58,3% (peningkatan 4,3x)
BigLaw Bench (penalaran hukum)	90,2%	—
MRCR v2 8-needle @ 1M (konteks panjang)	76%	—

Beberapa hal yang patut diperhatikan:

SWE-bench Verified: Sonnet 4.6 meraih skor 79,6%, hampir menyamai Opus di 80,8%. Untuk sebagian besar tugas coding, perbedaannya dapat diabaikan.
OSWorld: Kedua model meraih skor di atas 72% pada penggunaan komputer otonom — lompatan besar dari generasi sebelumnya dan jauh melampaui model pesaing.
ARC-AGI-2: Sonnet 4.6 melompat dari 13,6% ke 58,3%, sebuah peningkatan 4,3x — peningkatan satu generasi terbesar dalam sejarah Claude.
Pengambilan konteks panjang: Opus 4.6 meraih skor 76% pada tugas pengambilan 8-needle di konteks 1 Juta token, dibandingkan hanya 18,5% untuk Sonnet 4.5. Peningkatan 4x dalam menemukan informasi yang terkubur jauh di dalam dokumen panjang.

Harga

Kedua model mempertahankan harga yang sama dengan pendahulu 4.5 mereka:

Model	Input (per 1 Juta token)	Output (per 1 Juta token)
Opus 4.6	$5	$25
Sonnet 4.6	$3	$15
Haiku 4.5	$1	$5

Jendela konteks 1 Juta token tersedia dengan harga standar untuk Opus maupun Sonnet — tidak ada tingkatan premium atau biaya tambahan.

Kapan Menggunakan Model Mana

Pilih Opus 4.6 jika Anda membutuhkan:

Akurasi maksimum pada penalaran kompleks multi-langkah
Tugas konteks panjang yang memerlukan pengambilan presisi di seluruh dokumen besar
Alur kerja coding agentic di mana keandalan adalah hal utama
Analisis hukum, ilmiah, atau keuangan yang menuntut akurasi tertinggi

Pilih Sonnet 4.6 jika Anda membutuhkan:

Coding dan penalaran yang kuat dengan biaya lebih rendah
Penggunaan komputer dan tugas agentic (performa hampir identik dengan Opus)
Keseimbangan yang baik antara kemampuan dan kecepatan
Beban kerja bervolume tinggi di mana penghematan biaya 40% terasa signifikan

Pilih Haiku 4.5 jika Anda membutuhkan:

Tugas cepat dan ringan seperti klasifikasi, peringkasan, atau tanya jawab sederhana
Aplikasi yang sensitif terhadap anggaran dalam skala besar

Apa Artinya Ini bagi Para Developer

Generasi 4.6 mewakili pergeseran dalam cara developer dapat membangun dengan Claude:

Alur kerja agentic kini menjadi praktis. Pemikiran terselingi dan penggunaan alat yang ditingkatkan berarti Claude dapat menangani tugas kompleks multi-langkah dengan jauh lebih sedikit kesalahan. Skor Terminal-Bench dan OSWorld mengkonfirmasi hal ini.
Konteks bukan lagi hambatan. Dengan 1 Juta token pada harga standar dan pemadatan konteks otomatis, Anda dapat membangun aplikasi yang bernalar atas seluruh repositori, koleksi dokumen, atau riwayat percakapan.
Tingkat nilai sangat kuat. Sonnet 4.6 berperforma dalam 1-2% dari Opus pada sebagian besar benchmark coding dan penggunaan komputer. Untuk banyak beban kerja produksi, ini adalah default yang cerdas.
Pemikiran adaptif menyederhanakan integrasi. Alih-alih menyetel anggaran pemikiran per tugas, Anda menetapkan tingkat upaya dan membiarkan model menangani sisanya. Ini mengurangi overhead rekayasa prompt dan membuat performa lebih konsisten.

Kesimpulan

Claude Opus 4.6 dan Sonnet 4.6 menghadirkan lompatan kemampuan terbesar dalam satu generasi Claude. Jendela konteks 1 Juta token, pemikiran adaptif, dan penalaran terselingi bukan sekadar peningkatan di atas kertas — mereka secara fundamental mengubah apa yang dapat Anda bangun.

Opus 4.6 menetapkan benchmark baru di semua bidang. Sonnet 4.6 mendekatinya dengan luar biasa pada 60% dari harganya. Dan dengan Haiku 4.5 yang masih tersedia untuk tugas-tugas ringan, jajaran lengkap Claude mencakup setiap kasus penggunaan dari anggaran hingga frontier.

Model-model ini kini tersedia melalui Claude API, claude.ai, dan platform mitra termasuk Amazon Bedrock dan Google Cloud Vertex AI.

Claude Opus 4.6: Claude Paling Canggih yang Pernah Ada

Jendela Konteks 1 Juta Token dengan Harga Standar

128K Token Output

Pemikiran Adaptif

Pemikiran Terselingi

Pemadatan Konteks

Claude Sonnet 4.6: Menutup Kesenjangan

Sorotan Benchmark

Harga

Kapan Menggunakan Model Mana

Apa Artinya Ini bagi Para Developer

Kesimpulan

Artikel Terkait

GLM-5.1 vs Claude, GPT, Gemini, DeepSeek: Bagaimana Model Terbaru Zhipu AI Bersaing

Memperkenalkan Phota Edit di WaveSpeedAI

Memperkenalkan Phota Enhance di WaveSpeedAI

Memperkenalkan Phota Text-to-Image di WaveSpeedAI

Claude Mythos (Opus 5) Bocor: Apa yang Kita Ketahui Sejauh Ini

Suno vs MiniMax Music vs Google Lyria 3: Perbandingan Pembuatan Musik AI