← Blog

Claude Opus 4.6 dan Sonnet 4.6: Semua yang Perlu Anda Ketahui

Tinjauan mendalam tentang Claude Opus 4.6 dan Sonnet 4.6 dari Anthropic — model Claude paling canggih hingga saat ini, dilengkapi dengan jendela konteks 1 juta token, pemikiran adaptif, dan tolok ukur terdepan di industri.

6 min read

Anthropic kembali menaikkan standar. Dengan peluncuran Claude Opus 4.6 (5 Februari 2026) dan Claude Sonnet 4.6 (17 Februari 2026), keluarga model Claude menghadirkan peningkatan besar dalam coding, alur kerja agentic, penalaran konteks panjang, dan penggunaan komputer — semuanya dengan harga yang tidak berubah dari generasi sebelumnya.

Berikut ini yang membuat generasi 4.6 menjadi lompatan signifikan ke depan.

Claude Opus 4.6: Claude Paling Canggih yang Pernah Ada

Opus 4.6 adalah model unggulan Anthropic, dirancang untuk tugas-tugas paling menuntut dalam coding, riset, dan penalaran kompleks.

Jendela Konteks 1 Juta Token dengan Harga Standar

Untuk pertama kalinya, model kelas Opus hadir dengan jendela konteks 1 juta token — dan tidak ada biaya tambahan untuk konteks panjang. Ini berarti Anda dapat memasukkan seluruh basis kode, dokumen hukum yang panjang, atau kumpulan data besar ke dalam satu prompt tanpa khawatir tentang biaya tambahan.

128K Token Output

Opus 4.6 menggandakan output maksimum dari 64K menjadi 128K token, menjadikannya jauh lebih praktis untuk menghasilkan konten berformat panjang, kode terperinci, atau analisis komprehensif dalam satu respons.

Pemikiran Adaptif

Masa-masa menyetel anggaran extended thinking secara manual sudah berlalu. Opus 4.6 memperkenalkan pemikiran adaptif, di mana Claude secara dinamis memutuskan kapan dan seberapa dalam untuk bernalar. Anda dapat menetapkan salah satu dari empat tingkat upaya — rendah, sedang, tinggi (default), atau maksimum — dan biarkan model mengalokasikan anggaran penalarannya sesuai.

Pemikiran Terselingi

Dalam alur kerja agentic, Claude kini dapat berpikir di antara pemanggilan alat. Alih-alih merencanakan segalanya di awal lalu mengeksekusi, model bernalar di setiap langkah, menyesuaikan pendekatannya berdasarkan hasil antara. Ini membuat tugas multi-langkah jauh lebih andal.

Pemadatan Konteks

Ketika percakapan mendekati batas konteks, Opus 4.6 secara otomatis merangkum dan menggantikan konteks yang lebih lama alih-alih memotongnya begitu saja. Ini memungkinkan interaksi yang lebih panjang dan berkelanjutan — sangat berharga untuk sesi coding, debugging, dan alur kerja riset yang mencakup banyak giliran.

Claude Sonnet 4.6: Menutup Kesenjangan

Sonnet 4.6 kini menjadi model default untuk pengguna Free dan Pro di claude.ai. Yang luar biasa dari rilis ini adalah seberapa dekat Sonnet mendekati performa level Opus — kesenjangan antara keduanya adalah yang tersempit yang pernah ada.

Sonnet 4.6 berbagi peningkatan inti yang sama: jendela konteks 1 Juta token, pemikiran adaptif, extended thinking, dan pemikiran terselingi. Semua dengan harga yang jauh lebih terjangkau.

Sorotan Benchmark

Angka-angkanya bercerita secara meyakinkan:

BenchmarkOpus 4.6Sonnet 4.6
SWE-bench Verified (isu GitHub nyata)~80,8%79,6%
OSWorld-Verified (penggunaan komputer)72,7%72,5%
Terminal-Bench 2.0 (coding agentic)#1 keseluruhan59,1%
Humanity’s Last Exam#1 keseluruhan
ARC-AGI-258,3% (peningkatan 4,3x)
BigLaw Bench (penalaran hukum)90,2%
MRCR v2 8-needle @ 1M (konteks panjang)76%

Beberapa hal yang patut diperhatikan:

  • SWE-bench Verified: Sonnet 4.6 meraih skor 79,6%, hampir menyamai Opus di 80,8%. Untuk sebagian besar tugas coding, perbedaannya dapat diabaikan.
  • OSWorld: Kedua model meraih skor di atas 72% pada penggunaan komputer otonom — lompatan besar dari generasi sebelumnya dan jauh melampaui model pesaing.
  • ARC-AGI-2: Sonnet 4.6 melompat dari 13,6% ke 58,3%, sebuah peningkatan 4,3x — peningkatan satu generasi terbesar dalam sejarah Claude.
  • Pengambilan konteks panjang: Opus 4.6 meraih skor 76% pada tugas pengambilan 8-needle di konteks 1 Juta token, dibandingkan hanya 18,5% untuk Sonnet 4.5. Peningkatan 4x dalam menemukan informasi yang terkubur jauh di dalam dokumen panjang.

Harga

Kedua model mempertahankan harga yang sama dengan pendahulu 4.5 mereka:

ModelInput (per 1 Juta token)Output (per 1 Juta token)
Opus 4.6$5$25
Sonnet 4.6$3$15
Haiku 4.5$1$5

Jendela konteks 1 Juta token tersedia dengan harga standar untuk Opus maupun Sonnet — tidak ada tingkatan premium atau biaya tambahan.

Kapan Menggunakan Model Mana

Pilih Opus 4.6 jika Anda membutuhkan:

  • Akurasi maksimum pada penalaran kompleks multi-langkah
  • Tugas konteks panjang yang memerlukan pengambilan presisi di seluruh dokumen besar
  • Alur kerja coding agentic di mana keandalan adalah hal utama
  • Analisis hukum, ilmiah, atau keuangan yang menuntut akurasi tertinggi

Pilih Sonnet 4.6 jika Anda membutuhkan:

  • Coding dan penalaran yang kuat dengan biaya lebih rendah
  • Penggunaan komputer dan tugas agentic (performa hampir identik dengan Opus)
  • Keseimbangan yang baik antara kemampuan dan kecepatan
  • Beban kerja bervolume tinggi di mana penghematan biaya 40% terasa signifikan

Pilih Haiku 4.5 jika Anda membutuhkan:

  • Tugas cepat dan ringan seperti klasifikasi, peringkasan, atau tanya jawab sederhana
  • Aplikasi yang sensitif terhadap anggaran dalam skala besar

Apa Artinya Ini bagi Para Developer

Generasi 4.6 mewakili pergeseran dalam cara developer dapat membangun dengan Claude:

  1. Alur kerja agentic kini menjadi praktis. Pemikiran terselingi dan penggunaan alat yang ditingkatkan berarti Claude dapat menangani tugas kompleks multi-langkah dengan jauh lebih sedikit kesalahan. Skor Terminal-Bench dan OSWorld mengkonfirmasi hal ini.

  2. Konteks bukan lagi hambatan. Dengan 1 Juta token pada harga standar dan pemadatan konteks otomatis, Anda dapat membangun aplikasi yang bernalar atas seluruh repositori, koleksi dokumen, atau riwayat percakapan.

  3. Tingkat nilai sangat kuat. Sonnet 4.6 berperforma dalam 1-2% dari Opus pada sebagian besar benchmark coding dan penggunaan komputer. Untuk banyak beban kerja produksi, ini adalah default yang cerdas.

  4. Pemikiran adaptif menyederhanakan integrasi. Alih-alih menyetel anggaran pemikiran per tugas, Anda menetapkan tingkat upaya dan membiarkan model menangani sisanya. Ini mengurangi overhead rekayasa prompt dan membuat performa lebih konsisten.

Kesimpulan

Claude Opus 4.6 dan Sonnet 4.6 menghadirkan lompatan kemampuan terbesar dalam satu generasi Claude. Jendela konteks 1 Juta token, pemikiran adaptif, dan penalaran terselingi bukan sekadar peningkatan di atas kertas — mereka secara fundamental mengubah apa yang dapat Anda bangun.

Opus 4.6 menetapkan benchmark baru di semua bidang. Sonnet 4.6 mendekatinya dengan luar biasa pada 60% dari harganya. Dan dengan Haiku 4.5 yang masih tersedia untuk tugas-tugas ringan, jajaran lengkap Claude mencakup setiap kasus penggunaan dari anggaran hingga frontier.

Model-model ini kini tersedia melalui Claude API, claude.ai, dan platform mitra termasuk Amazon Bedrock dan Google Cloud Vertex AI.