Claude Fable 5 Telah Dirilis: 80,3% di SWE-Bench Pro, Harga 2× Opus 4.8, Gratis Hingga 22 Juni

Anthropic hari ini meluncurkan model kelas Mythos pertama yang tersedia untuk umum. Claude Fable 5 telah tersedia secara umum di Claude API, AWS Bedrock, Vertex AI, dan Microsoft Foundry pada 9 Juni 2026 — berpasangan dengan Claude Mythos 5, model dasar yang sama namun dengan pengaman yang dinonaktifkan, yang disimpan di dalam program mitra Project Glasswing. Harga keduanya ditetapkan di $10 input / $50 output per 1 juta token — tepatnya 2× tarif Claude Opus 4.8.

Namun bagian yang menarik bukan ada di judul utama. Di balik angka-angka peluncuran, terdapat perubahan harga yang signifikan (gratis di Pro/Max hingga 22 Juni, lalu ditagih berdasarkan kredit), profil benchmark mutakhir yang benar-benar memisahkan Fable 5 dari batas sebelumnya, dan pilihan arsitektur baru — pengaman pengklasifikasi otomatis yang jatuh kembali ke Opus 4.8 daripada menolak — yang secara material memengaruhi cara model ini di-deploy.

Yang diluncurkan

Detail	Nilai
Nama model	Claude Fable 5 (publik) + Claude Mythos 5 (terbatas)
ID model API	`claude-fable-5`
Harga input	$10/1 juta token
Harga output	$50/1 juta token
vs harga Opus 4.8	2× ($5/$25)
Ketersediaan	Claude API, AWS Bedrock, Vertex AI, Microsoft Foundry
Akses langganan	Pro / Max / Team / Enterprise — gratis hingga 22 Juni 2026
Setelah 22 Juni	Memerlukan kredit penggunaan tambahan di atas langganan
Akses Mythos 5	Hanya mitra Project Glasswing; peneliti biologi melalui program trusted-access

Dua catatan harga yang perlu diperhatikan:

Jendela gratis 13 hari adalah tuas peluncuran. Anthropic menggunakan bundel langganan untuk mendorong adopsi selama dua minggu pertama. Setelah 22 Juni, model yang sama di Pro/Max memerlukan pembelian kredit eksplisit, yang mengembalikan pengguna produksi ke perhitungan tagihan per-token pada tarif utama $10/$50.
Harga 2× Opus 4.8 cukup mahal, namun kesenjangan benchmark menjelaskan sebagian besarnya (lihat di bawah). Pada $50/1 juta output, Fable adalah model frontier paling mahal di pasaran — sekitar 3,3× Sonnet 4.6, 5× GPT-5.5, dan 5,5× Gemini 3.5 Flash pada token output.

Benchmark — dan apa yang sebenarnya ditunjukkannya

Fable 5 diluncurkan dengan klaim mutakhir pada “hampir semua benchmark yang diuji.” Angka-angka yang diterbitkan Anthropic yang paling konkret dan dapat dibandingkan secara langsung:

Benchmark	Fable 5	Opus 4.8	GPT-5.5	Gemini 3.1 Pro
SWE-Bench Pro	80,3%	69,2%	58,6%	54,2%
FrontierCode	29,3%	13,4%	5,7%	—

Tiga interpretasi:

80,3% pada SWE-Bench Pro adalah angka paling krusial. Ini adalah varian SWE-Bench yang paling sulit dan yang paling prediktif tentang bagaimana kinerja model pada kode produksi nyata. Fable 5 unggul atas Opus 4.8 sebesar 11,1 poin, atas GPT-5.5 sebesar 21,7 poin, dan atas Gemini 3.1 Pro sebesar 26,1 poin. Itu adalah kesenjangan tingkat, bukan keunggulan marginal. Untuk alur kerja coding di mana Anda membandingkan kualitas model secara langsung, ini adalah keunggulan frontier satu-sumbu terbesar yang dilaporkan tahun ini.

FrontierCode adalah angka yang lebih informatif. Benchmark ini menargetkan tingkat masalah pemrograman tersulit — teka-teki algoritmik abstrak, pekerjaan struktur data baru, optimasi kritis performa. Fable 5 pada 29,3% lebih dari 2× Opus 4.8 dan lebih dari 5× GPT-5.5. Pada benchmark di mana batas frontier sekitar 30%, lompatan semacam ini adalah bukti terdekat perubahan kemampuan signifikan yang dapat diberikan data benchmark.

Studi kasus Anthropic mendukung angka-angka tersebut. Stripe dilaporkan menggunakan Fable 5 untuk menyelesaikan migrasi basis kode 50 juta baris dalam satu hari. Hebbia melaporkan Fable 5 sebagai penykor tertinggi pada Finance Benchmark-nya. IMC mengatakan “hampir lulus semua evaluasi analisis perdagangan mereka.” Ini adalah testimoni ramah pihak pertama, namun konsistensi framing “pekerjaan pengetahuan kode/keuangan/sains” di beberapa pelanggan independen adalah sinyal yang layak dipertimbangkan.

Yang tidak ada dalam rilis benchmark: angka Terminal-Bench, GPQA, MMLU, HumanEval, AIME. Anthropic tampaknya telah memprioritaskan SWE-Bench Pro dan FrontierCode sebagai metrik coding utama, yang konsisten dengan framing model sebagai frontier rekayasa perangkat lunak.

Pengaman — pilihan arsitektur yang berbeda

Alasan Fable 5 bisa diluncurkan secara publik adalah tiga pengaman pengklasifikasi otomatis yang dibangun Anthropic di atas Mythos 5:

Keamanan siber — memblokir tugas siber ofensif dan pengembangan eksploit
Biologi/Kimia — jatuh kembali ke Opus 4.8 pada sebagian besar permintaan bio/kimia dengan risiko dual-use (secara khusus termasuk desain AAV)
Pencegahan distilasi — memblokir upaya mengekstrak kemampuan untuk model pesaing

Pilihan arsitektur yang penting: ketika pengaman dipicu, respons ditangani oleh Opus 4.8 daripada ditolak. Itu adalah pilihan UX yang bermakna. Pengguna mendapatkan jawaban yang dapat digunakan untuk sebagian besar kueri bahkan ketika penalaran frontier Fable 5 dibatasi oleh tinjauan keamanan. Anthropic melaporkan lebih dari 95% sesi Fable tidak melibatkan fallback sama sekali — artinya pengaman dikalibrasi cukup ketat sehingga alur kerja produksi sebagian besar tidak menyadarinya.

Hasil red-teaming eksternal:

1.000+ jam pengujian bug bounty eksternal — tidak ditemukan jailbreak universal
Nol permintaan keamanan siber berbahaya satu giliran yang dipatuhi di 30 teknik jailbreak publik
Seorang red-teamer eksternal menyebut pengaman tersebut “paling robust dari model mana pun yang pernah diuji”

Bagi pengembang yang men-deploy aplikasi menghadap pelanggan, ini adalah postur operasional yang berbeda dari menolak-saat-kebijakan-dipicu. Anda dapat membangun produk di sekitar model tanpa merancang fallback UX untuk setiap penolakan keamanan — Opus 4.8 menangani ekor panjang secara tak terlihat.

Mythos 5 — dan apa yang keberadaannya implikasikan

Model yang sama dengan pengaman dinonaktifkan dikirimkan sebagai Mythos 5, terbatas pada mitra keamanan siber Project Glasswing dan berkembang melalui program trusted-access untuk peneliti biologi. Kesenjangan kemampuan antara Fable 5 dan Mythos 5 terkonsentrasi dalam tiga kategori:

ExploitBench (siber): Mythos 5 pada 78% vs 40% Opus 4.8 (Fable 5 tidak menjalankan benchmark ini karena prompt siber memicu pengaman)
Desain obat: Mythos 5 dilaporkan mempercepat proses desain protein ~10×, dengan 9 dari 14 target menghasilkan kandidat obat
Pembangkitan hipotesis ilmiah: hipotesis biologi molekuler baru disukai ~80% waktu dalam perbandingan ahli buta

Keberadaan Mythos 5 memberi tahu Anda bahwa model dasar memiliki kemampuan yang secara material lebih kuat dari apa yang diekspos Fable 5. Untuk sebagian besar alur kerja produksi, hal itu tidak terlihat — tetapi untuk penelitian keamanan, penemuan obat, dan domain serupa, cabang Mythos adalah tempat batas frontier sebenarnya berada. Akses publik dibatasi secara khusus karena Anthropic menyimpulkan model mentah memiliki risiko dual-use yang menjadi alasan keberadaan pengaman pengklasifikasi.

Apa yang diungkapkan oleh kepatahan pola Sonnet

Dua minggu lalu saya berpendapat bahwa pola historis Anthropic dalam memasangkan versi minor Opus dan Sonnet membuat rilis Sonnet 4.7 lebih mungkin daripada Sonnet 4.8. Polanya patah lebih keras dari yang saya perkirakan: tidak ada Sonnet 4.7, tidak ada Sonnet 4.8, dan sekarang cabang Mythos menjadi rilis utama. Opus 4.8 dikirimkan untuk mengisi slot tingkat Pro; Fable 5 menempati tingkat baru sepenuhnya di atasnya.

Tiga interpretasi tentang apa artinya ini bagi jajaran Claude ke depan:

Cabang Mythos adalah frontier baru, dengan Sonnet dan Opus sebagai pilihan tingkat produksi di bawahnya. Batas kemampuan telah terlihat meningkat.
Penamaan telah terlepas dari versioning. Ke depannya, harapkan lebih banyak cabang bernama (Mythos, Fable) dan lebih sedikit tiga serangkai Opus/Sonnet/Haiku. Pendekatan string-in-source-map untuk memprediksi rilis model sudah mati.
Pemisahan tingkat harga semakin melebar. Fable 5 pada $10/$50 adalah 2× Opus 4.8, yang sudah 5× Haiku 4.5. Biaya kemampuan frontier meningkat lebih cepat dari biaya kemampuan tingkat produksi — artinya keputusan routing lebih penting dari sebelumnya.

Di mana Fable 5 cocok dalam produksi hari ini

Bacaan deployment yang konkret:

Gunakan Fable 5 untuk:

Alur kerja berat-kode di mana kinerja SWE-Bench Pro benar-benar penting — migrasi skala besar, pekerjaan algoritma baru, refaktor kritis performa. Keunggulan 11 poin atas Opus 4.8 diterjemahkan menjadi output yang lebih baik secara terukur pada basis kode nyata.
Pekerjaan pengetahuan kaya-visi — mengekstrak data terstruktur dari gambar ilmiah, membangun ulang aplikasi web dari tangkapan layar, memproses dokumentasi teknis dengan diagram tertanam.
Penalaran konteks panjang — framing Anthropic menekankan “mempertahankan fokus di seluruh jutaan token,” yang menunjukkan kurva degradasi model pada ujung konteks 1 juta+ token secara bermakna lebih baik dari frontier sebelumnya.
Analisis keuangan/perdagangan — benchmark independen (Hebbia) menempatkan Fable 5 di puncak evaluasi spesifik keuangan.

Tetap pada alternatif yang lebih murah untuk:

Generasi volume tinggi / taruhan rendah — pada $50/1 juta output, Fable 5 tidak ekonomis untuk generasi konten, klasifikasi, atau ekstraksi terstruktur. Sonnet 4.6 atau Gemini 3.5 Flash melakukan pekerjaan ini dengan ~10% dari harga.
Alur kerja agen terorkestrasi MCP / alat — Gemini 3.5 Flash saat ini memimpin MCP Atlas dan Toolathlon dengan sebagian kecil biaya. Kekuatan coding Fable tidak secara otomatis diterjemahkan menjadi kekuatan orkestrasi agen.
Kueri siber atau bio di mana Fable akan jatuh kembali — Anda membayar harga Fable untuk output Opus 4.8. Cukup gunakan Opus 4.8 secara langsung.

Cara mengakses Claude Fable 5 hari ini

Tiga jalur deployment:

Langsung melalui Anthropic — claude-fable-5 sudah aktif di Claude API dan di AWS Bedrock, Vertex AI, dan Microsoft Foundry. Gratis di paket Pro/Max hingga 22 Juni; tagihan per-token dimulai setelahnya pada $10/$50.
Melalui endpoint LLM WaveSpeedAI — akses kompatibel OpenAI ke model teks frontier saat ini di balik satu kunci API. Ketika Fable 5 menyebar melalui platform, Anda akan dapat melakukan A/B-test terhadap Opus 4.8, Sonnet 4.6, GPT-5.5, dan Gemini 3.5 Flash di bawah permukaan yang sama tanpa memutar kredensial penyedia.
Melalui router penyedia — jika Anda menggunakan agregator (Vercel AI SDK, LangChain, dll.), ID model claude-fable-5 sudah ada di registri model publik. Kebijakan routing untuk “gunakan Fable untuk tugas berat-SWE, Sonnet untuk yang lainnya” menjadi perubahan konfigurasi satu baris.

Yang perlu diperhatikan dalam dua minggu ke depan

Tiga sinyal:

Transisi harga 22 Juni. Ketika jendela gratis Pro/Max berakhir, sinyal adopsi publik menjadi berapa banyak pelanggan yang benar-benar membayar lebih untuk Fable 5. Itu adalah bacaan paling jelas tentang apakah harga 2× Opus 4.8 berkelanjutan untuk ekor panjang kasus penggunaan.
Replikasi benchmark independen. Angka SWE-Bench Pro dan FrontierCode Anthropic adalah pihak pertama. Perhatikan replikasi oleh suite benchmark independen — dan bukti apakah keunggulan 11 poin atas Opus 4.8 bertahan di luar set uji yang dikurasi Anthropic.
Rilis Sonnet berikutnya. Dengan Mythos sebagai cabang frontier baru, apa yang terjadi pada Sonnet? Sonnet yang diperbarui diposisikan melawan Gemini 3.5 Flash pada benchmark biaya/agen akan mengangkur kembali tingkat nilai jajaran Claude. Keheningan tentang Sonnet akan menandakan Anthropic membiarkan tingkat produksi bertahan di 4.6 lebih lama dari yang disarankan kadenza historis.

Hingga saat itu: Fable 5 adalah batas baru, Opus 4.8 adalah default tingkat produksi, dan Sonnet 4.6 tetap menjadi pilihan nilai. Dua minggu ke depan akan memberi tahu Anda apakah cabang Mythos adalah frontier satu kali atau normal baru untuk kadenza rilis Anthropic.

Yang diluncurkan

Benchmark — dan apa yang sebenarnya ditunjukkannya

Pengaman — pilihan arsitektur yang berbeda

Mythos 5 — dan apa yang keberadaannya implikasikan

Apa yang diungkapkan oleh kepatahan pola Sonnet

Di mana Fable 5 cocok dalam produksi hari ini

Gunakan Fable 5 untuk:

Tetap pada alternatif yang lebih murah untuk:

Cara mengakses Claude Fable 5 hari ini

Yang perlu diperhatikan dalam dua minggu ke depan

Artikel Terkait

Claude Sonnet 4.8: Apa yang Sebenarnya Dikatakan Kebocoran Itu, dan Mengapa Polanya Tidak Cocok

Gemini 3.5 Flash Diluncurkan — Model Tier Flash Kini Memimpin Tier Pro di Benchmark Agen

Gemini 3.5 Pro Hadir Bulan Depan — Apa yang Sudah Diungkap oleh Rilis Flash

Gemini 4.0 di Google I/O 2026: Yang Dikonfirmasi, Yang Bersumber Anonim, dan Yang Perlu Diperhatikan para Developer

Seedance 2.1 dan Seedance 2.0 Mini Segera Hadir: Peningkatan Kualitas, Harga Lebih Terjangkau

GPT-5.6 Baru Saja Muncul di Log Codex OpenAI — Ini Artinya Apa