Apa itu Z-Image-Base? Kontrol CFG Lengkap vs Kecepatan Turbo

Let me translate this article to Indonesian for you.

Halo, saya Dora. Akhir-akhir ini saya terganggu oleh sebuah masalah kecil. Saya ingin grafis banner saya berhenti keluar sedikit… kurang tepat. Warna akan bergeser. Wajah terlihat tidak alami. Dan ketika saya mencoba memperbaiki satu hal, hal lain akan berubah. Gesekan kecil yang akhirnya membuat saya frustrasi adalah: saya tidak bisa menyesuaikan hasil tanpa merusak seluruh keseimbangan gambar.

Jadi, minggu lalu dan lagi Senin pagi ini (Februari 2026), saya mencoba Z-Image-Base bersama kakak yang lebih cepat, Z-Image-Turbo. Saya tidak mengejar kecepatan. Saya menginginkan kontrol yang lebih stabil, prompt yang berperilaku baik, penyesuaian yang konsisten, dan lebih sedikit kebingungan antara pengujian.

Apa itu Z-Image-Base?

Z-Image-Base adalah model generasi gambar dengan 6B parameter yang cenderung menekankan kontrol dan prediktabilitas daripada kecepatan murni. Jika Turbo terasa seperti sprint, Base terasa seperti jalan yang stabil dengan peta. Model ini menyediakan lebih banyak kontrol yang benar-benar penting ketika Anda mencoba mencocokkan referensi, menjaga konsistensi warna merek, atau mengiterasi satu konsep visual tanpa kehilangan alur.

Ikhtisar Arsitektur Parameter 6B

Saya tidak di sini untuk memuja jumlah parameter, tetapi tanda 6B menunjukkan sesuatu yang sederhana: kapasitas yang cukup untuk mempertahankan gaya dan struktur tanpa runtuh karena perubahan kecil. Dalam praktik, saya memperhatikan dua hal saat pengujian pada 2-3 Februari 2026:

Pengeditan bertumpuk lebih bersih. Mengubah suhu warna atau pencahayaan tidak menghapus komposisi sesering sebelumnya.
Seed berperilaku lebih dapat diprediksi antar pengujian. Ketika saya mengunci seed dan menyesuaikan kekuatan panduan, adegan berkembang daripada direset.

Ini masih merupakan pengalaman gaya difusi di baliknya: skala panduan, jadwal kebisingan, dan tarian biasa langkah-langkah dan seed. Jika Anda peduli tentang teorinya, di sinilah classifier-free guidance memainkan peran. Tetapi apa yang penting bagi saya adalah ini: perubahan prompt kecil saya terasa sebanding dengan hasil.

Perbedaan Utama vs Z-Image-Turbo

Turbo lebih murah dan cepat. Ini bagus untuk penjelajahan konsep cepat, thumbnail, mood board, draf media sosial. Tetapi saya terus menghadapi dinding yang sama: begitu saya menyukai sesuatu, mendapatkan variasi yang tepat (nada lebih hangat, bayangan lebih lembut, potongan sedikit lebih ketat) membutuhkan waktu lebih lama dari yang seharusnya.

Base memberi saya kontrol yang lebih halus. Prompt negatif berpegang lebih baik, gambar referensi memiliki daya tarik lebih ketika saya memintanya, dan penyesuaian CFG terasa linear daripada melompat-lompat. Pengujian lebih lambat dan mengorbankan biaya per gambar, ya, tetapi lebih sedikit pengulangan menebus hal itu dalam tugas apa pun di mana kesetiaan penting.

Kemampuan Inti Z-Image-Base

Ini bukan fitur poin-peluru untuk diingat. Ini adalah tuas yang saya temukan diri saya menggunakan, dan apa yang berubah ketika saya melakukannya.

Dukungan CFG Penuh

Dengan Base, panduan berperilaku seperti dimmer, bukan saklar lampu. CFG yang lebih rendah membiarkan model menjelajahi, berguna ketika prompt terasa terlalu kaku. CFG yang lebih tinggi mendekatkan gambar ke teks, tetapi tanpa tampilan rapuh, over-contrast yang terkadang saya lihat dalam model yang lebih kecil atau over-tuned.

Dalam satu pass nyata: saya menghasilkan serangkaian header artikel (“ruang kerja yang tenang, palet teredam, cahaya alami, kekacauan minimal”). Pada CFG 4-5, saya mendapatkan hasil lembut dan atmosferik, bagus, tetapi samar. Pada 7-8, komposisi terkunci: meja, cahaya jendela, garis bersih. Di atas 10, detail mulai menyesuaikan berlebihan (tepi kasar, cahaya kurang organik). Titik manis saya terletak sekitar 7,5 untuk gaya ini.

Kontrol Prompt Negatif

Di sinilah Base mendapatkan kepercayaan saya. Ketika saya meminta “tidak ada lens flare, tidak ada pantulan mengkilap, tidak ada sudut miring,” model benar-benar mundur. Dengan Turbo, catatan tersebut terkadang diabaikan jika prompt utama cenderung sinematik.

Contoh kecil: untuk mockup shot produk, “tidak ada sorotan spekular” ditambah “finishing matte” menghasilkan permukaan konsisten di 6 dari 8 pengujian. Tidak sempurna, tetapi konsisten cukup sehingga saya tidak mengoreksi tangan setiap rendering. Beban mental turun, lebih sedikit koreksi mikro.

Panduan Gambar Referensi

Saya menggunakan dua referensi: kartu warna merek dan frame tata letak dari desain masa lalu. Base menghormati keduanya lebih kuat ketika saya menetapkan bobot referensi lebih tinggi. Warna tetap berada dalam jangkauan yang cocok dengan palet (tidak tepat, tetapi cukup dekat sehingga saya tidak perlu mengecat ulang), dan komposisi tetap dalam frame tanpa terasa kaku.

Ada pertukaran. Dorong bobot referensi terlalu jauh dan Anda mendapatkan gema basi dari sumber. Pertahankan tingkat moderat dan Anda mendapatkan kontinuitas tanpa kloning. Bagi saya, 0,35-0,55 terasa tepat ketika saya membutuhkan konsistensi merek: 0,15-0,25 ketika saya hanya menginginkan dorongan.

Penyesuaian Parameter Kekuatan

Sebut saja kekuatan denoise, kekuatan image-to-image, atau hanya “berapa banyak yang harus kita ubah?”, tombol itu penting. Dengan Base, edit kekuatan sedang (sekitar 0,45-0,6 dalam pengujian saya) mempertahankan tata letak sambil membiarkan gaya berkembang. Itu ideal untuk “adegan sama, suasana berbeda.”

Dua pengujian yang menonjol:

Saya melembutkan pencahayaan siang hari menjadi kehangatan sore hari tanpa kehilangan penempatan objek. Satu gerakan slider, satu pengujian, selesai.
Saya menukar latar belakang bertekstur dengan latar belakang datar sambil menjaga topeng subjek cukup utuh sehingga saya tidak perlu memotret ulang siluet.

Ini tidak menghemat waktu saya pada awalnya, saya mengotak-atik. Tetapi setelah beberapa pass, saya perhatikan itu mengurangi pengulangan dan mengurangi usaha mental. Model mengubah apa yang saya minta, dan meninggalkan sisanya saja.

Kapan Memilih Base vs Turbo

Saya terus beralih di antara keduanya selama sehari untuk merasakan perbedaannya. Pilihannya bukan filosofis: praktis.

Pilih Base: Ketika Kontrol Granular Penting

Anda mencocokkan palet merek atau tata letak berulang dan penyimpangan kecil adalah biaya.
Anda membutuhkan prompt negatif untuk menempel (tidak ada pantulan mengkilap, tidak ada kedalaman bidang ekstrem, tidak ada cakrawala miring) karena waktu pembersihan bertambah.
Anda mengiterasi satu konsep selama beberapa pengujian dan tidak ingin mengatur ulang komposisi setiap kali Anda menyesuaikan pencahayaan atau warna.

Base tidak membuat gambar “lebih baik” dengan sendirinya. Ini membuat koreksi tetap. Itu yang menang.

Pilih Turbo: Ketika Kecepatan Adalah Prioritas

Anda menjelajahi arah, menghasilkan banyak opsi, atau storyboarding dengan cepat.
Anda baik-baik saja dengan kekasaran dan berencana untuk memoles subset kecil kemudian.
Biaya adalah faktor dan Anda ingin melempar jaringan lebar terlebih dahulu.

Pola saya sekarang: mulai di Turbo untuk memetakan ruang, pindah ke Base setelah saya menentukan arah yang layak dipertahankan. Ini adalah sistem dua gigi yang terasa masuk akal.

Perbandingan Harga

Harga berubah, tetapi inilah yang saya kerjakan selama pengujian di awal Februari 2026.

Base: $0,01/gambar

Dengan satu sen per gambar, Base tidak mahal, tetapi juga bukan murahan yang dapat dibuang. Jika Anda mengiterasi secara mendalam pada satu visual, katakanlah 20-40 pengujian, kontrol ekstra sering membayar sendiri dalam lebih sedikit pengulangan di hilir (lebih sedikit pengeditan manual, lebih sedikit restart).

Turbo: $0,005/gambar

Setengah harganya dan jauh lebih cepat. Bagus untuk menghasilkan 50-100 draf kasar untuk menemukan arah. Jika alur kerja Anda adalah “brainstorm luas, refine sempit,” Turbo membuat fase pertama terjangkau.

Mulai Cepat

Jika Anda penasaran dan ingin merasakan perbedaannya tanpa membaca doc, ini adalah jalan yang saya ambil.

Pilih satu prompt yang terpusat. Sesuatu yang akrab, seperti “adegan meja dengan cahaya lembut, warna teredam, kayu alami, tanpa kekacauan.”
Jalankan 6-8 gambar di Turbo. Catat satu yang benar-benar akan Anda gunakan.
Beralih ke Base dengan seed yang sama (atau seed yang dekat). Atur CFG 7-8.
Tambahkan prompt negatif yang penting bagi Anda (tidak ada bayangan kasar, tidak ada lens flare, tidak ada sudut miring).
Jika Anda memiliki referensi, palet atau tata letak, terapkan dengan bobot sedang (0,3-0,5).
Gunakan strength ~0,5 untuk variasi pertama. Dorong naik atau turun dalam langkah kecil.
Simpan apa yang meningkatkan. Batalkan apa yang melawan Anda. Jangan mengejar kesempurnaan: kejar pengulangan.

Ini berhasil untuk saya, hasil Anda mungkin berbeda. Perbedaannya muncul bukan dalam satu gambar “wow” tunggal, tetapi dalam bagaimana model merespons ketika saya meminta perbaikan kecil yang membosankan. Di situlah alat baik-baik umur atau menjadi bising.

Satu catatan terakhir: jika Anda bertanya-tanya “Apa itu Z-Image-Base” di luar spek, ini untuk saya, model yang membiarkan keputusan kecil menempel. Saya akan mengambil itu daripada kembang api setiap hari.