Panduan Pengaturan Z-Image CFG: Menghindari Masalah Over-Saturasi dan Overeksposur
Pengaturan optimal untuk Z-Image-Base CFG (guidance_scale): Rentang yang direkomendasikan adalah 3,5 hingga 6. CFG yang berlebihan menyebabkan masalah over-saturasi. Gaya yang berbeda memiliki nilai CFG yang direkomendasikan berbeda.
Minggu ini, saya terus mendapatkan gambar yang terasa agak… mencolok. Warnanya terlalu mencolok, sorotan cahaya meledak, dan nuansanya tidak sesuai dengan prompt saya, meski subjeknya sudah benar. Gesekan kecil itulah yang mendorong saya untuk duduk sambil minum kopi dan menjalankan serangkaian pengujian pada Z-Image-Base, prompt yang sama, seed yang sama, nilai CFG yang berbeda, hingga polanya terasa jelas di tangan saya.
Saya Dora. Panduan Pengaturan CFG Z-Image ini adalah hasil dari pengujian tersebut, ditambah catatan dari pengerjaan sebelumnya dengan model difusi. Saya tidak di sini untuk menjual pengaturan tertentu. Saya di sini untuk menunjukkan apa yang berubah bagi saya, mengapa hal itu kemungkinan terjadi, dan di mana sedikit penyesuaian bisa membuat pekerjaan terasa lebih ringan alih-alih lebih berisik.

Apa itu CFG
Pengaruh CFG pada pembuatan gambar
Classifier-Free Guidance (CFG) adalah kenop yang menentukan seberapa kuat model harus mengikuti prompt Anda versus prior yang telah dipelajarinya sendiri. CFG rendah membiarkan model berkelana; CFG tinggi menariknya lebih dekat ke kata-kata Anda. Dalam praktiknya, ini tidak semistis kedengarannya. Saya menganggapnya seperti sutradara yang memberikan arahan: “Lebih longgar” atau “tetap pada naskah.”
Ketika saya menyapu CFG dari 1 hingga 9 pada prompt yang identik (“cahaya pagi yang lembut, cangkir keramik di atas meja kayu, depth of field yang dangkal”), perubahannya konsisten:
- CFG Rendah (1–3): variasi yang lebih moody, kontras yang lebih lembut, tekstur yang lebih tak terduga. Terkadang cangkir berubah menjadi stoneware atau cahayanya lebih dingin. Bukan salah, hanya interpretatif.
- CFG Sedang (3,5–6): gambar menjadi stabil, komposisi terjaga, dan detail sesuai dengan prompt tanpa menjadi kaku. Di sinilah bahu saya terasa rileks.
- CFG Tinggi (7+): kepatuhan terhadap subjek tetap tinggi, tetapi saturasi warna dan mikro-kontras melonjak. Sorotan cahaya lebih sering terpotong. Terlihat mencolok pada pandangan pertama, lalu melelahkan.
Jika Anda menginginkan referensi formal, makalah asli Classifier-Free Guidance oleh Jonathan Ho dan Tim Salimans menjelaskan mekanismenya: CFG menskalakan perbedaan antara prediksi kondisional dan tanpa kondisi untuk menyeimbangkan fidelitas sampel dan keragaman.

Hubungan antara nilai CFG dan kepatuhan prompt
CFG yang lebih tinggi meningkatkan kepatuhan prompt, tetapi dengan trade-off:
- Ini tidak memperbaiki prompt yang samar. Prompt yang tidak jelas pada CFG 8 tetap tidak jelas, hanya lebih keras.
- Ini bisa memaksakan literalisme yang bertentangan dengan gaya. Pada panduan tinggi, saya melihat “glossy” muncul meski saya tidak memintanya, seperti model yang terlalu menekankan sesuatu.
- Ini berinteraksi dengan negative prompt. “Tidak ada sorotan yang meledak, tidak ada oversaturasi” sedikit meredam CFG tinggi, tetapi tidak sebaik sekadar menurunkan kenop.
Kesimpulan saya: gunakan CFG untuk “menyetel” prompt yang baik, bukan untuk menyelamatkan prompt yang lemah. Titik manis biasanya ada di mana kepatuhan meningkat tanpa warna dan pencahayaan menjadi dramatis.
Rentang CFG Z-Image-Base yang Direkomendasikan

CFG Rendah (1–3): Lebih acak, lebih kreatif
Ketika saya berada di CFG 2 pada Z-Image-Base, saya mendapatkan kelembutan yang menyenangkan, hampir seperti film. Tepinya kurang tegas, dan artefak kecil memudar menjadi grain alih-alih kilap plastik. Rentang ini membantu untuk:
- Adegan yang mengutamakan atmosfer: kabut, senja, bokeh, rendering bergaya cat air.
- Ideasi awal: saya menginginkan berbagai kemungkinan, bukan presisi. CFG rendah memberi saya tiga arah yang meyakinkan dari satu seed.
Batasan yang saya temui:
- Pergeseran komposisi: properti bergerak, pembingkaian berubah, tangan menjadi goyah.
- Detail spesifik prompt (merek, jumlah objek) meleset.
Jika Anda sedang membuat mood board atau menjelajahi bahasa visual, CFG rendah bersifat lembut dan generatif. Jika Anda sedang mengejar tenggat waktu untuk memenuhi brief, ini mungkin terlalu longgar.
CFG Sedang (3,5–6): Titik keseimbangan (direkomendasikan 4,5)
Ini adalah zona yang paling andal dalam pengujian saya. Pada 4,5, Z-Image-Base terasa kooperatif tanpa menjadi glossy. Beberapa catatan lapangan:
- Warna menjadi stabil. Warna kulit berhenti condong ke neon. Kayu terlihat seperti kayu, bukan pernis.
- Pencahayaan tetap ekspresif tetapi tidak meledak. Kemeja putih mempertahankan teksturnya.
- Prompt mempertahankan bentuknya: jika saya meminta “dua cangkir,” saya mendapatkan dua cangkir hampir setiap saat.
Mengapa saya merekomendasikan 4,5 sebagai titik awal:
- Ini menangkap maksud prompt sambil memberi ruang untuk gaya.
- Ini cocok dipadukan dengan negative prompt kecil (mis., “terlalu tersaturasi, kilap plastik”).
- Dalam enam seed per prompt, variasi tetap berguna, bukan kacau.
Kasus tepi:
- Render produk yang sangat teknis terkadang membutuhkan sedikit lebih tinggi (5–5,5) untuk mempertegas tepi.
- Tekstur bergaya lukisan terlihat baik di sini tetapi terkadang berkembang lebih baik pada 3,5–4.
CFG Tinggi (7+): Risiko oversaturasi
Saya mendorong 7–9 untuk melihat di mana sesuatu mulai rusak. Tidak rusak, tetapi menjadi berisik.
- Saturasi meningkat dengan cara yang menarik perhatian pada thumbnail dan kemudian melelahkan dalam konteks.
- Sorotan spekular menjadi keras. Logam terlihat mencolok, kulit menjadi berlilin.
- Pola noise muncul di bidang datar, seperti model yang bekerja terlalu keras.
Apakah ada kegunaan untuk CFG tinggi? Beberapa:
- Aset yang mengutamakan thumbnail di mana dampak visual lebih penting dari nuansa.
- Batasan merek yang ketat, jika Anda juga mengendalikan warna saat pasca-pemrosesan dan memperhatikan eksposur.
Tetapi jika Anda mendapatkan “efek plastik” atau sorotan terang yang tidak bisa diperbaiki saat grading, turunkan terlebih dahulu sebelum Anda menumpuk perbaikan satu per satu. Dalam pengujian saya, menurunkan dari 7,5 ke 5 menyelesaikan lebih banyak masalah daripada daftar negative prompt manapun.
Diagnosis masalah umum
Oversaturasi gambar / warna yang terlalu cerah
Yang saya lihat: merah dan teal menjadi sangat mencolok, gradien membentuk pita, dan keseluruhan gambar terasa seperti HDR berlebihan.
Kemungkinan penyebab: CFG mendorong terlalu keras, terkadang dikombinasikan dengan sampler yang cenderung meningkatkan kontras.
Yang membantu:
- Turunkan CFG sebesar 1–2 poin terlebih dahulu. Solusi sederhana yang efektif.
- Tambahkan negative ringan: “oversaturated, color clipping.” Ini mendorong, tetapi tidak menggantikan, perubahan CFG.
- Jika tersedia, kurangi pasca-pemrosesan yang meningkatkan kontras atau ganti ke sampler yang lebih baik dalam mempertahankan midtone.
Hubungannya dengan pekerjaan: aset mulai lebih cocok diletakkan di samping foto nyata di halaman. Saya berhenti berjuang melawan warna saat pasca-pemrosesan.
Overeksposur gambar / luapan cahaya terang
Yang saya lihat: kemeja putih kehilangan rajutannya; jendela bersinar seperti portal. Histogram menumpuk di sebelah kanan.
Kemungkinan penyebab: CFG tinggi ditambah prompt “cerah” atau “diterangi matahari” tanpa batasan.
Yang membantu:
- Turunkan CFG ke rentang 4–5.
- Jadilah eksplisit: “cahaya yang lembut dan menyebar,” “pertahankan detail sorotan,” atau “tidak ada sorotan yang meledak.”
- Sesuaikan eksposur melalui prompt (“mendung” memberi dampak lebih dari yang saya harapkan). Jika alat memungkinkan, kurangi sedikit eksposur/kontras di tempat lain daripada berjuang hanya dengan panduan.
Hasilnya: spekular tetap ada, tetapi dengan tekstur. Gambar terlihat lebih seperti kamera, bukan render showroom.
Kehilangan detail / efek plastik
Yang saya lihat: kulit terlihat berlilin, kain berubah menjadi gradien halus, mikrotekstur menghilang.
Kemungkinan penyebab: kombinasi CFG tinggi dan istilah gaya seperti “glossy,” “cinematic lighting,” atau “ultra-detailed” yang secara paradoks meratakan permukaan.
Yang membantu:
- Turunkan CFG ke ~4,5.
- Ganti “ultra-detailed” dengan petunjuk tekstur yang konkret: “anyaman linen halus,” “pori-pori yang halus,” “hasil akhir matte.”
- Tambahkan negative seperti “plastic, waxy, airbrushed.”
Dalam praktiknya: ini tidak menghemat waktu saya pada percobaan pertama, tetapi setelah beberapa gambar, saya memperhatikan bahwa ini mengurangi upaya mental. Lebih sedikit pengulangan. Lebih sedikit momen “mengapa ini terlihat palsu?”.
Saran CFG untuk berbagai gaya
Fotografi realistis: CFG 4–5
Untuk prompt foto-realistis, 4–5 terasa paling dekat dengan “atur dan lupakan.” Saya menggunakan rentang ini untuk potret, adegan meja, dan foto makanan sederhana. Pada 4,5, tekstur kulit terjaga, bayangan tidak hancur, dan lensa terasa meyakinkan.
Penyesuaian yang membantu:
- Minta pencahayaan seperti yang dilakukan manusia: “cahaya jendela, menghadap utara, mendung.”
- Gunakan negative kecil: “oversaturated, plastic skin.”
- Jaga istilah komposisi tetap sederhana: “35mm, f/2.8, pinggang ke atas.” Prompt yang terlalu rumit mendorong gaya terlalu kuat dan bertentangan dengan realisme.
Cocok untuk: pemasar dan kreator yang menggabungkan gambar yang dihasilkan dengan fotografi nyata. Ini cocok di halaman merek tanpa terlihat mencolok.
Gaya ilustrasi: CFG 5–7
Ilustrasi menyukai sedikit lebih banyak panduan. Pada 5,5–6,5, garis kerja terjaga dengan baik dan palet warnanya disengaja tanpa berubah menjadi neon.
Penyesuaian yang membantu:
- Spesifik tentang medium: “gouache wash,” “garis tinta,” “tekstur cetak saring.” Panduan kemudian terkunci pada ide tersebut.
- Jika warna terlalu mencolok, turunkan CFG dan tancapkan petunjuk palet (“nuansa bumi yang redup,” “palet terbatas”).
- Untuk lembar konsep, turunkan hingga 3,5 untuk mendorong variasi di seluruh frame.
Cocok untuk: tim yang membangun sistem visual yang konsisten, aplikasi, dokumen, atau materi pendidikan, di mana kohesi gaya mengalahkan trik fotorealistis.
Kerjasama CFG dengan parameter lainnya
CFG tidak bekerja sendiri. Beberapa interaksi terus muncul dalam pengujian saya:
- Sampler dan langkah: Dengan lebih banyak langkah, artefak CFG tinggi terkadang melunak, tetapi tidak cukup untuk membenarkan waktu ekstra. Saya mendapatkan hasil yang lebih baik dari menurunkan CFG daripada menambah langkah.
- Resolusi: Memperbesar pada CFG tinggi memperburuk kilap plastik. Ketika saya membutuhkan output besar, saya menjaga CFG tetap sedang (≈4,5) dan membiarkan upscaler terpisah menangani detail.
- Negative prompt: Itu adalah bumbu, bukan penyelamat. Daftar kecil yang ditargetkan bekerja paling baik: “oversaturated, waxy skin, blown highlights.” Daftar panjang yang berlebihan membuat gambar menjadi kusam.
- Token gaya: Jika Anda menyertakan petunjuk gaya yang kuat (“studio strobe, majalah glossy”), harapkan mereka untuk memperkuat dampak CFG tinggi. Perhalus bahasa gaya atau turunkan CFG.
- Seed dan variasi: Menjalankan tiga seed pada 4,5 memberi saya lebih banyak pilihan yang bisa digunakan daripada satu seed pada 7. Yang pertama terasa seperti pilihan; yang terakhir terasa seperti koreksi.
Jika Anda ingin tahu lebih dalam mengapa hal ini terjadi, metode Classifier-Free Guidance dalam model difusi secara efektif menskalakan perbedaan antara prediksi kondisional dan tanpa kondisi. Dorong terlalu jauh dan Anda akan memperbesar bukan hanya sinyal tetapi juga noise dan bias terhadap representasi berkontras tinggi. Primer yang bagus: makalah asli tentang Classifier-Free Guidance dan catatan guidance_scale di Diffusers. Semuanya selaras dengan apa yang saya amati, gunakan panduan untuk mengarahkan, bukan untuk memaksa.
Semua ini bermuara pada praktik kecil yang kini saya ikuti: saya mulai dari CFG 4,5, jalankan dua seed, dan hanya menggerakkan kenop jika saya bisa menamai apa yang salah (terlalu terang, terlalu glossy, terlalu samar). Ini adalah pekerjaan yang tenang, tetapi menghemat saya dari berjuang melawan model nanti. Jika Anda menghubungkan ini ke alur kerja atau pipeline API, panduan singkat Z-Image-Base API ini menunjukkan di mana guidance_scale berada dan cara meneruskannya dengan bersih.





