Cara Menjaga Konsistensi Karakter di Seedance 2.0 (Paket Referensi + Aturan)

Ingin membuat video sinematik seperti Seedance 2.0? Coba WaveSpeed Cinematic Video Generator untuk membuat video sinematik berkualitas Seedance 2.0 sekarang juga.

Saya tidak berniat memperbaiki identity drift. Saya hanya ingin karakter yang sama berjalan melintasi ruangan dua kali tanpa berubah menjadi sepupunya. Hasil pertama terlihat bagus dalam ukuran thumbnail. Lalu saya memutarnya perlahan dan menyadari rahangnya menghalus, rambutnya kehilangan keriting, dan di detik terakhir matanya memiliki kemiringan yang berbeda. Bukan aneh, hanya… tidak pas. Seedance 2.0 cepat dan kompeten, tetapi konsistensi karakter adalah area yang bisa goyah.

Saya Dora. Saya menghabiskan beberapa malam terlambat bulan ini menjalankan loop kecil dan mencatat apa yang bertahan. Berikut ini yang benar-benar menstabilkannya untuk saya, dan apa yang tidak, ketika saya lebih mementingkan konsistensi karakter Seedance 2.0 di atas segalanya.

Mengapa ID drift terjadi (apa yang “dilupakan” model)

Seedance 2.0 menangani dua pekerjaan sekaligus: mempertahankan wajah yang dapat dikenali dan menghasilkan gerakan yang terasa hidup. Ketika harus memilih, ia sering memilih gerakan. Di situlah ID drift muncul.

Yang terus saya lihat, berulang kali:

Model berhasil menangkap siluet keseluruhan terlebih dahulu (volume rambut, tinggi badan, postur umum).
Kemudian fitur-fitur mikro mulai bergeser di bawah tekanan: jarak mata, panjang philtrum, bentuk telinga, sudut garis rambut. Dalam klip pendek, ini muncul di sekitar transisi dan putaran kepala.
Pergeseran pencahayaan berperilaku seperti pengeditan halus terhadap identitas. Lampu samping mengubah karakter saya menjadi orang yang sedikit berbeda.

Di balik layar (secara praktis, bukan berpura-pura saya bisa melihat bobotnya): prompt teks mendorong ke arah pencocokan kategori (“wanita muda, bob keriting, jaket denim”), sementara referensi menambatkan orang yang tepat. Jika prompt Anda terlalu mendeskripsikan, kategori yang menang. Jika referensi lemah atau tidak konsisten, model akan “merata-ratakan” wajah tersebut.

Saya juga memperhatikan model “lupa” di tempat-tempat yang dapat diprediksi:

Ketika tangan melintasi wajah, model memperlakukan frame berikutnya sebagai mini-reshuffle.
Putaran yaw cepat merusak kesetiaan telinga/pelipis.
Tekstur pakaian dengan pola berulang terkadang mengalihkan perhatian dari landmark wajah.

Jadi drift bukan acak. Ini adalah pergeseran lambat dari hal-hal spesifik ke tipe umum. Mengetahui hal itu mengubah cara saya mempersiapkan input dan cara saya menulis prompt. Jika Anda juga berjuang dengan ketidakstabilan frame yang halus, panduan singkat tentang memperbaiki flicker dan jitter di Seedance 2.0 ini berjalan beriringan dengan kontrol identitas.

Bangun reference pack (gambar + klip pendek + style anchor)

Kemenangan terbesar saya berasal dari langkah yang membosankan: saya membangun reference pack yang kecil dan disiplin. Pengumuman resmi ByteDance menyoroti bahwa Seedance 2.0 “unggul dalam mengikuti instruksi, memungkinkan reproduksi yang tepat dan konsistensi subjek yang stabil bahkan untuk cerita kompleks dengan interaksi karakter yang kaya.” Ketika saya memberikan Seedance 2.0 lebih sedikit dan lebih jelas sebagai anchor, karakter saya tetap utuh.

Berikut ini yang paling berhasil untuk saya:

Maksimal tiga gambar diam, bukan sepuluh. Saya memilih: satu tampak lurus ke depan, satu tiga perempat, satu profil. Sesi yang sama, pencahayaan yang sama. Saya menghindari senyum di satu gambar dan ekspresi netral di gambar lain, terlalu banyak variasi ekspresi membuat model memilih wajah titik tengah.
Klip referensi 2–3 detik dengan anggukan kepala netral atau kedipan lambat. Saya memangkas frame mati dan menjaga latar belakang tetap polos. Ini memberi model baseline bergerak untuk perilaku rahang dan mata.
Style anchor: satu visual yang menetapkan grade dan kontras. Saya menggunakan frame diam dari ekspor sebelumnya yang saya sukai. Jika saya melewati ini, identitas tetap terjaga tetapi vibes bergeser: dengan anchor tersebut, keduanya tetap lebih dekat.

Yang tidak membantu:

Kolase. Terlihat teratur bagi saya, tetapi model tampaknya memperlakukannya seperti adegan yang sibuk.
Pencahayaan campuran. Saya memiliki satu foto dalam ruangan yang hangat dan satu foto luar ruangan yang sejuk: model merata-ratakannya menjadi netral, yang sedikit mengubah warna kulit dan usia yang terlihat.
Hanya headshot resolusi tinggi. Anehnya, menyisipkan satu frame resolusi sedang di antara dua frame yang tajam membantu, mungkin karena itu melembutkan overfitting ke pori-pori dan mempertahankan bentuk.

Saya menyimpan pack ini dalam satu folder dengan nama sederhana (front.jpg, threequarter.jpg, profile.jpg, ref.mp4, look.jpg). Ini memangkas waktu setup menjadi satu menit, dan saya tidak perlu ragu tentang apa yang harus disertakan. Pengurangan kecil dalam hambatan mental itu penting ketika saya banyak melakukan iterasi.

Aturan prompt yang menstabilkan identitas (apa yang dipinned, apa yang dihindari)

Saya berhenti menulis prompt yang mewah. Semakin saya mencoba mengesankan model, semakin ia mengabaikan orang saya dan mengejar estetika. Berikut pendekatan yang lebih tenang yang mempertahankan konsistensi karakter Seedance 2.0 untuk saya.

Yang saya pin:

Beri nama orang tersebut sebagai satu entitas, meskipun fiktif: “Karakter yang sama seperti referensi: satu identitas yang konsisten.” Terdengar berlebihan, tetapi itu mencegah model dari mengambil sampel “varian tipe.”
Kunci rentang usia, detail rambut, dan satu atau dua ciri keras yang paling penting untuk pengenalan: “akhir 20-an, ikal gelap ketat sepanjang telinga, anting gelang perak kecil di telinga kiri.” Terlalu sedikit detail, dan model mengeneralisasi. Terlalu banyak, dan ia cherry-pick.
Niat shot dan tempo: “loop berjalan lambat melintasi frame, ekspresi halus, tanpa putaran dramatis.” Disiplin gerakan adalah disiplin identitas.

Yang saya hindari:

Kata-kata gaya samar yang bertentangan dengan anchor: “sinematik,” “dreamy,” “gritty.” Jika saya membutuhkan sebuah tampilan, saya menetapkannya dengan referensi gaya daripada kata sifat.
Manajemen mikro kostum yang mengubah siluet di tengah klip (syal, jaket longgar tertiup angin). Jika pakaian harus spesifik, saya membuatnya pas dan statis.
Aksi kompleks. Setiap beat tambahan adalah kesempatan untuk wajah baru. Saya mulai sederhana: berjalan, duduk, berputar 15 derajat, berkedip.

Dua trik frasa yang membantu:

“Pertahankan proporsi wajah identik dengan referensi di semua frame.” Kedengarannya bossy. Itu berhasil lebih sering dari tidak.

“Tidak ada perhiasan baru, tidak ada perubahan makeup, tidak ada gerakan rambut di luar ayunan alami.” Toggle kecil ini menutup celah aneh yang tidak saya pikirkan untuk disebutkan.

Setelah lima run, saya memperhatikan sesuatu yang kecil: mempersingkat prompt saya sepertiga membuat output lebih dekat. Dugaan saya: lebih sedikit token yang tersesat menarik model menuju buffet vibes.

Checklist QA sebelum Anda rerun (wajah, tangan, logo, pakaian)

Dulu saya rerun berdasarkan insting. Sekarang saya melakukan pass 60–90 detik dengan checklist yang sama setiap kali. Ini menghemat waktu dengan mencegah percobaan ulang yang buta.

Wajah

Freeze pada frame 1, titik tengah, dan frame terakhir. Bandingkan jarak mata dan sudut rahang dengan front.jpg. Jika keduanya bergeser lebih dari “satu lebar pixel pada skala thumbnail,” saya rerun.
Amati scrub lambat di seluruh kedipan. Jika tepi kelopak mata berubah ketebalan di tengah kedipan, identitas berisiko.

Tangan

Periksa setiap momen tangan melintasi wajah. Jika wajah muncul kembali lebih tipis atau dengan jembatan hidung yang berbeda, saya menganggapnya gagal total, bukan mungkin.
Hitung artefak jari. Satu glitch sering memprediksi slip identitas kedua 10–15 frame kemudian.

Logo dan tanda kecil

Jika logo kecil di kemeja terbalik atau melunak, saya berharap fitur mikro wajah juga goyah. Ini adalah peringatan dini yang baik.
Tahi lalat atau bintik: jika bermigrasi, saya tidak melawannya dalam grading. Saya memperbaiki input atau gerakan sebagai gantinya.

Pakaian

Pola crawl (moiré) dapat mendominasi perhatian. Jika saya melihatnya, saya mengganti atasan dengan warna solid atau mengubah eksposur di style anchor.
Garis leher yang bergeser mengekspos tulang selangka secara berbeda: itu dapat sedikit mengubah lebar wajah yang terlihat.

Saya memberi skor setiap pass secara longgar: 0 (mulai ulang), 1 (dapat digunakan untuk cutaway), 2 (cukup baik untuk menjangkar sebuah urutan). Jika saya mendapat dua “2” berturut-turut, saya berhenti mengubah. Tidak sempurna, hanya cukup stabil untuk cerita yang menanggungnya.

Fix ladder jika drift berlanjut (ganti referensi, perketat batasan, persingkat gerakan)

Ketika identitas masih tergelincir setelah input yang bersih dan prompt yang hati-hati, saya berhenti menebak dan memanjat tangga sederhana. Saya mencoba satu anak tangga pada satu waktu dan menjalankan tes 2–3 detik.

Ganti referensi, bukan segalanya

Ganti hanya profil atau hanya tiga perempat dengan yang lebih cocok dalam pencahayaan. Pertahankan sisanya. Overhaul penuh menghapus kemajuan yang tidak mudah saya dapatkan kembali.
Jika ekspresi bervariasi, normalisasikan: netral di semua gambar diam. Saya pernah memiliki satu senyum besar mendorong volume pipi lebih lebar untuk seluruh klip.

Perketat batasan dalam bahasa yang kecil dan polos

Tambahkan satu batasan per run: “tanpa putaran kepala lebih dari 10°,” lalu “tanpa oklusi di seluruh wajah,” lalu “pertahankan rambut menempel di kepala: tanpa angin.” Menumpuknya secara perlahan berhasil lebih baik daripada membuang semuanya sekaligus.
Jika model melawan Anda, beralih ke negatif: “hindari putaran dramatis: hindari angkat rambut: hindari perubahan aksesori.” Negatif tampaknya lebih ketat dipatuhi.

Persingkat gerakan, lalu bangun kembali

Potong jendela aksi menjadi 1,5–2 detik dan hapus beat: hanya jalan, hanya lirik. Setelah wajah stabil, tambahkan satu beat kembali.
Untuk loop, saya menghindari tumpang tindih siklik yang sempurna: itu dapat mendorong “reset” wajah pada jahitan.

Kurangi entropi visual

Sederhanakan latar belakang dan turunkan kontras di style anchor sedikit. Ketika adegan menjadi lebih tenang, Seedance 2.0 menghabiskan lebih banyak “perhatiannya” pada wajah.
Desaturasi kulit sedikit di anchor jika warna terus bergeser antar shot. Tampaknya itu mencegah pergeseran hangat/dingin yang tiba-tiba.

Langkah terakhir: menyerah pada siluet

Jika garis rahang yang unik tidak mau bertahan, saya bersandar pada bentuk rambut, perhiasan telinga, dan kecocokan pakaian. Penonton membaca identitas dari jarak jauh lebih dari yang kita akui. Ini bukan curang: ini adalah editing.

Dalam delapan tes pendek, tangga ini memotong percobaan ulang saya sekitar sepertiga. Yang lebih penting, ini menurunkan kebisingan mental. Saya tidak merasa berjudi di setiap render.

Siapa yang ini bantu: jika Anda peduli tentang konsistensi karakter Seedance 2.0 daripada gerakan kamera yang mewah, jalur yang lebih lambat dan lebih stabil ini mungkin akan terasa alami. Jika Anda menginginkan arc besar, whip, atau monolog ekspresif dalam satu kali jalan, Anda akan cepat mencapai batasnya. Anda masih bisa mencapainya, hanya bangun secara berlapis.

Ingin membuat video sinematik seperti Seedance 2.0? Coba WaveSpeed Cinematic Video Generator untuk membuat video sinematik berkualitas Seedance 2.0 sekarang juga.

Mengapa ID drift terjadi (apa yang “dilupakan” model)

Bangun reference pack (gambar + klip pendek + style anchor)

Aturan prompt yang menstabilkan identitas (apa yang dipinned, apa yang dihindari)

Checklist QA sebelum Anda rerun (wajah, tangan, logo, pakaian)

Fix ladder jika drift berlanjut (ganti referensi, perketat batasan, persingkat gerakan)

Artikel Terkait

Claude Fable 5 Telah Dirilis: 80,3% di SWE-Bench Pro, Harga 2× Opus 4.8, Gratis Hingga 22 Juni

Cara Memilih API Media AI untuk Aplikasi Codex (2026)

Hunyuan 3D API: Yang Perlu Diketahui para Developer

Hunyuan 3D vs Hyper3D vs Pixal3D

Membangun Aplikasi Video AI dengan Coding Agent

ChatGPT Codex API untuk Aplikasi Media AI