Kling 2.6 Motion Control: Pola Prompt yang Benar-Benar Menggerakkan Bagian yang Tepat

Kling 2.6 Motion Control: Pola Prompt yang Benar-Benar Menggerakkan Bagian yang Tepat

Beberapa hari setelah menguji Kling 2.6, saya terus mengalami masalah yang sama: saya minta gelombang tangan dan seluruh bahu bergeser, atau saya minta kamera maju dan subjek meloncat maju seperti ditarik dengan tali. Bukan kegagalan dramatis, hanya masalah berulang “menggerakkan bagian yang salah” yang perlahan-lahan menghilangkan kepercayaan.

Jadi saya menyisihkan satu sore, menyiapkan kopi, dan mencoba memahami apa yang sebenarnya didengarkan model ketika memutuskan apa yang harus digerakkan. Apa yang berikut bukan ulasan. Ini adalah catatan yang saya inginkan pada hari pertama: bagaimana saya mendorong Kling 2.6 menuju kontrol gerakan yang andal tanpa mengubah setiap prompt menjadi paragraf.

Mengapa “menggerakkan bagian yang salah” terjadi

Kling 2.6 bagus dalam gerakan yang masuk akal. Ini kurang bagus dalam gerakan presisi. Ketika saya minta “angkat tangan kanannya,” saya belajar bahwa model tidak hanya menguraikan kata-kata: ini juga bergantung pada prioritas yang dipelajari tentang bagaimana tubuh biasanya bergerak dan apa yang biasanya dilakukan kamera. Percayalah, itulah saat keseruan benar-benar dimulai. Berikut adalah pola yang terus saya lihat:

  • Referensi yang ambigu: Jika ada dua aktor yang masuk akal (subjek dan kamera), Kling kadang-kadang menugaskan gerakan ke kamera karena menjaga adegan tetap stabil dengan cara itu. “Dorong masuk” bisa menjadi subjek berjalan maju.
  • Oklusi + simetri: Jika tangan kanan sebagian tersembunyi atau serupa dengan yang kiri dalam postur, itu akan mencerminkan atau menukar sisi. Pencahayaan samping dan framing membantu lebih dari wording di sini.
  • Kekeruhan temporal: Tanpa beat atau durasi, gerakan menyebar di seluruh klip. Itulah ketika Anda mendapatkan micro-jitter abadi atau subjek yang tidak bisa diam.

Tidak ada dari ini yang merupakan bug. Ini model yang mengambil alih untuk realisme. Perbaikannya, bagi saya, adalah berbicara dengan Kling seperti direktur gerakan berbicara dengan kru kecil: siapa yang bergerak, bagian mana, seberapa jauh, seberapa cepat, dan apa yang tetap terkunci.

Daftar periksa token gerakan

Kling tidak memerlukan sintaks khusus, tetapi memberi diri saya template “token gerakan” kecil membuat saya jujur. Saya menulisnya secara inline, dalam bahasa biasa, seperti label di dalam prompt. Inilah masalahnya — ini membuat perbedaan yang besar.

Gist token saya terlihat seperti ini:

  • Aktor: siapa yang bergerak (subjek, tangan kiri, kamera, cahaya latar belakang). Satu aktor per token.
  • Aksi: kata kerja, tetap kecil ketika presisi penting (miringkan, lirik, angkat, putar sedikit).
  • Sisi/bagian: anggota badan atau objek yang tepat (pergelangan tangan kanan, alis kiri, jari telunjuk, yaw kamera).
  • Besaran: kecil, sedang, besar, atau derajat/hitungan ketika diperlukan (15°, 2 langkah, 3 frame).
  • Durasi + waktu: kapan itu terjadi dan berapa lama (beat 1–2 detik, tahan 1 detik, loop).
  • Batasan: apa yang tetap diam (torso terkunci, kamera terkunci, wajah netral).
  • Negatif: apa yang harus tidak bergerak (tidak ada pergeseran bahu, tidak ada zoom, rambut tetap tenang).

Saya biasanya membungkus ini dalam tanda kurung untuk membuat mereka dapat dipindai untuk saya, lagi, untuk saya, bukan untuk Kling:

[aktor: tangan kanan] [aksi: gelombang] [besaran: kecil] [durasi: 1 detik] [batasan: bahu terkunci] [negatif: tidak ada pergerakan kamera]

Pola 1: kontrol anggota badan

Masalah anggota badan adalah masalah klasik. Saya ingin gelombang tangan halus tanpa ayunan tubuh bagian atas penuh. Upaya pertama saya gagal karena saya minta “gelombang lembut.” Kling mendengar “gelombang” dan menganimasikan seluruh rantai.

Yang bekerja lebih baik:

  • Beri nama sendi bergerak terkecil terlebih dahulu. “Pergelangan tangan kanan bergerak cepat, jari memimpin, bahu tetap netral.”
  • Tambahkan batasan balik. “Torso tertambat pada kursi. Tidak ada ayunan pinggul.”
  • Beri itu beat. “Gelombang terjadi pada 0:02–0:03, kemudian istirahat.”
  • Jaga simetri tetap terjaga. “Tangan kiri tetap di meja, diam.”

Potongan prompt nyata yang menghasilkan gerakan bersih:

“Subjek duduk di meja kayu. Cahaya tenang. Pergelangan tangan kanan membuat gelombang kecil dari sisi ke sisi, jari melakukan sebagian besar gerakan. Bahu dan siku tetap stabil. Gerakan ini terjadi sekali antara 2–3 detik, kemudian tangan kembali istirahat di meja. Tangan kiri tetap diam. Tidak ada gerakan kamera.”

Ketika penting untuk tepat, saya mengatur jangkar visual: “Pergelangan tangan kanan beristirahat di sebelah cangkir kopi: hanya jari yang bergerak.” Jangkar mengurangi ketidakpastian model tentang di mana sendi berada.

Pola 2: kamera

Setengah dari klip “bagian yang salah bergerak” saya benar-benar pertukaran kamera–subjek. Saya minta “dorong masuk lembut” dan model membuat subjek condong ke depan. Masuk akal, tetapi bukan apa yang saya inginkan.

Bagaimana saya memisahkan keduanya:

  • Deklarasikan rig kamera. “Kamera di tripod, zoom 5% halus selama 2 detik.”
  • Bekukan subjek. “Subjek tetap benar-benar diam, hanya bernapas.”
  • Hindari kata kerja yang terdengar seperti aksi tubuh. Saya mengatakan “zoom-in” atau “dolly-in,” bukan “gerak lebih dekat.”
  • Gunakan angka. “5% zoom, linear, 2 detik, center-framed.”

Potongan prompt yang berperilaku:

“Shot terkunci. Kamera melakukan zoom-in linear lambat 5% dari 0–2 detik. Subjek tidak condong atau melangkah. Tidak ada perubahan parallax. Latar belakang tetap tetap.”

Jika saya ingin parallax (dolly), saya memanggilnya: “camera dolly-in, parallax dangkal di rak buku, subjek terkunci ke pusat bingkai.” Baris satu itu menghentikan model dari memalsukan gerakan dengan condong subjek.

Satu catatan lagi: Kling 2.6 kadang-kadang menambahkan guncangan handheld untuk ‘sinematik.’ Jika Anda tidak menginginkan itu, katakan: “tidak ada guncangan handheld, tidak ada micro-jitter.”

Pola 3: gerakan mikro

Gerakan mikro adalah di mana Kling 2.6 mengejutkan saya dengan cara yang baik. Perubahan kecil dan stabil cenderung terlihat alami — sakkade mata, pernapasan, hanyutan kain — jika Anda menjaga kata kerja tetap lembut dan durasi tetap pendek.

Yang bekerja:

  • Mata: “dua sakkade mata kecil kiri→tengah di detik pertama, kelopak mata lembut, kepala diam.”
  • Pernapasan: “kenaikan dada halus 4–6 mm selama 3 detik, kemudian turun, loop sekali.”
  • Kain/rambut: “hembusan hampir tidak ada, ujung rambut bergerak, akar stabil: ujung jaket berkibar selama 0,5 detik.”
  • Perlengkapan: “uap menggulung dari cangkir, tipis, terputus-putus, tidak bergejolak.”

Yang tidak:

  • Menumpuk banyak mikro sekaligus. Itu berubah menjadi kebisingan.
  • Menggunakan kata kerja besar dengan target mikro (“putar kepala sedikit” sering menjadi anggukan penuh). Saya menggunakan “angle,” “tilt,” “settle,” “drift.”

Ketika klip menjadi terlalu hidup, saya menambahkan batas: “latar belakang tetap diam: hanya [X] yang bergerak.” Satu baris itu mengurangi wiggle aksidental di seluruh bingkai.

Prompt negatif

Prompt negatif kurang tentang mengusir artefak dan lebih tentang mengalokasikan anggaran gerakan. Saya mendapat hasil yang lebih baik ketika saya menggunakan negatif untuk membekukan rantai tertentu.

Negatif berguna yang saya andalkan:

  • “Tidak ada keterlibatan bahu.” Memaksa model untuk melokalisasi gerakan tangan.
  • “Tidak ada gerakan kamera sama sekali.” Membunuh guncangan default.
  • “Rambut tetap tenang.” Menghentikan model dari “mensinemasikan” adegan dengan angin.
  • “Tidak ada perubahan ekspresi wajah.” Menjaga gerakan mikro dari melayang menjadi senyum.
  • “Tidak ada zoom atau dolly.” Menghindari pertukaran subjek/kamera.

Dan satu peringatan kecil: daftar negatif yang panjang bisa berulang. Dua atau tiga negatif yang ditargetkan mengalahkan daftar cucian.

Untuk konsistensi saat menguji prompt ini, kami menjalankan eksperimen Kling kami di WaveSpeed (lingkungan GPU internal kami) untuk melakukan iterasi dan membandingkan run tanpa penyimpangan setup.

10 prompt siap pakai

Ini adalah starter pendek yang sedang bekerja yang saya gunakan. Tweak subjek dan gaya, tetapi jaga bit gerakan tetap utuh.

1. Gelombang pergelangan tangan bersih, torso sunyi

“Seseorang yang duduk di meja kayu, cahaya siang hari.
[aktor: pergelangan tangan kanan] [aksi: gelombang kecil dari sisi ke sisi] [besaran: kecil]
[waktu: 2,0–3,0 detik, sekali] [batasan: bahu dan siku tetap stabil]
[negatif: tidak ada gerakan kamera, tidak ada gerakan tangan kiri].“

2. Camera push-in halus, subjek beku

“Framing potret, latar belakang netral.
[aktor: kamera] [aksi: zoom-in] [besaran: 5%] [durasi: 0–2 detik, linear]
[batasan: subjek sempurna diam, hanya bernapas]
[negatif: tidak ada dolly, tidak ada guncangan handheld].“

3. Sakkade mata tanpa gerakan kepala

“Wajah close-up, cahaya lembut.
[aktor: mata] [aksi: dua sakkade cepat kiri→tengah]
[waktu: dalam detik pertama]
[batasan: kepala terkunci, ekspresi netral]
[negatif: tidak ada senyum, tidak ada berkedip selama sakkade].“

4. Balikkan halaman dengan jari, bukan seluruh lengan

“Shot overhead dari catatan terbuka.
[aktor: jari telunjuk kanan] [aksi: geser sudut halaman dan balik]
[besaran: halaman tunggal] [waktu: 1,5–2,5 detik]
[batasan: pergelangan tangan minimal, lengan bawah tertambat pada meja]
[negatif: tidak ada gerakan kamera].“

5. Kemiringan kepala pengakuan, mikro saja

“Medium shot.
[aktor: kepala] [aksi: kemiringan kecil ke kanan kemudian kembali] [besaran: 5–7°]
[waktu: 1,0–1,4 detik]
[batasan: bahu tingkat]
[negatif: tidak ada senyum, tidak ada pergeseran mata].“

6. Dolly-kanan dengan parallax, subjek tertambat

“Adegan studio.
[aktor: kamera] [aksi: dolly-kanan] [besaran: kecil, 20 cm]
[durasi: 0–2 detik, mulus]
[batasan: subjek tetap center-framed, parallax latar belakang terlihat]
[negatif: tidak ada zoom].“

7. Flutter mikro kain saja

“Potret dengan angin ringan.
[aktor: ujung jaket] [aksi: flutter singkat]
[waktu: 0,8–1,2 detik]
[batasan: rambut dan pepohonan diam]
[negatif: tidak ada angin global].“

8. Mengetik dengan jari terisolasi

“Adegan meja, laptop.
[aktor: jari kedua tangan] [aksi: ketik lembut]
[waktu: ledakan terputus-putus]
[batasan: pergelangan tangan ditanam, siku stabil, torso diam]
[negatif: tidak ada guncangan kamera].”

9. Angkat cangkir tanpa pendakian bahu

“Meja kafe.
[aktor: tangan kanan] [aksi: angkat cangkir keramik, teguk, ganti]
[waktu: 1,0–2,5 detik]
[batasan: bahu dan leher tenang, siku minimal]
[negatif: tidak ada gerakan kamera, tidak ada lonjakan uap].“

10. Gerakan latar belakang saat subjek bertahan

“Potret jalan.
[aktor: pejalan kaki latar belakang] [aksi: lewati lambat kiri→kanan]
[batasan: subjek diam, mata pada kamera]
[negatif: tidak ada ayunan subjek, tidak ada zoom].”

Jika Anda perlu meningkatkan presisi, tumpuk satu batasan lagi daripada tindakan lain. Ini menjaga klip tetap dapat dibaca, untuk Anda dan untuk model. Tidak ada penilaian di sini — kami semua pernah ke sana.

Baiklah, giliran Anda — jangan biarkan saya menunggu: Apa kejutan lisensi “bobot terbuka” paling konyol yang pernah Anda temui? Turunkan kisah Anda di komentar!