Kling 2.6 動作控制:真正移動正確部分的提示詞模式
I’ll now provide the Traditional Chinese translation:
在測試Kling 2.6的前幾天,我一次次遇到同樣的問題:我要求做一個揮手動作,整個肩膀卻漂移了,或我要求鏡頭推進,主角卻像被繩子拉動一樣向前衝。不是戲劇化的失敗,只是那種低級的「移動錯誤部分」問題,慢慢地侵蝕信任。
所以我花了一個下午,喝著咖啡,試著理解當模型決定移動什麼時,它實際上在聽什麼。接下來的內容不是評論,而是我希望第一天就有的筆記:我如何在不把每個提示詞轉成一段文字的情況下,引導Kling 2.6實現可靠的動作控制。
為什麼會「移動錯誤部分」
Kling 2.6擅長逼真的動作。但它在精細動作上不太擅長。當我要求它「抬起她的右手」時,我發現這個模型不只是解析文字:它還依賴關於身體通常如何運動以及鏡頭通常做什麼的學習先驗。相信我,這就是樂趣真正開始的時候。

這是我一直看到的模式:
- 模糊的所指對象: 如果有兩個可能的演員(主角和鏡頭),Kling有時會將動作分配給鏡頭,因為這樣可以保持場景穩定。「推進」可能變成主角向前走。
- 遮擋+對稱性: 如果右手部分被遮擋或在姿勢上與左手相似,它會鏡像或交換邊。側光和構圖比措辭幫助更大。
- 時間混亂: 沒有節拍或時長時,運動會跨越整個片段。這就是當你得到永恆的微抖動或一個無法保持靜止的主角的時候。
這些都不是漏洞。這是模型為現實主義而做出的折衷。對我來說,修復方法是像運動導演和小團隊說話一樣和Kling交流:誰動、動哪部分、動多遠、動多快,以及什麼保持固定。
動作令牌檢查清單
Kling不需要特殊語法,但給自己一個小小的「動作令牌」模板讓我保持誠實。我用純語言內聯寫入它們,就像提示詞內的標籤。這是關鍵——它帶來了巨大的差異。
我的令牌框架看起來像這樣:
- 角色: 誰動(主角、左手、鏡頭、背景燈光)。每個令牌一個角色。
- 動作: 動詞,當精確度重要時要小(傾斜、瞥、抬起、輕微旋轉)。
- 側邊/部分: 確切的肢體或物體(右腕、左眉、食指、鏡頭搖)。
- 幅度: 小、中、大,或在需要時用度數/計數(15°、2步、3幀)。
- 時長+計時: 它何時發生以及持續多久(節拍1–2秒、保持1秒、循環)。
- 約束: 什麼保持靜止(軀幹鎖定、鏡頭鎖定、表情中性)。
- 反面: 什麼絕對不能動(無肩膀移動、無縮放、頭髮保持平靜)。
我通常用括號把這些包起來,以便對我來說保持可掃描性,再次說,對我而言,而不是對Kling而言:
[actor: right hand] [action: wave] [magnitude: small] [duration: 1s] [constraint: shoulder locked] [negative: no camera movement]
模式1:肢體控制

肢體問題是經典問題。我想要一個微妙的揮手動作,沒有完整的上身搖晃。我最初的嘗試失敗了,因為我要求「溫和的揮手」。Kling聽到「揮手」並動畫化了整個鏈。
更好的方法:
- 首先命名最小的移動關節。「右腕輕彈,手指引領,肩膀保持中性。」
- 添加反約束。「軀幹固定在椅子上。沒有臀部搖晃。」
- 給它一個節拍。「揮手發生在0:02–0:03,然後休息。」
- 保持對稱性受控。「左手留在桌子上,靜止。」
一個產生乾淨動作的真實提示片段:
「主角坐在木製書桌前。平靜的光線。右腕做小幅度的左右揮手,手指做大部分動作。肩膀和肘部保持穩定。此動作在2–3秒之間發生一次,然後手返回桌上的靜止狀態。左手保持靜止。無鏡頭移動。」
當精確度很重要時,我設置視覺錨點:「右腕靠著咖啡杯休息:只有手指動。」錨點減少了模型對關節位置的不確定性。
模式2:鏡頭
我一半的「錯誤部分移動」片段實際上是鏡頭–主角交換。我要求「溫和的推進」,模型讓主角向前傾。合理,但不是我想要的。
我如何區分兩者:
- 聲明鏡頭裝置。「鏡頭在三腳架上,在2秒內進行微妙的5%縮放。」
- 凍結主角。「主角保持完全靜止,只有呼吸。」
- 避免聽起來像身體動作的動詞。我說「縮放」或「推進」,不是「靠近」。
- 使用數字。「5%縮放,線性,2秒,中心構圖。」
一個表現良好的提示片段:
「鎖定的鏡頭。鏡頭在0–2秒內執行緩慢、線性的5%縮放。主角不傾斜或踏步。沒有視差變化。背景保持固定。」
如果我想要視差(推進),我稱之為:「鏡頭推進,書架上的淺視差,主角鎖定在框架中心。」這一行阻止模型用主角傾斜來偽造移動。
還有一點:Kling 2.6有時會增加手持抖動來增加「電影感」。如果你不想要,說出來:「沒有手持晃動,沒有微抖動。」
模式3:微動作

微動作是Kling 2.6令我驚喜的地方。小的、穩定的變化往往看起來自然——眼睛跳躍、呼吸、織物漂移——如果你保持動詞溫和和時間短。
有效的:
- 眼睛: 「在第一秒內兩次小眼睛跳躍左→中心,眼睑柔和,頭靜止。」
- 呼吸: 「微妙的胸部上升4–6毫米在3秒內,然後下降,循環一次。」
- 織物/頭髮: 「幾乎察覺不到的微風,頭髮尖端動,根部穩定:夾克下擺顫動0.5秒。」
- 道具: 「蒸汽從杯中卷起,細細的,間歇的,不是湍流。」
無效的:
- 一次堆疊許多微動作。它變成噪音。
- 對微目標使用大動詞(「輕微轉頭」通常變成完整點頭)。我使用「傾斜」、「翻轉」、「沉降」、「漂移」。
當片段變得太活躍時,我添加了上限:「背景保持靜止:只有[X]動。」這一行減少了意外的跨框架搖晃。
負面提示
負面提示不是關於消除artifacts,而是關於分配動作預算。當我使用負面提示來凍結特定鏈時,我得到了更好的結果。
我依賴的有用負面提示:
- 「無肩膀參與。」迫使模型將手動作本地化。
- 「完全沒有鏡頭移動。」消除了默認抖動。
- 「頭髮保持平靜。」阻止模型用風來「電影化」場景。
- 「沒有面部表情變化。」保持微動作不漂移成微笑。
- 「無縮放或推進。」避免主角/鏡頭交換。
還有一個小警告:長的負面提示列表可能會適得其反。兩個或三個有針對性的負面提示勝過一大串。
為了在測試這些提示時保持一致性,我們在WaveSpeed(我們的內部GPU環境)上運行Kling實驗,以迭代和比較運行,不受設置漂移的影響。

10個現成的提示
這些是我使用的簡短、有效的起始。調整主角和風格,但保持動作部分不變。
1. 乾淨的腕部揮手,軀幹安靜
「一個坐在木製書桌前的人,日光。
[actor: right wrist] [action: small side-to-side wave] [magnitude: small]
[timing: 2.0–3.0s, once] [constraint: shoulder and elbow steady]
[negative: no camera movement, no left-hand motion].」
2. 微妙的鏡頭推進,主角凍結
「肖像構圖,中性背景。
[actor: camera] [action: zoom-in] [magnitude: 5%] [duration: 0–2s, linear]
[constraint: subject perfectly still, only breathing]
[negative: no dolly, no handheld shake].」
3. 眼睛跳躍無頭部移動
「特寫面部,柔和的光線。
[actor: eyes] [action: two quick saccades left→center]
[timing: within first second]
[constraint: head locked, expression neutral]
[negative: no smile, no blink during saccades].」
4. 用手指翻頁,不是整個手臂
「開放式筆記本的俯視圖。
[actor: right index finger] [action: slide page corner and flip]
[magnitude: single page] [timing: 1.5–2.5s]
[constraint: wrist minimal, forearm anchored to table]
[negative: no camera move].」
5. 頭部傾斜確認,僅微動
「中等鏡頭。
[actor: head] [action: small tilt right then return] [magnitude: 5–7°]
[timing: 1.0–1.4s]
[constraint: shoulders level]
[negative: no smile, no eye shift].」
6. 右推進帶視差,主角固定
「工作室場景。
[actor: camera] [action: dolly-right] [magnitude: small, 20 cm]
[duration: 0–2s, smooth]
[constraint: subject remains center-framed, background parallax visible]
[negative: no zoom].」
7. 織物微顫動,只有此
「帶輕微微風的肖像。
[actor: jacket hem] [action: brief flutter]
[timing: 0.8–1.2s]
[constraint: hair and foliage still]
[negative: no global wind].」
8. 隔離手指打字
「書桌場景,筆記本電腦。
[actor: fingers both hands] [action: type softly]
[timing: intermittent bursts]
[constraint: wrists planted, elbows steady, torso still]
[negative: no camera shake].」

9. 杯子提起無肩膀上聳
「咖啡館桌子。
[actor: right hand] [action: lift ceramic cup, sip, replace]
[timing: 1.0–2.5s]
[constraint: shoulder and neck quiet, minimal elbow]
[negative: no camera move, no steam surge].」
10. 背景動作,主角保持
「街道肖像。
[actor: background pedestrians] [action: slow pass left→right]
[constraint: subject motionless, eyes at camera]
[negative: no subject sway, no zoom].」
如果你需要擴展精確度,堆疊另一個約束而不是另一個動作。它保持片段可讀,對你和對模型。沒有評判——我們都經歷過。
好的,輪到你了——別讓我失望:你遇到過最荒謬的「開放權重」許可證驚喜是什麼?在評論中留下你的故事!





