Kling AI 动作控制:工作原理 + 如何在 WaveSpeed 上使用
嘿伙计们。说实话,我一开始并不打算学习 Kling AI Motion Control。我只是想要一个杯子在桌子上滑过的短视频,不希望摄像机像在船上一样漂移。试了两次之后,我意识到这个模型太急切了,热情过头,想要添加花哨效果。动作感觉很飘浮。这个小烦恼让我进行了一周的测试、几次失败的渲染,以及一些我希望早就知道的清晰模式。

“动作控制”实际上意味着什么
当人们说”Kling AI Motion Control”时,他们通常同时指的是三件事:
- 你指导一个主体随时间的运动(走路、滑行、转身、手势)。
- 你保持摄像机行为一致(锁定、推进、缓慢平移),这样场景就不会抖动。
- 你限制模型临时发挥的冲动,比如添加道具、灯光或物理效果。
实际上,动作控制不像 After Effects 中的关键帧,更像是在道路上设置车道。你不会获得每一帧的精确坐标,但你可以缩小路径,使模型保持接近你描述的内容。

让我惊讶的是:好的动作控制主要是关于减少歧义。如果提示留有空间,模型会填充它,通常带有摄像机移动。如果你对摄像机和背景明确说明,你的主体运动就会变得更加可预测。当我在提示的早期写下”三脚架、固定摄像机、无变焦”时,漂移下降了很多。不是完全消失,但可以管理。
你能/不能控制什么(部分、摄像机、姿态)
我能够可靠地控制的
- 摄像机规范。 说”三脚架拍摄、固定摄像机、无变焦、无推进”比任何其他文本都更有帮助。如果你想要一个动作,请精确说明一个:“缓慢从右到左平移,恒定速度。” 混合多个动作会让它困惑。
- 粗略的主体动作。 动词加速度词有效:“缓慢行走”、“稳定滑行”、“转身 90 度”、“抬起右手挥手”。像”轻轻”这样的副词比像”0.5 m/s”这样的数字更容易被解释。
- 锚点时刻的姿态。 我在时间段上描述姿态时获得了更好的效果:“起始:中立姿态。中途:右手抬起到肩膀高度。结束:手放下。” 模型将这些解释为节拍。
保持滑动的
- 细粒度的肢体路径。 “肘部在 45°“通常不会坚持。“肘部紧靠”效果更好。
- 微观计时。 如果你需要手挥从 1 秒准确开始,预期会有一些漂移。我通过锚定节拍(“在中间…”、“在最后三分之一…”)而不是绝对秒数来靠近。
- 物理完美碰撞。 滑动物体有时感觉没有摩擦力。添加表面细节(“粗糙的橡木桌面、可见的纹理”)有所帮助,但它不是物理引擎。
如果你来自 ControlNet 或 MoCap 领域:Kling 在一些包装中接受调节(姿态、遮罩),但纯文本加上仔细的否定词让我为简单的拍摄完成了 80%。
WaveSpeed 设置(模型 + 预设)
我一直看到在坐在 Kling 顶部的几个 UI 中有一个”WaveSpeed”预设。名称在包装中有所不同,但想法是一致的:倾向于平滑的速度曲线而不是华丽的摄像机动作。当我将当前的 Kling 视频模型与 WaveSpeed 风格的预设配对时,我获得了更稳定的主体运动和更少的微观变焦。
我的基线设置:
- 模型: 测试时仪表板中可用的最新 Kling 视频/动作模型。
- 预设: “WaveSpeed”或任何提及稳定动作、恒定速度或三脚架偏差的预设。
- 动作强调: 中等。高有时会过度抑制纹理变化:低让摄像机漫游。
如果你的 UI 没有”WaveSpeed”,查找像”平滑速度”、“恒定动作”或”摄像机稳定器”这样的切换。这是用不同名称的相同意图。
对于这样的设置,我们使用我们自己的 WaveSpeed — 它保持运动稳定、预设一致,并减少重试。这正是我们团队处理 Kling AI Motion Control 的方式。

分步工作流程
这是为我产生最少重试的路径。
-
用文字框架化拍摄
- 从摄像机开始:“三脚架、固定摄像机、无变焦。” 或命名一个深思熟虑的动作。把这个放在第一句。
- 锁定背景:“普通工作室背景”、“日光厨房、静止”、“空旷的走廊、无其他人”。减少混乱。
-
描述主体和身份
- 一个清晰的主体身份,有 2-3 个锚点:衣服、调色板、道具。如果你有参考图像,使用它。
-
以节拍指定动作
- 开始/中间/结束。使用动词 + 速度词。避免在同一节拍中混合多个动作。
-
添加保护动作的否定词
- “无摄像机抖动、无变焦、无切割、无延时、无传送。” 听起来很傻,但它有效。
-
在渲染前设置持续时间和宽高比
- 我保持在 4-6 秒左右以获得更紧密的控制。较长的视频会引起漂移。
-
做一个低分辨率/快速过程
- 如果你的 UI 允许草稿模式,先以低分辨率测试动作。我用这种方法发现了 70% 的问题。
-
用小编辑进行迭代
- 每次运行改变一个变量:摄像机、速度词或单个节拍。大的提示编辑会导致大的不可预测性。
-
锁定好的种子
- 当一个拍摄接近时,锁定种子并从那里微调。否则,你最终会追逐幽灵。
这并不总是能省我挂钟时间,但它减少了心理负担。更少的”改变了什么?“时刻。
提示结构模板

我使用一个简单的脚手架并填充空白。复制它、调整它、忽略你不需要的。
上下文
- 摄像机:[三脚架/固定或一个清晰的动作]
- 背景:[简短的静止描述]
- 持续时间:[X 秒]、[宽高比]
主体
- [谁/什么]、[2-3 个身份锚点]
动作节拍
- 开始:[姿态/动作]
- 中间:[姿态/动作]
- 结束:[姿态/动作]
风格提示(可选)
- [灯光]、[纹理细节]、[真实感 vs 风格化]
保护性否定词
- 无摄像机抖动、无变焦、无切割、无延时、无运动模糊夸大、无额外角色
这种格式使 Kling AI Motion Control 表现得更像一个稳定的助手,而不是一个即兴合作伙伴。
5 个复制粘贴示例
简短、实用且经过测试。替换细节,保持骨架。
1. 产品在桌子上滑行(三脚架)
摄像机:三脚架、固定摄像机、无变焦。背景:干净的橡木桌面、柔和的日光。持续时间:5 秒、16:9。
主体:白色陶瓷杯,带蓝色条纹。
动作:开始:杯子在左边,静止。中间:杯子以恒定速度滑向中心。结束:杯子在中心停止,温和的缓出。
风格:逼真、微妙的反射、柔和的阴影。
否定词:无摄像机抖动、无延时、无倾斜、无额外道具。
2. 人类波浪,简单计时
摄像机:三脚架、固定、眼平线。背景:普通工作室灰色。持续时间:4 秒、9:16。
主体:穿着绿色连帽衫、卷发、中立表情的人。
动作:开始:双臂下垂。中间:右手抬起到肩膀高度并挥手两次,小幅动作。结束:手放下、中立姿态。
风格:柔和的主光、自然肤色。
否定词:无变焦、无切割、无背景角色、无头部转动。
3. 带有行走主体的缓慢平移
摄像机:缓慢从右到左平移,恒定速度。背景:安静的城市人行道、清晨。持续时间:6 秒、16:9。
主体:成年人,背着红色背包,穿着牛仔夹克。
动作:开始:主体从右侧进入画面,缓慢行走。中间:稳定行走、眼睛向前。结束:当平移完成时,从左侧退出画面。
风格:扎根现实、温和的对比。
否定词:无跳切、无镜头呼吸、无奔跑。
4. 手部演示在书桌上
摄像机:俯视图、固定摄像机、无变焦。背景:带有切割垫的木制书桌。持续时间:5 秒、1:1。
主体:右手放置黑色笔。
动作:开始:空桌子。中间:手从底部进入、放置笔、旋转 90°。结束:手退出、笔保留。
风格:清晰、最小阴影、清晰边缘。
否定词:无额外工具、无抖动、无颜色变化。
5. 标志卡拉
摄像机:三脚架、固定、特写。背景:中性纸背景。持续时间:4 秒、4:5。
主体:带有 [你的标志] 的小卡片。
动作:开始:卡片在画面下方。中间:卡片向上滑入中心并保持。结束:轻微定居、无反弹。
风格:干净、逼真的纹理、微距感觉。
否定词:无视差、无摄像机推进、无额外文本。
常见失败 + 修复

-
摄像机蠕变(微观变焦或微小倾斜)
修复:在第一行中放置”三脚架、固定摄像机、无变焦”。如果你想要完全锁定,添加”无推进、无平移”。如果它持续,缩短持续时间或简化背景。 -
动作太飘浮
修复:使用”恒定速度”、“温和的缓出”或命名有摩擦力的表面(“粗糙亚麻、粘合橡胶垫”)。有时切换到 WaveSpeed 风格的预设有所帮助。 -
身份跨帧漂移
修复:更强的身份锚点(特定衣服、颜色),或使用参考图像。锁定接近时的种子。避免在迭代中添加新道具。 -
背景抖动
修复:更少的背景细节。“普通墙壁”胜过”有人移动的咖啡馆”。如果你需要生动的背景,接受一些动作变异或缩短视频。
最佳导出设置
如果你将视频剪辑移入编辑器(Premiere、Resolve、FCP),干净的导出可以节省大量重新编码。
- 持续时间: 保持第一遍短(4-6 秒)。稍后拼接。
- 分辨率: 以接近目标交付的方式生成。事后向上缩放没问题,但避免双倍缩放。
- 帧率: 24 fps 用于电影感觉,30 fps 用于产品/UI 演示,60 只有当你真正需要时。一致性比数字更重要。
- 编解码器/容器: ProRes 422 HQ 或 DNxHR 用于编辑;H.264 High Profile 用于快速共享。如果工具强制使用 H.264,设置更高的比特率以避免带状效应(例如,1080p 时 15-20 Mbps,4K 时 35-50 Mbps)。
- 颜色: 锁定你的色彩空间。如果 UI 提供 sRGB/Rec.709,选择一个并将其保持在你的管道中。
我还将原始种子和提示保存在文件名或侧车文本中。六个渲染后,你会感谢过去的你。
就这样 — 我苦心赢得的 Kling AI Motion Control 智慧,从一个流氓杯子和太多咖啡催化的夜晚中提炼出来。现在轮到你了:Kling 为你的视频添加的最奇怪的”花哨”是什么?请在下方回复!





