Kling AI 모션 컨트롤: 작동 원리 + WaveSpeed에서 사용하는 방법

Kling AI 모션 컨트롤: 작동 원리 + WaveSpeed에서 사용하는 방법

안녕하세요. 솔직하게 말하면, 저는 Kling AI 모션 컨트롤을 배우려고 나선 게 아니었습니다. 그냥 테이블을 가로질러 미끄러지는 컵 영상을 원했는데, 카메라가 보트에 탄 것처럼 흔들리지 않기를 원했어요. 두 번째 시도에서 이 모델이 너무 자꾸 멋을 내려고 한다는 걸 깨달았습니다. 움직임이 둥둥 떠다니는 느낌이었어요. 그 작은 불만이 저를 1주일의 테스트, 몇몇 실패한 렌더, 그리고 제가 미리 알았으면 좋았을 패턴들을 발견하도록 이끌었습니다.

“모션 컨트롤”이 실제로 의미하는 것

“Kling AI 모션 컨트롤”이라고 할 때, 사람들은 보통 세 가지를 동시에 의미합니다:

  • 피사체의 시간에 따른 움직임을 가이드합니다 (걷기, 미끄러지기, 회전, 제스처).
  • 카메라 움직임의 일관성을 유지합니다 (고정, 돌리 인, 느린 팬) 장면이 떨리지 않도록 합니다.
  • 소품, 조명 또는 물리학으로 즉흥적으로 표현하려는 모델의 욕구를 제한합니다.

실제로 모션 컨트롤은 After Effects의 키프레이밍과 같지 않고, 도로에 차선을 표시하는 것과 비슷합니다. 모든 프레임에 대한 정확한 좌표는 얻을 수 없지만, 모델이 설명한 것에 가깝게 유지되도록 경로를 좁힐 수 있습니다.

놀랐던 점: 좋은 모션 컨트롤은 대부분 모호함을 줄이는 것입니다. 프롬프트가 공간을 남기면 모델이 채우는데, 보통 카메라 움직임으로 채웁니다. 카메라와 배경을 명시적으로 설명하면 피사체의 움직임이 더 예측 가능해집니다. 제가 프롬프트 초반에 “삼각대, 고정 카메라, 줌 없음”이라고 썼을 때, 드리프트가 많이 줄어들었습니다. 완전히 없어진 건 아니지만, 관리 가능한 수준이 되었습니다.

제어할 수 있는 것 / 없는 것 (부분, 카메라, 포즈)

안정적으로 제어할 수 있었던 것들

  • 카메라 규율. “삼각대 샷, 고정 카메라, 줌 없음, 돌리 없음”이라고 말하는 것이 다른 어떤 라인보다도 도움이 되었습니다. 움직임을 원하면 정확히 하나만 말하세요: “느린 좌에서 우로의 팬, 일정한 속도.” 여러 움직임을 섞으면 혼란스러워했습니다.
  • 대략적인 피사체 움직임. 동사와 속도 단어가 작동합니다: “천천히 걷는다”, “부드럽게 미끄러진다”, “90도 회전한다”, “손을 들어 올려 손가락질한다”. “부드럽게”와 같은 부사는 “0.5 m/s”와 같은 숫자보다 더 잘 해석되었습니다.
  • 앵커 순간의 포즈. 저는 시간 슬라이스에서 포즈를 설명했을 때 더 나은 결과를 얻었습니다: “시작: 중립 자세. 중간: 오른손이 어깨 높이로 올라갑니다. 끝: 손이 내려갑니다.” 모델은 이를 비트로 해석했습니다.

여전히 불안정했던 것들

  • 세밀한 팔다리 경로. “팔꿈치 45도”는 보통 유지되지 않았습니다. “팔꿈치를 가깝게 모은다”가 더 잘 작동했습니다.
  • 마이크로 타이밍. 손 흔들기가 정확히 1초에 시작해야 한다면 약간의 드리프트를 예상하세요. 절대 초가 아닌 비트로 앵커링(“중간쯤에…”, “마지막 삼분의 일에…”)을 통해 더 가깝게 얻었습니다.
  • 물리학적으로 완벽한 충돌. 슬라이딩 물체가 때때로 마찰이 없는 느낌을 주었습니다. 표면 세부 사항 추가(“거칠은 참나무 탁상면, 보이는 나뭇결”)가 조금 도움이 되었지만, 물리 엔진은 아닙니다.

ControlNet이나 MoCap 분야에서 오는 경우: Kling은 일부 래퍼에서 컨디셔닝(포즈, 마스크)을 수용하지만, 평문과 조심스러운 네거티브가 간단한 샷에서 80%까지 갈 수 있었습니다.

WaveSpeed 설정 (모델 + 프리셋)

여러 UI에서 Kling 위에 있는 “WaveSpeed” 프리셋을 계속 봤습니다. 래퍼마다 이름은 다르지만, 개념은 일관성이 있었습니다: 멋진 카메라 움직임보다 더 부드러운 속도 곡선을 선호합니다. 현재 Kling 비디오 모델을 WaveSpeed 스타일의 프리셋과 함께 사용했을 때, 더 안정적인 피사체 움직임과 더 적은 마이크로 줌을 얻었습니다.

제 기본 설정:

  • 모델: 테스트 당시 대시보드에서 사용 가능한 최신 Kling 비디오/모션 모델.
  • 프리셋: “WaveSpeed” 또는 안정적인 모션, 일정한 속도, 또는 삼각대 바이어스를 언급하는 프리셋.
  • 모션 강조: 중간. 높음은 때때로 질감 변화를 과도하게 억제했습니다: 낮음은 카메라가 방황하도록 놔두었습니다.

UI에 “WaveSpeed”가 없으면 “부드러운 속도”, “일정한 움직임”, 또는 “카메라 스태빌라이저”와 같은 토글을 찾으세요. 다른 이름으로 같은 의도입니다.

이와 같은 설정에서 우리는 자신의 WaveSpeed를 사용합니다 — 움직임을 안정적으로 유지하고, 프리셋을 일관성 있게 하며, 재시도를 줄입니다. 이것이 바로 우리 팀이 Kling AI 모션 컨트롤을 처리하는 방식입니다.

단계별 워크플로우

여기가 제가 가장 적은 재시도를 생산한 경로입니다.

  1. 샷을 단어로 프레이밍하기

    • 카메라로 시작하세요: “삼각대, 고정 카메라, 줌 없음.” 또는 의도적인 움직임을 하나 이름지으세요. 첫 문장에 이것을 넣으세요.
    • 배경을 고정하세요: “평면 스튜디오 배경”, “낮 시간 부엌, 정적”, “텅 빈 복도, 엑스트라 없음”. 변동을 줄입니다.
  2. 피사체와 정체성 설명하기

    • 명확한 피사체 정체성과 2~3개의 앵커: 의류, 색상 팔레트, 소품. 참고 이미지가 있으면 사용하세요.
  3. 비트에서 모션 지정하기

    • 시작 / 중간 / 끝. 동사와 속도 단어를 사용하세요. 같은 비트에서 여러 동작을 섞지 마세요.
  4. 모션을 보호하는 네거티브 추가하기

    • “카메라 흔들림 없음, 줌 없음, 컷 없음, 타임랩스 없음, 텔레포팅 없음.” 우스꽝스럽게 들리지만, 작동합니다.
  5. 렌더링 전 지속 시간 및 가로세로 비율 설정하기

    • 저는 더 타이트한 제어를 위해 4~6초를 유지했습니다. 더 긴 클립은 드리프트를 초대했습니다.
  6. 저해상도/빠른 통과 수행하기

    • UI가 드래프트 모드를 허용하면 저해상도로 먼저 모션을 테스트하세요. 이런 식으로 70%의 문제를 잡았습니다.
  7. 작은 편집으로 반복하기

    • 실행당 한 변수만 변경하세요: 카메라, 속도 단어, 또는 단일 비트. 큰 프롬프트 편집은 큰 예측 불가능성을 야기했습니다.
  8. 좋은 시드 잠그기

    • 테이크가 가깝다면 시드를 잠그고 거기서 약간 수정하세요. 그렇지 않으면 유령을 쫓는 것으로 끝납니다.

이것이 항상 벽시계 시간을 절약한 것은 아니었지만, 정신적 부하를 줄였습니다. “뭐가 바뀌었지?”하는 순간이 적어졌습니다.

프롬프트 구조 템플릿

저는 간단한 스캐폴드를 사용하고 빈칸을 채웁니다. 복사하고, 수정하고, 필요 없는 것은 무시하세요.

컨텍스트

  • 카메라: [삼각대/고정 또는 명확한 움직임 하나]
  • 배경: [짧은 정적 설명]
  • 지속 시간: [X초], [가로세로 비율]

피사체

  • [누구/무엇], [2~3개 정체성 앵커]

모션 비트

  • 시작: [포즈/동작]
  • 중간: [포즈/동작]
  • 끝: [포즈/동작]

스타일 힌트 (선택사항)

  • [조명], [질감 세부], [현실적 vs 스타일화]

보호 네거티브

  • 카메라 흔들림 없음, 줌 없음, 컷 없음, 타임랩스 없음, 모션 블러 과장 없음, 추가 캐릭터 없음

이 형식은 Kling AI 모션 컨트롤을 즉흥 파트너보다 안정적인 어시스턴트처럼 행동하게 만들었습니다.

5가지 복사-붙여넣기 예제

짧고 실용적이며 테스트됨. 세부 사항을 바꾸되 기본 구조는 유지하세요.

1. 제품이 테이블을 미끄러져 가기 (삼각대)

카메라: 삼각대, 고정 카메라, 줌 없음. 배경: 깨끗한 참나무 탁상면, 부드러운 낮 시간 빛. 지속 시간: 5초, 16:9. 피사체: 파란색 줄무늬가 있는 흰색 도자기 머그. 모션: 시작: 머그가 왼쪽에, 정지. 중간: 머그가 중심으로 미끄러져, 일정한 속도. 끝: 머그가 중심에서 멈춤, 부드러운 이즈아웃. 스타일: 현실적, 미세한 반사, 부드러운 그림자. 네거티브: 카메라 흔들림 없음, 타임랩스 없음, 틸트 없음, 추가 소품 없음.

2. 인간 손 흔들기, 간단한 타이밍

카메라: 삼각대, 고정, 눈높이. 배경: 평면 스튜디오 회색. 지속 시간: 4초, 9:16. 피사체: 녹색 후드, 곱슬머리, 중립적 표정을 한 사람. 모션: 시작: 팔 내려짐. 중간: 오른손이 어깨 높이로 올라가 두 번 흔들림, 작은 움직임. 끝: 손이 내려감, 중립 자세. 스타일: 부드러운 키 라이트, 자연스러운 피부톤. 네거티브: 줌 없음, 컷 없음, 배경 캐릭터 없음, 머리 회전 없음.

3. 피사체 걷기와 함께 느린 팬

카메라: 느린 우에서 좌로의 팬, 일정한 속도. 배경: 조용한 도시 인도, 이른 아침. 지속 시간: 6초, 16:9. 피사체: 빨간 배낭을 들고 있는 어른, 데님 자켓. 모션: 시작: 피사체가 프레임 우측에서 진입, 천천히 걷기. 중간: 꾸준한 걷기, 눈이 앞을 봄. 끝: 팬이 끝나면서 프레임 좌측으로 나감. 스타일: 근거 있는 현실주의, 부드러운 명암. 네거티브: 점프 컷 없음, 렌즈 숨쉬기 없음, 뛰기 없음.

4. 책상 위 손 시연

카메라: 탑다운, 고정 카메라, 줌 없음. 배경: 목재 책상에 커팅 매트. 지속 시간: 5초, 1:1. 피사체: 검은색 펜을 놓는 오른손. 모션: 시작: 빈 책상. 중간: 손이 아래쪽에서 진입, 펜을 놓음, 90도 회전. 끝: 손이 나감, 펜은 남음. 스타일: 선명함, 최소 그림자, 명확한 모서리. 네거티브: 추가 도구 없음, 떨림 없음, 색상 이동 없음.

5. 로고 카드 당기기

카메라: 삼각대, 고정, 클로즈업. 배경: 중립 종이 배경. 지속 시간: 4초, 4:5. 피사체: [당신의 로고가 있는 작은 카드]. 모션: 시작: 카드가 프레임 아래 밖. 중간: 카드가 중심으로 위로 미끄러져 유지. 끝: 약간의 정착, 바운스 없음. 스타일: 깨끗함, 현실적 질감, 매크로 느낌. 네거티브: 시차 없음, 카메라 푸시인 없음, 추가 텍스트 없음.

일반적인 실패 + 해결책

  • 카메라 크리프 (마이크로 줌이나 작은 틸트) 해결책: 첫 줄에 “삼각대, 고정 카메라, 줌 없음”을 넣으세요. 완전한 잠금을 원하면 “돌리 없음, 팬 없음”을 추가하세요. 지속되면 지속 시간을 단축하거나 배경을 단순화하세요.

  • 모션이 너무 둥둥 떠다니는 느낌 해결책: “일정한 속도”, “부드러운 이즈아웃” 사용 또는 마찰이 있는 표면 이름짓기 (“거친 린넨, 끈기 있는 러버 매트”). 때때로 WaveSpeed 같은 프리셋으로 전환이 도움이 되었습니다.

  • 프레임 전체에서 정체성 드리프트 해결책: 더 강력한 정체성 앵커 (특정 의류, 색상) 또는 참고 이미지 사용. 근처에 오면 시드를 잠그세요. 반복 중간에 새 소품을 추가하지 마세요.

  • 배경 떨림 해결책: 배경 세부 사항 감소. “카페와 사람이 움직이는”보다 “평면 벽”이 더 낫습니다. 활발한 배경이 필요하면 모션 분산을 수용하거나 클립을 단축하세요.

최고의 내보내기 설정

클립을 편집기 (Premiere, Resolve, FCP)로 옮기는 경우, 깨끗한 내보내기는 많은 재인코딩을 절약합니다.

  • 지속 시간: 초기 통과는 짧게 유지하세요 (4~6초). 나중에 연결하세요.
  • 해상도: 타겟 배송에서 또는 그 근처에서 생성하세요. 사후 업스케일링은 괜찮지만, 이중 스케일링을 피하세요.
  • 프레임 레이트: 영화적 느낌을 위해 24fps, 제품/UI 데모를 위해 30fps, 정말 필요한 경우에만 60fps. 숫자보다 일관성이 중요합니다.
  • 코덱/컨테이너: 편집을 위해 ProRes 422 HQ 또는 DNxHR; 빠른 공유를 위해 H.264 High Profile. 도구가 H.264를 강제하면 더 높은 비트레이트를 설정해 밴딩을 피하세요 (예: 1080p에서 1520Mbps, 4K에서 3550Mbps).
  • 색상: 색 공간을 잠그세요. UI가 sRGB/Rec.709를 제공하면 하나를 선택하고 파이프라인 전체에서 유지하세요.

저는 또한 원본 시드와 프롬프트를 파일명이나 사이드카 텍스트에 유지합니다. 여섯 번의 렌더 후, 과거의 당신에게 감사할 것입니다.

이제 당신이 차례입니다 — 한 도둑 컵과 너무 많은 커피 충전된 밤에서 증류된 제 어렵게 얻은 Kling AI 모션 컨트롤 지혜입니다. Kling이 당신 클립에 추가한 가장 이상한 “멋”은 무엇입니까? 아래에 답글하세요!