← 블로그

Alibaba WAN 2.7 Reference To Video, WaveSpeedAI에 출시

WAN 2.7 Reference-to-Video는 이미지나 동영상의 캐릭터, 소품 또는 장면 참조를 아이덴티티, 스타일, 레이아웃을 그대로 유지하면서 새로운 영상 샷으로 변환합니다

7 min read
Alibaba Wan.2.7 Reference To Video WAN 2.7 Reference-to-Video는 이미지나 동영상의 캐릭터, 소품 또는 장면 참조를 아이덴티...
Try it

Wan 2.7 Reference-to-Video: 다양한 레퍼런스로 캐릭터 일관성 있는 AI 영상 제작

AI 생성 영상 클립 전반에 걸쳐 캐릭터 정체성을 유지하는 것은 생성형 영상 분야에서 가장 어려운 문제 중 하나였습니다 — 지금까지는요. Alibaba Tongyi Lab의 Wan 2.7 Reference-to-Video는 여러 레퍼런스 영상과 이미지를 입력하면, 캐릭터·소품·시각적 스타일이 완벽하게 일관된 새로운 장면을 생성함으로써 이 문제를 해결합니다. 콜드 스타트 없이 합리적인 종량제 가격으로 WaveSpeedAI에서 지금 바로 사용할 수 있으며, 간단한 REST API를 통해 프로덕션 품질의 다중 캐릭터 영상 생성이 가능합니다.

복잡한 장면을 사전 시각화하는 영화감독이든, 대변인 캠페인을 제작하는 브랜드 팀이든, 다중 샷 내러티브를 구성하는 콘텐츠 크리에이터든 — Wan 2.7 Reference-to-Video는 AI 영상 워크플로를 괴롭혀 온 일관성 문제를 완전히 해소합니다.

Wan 2.7 Reference-to-Video의 작동 원리

Wan 2.7 Reference-to-Video는 Alibaba의 Diffusion Transformer(DiT) 아키텍처와 전체 어텐션(Full Attention) 메커니즘을 기반으로 하며, 전체 영상 시퀀스에 걸쳐 공간적·시간적 관계를 동시에 처리합니다. 모델이 프레임 단위로 생성하는 것이 아니라 전체 시퀀스를 한번에 이해하기 때문에, 클립 전 구간에 걸쳐 캐릭터 정체성이 안정적으로 유지됩니다.

워크플로는 간단합니다:

  1. 레퍼런스 영상 업로드 — 보존하고 싶은 캐릭터나 시각 요소가 담긴 소스 영상을 하나 이상 제공합니다.
  2. 선택적 레퍼런스 이미지 추가 — 추가적인 시각적 가이던스를 위해 정지 이미지를 보완할 수 있습니다.
  3. 프롬프트 작성 — 자연어로 새 장면을 설명하되, 캐릭터는 위치로 참조합니다(예: “Video 1의 캐릭터가 정원을 걸어가고 Video 2는 벤치에서 지켜본다”).
  4. 생성 — 모델이 참조된 캐릭터를 설명된 장면에 배치하되, 정체성·스타일·일관된 동작이 보존된 새 영상을 생성합니다.

최대 5개의 레퍼런스 입력(영상과 이미지 합산)을 지원하며, 720p 또는 1080p 해상도, 16:9 포함 다양한 화면비, 5·10·15초 클립 길이를 제공합니다. 고유한 프롬프트 인덱싱 시스템을 통해 어떤 레퍼런스가 어디에 등장할지 정밀하게 제어할 수 있습니다 — 영상은 순서대로 번호가 매겨지고(Video 1, Video 2), 이미지가 그 다음 번호를 이어받습니다(Image 3, Image 4).

Wan 2.7 Reference-to-Video의 주요 기능

  • 다중 영상 레퍼런스 지원 — 여러 소스 영상에서 캐릭터·오브젝트·시각 요소를 결합해 하나의 일관된 장면을 만듭니다. 같은 등급의 다른 모델 중에서 다중 소스 영상 레퍼런스를 이렇게 깔끔하게 처리하는 것은 없습니다.

  • 정체성 고정 캐릭터 일관성 — Full Attention 아키텍처가 얼굴 특징·의상·신체 비율·스타일 디테일을 생성 클립 전반에 걸쳐 보존하며, 구형 확산 기반 영상 모델에서 흔히 나타나는 정체성 드리프트가 없습니다.

  • 정밀 제어를 위한 프롬프트 인덱싱 — 프롬프트에서 “Video 1”, “Video 2”, “Image 3” 구문을 사용해 특정 캐릭터를 참조합니다. 생성된 장면에서 누가 무엇을 할지 감독 수준의 제어권을 부여합니다.

  • 네거티브 프롬프트 지원 — 출력에서 제외할 요소를 지정해 레퍼런스 소스 간의 의도치 않은 시각적 혼합을 방지합니다.

  • 자동 프롬프트 확장 — 프롬프트 확장을 활성화하면 모델이 짧은 프롬프트를 추가 디테일로 풍부하게 만들어, 수동 프롬프트 엔지니어링 없이도 더 풍성한 결과물을 생성합니다.

  • 1080p 출력 — 프로덕션 품질의 결과물을 위해 풀 HD 해상도로 생성하거나, 창작 과정의 반복 작업 시 720p를 사용해 더 빠르게 작업할 수 있습니다.

  • 클립당 최대 15초 — 캐릭터가 움직이고 상호작용하며 표현할 수 있는 더 긴 장면을 생성합니다 — 소셜 미디어 쇼츠와 광고 컷에 충분한 길이입니다.

Wan 2.7 Reference-to-Video 최적 활용 사례

다중 캐릭터 스토리텔링 및 단편 영화

별도의 레퍼런스 영상에 있는 캐릭터들을 실제로 함께 촬영한 적 없는 공유 장면에 배치합니다. 영화감독은 배우를 개별적으로 촬영한 후, Wan 2.7 R2V를 사용해 상호작용 장면을 생성할 수 있습니다 — 함께 앉거나, 나란히 걷거나, 새로운 환경에서 대화하는 캐릭터들. 인디 프로젝트와 사전 시각화의 제작 비용을 극적으로 절감합니다.

브랜드 대변인 영상 캠페인

마케팅 팀은 일관된 브랜드 대변인이나 마스코트가 등장하는 수십 가지 온브랜드 영상 변형을 생성할 수 있습니다. 브랜드 캐릭터의 레퍼런스 영상을 한 번 업로드하면, 다양한 환경에서 — 주방, 사무실, 야외 — 완벽한 시각적 정체성을 유지하며 해당 캐릭터를 생성할 수 있습니다. 재촬영이 필요 없습니다.

대규모 소셜 미디어 콘텐츠

콘텐츠 크리에이터는 대량으로 캐릭터 일관성 있는 숏폼 영상을 제작할 수 있습니다. 반복 등장하는 캐릭터나 페르소나의 레퍼런스 영상을 가져와 새로운 시나리오를 설명하면, 매일 새로운 콘텐츠를 생성할 수 있습니다. 정체성 보존 덕분에 시청자는 모든 게시물에서 캐릭터를 인식하게 되어, 제작 부담 없이 브랜드 일관성을 구축할 수 있습니다.

제품 데모 및 설명 영상

발표자의 레퍼런스 영상과 제품 이미지를 결합해 세련된 데모 영상을 생성합니다. 발표자는 새로운 맥락에서 제품과 상호작용하면서도 외모와 스타일을 유지합니다 — 이커머스 리스팅, 제품 출시, 튜토리얼 콘텐츠에 완벽합니다.

크리에이티브 기획 및 스토리보드

감독과 크리에이티브 팀은 본격적인 프로덕션에 착수하기 전에 다중 캐릭터 장면을 빠르게 프로토타이핑할 수 있습니다. 다양한 스테이징, 조명, 캐릭터 상호작용으로 장면의 10가지 변형을 몇 분 안에 생성합니다. 빠른 반복 작업은 720p로, 최종 컨셉은 1080p로 렌더링합니다.

팬 콘텐츠 및 캐릭터 크로스오버

서로 다른 소스의 시각적 요소를 하나의 일관된 장면으로 결합합니다. 다른 레퍼런스 영상의 캐릭터들이 자연스럽게 상호작용할 수 있어, 팬 아트·매시업·실험적 시각 스토리텔링을 위한 창의적 가능성을 열어줍니다.

교육 및 트레이닝 콘텐츠

여러 레슨에 걸쳐 일관된 강사 주도 영상 콘텐츠를 생성합니다. 강사의 레퍼런스를 한 번 업로드하면, 화이트보드 앞·실험실·현장 등 다양한 교육 환경에서 강사가 등장하는 영상을 제작할 수 있으며, 전체 강좌 시리즈에 걸쳐 시각적 연속성을 유지합니다.

Wan 2.7 Reference-to-Video 가격 및 API 접근

WaveSpeedAI는 Wan 2.7 Reference-to-Video를 명확한 생성당 가격으로 제공합니다:

길이720p1080p
5초$1.00$1.60
10초$1.50$2.40
15초$2.00$3.20

1080p 렌더링은 720p 요금의 1.6배입니다. 가격에는 레퍼런스 영상 처리를 위한 고정 오버헤드가 포함됩니다.

시작하는 데 몇 분이면 충분합니다. WaveSpeed SDK를 설치하고 첫 번째 API 호출을 해보세요:

import wavespeed

output = wavespeed.run(
    "alibaba/wan-2.7/reference-to-video",
    {
        "prompt": "The character in Video 1 walks through a sunlit garden, smiling and looking at the flowers",
        "videos": ["https://example.com/reference-video.mp4"],
        "resolution": "720p",
        "duration": 5,
    },
)

print(output["outputs"][0])

WaveSpeedAI는 Wan 2.7 Reference-to-Video를 콜드 스타트 없이 실행합니다 — 첫 번째 요청이 백 번째 요청만큼 빠릅니다. GPU 프로비저닝 지연도, 유휴 컴퓨팅 요금도 없습니다. 생성한 만큼만 지불합니다.

지금 Wan 2.7 Reference-to-Video 사용해보기 →

Wan 2.7 Reference-to-Video 최상의 결과를 위한 팁

  • 선명하고 구별되는 레퍼런스 영상을 사용하세요. 각 레퍼런스 영상이 시각적으로 더 뚜렷할수록, 모델이 출력에서 각 캐릭터의 정체성을 더 잘 보존합니다. 외모가 비슷한 피사체가 담긴 레퍼런스는 피하세요.

  • 프롬프트에서 인덱스로 캐릭터를 참조하세요. 어떤 캐릭터가 무엇을 하는지 지정할 때는 항상 “Video 1”, “Video 2” 등을 사용하세요. 번호는 영상의 업로드 순서를 따르며, 레퍼런스 이미지가 그 다음 번호를 이어받습니다.

  • 반복 작업은 720p로 시작하세요. 1080p 최종 렌더링을 결정하기 전에, 720p에서 장면 구성·프롬프트 표현·캐릭터 배치를 테스트하세요. 시간과 비용을 모두 절약할 수 있습니다.

  • 혼합 방지를 위해 네거티브 프롬프트를 사용하세요. 레퍼런스 소스 간에 시각적 스타일이 섞이는 경우, 네거티브 프롬프트를 추가해 원치 않는 특정 요소를 제외하세요.

  • 짧은 프롬프트에는 프롬프트 확장을 활성화하세요. 프롬프트가 짧거나 장면 디테일이 부족한 경우, 프롬프트 확장을 켜면 모델이 자동으로 영화적 디테일을 채워줍니다.

  • 레퍼런스 영상은 짧고 집중적으로 유지하세요. 보존하고자 하는 피사체가 명확하게 등장하는 레퍼런스 클립이, 길고 다양한 영상보다 더 나은 정체성 일관성을 만들어냅니다.

Wan 2.7 Reference-to-Video 자주 묻는 질문

Wan 2.7 Reference-to-Video란 무엇인가요?

Wan 2.7 Reference-to-Video는 Alibaba의 AI 영상 생성 모델로, 레퍼런스 영상과 이미지에 있는 캐릭터의 정체성·외모·스타일을 보존하면서 새로운 영상 장면을 생성합니다.

Wan 2.7 Reference-to-Video 비용은 얼마인가요?

720p 5초 클립 기준 $1.00부터 시작하며, 15초 1080p 영상은 $3.20까지 올라갑니다. 구독료는 없으며 WaveSpeedAI에서 생성당 요금을 지불합니다.

Wan 2.7 Reference-to-Video를 API로 사용할 수 있나요?

네. Wan 2.7 Reference-to-Video는 WaveSpeedAI에서 콜드 스타트 없이, 종량제 가격으로, WaveSpeed Python SDK를 통해 손쉽게 통합할 수 있는 REST API로 제공됩니다.

한 번에 레퍼런스 영상을 몇 개까지 사용할 수 있나요?

최대 5개의 레퍼런스 입력(영상과 이미지 합산)을 제공할 수 있습니다. 각 레퍼런스는 프롬프트에서 순차적으로 번호가 매겨져, 어떤 캐릭터가 어디에 등장할지 정밀하게 제어할 수 있습니다.

Wan 2.7 Reference-to-Video와 Wan 2.7 Image-to-Video의 차이점은 무엇인가요?

Wan 2.7 Image-to-Video는 단일 레퍼런스 이미지를 영상으로 애니메이션화합니다. Reference-to-Video는 여러 영상 레퍼런스를 받아 소스 전반에 걸쳐 정체성을 보존하고 일관된 정체성의 다중 캐릭터 장면을 가능하게 합니다 — 프로덕션 워크플로를 위한 근본적으로 다른 기능입니다.

Wan 2.7로 캐릭터 일관성 있는 영상 제작 시작하기

Wan 2.7 Reference-to-Video는 AI 영상 생성에서 이전까지 불가능했던 기능인 영상 레퍼런스로부터의 신뢰할 수 있는 다중 캐릭터 정체성 보존을 실현합니다. WaveSpeedAI의 즉각적인 추론과 간단한 API와 결합되어, 오늘 바로 프로덕션 워크플로에 활용할 수 있습니다.

Text-to-Video, Image-to-Video, Video Edit, Video Extend를 포함한 WaveSpeedAI의 전체 Wan 2.7 제품군을 살펴보세요.

WaveSpeedAI에서 Wan 2.7 Reference-to-Video 사용해보기 →