Alibaba WAN 2.6 Reference To Video Flash, WaveSpeedAI에 출시

Alibaba WAN 2.6 Reference-to-Video Flash, WaveSpeedAI에 출시

속도와 일관성의 만남. WaveSpeedAI는 Alibaba의 아이덴티티 보존 영상 생성 모델의 빠르고 경량화된 버전인 Alibaba WAN 2.6 Reference-to-Video Flash 출시를 발표하게 되어 기쁩니다. 레퍼런스-to-비디오 워크플로우를 사용하면서 결과물이 더 빨리 나오길 원하셨다면, 이 모델은 바로 여러분을 위해 만들어졌습니다. 동일한 캐릭터 일관성과 멀티샷 스토리텔링을 훨씬 짧은 생성 시간 내에 제공합니다.

WAN 2.6 Reference-to-Video Flash란?

WAN 2.6 Reference-to-Video Flash는 표준 WAN 2.6 Reference-to-Video 모델의 속도 최적화 버전입니다. 풀사이즈 모델에서 증류된 이 버전은 WAN 2.6 R2V 패밀리를 독보적으로 만드는 핵심 기능을 그대로 유지합니다. 캐릭터, 소품, 또는 장면의 레퍼런스 이미지를 업로드하고, 원하는 영상을 설명하는 텍스트 프롬프트를 작성하면, 모델이 레퍼런스 대상의 아이덴티티와 외형을 충실히 보존한 새로운 영상 샷을 생성합니다.

Flash 버전은 분 단위가 아닌 초 단위로 영상을 생성하는 획기적으로 빠른 추론 속도를 달성하면서도, WAN 2.6 시리즈를 정의하는 시각적 품질, 모션 일관성, 아이덴티티 보존 능력을 유지합니다. 최대 5개의 레퍼런스 이미지, 720p 및 1080p 출력, 5초 또는 10초 길이, 그리고 선택적 동기화 오디오 생성을 지원합니다.

주요 기능

멀티 레퍼런스 입력: 생성을 안내하기 위해 최대 5개의 레퍼런스 이미지를 업로드하세요. 동일 대상의 여러 각도와 시점을 활용하면 더 나은 아이덴티티 보존이 가능합니다. 일반적인 단일 레퍼런스 워크플로우보다 크게 향상된 기능입니다.
속도를 갖춘 아이덴티티 보존: Flash 모델은 생성된 모든 프레임에 걸쳐 레퍼런스 대상의 얼굴 특징, 의상, 체형, 고유한 특성을 유지하며, 이제 대기 시간이 대폭 줄었습니다.
멀티샷 구성: 단일 연속 샷 또는 프롬프트를 여러 개의 일관성 있는 샷으로 분리하여 부드러운 전환 효과를 제공하는 자동 멀티샷 구성 중에서 선택하세요. 단 하나의 API 호출로 영화적 스토리텔링을 구현합니다.
내장 오디오 생성: 배경 음악, 환경음, 폴리 효과 등 생성된 영상 콘텐츠에 맞게 동기화된 오디오를 선택적으로 활성화하세요. 후반 작업 더빙이 필요 없습니다.
해상도 유연성: 출력 요구 사항에 맞게 720p(1280×720 또는 720×1280) 또는 1080p(1920×1080 또는 1080×1920)로 생성하세요. 가로 또는 세로 방향 모두 지원합니다.
프롬프트 확장: 내장된 프롬프트 향상 기능이 설명을 더 풍부하고 상세한 프롬프트로 자동 정제하여, 전문적인 프롬프트 엔지니어링 없이도 생성 품질을 향상시킵니다.

실제 활용 사례

캐릭터 중심의 소셜 미디어 콘텐츠

여러 영상에 걸쳐 일관된 캐릭터가 등장하는 TikTok, Reels, YouTube Shorts를 제작하세요. 캐릭터나 브랜드 마스코트 사진 몇 장을 업로드하고, 장면을 설명하면 브랜드에 맞는 콘텐츠를 대규모로 생성할 수 있습니다. Flash의 빠른 속도 덕분에 빠른 반복 작업이 실용적으로 가능합니다. 표준 모델이 소수의 결과를 생성하는 시간에 수십 가지 변형을 테스트할 수 있습니다.

마케팅 및 광고 프로토타이핑

모든 샷에서 일관된 아이덴티티를 유지하는 특정 인물이나 캐릭터가 등장하는 제품 데모, 브랜드 광고, 캠페인 콘셉트를 생성하세요. 멀티샷 모드를 사용하면 동기화된 오디오까지 갖춘 구조화된 광고 시퀀스를 제작하여 사전 제작에 드는 며칠을 단 몇 분으로 단축할 수 있습니다.

내러티브 스토리텔링 및 애니메이션

장면 전환에 걸쳐 캐릭터의 외형이 유지되는 짧은 내러티브 시퀀스를 구축하세요. 멀티 레퍼런스 기능으로 단일 생성에서 여러 캐릭터를 설정할 수 있으며, 멀티샷 모드가 전환과 페이싱을 자동으로 처리합니다. 작가와 스토리보드 아티스트가 장면을 묘사하는 속도만큼 빠르게 시각화할 수 있습니다.

영화를 위한 빠른 사전 시각화

감독과 촬영 감독이 배우와 촬영지의 레퍼런스 사진을 사용하여 샷과 시퀀스를 사전 시각화할 수 있습니다. Flash 모델의 속도는 실시간 창작 피드백 루프를 가능하게 합니다. 긴 렌더 대기열을 기다릴 필요 없이 프롬프트를 조정하고 재생성하여 초 단위로 결과를 확인하세요.

이커머스 및 제품 영상

일관된 브랜딩으로 정적인 제품 사진을 역동적인 제품 영상으로 변환하세요. 제품 이미지를 레퍼런스로 업로드하고, 원하는 모션과 환경을 설명하면 목록 및 광고에 바로 사용할 수 있는 세련된 영상 콘텐츠를 생성할 수 있습니다.

WaveSpeedAI에서 시작하기

WaveSpeedAI API를 통해 WAN 2.6 Reference-to-Video Flash를 사용하는 방법은 간단합니다:

import json
import os
import time
from urllib.request import Request, urlopen

api_key = os.environ["WAVESPEED_API_KEY"]
headers = {"Authorization": f"Bearer {api_key}", "Content-Type": "application/json"}
payload = {
    "reference_urls": [
        "https://interactive-examples.mdn.mozilla.net/media/cc0-images/painted-hand-298-332.jpg"
    ],
    "prompt": "A cinematic ocean wave at sunrise, highly detailed",
    "size": "1280*720",
    "duration": 5,
    "shot_type": "single",
    "enable_audio": True,
    "enable_prompt_expansion": False,
    "seed": -1
}

def request_json(url, data=None):
    request = Request(url, data=data, headers=headers, method="POST" if data else "GET")
    with urlopen(request) as response:
        return json.load(response)

# 1. Submit the prediction.
submit_body = request_json("https://api.wavespeed.ai/api/v3/alibaba/wan-2.6/reference-to-video-flash", json.dumps(payload).encode())
task = submit_body.get("data", submit_body)
prediction_id = task.get("id")
if not prediction_id:
    raise RuntimeError("Submission response did not contain a prediction id")
result_url = task.get("urls", {}).get("get") or f"https://api.wavespeed.ai/api/v3/predictions/{prediction_id}/result"

# 2. Poll until the prediction finishes.
while True:
    body = request_json(result_url)
    result = body.get("data", body)
    status = result.get("status")
    if status == "completed":
        print(result.get("outputs", []))
        break
    if status in {"failed", "cancelled", "timeout"}:
        raise RuntimeError(result)
    if status not in {"created", "processing"}:
        raise RuntimeError(f"Unexpected status: {status}")
    time.sleep(2)

설정 옵션

파라미터	설명
`reference_urls`	캐릭터 및 장면 안내를 위한 1~5개의 레퍼런스 이미지
`prompt`	영상 장면과 모션에 대한 텍스트 설명
`size`	출력 해상도: 720p 또는 1080p, 가로 또는 세로 방향
`duration`	영상 길이: 5초 또는 10초
`shot_type`	연속 단일 샷은 `single`, 다양한 구성은 `multi`
`enable_audio`	동기화된 오디오 생성 (기본값: 활성화)
`enable_prompt_expansion`	프롬프트 자동 향상 (기본값: 비활성화)

가격

해상도	길이	오디오 비활성화	오디오 활성화
720p	5초	$0.25	$0.50
720p	10초	$0.375	$0.75
1080p	5초	$0.40	$0.80
1080p	10초	$0.60	$1.20

영상당 단 $0.25부터 시작 — 아이덴티티 일관성 있는 생성을 제공하는 유사 모델 대비 훨씬 저렴한 가격입니다.

유용한 팁

가장 정확한 아이덴티티 보존을 위해 다양한 각도의 레퍼런스 이미지를 여러 장 사용하세요
자동 전환이 포함된 영화적이고 역동적인 구성을 위해 multi 샷 타입을 선택하세요
오디오가 필요 없을 때는 비활성화하세요. 처리 속도가 빠르고 비용이 절반으로 줄어듭니다
빠른 프로토타이핑과 초안에는 720p를 사용하고, 최종 프로덕션 렌더링에는 1080p로 전환하세요
"blurry, distorted, deformed"와 같은 네거티브 프롬프트를 추가하여 출력 품질을 높이세요
생성된 영상에 소리가 없다면, 프롬프트에 “with background ambience”와 같은 표현을 추가해 보세요

왜 WaveSpeedAI인가?

WaveSpeedAI는 WAN 2.6 Reference-to-Video Flash를 위한 이상적인 인프라를 제공합니다:

콜드 스타트 없음: 모든 요청이 즉시 처리를 시작합니다. 모델 초기화를 기다릴 필요가 없습니다.
빠른 추론: 최적화된 인프라와 Flash 모델의 경량화된 아키텍처의 조합으로 초 단위의 결과를 얻을 수 있습니다.
합리적인 가격: 아이덴티티 일관성 있는 영상 생성을 $0.25부터, 생성 단위의 투명한 청구 방식으로 제공합니다.
간단한 REST API: 단 하나의 API 호출로 레퍼런스-to-비디오 생성을 모든 애플리케이션이나 워크플로우에 통합할 수 있습니다.

지금 바로 생성을 시작하세요

Alibaba WAN 2.6 Reference-to-Video Flash는 아이덴티티 보존 영상 생성을 실시간 창작 워크플로우에 적용할 수 있게 해줍니다. 동일한 멀티 레퍼런스 입력, 동일한 캐릭터 일관성, 동일한 멀티샷 스토리텔링을 프로젝트가 요구하는 속도로 제공합니다.

광고 콘셉트를 반복적으로 개선하거나, 캐릭터 중심의 콘텐츠 라이브러리를 구축하거나, 프로덕션을 위한 장면을 사전 시각화하는 경우 모두, 이 모델은 대기 시간을 없애고 창작 작업에만 집중할 수 있게 해줍니다.

지금 바로 wavespeed.ai/models/alibaba/wan-2.6/reference-to-video-flash에서 사용해 보세요.