← Блог

Представляем Alibaba WAN 2.6 Reference To Video Flash на WaveSpeedAI

Alibaba WAN 2.6 Reference-to-Video Flash превращает персонажей, реквизит или сцены из изображений или видео в новые видеокадры с сохранённой идентичностью, стилем и

By WaveSpeedAI 6 min read
Alibaba Wan.2.6 Reference To Video Flash
Alibaba Wan.2.6 Reference To Video Flash Alibaba WAN 2.6 Reference-to-Video Flash превращает персонаж...
Try it
Представляем Alibaba WAN 2.6 Reference To Video Flash на WaveSpeedAI

Alibaba WAN 2.6 Reference-to-Video Flash теперь доступен на WaveSpeedAI

Скорость встречается с последовательностью. WaveSpeedAI с радостью объявляет о запуске Alibaba WAN 2.6 Reference-to-Video Flash — быстрой, дистиллированной версии модели генерации видео с сохранением идентичности от Alibaba. Если вы работаете с рабочими процессами reference-to-video и хотели бы получать результаты быстрее, эта модель создана для вас — она обеспечивает ту же последовательность персонажей и многоплановое повествование за долю времени генерации.

Что такое WAN 2.6 Reference-to-Video Flash?

WAN 2.6 Reference-to-Video Flash — это оптимизированный по скорости аналог стандартной модели WAN 2.6 Reference-to-Video. Дистиллированная из полноразмерной модели, она сохраняет ключевую возможность, которая делает семейство WAN 2.6 R2V уникальным: вы загружаете референсные изображения персонажей, реквизита или сцен, пишете текстовый запрос с описанием нужного видео, и модель генерирует новые видеокадры, точно сохраняя идентичность и внешний вид ваших референсных объектов.

Версия Flash обеспечивает значительно более быстрый вывод — генерирует видео за секунды, а не минуты — при сохранении визуального качества, согласованности движения и сохранения идентичности, характерных для серии WAN 2.6. Она поддерживает до 5 референсных изображений, вывод в разрешении 720p и 1080p, длительность 5 или 10 секунд и опциональную синхронизированную генерацию звука.

Ключевые возможности

  • Мультиреференсный ввод: загружайте до 5 референсных изображений для управления генерацией. Несколько ракурсов одного объекта обеспечивают лучшее сохранение идентичности — значительное улучшение по сравнению с типичными рабочими процессами с одним референсом

  • Сохранение идентичности на скорости: модель Flash сохраняет черты лица, одежду, пропорции тела и отличительные характеристики ваших референсных объектов в каждом сгенерированном кадре — теперь со значительно сокращённым временем ожидания

  • Многоплановая композиция: выбирайте между единственным непрерывным кадром или автоматической многоплановой композицией, которая разбивает ваш запрос на несколько связных кадров с плавными переходами — кинематографическое повествование из одного вызова API

  • Встроенная генерация звука: включайте опциональный синхронизированный звук, включая фоновую музыку, окружающие звуки и звуковые эффекты, согласованные с сгенерированным видеоконтентом. Никакого дубляжа при постпродакшне

  • Гибкость разрешения: генерируйте в 720p (1280×720 или 720×1280) или 1080p (1920×1080 или 1080×1920) в соответствии с вашими требованиями — в горизонтальной или вертикальной ориентации

  • Расширение промпта: встроенный улучшитель промптов может автоматически дорабатывать ваши описания до более насыщенных и детальных запросов, повышая качество генерации без необходимости экспертного составления промптов

Реальные сценарии использования

Контент для социальных сетей с персонажами

Создавайте TikTok, Reels и YouTube Shorts с последовательными персонажами в нескольких видео. Загрузите несколько фотографий вашего персонажа или фирменного маскота, опишите сцену и генерируйте фирменный контент в масштабе. Скорость Flash делает быструю итерацию практичной — тестируйте десятки вариантов за то время, пока стандартная модель создаёт несколько.

Создание прототипов маркетинга и рекламы

Генерируйте демонстрации продуктов, брендовые ролики и концепции кампаний с конкретными людьми или персонажами с последовательной идентичностью во всех кадрах. Используйте многоплановый режим для создания структурированных рекламных последовательностей с синхронизированным звуком, сокращая дни препродакшна до минут.

Нарративное повествование и анимация

Создавайте короткие нарративные последовательности, в которых персонажи сохраняют свой внешний вид при смене сцен. Возможность мультиреференса позволяет задать несколько персонажей в одной генерации, а многоплановый режим автоматически обрабатывает переходы и темп. Сценаристы и художники раскадровки могут визуализировать сцены почти так же быстро, как описывают их.

Быстрая превизуализация для кино

Режиссёры и операторы могут превизуализировать кадры и последовательности, используя референсные фотографии актёров и локаций. Скорость модели Flash обеспечивает живой творческий цикл обратной связи — скорректируйте промпт, перегенерируйте и получите результат за секунды, не ожидая в длинных очередях рендера.

Видео для электронной коммерции и продуктов

Преобразуйте статичные фотографии продуктов в динамичные продуктовые видео с последовательным брендингом. Загрузите изображения продуктов в качестве референсов, опишите желаемое движение и окружение, и генерируйте полированный видеоконтент, готовый для листингов и рекламы.

Начало работы на WaveSpeedAI

Использование WAN 2.6 Reference-to-Video Flash через API WaveSpeedAI очень простое:

import wavespeed

output = wavespeed.run(
    "alibaba/wan-2.6/reference-to-video-flash",
    {
        "reference_urls": [
            "https://example.com/character-front.jpg",
            "https://example.com/character-side.jpg"
        ],
        "prompt": "A woman walks through a sunlit garden, turning to smile at the camera",
        "size": "1280*720",
        "duration": 5,
        "shot_type": "multi"
    },
)

print(output["outputs"][0])

Параметры конфигурации

ПараметрОписание
reference_urls1-5 референсных изображений для управления персонажем и сценой
promptТекстовое описание сцены и движения в видео
sizeРазрешение вывода: 720p или 1080p, горизонтальная или вертикальная
durationДлительность видео: 5 или 10 секунд
shot_typesingle для одного непрерывного кадра, multi для разнообразных композиций
enable_audioГенерировать синхронизированный звук (включено по умолчанию)
enable_prompt_expansionАвтоматически улучшать промпт (отключено по умолчанию)

Цены

РазрешениеДлительностьБез звукаСо звуком
720p5 сек$0.25$0.50
720p10 сек$0.375$0.75
1080p5 сек$0.40$0.80
1080p10 сек$0.60$1.20

Начиная всего с $0.25 за видео — ничтожная часть того, что сопоставимые модели берут за генерацию с сохранением идентичности.

Советы профессионалов

  • Используйте несколько референсных изображений с разных ракурсов для максимально точного сохранения идентичности
  • Выбирайте тип кадра multi для кинематографичных, динамичных композиций с автоматическими переходами
  • Отключайте звук, когда он не нужен — обработка идёт быстрее и стоит вдвое дешевле
  • Используйте 720p для быстрого прототипирования и черновиков, а затем переключайтесь на 1080p для финальных рендеров в продакшне
  • Добавьте негативный промпт вроде "blurry, distorted, deformed" для повышения чёткости результата
  • Если в сгенерированном видео нет звука, добавьте в промпт фразу вроде «with background ambience»

Почему WaveSpeedAI?

WaveSpeedAI предоставляет идеальную инфраструктуру для WAN 2.6 Reference-to-Video Flash:

  • Никаких холодных стартов: каждый запрос начинает обрабатываться немедленно — никакого ожидания инициализации модели
  • Быстрый вывод: оптимизированная инфраструктура в паре с дистиллированной архитектурой модели Flash означает, что вы получаете результаты за секунды
  • Доступные цены: генерация видео с сохранением идентичности начиная с $0.25, с прозрачной тарификацией за каждую генерацию
  • Простой REST API: добавляйте генерацию reference-to-video в любое приложение или рабочий процесс с помощью одного вызова API

Начните генерировать сегодня

Alibaba WAN 2.6 Reference-to-Video Flash привносит генерацию видео с сохранением идентичности в творческие рабочие процессы в реальном времени. Тот же мультиреференсный ввод, та же последовательность персонажей и то же многоплановое повествование — со скоростью, которую требуют ваши проекты.

Независимо от того, итерируете ли вы рекламные концепции, создаёте библиотеку контента с персонажами или превизуализируете сцены для продакшна, эта модель устраняет ожидание и позволяет сосредоточиться на творческой работе.

Попробуйте прямо сейчас на wavespeed.ai/models/alibaba/wan-2.6/reference-to-video-flash.

Поделиться