← Блог

Полное руководство по Seedance 2.0: мультимодальное создание видео

Seedance 2.0 теперь доступен на WaveSpeedAI. Освойте мультимодальную генерацию видео с помощью этого исчерпывающего руководства — комбинируйте изображения, видео, аудио и текст для точного управления движением, стилем и сторителлингом.

By WaveSpeedAI 10 min read

Уже доступно на WaveSpeedAI. Все 14 эндпоинтов Seedance 2.0 активны — уровни Standard и Fast с вариантами Turbo для запусков с минимальной задержкой.

Standard: T2V · I2V · T2V Turbo · I2V Turbo · Video Edit · Video Edit Turbo · Video Extend

Fast: T2V · I2V · T2V Turbo · I2V Turbo · Video Edit · Video Edit Turbo · Video Extend

Скидка 10% при запуске действует до 13 мая (UTC+0).

Seedance 2.0 представляет собой принципиальный сдвиг в генерации видео с помощью ИИ. Вместо того чтобы полагаться исключительно на текстовые подсказки или отдельные референсные изображения, эта модель принимает на вход изображения, видео, аудио и текст — позволяя вам управлять каждым аспектом создания, как настоящему кинорежиссёру.

Главная особенность — система референсов: вы можете задать визуальный стиль с помощью изображения, указать движение и работу камеры с помощью видео, задать ритм с помощью аудио и направить повествование с помощью текста. Результат — уровень контроля, который ранее был невозможен в генеративном видео.


Краткие характеристики

ПараметрСпецификация
Входные изображенияДо 9 изображений
Входные видеоДо 3 видео, максимум 15 с суммарно
Входное аудиоДо 3 MP3-файлов, максимум 15 с суммарно
Текстовый вводПодсказки на естественном языке
Длительность вывода4–15 секунд (на выбор пользователя)
АудиовыводНативные звуковые эффекты и музыка
Общий лимит файлов12 файлов на одну генерацию

При работе с несколькими файлами отдавайте приоритет материалам, которые оказывают наибольшее влияние на итоговый результат — будь то референсное видео для движения или изображение для сохранения внешности персонажа.


Как использовать референсы

Seedance 2.0 использует систему упоминаний через @, чтобы указать, как должен использоваться каждый загруженный материал. Это даёт вам явный контроль над тем, что каждый файл вносит в генерацию.

Точки входа

  • Режим первого/последнего кадра: используйте, когда нужно только начальное изображение и подсказка
  • Универсальный режим референсов: используйте для мультимодальных комбинаций (изображения + видео + аудио + текст)

Синтаксис @

После загрузки файлов ссылайтесь на них в подсказке, используя @ с идентификатором файла:

@Image1 as the first frame, reference @Video1 for camera movement,
use @Audio1 for background music

Примеры инструкций для референсов

Сценарий использованияШаблон подсказки
Задать первый кадр@Image1 as the first frame
Референс движенияReference @Video1 for the fighting choreography
Скопировать работу камерыFollow @Video1's camera movements and transitions
Добавить музыку/ритмUse @Audio1 for the background music
Продолжить видеоExtend @Video1 by 5 seconds
Заменить персонажаReplace the woman in @Video1 with @Image1

Основные возможности

1. Улучшенное базовое качество

Seedance 2.0 обеспечивает значительные улучшения в базовом качестве генерации:

  • Физическая точность: объекты падают, сталкиваются и взаимодействуют по законам реального мира
  • Плавное движение: естественное движение с правильным импульсом и тайминга
  • Точное следование инструкциям: модель понимает и выполняет сложные подсказки
  • Стилистическая согласованность: визуальная целостность сохраняется на протяжении всего видео

Пример подсказки:

A girl elegantly hanging laundry, finishing one piece and reaching
into the basket for another, shaking it out firmly.

Модель обрабатывает непрерывное действие, физику ткани и естественную механику тела без явного руководства.

2. Мультимодальная система референсов

Это ключевая особенность Seedance 2.0. Вы можете ссылаться практически на любой элемент из загруженных материалов:

  • Паттерны движения из референсных видео
  • Визуальные эффекты и переходы из креативных шаблонов
  • Внешность персонажей из референсных изображений
  • Техники съёмки из кинематографических примеров
  • Ритм и настроение аудио из музыкальных треков

Ключевой принцип: используйте естественный язык для описания того, что хотите взять в качестве референса. Конкретно указывайте, какой элемент (движение, стиль, камера, персонаж) должен быть извлечён из какого файла.

3. Согласованность персонажей и объектов

Предыдущие модели испытывали трудности с сохранением идентичности между кадрами. Seedance 2.0 решает эту проблему напрямую:

  • Согласованность лица: персонажи сохраняют свой внешний вид на протяжении всего видео
  • Сохранение деталей продукта: логотипы, текст и мелкие детали остаются точными
  • Согласованность сцены: окружение остаётся последовательным от кадра к кадру
  • Фиксация стиля: визуальный стиль не дрейфует в процессе генерации

Пример подсказки:

Man @Image1 comes home tired from work, walks down the hallway
slowing his pace, stops at the front door. Close-up of his face
as he takes a deep breath, adjusts his expression from stressed
to relaxed. Close-up of him finding his keys, inserting them into
the lock. He enters and his daughter and pet dog run to greet him
with a hug. The interior is warm and cozy, with natural dialogue
throughout.

4. Воспроизведение движения и работы камеры

Загрузите референсное видео, и Seedance 2.0 сможет извлечь и применить:

  • Сложную хореографию: боевые сцены, танцевальные движения, экшн-сцены
  • Техники съёмки: тележка, отслеживание, движение крана, ощущение съёмки с рук
  • Ритм монтажа: тайминг склейки, стили переходов, темп
  • Особые движения: зум Хичкока, хлещущие панорамы, орбитальные планы

Пример подсказки:

Reference @Image1 for the man's appearance in @Image2's elevator
setting. Fully replicate @Video1's camera movements and the
protagonist's facial expressions. Hitchcock zoom when startled,
then several orbit shots inside the elevator. Doors open, tracking
shot following him out. Exterior scene references @Image3, man
looks around. Reference @Video1's mechanical arm multi-angle
following shots tracking his line of sight.

5. Воспроизведение креативных шаблонов

Помимо движения, вы можете воспроизводить целые творческие концепции:

  • Рекламные форматы: демонстрация продукта, лайфстайл-монтаж, истории брендов
  • Визуальные эффекты: системы частиц, морфинг, стилизованные переходы
  • Киноприёмы: вступительные сцены, титры, драматические раскрытия
  • Стили монтажа: нарезка в стиле музыкального видео, темп документального кино, коммерческий ритм

Пример подсказки:

Replace the person in @Video1 with the girl in @Image1. Replace
the moon goddess CG with an angel referencing @Image2. When the
girl crouches, wings grow from her back. Wings sweep past camera
for transition. Reference @Video1's camera work and transitions.
Enter the next scene through the angel's pupil, aerial shot of
the angel (spiraling wings match the pupil), camera descends
following the angel's face, pulls back on arm raise to reveal
the stone angel statues in background. One continuous shot
throughout.

6. Расширение видео

Продолжайте существующие видео, сохраняя нарративную связность:

Пример подсказки:

Extend @Video1 by 15 seconds. Reference @Image1 and @Image2 for
the donkey-on-motorcycle character. Add a wild advertisement
sequence:

Scene 1: Side shot, donkey bursts through fence on motorcycle,
nearby chickens startled.

Scene 2: Donkey performs spinning stunts on sand, tire close-up
then aerial overhead shot of donkey doing circles, dust rising.

Scene 3: Mountain backdrop, donkey launches off slope, ad copy
appears behind through masking effect (text revealed as donkey
passes): "Inspire Creativity, Enrich Life". Final shot: motorcycle
passes, dust cloud rises.

7. Редактирование видео

Изменяйте существующие видео без повторной генерации с нуля:

  • Замена персонажей: замените одного человека другим, сохранив действие
  • Добавление/удаление элементов: добавляйте объекты, убирайте лишнее
  • Перенос стиля: применяйте новые визуальные обработки
  • Изменение повествования: меняйте направление истории

Пример подсказки:

Subvert the plot of @Video1. The man's expression shifts instantly
from tender to cold and ruthless. In the moment the woman least
expects it, he shoves her off the bridge into the water. The push
is decisive, premeditated, without hesitation—completely subverting
the romantic character setup. As she falls, no scream, only
disbelief in her eyes. She surfaces and shouts at him: "You were
lying to me from the start!" He stands on the bridge with a cold
smile and says quietly: "This is what your family owes mine."

8. Генерация с синхронизацией аудио

Seedance 2.0 генерирует видео с нативным аудио и может синхронизироваться с референсным звуком:

  • Синхронизация губ на нескольких языках
  • Звуковые эффекты, синхронизированные с действиями на экране
  • Фоновая музыка, следующая визуальному ритму
  • Озвучка с эмоциональной выразительностью

Пример подсказки:

Fixed shot. Fisheye lens looking down through circular opening.
Reference @Video1's fisheye effect. Make the horse from @Video2
look up at the fisheye lens. Reference @Video1's speaking motion.
Background audio references @Video3's sound effects.

9. Монтаж в ритм музыки

Создавайте контент в стиле музыкального видео, попадающий точно в биты:

Пример подсказки:

The girl in the poster keeps changing outfits. Clothing styles
reference @Image1 and @Image2. She holds the bag from @Image3.
Video rhythm references @Video1.

Для нескольких изображений, синхронизированных с музыкой:

Images @Image1 through @Image7 cut to the keyframe positions
and overall rhythm of @Video1. Characters in frame are more
dynamic. Overall style is more dreamlike. Strong visual impact.
Adjust reference image framing as needed for music and visual
flow. Add lighting changes between shots.

10. Непрерывность одного дубля

Генерируйте длинные непрерывные планы с последовательным движением:

Пример подсказки:

@Image1 through @Image5, one continuous tracking shot following
a runner up stairs, through corridors, onto the roof, ending
with an overhead view of the city.

Пример подсказки:

Spy thriller style. @Image1 as first frame. Front-facing tracking
shot of woman in red coat walking forward. Full shot following
her. Pedestrians repeatedly block the frame. She reaches a corner,
reference @Image2's corner architecture. Fixed shot as woman
exits frame, disappears around corner. A masked girl lurks at
the corner watching maliciously, mask girl appearance references
@Image3 (appearance only, she stands at the corner). Camera pans
forward toward woman in red. She enters a mansion and disappears.
Mansion references @Image4. No cuts. One continuous take.

Сферы применения

Реклама и e-commerce

Создавайте демонстрации продуктов с синхронизированным комментарием, лайфстайл-съёмкой и историями брендов. Мультимодальная система позволяет использовать существующие брендовые материалы как референс при создании нового контента.

Локализация контента

Генерируйте видеоадаптации на нескольких языках с нативной синхронизацией губ. Используйте оригинальное видео как референс для движения, генерируя новый диалог на других языках.

От раскадровки к видео

Преобразуйте статичные панели раскадровки в анимированные последовательности. Загрузите свои материалы как референсные изображения и опишите движение между ними.

Создание на основе шаблонов

Найдите понравившийся видеостиль, загрузите его как референс и генерируйте новый контент в этом стиле с собственными персонажами и декорациями.


Лучшие практики

  1. Явно указывайте референсы: чётко пишите, какой файл для каких целей. «Reference @Video1’s camera movement» лучше, чем просто упоминание видео.

  2. Расставляйте приоритеты в загрузках: при лимите в 12 файлов выбирайте материалы, оказывающие наибольшее влияние на результат.

  3. Проверяйте упоминания @: при наличии нескольких файлов дважды проверьте, что не перепутали, какое изображение, видео или аудио куда идёт.

  4. Различайте редактирование и референс: чётко указывайте, хотите ли вы отредактировать существующее видео или использовать его как референс для генерации нового.

  5. Выравнивание длительности: при продолжении видео установите длительность генерации, соответствующую длине нового контента (например, продлить на 5 с = генерировать 5 с).

  6. Используйте естественный язык: модель понимает контекст. Описывайте желаемое так, как описали бы человеку-редактору.


Попробуйте прямо сейчас

Seedance 2.0 уже доступен на WaveSpeedAI. Выберите вариант, подходящий для вашей задачи:

Скидка 10% при запуске действует до 13 мая (UTC+0). Ознакомьтесь с полным ассортиментом на странице коллекции Seedance 2.0.

Что дальше

Мультимодальные возможности Seedance 2.0 продолжают развиваться. Мы будем обновлять это руководство по мере появления новых функций и комбинаций входных данных.

Если вы столкнётесь с проблемами или у вас есть пожелания по функционалу, мы будем рады вашей обратной связи — именно так мы делаем инструмент лучше для всех.


Нужно меньше ограничений по контенту для конкретного кадра? Попробуйте эти альтернативы на WaveSpeedAI:

WAN 2.7 | Veo 3.1 Fast T2V | Veo 3.1 Fast I2V | Sora 2 T2V | Sora 2 I2V | Kling | Vidu

Поделиться