Veo 3.1: конкурент Sora 2 от OpenAI уже в пути

Veo 3 открыл новую главу в создании видео с искусственным интеллектом — когда видео со звуком стало реальностью, а не просто мечтой. После запуска OpenAI Sora 2, Google быстро движется вперёд со своим следующим шагом. Veo 3.1 теперь доступен на WaveSpeedAI — с генерацией видео на основе референсов, плавной интерполяцией кадров и высокоразрешающимся выводом 1080p, позволяя создателям производить более согласованные, реалистичные видео с синхронизированным звуком.

Что такое Veo?

Veo — это семейство моделей видео Google, которые превращают текст или изображения в короткие видео со звуком — включая музыку, фоновый шум и диалоги. Существует две версии Veo 3: Veo 3 (Standard) – для высокого качества, кинематографических результатов. Veo 3 Fast – оптимизирована для более быстрого создания и тестирования.

Что нового в Veo 3.1

По сравнению с Veo 3, обновление 3.1 представляет собой upgrade фундаментальной модели — сочетающий более высокую визуальную реалистичность с генерацией аудио, учитывающей контекст и синхронизированной.

Это ближе всего к настоящему движку создания «текст-в-сцену» для кинопроизводства.

Более интеллектуальное визуально-звуковое слияние

Новая фундаментальная модель в Veo 3.1 сближает рассуждение о видео и аудио как никогда раньше.

Промпт: кинематографическое видео от первого лица, гиперреалистичное, 8k, захватывающий первый ряд на винтажных деревянных американских горках в Японии, полностью беспрепятственный вид. Сцена разворачивается в золотой час заката, создавая драматическое теплое освещение. В дали величественная заснеженная гора Фудзи ……

В Veo 3.0 сцена американских горок выглядела гладко, но была «немой» внутри — напряжения просто не было.

Теперь Veo 3.1 захватывает каждый крик, порыв ветра и металлический звон в идеальной синхронизации с движением, увлекая вас прямо в поездку.

Генерация на основе субъекта (R2V): Сохраняйте лица и объекты

В отличие от Veo 3.0, новый Veo 3.1 позволяет загружать 1–3 референсных изображения, позволяя модели сохранять визуальную согласованность на каждом кадре.

Это сохраняет лица, движения и окружение в выравнивании, устраняя дрейф персонажей или неловкие переходы на более длинных клипах.

Промпт: мужчина с бородой, в шапочке и защитных очках, сверлит деревянную стену. Сверло только что пробило стену, открывая яркое солнечное поле цветущих диких цветов с другой стороны. Мужчина приостановил бурение, его выражение лица изменилось на восхищение и восторг. Он отпустил дрель и стоит с раскинутыми руками, глядя на прекрасное поле цветов, как будто обнимая новый мир, который он только что открыл. Свет от поля цветов освещает его лицо и края стены.

Генерация с управлением кадрами: начало, конец и всё, что между ними

Теперь вы можете зафиксировать первый и последний кадры, и Veo 3.1 плавно заполнит всё остальное.

Промпт: молодой человек в элегантном сером костюме, держащий коричневый кожаный портфель, уверенно идёт по залитой солнцем городской улице с классической архитектурой……

Для кого Veo 3.1?

🎥 Цифровые презентаторы и аватары: корпоративное обучение, новости и развлечения.
🤖 Агенты обслуживания клиентов: реалистичные, разговорчивые видеоответы.
📚 Образование и электронное обучение: доставка долгоформатного учебного контента.
🌍 Локализация контента: масштабируемый дубляж с точной синхронизацией губ.

Попробуйте Veo 3.1 на WaveSpeedAI уже сегодня

Начните создавать с Veo 3.1 на WaveSpeedAI прямо сейчас! Посетите площадку, загрузите изображение по вашему выбору, введите свой текст и нажмите «Создать». Всего через несколько секунд ваше говорящее видео будет готово к редактированию.

🔗text-to-video
🔗text-to-video-fast
🔗image-to-video
🔗image-to-video-fast
🔗reference-to-video