#digital-human

37 articles

daVinci-MagiHuman: Опенсорс-модель, которая уничтожила всех конкурентов в генерации цифровых людей

daVinci-MagiHuman — это опенсорс-модель на 15 млрд параметров, генерирующая видео с синхронизацией губ за 2 секунды на одном H100. Превосходит Ovi 1.1 (80% побед) и LTX 2.3 (60,9%). Лицензия Apache 2.0, поддержка множества языков и молниеносная скорость.

2026-03-275 мин чтения

Знакомьтесь: daVinci MagiHuman Image-to-Video на WaveSpeedAI

daVinci MagiHuman Image-to-Video — это открытая модель на 15 млрд параметров, которая превращает референсные изображения в кинематографические видео с опциональной синхронизацией звука. Сопоставима с WAN 2.5. Разрешение до 1080p, длительность 5–10 секунд. REST API, $0.04/сек, без холодного старта.

2026-03-275 мин чтения

Представляем daVinci MagiHuman Text-to-Video на WaveSpeedAI

daVinci MagiHuman Text-to-Video генерирует кинематографические видео с акцентом на людей по текстовым запросам с поддержкой синхронизации звука. Модель с открытым исходным кодом на 15B параметров, разрешение до 1080p, длительность 5–10 секунд. REST API, $0.04/сек, без холодного старта.

2026-03-275 мин чтения

Представляем InfiniteTalk Fast Video-to-Video Multi на WaveSpeedAI

InfiniteTalk Fast с несколькими персонажами синхронизирует губы, преобразуя видео и две аудиодорожки в реалистичные видео с разговором или пением. На 50% дешевле стандартного, до 10 минут. Готовый REST API для инференса, лучшая производительность, без холодных стартов, доступные цены.

2026-03-184 мин чтения

Представляем InfiniteTalk Video-to-Video Multi на WaveSpeedAI

InfiniteTalk Video-to-Video Multi создаёт реалистичные видео с синхронизацией губ для нескольких персонажей на основе видео и двух аудиодорожек. Поддерживает разрешения 480p/720p, длительность до 10 минут, с полной согласованностью движений тела. Готовый REST API для инференса, максимальная производительность, без холодного старта, доступные цены.

2026-03-185 мин чтения

SkyReels V3 Говорящий Аватар: ИИ-видео говорящей головы из одной фотографии

SkyReels V3 Говорящий Аватар создаёт реалистичные видео говорящей головы из одного портретного фото и аудио. Синхронизация губ на 40+ языках. Попробуйте на WaveSpeedAI.

2026-03-037 мин чтения

SoulX FlashHead: ИИ-аватар в реальном времени со скоростью 96 FPS

SoulX FlashHead генерирует потоковые видео с говорящей головой в реальном времени со скоростью 96 FPS без дрейфа идентичности. Видео неограниченной длины. Попробуйте на WaveSpeedAI.

2026-03-037 мин чтения

Представляем WaveSpeedAI Longcat Avatar на WaveSpeedAI

LongCat Avatar создаёт сверхреалистичные видео с синхронизацией губ длительностью до 1 минуты с естественной динамикой и постоянной идентичностью персонажа. Преобразует одну фотографию + аудио в видео говорящего или поющего аватара, управляемое звуком (Image-to-Video), уровень 720p за $0,30/5с. Готовый REST API без холодных запусков

2025-12-265 мин чтения

Представляем WaveSpeedAI InfiniteTalk на WaveSpeedAI

InfiniteTalk преобразует одну фотографию + аудио в видео с говорящим или поющим аватаром, управляемым аудио (Image-to-Video), до 10 минут, уровень 720p $0,30/5с. Готовый REST API, без холодных запусков, доступные цены.

2025-12-215 мин чтения

Представляем WaveSpeedAI Live Avatar на WaveSpeedAI

Live Avatar генерирует видео с говорящим аватаром из опорного изображения и аудио, создавая реалистичные анимации синхронизации губ с естественными выражениями лица.

2025-12-165 мин чтения

Представляем Kuaishou Kling V1 AI Avatar Standard на WaveSpeedAI

Kling AI Avatar создает потрясающие AI-генерируемые видео-аватары для цифровой идентичности и создания контента, с ценой $0,25 за 5 секунд видео. Готовое к использованию REST API, без холодных запусков, доступные цены.

2025-11-265 мин чтения

Представляем WaveSpeedAI InfiniteTalk Multi на WaveSpeedAI

InfiniteTalk Multi преобразует одно изображение и два аудиовхода в видео с разговаривающими или поющими персонажами в разрешении до 720p. Готовый REST API для инференса, лучшая производительность, без холодных стартов, доступная цена.

2025-11-225 мин чтения