#digital-human
38 articles
daVinci-MagiHuman: Опенсорс-модель, которая уничтожила всех конкурентов в генерации цифровых людей
daVinci-MagiHuman — это опенсорс-модель на 15 млрд параметров, генерирующая видео с синхронизацией губ за 2 секунды на одном H100. Превосходит Ovi 1.1 (80% побед) и LTX 2.3 (60,9%). Лицензия Apache 2.0, поддержка множества языков и молниеносная скорость.
Знакомьтесь: daVinci MagiHuman Image-to-Video на WaveSpeedAI
daVinci MagiHuman Image-to-Video — это открытая модель на 15 млрд параметров, которая превращает референсные изображения в кинематографические видео с опциональной синхронизацией звука. Сопоставима с WAN 2.5. Разрешение до 1080p, длительность 5–10 секунд. REST API, $0.04/сек, без холодного старта.
Представляем daVinci MagiHuman Text-to-Video на WaveSpeedAI
daVinci MagiHuman Text-to-Video генерирует кинематографические видео с акцентом на людей по текстовым запросам с поддержкой синхронизации звука. Модель с открытым исходным кодом на 15B параметров, разрешение до 1080p, длительность 5–10 секунд. REST API, $0.04/сек, без холодного старта.
Представляем InfiniteTalk Fast Video-to-Video Multi на WaveSpeedAI
InfiniteTalk Fast с несколькими персонажами синхронизирует губы, преобразуя видео и две аудиодорожки в реалистичные видео с разговором или пением. На 50% дешевле стандартного, до 10 минут. Готовый REST API для инференса, лучшая производительность, без холодных стартов, доступные цены.
Представляем InfiniteTalk Video-to-Video Multi на WaveSpeedAI
InfiniteTalk Video-to-Video Multi создаёт реалистичные видео с синхронизацией губ для нескольких персонажей на основе видео и двух аудиодорожек. Поддерживает разрешения 480p/720p, длительность до 10 минут, с полной согласованностью движений тела. Готовый REST API для инференса, максимальная производительность, без холодного старта, доступные цены.
SkyReels V3 Говорящий Аватар: ИИ-видео говорящей головы из одной фотографии
SkyReels V3 Говорящий Аватар создаёт реалистичные видео говорящей головы из одного портретного фото и аудио. Синхронизация губ на 40+ языках. Попробуйте на WaveSpeedAI.
SoulX FlashHead: ИИ-аватар в реальном времени со скоростью 96 FPS
SoulX FlashHead генерирует потоковые видео с говорящей головой в реальном времени со скоростью 96 FPS без дрейфа идентичности. Видео неограниченной длины. Попробуйте на WaveSpeedAI.
Представляем WaveSpeedAI Longcat Avatar на WaveSpeedAI
LongCat Avatar создаёт сверхреалистичные видео с синхронизацией губ длительностью до 1 минуты с естественной динамикой и постоянной идентичностью персонажа. Преобразует одну фотографию + аудио в видео говорящего или поющего аватара, управляемое звуком (Image-to-Video), уровень 720p за $0,30/5с. Готовый REST API без холодных запусков
Представляем WaveSpeedAI InfiniteTalk на WaveSpeedAI
InfiniteTalk преобразует одну фотографию + аудио в видео с говорящим или поющим аватаром, управляемым аудио (Image-to-Video), до 10 минут, уровень 720p $0,30/5с. Готовый REST API, без холодных запусков, доступные цены.
Представляем WaveSpeedAI Live Avatar на WaveSpeedAI
Live Avatar генерирует видео с говорящим аватаром из опорного изображения и аудио, создавая реалистичные анимации синхронизации губ с естественными выражениями лица.
Представляем Kuaishou Kling V1 AI Avatar Standard на WaveSpeedAI
Kling AI Avatar создает потрясающие AI-генерируемые видео-аватары для цифровой идентичности и создания контента, с ценой $0,25 за 5 секунд видео. Готовое к использованию REST API, без холодных запусков, доступные цены.
Представляем WaveSpeedAI InfiniteTalk Multi на WaveSpeedAI
InfiniteTalk Multi преобразует одно изображение и два аудиовхода в видео с разговаривающими или поющими персонажами в разрешении до 720p. Готовый REST API для инференса, лучшая производительность, без холодных стартов, доступная цена.