#talking-head
6 articles
daVinci-MagiHuman: O Modelo Open-Source que Acabou de Superar Todos os Geradores de Humanos Digitais
daVinci-MagiHuman é um modelo open-source de 15B que gera vídeos de cabeças falantes com lábios sincronizados em 2 segundos em um único H100. Supera Ovi 1.1 (taxa de vitória de 80%) e LTX 2.3 (60,9%). Licenciado Apache 2.0, multilíngue e extremamente rápido.
Apresentando daVinci MagiHuman Image-to-Video no WaveSpeedAI
daVinci MagiHuman Image-to-Video é um modelo open-source de 15B que anima imagens de referência em vídeos cinematográficos com sincronização de áudio opcional. Equivalente ao WAN 2.5. Até 1080p, 5 a 10 segundos. API REST, $0,04/seg, sem cold starts.
Apresentando o daVinci MagiHuman Text-to-Video no WaveSpeedAI
O daVinci MagiHuman Text-to-Video gera vídeos cinematográficos centrados em humanos a partir de prompts de texto com sincronização de áudio opcional. Modelo open-source de 15B, até 1080p, 5 a 10 segundos. API REST, $0,04/seg, sem cold starts.
Apresentando InfiniteTalk Fast Video-to-Video Multi no WaveSpeedAI
O InfiniteTalk Fast sincronização labial multi-personagem converte vídeo e duas faixas de áudio em vídeos realistas de pessoas falando ou cantando. 50% mais barato que o padrão, até 10 minutos. API REST de inferência pronta para uso, melhor desempenho, sem coldstarts, preços acessíveis.
Apresentando InfiniteTalk Video-to-Video Multi no WaveSpeedAI
InfiniteTalk Video-to-Video Multi cria vídeos realistas com múltiplos personagens sincronizados labialmente a partir de vídeo e duas entradas de áudio. Suporta 480p/720p, até 10 minutos, com coerência de corpo inteiro. API REST de inferência pronta para uso, melhor desempenho, sem cold starts e preços acessíveis.
SoulX FlashHead: Cabeça Falante com IA em Tempo Real a 96 FPS
O SoulX FlashHead gera vídeos de cabeça falante em streaming em tempo real a 96 FPS sem nenhuma deriva de identidade. Vídeo de duração infinita. Experimente no WaveSpeedAI.