#digital-human
39 articles
daVinci-MagiHuman: O Modelo Open-Source que Acabou de Superar Todos os Geradores de Humanos Digitais
daVinci-MagiHuman é um modelo open-source de 15B que gera vídeos de cabeças falantes com lábios sincronizados em 2 segundos em um único H100. Supera Ovi 1.1 (taxa de vitória de 80%) e LTX 2.3 (60,9%). Licenciado Apache 2.0, multilíngue e extremamente rápido.
Apresentando o daVinci MagiHuman Text-to-Video no WaveSpeedAI
O daVinci MagiHuman Text-to-Video gera vídeos cinematográficos centrados em humanos a partir de prompts de texto com sincronização de áudio opcional. Modelo open-source de 15B, até 1080p, 5 a 10 segundos. API REST, $0,04/seg, sem cold starts.
Apresentando daVinci MagiHuman Image-to-Video no WaveSpeedAI
daVinci MagiHuman Image-to-Video é um modelo open-source de 15B que anima imagens de referência em vídeos cinematográficos com sincronização de áudio opcional. Equivalente ao WAN 2.5. Até 1080p, 5 a 10 segundos. API REST, $0,04/seg, sem cold starts.
Apresentando InfiniteTalk Fast Video-to-Video Multi no WaveSpeedAI
O InfiniteTalk Fast sincronização labial multi-personagem converte vídeo e duas faixas de áudio em vídeos realistas de pessoas falando ou cantando. 50% mais barato que o padrão, até 10 minutos. API REST de inferência pronta para uso, melhor desempenho, sem coldstarts, preços acessíveis.
Apresentando InfiniteTalk Video-to-Video Multi no WaveSpeedAI
InfiniteTalk Video-to-Video Multi cria vídeos realistas com múltiplos personagens sincronizados labialmente a partir de vídeo e duas entradas de áudio. Suporta 480p/720p, até 10 minutos, com coerência de corpo inteiro. API REST de inferência pronta para uso, melhor desempenho, sem cold starts e preços acessíveis.
SkyReels V3 Talking Avatar: Vídeo de Avatar Falante com IA a partir de Uma Foto
SkyReels V3 Talking Avatar gera vídeos realistas de avatar falante a partir de uma foto de retrato e áudio. Sincronização labial em mais de 40 idiomas. Experimente no WaveSpeedAI.
SoulX FlashHead: Cabeça Falante com IA em Tempo Real a 96 FPS
O SoulX FlashHead gera vídeos de cabeça falante em streaming em tempo real a 96 FPS sem nenhuma deriva de identidade. Vídeo de duração infinita. Experimente no WaveSpeedAI.
Apresentando WaveSpeedAI Longcat Avatar no WaveSpeedAI
LongCat Avatar produz geração de vídeo longo super realista e sincronizado com lábios com dinâmica natural e identidade consistente. Converte uma foto + áudio em vídeos de avatar falante ou cantante orientados por áudio (Image-to-Video), até 1 minuto, nível 720p $0,30/5s. API REST pronta para uso, sem coldstarts, afiliado
Apresentando WaveSpeedAI InfiniteTalk no WaveSpeedAI
InfiniteTalk converte uma foto + áudio em vídeos de avatar falante ou cantante acionados por áudio (Image-to-Video), até 10 minutos, camada 720p $0,30/5s. API REST pronta para usar, sem inicializações frias, preços acessíveis.
Apresentando WaveSpeedAI Live Avatar no WaveSpeedAI
Live Avatar gera vídeos de avatar falante a partir de uma imagem de referência e áudio, criando animações de sincronização labial realistas com expressões naturais.
Apresentando Kuaishou Kling V1 AI Avatar Standard no WaveSpeedAI
Kling AI Avatar produz avatares de vídeo gerados por IA impressionantes para identidade digital e criação de conteúdo, com vídeo sob demanda cobrado a $0,25 por 5 segundos. API REST pronta para usar, sem delays de inicialização, preços acessíveis.
Apresentando WaveSpeedAI InfiniteTalk Multi no WaveSpeedAI
InfiniteTalk Multi converte uma única imagem e duas entradas de áudio em vídeos de múltiplos personagens falando ou cantando em até 720p. API REST de inferência pronta para usar, melhor desempenho, sem inicializações lentas, preços acessíveis.