#digital-human

37 articles

daVinci-MagiHuman: O Modelo Open-Source que Acabou de Superar Todos os Geradores de Humanos Digitais

daVinci-MagiHuman é um modelo open-source de 15B que gera vídeos de cabeças falantes com lábios sincronizados em 2 segundos em um único H100. Supera Ovi 1.1 (taxa de vitória de 80%) e LTX 2.3 (60,9%). Licenciado Apache 2.0, multilíngue e extremamente rápido.

2026-03-27 6 min de leitura

Apresentando daVinci MagiHuman Image-to-Video no WaveSpeedAI

daVinci MagiHuman Image-to-Video é um modelo open-source de 15B que anima imagens de referência em vídeos cinematográficos com sincronização de áudio opcional. Equivalente ao WAN 2.5. Até 1080p, 5 a 10 segundos. API REST, $0,04/seg, sem cold starts.

2026-03-27 6 min de leitura

Apresentando o daVinci MagiHuman Text-to-Video no WaveSpeedAI

O daVinci MagiHuman Text-to-Video gera vídeos cinematográficos centrados em humanos a partir de prompts de texto com sincronização de áudio opcional. Modelo open-source de 15B, até 1080p, 5 a 10 segundos. API REST, $0,04/seg, sem cold starts.

2026-03-27 6 min de leitura

Apresentando InfiniteTalk Fast Video-to-Video Multi no WaveSpeedAI

O InfiniteTalk Fast sincronização labial multi-personagem converte vídeo e duas faixas de áudio em vídeos realistas de pessoas falando ou cantando. 50% mais barato que o padrão, até 10 minutos. API REST de inferência pronta para uso, melhor desempenho, sem coldstarts, preços acessíveis.

2026-03-18 5 min de leitura

Apresentando InfiniteTalk Video-to-Video Multi no WaveSpeedAI

InfiniteTalk Video-to-Video Multi cria vídeos realistas com múltiplos personagens sincronizados labialmente a partir de vídeo e duas entradas de áudio. Suporta 480p/720p, até 10 minutos, com coerência de corpo inteiro. API REST de inferência pronta para uso, melhor desempenho, sem cold starts e preços acessíveis.

2026-03-18 6 min de leitura

SkyReels V3 Talking Avatar: Vídeo de Avatar Falante com IA a partir de Uma Foto

SkyReels V3 Talking Avatar gera vídeos realistas de avatar falante a partir de uma foto de retrato e áudio. Sincronização labial em mais de 40 idiomas. Experimente no WaveSpeedAI.

2026-03-03 8 min de leitura

SoulX FlashHead: Cabeça Falante com IA em Tempo Real a 96 FPS

O SoulX FlashHead gera vídeos de cabeça falante em streaming em tempo real a 96 FPS sem nenhuma deriva de identidade. Vídeo de duração infinita. Experimente no WaveSpeedAI.

2026-03-03 8 min de leitura

Apresentando WaveSpeedAI Longcat Avatar no WaveSpeedAI

LongCat Avatar produz geração de vídeo longo super realista e sincronizado com lábios com dinâmica natural e identidade consistente. Converte uma foto + áudio em vídeos de avatar falante ou cantante orientados por áudio (Image-to-Video), até 1 minuto, nível 720p $0,30/5s. API REST pronta para uso, sem coldstarts, afiliado

2025-12-26 6 min de leitura

Apresentando WaveSpeedAI InfiniteTalk no WaveSpeedAI

InfiniteTalk converte uma foto + áudio em vídeos de avatar falante ou cantante acionados por áudio (Image-to-Video), até 10 minutos, camada 720p $0,30/5s. API REST pronta para usar, sem inicializações frias, preços acessíveis.

2025-12-21 6 min de leitura

Apresentando WaveSpeedAI Live Avatar no WaveSpeedAI

Live Avatar gera vídeos de avatar falante a partir de uma imagem de referência e áudio, criando animações de sincronização labial realistas com expressões naturais.

2025-12-16 5 min de leitura

Apresentando Kuaishou Kling V1 AI Avatar Standard no WaveSpeedAI

Kling AI Avatar produz avatares de vídeo gerados por IA impressionantes para identidade digital e criação de conteúdo, com vídeo sob demanda cobrado a $0,25 por 5 segundos. API REST pronta para usar, sem delays de inicialização, preços acessíveis.

2025-11-26 6 min de leitura

Apresentando WaveSpeedAI InfiniteTalk Multi no WaveSpeedAI

InfiniteTalk Multi converte uma única imagem e duas entradas de áudio em vídeos de múltiplos personagens falando ou cantando em até 720p. API REST de inferência pronta para usar, melhor desempenho, sem inicializações lentas, preços acessíveis.

2025-11-22 6 min de leitura