#digital-human

37 articles - Page 2

Presenting WaveSpeedAI InfiniteTalk Fast on WaveSpeedAI

InfiniteTalk fast converts a photo + audio into speaking or singing avatar videos driven by audio (Image-to-Video), up to 10 minutes. Ready-to-use REST API, no cold starts, affordable pricing.

2025-11-21 6 min de leitura

Apresentando PixVerse LipSync no WaveSpeedAI

PixVerse LipSync converte áudio em animações de sincronização labial realistas com algoritmos avançados para movimentos de boca e timing precisos para avatares de vídeo. API de inferência REST pronta para usar, melhor desempenho, sem inicializações lentas, preços acessíveis.

2025-10-29 6 min de leitura

Apresentando Sync LipSync 2 no WaveSpeedAI

Sync Lipsync-2 sincroniza movimentos labiais em qualquer vídeo com áudio fornecido, permitindo alinhamento realista da boca para filmes, podcasts, jogos ou animações. API de inferência REST pronta para usar, melhor desempenho, sem inicializações lentas, preços acessíveis.

2025-10-28 7 min de leitura

Apresentando Veed LipSync no WaveSpeedAI

Gere animações de sincronização labial realistas a partir de áudio com sincronização de alta qualidade usando Veed LipSync; $0,15 por 5s de vídeo. API REST de inferência pronta para uso, melhor desempenho, sem inicializações a frio, preços acessíveis.

2025-10-27 6 min de leitura

Apresentando Hunyuan Avatar da WaveSpeedAI na WaveSpeedAI

Hunyuan Avatar cria vídeos de fala ou canto acionados por áudio a partir de uma imagem + áudio, em 480p/720p até 120s (começando em $0,15/5s). API de inferência REST pronta para usar, melhor desempenho, sem inicializações lentas, preços acessíveis.

2025-10-23 6 min de leitura

Apresentando WaveSpeedAI WAN 2.2 Speech To Video no WaveSpeedAI

Wan-2.2-S2V transforma imagens e fala em vídeos de alta fidelidade com movimento realista de rosto e corpo; suporta clipes de até 10 minutos em 480p, a partir de $0,15/5s. API REST pronta para usar, sem cold starts, preço acessível.

2025-10-19 6 min de leitura

Apresentando ByteDance Avatar Omni Human 1.5 no WaveSpeedAI

OmniHuman 1.5 converte sinais de áudio e visuais em animações de avatar realistas para humanos virtuais, narrativas e agentes interativos. API REST de inferência pronta para usar, melhor desempenho, sem inicializações frias, preços acessíveis.

2025-09-09 6 min de leitura

Apresentando ByteDance Avatar Omni Human no WaveSpeedAI

Bytedance OmniHuman transforma uma única foto de retrato em vídeo de avatar com movimento e expressões realistas ($0,12/seg). API REST de inferência pronta para usar, melhor desempenho, sem inicializações frias, preço acessível.

2025-09-09 6 min de leitura

Apresentando ByteDance LipSync Audio Para Vídeo no WaveSpeedAI

ByteDance LipSync transforma áudio em vídeos de fala realistas gerando movimentos labiais precisos totalmente sincronizados com o áudio de entrada. API REST de inferência pronta para usar, melhor desempenho, sem inicializações a frio, preços acessíveis.

2025-08-13 5 min de leitura

Apresentando ElevenLabs Eleven V3 Timing no WaveSpeedAI

ElevenLabs Eleven-V3 Timing converte texto em fala natural e retorna metadados de alinhamento—timestamps de caracteres/palavras em JSON—para legendas precisas, efeitos de karaokê e sincronização labial. Suporta voice_id, similaridade/estabilidade e Speaker Boost opcional. Preço de $0,10 por 1.000 caracteres. Pronto para u

2025-08-10 6 min de leitura

Apresentando ByteDance LatentSync no WaveSpeedAI

ByteDance LatentSync combina Stable Diffusion e TREPA para lip-sync de alta resolução end-to-end, oferecendo movimentos de boca precisos e realistas em vídeos gerados. API REST de inferência pronta para usar, melhor desempenho, sem coldstarts, preços acessíveis.

2025-07-17 6 min de leitura

Apresentando WaveSpeedAI Sam 3d Body no WaveSpeedAI

Modelo avançado de geração de corpo 3D SAM para criar modelos detalhados de corpo humano 3D a partir de imagens com segmentação baseada em máscara opcional. API de inferência REST pronta para usar, melhor desempenho, sem inicializações frias, preços acessíveis.

2025-07-16 6 min de leitura