#digital-human
39 articles - Page 2
InfiniteTalk Fast ahora disponible en WaveSpeedAI
InfiniteTalk fast converts a photo + audio into audio-driven talking or singing avatar videos (Image-to-Video), up to 10 minutes. Ready-to-use REST API, no cold starts, affordable pricing.
Presentando PixVerse LipSync en WaveSpeedAI
PixVerse LipSync convierte audio en animaciones de sincronización labial realista con algoritmos avanzados para movimientos de boca precisos y sincronización de tiempo para avatares de video. API REST de inferencia lista para usar, mejor rendimiento, sin tiempos de espera, precios asequibles.
Presentamos Sync LipSync 2 en WaveSpeedAI
Sync Lipsync-2 sincroniza los movimientos de los labios en cualquier vídeo con el audio suministrado, permitiendo un alineamiento realista de la boca para películas, podcasts, videojuegos o animaciones. API de inferencia REST lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.
Presentando Veed LipSync en WaveSpeedAI
Genera animaciones de sincronización labial realistas a partir de audio con sincronización de alta calidad usando Veed LipSync; $0.15 por 5s de video. API de inferencia REST lista para usar, mejor rendimiento, sin inicios en frío, precios asequibles.
Presentación del Avatar Hunyuan de WaveSpeedAI en WaveSpeedAI
Hunyuan Avatar crea videos de personas hablando o cantando impulsados por audio a partir de una imagen + audio, en 480p/720p hasta 120s (a partir de $0,15/5s). API REST de inferencia lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.
Presentando WaveSpeedAI WAN 2.2 Speech To Video en WaveSpeedAI
Wan-2.2-S2V convierte imágenes y voz en videos de alta fidelidad con movimiento facial y corporal realista; soporta clips de hasta 10 minutos en 480p, desde $0.15/5s. API REST lista para usar, sin inicios en frío, precios accesibles.
Presentamos ByteDance Avatar OmniHuman 1.5 en WaveSpeedAI
OmniHuman 1.5 convierte señales de audio y visuales en animaciones de avatar realistas para humanos virtuales, narrativa e agentes interactivos. API de inferencia REST lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.
Presentación del Avatar ByteDance Omni Human en WaveSpeedAI
ByteDance OmniHuman convierte una foto de retrato en video avatar con movimiento y expresiones realistas ($0.12/seg). API REST de inferencia lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.
Introducción a Image Effects My World en WaveSpeedAI
My-World convierte fotos en arte de píxeles estilo Minecraft, recreando la estética pixelada y en bloques del juego. API de inferencia REST lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.
Presentamos Video Effects Cartoon Doll en WaveSpeedAI
Convierte fotos en videos de muñecas chibi animadas con animaciones suaves y divertidas. Efecto de imagen a video para avatares y clips de redes sociales. API REST de inferencia lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.
Presentamos ByteDance LipSync Audio To Video en WaveSpeedAI
ByteDance LipSync convierte audio en videos de personas hablando realistas generando movimientos labiales precisos totalmente sincronizados con el audio de entrada. API REST de inferencia lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.
Presentando ElevenLabs Eleven V3 Timing en WaveSpeedAI
ElevenLabs Eleven-V3 Timing convierte texto a voz natural y devuelve metadatos de alineación—marcas de tiempo de caracteres/palabras en JSON—para subtítulos precisos, efectos de karaoke y sincronización de labios. Soporta voice_id, similitud/estabilidad y Speaker Boost opcional. Precio de $0.10 por 1,000 caracteres. Listo para usar