#digital-human

37 articles

daVinci-MagiHuman: El Modelo de Código Abierto que Acaba de Superar a Todos los Generadores de Humanos Digitales

daVinci-MagiHuman es un modelo de código abierto de 15B parámetros que genera videos de cabezas parlantes con sincronización labial en 2 segundos en una sola H100. Supera a Ovi 1.1 (80% de victorias) y LTX 2.3 (60,9%). Licencia Apache 2.0, multilingüe y ultrarrápido.

2026-03-27 6 min de lectura

Presentamos daVinci MagiHuman Image-to-Video en WaveSpeedAI

daVinci MagiHuman Image-to-Video es un modelo de código abierto de 15B que anima imágenes de referencia en videos cinematográficos con sincronización de audio opcional. A la par con WAN 2.5. Hasta 1080p, 5-10 segundos. API REST, $0.04/seg, sin arranques en frío.

2026-03-27 6 min de lectura

Presentando daVinci MagiHuman Text-to-Video en WaveSpeedAI

daVinci MagiHuman Text-to-Video genera videos cinematográficos centrados en humanos a partir de indicaciones de texto con sincronización de audio opcional. Modelo de código abierto de 15B, hasta 1080p, de 5 a 10 segundos. API REST, $0.04/seg, sin tiempos de espera en frío.

2026-03-27 7 min de lectura

Presentamos InfiniteTalk Fast Video-to-Video Multi en WaveSpeedAI

InfiniteTalk Fast sincronización labial multi-personaje convierte video y dos pistas de audio en videos realistas de personas hablando o cantando. 50% más económico que el estándar, hasta 10 minutos. API de inferencia REST lista para usar, máximo rendimiento, sin arranques en frío, precios asequibles.

2026-03-18 5 min de lectura

Presentamos InfiniteTalk Video-to-Video Multi en WaveSpeedAI

InfiniteTalk Video-to-Video Multi crea videos realistas de múltiples personajes con sincronización labial a partir de video y dos entradas de audio. Compatible con 480p/720p, hasta 10 minutos, con coherencia de cuerpo completo. API de inferencia REST lista para usar, máximo rendimiento, sin tiempos de espera de inicio y precios accesibles.

2026-03-18 6 min de lectura

SkyReels V3 Talking Avatar: Vídeo de cabeza parlante con IA a partir de una foto

SkyReels V3 Talking Avatar genera vídeos de cabeza parlante realistas a partir de una foto de retrato y audio. Sincronización labial en más de 40 idiomas. Pruébalo en WaveSpeedAI.

2026-03-03 8 min de lectura

SoulX FlashHead: Cabeza Parlante IA en Tiempo Real a 96 FPS

SoulX FlashHead genera videos de cabeza parlante en streaming en tiempo real a 96 FPS sin deriva de identidad. Video de duración infinita. Pruébalo en WaveSpeedAI.

2026-03-03 8 min de lectura

Presentando WaveSpeedAI Longcat Avatar en WaveSpeedAI

LongCat Avatar produce generación de vídeo largo súper realista y sincronizado con los labios con dinámica natural e identidad consistente. Convierte una foto + audio en vídeos de avatar hablante o cantante impulsados por audio (Imagen a vídeo), hasta 1 minuto, nivel 720p $0.30/5s. API REST lista para usar, sin inicios fríos, aff

2025-12-26 6 min de lectura

Presentando InfiniteTalk en WaveSpeedAI

InfiniteTalk convierte una foto + audio en videos de avatar hablando o cantando impulsados por audio (Imagen-a-Video), hasta 10 minutos, nivel 720p $0.30/5s. API REST lista para usar, sin arranques en frío, precios asequibles.

2025-12-21 7 min de lectura

Presentamos Live Avatar en WaveSpeedAI

Live Avatar genera videos de avatar parlante a partir de una imagen de referencia y audio, creando animaciones de sincronización de labios realistas con expresiones naturales.

2025-12-16 5 min de lectura

Presentamos Kuaishou Kling V1 AI Avatar Standard en WaveSpeedAI

Kling AI Avatar produce impresionantes avatares de video generados por IA para identidad digital y creación de contenido, con video bajo demanda facturado a $0,25 por 5 segundos. API REST lista para usar, sin tiempos de inicio fríos, precios asequibles.

2025-11-26 6 min de lectura

Presentando WaveSpeedAI InfiniteTalk Multi en WaveSpeedAI

InfiniteTalk Multi convierte una sola imagen y dos entradas de audio en videos de múltiples personajes hablando o cantando a hasta 720p. API REST de inferencia lista para usar, mejor rendimiento, sin inicios en frío, precios asequibles.

2025-11-22 6 min de lectura