#digital-human
39 articles
daVinci-MagiHuman: El Modelo de Código Abierto que Acaba de Superar a Todos los Generadores de Humanos Digitales
daVinci-MagiHuman es un modelo de código abierto de 15B parámetros que genera videos de cabezas parlantes con sincronización labial en 2 segundos en una sola H100. Supera a Ovi 1.1 (80% de victorias) y LTX 2.3 (60,9%). Licencia Apache 2.0, multilingüe y ultrarrápido.
Presentamos daVinci MagiHuman Image-to-Video en WaveSpeedAI
daVinci MagiHuman Image-to-Video es un modelo de código abierto de 15B que anima imágenes de referencia en videos cinematográficos con sincronización de audio opcional. A la par con WAN 2.5. Hasta 1080p, 5-10 segundos. API REST, $0.04/seg, sin arranques en frío.
Presentando daVinci MagiHuman Text-to-Video en WaveSpeedAI
daVinci MagiHuman Text-to-Video genera videos cinematográficos centrados en humanos a partir de indicaciones de texto con sincronización de audio opcional. Modelo de código abierto de 15B, hasta 1080p, de 5 a 10 segundos. API REST, $0.04/seg, sin tiempos de espera en frío.
Presentamos InfiniteTalk Fast Video-to-Video Multi en WaveSpeedAI
InfiniteTalk Fast sincronización labial multi-personaje convierte video y dos pistas de audio en videos realistas de personas hablando o cantando. 50% más económico que el estándar, hasta 10 minutos. API de inferencia REST lista para usar, máximo rendimiento, sin arranques en frío, precios asequibles.
Presentamos InfiniteTalk Video-to-Video Multi en WaveSpeedAI
InfiniteTalk Video-to-Video Multi crea videos realistas de múltiples personajes con sincronización labial a partir de video y dos entradas de audio. Compatible con 480p/720p, hasta 10 minutos, con coherencia de cuerpo completo. API de inferencia REST lista para usar, máximo rendimiento, sin tiempos de espera de inicio y precios accesibles.
SkyReels V3 Talking Avatar: Vídeo de cabeza parlante con IA a partir de una foto
SkyReels V3 Talking Avatar genera vídeos de cabeza parlante realistas a partir de una foto de retrato y audio. Sincronización labial en más de 40 idiomas. Pruébalo en WaveSpeedAI.
SoulX FlashHead: Cabeza Parlante IA en Tiempo Real a 96 FPS
SoulX FlashHead genera videos de cabeza parlante en streaming en tiempo real a 96 FPS sin deriva de identidad. Video de duración infinita. Pruébalo en WaveSpeedAI.
Presentando WaveSpeedAI Longcat Avatar en WaveSpeedAI
LongCat Avatar produce generación de vídeo largo súper realista y sincronizado con los labios con dinámica natural e identidad consistente. Convierte una foto + audio en vídeos de avatar hablante o cantante impulsados por audio (Imagen a vídeo), hasta 1 minuto, nivel 720p $0.30/5s. API REST lista para usar, sin inicios fríos, aff
Presentando InfiniteTalk en WaveSpeedAI
InfiniteTalk convierte una foto + audio en videos de avatar hablando o cantando impulsados por audio (Imagen-a-Video), hasta 10 minutos, nivel 720p $0.30/5s. API REST lista para usar, sin arranques en frío, precios asequibles.
Presentamos Live Avatar en WaveSpeedAI
Live Avatar genera videos de avatar parlante a partir de una imagen de referencia y audio, creando animaciones de sincronización de labios realistas con expresiones naturales.
Presentamos Kuaishou Kling V1 AI Avatar Standard en WaveSpeedAI
Kling AI Avatar produce impresionantes avatares de video generados por IA para identidad digital y creación de contenido, con video bajo demanda facturado a $0,25 por 5 segundos. API REST lista para usar, sin tiempos de inicio fríos, precios asequibles.
Presentando WaveSpeedAI InfiniteTalk Multi en WaveSpeedAI
InfiniteTalk Multi convierte una sola imagen y dos entradas de audio en videos de múltiples personajes hablando o cantando a hasta 720p. API REST de inferencia lista para usar, mejor rendimiento, sin inicios en frío, precios asequibles.