#digital-human

37 articles

daVinci-MagiHuman : Le Modèle Open-Source Qui Vient d'Écraser Tous les Générateurs d'Humains Numériques

daVinci-MagiHuman est un modèle open-source de 15 milliards de paramètres qui génère des vidéos de têtes parlantes avec synchronisation labiale en 2 secondes sur un seul H100. Surpasse Ovi 1.1 (taux de victoire de 80 %) et LTX 2.3 (60,9 %). Sous licence Apache 2.0, multilingue et ultra-rapide.

2026-03-27 6 min de lecture

Présentation de daVinci MagiHuman Image-to-Video sur WaveSpeedAI

daVinci MagiHuman Image-to-Video est un modèle open-source de 15 milliards de paramètres qui anime des images de référence en vidéos cinématographiques avec synchronisation audio optionnelle. Comparable à WAN 2.5. Jusqu'à 1080p, 5 à 10 secondes. API REST, 0,04 $/sec, sans cold starts.

2026-03-27 6 min de lecture

Présentation de daVinci MagiHuman Text-to-Video sur WaveSpeedAI

daVinci MagiHuman Text-to-Video génère des vidéos cinématographiques centrées sur l'humain à partir de prompts textuels avec synchronisation audio optionnelle. Modèle open-source 15B, jusqu'à 1080p, 5 à 10 secondes. API REST, 0,04 $/sec, sans démarrage à froid.

2026-03-27 7 min de lecture

Présentation d'InfiniteTalk Fast Video-to-Video Multi sur WaveSpeedAI

InfiniteTalk Fast synchronisation labiale multi-personnages convertit une vidéo et deux pistes audio en vidéos réalistes parlantes ou chantantes. 50% moins cher que la version standard, jusqu'à 10 minutes. API d'inférence REST prête à l'emploi, meilleures performances, sans démarrages à froid, tarification abordable.

2026-03-18 6 min de lecture

Présentation d'InfiniteTalk Video-to-Video Multi sur WaveSpeedAI

InfiniteTalk Video-to-Video Multi crée des vidéos réalistes avec synchronisation labiale pour plusieurs personnages à partir d'une vidéo et de deux entrées audio. Prend en charge le 480p/720p, jusqu'à 10 minutes, avec une cohérence du corps entier. API d'inférence REST prête à l'emploi, performances optimales, sans démarrages à froid, tarification abordable.

2026-03-18 6 min de lecture

SkyReels V3 Talking Avatar : Vidéo d'avatar parlant par IA à partir d'une seule photo

SkyReels V3 Talking Avatar génère des vidéos de têtes parlantes réalistes à partir d'une seule photo portrait et d'un audio. Synchronisation labiale en 40+ langues. Essayez-le sur WaveSpeedAI.

2026-03-03 8 min de lecture

SoulX FlashHead : Tête parlante IA en temps réel à 96 FPS

SoulX FlashHead génère des vidéos de tête parlante en streaming temps réel à 96 FPS sans dérive d'identité. Vidéo de longueur infinie. Essayez-le sur WaveSpeedAI.

2026-03-03 9 min de lecture

Présentation de WaveSpeedAI Longcat Avatar sur WaveSpeedAI

LongCat Avatar produit une génération vidéo longue super-réaliste et synchronisée aux lèvres avec une dynamique naturelle et une identité cohérente. Convertit une photo + audio en vidéos avatar parlantes ou chantantes pilotées par l'audio (Image-to-Video), jusqu'à 1 minute, niveau 720p à 0,30 $/5s. API REST prête à l'emploi, sans démarrages à froid, aff

2025-12-26 7 min de lecture

Présentation d'InfiniteTalk sur WaveSpeedAI

InfiniteTalk convertit une photo + audio en vidéos d'avatar parlant ou chantant pilotées par l'audio (Image-to-Video), jusqu'à 10 minutes, tarif 720p à 0,30 $/5s. API REST prête à l'emploi, sans démarrages à froid, tarification abordable.

2025-12-21 7 min de lecture

Présentation de WaveSpeedAI Live Avatar sur WaveSpeedAI

Live Avatar génère des vidéos d'avatar parlant à partir d'une image de référence et d'un audio, créant des animations de synchronisation labiale réalistes avec des expressions naturelles.

2025-12-16 6 min de lecture

Présentation de Kuaishou Kling V1 AI Avatar Standard sur WaveSpeedAI

Kling AI Avatar produit des avatars vidéo générés par IA époustouflants pour l'identité numérique et la création de contenu, avec une vidéo à la demande facturée à 0,25 $ par 5 secondes. API REST prête à l'emploi, pas de démarrages à froid, tarification abordable.

2025-11-26 6 min de lecture

Présentation d'InfiniteTalk Multi sur WaveSpeedAI

InfiniteTalk Multi convertit une seule image et deux entrées audio en vidéos multi-personnages parlants ou chantants jusqu'à 720p. API REST prête à l'emploi, meilleures performances, sans démarrages à froid, tarification abordable.

2025-11-22 6 min de lecture