#digital-human
39 articles
daVinci-MagiHuman : Le Modèle Open-Source Qui Vient d'Écraser Tous les Générateurs d'Humains Numériques
daVinci-MagiHuman est un modèle open-source de 15 milliards de paramètres qui génère des vidéos de têtes parlantes avec synchronisation labiale en 2 secondes sur un seul H100. Surpasse Ovi 1.1 (taux de victoire de 80 %) et LTX 2.3 (60,9 %). Sous licence Apache 2.0, multilingue et ultra-rapide.
Présentation de daVinci MagiHuman Image-to-Video sur WaveSpeedAI
daVinci MagiHuman Image-to-Video est un modèle open-source de 15 milliards de paramètres qui anime des images de référence en vidéos cinématographiques avec synchronisation audio optionnelle. Comparable à WAN 2.5. Jusqu'à 1080p, 5 à 10 secondes. API REST, 0,04 $/sec, sans cold starts.
Présentation de daVinci MagiHuman Text-to-Video sur WaveSpeedAI
daVinci MagiHuman Text-to-Video génère des vidéos cinématographiques centrées sur l'humain à partir de prompts textuels avec synchronisation audio optionnelle. Modèle open-source 15B, jusqu'à 1080p, 5 à 10 secondes. API REST, 0,04 $/sec, sans démarrage à froid.
Présentation d'InfiniteTalk Fast Video-to-Video Multi sur WaveSpeedAI
InfiniteTalk Fast synchronisation labiale multi-personnages convertit une vidéo et deux pistes audio en vidéos réalistes parlantes ou chantantes. 50% moins cher que la version standard, jusqu'à 10 minutes. API d'inférence REST prête à l'emploi, meilleures performances, sans démarrages à froid, tarification abordable.
Présentation d'InfiniteTalk Video-to-Video Multi sur WaveSpeedAI
InfiniteTalk Video-to-Video Multi crée des vidéos réalistes avec synchronisation labiale pour plusieurs personnages à partir d'une vidéo et de deux entrées audio. Prend en charge le 480p/720p, jusqu'à 10 minutes, avec une cohérence du corps entier. API d'inférence REST prête à l'emploi, performances optimales, sans démarrages à froid, tarification abordable.
SkyReels V3 Talking Avatar : Vidéo d'avatar parlant par IA à partir d'une seule photo
SkyReels V3 Talking Avatar génère des vidéos de têtes parlantes réalistes à partir d'une seule photo portrait et d'un audio. Synchronisation labiale en 40+ langues. Essayez-le sur WaveSpeedAI.
SoulX FlashHead : Tête parlante IA en temps réel à 96 FPS
SoulX FlashHead génère des vidéos de tête parlante en streaming temps réel à 96 FPS sans dérive d'identité. Vidéo de longueur infinie. Essayez-le sur WaveSpeedAI.
Présentation de WaveSpeedAI Longcat Avatar sur WaveSpeedAI
LongCat Avatar produit une génération vidéo longue super-réaliste et synchronisée aux lèvres avec une dynamique naturelle et une identité cohérente. Convertit une photo + audio en vidéos avatar parlantes ou chantantes pilotées par l'audio (Image-to-Video), jusqu'à 1 minute, niveau 720p à 0,30 $/5s. API REST prête à l'emploi, sans démarrages à froid, aff
Présentation d'InfiniteTalk sur WaveSpeedAI
InfiniteTalk convertit une photo + audio en vidéos d'avatar parlant ou chantant pilotées par l'audio (Image-to-Video), jusqu'à 10 minutes, tarif 720p à 0,30 $/5s. API REST prête à l'emploi, sans démarrages à froid, tarification abordable.
Présentation de WaveSpeedAI Live Avatar sur WaveSpeedAI
Live Avatar génère des vidéos d'avatar parlant à partir d'une image de référence et d'un audio, créant des animations de synchronisation labiale réalistes avec des expressions naturelles.
Présentation de Kuaishou Kling V1 AI Avatar Standard sur WaveSpeedAI
Kling AI Avatar produit des avatars vidéo générés par IA époustouflants pour l'identité numérique et la création de contenu, avec une vidéo à la demande facturée à 0,25 $ par 5 secondes. API REST prête à l'emploi, pas de démarrages à froid, tarification abordable.
Présentation d'InfiniteTalk Multi sur WaveSpeedAI
InfiniteTalk Multi convertit une seule image et deux entrées audio en vidéos multi-personnages parlants ou chantants jusqu'à 720p. API REST prête à l'emploi, meilleures performances, sans démarrages à froid, tarification abordable.