#digital-human
39 articles - Page 2
Présentation d'InfiniteTalk Fast de WaveSpeedAI sur WaveSpeedAI
InfiniteTalk fast convertit une photo + audio en vidéos d'avatar parlant ou chantant pilotées par l'audio (Image-to-Video), jusqu'à 10 minutes. API REST prête à l'emploi, sans démarrages à froid, tarification abordable.
Présentation de PixVerse LipSync sur WaveSpeedAI
PixVerse LipSync convertit l'audio en animations de synchronisation labiale réalistes avec des algorithmes avancés pour des mouvements de bouche et un timing précis pour les avatars vidéo. API d'inférence REST prête à l'emploi, performances optimales, pas de démarrages à froid, tarification abordable.
Présentation de Sync LipSync 2 sur WaveSpeedAI
Sync Lipsync-2 synchronise les mouvements des lèvres dans n'importe quelle vidéo avec l'audio fourni, permettant un alignement réaliste de la bouche pour les films, podcasts, jeux ou animations. API d'inférence REST prête à l'emploi, meilleures performances, sans démarrage à froid, tarification abordable.
Présentation de Veed LipSync sur WaveSpeedAI
Générez des animations de synchronisation labiale réalistes à partir d'audio avec une synchronisation de haute qualité en utilisant Veed LipSync ; 0,15 $ par 5 secondes de vidéo. API d'inférence REST prête à l'emploi, meilleures performances, pas de démarrages à froid, tarification abordable.
Présentation de WaveSpeedAI Hunyuan Avatar sur WaveSpeedAI
Hunyuan Avatar crée des vidéos parlantes ou chantantes pilotées par l'audio à partir d'une image + audio, en 480p/720p jusqu'à 120s (à partir de 0,15$/5s). API REST d'inférence prête à l'emploi, meilleures performances, pas de démarrages à froid, tarification abordable.
Présentation de WaveSpeedAI WAN 2.2 Speech To Video sur WaveSpeedAI
Wan-2.2-S2V transforme les images et la parole en vidéos haute fidélité avec des mouvements réalistes du visage et du corps ; supporte les clips jusqu'à 10 minutes en 480p, à partir de 0,15 $/5s. API REST prête à l'emploi, pas de démarrages à froid, tarification abordable.
Présentation de ByteDance Avatar Omni Human sur WaveSpeedAI
ByteDance OmniHuman transforme une photo de portrait unique en vidéo d'avatar avec des mouvements et expressions naturels (0,12 $/sec). API REST d'inférence prête à l'emploi, meilleures performances, pas de démarrages à froid, tarification abordable.
Présentation de ByteDance Avatar Omni Human 1.5 sur WaveSpeedAI
OmniHuman 1.5 convertit les signaux audio et visuels en animations d'avatar réalistes pour les humains virtuels, la narration et les agents interactifs. API d'inférence REST prête à l'emploi, meilleures performances, pas de démarrages à froid, tarification abordable.
Présentation des Effets Image Mon Monde sur WaveSpeedAI
Mon Monde transforme les photos en pixel art de style Minecraft, recréant l'esthétique pixelisée et en blocs du jeu. API d'inférence REST prête à l'emploi, meilleures performances, pas de démarrages à froid, tarification abordable.
Présentation des Effets Vidéo Cartoon Doll sur WaveSpeedAI
Transformez des photos en vidéos de poupées chibi dessinées avec des animations lisses et ludiques. Effet image-vidéo pour avatars et clips sociaux. API REST d'inférence prête à l'emploi, meilleures performances, pas de démarrages à froid, tarification abordable.
Présentation de ByteDance LipSync Audio To Video sur WaveSpeedAI
ByteDance LipSync transforme l'audio en vidéos parlantes réalistes en générant des mouvements de lèvres précis parfaitement synchronisés avec l'audio d'entrée. API d'inférence REST prête à l'emploi, meilleures performances, pas de démarrages à froid, tarification abordable.
Présentation d'ElevenLabs Eleven V3 Timing sur WaveSpeedAI
ElevenLabs Eleven-V3 Timing convertit le texte en parole naturelle et retourne des métadonnées d'alignement—horodatages de caractères/mots en JSON—pour des sous-titres précis, des effets karaoké et la synchronisation labiale. Supporte voice_id, similarity/stability et Speaker Boost optionnel. Tarifé à 0,10 $ par 1 000 caractères. Prêt à l'emploi