Mise à l’échelle de la génération vidéo IA : Comment Novita AI Réalise une Double Optimisation de l’Efficacité et des Coûts avec WaveSpeedAI

Novita AI

WaveSpeedAI a considérablement amélioré notre efficacité d’inférence et nous a permis de réduire les coûts de génération vidéo jusqu’à 67%. Avec un traitement vidéo plus rapide et plus fiable, nous sommes en mesure de fournir une expérience utilisateur exceptionnelle à grande échelle.”
— Junyu Huang, COO de Novita AI

Contexte du Client

Novita AI est une entreprise spécialisée dans l’infrastructure d’inférence IA, dédiée à fournir aux créateurs, développeurs et entreprises des services fiables et efficaces de génération vidéo par inférence. L’entreprise supporte le déploiement de plusieurs modèles de génération vidéo grand public, couvrant les capacités de bout en bout allant de la génération image-vers-vidéo et texte-vers-vidéo, servant des utilisateurs créatifs mondiaux et des plateformes IA à des résolutions allant de 720P à 1080P.

Novita AI

Défis avant WaveSpeedAI

À mesure que le nombre de modèles et la complexité des services augmentaient, Novita AI a rencontré plusieurs défis dans son architecture d’inférence et ses opérations :

Planification complexe des ressources due au déploiement multi-modèles : Le support de plusieurs modèles tels que Wan 2.1, Kling V1.6 et Hunyuan Video, chacun ayant des exigences différentes en matière de mémoire et de calcul, a entraîné des différences significatives dans l’efficacité d’inférence.
Coûts élevés pour l’inférence HD avec des GPU sous-utilisés : Notamment pour les tâches de génération vidéo 720P et 1080P, chaque cycle d’inférence consommait de grandes quantités de mémoire GPU, entraînant des coûts élevés par unité générée.
Latence instable sous forte concurrence : Certains grands modèles ont connu des retards de réponse importants lors du trafic utilisateur de pointe, affectant négativement l’expérience des utilisateurs finaux et la réputation de la plateforme.

Collaboration avec WaveSpeedAI

Pour relever ces défis, Novita AI a établi une collaboration approfondie avec WaveSpeed AI, en se concentrant sur le déploiement optimisé des modèles fondamentaux suivants :

Wan 2.1 Image-vers-Vidéo / Texte-vers-Vidéo

Wan 2.1 Image-vers-Vidéo / Texte-vers-Vidéo

Hunyuan Video Fast

MiniMax Video 01

MiniMax Video 01

Kling V1.6 Image-vers-Vidéo / Texte-vers-Vidéo

Kling V1.6 Image-vers-Vidéo / Texte-vers-Vidéo

Avec le support de WaveSpeed AI, Novita a pu affiner chaque modèle individuellement et planifier dynamiquement les ressources GPU sur un pool unifié, maximisant ainsi à la fois les performances et l’efficacité des coûts.

Résultats et Avantages

✅ Optimisation des Performances d’Inférence : L’efficacité d’inférence s’est améliorée jusqu’à 25%, avec un temps moyen de génération vidéo réduit de 30–40%.

Modèle	Résolution	Temps avant optimisation	Temps après optimisation
Hunyuan Video Fast	720P	2 minutes	1 minute 30 secondes
Wan 2.1 Texte-vers-Vidéo	1280×720	2 minutes 24 secondes	1 minute 55 secondes
Wan 2.1 Image-vers-Vidéo	1280×720	3 minutes 10 secondes	2 minutes 30 secondes
Kling V1.6 Image-vers-Vidéo	1080P / 5s	0,98 $ / vidéo	0,92 $ / vidéo

✅ Optimisation de la Structure des Coûts : Le coût moyen par appel réduit de plus de 30%, avec jusqu’à 66% d’économies dans les scénarios haute résolution.

Modèle	Résolution	Coût avant optimisation	Coût après optimisation	Réduction des coûts
Hunyuan Video Fast	720P	0,18 $ / sec	0,06 $ / sec	-66,7%
Wan 2.1 Texte-vers-Vidéo	1280×720	0,06 $ / sec	0,04 $ / sec	-33,3%
Wan 2.1 Image-vers-Vidéo	1280×720	0,08 $ / sec	0,06 $ / sec	-25,0%
Kling V1.6 Image-vers-Vidéo	1080P / 5s	0,49 $ / vidéo	0,46 $ / vidéo	-6,1%

✅ Stabilité Système Améliorée : Les réponses des modèles sont plus stables sous forte concurrence, les taux de réussite de génération vidéo ont augmenté, et les taux d’échec ont chuté en dessous de 0,05%, améliorant considérablement l’expérience utilisateur.

Vers l’Avenir

À l’avenir, Novita AI continuera à approfondir sa collaboration avec WaveSpeed AI pour améliorer davantage la flexibilité et la stabilité du déploiement multi-modèles, explorer des cadres d’inférence vidéo plus efficaces, et optimiser continuellement sa structure de coûts. Avec les forces techniques de WaveSpeedAI, Novita AI est confiante dans sa capacité à fournir des services de génération vidéo plus rapides, plus stables et plus rentables à ses clients mondiaux—repoussant les limites de la technologie et de la valeur commerciale dans le domaine de la génération de médias IA.

Essayez-les maintenant !

🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6

Mise à l’échelle de la génération vidéo IA : Comment Novita AI Réalise une Double Optimisation de l’Efficacité et des Coûts avec WaveSpeedAI

Contexte du Client

Défis avant WaveSpeedAI

Collaboration avec WaveSpeedAI

Résultats et Avantages

Vers l’Avenir

Essayez-les maintenant !

Articles associés

Seedance 2.0 arrive bientôt : Le modèle vidéo nouvelle génération de ByteDance avec audio natif

Guide Complet Seedance 2.0 : Création Vidéo Multimodale

Seedance 2.0 vs Kling 3.0 vs Sora 2 vs Veo 3.1 : La Comparaison Ultime de la Génération Vidéo

Examen de Vidu Q3 : Comment il se compare à Sora 2, Wan 2.6, Seedance 1.5, Veo 3.1 et Grok Imagine Video

Grok Imagine Video vs Sora 2, Veo 3.1, Seedance 1.5, WAN 2.5/2.6, et Vidu Q3 : Comparaison complète

À quoi s'attendre de Kling 3.0 : Un aperçu technique