Mise à l'échelle de la génération vidéo IA : Comment Novita AI réalise une double optimisation de l'efficacité et du coût avec WaveSpeedAI
Mise à l’échelle de la génération vidéo IA : Comment Novita AI Réalise une Double Optimisation de l’Efficacité et des Coûts avec WaveSpeedAI

WaveSpeedAI a considérablement amélioré notre efficacité d’inférence et nous a permis de réduire les coûts de génération vidéo jusqu’à 67%. Avec un traitement vidéo plus rapide et plus fiable, nous sommes en mesure de fournir une expérience utilisateur exceptionnelle à grande échelle.”
— Junyu Huang, COO de Novita AI
Contexte du Client
Novita AI est une entreprise spécialisée dans l’infrastructure d’inférence IA, dédiée à fournir aux créateurs, développeurs et entreprises des services fiables et efficaces de génération vidéo par inférence. L’entreprise supporte le déploiement de plusieurs modèles de génération vidéo grand public, couvrant les capacités de bout en bout allant de la génération image-vers-vidéo et texte-vers-vidéo, servant des utilisateurs créatifs mondiaux et des plateformes IA à des résolutions allant de 720P à 1080P.

Défis avant WaveSpeedAI
À mesure que le nombre de modèles et la complexité des services augmentaient, Novita AI a rencontré plusieurs défis dans son architecture d’inférence et ses opérations :
-
Planification complexe des ressources due au déploiement multi-modèles : Le support de plusieurs modèles tels que Wan 2.1, Kling V1.6 et Hunyuan Video, chacun ayant des exigences différentes en matière de mémoire et de calcul, a entraîné des différences significatives dans l’efficacité d’inférence.
-
Coûts élevés pour l’inférence HD avec des GPU sous-utilisés : Notamment pour les tâches de génération vidéo 720P et 1080P, chaque cycle d’inférence consommait de grandes quantités de mémoire GPU, entraînant des coûts élevés par unité générée.
-
Latence instable sous forte concurrence : Certains grands modèles ont connu des retards de réponse importants lors du trafic utilisateur de pointe, affectant négativement l’expérience des utilisateurs finaux et la réputation de la plateforme.
Collaboration avec WaveSpeedAI
Pour relever ces défis, Novita AI a établi une collaboration approfondie avec WaveSpeed AI, en se concentrant sur le déploiement optimisé des modèles fondamentaux suivants :
- Wan 2.1 Image-vers-Vidéo / Texte-vers-Vidéo

- Hunyuan Video Fast

- Kling V1.6 Image-vers-Vidéo / Texte-vers-Vidéo

Avec le support de WaveSpeed AI, Novita a pu affiner chaque modèle individuellement et planifier dynamiquement les ressources GPU sur un pool unifié, maximisant ainsi à la fois les performances et l’efficacité des coûts.
Résultats et Avantages
✅ Optimisation des Performances d’Inférence : L’efficacité d’inférence s’est améliorée jusqu’à 25%, avec un temps moyen de génération vidéo réduit de 30–40%.
| Modèle | Résolution | Temps avant optimisation | Temps après optimisation |
|---|---|---|---|
| Hunyuan Video Fast | 720P | 2 minutes | 1 minute 30 secondes |
| Wan 2.1 Texte-vers-Vidéo | 1280×720 | 2 minutes 24 secondes | 1 minute 55 secondes |
| Wan 2.1 Image-vers-Vidéo | 1280×720 | 3 minutes 10 secondes | 2 minutes 30 secondes |
| Kling V1.6 Image-vers-Vidéo | 1080P / 5s | 0,98 $ / vidéo | 0,92 $ / vidéo |
✅ Optimisation de la Structure des Coûts : Le coût moyen par appel réduit de plus de 30%, avec jusqu’à 66% d’économies dans les scénarios haute résolution.
| Modèle | Résolution | Coût avant optimisation | Coût après optimisation | Réduction des coûts |
|---|---|---|---|---|
| Hunyuan Video Fast | 720P | 0,18 $ / sec | 0,06 $ / sec | -66,7% |
| Wan 2.1 Texte-vers-Vidéo | 1280×720 | 0,06 $ / sec | 0,04 $ / sec | -33,3% |
| Wan 2.1 Image-vers-Vidéo | 1280×720 | 0,08 $ / sec | 0,06 $ / sec | -25,0% |
| Kling V1.6 Image-vers-Vidéo | 1080P / 5s | 0,49 $ / vidéo | 0,46 $ / vidéo | -6,1% |
✅ Stabilité Système Améliorée : Les réponses des modèles sont plus stables sous forte concurrence, les taux de réussite de génération vidéo ont augmenté, et les taux d’échec ont chuté en dessous de 0,05%, améliorant considérablement l’expérience utilisateur.
Vers l’Avenir
À l’avenir, Novita AI continuera à approfondir sa collaboration avec WaveSpeed AI pour améliorer davantage la flexibilité et la stabilité du déploiement multi-modèles, explorer des cadres d’inférence vidéo plus efficaces, et optimiser continuellement sa structure de coûts. Avec les forces techniques de WaveSpeedAI, Novita AI est confiante dans sa capacité à fournir des services de génération vidéo plus rapides, plus stables et plus rentables à ses clients mondiaux—repoussant les limites de la technologie et de la valeur commerciale dans le domaine de la génération de médias IA.
Essayez-les maintenant !
🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6
Suivez-nous sur Twitter, LinkedIn et rejoignez notre canal Discord pour rester informés.
Articles associés
Présentation de WaveSpeedAI LTX 2 19b Image-to-Video LoRA sur WaveSpeedAI
Présentation de WaveSpeedAI LTX 2 19b Image-to-Video sur WaveSpeedAI
Présentation du LoRA WaveSpeedAI LTX 2 19b Text-to-Video sur WaveSpeedAI
Introducing WaveSpeedAI LTX 2 19b Text-to-Video on WaveSpeedAI

WaveSpeedAI vs Hedra : Quelle plateforme vidéo IA est la meilleure ?
