Escalando la generación de video con IA: Cómo Novita AI logra optimización dual de eficiencia y costo con WaveSpeedAI
Escalado de Generación de Video con IA: Cómo Novita AI Logra Doble Optimización de Eficiencia y Costo con WaveSpeedAI

WaveSpeedAI ha mejorado significativamente nuestra eficiencia de inferencia y nos ha ayudado a reducir los costos de generación de video en hasta un 67%. Con un procesamiento de video más rápido y confiable, podemos ofrecer una experiencia de usuario excepcional a escala.”
— Junyu Huang, COO de Novita AI
Antecedentes del Cliente
Novita AI es una empresa dedicada a la infraestructura de inferencia de IA, comprometida con proporcionar a creadores, desarrolladores y empresas servicios confiables y eficientes de inferencia de generación de video. La empresa respalda el despliegue de múltiples modelos de generación de video convencionales, cubriendo capacidades de extremo a extremo desde generación de imagen a video y texto a video, sirviendo a usuarios creativos globales y plataformas de IA en resoluciones que van desde 720P hasta 1080P.

Desafíos Antes de WaveSpeedAI
A medida que aumentaba el número de modelos y la complejidad del servicio, Novita AI enfrentaba varios desafíos en su arquitectura de inferencia y operaciones:
-
Planificación compleja de recursos debido a despliegue multimodelo: Respaldar múltiples modelos como Wan 2.1, Kling V1.6 y Hunyuan Video, cada uno con diferentes requisitos de memoria y computación, resultó en diferencias significativas en la eficiencia de inferencia.
-
Costos altos para inferencia HD con GPU subutilizadas: Especialmente para tareas de generación de video 720P y 1080P, los ciclos de inferencia individual consumieron grandes cantidades de memoria GPU, lo que llevó a altos costos por unidad generada.
-
Latencia inestable bajo alta concurrencia: Algunos modelos grandes experimentaron retrasos de respuesta significativos durante el tráfico de usuarios pico, afectando negativamente la experiencia del usuario final y la reputación de la plataforma.
Colaboración con WaveSpeedAI
Para abordar estos desafíos, Novita AI estableció una colaboración profunda con WaveSpeed AI, enfocándose en el despliegue optimizado de los siguientes modelos principales:
- Wan 2.1 Imagen a Video / Texto a Video

- Hunyuan Video Rápido

- Kling V1.6 Imagen a Video / Texto a Video

Con el apoyo de WaveSpeed AI, Novita pudo ajustar cada modelo individualmente y programar dinámicamente recursos de GPU en un grupo unificado, maximizando así tanto el rendimiento como la eficiencia de costos.
Resultados y Beneficios
✅ Optimización del Rendimiento de Inferencia: La eficiencia de inferencia mejoró hasta en un 25%, con el tiempo promedio de generación de video reducido en 30–40%.
| Modelo | Resolución | Tiempo Antes de Optimización | Tiempo Después de Optimización |
|---|---|---|---|
| Hunyuan Video Rápido | 720P | 2 minutos | 1 minuto 30 segundos |
| Wan 2.1 Texto a Video | 1280×720 | 2 minutos 24 segundos | 1 minuto 55 segundos |
| Wan 2.1 Imagen a Video | 1280×720 | 3 minutos 10 segundos | 2 minutos 30 segundos |
| Kling V1.6 Imagen a Video | 1080P / 5s | $0.98 / video | $0.92 / video |
✅ Optimización de la Estructura de Costos: El costo promedio por llamada se redujo en más del 30%, con ahorros de hasta el 66% en escenarios de alta resolución.
| Modelo | Resolución | Costo Antes de Optimización | Costo Después de Optimización | Reducción de Costo |
|---|---|---|---|---|
| Hunyuan Video Rápido | 720P | $0.18 / seg | $0.06 / seg | -66.7% |
| Wan 2.1 Texto a Video | 1280×720 | $0.06 / seg | $0.04 / seg | -33.3% |
| Wan 2.1 Imagen a Video | 1280×720 | $0.08 / seg | $0.06 / seg | -25.0% |
| Kling V1.6 Imagen a Video | 1080P / 5s | $0.49 / video | $0.46 / video | -6.1% |
✅ Estabilidad Mejorada del Sistema: Las respuestas del modelo son más estables bajo alta concurrencia, las tasas de éxito de generación de video aumentaron y las tasas de fallo se redujeron a menos del 0.05%, mejorando significativamente la experiencia del usuario.
Mirando hacia el Futuro
En el futuro, Novita AI continuará profundizando su colaboración con WaveSpeed AI para mejorar aún más la flexibilidad y estabilidad del despliegue multimodelo, explorar marcos de inferencia de video más eficientes y optimizar continuamente su estructura de costos. Con las fortalezas técnicas de WaveSpeedAI, Novita AI está confiada en su capacidad para entregar servicios de generación de video más rápidos, estables y rentables a clientes globales—empujando los límites de la tecnología y el valor empresarial en el campo de la generación de medios de IA.
¡Pruébalos ahora!
🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6





