Escalando la generación de video con IA: Cómo Novita AI logra optimización dual de eficiencia y costo con WaveSpeedAI

Escalando la generación de video con IA: Cómo Novita AI logra optimización dual de eficiencia y costo con WaveSpeedAI

Escalado de Generación de Video con IA: Cómo Novita AI Logra Doble Optimización de Eficiencia y Costo con WaveSpeedAI

Novita AI

WaveSpeedAI ha mejorado significativamente nuestra eficiencia de inferencia y nos ha ayudado a reducir los costos de generación de video en hasta un 67%. Con un procesamiento de video más rápido y confiable, podemos ofrecer una experiencia de usuario excepcional a escala.”
— Junyu Huang, COO de Novita AI

Antecedentes del Cliente

Novita AI es una empresa dedicada a la infraestructura de inferencia de IA, comprometida con proporcionar a creadores, desarrolladores y empresas servicios confiables y eficientes de inferencia de generación de video. La empresa respalda el despliegue de múltiples modelos de generación de video convencionales, cubriendo capacidades de extremo a extremo desde generación de imagen a video y texto a video, sirviendo a usuarios creativos globales y plataformas de IA en resoluciones que van desde 720P hasta 1080P.

Novita AI

Desafíos Antes de WaveSpeedAI

A medida que aumentaba el número de modelos y la complejidad del servicio, Novita AI enfrentaba varios desafíos en su arquitectura de inferencia y operaciones:

  • Planificación compleja de recursos debido a despliegue multimodelo: Respaldar múltiples modelos como Wan 2.1, Kling V1.6 y Hunyuan Video, cada uno con diferentes requisitos de memoria y computación, resultó en diferencias significativas en la eficiencia de inferencia.

  • Costos altos para inferencia HD con GPU subutilizadas: Especialmente para tareas de generación de video 720P y 1080P, los ciclos de inferencia individual consumieron grandes cantidades de memoria GPU, lo que llevó a altos costos por unidad generada.

  • Latencia inestable bajo alta concurrencia: Algunos modelos grandes experimentaron retrasos de respuesta significativos durante el tráfico de usuarios pico, afectando negativamente la experiencia del usuario final y la reputación de la plataforma.

Colaboración con WaveSpeedAI

Para abordar estos desafíos, Novita AI estableció una colaboración profunda con WaveSpeed AI, enfocándose en el despliegue optimizado de los siguientes modelos principales:

  • Wan 2.1 Imagen a Video / Texto a Video

Wan 2.1 Imagen a Video / Texto a Video

MiniMax Video 01

  • Kling V1.6 Imagen a Video / Texto a Video

Kling V1.6 Imagen a Video / Texto a Video

Con el apoyo de WaveSpeed AI, Novita pudo ajustar cada modelo individualmente y programar dinámicamente recursos de GPU en un grupo unificado, maximizando así tanto el rendimiento como la eficiencia de costos.

Resultados y Beneficios

✅ Optimización del Rendimiento de Inferencia: La eficiencia de inferencia mejoró hasta en un 25%, con el tiempo promedio de generación de video reducido en 30–40%.

ModeloResoluciónTiempo Antes de OptimizaciónTiempo Después de Optimización
Hunyuan Video Rápido720P2 minutos1 minuto 30 segundos
Wan 2.1 Texto a Video1280×7202 minutos 24 segundos1 minuto 55 segundos
Wan 2.1 Imagen a Video1280×7203 minutos 10 segundos2 minutos 30 segundos
Kling V1.6 Imagen a Video1080P / 5s$0.98 / video$0.92 / video

✅ Optimización de la Estructura de Costos: El costo promedio por llamada se redujo en más del 30%, con ahorros de hasta el 66% en escenarios de alta resolución.

ModeloResoluciónCosto Antes de OptimizaciónCosto Después de OptimizaciónReducción de Costo
Hunyuan Video Rápido720P$0.18 / seg$0.06 / seg-66.7%
Wan 2.1 Texto a Video1280×720$0.06 / seg$0.04 / seg-33.3%
Wan 2.1 Imagen a Video1280×720$0.08 / seg$0.06 / seg-25.0%
Kling V1.6 Imagen a Video1080P / 5s$0.49 / video$0.46 / video-6.1%

✅ Estabilidad Mejorada del Sistema: Las respuestas del modelo son más estables bajo alta concurrencia, las tasas de éxito de generación de video aumentaron y las tasas de fallo se redujeron a menos del 0.05%, mejorando significativamente la experiencia del usuario.

Mirando hacia el Futuro

En el futuro, Novita AI continuará profundizando su colaboración con WaveSpeed AI para mejorar aún más la flexibilidad y estabilidad del despliegue multimodelo, explorar marcos de inferencia de video más eficientes y optimizar continuamente su estructura de costos. Con las fortalezas técnicas de WaveSpeedAI, Novita AI está confiada en su capacidad para entregar servicios de generación de video más rápidos, estables y rentables a clientes globales—empujando los límites de la tecnología y el valor empresarial en el campo de la generación de medios de IA.

¡Pruébalos ahora!

🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6