Escalando Geração de Vídeo IA: Como Novita AI Alcança Otimização Dupla de Eficiência e Custo com WaveSpeedAI

Escalando Geração de Vídeo IA: Como Novita AI Alcança Otimização Dupla de Eficiência e Custo com WaveSpeedAI

Dimensionando a Geração de Vídeo em IA: Como a Novita AI Alcança Otimização Dupla de Eficiência e Custo com WaveSpeedAI

Novita AI

WaveSpeedAI melhorou significativamente nossa eficiência de inferência e nos ajudou a reduzir os custos de geração de vídeo em até 67%. Com processamento de vídeo mais rápido e confiável, somos capazes de oferecer uma experiência de usuário excepcional em escala.”
— Junyu Huang, COO da Novita AI

Contexto do Cliente

Novita AI é uma empresa focada em infraestrutura de inferência de IA, dedicada a fornecer criadores, desenvolvedores e empresas com serviços confiáveis e eficientes de inferência de geração de vídeo. A empresa oferece suporte à implantação de múltiplos modelos de geração de vídeo mainstream, cobrindo capacidades de ponta a ponta desde geração de imagem para vídeo e texto para vídeo, servindo usuários criativos globais e plataformas de IA em resoluções que variam de 720P a 1080P.

Novita AI

Desafios Antes do WaveSpeedAI

Conforme o número de modelos e a complexidade do serviço aumentaram, a Novita AI enfrentou vários desafios em sua arquitetura de inferência e operações:

  • Agendamento de recursos complexo devido à implantação multi-modelo: Oferecer suporte a múltiplos modelos, como Wan 2.1, Kling V1.6 e Hunyuan Video, cada um com diferentes requisitos de memória e computacionais, resultou em diferenças significativas na eficiência de inferência.

  • Custos altos para inferência em HD com GPUs subutilizadas: Especialmente para tarefas de geração de vídeo em 720P e 1080P, ciclos de inferência individuais consumiam grandes quantidades de memória da GPU, levando a altos custos de geração por unidade.

  • Latência instável sob alta concorrência: Alguns modelos grandes experimentaram atrasos significativos na resposta durante o pico de tráfego de usuários, afetando negativamente a experiência do usuário final e a reputação da plataforma.

Colaboração com WaveSpeedAI

Para resolver esses desafios, a Novita AI estabeleceu uma colaboração profunda com WaveSpeed AI, focando na implantação otimizada dos seguintes modelos principais:

  • Wan 2.1 Imagem para Vídeo / Texto para Vídeo

Wan 2.1 Imagem para Vídeo / Texto para Vídeo

MiniMax Video 01

  • Kling V1.6 Imagem para Vídeo / Texto para Vídeo

Kling V1.6 Imagem para Vídeo / Texto para Vídeo

Com o suporte do WaveSpeed AI, a Novita foi capaz de ajustar cada modelo individualmente e agendar dinamicamente recursos de GPU em um pool unificado, maximizando assim tanto o desempenho quanto a eficiência de custo.

Resultados e Benefícios

✅ Otimização do Desempenho de Inferência: A eficiência de inferência melhorou em até 25%, com tempo médio de geração de vídeo reduzido em 30–40%.

ModeloResoluçãoTempo Pré-OtimizaçãoTempo Pós-Otimização
Hunyuan Video Rápido720P2 minutos1 minuto 30 segundos
Wan 2.1 Texto para Vídeo1280×7202 minutos 24 segundos1 minuto 55 segundos
Wan 2.1 Imagem para Vídeo1280×7203 minutos 10 segundos2 minutos 30 segundos
Kling V1.6 Imagem para Vídeo1080P / 5s$0.98 / vídeo$0.92 / vídeo

✅ Otimização da Estrutura de Custo: Custo médio por chamada reduzido em mais de 30%, com economias de até 66% em cenários de alta resolução.

ModeloResoluçãoCusto Pré-OtimizaçãoCusto Pós-OtimizaçãoRedução de Custo
Hunyuan Video Rápido720P$0.18 / seg$0.06 / seg-66.7%
Wan 2.1 Texto para Vídeo1280×720$0.06 / seg$0.04 / seg-33.3%
Wan 2.1 Imagem para Vídeo1280×720$0.08 / seg$0.06 / seg-25.0%
Kling V1.6 Imagem para Vídeo1080P / 5s$0.49 / vídeo$0.46 / vídeo-6.1%

✅ Estabilidade Melhorada do Sistema: As respostas do modelo são mais estáveis sob alta concorrência, as taxas de sucesso de geração de vídeo aumentaram e as taxas de falha caíram para abaixo de 0.05%, melhorando significativamente a experiência do usuário.

Olhando para o Futuro

No futuro, a Novita AI continuará a aprofundar sua colaboração com WaveSpeed AI para melhorar ainda mais a flexibilidade e estabilidade da implantação multi-modelo, explorar estruturas de inferência de vídeo mais eficientes e otimizar continuamente sua estrutura de custo. Com os pontos fortes técnicos do WaveSpeedAI, a Novita AI está confiante em sua capacidade de fornecer serviços de geração de vídeo mais rápidos, estáveis e econômicos para clientes globais—ampliando os limites da tecnologia e do valor comercial no campo da geração de mídia de IA.

Experimente Agora!

🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6