Escalando Geração de Vídeo IA: Como Novita AI Alcança Otimização Dupla de Eficiência e Custo com WaveSpeedAI
Dimensionando a Geração de Vídeo em IA: Como a Novita AI Alcança Otimização Dupla de Eficiência e Custo com WaveSpeedAI

WaveSpeedAI melhorou significativamente nossa eficiência de inferência e nos ajudou a reduzir os custos de geração de vídeo em até 67%. Com processamento de vídeo mais rápido e confiável, somos capazes de oferecer uma experiência de usuário excepcional em escala.”
— Junyu Huang, COO da Novita AI
Contexto do Cliente
Novita AI é uma empresa focada em infraestrutura de inferência de IA, dedicada a fornecer criadores, desenvolvedores e empresas com serviços confiáveis e eficientes de inferência de geração de vídeo. A empresa oferece suporte à implantação de múltiplos modelos de geração de vídeo mainstream, cobrindo capacidades de ponta a ponta desde geração de imagem para vídeo e texto para vídeo, servindo usuários criativos globais e plataformas de IA em resoluções que variam de 720P a 1080P.

Desafios Antes do WaveSpeedAI
Conforme o número de modelos e a complexidade do serviço aumentaram, a Novita AI enfrentou vários desafios em sua arquitetura de inferência e operações:
-
Agendamento de recursos complexo devido à implantação multi-modelo: Oferecer suporte a múltiplos modelos, como Wan 2.1, Kling V1.6 e Hunyuan Video, cada um com diferentes requisitos de memória e computacionais, resultou em diferenças significativas na eficiência de inferência.
-
Custos altos para inferência em HD com GPUs subutilizadas: Especialmente para tarefas de geração de vídeo em 720P e 1080P, ciclos de inferência individuais consumiam grandes quantidades de memória da GPU, levando a altos custos de geração por unidade.
-
Latência instável sob alta concorrência: Alguns modelos grandes experimentaram atrasos significativos na resposta durante o pico de tráfego de usuários, afetando negativamente a experiência do usuário final e a reputação da plataforma.
Colaboração com WaveSpeedAI
Para resolver esses desafios, a Novita AI estabeleceu uma colaboração profunda com WaveSpeed AI, focando na implantação otimizada dos seguintes modelos principais:
- Wan 2.1 Imagem para Vídeo / Texto para Vídeo

- Hunyuan Video Rápido

- Kling V1.6 Imagem para Vídeo / Texto para Vídeo

Com o suporte do WaveSpeed AI, a Novita foi capaz de ajustar cada modelo individualmente e agendar dinamicamente recursos de GPU em um pool unificado, maximizando assim tanto o desempenho quanto a eficiência de custo.
Resultados e Benefícios
✅ Otimização do Desempenho de Inferência: A eficiência de inferência melhorou em até 25%, com tempo médio de geração de vídeo reduzido em 30–40%.
| Modelo | Resolução | Tempo Pré-Otimização | Tempo Pós-Otimização |
|---|---|---|---|
| Hunyuan Video Rápido | 720P | 2 minutos | 1 minuto 30 segundos |
| Wan 2.1 Texto para Vídeo | 1280×720 | 2 minutos 24 segundos | 1 minuto 55 segundos |
| Wan 2.1 Imagem para Vídeo | 1280×720 | 3 minutos 10 segundos | 2 minutos 30 segundos |
| Kling V1.6 Imagem para Vídeo | 1080P / 5s | $0.98 / vídeo | $0.92 / vídeo |
✅ Otimização da Estrutura de Custo: Custo médio por chamada reduzido em mais de 30%, com economias de até 66% em cenários de alta resolução.
| Modelo | Resolução | Custo Pré-Otimização | Custo Pós-Otimização | Redução de Custo |
|---|---|---|---|---|
| Hunyuan Video Rápido | 720P | $0.18 / seg | $0.06 / seg | -66.7% |
| Wan 2.1 Texto para Vídeo | 1280×720 | $0.06 / seg | $0.04 / seg | -33.3% |
| Wan 2.1 Imagem para Vídeo | 1280×720 | $0.08 / seg | $0.06 / seg | -25.0% |
| Kling V1.6 Imagem para Vídeo | 1080P / 5s | $0.49 / vídeo | $0.46 / vídeo | -6.1% |
✅ Estabilidade Melhorada do Sistema: As respostas do modelo são mais estáveis sob alta concorrência, as taxas de sucesso de geração de vídeo aumentaram e as taxas de falha caíram para abaixo de 0.05%, melhorando significativamente a experiência do usuário.
Olhando para o Futuro
No futuro, a Novita AI continuará a aprofundar sua colaboração com WaveSpeed AI para melhorar ainda mais a flexibilidade e estabilidade da implantação multi-modelo, explorar estruturas de inferência de vídeo mais eficientes e otimizar continuamente sua estrutura de custo. Com os pontos fortes técnicos do WaveSpeedAI, a Novita AI está confiante em sua capacidade de fornecer serviços de geração de vídeo mais rápidos, estáveis e econômicos para clientes globais—ampliando os limites da tecnologia e do valor comercial no campo da geração de mídia de IA.
Experimente Agora!
🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6





