Масштабирование генерации AI видео: как Novita AI достигает двойной оптимизации эффективности и стоимости с WaveSpeedAI
Масштабирование генерации видео с помощью ИИ: Как Novita AI достигает двойной оптимизации эффективности и стоимости с WaveSpeedAI

WaveSpeedAI значительно улучшил эффективность нашего инференса и помог нам снизить затраты на генерацию видео на 67%. Благодаря более быстрой и надежной обработке видео мы можем обеспечить исключительный пользовательский опыт в масштабе.
— Junyu Huang, COO Novita AI
История клиента
Novita AI — это компания, специализирующаяся на инфраструктуре вывода ИИ, предоставляющая разработчикам, создателям и предприятиям надежные и эффективные услуги инференса для генерации видео. Компания поддерживает развертывание нескольких основных моделей генерации видео, охватывая сквозные возможности от генерации видео из изображения и текста, обслуживая глобальных творческих пользователей и платформы ИИ с разрешением от 720P до 1080P.

Проблемы до WaveSpeedAI
С увеличением количества моделей и сложности сервиса Novita AI столкнулась с несколькими проблемами в архитектуре инференса и операциях:
-
Сложное планирование ресурсов из-за развертывания нескольких моделей: поддержка нескольких моделей, таких как Wan 2.1, Kling V1.6 и Hunyuan Video, каждая с различными требованиями к памяти и вычислительным ресурсам, привела к значительным различиям в эффективности инференса.
-
Высокие затраты на инференс HD с недоиспользованными GPU: особенно для задач генерации видео 720P и 1080P, отдельные циклы инференса потребляли большое количество памяти GPU, что приводило к высокой стоимости за единицу генерации.
-
Нестабильная задержка при высокой конкурентности: некоторые большие модели испытывали значительные задержки в ответе во время пиковой нагрузки пользователей, что негативно влияло на пользовательский опыт и репутацию платформы.
Сотрудничество с WaveSpeedAI
Для решения этих проблем Novita AI установила глубокое сотрудничество с WaveSpeed AI, сосредоточившись на оптимизированном развертывании следующих основных моделей:
- Wan 2.1 Image-to-Video / Text-to-Video

- Hunyuan Video Fast

- Kling V1.6 Image-to-Video / Text-to-Video

Благодаря поддержке WaveSpeed AI компания Novita смогла тонко настроить каждую модель отдельно и динамически распределять ресурсы GPU по единому пулу, тем самым максимизируя как производительность, так и экономичность затрат.
Результаты и преимущества
✅ Оптимизация производительности инференса: эффективность инференса улучшена на 25%, среднее время генерации видео сокращено на 30–40%.
| Модель | Разрешение | Время до оптимизации | Время после оптимизации |
|---|---|---|---|
| Hunyuan Video Fast | 720P | 2 минуты | 1 минута 30 секунд |
| Wan 2.1 Text-to-Video | 1280×720 | 2 минуты 24 секунды | 1 минута 55 секунд |
| Wan 2.1 Image-to-Video | 1280×720 | 3 минуты 10 секунд | 2 минуты 30 секунд |
| Kling V1.6 Image-to-Video | 1080P / 5s | $0.98 / видео | $0.92 / видео |
✅ Оптимизация структуры затрат: средняя стоимость за вызов снижена на 30% и более, с экономией до 66% в высокочастотных сценариях.
| Модель | Разрешение | Затраты до оптимизации | Затраты после оптимизации | Сокращение затрат |
|---|---|---|---|---|
| Hunyuan Video Fast | 720P | $0.18 / сек | $0.06 / сек | -66.7% |
| Wan 2.1 Text-to-Video | 1280×720 | $0.06 / сек | $0.04 / сек | -33.3% |
| Wan 2.1 Image-to-Video | 1280×720 | $0.08 / сек | $0.06 / сек | -25.0% |
| Kling V1.6 Image-to-Video | 1080P / 5s | $0.49 / видео | $0.46 / видео | -6.1% |
✅ Улучшенная стабильность системы: ответы моделей стабильнее при высокой конкурентности, показатель успеха генерации видео повышен, а показатель сбоев снизился ниже 0.05%, что значительно улучшило пользовательский опыт.
Будущее
В будущем Novita AI продолжит углублять сотрудничество с WaveSpeed AI для дальнейшего повышения гибкости и стабильности развертывания нескольких моделей, изучать более эффективные платформы видео-инференса и непрерывно оптимизировать структуру затрат. Благодаря техническим преимуществам WaveSpeedAI компания Novita AI уверена в своей способности предоставлять более быстрые, стабильные и экономичные услуги генерации видео глобальным клиентам, раздвигая границы технологии и деловой ценности в области генерации медиа с помощью ИИ.
Попробуйте прямо сейчас!
🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6
Следите за нами в Twitter, LinkedIn и присоединяйтесь к нашему каналу Discord, чтобы быть в курсе событий.
