Масштабирование генерации AI видео: как Novita AI достигает двойной оптимизации эффективности и стоимости с WaveSpeedAI

Масштабирование генерации AI видео: как Novita AI достигает двойной оптимизации эффективности и стоимости с WaveSpeedAI

Масштабирование генерации видео с помощью ИИ: Как Novita AI достигает двойной оптимизации эффективности и стоимости с WaveSpeedAI

Novita AI

WaveSpeedAI значительно улучшил эффективность нашего инференса и помог нам снизить затраты на генерацию видео на 67%. Благодаря более быстрой и надежной обработке видео мы можем обеспечить исключительный пользовательский опыт в масштабе.
— Junyu Huang, COO Novita AI

История клиента

Novita AI — это компания, специализирующаяся на инфраструктуре вывода ИИ, предоставляющая разработчикам, создателям и предприятиям надежные и эффективные услуги инференса для генерации видео. Компания поддерживает развертывание нескольких основных моделей генерации видео, охватывая сквозные возможности от генерации видео из изображения и текста, обслуживая глобальных творческих пользователей и платформы ИИ с разрешением от 720P до 1080P.

Novita AI

Проблемы до WaveSpeedAI

С увеличением количества моделей и сложности сервиса Novita AI столкнулась с несколькими проблемами в архитектуре инференса и операциях:

  • Сложное планирование ресурсов из-за развертывания нескольких моделей: поддержка нескольких моделей, таких как Wan 2.1, Kling V1.6 и Hunyuan Video, каждая с различными требованиями к памяти и вычислительным ресурсам, привела к значительным различиям в эффективности инференса.

  • Высокие затраты на инференс HD с недоиспользованными GPU: особенно для задач генерации видео 720P и 1080P, отдельные циклы инференса потребляли большое количество памяти GPU, что приводило к высокой стоимости за единицу генерации.

  • Нестабильная задержка при высокой конкурентности: некоторые большие модели испытывали значительные задержки в ответе во время пиковой нагрузки пользователей, что негативно влияло на пользовательский опыт и репутацию платформы.

Сотрудничество с WaveSpeedAI

Для решения этих проблем Novita AI установила глубокое сотрудничество с WaveSpeed AI, сосредоточившись на оптимизированном развертывании следующих основных моделей:

  • Wan 2.1 Image-to-Video / Text-to-Video

Wan 2.1 Image-to-Video / Text-to-Video

MiniMax Video 01

  • Kling V1.6 Image-to-Video / Text-to-Video

Kling V1.6 Image-to-Video / Text-to-Video

Благодаря поддержке WaveSpeed AI компания Novita смогла тонко настроить каждую модель отдельно и динамически распределять ресурсы GPU по единому пулу, тем самым максимизируя как производительность, так и экономичность затрат.

Результаты и преимущества

✅ Оптимизация производительности инференса: эффективность инференса улучшена на 25%, среднее время генерации видео сокращено на 30–40%.

МодельРазрешениеВремя до оптимизацииВремя после оптимизации
Hunyuan Video Fast720P2 минуты1 минута 30 секунд
Wan 2.1 Text-to-Video1280×7202 минуты 24 секунды1 минута 55 секунд
Wan 2.1 Image-to-Video1280×7203 минуты 10 секунд2 минуты 30 секунд
Kling V1.6 Image-to-Video1080P / 5s$0.98 / видео$0.92 / видео

✅ Оптимизация структуры затрат: средняя стоимость за вызов снижена на 30% и более, с экономией до 66% в высокочастотных сценариях.

МодельРазрешениеЗатраты до оптимизацииЗатраты после оптимизацииСокращение затрат
Hunyuan Video Fast720P$0.18 / сек$0.06 / сек-66.7%
Wan 2.1 Text-to-Video1280×720$0.06 / сек$0.04 / сек-33.3%
Wan 2.1 Image-to-Video1280×720$0.08 / сек$0.06 / сек-25.0%
Kling V1.6 Image-to-Video1080P / 5s$0.49 / видео$0.46 / видео-6.1%

✅ Улучшенная стабильность системы: ответы моделей стабильнее при высокой конкурентности, показатель успеха генерации видео повышен, а показатель сбоев снизился ниже 0.05%, что значительно улучшило пользовательский опыт.

Будущее

В будущем Novita AI продолжит углублять сотрудничество с WaveSpeed AI для дальнейшего повышения гибкости и стабильности развертывания нескольких моделей, изучать более эффективные платформы видео-инференса и непрерывно оптимизировать структуру затрат. Благодаря техническим преимуществам WaveSpeedAI компания Novita AI уверена в своей способности предоставлять более быстрые, стабильные и экономичные услуги генерации видео глобальным клиентам, раздвигая границы технологии и деловой ценности в области генерации медиа с помощью ИИ.

Попробуйте прямо сейчас!

🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6

Следите за нами в Twitter, LinkedIn и присоединяйтесь к нашему каналу Discord, чтобы быть в курсе событий.