Масштабирование генерации видео с помощью ИИ: Как Novita AI достигает двойной оптимизации эффективности и стоимости с WaveSpeedAI

Novita AI

WaveSpeedAI значительно улучшил эффективность нашего инференса и помог нам снизить затраты на генерацию видео на 67%. Благодаря более быстрой и надежной обработке видео мы можем обеспечить исключительный пользовательский опыт в масштабе.
— Junyu Huang, COO Novita AI

История клиента

Novita AI — это компания, специализирующаяся на инфраструктуре вывода ИИ, предоставляющая разработчикам, создателям и предприятиям надежные и эффективные услуги инференса для генерации видео. Компания поддерживает развертывание нескольких основных моделей генерации видео, охватывая сквозные возможности от генерации видео из изображения и текста, обслуживая глобальных творческих пользователей и платформы ИИ с разрешением от 720P до 1080P.

Novita AI

Проблемы до WaveSpeedAI

С увеличением количества моделей и сложности сервиса Novita AI столкнулась с несколькими проблемами в архитектуре инференса и операциях:

Сложное планирование ресурсов из-за развертывания нескольких моделей: поддержка нескольких моделей, таких как Wan 2.1, Kling V1.6 и Hunyuan Video, каждая с различными требованиями к памяти и вычислительным ресурсам, привела к значительным различиям в эффективности инференса.
Высокие затраты на инференс HD с недоиспользованными GPU: особенно для задач генерации видео 720P и 1080P, отдельные циклы инференса потребляли большое количество памяти GPU, что приводило к высокой стоимости за единицу генерации.
Нестабильная задержка при высокой конкурентности: некоторые большие модели испытывали значительные задержки в ответе во время пиковой нагрузки пользователей, что негативно влияло на пользовательский опыт и репутацию платформы.

Сотрудничество с WaveSpeedAI

Для решения этих проблем Novita AI установила глубокое сотрудничество с WaveSpeed AI, сосредоточившись на оптимизированном развертывании следующих основных моделей:

Wan 2.1 Image-to-Video / Text-to-Video

Wan 2.1 Image-to-Video / Text-to-Video

Hunyuan Video Fast

MiniMax Video 01

MiniMax Video 01

Kling V1.6 Image-to-Video / Text-to-Video

Kling V1.6 Image-to-Video / Text-to-Video

Благодаря поддержке WaveSpeed AI компания Novita смогла тонко настроить каждую модель отдельно и динамически распределять ресурсы GPU по единому пулу, тем самым максимизируя как производительность, так и экономичность затрат.

Результаты и преимущества

✅ Оптимизация производительности инференса: эффективность инференса улучшена на 25%, среднее время генерации видео сокращено на 30–40%.

Модель	Разрешение	Время до оптимизации	Время после оптимизации
Hunyuan Video Fast	720P	2 минуты	1 минута 30 секунд
Wan 2.1 Text-to-Video	1280×720	2 минуты 24 секунды	1 минута 55 секунд
Wan 2.1 Image-to-Video	1280×720	3 минуты 10 секунд	2 минуты 30 секунд
Kling V1.6 Image-to-Video	1080P / 5s	$0.98 / видео	$0.92 / видео

✅ Оптимизация структуры затрат: средняя стоимость за вызов снижена на 30% и более, с экономией до 66% в высокочастотных сценариях.

Модель	Разрешение	Затраты до оптимизации	Затраты после оптимизации	Сокращение затрат
Hunyuan Video Fast	720P	$0.18 / сек	$0.06 / сек	-66.7%
Wan 2.1 Text-to-Video	1280×720	$0.06 / сек	$0.04 / сек	-33.3%
Wan 2.1 Image-to-Video	1280×720	$0.08 / сек	$0.06 / сек	-25.0%
Kling V1.6 Image-to-Video	1080P / 5s	$0.49 / видео	$0.46 / видео	-6.1%

✅ Улучшенная стабильность системы: ответы моделей стабильнее при высокой конкурентности, показатель успеха генерации видео повышен, а показатель сбоев снизился ниже 0.05%, что значительно улучшило пользовательский опыт.

Будущее

В будущем Novita AI продолжит углублять сотрудничество с WaveSpeed AI для дальнейшего повышения гибкости и стабильности развертывания нескольких моделей, изучать более эффективные платформы видео-инференса и непрерывно оптимизировать структуру затрат. Благодаря техническим преимуществам WaveSpeedAI компания Novita AI уверена в своей способности предоставлять более быстрые, стабильные и экономичные услуги генерации видео глобальным клиентам, раздвигая границы технологии и деловой ценности в области генерации медиа с помощью ИИ.

Попробуйте прямо сейчас!

🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6

Масштабирование генерации видео с помощью ИИ: Как Novita AI достигает двойной оптимизации эффективности и стоимости с WaveSpeedAI

История клиента

Проблемы до WaveSpeedAI

Сотрудничество с WaveSpeedAI

Результаты и преимущества

Будущее

Попробуйте прямо сейчас!

Похожие статьи

Seedance 2.0 уже скоро: видеомодель нового поколения от ByteDance с встроенным аудио

Seedance 2.0 Полное руководство: Создание видео с несколькими модальностями

Seedance 2.0 vs Kling 3.0 vs Sora 2 vs Veo 3.1: Полное сравнение генерации видео

Обзор Vidu Q3: Сравнение с Sora 2, Wan 2.6, Seedance 1.5, Veo 3.1 и Grok Imagine Video

Grok Imagine Video против Sora 2, Veo 3.1, Seedance 1.5, WAN 2.5/2.6 и Vidu Q3: Полное сравнение

Чего ожидать от Kling 3.0: Технический обзор