AI 비디오 생성 확장: Novita AI가 WaveSpeedAI로 효율성과 비용의 이중 최적화를 달성하는 방법

Novita AI

WaveSpeedAI는 우리의 추론 효율성을 크게 향상시켰으며 비디오 생성 비용을 최대 67%까지 절감하는 데 도움을 주었습니다. 더 빠르고 안정적인 비디오 처리를 통해 규모에 맞춰 뛰어난 사용자 경험을 제공할 수 있습니다.”
— Junyu Huang, Novita AI COO

고객 배경

Novita AI는 AI 추론 인프라에 중점을 두고 크리에이터, 개발자 및 엔터프라이즈에 안정적이고 효율적인 비디오 생성 추론 서비스를 제공하는 데 전력하는 회사입니다. 이 회사는 이미지-비디오 및 텍스트-비디오 생성부터 720P에서 1080P에 이르는 해상도로 엔드-투-엔드 기능을 포괄하여 여러 주요 비디오 생성 모델의 배포를 지원하고 전 세계 창의적인 사용자 및 AI 플랫폼을 서비스합니다.

Novita AI

WaveSpeedAI 이전의 과제

모델 수와 서비스 복잡성이 증가함에 따라 Novita AI는 추론 아키텍처 및 운영에서 여러 과제에 직면했습니다:

다중 모델 배포로 인한 복잡한 리소스 스케줄링: Wan 2.1, Kling V1.6 및 Hunyuan Video와 같은 여러 모델을 지원하면서 각 모델이 서로 다른 메모리 및 계산 요구사항을 가지고 있어 추론 효율성에 상당한 차이를 초래했습니다.
HD 추론의 높은 비용과 GPU 활용도 부족: 특히 720P 및 1080P 비디오 생성 작업의 경우 개별 추론 주기가 많은 양의 GPU 메모리를 소비하여 단위당 생성 비용이 높습니다.
높은 동시성 하에서 불안정한 지연: 일부 대규모 모델은 피크 사용자 트래픽 중에 상당한 응답 지연을 경험하여 최종 사용자 경험 및 플랫폼 평판에 부정적인 영향을 미쳤습니다.

WaveSpeedAI와의 협력

이러한 과제를 해결하기 위해 Novita AI는 WaveSpeed AI와 다음의 핵심 모델의 최적화된 배포에 중점을 두고 깊은 협력을 구축했습니다:

Wan 2.1 Image-to-Video / Text-to-Video

Wan 2.1 Image-to-Video / Text-to-Video

Hunyuan Video Fast

MiniMax Video 01

MiniMax Video 01

Kling V1.6 Image-to-Video / Text-to-Video

Kling V1.6 Image-to-Video / Text-to-Video

WaveSpeed AI의 지원으로 Novita는 각 모델을 개별적으로 미세 조정할 수 있었고 통합 풀 전체에 걸쳐 GPU 리소스를 동적으로 스케줄링하여 성능과 비용 효율성을 모두 극대화했습니다.

결과 및 이점

✅ 추론 성능 최적화: 추론 효율성이 최대 25% 향상되었으며 평균 비디오 생성 시간이 30-40% 감소했습니다.

모델	해상도	최적화 전 시간	최적화 후 시간
Hunyuan Video Fast	720P	2분	1분 30초
Wan 2.1 Text-to-Video	1280×720	2분 24초	1분 55초
Wan 2.1 Image-to-Video	1280×720	3분 10초	2분 30초
Kling V1.6 Image-to-Video	1080P / 5s	비디오당 $0.98	비디오당 $0.92

✅ 비용 구조 최적화: 평균 호출당 비용이 30% 이상 감소했으며 고해상도 시나리오에서는 최대 66% 절감됩니다.

모델	해상도	최적화 전 비용	최적화 후 비용	비용 감소
Hunyuan Video Fast	720P	초당 $0.18	초당 $0.06	-66.7%
Wan 2.1 Text-to-Video	1280×720	초당 $0.06	초당 $0.04	-33.3%
Wan 2.1 Image-to-Video	1280×720	초당 $0.08	초당 $0.06	-25.0%
Kling V1.6 Image-to-Video	1080P / 5s	비디오당 $0.49	비디오당 $0.46	-6.1%

✅ 향상된 시스템 안정성: 높은 동시성 하에서 모델 응답이 더욱 안정적이며 비디오 생성 성공률이 증가했고 실패율이 0.05% 이하로 떨어져 사용자 경험을 크게 향상시켰습니다.

앞으로의 계획

향후 Novita AI는 WaveSpeed AI와의 협력을 계속 심화하여 다중 모델 배포의 유연성과 안정성을 더욱 강화하고 더 효율적인 비디오 추론 프레임워크를 탐색하며 비용 구조를 지속적으로 최적화할 것입니다. WaveSpeedAI의 기술적 강점으로 Novita AI는 전 세계 고객에게 더 빠르고 안정적이며 비용 효율적인 비디오 생성 서비스를 제공할 수 있다는 확신을 가지고 있으며 AI 미디어 생성 분야에서 기술과 비즈니스 가치의 경계를 밀어붙이고 있습니다.