AI视频生成规模化:Novita AI如何与WaveSpeedAI实现效率和成本的双重优化
扩展AI视频生成:Novita AI如何与WaveSpeedAI实现效率和成本的双重优化

WaveSpeedAI显著提升了我们的推理效率,帮助我们将视频生成成本降低了高达67%。通过更快速和更可靠的视频处理,我们能够大规模交付卓越的用户体验。”
— Novita AI首席运营官黄骏宇
客户背景
Novita AI是一家专注于AI推理基础设施的公司,致力于为创意工作者、开发者和企业提供可靠高效的视频生成推理服务。该公司支持多种主流视频生成模型的部署,涵盖从图像转视频到文本转视频生成的端到端能力,为全球创意用户和AI平台提供720P到1080P不同分辨率的服务。

与WaveSpeedAI合作前的挑战
随着模型数量和服务复杂性的增加,Novita AI在推理架构和运营方面面临了多个挑战:
-
多模型部署导致的复杂资源调度:支持Wan 2.1、Kling V1.6和Hunyuan Video等多个模型,每个模型都有不同的内存和计算需求,导致推理效率差异显著。
-
HD推理成本高,GPU利用率不足:特别是对于720P和1080P视频生成任务,单次推理周期消耗大量GPU内存,导致单位生成成本高昂。
-
高并发下延迟不稳定:某些大型模型在高峰用户流量期间出现显著的响应延迟,对最终用户体验和平台声誉产生负面影响。
与WaveSpeedAI的合作
为了解决这些挑战,Novita AI与WaveSpeed AI建立了深度合作,重点优化部署以下核心模型:
- Wan 2.1 图像转视频 / 文本转视频

- Hunyuan Video Fast

- Kling V1.6 图像转视频 / 文本转视频

在WaveSpeed AI的支持下,Novita能够对每个模型进行单独的微调,并在统一的资源池中动态调度GPU资源,从而最大化性能和成本效率。
结果与收益
✅ 推理性能优化:推理效率提升高达25%,平均视频生成时间减少30–40%。
| 模型 | 分辨率 | 优化前时间 | 优化后时间 |
|---|---|---|---|
| Hunyuan Video Fast | 720P | 2分钟 | 1分30秒 |
| Wan 2.1 文本转视频 | 1280×720 | 2分24秒 | 1分55秒 |
| Wan 2.1 图像转视频 | 1280×720 | 3分10秒 | 2分30秒 |
| Kling V1.6 图像转视频 | 1080P / 5s | $0.98 / 视频 | $0.92 / 视频 |
✅ 成本结构优化:单次调用平均成本降低超过30%,高分辨率场景中节省高达66%。
| 模型 | 分辨率 | 优化前成本 | 优化后成本 | 成本降幅 |
|---|---|---|---|---|
| Hunyuan Video Fast | 720P | $0.18 / 秒 | $0.06 / 秒 | -66.7% |
| Wan 2.1 文本转视频 | 1280×720 | $0.06 / 秒 | $0.04 / 秒 | -33.3% |
| Wan 2.1 图像转视频 | 1280×720 | $0.08 / 秒 | $0.06 / 秒 | -25.0% |
| Kling V1.6 图像转视频 | 1080P / 5s | $0.49 / 视频 | $0.46 / 视频 | -6.1% |
✅ 系统稳定性提升:模型在高并发下的响应更加稳定,视频生成成功率提高,故障率降至0.05%以下,显著提升用户体验。
展望未来
未来,Novita AI将继续深化与WaveSpeed AI的合作,进一步提高多模型部署的灵活性和稳定性,探索更高效的视频推理框架,不断优化成本结构。凭借WaveSpeedAI的技术优势,Novita AI有信心为全球客户提供更快速、更稳定、更具成本效益的视频生成服务——推动AI媒体生成领域技术和业务价值的发展。
立即体验!
🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6
