AI视频生成规模化:Novita AI如何与WaveSpeedAI实现效率和成本的双重优化

AI视频生成规模化:Novita AI如何与WaveSpeedAI实现效率和成本的双重优化

扩展AI视频生成:Novita AI如何与WaveSpeedAI实现效率和成本的双重优化

Novita AI

WaveSpeedAI显著提升了我们的推理效率,帮助我们将视频生成成本降低了高达67%。通过更快速和更可靠的视频处理,我们能够大规模交付卓越的用户体验。”
— Novita AI首席运营官黄骏宇

客户背景

Novita AI是一家专注于AI推理基础设施的公司,致力于为创意工作者、开发者和企业提供可靠高效的视频生成推理服务。该公司支持多种主流视频生成模型的部署,涵盖从图像转视频到文本转视频生成的端到端能力,为全球创意用户和AI平台提供720P到1080P不同分辨率的服务。

Novita AI

与WaveSpeedAI合作前的挑战

随着模型数量和服务复杂性的增加,Novita AI在推理架构和运营方面面临了多个挑战:

  • 多模型部署导致的复杂资源调度:支持Wan 2.1、Kling V1.6和Hunyuan Video等多个模型,每个模型都有不同的内存和计算需求,导致推理效率差异显著。

  • HD推理成本高,GPU利用率不足:特别是对于720P和1080P视频生成任务,单次推理周期消耗大量GPU内存,导致单位生成成本高昂。

  • 高并发下延迟不稳定:某些大型模型在高峰用户流量期间出现显著的响应延迟,对最终用户体验和平台声誉产生负面影响。

与WaveSpeedAI的合作

为了解决这些挑战,Novita AI与WaveSpeed AI建立了深度合作,重点优化部署以下核心模型:

  • Wan 2.1 图像转视频 / 文本转视频

Wan 2.1 图像转视频 / 文本转视频

MiniMax Video 01

  • Kling V1.6 图像转视频 / 文本转视频

Kling V1.6 图像转视频 / 文本转视频

在WaveSpeed AI的支持下,Novita能够对每个模型进行单独的微调,并在统一的资源池中动态调度GPU资源,从而最大化性能和成本效率。

结果与收益

✅ 推理性能优化:推理效率提升高达25%,平均视频生成时间减少30–40%。

模型分辨率优化前时间优化后时间
Hunyuan Video Fast720P2分钟1分30秒
Wan 2.1 文本转视频1280×7202分24秒1分55秒
Wan 2.1 图像转视频1280×7203分10秒2分30秒
Kling V1.6 图像转视频1080P / 5s$0.98 / 视频$0.92 / 视频

✅ 成本结构优化:单次调用平均成本降低超过30%,高分辨率场景中节省高达66%。

模型分辨率优化前成本优化后成本成本降幅
Hunyuan Video Fast720P$0.18 / 秒$0.06 / 秒-66.7%
Wan 2.1 文本转视频1280×720$0.06 / 秒$0.04 / 秒-33.3%
Wan 2.1 图像转视频1280×720$0.08 / 秒$0.06 / 秒-25.0%
Kling V1.6 图像转视频1080P / 5s$0.49 / 视频$0.46 / 视频-6.1%

✅ 系统稳定性提升:模型在高并发下的响应更加稳定,视频生成成功率提高,故障率降至0.05%以下,显著提升用户体验。

展望未来

未来,Novita AI将继续深化与WaveSpeed AI的合作,进一步提高多模型部署的灵活性和稳定性,探索更高效的视频推理框架,不断优化成本结构。凭借WaveSpeedAI的技术优势,Novita AI有信心为全球客户提供更快速、更稳定、更具成本效益的视频生成服务——推动AI媒体生成领域技术和业务价值的发展。

立即体验!

🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6

TwitterLinkedIn上关注我们,加入我们的Discord频道,保持更新。