扩展AI视频生成：Novita AI如何与WaveSpeedAI实现效率和成本的双重优化

Novita AI

WaveSpeedAI显著提升了我们的推理效率，帮助我们将视频生成成本降低了高达67%。通过更快速和更可靠的视频处理，我们能够大规模交付卓越的用户体验。”
— Novita AI首席运营官黄骏宇

客户背景

Novita AI是一家专注于AI推理基础设施的公司，致力于为创意工作者、开发者和企业提供可靠高效的视频生成推理服务。该公司支持多种主流视频生成模型的部署，涵盖从图像转视频到文本转视频生成的端到端能力，为全球创意用户和AI平台提供720P到1080P不同分辨率的服务。

Novita AI

与WaveSpeedAI合作前的挑战

随着模型数量和服务复杂性的增加，Novita AI在推理架构和运营方面面临了多个挑战：

多模型部署导致的复杂资源调度：支持Wan 2.1、Kling V1.6和Hunyuan Video等多个模型，每个模型都有不同的内存和计算需求，导致推理效率差异显著。
HD推理成本高，GPU利用率不足：特别是对于720P和1080P视频生成任务，单次推理周期消耗大量GPU内存，导致单位生成成本高昂。
高并发下延迟不稳定：某些大型模型在高峰用户流量期间出现显著的响应延迟，对最终用户体验和平台声誉产生负面影响。

与WaveSpeedAI的合作

为了解决这些挑战，Novita AI与WaveSpeed AI建立了深度合作，重点优化部署以下核心模型：

Wan 2.1 图像转视频 / 文本转视频

Wan 2.1 图像转视频 / 文本转视频

Hunyuan Video Fast

MiniMax Video 01

MiniMax Video 01

Kling V1.6 图像转视频 / 文本转视频

Kling V1.6 图像转视频 / 文本转视频

在WaveSpeed AI的支持下，Novita能够对每个模型进行单独的微调，并在统一的资源池中动态调度GPU资源，从而最大化性能和成本效率。

结果与收益

✅ 推理性能优化：推理效率提升高达25%，平均视频生成时间减少30–40%。

模型	分辨率	优化前时间	优化后时间
Hunyuan Video Fast	720P	2分钟	1分30秒
Wan 2.1 文本转视频	1280×720	2分24秒	1分55秒
Wan 2.1 图像转视频	1280×720	3分10秒	2分30秒
Kling V1.6 图像转视频	1080P / 5s	$0.98 / 视频	$0.92 / 视频

✅ 成本结构优化：单次调用平均成本降低超过30%，高分辨率场景中节省高达66%。

模型	分辨率	优化前成本	优化后成本	成本降幅
Hunyuan Video Fast	720P	$0.18 / 秒	$0.06 / 秒	-66.7%
Wan 2.1 文本转视频	1280×720	$0.06 / 秒	$0.04 / 秒	-33.3%
Wan 2.1 图像转视频	1280×720	$0.08 / 秒	$0.06 / 秒	-25.0%
Kling V1.6 图像转视频	1080P / 5s	$0.49 / 视频	$0.46 / 视频	-6.1%

✅ 系统稳定性提升：模型在高并发下的响应更加稳定，视频生成成功率提高，故障率降至0.05%以下，显著提升用户体验。

展望未来

未来，Novita AI将继续深化与WaveSpeed AI的合作，进一步提高多模型部署的灵活性和稳定性，探索更高效的视频推理框架，不断优化成本结构。凭借WaveSpeedAI的技术优势，Novita AI有信心为全球客户提供更快速、更稳定、更具成本效益的视频生成服务——推动AI媒体生成领域技术和业务价值的发展。