VOID Video Inpainting 现已登陆WaveSpeedAI
VOID Video Inpainting——使用遮罩引导的AI修复技术从视频中移除对象。支持四重遮罩或自动SAM-3遮罩,可选Pass 2精化以保证时序一致性。现已在WaveSpeedAI上线。
视频中的干净对象移除——终于有一个真正好用的了
从视频中移除不需要的对象,历来是后期制作中最难的问题——逐帧转描、仿制图章操作、时间闪烁。大多数 AI 尝试都产生了闪烁不稳定的结果,只在单帧上看起来不错。VOID Video Inpainting 采用了不同的方法:基于遮罩引导的修复,配合可选的 Pass 2 精修,从而锁定时间一致性。我们很高兴地宣布,VOID Video Inpainting 现已在 WaveSpeedAI 上线。
什么是 VOID Video Inpainting?
VOID Video Inpainting 是一个遮罩引导的视频对象移除模型。你需要提供:
- 输入视频。
- 遮罩——可以手动提供(四边形遮罩),也可以通过 SAM-3 自动生成。
VOID 会生成一个干净版本的视频,将遮罩区域修复填充,使用与周围场景相匹配的上下文感知内容——跨时间帧,而非仅针对单帧。
核心功能
四边形遮罩或自动 SAM-3 遮罩 提供你自己的遮罩,或让内置的 SAM-3 集成根据边界区域或点击提示自动生成遮罩。
可选 Pass 2 精修
启用 enable_pass2_refinement 可运行第二次精修,显著提升时间一致性——大幅减少困难镜头中的闪烁。
可调节的去噪与引导参数
调整 denoising_steps、guidance_scale 和 temporal_window_size,以适配你的镜头所需的质量/成本权衡。
时间窗口控制 设置模型一次推理的帧数范围——更大的窗口在快速运动内容上能更好地保持动作连贯性。
生产级 REST API 这不是研究演示——而是一个经过强化的端点,可直接接入后期制作和剪辑流程。
真实应用场景
拍摄现场的失误——不需要的器材、工作人员、标识
移除吊杆麦克风、导演的倒影、驶过的卡车——无需转描艺术家。
社交 / UGC 内容清理
创作者可以从手机拍摄的视频中抹去不需要的人物、Logo 或背景杂乱元素。
电商视频清理
按 SKU 批量移除商品视频中的标签、手指或反光。
档案与纪录片修复
清理档案素材中的电线、杂物、损伤——同时保留原始美学风格。
视效板材准备
在插入 CG 元素之前预先清洁板材。干净板材与凌乱板材的差距,就是 2 小时合成与 2 天合成的差距。
隐私与合规
从训练数据、文档视频或发布材料中移除身份标识、面部或车牌。
在 WaveSpeedAI 上快速开始
- 上传源视频。
- 提供遮罩——四边形遮罩、预制遮罩视频,或让 SAM-3 自动生成。
- 调整精修设置——最佳质量启用 Pass 2,追求速度则跳过。
- 提交——生产级 REST API,无冷启动。
完整参数说明请见模型页面。
定价
- 基础费率: 每秒源视频 $0.05。
- Pass 2 精修: 基础价格的 2 倍(对于可发布的作品强烈推荐)。
- 提供遮罩视频: 每秒额外 +$0.05。
一个 10 秒的片段,启用 Pass 2 并使用自动生成遮罩,费用为 $1.00。若提供自定义遮罩视频,则为 $1.50。
为什么选择在 WaveSpeedAI 上运行 VOID Video Inpainting
- 视频栈的统一 API。 通过同一端点将 VOID 修复与生成、放大、编辑模型串联。
- 无冷启动。 对于交互式后期制作工具至关重要。
- 透明的按秒计费 + 附加项定价。 为制作公司提供可预测的账单。
- 生产级吞吐量。 可跨整个拍摄项目的板材并行批量处理任务。
专业建议
- 核心镜头务必尝试 Pass 2。 时间一致性的提升完全值得 2 倍的成本。
- SAM-3 遮罩是很好的起点。 对于棘手的边缘,审查后手动精修再提交。
- 遮罩越小,修复越干净。 过大的遮罩会减少模型可参考的上下文。
- 快速运动使用更大的时间窗口。 动作镜头受益于更长的时间范围;静态镜头则无需如此。
- 先跑低分辨率预览。 用低成本先调好遮罩和参数,再以全分辨率 + Pass 2 提交最终版本。
立即开始创作
VOID Video Inpainting 是我们见过的最干净的对象移除流程,以单次 API 调用的形式封装——具备真正的时间一致性,而非仅仅的单帧魔法。
立即在 WaveSpeedAI 上试用 VOID Video Inpainting,一次调用即可从视频中移除不需要的内容。




