视频生成终于有声音了:HunyuanVideo-Foley 现已登陆WaveSpeedAI
多年来,AI视频生成一直是一部无声电影。我们看着令人惊艳的AI创意视觉在诡异的寂静中展开,等待技术找到它的声音。
今天,这个等待终于结束了。HunyuanVideo-Foley,腾讯Hunyuan的端到端视频音效生成模型,现已在WaveSpeedAI上推出。创意工作者首次可以生成同步的视频和电影级音频——由全球最快的多模态推理加速平台驱动。
你只需上传一个无声视频和简单的文本提示,就会得到一个真实的、启用了声音的视频。
解决AI音频的三大难题
现有的音频生成技术面临多个困难,例如泛化能力有限、语义对齐不一致以及音频质量不佳。
HunyuanVideo-Foley逐一解决了这些问题。
亮点包括:
🎭 多场景同步 – 与复杂视觉场景高度对齐的高质量音频
🧠 多模态平衡 – 视觉和文本线索之间的完美和谐
🎵 48kHz Hi-Fi输出 – 专业级清晰度,无噪音和伪影
🏆 SOTA性能 – 在保真度、同步性和语义对齐方面领先所有基准
从短视频到大制作
事实上,HunyuanVideo-Foley是革命性的。它可以应用于广泛的场景。例如,通过上传一个无声视频,它可以立即生成一个舒缓的烹饪ASMR片段。
无声视频提示:一个放松身心的ASMR视频,展示双手在木制砧板上切新鲜猕猴桃。近距离微距视角,清晰的刀声,多汁的纹理,柔和的自然光线,干净简洁的背景。强调触觉ASMR声音:切割、剥皮、轻轻敲击。
文本提示:生成猕猴桃的真实切割声。
同时,电影级场景的配音同样轻而易举。
我们也可以添加动画作品应该有的所有声音。
HunyuanVideo-Foley还有许多其他应用——你可以按自己的节奏探索它们。
今天开始创建
无声AI视频的时代正式结束了。
视频制作技术正在迅速发展,创意工作者必须拥抱这些工具来制作更高质量的内容。
立即尝试HunyuanVideo-Foley:https://wavespeed.ai/models/wavespeed-ai/hunyuan-video-foley
此外,你可以在下方社交媒体上与我们联系。
Discord:http://discord.com/invite/yHa3J4Vcd
X (Twitter):http://x.com/wavespeed_ai
开源项目:http://github.com/chengzeyi

