影片生成終於有聲音:HunyuanVideo-Foley 现已登陆WaveSpeedAI

影片生成終於有聲音:HunyuanVideo-Foley 现已登陆WaveSpeedAI

多年以来,AI 视频生成一直是一部无声电影。我们观看着令人惊艳的 AI 创意视觉在诡异的寂静中展开,等待技术找到自己的声音。

今天,这种等待终于结束了。HunyuanVideo-Foley,腾讯混元的端到端视频音效生成模型,现已在 WaveSpeedAI 上线。创作者首次可以生成同步的视频和电影级音频——由世界上最快的多模态推理加速平台提供支持。

您只需上传一个无声视频和一个简单的文本提示,就能得到一个真实的、带有声音的视频。

解决 AI 音频的三大难题

现有的音频生成技术面临几个困难,如泛化能力有限、语义对齐不一致和音频质量差。

HunyuanVideo-Foley 逐一解决了这些问题。

亮点包括:
🎭 多场景同步 – 与复杂视觉场景高度对齐的高质量音频
🧠 多模态平衡 – 视觉和文本线索之间的完美和谐
🎵 48kHz 高保真输出 – 专业级清晰度,无噪音和失真
🏆 SOTA 性能 – 在保真度、同步性和语义对齐方面领先所有基准
picture2

从短片到大制作

实际上,HunyuanVideo-Foley 是突破性的。它可以应用于多种场景。例如,通过上传一个无声视频,它可以立即生成舒缓的烹饪 ASMR 短片。

无声视频提示:双手在木砧板上切新鲜猕猴桃的放松 ASMR 视频。近距离宏观视图、清脆的刀声、多汁的质感、柔和的自然光线、简洁的极简背景。强调触觉 ASMR 声音:切割、剥皮、轻轻敲击。
文本提示:生成猕猴桃的真实切割声。

同时,为电影级场景配音同样毫不费力。

我们也可以添加动画作品应该有的所有声音。

HunyuanVideo-Foley 还有许多应用——您可以按自己的节奏探索它们。

立即开始创作

无声 AI 视频的时代正式结束。
视频制作技术正在快速发展,创作者必须拥抱这些工具来制作更高质量的内容。
立即尝试 HunyuanVideo-Foley:https://wavespeed.ai/models/wavespeed-ai/hunyuan-video-foley

此外,您可以在下方社交媒体上与我们联系。
Discord: http://discord.com/invite/yHa3J4Vcd