InfiniteTalk：無限對話，最大真實感现已登陆WaveSpeedAI

目前，大多數 AI 影片工具只能生成靜音影片。雖然 Google 的 Veo 3 帶動了唇形同步技術進入主流，但現有解決方案仍缺乏對長時間互動對話的真正支援。

這就是為什麼我們很高興地宣佈在我們的平台上推出 InfiniteTalk——一個數位人類模型，能夠進行 ** 長達 10 分鐘** 的自然對話，甚至 ** 支援雙人對話**。創作者只需一個 API 呼叫就能將靜態照片轉變為動態、逼真的數位人類。

告別傳統影片製作

InfiniteTalk 基於一個新穎的稀疏幀影片配音框架，不僅能夠實現增量更新，還能從音訊輸入生成無限長的說話影片，實現精確的唇形同步、頭部運動、身體姿態和面部表情。

只需上傳一張（或兩張團體）肖像照片和一個音訊文件（或兩個音訊文件），InfiniteTalk 就能生成逼真的數位人類，能夠進行持續、自然的對話（長達 10 分鐘）——無論是進行獨白演講還是參與雙人對話，都可以輕鬆實現。

迄今為止，廣泛可用的 AI 影片生成工具主要專注於極短的 5-10 秒片段。隨著影片長度增加，扭曲、身份漂移和抖動等問題變得越來越普遍。

然而，InfiniteTalk 從一開始就被設計來克服這些限制。與局限於 5-10 秒的現有工具不同，InfiniteTalk 將影片生成擴展到 10 分鐘——比領先替代品長 3 倍。它不僅支援長達 10 分鐘的穩定品質影片生成，還支援雙人對話，這是 AI 影片的真正里程碑。

無論您是在構建數位人類產品、本地化影片內容還是創建沉浸式虛擬體驗，InfiniteTalk 都以無與倫比的效率提供精度、可擴展性和真實感。我們的端點起價為 480p 影片生成每 5 秒 $0.15 或 720p 影片生成每 5 秒 $0.3，支援最長 10 分鐘的生成長度。立即試用！