InfiniteTalk:無限對話,最大真實感现已登陆WaveSpeedAI

InfiniteTalk:無限對話,最大真實感现已登陆WaveSpeedAI

目前,大多數 AI 影片工具只能生成靜音影片。雖然 Google 的 Veo 3 帶動了唇形同步技術進入主流,但現有解決方案仍缺乏對長時間互動對話的真正支援。

這就是為什麼我們很高興地宣佈在我們的平台上推出 InfiniteTalk——一個數位人類模型,能夠進行 ** 長達 10 分鐘** 的自然對話,甚至 ** 支援雙人對話**。創作者只需一個 API 呼叫就能將靜態照片轉變為動態、逼真的數位人類。

告別傳統影片製作

InfiniteTalk 基於一個新穎的稀疏幀影片配音框架,不僅能夠實現增量更新,還能從音訊輸入生成無限長的說話影片,實現精確的唇形同步、頭部運動、身體姿態和面部表情。

只需上傳一張(或兩張團體)肖像照片和一個音訊文件(或兩個音訊文件),InfiniteTalk 就能生成逼真的數位人類,能夠進行持續、自然的對話(長達 10 分鐘)——無論是進行獨白演講還是參與雙人對話,都可以輕鬆實現。

突破 10 秒障礙

迄今為止,廣泛可用的 AI 影片生成工具主要專注於極短的 5-10 秒片段。隨著影片長度增加,扭曲、身份漂移和抖動等問題變得越來越普遍。

然而,InfiniteTalk 從一開始就被設計來克服這些限制。與局限於 5-10 秒的現有工具不同,InfiniteTalk 將影片生成擴展到 10 分鐘——比領先替代品長 3 倍。它不僅支援長達 10 分鐘的穩定品質影片生成,還支援雙人對話,這是 AI 影片的真正里程碑。

InfiniteTalk 的新現實

功能InfiniteTalk(舊版)InfiniteTalk(升級版)
最長影片長度長達 2 分鐘長達 10 分鐘
穩定性良好優秀(長格式無抖動)
雙人說話模式不支援兩個數位人類進行逼真對話

使用 InfiniteTalk 可以構建什麼?

  • 數位主持人和虛擬人物:用於企業培訓、新聞和娛樂。
  • 客服代理:提供逼真的對話式影片回應。
  • 教育與電子學習:傳遞長篇講座內容。 例如,教師教學生如何正確發音。
  • 內容本地化:大規模配音,精確同步。

開始展示,而不只是敘述

無論您是在構建數位人類產品、本地化影片內容還是創建沉浸式虛擬體驗,InfiniteTalk 都以無與倫比的效率提供精度、可擴展性和真實感。我們的端點起價為 480p 影片生成每 5 秒 $0.15 或 720p 影片生成每 5 秒 $0.3,支援最長 10 分鐘的生成長度。立即試用!

🔗https://wavespeed.ai/models/wavespeed-ai/infinitetalk/multi 🔗https://wavespeed.ai/models/wavespeed-ai/infinitetalk