Veo 3.1 現已登陸WaveSpeedAI

2025-04-02

sora openai video-generation

Veo 3.1 現已登陸WaveSpeedAI

Veo 3 開啟了 AI 影片生成的新篇章 — 當有聲影片成為可能，而非只是想像。在 OpenAI 的 Sora 2 推出後，Google 正快速推進下一步。 Veo 3.1 現已在 WaveSpeedAI 上推出 — 具備參考影像影片生成、流暢的幀插值和高解析度 1080p 輸出，讓創作者能夠製作** 更一致的**、** 生動逼真的同步有聲影片**。

什麼是 Veo？

Veo 是 Google 的 AI 影片模型系列，可將文字或圖像轉換為帶有聲音的短影片 — 包括音樂、環境音和對白。 Veo 3 有兩個版本： Veo 3（標準版） – 用於高品質、電影級的效果。 Veo 3 Fast – 針對更快的生成和測試進行了優化。

Veo 3.1 的新功能

與 Veo 3 相比，3.1 更新代表了一次基礎模型升級 — 結合了更高保真度的視覺真實感與上下文感知、同步音訊生成。

這是迄今為止最接近真正「文字轉場景」電影製作引擎的版本。

更聰明的視覺-音訊融合

Veo 3.1 中的新基礎模型將影片和音訊推理結合得更緊密。

提示詞：電影級 POV 影片，超逼真，8k，在日本古老木製雲霄飛車上的驚險第一人稱體驗，坐在最前排，完全無遮擋的視野。場景設置在黃金時刻日落，投射出戲劇性的溫暖光線。遠處，壯麗的被冰雪覆蓋的富士山 ……

在 Veo 3.0 中，雲霄飛車場景看起來很流暢但內部「無聲」— 張力根本不在。

現在，Veo 3.1 捕捉每一聲尖叫、風的呼嘯聲和金屬的嘎嘎聲，與動作完美同步，將你帶入了騎行體驗。

主體參考生成（R2V）：保留臉部和物體

與 Veo 3.0 不同，新的 Veo 3.1 允許你上傳 1–3 張參考圖像，使模型能夠在每一幀中保持視覺一致性。

它保持臉部、動作和環境對齐，消除長片段中的角色漂移或尷尬的轉場。

提示詞：一個留著鬍鬚、戴著毛帽和安全眼鏡的男人正在往木牆上鑽孔。鑽頭剛好穿破牆壁，露出另一側陽光明媚、盛開著鮮豔野花的田野。男人停止鑽孔，他的表情變成了敬畏和喜悅。他放下了鑽頭，現在正站著雙臂張開，面向美麗的花田，彷彿在擁抱他剛剛發現的新世界。花田的光線照亮了他的臉和牆的邊緣。

幀控生成：開頭、結尾及其中的所有內容

你現在可以鎖定第一幀和最後一幀，Veo 3.1 將平順地填充其中的所有內容。

提示詞：一個穿著剪裁得體的灰色套裝、拿著棕色皮革公事包的年輕男子，自信地走在陽光照耀的城市街道上，具有古典建築風格……

Veo 3.1 適合誰？

🎥 數位主持人和虛擬角色：企業培訓、新聞和娛樂。
🤖 客戶服務代理：逼真、對話式的影片回應。
📚 教育和電子學習：傳遞長篇講座內容。
🌍 內容本地化：具有精確唇音同步的可擴展配音。

立即在 WaveSpeedAI 上試用 Veo 3.1

現在就在 WaveSpeedAI 上開始使用 Veo 3.1 進行創作！訪問遊樂場，上傳你選擇的圖像，輸入你的文字，然後點擊「生成」。只需幾秒鐘，你的說話影片就準備好編輯了。

🔗text-to-video
🔗text-to-video-fast
🔗image-to-video
🔗image-to-video-fast
🔗reference-to-video