Veo 3.1 現已登陸WaveSpeedAI
Veo 3 開啟了 AI 影片生成的新篇章 — 當有聲影片成為可能,而非只是想像。 在 OpenAI 的 Sora 2 推出後,Google 正快速推進下一步。 Veo 3.1 現已在 WaveSpeedAI 上推出 — 具備參考影像影片生成、流暢的幀插值和高解析度 1080p 輸出,讓創作者能夠製作** 更一致的**、** 生動逼真的同步有聲影片**。
什麼是 Veo?
Veo 是 Google 的 AI 影片模型系列,可將文字或圖像轉換為帶有聲音的短影片 — 包括音樂、環境音和對白。 Veo 3 有兩個版本: Veo 3(標準版) – 用於高品質、電影級的效果。 Veo 3 Fast – 針對更快的生成和測試進行了優化。
Veo 3.1 的新功能
與 Veo 3 相比,3.1 更新代表了一次基礎模型升級 — 結合了更高保真度的視覺真實感與上下文感知、同步音訊生成。
這是迄今為止最接近真正「文字轉場景」電影製作引擎的版本。
更聰明的視覺-音訊融合
Veo 3.1 中的新基礎模型將影片和音訊推理結合得更緊密。
提示詞:電影級 POV 影片,超逼真,8k,在日本古老木製雲霄飛車上的驚險第一人稱體驗,坐在最前排,完全無遮擋的視野。場景設置在黃金時刻日落,投射出戲劇性的溫暖光線。遠處,壯麗的被冰雪覆蓋的富士山 ……
在 Veo 3.0 中,雲霄飛車場景看起來很流暢但內部「無聲」— 張力根本不在。
現在,Veo 3.1 捕捉每一聲尖叫、風的呼嘯聲和金屬的嘎嘎聲,與動作完美同步,將你帶入了騎行體驗。
主體參考生成(R2V):保留臉部和物體
與 Veo 3.0 不同,新的 Veo 3.1 允許你上傳 1–3 張參考圖像,使模型能夠在每一幀中保持視覺一致性。
它保持臉部、動作和環境對齐,消除長片段中的角色漂移或尷尬的轉場。
提示詞:一個留著鬍鬚、戴著毛帽和安全眼鏡的男人正在往木牆上鑽孔。鑽頭剛好穿破牆壁,露出另一側陽光明媚、盛開著鮮豔野花的田野。男人停止鑽孔,他的表情變成了敬畏和喜悅。他放下了鑽頭,現在正站著雙臂張開,面向美麗的花田,彷彿在擁抱他剛剛發現的新世界。花田的光線照亮了他的臉和牆的邊緣。
幀控生成:開頭、結尾及其中的所有內容
你現在可以鎖定第一幀和最後一幀,Veo 3.1 將平順地填充其中的所有內容。
提示詞:一個穿著剪裁得體的灰色套裝、拿著棕色皮革公事包的年輕男子,自信地走在陽光照耀的城市街道上,具有古典建築風格……
Veo 3.1 適合誰?
- 🎥 數位主持人和虛擬角色:企業培訓、新聞和娛樂。
- 🤖 客戶服務代理:逼真、對話式的影片回應。
- 📚 教育和電子學習:傳遞長篇講座內容。
- 🌍 內容本地化:具有精確唇音同步的可擴展配音。
立即在 WaveSpeedAI 上試用 Veo 3.1
現在就在 WaveSpeedAI 上開始使用 Veo 3.1 進行創作!訪問遊樂場,上傳你選擇的圖像,輸入你的文字,然後點擊「生成」。只需幾秒鐘,你的說話影片就準備好編輯了。
🔗text-to-video
🔗text-to-video-fast
🔗image-to-video
🔗image-to-video-fast
🔗reference-to-video





