AI影片生成最新動態：2026年最新模型與更新

我是Dora。我開始這個專欄，是因為我一直在丟失線索。

AI影片模型的領域變化太快，我在三月記下的內容，到了五月往往已經過時。當我第四次發現自己引用的價格早已改變，我就放棄了靠記憶，開始把一切寫下來。每月一次。格式固定。這是第一期。

我不是記者。我用這些工具工作，讀的也是所有人都能看到的同一批發布文章和更新日誌。我所能添加的——如果有的話——是過濾。哪些說法我已驗證過，哪些只是引用，哪些我明確存疑。這就是這個專欄的全部使命：每月一次梳理AI影片生成新聞堆，加上我的標籤。

AI影片生成領域現況

本期回顧的結構

六個章節，每月順序相同：模型發布、API存取、定價、能力變化、行業動態、後續展望。另附FAQ。每個項目簡短。每個項目附有時間戳記。我將來源標記為官方（公司文件、系統說明、發布頁面）、媒體報導（主流媒體）或社群（排行榜、獨立基準測試）。當三者出現分歧，我會注記。當我無法獨立核實時，我會說明。我寧可把一個事實標記為「未確認」，也不願替新聞稿背書。

如何解讀「截至」日期

這個教訓我是從實踐中得來的。二月的定價方案不一定撐得到六月。發布當天宣傳的能力，幾週內可能就會被限流。這裡的每一項說法都帶有「截至」時間戳記。過了那個日期——請假設已有偏差。在我自己的工作中，每次依賴某個數字之前，我都會重新核實。你也應該這樣做。

新模型發布與重大版本更新

本期最新發布

從二月到五月，是2026年AI影片模型發布異常密集的一段時期。我回頭數了數，有四個值得追蹤的發布：

Kling 3.0 — 2026年2月5日由快手發布。原生4K輸出、多語言音頻、多模態架構。據報導，發布後數日便登上Artificial Analysis文字轉影片排行榜榜首。此後榜單名次已輪換，所以等你看到這篇文章時，我不會引用那個排名。
Seedance 2.0 — 2026年2月12日由ByteDance發布。以1213 Elo（含音頻）登上同一排行榜第一名，詳見ByteDance的Seedance頁面。發布後幾乎立即出現帶有真實演員的病毒式短片，引發版權審查，目前仍懸而未決。
Veo 3.1 Lite — 2026年3月31日由Google發布。可透過Gemini API和Google AI Studio使用的預算級別方案。720p定價報導為每秒$0.05。完整的Veo 3.1仍是旗艦版本。
LTX-2.3 — 2026年3月5日由Lightricks發布。LTX-2系列的小版本更新。首個同時搭載原生4K、音頻與開放權重的開源模型系列。

大約一百天內發布了四款。大多數行銷語言都高度重疊——每一款都聲稱在某方面實現了「跨越式」提升。我所保留的更窄：原生音頻、4K以及超過60秒的時長，現在已是基本配備，不再是差異化特色。

值得關注的預期發布

公開路線圖上我正在追蹤的兩條線索：

Wan 3.0（阿里巴巴）— 根據阿里巴巴的公開路線圖，目標是2026年中發布。報導規格：600億參數、原生4K、單次推理支援30秒連續生成。時間表未確認。我不打算押這個日期。
OpenAI的下一個影片模型 — 無公開發布日期。Sora的退場（見下一節）留下了明顯的空缺。

API可用性與存取變更

新API端點與SDK更新

這個章節是開發者錯過了就要付出真實代價的部分。

OpenAI Sora API關閉 — OpenAI於2026年3月24日宣布，Sora消費者應用程式與API將停止服務。應用程式於2026年4月26日下線。API預計於2026年9月24日停止服務，詳見OpenAI官方Sora 2頁面。我認識兩個正在進行遷移的人。如果你有任何在生產環境中運行的服務，這個窗口期比看起來要短得多。
Veo 3.1 Lite 透過Gemini API提供 — Google的Veo模型頁面確認可透過Gemini API和Google AI Studio存取。這是Veo系列首次在公開API背後提供真正的預算級別方案。
Seedance 2.0官方開發者API — 截至2026年5月下旬仍未發布。第三方平台已依授權條款整合該模型。據報導，ByteDance在與好萊塢片廠的版權糾紛尚未解決之前，推遲了開發者API的發布。我建議將這個列為值得追蹤的項目——一旦官方端點上線，任何目前透過聚合平台路由的人，其成本計算就會改變。

地區可用性與等待名單進展

Sora 2在其運營期間已擴展至美國、加拿大、日本、韓國、泰國、越南和台灣的Android用戶。這現在已成歷史。Veo 3.1在某些地區仍需通過Google Cloud身份驗證。Kling繼續運行兩個存取層（kling.ai面向國際用戶，klingai.com面向中國用戶）。本期我沒有注意到重大的等待名單取消情況。

定價與速率限制更新

每秒與每片段定價變化

本節的所有內容都帶有有效期限。我在撰寫時已對照各平台自身頁面核實每個數字。使用前請再次核實：

Veo 3.1 Lite：720p每秒$0.05（官方，Google）。
Kling 3.0透過第三方API：約每秒$0.029（媒體報導，fal.ai）。
Seedance 2.0第三方存取：依解析度和方案，每分鐘$0.10–$0.80（媒體報導；無官方費率可供比較）。
Sora 2 API：定價自發布以來未變，但實際可用期限至2026年9月24日終止。

本輪最新AI影片生成定價變動的規律：預算級別的每秒成本正在下降。旗艦級別的定價並未以同樣方式移動。對於高流量工作，這個差距比圍繞模型品質的行銷說法更重要。

並行度與吞吐量變化

本期無重大的公開並行度提升。多個平台已悄悄從信用點數桶計費轉向每任務計費。同樣的工作量，帳單不同——如果你在預測批量成本，值得建模計算。

對生產環境重要的能力變化

原生音頻影片生成

本季最重要的跨廠商變化。Seedance 2.0、Veo 3.1和Kling 3.0現在都能在單次推理中生成帶有同步音頻的影片。根據Google的文件，Veo是唯一能可靠生成48kHz對話的模型。其他模型處理音效、環境音和粗糙的唇形同步。影片生成後再疊加音頻的兩步驟流程，正在合併為一步。

更長的連貫輸出

Sora 2延伸至25秒。Kling 3.0延伸至60秒。兩者在整個時長內都能保持身份連貫性，但效果參差不齊——結果因主體複雜度而異。第一季末的研究論文提到了針對10–20分鐘連貫片段的「長上下文影片Transformer」。這些都尚未發布。

角色與場景一致性

Veo 3.1的「Ingredients to Video」每次生成最多接受三張參考圖像。Seedance 2.0在60秒片段中使用潛在空間錨定技術。Kling 3.0的多鏡頭模式支援最多六個連接鏡頭。沒有一個是完美的。所有都比六個月前發布的版本更好。這是我在未自行進行比較的情況下所能確認的全部，而我這個月沒有做這些比較。

對開發者相關的行業動態

合作夥伴關係與生態系統整合

OpenAI–Disney合作 — 報導稱達成10億美元的授權角色生成協議。這是這個規模上第一個影視公司與AI的合作案。對IP授權工作流程意味著什麼，仍在發展中；我不打算猜測。
Runway融資3.15億美元 — 本期完成。資金繼續流向製作流程層（前期視覺化、故事板、視覺特效整合），而非單純流向模型層。
Luma估值40億美元 — 有報導。與Runway融資傳遞的信號相同——製作工具層是投資者在這個週期押注的持久賭注。

政策、安全與浮水印

我差點跳過這一節。然後我想起了為什麼不應該這樣做。

歐盟AI法案第50條 — 執法於2026年8月2日開始。要求向歐盟受眾發布的所有AI生成影片加上機器可讀標記。罰款最高可達1500萬歐元或全球年營業額的3%。
加州SB 942 — 於2026年1月1日生效。對在加州發布的AI生成內容有披露要求。
C2PA內容認證 — Seedance 2.0內建C2PA浮水印。TikTok已使用C2PA偵測標記超過13億個AI生成影片。參考文件為C2PA技術規格。Google的SynthID作為補充性的像素級浮水印推出。

如果你的流程為歐盟或加州發行製作影片，而你在八月之前沒有合規計劃，這是我這個月會優先處理的工作。這種事往往發現得太晚。

後續關注重點

我將在第三季追蹤的三條線索：

Wan 3.0是否能按2026年中的目標發布，以及600億參數的開放權重承諾是否成立。
Sora API於9月24日停止服務後，什麼將填補這個空缺。
歐盟第50條在前60天的執法情況——特別是上傳平台是否會剝離C2PA元資料，以及當這種情況發生時，責任落在誰身上。

常見問題

AI影片生成領域實際上變化有多快？

根據我自己的追蹤，AI影片生成新聞週期已壓縮至主要模型發布大約每月一次，能力更新和AI影片生成器更新大約每週一次。定價在季中就會發生變化。我最信任的信號：排行榜變動、API文件差異、定價頁面修改。我對發布公告的權重較低——太多宣布的事情沒有按時發布，或是在等待名單後才發布。

近期哪些模型發布對開發者最相關？

我不會告訴你該選哪個模型。但根據本期發布情況，2026年AI影片模型發布中值得現在評估的：Veo 3.1適用於原生音頻對話，Kling 3.0適用於成本平衡的迭代量，Seedance 2.0適用於動感強烈的場景（當且若官方API上線）。鑒於9月24日的停服日期，Sora 2屬於遷移對話，而非新建項目對話。

近期定價變化如何影響生產規劃？

預算級別的每秒定價下降速度快於旗艦級別。如果你主要在720p製作，Veo 3.1 Lite方案和第三方Kling存取能顯著改變成本模型。在鎖定預算之前，請對照最新AI影片生成器更新核實當前費率——在2026年的任何時間點，我都沒見過這個類別的定價在整個季度內保持穩定。

開發者在2026年應該關注哪些能力變化？

在更廣泛的影片AI行業新聞中，值得追蹤的有三點：原生音頻生成成為標準（按我的判斷，到年底它將不再是差異化特色）、角色一致性延伸至60秒以上，以及機器可讀溯源標記在8月2日前對歐盟發行成為強制要求。第三點沒有選擇餘地。前兩點影響你如何選擇模型。第三點影響你是否能向特定市場發布。

往期文章：