← 部落格

阿里巴巴 WAN 2.1 T2V Plus 720p 现已登陆WaveSpeedAI

阿里巴巴 WAN 2.1 T2V Plus (720p) 將文字提示轉換為高品質 720p 影片,支援無限制 AI 影片生成。隨時可用的 REST 推論 API、最佳效能、無冷啟動、價格親民。

2 min read
Alibaba Wan.2.1 T2v Plus 720p
Alibaba Wan.2.1 T2v Plus 720p 阿里巴巴 WAN 2.1 T2V Plus (720p) 將文字提示轉換為高品質 720p 影片,支援無限制 AI 影片...
Try it
阿里巴巴 WAN 2.1 T2V Plus 720p 现已登陆WaveSpeedAI

介紹阿里巴巴 Wan 2.1 T2V Plus (720p) 在 WaveSpeedAI 上的推出

AI 影片生成的環境已經到達了一個關鍵時刻,我們很高興能將其中一項最令人印象深刻的開源突破帶到 WaveSpeedAI。阿里巴巴 Wan 2.1 T2V Plus (720p) 現已在我們的平台上推出,提供專業級文字轉影片生成,其表現可與—在許多基準測試中甚至超越—OpenAI 的 Sora 等專有模型。

什麼是阿里巴巴 Wan 2.1 T2V Plus?

阿里巴巴 Wan 2.1 T2V Plus 代表阿里巴巴雲計算的通義實驗室對日益增長的易於使用、高品質 AI 影片生成需求的回應。基於擴散變換器 (DiT) 範例以及自訂的** 時空變分自編碼器 (Wan-VAE)**,這個 140 億參數模型將文本提示轉化為具有卓越逼真度和動作連貫性的電影級 720p 影片。

Wan 2.1 的與眾不同之處不僅在於其技術實力—還在於影片 AI 的民主化。雖然 Sora 和 Google 的 Veo 2 等競爭對手仍被鎖在付費牆後面,但阿里巴巴在 Apache 2.0 許可證下發佈了 Wan 2.1,訓練資料來自大約 15 億個影片和 100 億張圖像。其結果是一個從根本上理解視覺敘事的模型。

VBench 排行榜—評估 AI 影片生成器的業界標準—Wan 2.1 達到了 86.22% 的總分,超越了 Sora 的 84.28% 和 Luma 的 83.61%。這些不是邊際改進;它們代表了主題一致性、空間準確性和動作流暢性的可衡量進步。

關鍵功能

電影級視覺控制 Wan 2.1 T2V Plus 提供對您的影片輸出的好萊塢級控制。該模型捕捉細緻的燈光、精巧的色彩分級和專業的景深—這些元素以前需要昂貴的後期製作工作或閉源解決方案。

優越的動作連貫性 AI 影片生成最具挑戰性的方面之一是在整個片段中保持平滑、逼真的動作。Wan 2.1 在這方面表現出色,確保主體和背景之間動作流暢,沒有較差模型常見的閃爍、扭曲或結構偏移。

提示忠實生成 詳細描述一個場景,Wan 2.1 就會交付。該模型的 T5 編碼器與交叉注意力架構提供強大的文本處理,準確解釋複雜提示,無論您要求的是「一隻金毛獵犬在秋葉中奔跑的慢動作鏡頭」還是「帶有飛行交通工具的霓虹燈網路龐克城市景觀」。

多語言文本生成 業界首創—Wan 2.1 支持在 AI 生成的影片中同時生成中文和英文文本,為本地化內容創建和多語言行銷材料打開了大門。

優化的 720p 效率 T2V Plus 變體在品質和性能之間達到了理想的平衡。在 720p 解析度下,您可以獲得專業級輸出,同時與更高解析度替代方案相比具有更快的推理時間和更低的計算成本。

真實世界用例

社交媒體內容創建

為 TikTok、Instagram Reels 或 YouTube Shorts 生成引人注目的 5 秒片段。該模型的橫向 (1280×720) 和縱向 (720×1280) 選項讓您可以針對任何平台進行優化。創建產品展示、品牌時刻或病毒式內容,無需拍攝一幀。

行銷和廣告

將您的行銷文案轉化為動態影片廣告。描述您的產品實際效果、設置心情和燈光,並以傳統製作成本的一小部分生成專業推廣內容。該模型的電影級控制使其非常適合高端品牌定位。

概念視覺化

建築師、遊戲設計師和創意總監可以在全面投入製作之前將概念變為現實。使用僅提示即可視覺化建築漫遊、遊戲電影或電影預視覺。

教育內容

為複雜主題創建引人入勝的視覺解釋。從科學過程到歷史事件,將枯燥的文本轉化為令人難忘的視覺敘事,增強學習保留率。

電子商務產品影片

生成產品演示影片,展示商品在各種環境和燈光條件下的情況。非常適合直運商、小企業和尋求擴大視覺內容規模的電子商務平台。

在 WaveSpeedAI 上開始使用

在 WaveSpeedAI 上訪問 Wan 2.1 T2V Plus 只需片刻時間:

  1. 導航至模型:訪問 WaveSpeedAI 上的 alibaba/wan-2.1/t2v-plus-720p

  2. 撰寫您的提示:詳細描述您所需的場景。包括環境、主體、燈光和攝影機運動。例如:「一杯冒著蒸汽的咖啡放在木質桌子上,早晨的陽光透過窗簾射進,輕輕上升的蒸汽,淺景深,溫暖的色調。」

  3. 選擇您的寬高比:為電影內容選擇橫向 (1280×720),或為社交媒體豎直格式選擇縱向 (720×1280)。

  4. 可選優化:添加負面提示以排除不需要的元素,或設置種子值以獲得可重現的結果。

  5. 生成:點擊運行,在片刻內收到您的 5 秒 720p 影片。

最佳結果的專業提示

  • 包括動作線索:「攝影機緩慢平移」、「微風吹動頭髮」或「輕輕落下的雨」等短語會大幅提高輸出品質。
  • 具體說明燈光:「金色時刻陽光」、「霓虹光輝」或「柔和工作室燈光」幫助模型確定您的視覺意圖。
  • 保持提示聚焦:雖然該模型能很好地處理複雜性,但清晰、具體的提示會產生最一致的結果。

為什麼選擇 WaveSpeedAI?

在本地執行 Wan 2.1 的 140 億參數模型需要大量硬體投資和技術設置。WaveSpeedAI 完全消除了這些障礙:

無冷啟動:您的生成立即開始—無需等待模型加載或 GPU 預熱。

快速推理:我們的優化基礎設施快速交付結果,讓您能夠有效地迭代和完善您的創意願景。

經濟實惠的定價:以 ** 每 5 秒影片 $0.70** 的價格,您可以自由實驗,無需擔心預算。那就是易於獨立創作者、小型企業和企業使用的專業級 AI 影片生成。

零設置:無需安裝驅動程式、無需管理依賴項、無需應對 VRAM 限制。只需描述您的願景並生成。

影片創作的未來

Wan 2.1 代表的不僅僅是另一個 AI 模型—它預示著影片內容製作方式的根本轉變。基準測試本身就說明了一切:這個開源模型在動作品質、空間準確性和時間一致性方面超越了許多閉源替代品。

其含義超越了個別創作者。隨著 AI 影片生成變得更易於使用和更有能力,我們正在見證創意革命的早期階段。曾經需要製作預算的故事現在可以由任何擁有令人信服的想法和清晰願景的人講述。

立即開始創建

想像和視覺現實之間的障礙從未如此之低。無論您是希望擴大輸出的內容創作者、尋求以新方式吸引觀眾的行銷人員,或只是對 AI 影片生成能做什麼感到好奇,WaveSpeedAI 上的阿里巴巴 Wan 2.1 T2V Plus (720p) 已準備好將您的文本轉化為動作。

立即試用阿里巴巴 Wan 2.1 T2V Plus (720p) →