← 部落格

Alibaba WAN 2.7 文字轉影片現已登陸WaveSpeedAI

WAN 2.7 文字轉影片能將簡單的提示詞轉化為連貫的電影級影片,畫面清晰細緻、動作穩定流暢,並具備強大的指令跟隨能力——非常適合廣告、創意實驗及各類內容製作。

By WaveSpeedAI 3 min read
Alibaba Wan.2.7 Text To Video WAN 2.7 文字轉影片能將簡單的提示詞轉化為連貫的電影級影片,畫面清晰細緻、動作穩定流暢,並具備強大的指令跟隨能力—...
Try it

WAN 2.7 文字轉影片:帶有音訊同步動態的電影級 AI 影片生成

WAN 2.7 文字轉影片是阿里巴巴最新的電影級 AI 影片生成模型,能將純文字提示轉化為連貫、高品質的影片片段,具備穩定的動態效果、清晰的細節呈現,以及出色的指令跟隨能力。WAN 2.7 現已在 WaveSpeedAI 上線,為廣告、說明影片、音樂影片及社群內容的規模化創作者帶來音訊輸入支援、負向提示控制,以及彈性的解析度選項。

對於需要廣播級輸出卻沒有製作團隊的團隊而言,WAN 2.7 縮短了文字提示與完成片段之間的距離——生成最高 1080p 的影片,並忠實呈現自然語言所描述的鏡頭方向、燈光提示與主體行為。

在 WaveSpeedAI 上試用 WAN 2.7 文字轉影片 →

WAN 2.7 文字轉影片的運作原理

WAN 2.7 是一款基於擴散技術的文字轉影片模型,能解讀自然語言提示並將其合成為時序連貫的影片。與早期在跨幀物件一致性上表現欠佳的文字轉影片系統不同,WAN 2.7 在整個片段時長內維持穩定的身份識別、合理的物理表現,以及流暢的鏡頭運動。

該模型接受主要 prompt(提示詞)及一系列可選控制項:

  • 解析度:720p(預設)或 1080p 輸出
  • 長寬比:預設 16:9,提供 9:16 垂直、1:1 正方形及電影寬螢幕等彈性選項
  • 時長:每個片段 5、10 或 15 秒
  • 負向提示:排除不需要的瑕疵、風格或元素
  • 音訊輸入:上傳音軌以同步視覺節奏與步調
  • 提示詞擴展:可選模式,在生成前自動為簡短提示詞補充電影細節
  • 種子值:固定輸出以實現可重現的迭代

音訊條件生成是 WAN 2.7 有別於大多數文字轉影片 API 的關鍵所在。競爭模型孤立地渲染視覺內容,而 WAN 2.7 能將剪輯點、動態強度和步調與音樂軌道或旁白對齊——使其在音樂影片、廣告片段和旁白說明影片中具有直接的實用價值。

WAN 2.7 文字轉影片的主要功能

  • 電影級視覺品質 — 生成具有精確燈光、景深與構圖的細緻場景,在 1080p 交付解析度下依然出色。
  • 音訊同步輸出 — 提供音軌後,模型將動態節奏與之匹配,省去後期手動剪輯修整的步驟。
  • 出色的指令跟隨 — 提示詞中描述的鏡頭運動、色彩調性與主體行為都能可靠地呈現在生成影片中。
  • 負向提示控制 — 明確排除常見瑕疵(模糊臉部、扭曲肢體、不需要的文字)以獲得更乾淨的輸出。
  • 提示詞擴展模式 — 短提示詞會自動補充場景細節,非常適合不想撰寫大段描述的批次工作流程。
  • 可重現的生成結果 — 找到滿意效果後固定種子值,在不改變視覺風格的情況下調整解析度或時長進行迭代。
  • 製作就緒的解析度 — 720p 適合快速交付,1080p 適合客戶級可交付成果。

WAN 2.7 文字轉影片的最佳使用場景

電影敘事與短片創作

電影創作者和說故事的人可以從詳細提示詞中渲染出具有氛圍感、敘事驅動的場景——在一段文字中描述鏡頭角度、燈光風格、情緒和主體動作,即可獲得可用的電影鏡頭。WAN 2.7 穩定的動態效果使其在建立鏡頭、夢境序列和風格化敘事插入片段中表現強勁。

規模化社群媒體內容

9:16 垂直輸出、5 秒片段長度和快速生成使 WAN 2.7 非常適合 TikTok、Instagram Reels 和 YouTube Shorts。品牌可以從單一概念提案生成數十個平台原生變體——無需預訂任何拍攝日,即可測試鉤子和視覺風格。

行銷與廣告製作

製作前置廣告、產品預告和說明影片的廣告公司,可以用符合精確品牌要求的自訂生成場景取代素材庫影片。15 秒時長選項符合標準廣告置入規格,1080p 輸出開箱即可滿足大多數數位廣告交付規格。

音樂影片與視聽同步

音訊輸入功能專為音樂創作者而設計。上傳音軌、描述視覺世界,WAN 2.7 即可生成與音樂律動的影片——鼓點與鏡頭切換對齊,情緒轉換在燈光變化中呼應。獨立音樂人無需聘請導演即可製作完整視覺化作品。

用於提案的概念視覺化

創意總監、產品設計師和遊戲工作室可以在投入製作前,使用 WAN 2.7 將早期構想付諸實踐。5 秒片段已足夠向利害關係人傳達調性、色調和動態語言——在幾分鐘內將簡報概念轉化為動態預覽。

說明與教育內容

課程創作者和 SaaS 行銷團隊可以用電影級片段來說明抽象概念——資料流、生物過程、歷史場景——比動畫圖表更能抓住注意力。透過上傳旁白作為音訊輸入,將生成影片與旁白搭配使用。

電商品牌內容

直接面對消費者的品牌可以生成以其產品類別為主角的生活風格 B-roll——廚具的烹飪畫面、服飾的戶外場景、家居用品的環境設定——成本僅需委外影片團隊的一小部分。

立即生成您的第一支 WAN 2.7 影片 →

WAN 2.7 定價與 API 存取

WAN 2.7 文字轉影片按生成影片的秒數計費,每個解析度層級均有明確的固定費率:

時長720p1080p
5 秒$0.50$0.75
10 秒$1.00$1.50
15 秒$1.50$2.25
  • 720p:每秒 $0.10
  • 1080p:每秒 $0.15(基礎費率的 1.5 倍)

無訂閱費用、無最低承諾、無冷啟動——只需為您生成的內容付費。WaveSpeedAI 的推理基礎設施確保您的第一個請求與第一千個請求享有相同的延遲。

API 範例

使用 WaveSpeed Python SDK,生成影片只需一個 REST 呼叫:

import wavespeed

output = wavespeed.run(
    "alibaba/wan-2.7/text-to-video",
    {
        "prompt": "A neon-lit Tokyo street at night, slow dolly forward, rain-soaked pavement reflecting signs, cinematic 35mm look",
        "resolution": "1080p",
        "aspect_ratio": "16:9",
        "duration": 5,
    },
)

print(output["outputs"][0])

若要進行音訊同步生成,請透過 audio 參數傳入可公開存取的音訊 URL。若要排除瑕疵,請添加 negative_prompt。若要讓 WAN 2.7 自動豐富短提示詞,請將 enable_prompt_expansion 設為 true。

如果您正在比較 WaveSpeedAI 目錄中的各種選項,也可以評估其他文字轉影片模型,以獲得不同的風格、延遲或成本取捨。

使用 WAN 2.7 獲得最佳效果的技巧

  • 精確描述電影攝影手法。 包含鏡頭角度(低角度、俯拍、前推鏡頭)、鏡頭風格(變形鏡頭、35mm、廣角)和燈光(黃金時段、霓虹燈、強烈陰影)。泛泛的提示詞只會產生泛泛的輸出。
  • 使用負向提示清理輸出。 常見條目:「blurry, distorted faces, low contrast, watermark, text overlay, jittery motion」。這能透過一個參數消除一類常見瑕疵。
  • 對短提示詞啟用提示詞擴展。 若您正在從一系列簡短概念批次生成,提示詞擴展會添加能產生電影效果的場景細節——無需您撰寫大段描述。
  • 找到滿意效果後鎖定種子值。 當您在 720p 下確定了理想的視覺效果,固定種子值並以 1080p 重新生成,即可獲得相同片段的最終品質版本。
  • 根據平台匹配長寬比。 垂直社群媒體使用 9:16,YouTube 和網頁播放器使用 16:9,動態貼文使用 1:1,敘事作品使用電影寬螢幕——按目標比例生成優於後期裁剪。
  • 為音樂和廣告工作進行音訊同步。 當步調至關重要時,預先提供音軌比僅靠提示詞語言來控制動態時序更快速,且能產生更緊湊的效果。

常見問題

WAN 2.7 文字轉影片是什麼?

WAN 2.7 文字轉影片是阿里巴巴的進階 AI 文字轉影片模型,能從自然語言提示生成電影品質的影片片段,並支援可選的音訊同步、負向提示控制和 1080p 輸出。

WAN 2.7 的費用是多少?

WAN 2.7 按生成影片的秒數計費:720p 每秒 $0.10,1080p 每秒 $0.15。5 秒 720p 片段費用為 $0.50;15 秒 1080p 片段費用為 $2.25。無訂閱費用或最低承諾。

我可以透過 API 使用 WAN 2.7 嗎?

可以。WAN 2.7 可透過 WaveSpeedAI 的 REST 推理 API 和 Python SDK 使用,無冷啟動。單一 wavespeed.run() 呼叫即可返回生成的影片 URL。

WAN 2.7 是否支援音訊輸入?

支援——WAN 2.7 接受可選音軌,以同步生成影片的節奏、步調和情緒。這使其非常適合音樂影片、旁白說明影片,以及具有固定聲音底層的廣告。

WAN 2.7 支援哪些解析度和長寬比?

WAN 2.7 可生成 720p 或 1080p 的影片,支援彈性長寬比,包括 16:9、9:16、1:1 和電影寬螢幕——透過單一 API 涵蓋社群、網頁和廣播交付格式。

立即開始使用 WAN 2.7 生成影片

WAN 2.7 文字轉影片透過簡單的 REST API 帶來電影級品質、音訊同步動態和製作就緒的解析度——無訂閱綁定,無冷啟動。無論您是在規模化生產社群內容、原型設計廣告概念,還是從零開始製作音樂影片,WAN 2.7 都能以一個提示詞驅動完整的創意流程。

在 WaveSpeedAI 上試用 WAN 2.7 文字轉影片 →