WaveSpeedAI Ace Step 1.5 現已登陸WaveSpeedAI

AI音樂創作的未來已經來臨：ACE-Step 1.5

音樂創作長期以來是受過訓練的音樂家、昂貴錄音室以及數小時繁瑣製作的專屬領域。這一切今天改變了。我們很高興宣布 ACE-Step 1.5 現已在 WaveSpeedAI 上線——這是一款 AI 音樂生成模型，能將簡單的文字描述轉化為完整歌曲，支援超過 50 種語言的人聲與歌詞。

無論您是尋找自訂背景音樂的內容創作者、正在構思靈感的詞曲創作人，還是正在打造音頻驅動應用程式的開發者，ACE-Step 1.5 都能讓您以每秒不到一美分的價格，輕鬆生成專業品質的音樂。

什麼是 ACE-Step 1.5？

ACE-Step 1.5 是一款文字轉音頻模型，僅需兩個簡單輸入即可生成音樂：風格標籤（描述風格、情感與樂器配置），以及可選的結構化歌詞（引導人聲表現）。該模型可生成最長四分鐘的曲目，具備高保真音質，支援從 lo-fi 環境氛圍純音樂到帶有主歌、副歌和橋段的完整流行歌曲等各種類型。

ACE-Step 1.5 的獨特之處在於其品質、靈活性與成本的完美結合。該模型支援超過 50 種語言的歌詞生成，能以 [Verse]、[Chorus]、[Bridge] 等段落標記處理複雜的歌曲結構，而費用僅需 每秒 $0.0003 美元——這意味著一首完整的四分鐘曲目費用不超過 $0.05 美元。

主要功能

最長 4 分鐘的曲目：生成最長 240 秒的完整歌曲，足以包含多個段落與過渡的完整音樂作品。
標籤式風格控制：使用以逗號分隔的標籤定義您的聲音，例如 steampunk, electro swing, jazz, piano, ticking clock 或 pop, female vocals, upbeat, guitar, 120bpm。自由混搭風格、樂器、情緒與節奏。
結構化歌詞支援：使用標準歌曲結構標記撰寫歌詞——[Verse]、[Chorus]、[Bridge]、[Outro]——模型將據此編排音樂。
支援 50 種以上語言：以數十種語言生成人聲，非常適合全球內容創作與多語言專案。
純音樂模式：將歌詞欄位留空即可生成純音樂曲目——非常適合背景音樂與音景創作。
可重現結果：使用種子值重新生成相同的輸出，確保多次迭代的一致性。
彈性時長控制：精準設定所需曲目長度，從短促的廣告配樂到完整樂曲皆可。

實際應用場景

內容創作與社群媒體

為 YouTube 影片、TikTok 內容、Podcast 及 Instagram 短片創作原創音樂，傳統上意味著授權購買音樂庫素材或聘請作曲家。ACE-Step 1.5 讓創作者能夠生成量身打造的自訂曲目，完美契合內容的情緒與節奏。需要一段 30 秒的活力開場音樂？或是教學影片的 2 分鐘舒緩背景音樂？用標籤描述您的需求，幾秒內即可獲得原創音樂。

遊戲與應用程式開發

遊戲開發者和應用程式開發者可以在無需授權煩惱的情況下生成動態配樂、選單音樂和環境音效。標籤系統讓您輕鬆在不同場景或關卡中創作主題一致的音樂——地下城用黑暗環境音、Boss 勝利用凱旋管弦樂、選單用輕鬆木吉他。

音樂製作與詞曲創作

詞曲創作人和製作人可以將 ACE-Step 1.5 作為快速原型工具。撰寫歌詞，以標籤選擇風格方向，瞬間聆聽完整編曲。以幾乎零成本反覆迭代靈感，再決定是否進棚錄製。每分鐘生成音頻不到兩美分，實驗創作的成本幾乎可以忽略不計。

批量音頻生成

需要大量原創音樂的企業——媒體公司、廣告代理商、電子學習平台——可以以極具競爭力的成本生成數百首獨特曲目。API 優先的設計使音樂生成輕鬆整合至自動化內容流程中。

多語言與全球化專案

支援超過 50 種語言，ACE-Step 1.5 特別適合跨市場與跨文化的專案。以英語、日語、西班牙語和韓語生成同一首歌的歌詞版本——每個版本皆具備自然流暢的人聲演唱。

在 WaveSpeedAI 上開始使用

在 WaveSpeedAI 上使用 ACE-Step 1.5 非常簡單。您可以透過模型頁面開始生成音樂，或直接透過 API 整合至您的應用程式。

以下是使用 WaveSpeed Python SDK 的快速範例：

import wavespeed

output = wavespeed.run(
    "wavespeed-ai/ace-step-1.5",
    {
        "tags": "pop, female vocals, upbeat, guitar, 120bpm",
        "lyrics": "[Verse]\nWalking down the city streets at night\nNeon signs are painting everything in light\n\n[Chorus]\nWe're alive, we're alive tonight\nNothing's gonna stop us feeling right",
        "duration": 120,
    },
)

print(output["outputs"][0])  # 音頻輸出 URL