WaveSpeedAI Ace Step 1.5 現已登陸WaveSpeedAI
ACE-Step 1.5 可從文字生成長達4分鐘的含歌詞音樂,支援50多種語言,具備高品質音響保真度,並可在消費級硬體上高效運行。
AI音樂創作的未來已經來臨:ACE-Step 1.5
音樂創作長期以來是受過訓練的音樂家、昂貴錄音室以及數小時繁瑣製作的專屬領域。這一切今天改變了。我們很高興宣布 ACE-Step 1.5 現已在 WaveSpeedAI 上線——這是一款 AI 音樂生成模型,能將簡單的文字描述轉化為完整歌曲,支援超過 50 種語言的人聲與歌詞。
無論您是尋找自訂背景音樂的內容創作者、正在構思靈感的詞曲創作人,還是正在打造音頻驅動應用程式的開發者,ACE-Step 1.5 都能讓您以每秒不到一美分的價格,輕鬆生成專業品質的音樂。
什麼是 ACE-Step 1.5?
ACE-Step 1.5 是一款文字轉音頻模型,僅需兩個簡單輸入即可生成音樂:風格標籤(描述風格、情感與樂器配置),以及可選的結構化歌詞(引導人聲表現)。該模型可生成最長四分鐘的曲目,具備高保真音質,支援從 lo-fi 環境氛圍純音樂到帶有主歌、副歌和橋段的完整流行歌曲等各種類型。
ACE-Step 1.5 的獨特之處在於其品質、靈活性與成本的完美結合。該模型支援超過 50 種語言的歌詞生成,能以 [Verse]、[Chorus]、[Bridge] 等段落標記處理複雜的歌曲結構,而費用僅需 每秒 $0.0003 美元——這意味著一首完整的四分鐘曲目費用不超過 $0.05 美元。
主要功能
- 最長 4 分鐘的曲目:生成最長 240 秒的完整歌曲,足以包含多個段落與過渡的完整音樂作品。
- 標籤式風格控制:使用以逗號分隔的標籤定義您的聲音,例如
steampunk, electro swing, jazz, piano, ticking clock或pop, female vocals, upbeat, guitar, 120bpm。自由混搭風格、樂器、情緒與節奏。 - 結構化歌詞支援:使用標準歌曲結構標記撰寫歌詞——
[Verse]、[Chorus]、[Bridge]、[Outro]——模型將據此編排音樂。 - 支援 50 種以上語言:以數十種語言生成人聲,非常適合全球內容創作與多語言專案。
- 純音樂模式:將歌詞欄位留空即可生成純音樂曲目——非常適合背景音樂與音景創作。
- 可重現結果:使用種子值重新生成相同的輸出,確保多次迭代的一致性。
- 彈性時長控制:精準設定所需曲目長度,從短促的廣告配樂到完整樂曲皆可。
實際應用場景
內容創作與社群媒體
為 YouTube 影片、TikTok 內容、Podcast 及 Instagram 短片創作原創音樂,傳統上意味著授權購買音樂庫素材或聘請作曲家。ACE-Step 1.5 讓創作者能夠生成量身打造的自訂曲目,完美契合內容的情緒與節奏。需要一段 30 秒的活力開場音樂?或是教學影片的 2 分鐘舒緩背景音樂?用標籤描述您的需求,幾秒內即可獲得原創音樂。
遊戲與應用程式開發
遊戲開發者和應用程式開發者可以在無需授權煩惱的情況下生成動態配樂、選單音樂和環境音效。標籤系統讓您輕鬆在不同場景或關卡中創作主題一致的音樂——地下城用黑暗環境音、Boss 勝利用凱旋管弦樂、選單用輕鬆木吉他。
音樂製作與詞曲創作
詞曲創作人和製作人可以將 ACE-Step 1.5 作為快速原型工具。撰寫歌詞,以標籤選擇風格方向,瞬間聆聽完整編曲。以幾乎零成本反覆迭代靈感,再決定是否進棚錄製。每分鐘生成音頻不到兩美分,實驗創作的成本幾乎可以忽略不計。
批量音頻生成
需要大量原創音樂的企業——媒體公司、廣告代理商、電子學習平台——可以以極具競爭力的成本生成數百首獨特曲目。API 優先的設計使音樂生成輕鬆整合至自動化內容流程中。
多語言與全球化專案
支援超過 50 種語言,ACE-Step 1.5 特別適合跨市場與跨文化的專案。以英語、日語、西班牙語和韓語生成同一首歌的歌詞版本——每個版本皆具備自然流暢的人聲演唱。
在 WaveSpeedAI 上開始使用
在 WaveSpeedAI 上使用 ACE-Step 1.5 非常簡單。您可以透過模型頁面開始生成音樂,或直接透過 API 整合至您的應用程式。
以下是使用 WaveSpeed Python SDK 的快速範例:
import wavespeed
output = wavespeed.run(
"wavespeed-ai/ace-step-1.5",
{
"tags": "pop, female vocals, upbeat, guitar, 120bpm",
"lyrics": "[Verse]\nWalking down the city streets at night\nNeon signs are painting everything in light\n\n[Chorus]\nWe're alive, we're alive tonight\nNothing's gonna stop us feeling right",
"duration": 120,
},
)
print(output["outputs"][0]) # 音頻輸出 URL
tags 參數是唯一必填欄位。加入 lyrics 可生成人聲曲目,設定 duration 控制曲目長度(最長 240 秒),並可選擇使用 seed 以獲得可重現的結果。
以下幾點提示有助於獲得最佳效果:
- 標籤盡量具體:標籤越詳細,輸出結果越精準。結合風格、樂器、情緒和節奏標籤,實現精確控制。
- 使用結構標記:帶有
[Verse]、[Chorus]和[Bridge]標記的歌詞,比未結構化的文字能產生更具音樂連貫性的編曲。 - 從短片段開始,再延長:先以 30-60 秒的片段進行原型測試,再生成完整曲目,以快速找到合適的風格方向。
- 先嘗試純音樂:不加歌詞先生成以評估音樂風格,滿意後再加入人聲。
為什麼選擇 WaveSpeedAI?
在 WaveSpeedAI 上運行 ACE-Step 1.5,相比自行部署有以下幾項優勢:
- 無冷啟動:您的請求立即處理——無需等待模型載入或 GPU 分配。
- 快速推理:優化的基礎架構能快速交付生成的音頻,即使是完整的四分鐘曲目也不例外。
- 實惠定價:每秒生成音頻僅需 $0.0003 美元,即使大量使用也能保持極低成本。
- 簡潔 API:整潔的 REST API 和 Python SDK 讓您在幾分鐘內即可將音樂生成整合至任何工作流程。
- 無硬體需求:省去配置 GPU 和管理模型權重的麻煩。只需發送請求,即可獲得音頻。
立即開始創作音樂
ACE-Step 1.5 代表著讓音樂創作真正普及化的重要一步。無論您需要一首自訂曲目還是數千首獨特作品,其品質、靈活性與實惠定價的結合,使其成為創作者和開發者的理想工具。
前往 ACE-Step 1.5 模型頁面,立即開始生成音樂——無需設定,無需訂閱。描述您想要的聲音,撰寫您的歌詞,剩下的交給模型來完成。





