← 部落格

Heartmula Generate Music現已登陸WaveSpeedAI

HeartMuLa是一款頂尖的音樂生成模型,能夠根據歌詞和風格標籤創作高品質歌曲。提供即用型REST推理API,性價比最佳。

2 min read
Wavespeed Ai Heartmula Generate Music
Wavespeed Ai Heartmula Generate Music HeartMuLa是一款頂尖的音樂生成模型,能夠根據歌詞和風格標籤創作高品質歌曲。提供即用型REST推理API,性價比最...
Try it
Heartmula Generate Music現已登陸WaveSpeedAI

HeartMuLa 現已登陸 WaveSpeedAI:用 AI 將你的歌詞變成完整歌曲

長久以來,創作原創音樂一直是最耗時的創意工程之一——直到現在。WaveSpeedAI 很高興宣佈 HeartMuLa 正式上線,這是一款頂尖的開源音樂基礎模型,能夠根據你的歌詞和風格標籤生成高品質的完整歌曲。無論你是正在構思創意的詞曲創作者、尋找客製化配樂的內容創作者,還是正在打造下一款音樂應用的開發者,HeartMuLa 都能讓你透過簡單的 API 呼叫享受專業級的音樂製作體驗。

HeartMuLa 是什麼?

HeartMuLa 是一系列開源音樂基礎模型,建構於精密的四元件架構之上:負責音訊-文字對齊的 HeartCLAP、負責歌詞辨識的 HeartTranscriptor、負責高保真音樂標記化的 HeartCodec,以及負責歌曲生成的 HeartMuLa 語言模型本身。這些元件協同運作,僅憑結構化的歌詞與少量風格標籤,便能生成完整的歌曲——包含人聲、旋律、和聲及完整的器樂編排。

HeartMuLa 的卓越之處在於其歌詞清晰度。在基準測試中,HeartMuLa 在所有測試語言中均達到最低的音素錯誤率(PER),超越了包括 Suno v5 和 MiniMax Music 2.0 在內的頂尖商業模型。在英語方面,HeartMuLa 的 PER 僅為 0.09,在中文方面則達到 0.12——這意味著你所寫的每一個字都能在最終歌曲中清晰呈現。該模型還透過直接偏好最佳化(DPO)進行了進一步調校,這是一種強化學習技術,能確保對風格、標籤及整體音樂品質的精確控制。

這是首個以學術規模重現商業級音樂生成系統並以 Apache 2.0 授權開源發佈的模型——現在它已在 WaveSpeedAI 上線,無需任何設定即可使用。

主要功能

  • 完整歌曲生成:生成帶有人聲、器樂、前奏、橋段和尾奏的完整歌曲——而非單純的循環片段或短片段
  • 多語言歌詞支援:支援英語、中文、日語、韓語和西班牙語,非常適合面向全球受眾的創作者
  • 結構化歌曲編排:使用 [Verse][Chorus][Bridge][intro-short][outro-medium] 等段落標記,精確控制歌曲的編排與走向
  • 靈活的風格控制:透過簡單的逗號分隔標籤定義曲風、情緒、節奏、樂器和人聲特性,例如 "r&b, smooth, male vocals, soulful, 85bpm"
  • 器樂段落:加入帶有可配置時長標記的前奏、尾奏和器樂間奏——這些段落無需歌詞
  • 業界領先的歌詞清晰度:在所有測試語言中均達到最低音素錯誤率,確保你的歌詞被完整演唱

實際應用場景

原創音樂創作

詞曲創作者和音樂人可以立即將歌詞付諸實現。寫下你的主歌和副歌,選擇一種風格,幾秒鐘內便能聽到完整製作版本的歌曲。這是從靈感到試聽小樣最快速的途徑。

內容配樂

影片創作者、播客主持人和社群媒體製作者可以生成完美契合其內容的客製化背景音樂。不必再從通用的免版稅音樂庫中苦苦搜尋,為每個專案創作獨一無二的音樂。

多語言內容製作

服務國際受眾的品牌和創作者可以從單一模型生成五種語言的歌曲。透過同一個 API,即可推出日語流行曲、西班牙語抒情曲和英語頌歌,用於行銷活動。

試聽小樣製作與詞曲創作輔助

專業詞曲創作者可以將 HeartMuLa 作為快速原型工具。在投入昂貴的錄音室工作之前,先測試歌詞在不同曲風和節奏下的效果。透過重新排列段落標記並在幾秒鐘內重新生成,即可嘗試不同的編排方式。

遊戲與應用程式開發

遊戲開發者可以創作原創主題曲、選單音樂和帶有人聲的遊戲內配樂,與遊戲敘事完美契合。應用程式開發者可以透過 WaveSpeedAI API,將音樂生成功能直接整合到其產品中。

在 WaveSpeedAI 上快速開始

使用 WaveSpeedAI 上的 HeartMuLa 生成音樂非常簡單。你只需要歌詞——其他一切皆為選填。

使用 API

import wavespeed

output = wavespeed.run(
    "wavespeed-ai/heartmula/generate-music",
    {
        "lyrics": """[intro-short]
[Verse]
Your voice like velvet, I'm never alone
The way you say my name, it pulls me in
A love like ours is more than skin
[Chorus]
Stay with me until the morning light
Hold me close and never let me go
[outro-short]""",
        "tags": "r&b, smooth, male vocals, soulful, slow jam, romantic, 85bpm"
    },
)

print(output["outputs"][0])

編寫你的歌詞

使用段落標記構建歌詞結構,以獲得最佳效果:

  • [Verse][Chorus][Bridge] — 需要填入歌詞的人聲段落
  • [intro-short][intro-medium] — 器樂前奏(0–10 秒或 10–20 秒)
  • [inst-short][inst-medium] — 段落之間的器樂間奏
  • [outro-short][outro-medium] — 器樂尾奏

定義你的風格

結合標籤,精確描述你想要的音樂風格:

  • "female, bright, pop, happy, piano, 130bpm" — 輕快流行頌歌
  • "male, dark, rock, guitar, drums, energetic" — 激昂搖滾曲目
  • "piano, happy, wedding, synthesizer, romantic" — 浪漫婚禮歌曲
  • "jazz, smooth, saxophone, soft, 90bpm" — 深夜爵士氛圍

專業技巧:

  • 使用清晰的段落標記保持歌詞結構整齊,以獲得最佳編排品質
  • 組合多個風格標籤以獲得更具體的效果——曲風、情緒、樂器、節奏和人聲特性皆可協同發揮作用
  • 在人聲段落之間使用 [inst-short][inst-medium],讓歌曲有喘息空間
  • 設定特定的種子值,以便在找到心儀的生成結果時能夠完整重現

為何選擇 WaveSpeedAI?

在 WaveSpeedAI 上運行 HeartMuLa,讓你兼得兩者之長——開源模型與商業級基礎設施:

  • 無冷啟動延遲:你的音樂生成立即開始,無需等待實例啟動
  • 快速推理:最佳化的基礎設施能快速交付完整歌曲,讓你自由迭代和實驗
  • 實惠定價:每首歌僅需 $0.10——遠低於訂閱制音樂生成平台的收費
  • 簡單的 REST API:透過直覺易用的 API 將 AI 音樂生成整合至你的應用程式,無需任何機器學習專業知識或 GPU 管理經驗

立即開始創作你的音樂

HeartMuLa 代表了 AI 音樂生成的一個里程碑:一個在品質上媲美商業產品、在歌詞清晰度上超越商業產品、並支援真正多語言歌曲創作的開源模型。結合 WaveSpeedAI 快速可靠的基礎設施,這是將你的文字轉化為音樂最便捷的方式。

無論你是為電影配樂、打磨潛力單曲、創作內容配樂,還是打造音樂驅動的應用程式,WaveSpeedAI 上的 HeartMuLa 都能以開放創意可能性的價格,為所有人提供專業級的成果。

準備好聆聽你的歌詞重獲生命了嗎? 立即在 WaveSpeedAI 上試用 HeartMuLa,開始從你的文字生成完整歌曲。