WaveSpeedAI 歌曲生成现已登陆WaveSpeedAI

介紹 SongGeneration (LeVo)：使用 AI 將您的歌詞轉變為專業歌曲

AI 動力音樂創作的世界已經達到了一個新的里程碑。WaveSpeedAI 很高興宣布 SongGeneration (LeVo) 的推出，這是由騰訊 AI Lab 開發的突破性文字轉歌曲模型，可以從您的歌詞生成完整、高品質的歌曲。這個開源模型代表了 AI 音樂生成的重大進步，提供的成果可與 Suno 4.5 等商業平台相媲美。

什麼是 SongGeneration (LeVo)？

SongGeneration 是一個基於語言模型的音樂生成框架，結合了語言模型 (LeLM) 和先進的音樂編解碼器，可以生成帶有人聲的全長歌曲。與生成器樂音樂或短片段的簡單文字轉音頻模型不同，SongGeneration 可以創建完整的歌曲—人聲、伴奏和專業品質的製作—全部來自結構化的歌詞輸入。

該模型可以生成長度達 4 分 30 秒的歌曲，支持多種語言，包括英文、中文、西班牙文和日文。它與眾不同之處在於其靈活性：您可以輸出結合的人聲和伴奏、純器樂、獨立的清唱人聲，或完全分離的音軌以進行專業混音。

主要功能

全長歌曲生成：創建長達 4.5 分鐘的完整歌曲，不只是 30 秒的片段
結構化歌詞支持：使用直觀的段落標記（如 [verse]、[chorus] 和 [bridge]）來控制歌曲結構
靈活的風格控制：使用性別、音色、流派、情感、樂器和節奏的文本描述來指導輸出
音頻提示：上傳參考音頻樣本（前 10 秒）以影響生成的風格
多種輸出模式：獲得混合版本、純音樂、清唱人聲或分離的音軌
多語言功能：生成英文、中文、西班牙文、日文等多種語言的歌曲
專業品質指標：在基準測試中達到 5.1% 的音素錯誤率，音樂性得分為 3.94/5

使用案例

對於音樂家和製作人

通過編寫歌詞並聽到其演奏來快速原型化歌曲創意。在提交完整製作之前測試不同的流派、節奏和編排。使用分離音軌輸出來提取 AI 生成的旋律或和聲用於您自己的編排。

對於內容創作者

為視頻、播客和社交媒體內容生成原創背景音樂和音效。創建您品牌或頻道的自定義主題曲，無需昂貴的錄音室會議或許可費用。

對於遊戲和應用程式開發者

生成針對特定情緒和場景的動態原創配樂。快速生成多個變體，為您的項目氛圍找到完美匹配。

對於歌曲作者

立即聽到您的歌詞栩栩如生，評估旋律和節奏。嘗試不同的風格和編排以發現新的創意方向。

對於教育工作者和研究人員

創建自定義教育歌曲或研究 AI 與音樂創作的交集。分析不同的歌詞結構和風格提示如何影響生成的輸出。

如何格式化您的輸入

歌詞結構

您的歌詞應遵循以下格式：

[intro-short]

[verse]
Streetlights flicker in the night
I wander through familiar corners
Memories rush in like a tide

[chorus]
The warmth of memories still remains
But you are gone
My heart was filled with love

[outro-short]

每個段落都以方括號中的結構標籤開始。諸如 [intro-short]、[inst-medium] 和 [outro-long] 之類的標籤僅用於器樂—無需歌詞。諸如 [verse]、[chorus] 和 [bridge] 之類的標籤需要歌詞文本。

風格描述

使用自然語言描述來控制音樂輸出：

female, dark, pop, sad, piano and drums, the bpm is 125

您可以指定性別、音色、流派、情感、樂器和節奏的任何組合。該模型支持開放詞彙表，但預定義標籤提供更一致的結果。

使用參考音頻

為了實現更精確的風格匹配，上傳參考音頻片段。該模型使用前 10 秒來學習流派、樂器編制、節奏和人聲風格。專業提示：使用歌曲的合唱部分作為參考通常會產生最佳結果。

在 WaveSpeedAI 上入門

WaveSpeedAI 使您可以輕鬆立即開始生成歌曲：

訪問 SongGeneration 模型頁面
在輸入欄位中輸入您的結構化歌詞
添加可選的風格描述或上傳參考音頻
點擊生成並接收您的完整歌曲

使用 WaveSpeedAI 的基礎設施，您將受益於：

即時可用性：沒有冷啟動意味著您的生成立即開始
快速推理：優化的基礎設施快速傳遞結果
經濟實惠的價格：只需為您生成的內容付費，透明的按請求定價
簡單的 REST API：直接將歌曲生成整合到您的應用程式和工作流程中

技術規格

功能	規格
最大歌曲長度	4 分 30 秒
支持的語言	英文、中文、西班牙文、日文
輸出格式	混合版本、器樂、人聲、分離音軌
輸入方法	結構化歌詞 + 文本描述或參考音頻

結論

SongGeneration (LeVo) 代表了 AI 音樂生成的重大進步，將專業品質的歌曲創作帶給任何有創意和歌詞的人。無論您是探索新聲音的音樂家、需要原創音樂的內容創作者，還是開發下一代創意工具的開發人員，此模型都開啟了新的可能性。

結構化歌詞輸入、靈活的風格控制和多音軌輸出功能的組合使 SongGeneration 成為當今最通用的文字轉歌曲模型之一。而且由於 WaveSpeedAI 的快速、可靠的推理基礎設施，您可以在幾秒內開始創建。

準備好讓您的歌詞栩栩如生？立即在 WaveSpeedAI 上嘗試 SongGeneration，體驗 AI 動力音樂創作的未來。