WaveSpeedAI 歌曲生成现已登陆WaveSpeedAI
免費試用 Wavespeed Ai Song Generation
介紹 SongGeneration (LeVo):使用 AI 將您的歌詞轉變為專業歌曲
AI 動力音樂創作的世界已經達到了一個新的里程碑。WaveSpeedAI 很高興宣布 SongGeneration (LeVo) 的推出,這是由騰訊 AI Lab 開發的突破性文字轉歌曲模型,可以從您的歌詞生成完整、高品質的歌曲。這個開源模型代表了 AI 音樂生成的重大進步,提供的成果可與 Suno 4.5 等商業平台相媲美。
什麼是 SongGeneration (LeVo)?
SongGeneration 是一個基於語言模型的音樂生成框架,結合了語言模型 (LeLM) 和先進的音樂編解碼器,可以生成帶有人聲的全長歌曲。與生成器樂音樂或短片段的簡單文字轉音頻模型不同,SongGeneration 可以創建完整的歌曲—人聲、伴奏和專業品質的製作—全部來自結構化的歌詞輸入。
該模型可以生成長度達 4 分 30 秒的歌曲,支持多種語言,包括英文、中文、西班牙文和日文。它與眾不同之處在於其靈活性:您可以輸出結合的人聲和伴奏、純器樂、獨立的清唱人聲,或完全分離的音軌以進行專業混音。
主要功能
- 全長歌曲生成:創建長達 4.5 分鐘的完整歌曲,不只是 30 秒的片段
- 結構化歌詞支持:使用直觀的段落標記(如
[verse]、[chorus]和[bridge])來控制歌曲結構 - 靈活的風格控制:使用性別、音色、流派、情感、樂器和節奏的文本描述來指導輸出
- 音頻提示:上傳參考音頻樣本(前 10 秒)以影響生成的風格
- 多種輸出模式:獲得混合版本、純音樂、清唱人聲或分離的音軌
- 多語言功能:生成英文、中文、西班牙文、日文等多種語言的歌曲
- 專業品質指標:在基準測試中達到 5.1% 的音素錯誤率,音樂性得分為 3.94/5
使用案例
對於音樂家和製作人
通過編寫歌詞並聽到其演奏來快速原型化歌曲創意。在提交完整製作之前測試不同的流派、節奏和編排。使用分離音軌輸出來提取 AI 生成的旋律或和聲用於您自己的編排。
對於內容創作者
為視頻、播客和社交媒體內容生成原創背景音樂和音效。創建您品牌或頻道的自定義主題曲,無需昂貴的錄音室會議或許可費用。
對於遊戲和應用程式開發者
生成針對特定情緒和場景的動態原創配樂。快速生成多個變體,為您的項目氛圍找到完美匹配。
對於歌曲作者
立即聽到您的歌詞栩栩如生,評估旋律和節奏。嘗試不同的風格和編排以發現新的創意方向。
對於教育工作者和研究人員
創建自定義教育歌曲或研究 AI 與音樂創作的交集。分析不同的歌詞結構和風格提示如何影響生成的輸出。
如何格式化您的輸入
歌詞結構
您的歌詞應遵循以下格式:
[intro-short]
[verse]
Streetlights flicker in the night
I wander through familiar corners
Memories rush in like a tide
[chorus]
The warmth of memories still remains
But you are gone
My heart was filled with love
[outro-short]
每個段落都以方括號中的結構標籤開始。諸如 [intro-short]、[inst-medium] 和 [outro-long] 之類的標籤僅用於器樂—無需歌詞。諸如 [verse]、[chorus] 和 [bridge] 之類的標籤需要歌詞文本。
風格描述
使用自然語言描述來控制音樂輸出:
female, dark, pop, sad, piano and drums, the bpm is 125
您可以指定性別、音色、流派、情感、樂器和節奏的任何組合。該模型支持開放詞彙表,但預定義標籤提供更一致的結果。
使用參考音頻
為了實現更精確的風格匹配,上傳參考音頻片段。該模型使用前 10 秒來學習流派、樂器編制、節奏和人聲風格。專業提示:使用歌曲的合唱部分作為參考通常會產生最佳結果。
在 WaveSpeedAI 上入門
WaveSpeedAI 使您可以輕鬆立即開始生成歌曲:
- 訪問 SongGeneration 模型頁面
- 在輸入欄位中輸入您的結構化歌詞
- 添加可選的風格描述或上傳參考音頻
- 點擊生成並接收您的完整歌曲
使用 WaveSpeedAI 的基礎設施,您將受益於:
- 即時可用性:沒有冷啟動意味著您的生成立即開始
- 快速推理:優化的基礎設施快速傳遞結果
- 經濟實惠的價格:只需為您生成的內容付費,透明的按請求定價
- 簡單的 REST API:直接將歌曲生成整合到您的應用程式和工作流程中
技術規格
| 功能 | 規格 |
|---|---|
| 最大歌曲長度 | 4 分 30 秒 |
| 支持的語言 | 英文、中文、西班牙文、日文 |
| 輸出格式 | 混合版本、器樂、人聲、分離音軌 |
| 輸入方法 | 結構化歌詞 + 文本描述或參考音頻 |
結論
SongGeneration (LeVo) 代表了 AI 音樂生成的重大進步,將專業品質的歌曲創作帶給任何有創意和歌詞的人。無論您是探索新聲音的音樂家、需要原創音樂的內容創作者,還是開發下一代創意工具的開發人員,此模型都開啟了新的可能性。
結構化歌詞輸入、靈活的風格控制和多音軌輸出功能的組合使 SongGeneration 成為當今最通用的文字轉歌曲模型之一。而且由於 WaveSpeedAI 的快速、可靠的推理基礎設施,您可以在幾秒內開始創建。
準備好讓您的歌詞栩栩如生?立即在 WaveSpeedAI 上嘗試 SongGeneration,體驗 AI 動力音樂創作的未來。

