WaveSpeedAI 歌曲生成现已登陆WaveSpeedAI

免費試用 Wavespeed Ai Song Generation
WaveSpeedAI 歌曲生成现已登陆WaveSpeedAI

介紹 SongGeneration (LeVo):使用 AI 將您的歌詞轉變為專業歌曲

AI 動力音樂創作的世界已經達到了一個新的里程碑。WaveSpeedAI 很高興宣布 SongGeneration (LeVo) 的推出,這是由騰訊 AI Lab 開發的突破性文字轉歌曲模型,可以從您的歌詞生成完整、高品質的歌曲。這個開源模型代表了 AI 音樂生成的重大進步,提供的成果可與 Suno 4.5 等商業平台相媲美。

什麼是 SongGeneration (LeVo)?

SongGeneration 是一個基於語言模型的音樂生成框架,結合了語言模型 (LeLM) 和先進的音樂編解碼器,可以生成帶有人聲的全長歌曲。與生成器樂音樂或短片段的簡單文字轉音頻模型不同,SongGeneration 可以創建完整的歌曲—人聲、伴奏和專業品質的製作—全部來自結構化的歌詞輸入。

該模型可以生成長度達 4 分 30 秒的歌曲,支持多種語言,包括英文、中文、西班牙文和日文。它與眾不同之處在於其靈活性:您可以輸出結合的人聲和伴奏、純器樂、獨立的清唱人聲,或完全分離的音軌以進行專業混音。

主要功能

  • 全長歌曲生成:創建長達 4.5 分鐘的完整歌曲,不只是 30 秒的片段
  • 結構化歌詞支持:使用直觀的段落標記(如 [verse][chorus][bridge])來控制歌曲結構
  • 靈活的風格控制:使用性別、音色、流派、情感、樂器和節奏的文本描述來指導輸出
  • 音頻提示:上傳參考音頻樣本(前 10 秒)以影響生成的風格
  • 多種輸出模式:獲得混合版本、純音樂、清唱人聲或分離的音軌
  • 多語言功能:生成英文、中文、西班牙文、日文等多種語言的歌曲
  • 專業品質指標:在基準測試中達到 5.1% 的音素錯誤率,音樂性得分為 3.94/5

使用案例

對於音樂家和製作人

通過編寫歌詞並聽到其演奏來快速原型化歌曲創意。在提交完整製作之前測試不同的流派、節奏和編排。使用分離音軌輸出來提取 AI 生成的旋律或和聲用於您自己的編排。

對於內容創作者

為視頻、播客和社交媒體內容生成原創背景音樂和音效。創建您品牌或頻道的自定義主題曲,無需昂貴的錄音室會議或許可費用。

對於遊戲和應用程式開發者

生成針對特定情緒和場景的動態原創配樂。快速生成多個變體,為您的項目氛圍找到完美匹配。

對於歌曲作者

立即聽到您的歌詞栩栩如生,評估旋律和節奏。嘗試不同的風格和編排以發現新的創意方向。

對於教育工作者和研究人員

創建自定義教育歌曲或研究 AI 與音樂創作的交集。分析不同的歌詞結構和風格提示如何影響生成的輸出。

如何格式化您的輸入

歌詞結構

您的歌詞應遵循以下格式:

[intro-short]

[verse]
Streetlights flicker in the night
I wander through familiar corners
Memories rush in like a tide

[chorus]
The warmth of memories still remains
But you are gone
My heart was filled with love

[outro-short]

每個段落都以方括號中的結構標籤開始。諸如 [intro-short][inst-medium][outro-long] 之類的標籤僅用於器樂—無需歌詞。諸如 [verse][chorus][bridge] 之類的標籤需要歌詞文本。

風格描述

使用自然語言描述來控制音樂輸出:

female, dark, pop, sad, piano and drums, the bpm is 125

您可以指定性別、音色、流派、情感、樂器和節奏的任何組合。該模型支持開放詞彙表,但預定義標籤提供更一致的結果。

使用參考音頻

為了實現更精確的風格匹配,上傳參考音頻片段。該模型使用前 10 秒來學習流派、樂器編制、節奏和人聲風格。專業提示:使用歌曲的合唱部分作為參考通常會產生最佳結果。

在 WaveSpeedAI 上入門

WaveSpeedAI 使您可以輕鬆立即開始生成歌曲:

  1. 訪問 SongGeneration 模型頁面
  2. 在輸入欄位中輸入您的結構化歌詞
  3. 添加可選的風格描述或上傳參考音頻
  4. 點擊生成並接收您的完整歌曲

使用 WaveSpeedAI 的基礎設施,您將受益於:

  • 即時可用性:沒有冷啟動意味著您的生成立即開始
  • 快速推理:優化的基礎設施快速傳遞結果
  • 經濟實惠的價格:只需為您生成的內容付費,透明的按請求定價
  • 簡單的 REST API:直接將歌曲生成整合到您的應用程式和工作流程中

技術規格

功能規格
最大歌曲長度4 分 30 秒
支持的語言英文、中文、西班牙文、日文
輸出格式混合版本、器樂、人聲、分離音軌
輸入方法結構化歌詞 + 文本描述或參考音頻

結論

SongGeneration (LeVo) 代表了 AI 音樂生成的重大進步,將專業品質的歌曲創作帶給任何有創意和歌詞的人。無論您是探索新聲音的音樂家、需要原創音樂的內容創作者,還是開發下一代創意工具的開發人員,此模型都開啟了新的可能性。

結構化歌詞輸入、靈活的風格控制和多音軌輸出功能的組合使 SongGeneration 成為當今最通用的文字轉歌曲模型之一。而且由於 WaveSpeedAI 的快速、可靠的推理基礎設施,您可以在幾秒內開始創建。

準備好讓您的歌詞栩栩如生?立即在 WaveSpeedAI 上嘗試 SongGeneration,體驗 AI 動力音樂創作的未來。