WaveSpeedAI Song GenerationがWaveSpeedAIに登場
Wavespeed Ai Song Generation を無料で試す
SongGeneration (LeVo)を紹介:あなたの歌詞をAIで プロフェッショナルな曲に変換
AI駆動の音楽制作の世界は新たなマイルストーンに達しました。WaveSpeedAIは、Tencent AI Labによって開発された革新的なテキスト・トゥ・ソング モデル SongGeneration (LeVo) の利用可能性を発表できることが嬉しいです。このオープンソース モデルは、あなたの歌詞から完全で高品質な曲を生成し、Suno 4.5などの商用プラットフォームと同等の結果を提供します。AI音楽生成における大きな飛躍を表しています。
SongGeneration (LeVo)とは?
SongGenerationは、言語モデル(LeLM)と高度な音楽コーデックを組み合わせて、歌声と伴奏を含む完全な長さの曲を制作するLMベースの音楽生成フレームワークです。短いクリップやインストルメンタル音楽を生成する単純なテキスト・トゥ・オーディオ モデルとは異なり、SongGenerationは構造化された歌詞入力から完全な曲—ボーカル、伴奏、プロフェッショナル品質の制作—を創作します。
このモデルは最大4分30秒の長さの曲を生成でき、英語、中国語、スペイン語、日本語を含む複数の言語に対応しています。その特徴は柔軟性にあります。ボーカルと伴奏の組み合わせ、純粋なインストルメンタル音楽、分離されたアカペラボーカル、またはプロフェッショナルなミックス用の完全に分離されたトラックを出力できます。
主な機能
- フル・レングス・ソング生成:30秒のクリップではなく、最大4分30秒の完全な曲を制作
- 構造化された歌詞サポート:
[verse]、[chorus]、[bridge]などの直感的なセクションマーカーを使用して曲の構成を制御 - 柔軟なスタイル制御:性別、音色、ジャンル、感情、楽器、テンポのテキスト説明で出力をガイド
- オーディオプロンプティング:参考オーディオサンプル(最初の10秒)をアップロードして、生成されたスタイルに影響を与える
- 複数の出力モード:コンバインドミックス、純粋な音楽、アカペラボーカル、または分離されたトラックを取得
- 多言語対応:英語、中国語、スペイン語、日本語などで曲を生成
- プロフェッショナルなクオリティメトリクス:ベンチマークで5.1%の音素誤り率を達成し、音楽性スコアは3.94/5
ユースケース
ミュージシャンとプロデューサーの場合
歌詞を書いて、それが演奏されているのを聞いて、曲のアイデアを素早くプロトタイプ化します。フル制作にコミットする前に、異なるジャンル、テンポ、アレンジをテストします。分離されたトラック出力を使用して、AI生成のメロディーやハーモニーを抽出して、あなた自身のアレンジに使用します。
コンテンツクリエイターの場合
ビデオ、ポッドキャスト、ソーシャルメディアコンテンツ用のオリジナル背景音楽とジングルを生成します。高額なスタジオセッションやライセンス料なしで、ブランドやチャネル用のカスタムテーマソングを作成します。
ゲームとアプリ開発者の場合
特定の気分やシーンに合わせた動的でオリジナルなサウンドトラックを製作します。複数のバリエーションを素早く生成して、プロジェクトの雰囲気に完璧にフィットするものを見つけます。
ソングライターの場合
あなたの歌詞が即座に現実になり、メロディーとリズムを評価します。異なるスタイルとアレンジを試して、新しい創造的な方向を発見します。
教育者と研究者の場合
カスタム教育曲を作成するか、AIと音楽作曲の交差点を研究します。異なる歌詞構造とスタイルプロンプトが生成された出力にどのように影響するかを分析します。
入力をフォーマットする方法
歌詞構造
歌詞は以下のフォーマットに従う必要があります:
[intro-short]
[verse]
Streetlights flicker in the night
I wander through familiar corners
Memories rush in like a tide
[chorus]
The warmth of memories still remains
But you are gone
My heart was filled with love
[outro-short]
各セクションは括弧内の構造ラベルで始まります。[intro-short]、[inst-medium]、[outro-long]などのラベルはインストルメンタルのみ—歌詞は不要です。[verse]、[chorus]、[bridge]などのラベルは歌詞テキストが必要です。
スタイル説明
自然言語の説明で音楽出力を制御します:
female, dark, pop, sad, piano and drums, the bpm is 125
性別、音色、ジャンル、感情、楽器、テンポの任意の組み合わせを指定できます。モデルはオープン語彙をサポートしていますが、事前定義されたタグはより一貫性のある結果をもたらします。
参考オーディオを使用する
さらに正確なスタイルマッチングのために、参考オーディオクリップをアップロードします。モデルは最初の10秒を使用してジャンル、楽器編成、リズム、ボーカルスタイルを学習します。プロのヒント:曲のコーラスを参考として使用することは通常最良の結果をもたらします。
WaveSpeedAIで始める
WaveSpeedAIを使うと、すぐに曲の生成を始めるのが簡単です:
- SongGenerationモデルページにアクセス
- 構造化された歌詞を入力フィールドに入力
- オプションのスタイル説明を追加するか、参考オーディオをアップロード
- 生成をクリックして、完全な曲を受け取ります
WaveSpeedAIのインフラストラクチャを利用することで、以下のメリットが得られます:
- 即座の利用可能性:コールドスタートがないため、生成は直ちに開始されます
- 高速推論:最適化されたインフラストラクチャが結果を迅速に提供します
- 手頃な価格設定:透明なリクエストごとの価格で生成したものだけに料金を支払います
- シンプルなREST API:曲生成をアプリケーションとワークフローに直接統合します
技術仕様
| 機能 | 仕様 |
|---|---|
| 最大曲の長さ | 4分30秒 |
| サポートされている言語 | 英語、中国語、スペイン語、日本語 |
| 出力形式 | コンバインドミックス、インストルメンタル、ボーカル、分離されたトラック |
| 入力方法 | 構造化された歌詞+テキスト説明または参考オーディオ |
結論
SongGeneration (LeVo)はAI音楽生成における重要な進歩を表しており、アイデアと歌詞を持つ誰もがプロフェッショナルな品質の曲制作にアクセスできるようにしています。新しい音を探索しているミュージシャン、オリジナル音楽が必要なコンテンツクリエイター、または次世代の創造的なツールを構築している開発者であっても、このモデルは新しい可能性を開きます。
構造化された歌詞入力、柔軟なスタイル制御、マルチトラック出力機能の組み合わせにより、SongGenerationは今日利用可能な最も汎用的なテキスト・トゥ・ソング モデルの1つです。さらに、WaveSpeedAIの高速で信頼性の高い推論インフラストラクチャにより、数秒で制作を開始できます。
あなたの歌詞が現実になるのを聞く準備はできていますか?今日WaveSpeedAIでSongGenerationを試してみて、AI駆動の音楽制作の未来を体験してください。

