← ブログ

HeartMuLa Generate MusicがWaveSpeedAIに登場

HeartMuLaは、歌詞とスタイルタグから高品質な楽曲を生成する最先端の音楽生成モデルです。すぐに使えるREST推論APIで最高のパフォーマンスを発揮します。

2 min read
Wavespeed Ai Heartmula Generate Music
Wavespeed Ai Heartmula Generate Music HeartMuLaは、歌詞とスタイルタグから高品質な楽曲を生成する最先端の音楽生成モデルです。すぐに使えるREST推論A...
Try it
HeartMuLa Generate MusicがWaveSpeedAIに登場

HeartMuLaがWaveSpeedAIに登場:AIで歌詞を完全な楽曲に変換

オリジナル音楽の制作は、これまで最も時間のかかるクリエイティブな作業の一つでした——しかし、それも今や昔の話です。WaveSpeedAIは、HeartMuLaの提供開始を喜んでお知らせします。HeartMuLaは、歌詞とスタイルタグから高品質な完全楽曲を生成する、最先端のオープンソース音楽基盤モデルです。アイデアを試したいソングライター、カスタムサウンドトラックを求めるコンテンツクリエイター、次世代の音楽アプリを開発するデベロッパーまで、HeartMuLaはシンプルなAPIコール一つでプロ品質の音楽制作を実現します。

HeartMuLaとは?

HeartMuLaは、4つのコンポーネントから成る洗練されたアーキテクチャを基盤とするオープンソース音楽基盤モデルファミリーです。音声とテキストのアライメントを担う「HeartCLAP」、歌詞認識を行う「HeartTranscriptor」、高忠実度の音楽トークン化を担う「HeartCodec」、そして楽曲生成を行う「HeartMuLa」言語モデル自体で構成されています。これらのコンポーネントが連携することで、構造化された歌詞とわずかなスタイルタグだけから、ボーカル・メロディ・ハーモニー・フルインストゥルメンタルアレンジメントを含む完全な楽曲が生成されます。

HeartMuLaが際立っている点は、歌詞の明瞭さです。ベンチマークテストでは、HeartMuLaはテスト済みのすべての言語において最低の音素誤り率(PER)を達成しており、Suno v5やMiniMax Music 2.0などのトップ商用モデルを上回っています。英語ではPERわずか0.09、中国語では0.12を達成——つまり、あなたが書いたすべての言葉が最終的な楽曲の中でクリアに伝わります。さらに、Direct Preference Optimization(DPO)という強化学習手法でモデルが洗練されており、スタイル・タグ・全体的な音楽クオリティの精密なコントロールが保証されています。

商用品質の音楽生成システムが初めてアカデミックスケールで再現され、Apache 2.0ライセンスのもとオープンソースとして公開されました——そして今、WaveSpeedAI上でセットアップ不要で利用できます。

主な機能

  • 完全楽曲生成:ループや短いクリップではなく、ボーカル・インストゥルメンタル・イントロ・ブリッジ・アウトロを含む完全な楽曲を生成
  • 多言語歌詞対応:英語・中国語・日本語・韓国語・スペイン語に対応し、グローバルなオーディエンスをターゲットにするクリエイターに最適
  • 構造化楽曲作成[Verse][Chorus][Bridge][intro-short][outro-medium]などのセクションマーカーを使用して、楽曲のアレンジメントとフローを精密にコントロール
  • 柔軟なスタイルコントロール"r&b, smooth, male vocals, soulful, 85bpm"のようなシンプルなカンマ区切りタグで、ジャンル・ムード・テンポ・楽器・ボーカルの特性を定義
  • インストゥルメンタルセクション:設定可能な長さマーカーを使ってイントロ・アウトロ・インストゥルメンタルブレイクを追加——これらのセクションには歌詞不要
  • 業界最高水準の歌詞明瞭度:テスト済み全言語で最低の音素誤り率を達成し、書いた通りに歌詞が歌われることを保証

実際のユースケース

オリジナル音楽制作

ソングライターやミュージシャンは、歌詞を瞬時に形にできます。バースとコーラスを書き、スタイルを選ぶだけで、数秒でフルプロデュースされた楽曲が完成します。アイデアからデモまでの最速の道筋です。

コンテンツサウンドトラック

動画クリエイター、ポッドキャスター、SNSクリエイターは、コンテンツにぴったりのカスタムBGMを生成できます。汎用的なロイヤリティフリーライブラリを探し回る代わりに、プロジェクトごとにユニークなものを作り上げましょう。

多言語コンテンツ制作

国際的なオーディエンスにサービスを提供するブランドやクリエイターは、単一のモデルから5言語の楽曲を制作できます。日本語ポップトラック、スペイン語バラード、英語アンセムを揃えたマーケティングキャンペーンを——すべて同じAPIで生成できます。

デモ制作とソングライティングサポート

プロのソングライターは、HeartMuLaをラピッドプロトタイピングツールとして活用できます。高額なスタジオセッションにコミットする前に、さまざまなジャンルやテンポに合わせた歌詞の響きをテストしましょう。セクションマーカーを入れ替えて数秒で再生成することで、アレンジメントを試すことができます。

ゲーム・アプリ開発

ゲームデベロッパーは、ゲームのストーリーに合わせたボーカル付きのオリジナルテーマ曲・メニュー音楽・ゲーム内サウンドトラックを制作できます。アプリデベロッパーは、WaveSpeedAI APIを通じて音楽生成機能を自社プロダクトに直接統合できます。

WaveSpeedAIで始める

WaveSpeedAI上でHeartMuLaを使った音楽生成はシンプルです。必要なのは歌詞だけ——それ以外はすべてオプションです。

APIの使用方法

import wavespeed

output = wavespeed.run(
    "wavespeed-ai/heartmula/generate-music",
    {
        "lyrics": """[intro-short]
[Verse]
Your voice like velvet, I'm never alone
The way you say my name, it pulls me in
A love like ours is more than skin
[Chorus]
Stay with me until the morning light
Hold me close and never let me go
[outro-short]""",
        "tags": "r&b, smooth, male vocals, soulful, slow jam, romantic, 85bpm"
    },
)

print(output["outputs"][0])

歌詞の構成

最良の結果を得るために、セクションマーカーを使って歌詞を構成しましょう:

  • [Verse][Chorus][Bridge] — 歌詞が必要なボーカルセクション
  • [intro-short][intro-medium] — インストゥルメンタルイントロ(0〜10秒または10〜20秒)
  • [inst-short][inst-medium] — セクション間のインストゥルメンタルブレイク
  • [outro-short][outro-medium] — インストゥルメンタルエンディング

スタイルの定義

タグを組み合わせて、求めるサウンドを正確に表現しましょう:

  • "female, bright, pop, happy, piano, 130bpm" — アップビートなポップアンセム
  • "male, dark, rock, guitar, drums, energetic" — 力強いロックトラック
  • "piano, happy, wedding, synthesizer, romantic" — ロマンチックなウェディングソング
  • "jazz, smooth, saxophone, soft, 90bpm" — 深夜のジャズの雰囲気

プロのヒント:

  • 最高のアレンジメント品質を得るために、明確なセクションマーカーを使って歌詞をしっかりと構成しましょう
  • より具体的な結果を得るために、複数のスタイルタグを組み合わせましょう——ジャンル・ムード・楽器・テンポ・ボーカルの特性をすべて組み合わせて使えます
  • ボーカルセクション間に[inst-short][inst-medium]を使って、楽曲に余白を持たせましょう
  • 気に入った生成結果を再現したい場合は、特定のシード値を設定することで同一の結果を得られます

WaveSpeedAIを選ぶ理由

WaveSpeedAI上でHeartMuLaを実行することで、オープンソースモデルと商用グレードのインフラ両方のメリットを享受できます:

  • コールドスタートなし:インスタンスの起動を待つことなく、音楽生成がすぐに始まります
  • 高速推論:最適化されたインフラが完全な楽曲を素早く届けるので、自由に繰り返し試行できます
  • 手頃な価格:完全な楽曲を1曲あたりわずか$0.10で生成——サブスクリプション型音楽生成プラットフォームの何分の一かの価格です
  • シンプルなREST API:MLの専門知識やGPU管理なしに、わかりやすいAPIでAI音楽生成をアプリケーションに統合できます

今日から音楽制作を始めましょう

HeartMuLaはAI音楽生成における一つのマイルストーンです:商用モデルに匹敵するクオリティを持ち、歌詞の明瞭さでそれらを超え、真の多言語楽曲制作をサポートするオープンソースモデル。WaveSpeedAIの高速で信頼性の高いインフラと組み合わせることで、あなたの言葉を音楽に変える最もアクセスしやすい方法となっています。

映画のスコアリング、ヒット曲のプロトタイピング、コンテンツサウンドトラックの制作、あるいは音楽アプリの開発など、WaveSpeedAI上のHeartMuLaはすべての人にクリエイティブな可能性を広げる価格でプロ品質の結果をお届けします。

あなたの歌詞が生き生きとした音楽になるのを聴く準備はできていますか? WaveSpeedAIでHeartMuLaを今すぐ試すから、あなたの言葉で完全な楽曲を生成し始めましょう。