← Блог

Представляем WaveSpeedAI Heartmula Generate Music на WaveSpeedAI

HeartMuLa — передовая модель генерации музыки, создающая высококачественные песни на основе текстов и стилевых тегов. Готовый к использованию REST API для инференса с лучшей произ

By WaveSpeedAI 6 min read
Wavespeed Ai Heartmula Generate Music
Wavespeed Ai Heartmula Generate Music HeartMuLa — передовая модель генерации музыки, создающая выс...
Try it
Представляем WaveSpeedAI Heartmula Generate Music на WaveSpeedAI

HeartMuLa теперь доступна на WaveSpeedAI: превратите свои тексты в полноценные песни с помощью ИИ

Создание оригинальной музыки всегда было одним из самых трудоёмких творческих занятий — до сегодняшнего дня. WaveSpeedAI с радостью объявляет о доступности HeartMuLa — передовой музыкальной фундаментальной модели с открытым исходным кодом, которая генерирует качественные, полноценные песни на основе ваших текстов и стилевых тегов. Независимо от того, являетесь ли вы автором песен, прорабатывающим идеи, создателем контента в поисках оригинального саундтрека или разработчиком, создающим следующее музыкальное приложение, HeartMuLa предоставляет профессиональное музыкальное производство через простой вызов API.

Что такое HeartMuLa?

HeartMuLa — это семейство музыкальных фундаментальных моделей с открытым исходным кодом, построенных на сложной четырёхкомпонентной архитектуре: HeartCLAP для выравнивания аудио и текста, HeartTranscriptor для распознавания текстов песен, HeartCodec для высококачественной токенизации музыки и сама языковая модель HeartMuLa для генерации песен. Вместе эти компоненты создают полноценные песни — вокал, мелодии, гармонии и полные инструментальные аранжировки — всего лишь из структурированных текстов и нескольких стилевых тегов.

Что делает HeartMuLa выдающейся — это чёткость воспроизведения текста. В тестах HeartMuLa достигает наименьшего показателя фонемных ошибок (PER) во всех протестированных языках, превосходя ведущие коммерческие модели, включая Suno v5 и MiniMax Music 2.0. На английском HeartMuLa достигает PER всего 0,09, а на китайском — 0,12, что означает: каждое написанное вами слово будет звучать кристально чисто в финальной песне. Модель дополнительно улучшена с помощью метода Direct Preference Optimization (DPO) — техники обучения с подкреплением, обеспечивающей точный контроль над стилями, тегами и общим музыкальным качеством.

Впервые система генерации музыки коммерческого уровня воспроизведена в академическом масштабе и выпущена с открытым исходным кодом под лицензией Apache 2.0 — и теперь она доступна на WaveSpeedAI без какой-либо настройки.

Ключевые возможности

  • Генерация полноценных песен: создаёт целые песни с вокалом, инструментальными партиями, вступлениями, бриджами и аутро — а не просто короткие петли или клипы
  • Многоязычные тексты: поддерживает английский, китайский, японский, корейский и испанский языки, что идеально подходит для авторов, ориентированных на глобальную аудиторию
  • Структурированная композиция: используйте маркеры секций, такие как [Verse], [Chorus], [Bridge], [intro-short] и [outro-medium], для точного управления аранжировкой и структурой песни
  • Гибкое управление стилем: определяйте жанр, настроение, темп, инструменты и характеристики вокала с помощью простых тегов через запятую, например "r&b, smooth, male vocals, soulful, 85bpm"
  • Инструментальные секции: добавляйте вступления, аутро и инструментальные вставки с настраиваемыми маркерами длительности — тексты для этих секций не требуются
  • Лидирующая в отрасли чёткость текста: наименьший уровень фонемных ошибок среди всех протестированных языков, гарантирующий точное воспроизведение ваших текстов

Примеры реального использования

Создание оригинальной музыки

Авторы песен и музыканты могут мгновенно воплощать свои тексты в жизнь. Напишите куплеты и припевы, выберите стиль — и услышите полностью продюсированную версию своей песни за секунды. Это самый быстрый путь от идеи до демо.

Саундтреки для контента

Видеоблогеры, подкастеры и авторы в социальных сетях могут генерировать оригинальную фоновую музыку, идеально подходящую к их контенту. Вместо того чтобы перебирать стандартные библиотеки роялти-фри, создавайте что-то уникальное для каждого проекта.

Многоязычное производство контента

Бренды и авторы, работающие с международной аудиторией, могут создавать песни на пяти языках с помощью одной модели. Запускайте маркетинговые кампании с японским поп-треком, испанской балладой и английским гимном — все они генерируются через один и тот же API.

Производство демо и помощь в написании песен

Профессиональные авторы песен могут использовать HeartMuLa как инструмент быстрого прототипирования. Проверяйте, как тексты звучат в разных жанрах и темпах, прежде чем вкладываться в дорогостоящие студийные сессии. Экспериментируйте с аранжировками, переставляя маркеры секций и регенерируя результат за секунды.

Разработка игр и приложений

Разработчики игр могут создавать оригинальные заглавные темы, музыку для меню и внутриигровые саундтреки с вокалом, соответствующим нарративу игры. Разработчики приложений могут интегрировать генерацию музыки непосредственно в свои продукты через API WaveSpeedAI.

Начало работы на WaveSpeedAI

Генерировать музыку с HeartMuLa на WaveSpeedAI просто. Всё, что вам нужно — это тексты, всё остальное необязательно.

Использование API

import wavespeed

output = wavespeed.run(
    "wavespeed-ai/heartmula/generate-music",
    {
        "lyrics": """[intro-short]
[Verse]
Your voice like velvet, I'm never alone
The way you say my name, it pulls me in
A love like ours is more than skin
[Chorus]
Stay with me until the morning light
Hold me close and never let me go
[outro-short]""",
        "tags": "r&b, smooth, male vocals, soulful, slow jam, romantic, 85bpm"
    },
)

print(output["outputs"][0])

Составление текстов

Структурируйте тексты с маркерами секций для достижения наилучших результатов:

  • [Verse], [Chorus], [Bridge] — вокальные секции, требующие текста
  • [intro-short], [intro-medium] — инструментальные вступления (0–10 с или 10–20 с)
  • [inst-short], [inst-medium] — инструментальные вставки между секциями
  • [outro-short], [outro-medium] — инструментальные окончания

Определение стиля

Комбинируйте теги для точного описания желаемого звучания:

  • "female, bright, pop, happy, piano, 130bpm" — энергичный поп-гимн
  • "male, dark, rock, guitar, drums, energetic" — мощный рок-трек
  • "piano, happy, wedding, synthesizer, romantic" — романтическая свадебная песня
  • "jazz, smooth, saxophone, soft, 90bpm" — атмосфера позднего джаза

Советы профессионала:

  • Хорошо структурируйте тексты с чёткими маркерами секций для достижения наилучшего качества аранжировки
  • Комбинируйте несколько стилевых тегов для более конкретных результатов — жанр, настроение, инструменты, темп и характеристики вокала работают вместе
  • Используйте [inst-short] или [inst-medium] между вокальными секциями, чтобы дать песне пространство для дыхания
  • Задавайте конкретное значение seed для воспроизведения идентичных результатов, когда вы нашли удачный вариант

Почему стоит выбрать WaveSpeedAI?

Запуск HeartMuLa на WaveSpeedAI даёт вам лучшее из двух миров — модель с открытым исходным кодом и инфраструктура коммерческого уровня:

  • Без холодного старта: генерация музыки начинается немедленно, без ожидания запуска экземпляров
  • Быстрый инференс: оптимизированная инфраструктура быстро доставляет ваши полноценные песни, позволяя свободно итерировать и экспериментировать
  • Доступные цены: генерируйте полноценные песни всего за $0,10 за песню — это ничтожная доля от того, что берут платформы генерации музыки по подписке
  • Простой REST API: интегрируйте генерацию музыки с ИИ в свои приложения с помощью понятного API, не требующего знаний в области машинного обучения или управления GPU

Начните создавать свою музыку сегодня

HeartMuLa представляет собой веху в генерации музыки с помощью ИИ: модель с открытым исходным кодом, которая конкурирует с коммерческими предложениями по качеству, превосходит их по чёткости текста и поддерживает истинное многоязычное создание песен. В сочетании с быстрой и надёжной инфраструктурой WaveSpeedAI это самый доступный способ превратить ваши слова в музыку.

Создаёте ли вы саундтрек к фильму, прототипируете хит, делаете саундтреки для контента или разрабатываете музыкальное приложение — HeartMuLa на WaveSpeedAI обеспечивает профессиональные результаты по цене, открывающей творческие возможности для каждого.

Готовы услышать, как ваши тексты оживают? Попробуйте HeartMuLa на WaveSpeedAI сегодня и начните генерировать полноценные песни из своих слов.

Поделиться