← Blog

Apresentando o WaveSpeedAI Heartmula Generate Music no WaveSpeedAI

HeartMuLa é um modelo de geração de música de última geração que cria canções de alta qualidade a partir de letras e tags de estilo. API de inferência REST pronta para uso com o melhor desempenho por

7 min read
Wavespeed Ai Heartmula Generate Music
Wavespeed Ai Heartmula Generate Music HeartMuLa é um modelo de geração de música de última geração...
Try it
Apresentando o WaveSpeedAI Heartmula Generate Music no WaveSpeedAI

HeartMuLa Já Está Disponível no WaveSpeedAI: Transforme Suas Letras em Músicas Completas com IA

Criar música original sempre foi uma das atividades criativas mais demoradas — até agora. O WaveSpeedAI tem o prazer de anunciar a disponibilidade do HeartMuLa, um modelo de fundação musical de código aberto e última geração que gera músicas completas e de alta qualidade a partir de suas letras e tags de estilo. Seja você um compositor prototipando ideias, um criador de conteúdo em busca de uma trilha sonora personalizada ou um desenvolvedor construindo o próximo aplicativo com foco em música, o HeartMuLa coloca a produção musical profissional ao alcance de uma simples chamada de API.

O Que É o HeartMuLa?

O HeartMuLa é uma família de modelos de fundação musical de código aberto construída sobre uma sofisticada arquitetura de quatro componentes: HeartCLAP para alinhamento áudio-texto, HeartTranscriptor para reconhecimento de letras, HeartCodec para tokenização musical de alta fidelidade e o próprio modelo de linguagem HeartMuLa para geração de músicas. Juntos, esses componentes produzem músicas completas — vocais, melodias, harmonias e arranjos instrumentais completos — a partir de apenas letras estruturadas e algumas tags de estilo.

O que torna o HeartMuLa notável é a clareza das letras. Em testes de benchmark, o HeartMuLa alcança a menor Taxa de Erro de Fonema (PER) em todos os idiomas testados, superando os principais modelos comerciais, incluindo Suno v5 e MiniMax Music 2.0. Em inglês, o HeartMuLa atinge um PER de apenas 0,09, enquanto em chinês alcança 0,12 — o que significa que cada palavra que você escreve fica cristalina na música final. O modelo foi ainda refinado com Otimização de Preferência Direta (DPO), uma técnica de aprendizado por reforço que garante controle preciso sobre estilos, tags e qualidade musical geral.

Pela primeira vez, um sistema de geração musical de nível comercial foi reproduzido em escala acadêmica e lançado como código aberto sob a licença Apache 2.0 — e agora está disponível no WaveSpeedAI sem nenhuma configuração necessária.

Principais Recursos

  • Geração de Música Completa: Produz músicas inteiras com vocais, instrumentais, introduções, pontes e finais — não apenas loops ou clipes curtos
  • Letras Multilíngues: Suporta inglês, chinês, japonês, coreano e espanhol, tornando-o ideal para criadores que atingem audiências globais
  • Composição Estruturada de Músicas: Use marcadores de seção como [Verse], [Chorus], [Bridge], [intro-short] e [outro-medium] para controlar com precisão o arranjo e o fluxo da sua música
  • Controle de Estilo Flexível: Defina gênero, humor, tempo, instrumentos e características vocais por meio de tags simples separadas por vírgulas, como "r&b, smooth, male vocals, soulful, 85bpm"
  • Seções Instrumentais: Adicione introduções, finais e breaks instrumentais com marcadores de duração configuráveis — sem necessidade de letras para essas seções
  • Clareza de Letra Líder do Setor: Menor taxa de erro de fonema em todos os idiomas testados, garantindo que suas letras sejam cantadas exatamente como escritas

Casos de Uso no Mundo Real

Criação de Música Original

Compositores e músicos podem dar vida às suas letras instantaneamente. Escreva seus versos e refrões, escolha um estilo e ouça uma versão completamente produzida da sua música em segundos. É o caminho mais rápido da ideia ao demo.

Trilhas Sonoras para Conteúdo

Criadores de vídeo, podcasters e produtores de mídia social podem gerar música de fundo personalizada que se encaixa perfeitamente em seu conteúdo. Em vez de vasculhar bibliotecas genéricas de royalty-free, crie algo único para cada projeto.

Produção de Conteúdo Multilíngue

Marcas e criadores que atendem públicos internacionais podem produzir músicas em cinco idiomas a partir de um único modelo. Lance uma campanha de marketing com uma faixa pop japonesa, uma balada espanhola e um hino em inglês — tudo gerado pela mesma API.

Produção de Demo e Assistência na Composição

Compositores profissionais podem usar o HeartMuLa como uma ferramenta de prototipagem rápida. Teste como as letras soam em diferentes gêneros e tempos antes de se comprometer com sessões de estúdio caras. Experimente com arranjos reorganizando marcadores de seção e gerando novamente em segundos.

Desenvolvimento de Jogos e Aplicativos

Desenvolvedores de jogos podem criar músicas temáticas originais, músicas de menu e trilhas sonoras in-game com vocais adaptados à narrativa do jogo. Desenvolvedores de aplicativos podem integrar geração de música diretamente em seus produtos por meio da API do WaveSpeedAI.

Primeiros Passos no WaveSpeedAI

Gerar música com o HeartMuLa no WaveSpeedAI é simples. Tudo o que você precisa são letras — todo o resto é opcional.

Usando a API

import wavespeed

output = wavespeed.run(
    "wavespeed-ai/heartmula/generate-music",
    {
        "lyrics": """[intro-short]
[Verse]
Your voice like velvet, I'm never alone
The way you say my name, it pulls me in
A love like ours is more than skin
[Chorus]
Stay with me until the morning light
Hold me close and never let me go
[outro-short]""",
        "tags": "r&b, smooth, male vocals, soulful, slow jam, romantic, 85bpm"
    },
)

print(output["outputs"][0])

Estruturando Suas Letras

Organize suas letras com marcadores de seção para obter os melhores resultados:

  • [Verse], [Chorus], [Bridge] — Seções vocais que exigem letras
  • [intro-short], [intro-medium] — Introduções instrumentais (0–10s ou 10–20s)
  • [inst-short], [inst-medium] — Breaks instrumentais entre seções
  • [outro-short], [outro-medium] — Finais instrumentais

Definindo Seu Estilo

Combine tags para descrever exatamente o som que você deseja:

  • "female, bright, pop, happy, piano, 130bpm" — Hino pop animado
  • "male, dark, rock, guitar, drums, energetic" — Faixa de rock intensa
  • "piano, happy, wedding, synthesizer, romantic" — Música romântica para casamento
  • "jazz, smooth, saxophone, soft, 90bpm" — Clima de jazz noturno

Dicas Profissionais:

  • Mantenha as letras bem estruturadas com marcadores de seção claros para obter a melhor qualidade de arranjo
  • Combine múltiplas tags de estilo para resultados mais específicos — gênero, humor, instrumentos, tempo e características vocais funcionam em conjunto
  • Use [inst-short] ou [inst-medium] entre seções vocais para dar espaço de respiração à sua música
  • Defina um valor de seed específico para reproduzir resultados idênticos quando encontrar uma geração que você adore

Por Que Escolher o WaveSpeedAI?

Executar o HeartMuLa no WaveSpeedAI oferece o melhor dos dois mundos — um modelo de código aberto com infraestrutura de nível comercial:

  • Sem Cold Starts: A geração da sua música começa imediatamente, sem esperar que as instâncias sejam inicializadas
  • Inferência Rápida: A infraestrutura otimizada entrega suas músicas completas rapidamente para que você possa iterar e experimentar livremente
  • Preços Acessíveis: Gere músicas completas por apenas $0,10 por música — uma fração do que as plataformas de geração musical baseadas em assinatura cobram
  • API REST Simples: Integre geração de música com IA em seus aplicativos com uma API direta que não exige expertise em ML ou gerenciamento de GPU

Comece a Criar Sua Música Hoje

O HeartMuLa representa um marco na geração musical com IA: um modelo de código aberto que rivaliza com ofertas comerciais em qualidade, as supera em clareza de letras e suporta criação multilíngue verdadeira. Combinado com a infraestrutura rápida e confiável do WaveSpeedAI, é a forma mais acessível de transformar suas palavras em música.

Seja para trilhar um filme, prototipar um sucesso, criar trilhas sonoras para conteúdo ou construir um aplicativo com foco em música, o HeartMuLa no WaveSpeedAI entrega resultados profissionais a um preço que abre possibilidades criativas para todos.

Pronto para ouvir suas letras ganharem vida? Experimente o HeartMuLa no WaveSpeedAI hoje e comece a gerar músicas completas a partir das suas palavras.

Compartilhar