Presentando WaveSpeedAI Heartmula Generate Music en WaveSpeedAI
HeartMuLa es un modelo de generación musical de última generación que crea canciones de alta calidad a partir de letras y etiquetas de estilo. API de inferencia REST lista para usar con el mejor rendimiento
HeartMuLa Ya Está Disponible en WaveSpeedAI: Convierte Tus Letras en Canciones Completas con IA
Crear música original ha sido durante mucho tiempo una de las actividades creativas más laboriosas, hasta ahora. WaveSpeedAI se complace en anunciar la disponibilidad de HeartMuLa, un modelo de fundamento musical de código abierto de última generación que genera canciones completas y de alta calidad a partir de tus letras y etiquetas de estilo. Ya seas un compositor que prototipa ideas, un creador de contenido que busca una banda sonora personalizada, o un desarrollador construyendo la próxima aplicación basada en música, HeartMuLa pone la producción musical de nivel profesional al alcance de una simple llamada a la API.
¿Qué Es HeartMuLa?
HeartMuLa es una familia de modelos de fundamento musical de código abierto construida sobre una sofisticada arquitectura de cuatro componentes: HeartCLAP para la alineación audio-texto, HeartTranscriptor para el reconocimiento de letras, HeartCodec para la tokenización musical de alta fidelidad, y el propio modelo de lenguaje HeartMuLa para la generación de canciones. Juntos, estos componentes producen canciones completas —voces, melodías, armonías y arreglos instrumentales completos— a partir de nada más que letras estructuradas y un puñado de etiquetas de estilo.
Lo que hace notable a HeartMuLa es la claridad de sus letras. En pruebas de referencia, HeartMuLa logra la Tasa de Error de Fonemas (PER) más baja en todos los idiomas evaluados, superando a los principales modelos comerciales, incluidos Suno v5 y MiniMax Music 2.0. En inglés, HeartMuLa alcanza un PER de apenas 0,09, mientras que en chino logra 0,12, lo que significa que cada palabra que escribes se escucha con total claridad en la canción final. El modelo ha sido perfeccionado con Optimización de Preferencia Directa (DPO), una técnica de aprendizaje por refuerzo que garantiza un control preciso sobre los estilos, las etiquetas y la calidad musical general.
Por primera vez, un sistema de generación musical de nivel comercial ha sido reproducido a escala académica y publicado como código abierto bajo la licencia Apache 2.0, y ahora está disponible en WaveSpeedAI sin necesidad de ninguna configuración.
Características Principales
- Generación de Canciones Completas: Produce canciones completas con voces, instrumentales, intros, puentes y outros, no solo bucles o clips cortos
- Letras Multilingües: Compatible con inglés, chino, japonés, coreano y español, lo que lo hace ideal para creadores que se dirigen a audiencias globales
- Composición de Canciones Estructurada: Usa marcadores de sección como
[Verse],[Chorus],[Bridge],[intro-short]y[outro-medium]para controlar con precisión el arreglo y el flujo de tu canción - Control de Estilo Flexible: Define género, estado de ánimo, tempo, instrumentos y características vocales mediante etiquetas simples separadas por comas como
"r&b, smooth, male vocals, soulful, 85bpm" - Secciones Instrumentales: Agrega intros, outros y pausas instrumentales con marcadores de duración configurables, sin necesidad de letras para estas secciones
- Claridad de Letras Líder en la Industria: Tasa de error de fonemas más baja en todos los idiomas probados, garantizando que tus letras se canten exactamente como las escribiste
Casos de Uso en el Mundo Real
Creación de Música Original
Los compositores y músicos pueden dar vida a sus letras al instante. Escribe tus versos y estribillos, elige un estilo y escucha una versión completamente producida de tu canción en segundos. Es el camino más rápido desde la idea hasta la demo.
Bandas Sonoras para Contenido
Los creadores de vídeo, podcasters y productores de redes sociales pueden generar música de fondo personalizada que se adapte perfectamente a su contenido. En lugar de buscar entre bibliotecas genéricas libres de derechos, crea algo único para cada proyecto.
Producción de Contenido Multilingüe
Las marcas y creadores que atienden a audiencias internacionales pueden producir canciones en cinco idiomas desde un único modelo. Lanza una campaña de marketing con una pista pop japonesa, una balada española y un himno en inglés, todos generados a través de la misma API.
Producción de Demos y Asistencia en la Composición
Los compositores profesionales pueden usar HeartMuLa como herramienta de prototipado rápido. Prueba cómo suenan las letras con diferentes géneros y tempos antes de comprometerte con costosas sesiones de estudio. Experimenta con los arreglos reorganizando los marcadores de sección y regenerando en segundos.
Desarrollo de Juegos y Aplicaciones
Los desarrolladores de juegos pueden crear canciones temáticas originales, música de menú y bandas sonoras en el juego con voces adaptadas a la narrativa de su juego. Los desarrolladores de aplicaciones pueden integrar la generación de música directamente en sus productos a través de la API de WaveSpeedAI.
Primeros Pasos en WaveSpeedAI
Generar música con HeartMuLa en WaveSpeedAI es sencillo. Todo lo que necesitas son letras; todo lo demás es opcional.
Usando la API
import wavespeed
output = wavespeed.run(
"wavespeed-ai/heartmula/generate-music",
{
"lyrics": """[intro-short]
[Verse]
Your voice like velvet, I'm never alone
The way you say my name, it pulls me in
A love like ours is more than skin
[Chorus]
Stay with me until the morning light
Hold me close and never let me go
[outro-short]""",
"tags": "r&b, smooth, male vocals, soulful, slow jam, romantic, 85bpm"
},
)
print(output["outputs"][0])
Elaborando Tus Letras
Estructura tus letras con marcadores de sección para obtener los mejores resultados:
[Verse],[Chorus],[Bridge]— Secciones vocales que requieren letras[intro-short],[intro-medium]— Intros instrumentales (0–10 s o 10–20 s)[inst-short],[inst-medium]— Pausas instrumentales entre secciones[outro-short],[outro-medium]— Finales instrumentales
Definiendo Tu Estilo
Combina etiquetas para describir exactamente el sonido que deseas:
"female, bright, pop, happy, piano, 130bpm"— Himno pop animado"male, dark, rock, guitar, drums, energetic"— Pista de rock contundente"piano, happy, wedding, synthesizer, romantic"— Canción romántica de boda"jazz, smooth, saxophone, soft, 90bpm"— Ambiente de jazz nocturno
Consejos Pro:
- Mantén las letras bien estructuradas con marcadores de sección claros para obtener la mejor calidad de arreglo
- Combina múltiples etiquetas de estilo para obtener resultados más específicos: género, estado de ánimo, instrumentos, tempo y características vocales funcionan juntos
- Usa
[inst-short]o[inst-medium]entre secciones vocales para darle espacio de respiración a tu canción - Establece un valor de semilla específico para reproducir resultados idénticos cuando encuentres una generación que te encante
¿Por Qué Elegir WaveSpeedAI?
Ejecutar HeartMuLa en WaveSpeedAI te ofrece lo mejor de ambos mundos: un modelo de código abierto con infraestructura de nivel comercial:
- Sin Arranques en Frío: La generación de tu música comienza de inmediato, sin esperar a que se inicien las instancias
- Inferencia Rápida: La infraestructura optimizada entrega tus canciones completas rápidamente para que puedas iterar y experimentar libremente
- Precios Accesibles: Genera canciones completas por solo $0,10 por canción, una fracción de lo que cobran las plataformas de generación musical por suscripción
- API REST Simple: Integra la generación de música con IA en tus aplicaciones con una API sencilla que no requiere experiencia en ML ni gestión de GPU
Empieza a Crear Tu Música Hoy
HeartMuLa representa un hito en la generación de música con IA: un modelo de código abierto que rivaliza con las ofertas comerciales en calidad, las supera en claridad de letras y admite la creación de canciones verdaderamente multilingüe. Combinado con la infraestructura rápida y confiable de WaveSpeedAI, es la forma más accesible de convertir tus palabras en música.
Ya sea que estés poniendo música a una película, prototipando un éxito, creando bandas sonoras para contenido o desarrollando una aplicación basada en música, HeartMuLa en WaveSpeedAI ofrece resultados profesionales a un precio que abre posibilidades creativas para todos.
¿Listo para escuchar tus letras cobrar vida? Prueba HeartMuLa en WaveSpeedAI hoy y empieza a generar canciones completas a partir de tus palabras.





