Présentation de la génération de chansons WaveSpeedAI sur WaveSpeedAI

Présentation de SongGeneration (LeVo) : Transformez vos paroles en chansons professionnelles grâce à l’IA

Le monde de la création musicale alimentée par l’IA a atteint un nouveau jalon. WaveSpeedAI est heureux d’annoncer la disponibilité de SongGeneration (LeVo), un modèle révolutionnaire de texte-vers-chanson développé par Tencent AI Lab qui génère des chansons complètes et de haute qualité à partir de vos paroles. Ce modèle open-source représente un bond significatif en avant dans la génération musicale par IA, fournissant des résultats qui rivalisent avec les plateformes commerciales comme Suno 4.5.

Qu’est-ce que SongGeneration (LeVo) ?

SongGeneration est un cadre basé sur LM pour la génération musicale qui combine un modèle de langage (LeLM) avec un codec audio avancé pour produire des chansons de longueur complète avec des voix. Contrairement aux modèles plus simples de texte-vers-audio qui génèrent de la musique instrumentale ou des clips courts, SongGeneration crée des chansons complètes — voix, accompagnement et production de qualité professionnelle — le tout à partir d’une entrée de paroles structurées.

Le modèle peut générer des chansons jusqu’à 4 minutes et 30 secondes de longueur, supportant plusieurs langues incluant l’anglais, le chinois, l’espagnol et le japonais. Ce qui le distingue est sa flexibilité : vous pouvez obtenir des voix et un accompagnement combinés, de la musique purement instrumentale, des voix a cappella isolées, ou des pistes entièrement séparées pour un mixage professionnel.

Caractéristiques principales

Génération de chansons complètes : Créez des chansons complètes jusqu’à 4,5 minutes, pas seulement des clips de 30 secondes
Support des paroles structurées : Utilisez des marqueurs de section intuitifs comme [verse], [chorus] et [bridge] pour contrôler la structure de la chanson
Contrôle flexible du style : Guidez la sortie avec des descriptions textuelles pour le sexe, le timbre, le genre, l’émotion, les instruments et le tempo
Prompte audio : Uploadez un échantillon audio de référence (les 10 premières secondes) pour influencer le style généré
Plusieurs modes de sortie : Obtenez un mix combiné, de la musique pure, des voix a cappella, ou des pistes séparées
Capacités multilingues : Générez des chansons en anglais, chinois, espagnol, japonais et plus
Métriques de qualité professionnelle : Atteint un taux d’erreur de phonèmes de 5,1 % sur les benchmarks avec des scores de musicalité de 3,94/5

Cas d’usage

Pour les musiciens et producteurs

Prototypez rapidement des idées de chansons en écrivant des paroles et en les entendant interprétées. Testez différents genres, tempos et arrangements avant de vous engager dans une production complète. Utilisez la sortie de pistes séparées pour extraire des mélodies ou harmonies générées par IA pour vos propres arrangements.

Pour les créateurs de contenu

Générez de la musique de fond originale et des jingles pour vos vidéos, podcasts et contenu sur les réseaux sociaux. Créez des chansons thématiques personnalisées pour votre marque ou chaîne sans frais de studio coûteux ou de licences.

Pour les développeurs de jeux et d’applications

Produisez des bandes sonores originales et dynamiques adaptées à des ambiances et scènes spécifiques. Générez rapidement plusieurs variations pour trouver la combinaison parfaite pour l’atmosphère de votre projet.

Pour les compositeurs de chansons

Entendez vos paroles prendre vie instantanément pour évaluer la mélodie et le rythme. Expérimentez avec différents styles et arrangements pour découvrir de nouvelles directions créatives.

Pour les éducateurs et chercheurs

Créez des chansons éducatives personnalisées ou étudiez l’intersection entre l’IA et la composition musicale. Analysez comment différentes structures de paroles et des demandes de style affectent la sortie générée.

Comment formater votre entrée

Structure des paroles

Vos paroles doivent suivre ce format :

[intro-short]

[verse]
Streetlights flicker in the night
I wander through familiar corners
Memories rush in like a tide

[chorus]
The warmth of memories still remains
But you are gone
My heart was filled with love

[outro-short]

Chaque section commence par un label de structure entre crochets. Des labels comme [intro-short], [inst-medium] et [outro-long] sont uniquement instrumentaux — aucune parole nécessaire. Des labels comme [verse], [chorus] et [bridge] nécessitent du texte lyrique.

Description du style

Contrôlez la sortie musicale avec une description en langage naturel :

female, dark, pop, sad, piano and drums, the bpm is 125

Vous pouvez spécifier n’importe quelle combinaison de sexe, timbre, genre, émotion, instruments et tempo. Le modèle supporte un vocabulaire ouvert, bien que les tags prédéfinis fournissent des résultats plus cohérents.

Utiliser l’audio de référence

Pour un matching de style encore plus précis, uploadez un clip audio de référence. Le modèle utilise les 10 premières secondes pour apprendre le genre, l’instrumentation, le rythme et le style vocal. Conseil professionnel : utiliser le refrain d’une chanson comme référence produit généralement les meilleurs résultats.

Démarrage sur WaveSpeedAI

WaveSpeedAI facilite le démarrage de la génération de chansons immédiatement :

Visitez la page du modèle SongGeneration
Entrez vos paroles structurées dans le champ d’entrée
Ajoutez une description de style optionnelle ou uploadez un audio de référence
Cliquez sur générer et recevez votre chanson complète

Avec l’infrastructure de WaveSpeedAI, vous bénéficiez de :

Disponibilité instantanée : Pas de démarrages froids signifie que votre génération commence immédiatement
Inférence rapide : L’infrastructure optimisée fournit les résultats rapidement
Tarification abordable : Payez uniquement pour ce que vous générez avec une tarification transparente par requête
API REST simple : Intégrez la génération de chansons directement dans vos applications et flux de travail

Spécifications techniques

Caractéristique	Spécification
Longueur maximale de la chanson	4 minutes 30 secondes
Langues supportées	Anglais, chinois, espagnol, japonais
Formats de sortie	Mix combiné, instrumental, voix, pistes séparées
Méthodes d’entrée	Paroles structurées + description textuelle ou audio de référence

Conclusion

SongGeneration (LeVo) représente un progrès significatif dans la génération musicale par IA, mettant la création de chansons de qualité professionnelle à la portée de quiconque a une idée et quelques paroles. Que vous soyez un musicien explorant de nouveaux sons, un créateur de contenu ayant besoin de musique originale, ou un développeur construisant la prochaine génération d’outils créatifs, ce modèle ouvre de nouvelles possibilités.

La combinaison d’une entrée de paroles structurées, d’un contrôle flexible du style et de capacités de sortie multi-pistes fait de SongGeneration l’un des modèles de texte-vers-chanson les plus polyvalents disponibles aujourd’hui. Et avec l’infrastructure d’inférence rapide et fiable de WaveSpeedAI, vous pouvez commencer à créer en quelques secondes.

Prêt à entendre vos paroles prendre vie ? Essayez SongGeneration sur WaveSpeedAI aujourd’hui et découvrez l’avenir de la création musicale alimentée par l’IA.