WaveSpeedAI 노래 생성, WaveSpeedAI에 출시

SongGeneration (LeVo) 소개: AI로 가사를 전문적인 노래로 변환하세요

AI 기반 음악 생성의 세계가 새로운 이정표에 도달했습니다. WaveSpeedAI는 Tencent AI Lab이 개발한 획기적인 텍스트-투-송 모델인 SongGeneration (LeVo) 의 가용성을 발표하게 되어 기쁩니다. 이 모델은 당신의 가사로부터 완전하고 고품질의 노래를 생성합니다. 이 오픈소스 모델은 AI 음악 생성 분야에서 큰 도약을 나타내며, Suno 4.5와 같은 상용 플랫폼에 필적하는 결과를 제공합니다.

SongGeneration (LeVo)란 무엇인가요?

SongGeneration은 언어 모델(LeLM)과 고급 음악 코덱을 결합하여 보컬이 포함된 풀-레이스 노래를 생성하는 LM 기반 음악 생성 프레임워크입니다. 악기 음악이나 짧은 클립을 생성하는 더 간단한 텍스트-투-오디오 모델과 달리, SongGeneration은 구조화된 가사 입력으로부터 완전한 노래(보컬, 반주, 전문 품질의 프로덕션)를 생성합니다.

이 모델은 최대 4분 30초 길이의 노래를 생성할 수 있으며, 영어, 중국어, 스페인어, 일본어를 포함한 여러 언어를 지원합니다. 이를 돋보이게 하는 것은 유연성입니다. 결합된 보컬과 반주, 순수한 악기 음악, 고립된 아카펠라 보컬, 또는 전문 믹싱을 위한 완전히 분리된 트랙을 출력할 수 있습니다.

주요 기능

풀-레이스 노래 생성: 30초 클립이 아닌 최대 4분 30초의 완전한 노래 생성
구조화된 가사 지원: [verse], [chorus], [bridge]와 같은 직관적인 섹션 마커를 사용하여 노래 구조 제어
유연한 스타일 제어: 성별, 음색, 장르, 감정, 악기, 템포에 대한 텍스트 설명으로 출력 가이드
오디오 프롬프팅: 참조 오디오 샘플(처음 10초)을 업로드하여 생성된 스타일에 영향 미치기
다중 출력 모드: 결합된 믹스, 순수 음악, 아카펠라 보컬, 또는 분리된 트랙 획득
다국어 기능: 영어, 중국어, 스페인어, 일본어 등으로 노래 생성
전문 품질 지표: 벤치마크에서 5.1% 음소 오류율을 달성하며 음악성 점수는 3.94/5

사용 사례

뮤지션과 프로듀서를 위해

가사를 작성하고 그것이 연주되는 것을 들음으로써 노래 아이디어를 빠르게 프로토타입하세요. 전체 프로덕션에 착수하기 전에 다양한 장르, 템포, 편곡을 테스트하세요. 분리된 트랙 출력을 사용하여 AI 생성 멜로디나 하모니를 추출하여 자신의 편곡에 사용하세요.

콘텐츠 크리에이터를 위해

비디오, 팟캐스트, 소셜 미디어 콘텐츠를 위한 독창적인 배경음악과 징글을 생성하세요. 비용이 많이 드는 스튜디오 세션이나 라이선싱료 없이 브랜드나 채널을 위한 커스텀 테마 곡을 만드세요.

게임 및 앱 개발자를 위해

특정 분위기와 장면에 맞춘 동적이고 독창적인 사운드트랙을 제작하세요. 프로젝트의 분위기에 완벽한 핏을 찾기 위해 여러 변형을 빠르게 생성하세요.

송라이터를 위해

당신의 가사가 생생해지는 것을 즉시 들으며 멜로디와 리듬을 평가하세요. 다양한 스타일과 편곡을 실험하여 새로운 창의적 방향을 발견하세요.

교육자 및 연구자를 위해

커스텀 교육 노래를 만들거나 AI와 음악 작곡의 교차점을 연구하세요. 다양한 가사 구조와 스타일 프롬프트가 생성된 출력에 어떤 영향을 미치는지 분석하세요.

입력 형식 지정하는 방법

가사 구조

당신의 가사는 다음 형식을 따라야 합니다:

[intro-short]

[verse]
Streetlights flicker in the night
I wander through familiar corners
Memories rush in like a tide

[chorus]
The warmth of memories still remains
But you are gone
My heart was filled with love

[outro-short]

각 섹션은 대괄호 안의 구조 라벨로 시작합니다. [intro-short], [inst-medium], [outro-long]과 같은 라벨은 악기만 사용됩니다(가사 필요 없음). [verse], [chorus], [bridge]와 같은 라벨은 가사 텍스트가 필요합니다.

스타일 설명

자연 언어 설명으로 음악 출력을 제어하세요:

female, dark, pop, sad, piano and drums, the bpm is 125

성별, 음색, 장르, 감정, 악기, 템포의 조합을 지정할 수 있습니다. 이 모델은 개방형 어휘를 지원하지만, 미리 정의된 태그가 더 일관된 결과를 제공합니다.

참조 오디오 사용

더욱 정확한 스타일 매칭을 위해 참조 오디오 클립을 업로드하세요. 이 모델은 처음 10초를 사용하여 장르, 악기, 리듬, 보컬 스타일을 학습합니다. 팁: 노래의 코러스를 참조로 사용하면 일반적으로 최고의 결과를 얻을 수 있습니다.

WaveSpeedAI에서 시작하기

WaveSpeedAI를 사용하면 즉시 노래 생성을 시작하기가 쉽습니다:

SongGeneration 모델 페이지를 방문하세요
입력 필드에 구조화된 가사를 입력하세요
선택적으로 스타일 설명을 추가하거나 참조 오디오를 업로드하세요
생성을 클릭하고 완성된 노래를 받으세요

WaveSpeedAI의 인프라를 통해 다음의 이점을 누릴 수 있습니다:

즉각적인 가용성: 콜드 스타트가 없어 생성이 즉시 시작됩니다
빠른 추론: 최적화된 인프라는 빠른 결과를 제공합니다
저렴한 가격: 투명한 요청당 가격으로 생성한 것에만 지불하세요
간단한 REST API: 응용 프로그램과 워크플로우에 노래 생성을 직접 통합하세요

기술 사양

기능	사양
최대 노래 길이	4분 30초
지원되는 언어	영어, 중국어, 스페인어, 일본어
출력 형식	결합된 믹스, 악기, 보컬, 분리된 트랙
입력 방법	구조화된 가사 + 텍스트 설명 또는 참조 오디오

결론

SongGeneration (LeVo)는 AI 음악 생성 분야에서 상당한 진전을 나타내며, 아이디어와 가사만 있으면 누구나 전문적 수준의 노래 작성을 할 수 있게 해줍니다. 새로운 사운드를 탐색하는 뮤지션이든, 독창적인 음악이 필요한 콘텐츠 크리에이터든, 차세대 창의적 도구를 구축하는 개발자든, 이 모델은 새로운 가능성을 열어줍니다.

구조화된 가사 입력, 유연한 스타일 제어, 멀티-트랙 출력 기능의 조합은 SongGeneration을 현재 이용 가능한 가장 다재다능한 텍스트-투-송 모델 중 하나로 만듭니다. 그리고 WaveSpeedAI의 빠르고 신뢰할 수 있는 추론 인프라를 사용하면 몇 초 안에 생성을 시작할 수 있습니다.

당신의 가사가 생생해지는 것을 들을 준비가 되었나요? 지금 바로 WaveSpeedAI에서 SongGeneration을 시도하세요하고 AI 기반 음악 생성의 미래를 경험하세요.

SongGeneration (LeVo) 소개: AI로 가사를 전문적인 노래로 변환하세요

SongGeneration (LeVo)란 무엇인가요?

주요 기능

사용 사례

뮤지션과 프로듀서를 위해

콘텐츠 크리에이터를 위해

게임 및 앱 개발자를 위해

송라이터를 위해

교육자 및 연구자를 위해

입력 형식 지정하는 방법

가사 구조

스타일 설명

참조 오디오 사용

WaveSpeedAI에서 시작하기

기술 사양

결론

관련 기사

WaveSpeedAI LTX 2 19b Image-to-Video, WaveSpeedAI에 출시

WaveSpeedAI LTX 2 19b Image-to-Video LoRA, WaveSpeedAI에 출시

WaveSpeedAI LTX 2 19b Text-to-Video LoRA, WaveSpeedAI에 출시

WaveSpeedAI LTX 2 19b, WaveSpeedAI에 출시

WaveSpeed Desktop: 최고의 데스크톱 AI 스튜디오 앱

2026년 최고의 AI 이미지 편집기: AI를 활용한 전문 사진 편집