WaveSpeedAI에서 Magi-1 출시: 오픈소스 비디오 생성의 새로운 기준

WaveSpeedAI에서 Magi-1 출시: 오픈소스 비디오 생성의 새로운 기준

WaveSpeedAI에서 라이브된 Magi-1: 오픈소스 비디오 생성의 새로운 기준

Sand AI의 획기적인 오픈소스 비디오 생성 모델 Magi-1이 이제 WaveSpeedAI에서 실시간 추론 및 API 배포를 위해 이용 가능합니다.

이 높은 평가를 받은 출시는 비디오 생성의 경계를 확장하며, 최첨단의 모션 품질, 시간적 일관성, 시각적 충실도를 결합하여 독점 시스템에 대한 강력한 오픈소스 대안을 제공합니다.

Magi-1이란?

Magi-1은 텍스트 프롬프트에서 사실적이고 일관성 있는 비디오를 생성하도록 구축된 대규모 확산 기반 비디오 생성 모델입니다. 높은 해상도에서 최대 4초까지의 프레임 길이를 지원합니다. Sand AI에 의해 개발되고 오픈 라이선스 하에 출시된 이 모델은 선도적인 폐쇄형 모델과 동등하거나 이를 초과하는 성능으로 비디오 합성을 민주화하는 것을 목표로 합니다.

훈련 전략은 마스킹된 비디오 모델링, 공간-시간 일관성 학습, 멀티모달 정렬을 혼합하여 시간에 따른 신원, 구조, 장면 로직 유지에 특히 강합니다.

주요 기능

확산 비디오 생성

확산 확률 모델 제거에 기반하여 구축된 Magi-1은 노이즈 벡터 시퀀스를 점진적으로 사진 현실적 모션으로 정제하여 비디오를 생성합니다. 이 방법은 모션 역학 및 프레임 일관성에 대한 뛰어난 제어를 가능하게 합니다.

고품질, 시간적으로 일관된 모션

일반적인 단기 시퀀스 모델(예: 2초)과 달리 Magi-1은 일관된 캐릭터 신원, 배경, 작용 흐름을 유지하면서 최대 64프레임(약 4초)의 비디오를 생성합니다.

강력한 시각적 및 구조적 충실도

이 모델은 세부 장면 렌더링, 미세 텍스처 캡처, 객체 상호작용, 현실적인 인체 자세에서 우수합니다.

멀티모달 조건부

Magi-1은 공간 및 시간 차원 전반에 걸친 정렬을 포함한 텍스트-비디오(T2V) 생성을 지원하여 프롬프트 기반 비디오 생성을 더욱 정확하고 신뢰할 수 있게 합니다.

광범위한 벤치마크 테스트

공개 평가에서 Magi-1은 FVD(Fréchet Video Distance), 인간 선호도, 신원 일관성 같은 주요 지표에서 테스트된 모든 오픈소스 모델을 능가했습니다. 아래 벤치마크 표를 참조하세요.

벤치마크 비교 (공식 테스트 기준)

모델FVD ↓ (16f)FVD ↓ (64f)CLIP-S ↑인간 선호도 ↑
Magi-1190.5274.80.32142.1%
Stable Video Diffusion (SVD)307.9489.20.31321.4%
Gen-2 (Runway)208.4300.60.31736.5%
Pika-LLaVA310.3498.70.30718.6%

참고: FVD가 낮을수록 좋습니다. CLIP-S와 선호도 점수가 높을수록 높은 충실도와 사용자 만족도를 나타냅니다.

사용 사례

생성 도구, 창의적인 플랫폼 또는 실험적 미디어를 구축하고 있든 Magi-1은 다음을 가능하게 합니다:

  • 영화적 비디오 생성: 설득력 있는 모션, 장면 역학, 캐릭터 일관성으로 짧은 클립을 생성합니다.
  • AI 강화 콘텐츠: 간단한 프롬프트에서 트레일러, 컨셉 시각 또는 제품 애니메이션을 생성합니다.
  • 생성 앱에서 프로토타이핑: Magi-1을 크리에이터 도구, 게임 및 AIGC 워크플로우에 통합하여 빠른 시각적 아이디어를 얻습니다.
  • 연구 및 벤치마킹: 다운스트림 모델을 개발하거나 오픈소스 프레임워크를 비교하는 연구자를 위한 강력한 기준선입니다.

WaveSpeedAI에서 Magi-1 체험하기

Magi-1은 이제 WaveSpeedAI의 추론 엔진에 완전히 통합되어 UI 또는 API를 통한 반응형 비디오 생성에 최적화되어 있습니다.

WaveSpeedAI에서 Magi-1 체험하기

Magi-1의 출시는 오픈소스 비디오 영역에서 큰 진전입니다. 고충실도, 모션 일관성 비디오 생성이 더 이상 독점 벽 뒤에 갇혀 있지 않음을 보여줍니다.

WaveSpeedAI는 우리 플랫폼에서 이 이정표를 출시하게 된 것을 자랑스러워하며, 차세대 생성 비디오를 전 세계 크리에이터, 연구자 및 개발자 커뮤니티에 가져오는 것을 돕고 있습니다.