WaveSpeedAI에서 2가지 모델 트레이너 출시: Wan 또는 Flux를 LoRA로 직접 학습시키세요

WaveSpeedAI에서 2개의 모델 트레이너 출시: 자신의 Wan 또는 Flux를 LoRA로 트레이닝하세요

WaveSpeedAI의 Wan-Trainer와 Flux-Dev-LoRA-Trainer — 2가지 트레이닝 도구를 소개하게 되어 기쁩니다. 이 도구들은 자신의 데이터셋으로 모델을 트레이닝할 수 있습니다.

Wan-Trainer에 대하여

Wan은 알리바바에서 개발한 오픈소스 비디오 생성 모델링 스위트로, Text-to-Video, Image-to-Video, 비디오 편집, Text-to-Image, Video-to-Audio를 포함한 다양한 작업을 지원합니다.

WaveSpeedAI에서 제공하는 Wan-Trainer를 사용하면 자신의 데이터셋을 쉽게 업로드하고 간단한 작업으로 자신의 Wan-LoRA 모델을 빠르게 미세 조정할 수 있습니다! Wan이 지원하는 모든 작업 — Text-to-Video부터 시작하여 — WaveSpeedAI에서 직접 트레이닝할 수 있습니다.

Wan-Trainer

Wan_3D_Pintr_Lora 예제 만들기:

비디오 데이터셋 예제: 비디오 데이터셋
데이터셋 전처리: 일관된 특징을 가진 약 10개의 비디오 클립을 준비하고 ZIP 파일로 압축합니다.
지속 시간: 각 비디오 클립은 약 5초 길이여야 합니다.
주석: Wavespeed 플랫폼은 자동 태깅 기능을 제공합니다.
매개변수:
- learning_rate: 모델이 학습하는 속도입니다. 더 높은 값은 트레이닝을 가속화할 수 있지만 과적합의 위험이 있습니다.
- trigger_phrase: 모델이 이미지를 생성하도록 활성화하는 특정 구문입니다.
- number_of_steps: 1000
- auto_scale_input: 활성화(true)되면 입력 비디오가 자동으로 16fps의 81프레임으로 스케일링됩니다.

json 예제:

{
  "learning_rate": 0.0002,
  "trigger_phrase": "3d",
  "number_of_steps": 1000,
  "auto_scale_input": true,
  "training_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1746773122258761405_gMU3b9hp.zip",
  "model_id": "wavespeed-ai/wan-trainer"
}

Flux-Dev-LoRA-Trainer에 대하여

Flux Dev는 Black Forest Labs에서 개발한 텍스트-이미지 모델의 비상용 오픈소스 버전입니다. 이미지 품질, 디테일 성능, 큐 단어 재현에 뛰어납니다. WaveSpeedAI에서 제공하는 Flux-Dev-LoRA-Trainer를 사용하면 자신의 데이터셋을 쉽게 업로드하고 간단한 작업으로 자신의 Flux-Dev-LoRA 모델을 미세 조정할 수 있습니다!

Flux-Dev-LoRA-Trainer

FLUX_Style_Lora 예제 만들기:

이미지 데이터셋 예제: 이미지 데이터셋
데이터셋 전처리: 같은 스타일의 모든 트레이닝 이미지를 하나의 폴더에 배치합니다.
해상도: 원본 이미지는 이상적으로 1024×1024 이상의 해상도를 가져야 합니다. 필요한 경우 나중에 512×512로 변환할 수 있습니다.
종횡비: Flux.1에서 트레이닝할 때 1:1 종횡비를 사용할 수 있습니다. 다양성을 향상하기 위해 추가 종횡비가 추가될 수 있습니다.
선명도: 가능한 한 명확하고 고품질의 이미지를 사용하세요.
다양성: 모델 적응성을 개선하기 위해 각도, 조명 조건, 의류의 변화를 포함시키세요.
매개변수:
- trigger_word: 캡션에서 사용할 트리거 단어입니다. None으로 설정하면 트리거 단어가 사용되지 않습니다. 캡션이 제공되지 않으면 트리거 단어가 캡션을 대체합니다. 캡션이 있으면 트리거 단어는 무시됩니다.
- create_masks: True이면 세분화 마스크가 트레이닝 손실에 가중치를 적용합니다. 인물 피사체의 경우 가능하면 얼굴 마스크가 우선시됩니다.
- steps: 일반적으로 (이미지 수) × 100으로 계산됩니다(예: 20개 이미지 → 2000 단계).
- is_style: True일 때 스타일 전송에 대한 트레이닝을 구성합니다. 이는 세분화 및 캡셔닝을 비활성화하고 트리거 단어를 사용하여 스타일을 정의합니다.
- is_input_format_already_preprocessed: 입력 데이터가 전처리되었는지 여부를 나타냅니다. 기본값(False)은 일치하는 이미지/캡션 파일명(예: photo.jpg 및 photo.txt)을 가진 원본 입력을 가정합니다. 전처리된 데이터의 경우 True로 설정하세요.
- data_archive_format: 아카이브 형식입니다. 지정되지 않으면 URL에서 유추됩니다.

json 예제:

{
  "create_masks": false,
  "images_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1747100030859337188_6Ddljsqo.zip",
  "is_input_format_already_preprocessed": true,
  "is_style": true,
  "steps": 2000,
  "trigger_word": "test",
  "model_id": "wavespeed-ai/flux-dev-lora-trainer"
}

지금 WaveSpeedAI에서 Wan-Trainer와 Flux-Dev-LoRA-Trainer를 사용해보세요

WaveSpeedAI에서 Wan-Trainer와 Flux-Dev-LoRA-Trainer로 자신의 AI 모델을 미세 조정하세요 — 복잡한 설정이 필요 없습니다.

Text-to-Video, Image-to-Video, 또는 심지어 비디오 편집이든 상관없이, Wan-Trainer는 자신의 데이터를 업로드하고 강력한 Wan 모델을 사용자의 창의적인 목표에 맞게 사용자화할 수 있게 해줍니다.

Flux-Dev-LoRA-Trainer를 사용하면 이미지 품질과 프롬프트 충실도로 유명한 Flux-Dev 모델을 자신의 이미지를 사용하여 자신의 LoRA를 트레이닝함으로써 쉽게 사용자화할 수 있습니다.

표현적인 비디오 워크플로우를 구축하든 맞춤형 이미지 생성기를 만들든, WaveSpeedAI는 완전한 제어와 빠른 결과를 제공합니다. 지금 모델 미세 조정을 시작하세요!

WaveSpeedAI에서 2개의 모델 트레이너 출시: 자신의 Wan 또는 Flux를 LoRA로 트레이닝하세요

Wan-Trainer에 대하여

Wan_3D_Pintr_Lora 예제 만들기:

Flux-Dev-LoRA-Trainer에 대하여

FLUX_Style_Lora 예제 만들기:

지금 WaveSpeedAI에서 Wan-Trainer와 Flux-Dev-LoRA-Trainer를 사용해보세요

관련 기사

Seedance 2.0, WaveSpeedAI에 출시 예정: 네이티브 오디오가 포함된 ByteDance의 차세대 비디오 모델

Seedance 2.0 완벽 가이드: 멀티모달 비디오 생성

Seedance 2.0 vs Kling 3.0 vs Sora 2 vs Veo 3.1: 최고의 비디오 생성 비교

Seedream 5.0-Preview 완벽 가이드: 지능형 이미지 생성

Seedream 5.0 vs Nano Banana Pro vs GPT Image 1.5 vs Flux Klein vs Qwen Image: 완벽한 비교

Vidu Q3 리뷰: Sora 2, Wan 2.6, Seedance 1.5, Veo 3.1, Grok Imagine Video와의 비교