2 Model Trainer jetzt live auf WaveSpeedAI: Trainiere dein eigenes Wan oder Flux für LoRA

2 Model Trainer jetzt live auf WaveSpeedAI: Trainiere dein eigenes Wan oder Flux für LoRA

2 Model Trainer sind jetzt auf WaveSpeedAI verfügbar: Trainieren Sie Ihre eigenen Wan- oder Flux-Modelle für LoRA

Wir freuen uns, den Wan-Trainer und Flux-Dev-LoRA-Trainer vorzustellen — 2 Trainingstools, mit denen Sie Modelle mit Ihrem eigenen Datensatz trainieren können.

Über den Wan-Trainer

Wan ist eine Open-Source-Videogenerations-Modellsuite von Alibaba, die eine Vielzahl von Aufgaben unterstützt, darunter Text-to-Video, Image-to-Video, Video-Bearbeitung, Text-to-Image und Video-to-Audio.

Mit dem von WaveSpeedAI bereitgestellten Wan-Trainer können Sie ganz einfach Ihren eigenen Datensatz hochladen und schnell Ihr eigenes Wan-LoRA-Modell mit nur wenigen Schritten fine-tunen! Alle von Wan unterstützten Aufgaben — von Text-to-Video bis zu Video Editing — können direkt auf WaveSpeedAI trainiert werden.

Wan-Trainer

Erstellen eines Wan_3D_Pintr_Lora Beispiels:

  • Video-Datensatz-Beispiel: Video-Datensatz
  • Datensatz-Vorverarbeitung: Bereiten Sie ungefähr 10 Videoclips mit konsistenten Merkmalen vor und komprimieren Sie diese in eine ZIP-Datei.
  • Dauer: Jeder Videoclip sollte ungefähr 5 Sekunden lang sein.
  • Anmerkung: Die Wavespeed-Plattform bietet eine automatische Tagging-Funktionalität.
  • Parameter:
    • learning_rate: Die Rate, mit der das Modell lernt. Höhere Werte können das Training beschleunigen, riskieren aber Überanpassung.
    • trigger_phrase: Ein spezifischer Satz, der das Modell aktiviert, um ein Bild zu generieren.
    • number_of_steps: 1000
    • auto_scale_input: Wenn aktiviert (true), wird das Eingabevideo automatisch auf 81 Frames bei 16fps skaliert.

JSON-Beispiel:

{
  "learning_rate": 0.0002,
  "trigger_phrase": "3d",
  "number_of_steps": 1000,
  "auto_scale_input": true,
  "training_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1746773122258761405_gMU3b9hp.zip",
  "model_id": "wavespeed-ai/wan-trainer"
}

Über den Flux-Dev-LoRA-Trainer

Flux Dev ist eine nicht-kommerzielle Open-Source-Version des Text-to-Image-Modells von Black Forest Labs. Es zeichnet sich durch Bildqualität, Detailleistung und Stichwortreproduktion aus. Mit dem von WaveSpeedAI bereitgestellten Flux-Dev-LoRA-Trainer können Sie ganz einfach Ihren eigenen Datensatz hochladen und Ihr eigenes Flux-Dev-LoRA-Modell mit nur wenigen Schritten fine-tunen!

Flux-Dev-LoRA-Trainer

Erstellen eines FLUX_Style_Lora Beispiels:

  • Bild-Datensatz-Beispiel: Bild-Datensatz
  • Datensatz-Vorverarbeitung: Platzieren Sie alle Trainingsbilder desselben Stils in einem einzigen Ordner.
  • Auflösung: Originalbilder sollten idealerweise eine Auflösung von 1024×1024 oder höher haben. Sie können bei Bedarf später in 512×512 konvertiert werden.
  • Seitenverhältnis: Beim Training mit Flux.1 kann ein 1:1-Seitenverhältnis verwendet werden. Zusätzliche Seitenverhältnisse können zur Verbesserung der Vielfalt hinzugefügt werden.
  • Klarheit: Verwenden Sie nach Möglichkeit klare, hochwertige Bilder.
  • Vielfalt: Beziehen Sie Variationen in Winkeln, Lichtverhältnissen und Kleidung ein, um die Modellportabilität zu verbessern.
  • Parameter:
    • trigger_word: Triggerwort, das in Überschriften verwendet werden soll. Falls auf None gesetzt, wird kein Triggerwort verwendet. Wenn keine Überschriften vorhanden sind, ersetzt das Triggerwort die Überschriften. Falls Überschriften vorhanden sind, wird das Triggerwort ignoriert.
    • create_masks: Falls True, werden Segmentierungsmasken angewendet, um die Trainingsausfallgewichtung zu beeinflussen. Bei menschlichen Subjekten werden Gesichtsmasken, wenn möglich, bevorzugt.
    • steps: Normalerweise berechnet als (Anzahl der Bilder) × 100 (z. B. 20 Bilder → 2000 Schritte).
    • is_style: Falls True, konfiguriert das Training für Stilübertragung. Dies deaktiviert Segmentierung und Untertitelung und verwendet das Triggerwort zur Definition des Stils.
    • is_input_format_already_preprocessed: Gibt an, ob Eingabedaten vorverarbeitet sind. Standard (False) geht von rohem Input mit übereinstimmenden Bild-/Unterschriften-Dateinamen aus (z. B. photo.jpg und photo.txt). Setzen Sie auf True für vorverarbeitete Daten.
    • data_archive_format: Archivformat. Falls nicht angegeben, wird es aus der URL abgeleitet.

JSON-Beispiel:

{
  "create_masks": false,
  "images_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1747100030859337188_6Ddljsqo.zip",
  "is_input_format_already_preprocessed": true,
  "is_style": true,
  "steps": 2000,
  "trigger_word": "test",
  "model_id": "wavespeed-ai/flux-dev-lora-trainer"
}

Testen Sie Wan-Trainer und Flux-Dev-LoRA-Trainer jetzt auf WaveSpeedAI

Fine-tunen Sie Ihre eigenen KI-Modelle mit Wan-Trainer und Flux-Dev-LoRA-Trainer auf WaveSpeedAI — ohne komplizierte Einrichtung.

Ob Text-to-Video, Image-to-Video oder sogar Video-Bearbeitung, mit Wan-Trainer können Sie Ihre eigenen Daten hochladen und das leistungsstarke Wan-Modell an Ihre kreativen Ziele anpassen.

Mit Flux-Dev-LoRA-Trainer können Sie das Flux-Dev-Modell — bekannt für seine Bildqualität und Prompt-Genauigkeit — ganz einfach anpassen, indem Sie mit Ihren eigenen Bildern Ihre eigene LoRA trainieren.

Ob Sie ausdrucksstarke Video-Workflows oder maßgeschneiderte Bildgeneratoren aufbauen, WaveSpeedAI gibt Ihnen die volle Kontrolle und schnelle Ergebnisse. Beginnen Sie heute mit dem Fine-Tuning Ihrer Modelle!