← Блог

2 тренировщика моделей теперь доступны на WaveSpeedAI: обучите собственный Wan или Flux для LoRA

Мы рады представить Wan-Trainer и Flux-Dev-LoRA-Trainer — 2 инструмента обучения, которые позволяют тренировать модели на вашем собственном наборе данных.

3 min read
2 тренировщика моделей теперь доступны на WaveSpeedAI: обучите собственный Wan или Flux для LoRA

2 Тренера Моделей Уже Доступны на WaveSpeedAI: Обучите Собственную Wan или Flux для LoRA

Мы рады представить Wan-Trainer и Flux-Dev-LoRA-Trainer — 2 инструмента для обучения, которые позволяют тренировать модели на ваших собственных данных.

О Wan-Trainer

Wan — это набор инструментов для генерации видео с открытым исходным кодом, разработанный Alibaba, поддерживающий широкий спектр задач: Text-to-Video, Image-to-Video, редактирование видео, Text-to-Image и Video-to-Audio.

С помощью Wan-Trainer от WaveSpeedAI вы можете легко загрузить собственный датасет и быстро дообучить свою модель Wan-LoRA в несколько простых шагов! Все задачи, поддерживаемые Wan — от Text-to-Video — можно тренировать напрямую на WaveSpeedAI.

Wan-Trainer

Пример создания Wan_3D_Pintr_Lora:

  • Пример видеодатасета: Видеодатасет
  • Подготовка датасета: Подготовьте примерно 10 видеоклипов с общими характеристиками и упакуйте их в ZIP-архив.
  • Длительность: Каждый видеоклип должен быть примерно 5 секунд.
  • Аннотация: Платформа Wavespeed предоставляет функцию автоматической разметки.
  • Параметры:
    • learning_rate: Скорость обучения модели. Более высокие значения могут ускорить обучение, но увеличивают риск переобучения.
    • trigger_phrase: Специальная фраза, которая активирует модель для генерации изображения.
    • number_of_steps: 1000
    • auto_scale_input: Если включено (true), входное видео автоматически масштабируется до 81 кадра при 16 кадрах/с.

Пример JSON:

{
  "learning_rate": 0.0002,
  "trigger_phrase": "3d",
  "number_of_steps": 1000,
  "auto_scale_input": true,
  "training_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1746773122258761405_gMU3b9hp.zip",
  "model_id": "wavespeed-ai/wan-trainer"
}

О Flux-Dev-LoRA-Trainer

Flux Dev — это некоммерческая версия модели преобразования текста в изображение с открытым исходным кодом, разработанная Black Forest Labs. Она отличается высоким качеством изображений, детализацией и точным воспроизведением подсказок. С помощью Flux-Dev-LoRA-Trainer от WaveSpeedAI вы можете легко загрузить собственный датасет и дообучить свою модель Flux-Dev-LoRA в несколько простых шагов!

Flux-Dev-LoRA-Trainer

Пример создания FLUX_Style_Lora:

  • Пример датасета изображений: Датасет изображений
  • Подготовка датасета: Поместите все обучающие изображения одного стиля в одну папку.
  • Разрешение: Исходные изображения должны иметь разрешение 1024×1024 или выше. При необходимости их можно конвертировать в 512×512.
  • Соотношение сторон: При обучении на Flux.1 можно использовать соотношение 1:1. Для повышения разнообразия можно добавить дополнительные соотношения сторон.
  • Качество: По возможности используйте чёткие высококачественные изображения.
  • Разнообразие: Включайте вариации углов съёмки, условий освещения и образов для улучшения адаптивности модели.
  • Параметры:
    • trigger_word: Триггерное слово для использования в подписях. Если установлено None, триггерное слово не используется. Если подписи не предоставлены, триггерное слово заменяет их. Если подписи существуют, триггерное слово игнорируется.
    • create_masks: Если True, маски сегментации применяются для взвешивания потерь при обучении. Для людей приоритет отдаётся маскам лица, когда это возможно.
    • steps: Обычно рассчитывается как (количество изображений) × 100 (например, 20 изображений → 2000 шагов).
    • is_style: Если True, настраивает обучение для переноса стиля. Это отключает сегментацию и создание подписей, используя триггерное слово для определения стиля.
    • is_input_format_already_preprocessed: Указывает, предварительно обработаны ли входные данные. По умолчанию (False) предполагается необработанный ввод с совпадающими именами файлов изображений и подписей (например, photo.jpg и photo.txt). Установите True для предварительно обработанных данных.
    • data_archive_format: Формат архива. Если не указан, определяется из URL.

Пример JSON:

{
  "create_masks": false,
  "images_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1747100030859337188_6Ddljsqo.zip",
  "is_input_format_already_preprocessed": true,
  "is_style": true,
  "steps": 2000,
  "trigger_word": "test",
  "model_id": "wavespeed-ai/flux-dev-lora-trainer"
}

Попробуйте Wan-Trainer и Flux-Dev-LoRA-Trainer на WaveSpeedAI Прямо Сейчас

Дообучайте собственные AI-модели с помощью Wan-Trainer и Flux-Dev-LoRA-Trainer на WaveSpeedAI — без сложной настройки.

Будь то Text-to-Video, Image-to-Video или даже редактирование видео, Wan-Trainer позволяет загрузить собственные данные и адаптировать мощную модель Wan под ваши творческие цели.

С Flux-Dev-LoRA-Trainer вы можете легко настроить модель Flux-Dev — известную своим качеством изображений и точностью следования подсказкам — обучив собственную LoRA на своих изображениях.

Создаёте ли вы выразительные видеорабочие процессы или специализированные генераторы изображений, WaveSpeedAI даёт вам полный контроль и быстрые результаты. Начните дообучать свои модели уже сегодня!

Поделиться