2 тренировщика моделей теперь доступны на WaveSpeedAI: обучите собственный Wan или Flux для LoRA

2 Тренера Моделей Уже Доступны на WaveSpeedAI: Обучите Собственную Wan или Flux для LoRA

Мы рады представить Wan-Trainer и Flux-Dev-LoRA-Trainer — 2 инструмента для обучения, которые позволяют тренировать модели на ваших собственных данных.

О Wan-Trainer

Wan — это набор инструментов для генерации видео с открытым исходным кодом, разработанный Alibaba, поддерживающий широкий спектр задач: Text-to-Video, Image-to-Video, редактирование видео, Text-to-Image и Video-to-Audio.

С помощью Wan-Trainer от WaveSpeedAI вы можете легко загрузить собственный датасет и быстро дообучить свою модель Wan-LoRA в несколько простых шагов! Все задачи, поддерживаемые Wan — от Text-to-Video — можно тренировать напрямую на WaveSpeedAI.

Wan-Trainer

Пример создания Wan_3D_Pintr_Lora:

Подготовка датасета: Подготовьте примерно 10 видеоклипов с общими характеристиками и упакуйте их в ZIP-архив.
Длительность: Каждый видеоклип должен быть примерно 5 секунд.
Аннотация: Платформа Wavespeed предоставляет функцию автоматической разметки.
Параметры:
- learning_rate: Скорость обучения модели. Более высокие значения могут ускорить обучение, но увеличивают риск переобучения.
- trigger_phrase: Специальная фраза, которая активирует модель для генерации изображения.
- number_of_steps: 1000
- auto_scale_input: Если включено (true), входное видео автоматически масштабируется до 81 кадра при 16 кадрах/с.

Пример JSON:

{
  "learning_rate": 0.0002,
  "trigger_phrase": "3d",
  "number_of_steps": 1000,
  "auto_scale_input": true,
  "training_data_url": "https://example.com/video-training-dataset.zip",
  "model_id": "wavespeed-ai/wan-trainer"
}

О Flux-Dev-LoRA-Trainer

Flux Dev — это некоммерческая версия модели преобразования текста в изображение с открытым исходным кодом, разработанная Black Forest Labs. Она отличается высоким качеством изображений, детализацией и точным воспроизведением подсказок. С помощью Flux-Dev-LoRA-Trainer от WaveSpeedAI вы можете легко загрузить собственный датасет и дообучить свою модель Flux-Dev-LoRA в несколько простых шагов!

Flux-Dev-LoRA-Trainer

Пример создания FLUX_Style_Lora:

Подготовка датасета: Поместите все обучающие изображения одного стиля в одну папку.
Разрешение: Исходные изображения должны иметь разрешение 1024×1024 или выше. При необходимости их можно конвертировать в 512×512.
Соотношение сторон: При обучении на Flux.1 можно использовать соотношение 1:1. Для повышения разнообразия можно добавить дополнительные соотношения сторон.
Качество: По возможности используйте чёткие высококачественные изображения.
Разнообразие: Включайте вариации углов съёмки, условий освещения и образов для улучшения адаптивности модели.
Параметры:
- trigger_word: Триггерное слово для использования в подписях. Если установлено None, триггерное слово не используется. Если подписи не предоставлены, триггерное слово заменяет их. Если подписи существуют, триггерное слово игнорируется.
- create_masks: Если True, маски сегментации применяются для взвешивания потерь при обучении. Для людей приоритет отдаётся маскам лица, когда это возможно.
- steps: Обычно рассчитывается как (количество изображений) × 100 (например, 20 изображений → 2000 шагов).
- is_style: Если True, настраивает обучение для переноса стиля. Это отключает сегментацию и создание подписей, используя триггерное слово для определения стиля.
- is_input_format_already_preprocessed: Указывает, предварительно обработаны ли входные данные. По умолчанию (False) предполагается необработанный ввод с совпадающими именами файлов изображений и подписей (например, photo.jpg и photo.txt). Установите True для предварительно обработанных данных.
- data_archive_format: Формат архива. Если не указан, определяется из URL.

Пример JSON:

{
  "create_masks": false,
  "images_data_url": "https://example.com/image-training-dataset.zip",
  "is_input_format_already_preprocessed": true,
  "is_style": true,
  "steps": 2000,
  "trigger_word": "test",
  "model_id": "wavespeed-ai/flux-dev-lora-trainer"
}

Попробуйте Wan-Trainer и Flux-Dev-LoRA-Trainer на WaveSpeedAI Прямо Сейчас

Дообучайте собственные AI-модели с помощью Wan-Trainer и Flux-Dev-LoRA-Trainer на WaveSpeedAI — без сложной настройки.

Будь то Text-to-Video, Image-to-Video или даже редактирование видео, Wan-Trainer позволяет загрузить собственные данные и адаптировать мощную модель Wan под ваши творческие цели.

С Flux-Dev-LoRA-Trainer вы можете легко настроить модель Flux-Dev — известную своим качеством изображений и точностью следования подсказкам — обучив собственную LoRA на своих изображениях.

Создаёте ли вы выразительные видеорабочие процессы или специализированные генераторы изображений, WaveSpeedAI даёт вам полный контроль и быстрые результаты. Начните дообучать свои модели уже сегодня!

2 Тренера Моделей Уже Доступны на WaveSpeedAI: Обучите Собственную Wan или Flux для LoRA

О Wan-Trainer

Пример создания Wan_3D_Pintr_Lora:

О Flux-Dev-LoRA-Trainer

Пример создания FLUX_Style_Lora:

Попробуйте Wan-Trainer и Flux-Dev-LoRA-Trainer на WaveSpeedAI Прямо Сейчас

Похожие статьи

Reve 2.0: Модель изображений 4K с приоритетом компоновки, бросающая вызов GPT Image 2 и Nano Banana

Gemini Omni Flash vs Seedance 2.0 vs Kling 3.0: лучшая мультимодальная модель видеогенерации

GPT Image 2 vs FLUX 2 vs Imagen 4: Какой API изображений выбрать разработчикам в 2026 году?

Kling 3.0 Omni объяснён: мультикадровый сторибординг, встроенное аудио и в чём он превосходит Veo

Технический разбор Seedance 2.0: почему генерация аудио и видео становится стандартом

Agnes-Video-V2.0 появляется за $0.30/мин: разрушитель цен в рейтинге Artificial Analysis