2 Entrenadores de Modelos Ahora en Vivo en WaveSpeedAI: Entrena tu Propio Wan o Flux para LoRA

Nos complace presentar el Wan-Trainer y Flux-Dev-LoRA-Trainer — 2 herramientas de entrenamiento que pueden entrenar modelos con tu propio conjunto de datos.

Acerca de Wan-Trainer

Wan es un conjunto de modelado de generación de videos de código abierto desarrollado por Alibaba que admite una variedad de tareas, incluyendo Texto-a-Video, Imagen-a-Video, Edición de Video, Texto-a-Imagen y Video-a-Audio.

Con Wan-Trainer proporcionado por WaveSpeedAI, ¡puedes cargar fácilmente tu propio conjunto de datos y ajustar rápidamente tu propio modelo Wan-LoRA en una operación simple! Todas las tareas admitidas por Wan — desde Texto-a-Video — se pueden entrenar directamente en WaveSpeedAI.

Wan-Trainer

Creando un Ejemplo Wan_3D_Pintr_Lora:

Ejemplo de Conjunto de Datos de Video: Conjunto de Datos de Video
Preprocesamiento de Datos: Prepara aproximadamente 10 clips de video con características consistentes y comprimelos en un archivo ZIP.
Duración: Cada clip de video debe tener aproximadamente 5 segundos de duración.
Anotación: La plataforma Wavespeed proporciona una funcionalidad de etiquetado automático.
Parámetros:
- learning_rate: La velocidad a la que el modelo aprende. Los valores más altos pueden acelerar el entrenamiento pero riesgan el sobreajuste.
- trigger_phrase: Una frase específica que activa el modelo para generar una imagen.
- number_of_steps: 1000
- auto_scale_input: Si está habilitado (true), el video de entrada se escalará automáticamente a 81 fotogramas a 16fps.

Ejemplo JSON:

{
  "learning_rate": 0.0002,
  "trigger_phrase": "3d",
  "number_of_steps": 1000,
  "auto_scale_input": true,
  "training_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1746773122258761405_gMU3b9hp.zip",
  "model_id": "wavespeed-ai/wan-trainer"
}

Acerca de Flux-Dev-LoRA-Trainer

Flux Dev es una versión de código abierto no comercial del modelo de texto a imagen desarrollado por Black Forest Labs. Destaca por su calidad de imagen, rendimiento de detalle y reproducción de palabras clave. Con Flux-Dev-LoRA-Trainer proporcionado por WaveSpeedAI, ¡puedes cargar fácilmente tu propio conjunto de datos y ajustar tu propio modelo Flux-Dev-LoRA en una operación simple!

Flux-Dev-LoRA-Trainer

Creando un Ejemplo FLUX_Style_Lora:

Ejemplo de Conjunto de Datos de Imagen: Conjunto de Datos de Imagen
Preprocesamiento de Datos: Coloca todas las imágenes de entrenamiento del mismo estilo en una única carpeta.
Resolución: Las imágenes originales idealmente deberían tener una resolución de 1024×1024 o superior. Pueden convertirse a 512×512 más tarde si es necesario.
Relación de Aspecto: Al entrenar en Flux.1, se puede utilizar una relación de aspecto 1:1. Se pueden agregar relaciones de aspecto adicionales para mejorar la diversidad.
Claridad: Usa imágenes claras y de alta calidad siempre que sea posible.
Diversidad: Incorpora variaciones en ángulos, condiciones de iluminación y atuendos para mejorar la adaptabilidad del modelo.
Parámetros:
- trigger_word: Palabra desencadenante a utilizar en los títulos. Si se establece en None, no se usará ninguna palabra desencadenante. Si no se proporcionan títulos, la palabra desencadenante reemplazará los títulos. Si existen títulos, se ignora la palabra desencadenante.
- create_masks: Si es True, se aplican máscaras de segmentación para ponderar la pérdida de entrenamiento. Para sujetos humanos, se priorizan las máscaras faciales cuando es posible.
- steps: Típicamente calculado como (número de imágenes) × 100 (por ejemplo, 20 imágenes → 2000 pasos).
- is_style: Cuando es True, configura el entrenamiento para transferencia de estilo. Esto desactiva la segmentación y los títulos, utilizando la palabra desencadenante para definir el estilo.
- is_input_format_already_preprocessed: Indica si los datos de entrada están preprocesados. Por defecto (False) asume entrada sin procesar con nombres de archivo de imagen/título coincidentes (por ejemplo, photo.jpg y photo.txt). Establece en True para datos preprocesados.
- data_archive_format: Formato de archivo. Si no se especifica, se deduce de la URL.

Ejemplo JSON:

{
  "create_masks": false,
  "images_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1747100030859337188_6Ddljsqo.zip",
  "is_input_format_already_preprocessed": true,
  "is_style": true,
  "steps": 2000,
  "trigger_word": "test",
  "model_id": "wavespeed-ai/flux-dev-lora-trainer"
}

Prueba Wan-Trainer y Flux-Dev-LoRA-Trainer Ahora en WaveSpeedAI

Ajusta tus propios modelos de IA con Wan-Trainer y Flux-Dev-LoRA-Trainer en WaveSpeedAI — sin configuración compleja requerida.

Ya sea Texto-a-Video, Imagen-a-Video o incluso Edición de Video, Wan-Trainer te permite cargar tus propios datos y personalizar el poderoso modelo Wan para que se ajuste a tus objetivos creativos.

Con Flux-Dev-LoRA-Trainer, puedes personalizar fácilmente el modelo Flux-Dev—reconocido por su calidad de imagen y fidelidad de indicaciones—entrenando tu propio LoRA usando tus propias imágenes.

Ya sea que estés construyendo flujos de trabajo de video expresivos o generadores de imágenes personalizados, WaveSpeedAI te da control total y resultados rápidos. ¡Comienza a ajustar tus modelos hoy!

2 Entrenadores de Modelos Ahora en Vivo en WaveSpeedAI: Entrena tu Propio Wan o Flux para LoRA

Acerca de Wan-Trainer

Creando un Ejemplo Wan_3D_Pintr_Lora:

Acerca de Flux-Dev-LoRA-Trainer

Creando un Ejemplo FLUX_Style_Lora:

Prueba Wan-Trainer y Flux-Dev-LoRA-Trainer Ahora en WaveSpeedAI

Artículos relacionados

Seedance 2.0 Próximamente: El Modelo de Video de Próxima Generación de ByteDance con Audio Nativo

Guía Completa de Seedance 2.0: Creación de Vídeo Multimodal

Seedance 2.0 vs Kling 3.0 vs Sora 2 vs Veo 3.1: La Comparación Definitiva de Generación de Video

Seedream 5.0 vs Nano Banana Pro vs GPT Image 1.5 vs Flux Klein vs Qwen Image: Comparación Completa

Guía Completa de Seedream 5.0-Preview: Generación Inteligente de Imágenes

Revisión de Vidu Q3: Cómo se compara con Sora 2, Wan 2.6, Seedance 1.5, Veo 3.1 y Grok Imagine Video