2 Entrenadores de Modelos Ahora en Vivo en WaveSpeedAI: Entrena tu Propio Wan o Flux para LoRA
2 Entrenadores de Modelos Ahora en Vivo en WaveSpeedAI: Entrena tu Propio Wan o Flux para LoRA
Nos complace presentar el Wan-Trainer y Flux-Dev-LoRA-Trainer — 2 herramientas de entrenamiento que pueden entrenar modelos con tu propio conjunto de datos.
Acerca de Wan-Trainer
Wan es un conjunto de modelado de generación de videos de código abierto desarrollado por Alibaba que admite una variedad de tareas, incluyendo Texto-a-Video, Imagen-a-Video, Edición de Video, Texto-a-Imagen y Video-a-Audio.
Con Wan-Trainer proporcionado por WaveSpeedAI, ¡puedes cargar fácilmente tu propio conjunto de datos y ajustar rápidamente tu propio modelo Wan-LoRA en una operación simple! Todas las tareas admitidas por Wan — desde Texto-a-Video — se pueden entrenar directamente en WaveSpeedAI.

Creando un Ejemplo Wan_3D_Pintr_Lora:
- Ejemplo de Conjunto de Datos de Video: Conjunto de Datos de Video
- Preprocesamiento de Datos: Prepara aproximadamente 10 clips de video con características consistentes y comprimelos en un archivo ZIP.
- Duración: Cada clip de video debe tener aproximadamente 5 segundos de duración.
- Anotación: La plataforma Wavespeed proporciona una funcionalidad de etiquetado automático.
- Parámetros:
- learning_rate: La velocidad a la que el modelo aprende. Los valores más altos pueden acelerar el entrenamiento pero riesgan el sobreajuste.
- trigger_phrase: Una frase específica que activa el modelo para generar una imagen.
- number_of_steps: 1000
- auto_scale_input: Si está habilitado (true), el video de entrada se escalará automáticamente a 81 fotogramas a 16fps.
Ejemplo JSON:
{
"learning_rate": 0.0002,
"trigger_phrase": "3d",
"number_of_steps": 1000,
"auto_scale_input": true,
"training_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1746773122258761405_gMU3b9hp.zip",
"model_id": "wavespeed-ai/wan-trainer"
}
Acerca de Flux-Dev-LoRA-Trainer
Flux Dev es una versión de código abierto no comercial del modelo de texto a imagen desarrollado por Black Forest Labs. Destaca por su calidad de imagen, rendimiento de detalle y reproducción de palabras clave. Con Flux-Dev-LoRA-Trainer proporcionado por WaveSpeedAI, ¡puedes cargar fácilmente tu propio conjunto de datos y ajustar tu propio modelo Flux-Dev-LoRA en una operación simple!

Creando un Ejemplo FLUX_Style_Lora:
- Ejemplo de Conjunto de Datos de Imagen: Conjunto de Datos de Imagen
- Preprocesamiento de Datos: Coloca todas las imágenes de entrenamiento del mismo estilo en una única carpeta.
- Resolución: Las imágenes originales idealmente deberían tener una resolución de 1024×1024 o superior. Pueden convertirse a 512×512 más tarde si es necesario.
- Relación de Aspecto: Al entrenar en Flux.1, se puede utilizar una relación de aspecto 1:1. Se pueden agregar relaciones de aspecto adicionales para mejorar la diversidad.
- Claridad: Usa imágenes claras y de alta calidad siempre que sea posible.
- Diversidad: Incorpora variaciones en ángulos, condiciones de iluminación y atuendos para mejorar la adaptabilidad del modelo.
- Parámetros:
- trigger_word: Palabra desencadenante a utilizar en los títulos. Si se establece en None, no se usará ninguna palabra desencadenante. Si no se proporcionan títulos, la palabra desencadenante reemplazará los títulos. Si existen títulos, se ignora la palabra desencadenante.
- create_masks: Si es True, se aplican máscaras de segmentación para ponderar la pérdida de entrenamiento. Para sujetos humanos, se priorizan las máscaras faciales cuando es posible.
- steps: Típicamente calculado como (número de imágenes) × 100 (por ejemplo, 20 imágenes → 2000 pasos).
- is_style: Cuando es True, configura el entrenamiento para transferencia de estilo. Esto desactiva la segmentación y los títulos, utilizando la palabra desencadenante para definir el estilo.
- is_input_format_already_preprocessed: Indica si los datos de entrada están preprocesados. Por defecto (False) asume entrada sin procesar con nombres de archivo de imagen/título coincidentes (por ejemplo, photo.jpg y photo.txt). Establece en True para datos preprocesados.
- data_archive_format: Formato de archivo. Si no se especifica, se deduce de la URL.
Ejemplo JSON:
{
"create_masks": false,
"images_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1747100030859337188_6Ddljsqo.zip",
"is_input_format_already_preprocessed": true,
"is_style": true,
"steps": 2000,
"trigger_word": "test",
"model_id": "wavespeed-ai/flux-dev-lora-trainer"
}
Prueba Wan-Trainer y Flux-Dev-LoRA-Trainer Ahora en WaveSpeedAI
Ajusta tus propios modelos de IA con Wan-Trainer y Flux-Dev-LoRA-Trainer en WaveSpeedAI — sin configuración compleja requerida.
Ya sea Texto-a-Video, Imagen-a-Video o incluso Edición de Video, Wan-Trainer te permite cargar tus propios datos y personalizar el poderoso modelo Wan para que se ajuste a tus objetivos creativos.
Con Flux-Dev-LoRA-Trainer, puedes personalizar fácilmente el modelo Flux-Dev—reconocido por su calidad de imagen y fidelidad de indicaciones—entrenando tu propio LoRA usando tus propias imágenes.
Ya sea que estés construyendo flujos de trabajo de video expresivos o generadores de imágenes personalizados, WaveSpeedAI te da control total y resultados rápidos. ¡Comienza a ajustar tus modelos hoy!





