2 Treinadores de Modelo Agora Disponíveis na WaveSpeedAI: Treine Seu Próprio Wan ou Flux para LoRA

2 Treinadores de Modelos Agora Disponíveis no WaveSpeedAI: Treine Seu Próprio Wan ou Flux para LoRA

Estamos entusiasmados em apresentar o Wan-Trainer e o Flux-Dev-LoRA-Trainer — 2 ferramentas de treinamento que podem treinar modelos com seu próprio conjunto de dados.

Sobre o Wan-Trainer

Wan é um conjunto de modelagem de geração de vídeo de código aberto desenvolvido pela Alibaba que suporta uma variedade de tarefas, incluindo Texto-para-Vídeo, Imagem-para-Vídeo, Edição de Vídeo, Texto-para-Imagem e Vídeo-para-Áudio.

Com o Wan-Trainer fornecido pelo WaveSpeedAI, você pode facilmente fazer upload de seu próprio conjunto de dados e ajustar rapidamente seu próprio modelo Wan-LoRA em uma operação simples! Todas as tarefas suportadas pelo Wan — desde Texto-para-Vídeo — podem ser treinadas diretamente no WaveSpeedAI.

Wan-Trainer

Criando um Exemplo Wan_3D_Pintr_Lora:

Exemplo de Conjunto de Dados de Vídeo: Conjunto de Dados de Vídeo
Pré-processamento de Dados: Prepare aproximadamente 10 clipes de vídeo com características consistentes e compacte-os em um arquivo ZIP.
Duração: Cada clipe de vídeo deve ter aproximadamente 5 segundos de duração.
Anotação: A plataforma Wavespeed oferece uma funcionalidade de marcação automática.
Parâmetros:
- learning_rate: A taxa em que o modelo aprende. Valores mais altos podem acelerar o treinamento, mas correm o risco de sobreajuste.
- trigger_phrase: Uma frase específica que ativa o modelo para gerar uma imagem.
- number_of_steps: 1000
- auto_scale_input: Se ativado (true), o vídeo de entrada será automaticamente dimensionado para 81 quadros a 16fps.

Exemplo JSON:

{
  "learning_rate": 0.0002,
  "trigger_phrase": "3d",
  "number_of_steps": 1000,
  "auto_scale_input": true,
  "training_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1746773122258761405_gMU3b9hp.zip",
  "model_id": "wavespeed-ai/wan-trainer"
}

Sobre o Flux-Dev-LoRA-Trainer

Flux Dev é uma versão de código aberto não comercial do modelo texto-para-imagem desenvolvido pela Black Forest Labs. Destaca-se em qualidade de imagem, desempenho de detalhes e reprodução de palavras-chave. Com o Flux-Dev-LoRA-Trainer fornecido pelo WaveSpeedAI, você pode facilmente fazer upload de seu próprio conjunto de dados e ajustar seu próprio modelo Flux-Dev-LoRA em uma operação simples!

Flux-Dev-LoRA-Trainer

Criando um Exemplo FLUX_Style_Lora:

Exemplo de Conjunto de Dados de Imagem: Conjunto de Dados de Imagem
Pré-processamento de Dados: Coloque todas as imagens de treinamento do mesmo estilo em uma única pasta.
Resolução: As imagens originais devem idealmente ter uma resolução de 1024×1024 ou superior. Elas podem ser convertidas para 512×512 posteriormente, se necessário.
Taxa de Aspecto: Ao treinar no Flux.1, uma proporção de aspecto de 1:1 pode ser usada. Proporções de aspecto adicionais podem ser adicionadas para aumentar a diversidade.
Clareza: Use imagens claras e de alta qualidade sempre que possível.
Diversidade: Incorpore variações em ângulos, condições de iluminação e roupas para melhorar a adaptabilidade do modelo.
Parâmetros:
- trigger_word: Palavra acionadora a ser usada em legendas. Se definido como None, nenhuma palavra acionadora será usada. Se as legendas não forem fornecidas, a palavra acionadora substituirá as legendas. Se as legendas existirem, a palavra acionadora será ignorada.
- create_masks: Se True, máscaras de segmentação são aplicadas para ponderar a perda de treinamento. Para sujeitos humanos, máscaras faciais são priorizadas quando possível.
- steps: Tipicamente calculado como (número de imagens) × 100 (por exemplo, 20 imagens → 2000 passos).
- is_style: Quando True, configura o treinamento para transferência de estilo. Isso desativa segmentação e legendagem, usando a palavra acionadora para definir o estilo.
- is_input_format_already_preprocessed: Indica se os dados de entrada são pré-processados. O padrão (False) assume entrada bruta com nomes de arquivo de imagem/legenda correspondentes (por exemplo, photo.jpg e photo.txt). Defina como True para dados pré-processados.
- data_archive_format: Formato do arquivo. Se não especificado, é inferido da URL.

Exemplo JSON:

{
  "create_masks": false,
  "images_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1747100030859337188_6Ddljsqo.zip",
  "is_input_format_already_preprocessed": true,
  "is_style": true,
  "steps": 2000,
  "trigger_word": "test",
  "model_id": "wavespeed-ai/flux-dev-lora-trainer"
}

Teste Wan-Trainer e Flux-Dev-LoRA-Trainer Agora no WaveSpeedAI

Ajuste seu próprio modelo de IA com Wan-Trainer e Flux-Dev-LoRA-Trainer no WaveSpeedAI — sem configuração complexa necessária.

Seja Texto-para-Vídeo, Imagem-para-Vídeo, ou até mesmo Edição de Vídeo, o Wan-Trainer permite que você faça upload de seus próprios dados e customize o poderoso modelo Wan para se adequar aos seus objetivos criativos.

Com o Flux-Dev-LoRA-Trainer, você pode facilmente customizar o modelo Flux-Dev — conhecido pela sua qualidade de imagem e fidelidade de prompt — treinando seu próprio LoRA usando suas próprias imagens.

Quer você esteja construindo fluxos de trabalho de vídeo expressivos ou geradores de imagens personalizados, o WaveSpeedAI oferece controle total e resultados rápidos. Comece a ajustar seus modelos hoje!

2 Treinadores de Modelos Agora Disponíveis no WaveSpeedAI: Treine Seu Próprio Wan ou Flux para LoRA

Sobre o Wan-Trainer

Criando um Exemplo Wan_3D_Pintr_Lora:

Sobre o Flux-Dev-LoRA-Trainer

Criando um Exemplo FLUX_Style_Lora:

Teste Wan-Trainer e Flux-Dev-LoRA-Trainer Agora no WaveSpeedAI

Artigos relacionados

Seedance 2.0 em Breve: Modelo de Vídeo de Próxima Geração do ByteDance com Áudio Nativo

Guia Completo do Seedance 2.0: Criação de Vídeo Multimodal

Seedance 2.0 vs Kling 3.0 vs Sora 2 vs Veo 3.1: A Comparação Definitiva de Geração de Vídeos

Guia Completo do Seedream 5.0-Preview: Geração Inteligente de Imagens

Seedream 5.0 vs Nano Banana Pro vs GPT Image 1.5 vs Flux Klein vs Qwen Image: Comparação Completa

Análise do Vidu Q3: Como se Compara ao Sora 2, Wan 2.6, Seedance 1.5, Veo 3.1 e Grok Imagine Video