2 Treinadores de Modelo Agora Disponíveis na WaveSpeedAI: Treine Seu Próprio Wan ou Flux para LoRA

2 Treinadores de Modelo Agora Disponíveis na WaveSpeedAI: Treine Seu Próprio Wan ou Flux para LoRA

2 Treinadores de Modelos Agora Disponíveis no WaveSpeedAI: Treine Seu Próprio Wan ou Flux para LoRA

Estamos entusiasmados em apresentar o Wan-Trainer e o Flux-Dev-LoRA-Trainer — 2 ferramentas de treinamento que podem treinar modelos com seu próprio conjunto de dados.

Sobre o Wan-Trainer

Wan é um conjunto de modelagem de geração de vídeo de código aberto desenvolvido pela Alibaba que suporta uma variedade de tarefas, incluindo Texto-para-Vídeo, Imagem-para-Vídeo, Edição de Vídeo, Texto-para-Imagem e Vídeo-para-Áudio.

Com o Wan-Trainer fornecido pelo WaveSpeedAI, você pode facilmente fazer upload de seu próprio conjunto de dados e ajustar rapidamente seu próprio modelo Wan-LoRA em uma operação simples! Todas as tarefas suportadas pelo Wan — desde Texto-para-Vídeo — podem ser treinadas diretamente no WaveSpeedAI.

Wan-Trainer

Criando um Exemplo Wan_3D_Pintr_Lora:

  • Exemplo de Conjunto de Dados de Vídeo: Conjunto de Dados de Vídeo
  • Pré-processamento de Dados: Prepare aproximadamente 10 clipes de vídeo com características consistentes e compacte-os em um arquivo ZIP.
  • Duração: Cada clipe de vídeo deve ter aproximadamente 5 segundos de duração.
  • Anotação: A plataforma Wavespeed oferece uma funcionalidade de marcação automática.
  • Parâmetros:
    • learning_rate: A taxa em que o modelo aprende. Valores mais altos podem acelerar o treinamento, mas correm o risco de sobreajuste.
    • trigger_phrase: Uma frase específica que ativa o modelo para gerar uma imagem.
    • number_of_steps: 1000
    • auto_scale_input: Se ativado (true), o vídeo de entrada será automaticamente dimensionado para 81 quadros a 16fps.

Exemplo JSON:

{
  "learning_rate": 0.0002,
  "trigger_phrase": "3d",
  "number_of_steps": 1000,
  "auto_scale_input": true,
  "training_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1746773122258761405_gMU3b9hp.zip",
  "model_id": "wavespeed-ai/wan-trainer"
}

Sobre o Flux-Dev-LoRA-Trainer

Flux Dev é uma versão de código aberto não comercial do modelo texto-para-imagem desenvolvido pela Black Forest Labs. Destaca-se em qualidade de imagem, desempenho de detalhes e reprodução de palavras-chave. Com o Flux-Dev-LoRA-Trainer fornecido pelo WaveSpeedAI, você pode facilmente fazer upload de seu próprio conjunto de dados e ajustar seu próprio modelo Flux-Dev-LoRA em uma operação simples!

Flux-Dev-LoRA-Trainer

Criando um Exemplo FLUX_Style_Lora:

  • Exemplo de Conjunto de Dados de Imagem: Conjunto de Dados de Imagem
  • Pré-processamento de Dados: Coloque todas as imagens de treinamento do mesmo estilo em uma única pasta.
  • Resolução: As imagens originais devem idealmente ter uma resolução de 1024×1024 ou superior. Elas podem ser convertidas para 512×512 posteriormente, se necessário.
  • Taxa de Aspecto: Ao treinar no Flux.1, uma proporção de aspecto de 1:1 pode ser usada. Proporções de aspecto adicionais podem ser adicionadas para aumentar a diversidade.
  • Clareza: Use imagens claras e de alta qualidade sempre que possível.
  • Diversidade: Incorpore variações em ângulos, condições de iluminação e roupas para melhorar a adaptabilidade do modelo.
  • Parâmetros:
    • trigger_word: Palavra acionadora a ser usada em legendas. Se definido como None, nenhuma palavra acionadora será usada. Se as legendas não forem fornecidas, a palavra acionadora substituirá as legendas. Se as legendas existirem, a palavra acionadora será ignorada.
    • create_masks: Se True, máscaras de segmentação são aplicadas para ponderar a perda de treinamento. Para sujeitos humanos, máscaras faciais são priorizadas quando possível.
    • steps: Tipicamente calculado como (número de imagens) × 100 (por exemplo, 20 imagens → 2000 passos).
    • is_style: Quando True, configura o treinamento para transferência de estilo. Isso desativa segmentação e legendagem, usando a palavra acionadora para definir o estilo.
    • is_input_format_already_preprocessed: Indica se os dados de entrada são pré-processados. O padrão (False) assume entrada bruta com nomes de arquivo de imagem/legenda correspondentes (por exemplo, photo.jpg e photo.txt). Defina como True para dados pré-processados.
    • data_archive_format: Formato do arquivo. Se não especificado, é inferido da URL.

Exemplo JSON:

{
  "create_masks": false,
  "images_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1747100030859337188_6Ddljsqo.zip",
  "is_input_format_already_preprocessed": true,
  "is_style": true,
  "steps": 2000,
  "trigger_word": "test",
  "model_id": "wavespeed-ai/flux-dev-lora-trainer"
}

Teste Wan-Trainer e Flux-Dev-LoRA-Trainer Agora no WaveSpeedAI

Ajuste seu próprio modelo de IA com Wan-Trainer e Flux-Dev-LoRA-Trainer no WaveSpeedAI — sem configuração complexa necessária.

Seja Texto-para-Vídeo, Imagem-para-Vídeo, ou até mesmo Edição de Vídeo, o Wan-Trainer permite que você faça upload de seus próprios dados e customize o poderoso modelo Wan para se adequar aos seus objetivos criativos.

Com o Flux-Dev-LoRA-Trainer, você pode facilmente customizar o modelo Flux-Dev — conhecido pela sua qualidade de imagem e fidelidade de prompt — treinando seu próprio LoRA usando suas próprias imagens.

Quer você esteja construindo fluxos de trabalho de vídeo expressivos ou geradores de imagens personalizados, o WaveSpeedAI oferece controle total e resultados rápidos. Comece a ajustar seus modelos hoje!