2 个模型训练工具：训练您自己的 Wan 或 Flux LoRA 现已登陆WaveSpeedAI

2 Model Trainers Now Live on WaveSpeedAI：训练您自己的 Wan 或 Flux LoRA

我们很高兴地推出 Wan-Trainer 和 Flux-Dev-LoRA-Trainer — 2 个培训工具，可以使用您自己的数据集训练模型。

关于 Wan-Trainer

Wan 是由阿里巴巴开发的开源视频生成建模套件，支持多种任务，包括文本转视频、图像转视频、视频编辑、文本转图像和视频转音频。

通过 WaveSpeedAI 提供的 Wan-Trainer，您可以轻松上传自己的数据集，只需简单操作即可快速微调您自己的 Wan-LoRA 模型！Wan 支持的所有任务——从文本转视频——都可以直接在 WaveSpeedAI 上训练。

Wan-Trainer

创建 Wan_3D_Pintr_Lora 示例：

视频数据集示例：视频数据集
数据集预处理：准备大约 10 个具有一致特征的视频片段，并将其压缩为 ZIP 文件。
时长：每个视频片段长度应约为 5 秒。
标注：Wavespeed 平台提供自动标记功能。
参数：
- learning_rate：模型学习的速率。较高的值可能会加快训练速度，但有过拟合的风险。
- trigger_phrase：激活模型生成图像的特定短语。
- number_of_steps：1000
- auto_scale_input：如果启用（true），输入视频将自动缩放为 81 帧，每秒 16 帧。

JSON 示例：

{
  "learning_rate": 0.0002,
  "trigger_phrase": "3d",
  "number_of_steps": 1000,
  "auto_scale_input": true,
  "training_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1746773122258761405_gMU3b9hp.zip",
  "model_id": "wavespeed-ai/wan-trainer"
}

关于 Flux-Dev-LoRA-Trainer

Flux Dev 是由 Black Forest Labs 开发的非商业开源版本的文本转图像模型。它在图像质量、细节表现和提示词复现方面表现出色。通过 WaveSpeedAI 提供的 Flux-Dev-LoRA-Trainer，您可以轻松上传自己的数据集，只需简单操作即可微调您自己的 Flux-Dev-LoRA 模型！

Flux-Dev-LoRA-Trainer

创建 FLUX_Style_Lora 示例：

图像数据集示例：图像数据集
数据集预处理：将所有相同风格的训练图像放在单个文件夹中。
分辨率：原始图像的分辨率最好为 1024×1024 或更高。如需要，可以稍后转换为 512×512。
宽高比：在 Flux.1 上训练时，可以使用 1:1 宽高比。可以添加其他宽高比以增加多样性。
清晰度：尽可能使用清晰、高质量的图像。
多样性：融入角度、光照条件和服装的变化，以提高模型的适应性。
参数：
- trigger_word：用于标题中的触发词。如果设置为 None，则不使用触发词。如果未提供标题，触发词将替换标题。如果标题存在，触发词将被忽略。
- create_masks：如果为 True，分割掩码应用于加权训练损失。对于人类主体，在可能的情况下优先使用面部掩码。
- steps：通常计算为（图像数量）× 100（例如，20 张图像 → 2000 步）。
- is_style：为 True 时，配置风格转移训练。这禁用分割和标题，使用触发词来定义风格。
- is_input_format_already_preprocessed：指示输入数据是否已预处理。默认值（False）假设原始输入且图像/标题文件名匹配（例如，photo.jpg 和 photo.txt）。对于预处理数据，设置为 True。
- data_archive_format：存档格式。如果未指定，则从 URL 推断。

JSON 示例：

{
  "create_masks": false,
  "images_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1747100030859337188_6Ddljsqo.zip",
  "is_input_format_already_preprocessed": true,
  "is_style": true,
  "steps": 2000,
  "trigger_word": "test",
  "model_id": "wavespeed-ai/flux-dev-lora-trainer"
}