2 个模型训练工具:训练您自己的 Wan 或 Flux LoRA 现已登陆WaveSpeedAI
2 Model Trainers Now Live on WaveSpeedAI:训练您自己的 Wan 或 Flux LoRA
我们很高兴地推出 Wan-Trainer 和 Flux-Dev-LoRA-Trainer — 2 个培训工具,可以使用您自己的数据集训练模型。
关于 Wan-Trainer
Wan 是由阿里巴巴开发的开源视频生成建模套件,支持多种任务,包括文本转视频、图像转视频、视频编辑、文本转图像和视频转音频。
通过 WaveSpeedAI 提供的 Wan-Trainer,您可以轻松上传自己的数据集,只需简单操作即可快速微调您自己的 Wan-LoRA 模型!Wan 支持的所有任务——从文本转视频——都可以直接在 WaveSpeedAI 上训练。

创建 Wan_3D_Pintr_Lora 示例:
- 视频数据集示例:视频数据集
- 数据集预处理:准备大约 10 个具有一致特征的视频片段,并将其压缩为 ZIP 文件。
- 时长:每个视频片段长度应约为 5 秒。
- 标注:Wavespeed 平台提供自动标记功能。
- 参数:
- learning_rate:模型学习的速率。较高的值可能会加快训练速度,但有过拟合的风险。
- trigger_phrase:激活模型生成图像的特定短语。
- number_of_steps:1000
- auto_scale_input:如果启用(true),输入视频将自动缩放为 81 帧,每秒 16 帧。
JSON 示例:
{
"learning_rate": 0.0002,
"trigger_phrase": "3d",
"number_of_steps": 1000,
"auto_scale_input": true,
"training_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1746773122258761405_gMU3b9hp.zip",
"model_id": "wavespeed-ai/wan-trainer"
}
关于 Flux-Dev-LoRA-Trainer
Flux Dev 是由 Black Forest Labs 开发的非商业开源版本的文本转图像模型。它在图像质量、细节表现和提示词复现方面表现出色。通过 WaveSpeedAI 提供的 Flux-Dev-LoRA-Trainer,您可以轻松上传自己的数据集,只需简单操作即可微调您自己的 Flux-Dev-LoRA 模型!

创建 FLUX_Style_Lora 示例:
- 图像数据集示例:图像数据集
- 数据集预处理:将所有相同风格的训练图像放在单个文件夹中。
- 分辨率:原始图像的分辨率最好为 1024×1024 或更高。如需要,可以稍后转换为 512×512。
- 宽高比:在 Flux.1 上训练时,可以使用 1:1 宽高比。可以添加其他宽高比以增加多样性。
- 清晰度:尽可能使用清晰、高质量的图像。
- 多样性:融入角度、光照条件和服装的变化,以提高模型的适应性。
- 参数:
- trigger_word:用于标题中的触发词。如果设置为 None,则不使用触发词。如果未提供标题,触发词将替换标题。如果标题存在,触发词将被忽略。
- create_masks:如果为 True,分割掩码应用于加权训练损失。对于人类主体,在可能的情况下优先使用面部掩码。
- steps:通常计算为(图像数量)× 100(例如,20 张图像 → 2000 步)。
- is_style:为 True 时,配置风格转移训练。这禁用分割和标题,使用触发词来定义风格。
- is_input_format_already_preprocessed:指示输入数据是否已预处理。默认值(False)假设原始输入且图像/标题文件名匹配(例如,photo.jpg 和 photo.txt)。对于预处理数据,设置为 True。
- data_archive_format:存档格式。如果未指定,则从 URL 推断。
JSON 示例:
{
"create_masks": false,
"images_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1747100030859337188_6Ddljsqo.zip",
"is_input_format_already_preprocessed": true,
"is_style": true,
"steps": 2000,
"trigger_word": "test",
"model_id": "wavespeed-ai/flux-dev-lora-trainer"
}
立即在 WaveSpeedAI 上尝试 Wan-Trainer 和 Flux-Dev-LoRA-Trainer
使用 Wan-Trainer 和 Flux-Dev-LoRA-Trainer 在 WaveSpeedAI 上微调您自己的 AI 模型 — 无需复杂设置。
无论是文本转视频、图像转视频,还是视频编辑,Wan-Trainer 都可以让您上传自己的数据并自定义强大的 Wan 模型,以满足您的创意目标。
通过 Flux-Dev-LoRA-Trainer,您可以轻松自定义 Flux-Dev 模型——该模型因其图像质量和提示词保真度而闻名——通过使用您自己的图像训练您自己的 LoRA。
无论您是在构建富有表现力的视频工作流还是定制化的图像生成器,WaveSpeedAI 都为您提供完全控制和快速结果。立即开始微调您的模型!
