2 個模型訓練器现已登陆WaveSpeedAI

2 個模型訓練器现已登陆WaveSpeedAI

2 個模型訓練器現已在 WaveSpeedAI 上線:訓練您自己的 Wan 或 Flux LoRA

我們很榮幸推出 Wan-Trainer 和 Flux-Dev-LoRA-Trainer — 2 個可以使用您自己的數據集訓練模型的訓練工具。

關於 Wan-Trainer

Wan 是由阿里巴巴開發的開源視頻生成建模套件,支持多種任務,包括文本生成視頻、圖像生成視頻、視頻編輯、文本生成圖像和視頻生成音頻。

WaveSpeedAI 提供的 Wan-Trainer 讓您可以輕鬆上傳自己的數據集,並通過簡單操作快速微調自己的 Wan-LoRA 模型!Wan 支持的所有任務 — 從文本生成視頻 — 都可以直接在 WaveSpeedAI 上進行訓練。

Wan-Trainer

創建 Wan_3D_Pintr_Lora 示例:

  • 視頻數據集示例:視頻數據集
  • 數據集預處理:準備大約 10 個具有一致特徵的視頻片段,並將其壓縮為 ZIP 文件。
  • 時長:每個視頻片段的長度應約為 5 秒。
  • 標註:Wavespeed 平台提供自動標籤功能。
  • 參數:
    • learning_rate:模型學習的速率。較高的值可能會加快訓練但有過度擬合的風險。
    • trigger_phrase:激活模型生成圖像的特定短語。
    • number_of_steps:1000
    • auto_scale_input:如果啟用 (true),輸入視頻將自動縮放為 81 幀,幀率為 16fps。

json 示例:

{
  "learning_rate": 0.0002,
  "trigger_phrase": "3d",
  "number_of_steps": 1000,
  "auto_scale_input": true,
  "training_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1746773122258761405_gMU3b9hp.zip",
  "model_id": "wavespeed-ai/wan-trainer"
}

關於 Flux-Dev-LoRA-Trainer

Flux Dev 是由 Black Forest Labs 開發的非商業開源文本生成圖像模型。它在圖像質量、細節表現和提示詞重現方面表現出色。 WaveSpeedAI 提供的 Flux-Dev-LoRA-Trainer 讓您可以輕鬆上傳自己的數據集,並通過簡單操作微調自己的 Flux-Dev-LoRA 模型!

Flux-Dev-LoRA-Trainer

創建 FLUX_Style_Lora 示例:

  • 圖像數據集示例:圖像數據集
  • 數據集預處理:將所有相同風格的訓練圖像放在同一文件夾中。
  • 解析度:原始圖像理想情況下應具有 1024×1024 或更高的解析度。如需要,後續可轉換為 512×512。
  • 寬高比:在 Flux.1 上訓練時,可以使用 1:1 寬高比。可以添加其他寬高比以增強多樣性。
  • 清晰度:儘可能使用清晰、高質量的圖像。
  • 多樣性:加入角度、光照條件和服裝的變化,以提高模型的適應性。
  • 參數:
    • trigger_word:要在標題中使用的觸發詞。如果設為 None,則不使用觸發詞。如果未提供標題,觸發詞將替換標題。如果存在標題,觸發詞將被忽略。
    • create_masks:如果為 True,分割遮罩應用於訓練損失加權。對於人類主體,優先使用面部遮罩(如可能)。
    • steps:通常計算為 (圖像數量) × 100 (例如,20 張圖像 → 2000 步)。
    • is_style:為 True 時,配置風格轉移訓練。這禁用分割和標題功能,使用觸發詞來定義風格。
    • is_input_format_already_preprocessed:指示輸入數據是否已預處理。默認值 (False) 假設原始輸入,圖像/標題文件名匹配 (例如 photo.jpg 和 photo.txt)。對於預處理數據,設為 True。
    • data_archive_format:檔案格式。如果未指定,將從 URL 推斷。

json 示例:

{
  "create_masks": false,
  "images_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1747100030859337188_6Ddljsqo.zip",
  "is_input_format_already_preprocessed": true,
  "is_style": true,
  "steps": 2000,
  "trigger_word": "test",
  "model_id": "wavespeed-ai/flux-dev-lora-trainer"
}

立即在 WaveSpeedAI 上嘗試 Wan-Trainer 和 Flux-Dev-LoRA-Trainer

在 WaveSpeedAI 上使用 Wan-TrainerFlux-Dev-LoRA-Trainer 微調您自己的 AI 模型 — 無需複雜設置。

無論是文本生成視頻、圖像生成視頻,還是視頻編輯,Wan-Trainer 都讓您可以上傳自己的數據,並自定義強大的 Wan 模型以符合您的創意目標。

使用 Flux-Dev-LoRA-Trainer,您可以輕鬆自定義 Flux-Dev 模型 — 因其圖像質量和提示詞保真度而聞名 — 通過使用自己的圖像訓練自己的 LoRA。

無論您是在構建富有表現力的視頻工作流程還是定製的圖像生成器,WaveSpeedAI 都為您提供完全的控制權和快速的結果。立即開始微調您的模型!