WaveSpeedAIで2つのモデルトレーナーが利用可能に: 独自のWanまたはFluxをLoRA用にトレーニング

The translation is complete. Here’s the Japanese version of the article:

WaveSpeedAI で 2 つのモデルトレーナーがライブ：あなた独自の Wan または Flux for LoRA をトレーニング

Wan-Trainer と Flux-Dev-LoRA-Trainer の 2 つのトレーニングツールをご紹介します。これらのツールは独自のデータセットでモデルをトレーニングできます。

Wan-Trainer について

Wan は Alibaba によって開発されたオープンソースビデオ生成モデリングスイートで、Text-to-Video、Image-to-Video、ビデオ編集、Text-to-Image、Video-to-Audio など、様々なタスクをサポートしています。

WaveSpeedAI が提供する Wan-Trainer を使用すれば、独自のデータセットを簡単にアップロードし、シンプルな操作で独自の Wan-LoRA モデルを素早くファインチューニングできます！Wan がサポートしているすべてのタスク（Text-to-Video など）は、WaveSpeedAI で直接トレーニングできます。

Wan-Trainer

Wan_3D_Pintr_Lora 例の作成：

ビデオデータセット例：ビデオデータセット
データセット前処理：同じ特性を持つビデオクリップを約 10 本準備し、ZIP ファイルに圧縮します。
期間：各ビデオクリップは約 5 秒の長さである必要があります。
アノテーション：Wavespeed プラットフォームは自動タグ機能を提供しています。
パラメータ：
- learning_rate：モデルが学習する速度。値が高いほどトレーニングが加速する可能性がありますが、過学習のリスクがあります。
- trigger_phrase：モデルに画像を生成させるよう指示する特定のフレーズ。
- number_of_steps：1000
- auto_scale_input：有効（true）にすると、入力ビデオは自動的に 16fps で 81 フレームにスケーリングされます。

JSON 例：

{
  "learning_rate": 0.0002,
  "trigger_phrase": "3d",
  "number_of_steps": 1000,
  "auto_scale_input": true,
  "training_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1746773122258761405_gMU3b9hp.zip",
  "model_id": "wavespeed-ai/wan-trainer"
}

Flux-Dev-LoRA-Trainer について

Flux Dev は Black Forest Labs によって開発されたテキスト画像生成モデルの非商用オープンソース版です。画像品質、詳細なパフォーマンス、キューワード再現性に優れています。 WaveSpeedAI が提供する Flux-Dev-LoRA-Trainer を使用すれば、独自のデータセットを簡単にアップロードし、シンプルな操作で独自の Flux-Dev-LoRA モデルをファインチューニングできます！

Flux-Dev-LoRA-Trainer

FLUX_Style_Lora 例の作成：

画像データセット例：画像データセット
データセット前処理：同じスタイルのすべてのトレーニング画像を 1 つのフォルダに配置します。
解像度：元の画像は理想的には 1024×1024 以上の解像度を持つべきです。必要に応じて、後で 512×512 に変換できます。
アスペクト比：Flux.1 でトレーニングする場合、1:1 のアスペクト比を使用できます。多様性を向上させるため、追加のアスペクト比を追加することもできます。
クラリティ：可能な限りクリアで高品質な画像を使用してください。
多様性：角度、照明条件、衣装のバリエーションを組み込み、モデルの適応性を向上させます。
パラメータ：
- trigger_word：キャプションで使用するトリガーワード。None に設定されている場合、トリガーワードは使用されません。キャプションが提供されていない場合、トリガーワードがキャプションを置き換えます。キャプションが存在する場合、トリガーワードは無視されます。
- create_masks：True の場合、セグメンテーションマスクがトレーニング損失の重み付けに適用されます。人間のサブジェクトの場合、可能であれば顔マスクが優先されます。
- steps：通常は（画像数）× 100 で計算されます（例：20 画像 → 2000 ステップ）。
- is_style：True の場合、スタイル転送のトレーニングが設定されます。これはセグメンテーションとキャプション機能を無効にし、トリガーワードを使用してスタイルを定義します。
- is_input_format_already_preprocessed：入力データが前処理されているかどうかを示します。デフォルト（False）は、一致する画像/キャプション名（photo.jpg と photo.txt など）を持つ生の入力を想定しています。前処理されたデータの場合は True に設定します。
- data_archive_format：アーカイブ形式。指定されていない場合は、URL から推測されます。

JSON 例：

{
  "create_masks": false,
  "images_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1747100030859337188_6Ddljsqo.zip",
  "is_input_format_already_preprocessed": true,
  "is_style": true,
  "steps": 2000,
  "trigger_word": "test",
  "model_id": "wavespeed-ai/flux-dev-lora-trainer"
}