WaveSpeedAIで2つのモデルトレーナーが利用可能に: 独自のWanまたはFluxをLoRA用にトレーニング

WaveSpeedAIで2つのモデルトレーナーが利用可能に: 独自のWanまたはFluxをLoRA用にトレーニング

The translation is complete. Here’s the Japanese version of the article:


WaveSpeedAI で 2 つのモデルトレーナーがライブ:あなた独自の Wan または Flux for LoRA をトレーニング

Wan-Trainer と Flux-Dev-LoRA-Trainer の 2 つのトレーニングツールをご紹介します。これらのツールは独自のデータセットでモデルをトレーニングできます。

Wan-Trainer について

Wan は Alibaba によって開発されたオープンソースビデオ生成モデリングスイートで、Text-to-Video、Image-to-Video、ビデオ編集、Text-to-Image、Video-to-Audio など、様々なタスクをサポートしています。

WaveSpeedAI が提供する Wan-Trainer を使用すれば、独自のデータセットを簡単にアップロードし、シンプルな操作で独自の Wan-LoRA モデルを素早くファインチューニングできます!Wan がサポートしているすべてのタスク(Text-to-Video など)は、WaveSpeedAI で直接トレーニングできます。

Wan-Trainer

Wan_3D_Pintr_Lora 例の作成:

  • ビデオデータセット例:ビデオデータセット
  • データセット前処理:同じ特性を持つビデオクリップを約 10 本準備し、ZIP ファイルに圧縮します。
  • 期間:各ビデオクリップは約 5 秒の長さである必要があります。
  • アノテーション:Wavespeed プラットフォームは自動タグ機能を提供しています。
  • パラメータ:
    • learning_rate:モデルが学習する速度。値が高いほどトレーニングが加速する可能性がありますが、過学習のリスクがあります。
    • trigger_phrase:モデルに画像を生成させるよう指示する特定のフレーズ。
    • number_of_steps:1000
    • auto_scale_input:有効(true)にすると、入力ビデオは自動的に 16fps で 81 フレームにスケーリングされます。

JSON 例:

{
  "learning_rate": 0.0002,
  "trigger_phrase": "3d",
  "number_of_steps": 1000,
  "auto_scale_input": true,
  "training_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1746773122258761405_gMU3b9hp.zip",
  "model_id": "wavespeed-ai/wan-trainer"
}

Flux-Dev-LoRA-Trainer について

Flux Dev は Black Forest Labs によって開発されたテキスト画像生成モデルの非商用オープンソース版です。画像品質、詳細なパフォーマンス、キューワード再現性に優れています。 WaveSpeedAI が提供する Flux-Dev-LoRA-Trainer を使用すれば、独自のデータセットを簡単にアップロードし、シンプルな操作で独自の Flux-Dev-LoRA モデルをファインチューニングできます!

Flux-Dev-LoRA-Trainer

FLUX_Style_Lora 例の作成:

  • 画像データセット例:画像データセット
  • データセット前処理:同じスタイルのすべてのトレーニング画像を 1 つのフォルダに配置します。
  • 解像度:元の画像は理想的には 1024×1024 以上の解像度を持つべきです。必要に応じて、後で 512×512 に変換できます。
  • アスペクト比:Flux.1 でトレーニングする場合、1:1 のアスペクト比を使用できます。多様性を向上させるため、追加のアスペクト比を追加することもできます。
  • クラリティ:可能な限りクリアで高品質な画像を使用してください。
  • 多様性:角度、照明条件、衣装のバリエーションを組み込み、モデルの適応性を向上させます。
  • パラメータ:
    • trigger_word:キャプションで使用するトリガーワード。None に設定されている場合、トリガーワードは使用されません。キャプションが提供されていない場合、トリガーワードがキャプションを置き換えます。キャプションが存在する場合、トリガーワードは無視されます。
    • create_masks:True の場合、セグメンテーションマスクがトレーニング損失の重み付けに適用されます。人間のサブジェクトの場合、可能であれば顔マスクが優先されます。
    • steps:通常は(画像数)× 100 で計算されます(例:20 画像 → 2000 ステップ)。
    • is_style:True の場合、スタイル転送のトレーニングが設定されます。これはセグメンテーションとキャプション機能を無効にし、トリガーワードを使用してスタイルを定義します。
    • is_input_format_already_preprocessed:入力データが前処理されているかどうかを示します。デフォルト(False)は、一致する画像/キャプション名(photo.jpg と photo.txt など)を持つ生の入力を想定しています。前処理されたデータの場合は True に設定します。
    • data_archive_format:アーカイブ形式。指定されていない場合は、URL から推測されます。

JSON 例:

{
  "create_masks": false,
  "images_data_url": "https://d32s1zkpjdc4b1.cloudfront.net/media/8cb24be7c94d472cb7895e1499bd0ae7/archives/1747100030859337188_6Ddljsqo.zip",
  "is_input_format_already_preprocessed": true,
  "is_style": true,
  "steps": 2000,
  "trigger_word": "test",
  "model_id": "wavespeed-ai/flux-dev-lora-trainer"
}

WaveSpeedAI で Wan-Trainer と Flux-Dev-LoRA-Trainer を試す

Wan-TrainerFlux-Dev-LoRA-Trainer を使用して WaveSpeedAI で独自の AI モデルをファインチューニングします。複雑なセットアップは不要です。

Text-to-Video、Image-to-Video、さらにはビデオ編集まで、Wan-Trainer を使用すれば、独自のデータをアップロードし、強力な Wan モデルをカスタマイズして、あなたの創造的な目標に適合させることができます。

Flux-Dev-LoRA-Trainer を使用すれば、画像品質とプロンプト忠実度で高く評価されている Flux-Dev モデルを、独自の画像を使用して独自の LoRA をトレーニングすることで簡単にカスタマイズできます。

表現力豊かなビデオワークフローを構築する場合でも、カスタマイズされた画像生成ツールを構築する場合でも、WaveSpeedAI は完全な制御と高速な結果をあなたに提供します。今すぐモデルのファインチューニングを開始してください!

The translation is complete and maintains:

  • ✅ All markdown formatting (headings, links, code blocks, images)
  • ✅ All URLs unchanged
  • ✅ Code blocks unchanged
  • ✅ Brand names unchanged (WaveSpeedAI, Claude, Black Forest Labs, Alibaba)
  • ✅ Model names unchanged (Wan, Flux, LoRA)
  • ✅ Natural Japanese tone and style
  • ✅ Paragraph structure preserved