FLUX 2 Klein 4bがWaveSpeedAIに登場

FLUX.2 [klein] 4B: サブセカンド画像生成がここに

AI駆動の画像生成の風景が劇的に変わりました。Black Forest Labsが、1秒未満で高品質の画像を生成できるコンパクトながら驚くほど機能豊富なモデル、FLUX.2 [klein] 4Bをリリースしました。WaveSpeedAIで利用可能になったこのブレークスルーは、プロフェッショナルグレードのテキスト・ツー・イメージ機能をすべての開発者とクリエイターの手に届けます。

FLUX.2 [klein] 4Bとは何か？

FLUX.2 [klein] 4Bは、品質を犠牲にすることなくスピードのために一から設計された40億パラメータの修正フロー変換器です。「klein」というドイツ語で「小さい」という意味の名前は、このモデルのコンパクトなアーキテクチャを反映していますが、それに騙されてはいけません。このモデルは、その5倍のサイズのモデルの品質に一貫して匹敵するか、それを上回ります。

秘密は蒸留技術にあります。Black Forest Labsは、より大きく、より強力なモデルをトレーニングし、その後、より小さな[klein]バリアントに、わずか4つの推論ステップで出力を近似するように「教え」ました。その結果？ハードウェアに応じて0.3〜1.2秒での画像生成、そしてヘビー級モデルと競い合う品質が実現します。

FLUX.2 [klein] 4Bが他のコンパクトモデルと異なる点は、統一されたアーキテクチャです。テキスト・ツー・イメージ生成、単一参照編集、マルチリファレンス合成を、単一の重みセットを通じて処理します。モデルの交換は不要、複雑なパイプラインも不要です。あなたの創造的な意図を理解する、ただ1つの効率的なシステムです。

主な機能

サブセカンド生成 — わずか0.3秒でも完全な画像を生成し、従来の拡散モデルでは不可能だった、リアルタイムの創造的なワークフローを実現
4ステップ推論 — 蒸留アーキテクチャは、従来のモデルで必要な50以上のステップと比較して、わずか4つのステップで生成を完了
コンパクトなフットプリント — 40億パラメータで、約13GB VRAMで動作し、RTX 3090やRTX 4070などのコンシューマーGPUでアクセス可能
読み取り可能なテキスト生成 — 多くの画像モデルが文字化けした文字を生成する一方、FLUX.2 [klein] 4Bは複雑なレイアウトとインフォグラフィックスでクリーンで読みやすいテキストを生成
正確な照明と物理学 — 影は自然に落ち、反射は正しく動作し、オブジェクトは適切な遠近関係を保持
Apache 2.0ライセンス — ライセンス料なしで商用利用に完全にオープンであり、スタートアップ、インディーデベロッパー、本番アプリケーションに最適
複数の出力形式 — JPEG、PNG、WebP出力をサポートし、ワークフロー要件に合わせて対応

現実の使用例

迅速な創造的イテレーション

視覚的なコンセプトに取り組むデザイナーとアーティストは、思考の速度で反復することができるようになりました。初期画像を生成し、プロンプトを改善し、1秒未満で結果を確認します。これにより、AI画像生成がバッチプロセスからインタラクティブな会話へと変換されます。

電子商取引の製品ビジュアライゼーション

高価な写真撮影なしに、製品画像、ライフスタイルショット、マーケティングビジュアルを作成します。このモデルのリアルな照明と物理の理解は、生成された製品が自然で商業的に実行可能に見えることを意味します。

UI/UXデザインモックアップ

FLUX.2 [klein] 4Bの読み取り可能なテキストをレンダリングする能力は、インターフェースデザインに特に価値があります。実際に読みやすいテキストを備えたプレースホルダースクリーン、アプリモックアップ、ビジュアルコンセプトを生成します。これは、ほとんどの他の画像モデルのユーザーを挫折させるものです。

規模でのコンテンツ制作

メディア企業とコンテンツクリエイターは、記事、ソーシャルポスト、マーケティングキャンペーン用のサポート画像をリアルタイムで生成できます。サブセカンド生成速度は、クリエイティブブリーフがまだ新鮮な間に数十の選択肢を生成できることを意味します。

インタラクティブアプリケーション

アプリケーションにリアルタイム画像生成機能を直接構築します。ゲーム開発者、インタラクティブエクスペリエンスデザイナー、教育プラットフォームビルダーは、長い待ち時間なしにユーザーへのインスタント画像生成を提供できます。

一貫したキャラクターと製品生成

マルチリファレンス機能により、生成全体で視覚的な一貫性を維持できます。キャラクターまたは製品を一度作成し、その後、特徴的な特性を保持しながら新しいシーンと文脈で生成します。

WaveSpeedAIで始める

WaveSpeedAIはFLUX.2 [klein] 4Bの展開を簡単にします。当社のインフラストラクチャは、モデルのフルスピード能力をコールドスタートなしで提供するため、最初のリクエストは1000番目のリクエストと同じくらい高速です。

最初の画像を生成する方法は次のとおりです：

import wavespeed

output = wavespeed.run(
    "wavespeed-ai/flux-2-klein-4b/text-to-image",
    {
        "prompt": "A professional product photograph of wireless earbuds on a marble surface, soft natural lighting, minimalist aesthetic"
    },
)

print(output["outputs"][0])

追加パラメータを使用して生成をカスタマイズできます：

import wavespeed

output = wavespeed.run(
    "wavespeed-ai/flux-2-klein-4b/text-to-image",
    {
        "prompt": "An architect's rendering of a modern sustainable home with floor-to-ceiling windows, surrounded by native landscaping",
        "size": "1024*768"
    },
)

print(output["outputs"][0])

このモデルはsizeパラメータを通じてカスタム画像寸法をサポートしており、複数のリクエスト全体で一貫した結果が必要な場合、オプションのseedパラメータを使用して再現可能な生成ができます。

なぜWaveSpeedAIなのか？

WaveSpeedAI経由でFLUX.2 [klein] 4Bを実行することで、いくつかの利点が得られます：

コールドスタートなし — 常に温かいインフラストラクチャにより、リクエストは即座に実行されます。モデルロードの待機なし、予測不可能なレイテンシースパイクなし。

最適化されたパフォーマンス — 蒸留アーキテクチャからスピードのあらゆる側面を抽出し、FLUX.2 [klein] 4Bのために特に特別に調整した展開です。

手頃な価格設定 — 生成したものだけに対して支払います。当社の価格モデルは、あらゆる規模のビジネスにとって大量生産を実行可能にします。

シンプルな統合 — クリーンなREST APIとPython SDKは、アプリケーションに数日ではなく数分で画像生成を追加できることを意味します。

より大きな図

FLUX.2 [klein] 4Bは、AI画像生成の民主化における重要なマイルストーンを表しています。はるかに大きなモデルとの品質パリティを達成しながらコンシューマーハードウェアで実行することで、Black Forest Labsは世界中のクリエイター、開発者、ビジネスの参入障壁を低下させました。

Apache 2.0ライセンスは商用制限を削除します。つまり、プロトタイプに電力を供給するテクノロジーは、条件の再交渉やライセンス料の支払いなしに、本番環境に直接スケールできることを意味します。

次世代の創造的なツールを構築する開発者にとって、スピード、品質、アクセシビリティのこの組み合わせは、以前は存在しなかった可能性を開きます。リアルタイム画像生成はもはや妥協ではなく、新しい標準です。

今日から創造を始める

WaveSpeedAIのFLUX.2 [klein] 4Bは、最も要求の厳しいプロジェクトの準備ができています。インタラクティブなデザインツールを構築する場合でも、コンテンツ制作パイプラインに電力を供給する場合でも、または最新の画像生成で何が可能かを単に探索する場合でも、サブセカンド結果は指先にあります。

wavespeed.ai/models/wavespeed-ai/flux-2-klein-4b/text-to-imageにアクセスして、モデルの機能を探索し、ドキュメントを確認し、生成を開始します。

画像作成の未来は待つことについてではなく、想像の速度で作成することについてです。