← ブログ

Baidu ERNIE Image TurboがWaveSpeedAIに登場

ERNIE Image Turboは、Baiduが開発した8ステップ蒸留テキスト生成画像モデルです。中国語・英語・日本語にネイティブ対応し、高速生成を実現。1枚あたり$0.03でWaveSpeedAIにて利用可能。

1 min read
Wavespeed Ai Ernie Image Text To Image Turbo
Wavespeed Ai Ernie Image Text To Image Turbo ERNIE Image Turboは、Baiduが開発した8ステップ蒸留テキスト生成画像モデルです。中国語・英語・日本語...
Try it
Baidu ERNIE Image TurboがWaveSpeedAIに登場

BaiduのERNIE Image Turbo、WaveSpeedAIに登場

最終出力向けのフル品質画像生成は素晴らしいですが、アイデア出し、反復作業、リアルタイム体験には、同じモデルをはるかに低いレイテンシで使えることが重要です。Baidu ERNIE Image TurboがWaveSpeedAIに登場したことをお知らせします。ERNIEImageの蒸留8ステップ版であり、わずかなディテールの低下と引き換えに大幅な高速化を実現しつつ、同じ低価格を維持しています。

Baidu ERNIE Image Turboとは?

ERNIE Image Turboは、Baiduのフラッグシップtext-to-imageモデルERNIE Image高速推論バリアントです。ステップ蒸留によって生成パイプラインをわずか8推論ステップに圧縮しつつ、ERNIE Imageが持つ核心的な強みを保持しています。それは中国語・英語・日本語のネイティブプロンプト理解、柔軟なサイズ設定、そしてLLMによるプロンプト拡張です。

ERNIE Imageが「最終的なピクセル品質」のためのモデルだとすれば、ERNIE Image Turboは「ユーザーがタイプするのと同じ速さ」のためのモデルです。

主な特徴

8ステップ蒸留推論 フル品質バリアントの一部の計算量で、大多数のユースケースにおいて十分な本番環境対応の出力品質を実現します。

同じネイティブ多言語プロンプト対応 中国語(简体中文)、英語、日本語(日本語)——すべて第一級言語として対応。Turboはスピードのために言語精度を犠牲にしません。

LLMによるプロンプト拡張 短いプロンプトでもERNIEを活用した自動拡張が機能するため、簡潔な入力から詳細な出力を生成できます。

柔軟なサイズ設定 自由なアスペクト比と解像度——縦向き、横向き、正方形、カスタム。

低レイテンシ、低コスト アイデア出しに十分なコスト、チャットベースのクリエイティブUI・ライブデモ・反復的な改善に十分な速度。

実際のユースケース

インタラクティブなクリエイティブアプリ

ユーザーがプロンプトを入力すると数十秒ではなく数秒で結果が表示されるツールを構築できます。チャットスタイルのクリエイティブUI、デザインコパイロット、テキストアドベンチャービジュアルに不可欠です。

中国語・日本語SNSコンテンツの大量生成

大量のローカライズされたSNSビジュアルをバッチ生成しても、予算を大きく消費しません。

コンセプト探索

フル品質のERNIE Imageが5つをレンダリングする時間で、コンセプトの20バリエーションを試せます。勝者を選んでから、フル品質で再レンダリングしましょう。

商品リスティングとサムネイル

Eコマース、ゲームアセット、UGCプラットフォーム向け——他に類を見ない価格での大量画像生成。

ライブデモとユーザー向けプレビュー

素早いフィードバックでユーザーを引き付けましょう。インタラクティブプレビューにはTurboを使用し、「最終レンダリング」ボタンでフルERNIE Imageを呼び出せます。

WaveSpeedAIで始める

  1. 中国語、英語、または日本語でプロンプトを入力します。
  2. サイズを選択——レイアウトに合ったアスペクト比を選べます。
  3. 送信——フル品質バリアントの何分の一かの時間で出力が返ってきます。

完全なAPIスキーマとインタラクティブなプレイグラウンドはモデルページでご確認いただけます。

料金

1画像あたり$0.03——フルERNIE Imageと同じ低価格でありながら、Turboのレイテンシプロファイルを実現。大量・インタラクティブ・反復ワークフローに最適なコストパフォーマンスです。

ERNIE Image TurboをWaveSpeedAIで使う理由

  • 890以上のモデルに対応した1つのAPI。 文字列を変えるだけでTurbo、フルERNIE Image、FLUX、SDXLなどを切り替えられます。
  • コールドスタートなし。 負荷がかかってもTurboはTurboのまま——ウォームアップのペナルティはありません。
  • 透明な料金体系。 画像ごとの課金、サブスクリプション不要、最低利用額なし。
  • 本番環境の信頼性。 リアルタイムクリエイティブアプリ、ライブデモ、コンシューマーワークロードに適しています。

プロのヒント

  • アイデア出しはTurboで、最終化はERNIE Imageで。 ユーザー(または自分自身)が低コストで反復し、勝者をフル品質で再レンダリングしましょう。
  • バッチ処理を活用。 Turboの低レイテンシは、単一プロンプトからバリエーショングリッドを生成する際に最大限発揮されます。
  • プロンプトは簡潔に。 被写体、スタイル、ムードを指定すれば、LLM拡張が残りを処理します。
  • 中国語コンテンツは中国語で書く。 翻訳は不要——Turboはネイティブに理解します。
  • ストリーミングUIを活用。 Turboのスピードによって、タイプしながらプレビューするパターンが実用的になります。

今日から始めよう

ERNIE Image Turboは、Baiduのネイティブ多言語画像生成をリアルタイム利用に十分なスピードで提供します——フル品質モデルと同じ1画像あたりの価格で。

今すぐWaveSpeedAIでBaidu ERNIE Image Turboを試す——人間のスピードで応答する多言語クリエイティブUIを構築しましょう。