Baidu ERNIE Image 現已登陸WaveSpeedAI
百度 ERNIE Image 文字轉圖像模型——原生支援中文、英文、日文提示詞,內建 LLM 提示詞擴展,靈活尺寸設定。現已在 WaveSpeedAI 上線。
真正的多語言文字生成圖像模型,現已投入生產使用
大多數文字生成圖像模型主要以英語說明文字進行訓練。當您以中文或日文輸入提示詞時,模型只能透過翻譯過濾後得到近似的英語理解——語意因此模糊,文化細節也隨之消失。百度的 ERNIE Image 與眾不同:它能原生理解中文、英文和日文,並以流利使用者的方式閱讀提示詞。我們很高興宣布,百度 ERNIE Image 現已在 WaveSpeedAI 上線,可透過我們統一的 REST API 存取。
什麼是百度 ERNIE Image?
ERNIE Image 是百度旗艦文字生成圖像模型,屬於更大型的 ERNIE(透過知識整合增強表示,Enhanced Representation through kNowledge IntEgration)基礎模型家族的一部分。憑藉百度在中文 AI 領域的深厚積累,ERNIE Image 是中文提示詞保真度、慣用語理解及文化原生視覺輸出方面最強大的開放模型之一。
與那些在純英語骨幹上附加翻譯的改裝方案不同,ERNIE Image 從一開始就以一流的多語言支援進行訓練——中文提示詞能產生原生中文感的視覺效果,日文提示詞呈現原生日文感,英文提示詞則達到全球頂級模型的品質水準。
主要特色
原生多語言提示詞 以中文(简体中文)、英文或日文(日本語)撰寫——每種語言都是一等公民,而非翻譯層。成語、文化典故與細膩語意均能完整傳達。
LLM 增強提示詞擴展 簡短的提示詞會由百度的 ERNIE 語言模型自動擴展為詳細、生動的描述——讓您無需手動設計提示詞,也能從最少的輸入獲得豐富的結果。
彈性尺寸設定 自由選擇輸出尺寸——直式、橫式、正方形或自訂長寬比。適用於任何形狀的社群媒體、印刷品、產品圖像及應用程式 UI。
高品質寫實與插畫效果 同等出色地處理照片寫實、繪畫風格、動漫、3D 渲染外觀及平面設計。
中華文化原真性 在收到相應提示時,能產生根植於中華美學的視覺效果——傳統建築、書法構圖、地域服飾、真實面孔與場景。
實際應用場景
跨境電商與行銷
從單一流程為中文、日文和西方受眾生成具有文化精準風格的產品圖像——無需為每個市場切換模型。
內容本地化
為每種目標語言的文化語境生成自然貼切的視覺效果。單一工作流程涵蓋中文/英文/日文行銷活動。
中文創意製作
插畫、書籍封面設計、社群媒體圖像、遊戲概念美術——以中文撰寫提示詞,無翻譯損失地獲得精準結果。
快速概念探索
LLM 提示詞擴展功能將一句話轉化為豐富場景,讓藝術總監和設計師能快速掃遍各種創意構思。
本地化應用程式與產品圖像
為應用程式、網站和產品列表填充符合各市場文化語境的圖像。
在 WaveSpeedAI 上快速開始
- 選擇語言 — 以中文、英文或日文撰寫提示詞,也可以混合使用。
- 選擇尺寸 — 選擇符合您使用場景的任意長寬比和解析度。
- 提交 — 當輸入較短時,模型會在內部自動處理提示詞擴展。
透過 WaveSpeedAI REST API 呼叫,與其他任何模型相同。完整的請求/回應結構描述請參閱模型頁面。
定價
僅需 每張圖像 $0.03 — 無論使用何種語言,都是市場上最實惠的高品質文字生成圖像模型之一。
為何選擇在 WaveSpeedAI 上運行 ERNIE Image
- 單一 API,890+ 個模型。 只需更改一個字串,即可在 ERNIE Image、SDXL、FLUX 等模型之間切換。
- 無冷啟動。 在任何負載下均達到生產級延遲。
- 透明定價。 按圖像計費,無需訂閱。
- 全球可用。 從任何地方存取頂級中文模型,無需配置中國雲端基礎設施。
專業技巧
- 對於中文提示詞,跳過機器翻譯——直接以中文撰寫,以獲得最佳效果。
- 將提示詞聚焦在您想要的內容(主題、風格、場景、氛圍)。LLM 擴展會自動補充細節。
- 將特定語言的成語與風格關鍵詞結合(「水墨画風格」、「浮世繪」、「photorealistic cinematic」),以實現文化原真性。
- 若需一致的品牌輸出,鎖定一個簡短的前置詞組並改變主題——擴展功能仍然有效。
- 同時測試 ERNIE Image 和 ERNIE Image Turbo — 最終資產使用完整品質版本,構思發想則使用 Turbo 版本。
立即開始創作
百度 ERNIE Image 為任何應用程式帶來真正的多語言圖像生成能力——具備一流的中文、英文和日文支援、生產級可靠性及按圖像計費的定價方式。
立即在 WaveSpeedAI 上試用百度 ERNIE Image,為您的工具鏈加入原生多語言圖像模型。




