← 部落格

xAI Grok Imagine Image文字轉圖像現已登陸WaveSpeedAI

X-AI Grok Imagine Image讓您透過xAI的Grok Imagine模型進行精確的圖像編輯。使用文字提示搭配AI驅動的精準度,輕鬆轉換與修改圖像。

By WaveSpeedAI 3 min read
X Ai Grok Imagine Image Text To Image
X Ai Grok Imagine Image Text To Image X-AI Grok Imagine Image讓您透過xAI的Grok Imagine模型進行精確的圖像編輯。使用文字提...
Try it
xAI Grok Imagine Image文字轉圖像現已登陸WaveSpeedAI

Grok Imagine Image:xAI 的文字轉圖像模型,打造高品質視覺創作

Grok Imagine Image 是 xAI 的文字轉圖像生成模型,能將文字提示詞轉化為高品質、風格化的視覺影像——從寫實場景到 3D 角色與 Q 版人物,一應俱全。此模型現已在 WaveSpeedAI 上線,提供即用型 REST API,無需等待冷啟動,定價僅 $0.022 美元/張,讓開發者、設計師與內容創作者能以快速、實惠的方式大規模生成創意圖像。

如果您一直在尋找一款結合 xAI 標誌性創意風格的文字轉圖像 API,同時支援批量生成、靈活的畫面比例以及內建提示詞增強功能,Grok Imagine Image 正是您需要的答案——並以生產就緒的推論端點呈現。

立即試用 Grok Imagine Image →

Grok Imagine Image 的運作原理

Grok Imagine Image 接收自然語言文字提示詞,並在異常廣泛的畫面比例選項中生成高保真圖像。許多文字轉圖像模型僅支援少數幾種方形或直式格式,而 Grok Imagine Image 支援 11 種預設畫面比例——2:1、20:9、16:9、4:3、3:2、1:1、2:3、3:4、9:16、9:20,以及模型預設值——同樣適用於 TikTok 直式影片、YouTube 縮圖、Instagram 貼文與超寬電影橫幅。

此模型還支援每次請求最多批量生成 4 張圖像,在您需要探索多種視覺方向時,能大幅縮短迭代時間。結合內建的提示詞增強功能,Grok Imagine Image 成為創意工作的快速回饋迴圈,而不僅僅是靜態圖像生成器。

對於開發者而言,API 設計刻意保持精簡:傳入 prompt,可選擇設定 aspect_rationum_images,即可完成。無需微調、無需處理 LoRA,也無需佈建 GPU。

Grok Imagine Image 的主要功能

  • 高品質風格化輸出 — 從 3D 角色、Q 版插畫到寫實環境,全面出色,讓您以單一模型適應多種視覺語言。
  • 11 種預設畫面比例 — 從 9:20 超窄直式到 2:1 電影寬幕,無需後製裁切即可符合平台所需的精確格式。
  • 批量生成最多 4 張圖像 — 單次 API 呼叫即可生成四種變化,非常適合 A/B 測試、情緒板與快速概念探索。
  • 內建提示詞增強 — xAI 的提示詞增強功能自動優化您的輸入,產生更豐富、更精細的輸出,降低非專業使用者的入門門檻。
  • 可預測的單張計費 — 固定 $0.022 美元/張,無隱藏費用或運算時間計費,讓高容量工作負載的預算規劃更加直觀。
  • WaveSpeedAI 上的生產就緒 REST API — 零冷啟動、低延遲、按用量計費,讓您不再為閒置的 GPU 容量付費。

Grok Imagine Image 最佳使用情境

角色設計與 3D 插畫

Grok Imagine Image 在風格化 3D 角色、Q 版人物與玩具風格插畫方面表現尤為出色。獨立遊戲工作室、動畫製作流程與周邊商品設計師可在幾分鐘內構建角色概念——每次請求生成四種變化,在確定生產資產前找到正確的姿勢、表情或美術方向。

大規模社群媒體內容

執行多平台行銷活動的行銷團隊可從模型的畫面比例靈活性中獲益良多。單一品牌簡報可渲染為 1:1 Instagram 貼文、9:16 Reels/TikTok 視覺圖,以及 16:9 YouTube 縮圖——同一下午在同一 API 中全部完成。搭配批量生成功能,可在一次衝刺中填滿數週的內容行事曆。

概念藝術與前期視覺化

電影、廣告與遊戲工作室透過快速概念藝術在創意團隊之間傳達想法。Grok Imagine Image 能同時處理寫實環境與風格化角色,使其成為多功能的前期視覺化工具——而 2:1 與 20:9 的超寬比例非常適合關鍵影格、環境板與電影橫幅。

行銷創意與廣告變體

效果行銷人員深知創意量決定成效。透過 Grok Imagine Image,代理商可生成數十種廣告創意變體——不同畫面比例、不同視覺風格、不同場景構圖——每張僅需 $0.022 美元,再將勝出版本投入付費活動,而不必擔心成本失控。

電商主視覺圖像

線上零售商可使用 Grok Imagine Image 生成生活風格圖像、主題橫幅與季節性活動視覺效果,無需預約攝影棚拍攝。此模型對紋理、燈光與色彩的出色處理,使其適用於產品周邊視覺,如背景圖、氛圍圖與主視覺橫幅。

編輯與出版插圖

新聞編輯室、部落格與編輯網站需要在緊迫截止日期內取得原創圖像。Grok Imagine Image 的快速推論與廣泛的風格範疇——加上幫助非設計師構建更好視覺提示詞的提示詞增強功能——使其成為編輯插圖工作流程的實用選擇。

設計師的快速原型製作

探索新品牌、應用程式或行銷活動方向的設計師,可使用 num_images=4 在單次呼叫中生成視覺情緒板。迭代提示詞、優化方向、收斂至最終概念——全程無需離開 API。

Grok Imagine Image 定價與 API 存取

WaveSpeedAI 上的 Grok Imagine Image 採用簡單、可預測的單張計費:

輸出費用
每張圖像$0.022

計費範例:

  • 1 張圖像 → $0.022
  • 2 張圖像 → $0.044
  • 4 張圖像 → $0.088(每次請求上限)

總費用計算方式為 $0.022 × num_images,每次請求上限為 4 張圖像。

API 參數

參數必填說明
prompt您想生成圖像的文字描述
aspect_ratio輸出比例:2:1、20:9、16:9、4:3、3:2、1:1、2:3、3:4、9:16、9:20
num_images每次請求的圖像數量(1–4,預設:1)

程式碼範例

import wavespeed

output = wavespeed.run(
    "x-ai/grok-imagine-image/text-to-image",
    {
        "prompt": "A cinematic portrait of a futuristic samurai under neon rain, ultra-detailed, dramatic lighting",
        "aspect_ratio": "16:9",
        "num_images": 4,
    },
)

print(output["outputs"][0])

WaveSpeedAI 負責處理基礎設施——無需 GPU 設定、無冷啟動延遲、無擴展困擾。您可獲得生產就緒的 REST 端點,只需為生成的圖像付費,並直接整合至您的應用程式堆疊。

取得 API 金鑰,立即開始建構 →

使用 Grok Imagine Image 的最佳技巧

  • 使用提示詞增強功能,將簡短的提示詞優化為更豐富、更具描述性的輸入——對非設計師或需要大量批次處理多個概念的情況特別有幫助。
  • 明確描述風格、紋理、燈光與色彩調色盤。 「柔和的體積邊緣光、冷藍色調、啞光紋理」等提示詞比籠統描述更能產生一致的結果。
  • 探索新概念時,一次生成四張圖像。 邊際成本很小,而變化能提供更好的素材供進一步優化。
  • 根據目標平台選擇畫面比例:YouTube 與桌面用 16:9,TikTok/Reels/Stories 用 9:16,Instagram 動態用 1:1,電影橫幅與網站頁首用 2:1 或 20:9。
  • 迭代提示詞,而非調整參數。 最大的改善來自對主題、構圖與氛圍的更清晰描述,而非反覆調整畫面比例。
  • 搭配 Grok Imagine Image Edit 來優化或修改生成結果。這兩個模型設計為協同運作,形成生成後編輯的工作流程。

常見問題

什麼是 Grok Imagine Image?

Grok Imagine Image 是 xAI 的文字轉圖像生成模型,在 WaveSpeedAI 上以託管 REST API 形式提供。它能將文字提示詞轉換為 11 種畫面比例的高品質圖像,並支援每次請求最多批量生成 4 張圖像。

Grok Imagine Image 的費用是多少?

Grok Imagine Image 在 WaveSpeedAI 上的費用為每張圖像 $0.022 美元,每次請求最多 4 張。單張圖像請求為 $0.022 美元;四張圖像批量請求為 $0.088 美元。

我可以透過 API 使用 Grok Imagine Image 嗎?

可以。Grok Imagine Image 可透過 WaveSpeedAI 的 REST 推論 API 完整存取,無冷啟動、無需佈建 GPU,並採按用量計費。您可以直接使用 WaveSpeed Python SDK 或任何 HTTP 客戶端呼叫它。

Grok Imagine Image 支援哪些畫面比例?

Grok Imagine Image 支援 11 種預設畫面比例:2:1、20:9、16:9、4:3、3:2、1:1、2:3、3:4、9:16 與 9:20,以及一個預設選項。這使其非常適合從單一 API 為 YouTube、TikTok、Instagram 與電影橫幅生成內容。

Grok Imagine Image 每次請求可以生成多少張圖像?

您可以在單次 Grok Imagine Image API 呼叫中,透過設定 num_images 參數生成 1 至 4 張圖像。這對快速迭代、A/B 測試創意變體以及高效探索多種設計方向非常實用。

立即開始使用 Grok Imagine Image 建構

Grok Imagine Image 將 xAI 的文字轉圖像能力帶入生產就緒的推論端點,提供真實應用程式所需的速度、可靠性與可預測的定價。無論您是在推出創意 SaaS 工具、擴展行銷創意,還是原型設計新產品概念,這都是目前最靈活、最具成本效益的文字轉圖像 API 之一。

在 WaveSpeedAI 上啟動 Grok Imagine Image →