Z AI Glm Image 文字生成圖像現已登陸WaveSpeedAI

在WaveSpeedAI上推出Z.AI GLM-Image

AI圖像生成的格局剛剛變得更加令人興奮。WaveSpeedAI很榮幸宣佈推出Z.AI GLM-Image，這是一個突破性的160億參數文字轉圖像模型，正在重新定義AI生成圖像的可能性——特別是在精確呈現文字和知識密集內容方面具有前所未有的準確度。

什麼是GLM-Image？

GLM-Image代表了與傳統圖像生成方法的重大偏離。由智譜AI（Z.AI）開發，該模型採用了革命性的混合架構，結合了90億參數自迴歸語言模型和70億參數擴散解碼器。這種雙引擎設計讓GLM-Image在其他模型難以發揮作用的地方表現出色：生成具有精確文字呈現和複雜信息佈局的圖像。

自迴歸元件建立在經過驗證的GLM-4-9B基礎上，負責指令理解、語義推理和整體圖像構圖。同時，擴散解碼器——配備了專門的字形編碼器——將這些語義表現轉化為具有非常精確文字呈現的高保真視覺效果。

主要功能

卓越的文字呈現準確度 GLM-Image在CVTG-2K基準上達到了0.9116的單詞準確度得分，遠遠超過競爭對手。在LongText-Bench排行榜上，英文文字呈現得分為0.9524，中文文字呈現則達到0.9788——在包括標誌、海報和對話框在內的8個不同場景中排名開源模型第一。

知識密集生成 需要信息圖表、演示文稿幻燈片或技術圖表？GLM-Image擅長生成需要語義理解和精確信息展示的視覺效果。該模型以純擴散模型無法匹配的方式理解上下文、層次結構和佈局。

強大的提示理解 得益於其源自GLM-4語言模型的自迴歸基礎，GLM-Image能夠準確解釋詳細提示並生成與您描述高度相符的圖像。該模型在生成像素之前會推理物體、關係和空間排列。

靈活的尺寸選項 使用自訂寬度和高度控制在所需尺寸下生成圖像。無論您需要正方形社交媒體貼文、垂直故事還是寬幅橫幅圖形，GLM-Image都能適應您的規格。

內置提示增強 不確定如何製作完美提示？啟用提示擴展功能，讓GLM-Image的內置LLM自動增強您的描述以獲得更好的生成結果。當從需要更多細節的簡單概念開始時，這特別有用。

多種輸出格式 在適合網路使用的較小檔案大小的JPEG和需要無損質量的PNG之間選擇，以獲得具有潛在透明度要求的清晰圖形。

實際應用案例

市場營銷和廣告 使用直接呈現在圖像中的精確品牌名稱、標語和產品描述來建立專業的促銷材料。無需再進行後期處理來添加文字——GLM-Image將排版作為生成過程的一部分進行處理。

社交媒體內容 生成具有真正看起來專業的嵌入文字的引人入勝的視覺效果，用於貼文、故事和廣告。報價圖形、公告貼文和品牌內容從未如此容易製作過。

教育材料 開發信息圖表、說明圖表和教育海報，其中文字清晰度至關重要。GLM-Image在信息密集佈局方面的卓越表現使其成為視覺化複雜概念的理想選擇。

演示文稿圖形 生成具有集成文字元素的幻燈片就緒視覺效果、數據視覺化模型和演示文稿背景。該模型理解標題層次結構和信息卡佈局。

產品視覺化 建立品牌名稱和描述需要自然地出現在場景中的模型、包裝概念和產品圖像。

概念藝術和構思 以確信任何概念中的文字元素都會清晰清楚地呈現的信心快速視覺化創意專案想法。

在WaveSpeedAI上開始使用

在WaveSpeedAI上使用GLM-Image非常簡單。以下是生成您的第一張圖像的方法：

import wavespeed

output = wavespeed.run(
    "z-ai/glm-image/text-to-image",
    {
        "prompt": "A professional business infographic about sustainable energy, featuring clear statistics and modern design"
    },
)

print(output["outputs"][0])

為了更好地控制您的生成，您可以指定其他參數：

import wavespeed

output = wavespeed.run(
    "z-ai/glm-image/text-to-image",
    {
        "prompt": "A vibrant movie poster for a sci-fi film titled 'STELLAR DAWN' with dramatic lighting and futuristic typography",
        "width": 1024,
        "height": 1536,
        "enable_prompt_expansion": True
    },
)

print(output["outputs"][0])