Memperkenalkan xAI Grok Imagine Image Text-to-Image di WaveSpeedAI

Grok Imagine Image: Model Teks-ke-Gambar dari xAI untuk Generasi Visual Berkualitas Tinggi

Grok Imagine Image adalah model generasi teks-ke-gambar dari xAI yang mengubah prompt teks menjadi visual berkualitas tinggi dan stylized — mulai dari pemandangan fotorealistis hingga karakter 3D dan figur chibi. Kini tersedia di WaveSpeedAI dengan REST API siap pakai, tanpa cold start, dan harga hanya $0,022 per gambar, model ini memberikan cara yang cepat dan terjangkau bagi developer, desainer, dan kreator konten untuk menghasilkan gambar kreatif dalam skala besar.

Jika Anda mencari API teks-ke-gambar yang menggabungkan jangkauan kreatif khas xAI dengan generasi batch, rasio aspek fleksibel, dan Prompt Enhancer bawaan, Grok Imagine Image memberikan semua itu — dikemas dalam endpoint inferensi yang siap produksi.

Coba Grok Imagine Image sekarang →

Cara Kerja Grok Imagine Image

Grok Imagine Image menerima prompt teks dalam bahasa alami dan menghasilkan gambar berkualitas tinggi dalam berbagai rasio aspek yang sangat beragam. Di mana banyak model teks-ke-gambar mengunci Anda pada beberapa format persegi atau potret, Grok Imagine Image mendukung 11 rasio aspek preset — 2:1, 20:9, 16:9, 4:3, 3:2, 1:1, 2:3, 3:4, 9:16, 9:20, dan default model — menjadikannya sama-sama cocok untuk vertikal TikTok, thumbnail YouTube, postingan Instagram, dan banner sinematik ultra-lebar.

Model ini juga mendukung generasi batch hingga 4 gambar per permintaan, yang secara dramatis mengurangi waktu iterasi ketika Anda perlu mengeksplorasi berbagai arah visual. Gabungkan dengan Prompt Enhancer bawaan, dan Grok Imagine Image menjadi loop umpan balik yang cepat untuk pekerjaan kreatif, bukan sekadar generator gambar statis.

Bagi developer, API-nya sengaja dibuat minimal: kirim prompt, opsional pilih aspect_ratio dan num_images, dan selesai. Tanpa fine-tuning, tanpa repot dengan LoRA, tanpa penyediaan GPU.

Fitur Utama Grok Imagine Image

Output stylized berkualitas tinggi — Unggul dalam segalanya mulai dari karakter 3D dan ilustrasi gaya chibi hingga lingkungan fotorealistis, memberikan satu model yang beradaptasi dengan berbagai bahasa visual.
11 rasio aspek preset — Dari ultra-vertikal 9:20 hingga widescreen sinematik 2:1, Anda dapat menyesuaikan format yang tepat sesuai kebutuhan platform tanpa pasca-pemrosesan atau pemotongan.
Generasi batch hingga 4 gambar — Hasilkan empat variasi dalam satu panggilan API, ideal untuk pengujian A/B, papan mood, dan eksplorasi konsep cepat.
Prompt Enhancer bawaan — Peningkatan prompt xAI secara otomatis menyempurnakan input Anda untuk output yang lebih kaya dan detail, menurunkan hambatan bagi pengguna non-ahli.
Harga per gambar yang dapat diprediksi — Flat $0,022 per gambar tanpa biaya tersembunyi atau penagihan berdasarkan waktu komputasi berarti penganggaran untuk beban kerja volume tinggi menjadi mudah.
REST API siap produksi di WaveSpeedAI — Zero cold start, latensi rendah, dan penagihan pay-per-use, sehingga Anda tidak pernah membayar untuk kapasitas GPU yang menganggur.

Kasus Penggunaan Terbaik untuk Grok Imagine Image

Desain Karakter dan Ilustrasi 3D

Grok Imagine Image sangat kuat dalam karakter 3D stylized, figur chibi, dan ilustrasi bergaya mainan. Studio game indie, pipeline animasi, dan desainer merchandise dapat membuat konsep karakter dalam hitungan menit — menghasilkan empat variasi per permintaan untuk mendapatkan pose, ekspresi, atau arah seni yang tepat sebelum berkomitmen pada aset produksi.

Konten Media Sosial dalam Skala Besar

Tim pemasaran yang menjalankan kampanye multi-platform mendapat manfaat besar dari fleksibilitas rasio aspek model. Satu brief merek dapat dirender sebagai postingan Instagram 1:1, visual Reels/TikTok 9:16, dan thumbnail YouTube 16:9 — semuanya dari API yang sama dalam satu sore. Padukan dengan generasi batch untuk mengisi kalender konten selama berminggu-minggu dalam satu sprint.

Seni Konsep dan Pra-Visualisasi

Studio film, periklanan, dan game menggunakan seni konsep cepat untuk mengkomunikasikan ide di seluruh tim kreatif. Kemampuan Grok Imagine Image untuk menangani lingkungan fotorealistis bersama karakter stylized menjadikannya alat pra-vis yang serbaguna — dan rasio ultra-lebar 2:1 dan 20:9 ideal untuk keyframe, pelat lingkungan, dan banner sinematik.

Kreatif Pemasaran dan Variasi Iklan

Pemasar performa tahu bahwa volume kreatif mendorong hasil. Dengan Grok Imagine Image, sebuah agensi dapat menghasilkan lusinan varian kreatif iklan — rasio aspek berbeda, gaya visual berbeda, komposisi adegan berbeda — seharga $0,022 per gambar, kemudian mendorong pemenang ke kampanye berbayar tanpa biaya yang membengkak.

Gambar Hero E-Commerce

Pengecer online dapat menggunakan Grok Imagine Image untuk menghasilkan gambar lifestyle, banner bertema, dan visual kampanye musiman tanpa memesan sesi pemotretan. Kemampuan model yang kuat dalam menangani tekstur, pencahayaan, dan warna membuatnya cocok untuk visual yang berdekatan dengan produk seperti latar belakang, gambar mood, dan banner hero.

Ilustrasi Editorial dan Penerbitan

Ruang berita, blog, dan situs editorial membutuhkan gambar orisinal dalam tenggat waktu yang ketat. Inferensi cepat Grok Imagine Image dan jangkauan stilistis yang luas — bersama dengan Prompt Enhancer yang membantu non-desainer membuat prompt visual yang lebih baik — menjadikannya cocok secara praktis untuk alur kerja ilustrasi editorial.

Prototipe Cepat untuk Desainer

Desainer yang mengeksplorasi arah untuk merek, aplikasi, atau kampanye baru dapat menggunakan num_images=4 untuk menghasilkan papan mood visual dalam satu panggilan. Iterasi pada prompt, sempurnakan arah, dan konvergen ke konsep akhir — semua tanpa meninggalkan API.

Harga dan Akses API Grok Imagine Image

Grok Imagine Image di WaveSpeedAI menggunakan harga per gambar yang sederhana dan dapat diprediksi:

Output	Biaya
Per gambar	$0,022

Contoh penagihan:

1 gambar → $0,022
2 gambar → $0,044
4 gambar → $0,088 (maksimum per permintaan)

Total biaya dihitung sebagai $0,022 × num_images, dibatasi hingga 4 gambar per permintaan.

Parameter API

Parameter	Wajib	Deskripsi
`prompt`	Ya	Deskripsi teks dari gambar yang ingin Anda hasilkan
`aspect_ratio`	Tidak	Rasio output: 2:1, 20:9, 16:9, 4:3, 3:2, 1:1, 2:3, 3:4, 9:16, 9:20
`num_images`	Tidak	Jumlah gambar per permintaan (1–4, default: 1)

Contoh Kode

import json
import os
import time
from urllib.request import Request, urlopen

api_key = os.environ["WAVESPEED_API_KEY"]
headers = {"Authorization": f"Bearer {api_key}", "Content-Type": "application/json"}
payload = {
    "prompt": "A cinematic ocean wave at sunrise, highly detailed",
    "aspect_ratio": "2:1",
    "output_format": "jpeg"
}

def request_json(url, data=None):
    request = Request(url, data=data, headers=headers, method="POST" if data else "GET")
    with urlopen(request) as response:
        return json.load(response)

# 1. Submit the prediction.
submit_body = request_json("https://api.wavespeed.ai/api/v3/x-ai/grok-imagine-image/text-to-image", json.dumps(payload).encode())
task = submit_body.get("data", submit_body)
prediction_id = task.get("id")
if not prediction_id:
    raise RuntimeError("Submission response did not contain a prediction id")
result_url = task.get("urls", {}).get("get") or f"https://api.wavespeed.ai/api/v3/predictions/{prediction_id}/result"

# 2. Poll until the prediction finishes.
while True:
    body = request_json(result_url)
    result = body.get("data", body)
    status = result.get("status")
    if status == "completed":
        print(result.get("outputs", []))
        break
    if status in {"failed", "cancelled", "timeout"}:
        raise RuntimeError(result)
    if status not in {"created", "processing"}:
        raise RuntimeError(f"Unexpected status: {status}")
    time.sleep(2)

WaveSpeedAI mengelola infrastruktur — tanpa pengaturan GPU, tanpa latensi cold start, tanpa kerumitan penskalaan. Anda mendapatkan endpoint REST produksi, hanya membayar untuk gambar yang Anda hasilkan, dan mengintegrasikannya langsung ke dalam tumpukan aplikasi Anda.

Dapatkan kunci API Anda dan mulai membangun →

Tips untuk Hasil Terbaik dengan Grok Imagine Image

Gunakan Prompt Enhancer untuk menyempurnakan prompt yang jarang menjadi input yang lebih kaya dan deskriptif — sangat membantu untuk non-desainer atau untuk batch di banyak konsep.
Bersikaplah spesifik tentang gaya, tekstur, pencahayaan, dan palet warna. Prompt seperti “pencahayaan rim volumetrik lembut, palet biru dingin, tekstur matte” menghasilkan hasil yang lebih konsisten daripada deskriptor generik.
Hasilkan empat gambar sekaligus saat mengeksplorasi konsep baru. Biaya marginalnya kecil, dan variasinya memberi Anda bahan yang lebih baik untuk disempurnakan.
Sesuaikan rasio aspek dengan platform target Anda: 16:9 untuk YouTube dan desktop, 9:16 untuk TikTok/Reels/Stories, 1:1 untuk feed Instagram, dan 2:1 atau 20:9 untuk banner sinematik dan header website.
Iterasi pada prompt, bukan parameter. Keuntungan terbesar berasal dari deskripsi yang lebih jelas tentang subjek, komposisi, dan mood — bukan dari mengubah rasio aspek berulang kali.
Padukan dengan Grok Imagine Image Edit saat Anda perlu menyempurnakan atau memodifikasi hasil generasi. Kedua model dirancang untuk bekerja sama sebagai pipeline generate-then-edit.

Pertanyaan yang Sering Diajukan

Apa itu Grok Imagine Image?

Grok Imagine Image adalah model generasi teks-ke-gambar dari xAI, tersedia sebagai REST API yang dihosting di WaveSpeedAI. Model ini mengonversi prompt teks menjadi gambar berkualitas tinggi dalam 11 rasio aspek dan mendukung generasi batch hingga 4 gambar per permintaan.

Berapa biaya Grok Imagine Image?

Grok Imagine Image dikenakan biaya $0,022 per gambar di WaveSpeedAI, dengan maksimum 4 gambar per permintaan. Satu permintaan gambar adalah $0,022; batch empat gambar adalah $0,088.

Bisakah saya menggunakan Grok Imagine Image melalui API?

Ya. Grok Imagine Image sepenuhnya dapat diakses melalui REST inference API WaveSpeedAI tanpa cold start, tanpa penyediaan GPU, dan penagihan pay-per-use. Anda dapat memanggilnya langsung dengan WaveSpeed Python SDK atau klien HTTP apa pun.

Rasio aspek apa yang didukung Grok Imagine Image?

Grok Imagine Image mendukung 11 rasio aspek preset: 2:1, 20:9, 16:9, 4:3, 3:2, 1:1, 2:3, 3:4, 9:16, dan 9:20, ditambah opsi default. Ini menjadikannya ideal untuk menghasilkan konten untuk YouTube, TikTok, Instagram, dan banner sinematik dari satu API.

Berapa banyak gambar yang dapat dihasilkan Grok Imagine Image per permintaan?

Anda dapat menghasilkan antara 1 hingga 4 gambar dalam satu panggilan API Grok Imagine Image dengan mengatur parameter num_images. Ini berguna untuk iterasi cepat, pengujian A/B variasi kreatif, dan mengeksplorasi beberapa arah desain secara efisien.

Mulai Membangun dengan Grok Imagine Image Hari Ini

Grok Imagine Image membawa kemampuan teks-ke-gambar xAI ke endpoint inferensi siap produksi dengan kecepatan, keandalan, dan harga yang dapat diprediksi yang dibutuhkan oleh aplikasi nyata. Baik Anda sedang merilis alat SaaS kreatif, menskalakan konten kreatif pemasaran, atau membuat prototipe ide produk baru, ini adalah salah satu API teks-ke-gambar yang paling fleksibel dan hemat biaya yang tersedia saat ini.

Luncurkan Grok Imagine Image di WaveSpeedAI →