Tutorial Lengkap Seedream 4.0 hingga 5.0: Text-to-Image, Pengeditan, dan Pembuatan Multi-Gambar
Kuasai keluarga model Seedream dari ByteDance mulai dari 4.0 hingga 5.0. Pelajari pembuatan gambar dari teks, pengeditan gambar, pembuatan multi-gambar secara berurutan, rekayasa prompt, dan cara memilih versi yang tepat untuk alur kerja Anda.
Keluarga Seedream dari ByteDance telah berkembang pesat dari versi 4.0 hingga 5.0, dengan setiap rilis menghadirkan kemampuan baru untuk pembuatan gambar, pengeditan, dan penalaran cerdas. Tutorial ini mencakup seluruh rangkaian 4.0–5.0—apa yang paling unggul di setiap versi, varian model mana yang harus digunakan, dan cara mendapatkan hasil berkualitas produksi melalui API WaveSpeedAI.
Ikhtisar Keluarga Model
Jajaran Seedream 4.0–5.0 mendukung tiga jenis input—teks, satu gambar, dan beberapa gambar—yang memungkinkan pembuatan gambar dari teks, pengeditan gambar, penggabungan multi-gambar, dan pembuatan batch berurutan dengan konsistensi tema.
Setiap versi utama memiliki keunggulan yang berbeda:
| Versi | Posisi | Terbaik Untuk | Harga (WaveSpeedAI) |
|---|---|---|---|
| 4.0 | Efisiensi Tinggi | Iterasi cepat, poster sadar tata letak, desain grid, produksi hemat biaya | $0.027/gambar |
| 4.5 | Pengeditan Mendalam & Tipografi | Potret, visual merek, rendering teks tajam, komposisi poster 4K | $0.04/gambar |
| 5.0-Lite | 5.0 Ringan | Pembuatan dan pengeditan 5.0 cepat, titik masuk yang mudah diakses | Tersedia sekarang |
| 5.0-Preview | Pengetahuan & Penalaran | Topik tren, pencarian web, penalaran logis, konten spesifik domain | Segera hadir |
Seedream 4.0: Pembuatan Sadar Tata Letak
Seedream 4.0 dioptimalkan untuk poster multi-panel, desain konsep dengan teks, visual kunci seri (KV), dan aset media sosial. Unggul dalam tata letak berbasis grid, perencanaan ruang kosong untuk judul dan subjudul, serta peningkatan keterbacaan teks.
Spesifikasi Utama
- Output default: 2048x2048 (2K)
- Resolusi maksimum: 4096x4096
- Kecepatan inferensi: ~1,8 detik untuk gambar 2K
- Rasio aspek: 1:1, 3:2, 4:3, 16:9, 21:9, dan kustom
Varian Model
Seedream 4.0 hadir dengan empat varian di WaveSpeedAI, masing-masing dirancang untuk alur kerja yang berbeda:
bytedance/seedream-v4 — Teks ke gambar. Menghasilkan gambar dari prompt teks. Ideal untuk poster, seni konsep, dan grafis media sosial.
bytedance/seedream-v4/edit — Gambar ke gambar. Memodifikasi gambar yang sudah ada: penggantian pakaian, penggantian latar belakang, perubahan material, desain ulang interior. Mendukung hingga 10 gambar referensi.
bytedance/seedream-v4/sequential — Batch teks ke gambar. Menghasilkan beberapa gambar sekaligus dengan konsistensi antar gambar. Sempurna untuk lembar karakter, kampanye iklan, dan diagram langkah.
bytedance/seedream-v4/edit-sequential — Batch gambar ke gambar. Input multi-gambar dengan output batch. Memungkinkan penggabungan multi-gambar, transfer gaya di seluruh set, dan perbandingan varian A/B.
Prompting Teks ke Gambar (V4)
Saat membuat prompt untuk Seedream 4.0, tentukan subjek, tata letak (grid, triptych, dll.), penempatan teks (judul, subjudul, CTA), dan gaya yang diinginkan.
Poster Grid 2x2
Tata letak poster grid 2x2, margin bersih untuk tipografi, judul di tengah atas:
"SUMMER COLLECTION", subjudul: "New Arrivals 2026". Panel 1: resor tepi pantai;
Panel 2: koktail saat matahari terbenam; Panel 3: bunga tropis; Panel 4: ombak laut.
Gradasi warna yang konsisten, pencahayaan sinematik, warna merek #3CA2F6,
latar belakang mudah dibaca, minim kekacauan
Triptych
Panel triptych horizontal, narasi kiri ke kanan: matahari terbit di gunung ->
jalur pendakian -> perayaan di puncak, palet terpadu warna hangat bumi,
vignette lembut, gutter yang jelas, hierarki tipografi yang kuat,
ruang disiapkan untuk CTA "START YOUR ADVENTURE"
Poster Minimalis
Poster minimal, judul besar di tengah: "INNOVATION SUMMIT", subjudul kecil
di bawah: "March 2026 • San Francisco", satu objek fokus: patung
geometris abstrak, monokrom + aksen #3CA2F6, latar belakang mudah dibaca,
tata letak berbasis grid
Strip Komik
Tata letak strip komik 4 panel, placeholder gelembung ucapan.
Panel 1: pengembang menatap layar; Panel 2: AI menghasilkan solusi;
Panel 3: pengembang merayakan; Panel 4: "Semudah itu?"
Seni garis tebal, shading datar, gutter yang jelas, keterbacaan tinggi
Contoh API: Teks ke Gambar
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4",
{"prompt": "2x2 grid poster, title: 'TECH EXPO 2026', four futuristic product concepts, clean margins, cinematic lighting, brand color blue"},
)
print(output["outputs"][0])
Pengeditan Gambar (V4 Edit)
Varian edit memodifikasi gambar yang sudah ada sambil mempertahankan identitas subjek, pencahayaan, dan komposisi. Gunakan prompt yang jelas dan terstruktur mengikuti pola: aksi + objek + fitur target + batasan.
Penggantian Pakaian
Penggantian pakaian untuk potret, ganti pakaian dengan jas navy elegan;
pertahankan pose dan komposisi; aksesori: jam tangan emas;
riasan/rambut tidak berubah; pertahankan warna kulit dan pencahayaan;
tepi bersih, tidak ada artefak
Penggantian Latar Belakang
Penggantian latar belakang untuk subjek, pertahankan tepi subjek;
lingkungan baru: kantor modern dengan jendela dari lantai ke langit-langit;
cocokkan arah cahaya dan suhu warna;
bayangan kontak lembut; tidak ada haloing
Desain Ulang Interior
Penggantian finishing interior, perbarui dinding menjadi bata ekspos,
lantai menjadi kayu keras gelap, pelapis furnitur menjadi linen arang;
tata letak dan pencahayaan tidak berubah; tekstur PBR realistis
Contoh API: Pengeditan Gambar
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4/edit",
{
"prompt": "Replace the background with a tropical beach at sunset, match light direction, soft shadows",
"image": "https://example.com/portrait.jpg",
},
)
print(output["outputs"][0])
Pembuatan Sekuensial (V4 Sequential)
Varian sekuensial menghasilkan beberapa gambar dalam satu panggilan dengan gaya, identitas, dan palet yang konsisten di seluruh set. Anda harus menentukan jumlah gambar baik dalam prompt maupun parameter max_images.
Lembar Desain Karakter
Hasilkan 6 lembar karakter seorang peretas cyberpunk.
Gambar 1: pose netral; Gambar 2: pose aksi; Gambar 3: profil samping;
Gambar 4: tampilan belakang; Gambar 5: ekspresi gembira; Gambar 6: ekspresi serius.
Pakaian dan palet yang sama, gaya turnaround bersih.
Kampanye Iklan
Hasilkan 4 konsep poster dari kampanye merek kopi yang sama.
Gambar 1: headline "WAKE UP", cahaya pagi;
Gambar 2: headline "FUEL UP", energi siang;
Gambar 3: headline "WIND DOWN", kehangatan sore;
Gambar 4: headline "DREAM ON", suasana malam.
Pertahankan warna merek coklat/emas, grid dan margin yang konsisten, pencahayaan sinematik.
Contoh API: Pembuatan Sekuensial
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4/sequential",
{
"prompt": "Generate 4 images of a sneaker in different colorways. Image 1: white/blue; Image 2: black/gold; Image 3: red/white; Image 4: green/cream. Studio lighting, identical angle and composition, clean background.",
"max_images": 4,
},
)
for url in output["outputs"]:
print(url)
Catatan biaya: Model sekuensial menagih per
max_images, bukan per output aktual. Jika Anda menetapkanmax_images=4tetapi hanya mendeskripsikan 2 gambar dalam prompt Anda, Anda tetap akan ditagih untuk 4. Selalu cocokkan jumlah dalam prompt Anda denganmax_images.
Seedream 4.5: Tipografi dan Pengeditan Mendalam
Seedream 4.5 dibangun di atas 4.0 dengan peningkatan signifikan dalam rendering teks, kepatuhan prompt, kualitas estetika, dan konsistensi gambar referensi. Ini adalah pilihan yang direkomendasikan untuk pekerjaan apa pun yang melibatkan tipografi, visual bermerek, atau pengeditan potret.
Peningkatan Utama dari 4.0
- Tipografi yang disempurnakan: Teks tajam dan mudah dibaca untuk poster, logo, UI, dan tata letak pemasaran
- Komposisi tingkat desainer: Menangani tata letak bergaya poster kompleks dengan hierarki yang jelas
- Kepatuhan prompt yang lebih kuat: Mengikuti dengan cermat deskripsi detail untuk subjek, tata letak, dan gaya
- Resolusi lebih tinggi: Mendukung 2560x1440 hingga 4096x4096 (minimum lebih tinggi dari V4)
- Konsistensi referensi yang lebih baik: Mempertahankan fitur wajah, pencahayaan, dan nada warna dari gambar referensi
Varian Model
Seperti V4, Seedream 4.5 menawarkan empat varian di WaveSpeedAI:
| Varian | Path Model | Tipe | Kasus Penggunaan |
|---|---|---|---|
| Base | bytedance/seedream-v4.5 | Teks ke Gambar | Poster berat tipografi, visual merek |
| Edit | bytedance/seedream-v4.5/edit | Gambar ke Gambar | Pengeditan potret, retouching produk |
| Sequential | bytedance/seedream-v4.5/sequential | Batch T2I | Seri konsisten, set kampanye |
| Edit-Sequential | bytedance/seedream-v4.5/edit-sequential | Batch I2I | Penggabungan multi-gambar, transfer gaya |
Resolusi yang Direkomendasikan (V4.5)
| Rasio Aspek | Resolusi yang Disarankan |
|---|---|
| 1:1 | 2048x2048 |
| 4:3 | 2688x2016 |
| 3:2 | 2688x1792 |
| 16:9 | 2560x1440 |
| Square 4K | 4096x4096 |
Praktik Terbaik Rendering Teks
Fitur unggulan Seedream 4.5 adalah pembuatan teks akurat dalam gambar. Ikuti panduan ini untuk hasil terbaik:
- Gunakan tanda kutip ganda di sekitar teks yang harus muncul dalam gambar:
Buat poster dengan judul "Seedream 4.5" - Tentukan karakteristik font: “sans-serif tebal”, “skrip elegan”, “tulisan tangan”
- Deskripsikan penempatan teks: “judul tengah atas”, “subjudul di bawah”, “CTA kanan bawah”
- Jaga teks tetap singkat: 1–10 kata bekerja paling baik; paragraf panjang mungkin memiliki inkonsistensi
- Gunakan resolusi lebih tinggi: 2048x2048 atau di atasnya memberikan tipografi yang jauh lebih bersih
Contoh: Poster Merek
Poster konferensi teknologi minimalis, latar belakang navy gelap.
Judul putih huruf besar besar di bagian atas: "AI SUMMIT 2026".
Subjudul abu-abu kecil di bawah: "San Francisco • June 15-17".
Bentuk geometris holografis abstrak di tengah.
Aksen warna merek #3CA2F6. Tata letak grid bersih, ruang kosong yang luas.
Contoh API: Pembuatan Berat Tipografi
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4.5",
{
"prompt": "Coffee shop menu board, chalkboard style, title 'DAILY SPECIALS' in bold chalk lettering, items: Espresso $3, Latte $4, Cappuccino $4.50, warm ambient lighting, cozy cafe atmosphere",
"size": "2048x2048",
},
)
print(output["outputs"][0])
Pembuatan Berbasis Referensi (V4.5 Edit)
Seedream 4.5 Edit unggul dalam mengekstrak dan mempertahankan karakteristik visual dari gambar referensi:
Transfer Gradasi Warna
Ubah nada warna Gambar 1 agar sesuai dengan nada warna Gambar 2
Transfer Riasan
Transfer riasan dari Gambar 2 ke orang di Gambar 1
Penerapan Gaya Merek
Terapkan gaya desain merek Gambar 1 ke produk di Gambar 2,
buat gambar promosi seri merek yang serupa,
sertakan semua modul desain dari Gambar 1
Seedream 5.0-Preview: Kecerdasan dan Penalaran
Seedream 5.0-Preview memperkenalkan kemampuan yang melampaui pembuatan gambar tradisional. Ini mengutamakan pengetahuan dan kecerdasan daripada estetika murni, menambahkan pencarian web real-time, kontrol pengeditan yang presisi, dan penalaran logis tingkat lanjut.
Catatan: Untuk keindahan visual murni dan fotorealisme, Seedream 4.5 tetap menjadi pilihan yang direkomendasikan. Rilis penuh 5.0 akan menggabungkan kecerdasan dan estetika.
Pencarian Web Real-Time
5.0-Preview adalah model pembuatan gambar pertama yang mendukung pembuatan berbasis pencarian. Model secara cerdas menentukan kapan harus melakukan pencarian berdasarkan prompt Anda:
- Istilah sensitif waktu: Rilis produk terbaru, peristiwa terkini
- Entitas spesifik: Selebriti, merek, lokasi
- Kueri spesifik: Topik niche yang memerlukan akurasi faktual
Contoh prompt yang memicu pencarian:
Hasilkan desain konsep iPhone 17 Pro Max
Referensi antarmuka aplikasi Duolingo, rancang halaman
kartu flash kosakata dengan kata dan penghitung streak, masukkan
maskot burung hantu hijau
Hasilkan poster Olimpiade Musim Dingin Nordik: latar belakang aurora Norwegia,
pemain ski dengan seragam nasional, sertakan
elemen dan maskot Olimpiade
Penalaran Logis yang Cerdas
5.0-Preview menangani operasi kompleks yang memerlukan pemahaman konteks dan pengambilan keputusan multi-langkah:
Klasifikasi dan Distribusi
Klasifikasikan bunga di Gambar 1 berdasarkan varietasnya, atur mereka
secara terpisah di tiga vas yang ditampilkan di Gambar 2
Pemahaman Dunia Fisik
Dua penggaris alat tulis, atas adalah penggaris plastik 20cm,
bawah adalah penggaris baja 10cm
Penalaran 3D
Hasilkan bentuk rakitan 3D berdasarkan diagram tata letak datar kemasan
Pengetahuan Spesifik Domain
Referensi set gambar CAD ini, hasilkan visualisasi
bangunan yang realistis
Diagram tampak depan sistem pernapasan manusia menampilkan:
rongga hidung, lubang hidung, rongga mulut, faring, laring,
trakea, bronkus utama kiri dan kanan, paru-paru kiri dan kanan,
dan diafragma
Pengeditan Berbasis Contoh
Daripada mendeskripsikan transformasi kompleks, tunjukkan kepada model apa yang Anda inginkan dengan contoh sebelum/sesudah:
Referensi perubahan dari Gambar 1 ke Gambar 2, terapkan
operasi yang sama ke Gambar 3
Ini bekerja untuk perubahan gaya rambut, penggantian adegan, transformasi material, dan perubahan perspektif.
Panduan Rekayasa Prompt
Tips ini berlaku di semua versi Seedream 4.0–5.0.
Gunakan Bahasa Alami, Bukan Daftar Tag
Tulis narasi yang koheren daripada daftar kata kunci yang terfragmentasi:
Hindari:
gadis, gaun mewah, payung, jalan berjajar pohon, lukisan minyak, gaya Monet
Lebih baik:
Seorang gadis berbaju gaun mewah berjalan di bawah payung di sepanjang
jalan berjajar pohon, dalam gaya lukisan minyak Monet
Formula Struktur Prompt
[Subjek] + [Aksi/Pose] + [Lingkungan/Setting] + [Gaya] + [Detail Teknis] + [Konten Teks]
Contoh:
Seorang barista profesional (subjek) membuat latte art (aksi) di kedai kopi
spesialti modern (lingkungan), gaya fotorealistis (gaya),
cahaya pagi hangat melalui jendela besar, depth of field dangkal (teknis),
papan tulis di belakang mereka bertuliskan "ARTISAN ROASTERS" (konten teks)
Prompt Pengeditan
Untuk pengeditan gambar, gunakan instruksi spesifik dan tidak ambigu yang secara eksplisit menyatakan apa yang berubah dan apa yang tetap sama:
Hindari: Buat terlihat lebih baik
Lebih baik: Ganti langit mendung dengan latar belakang matahari terbenam yang hidup, nada oranye hangat; pertahankan bangunan dan latar depan tidak berubah
Markup Visual untuk Pengeditan Kompleks
Ketika deskripsi teks saja tidak cukup untuk pemosisian yang tepat, gunakan panah, kotak pembatas, atau coretan pada gambar referensi untuk menentukan wilayah tertentu yang akan dimodifikasi.
Kesalahan Umum
- Instruksi yang bertentangan: “Karakter kartun fotorealistis” — pilih satu arah gaya
- Terlalu memperumit prompt: Mulai sederhana, tambahkan detail secara bertahap
- Mengabaikan rasio aspek: Cocokkan dimensi dengan kasus penggunaan Anda (persegi untuk media sosial, lanskap untuk banner)
- Instruksi pengeditan yang samar: Hindari kata ganti seperti “ubah itu” — tentukan apa “itu” tersebut
Memilih Versi yang Tepat
Panduan Keputusan Cepat
- Butuh kecepatan dan biaya rendah? → Seedream 4.0
- Butuh teks yang tajam dalam gambar? → Seedream 4.5
- Butuh poster berkualitas merek? → Seedream 4.5
- Butuh set multi-gambar yang konsisten? → V4 atau V4.5 Sequential
- Butuh mengedit foto yang sudah ada? → V4 atau V4.5 Edit
- Butuh gambar tentang peristiwa terkini? → Seedream 5.0-Preview
- Butuh konten berbasis pengetahuan? → Seedream 5.0-Preview
Perbandingan Terperinci
| Kemampuan | 4.0 | 4.5 | 5.0-Preview |
|---|---|---|---|
| Teks ke Gambar | Ya | Ya | Ya |
| Pengeditan Gambar | Ya | Ya (lebih baik) | Ya |
| Multi-Gambar | Ya | Ya | Ya |
| Pembuatan Sekuensial | Ya | Ya | Ya |
| Rendering Teks | Baik | Sangat Baik | Baik |
| Pencarian Web | Tidak | Tidak | Ya |
| Penalaran Logis | Dasar | Dasar | Lanjutan |
| Resolusi Maks | 4096x4096 | 4096x4096 | 4K |
| Resolusi Min | ~320x320 | 2560x1440 | — |
| Kecepatan | Tercepat | Sedang | Sedang |
| Biaya | $0.027 | $0.04 | — |
Keterbatasan Versi
Seedream 4.0: Teks kecil mungkin berulang atau menurun kualitasnya; akurasi pengeditan lebih rendah dari 4.5.
Seedream 4.5: Terkadang ada masalah blur atau pemotongan; biaya dan waktu pembuatan lebih tinggi dari 4.0.
Seedream 5.0-Preview: Beberapa tampilan yang dihasilkan AI; terkadang ada masalah proporsi; ketidakstabilan struktur teks; penalaran grafik/data terbatas. Saat ini mengutamakan kecerdasan daripada estetika.
Semua Model yang Tersedia di WaveSpeedAI
| Model | Tipe | Harga | Terbaik Untuk |
|---|---|---|---|
bytedance/seedream-v4 | Teks ke Gambar | $0.027 | Poster, tata letak grid, desain konsep |
bytedance/seedream-v4/edit | Gambar ke Gambar | $0.027 | Penggantian pakaian, perubahan latar belakang, retouching |
bytedance/seedream-v4/sequential | Batch T2I | $0.027/gambar | Lembar karakter, set kampanye |
bytedance/seedream-v4/edit-sequential | Batch I2I | $0.027/gambar | Penggabungan multi-gambar, varian A/B |
bytedance/seedream-v4.5 | Teks ke Gambar | $0.04 | Tipografi, visual merek, poster 4K |
bytedance/seedream-v4.5/edit | Gambar ke Gambar | $0.04 | Pengeditan potret, transfer gaya/fitur |
bytedance/seedream-v4.5/sequential | Batch T2I | $0.04/gambar | Seri bermerek, kampanye konsisten |
bytedance/seedream-v4.5/edit-sequential | Batch I2I | $0.04/gambar | Pengeditan multi-gambar, eksplorasi desain |
bytedance/seedream-v5.0-lite | Teks ke Gambar | $0.035 | Pembuatan berbasis pengetahuan, pencarian web |
bytedance/seedream-v5.0-lite/edit | Gambar ke Gambar | $0.035 | Pengeditan cerdas, transfer fitur |
bytedance/seedream-v5.0-lite/sequential | Batch T2I | $0.035/gambar | Seri cerdas yang konsisten |
bytedance/seedream-v5.0-lite/edit-sequential | Batch I2I | $0.035/gambar | Pengeditan multi-gambar yang cerdas |
Memulai
- Daftar di WaveSpeedAI dan dapatkan kunci API Anda
- Instal SDK:
pip install wavespeed - Pilih model Anda berdasarkan panduan keputusan di atas
- Tulis prompt Anda menggunakan formula struktur dan praktik terbaik
- Hasilkan dan iterasi: Sempurnakan prompt berdasarkan hasil
import wavespeed
# Teks ke Gambar dengan Seedream 4.5
output = wavespeed.run(
"bytedance/seedream-v4.5",
{"prompt": "A sleek product showcase poster, title 'NEXT GEN' in bold white sans-serif, dark gradient background, floating smartphone with holographic screen, cinematic lighting, brand color #3CA2F6"},
)
print(output["outputs"][0])
import wavespeed
# Pengeditan Gambar dengan Seedream 4.0
output = wavespeed.run(
"bytedance/seedream-v4/edit",
{
"prompt": "Change the outfit to a formal black suit, keep the same pose and background lighting",
"image": "https://example.com/portrait.jpg",
},
)
print(output["outputs"][0])
import wavespeed
# Pembuatan Sekuensial dengan Seedream 4.0
output = wavespeed.run(
"bytedance/seedream-v4/sequential",
{
"prompt": "Generate 3 step-by-step tutorial visuals for making pour-over coffee. Image 1: grinding beans; Image 2: pouring water in circular motion; Image 3: finished cup with steam. Uniform warm style, numbered labels.",
"max_images": 3,
},
)
for url in output["outputs"]:
print(url)
Baik Anda membangun otomatisasi pemasaran, membuat konten media sosial dalam skala besar, atau mengembangkan aplikasi kreatif, keluarga Seedream 4.0–5.0 di WaveSpeedAI menyediakan spektrum lengkap mulai dari iterasi cepat hingga pembuatan yang cerdas berbasis pengetahuan.





