← Blog

Tutorial Lengkap Seedream 4.0 hingga 5.0: Text-to-Image, Pengeditan, dan Pembuatan Multi-Gambar

Kuasai keluarga model Seedream dari ByteDance mulai dari 4.0 hingga 5.0. Pelajari pembuatan gambar dari teks, pengeditan gambar, pembuatan multi-gambar secara berurutan, rekayasa prompt, dan cara memilih versi yang tepat untuk alur kerja Anda.

14 min read

Keluarga Seedream dari ByteDance telah berkembang pesat dari versi 4.0 hingga 5.0, dengan setiap rilis menghadirkan kemampuan baru untuk pembuatan gambar, pengeditan, dan penalaran cerdas. Tutorial ini mencakup seluruh rangkaian 4.0–5.0—apa yang paling unggul di setiap versi, varian model mana yang harus digunakan, dan cara mendapatkan hasil berkualitas produksi melalui API WaveSpeedAI.


Ikhtisar Keluarga Model

Jajaran Seedream 4.0–5.0 mendukung tiga jenis input—teks, satu gambar, dan beberapa gambar—yang memungkinkan pembuatan gambar dari teks, pengeditan gambar, penggabungan multi-gambar, dan pembuatan batch berurutan dengan konsistensi tema.

Setiap versi utama memiliki keunggulan yang berbeda:

VersiPosisiTerbaik UntukHarga (WaveSpeedAI)
4.0Efisiensi TinggiIterasi cepat, poster sadar tata letak, desain grid, produksi hemat biaya$0.027/gambar
4.5Pengeditan Mendalam & TipografiPotret, visual merek, rendering teks tajam, komposisi poster 4K$0.04/gambar
5.0-Lite5.0 RinganPembuatan dan pengeditan 5.0 cepat, titik masuk yang mudah diaksesTersedia sekarang
5.0-PreviewPengetahuan & PenalaranTopik tren, pencarian web, penalaran logis, konten spesifik domainSegera hadir

Seedream 4.0: Pembuatan Sadar Tata Letak

Seedream 4.0 dioptimalkan untuk poster multi-panel, desain konsep dengan teks, visual kunci seri (KV), dan aset media sosial. Unggul dalam tata letak berbasis grid, perencanaan ruang kosong untuk judul dan subjudul, serta peningkatan keterbacaan teks.

Spesifikasi Utama

  • Output default: 2048x2048 (2K)
  • Resolusi maksimum: 4096x4096
  • Kecepatan inferensi: ~1,8 detik untuk gambar 2K
  • Rasio aspek: 1:1, 3:2, 4:3, 16:9, 21:9, dan kustom

Varian Model

Seedream 4.0 hadir dengan empat varian di WaveSpeedAI, masing-masing dirancang untuk alur kerja yang berbeda:

bytedance/seedream-v4 — Teks ke gambar. Menghasilkan gambar dari prompt teks. Ideal untuk poster, seni konsep, dan grafis media sosial.

bytedance/seedream-v4/edit — Gambar ke gambar. Memodifikasi gambar yang sudah ada: penggantian pakaian, penggantian latar belakang, perubahan material, desain ulang interior. Mendukung hingga 10 gambar referensi.

bytedance/seedream-v4/sequential — Batch teks ke gambar. Menghasilkan beberapa gambar sekaligus dengan konsistensi antar gambar. Sempurna untuk lembar karakter, kampanye iklan, dan diagram langkah.

bytedance/seedream-v4/edit-sequential — Batch gambar ke gambar. Input multi-gambar dengan output batch. Memungkinkan penggabungan multi-gambar, transfer gaya di seluruh set, dan perbandingan varian A/B.

Prompting Teks ke Gambar (V4)

Saat membuat prompt untuk Seedream 4.0, tentukan subjek, tata letak (grid, triptych, dll.), penempatan teks (judul, subjudul, CTA), dan gaya yang diinginkan.

Poster Grid 2x2

Tata letak poster grid 2x2, margin bersih untuk tipografi, judul di tengah atas:
"SUMMER COLLECTION", subjudul: "New Arrivals 2026". Panel 1: resor tepi pantai;
Panel 2: koktail saat matahari terbenam; Panel 3: bunga tropis; Panel 4: ombak laut.
Gradasi warna yang konsisten, pencahayaan sinematik, warna merek #3CA2F6,
latar belakang mudah dibaca, minim kekacauan

Triptych

Panel triptych horizontal, narasi kiri ke kanan: matahari terbit di gunung ->
jalur pendakian -> perayaan di puncak, palet terpadu warna hangat bumi,
vignette lembut, gutter yang jelas, hierarki tipografi yang kuat,
ruang disiapkan untuk CTA "START YOUR ADVENTURE"

Poster Minimalis

Poster minimal, judul besar di tengah: "INNOVATION SUMMIT", subjudul kecil
di bawah: "March 2026 • San Francisco", satu objek fokus: patung
geometris abstrak, monokrom + aksen #3CA2F6, latar belakang mudah dibaca,
tata letak berbasis grid

Strip Komik

Tata letak strip komik 4 panel, placeholder gelembung ucapan.
Panel 1: pengembang menatap layar; Panel 2: AI menghasilkan solusi;
Panel 3: pengembang merayakan; Panel 4: "Semudah itu?"
Seni garis tebal, shading datar, gutter yang jelas, keterbacaan tinggi

Contoh API: Teks ke Gambar

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4",
    {"prompt": "2x2 grid poster, title: 'TECH EXPO 2026', four futuristic product concepts, clean margins, cinematic lighting, brand color blue"},
)

print(output["outputs"][0])

Pengeditan Gambar (V4 Edit)

Varian edit memodifikasi gambar yang sudah ada sambil mempertahankan identitas subjek, pencahayaan, dan komposisi. Gunakan prompt yang jelas dan terstruktur mengikuti pola: aksi + objek + fitur target + batasan.

Penggantian Pakaian

Penggantian pakaian untuk potret, ganti pakaian dengan jas navy elegan;
pertahankan pose dan komposisi; aksesori: jam tangan emas;
riasan/rambut tidak berubah; pertahankan warna kulit dan pencahayaan;
tepi bersih, tidak ada artefak

Penggantian Latar Belakang

Penggantian latar belakang untuk subjek, pertahankan tepi subjek;
lingkungan baru: kantor modern dengan jendela dari lantai ke langit-langit;
cocokkan arah cahaya dan suhu warna;
bayangan kontak lembut; tidak ada haloing

Desain Ulang Interior

Penggantian finishing interior, perbarui dinding menjadi bata ekspos,
lantai menjadi kayu keras gelap, pelapis furnitur menjadi linen arang;
tata letak dan pencahayaan tidak berubah; tekstur PBR realistis

Contoh API: Pengeditan Gambar

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4/edit",
    {
        "prompt": "Replace the background with a tropical beach at sunset, match light direction, soft shadows",
        "image": "https://example.com/portrait.jpg",
    },
)

print(output["outputs"][0])

Pembuatan Sekuensial (V4 Sequential)

Varian sekuensial menghasilkan beberapa gambar dalam satu panggilan dengan gaya, identitas, dan palet yang konsisten di seluruh set. Anda harus menentukan jumlah gambar baik dalam prompt maupun parameter max_images.

Lembar Desain Karakter

Hasilkan 6 lembar karakter seorang peretas cyberpunk.
Gambar 1: pose netral; Gambar 2: pose aksi; Gambar 3: profil samping;
Gambar 4: tampilan belakang; Gambar 5: ekspresi gembira; Gambar 6: ekspresi serius.
Pakaian dan palet yang sama, gaya turnaround bersih.

Kampanye Iklan

Hasilkan 4 konsep poster dari kampanye merek kopi yang sama.
Gambar 1: headline "WAKE UP", cahaya pagi;
Gambar 2: headline "FUEL UP", energi siang;
Gambar 3: headline "WIND DOWN", kehangatan sore;
Gambar 4: headline "DREAM ON", suasana malam.
Pertahankan warna merek coklat/emas, grid dan margin yang konsisten, pencahayaan sinematik.

Contoh API: Pembuatan Sekuensial

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4/sequential",
    {
        "prompt": "Generate 4 images of a sneaker in different colorways. Image 1: white/blue; Image 2: black/gold; Image 3: red/white; Image 4: green/cream. Studio lighting, identical angle and composition, clean background.",
        "max_images": 4,
    },
)

for url in output["outputs"]:
    print(url)

Catatan biaya: Model sekuensial menagih per max_images, bukan per output aktual. Jika Anda menetapkan max_images=4 tetapi hanya mendeskripsikan 2 gambar dalam prompt Anda, Anda tetap akan ditagih untuk 4. Selalu cocokkan jumlah dalam prompt Anda dengan max_images.


Seedream 4.5: Tipografi dan Pengeditan Mendalam

Seedream 4.5 dibangun di atas 4.0 dengan peningkatan signifikan dalam rendering teks, kepatuhan prompt, kualitas estetika, dan konsistensi gambar referensi. Ini adalah pilihan yang direkomendasikan untuk pekerjaan apa pun yang melibatkan tipografi, visual bermerek, atau pengeditan potret.

Peningkatan Utama dari 4.0

  • Tipografi yang disempurnakan: Teks tajam dan mudah dibaca untuk poster, logo, UI, dan tata letak pemasaran
  • Komposisi tingkat desainer: Menangani tata letak bergaya poster kompleks dengan hierarki yang jelas
  • Kepatuhan prompt yang lebih kuat: Mengikuti dengan cermat deskripsi detail untuk subjek, tata letak, dan gaya
  • Resolusi lebih tinggi: Mendukung 2560x1440 hingga 4096x4096 (minimum lebih tinggi dari V4)
  • Konsistensi referensi yang lebih baik: Mempertahankan fitur wajah, pencahayaan, dan nada warna dari gambar referensi

Varian Model

Seperti V4, Seedream 4.5 menawarkan empat varian di WaveSpeedAI:

VarianPath ModelTipeKasus Penggunaan
Basebytedance/seedream-v4.5Teks ke GambarPoster berat tipografi, visual merek
Editbytedance/seedream-v4.5/editGambar ke GambarPengeditan potret, retouching produk
Sequentialbytedance/seedream-v4.5/sequentialBatch T2ISeri konsisten, set kampanye
Edit-Sequentialbytedance/seedream-v4.5/edit-sequentialBatch I2IPenggabungan multi-gambar, transfer gaya

Resolusi yang Direkomendasikan (V4.5)

Rasio AspekResolusi yang Disarankan
1:12048x2048
4:32688x2016
3:22688x1792
16:92560x1440
Square 4K4096x4096

Praktik Terbaik Rendering Teks

Fitur unggulan Seedream 4.5 adalah pembuatan teks akurat dalam gambar. Ikuti panduan ini untuk hasil terbaik:

  1. Gunakan tanda kutip ganda di sekitar teks yang harus muncul dalam gambar: Buat poster dengan judul "Seedream 4.5"
  2. Tentukan karakteristik font: “sans-serif tebal”, “skrip elegan”, “tulisan tangan”
  3. Deskripsikan penempatan teks: “judul tengah atas”, “subjudul di bawah”, “CTA kanan bawah”
  4. Jaga teks tetap singkat: 1–10 kata bekerja paling baik; paragraf panjang mungkin memiliki inkonsistensi
  5. Gunakan resolusi lebih tinggi: 2048x2048 atau di atasnya memberikan tipografi yang jauh lebih bersih

Contoh: Poster Merek

Poster konferensi teknologi minimalis, latar belakang navy gelap.
Judul putih huruf besar besar di bagian atas: "AI SUMMIT 2026".
Subjudul abu-abu kecil di bawah: "San Francisco • June 15-17".
Bentuk geometris holografis abstrak di tengah.
Aksen warna merek #3CA2F6. Tata letak grid bersih, ruang kosong yang luas.

Contoh API: Pembuatan Berat Tipografi

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4.5",
    {
        "prompt": "Coffee shop menu board, chalkboard style, title 'DAILY SPECIALS' in bold chalk lettering, items: Espresso $3, Latte $4, Cappuccino $4.50, warm ambient lighting, cozy cafe atmosphere",
        "size": "2048x2048",
    },
)

print(output["outputs"][0])

Pembuatan Berbasis Referensi (V4.5 Edit)

Seedream 4.5 Edit unggul dalam mengekstrak dan mempertahankan karakteristik visual dari gambar referensi:

Transfer Gradasi Warna

Ubah nada warna Gambar 1 agar sesuai dengan nada warna Gambar 2

Transfer Riasan

Transfer riasan dari Gambar 2 ke orang di Gambar 1

Penerapan Gaya Merek

Terapkan gaya desain merek Gambar 1 ke produk di Gambar 2,
buat gambar promosi seri merek yang serupa,
sertakan semua modul desain dari Gambar 1

Seedream 5.0-Preview: Kecerdasan dan Penalaran

Seedream 5.0-Preview memperkenalkan kemampuan yang melampaui pembuatan gambar tradisional. Ini mengutamakan pengetahuan dan kecerdasan daripada estetika murni, menambahkan pencarian web real-time, kontrol pengeditan yang presisi, dan penalaran logis tingkat lanjut.

Catatan: Untuk keindahan visual murni dan fotorealisme, Seedream 4.5 tetap menjadi pilihan yang direkomendasikan. Rilis penuh 5.0 akan menggabungkan kecerdasan dan estetika.

Pencarian Web Real-Time

5.0-Preview adalah model pembuatan gambar pertama yang mendukung pembuatan berbasis pencarian. Model secara cerdas menentukan kapan harus melakukan pencarian berdasarkan prompt Anda:

  • Istilah sensitif waktu: Rilis produk terbaru, peristiwa terkini
  • Entitas spesifik: Selebriti, merek, lokasi
  • Kueri spesifik: Topik niche yang memerlukan akurasi faktual

Contoh prompt yang memicu pencarian:

Hasilkan desain konsep iPhone 17 Pro Max
Referensi antarmuka aplikasi Duolingo, rancang halaman
kartu flash kosakata dengan kata dan penghitung streak, masukkan
maskot burung hantu hijau
Hasilkan poster Olimpiade Musim Dingin Nordik: latar belakang aurora Norwegia,
pemain ski dengan seragam nasional, sertakan
elemen dan maskot Olimpiade

Penalaran Logis yang Cerdas

5.0-Preview menangani operasi kompleks yang memerlukan pemahaman konteks dan pengambilan keputusan multi-langkah:

Klasifikasi dan Distribusi

Klasifikasikan bunga di Gambar 1 berdasarkan varietasnya, atur mereka
secara terpisah di tiga vas yang ditampilkan di Gambar 2

Pemahaman Dunia Fisik

Dua penggaris alat tulis, atas adalah penggaris plastik 20cm,
bawah adalah penggaris baja 10cm

Penalaran 3D

Hasilkan bentuk rakitan 3D berdasarkan diagram tata letak datar kemasan

Pengetahuan Spesifik Domain

Referensi set gambar CAD ini, hasilkan visualisasi
bangunan yang realistis
Diagram tampak depan sistem pernapasan manusia menampilkan:
rongga hidung, lubang hidung, rongga mulut, faring, laring,
trakea, bronkus utama kiri dan kanan, paru-paru kiri dan kanan,
dan diafragma

Pengeditan Berbasis Contoh

Daripada mendeskripsikan transformasi kompleks, tunjukkan kepada model apa yang Anda inginkan dengan contoh sebelum/sesudah:

Referensi perubahan dari Gambar 1 ke Gambar 2, terapkan
operasi yang sama ke Gambar 3

Ini bekerja untuk perubahan gaya rambut, penggantian adegan, transformasi material, dan perubahan perspektif.


Panduan Rekayasa Prompt

Tips ini berlaku di semua versi Seedream 4.0–5.0.

Gunakan Bahasa Alami, Bukan Daftar Tag

Tulis narasi yang koheren daripada daftar kata kunci yang terfragmentasi:

Hindari:

gadis, gaun mewah, payung, jalan berjajar pohon, lukisan minyak, gaya Monet

Lebih baik:

Seorang gadis berbaju gaun mewah berjalan di bawah payung di sepanjang
jalan berjajar pohon, dalam gaya lukisan minyak Monet

Formula Struktur Prompt

[Subjek] + [Aksi/Pose] + [Lingkungan/Setting] + [Gaya] + [Detail Teknis] + [Konten Teks]

Contoh:

Seorang barista profesional (subjek) membuat latte art (aksi) di kedai kopi
spesialti modern (lingkungan), gaya fotorealistis (gaya),
cahaya pagi hangat melalui jendela besar, depth of field dangkal (teknis),
papan tulis di belakang mereka bertuliskan "ARTISAN ROASTERS" (konten teks)

Prompt Pengeditan

Untuk pengeditan gambar, gunakan instruksi spesifik dan tidak ambigu yang secara eksplisit menyatakan apa yang berubah dan apa yang tetap sama:

Hindari: Buat terlihat lebih baik

Lebih baik: Ganti langit mendung dengan latar belakang matahari terbenam yang hidup, nada oranye hangat; pertahankan bangunan dan latar depan tidak berubah

Markup Visual untuk Pengeditan Kompleks

Ketika deskripsi teks saja tidak cukup untuk pemosisian yang tepat, gunakan panah, kotak pembatas, atau coretan pada gambar referensi untuk menentukan wilayah tertentu yang akan dimodifikasi.

Kesalahan Umum

  1. Instruksi yang bertentangan: “Karakter kartun fotorealistis” — pilih satu arah gaya
  2. Terlalu memperumit prompt: Mulai sederhana, tambahkan detail secara bertahap
  3. Mengabaikan rasio aspek: Cocokkan dimensi dengan kasus penggunaan Anda (persegi untuk media sosial, lanskap untuk banner)
  4. Instruksi pengeditan yang samar: Hindari kata ganti seperti “ubah itu” — tentukan apa “itu” tersebut

Memilih Versi yang Tepat

Panduan Keputusan Cepat

  • Butuh kecepatan dan biaya rendah? → Seedream 4.0
  • Butuh teks yang tajam dalam gambar? → Seedream 4.5
  • Butuh poster berkualitas merek? → Seedream 4.5
  • Butuh set multi-gambar yang konsisten? → V4 atau V4.5 Sequential
  • Butuh mengedit foto yang sudah ada? → V4 atau V4.5 Edit
  • Butuh gambar tentang peristiwa terkini? → Seedream 5.0-Preview
  • Butuh konten berbasis pengetahuan? → Seedream 5.0-Preview

Perbandingan Terperinci

Kemampuan4.04.55.0-Preview
Teks ke GambarYaYaYa
Pengeditan GambarYaYa (lebih baik)Ya
Multi-GambarYaYaYa
Pembuatan SekuensialYaYaYa
Rendering TeksBaikSangat BaikBaik
Pencarian WebTidakTidakYa
Penalaran LogisDasarDasarLanjutan
Resolusi Maks4096x40964096x40964K
Resolusi Min~320x3202560x1440
KecepatanTercepatSedangSedang
Biaya$0.027$0.04

Keterbatasan Versi

Seedream 4.0: Teks kecil mungkin berulang atau menurun kualitasnya; akurasi pengeditan lebih rendah dari 4.5.

Seedream 4.5: Terkadang ada masalah blur atau pemotongan; biaya dan waktu pembuatan lebih tinggi dari 4.0.

Seedream 5.0-Preview: Beberapa tampilan yang dihasilkan AI; terkadang ada masalah proporsi; ketidakstabilan struktur teks; penalaran grafik/data terbatas. Saat ini mengutamakan kecerdasan daripada estetika.


Semua Model yang Tersedia di WaveSpeedAI

ModelTipeHargaTerbaik Untuk
bytedance/seedream-v4Teks ke Gambar$0.027Poster, tata letak grid, desain konsep
bytedance/seedream-v4/editGambar ke Gambar$0.027Penggantian pakaian, perubahan latar belakang, retouching
bytedance/seedream-v4/sequentialBatch T2I$0.027/gambarLembar karakter, set kampanye
bytedance/seedream-v4/edit-sequentialBatch I2I$0.027/gambarPenggabungan multi-gambar, varian A/B
bytedance/seedream-v4.5Teks ke Gambar$0.04Tipografi, visual merek, poster 4K
bytedance/seedream-v4.5/editGambar ke Gambar$0.04Pengeditan potret, transfer gaya/fitur
bytedance/seedream-v4.5/sequentialBatch T2I$0.04/gambarSeri bermerek, kampanye konsisten
bytedance/seedream-v4.5/edit-sequentialBatch I2I$0.04/gambarPengeditan multi-gambar, eksplorasi desain
bytedance/seedream-v5.0-liteTeks ke Gambar$0.035Pembuatan berbasis pengetahuan, pencarian web
bytedance/seedream-v5.0-lite/editGambar ke Gambar$0.035Pengeditan cerdas, transfer fitur
bytedance/seedream-v5.0-lite/sequentialBatch T2I$0.035/gambarSeri cerdas yang konsisten
bytedance/seedream-v5.0-lite/edit-sequentialBatch I2I$0.035/gambarPengeditan multi-gambar yang cerdas

Memulai

  1. Daftar di WaveSpeedAI dan dapatkan kunci API Anda
  2. Instal SDK: pip install wavespeed
  3. Pilih model Anda berdasarkan panduan keputusan di atas
  4. Tulis prompt Anda menggunakan formula struktur dan praktik terbaik
  5. Hasilkan dan iterasi: Sempurnakan prompt berdasarkan hasil
import wavespeed

# Teks ke Gambar dengan Seedream 4.5
output = wavespeed.run(
    "bytedance/seedream-v4.5",
    {"prompt": "A sleek product showcase poster, title 'NEXT GEN' in bold white sans-serif, dark gradient background, floating smartphone with holographic screen, cinematic lighting, brand color #3CA2F6"},
)

print(output["outputs"][0])
import wavespeed

# Pengeditan Gambar dengan Seedream 4.0
output = wavespeed.run(
    "bytedance/seedream-v4/edit",
    {
        "prompt": "Change the outfit to a formal black suit, keep the same pose and background lighting",
        "image": "https://example.com/portrait.jpg",
    },
)

print(output["outputs"][0])
import wavespeed

# Pembuatan Sekuensial dengan Seedream 4.0
output = wavespeed.run(
    "bytedance/seedream-v4/sequential",
    {
        "prompt": "Generate 3 step-by-step tutorial visuals for making pour-over coffee. Image 1: grinding beans; Image 2: pouring water in circular motion; Image 3: finished cup with steam. Uniform warm style, numbered labels.",
        "max_images": 3,
    },
)

for url in output["outputs"]:
    print(url)

Baik Anda membangun otomatisasi pemasaran, membuat konten media sosial dalam skala besar, atau mengembangkan aplikasi kreatif, keluarga Seedream 4.0–5.0 di WaveSpeedAI menyediakan spektrum lengkap mulai dari iterasi cepat hingga pembuatan yang cerdas berbasis pengetahuan.