← ブログ

Seedream 4.0から5.0完全チュートリアル:テキストから画像生成、編集、マルチ画像生成

ByteDanceのSeedreamモデルファミリーを4.0から5.0まで徹底解説。テキストから画像生成、画像編集、シーケンシャルなマルチ画像作成、プロンプトエンジニアリング、そしてワークフローに最適なバージョンの選び方を学びましょう。

5 min read

ByteDanceのSeedreamファミリーはバージョン4.0から5.0へと急速に進化し、各リリースで画像生成、編集、インテリジェントな推論に関する新しい機能が追加されています。このチュートリアルでは、4.0〜5.0の全範囲を網羅し、各バージョンの得意分野、使用すべきモデルバリアント、そしてWaveSpeedAIのAPIを通じてプロダクション品質の結果を得る方法を解説します。


モデルファミリー概要

Seedream 4.0〜5.0のラインナップは、テキスト単一画像複数画像の3種類の入力をサポートしており、テキストから画像の生成、画像編集、複数画像のフュージョン、テーマの一貫性を持つシーケンシャルなバッチ生成が可能です。

各メジャーバージョンには明確な強みがあります:

バージョン位置付け最適な用途価格(WaveSpeedAI)
4.0高効率高速イテレーション、レイアウト対応ポスター、グリッドデザイン、コスト重視のプロダクション$0.027/枚
4.5ディープ編集・タイポグラフィポートレート、ブランドビジュアル、クリアなテキストレンダリング、4Kポスター制作$0.04/枚
5.0-Lite軽量5.0高速な5.0生成と編集、手軽なエントリーポイント現在利用可能
5.0-Preview知識・推論トレンドトピック、ウェブ検索、論理的推論、ドメイン固有コンテンツ近日公開

Seedream 4.0:レイアウト対応生成

Seedream 4.0は、マルチパネルポスターコピー入りコンセプトデザインシリーズキービジュアル(KV)ソーシャルメディア素材に最適化されています。グリッドベースのレイアウト、タイトルやサブタイトルのためのホワイトスペース計画、テキストの読みやすさの向上に優れています。

主な仕様

  • デフォルト出力: 2048x2048(2K)
  • 最大解像度: 4096x4096
  • 推論速度: 2K画像で約1.8秒
  • アスペクト比: 1:1、3:2、4:3、16:9、21:9、カスタム

モデルバリアント

Seedream 4.0はWaveSpeedAIで4つのバリアントを提供しており、それぞれ異なるワークフロー向けに設計されています:

bytedance/seedream-v4 — テキストから画像。テキストプロンプトから画像を生成。ポスター、コンセプトアート、ソーシャルメディアグラフィックに最適。

bytedance/seedream-v4/edit — 画像から画像。既存の画像を修正:アウトフィットの変更、背景の置き換え、素材変更、インテリアのリデザイン。最大10枚のリファレンス画像をサポート。

bytedance/seedream-v4/sequential — バッチテキストから画像。複数の画像を同時に生成し、画像間の一貫性を保持。キャラクターシート、広告キャンペーン、ステップ図に最適。

bytedance/seedream-v4/edit-sequential — バッチ画像から画像。複数画像入力とバッチ出力。複数画像のフュージョン、セット全体のスタイル転送、A/Bバリアント比較が可能。

テキストから画像のプロンプト(V4)

Seedream 4.0のプロンプトでは、被写体レイアウト(グリッド、三連画など)、テキスト配置(タイトル、サブタイトル、CTA)、希望するスタイルを指定します。

2x2グリッドポスター

2x2グリッドポスターレイアウト、タイポグラフィのためのクリーンなマージン、上部中央にタイトル:
"SUMMER COLLECTION"、サブタイトル: "New Arrivals 2026"。パネル1: ビーチサイドリゾート;
パネル2: サンセットカクテル; パネル3: トロピカルフラワー; パネル4: 海の波。
統一されたカラーグレーディング、シネマティックな照明、ブランドカラー#3CA2F6、
高い視認性の背景、ミニマルな構成

三連画

水平三連画パネル、左から右へのナラティブ: 山の日の出 ->
ハイキングトレイル -> 山頂での祝福、統一されたウォームアースカラーのパレット、
ソフトなビネット、クリアなガター、強いタイポグラフィ階層、
CTA "START YOUR ADVENTURE" のためのスペースを確保

ミニマリストポスター

ミニマルポスター、中央に大きなタイトル: "INNOVATION SUMMIT"、
その下に小さなサブタイトル: "March 2026 • San Francisco"、
単一のフォーカルオブジェクト: 抽象的な幾何学的彫刻、
モノクローム + アクセント#3CA2F6、高い視認性の背景、グリッドベースのレイアウト

コミックストリップ

4パネルコミックストリップレイアウト、吹き出しのプレースホルダー。
パネル1: 開発者が画面を見つめる; パネル2: AIがソリューションを生成;
パネル3: 開発者が喜ぶ; パネル4: "It was that easy?"
太いラインアート、フラットシェーディング、クリアなガター、高い読みやすさ

APIの例:テキストから画像

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4",
    {"prompt": "2x2グリッドポスター、タイトル: 'TECH EXPO 2026'、4つの未来的な製品コンセプト、クリーンなマージン、シネマティックな照明、ブランドカラーブルー"},
)

print(output["outputs"][0])

画像編集(V4 Edit)

editバリアントは、被写体のアイデンティティ、照明、構図を維持しながら既存の画像を修正します。アクション + オブジェクト + ターゲット特徴 + 制約のパターンに従った、明確で構造化されたプロンプトを使用してください。

アウトフィット変更

ポートレートのアウトフィットを変更、衣服をエレガントなネイビーブレザーに交換;
ポーズと構図を維持; アクセサリー: ゴールドウォッチ;
メイク/ヘアは変更なし; 肌のトーンと照明を維持;
クリーンなエッジ、アーティファクトなし

背景の置き換え

被写体の背景を置き換え、被写体のエッジを維持;
新しい環境: フロアトゥシーリングウィンドウのあるモダンなオフィス;
光の方向と色温度を合わせる;
ソフトなコンタクトシャドウ; ハローなし

インテリアのリデザイン

インテリアの仕上げを変更、壁を露出したレンガに、
床をダークハードウッドに、家具の張地をチャコールリネンに更新;
レイアウトと照明は変更なし; リアルなPBRテクスチャ

APIの例:画像編集

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4/edit",
    {
        "prompt": "背景をサンセット時のトロピカルビーチに置き換え、光の方向を合わせ、ソフトなシャドウを追加",
        "image": "https://example.com/portrait.jpg",
    },
)

print(output["outputs"][0])

シーケンシャル生成(V4 Sequential)

sequentialバリアントは、セット全体で一貫したスタイル、アイデンティティ、パレットを維持しながら、1回の呼び出しで複数の画像を生成します。プロンプトとmax_imagesパラメータの両方で画像の数を必ず指定してください。

キャラクターデザインシート

サイバーパンクハッカーのキャラクターシートを6枚生成。
画像1: ニュートラルポーズ; 画像2: アクションポーズ; 画像3: サイドプロファイル;
画像4: 背面ビュー; 画像5: 喜んだ表情; 画像6: 真剣な表情。
同じアウトフィットとパレット、クリーンなターンアラウンドスタイル。

広告キャンペーン

同じコーヒーブランドキャンペーンのポスターコンセプトを4枚生成。
画像1: ヘッドライン "WAKE UP"、朝の光;
画像2: ヘッドライン "FUEL UP"、午後のエネルギー;
画像3: ヘッドライン "WIND DOWN"、夕方の温もり;
画像4: ヘッドライン "DREAM ON"、夜の雰囲気。
ブランドカラーのブラウン/ゴールドを維持、一貫したグリッドとマージン、シネマティックな照明。

APIの例:シーケンシャル生成

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4/sequential",
    {
        "prompt": "スニーカーの異なるカラーウェイを4枚生成。画像1: ホワイト/ブルー; 画像2: ブラック/ゴールド; 画像3: レッド/ホワイト; 画像4: グリーン/クリーム。スタジオ照明、同一の角度と構図、クリーンな背景。",
        "max_images": 4,
    },
)

for url in output["outputs"]:
    print(url)

コストに関する注意: sequentialモデルは実際の出力数ではなくmax_imagesに対して課金されます。max_images=4を設定してもプロンプトで2枚しか説明していない場合、4枚分の料金が請求されます。プロンプト内の数とmax_imagesを常に一致させてください。


Seedream 4.5:タイポグラフィとディープ編集

Seedream 4.5は4.0をベースに、テキストレンダリングプロンプト遵守美的品質リファレンス画像の一貫性において大幅な改善を加えています。タイポグラフィ、ブランドビジュアル、ポートレート編集を含む作業に推奨される選択肢です。

4.0からの主な改善点

  • 強化されたタイポグラフィ: ポスター、ロゴ、UI、マーケティングレイアウト向けのシャープで読みやすいテキスト
  • デザイナーレベルのコンポジション: 明確な階層を持つ複雑なポスタースタイルのレイアウトに対応
  • より強いプロンプト遵守: 被写体、レイアウト、スタイルの詳細な説明に忠実に従う
  • より高い解像度: 2560x1440から4096x4096をサポート(V4よりも高い最小値)
  • より良いリファレンスの一貫性: リファレンス画像からの顔の特徴、照明、カラートーンを維持

モデルバリアント

V4と同様に、Seedream 4.5はWaveSpeedAIで4つのバリアントを提供しています:

バリアントモデルパスタイプユースケース
ベースbytedance/seedream-v4.5テキストから画像タイポグラフィ重視のポスター、ブランドビジュアル
編集bytedance/seedream-v4.5/edit画像から画像ポートレート編集、製品レタッチ
シーケンシャルbytedance/seedream-v4.5/sequentialバッチT2I一貫したシリーズ、キャンペーンセット
編集シーケンシャルbytedance/seedream-v4.5/edit-sequentialバッチI2I複数画像フュージョン、スタイル転送

推奨解像度(V4.5)

アスペクト比推奨解像度
1:12048x2048
4:32688x2016
3:22688x1792
16:92560x1440
スクエア4K4096x4096

テキストレンダリングのベストプラクティス

Seedream 4.5の際立った機能は、画像内での正確なテキスト生成です。最良の結果を得るには以下のガイドラインに従ってください:

  1. ダブルクォートを使用: 画像内に表示させるテキストはダブルクォートで囲む:タイトルが "Seedream 4.5" のポスターを生成
  2. フォントの特徴を指定: 「太いサンセリフ」、「エレガントなスクリプト」、「手書き」
  3. テキストの配置を説明: 「タイトルを上部中央」、「サブタイトルは下」、「CTAは右下」
  4. テキストを短く: 1〜10語が最適。長い段落は不一致が生じる可能性あり
  5. より高い解像度を使用: 2048x2048以上で明らかにクリーンなタイポグラフィが得られる

例:ブランドポスター

ミニマリストなテックカンファレンスポスター、ダークネイビーの背景。
上部に大きな白いオールキャップスのタイトル: "AI SUMMIT 2026"。
その下に小さなグレーのサブタイトル: "San Francisco • June 15-17"。
中央に抽象的なホログラフィックな幾何学的形状。
ブランドカラーアクセント#3CA2F6。クリーンなグリッドレイアウト、十分なホワイトスペース。

APIの例:タイポグラフィ重視の生成

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4.5",
    {
        "prompt": "コーヒーショップのメニューボード、黒板スタイル、太いチョーク文字でタイトル 'DAILY SPECIALS'、アイテム: Espresso $3、Latte $4、Cappuccino $4.50、温かみのある周囲の照明、居心地の良いカフェの雰囲気",
        "size": "2048x2048",
    },
)

print(output["outputs"][0])

リファレンスベースの生成(V4.5 Edit)

Seedream 4.5 Editはリファレンス画像から視覚的特徴を抽出して維持することに優れています:

カラーグレーディング転送

画像1のカラートーンを画像2のカラートーンに合わせて変更

メイクアップ転送

画像2のメイクアップを画像1の人物に適用

ブランドスタイルの適用

画像1のブランドデザインスタイルを画像2の製品に適用し、
類似したブランドシリーズのプロモーション画像を作成、
画像1のすべてのデザインモジュールを含める

Seedream 5.0-Preview:インテリジェンスと推論

Seedream 5.0-Previewは、従来の画像生成を超えた機能を導入しています。純粋な美しさよりも知識とインテリジェンスを優先し、リアルタイムウェブ検索、精密な編集制御、高度な論理的推論を追加しています。

注意: 純粋な視覚的美しさとフォトリアリズムには、Seedream 4.5が引き続き推奨される選択肢です。5.0の完全リリースではインテリジェンスと美しさの両方が組み合わされる予定です。

リアルタイムウェブ検索

5.0-Previewは検索ベースの生成をサポートする最初の画像生成モデルです。モデルはプロンプトに基づいて検索のタイミングをインテリジェントに判断します:

  • 時間に敏感な用語: 最近の製品リリース、現在のイベント
  • 特定のエンティティ: セレブリティ、ブランド、場所
  • ロングテールクエリ: 事実の正確さが必要なニッチなトピック

検索をトリガーするプロンプトの例:

iPhone 17 Pro Maxのコンセプトデザインを生成
Duolingoアプリのインターフェースを参考に、単語と連続記録カウンターを含む
語彙フラッシュカードページをデザイン、緑のフクロウのマスコットを組み込む
北欧の冬季オリンピックポスターを生成: ノルウェーのオーロラの背景、
国旗の制服を着たスキーヤー、オリンピックの要素とマスコットを含める

インテリジェントな論理的推論

5.0-Previewは、コンテキストの理解とマルチステップの意思決定を必要とする複雑な操作を処理します:

分類と配布

画像1の花を品種ごとに分類し、
画像2に示されている3つの花瓶にそれぞれ別々に配置

物理的世界の理解

2本の文房具定規、上は20cmのプラスチック定規、
下は10cmのスチール定規

3D推論

パッケージングの展開図に基づいて3D組み立て形状を生成

ドメイン固有の知識

このCAD図面セットを参考に、リアルな建物のビジュアライゼーションを生成
人体呼吸器系の前面図:鼻腔、鼻孔、口腔、咽頭、喉頭、
気管、左右の主気管支、左右の肺、横隔膜を示す図

例ベースの編集

複雑な変換を説明する代わりに、ビフォー/アフターの例でモデルに望む結果を示します:

画像1から画像2への変更を参考に、
同じ操作を画像3に適用

これはヘアスタイルの変更、シーンの入れ替え、素材の変換、視点の変更に機能します。


プロンプトエンジニアリングガイド

これらのヒントはSeedream 4.0〜5.0のすべてのバージョンに適用されます。

タグリストではなく自然言語を使用

断片的なキーワードリストではなく、一貫したナラティブを書きましょう:

避けるべき:

少女、豪華なドレス、パラソル、並木道、油絵、モネスタイル

推奨:

豪華なドレスを着た少女が並木道をパラソルを持って歩く姿を、
モネの油絵のスタイルで描く

プロンプト構造の公式

[被写体] + [アクション/ポーズ] + [環境/設定] + [スタイル] + [技術的詳細] + [テキストコンテンツ]

:

プロのバリスタが(被写体)ラテアートを作っている(アクション)モダンなスペシャルティコーヒーショップ(環境)、
フォトリアリスティックスタイル(スタイル)、大きな窓からの温かみのある朝の光、浅い被写界深度(技術的詳細)、
背後の黒板に "ARTISAN ROASTERS" と書かれている(テキストコンテンツ)

編集プロンプト

画像編集には、何が変わり何が変わらないかを明示した具体的で明確な指示を使用してください:

避けるべき: もっと良く見せて

推奨: 曇り空を鮮やかなサンセットの背景に置き換え、温かいオレンジトーン; 建物と前景は変更しない

複雑な編集のためのビジュアルマークアップ

テキストの説明だけでは正確な位置指定に不十分な場合は、リファレンス画像に矢印、バウンディングボックス、落書きを使用して修正する特定の領域を指定してください。

よくある間違い

  1. 矛盾する指示: 「フォトリアリスティックなカートーンキャラクター」— スタイルの方向性を一つ選ぶ
  2. プロンプトの過度な複雑化: シンプルに始め、段階的に詳細を追加
  3. アスペクト比の無視: ユースケースに合わせた寸法を選ぶ(ソーシャルメディアにはスクエア、バナーにはランドスケープ)
  4. 曖昧な編集指示: 「それを変更して」などの代名詞を避け、「それ」が何かを具体的に指定する

適切なバージョンの選択

クイック決定ガイド

  • 速度とコストを重視? → Seedream 4.0
  • 画像内のクリアなテキストが必要? → Seedream 4.5
  • ブランド品質のポスターが必要? → Seedream 4.5
  • 一貫した複数画像セットが必要? → V4またはV4.5 Sequential
  • 既存の写真を編集したい? → V4またはV4.5 Edit
  • 現在のイベントの画像が必要? → Seedream 5.0-Preview
  • 知識駆動のコンテンツが必要? → Seedream 5.0-Preview

詳細比較

機能4.04.55.0-Preview
テキストから画像ありありあり
画像編集ありあり(より優れた)あり
複数画像ありありあり
シーケンシャル生成ありありあり
テキストレンダリング良好優秀良好
ウェブ検索なしなしあり
論理的推論基本基本高度
最大解像度4096x40964096x40964K
最小解像度約320x3202560x1440
速度最速普通普通
コスト$0.027$0.04

バージョンの制限事項

Seedream 4.0: 小さなテキストが繰り返したり劣化する場合あり; 4.5より編集精度が低い。

Seedream 4.5: まれにぼかしやトリミングの問題が発生; 4.0よりコストと生成時間が高い。

Seedream 5.0-Preview: AI生成の外観が出る場合あり; まれに比率の問題; テキスト構造の不安定性; チャート/データの推論が限られている。現在は美しさよりもインテリジェンスを優先。


WaveSpeedAIで利用可能なすべてのモデル

モデルタイプ価格最適な用途
bytedance/seedream-v4テキストから画像$0.027ポスター、グリッドレイアウト、コンセプトデザイン
bytedance/seedream-v4/edit画像から画像$0.027アウトフィット変更、背景変更、レタッチ
bytedance/seedream-v4/sequentialバッチT2I$0.027/枚キャラクターシート、キャンペーンセット
bytedance/seedream-v4/edit-sequentialバッチI2I$0.027/枚複数画像フュージョン、A/Bバリアント
bytedance/seedream-v4.5テキストから画像$0.04タイポグラフィ、ブランドビジュアル、4Kポスター
bytedance/seedream-v4.5/edit画像から画像$0.04ポートレート編集、スタイル/特徴転送
bytedance/seedream-v4.5/sequentialバッチT2I$0.04/枚ブランドシリーズ、一貫したキャンペーン
bytedance/seedream-v4.5/edit-sequentialバッチI2I$0.04/枚複数画像編集、デザイン探索
bytedance/seedream-v5.0-liteテキストから画像$0.035知識駆動の生成、ウェブ検索
bytedance/seedream-v5.0-lite/edit画像から画像$0.035インテリジェント編集、特徴転送
bytedance/seedream-v5.0-lite/sequentialバッチT2I$0.035/枚一貫したインテリジェントシリーズ
bytedance/seedream-v5.0-lite/edit-sequentialバッチI2I$0.035/枚複数画像インテリジェント編集

はじめに

  1. WaveSpeedAIサインアップしてAPIキーを取得
  2. SDKをインストール: pip install wavespeed
  3. 上記の決定ガイドに基づいてモデルを選択
  4. 構造の公式とベストプラクティスを使ってプロンプトを作成
  5. 生成してイテレーション: 結果に基づいてプロンプトを改良
import wavespeed

# Seedream 4.5でテキストから画像を生成
output = wavespeed.run(
    "bytedance/seedream-v4.5",
    {"prompt": "スリークな製品ショーケースポスター、太い白いサンセリフのタイトル 'NEXT GEN'、ダークグラデーション背景、ホログラフィックスクリーンの浮かぶスマートフォン、シネマティックな照明、ブランドカラー#3CA2F6"},
)

print(output["outputs"][0])
import wavespeed

# Seedream 4.0で画像編集
output = wavespeed.run(
    "bytedance/seedream-v4/edit",
    {
        "prompt": "アウトフィットをフォーマルなブラックスーツに変更、同じポーズと背景の照明を維持",
        "image": "https://example.com/portrait.jpg",
    },
)

print(output["outputs"][0])
import wavespeed

# Seedream 4.0でシーケンシャル生成
output = wavespeed.run(
    "bytedance/seedream-v4/sequential",
    {
        "prompt": "ハンドドリップコーヒーの作り方のステップバイステップのチュートリアルビジュアルを3枚生成。画像1: 豆を挽く; 画像2: 円を描くように水を注ぐ; 画像3: 湯気の立つ完成したカップ。統一された温かみのあるスタイル、番号付きラベル。",
        "max_images": 3,
    },
)

for url in output["outputs"]:
    print(url)

マーケティングオートメーションの構築、大規模なソーシャルメディアコンテンツの作成、クリエイティブアプリケーションの開発を問わず、WaveSpeedAI上のSeedream 4.0〜5.0ファミリーは、高速なイテレーションからインテリジェントな知識駆動の生成まで、全スペクトルを提供します。