← 博客

Seedream 4.0到5.0完整教程:文生图、图像编辑与多图生成

全面掌握字节跳动Seedream模型系列,从4.0到5.0。学习文生图、图像编辑、顺序多图生成、提示词工程,以及如何为您的工作流选择合适的版本。

6 min read

ByteDance 的 Seedream 系列从 4.0 到 5.0 快速迭代,每个版本都为图像生成、编辑和智能推理带来了新能力。本教程涵盖 4.0–5.0 的完整版本——每个版本的优势、应选用的模型变体,以及如何通过 WaveSpeedAI API 获得生产级效果。


模型系列概览

Seedream 4.0–5.0 系列支持三种输入类型——文本单张图像多张图像——从而实现文生图、图像编辑、多图融合以及具有主题一致性的批量序列生成。

每个主要版本各有独特优势:

版本定位最适合价格(WaveSpeedAI)
4.0高效率快速迭代、布局感知海报、网格设计、成本敏感型生产$0.027/张
4.5深度编辑与排版人像、品牌视觉、清晰文字渲染、4K 海报合成$0.04/张
5.0-Lite轻量级 5.0快速 5.0 生成与编辑,易于上手的入门版本现已可用
5.0-Preview知识与推理热点话题、网络搜索、逻辑推理、特定领域内容即将推出

Seedream 4.0:布局感知生成

Seedream 4.0 针对多面板海报含文案的概念设计系列主视觉(KV)社交媒体素材进行了优化。它擅长基于网格的布局、为标题和副标题预留留白空间,以及提升文字可读性。

关键参数

  • 默认输出:2048x2048(2K)
  • 最大分辨率:4096x4096
  • 推理速度:2K 图像约 1.8 秒
  • 宽高比:1:1、3:2、4:3、16:9、21:9 及自定义

模型变体

Seedream 4.0 在 WaveSpeedAI 上提供四个变体,每个变体针对不同工作流程设计:

bytedance/seedream-v4 — 文生图。根据文本提示词生成图像。适合海报、概念艺术和社交媒体图形。

bytedance/seedream-v4/edit — 图生图。修改现有图像:服装替换、背景更换、材质变更、室内重新设计。最多支持 10 张参考图像。

bytedance/seedream-v4/sequential — 批量文生图。一次生成多张图像,保持跨图一致性。非常适合角色设定集、广告投放和步骤图解。

bytedance/seedream-v4/edit-sequential — 批量图生图。多图输入批量输出。支持多图融合、跨组风格迁移以及 A/B 变体对比。

文生图提示词(V4)

使用 Seedream 4.0 时,请在提示词中指定主体布局(网格、三联画等)、文字位置(标题、副标题、行动号召)以及偏好风格

2x2 网格海报

2x2 网格海报布局,留有清晰的排版边距,顶部居中标题:
"SUMMER COLLECTION",副标题:"New Arrivals 2026"。面板 1:海滨度假村;
面板 2:日落鸡尾酒;面板 3:热带花卉;面板 4:海浪。
统一色彩调性,电影级光照,品牌色 #3CA2F6,
高可读性背景,简洁无杂乱

三联画

横向三联画面板,从左到右叙事:山间日出 ->
登山小道 -> 山顶庆祝,统一暖土色系调色板,
柔和暗角,清晰间隔,强烈的排版层次,
为行动号召"START YOUR ADVENTURE"预留空间

极简海报

极简海报,大标题居中:"INNOVATION SUMMIT",小副标题
在下方:"March 2026 • San Francisco",单一焦点物体:抽象
几何雕塑,单色 + 点缀色 #3CA2F6,高可读性
背景,基于网格的布局

漫画条

4 格漫画条布局,对话气泡占位符。
格 1:开发者盯着屏幕;格 2:AI 生成解决方案;
格 3:开发者庆祝;格 4:"就这么简单?"
粗线艺术风格,平涂着色,清晰间隔,高可读性

API 示例:文生图

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4",
    {"prompt": "2x2 网格海报,标题:'TECH EXPO 2026',四个未来感产品概念,清晰边距,电影级光照,品牌蓝色"},
)

print(output["outputs"][0])

图像编辑(V4 Edit)

编辑变体在保留主体身份、光照和构图的同时修改现有图像。请使用清晰、结构化的提示词,遵循以下模式:动作 + 对象 + 目标特征 + 约束条件

服装更换

为人像更换服装,将衣物替换为优雅的海军蓝西装;
保持姿势和构图;配饰:金表;
妆容/发型不变;保留肤色和光照;
干净边缘,无伪影

背景替换

替换主体背景,保持主体边缘;
新环境:有落地窗的现代办公室;
匹配光照方向和色温;
柔和接触阴影;无光晕

室内重新设计

更换室内装饰,将墙面改为裸砖,
地板改为深色硬木,家具软包改为木炭亚麻;
布局和光照不变;真实 PBR 纹理

API 示例:图像编辑

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4/edit",
    {
        "prompt": "将背景替换为日落时分的热带海滩,匹配光照方向,柔和阴影",
        "image": "https://example.com/portrait.jpg",
    },
)

print(output["outputs"][0])

序列生成(V4 Sequential)

序列变体在一次调用中生成多张图像,保持整组图像在风格、身份和调色板上的一致性。您必须在提示词和 max_images 参数中同时指定图像数量。

角色设定集

生成 6 张赛博朋克黑客角色设定图。
图 1:中立姿势;图 2:动作姿势;图 3:侧面轮廓;
图 4:背面视图;图 5:开心表情;图 6:严肃表情。
相同服装和调色板,清晰的转面风格。

广告活动

生成同一咖啡品牌活动的 4 张海报概念图。
图 1:标题"WAKE UP",清晨光线;
图 2:标题"FUEL UP",下午活力;
图 3:标题"WIND DOWN",傍晚温暖;
图 4:标题"DREAM ON",夜晚氛围。
保持品牌色棕色/金色,统一网格和边距,电影级光照。

API 示例:序列生成

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4/sequential",
    {
        "prompt": "生成 4 张不同配色的运动鞋图像。图 1:白/蓝;图 2:黑/金;图 3:红/白;图 4:绿/奶油色。棚拍光照,相同角度和构图,干净背景。",
        "max_images": 4,
    },
)

for url in output["outputs"]:
    print(url)

费用说明:序列模型按 max_images 计费,而非实际输出数量。如果您设置 max_images=4 但提示词中只描述了 2 张图像,仍会按 4 张收费。请始终使提示词中的数量与 max_images 匹配。


Seedream 4.5:排版与深度编辑

Seedream 4.5 在 4.0 基础上进行了重大改进,包括文字渲染提示词遵循美学质量参考图一致性。对于涉及排版、品牌视觉或人像编辑的任何工作,它都是推荐之选。

相较 4.0 的关键改进

  • 增强排版:清晰、易读的文字,适用于海报、标志、UI 和营销布局
  • 设计师级构图:处理具有清晰层次的复杂海报式布局
  • 更强的提示词遵循:严格遵循对主体、布局和风格的详细描述
  • 更高分辨率:支持 2560x1440 至 4096x4096(最低分辨率高于 V4)
  • 更好的参考一致性:保留参考图像中的面部特征、光照和色调

模型变体

与 V4 一样,Seedream 4.5 在 WaveSpeedAI 上提供四个变体:

变体模型路径类型使用场景
基础版bytedance/seedream-v4.5文生图排版密集海报、品牌视觉
编辑版bytedance/seedream-v4.5/edit图生图人像编辑、产品修图
序列版bytedance/seedream-v4.5/sequential批量文生图一致系列、活动套图
编辑序列版bytedance/seedream-v4.5/edit-sequential批量图生图多图融合、风格迁移

推荐分辨率(V4.5)

宽高比建议分辨率
1:12048x2048
4:32688x2016
3:22688x1792
16:92560x1440
正方形 4K4096x4096

文字渲染最佳实践

Seedream 4.5 的突出特点是在图像中准确生成文字。请遵循以下准则以获得最佳效果:

  1. 使用双引号括住必须出现在图像中的文字:生成一张标题为"Seedream 4.5"的海报
  2. 指定字体特征:“粗体无衬线”、“优雅手写体”、“手写风格”
  3. 描述文字位置:“标题顶部居中”、“副标题在下方”、“行动号召右下角”
  4. 保持文字简短:1–10 个词效果最佳;长段落可能出现不一致
  5. 使用更高分辨率:2048x2048 或以上可获得明显更清晰的排版效果

示例:品牌海报

极简科技会议海报,深海军蓝背景。
顶部大型白色全大写标题:"AI SUMMIT 2026"。
下方小灰色副标题:"San Francisco • June 15-17"。
居中抽象全息几何形状。
品牌色点缀 #3CA2F6。整洁网格布局,充裕留白。

API 示例:排版密集型生成

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4.5",
    {
        "prompt": "咖啡店菜单板,黑板风格,标题'DAILY SPECIALS'采用粗体粉笔字,项目:Espresso $3, Latte $4, Cappuccino $4.50,温暖的环境光照,舒适咖啡馆氛围",
        "size": "2048x2048",
    },
)

print(output["outputs"][0])

基于参考的生成(V4.5 Edit)

Seedream 4.5 Edit 擅长从参考图像中提取并保留视觉特征:

色彩调性迁移

将图 1 的色调改变为与图 2 的色调一致

妆容迁移

将图 2 中的妆容转移到图 1 中的人物身上

品牌风格应用

将图 1 的品牌设计风格应用于图 2 中的产品,
创建一张类似的品牌系列宣传图,
包含图 1 中的所有设计模块

Seedream 5.0-Preview:智能与推理

Seedream 5.0-Preview 引入了超越传统图像生成的能力。它优先关注知识与智能而非纯粹的美学,增加了实时网络搜索、精确编辑控制和高级逻辑推理功能。

说明:对于纯粹的视觉美感和照片级真实感,Seedream 4.5 仍是推荐选择。完整的 5.0 版本将同时兼顾智能与美学。

实时网络搜索

5.0-Preview 是第一个支持基于搜索生成的图像生成模型。该模型会根据您的提示词智能判断何时需要搜索:

  • 时效性词汇:近期产品发布、当前事件
  • 特定实体:名人、品牌、地点
  • 长尾查询:需要事实准确性的小众话题

触发搜索的示例提示词:

生成 iPhone 17 Pro Max 概念设计
参考 Duolingo 应用界面,设计一个带有单词和连续学习天数计数器的词汇
闪卡页面,融入绿色猫头鹰吉祥物
生成北欧冬季奥运会海报:挪威极光背景,
穿着国家队服的滑雪运动员,包含奥运
元素和吉祥物

智能逻辑推理

5.0-Preview 能处理需要理解上下文和多步骤决策的复杂操作:

分类与分配

将图 1 中的花按品种分类,分别摆放在
图 2 中展示的三个花瓶里

物理世界理解

两把文具尺,上方是 20cm 塑料尺,
下方是 10cm 钢尺

3D 推理

根据包装展开图生成 3D 组装后的形态

领域专业知识

参考这组 CAD 图纸,生成真实的
建筑效果图
人体呼吸系统正视图,标注:
鼻腔、鼻孔、口腔、咽、喉、
气管、左右主支气管、左右
肺和横膈膜

基于示例的编辑

无需描述复杂的变换,只需用前后对比示例向模型展示您想要的效果:

参考图 1 到图 2 的变化,将
相同的操作应用于图 3

这适用于发型变化、场景替换、材质变换和视角切换。


提示词工程指南

以下技巧适用于所有 Seedream 4.0–5.0 版本。

使用自然语言,而非标签列表

连贯的叙述而非碎片化的关键词列表:

避免

少女,华丽长裙,遮阳伞,林荫小道,油画,莫奈风格

推荐

一位身着华丽长裙的少女,撑着遮阳伞漫步在林荫小道上,
莫奈油画风格

提示词结构公式

[主体] + [动作/姿势] + [环境/场景] + [风格] + [技术细节] + [文字内容]

示例

一位专业咖啡师(主体)在一家现代精品咖啡馆(环境)制作拿铁艺术(动作),
写实风格(风格),大窗户透进的温暖晨光,浅景深(技术细节),
身后黑板上写着"ARTISAN ROASTERS"(文字内容)

编辑提示词

对于图像编辑,使用具体、明确的指令,明确说明哪些内容需要改变、哪些保持不变:

避免让它看起来更好

推荐将阴天天空替换为生动的日落背景,暖橙色调;保持建筑和前景不变

复杂编辑的视觉标注

当文字描述不足以精确定位时,在参考图像上使用箭头、边界框或涂鸦来标注需要修改的特定区域。

常见错误

  1. 相互冲突的指令:“写实卡通角色”——请选择一个风格方向
  2. 提示词过度复杂:从简单开始,逐步添加细节
  3. 忽略宽高比:根据使用场景匹配尺寸(社交媒体用正方形,横幅用横向)
  4. 模糊的编辑指令:避免使用”它”这样的代词——请明确指出”它”是什么

选择合适的版本

快速决策指南

  • 需要速度和低成本? → Seedream 4.0
  • 需要图像中清晰的文字? → Seedream 4.5
  • 需要品牌级海报? → Seedream 4.5
  • 需要一致的多图套组? → V4 或 V4.5 Sequential
  • 需要编辑现有照片? → V4 或 V4.5 Edit
  • 需要当前事件相关图像? → Seedream 5.0-Preview
  • 需要知识驱动的内容? → Seedream 5.0-Preview

详细对比

能力4.04.55.0-Preview
文生图支持支持支持
图像编辑支持支持(更佳)支持
多图处理支持支持支持
序列生成支持支持支持
文字渲染良好优秀良好
网络搜索
逻辑推理基础基础高级
最大分辨率4096x40964096x40964K
最小分辨率~320x3202560x1440
速度最快中等中等
价格$0.027$0.04

版本局限性

Seedream 4.0:小字可能重复或降质;编辑精度低于 4.5。

Seedream 4.5:偶尔出现模糊或裁切问题;成本和生成时间高于 4.0。

Seedream 5.0-Preview:部分图像有 AI 生成感;偶尔出现比例问题;文字结构不稳定;图表/数据推理能力有限。目前优先关注智能而非美学。


WaveSpeedAI 上所有可用模型

模型类型价格最适合
bytedance/seedream-v4文生图$0.027海报、网格布局、概念设计
bytedance/seedream-v4/edit图生图$0.027服装替换、背景更换、修图
bytedance/seedream-v4/sequential批量文生图$0.027/张角色设定集、活动套图
bytedance/seedream-v4/edit-sequential批量图生图$0.027/张多图融合、A/B 变体
bytedance/seedream-v4.5文生图$0.04排版、品牌视觉、4K 海报
bytedance/seedream-v4.5/edit图生图$0.04人像编辑、风格/特征迁移
bytedance/seedream-v4.5/sequential批量文生图$0.04/张品牌系列、一致活动套图
bytedance/seedream-v4.5/edit-sequential批量图生图$0.04/张多图编辑、设计探索
bytedance/seedream-v5.0-lite文生图$0.035知识驱动生成、网络搜索
bytedance/seedream-v5.0-lite/edit图生图$0.035智能编辑、特征迁移
bytedance/seedream-v5.0-lite/sequential批量文生图$0.035/张一致的智能系列
bytedance/seedream-v5.0-lite/edit-sequential批量图生图$0.035/张多图智能编辑

快速上手

  1. WaveSpeedAI 注册并获取 API 密钥
  2. 安装 SDKpip install wavespeed
  3. 根据上方决策指南选择您的模型
  4. 使用结构公式和最佳实践编写提示词
  5. 生成并迭代:根据结果优化提示词
import wavespeed

# 使用 Seedream 4.5 文生图
output = wavespeed.run(
    "bytedance/seedream-v4.5",
    {"prompt": "时尚产品展示海报,标题'NEXT GEN'采用粗体白色无衬线字体,深色渐变背景,漂浮的全息屏幕智能手机,电影级光照,品牌色 #3CA2F6"},
)

print(output["outputs"][0])
import wavespeed

# 使用 Seedream 4.0 图像编辑
output = wavespeed.run(
    "bytedance/seedream-v4/edit",
    {
        "prompt": "将服装改为正式黑色西装,保持相同的姿势和背景光照",
        "image": "https://example.com/portrait.jpg",
    },
)

print(output["outputs"][0])
import wavespeed

# 使用 Seedream 4.0 序列生成
output = wavespeed.run(
    "bytedance/seedream-v4/sequential",
    {
        "prompt": "生成 3 张手冲咖啡制作步骤教程视觉图。图 1:研磨咖啡豆;图 2:以画圆方式注水;图 3:冒着热气的成品咖啡杯。统一温暖风格,带编号标签。",
        "max_images": 3,
    },
)

for url in output["outputs"]:
    print(url)

无论您是在构建营销自动化、大规模创建社交媒体内容,还是开发创意应用,WaveSpeedAI 上的 Seedream 4.0–5.0 系列都能为您提供从快速迭代到智能知识驱动生成的全方位支持。