Seedream 4.0到5.0完整教程:文生图、图像编辑与多图生成
全面掌握字节跳动Seedream模型系列,从4.0到5.0。学习文生图、图像编辑、顺序多图生成、提示词工程,以及如何为您的工作流选择合适的版本。
ByteDance 的 Seedream 系列从 4.0 到 5.0 快速迭代,每个版本都为图像生成、编辑和智能推理带来了新能力。本教程涵盖 4.0–5.0 的完整版本——每个版本的优势、应选用的模型变体,以及如何通过 WaveSpeedAI API 获得生产级效果。
模型系列概览
Seedream 4.0–5.0 系列支持三种输入类型——文本、单张图像和多张图像——从而实现文生图、图像编辑、多图融合以及具有主题一致性的批量序列生成。
每个主要版本各有独特优势:
| 版本 | 定位 | 最适合 | 价格(WaveSpeedAI) |
|---|---|---|---|
| 4.0 | 高效率 | 快速迭代、布局感知海报、网格设计、成本敏感型生产 | $0.027/张 |
| 4.5 | 深度编辑与排版 | 人像、品牌视觉、清晰文字渲染、4K 海报合成 | $0.04/张 |
| 5.0-Lite | 轻量级 5.0 | 快速 5.0 生成与编辑,易于上手的入门版本 | 现已可用 |
| 5.0-Preview | 知识与推理 | 热点话题、网络搜索、逻辑推理、特定领域内容 | 即将推出 |
Seedream 4.0:布局感知生成
Seedream 4.0 针对多面板海报、含文案的概念设计、系列主视觉(KV)和社交媒体素材进行了优化。它擅长基于网格的布局、为标题和副标题预留留白空间,以及提升文字可读性。
关键参数
- 默认输出:2048x2048(2K)
- 最大分辨率:4096x4096
- 推理速度:2K 图像约 1.8 秒
- 宽高比:1:1、3:2、4:3、16:9、21:9 及自定义
模型变体
Seedream 4.0 在 WaveSpeedAI 上提供四个变体,每个变体针对不同工作流程设计:
bytedance/seedream-v4 — 文生图。根据文本提示词生成图像。适合海报、概念艺术和社交媒体图形。
bytedance/seedream-v4/edit — 图生图。修改现有图像:服装替换、背景更换、材质变更、室内重新设计。最多支持 10 张参考图像。
bytedance/seedream-v4/sequential — 批量文生图。一次生成多张图像,保持跨图一致性。非常适合角色设定集、广告投放和步骤图解。
bytedance/seedream-v4/edit-sequential — 批量图生图。多图输入批量输出。支持多图融合、跨组风格迁移以及 A/B 变体对比。
文生图提示词(V4)
使用 Seedream 4.0 时,请在提示词中指定主体、布局(网格、三联画等)、文字位置(标题、副标题、行动号召)以及偏好风格。
2x2 网格海报
2x2 网格海报布局,留有清晰的排版边距,顶部居中标题:
"SUMMER COLLECTION",副标题:"New Arrivals 2026"。面板 1:海滨度假村;
面板 2:日落鸡尾酒;面板 3:热带花卉;面板 4:海浪。
统一色彩调性,电影级光照,品牌色 #3CA2F6,
高可读性背景,简洁无杂乱
三联画
横向三联画面板,从左到右叙事:山间日出 ->
登山小道 -> 山顶庆祝,统一暖土色系调色板,
柔和暗角,清晰间隔,强烈的排版层次,
为行动号召"START YOUR ADVENTURE"预留空间
极简海报
极简海报,大标题居中:"INNOVATION SUMMIT",小副标题
在下方:"March 2026 • San Francisco",单一焦点物体:抽象
几何雕塑,单色 + 点缀色 #3CA2F6,高可读性
背景,基于网格的布局
漫画条
4 格漫画条布局,对话气泡占位符。
格 1:开发者盯着屏幕;格 2:AI 生成解决方案;
格 3:开发者庆祝;格 4:"就这么简单?"
粗线艺术风格,平涂着色,清晰间隔,高可读性
API 示例:文生图
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4",
{"prompt": "2x2 网格海报,标题:'TECH EXPO 2026',四个未来感产品概念,清晰边距,电影级光照,品牌蓝色"},
)
print(output["outputs"][0])
图像编辑(V4 Edit)
编辑变体在保留主体身份、光照和构图的同时修改现有图像。请使用清晰、结构化的提示词,遵循以下模式:动作 + 对象 + 目标特征 + 约束条件。
服装更换
为人像更换服装,将衣物替换为优雅的海军蓝西装;
保持姿势和构图;配饰:金表;
妆容/发型不变;保留肤色和光照;
干净边缘,无伪影
背景替换
替换主体背景,保持主体边缘;
新环境:有落地窗的现代办公室;
匹配光照方向和色温;
柔和接触阴影;无光晕
室内重新设计
更换室内装饰,将墙面改为裸砖,
地板改为深色硬木,家具软包改为木炭亚麻;
布局和光照不变;真实 PBR 纹理
API 示例:图像编辑
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4/edit",
{
"prompt": "将背景替换为日落时分的热带海滩,匹配光照方向,柔和阴影",
"image": "https://example.com/portrait.jpg",
},
)
print(output["outputs"][0])
序列生成(V4 Sequential)
序列变体在一次调用中生成多张图像,保持整组图像在风格、身份和调色板上的一致性。您必须在提示词和 max_images 参数中同时指定图像数量。
角色设定集
生成 6 张赛博朋克黑客角色设定图。
图 1:中立姿势;图 2:动作姿势;图 3:侧面轮廓;
图 4:背面视图;图 5:开心表情;图 6:严肃表情。
相同服装和调色板,清晰的转面风格。
广告活动
生成同一咖啡品牌活动的 4 张海报概念图。
图 1:标题"WAKE UP",清晨光线;
图 2:标题"FUEL UP",下午活力;
图 3:标题"WIND DOWN",傍晚温暖;
图 4:标题"DREAM ON",夜晚氛围。
保持品牌色棕色/金色,统一网格和边距,电影级光照。
API 示例:序列生成
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4/sequential",
{
"prompt": "生成 4 张不同配色的运动鞋图像。图 1:白/蓝;图 2:黑/金;图 3:红/白;图 4:绿/奶油色。棚拍光照,相同角度和构图,干净背景。",
"max_images": 4,
},
)
for url in output["outputs"]:
print(url)
费用说明:序列模型按
max_images计费,而非实际输出数量。如果您设置max_images=4但提示词中只描述了 2 张图像,仍会按 4 张收费。请始终使提示词中的数量与max_images匹配。
Seedream 4.5:排版与深度编辑
Seedream 4.5 在 4.0 基础上进行了重大改进,包括文字渲染、提示词遵循、美学质量和参考图一致性。对于涉及排版、品牌视觉或人像编辑的任何工作,它都是推荐之选。
相较 4.0 的关键改进
- 增强排版:清晰、易读的文字,适用于海报、标志、UI 和营销布局
- 设计师级构图:处理具有清晰层次的复杂海报式布局
- 更强的提示词遵循:严格遵循对主体、布局和风格的详细描述
- 更高分辨率:支持 2560x1440 至 4096x4096(最低分辨率高于 V4)
- 更好的参考一致性:保留参考图像中的面部特征、光照和色调
模型变体
与 V4 一样,Seedream 4.5 在 WaveSpeedAI 上提供四个变体:
| 变体 | 模型路径 | 类型 | 使用场景 |
|---|---|---|---|
| 基础版 | bytedance/seedream-v4.5 | 文生图 | 排版密集海报、品牌视觉 |
| 编辑版 | bytedance/seedream-v4.5/edit | 图生图 | 人像编辑、产品修图 |
| 序列版 | bytedance/seedream-v4.5/sequential | 批量文生图 | 一致系列、活动套图 |
| 编辑序列版 | bytedance/seedream-v4.5/edit-sequential | 批量图生图 | 多图融合、风格迁移 |
推荐分辨率(V4.5)
| 宽高比 | 建议分辨率 |
|---|---|
| 1:1 | 2048x2048 |
| 4:3 | 2688x2016 |
| 3:2 | 2688x1792 |
| 16:9 | 2560x1440 |
| 正方形 4K | 4096x4096 |
文字渲染最佳实践
Seedream 4.5 的突出特点是在图像中准确生成文字。请遵循以下准则以获得最佳效果:
- 使用双引号括住必须出现在图像中的文字:
生成一张标题为"Seedream 4.5"的海报 - 指定字体特征:“粗体无衬线”、“优雅手写体”、“手写风格”
- 描述文字位置:“标题顶部居中”、“副标题在下方”、“行动号召右下角”
- 保持文字简短:1–10 个词效果最佳;长段落可能出现不一致
- 使用更高分辨率:2048x2048 或以上可获得明显更清晰的排版效果
示例:品牌海报
极简科技会议海报,深海军蓝背景。
顶部大型白色全大写标题:"AI SUMMIT 2026"。
下方小灰色副标题:"San Francisco • June 15-17"。
居中抽象全息几何形状。
品牌色点缀 #3CA2F6。整洁网格布局,充裕留白。
API 示例:排版密集型生成
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4.5",
{
"prompt": "咖啡店菜单板,黑板风格,标题'DAILY SPECIALS'采用粗体粉笔字,项目:Espresso $3, Latte $4, Cappuccino $4.50,温暖的环境光照,舒适咖啡馆氛围",
"size": "2048x2048",
},
)
print(output["outputs"][0])
基于参考的生成(V4.5 Edit)
Seedream 4.5 Edit 擅长从参考图像中提取并保留视觉特征:
色彩调性迁移
将图 1 的色调改变为与图 2 的色调一致
妆容迁移
将图 2 中的妆容转移到图 1 中的人物身上
品牌风格应用
将图 1 的品牌设计风格应用于图 2 中的产品,
创建一张类似的品牌系列宣传图,
包含图 1 中的所有设计模块
Seedream 5.0-Preview:智能与推理
Seedream 5.0-Preview 引入了超越传统图像生成的能力。它优先关注知识与智能而非纯粹的美学,增加了实时网络搜索、精确编辑控制和高级逻辑推理功能。
说明:对于纯粹的视觉美感和照片级真实感,Seedream 4.5 仍是推荐选择。完整的 5.0 版本将同时兼顾智能与美学。
实时网络搜索
5.0-Preview 是第一个支持基于搜索生成的图像生成模型。该模型会根据您的提示词智能判断何时需要搜索:
- 时效性词汇:近期产品发布、当前事件
- 特定实体:名人、品牌、地点
- 长尾查询:需要事实准确性的小众话题
触发搜索的示例提示词:
生成 iPhone 17 Pro Max 概念设计
参考 Duolingo 应用界面,设计一个带有单词和连续学习天数计数器的词汇
闪卡页面,融入绿色猫头鹰吉祥物
生成北欧冬季奥运会海报:挪威极光背景,
穿着国家队服的滑雪运动员,包含奥运
元素和吉祥物
智能逻辑推理
5.0-Preview 能处理需要理解上下文和多步骤决策的复杂操作:
分类与分配
将图 1 中的花按品种分类,分别摆放在
图 2 中展示的三个花瓶里
物理世界理解
两把文具尺,上方是 20cm 塑料尺,
下方是 10cm 钢尺
3D 推理
根据包装展开图生成 3D 组装后的形态
领域专业知识
参考这组 CAD 图纸,生成真实的
建筑效果图
人体呼吸系统正视图,标注:
鼻腔、鼻孔、口腔、咽、喉、
气管、左右主支气管、左右
肺和横膈膜
基于示例的编辑
无需描述复杂的变换,只需用前后对比示例向模型展示您想要的效果:
参考图 1 到图 2 的变化,将
相同的操作应用于图 3
这适用于发型变化、场景替换、材质变换和视角切换。
提示词工程指南
以下技巧适用于所有 Seedream 4.0–5.0 版本。
使用自然语言,而非标签列表
写连贯的叙述而非碎片化的关键词列表:
避免:
少女,华丽长裙,遮阳伞,林荫小道,油画,莫奈风格
推荐:
一位身着华丽长裙的少女,撑着遮阳伞漫步在林荫小道上,
莫奈油画风格
提示词结构公式
[主体] + [动作/姿势] + [环境/场景] + [风格] + [技术细节] + [文字内容]
示例:
一位专业咖啡师(主体)在一家现代精品咖啡馆(环境)制作拿铁艺术(动作),
写实风格(风格),大窗户透进的温暖晨光,浅景深(技术细节),
身后黑板上写着"ARTISAN ROASTERS"(文字内容)
编辑提示词
对于图像编辑,使用具体、明确的指令,明确说明哪些内容需要改变、哪些保持不变:
避免:让它看起来更好
推荐:将阴天天空替换为生动的日落背景,暖橙色调;保持建筑和前景不变
复杂编辑的视觉标注
当文字描述不足以精确定位时,在参考图像上使用箭头、边界框或涂鸦来标注需要修改的特定区域。
常见错误
- 相互冲突的指令:“写实卡通角色”——请选择一个风格方向
- 提示词过度复杂:从简单开始,逐步添加细节
- 忽略宽高比:根据使用场景匹配尺寸(社交媒体用正方形,横幅用横向)
- 模糊的编辑指令:避免使用”它”这样的代词——请明确指出”它”是什么
选择合适的版本
快速决策指南
- 需要速度和低成本? → Seedream 4.0
- 需要图像中清晰的文字? → Seedream 4.5
- 需要品牌级海报? → Seedream 4.5
- 需要一致的多图套组? → V4 或 V4.5 Sequential
- 需要编辑现有照片? → V4 或 V4.5 Edit
- 需要当前事件相关图像? → Seedream 5.0-Preview
- 需要知识驱动的内容? → Seedream 5.0-Preview
详细对比
| 能力 | 4.0 | 4.5 | 5.0-Preview |
|---|---|---|---|
| 文生图 | 支持 | 支持 | 支持 |
| 图像编辑 | 支持 | 支持(更佳) | 支持 |
| 多图处理 | 支持 | 支持 | 支持 |
| 序列生成 | 支持 | 支持 | 支持 |
| 文字渲染 | 良好 | 优秀 | 良好 |
| 网络搜索 | 否 | 否 | 是 |
| 逻辑推理 | 基础 | 基础 | 高级 |
| 最大分辨率 | 4096x4096 | 4096x4096 | 4K |
| 最小分辨率 | ~320x320 | 2560x1440 | — |
| 速度 | 最快 | 中等 | 中等 |
| 价格 | $0.027 | $0.04 | — |
版本局限性
Seedream 4.0:小字可能重复或降质;编辑精度低于 4.5。
Seedream 4.5:偶尔出现模糊或裁切问题;成本和生成时间高于 4.0。
Seedream 5.0-Preview:部分图像有 AI 生成感;偶尔出现比例问题;文字结构不稳定;图表/数据推理能力有限。目前优先关注智能而非美学。
WaveSpeedAI 上所有可用模型
| 模型 | 类型 | 价格 | 最适合 |
|---|---|---|---|
bytedance/seedream-v4 | 文生图 | $0.027 | 海报、网格布局、概念设计 |
bytedance/seedream-v4/edit | 图生图 | $0.027 | 服装替换、背景更换、修图 |
bytedance/seedream-v4/sequential | 批量文生图 | $0.027/张 | 角色设定集、活动套图 |
bytedance/seedream-v4/edit-sequential | 批量图生图 | $0.027/张 | 多图融合、A/B 变体 |
bytedance/seedream-v4.5 | 文生图 | $0.04 | 排版、品牌视觉、4K 海报 |
bytedance/seedream-v4.5/edit | 图生图 | $0.04 | 人像编辑、风格/特征迁移 |
bytedance/seedream-v4.5/sequential | 批量文生图 | $0.04/张 | 品牌系列、一致活动套图 |
bytedance/seedream-v4.5/edit-sequential | 批量图生图 | $0.04/张 | 多图编辑、设计探索 |
bytedance/seedream-v5.0-lite | 文生图 | $0.035 | 知识驱动生成、网络搜索 |
bytedance/seedream-v5.0-lite/edit | 图生图 | $0.035 | 智能编辑、特征迁移 |
bytedance/seedream-v5.0-lite/sequential | 批量文生图 | $0.035/张 | 一致的智能系列 |
bytedance/seedream-v5.0-lite/edit-sequential | 批量图生图 | $0.035/张 | 多图智能编辑 |
快速上手
- 在 WaveSpeedAI 注册并获取 API 密钥
- 安装 SDK:
pip install wavespeed - 根据上方决策指南选择您的模型
- 使用结构公式和最佳实践编写提示词
- 生成并迭代:根据结果优化提示词
import wavespeed
# 使用 Seedream 4.5 文生图
output = wavespeed.run(
"bytedance/seedream-v4.5",
{"prompt": "时尚产品展示海报,标题'NEXT GEN'采用粗体白色无衬线字体,深色渐变背景,漂浮的全息屏幕智能手机,电影级光照,品牌色 #3CA2F6"},
)
print(output["outputs"][0])
import wavespeed
# 使用 Seedream 4.0 图像编辑
output = wavespeed.run(
"bytedance/seedream-v4/edit",
{
"prompt": "将服装改为正式黑色西装,保持相同的姿势和背景光照",
"image": "https://example.com/portrait.jpg",
},
)
print(output["outputs"][0])
import wavespeed
# 使用 Seedream 4.0 序列生成
output = wavespeed.run(
"bytedance/seedream-v4/sequential",
{
"prompt": "生成 3 张手冲咖啡制作步骤教程视觉图。图 1:研磨咖啡豆;图 2:以画圆方式注水;图 3:冒着热气的成品咖啡杯。统一温暖风格,带编号标签。",
"max_images": 3,
},
)
for url in output["outputs"]:
print(url)
无论您是在构建营销自动化、大规模创建社交媒体内容,还是开发创意应用,WaveSpeedAI 上的 Seedream 4.0–5.0 系列都能为您提供从快速迭代到智能知识驱动生成的全方位支持。





