百度ERNIE Image现已登陆WaveSpeedAI
百度ERNIE Image文生图模型——原生支持中文、英文、日文提示词,内置LLM提示词扩展,尺寸灵活可调。现已在WaveSpeedAI上线。
真正的多语言文生图模型,现已正式上线
大多数文生图模型主要基于英文描述训练。当你用中文或日文输入提示词时,模型会经过翻译过滤后进行近似的英文理解——语义因此模糊,文化细节也随之消失。百度文心Image与众不同:它能原生理解中文、英文和日文,像母语用户一样读懂提示词。我们很高兴宣布,百度文心Image现已在WaveSpeedAI上线,可通过我们统一的REST API访问。
什么是百度文心Image?
文心Image是百度旗舰级文生图模型,隶属于更大的文心(ERNIE,Enhanced Representation through kNowledge IntEgration)基础模型家族。基于百度在中文AI领域的深厚积累,文心Image是目前中文提示词忠实度、惯用表达理解以及文化本真视觉输出方面最强的开源模型之一。
与那些在纯英文底座上附加翻译层的改造方案不同,文心Image从训练阶段就内置了一流的多语言支持——因此中文提示词会生成具有原生中文气质的画面,日文提示词同样原汁原味,英文提示词的质量也与国际顶尖模型比肩。
核心功能
原生多语言提示词 用中文(简体中文)、英文或日文(日本語)直接输入——每种语言都是一等公民,而非翻译中转层。成语、文化意象和语言细微差别均能完整传达。
LLM增强提示词扩展 简短的提示词会被百度文心语言模型自动扩展为详尽生动的描述——无需手动精调提示词,少量输入即可获得丰富的生成结果。
灵活的尺寸选择 自由选择输出尺寸——竖版、横版、方形、自定义宽高比均可。完美适配社交媒体、印刷品、产品图和任意比例的应用界面设计。
高品质写实与插画表现 写实摄影风格、绘画风、动漫、3D渲染感和平面设计,各种风格均能出色呈现。
中式文化本真性 按提示词生成根植于中国美学的视觉作品——传统建筑、书法构图、地域服饰、真实的人物面孔与场景。
实际应用场景
跨境电商与营销
在单一流程中,为中文、日文和英文受众分别生成具有准确文化风格的产品图——无需针对不同市场切换模型。
内容本地化
生成在每种目标语言文化语境中自然呈现的视觉内容。单一工作流即可覆盖中/英/日多市场推广活动。
中文创意内容生产
插画、书籍封面设计、社交媒体图片、游戏概念图——直接用中文输入提示词,无需经过翻译损耗。
快速概念探索
LLM提示词扩展功能可将一句话变成丰富的场景,让艺术总监和设计师快速遍历创意想法。
本地化应用与产品图
为应用、网站和产品列表填充与各目标市场文化语境相符的图像素材。
在WaveSpeedAI上快速开始
- 选择语言 — 用中文、英文或日文撰写提示词,混合使用也可以。
- 选择尺寸 — 根据使用场景选择任意宽高比和分辨率。
- 提交 — 当输入内容较简短时,模型会在内部自动进行提示词扩展。
像调用任何其他模型一样,通过WaveSpeedAI REST API调用即可。完整的请求/响应格式详见模型页面。
定价
仅需每张图$0.03 — 无论使用何种语言,这都是市场上性价比最高的高质量文生图模型之一。
为什么在WaveSpeedAI上运行文心Image
- 一套API,900+模型。 只需修改一个字符串,即可在文心Image、SDXL、FLUX等模型之间切换。
- 无冷启动。 任意负载下均保持生产级延迟。
- 透明定价。 按图计费,无需订阅。
- 全球可访问。 无需部署中国云基础设施,即可在任何地方使用顶尖中文模型。
使用技巧
- 中文提示词请直接用中文书写,跳过机器翻译——这样能获得最准确的生成结果。
- 提示词聚焦于你想要的内容(主体、风格、场景、氛围),LLM扩展会自动补充细节。
- 将特定语言的惯用表达与风格关键词结合使用(如”水墨画风格”、“浮世绘”、“photorealistic cinematic”),以获得更具文化本真性的结果。
- 如需保持品牌输出一致性,锁定一个简短的前缀短语并变换主体——提示词扩展功能依然有效。
- 同时测试文心Image与文心Image Turbo——正式资产使用完整质量版本,创意探索阶段使用Turbo版本。
立即开始创作
百度文心Image为任意应用带来真正的多语言图像生成能力——原生支持中文、英文和日文,具备生产级可靠性,并采用按图计费定价。
立即在WaveSpeedAI上体验百度文心Image,将原生多语言图像模型纳入你的技术工具链。




