WAN 2.1 文本生成图像功能现已登陆WaveSpeedAI

WAN 2.1 文本生成图像功能现已登陆WaveSpeedAI

Wan 2.1 文本生成图像功能现已推出:轻松从文本创建令人惊艳的逼真图像

海报

我们很高兴地宣布,Wan 2.1 文本生成图像模型 现已在 WaveSpeed AI 上线,这是一款强大的工具,能将简单的文本提示转化为高质量、高逼真度的图像。 Wan 2.1 文本生成图像模型是为那些想要获得精确、细节丰富且视觉效果令人印象深刻的图像,而无需进行手动编辑或昂贵拍摄的用户设计的。它非常适合营销人员、设计师、教育工作者和开发人员快速轻松地创建视觉内容。

关于 Wan 2.1 文本生成图像模型

Wan 2.1 文本生成图像是完整的 Wan 2.1 视频模型套件的一部分,这是一个最先进的 AI 引擎,支持多种媒体生成任务,包括文本生成图像、文本生成视频、图像生成视频等。

现在,通过文本生成图像功能,您可以输入简单的提示词,在几秒钟内获得详细的、优美的图像。

📝 输入:纯文本提示词或文本 + 参考图像
🖼️ 输出:不同格式的高分辨率视觉内容
🔐 安全:集成了内容过滤和审核
🔄 可扩展:可在浏览器中使用或通过 API 用于自动化工作流

配图

模型亮点

Wan 2.1 文本生成图像经过优化,可以保留精细细节、生成一致的光照和空间透视,并在各种内容类型(包括肖像、场景、物体和纹理)上保持逼真度。

功能详情
输入文本提示词(可选支持参考图像作为输入)
输出JPEG、PNG、WebP(可选的 base64 编码)
分辨率最高达 1536x1536
宽高比支持正方形和宽/高长宽比
安全过滤内置审核和内容过滤

实际应用

各行各业的用户已经从 Wan 2.1 文本生成图像中受益:

  • 营销团队 在数分钟内生成营销活动视觉。
  • 产品设计师 将规格表转化为高逼真度的样机。
  • 教育工作者 按需说明历史或科学概念。
  • 内容创作者 用自定义图像丰富博客文章和社交媒体。

配图

如何编写有效的提示词

✅ 基础公式:提示词 = 主体 + 场景 + 风格

  • 主体:主要焦点(例如,“一辆复古自行车”)。
  • 场景:环境细节(例如,“停在阳光照耀的鹅卵石小路旁”)。
  • 风格:艺术风格(例如,“逼真的水彩画”)。
提示词示例结果
现代工作区,配有木制办公桌、自然光线和打开设计应用的笔记本电脑现代工作区,配有木制办公桌、自然光线和打开设计应用的笔记本电脑
欧洲女孩,看着镜头,穿着优雅的服装。商业摄影,户外,电影般的光照,半身特写,精致的淡妆,清晰的边缘。欧洲女孩,看着镜头,穿着优雅的服装。商业摄影,户外,电影般的光照,半身特写,精致的淡妆,清晰的边缘。

✅ 专业用户高级公式:提示词 = 主体(描述)+ 场景(描述)+ 风格 + 镜头语言 + 氛围 + 细节增强

  • 镜头语言:特写、远景、眼平线角度。
  • 氛围:梦幻、戏剧性、极简主义。
  • 细节增强:高分辨率、复杂纹理、光影效果。
提示词示例结果
手绘插画风格、欧美绘本、一只可爱的橙色猫,有大而明亮的眼睛、微笑和翘起的尾巴。猫的毛发细软,耳朵尖锐,胡须长而纤细。背景是简单的白色或浅色背景,突出猫的调皮和可爱。卡通风格,图片简洁明亮,色彩鲜艳。特写、正面视角。手绘插画风格、欧美绘本、一只可爱的橙色猫,有大而明亮的眼睛、微笑和翘起的尾巴。猫的毛发细软,耳朵尖锐,胡须长而纤细。背景是简单的白色或浅色背景,突出猫的调皮和可爱。卡通风格,图片简洁明亮,色彩鲜艳。特写、正面视角。
黑暗风格:一个戴着黑色眼罩的战士,长着长长的夜色黑发和破烂的披风,坚定地站立。面罩下锐利的眼睛散发出坚定的决心。紧握她的武器,她已准备好战斗,敏捷而强大。荒凉的战场和烟雾弥漫的天空增加了紧张感,营造出神秘、致命的氛围。黑暗风格:一个戴着黑色眼罩的战士,长着长长的夜色黑发和破烂的披风,坚定地站立。面罩下锐利的眼睛散发出坚定的决心。紧握她的武器,她已准备好战斗,敏捷而强大。荒凉的战场和烟雾弥漫的天空增加了紧张感,营造出神秘、致命的氛围。
油画风格肖像,女性具有鲜明的面部特征。她的五官立体感强,眼睛深邃,嘴唇饱满,皮肤细腻。图片采用暖色调,笔触明显,油彩厚实。背景简洁,突出人物。特写、居中构图。油画风格肖像,女性具有鲜明的面部特征。她的五官立体感强,眼睛深邃,嘴唇饱满,皮肤细腻。图片采用暖色调,笔触明显,油彩厚实。背景简洁,突出人物。特写、居中构图。

通过掌握提示词结构,您每次都能获得精确、一致的结果。

提示词库

通过多个维度来精心编写提示词,可以让您微调 AI 生成图像的各个方面,从构图到情绪。以下是一些关键的提示词维度,可以帮助您快速入门;欢迎在 Wan 2.1 文本生成图像中进行实验,超越这些类别,探索新的创意可能性!

  1. 镜头类型
    根据相机距离定义主体在画框中的显示范围。示例包括广角镜头、全景镜头、中景镜头、特写和极端特写。
  2. 镜头角度
    指定捕捉场景的视角,例如眼平线、低角度或鸟瞰图。
  3. 镜头选择
    表示虚拟镜头的类型——微距、长焦、广角等——以影响景深和透视。
  4. 艺术风格
    描述您想要的视觉效果或技术,例如水彩画、3D 卡通、极简线条艺术或反乌托邦科幻。
  5. 光照
    通过选择自然光、逆光、柔和漫射光、戏剧性侧光等来设置情绪和逼真度。
  6. 扩展想法
    通过添加色调、纹理、时代或设置、情感基调和构图规则(例如三分法则、对称性)等维度来扩展您的提示词。使用此库作为起点,组合各个维度,创造自己的类别,并细化每个提示词,直到获得您想要的确切外观和感觉!

立即开始

您现在可以直接在 WaveSpeed AI 游乐场中探索 Wan 2.1 文本生成图像,或通过 API 将其集成到您的工作流程中。 立即尝试!

🔗 Wan 2.1 文本生成图像
🔗 Wan 模型集合

TwitterLinkedIn 上关注我们,并加入我们的 Discord 频道以了解最新动态。