WAN 2.2趣味控制功能现已登陆WaveSpeedAI

免费试用 Wavespeed Ai Wan.2.2 Fun Control

介绍 Wan 2.2 Fun Control:具有多模态控制的精准视频生成

AI 视频生成世界刚刚取得了重大飞跃。我们很高兴宣布 Wan 2.2 Fun Control 现已在 WaveSpeedAI 上推出——这是一个强大的视频转视频生成模型,为您提供前所未有的创意控制。

由阿里巴巴 PAI 团队开发,基于先进的 Wan 2.2 架构,这个模型引入了创新的 Control Codes,让您能够以卓越的精度指导运动、结构和场景构图。无论您是在创建动态角色动画、转换现有素材,还是让静态图像生动起来,Wan 2.2 Fun Control 都能以您一直想要的控制力提供电影级品质的结果。

什么是 Wan 2.2 Fun Control?

Wan 2.2 Fun Control 代表了可控视频生成的下一个进化阶段。与传统的文本到视频模型不同,传统模型让运动基本上取决于概率,而这个模型将深度学习与多模态条件相结合,为创意工作者提供对视频合成各个方面的细粒度控制。

该模型利用阿里巴巴专有的混合专家(MoE)架构,该架构根据去噪时间步长智能地划分专家模型。这项技术创新使得视频内容的质量更高,具有稳定的运动、一致的身份保留和满足 VFX、广告和虚拟制作工作流标准的专业级输出。

与其前身相比,Wan 2.2 Fun Control 在大幅扩展的数据集上进行了训练——增加了 65.6% 的图像和 83.2% 的视频——在运动质量、语义理解和美学吸引力等多个维度上实现了开源和闭源模型中的顶级性能。

主要功能

多模态控制系统

Wan 2.2 Fun Control 的核心在于其多功能的控制输入选项:

  • Canny(边缘检测):使用边缘或线稿参考来指导物体形状和结构轮廓
  • 深度图:控制空间关系和 3D 构图,以实现自然的视差效果
  • OpenPose(骨骼跟踪):使用精确的骨骼关键点检测来指导人类姿态和运动
  • MLSD(几何线):在场景中保持建筑一致性和结构完整性
  • 轨迹控制:为物体和摄像机运动定义精确的运动路径

电影级品质的输出

建立在 Wan 2.2 基础之上,该模型融合了精心策划的美学数据,包括照明、构图、对比度和色调的详细标签。其结果是真正的电影级视频生成,具有可定制的美学偏好和专业级的视觉保真度。

扩展的视频时长

在 720p 分辨率下生成长达 120 秒的视频——这是一项可观的能力,可以实现更长的叙事序列、完整的舞蹈表演和扩展的动作场景,而无需拼接多个片段。

双语提示支持

接受中文和英文的提示,为国际团队和多样化工作流提供灵活的创意控制。

商业级许可证

在 Apache 2.0 许可证下发布,Wan 2.2 Fun Control 可以自由集成到商业产品中,没有法律歧义,为企业提供完全的部署灵活性。

现实应用场景

角色动画和运动转移

通过将参考图像与运动指导相结合,将静态角色设计转换为动态动画。使用某人跳舞或执行动作的控制视频,将其与您的角色设计配对,该模型会智能地将它们融合成一个连贯、风格一致的动画。这个工作流非常适合游戏开发者、动画师和需要快速让角色栩栩如生的内容创作者。

舞蹈和动作序列

Fun-Control 架构在生成扩展的舞蹈和打斗场景方面表现出色。社区用户称赞它能够生成长达 2 分钟的序列,具有一致的角色外观和自然的运动流——这些任务传统上需要大量的手工动画工作。

营销和广告内容

创建动态产品展示、品牌视频和宣传内容,对摄像机运动和场景构图进行精确控制。轨迹控制功能可以实现流畅的摄像机路径,从多个角度展示产品,同时保持专业的视觉质量。

虚拟制作和 VFX

电影和电视专业人士可以使用 Wan 2.2 Fun Control 生成预可视化内容、原型复杂镜头或创建用于合成的背景元素。深度图控制确保精确的空间关系,与实景素材无缝集成。

社交媒体和内容创作

将现有视频内容或静态图像转换为针对不同平台优化的新鲜、引人入胜的片段。该模型保留结构同时重新设计场景的能力使其非常适合在保持品牌一致性的同时跨频道重用内容。

在 WaveSpeedAI 上开始使用

在 WaveSpeedAI 上使用 Wan 2.2 Fun Control 简单直接,从第一天起就可以用于生产:

  1. 导航到模型:访问 wavespeed.ai/models/wavespeed-ai/wan-2.2/fun-control
  2. 上传您的输入:提供您的参考图像或视频以及您选择的控制图(Canny、Depth、OpenPose、MLSD 或 Trajectory)
  3. 编写您的提示:用英文或中文描述您所需的输出
  4. 选择分辨率:在 480p($0.04/秒)或 720p($0.08/秒)之间选择
  5. 生成:让模型展现其魔力

WaveSpeedAI 的基础设施确保您获得结果,而无需 AI 模型部署的典型摩擦:

  • 无冷启动:您的请求立即开始处理
  • REST API 就绪:直接集成到您的生产管道中
  • 可预测的定价:计费上限为 600 秒(10 分钟)以保持成本可管理
  • 价格亲民:最低费用从 480p 的 $0.20 或 720p 的 $0.40 开始

获得最佳结果的建议

  • 匹配宽高比:保持输入图像和目标视频尺寸一致以获得最优输出
  • 保持构图一致性:确保您的参考图像的姿态和摄像机角度与您的控制图一致
  • 从简单开始:从一到两种控制类型开始,随着工作流的改进而添加更多
  • 尝试控制组合:不同的项目可能受益于将 Depth 与 OpenPose 分层或将 Canny 与 Trajectory 控制相结合

将您的视频创作提升到新的高度

Wan 2.2 Fun Control 代表了创意工作者如何处理 AI 视频生成的根本转变。通过为艺术家、动画师、营销人员和电影制作人提供精确的控制工具,它弥合了创意愿景和 AI 生成输出之间的差距。

多模态控制输入、扩展视频时长、电影级品质和商业友好的许可证的结合使这个模型成为任何创意工作流的必要补充。而且凭借 WaveSpeedAI 可靠的基础设施、经济实惠的定价和即时的可用性,现在是探索可控视频生成能为您的项目做什么的最好时机。

准备好控制您的视频生成了吗? 立即在 WaveSpeedAI 上尝试 Wan 2.2 Fun Control,发现精准、专业级品质的 AI 视频现在只需点击几下即可获得。