Kling O1 Series——统一图像与视频创作的新标准现已登陆WaveSpeedAI

Kling O1 Series——统一图像与视频创作的新标准现已登陆WaveSpeedAI

介绍 Kling O1 系列

WaveSpeedAI 荣幸正式推出 Kling O1 系列,这是一个建立在 ** 多模态视觉语言 (MVL)** 概念之上的下一代多模态创意家族。该系列包含两个强大的模型:

  • Kling Image O1 — 全场景图像创建和编辑模型
  • Kling Video O1 — 世界上首个统一的多模态视频模型

它们为创意工作者带来了一个完整的视觉制作引擎,能够处理文本、图像、主体和视频输入,具有卓越的一致性和创意灵活性。


Kling Image O1 — 全场景高级图像创建

Image O1 旨在消除整个图像创建流程中的摩擦,将文本生图、多参考融合、细粒度编辑和高保真风格迁移整合到一个无缝工作流中。

以下是其核心亮点。

跨最多 10 个参考的高特征一致性

Image O1 可以从多达 10 张参考图像 中提取并保持稳定的特征,保留:

  • 身份
  • 对象结构
  • 色调
  • 视觉轮廓
  • 整体风格方向

这对于 IP 角色设计、漫画帧一致性、品牌视觉系统和基于系列的概念艺术特别强大。


通过自然语言进行精确编辑

无需遮罩或手动修饰,Image O1 可以修改:

  • 对象
  • 人物
  • 颜色
  • 背景
  • 材质

…同时保持原始光照、阴影和纹理完整性。

提示:将桌子的材质改为石头。

原始图像

石桌编辑后的图像


忠实的风格解读与迁移

从毛毡纹理到 3D 小雕像风格再到小众艺术风格,Image O1 可以深度分析:

  • 笔触图案
  • 调色板结构
  • 构图逻辑

…提供自然且连贯的风格转换。

提示:将图片转换为乐高风格。

原始图像

乐高风格迁移


丰富的想象力与多参考融合

Image O1 支持混合创意流程,例如:

  • 草图 + 文本
  • 参考 + 风格变化
  • 多主体融合
  • 布局重新解读

它自然地融合源内容,而不会产生通常的”剪切粘贴”外观。

提示:将图片改为俯视图。

原始图像

生成的俯视图


Kling Video O1 — 世界上首个统一的多模态视频模型

Kling Video O1 通过在 一个统一的模型 中合并多个任务,带来了视频创建的突破性方法——无需模式切换,无需碎片化编辑步骤。

一体化创意引擎

Video O1 统一了之前需要单独工具的任务:

  • 文本生视频
  • 基于参考的视频生成
  • 首帧/末帧视频创建
  • 视频编辑、增强和删除
  • 风格重写
  • 镜头延伸

创意工作者现在可以在一个连续的体验中从想法 → 生成 → 编辑进行操作。


多模态输入,多模态命令

Video O1 将所有输入视为一个指令系统:

  • 图像
  • 视频片段
  • 主体(多角度参考)
  • 自然语言

你只需说:

  • “删除路人”
  • “将白天改为黄昏”
  • “替换服装”

…模型会自动执行像素级语义重建。


工业级视觉一致性

Video O1 加强了对以下内容的理解:

  • 身份
  • 运动
  • 场景逻辑
  • 多主体交互

无论视频涉及单个说话者还是复杂的群体镜头,每个角色在帧、角度和场景变化中都保持稳定。


创意技能组合

Video O1 支持复杂的混合工作流:

  • 在改变风格的 同时 添加主体
  • 在修改背景的 同时 使用图像参考
  • 基于视频参考生成下一镜头运动

创意化学反应变得无限可能。


叙事控制:3–10 秒生成

创意工作者可以自由定义镜头节奏——从短冲击时刻到更长的主题场景。


为什么 Kling O1 很重要

Kling O1 系列代表了一个新的 范式:一个能够覆盖视觉创建每个阶段的模型家族——图像和视频都能处理。 无论你是设计师、电影制作人、品牌团队还是独立创意工作者,Kling O1 都能解锁新的创意效率高度。

它是:

  • 多模态
  • 一致性强
  • 可扩展的
  • 易于创意工作者使用
  • 生产就绪

关于 Kling O1 的常见问题

1. 什么是 Kling O1 系列? 一个用于在浏览器中进行高级图像和视频创建的新 Kling 套件。

2. 包含哪些工具? Kling Image O1Kling Video O1

3. 我需要特殊硬件吗? 不需要,它完全在线工作。

4. 它能同时制作图像和视频吗? 可以——用 Image O1 制作图像,用 Video O1 制作视频。

5. 它对初学者友好吗? 是的,具有简单的控制和专业级功能。

6. 我可以商业使用它吗? 可以,取决于你的 WaveSpeedAI 计划。


结论

Kling O1 系列为创意工作者在图像和视频中带来了一致性、控制和多模态智能的新水平。它使创意工作变得更顺畅、更统一、效率更高——无论你是在生成、编辑还是构建完整的视觉故事。

而且使用 WaveSpeedAI,开始使用很简单。无需下载,无需设置——** 只需打开浏览器开始创作。**

👉 立即在 WaveSpeedAI 上尝试 Kling Image O1 和 Kling Video O1。


与我们保持联系

Discord 社区 | X (Twitter) | 开源项目 | Instagram