#alibaba

215 articles - Page 17

所有标签 gemini-3-5-flash google google-io ai-models agent-tools deepmind gemini-3-5 gemini-3-5-pro gemini-omni gemini-omni-flash

Kling O1视频模型即将到来——视觉创作的全面跃升

Kling O1视频模型即将到来——视觉创作的全面跃升

专为创作者、电影制作人和设计师打造，Kling O1在智能性、一致性和可编辑性方面实现了重大突破，覆盖完整的视频工作流程。这款下一代多模态视频引擎为所有视频从业者带来更流畅、更直观、高度可控的创作体验。

2025-05-11 1 分钟阅读

Kling Omni Video O1 Video Edit 现已登陆WaveSpeedAI

Kling Omni Video O1 Video Edit 现已登陆WaveSpeedAI

WaveSpeedAI荣幸宣布推出Kling Video Edit，由快手突破性的多模态视频模型Kling Omni Video O1驱动。使用Video Edit，您可以通过简单的自然语言指令修改视频。

2025-05-10 2 分钟阅读

Nano Banana Pro vs Wan 2.5 Image Edit：编辑精修遇见完整生成能力

Nano Banana Pro vs Wan 2.5 Image Edit：编辑精修遇见完整生成能力

探索谷歌的 Nano Banana Pro（Gemini 3.0 Pro Image）和 Wan 2.5 Image Edit 如何结合生成和精准编辑来简化创意工作流程。

2025-05-01 2 分钟阅读

Seedream V4 快速开始指南

Seedream V4 快速开始指南

Seedream 4.0 支持三种输入类型：文本、单张图像和多张图像。

2025-04-28 4 分钟阅读

WaveSpeedAI上的Qwen-Image-Edit：在几秒内清理照片和完善视觉效果

WaveSpeedAI上的Qwen-Image-Edit：在几秒内清理照片和完善视觉效果

您是否厌倦了与复杂的图像编辑软件作斗争，花费数小时和精力才能进行简单的修改？您是否希望有一个图像编辑工具能够解决您的图像编辑挑战？我们很高兴地宣布，Qwen-Image-Edit现已在WaveSpeed AI上可用。基于旗舰级20B参数Qwen-Image模型构建，该工具将尖端的语义理解与像素级完美的外观控制相结合，使用户能够以前所未有的精度创建、修改和优化图像。

2025-04-27 1 分钟阅读

WaveSpeedAI上的通义图像：锐利文本渲染和精准编辑

WaveSpeedAI上的通义图像：锐利文本渲染和精准编辑

WaveSpeedAI上的通义图像：锐利文本渲染和精准编辑

2025-04-25 1 分钟阅读

速度还是规模？Nano Banana Pro 与 Qwen Image 为创意专业人士的对比

速度还是规模？Nano Banana Pro 与 Qwen Image 为创意专业人士的对比

Google Nano Banana Pro（Gemini 3.0 Pro Image）和 Seedream 4 的简明对比，突出了创意专业人士的速度、逼真度和工作流优势。

2025-04-17 1 分钟阅读

停止手动遮罩图像：使用Qwen-Image Layered创建干净的RGBA图层

停止手动遮罩图像：使用Qwen-Image Layered创建干净的RGBA图层

Qwen-Image Layered是一个提示引导的图像分解模型，可将单个图像分解为多个干净的RGBA图层，每个图层都具有适当的透明度、柔和边缘和正确的遮挡顺序——可立即用于真实的生产工作流程。

2025-04-15 1 分钟阅读

停止训练，开始创作：在WaveSpeedAI上使用LoRA

停止训练，开始创作：在WaveSpeedAI上使用LoRA

什么是LoRA？可以把它看作一种轻量级微调方法：与其重新训练整个模型，你只需向现有模型添加一个小的'快速适应'层来锁定你自己的风格——更快、更便宜。

2025-04-14 2 分钟阅读

AI视频的下一步：认识WAN 2.5

AI视频的下一步：认识WAN 2.5

过去几年，AI视频生成经历了几波创新浪潮——首先是更流畅的动作，然后是更高的视觉清晰度。

2025-04-08 2 分钟阅读

通过WaveSpeedAI上的阿里巴巴WAN 2.6解锁下一代视频创作

通过WaveSpeedAI上的阿里巴巴WAN 2.6解锁下一代视频创作

现已在WaveSpeedAI上推出，阿里巴巴的WAN 2.6模型为创作者提供更强的叙事能力、更智能的参考驱动生成和更长、更富表现力的输出。我们重点介绍了定义WAN 2.6的三个核心功能。

2025-04-05 1 分钟阅读

WAN 2.2 Spicy：AI 变得大胆的地方

WAN 2.2 Spicy：AI 变得大胆的地方

最近，由埃隆·马斯克开发的新模型 Grok 在 X 上走红。但还有另一个同样强大的竞争者——WAN 2.2 Spicy。由阿里巴巴团队构建，它提供相同的创意灵活性，支持多个用例，甚至提供 API 调用。得益于其广泛的边界，你可以在这里释放你的想象力——现在已在 WaveSpeedAI 上可用！

2025-03-30 1 分钟阅读