WaveSpeed 博客 - Page 124

更聪明地表达，更流畅地沟通：MiniMax Speech 2.6 的到来

曾经有一段时间，与 AI 交谈总是感觉有点不对劲——节奏太生硬，语调太平板，温暖感始终触及不到。但现在，随着 MiniMax Speech 2.6 系列——包括 Speech 2.6 Turbo 和 Speech 2.6 HD——在 WaveSpeedAI 上的推出，一些非凡的变化发生了：AI 的声音终于活了起来。

Apr 22, 2025 1 min read

seedancebytedance

Seedance 1.5 Pro：迈向原生音视频生成的重大步伐

随着生成式视频进入真实生产阶段，仅有视觉效果已不再足够。现代工作流程日益要求视频和音频一起生成——原生且同步。ByteDance 的下一代原生音视频协同生成模型 Seedance 1.5 Pro 现已在 WaveSpeedAI 上线。

Apr 21, 2025 1 min read

seedreambytedance

Seedream 4.0：下一代多模态图像模型

在过去的一周里，Nano-Banana 的病毒式传播主导了头条新闻，标志着多模态人工智能正以前所未有的速度进入公众意识。然而，这些讨论通常仍然局限于研究和探索阶段，距离真正的企业级实施还有很大距离。

Apr 20, 2025 1 min read

seedreambytedance

Seedream4.5 现已登陆WaveSpeedAI

WaveSpeedAI已正式集成ByteDance的Seedream4.5，将最先进的多模态图像生成模型之一引入其平台。Seedream4.5提供更清晰的细节、更高的稳定性和对复杂提示词的更准确解释。

Apr 18, 2025 2 min read

seedreambytedance

速度还是规模？Nano Banana Pro 与 Qwen Image 为创意专业人士的对比

Google Nano Banana Pro（Gemini 3.0 Pro Image）和 Seedream 4 的简明对比，突出了创意专业人士的速度、逼真度和工作流优势。

Apr 17, 2025 1 min read

qwenalibaba

停止手动遮罩图像：使用Qwen-Image Layered创建干净的RGBA图层

Qwen-Image Layered是一个提示引导的图像分解模型，可将单个图像分解为多个干净的RGBA图层，每个图层都具有适当的透明度、柔和边缘和正确的遮挡顺序——可立即用于真实的生产工作流程。

Apr 15, 2025 1 min read

wanalibaba

停止训练，开始创作：在WaveSpeedAI上使用LoRA

什么是LoRA？可以把它看作一种轻量级微调方法：与其重新训练整个模型，你只需向现有模型添加一个小的'快速适应'层来锁定你自己的风格——更快、更便宜。

Apr 14, 2025 2 min read

replicatewavespeedai

The Dream Team Is Ready. What’s Your Big Idea?

A groundbreaking idea deserves more than just a tool—it deserves a dream team.

Apr 11, 2025 1 min read

video-generationwavespeedai

WaveSpeedAI：多模态AIGC平台释放无限创意

多模态AIGC平台释放无限创意

Apr 9, 2025 2 min read

wanalibaba

AI视频的下一步：认识WAN 2.5

过去几年，AI视频生成经历了几波创新浪潮——首先是更流畅的动作，然后是更高的视觉清晰度。

Apr 8, 2025 2 min read

wanalibaba

通过WaveSpeedAI上的阿里巴巴WAN 2.6解锁下一代视频创作

现已在WaveSpeedAI上推出，阿里巴巴的WAN 2.6模型为创作者提供更强的叙事能力、更智能的参考驱动生成和更长、更富表现力的输出。我们重点介绍了定义WAN 2.6的三个核心功能。

Apr 5, 2025 1 min read

veogoogle

Veo 3.1 现已在 WaveSpeedAI 上可用

全球多模态推理加速平台 WaveSpeedAI 今日宣布推出 Veo 3.1——谷歌最新的视频和音频生成模型——现已通过 WaveSpeedAI API 访问。

Apr 4, 2025 1 min read