Midjourney:当AI艺术开始呼吸
image-to-videovideo-generation

Midjourney:当AI艺术开始呼吸

自古以来,人类从未停止追求美的脚步。从古希腊的大理石雕塑到文艺复兴的杰作,从工业设计时代到今天的数字革命——每个时代都在寻求自己独特的方式来诠释美的含义。如今,随着科技以不可阻挡的速度不断演进,AI创意已经融入我们的生活,重塑了我们想象、设计和创造的方式。

2 min read
MiniMax Video-01 现已登陆WaveSpeedAI
image-to-videovideo-generation

MiniMax Video-01 现已登陆WaveSpeedAI

在 WaveSpeedAI 上发现突破性的 MiniMax Video 01 模型,以前所未有的易用性和效率实现高质量视频生成。探索其功能、应用场景以及为何 WaveSpeedAI 是您创意需求的理想平台。

1 min read
MMAudio V2 现已登陆WaveSpeedAI
announcementmodel-release

MMAudio V2 现已登陆WaveSpeedAI

MMAudio V2 是一款前沿模型,能够从视频和文本输入生成高质量、同步的音频。这一进展为多媒体内容创作开启了新的可能性,增强了生成媒体的真实感和沉浸感

1 min read
AI图像编辑的下一步:认识Qwen-Image-Edit-2509
qwenalibaba

AI图像编辑的下一步:认识Qwen-Image-Edit-2509

AI图像编辑的下一步:认识Qwen-Image-Edit-2509

1 min read
Real-ESRGAN 现已登陆WaveSpeedAI
upscaleimage-enhancement

Real-ESRGAN 现已登陆WaveSpeedAI

Real-ESRGAN 是一款强大的图像质量增强工具,现已在 WaveSpeedAI 上可用。由腾讯 ARC 实验室开发,该模型擅长将低分辨率图像转换为高分辨率杰作,即使在图像退化性质未知的情况下也能表现出色。

1 min read
AI视频生成规模化:Novita AI如何与WaveSpeedAI实现效率和成本的双重优化
image-to-videovideo-generation

AI视频生成规模化:Novita AI如何与WaveSpeedAI实现效率和成本的双重优化

Novita AI是一家专注于AI推理基础设施的公司,致力于为创意工作者、开发者和企业提供可靠高效的视频生成推理服务。公司支持多个主流视频生成模型的部署,覆盖从图像到视频和文本到视频生成的端到端能力,为全球创意用户和AI平台提供720P至1080P分辨率的服务。

2 min read
SDXL 现已登陆WaveSpeedAI
sdxlstability-ai

SDXL 现已登陆WaveSpeedAI

我们很荣幸推出 2 个现已在 WaveSpeedAI 上可用的稳定扩散 XL 模型:sdxl 和 sdxl-lora。

1 min read
SkyReels-V1 现已登陆WaveSpeedAI
hunyuantencent

SkyReels-V1 现已登陆WaveSpeedAI

世界首个开源的以人为中心的视频基础模型 SkyReels V1 现已在 WaveSpeedAI 上线

1 min read
AI视频终于可用了:Sora 2真正意味着什么?
soraopenai

AI视频终于可用了:Sora 2真正意味着什么?

2025年10月1日,OpenAI悄然发布了Sora 2。这不仅仅是另一个产品更新——它标志着AI视频生成从技术演示转变为真正生产工具的分水岭时刻。

1 min read
Sora 2:看得更多。做得更多。玩得更开心!
soraopenai

Sora 2:看得更多。做得更多。玩得更开心!

Sora 1 阐明了 LLM 之外的可能性;Sora 2 则以真正的飞跃来回应——更精准的动作、更好的光影和纹理,以及同步音频,将电影级质量从稀有成就转变为日常体验。

2 min read
OpenAI的Sora 2模型现已登陆WaveSpeedAI
soraopenai

OpenAI的Sora 2模型现已登陆WaveSpeedAI

全球多模态推理加速平台WaveSpeedAI今日宣布,通过WaveSpeedAI API推出OpenAI的下一代视频和音频生成模型Sora 2。

1 min read
Step1X-Edit: 为开源图像编辑树立新标准
image-generationwavespeedai

Step1X-Edit: 为开源图像编辑树立新标准

在图像编辑领域,用户对高质量和用户友好的解决方案的需求日益增加。虽然 GPT-4o 和 Gemini 2 Flash 等闭源多模态模型提供强大的图像编辑功能,但开源选项在性能上往往滞后。

1 min read