#announcement
534 articles - Page 8
WaveSpeedAI LTX 2 19b 文本生成视频 LoRA现已登陆WaveSpeedAI
LTX-2 19b 文本生成视频 LoRA 是首个基于 DiT 的音视频基础模型,支持同步的音频和视频生成。该 LoRA 版本支持自定义
WaveSpeedAI LTX 2 19b现已登陆WaveSpeedAI
LTX-2 19b是首个基于DiT的音视频基础模型,具有同步音视频、高保真度、多种性能模式和生产级就绪等特点
WaveSpeed Desktop:最佳桌面 AI 工作室应用
下载 WaveSpeed Desktop - 最佳一体化 AI 工作室,提供 600+ AI 模型的便捷操作界面,以及免费的换脸、图像擦除、背景移除、图像增强等工具。
OpenAI GPT Image 1.5 Edit 现已登陆WaveSpeedAI
GPT Image 1.5 Edit 是 OpenAI 的图像模型,用于精确的自然语言编辑。可以添加/移除对象、交换背景、修饰面部、调整颜色/光照、编辑文本/图形、裁剪/调整大小,以及应用十六进制颜色控制。即用型 REST 推理 API、最佳性能、无冷启动、价格实惠
ByteDance Seedance V1.5 Pro 图像转视频快速版现已登陆WaveSpeedAI
Seedance 1.5 Pro 快速图像转视频将单张图像(加上可选文本提示)转换为电影级、偏向真人实景的短视频,同时保留主体身份、构图和首帧保真度。它支持 4-12 秒时长控制、自适应宽高比跟随输入图像、实验
ByteDance Seedream V4.5 现已登陆WaveSpeedAI
ByteDance Seedream 4.5 是一款针对排版优化的下一代文本转图像模型——文字渲染更清晰、提示词遵循度更强、支持最高 4K 输出用于海报和品牌视觉。提供即用型 REST 推理 API、最佳性能、零冷启动、价格实惠。
阿里巴巴 WAN 2.6 图像编辑现已登陆WaveSpeedAI
阿里巴巴 WAN 2.6 图像编辑将提示词转化为精确的照片编辑——调整色彩和光线、重新设计美学、替换背景、移除物体和完善细节,同时保留主体身份。专为稳定、可重复的图像到图像流程设计。现成可用的 REST API,最佳
FLUX 2 Max 文本到图像生成现已登陆WaveSpeedAI
Black Forest Labs 的 FLUX 2 Max 提供生产级文本到图像生成,具有增强的真实感、更清晰的文本渲染和原生编辑功能,可确保可靠、可重复的结果。提供随时可用的 REST 推理 API、最佳性能、无冷启动、价格实惠。
快手 Kling Video O1 Std 图像到视频功能现已登陆WaveSpeedAI
Kling Omni Video O1 图像到视频(标准版)将静态图像转换为动态、高质量的视频,同时保持主体身份和视觉/时间一致性。它增加了自然运动、逼真的物理效果和平滑的场景动态,并在参考帧时支持灵活的片段持续时间
SCAIL 现已登陆WaveSpeedAI
SCAIL 使用参考图像实现高保真角色动画。它能处理大幅度动作变化、风格化角色和多角色互动,无需显式的逐帧结构指导。提供即用型 REST 推理 API,无冷启动,价格实惠。
Qwen Image Layered 现已登陆WaveSpeedAI
Qwen-Image Layered 是一个统一的图像分层分解模型,用于提示引导的合成。提供点、框或粗糙蒙版来隔离主体和区域,该模型将单个图像分解为多个具有清晰 Alpha 通道、柔和边缘和正确遮挡顺序的 RGBA 图层。即插即用
WaveSpeedAI Ultimate Image Upscaler 现已登陆WaveSpeedAI
Ultimate Image Upscaler 是最先进的 AI 增强工具,可在将图像升级到 4K 或 8K 时重新构想细节。即用型 REST 推理 API、最佳性能、无冷启动、价格实惠。