#announcement

422 articles - Page 8

OpenAI GPT Image 1.5 Edit 现已登陆WaveSpeedAI

GPT Image 1.5 Edit 是 OpenAI 的图像模型,用于精确的自然语言编辑。可以添加/移除对象、交换背景、修饰面部、调整颜色/光照、编辑文本/图形、裁剪/调整大小,以及应用十六进制颜色控制。即用型 REST 推理 API、最佳性能、无冷启动、价格实惠

Seedance 1.5 Pro 快速图像转视频将单张图像（加上可选文本提示）转换为电影级、偏向真人实景的短视频，同时保留主体身份、构图和首帧保真度。它支持 4-12 秒时长控制、自适应宽高比跟随输入图像、实验

ByteDance Seedream 4.5 是一款针对排版优化的下一代文本转图像模型——文字渲染更清晰、提示词遵循度更强、支持最高 4K 输出用于海报和品牌视觉。提供即用型 REST 推理 API、最佳性能、零冷启动、价格实惠。

阿里巴巴 WAN 2.6 图像编辑将提示词转化为精确的照片编辑——调整色彩和光线、重新设计美学、替换背景、移除物体和完善细节，同时保留主体身份。专为稳定、可重复的图像到图像流程设计。现成可用的 REST API，最佳

Black Forest Labs 的 FLUX 2 Max 提供生产级文本到图像生成，具有增强的真实感、更清晰的文本渲染和原生编辑功能，可确保可靠、可重复的结果。提供随时可用的 REST 推理 API、最佳性能、无冷启动、价格实惠。

Kling Omni Video O1 图像到视频（标准版）将静态图像转换为动态、高质量的视频，同时保持主体身份和视觉/时间一致性。它增加了自然运动、逼真的物理效果和平滑的场景动态，并在参考帧时支持灵活的片段持续时间

SCAIL 使用参考图像实现高保真角色动画。它能处理大幅度动作变化、风格化角色和多角色互动,无需显式的逐帧结构指导。提供即用型 REST 推理 API,无冷启动,价格实惠。

Qwen-Image Layered 是一个统一的图像分层分解模型，用于提示引导的合成。提供点、框或粗糙蒙版来隔离主体和区域，该模型将单个图像分解为多个具有清晰 Alpha 通道、柔和边缘和正确遮挡顺序的 RGBA 图层。即插即用

Ultimate Image Upscaler 是最先进的 AI 增强工具，可在将图像升级到 4K 或 8K 时重新构想细节。即用型 REST 推理 API、最佳性能、无冷启动、价格实惠。

Z-Image-Turbo 是一个 60 亿参数的文本到图像模型，可在不到一秒的时间内生成逼真照片。提供即用型 REST 推理 API、最佳性能、无冷启动、价格实惠。

Grok 2 Image 是 xAI 最新的图像生成模型，能在几秒内将简单的文本提示转化为清晰、逼真的视觉效果。从产品图到社交媒体帖子和概念艺术，它能紧密遵循你的指示，让你只需一个提示就能从想法直接生成可用于生产的图像。准备好了

MiniMax 的 Hailuo 2.3 Fast 生成高质量的 6 秒和 10 秒图像到视频片段，分辨率为 768p，为创作者和营销人员优化。即用型 REST 推理 API，最佳性能，无冷启动，价格实惠。