WaveSpeedAI 博客 - Page 92 | WaveSpeedAI Blog

Seedream 4.5 顺序模式生成具有一致角色和对象的多图像集合，统一所有输出的调色板、光照和风格。支持高达 4K 的结果，适用于营销活动、故事板和产品线。提供开箱即用的 REST 推理 API、最佳性能、无冷启动、经济实惠

字节跳动视频超分利用AI超分辨率技术将视频升级至4K并在安全的云环境中恢复细节。即用型REST推理API、最佳性能、无冷启动、价格实惠。

字节跳动的 USO（统一风格-主题优化）统一了风格驱动和主题驱动的生成，产生一致的输出，融合了艺术风格和主题保真度。即用型 REST 推理 API，最佳性能，无冷启动，价格实惠。

ElevenLabs eleven-v3是一个文本转语音模型，可作为托管端点使用；请求成本为每1000个字符0.1美元。即用型REST推理API，最佳性能，无冷启动，价格实惠。

ElevenLabs Flash V2是一个文本转语音模型，使用ElevenLabs Flash V2引擎将文本转换为语音。提供开箱即用的REST推理API、最佳性能、无冷启动、平价定价。

ElevenLabs Flash V2 是一个文本转语音模型，使用 ElevenLabs Flash V2 引擎将文本转换为语音音频。提供即用型 REST 推理 API、最佳性能、无冷启动、价格实惠。

ElevenLabs Eleven-V3 Timing将文本转换为自然语音，并返回对齐元数据——JSON格式的字符/单词时间戳——用于精确字幕、卡拉OK效果和唇同步。支持voice_id、相似度/稳定性和可选的Speaker Boost。价格为每1000个字符0.10美元。随时可用

ElevenLabs 多语言 V1 提供跨多种语言的自然发音文本转语音。提供开箱即用的 REST 推理 API，最佳性能，无冷启动，价格实惠。

ElevenLabs多语言V2是一个多语言文本转语音模型；成本为每1000个字符0.1美元。随时可用的REST推理API，最佳性能，无冷启动，价格实惠。

ElevenLabs Turbo V2.5是通过WaveSpeedAI提供的文本转语音模型，按$0.05每1000个字符计费。即用型REST推理API，性能最佳，无冷启动，价格实惠。

ElevenLabs Turbo V2 是一个文本转语音模型,可通过 WaveSpeedAI 使用,API 请求按每 1000 个字符 $0.05 计费。即用型 REST 推理 API,性能最优,无冷启动,价格实惠。

Google Gemini 2.5 Flash 图像预览是一款图像到图像编辑模型，具有先进的创意控制功能，可实现精确的图像编辑。提供随时可用的 REST 推理 API、最佳性能、无冷启动、经济实惠的价格。