ByteDance Seedream V4.5 顺序模式现已登陆WaveSpeedAI
Seedream 4.5 顺序模式生成具有一致角色和对象的多图像集合,统一所有输出的调色板、光照和风格。支持高达 4K 的结果,适用于营销活动、故事板和产品线。提供开箱即用的 REST 推理 API、最佳性能、无冷启动、经济实惠
字节跳动视频超分现已登陆WaveSpeedAI
字节跳动视频超分利用AI超分辨率技术将视频升级至4K并在安全的云环境中恢复细节。即用型REST推理API、最佳性能、无冷启动、价格实惠。
字节跳动 USO 现已登陆WaveSpeedAI
字节跳动的 USO(统一风格-主题优化)统一了风格驱动和主题驱动的生成,产生一致的输出,融合了艺术风格和主题保真度。即用型 REST 推理 API,最佳性能,无冷启动,价格实惠。
ElevenLabs Eleven V3 现已登陆WaveSpeedAI
ElevenLabs eleven-v3是一个文本转语音模型,可作为托管端点使用;请求成本为每1000个字符0.1美元。即用型REST推理API,最佳性能,无冷启动,价格实惠。
ElevenLabs Flash V2.5 现已登陆WaveSpeedAI
ElevenLabs Flash V2是一个文本转语音模型,使用ElevenLabs Flash V2引擎将文本转换为语音。提供开箱即用的REST推理API、最佳性能、无冷启动、平价定价。
ElevenLabs Flash V2 现已登陆WaveSpeedAI
ElevenLabs Flash V2 是一个文本转语音模型,使用 ElevenLabs Flash V2 引擎将文本转换为语音音频。提供即用型 REST 推理 API、最佳性能、无冷启动、价格实惠。
ElevenLabs Eleven V3 Timing 现已登陆WaveSpeedAI
ElevenLabs Eleven-V3 Timing将文本转换为自然语音,并返回对齐元数据——JSON格式的字符/单词时间戳——用于精确字幕、卡拉OK效果和唇同步。支持voice_id、相似度/稳定性和可选的Speaker Boost。价格为每1000个字符0.10美元。随时可用
ElevenLabs 多语言 V1 现已登陆WaveSpeedAI
ElevenLabs 多语言 V1 提供跨多种语言的自然发音文本转语音。提供开箱即用的 REST 推理 API,最佳性能,无冷启动,价格实惠。
ElevenLabs多语言V2 现已登陆WaveSpeedAI
ElevenLabs多语言V2是一个多语言文本转语音模型;成本为每1000个字符0.1美元。随时可用的REST推理API,最佳性能,无冷启动,价格实惠。
ElevenLabs Turbo V2.5 现已登陆WaveSpeedAI
ElevenLabs Turbo V2.5是通过WaveSpeedAI提供的文本转语音模型,按$0.05每1000个字符计费。即用型REST推理API,性能最佳,无冷启动,价格实惠。
ElevenLabs Turbo V2 现已登陆WaveSpeedAI
ElevenLabs Turbo V2 是一个文本转语音模型,可通过 WaveSpeedAI 使用,API 请求按每 1000 个字符 $0.05 计费。即用型 REST 推理 API,性能最优,无冷启动,价格实惠。
Google Gemini 2.5 Flash 图像预览编辑功能现已登陆WaveSpeedAI
Google Gemini 2.5 Flash 图像预览是一款图像到图像编辑模型,具有先进的创意控制功能,可实现精确的图像编辑。提供随时可用的 REST 推理 API、最佳性能、无冷启动、经济实惠的价格。