ElevenLabs Eleven V3 Timing 现已登陆WaveSpeedAI
ElevenLabs Eleven-V3 Timing将文本转换为自然语音,并返回对齐元数据——JSON格式的字符/单词时间戳——用于精确字幕、卡拉OK效果和唇同步。支持voice_id、相似度/稳定性和可选的Speaker Boost。价格为每1000个字符0.10美元。随时可用
ElevenLabs多语言V2 现已登陆WaveSpeedAI
ElevenLabs多语言V2是一个多语言文本转语音模型;成本为每1000个字符0.1美元。随时可用的REST推理API,最佳性能,无冷启动,价格实惠。
ElevenLabs Turbo V2.5 现已登陆WaveSpeedAI
ElevenLabs Turbo V2.5是通过WaveSpeedAI提供的文本转语音模型,按$0.05每1000个字符计费。即用型REST推理API,性能最佳,无冷启动,价格实惠。
ElevenLabs Turbo V2 现已登陆WaveSpeedAI
ElevenLabs Turbo V2 是一个文本转语音模型,可通过 WaveSpeedAI 使用,API 请求按每 1000 个字符 $0.05 计费。即用型 REST 推理 API,性能最优,无冷启动,价格实惠。
Google Gemini 2.5 Flash 图像预览编辑功能现已登陆WaveSpeedAI
Google Gemini 2.5 Flash 图像预览是一款图像到图像编辑模型,具有先进的创意控制功能,可实现精确的图像编辑。提供随时可用的 REST 推理 API、最佳性能、无冷启动、经济实惠的价格。
Google Gemini 3 Flash 图像编辑现已登陆WaveSpeedAI
Google Gemini 3 Flash 图像预览 - 图像到图像 - WaveSpeedAI
Google Gemini 2.5 Flash 图像编辑现已登陆WaveSpeedAI
Nano Banana (Gemini 2.5 Flash 图像)提供图像到图像生成和精确编辑,具有深度推理功能以提高准确性。开箱即用的REST推理API,最佳性能,无冷启动,经济实惠的定价。
Google Gemini 2.5 Flash图像预览文本转图像现已登陆WaveSpeedAI
Google Gemini 2.5 Flash文本转图像提供最先进的文本转图像生成和图像编辑,带有预览功能。即用的REST推理API、最佳性能、无冷启动、经济实惠的价格。
Google Gemini 3 Flash Image Text-to-Image 现已登陆WaveSpeedAI
在WaveSpeedAI上体验Google Gemini 3 Flash Image文本生成图像模型,快速将文字描述转化为高质量图像。
Google Gemini 2.5 Flash Image 文本生成图像功能现已登陆WaveSpeedAI
Google Gemini 2.5 Flash Image 提供先进的文本生成图像和图像编辑功能,具有创意控制选项以生成高质量图像。即用型 REST 推理 API,性能最佳,无冷启动,价格实惠。
快手 Kling LipSync 音频转视频功能现已登陆WaveSpeedAI
Kling LipSync 将音频转换为说话头部视频,通过生成逼真的唇动完美同步输入音频。提供即用型 REST 推理 API,最佳性能,无冷启动,价格实惠。
快手 Kling LipSync 文本转视频现已登陆WaveSpeedAI
Kwaivgi 的 Kling 文本转视频功能创建具有逼真嘴唇运动的视频,精确同步输入文本以实现自然的说话视觉效果。即用型 REST 推理 API,最佳性能,无冷启动,经济实惠的定价。