#alibaba
208 articles - Page 13
阿里巴巴通义视觉翻译现已登陆WaveSpeedAI
阿里巴巴通义视觉翻译提供基于OCR的图像理解和多语言图像内文本翻译,实现上下文感知结果。即用型REST推理API,最佳性能,无冷启动,价格实惠。
快手Kling文本转音频现已登陆WaveSpeedAI
Kling文本转音频将文本提示转换为视频、游戏和多媒体的自定义音效,采用KlingAI的音频模型。开箱即用的REST推理API、最佳性能、零冷启动、平价定价。
快手Kling V2.6 Pro图生视频现已登陆WaveSpeedAI
Kling 2.6 Pro提供顶级图生视频生成能力,具备流畅动作、电影级视觉效果、精准提示词遵循和原生音频支持,可立即分享。提供即用型REST推理API,性能最优,无冷启动,价格实惠。
Google Gemini 3 Flash 图像编辑现已登陆WaveSpeedAI
Google Gemini 3 Flash 图像预览 - 图像到图像 - WaveSpeedAI
Google Gemini 2.5 Flash 图像编辑现已登陆WaveSpeedAI
Nano Banana (Gemini 2.5 Flash 图像)提供图像到图像生成和精确编辑,具有深度推理功能以提高准确性。开箱即用的REST推理API,最佳性能,无冷启动,经济实惠的定价。
快手Kling V2.6创建语音现已登陆WaveSpeedAI
Kling 2.6创建语音是一个可以生成自定义语音的模型。上传音频文件以创建自定义语音,该语音可与V2.6视频生成中的语音控制功能一起使用。音频应该是干净的、无噪音的、单个声音,时长在5-30秒之间。为稳定的产品而构建
Lightricks LTX 2 Retake 现已登陆WaveSpeedAI
LTX-2 Retake 可对视频的任何部分进行目标重新拍摄——替换视觉效果、音频或两者——同时保持时间和连贯性,每输出视频秒仅需 $0.1。提供即用型 REST 推理 API,性能最佳,无冷启动,价格实惠。
OpenAI DALL-E 3 现已登陆WaveSpeedAI
OpenAI DALL·E 3用于高保真文本到图像生成,现已作为托管API在WaveSpeedAI上提供。即用型REST推理API、最佳性能、无冷启动、价格实惠。
OpenAI Sora 现已登陆WaveSpeedAI
Sora 是 OpenAI 的多模态模型,可以从文本、图像或现有视频输入生成视频。提供即用型 REST 推理 API、最佳性能、无冷启动、经济实惠的定价。
Bria Video Eraser Mask 现已登陆WaveSpeedAI
Bria Video Eraser (Mask) 使用用户提供的遮罩视频从视频中移除不需要的对象。逐帧标记区域(黑白或 alpha),模型执行 AI 视频修复以重建干净、时间连贯的背景,适用于人物、徽标、文本和道具。即用型 REST
Bria 视频擦除提示功能现已登陆WaveSpeedAI
Bria Video Eraser 是一款 AI 视频修复模型,使用自然语言提示从视频中移除不需要的对象、人物、徽标和文本。它可以跟踪跨帧的目标并重建干净、时间上一致的背景,提供可直接编辑的结果。提供现成的 REST API,性能最佳
视频效果吹吻现已登陆WaveSpeedAI
将照片转换为迷人的吹吻视频,配以温柔的手势和温暖的表情,非常适合浪漫或友好的信息。可立即使用的REST推理API,性能最佳,无冷启动,价格实惠。