#alibaba
208 articles - Page 13
阿里巴巴通義視覺翻譯现已登陆WaveSpeedAI
阿里巴巴通義視覺翻譯提供基於 OCR 的圖像理解和多語言圖像內文本翻譯,具有上下文感知結果。即用型 REST 推理 API、最佳性能、無冷啟動、價格實惠。
快手 Kling Text To Audio 现已登陆WaveSpeedAI
Kling Text-to-Audio 使用 KlingAI 的音頻模型將文字提示轉換為視頻、遊戲和多媒體的自訂音效。提供即用型 REST 推論 API、最佳性能、無冷啟動、平價價格。
快手 Kling V2.6 Pro 圖像轉視頻现已登陆WaveSpeedAI
Kling 2.6 Pro 提供頂級圖像轉視頻生成,具有流暢的動作、電影級視覺效果、精確的提示詞遵循和原生音頻,可直接分享的視頻。提供即用型 REST 推理 API,最佳性能,無冷啟動,價格優惠。
Google Gemini 3 Flash 圖像編輯现已登陆WaveSpeedAI
Google Gemini 3 Flash 圖像預覽 - 圖像轉圖像 - WaveSpeedAI
Google Gemini 2.5 Flash 圖像編輯现已登陆WaveSpeedAI
Nano Banana (Gemini 2.5 Flash Image) 提供圖像到圖像的生成和精確編輯,具有深度推理以提高準確性。隨時可用的 REST 推理 API、最佳性能、無冷啟動、經濟實惠的定價。
快手 Kling V2.6 Create Voice 现已登陆WaveSpeedAI
Kling 2.6 Create Voice 是一個能夠生成自訂語音的模型。上傳音訊檔案以建立自訂語音,可用於 V2.6 影片生成中的語音控制功能。音訊應清晰、無雜訊、單一語音,持續時間在 5-30 秒之間。專為穩定產品而設計
Lightricks LTX 2 Retake 现已登陆WaveSpeedAI
LTX-2 Retake 可對影片的任何部分進行有針對性的重新錄製——替換視覺、音訊或兩者——同時保持時序和連續性,每輸出影片秒數僅需 $0.1。提供隨時可用的 REST 推論 API、最佳效能、無冷啟動、價格實惠。
OpenAI DALL-E 3 现已登陆WaveSpeedAI
OpenAI DALL·E 3 現已在 WaveSpeedAI 上提供高保真文本到圖像生成服務,作為託管 API 提供。即用型 REST 推論 API、最佳效能、無冷啟動、實惠定價。
OpenAI Sora 现已登陆WaveSpeedAI
Sora 是 OpenAI 的多模態模型,可從文字、圖像或現有影片輸入生成影片。隨時可用的 REST 推理 API、最佳效能、無冷啟動、實惠定價。
Bria 影片橡皮擦提示现已登陆WaveSpeedAI
Bria 影片橡皮擦是一個 AI 影片修復模型,可以使用自然語言提示從影片中移除不需要的物體、人物、標誌和文字。它可以跨幀追蹤目標,並重建乾淨、時間一致的背景,以獲得編輯就緒的結果。提供現成的 REST API,效能最佳
Bria 影片清除面具功能现已登陆WaveSpeedAI
Bria 影片清除(遮罩)使用使用者提供的遮罩影片移除影片中不需要的物體。逐幀標記區域(黑白或 Alpha),模型執行 AI 影片修復以重建乾�淨、時間一致的背景,適用於人物、標誌、文字和道具。可立即使用的 REST
視頻效果 Blow Kiss 现已登陆WaveSpeedAI
將照片轉換為迷人的飛吻視頻,具有甜蜜的姿態和溫暖的表情,非常適合浪漫或友好的訊息。隨時可用的 REST 推論 API,最佳效能、無冷啟動、經濟實惠的定價。