#model-release
391 articles - Page 10
Google Nano Banana Pro Edit Multi 现已登陆WaveSpeedAI
Google 的 Nano Banana Pro (Gemini 3.0 Pro Image) Edit 是新一代圖像編輯模型,能夠在單次運行中生成多張高品質編輯圖像。成本極低——每張圖像僅需 $0.07。隨時可用的 REST 推理 API、最佳效能、無冷啟動、價格親民。
MiniMax Hailuo 2.3 T2V Pro 現已登陸 WaveSpeedAI
MiniMax Hailuo 2.3 Pro 是一款文字轉視頻模型,可生成 1080p 視頻,效率提升 2.5 倍,複雜指令準確率達 85%。提供即用型 REST 推論 API,性能最優,無冷啟動,價格實惠。
MiniMax Hailuo 2.3 T2V Standard 现已登陆WaveSpeedAI
Hailuo 2.3 是一款文本轉視頻模型,可生成物理感知的 768p 視頻,效率提升 2.5 倍,複雜指令回應率達 85%。提供即用型 REST 推理 API,性能最佳,無冷啟動,價格實惠。
Google Gemini 3 Pro 圖像編輯现已登陆WaveSpeedAI
Google 的 Gemini 3.0 Pro(Gemini 3.0 Pro Image)Edit 支援圖像編輯和文字轉圖像生成,具有 4K 級別的行動設備輸出能力。提供即用型 REST 推理 API、最佳性能、無冷啟動、價格實惠。
FLUX 2 Dev 文字生成圖像功能现已登陆WaveSpeedAI
Black Forest Labs 的 FLUX.2 [dev] 提供快速、工作室級別的文字生成圖像功能,具有增強的真實感、更清晰的文字渲染和原生編輯功能,可實現快速迭代。提供即用型 REST 推理 API、最佳效能、無冷啟動、實惠定價。
Google Gemini 3 Pro 圖像文本轉圖像现已登陆WaveSpeedAI
Google 的 Gemini 3.0 Pro(Gemini 3.0 Pro Preview)是一個尖端的文本轉圖像模型,可實現為手機優化的高解析度 4K 圖像生成。隨時可用的 REST 推論 API、最佳效能、無冷啟動、平價格。
WaveSpeedAI InfiniteTalk Fast Multi 现已登陆WaveSpeedAI
InfiniteTalk fast multi 將單一影像和兩個音訊輸入轉換為多角色對話或唱歌影片。可立即使用的 REST 推論 API,最佳效能,無冷啟動,價格實惠。
WaveSpeedAI HunyuanVideo Foley 现已登陆WaveSpeedAI
HunyuanVideo-Foley 使用文字提示從上傳的影片生成逼真的 Foley 和環境音訊。提供隨時可用的 REST 推論 API、最佳效能、無冷啟動、價格實惠。
Think Sound on 现已登陆WaveSpeedAI
ThinkSound 將上傳的影片轉換為逼真、文字引導的音頻。上傳影片並新增文字提示即可生成栩栩如生的聲音。隨時可用的 REST 推理 API、最佳效能、無冷啟動、價格實惠。
WaveSpeedAI WAN 2.2 影片編輯现已登陆WaveSpeedAI
Wan 2.2 影片編輯讓您透過文字提示修改影片(例如更改服裝或角色)。由 Wan 2.2 提供支援,支援 480p($0.20/5秒)和 720p($0.40/5秒),最長 120 秒。現成可用的 REST 推理 API,最佳效能,無冷啟動,價格實惠。
MiniMax Speech 02 HD 现已登陆WaveSpeedAI
Minimax Speech 02 HD 是 Minimax 的高清晰度文本轉語音模型,提供清晰的高清語音;定價為每 1,000 個字符 $0.05。開箱即用的 REST 推理 API、最佳性能、無冷啟動、價格實惠。
Qwen Image Edit 現已登陸WaveSpeedAI
Qwen-Image-Edit 是一個 20B MMDiT 圖像到圖像模型,提供精確的雙語(中文和英文)文字編輯,同時保留風格。現成可用的 REST 推論 API、最佳效能、無冷啟動、平價定價。