#model-release

318 articles - Page 10

MiniMax Hailuo 2.3 T2V Pro 現已登陸 WaveSpeedAI

MiniMax Hailuo 2.3 Pro 是一款文字轉視頻模型，可生成 1080p 視頻，效率提升 2.5 倍，複雜指令準確率達 85%。提供即用型 REST 推論 API，性能最優，無冷啟動，價格實惠。

Hailuo 2.3 是一款文本轉視頻模型，可生成物理感知的 768p 視頻，效率提升 2.5 倍，複雜指令回應率達 85%。提供即用型 REST 推理 API，性能最佳，無冷啟動，價格實惠。

Google 的 Gemini 3.0 Pro（Gemini 3.0 Pro Image）Edit 支援圖像編輯和文字轉圖像生成，具有 4K 級別的行動設備輸出能力。提供即用型 REST 推理 API、最佳性能、無冷啟動、價格實惠。

Black Forest Labs 的 FLUX.2 [dev] 提供快速、工作室級別的文字生成圖像功能，具有增強的真實感、更清晰的文字渲染和原生編輯功能，可實現快速迭代。提供即用型 REST 推理 API、最佳效能、無冷啟動、實惠定價。

Google 的 Gemini 3.0 Pro（Gemini 3.0 Pro Preview）是一個尖端的文本轉圖像模型，可實現為手機優化的高解析度 4K 圖像生成。隨時可用的 REST 推論 API、最佳效能、無冷啟動、平價格。

InfiniteTalk fast multi 將單一影像和兩個音訊輸入轉換為多角色對話或唱歌影片。可立即使用的 REST 推論 API，最佳效能，無冷啟動，價格實惠。

HunyuanVideo-Foley 使用文字提示從上傳的影片生成逼真的 Foley 和環境音訊。提供隨時可用的 REST 推論 API、最佳效能、無冷啟動、價格實惠。

ThinkSound 將上傳的影片轉換為逼真、文字引導的音頻。上傳影片並新增文字提示即可生成栩栩如生的聲音。隨時可用的 REST 推理 API、最佳效能、無冷啟動、價格實惠。

Wan 2.2 影片編輯讓您透過文字提示修改影片（例如更改服裝或角色）。由 Wan 2.2 提供支援，支援 480p（$0.20/5秒）和 720p（$0.40/5秒），最長 120 秒。現成可用的 REST 推理 API，最佳效能，無冷啟動，價格實惠。

Minimax Speech 02 HD 是 Minimax 的高清晰度文本轉語音模型，提供清晰的高清語音；定價為每 1,000 個字符 $0.05。開箱即用的 REST 推理 API、最佳性能、無冷啟動、價格實惠。

Qwen-Image-Edit 是一個 20B MMDiT 圖像到圖像模型，提供精確的雙語（中文和英文）文字編輯，同時保留風格。現成可用的 REST 推論 API、最佳效能、無冷啟動、平價定價。

PixVerse V5 效果將圖像轉換為流暢、自然的短視頻，具有逼真的動作；支持 5 秒/8 秒和 720p/1080p 輸出。即用型 REST API、無冷啟動、最佳性能、平價定價。