WaveSpeedAI 部落格 - Page 37

LTX-2 19B ControlNet 從視頻輸入生成同步音視頻（最長 20 秒），支持姿態、深度或 Canny 邊緣引導。支持音頻保留、基因

LTX-2 IC-LoRA Trainer 讓您可以訓練自訂的情景內 LoRA 模型，用於視頻轉視頻的轉換，包括深度/姿態適配器、視頻修復和風格

LTX-2 音頻影片 LoRA 訓練器讓您訓練自訂 LoRA 模型，並支援同步音頻影片生成。訓練動作、運動和影片效果模型

LTX-2 19B Video Upscaler 將低解析度影片轉換為清晰的 4K 畫質，具備無縫動作動態和幀一致性。可立即使用的 REST 推理 A

Molmo2-4B Image Captioner：為圖片生成詳細、準確的標題說明，支援可自訂的詳細程度（低、中、高）。開源視覺語言模型

Molmo2-4B Image Content Moderator：分析圖像內容的安全性、適當性和政策合規性。檢測暴力、裸露、血腥和其他有害內容

Molmo2-4B Image QA：支援多圖像比較（1-2 張影像）回答關於影像的問題。開源視覺語言模型。可即時使用的 REST API

Molmo2-4B 提示詞優化器：通過智能重組、風格指導和情境感知改進，為圖像和視頻生成增強提示詞。開放

Molmo2-4B 文本內容審核器：分析文本內容的安全性、適當性和政策合規性。檢測仇恨言論、暴力、性內容等

Molmo2-4B Video Captioner：為影片生成詳細、準確的字幕，支援可自訂的詳細程度（低、中、高）。開源視覺語言模型

Molmo2-4B 視頻內容審核器分析視頻內容的安全性、適當性和政策合規性。檢測暴力、裸露、血腥和其他有害內容

Molmo2-4B Video QA：透過時間理解來回答視頻內容的問題。開源視覺語言模型。隨時可用的REST API，無冷啟動