WaveSpeedAI LTX 2 19b Control現已登陸WaveSpeedAI
LTX-2 19B ControlNet 從視頻輸入生成同步音視頻(最長 20 秒),支持姿態、深度或 Canny 邊緣引導。支持音頻保留、基因
WaveSpeedAI LTX 2 19b Ic LoRA Trainer現已登陸WaveSpeedAI
LTX-2 IC-LoRA Trainer 讓您可以訓練自訂的情景內 LoRA 模型,用於視頻轉視頻的轉換,包括深度/姿態適配器、視頻修復和風格
WaveSpeedAI LTX 2 19b Video LoRA Trainer現已登陸WaveSpeedAI
LTX-2 音頻影片 LoRA 訓練器讓您訓練自訂 LoRA 模型,並支援同步音頻影片生成。訓練動作、運動和影片效果模型
WaveSpeedAI LTX 2 19b Video Upscaler現已登陸WaveSpeedAI
LTX-2 19B Video Upscaler 將低解析度影片轉換為清晰的 4K 畫質,具備無縫動作動態和幀一致性。可立即使用的 REST 推理 A
WaveSpeedAI Molmo2 Image Captioner現已登陸WaveSpeedAI
Molmo2-4B Image Captioner:為圖片生成詳細、準確的標題說明,支援可自訂的詳細程度(低、中、高)。開源視覺語言模型
WaveSpeedAI Molmo2 Image Content Moderator現已登陸WaveSpeedAI
Molmo2-4B Image Content Moderator:分析圖像內容的安全性、適當性和政策合規性。檢測暴力、裸露、血腥和其他有害內容
WaveSpeedAI Molmo2 Image Qa現已登陸WaveSpeedAI
Molmo2-4B Image QA:支援多圖像比較(1-2 張影像)回答關於影像的問題。開源視覺語言模型。可即時使用的 REST API
WaveSpeedAI Molmo2 提示詞優化器現已登陸WaveSpeedAI
Molmo2-4B 提示詞優化器:通過智能重組、風格指導和情境感知改進,為圖像和視頻生成增強提示詞。開放
WaveSpeedAI Molmo2 文本內容審核器現已登陸WaveSpeedAI
Molmo2-4B 文本內容審核器:分析文本內容的安全性、適當性和政策合規性。檢測仇恨言論、暴力、性內容等
WaveSpeedAI Molmo2 Video Captioner現已登陸WaveSpeedAI
Molmo2-4B Video Captioner:為影片生成詳細、準確的字幕,支援可自訂的詳細程度(低、中、高)。開源視覺語言模型
WaveSpeedAI Molmo2 視頻內容審核器現已登陸WaveSpeedAI
Molmo2-4B 視頻內容審核器分析視頻內容的安全性、適當性和政策合規性。檢測暴力、裸露、血腥和其他有害內容
WaveSpeedAI Molmo2 Video Qa現已登陸WaveSpeedAI
Molmo2-4B Video QA:透過時間理解來回答視頻內容的問題。開源視覺語言模型。隨時可用的REST API,無冷啟動