WaveSpeedAI LTX 2 19b Control现已登陆WaveSpeedAI
LTX-2 19B ControlNet 可从视频输入生成同步音视频(最长 20 秒),支持姿态、深度或 Canny 边缘引导。支持音频保留、基因
WaveSpeedAI LTX 2 19b Ic LoRA Trainer现已登陆WaveSpeedAI
LTX-2 IC-LoRA Trainer 让您能够训练自定义上下文 LoRA 模型,用于视频转换、深度/姿态适配器、视频修复和风格转换。
WaveSpeedAI LTX 2 19b Video LoRA Trainer现已登陆WaveSpeedAI
LTX-2 音频-视频 LoRA 训练工具让你训练自定义 LoRA 模型,支持同步的音频-视频生成。训练动作、运动和视频效果模型
WaveSpeedAI LTX 2 19b Video Upscaler现已登陆WaveSpeedAI
LTX-2 19B Video Upscaler 将低分辨率视频转换为清晰的 4K 画面,具有无缝的运动动态和帧一致性。随时可用的 REST 推理 A
WaveSpeedAI Molmo2 Image Captioner现已登陆WaveSpeedAI
Molmo2-4B Image Captioner:为图像生成详细、准确的字幕,支持可自定义的细节级别(低、中、高)。开源视觉语言模型
WaveSpeedAI Molmo2 Image Content Moderator现已登陆WaveSpeedAI
Molmo2-4B Image Content Moderator:分析图像内容的安全性、适当性和政策合规性。检测暴力、裸露、血腥和其他有害内容
WaveSpeedAI Molmo2 Image Qa现已登陆WaveSpeedAI
Molmo2-4B Image QA: 支持多图像比较(1-2张图像)回答有关图像的问题。开源视觉语言模型。即用型REST API
WaveSpeedAI Molmo2 Prompt Optimizer现已登陆WaveSpeedAI
Molmo2-4B Prompt Optimizer:通过智能重组、风格指导和上下文感知的改进来增强图像和视频生成提示词。开源
WaveSpeedAI Molmo2 Text Content Moderator现已登陆WaveSpeedAI
Molmo2-4B文本内容审核员:分析文本内容的安全性、适当性和政策合规性。检测仇恨言论、暴力、性内容及其他有害内容。
WaveSpeedAI Molmo2 视频字幕生成器现已登陆WaveSpeedAI
Molmo2-4B 视频字幕生成器:为视频生成详细准确的字幕,支持可自定义的细节级别(低、中、高)。开源视觉语言模型
WaveSpeedAI Molmo2 Video Qa现已登陆WaveSpeedAI
Molmo2-4B Video QA:具有时间理解能力,回答关于视频内容的问题。开源视觉语言模型。即用型REST API,无冷启动
WaveSpeedAI Molmo2 Video Understanding现已登陆WaveSpeedAI
Molmo2-4B Video Understanding:使用专门任务分析视频(通用、总结、分析、计数、场景描述)。开源视觉语言模型