WaveSpeedAI Molmo2 Video Content Moderator现已登陆WaveSpeedAI
Molmo2-4B Video Content Moderator 分析视频内容的安全性、适当性和政策合规性。检测暴力、裸露、血腥和其他有害内容
OpenAI Whisper With Video现已登陆WaveSpeedAI
OpenAI Whisper Large v3(视频转文本)直接从视频文件提供高精度多语言转录,具备自动语言检测和可选功能
WaveSpeedAI Paddle Ocr 现已登陆WaveSpeedAI
PaddleOCR-VL 是一个超紧凑的 0.9B 参数视觉语言模型,用于文档解析,支持 109 种语言的文本、表格、公式和图表识别
Qwen Image 2512 LoRA Trainer现已登陆WaveSpeedAI
Qwen-Image-2512 LoRA Trainer让您能够快速训练自定义LoRA模型,速度快10倍,支持风格、人物和物体训练。从概念到模型,只需几分钟而非数小时
Qwen Image Text-to-Image 2512 LoRA现已登陆WaveSpeedAI
Qwen-Image-2512 LoRA 是一个增强的 20B MMDiT 文本转图像模型,支持 LoRA,可快速自定义和精细化图像生成。支持即用型 REST 推理
WaveSpeedAI视频背景移除器现已登陆WaveSpeedAI
WaveSpeed视频背景移除器可以替换或移除视频背景,使用自定义图像。上传或粘贴视频链接,然后提供背景图像
WaveSpeedAI Z Image Turbo Controlnet现已登陆WaveSpeedAI
Z-Image-Turbo ControlNet 通过结构控制信号(深度、Canny 边缘、姿态)生成图像,实现精确的构图控制。提供开箱即用的 REST 推理
xAI Grok 2 Image 现已登陆WaveSpeedAI
Grok 2 Image 是 xAI 最新的图像生成模型,可以在几秒内将简单的文本提示转换为清晰、逼真的视觉效果。从产品图片到社交
Z AI CogView 4现已登陆WaveSpeedAI
Z-AI CogView-4 从文本提示生成高质量图像,能够快速准确地理解用户描述,让 AI 更精准地表达图像
Z AI Glm Image Edit现已登陆WaveSpeedAI
GLM-Image Edit 是一个强大的图像转图像编辑模型,可根据文本提示转换图像。开箱即用的 REST 推理 API,最佳性能,无需共
Z AI GLM Image 文生图现已登陆WaveSpeedAI
Z-AI GLM Image 从文本提示生成高质量图像,增强了对用户描述的理解,生成的图像更加精确
Kling 2.6 运动控制舞蹈动画:设置与唇音同步技巧
使用 Kling 2.6 运动控制进行舞蹈动画的实用技巧——设置、身体部位优先级、节拍对齐,以及脚滑动和抖动的修复方法。