WaveSpeedAI LTX 2 19b Control, WaveSpeedAI에 출시

WaveSpeedAI LTX 2 19b Control, WaveSpeedAI에 출시

LTX-2 19B ControlNet은 포즈, 깊이 또는 Canny 엣지 가이던스를 사용하여 비디오 입력에서 동기화된 오디오-비디오(최대 20초)를 생성합니다. 오디오 보존을 지원하며 생성

5 min read
WaveSpeedAI LTX 2 19b Ic LoRA Trainer, WaveSpeedAI에 출시

WaveSpeedAI LTX 2 19b Ic LoRA Trainer, WaveSpeedAI에 출시

LTX-2 IC-LoRA Trainer를 사용하면 비디오-투-비디오 변환을 위한 커스텀 In-Context LoRA 모델을 학습할 수 있으며, 깊이/포즈 어댑터, 비디오 복원, 스타일 변환을 포함합니다.

5 min read
LTX 2 19b Video LoRA Trainer, WaveSpeedAI에 출시

LTX 2 19b Video LoRA Trainer, WaveSpeedAI에 출시

LTX-2 Audio-Video LoRA Trainer는 동기화된 오디오-비디오 생성 지원으로 맞춤형 LoRA 모델을 학습할 수 있습니다. 액션, 모션 및 비디오 효과 모델을 학습하세요

4 min read
LTX 2 19b Video Upscaler, WaveSpeedAI에 출시

LTX 2 19b Video Upscaler, WaveSpeedAI에 출시

LTX-2 19B Video Upscaler는 저해상도 비디오를 선명한 4K 영상으로 변환하며, 부드러운 모션 다이나믹과 프레임 일관성을 제공합니다. 즉시 사용 가능한 REST 추론

5 min read
Molmo2 Image Content Moderator, WaveSpeedAI에 출시

Molmo2 Image Content Moderator, WaveSpeedAI에 출시

Molmo2-4B Image Content Moderator: 이미지 콘텐츠의 안전성, 적절성 및 정책 준수 여부를 분석합니다. 폭력, 누드, 유혈 장면 및 기타 해로운 콘텐츠를 감지합니다.

5 min read
Molmo2 Image Captioner, WaveSpeedAI에 출시

Molmo2 Image Captioner, WaveSpeedAI에 출시

Molmo2-4B 이미지 캡셔너: 커스터마이즈 가능한 상세 수준(낮음, 중간, 높음)으로 이미지에 대한 자세하고 정확한 캡션을 생성합니다. 오픈소스 비전-언어 모델

4 min read
Molmo2 Image QA, WaveSpeedAI에 출시

Molmo2 Image QA, WaveSpeedAI에 출시

Molmo2-4B Image QA: 다중 이미지 비교(1-2개 이미지) 지원으로 이미지에 대한 질문에 답변합니다. 오픈소스 비전-언어 모델입니다. 즉시 사용 가능한 REST API

5 min read
WaveSpeedAI Molmo2 Prompt Optimizer, WaveSpeedAI에 출시

WaveSpeedAI Molmo2 Prompt Optimizer, WaveSpeedAI에 출시

Molmo2-4B Prompt Optimizer: 지능형 재구성, 스타일 안내, 상황 인식 개선으로 이미지 및 비디오 생성을 위한 프롬프트를 향상시킵니다. 오픈

5 min read
WaveSpeedAI Molmo2 Text Content Moderator, WaveSpeedAI에 출시

WaveSpeedAI Molmo2 Text Content Moderator, WaveSpeedAI에 출시

Molmo2-4B Text Content Moderator: 텍스트 콘텐츠의 안전성, 적절성 및 정책 준수 여부를 분석합니다. 혐오 발언, 폭력, 성인 콘텐츠 등을 감지합니다.

5 min read
Molmo2 Video Captioner, WaveSpeedAI에 출시

Molmo2 Video Captioner, WaveSpeedAI에 출시

Molmo2-4B Video Captioner: 커스터마이징 가능한 세부 수준(낮음, 중간, 높음)으로 비디오에 대한 자세하고 정확한 캡션을 생성합니다. 오픈소스 비전-언어 모델

5 min read
Molmo2 Video Content Moderator, WaveSpeedAI에 출시

Molmo2 Video Content Moderator, WaveSpeedAI에 출시

Molmo2-4B Video Content Moderator는 비디오 콘텐츠의 안전성, 적절성 및 정책 준수를 분석합니다. 폭력, 노출, 혐오 콘텐츠 및 기타 해로운 비디오 콘텐츠를 감지합니다.

5 min read
Molmo2 Video QA, WaveSpeedAI에 출시

Molmo2 Video QA, WaveSpeedAI에 출시

Molmo2-4B Video QA: 시간적 이해를 통해 동영상 콘텐츠에 대한 질문에 답변합니다. 오픈소스 비전-언어 모델입니다. 즉시 사용 가능한 REST API, 콜드 스타트 없음

5 min read