Qwen Image Max Text-to-Image, WaveSpeedAI에 출시
Qwen Image Max는 중국어와 영어 프롬프트를 지원하는 고품질 이미지 생성 텍스트-이미지 모델입니다. 바로 사용 가능한 REST 추론 API, 최고의 성능
Qwen3 TTS, WaveSpeedAI에 출시
Qwen3 TTS: 스타일 제어 기능이 있는 다국어, 다중 음성 텍스트 음성 합성. 11개 언어와 9개 음성 캐릭터를 지원합니다. 바로 사용 가능한 REST 추론 API
Qwen3 TTS Voice Clone, WaveSpeedAI에 출시
Qwen3 TTS Voice Clone: 참조 오디오에서 음성을 복제하고 해당 음성으로 음성을 생성합니다. 즉시 사용 가능한 REST 추론 API, 최고 성능, 콜드 스타트 없음
Qwen3 TTS Voice Design, WaveSpeedAI에 출시
Qwen3 TTS Voice Design: 자연어로 설명된 커스텀 음성 특성으로 음성을 생성합니다. 사용 가능한 REST 추론 API, 최고의 성능, 설정 없음
SAM3 Image, WaveSpeedAI에 출시
SAM 3는 텍스트, 포인트 또는 박스를 사용하여 객체를 감지하고 분할하기 위한 프롬프트 가능한 이미지 분할용 통합 기초 모델입니다. 바로 사용 가능한 REST 추론 API
Sam3 Image Rle, WaveSpeedAI에 출시
SAM 3 RLE은 텍스트, 포인트 또는 상자를 사용하여 객체를 감지하고 분할하는 프롬프트 가능한 이미지 분할을 위한 통합 기초 모델입니다. RLE(Run-Length En을 반환합니다.
SAM 3 Video RLE, WaveSpeedAI에 출시
SAM 3 Video RLE은 비디오의 프롬프트 기반 분할을 위한 통합 기초 모델입니다. 텍스트, 포인트 또는 박스를 사용하여 프레임 전체에서 객체를 추적하고 분할합니다.
WaveSpeedAI Z Image Base LoRA, WaveSpeedAI에 출시
Z-Image-Base LoRA (6B)는 완전한 CFG 지원 및 외부 LoRA 지원으로 고품질 텍스트-투-이미지 생성을 가능하게 합니다. 음수 프롬프팅을 지원하면서 적용
Z-Image Base, WaveSpeedAI에 출시
Z-Image-Base는 완전한 CFG 지원을 갖춘 60억 파라미터 텍스트-이미지 모델입니다. 부정 프롬프팅과 파인튜닝 기능을 지원하여 최대한의 제어 가능성을 제공합니다.
Z Image Base LoRA Trainer, WaveSpeedAI에 출시
Z-Image Base LoRA Trainer – 자신의 데이터셋에서 커스텀 이미지 LoRA 모델을 학습하고, zip 업로드, 자동 조정된 기본값, 브랜드 및 캐릭터를 위한 빠른 반복으로 구성된 도구
MOVA vs WAN vs Sora 2 vs Seedance: 2026년 비디오-오디오 AI 모델 비교
OpenMOSS MOVA, WAN 2.2 Spicy, WAN 2.6 Flash, Sora 2, Seedance 1.5 Pro의 비디오 생성 및 오디오 기능을 비교합니다. 특징, 가격, 추천 사항을 확인하세요.
WAN 2.5 ComfyUI 워크플로우: 안정적인 결과를 위한 최고의 노드 그래프 + 설정
실용적인 WAN 2.5 ComfyUI 워크플로우: 최소한의 노드 그래프, 안정적인 설정 기준, 모션 컨트롤 팁, 내보내기 경로 및 일반적인 오류 수정.