#model-release
346 articles - Page 6
Vidu Text-to-Video Q2, WaveSpeedAI에 출시
Vidu Q2 Text-to-Video는 텍스트 프롬프트를 뛰어난 시각적 충실도와 다양한 모션을 갖춘 고품질 비디오로 변환합니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격.
Kuaishou Kling Video O1 Std Reference To Video, WaveSpeedAI에 출시
Kling Omni Video O1 (Standard) Reference-to-Video는 여러 시점에서 캐릭터, 소품 또는 장면 참조를 사용하여 창의적인 비디오를 생성합니다. 주체의 특징을 추출하고 프레임 전체에서 신원 일관성을 유지하면서 새로운 비디오 콘텐츠를 만듭니다. 즉시 사용 가능한 REST API, 최고의 성능, 제한 없음
쿠이숏 Kling Image O1, WaveSpeedAI에 출시
Kling Omni Image O1은 MVL 기술을 탑재한 쿠이숏의 멀티모달 이미지 생성 모델입니다. 최대 10개의 참조 이미지로 피처 일관성을 지원하고, 정밀한 디테일 편집(추가/제거/수정), 스타일 제어 및 시리즈 콘텐츠 생성이 가능합니다. IP 캐릭터 디자인, 만화 패널, 브랜드 머천다이징에 완벽합니다.
Google Nano Banana Pro Edit Multi, WaveSpeedAI에 출시
Google의 Nano Banana Pro (Gemini 3.0 Pro Image) Edit는 단일 실행으로 여러 고품질 편집 이미지를 생성할 수 있는 차세대 이미지 편집 모델입니다. 매우 저렴한 비용 — 이미지당 단 $0.07. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격.
MiniMax Hailuo 2.3 T2V Pro, WaveSpeedAI에 출시
MiniMax Hailuo 2.3 Pro는 1080p 동영상을 2.5배 효율성과 85% 복잡한 명령 정확도로 제공하는 텍스트-투-비디오 모델입니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격.
WaveSpeedAI에서 MiniMax Hailuo 2.3 T2V Standard 출시
Hailuo 2.3는 물리 인식 768p 비디오를 생성하는 텍스트-비디오 모델로, 2.5배 효율성과 85% 복잡한 명령어 응답률을 자랑합니다. 즉시 사용 가능한 REST 추론 API, 최고 성능, 콜드스타트 없음, 저렴한 가격.
Google Gemini 3 Pro 이미지 편집, WaveSpeedAI에 출시
Google의 Gemini 3.0 Pro (Gemini 3.0 Pro Image) Edit는 모바일 기기용 4K 출력이 가능한 이미지 편집 및 텍스트-이미지 생성을 지원합니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격.
FLUX 2 Dev 텍스트-이미지, WaveSpeedAI에 출시
Black Forest Labs의 FLUX.2 [dev]는 빠르고 스튜디오 품질의 텍스트-이미지 생성을 제공하며, 향상된 사실성, 더욱 선명한 텍스트 렌더링, 빠른 반복을 위한 기본 편집 기능을 갖추고 있습니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드 스타트 없음, 저렴한 가격.
Google Gemini 3 Pro 이미지 텍스트-이미지, WaveSpeedAI에 출시
Google의 Gemini 3.0 Pro (Gemini 3.0 Pro Preview)는 휴대폰에 최적화된 고해상도 4K 이미지 생성을 지원하는 최첨단 텍스트-이미지 모델입니다. 바로 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격.
InfiniteTalk Fast Multi, WaveSpeedAI에 출시
InfiniteTalk fast multi는 단일 이미지와 두 개의 오디오 입력을 다중 캐릭터 토킹 또는 싱잉 비디오로 변환합니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격.
HunyuanVideo Foley, WaveSpeedAI에 출시
HunyuanVideo-Foley는 업로드된 비디오에서 텍스트 프롬프트를 사용하여 현실적인 폴리 및 앰비언트 오디오를 생성합니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 합리적인 가격.
WaveSpeedAI Think Sound, WaveSpeedAI에 출시
ThinkSound은 업로드된 비디오를 텍스트로 안내되는 현실적인 오디오로 변환합니다. 비디오를 업로드하고 텍스트 프롬프트를 추가하여 자연스러운 소리를 생성합니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드 스타트 없음, 저렴한 가격입니다.