#lip-sync
28 articles - Page 2
InfiniteTalk Fast Multi, WaveSpeedAI에 출시
InfiniteTalk fast multi는 단일 이미지와 두 개의 오디오 입력을 다중 캐릭터 토킹 또는 싱잉 비디오로 변환합니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격.
InfiniteTalk Fast, WaveSpeedAI에 출시
InfiniteTalk fast는 1개의 사진과 오디오를 이용해 음성 기반 말하기 또는 노래하는 아바타 비디오(이미지-투-비디오)로 변환하며, 최대 10분까지 지원합니다. 즉시 사용 가능한 REST API, 콜드스타트 없음, 저렴한 가격.
InfiniteTalk Fast 비디오-투-비디오, WaveSpeedAI에 출시
오디오 기반 infinitetalk-fast는 하나의 비디오와 오디오를 결합하여 립싱크된 현실적인 대화 또는 노래 영상으로 변환합니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드 스타트 없음, 저렴한 가격.
InfiniteTalk 비디오-투-비디오, WaveSpeedAI에 출시
오디오 기반 InfiniteTalk는 하나의 비디오와 오디오를 480p 또는 720p의 현실적인 톡킹 또는 싱잉 비디오로 립싱크와 함께 변환합니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격.
PixVerse LipSync, WaveSpeedAI에 출시
PixVerse LipSync은 고급 알고리즘을 사용하여 오디오를 정확한 입술 움직임과 타이밍이 있는 현실적인 립싱크 애니메이션으로 변환합니다. 비디오 아바타용으로 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격입니다.
WaveSpeedAI에서 Sync LipSync 1.9.0 베타 출시
고급 알고리즘을 사용하여 오디오에서 현실적인 입술 싱크 애니메이션을 생성하여 높은 품질의 얼굴 동기화를 실현합니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격.
Sync React 1, WaveSpeedAI에 출시
Sync React-1은 프로덕션급 비디오-비디오 립싱크 모델입니다. 모든 음성 트랙을 대상 얼굴에 매핑하여 음소 정확도가 높은 비주얼과 부드러운 타이밍을 생성하면서 정체성, 머리 방향, 조명 및 배경을 보존합니다. 감정 및 강도 조절, 다국어 음성 및 긴 테이크를 지원합니다.
Veed LipSync, WaveSpeedAI에 출시
Veed LipSync으로 오디오에서 고품질 동기화를 통해 현실적인 립싱크 애니메이션을 생성하세요; 비디오 5초당 $0.15. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격.
Google Veo3, WaveSpeedAI에 출시
Google Veo3는 내장 오디오를 갖춘 Google의 플래그십 텍스트-투-비디오 모델로, 텍스트 프롬프트에서 동기화된 비디오와 사운드를 생성합니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드 스타트 없음, 저렴한 가격.
ByteDance Avatar Omni Human 1.5, WaveSpeedAI에 출시
OmniHuman 1.5는 오디오와 시각 신호를 사실적인 아바타 애니메이션으로 변환하여 가상 인간, 스토리텔링, 대화형 에이전트를 구현합니다. 즉시 사용 가능한 REST 추론 API, 최고 성능, 콜드 스타트 없음, 저렴한 가격.
ElevenLabs Eleven V3 Timing, WaveSpeedAI에 출시
ElevenLabs Eleven-V3 Timing은 텍스트를 자연스러운 음성으로 변환하고 정확한 자막, 카라오케 효과, 립싱크를 위한 문자/단어 타임스탐프를 JSON으로 반환합니다. voice_id, 유사성/안정성 및 선택적 Speaker Boost를 지원합니다. 1,000자당 $0.10의 가격으로 준비되어 있습니다.
ByteDance LatentSync, WaveSpeedAI에 출시
ByteDance LatentSync은 Stable Diffusion과 TREPA를 결합하여 고해상도 엔드-투-엔드 립싱크를 제공하며, 생성된 비디오에서 정확하고 자연스러운 입 움직임을 전달합니다. 바로 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격.