#digital-human
39 articles - Page 2
InfiniteTalk Fast, WaveSpeedAI에 출시
InfiniteTalk fast는 1개의 사진과 오디오를 이용해 음성 기반 말하기 또는 노래하는 아바타 비디오(이미지-투-비디오)로 변환하며, 최대 10분까지 지원합니다. 즉시 사용 가능한 REST API, 콜드스타트 없음, 저렴한 가격.
PixVerse LipSync, WaveSpeedAI에 출시
PixVerse LipSync은 고급 알고리즘을 사용하여 오디오를 정확한 입술 움직임과 타이밍이 있는 현실적인 립싱크 애니메이션으로 변환합니다. 비디오 아바타용으로 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격입니다.
Sync LipSync 2, WaveSpeedAI에 출시
Sync Lipsync-2는 모든 비디오의 입술 움직임을 제공된 오디오와 동기화하여 영화, 팟캐스트, 게임 또는 애니메이션을 위한 현실적인 입술 정렬을 가능하게 합니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 합리적인 가격.
Veed LipSync, WaveSpeedAI에 출시
Veed LipSync으로 오디오에서 고품질 동기화를 통해 현실적인 립싱크 애니메이션을 생성하세요; 비디오 5초당 $0.15. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격.
Hunyuan Avatar, WaveSpeedAI에 출시
Hunyuan Avatar는 1개의 이미지와 오디오로 음성 기반 토킹 또는 싱잉 비디오를 480p/720p로 최대 120초까지 생성합니다 ($0.15/5초부터 시작). 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격.
WAN 2.2 Speech To Video, WaveSpeedAI에 출시
Wan-2.2-S2V는 이미지와 음성을 현실적인 얼굴과 신체 움직임이 있는 고화질 비디오로 변환합니다. 480p에서 최대 10분 클립을 지원하며 $0.15/5초부터 시작합니다. 바로 사용 가능한 REST API, 콜드스타트 없음, 합리적인 가격.
ByteDance Avatar Omni Human, WaveSpeedAI에 출시
Bytedance OmniHuman은 단일 초상화 사진을 생동감 있는 모션과 표정의 아바타 비디오로 변환합니다($0.12/초). 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 저렴한 가격.
ByteDance Avatar Omni Human 1.5, WaveSpeedAI에 출시
OmniHuman 1.5는 오디오와 시각 신호를 사실적인 아바타 애니메이션으로 변환하여 가상 인간, 스토리텔링, 대화형 에이전트를 구현합니다. 즉시 사용 가능한 REST 추론 API, 최고 성능, 콜드 스타트 없음, 저렴한 가격.
이미지 효과 My World, WaveSpeedAI에 출시
My-World는 사진을 마인크래프트 스타일의 픽셀 아트로 변환하여 게임의 블록 같은 픽셀화된 미학을 재현합니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드 스타트 없음, 저렴한 가격.
비디오 효과 카툰 인형, WaveSpeedAI에 출시
사진을 부드럽고 재미있는 애니메이션이 있는 치비 카툰 인형 비디오로 변환하세요. 아바타 및 소셜 클립을 위한 이미지-투-비디오 효과입니다. 준비된 REST 추론 API, 최고의 성능, 콜드 스타트 없음, 저렴한 가격.
ByteDance LipSync 오디오 투 비디오 WaveSpeedAI에 도입
ByteDance LipSync는 오디오를 입력 오디오와 완벽하게 동기화된 정확한 입술 움직임을 생성하여 생생한 말하는 비디오로 변환합니다. 바로 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 합리적인 가격.
ElevenLabs Eleven V3 Timing, WaveSpeedAI에 출시
ElevenLabs Eleven-V3 Timing은 텍스트를 자연스러운 음성으로 변환하고 정확한 자막, 카라오케 효과, 립싱크를 위한 문자/단어 타임스탐프를 JSON으로 반환합니다. voice_id, 유사성/안정성 및 선택적 Speaker Boost를 지원합니다. 1,000자당 $0.10의 가격으로 준비되어 있습니다.