#digital-human
39 articles
daVinci-MagiHuman: 모든 디지털 휴먼 생성기를 압도한 오픈소스 모델
daVinci-MagiHuman은 단일 H100에서 2초 만에 립싱크 토킹 헤드 영상을 생성하는 150억 파라미터 오픈소스 모델입니다. Ovi 1.1(승률 80%)과 LTX 2.3(60.9%)을 능가하며, Apache 2.0 라이선스, 다국어 지원, 초고속 처리를 자랑합니다.
daVinci MagiHuman Image-to-Video, WaveSpeedAI에 출시
daVinci MagiHuman Image-to-Video는 참조 이미지를 선택적 오디오 싱크와 함께 시네마틱 영상으로 애니메이션화하는 150억 파라미터 오픈소스 모델입니다. WAN 2.5와 동등한 수준이며, 최대 1080p, 5~10초 길이를 지원합니다. REST API 제공, $0.04/초, 콜드 스타트 없음.
daVinci MagiHuman Text-to-Video, WaveSpeedAI에 출시
daVinci MagiHuman Text-to-Video는 텍스트 프롬프트에서 선택적 오디오 싱크를 지원하는 시네마틱 인물 중심 영상을 생성합니다. 150억 파라미터 오픈소스 모델, 최대 1080p, 5~10초 영상. REST API, 초당 $0.04, 콜드 스타트 없음.
InfiniteTalk Fast Video-to-Video Multi, WaveSpeedAI에 출시
InfiniteTalk Fast 다중 캐릭터 립싱크는 영상과 두 개의 오디오 트랙을 사실감 넘치는 말하기 또는 노래 영상으로 변환합니다. 표준 대비 50% 저렴하며 최대 10분까지 지원합니다. 바로 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 합리적인 가격을 제공합니다.
InfiniteTalk Video-to-Video Multi, WaveSpeedAI에 출시
InfiniteTalk Video-to-Video Multi는 영상과 두 개의 오디오 입력으로 여러 캐릭터가 등장하는 사실적인 립싱크 영상을 생성합니다. 480p/720p 해상도, 최대 10분 지원, 전신 일관성 유지. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 합리적인 가격을 제공합니다.
SkyReels V3 Talking Avatar: 사진 한 장으로 만드는 AI 토킹 헤드 영상
SkyReels V3 Talking Avatar는 인물 사진 한 장과 오디오로 실감나는 토킹 헤드 영상을 생성합니다. 40개 이상의 언어 립싱크를 지원합니다. WaveSpeedAI에서 지금 바로 사용해보세요.
SoulX FlashHead: 96FPS 실시간 AI 토킹 헤드
SoulX FlashHead는 96FPS의 실시간 스트리밍 토킹 헤드 영상을 아이덴티티 드리프트 없이 생성합니다. 무한 길이 영상 지원. WaveSpeedAI에서 지금 체험해보세요.
WaveSpeedAI Longcat Avatar, WaveSpeedAI에 출시
LongCat Avatar는 초현실적이고 립싱크된 장시간 비디오 생성을 자연스러운 역동성과 일관된 정체성으로 제공합니다. 한 장의 사진 + 오디오를 오디오 기반 톡킹 또는 싱깅 아바타 비디오(이미지-투-비디오)로 변환하며, 최대 1분, 720p 티어 $0.30/5s입니다. 즉시 사용 가능한 REST API, 콜드스타트 없음
WaveSpeedAI InfiniteTalk, WaveSpeedAI에 출시
InfiniteTalk은 하나의 사진과 오디오를 오디오 기반의 대화하거나 노래하는 아바타 비디오(이미지-투-비디오)로 변환하며, 최대 10분, 720p 티어 $0.30/5초입니다. 바로 사용 가능한 REST API, 콜드스타트 없음, 저렴한 가격입니다.
WaveSpeedAI Live Avatar, WaveSpeedAI에 출시
Live Avatar는 참조 이미지와 오디오에서 말하는 아바타 비디오를 생성하여 자연스러운 표정으로 현실적인 입술 동기화 애니메이션을 만듭니다.
Kuaishou Kling V1 AI Avatar Standard, WaveSpeedAI에 출시
Kling AI Avatar는 디지털 정체성과 콘텐츠 제작을 위한 놀라운 AI 생성 비디오 아바타를 제공하며, 온디맨드 비디오는 5초당 $0.25로 청구됩니다. 바로 사용 가능한 REST API, 콜드스타트 없음, 저렴한 가격.
WaveSpeedAI InfiniteTalk Multi, WaveSpeedAI에 출시
InfiniteTalk Multi은 단일 이미지와 두 개의 오디오 입력을 최대 720p의 멀티 캐릭터 토킹 또는 싱잉 비디오로 변환합니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 합리적인 가격.