#digital-human

37 articles

모든 태그 claude-fable-5 claude-mythos-5 anthropic claude model-release ai-models grok-imagine-video grok-imagine-video-1-5 xai image-to-video

daVinci-MagiHuman: 모든 디지털 휴먼 생성기를 압도한 오픈소스 모델

daVinci-MagiHuman은 단일 H100에서 2초 만에 립싱크 토킹 헤드 영상을 생성하는 150억 파라미터 오픈소스 모델입니다. Ovi 1.1(승률 80%)과 LTX 2.3(60.9%)을 능가하며, Apache 2.0 라이선스, 다국어 지원, 초고속 처리를 자랑합니다.

2026-03-27 4 분 소요

daVinci MagiHuman Image-to-Video, WaveSpeedAI에 출시

daVinci MagiHuman Image-to-Video는 참조 이미지를 선택적 오디오 싱크와 함께 시네마틱 영상으로 애니메이션화하는 150억 파라미터 오픈소스 모델입니다. WAN 2.5와 동등한 수준이며, 최대 1080p, 5~10초 길이를 지원합니다. REST API 제공, $0.04/초, 콜드 스타트 없음.

2026-03-27 4 분 소요

daVinci MagiHuman Text-to-Video, WaveSpeedAI에 출시

daVinci MagiHuman Text-to-Video는 텍스트 프롬프트에서 선택적 오디오 싱크를 지원하는 시네마틱 인물 중심 영상을 생성합니다. 150억 파라미터 오픈소스 모델, 최대 1080p, 5~10초 영상. REST API, 초당 $0.04, 콜드 스타트 없음.

2026-03-27 5 분 소요

InfiniteTalk Fast Video-to-Video Multi, WaveSpeedAI에 출시

InfiniteTalk Fast 다중 캐릭터 립싱크는 영상과 두 개의 오디오 트랙을 사실감 넘치는 말하기 또는 노래 영상으로 변환합니다. 표준 대비 50% 저렴하며 최대 10분까지 지원합니다. 바로 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 합리적인 가격을 제공합니다.

2026-03-18 4 분 소요

InfiniteTalk Video-to-Video Multi, WaveSpeedAI에 출시

InfiniteTalk Video-to-Video Multi는 영상과 두 개의 오디오 입력으로 여러 캐릭터가 등장하는 사실적인 립싱크 영상을 생성합니다. 480p/720p 해상도, 최대 10분 지원, 전신 일관성 유지. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 합리적인 가격을 제공합니다.

2026-03-18 4 분 소요

SkyReels V3 Talking Avatar: 사진 한 장으로 만드는 AI 토킹 헤드 영상

SkyReels V3 Talking Avatar는 인물 사진 한 장과 오디오로 실감나는 토킹 헤드 영상을 생성합니다. 40개 이상의 언어 립싱크를 지원합니다. WaveSpeedAI에서 지금 바로 사용해보세요.

2026-03-03 6 분 소요

SoulX FlashHead: 96FPS 실시간 AI 토킹 헤드

SoulX FlashHead는 96FPS의 실시간 스트리밍 토킹 헤드 영상을 아이덴티티 드리프트 없이 생성합니다. 무한 길이 영상 지원. WaveSpeedAI에서 지금 체험해보세요.

2026-03-03 6 분 소요

WaveSpeedAI Longcat Avatar, WaveSpeedAI에 출시

LongCat Avatar는 초현실적이고 립싱크된 장시간 비디오 생성을 자연스러운 역동성과 일관된 정체성으로 제공합니다. 한 장의 사진 + 오디오를 오디오 기반 톡킹 또는 싱깅 아바타 비디오(이미지-투-비디오)로 변환하며, 최대 1분, 720p 티어 $0.30/5s입니다. 즉시 사용 가능한 REST API, 콜드스타트 없음

2025-12-26 5 분 소요

WaveSpeedAI InfiniteTalk, WaveSpeedAI에 출시

InfiniteTalk은 하나의 사진과 오디오를 오디오 기반의 대화하거나 노래하는 아바타 비디오(이미지-투-비디오)로 변환하며, 최대 10분, 720p 티어 $0.30/5초입니다. 바로 사용 가능한 REST API, 콜드스타트 없음, 저렴한 가격입니다.

2025-12-21 5 분 소요

WaveSpeedAI Live Avatar, WaveSpeedAI에 출시

Live Avatar는 참조 이미지와 오디오에서 말하는 아바타 비디오를 생성하여 자연스러운 표정으로 현실적인 입술 동기화 애니메이션을 만듭니다.

2025-12-16 4 분 소요

Kuaishou Kling V1 AI Avatar Standard, WaveSpeedAI에 출시

Kling AI Avatar는 디지털 정체성과 콘텐츠 제작을 위한 놀라운 AI 생성 비디오 아바타를 제공하며, 온디맨드 비디오는 5초당 $0.25로 청구됩니다. 바로 사용 가능한 REST API, 콜드스타트 없음, 저렴한 가격.

2025-11-26 4 분 소요

WaveSpeedAI InfiniteTalk Multi, WaveSpeedAI에 출시

InfiniteTalk Multi은 단일 이미지와 두 개의 오디오 입력을 최대 720p의 멀티 캐릭터 토킹 또는 싱잉 비디오로 변환합니다. 즉시 사용 가능한 REST 추론 API, 최고의 성능, 콜드스타트 없음, 합리적인 가격.

2025-11-22 4 분 소요