#open-source
14 articles
HiDream-O1-Image-Dev: 56B FLUX.2를 능가한 8B 픽셀 네이티브 모델
HiDream-O1-Image-Dev는 VAE와 외부 텍스트 인코더를 제거하고 2K 해상도를 네이티브로 생성하며, GenEval, DPG, HPSv3에서 자신보다 7배 큰 모델을 능가하는 8B 증류 이미지 모델입니다.
Google Gemma 4란 무엇인가? 아키텍처, 벤치마크, 그리고 중요성
Google Gemma 4는 DeepMind의 가장 강력한 오픈 모델 패밀리로, Apache 2.0 라이선스 하에 네 가지 크기로 제공되며 멀티모달 입력, 네이티브 추론, 그리고 Raspberry Pi 수준의 온디바이스 배포를 지원합니다.
daVinci-MagiHuman: 모든 디지털 휴먼 생성기를 압도한 오픈소스 모델
daVinci-MagiHuman은 단일 H100에서 2초 만에 립싱크 토킹 헤드 영상을 생성하는 150억 파라미터 오픈소스 모델입니다. Ovi 1.1(승률 80%)과 LTX 2.3(60.9%)을 능가하며, Apache 2.0 라이선스, 다국어 지원, 초고속 처리를 자랑합니다.
daVinci MagiHuman Image-to-Video, WaveSpeedAI에 출시
daVinci MagiHuman Image-to-Video는 참조 이미지를 선택적 오디오 싱크와 함께 시네마틱 영상으로 애니메이션화하는 150억 파라미터 오픈소스 모델입니다. WAN 2.5와 동등한 수준이며, 최대 1080p, 5~10초 길이를 지원합니다. REST API 제공, $0.04/초, 콜드 스타트 없음.
daVinci MagiHuman Text-to-Video, WaveSpeedAI에 출시
daVinci MagiHuman Text-to-Video는 텍스트 프롬프트에서 선택적 오디오 싱크를 지원하는 시네마틱 인물 중심 영상을 생성합니다. 150억 파라미터 오픈소스 모델, 최대 1080p, 5~10초 영상. REST API, 초당 $0.04, 콜드 스타트 없음.
Helios: 모든 지름길을 거부한 실시간 장편 비디오 생성 모델
Helios는 KV 캐시, 희소 어텐션, 그 외 일반적인 가속 기법 없이 단일 H100에서 19.5 FPS로 분 단위 영상을 생성합니다. 무엇이 이 모델을 다르게 만드는지 알아보세요.
BitDance 14B: 자기회귀 AI 이미지 생성을 30배 빠르게
BitDance 14B는 이진 토큰을 사용하여 다른 자기회귀 모델보다 30배 빠르게 이미지를 생성합니다. 벤치마크에서 FLUX.1을 능가합니다. WaveSpeedAI에서 지금 사용해보세요.
Kimi K2.5: Moonshot의 시각 에이전트 모델에 대해 알아야 할 모든 것
Kimi K2.5는 Moonshot AI의 오픈소스 1T 파라미터 모델로 Agent Swarm 기술, 256K 컨텍스트, 멀티모달 기능을 갖추고 있습니다. 완전한 분석을 확인하세요.
OpenClaw: 당신이 제어하는 오픈소스 개인 AI 어시스턴트
자신의 기기에서 실행되며 여러 메시징 플랫폼과 통합되면서도 당신이 제어권을 유지하는 혁신적인 오픈소스 개인 AI 어시스턴트 OpenClaw를 발견하세요.
MOVA vs WAN vs Sora 2 vs Seedance: 2026년 비디오-오디오 AI 모델 비교
OpenMOSS MOVA, WAN 2.2 Spicy, WAN 2.6 Flash, Sora 2, Seedance 1.5 Pro의 비디오 생성 및 오디오 기능을 비교합니다. 특징, 가격, 추천 사항을 확인하세요.
DeepSeek V4: 다가오는 코딩 AI 모델에 대해 알아야 할 모든 것
DeepSeek V4는 2026년 2월에 혁신적인 코딩 기능과 함께 출시될 예정입니다. 아키텍처, 기능 및 벤치마크에 대해 알아보세요.
Apple SHARP: 모든 사진을 1초 이내에 3D로 변환
Apple의 SHARP AI 모델은 가우시안 스플래팅을 사용하여 단일 2D 사진을 1초 이내에 포토리얼리스틱한 3D 장면으로 변환합니다. 이 오픈소스 혁신이 어떻게 작동하는지 알아보세요.