Phota Text-to-Image, WaveSpeedAI에 출시
photatext-to-image

Phota Text-to-Image, WaveSpeedAI에 출시

Phota Text-to-Image는 텍스트 프롬프트에서 고품질 맞춤형 사진을 생성합니다. 4K 해상도, 다양한 화면 비율, 배치 생성, 내장 프롬프트 향상 기능을 지원합니다. REST API 제공, 이미지당 $0.09, 콜드 스타트 없음.

3 min read
LTX-2.3 가격 안내: API 비용, 로컬 추론 및 클라우드 트레이드오프 (2026)

LTX-2.3 가격 안내: API 비용, 로컬 추론 및 클라우드 트레이드오프 (2026)

LTX-2.3 API 가격 상세 안내: fast vs pro 변형, 720p vs 1080p 티어, 초당 비용 분석, 그리고 로컬 추론이 실제로 비용을 절감하는 경우.

7 min read
PixVerse V6 출시: 카메라 컨트롤, 네이티브 오디오, 멀티샷 비디오 생성
pixversepixverse-v6

PixVerse V6 출시: 카메라 컨트롤, 네이티브 오디오, 멀티샷 비디오 생성

PixVerse V6가 20가지 이상의 시네마틱 렌즈 컨트롤, 네이티브 오디오 지원 멀티샷 비디오, 15초 1080p 안정성, 개발자 워크플로우용 CLI와 함께 출시되었습니다. V6의 새로운 기능과 지금 바로 사용할 수 있는 최고의 AI 비디오 모델을 소개합니다.

5 min read
Claude Mythos (Opus 5) 유출: 지금까지 알려진 것들
ai-modelsclaude

Claude Mythos (Opus 5) 유출: 지금까지 알려진 것들

Anthropic의 차세대 Claude Mythos 모델이 데이터 유출로 공개되었습니다. 유출된 문서에서 코딩, 추론, 사이버 보안 분야의 성능에 대해 무엇을 말하고 있는지, 그리고 AI에 어떤 의미를 갖는지 알아보세요.

5 min read
Suno vs MiniMax Music vs Google Lyria 3: AI 음악 생성 비교
ai-musicsuno

Suno vs MiniMax Music vs Google Lyria 3: AI 음악 생성 비교

AI 음악 생성을 위한 Suno v5.5, MiniMax Music 2.5, Google Lyria 3 Pro의 상세 비교 — 음질, 보컬, 창작 제어, 가격 및 API 접근성을 다룹니다.

9 min read
daVinci-MagiHuman: 모든 디지털 휴먼 생성기를 압도한 오픈소스 모델
magihumandavinci

daVinci-MagiHuman: 모든 디지털 휴먼 생성기를 압도한 오픈소스 모델

daVinci-MagiHuman은 단일 H100에서 2초 만에 립싱크 토킹 헤드 영상을 생성하는 150억 파라미터 오픈소스 모델입니다. Ovi 1.1(승률 80%)과 LTX 2.3(60.9%)을 능가하며, Apache 2.0 라이선스, 다국어 지원, 초고속 처리를 자랑합니다.

4 min read
daVinci MagiHuman Image-to-Video, WaveSpeedAI에 출시
davinci-magihumansand-ai

daVinci MagiHuman Image-to-Video, WaveSpeedAI에 출시

daVinci MagiHuman Image-to-Video는 참조 이미지를 선택적 오디오 싱크와 함께 시네마틱 영상으로 애니메이션화하는 150억 파라미터 오픈소스 모델입니다. WAN 2.5와 동등한 수준이며, 최대 1080p, 5~10초 길이를 지원합니다. REST API 제공, $0.04/초, 콜드 스타트 없음.

4 min read
daVinci MagiHuman Text-to-Video, WaveSpeedAI에 출시
davinci-magihumansand-ai

daVinci MagiHuman Text-to-Video, WaveSpeedAI에 출시

daVinci MagiHuman Text-to-Video는 텍스트 프롬프트에서 선택적 오디오 싱크를 지원하는 시네마틱 인물 중심 영상을 생성합니다. 150억 파라미터 오픈소스 모델, 최대 1080p, 5~10초 영상. REST API, 초당 $0.04, 콜드 스타트 없음.

5 min read
LTX-2.3 ComfyUI 설정: 2단계 파이프라인, VRAM 수정 및 Gemma 인코더

LTX-2.3 ComfyUI 설정: 2단계 파이프라인, VRAM 수정 및 Gemma 인코더

ComfyUI에서 LTX-2.3 설정하기: 체크포인트 배치, Gemma 3 12B 인코더 구성, 2단계 생성 파이프라인, 그리고 소비자용 GPU를 위한 저VRAM 전략.

7 min read
LTX-2.3 LoRA 학습 가이드: 스타일, 모션 및 IC-LoRA 제어 (2026)

LTX-2.3 LoRA 학습 가이드: 스타일, 모션 및 IC-LoRA 제어 (2026)

공식 ltx-trainer를 사용하여 LTX-2.3에서 커스텀 LoRA를 학습합니다. 스타일 LoRA, IC-LoRA 구조적 제어, 랭크 설정, 데이터셋 준비 및 일반적인 학습 실패 사례를 다룹니다.

7 min read
Google Lyria 3 Clip, WaveSpeedAI에 출시
lyriagoogle

Google Lyria 3 Clip, WaveSpeedAI에 출시

Google Lyria 3 Clip은 가사, 설명, 오디오가 포함된 텍스트 프롬프트로 완성된 음악 트랙을 생성합니다. 이미지 기반 생성, 네거티브 프롬프트, 재현 가능한 결과를 지원합니다. REST API, 클립당 $0.04, 콜드 스타트 없음.

4 min read
Google Lyria 3 Pro, WaveSpeedAI에 출시
lyriagoogle

Google Lyria 3 Pro, WaveSpeedAI에 출시

Google Lyria 3 Pro는 Clip 티어보다 더 풍부한 악기 구성, 섬세한 표현력, 높은 음질로 프리미엄 품질의 AI 음악을 생성합니다. 텍스트 및 이미지 기반 음악 제작 지원. REST API, 클립당 $0.08, 콜드 스타트 없음.

4 min read