LTX-2.3 세로 영상 가이드: 소셜 및 모바일을 위한 9:16 워크플로우 (2026)

LTX-2.3 세로 영상 가이드: 소셜 및 모바일을 위한 9:16 워크플로우 (2026)

LTX-2.3은 크롭 없이 최대 1080×1920 해상도의 9:16 세로 영상을 네이티브로 생성합니다. 2026년에 소셜 미디어에 최적화된 세로 영상을 설정, 프롬프트 작성, 일괄 제작하는 방법을 소개합니다.

7 min read
GLM-5.1 vs Claude, GPT, Gemini, DeepSeek: Zhipu AI 최신 모델 성능 비교
llmai-models

GLM-5.1 vs Claude, GPT, Gemini, DeepSeek: Zhipu AI 최신 모델 성능 비교

Zhipu AI의 GLM-5.1은 Claude Opus 4.6 코딩 성능의 94.6%를 달성했다고 주장합니다 — 화웨이 칩으로만 훈련된 오픈 웨이트 모델입니다. 2026년 모든 최전선 LLM과의 비교를 살펴보세요.

6 min read
Phota Edit, WaveSpeedAI에 출시
photaimage-editing

Phota Edit, WaveSpeedAI에 출시

Phota Edit는 자연어 명령으로 이미지를 변환합니다. 최대 10개의 참조 이미지, 4K 출력, 유연한 화면 비율, 배치 생성 지원. REST API, 이미지당 $0.09, 콜드 스타트 없음.

3 min read
Phota Enhance, WaveSpeedAI에 출시
photaimage-enhance

Phota Enhance, WaveSpeedAI에 출시

Phota Enhance는 저화질 사진에서 섬세한 질감, 선명한 엣지, 손실된 세부 정보를 복원하는 AI 기반 이미지 업스케일러입니다. 배치 처리, 4K 출력, JPEG/PNG/WebP 지원. REST API, 이미지당 $0.09, 콜드 스타트 없음.

3 min read
Phota Text-to-Image, WaveSpeedAI에 출시
photatext-to-image

Phota Text-to-Image, WaveSpeedAI에 출시

Phota Text-to-Image는 텍스트 프롬프트에서 고품질 맞춤형 사진을 생성합니다. 4K 해상도, 다양한 화면 비율, 배치 생성, 내장 프롬프트 향상 기능을 지원합니다. REST API 제공, 이미지당 $0.09, 콜드 스타트 없음.

3 min read
LTX-2.3 가격 안내: API 비용, 로컬 추론 및 클라우드 트레이드오프 (2026)

LTX-2.3 가격 안내: API 비용, 로컬 추론 및 클라우드 트레이드오프 (2026)

LTX-2.3 API 가격 상세 안내: fast vs pro 변형, 720p vs 1080p 티어, 초당 비용 분석, 그리고 로컬 추론이 실제로 비용을 절감하는 경우.

7 min read
PixVerse V6 출시: 카메라 컨트롤, 네이티브 오디오, 멀티샷 비디오 생성
pixversepixverse-v6

PixVerse V6 출시: 카메라 컨트롤, 네이티브 오디오, 멀티샷 비디오 생성

PixVerse V6가 20가지 이상의 시네마틱 렌즈 컨트롤, 네이티브 오디오 지원 멀티샷 비디오, 15초 1080p 안정성, 개발자 워크플로우용 CLI와 함께 출시되었습니다. V6의 새로운 기능과 지금 바로 사용할 수 있는 최고의 AI 비디오 모델을 소개합니다.

5 min read
Claude Mythos (Opus 5) 유출: 지금까지 알려진 것들
ai-modelsclaude

Claude Mythos (Opus 5) 유출: 지금까지 알려진 것들

Anthropic의 차세대 Claude Mythos 모델이 데이터 유출로 공개되었습니다. 유출된 문서에서 코딩, 추론, 사이버 보안 분야의 성능에 대해 무엇을 말하고 있는지, 그리고 AI에 어떤 의미를 갖는지 알아보세요.

5 min read
Suno vs MiniMax Music vs Google Lyria 3: AI 음악 생성 비교
ai-musicsuno

Suno vs MiniMax Music vs Google Lyria 3: AI 음악 생성 비교

AI 음악 생성을 위한 Suno v5.5, MiniMax Music 2.5, Google Lyria 3 Pro의 상세 비교 — 음질, 보컬, 창작 제어, 가격 및 API 접근성을 다룹니다.

9 min read
daVinci-MagiHuman: 모든 디지털 휴먼 생성기를 압도한 오픈소스 모델
magihumandavinci

daVinci-MagiHuman: 모든 디지털 휴먼 생성기를 압도한 오픈소스 모델

daVinci-MagiHuman은 단일 H100에서 2초 만에 립싱크 토킹 헤드 영상을 생성하는 150억 파라미터 오픈소스 모델입니다. Ovi 1.1(승률 80%)과 LTX 2.3(60.9%)을 능가하며, Apache 2.0 라이선스, 다국어 지원, 초고속 처리를 자랑합니다.

4 min read
daVinci MagiHuman Image-to-Video, WaveSpeedAI에 출시
davinci-magihumansand-ai

daVinci MagiHuman Image-to-Video, WaveSpeedAI에 출시

daVinci MagiHuman Image-to-Video는 참조 이미지를 선택적 오디오 싱크와 함께 시네마틱 영상으로 애니메이션화하는 150억 파라미터 오픈소스 모델입니다. WAN 2.5와 동등한 수준이며, 최대 1080p, 5~10초 길이를 지원합니다. REST API 제공, $0.04/초, 콜드 스타트 없음.

4 min read
daVinci MagiHuman Text-to-Video, WaveSpeedAI에 출시
davinci-magihumansand-ai

daVinci MagiHuman Text-to-Video, WaveSpeedAI에 출시

daVinci MagiHuman Text-to-Video는 텍스트 프롬프트에서 선택적 오디오 싱크를 지원하는 시네마틱 인물 중심 영상을 생성합니다. 150억 파라미터 오픈소스 모델, 최대 1080p, 5~10초 영상. REST API, 초당 $0.04, 콜드 스타트 없음.

5 min read