LTX-2에서 LTX-2.3으로 업그레이드: 호환성, LoRA 변경 사항 및 마이그레이션 가이드 (2026)

안녕하세요, 저는 Dora입니다. 업그레이드 주간을 계획한 건 아니었어요. 그냥 클라이언트 덱에서 오래된 프롬프트를 다시 실행하고 싶었을 뿐입니다. 같은 시드, 같은 설정, 소위 “동일한” 모델이었는데, 실제로는 달랐습니다. LTX-2.3이 내 폴더에 들어왔고, 이미지가 한 단계 더 선명하고, 조금 더 직관적으로 느껴졌습니다… 그리고 LoRA로 강화한 내 스타일은 사라져 있었죠. 그 작은 불일치가 저를 토끼굴로 끌어들였습니다. 2026년 3월, 며칠 동안 저는 기존 ComfyUI 파이프라인과 배치 작업에 주로 사용하는 관리형 API에서 ltx-2에서 ltx-2.3으로의 업그레이드를 테스트했습니다. 실제로 무엇이 바뀌었는지, 무엇이 그대로인지, 그리고 데모가 아닌 실제 작업에서 어디에서 마찰이 생기는지 정리했습니다.

LTX-2와 2.3 사이에서 실제로 달라진 것

마케팅 문구는 건너뛰고 기존 워크플로우에 영향을 준 부분만 짚겠습니다.

프롬프트가 더 직관적으로 반영됩니다. 2.3은 위치 힌트(“왼쪽/오른쪽”, “전경/배경”)를 더 일관되게 따릅니다. 제품 레이아웃에는 좋습니다만, LTX-2의 느슨함에 의존하던 예술적 프롬프트에는 다소 경직된 느낌입니다.
기본값에서 대비와 채도가 더 높게 설정됩니다. 중립적인 조명 프리셋이 2.3에서는 더 강렬하게 나왔습니다. 가이던스를 약 0.5–1.0 낮추고 후처리에서 대비를 덜 낮추게 됐습니다.
버전 간에 시드는 1:1로 대응되지 않습니다. 같은 시드를 사용해도 LTX-2.3은 제 실행에서 약 10–12 스텝 후에 달라졌습니다. 이전 작업에서 픽셀 수준으로 동일한 재렌더링이 필요하다면 기대하지 마세요.
종횡비 처리가 더 합리적입니다. 2.3은 비정방형 크기(예: 1024×1536)를 왜곡 요소 없이 더 잘 지켰습니다. LTX-2에서 사용하던 캔버스 해킹 일부를 제거할 수 있었습니다.
샘플러 기본값이 바뀌었습니다. 2.3의 권장 스케줄러(및 스텝 곡선)로 인해 같은 디테일을 위한 스텝 수가 줄었습니다. 제 최적값이 약 28–32 스텝에서 약 22–26 스텝으로 이동했습니다. 같은 GPU에서 처리량이 약간 향상됐습니다.

드라마틱한 변화는 아닙니다. 하지만 파이프라인을 작은, 때로는 반가운 방식으로 구부리기엔 충분합니다… 그리고 정확한 재현성에 의존하는 것, 특히 LoRA에는 문제를 일으킵니다.

모델 크기 현실 점검: 로컬 배포에서의 영향

24GB 4090과 8GB 노트북 GPU에서 두 버전을 모두 실행했습니다. 이 부분이 릴리즈 노트에서 더 강조했으면 하는 내용입니다. 즉, 카드가 실제로 감당할 수 있는 실질적 한계입니다.

VRAM 및 스토리지 비교 (두 버전의 dev / fp8 / distilled)

제가 관찰하고 실제로 중요했던 내용은 다음과 같습니다:

Dev/풀 체크포인트: 4090에서 LTX-2와 LTX-2.3 “dev” 빌드 모두 로드됐지만, 2.3은 런타임에서 VRAM을 약간 더 차지했습니다(같은 샘플러/스텝으로 제 실행에서 약 +0.5–1.2 GB). 고해상도 생성 시 여유가 빠듯하다면 그 차이가 중요합니다. 8GB 카드에서는 오프로딩 없이 전체 dev 빌드는 현실적이지 않았습니다.
FP8/양자화 변형: fp8 2.3 빌드는 제 테스트에서 전체 정밀도 대비 약 25–35% VRAM을 절약했지만, 매우 낮은 스텝에서 세밀한 디테일이 약간 더 불안정해졌습니다. 일반적인 1K 출력에서는 문제없었습니다. 적극적으로 합성하거나 크롭한다면 신경 쓰일 수 있습니다. 배포에서 FP8 양자화의 실질적 이점에 대해서는 효율적인 저정밀 AI 학습에 관한 NVIDIA 공식 가이드를 참고했습니다.
Distilled: 2.3 distilled 체크포인트는 실용적인 중간 지점처럼 동작했습니다. 저장 용량이 작고, 워밍업이 눈에 띄게 빠르며, 엣지 마이크로 디테일에서 약간의 트레이드오프가 있습니다. 소셜용 이미지와 내부 문서에는 풀 2.0보다 distilled 2.3을 선택하겠습니다.
디스크 용량: 2.0 대비 2.3 변형에서 약간 증가를 예상하세요. 크지는 않지만, 스크래치 드라이브를 깨끗하게 유지하기 위해 오래된 실험용 LoRA를 정리해야 했습니다.

현장에서의 작은 메모: VRAM 여유 공간이 약 2GB 미만으로 떨어지면, 2.3에서 타일링 고해상도 패스 중에 간헐적인 OOM이 발생했습니다. 타일링 오버랩을 낮추거나 fp8을 사용하면 안정됐습니다.

ComfyUI 워크플로우 호환성: 여전히 작동하는 것, 업데이트가 필요한 것

ComfyUI 설정은 거의 그대로 유지하고 체크포인트만 교체했습니다. 테스트 중 워크플로우 호환성을 확인하기 위해 주로 공식 ComfyUI 저장소를 참고했습니다.

여전히 잘 작동한 것들:

컨디셔닝 → 샘플러 → VAE 디코드로 이어지는 기본 텍스트-이미지 그래프. 그래프를 재구성하지 않고 2.3 로더를 교체하고 렌더링할 수 있었습니다.
일반 샘플러(예: DPM++ 계열)는 잘 실행됐습니다. 새 곡선에 맞게 스텝과 가이던스만 조정했습니다.
잠재 업스케일러를 사용한 고해상도 워크플로우는 여전히 작동했지만, 디테일 손실 없이 2단계 스텝을 약 20% 줄였습니다.

업데이트가 필요했던 것들:

LoRA 주입 노드: LTX-2 LoRA가 2.3에 깔끔하게 연결되지 않았습니다. 노드가 연결을 허용해도 결과가 어긋났고, 스타일이 흔들리거나 무너졌습니다. 아래에 자세히 설명합니다.
체크포인트 경로 및 형식: 테스트한 2.3 체크포인트는 다른 폴더 이름과 약간 다른 config 참조로 제공됐습니다. Checkpoint Loader 노드 경로를 새로 설정하고 VAE 페어링을 확인해야 했습니다.
파라미터 기본값: 기존 “하우스” 프리셋(CFG 6.5, 스텝 약 30)이 2.3에서 더 강한 대비를 만들었습니다. CFG를 약 5.5로, 스텝을 약 24로 낮추니 원하는 균형이 돌아왔습니다.
네거티브 프롬프트: 긴 네거티브 목록에 덜 의존하게 됐습니다. 2.3은 특정 아티팩트를 기본적으로 피하는 것 같았습니다(제품 포즈에서 손이 약간 개선됐습니다). 프롬프트 오버헤드를 줄이기 위해 네거티브를 정리했습니다.

노드 변경 사항, 체크포인트 경로, 파라미터 차이

노드 변경: 핵심 생성을 위한 새 커스텀 노드는 필요하지 않았지만, 메타데이터 불일치를 피하기 위해 모델 로더 노드를 최신 ComfyUI 빌드로 업데이트했습니다. ComfyUI가 몇 달 뒤처져 있다면 먼저 업데이트하세요. 이상한 오류를 줄여줍니다.
체크포인트 경로: 2.0과 2.3 폴더를 분리해서 유지하세요. 배치 작업이 잘못된 파일을 가져가지 않도록 명확한 명명 체계(model_name/version/precision)를 사용합니다.
파라미터 차이: 2.3은 CFG 변동에 더 민감한 것 같았습니다. 작은 변화(약 0.5)가 2.0보다 더 큰 시각적 영향을 미쳤습니다. 또한 적은 스텝으로 비슷한 디테일을 얻었습니다. 1K 이미지에서 약 26 스텝을 넘으면 제 테스트에서 수확 체감이 발생했습니다.

LoRA 호환성: 기존 LoRA가 직접 전환되지 않는 이유

이것이 가장 큰 놀라움이었고, LTX-2에서 스타일 라이브러리를 구축한 경우 가장 비용이 많이 드는 부분입니다.

LTX-2 LoRA는 의미 있게 전환되지 않았습니다. 간단히 말하면, 베이스 모델 변경(임베딩 공간, 어텐션 블록, 때로는 정규화 및 VAE 변경)으로 인해 학습된 델타가 깔끔하게 매핑되지 않습니다. 강제할 수도 있지만, 이상한 색상 캐스트, 형태 드리프트, 또는 악명 높은 “모든 것이 베이지색 플라스틱으로 변하는” 현상과 싸워야 합니다. 스타일이 LoRA에 크게 의존한다면, 공식 Hugging Face LoRA 학습 가이드를 따라 LTX-2.3을 새 베이스 모델로 취급하고 재학습하는 것을 권장합니다.

실용적인 관점에서: 스타일이 LoRA에 의존한다면, LTX-2.3을 새 베이스로 취급하고 재학습을 계획하세요.

재학습이 필요한 것과 예상 비용

제가 유지한 것:

데이터셋: 정제되고 캡션이 달린 세트를 재사용했습니다(다양성에 따라 스타일당 약 300–800개 이미지). 더 나은 캡션이 2.3에서 원시 볼륨보다 더 효과적이었습니다.
설정: 채도 과포화를 피하기 위해 2.0에서 사용하던 것보다 낮은 학습률. 랭크/dim은 비슷하게 유지했지만, 학습 스텝을 약 10–15% 줄였습니다.
검증: 레거시 프롬프트가 아닌 새 베이스 프롬프트로 몇백 스텝마다 검증했습니다. 오래된 프롬프트는 잘못된 목표를 향해 편향시켰습니다.

대략적인 비용:

시간: 중간 크기 세트 기준으로 단일 4090에서 LoRA당 약 3–5시간, 검증 및 소규모 재시작 포함. Distilled 2.3 베이스는 훨씬 빠르게 학습됐습니다.
클라우드: 대여하는 경우, 2026년 3월 기준 24GB 클래스 GPU는 시간당 $0.80–$1.60 예산을 잡으세요. 단일 클린 재학습 비용이 $3–$10 범위이고, 여기에 시간이 추가됩니다. 당연히 더 큰 세트와 더 많은 실험은 비용을 올립니다.

처음에는 시간을 절약하지 못했습니다. 하지만 두세 번의 실행 후, 2.3 LoRA는 프롬프트에서 가드레일이 덜 필요해졌고, 이로 인해 향후 배치에서 정신적 노력이 줄었습니다.

API 사용자: 주의해야 할 엔드포인트 및 파라미터 차이

관리형 API의 경우, ltx-2.3과 ltx-2의 차이는 작지만 중요했습니다:

버전 지정 모델: 2.3은 종종 명시적인 모델 또는 버전 파라미터 뒤에 위치합니다. “latest”에 의존한다면, 테스트를 마칠 때까지 2.0으로 고정하세요.
기본값이 변경됐습니다: 가이던스, 스텝 수, 안전 수준이 제 프로바이더에서 변경됐습니다. CFG를 약 10–15% 낮출 때까지 LTX-2 프리셋이 2.3에서 더 높은 대비 이미지를 만들었습니다.
시드 타입: 하나의 API가 2.3에서 시드를 32비트에서 64비트 정수로 변경했습니다. 무해하지만, 제 오래된 래퍼가 시드를 문자열로 타입했습니다. 조용히 무시됐습니다.
네거티브 프롬프트 및 가중치 문법: 토크나이저/가중치 형식을 확인하세요. 한 프로바이더가 파싱을 엄격하게 했습니다. 이전 “(keyword:1.2)” 문법에 등록되려면 공백이 필요했습니다.
속도 제한 및 배칭: 2.3은 제 큐에서 요청당 약간 더 빠르게 실행됐지만, 배치 동시성 한도는 변경되지 않았습니다. 짧은 스파이크를 피하기 위해 작업을 분산했습니다.

확신이 없다면 프로바이더의 릴리즈 노트를 훑어보고 버전 간에 같은 프롬프트/시드를 테스트하세요. 비슷한 구성을 기대하되, 동일한 픽셀은 기대하지 마세요.

LTX-2에 계속 머무르는 것이 합리적인 경우

저도 새로운 것을 좋아하지만, 이유 없이 잘 작동하는 시스템을 재구축하지는 않습니다. 몇 가지 프로젝트에서 LTX-2를 유지한 이유:

엄격한 재현성이 필요한 경우. 감사, 규제된 워크플로우, 또는 이전 모델 버전에 연결된 클라이언트 승인을 위해 같은 시드, 같은 픽셀이 필요할 때.
무거운 LoRA 투자가 있는 경우. 라이브러리가 깊고 다양하다면, 재학습 비용(돈뿐만 아니라 시간과 주의력)이 쌓입니다.
엣지 또는 저VRAM 환경. 8GB 머신이 2.0 스택을 간신히 감당하고 있다면, 2.3의 추가 메모리 요구가 오프로딩으로 이어질 수 있습니다.
팀 교육 비용. 프롬프트와 프리셋이 문서와 튜토리얼에 내장돼 있다면, 2.3은 작지만 누적되는 변경을 강제합니다. 천 개의 작은 상처로 인한 죽음은 실재합니다.

반면에, 새로 시작하거나 기본적으로 더 정밀한 프롬프트 준수를 원한다면, 2.3이 조종하기 더 편했습니다.