ComfyUI에서 LTX-2 오류 해결: OOM, 검은 프레임 및 깜빡임 솔루션
안녕하세요, Dora입니다. 저는 ComfyUI에서 LTX-2를 디버깅하려고 나선 게 아니었어요. 작은 멈춤에서 시작했거든요. dozen 번이나 실행했던 워크플로우 다음에 검은색 미리보기 창이 떴어요. 극적인 실패는 아니었고요. 그냥… 아무것도 없었어요. 재시도했고, 콘솔을 살펴봤고, 설정을 하나 둘 건드렸어요. 한 주가 지나가면서 (2026년 1월 6-10일 테스트됨) 계속 반복되는 몇 가지 수정 방법을 모았어요. 이건 거창한 튜토리얼이 아니라, 드라이버를 다시 설치하는 악몽을 피하면서 LTX-2를 말 듣게 만들려고 하는 친구에게 건넬 메모 같은 거예요. 우리 모두가 잘 아는 그런 고요한 혼돈이죠.
60초 진단 (증상 → 원인 매핑)
LTX-2가 ComfyUI에서 이상할 때, 저는 추측하는 것보다 빠른 패턴 매칭이 더 낫다는 걸 알았어요. 뭔가 무거운 걸 만지기 전에 60초 안에 확인하는 체크리스트가 있어요:
증상: 깜빡임이나 프레임 간 드리프트
가능한 원인: 불안정한 가이던스 (CFG가 너무 높음), 변경되는 시드, 지나치게 강한 모션 설정.
빠른 시도: 시드를 고정하고, CFG를 조금 낮추고, 모션/디노이즈를 아래로 조정하고, 시간적 일관성 단계를 추가해요.
증상: 이상한 색상 변화, “눈”이나 늘어난 블록
가능한 원인: 가중치/버전 불일치, 잘못된 VAE, 손상된 캐시 또는 부분 다운로드.
빠른 시도: 해시를 다시 확인하고, 모델 캐시를 지우고, VAE 호환성을 확인해요.
증상: 형태나 NoneType에 대한 노드 오류
가능한 원인: 노드가 출력을 하지 않음 (이전 실패) 또는 호환되지 않는 노드/모델 버전.
빠른 시도: 실패한 분기를 분리하고, 그 노드까지만 실행하고, ComfyUI 콘솔에서 첫 번째 실제 오류 줄을 확인해요.
이 중 하나에 해당하면, 멈춰요. 한 번에 한 번의 변경만 해요. 그 다음 2-3초 클립을 다시 실행하니까 긴 렌더링으로 시간을 낭비하지 않아요.
OOM 수정: 해상도 / 정밀도 / 배치 다운그레이드 순서
제 LTX-2 OOM 루틴은 지루하지만 작동해요. 이 순서대로 하고 OOM이 계속되면 다음 단계로 넘어가요:
1. 먼저 해상도
- 높이/너비를 반으로 줄이지 말고 20-30% 줄여요. 많은 LTX-2 그래프는 스트라이드에 민감해요 (8 또는 16의 배수). 숨겨진 패딩을 피하려고 차원을 16으로 나누어떨어지게 유지해요.
- 1024×576을 목표로 한다면, 896×504를 시도해봐요. 원본보다 훨씬 가깝게 보인다고 말할 수 있어요.
2. 다음으로 정밀도
- 관련 로더 노드에서 모델 정밀도를 fp16 (또는 스택이 지원하면 bf16)으로 전환해요. NVIDIA 소비자 GPU에서는 fp16이 보통 가장 깔끔한 메모리 절약을 제공해요.
- 혼합 정밀도는 괜찮지만, 실행 중에 노드별로 토글하는 것은 피해요. 무거운 부분에는 한 가지 정밀도로 커밋해요.
3. 마지막으로 배치 크기
- 비디오 샘플링을 위해 배치를 1로 설정해요. 작은 배치도 메모리에서 핵심 활성화를 곱해요. 빠른 레이턴트나 미리보기에만 배치를 올려요.
또한 미묘한 이득이 있다는 걸 알았어요: OOM 조정 중에 시드를 잠궈요. 랜덤성은 마지막 변경이 실제로 도움이 되었는지 여부를 숨길 수 있어요.
검은색 화면: 모델 로딩 vs 디코딩 문제
이번 주 첫 번째 검은색 화면은 실제로 모델 실패가 아니었어요. 디코딩 특이점이었거든요.
둘을 빠르게 구분하는 방법
파일 크기와 지속 시간 확인
-
비디오가 올바른 길이이고 대략 예상되는 크기라면, 프레임이 있을 수 있어요. 플레이어가 픽셀 형식이나 색상 공간을 좋아하지 않을 수 있어요.
-
안전한 기본선으로 다시 인코딩해요:
ffmpeg -i input.mp4 -pix_fmt yuv420p -c:v libx264 -crf 18 output.mp4
(더 많은 인코딩 옵션은 FFmpeg 문서 참조)
ComfyUI 콘솔 확인 -
진정한 모델 로드 문제는 자신을 발표해요: 누락된 가중치, 호환되지 않는 키, 또는 VAE/모델 해시 불일치.
-
성공적인 샘플링 로그와 예외가 없으면, 아마도 표시/인코딩 경로 문제예요.
레이턴트 차원 불일치
- LTX-2 파이프라인은 특정 스트라이드 (종종 16의 배수)를 기대해요. 레이턴트 또는 제어 입력이 일치하지 않으면, 공백이나 거의 검은색 프레임을 얻을 수 있어요.
- 리사이즈 노드가 모델이 기대하기 전에 발생하는지 확인하고, 모든 분기가 너비/높이에 동의하는지 확인해요.
색상 범위 놀라움
- 전체 범위 대 제한 범위는 일부 플레이어에서 검은색으로 가팔라 보일 수 있어요. 빠른 다시 인코딩 (위 참조)이 보통 해결해요.
모델 로드 문제라면, 출처로 가요: 로더 노드의 LTX-2 체크포인트 경로가 실제 파일을 가리키는지 확인하고, 체크섬을 확인하고, 노드의 예상 가중치 형식 (safetensors 대 ckpt)이 파일과 일치하는지 확인해요. 공식 ComfyUI 문서와 모델의 README가 유일하게 신뢰하는 페이지예요.
깜빡임 수정: 안정성 매개변수 및 프롬프트 앵커링
깜빡임이 항상 버그는 아니에요. 때로는 모델이 정확히 지시받은 대로 하고 있는 거고, 자유도가 너무 많을 뿐이에요.
저를 안정시킨 것:
-
시드 고정
A/B 테스트에는 시드를 잠궈요. 한 번에 하나의 미끄러운 변수를 제거해요. -
CFG를 한 단계 낮춰요
8-9에서 6을 시도해요. 지나치게 높은 가이던스는 프레임을 다른 방향으로 끌어당길 수 있어요. -
디노이즈 및 모션 강도
여기서 부드러운 감소 (10-20%)는 종종 스텝을 꺾는 것보다 더 도움이 돼요. 약간 적은 디노이즈가 시간적 신호를 더 잘 보존한다는 걸 알았어요. -
프롬프트 앵커링
안정적인 기본 프롬프트를 유지하고 변경을 작고 명시적인 섹션 (키프레임 또는 짧은 괄호)으로 옮겨요. 프레임 전체 문장을 변경하면 드리프트를 초대해요. -
시간적 일관성 패스
그래프에 시간적/일관성 노드가 있으면, 가볍게 실행해요. 세부 사항을 만들지 않지만, 떨림을 다듬을 수 있어요. -
샘플러 선택
같은 시드로 2-3개 샘플러를 테스트해요. 일부는 비디오에서 더 떨려요. 같은 스텝 수에서 한 가지가 모서리를 진정시키면, 유지해요.
작은 메모: 저는 “완벽한” 프레임 일관성을 추구하는 걸 멈췄어요. 제 목표는 편집 중 정신적 피로가 적은 것, 현미경 아래에서 완벽함이 아니라 자를 수 있는 무언가예요.
손상된 출력: 가중치 불일치 / 경로 오류
손상은 분홍색 블록, 반짝이는 눈, 또는 프롬프트와 일치하지 않는 색상 밴딩으로 제 앞에 나타났어요. 매번 평범했어요:
-
불일치하는 가중치
로더는 특정 LTX-2 변형을 기대했어요: 비슷한 이름의 다른 것을 가지고 있었어요. 이제 파일 이름에 모델 날짜 또는 해시를 포함시켜요. -
잘못된 VAE
무심코 VAE를 바꾸면 문제가 됐어요. 수정은 간단했어요: LTX-2 노드 문서나 모델 README에서 지정한 VAE를 사용해요. 지정된 것이 없으면, 번들된 것 또는 그래프 작성자가 권장하는 것으로 기본값을 지정해요.
-
부분 다운로드
3-8GB 체크포인트가 95%에서 실패하면 폴더 보기에서는 완료로 보여요. 리포 목록에 대한 파일 크기를 확인하고, 가능할 때 해시를 확인해요. -
경로 문제 (특히 Windows)
비ASCII 문자와 매우 긴 경로는 과거에 로드를 깼어요. 믿어요, 모델 경로를 짧게 유지해요 (예:D:\models\ltx2\…) 그리고 가능할 때 공백을 피해요. -
혼합 형식
safetensors 대 .ckpt는 일부 노드에서 상호 교환할 수 없어요. 노드의 기대와 일치시켜요.
손상을 의심할 때, 알려진 좋은 작은 프롬프트를 아주 작은 해상도로 다시 실행해요. 그게 깔끔하면, 전체 설치가 아니라 현재 조합에 문제가 있다는 걸 알아요.
로그 읽기: 어느 레이어가 충돌했는지
제 시간 절약의 대부분은 마지막 극적인 것이 아니라 첫 번째 실패 줄을 읽는 것에서 나왔어요. ComfyUI의 콘솔은 30초 동안 속도를 늦추면 보통 충분히 알려줘요.
찾는 것:
-
CUDA 메모리 부족
버그가 아니에요. 위와 같이 해상도/정밀도/배치를 줄여요. 매번 같은 단계에서 실패하면, 특정 활성화 피크에 도달하고, 단계를 줄이거나 메모리 효율적인 주의를 활성화해요. -
CUDNN_STATUS_EXECUTION_FAILED 또는 불법 메모리 접근
종종 드라이버 또는 라이브러리 불일치예요. CUDA, PyTorch, GPU 드라이버 버전을 텍스트 파일에 적어요. 최근에 하나를 업데이트했으면, 롤백하거나 venv를 다시 빌드해요. ComfyUI 문서에 알려진 좋은 조합의 작은 행렬이 있어요.
-
크기 불일치 / 형태 오류
텐서가 잘못된 형태예요. 이는 보통 노드 그래프 문제예요: 리사이즈가 한 분기에서 발생하고 다른 분기에서는 발생하지 않음, 또는 제어 입력이 다른 스케일을 기대해요. 차원이 발산하는 위치를 추적해요. -
KeyError / 누락된 state_dict 키
가중치-노드 불일치. 나열된 누락된 키를 모델 README와 비교해요. 잘못된 체크포인트 변형 또는 만료된 노드. -
AttributeError: ‘NoneType’ …
이전 노드가 아무것도 반환하지 않음. 그 노드까지만 그래프를 실행해요. 첫 번째 None이 실제 범인이에요.
도움이 된 두 가지 습관:
- 디버깅 중에 짧은 클립을 실행해요. 10초의 실패 로그는 1분의 침묵보다 훨씬 적은 시간을 낭비해요.
- 의심 노드에서 사용 가능한 디버그/상세 토글을 활성화해요. 추가 컨텍스트가 추측하는 것을 이겨요.
프로젝트 폴더에 작은 “환경 카드”를 유지해요: GPU 모델 및 VRAM, 드라이버, CUDA, PyTorch, ComfyUI 커밋, 노드 팩 버전, LTX-2 체크포인트 해시. 뭔가 고장나면, 모델을 탓하기 전에 지난주 카드와 비교해요.
클라우드로 전환할 때 (WaveSpeed 문제 해결 지름길)
저는 LTX-2에 서두르지 않지만, “제 기계의 기분”을 실제 문제와 분리하는 가장 깨끗한 방법일 때가 있어요.
전환할 때
- VRAM이 16GB 미만이고 무거운 타협 없이 1024p 출력이 필요해요.
- 제 로컬 CUDA/드라이버 버전과 관련된 불안정한 충돌을 보고 있으며, 다시 빌드할 시간이 없어요.
- 두 번째 의견이 필요해요: 같은 그래프, 다른 하드웨어.
WaveSpeed (또는 비슷한 GPU 워크스페이스)에서 할 일
- 알려진 좋은 이미지를 선택해요 (문서화된 CUDA/PyTorch 조합). 원시 TFLOPS보다 디버깅할 때 더 중요해요.
- 최소 그래프, 정확한 LTX-2 가중치 (해시 포함), 그리고 하나의 짧은 테스트 프롬프트만 동기화해요.
- 가장 작은 재현 가능한 경우를 먼저 실행해요. 클라우드에서는 작동하고 로컬에서는 작동하지 않으면, 아마도 환경이에요: 둘 다 실패하면, 그래프 또는 가중치 문제예요.
비용 및 트레이드오프
- 네, 계산을 위해 비용을 지불할 거예요. 하지만 하나의 깨끗한 재현은 오후의 드라이버 룰렛을 절약할 수 있어요.
- 클라우드 디스크도 경로 문제를 숨길 수 있어요, 다른 방식일 뿐이에요. 저는 여전히 경로를 짧고 ASCII로 유지해요.
이건 워크플로우를 이동하도록 밀어붙이는 게 아니에요. 갇혀 있고 마감이 참을성보다 크면 빠르게 규칙하는 조용한 지름길이예요.
우리는 정확히 이런 순간을 위해 WaveSpeed를 만들었어요 — 깨끗한 GPU 환경이 빠르게 규칙하려고 할 때. LTX-2 디버깅에 갇혀있다면, WaveSpeed를 여기서 시도할 수 있어요.
이번 주 LTX-2가 겪은 가장 미친 버그가 뭐예요? 댓글을 달고 새로운 함정인지 알려줘요.





