LTX-2-Fehler in ComfyUI beheben: OOM, schwarze Frames & Flimmer-Lösungen

LTX-2-Fehler in ComfyUI beheben: OOM, schwarze Frames & Flimmer-Lösungen

Hey, hier ist Dora. Ich wollte nicht unbedingt LTX-2 in ComfyUI debuggen. Es fing mit einer winzigen Pause an: ein schwarzes Vorschaufenster nach einem Workflow, den ich ein Dutzend Mal ausgeführt hatte. Kein dramatischer Fehler. Einfach… nichts. Ich wiederholte es, beobachtete die Konsole, passte eine Einstellung oder zwei an. Am Ende der Woche (getestet vom 6.–10. Januar 2026) hatte ich eine Handvoll Fixes gesammelt, die sich immer wieder wiederholten. Das ist kein großes Tutorial, eher wie Notizen, die ich einem Freund geben würde, der auch versucht, LTX-2 zum Laufen zu bringen, ohne seinen Morgen in eine Neuinstallation von Treibern zu verwandeln. Ihr wisst, das ist die Art von stiller Unordnung, die wir alle nur zu gut kennen.

60-Sekunden-Diagnose (Symptom → Ursachen-Mapping)

Wenn LTX-2 in ComfyUI nicht funktioniert, habe ich herausgefunden, dass schnelles Muster-Matching besser funktioniert als Rätselraten. Hier ist die 60-Sekunden-Karte, die ich durchgehe, bevor ich etwas Schwereres anfasse:

Symptom: Flimmern oder Bild-zu-Bild-Verschiebung
Wahrscheinliche Ursache: instabile Guidance (CFG zu hoch), sich ändernde Seeds, zu starke Bewegungseinstellungen.
Schneller Versuch: Fix den Seed, senke CFG um eine Stufe, reduziere Bewegung/Denoise leicht, füge einen Schritt zur zeitlichen Konsistenz hinzu.

Symptom: Merkwürdige Farbverschiebungen, „Schnee” oder gestreckte Blöcke
Wahrscheinliche Ursache: Gewichts-/Versions-Mismatch, falsches VAE, beschädigter Cache oder teilweiser Download.
Schneller Versuch: Hashes neu überprüfen, Modell-Cache löschen, VAE-Kompatibilität bestätigen.

Symptom: Knotenfehler über Shapes oder NoneType
Wahrscheinliche Ursache: Ein Knoten hat keine Ausgabe (früherer Fehler) oder inkompatible Knoten-/Modellversionen.
Schneller Versuch: Isoliere den fehlgeschlagenen Branch, führe bis zu diesem Knoten aus, überprüfe die ComfyUI-Konsole auf die erste echte Fehlerzeile. Wenn einer dieser Punkte zutrifft, stoppe ich. Eine Änderung nach der anderen. Dann führe ich einen 2–3-Sekunden-Clip erneut aus, damit ich keine Zeit bei langen Renders verschleudere.

OOM Fix: Auflösung / Genauigkeit / Batch-Downgrade-Reihenfolge

Meine LTX-2-OOM-Routine ist langweilig, aber sie funktioniert. Ich mache es in dieser Reihenfolge und gehe nur zum nächsten Schritt über, wenn die OOM bestehen bleibt:

1. Zunächst die Auflösung

  • Reduziere Höhe/Breite um 20–30% anstatt zu halbieren. Viele LTX-2-Graphen sind stride-empfindlich (Vielfache von 8 oder 16). Ich halte Dimensionen durch 16 teilbar, um verborgene Polsterung zu vermeiden.
  • Wenn du 1024×576 anstrebst, versuche 896×504. Sag dir, es sieht näher am Original aus, als du erwartest.

2. Genauigkeit als nächstes

  • Wechsle die Modellgenauigkeit im relevanten Loader-Knoten zu fp16 (oder bf16, wenn dein Stack das unterstützt). Auf NVIDIA Consumer-GPUs spart fp16 normalerweise die sauberste Speichereinsparung.
  • Gemischte Genauigkeit ist in Ordnung, aber ich verzichte darauf, sie während des Durchlaufs pro Knoten umzuschalten. Verpflichte dich zu einer Genauigkeit für die schweren Teile.

3. Batch-Größe zuletzt

  • Stelle Batch auf 1 für Video-Sampling ein. Selbst kleine Batches vervielfachen Schlüsselaktivierungen im Speicher. Ich erhöhe Batch nur für schnelle Latenzen oder Vorschauversionen.

Ich habe auch einen subtilen Gewinn bemerkt: Sperren Sie den Seed während der OOM-Optimierung. Zufälligkeit kann verbergen, ob deine letzte Änderung wirklich geholfen hat.

Schwarzer Bildschirm: Modellladung vs. Decode-Probleme

Mein erster schwarzer Bildschirm diese Woche erwies sich überhaupt nicht als Modellfehler. Es war eine Decode-Besonderheit.

Wie ich die beiden schnell unterscheide

Überprüfe Dateigröße und Dauer

  • Wenn das Video die richtige Länge und ungefähr die erwartete Größe hat, könnten die Frames vorhanden sein. Dein Player mag das Pixelformat oder den Farbraum möglicherweise nicht.

  • Codiere mit einer sicheren Baseline neu:
    ffmpeg -i input.mp4 -pix_fmt yuv420p -c:v libx264 -crf 18 output.mp4
    (siehe FFmpeg-Dokumentation für mehr Codierungsoptionen) Durchsuche die ComfyUI-Konsole

  • Echte Modell-Ladeprobleme machen sich bekannt: fehlende Gewichte, inkompatible Schlüssel oder ein VAE/Modell-Hash-Mismatch.

  • Wenn du erfolgreiche Sampling-Logs und keine Ausnahmen siehst, liegt es wahrscheinlich an einem Display-/Encode-Pfad.

Latente Dimensionsmismatch

  • LTX-2-Pipelines erwarten bestimmte Strides (oft Vielfache von 16). Wenn deine Latent- oder Control-Eingaben nicht übereinstimmen, kannst du leere oder nahezu schwarze Frames erhalten.
  • Ich überprüfe, dass alle Resize-Knoten stattfinden, bevor das Modell sie erwartet, und dass alle Branches Breite/Höhe vereinbaren.

Farbraumüberraschungen

  • Vollständig vs. begrenzter Bereich kann in einigen Playern zu schwarzem Aussehn führen. Eine schnelle Neucodierung (oben) räumt normalerweise auf.

Falls es ein Modell-Ladeproblem ist, gehe zur Quelle: Überprüfe, dass der LTX-2-Checkpoint-Pfad im Loader-Knoten auf die tatsächliche Datei verweist, bestätige die Prüfsumme und stelle sicher, dass das erwartete Gewichtsformat des Knotens (safetensors vs. ckpt) mit der Datei übereinstimmt. Die offizielle ComfyUI-Dokumentation und die README des Modells sind die einzigen Seiten, denen ich für Versions-/Formatnotizen vertraue.

Flimmer-Fix: Stabilitätsparameter & Prompt-Verankerung

Flimmern ist nicht immer ein Fehler. Manchmal macht das Modell genau, was man ihm sagte, mit zu viel Freiheit.

Was die Dinge für mich stabilisiert hat:

  • Sperren Sie den Seed
    Ich sperren den Seed für jeden A/B-Test. Es entfernt sofort eine rutschige Variable.

  • Senken Sie CFG um eine Stufe
    Wenn ich bei 8–9 bin, versuche ich 6. Übermäßig hohe Guidance kann Frames in verschiedene Richtungen zerren.

  • Denoise und Bewegungsstärke
    Sanfte Reduzierungen hier (10–20%) helfen oft mehr als das Erhöhen von Schritten. Ich habe festgestellt, dass etwas weniger Denoise zeitliche Signale besser bewahrt.

  • Prompt-Verankerung
    Behalte einen stabilen Basis-Prompt und verschiebe Änderungen in einen kleinen, expliziten Abschnitt (Keyframes oder eine kurze Klammer). Das Ändern des gesamten Satzes über Frames lädt zur Drift ein.

  • Zeitliche Konsistenz-Pass
    Wenn dein Graph einen zeitlichen/Konsistenz-Knoten hat, führe ihn leicht aus. Er wird keine Details erfinden, aber er kann das Zittern schleifen.

  • Sampler-Auswahl
    Ich teste 2–3 Sampler mit demselben Seed. Einige sind bei Video springend. Wenn einer die Kanten bei der gleichen Schrittanzahl beruhigt, behalte ich ihn.

Kleine Anmerkung: Ich habe aufgehört, “perfekte” Bild-Kohärenz zu jagen. Mein Ziel ist weniger mentale Ermüdung beim Bearbeiten, etwas, das ich schneiden kann, nicht Perfektion unter einem Mikroskop.

Beschädigte Ausgabe: Gewichtsmismatch / Pfadfehler

Beschädigung zeigte sich für mich als rosa Blöcke, funkelnder Schnee oder Farbbänderung, die nicht zum Prompt passte. Jedes Mal war es etwas Alltägliches:

  • Nichtübereinstimmende Gewichte
    Der Loader erwartete eine bestimmte LTX-2-Variante: Ich hatte eine andere mit ähnlicher Benennung. Ich schließe jetzt das Modelldatum oder den Hash in Dateinamen ein.

  • Falsches VAE
    Beliebiges Tauschen von VAEs hat mich getroffen. Die Lösung war einfach: Verwende das im LTX-2-Knoten-Docs oder in der Modell-README angegebene VAE. Falls nicht angegeben, verwende standardmäßig die im Bundle enthaltene oder vom Graphen-Autor empfohlene.

  • Teilweise Downloads
    Ein 3–8 GB Checkpoint fehlgeschlagen bei 95% sieht in einer Ordneransicht vollständig aus. Ich überprüfe die Dateigröße gegen die Repo-Auflistung und überprüfe ggf. den Hash.

  • Pfad-Pannen (besonders Windows)
    Nicht-ASCII-Zeichen und sehr lange Pfade haben in der Vergangenheit Ladevorgänge für mich unterbrochen. Glaubt mir, ich behalte Modellpfade kurz (z.B. D:\models\ltx2\…) und vermeide Leerzeichen, wenn ich kann.

  • Gemischte Formate
    safetensors vs. .ckpt sind in einigen Knoten nicht austauschbar. Ich stimme der Erwartung des Knotens zu.

Wenn ich Beschädigung vermute, führe ich einen bekannten guten kleinen Prompt bei winziger Auflösung erneut aus. Wenn das sauber ist, weiß ich, dass das Problem in meiner aktuellen Kombination liegt, nicht in der gesamten Installation.

Log-Lesen: Welche Schicht ist abgestürzt

Die meisten meiner Zeitsparmaßnahmen kamen vom Lesen der ersten fehlgeschlagenen Zeile, nicht der letzten dramatischen. ComfyUIs Konsole sagt dir normalerweise genug, wenn du dir dreißig Sekunden Zeit nimmst.

Worauf ich achte:

  • CUDA out of memory
    Kein Fehler. Reduziere Auflösung/Genauigkeit/Batch wie oben. Wenn es jedes Mal beim gleichen Schritt fehlschlägt, triffst du eine spezifische Aktivierungsspitze, reduziere Schritte oder aktiviere speichereffiziente Aufmerksamkeit.

  • CUDNN_STATUS_EXECUTION_FAILED oder illegaler Speicherzugriff
    Oft Treiber- oder Bibliotheks-Mismatch. Ich notiere meine CUDA-, PyTorch- und GPU-Treiberversionen in einer Textdatei. Wenn ich kürzlich eine aktualisiert habe, rollte ich sie zurück oder baue die venv neu. Die ComfyUI-Dokumentation hat eine kleine Matrix bekannter guter Kombinationen.

  • Größenmismatch / Shape-Fehler
    Ein Tensor hat die falsche Form. Dies ist normalerweise ein Knoten-Graphen-Problem: Eine Größenänderung geschieht auf einem Branch und nicht auf einem anderen, oder eine Control-Eingabe erwartet eine andere Skalierung. Ich verfolge die Dimensionen, wo sie divergieren.

  • KeyError / fehlende state_dict-Schlüssel
    Gewichts–Knoten-Mismatch. Vergleiche die aufgelisteten fehlenden Schlüssel mit der Modell-README. Falsche Checkpoint-Variante oder veralteter Knoten.

  • AttributeError: ‘NoneType’ …
    Ein früherer Knoten hat nichts zurückgegeben. Ich führe den Graphen nur bis zu diesem Knoten aus. Das erste None ist der echte Schuldige.

Zwei Gewohnheiten, die geholfen haben:

  • Führe kurze Clips beim Debuggen aus. Zehn Sekunden Fehler-Logs verschwenden viel weniger Zeit als eine Minute Stille.
  • Aktiviere alle verfügbaren Debug-/Verbose-Umschalter auf dem verdächtigen Knoten. Zusätzlicher Kontext schlägt Raten.

Ich behalte eine kleine “Umgebungskarte” im Projektordner: GPU-Modell und VRAM, Treiber, CUDA, PyTorch, ComfyUI-Commit, Knotenpakete-Versionen und LTX-2-Checkpoint-Hash. Wenn etwas kaputt geht, vergleiche ich es mit der Karte von letzter Woche, bevor ich das Modell beschuldige.

Wann zu Cloud wechseln (WaveSpeed Fehlersuche-Abkürzung)

Ich eile nicht zur Cloud für LTX-2, aber es gibt Momente, in denen es die sauberste Methode ist, “die Laune meines Computers” von echten Problemen zu trennen.

Wann ich wechsle

  • VRAM unter 16 GB und ich brauche 1024p-Ausgaben ohne schwere Kompromisse.
  • Ich sehe instabile Abstürze, die an meinen lokalen CUDA/Treiber-Versionen gebunden sind, und ich habe keine Zeit zum Neuaufbau.
  • Ich möchte eine zweite Meinung: gleicher Graph, andere Hardware.

Was ich auf WaveSpeed (oder einem vergleichbaren GPU-Arbeitsplatz) mache

  • Wähle ein bekanntes gutes Image (dokumentiertes CUDA/PyTorch-Combo). Das ist wichtiger als rohe TFLOPS, wenn du debuggst.
  • Synchronisiere nur den minimalen Graphen, die exakten LTX-2-Gewichte (mit Hash) und einen kurzen Test-Prompt.
  • Führe zuerst den kleinsten reproduzierbaren Fall aus. Wenn es in der Cloud funktioniert und nicht lokal, ist es wahrscheinlich die Umgebung: Wenn es in beiden fehlschlägt, ist es der Graph oder die Gewichte.

Kosten und Kompromisse

  • Du zahlst für Compute, ja. Aber eine saubere Repro kann einen Nachmittag Treiber-Roulette sparen.
  • Cloud-Festplatten können Pfade auch verbergen, nur auf andere Weise. Ich behalte immer noch Pfade kurz und ASCII.

Das ist kein Push, um deinen Workflow zu verlagern. Es ist nur eine stille Abkürzung, wenn du steckst und der Zeitrahmen lauter ist als deine Geduld.

Wir haben WaveSpeed für Momente wie diesen gebaut — wenn du einfach eine saubere GPU-Umgebung brauchst, um Dinge schnell auszuschließen. Wenn du bei der Fehlersuche für LTX-2 festlegst, kannst du unseren WaveSpeed hier versuchen.


Was ist der verrückteste LTX-2-Bug, auf den du diese Woche gestoßen bist? Schreib einen Kommentar und lass mich wissen, falls es eine neue Falle ist.