ComfyUI-LTXVideo 扩展：LoRA 支持、工作流及使用场景

Let me provide the translation directly:

我第一次尝试 ComfyUI LTXVideo 时，并不是在追逐新功能。我只是想要一种稳定的方式，将粗糙的故事板转换为动画，而不用逐帧监督。我的小困扰：漫长的一天之后又出现了一个”缺失节点”错误。我几乎关闭了窗口。但后来，我决定给它一周时间（2026年1月初），并在几个真实项目中运行它：一个12秒的产品循环、一个课程教学片段，以及一个那种要么看起来聪慧要么看起来诡异的纹理动画实验。我发现的不是魔法。但它在一些细微的地方确实让工作感觉更轻松。这通常是我寻找的信号。

核心功能与扩展：有什么区别

我一直听人们谈论 “ComfyUI 中的 LTXVideo 支持”，但不清楚什么是原生的，什么需要额外部分。以下是我在实践中注意到的。

核心功能（ComfyUI 基础）：你可以连接通用的文本转图像/视频流、安排采样器和管理条件。基础应用在数据路由、预览帧和保持运行可重复性方面非常可靠。但默认情况下不附带专门的 LTX-Video 节点。
扩展（LTXVideo 自定义节点）：这添加了围绕 LTX-Video 架构构建的模型感知节点（加载器、采样器、条件块）。该扩展理解模型的动作长度、上下文窗口以及不能干净地映射到通用节点的小约束。

当你尝试减少手动粘合代码时，差异就显现出来了。仅使用核心节点，我需要处理张量形状、猜测默认值并解决形状不匹配。安装扩展后，图表变短了，错误减少了。我仍然需要思考，只是不用再想关于管道的问题。

一个小例子：我建立了一个8-12秒的循环，具有场景一致的照明。仅核心节点花了我约45分钟来稳定：让我告诉你，扩展版本在第二次尝试中运行得很干净（约15分钟），因为预先连接的采样器和视频汇编程序处理了帧对齐，而我无需为此苦恼。

所以，如果你在评估：如果你喜欢完全控制并且不介意手动连接，核心功能就足够了。扩展适合你更关心可重复运行而不是手动调整管道的情况。

扩展添加的内容（工作流/节点/LoRA）

当我点进示例图表时，我没有期望太多，我见过太多”启动者”工作流基本上就是截图。这些比那更好。

对我有帮助的：

用途构建的节点：LTX-Video 的模型加载器、避免奇数帧数的动作长度选择器，以及尊重模型时间最佳点的采样器。它们消除了一些通常只在失败渲染后才出现的陷阱。
示例工作流：三个我一直回到的，文本转视频基础、带动作注入的图像转视频，以及使用 LoRA 的风格转移。每一个都足够清晰以开始，但不会那么死板以至于你不能交换部分。
LoRA 钩子：该扩展清晰地公开了 LoRA 强度和组合。我可以堆叠样式 LoRA 与轻身份 LoRA，同时保持运动稳定。我必须说，这在早期视频设置中很少见。

一个小惊喜：默认色彩处理感觉比我尝试过的大多数开源视频模型都更平静。蓝色不会爆炸。肤色保持在可信范围内。我仍然需要调整曝光，但我没有在与饱和度作战。

我遇到的限制：

长序列（超过约12-16秒）会漂移，除非我引入锚定关键帧或分割运行。这在这个阶段是正常的，但值得注意。
沉重的 LoRA 堆叠可能会摇晃运动。两个没问题，三个很危险，除非你降低强度。

安装和更新步骤

准备

将 ComfyUI 更新到最新版本。我在两台机器上都使用了2026年1月的夜间版本。
Python 3.10–3.11 兼容性最好。我每台机器保持一个新的虚拟环境。

安装 LTXVideo 扩展

如果你有的话，使用 ComfyUI-Manager：搜索 “LTXVideo” 或 “ComfyUI-LTXVideo” 并安装。
手动方式：将仓库克隆到 ComfyUI/custom_nodes。然后在你的环境中安装需求（pip install -r requirements.txt）。

模型

将 LTX-Video 检查点放在扩展期望的位置。大多数版本在 models/ltxvideo 或 models/checkpoints 下查看：节点通常在悬停时告诉你确切的路径。
如果你使用 LoRA，将它们放在 models/loras 下（或节点列出的任何默认值）。

CUDA 和运行时

带有 CUDA 12.x 和 PyTorch 2.3+ 的 Linux 运行得很顺利。在 macOS 上，Metal 有效，但我保持批量大小较小。
如果你在第一次运行时看到内存峰值，减少动作长度或在节点公开的情况下设置较低的解码精度。

更新

从扩展仓库拉取最新版本。当主要提交登陆时重新安装需求（我遇到了一个火炬视觉不匹配和一个 protobuf 版本碰撞：都通过干净的重新安装修复）。
更新后清除 ComfyUI 缓存（如果节点没有出现）。快速重启通常会解决过时的导入。

时间成本：第一次安装在干净的 Linux 盒子上花了我约20分钟，在 macOS 上花了约30分钟，因为我需要重新链接一些金属构建。更新是几分钟，除非依赖项更改。

示例工作流演练

我多次运行三个工作流，只调整足够以查看它们的稳定性如何。

1. 文本转视频（基线）

设置：提示、负面提示、LTX-Video 加载器、模型采样器和短边 512-768 像素的视频编写器。我将动作长度保持在 8-12 秒。
观察：第一次通常不能准确命中确切的节奏，但它给了我一个稳定的”基础版本”。第二次通过进行小的提示编辑修复了大多数问题。每次渲染在 A6000 上花费 2-4 分钟，在 M3 Max 上约 6-8 分钟。
小提示：如果运动看起来浮动，收紧时间指导或降低 CFG。对我来说，4.5-6.5 是可用范围。

2. 图像转视频与动作注入

设置：单个参考图像，加上低强度样式 LoRA 以保持纹理一致性。我使用扩展的动作节点来轻推相机漂移，而不是让它自行发明运动。
观察：第一次尝试这没有节省时间，我过度调整了。在第三次运行时，我意识到它降低了精神负担：更少的伪影需要分类，更少的”那个角落里是什么？“惊喜。
实际说明：如果主体在第3-5帧左右扭曲，添加中序列提示图像或锚定帧。我对10秒剪辑使用了两个锚定，它感觉被锁定了。

3. 使用 LoRA 的风格（加上轻身份）

设置：基本提示、一个样式 LoRA 在 0.6-0.8、身份 LoRA 在 0.2-0.3，以及保守运动。
观察：组合比我预期的保持得更好。样式强于 0.8 开始”闪闪发光”纹理，对海报很好，对运动很奇怪。保持身份低避免了不安的转变。
导出：我写到 ProRes 进行分级。H.264 很好用于快速检查，但当我在 Resolve 中进行轻度处理时颜色看起来更好。

在各次运行中，与拼接通用节点相比，我节省了大约 15-20 分钟每个剪辑。更大的胜利是更少的重启。更少的调整，更多的决策。

LoRA 和 IC-LoRA 基础

我倾向于只在需要时才使用 LoRA。使用 LTXVideo，它们值得额外的步骤，特别是为了一致性。

LoRA：把它想象成一个轻微的风格指纹。在视频中，温和地推动。强度超过约 0.8 看起来脆弱，因为运动累积。
身份 LoRA：有助于保持角色或产品在帧之间的稳定性。我喜欢 0.15-0.35 范围内的值。
IC-LoRA（图像条件 LoRA）：这是我发现最多实际价值的地方。将干净的参考图像输入 IC-LoRA 稳定了细节（徽标、面孔）而不冻结场景。我使用了一个清晰的正面图像，有时还有一个侧面角度作为次要提示。

在实践中重要的是：

干净的参考击败聪慧的提示。垃圾进垃圾出，它在运动中显示得更多。
混合更少，调整更轻。两个 LoRA 轻轻应用比三个互相争斗更有效。
如果微观抖动出现，重新播种。一个新的种子加上相同的锚定通常解决了微小的面部闪烁。

“缺失节点”修复

在测试时我遇到了三种风味的”缺失节点”。没有一个是戏剧性的，但它们确实会破坏流程。

扩展未加载：确保 LTXVideo 文件夹位于 ComfyUI/custom_nodes 下，并且它有一个 __init__.py。重启 ComfyUI。如果日志显示导入错误，为该节点重新安装需求。
依赖项漂移：Torch/CUDA 不匹配表现为导入错误。对齐扩展 README 中列出的 PyTorch 和 CUDA 版本。新的虚拟环境比调试纠缠的更快。
旧工作流、新节点：一些图表引用重命名的节点。打开 JSON，搜索节点类，并将其映射到新名称。扩展 CHANGELOG 通常会注意这些。

快速健全性检查：

更新 ComfyUI-Manager，然后”扫描更新”。
清除 ComfyUI 的缓存并重启。
确认加载节点中的模型路径，缺失的检查点从 UI 的角度看起来就像缺失的节点一样。

在 WaveSpeed 上应用这些工作流

我尝试了一次云运行以查看这如何从我的桌子上转移。在 WaveSpeed，我启动了一个带有 RTX 类 GPU 的 ComfyUI 工作空间，并以相同的方式删除了 LTXVideo 扩展。 如果你走这条路，两个说明：

保持你的模型有序：我首先将 LTX-Video 检查点和 LoRA 同步到预期的文件夹（models/ltxvideo、models/loras），然后打开示例图表。相信我，一旦路径匹配就没有惊喜。
运行长度：云 GPU 让我在不担心 VRAM 的情况下测试 12-16 秒剪辑的更高分辨率。它本身并不能解决漂移，但它加快了迭代，我可以并行渲染三个版本并选择最好的。

如果你在笔记本电脑上工作，这是在提交本地安装之前测试想法的低压力方式。你的里程可能会有所不同，但它为我省去了一些深夜编译循环。

小小的挥之不去的想法：ComfyUI 内部的 LTXVideo 不会试图在最初让你惊艳。它只是缩小了你一次必须在脑子里保持的事物数量。在忙碌的日子里，那已经足够了。