ComfyUI-LTXVideo 扩展:LoRA 支持、工作流及使用场景
Let me provide the translation directly:
我第一次尝试 ComfyUI LTXVideo 时,并不是在追逐新功能。我只是想要一种稳定的方式,将粗糙的故事板转换为动画,而不用逐帧监督。我的小困扰:漫长的一天之后又出现了一个”缺失节点”错误。我几乎关闭了窗口。但后来,我决定给它一周时间(2026年1月初),并在几个真实项目中运行它:一个12秒的产品循环、一个课程教学片段,以及一个那种要么看起来聪慧要么看起来诡异的纹理动画实验。 我发现的不是魔法。但它在一些细微的地方确实让工作感觉更轻松。这通常是我寻找的信号。
核心功能与扩展:有什么区别
我一直听人们谈论 “ComfyUI 中的 LTXVideo 支持”,但不清楚什么是原生的,什么需要额外部分。以下是我在实践中注意到的。
- 核心功能(ComfyUI 基础):你可以连接通用的文本转图像/视频流、安排采样器和管理条件。基础应用在数据路由、预览帧和保持运行可重复性方面非常可靠。但默认情况下不附带专门的 LTX-Video 节点。

- 扩展(LTXVideo 自定义节点):这添加了围绕 LTX-Video 架构构建的模型感知节点(加载器、采样器、条件块)。该扩展理解模型的动作长度、上下文窗口以及不能干净地映射到通用节点的小约束。
当你尝试减少手动粘合代码时,差异就显现出来了。仅使用核心节点,我需要处理张量形状、猜测默认值并解决形状不匹配。安装扩展后,图表变短了,错误减少了。我仍然需要思考,只是不用再想关于管道的问题。
一个小例子:我建立了一个8-12秒的循环,具有场景一致的照明。仅核心节点花了我约45分钟来稳定:让我告诉你,扩展版本在第二次尝试中运行得很干净(约15分钟),因为预先连接的采样器和视频汇编程序处理了帧对齐,而我无需为此苦恼。
所以,如果你在评估:如果你喜欢完全控制并且不介意手动连接,核心功能就足够了。扩展适合你更关心可重复运行而不是手动调整管道的情况。
扩展添加的内容(工作流/节点/LoRA)
当我点进示例图表时,我没有期望太多,我见过太多”启动者”工作流基本上就是截图。这些比那更好。
对我有帮助的:
- 用途构建的节点:LTX-Video 的模型加载器、避免奇数帧数的动作长度选择器,以及尊重模型时间最佳点的采样器。它们消除了一些通常只在失败渲染后才出现的陷阱。
- 示例工作流:三个我一直回到的,文本转视频基础、带动作注入的图像转视频,以及使用 LoRA 的风格转移。每一个都足够清晰以开始,但不会那么死板以至于你不能交换部分。
- LoRA 钩子:该扩展清晰地公开了 LoRA 强度和组合。我可以堆叠样式 LoRA 与轻身份 LoRA,同时保持运动稳定。我必须说,这在早期视频设置中很少见。
一个小惊喜:默认色彩处理感觉比我尝试过的大多数开源视频模型都更平静。蓝色不会爆炸。肤色保持在可信范围内。我仍然需要调整曝光,但我没有在与饱和度作战。
我遇到的限制:
- 长序列(超过约12-16秒)会漂移,除非我引入锚定关键帧或分割运行。这在这个阶段是正常的,但值得注意。
- 沉重的 LoRA 堆叠可能会摇晃运动。两个没问题,三个很危险,除非你降低强度。
安装和更新步骤
准备
- 将 ComfyUI 更新到最新版本。我在两台机器上都使用了2026年1月的夜间版本。
- Python 3.10–3.11 兼容性最好。我每台机器保持一个新的虚拟环境。
安装 LTXVideo 扩展
- 如果你有的话,使用 ComfyUI-Manager:搜索 “LTXVideo” 或 “ComfyUI-LTXVideo” 并安装。

- 手动方式:将仓库克隆到 ComfyUI/custom_nodes。然后在你的环境中安装需求(
pip install -r requirements.txt)。
模型
- 将 LTX-Video 检查点放在扩展期望的位置。大多数版本在
models/ltxvideo或models/checkpoints下查看:节点通常在悬停时告诉你确切的路径。 - 如果你使用 LoRA,将它们放在
models/loras下(或节点列出的任何默认值)。
CUDA 和运行时
- 带有 CUDA 12.x 和 PyTorch 2.3+ 的 Linux 运行得很顺利。在 macOS 上,Metal 有效,但我保持批量大小较小。
- 如果你在第一次运行时看到内存峰值,减少动作长度或在节点公开的情况下设置较低的解码精度。
更新
- 从扩展仓库拉取最新版本。当主要提交登陆时重新安装需求(我遇到了一个火炬视觉不匹配和一个 protobuf 版本碰撞:都通过干净的重新安装修复)。
- 更新后清除 ComfyUI 缓存(如果节点没有出现)。快速重启通常会解决过时的导入。
时间成本:第一次安装在干净的 Linux 盒子上花了我约20分钟,在 macOS 上花了约30分钟,因为我需要重新链接一些金属构建。更新是几分钟,除非依赖项更改。
示例工作流演练
我多次运行三个工作流,只调整足够以查看它们的稳定性如何。
1. 文本转视频(基线)
- 设置:提示、负面提示、LTX-Video 加载器、模型采样器和短边 512-768 像素的视频编写器。我将动作长度保持在 8-12 秒。
- 观察:第一次通常不能准确命中确切的节奏,但它给了我一个稳定的”基础版本”。第二次通过进行小的提示编辑修复了大多数问题。每次渲染在 A6000 上花费 2-4 分钟,在 M3 Max 上约 6-8 分钟。
- 小提示:如果运动看起来浮动,收紧时间指导或降低 CFG。对我来说,4.5-6.5 是可用范围。
2. 图像转视频与动作注入
- 设置:单个参考图像,加上低强度样式 LoRA 以保持纹理一致性。我使用扩展的动作节点来轻推相机漂移,而不是让它自行发明运动。
- 观察:第一次尝试这没有节省时间,我过度调整了。在第三次运行时,我意识到它降低了精神负担:更少的伪影需要分类,更少的”那个角落里是什么?“惊喜。
- 实际说明:如果主体在第3-5帧左右扭曲,添加中序列提示图像或锚定帧。我对10秒剪辑使用了两个锚定,它感觉被锁定了。
3. 使用 LoRA 的风格(加上轻身份)
- 设置:基本提示、一个样式 LoRA 在 0.6-0.8、身份 LoRA 在 0.2-0.3,以及保守运动。
- 观察:组合比我预期的保持得更好。样式强于 0.8 开始”闪闪发光”纹理,对海报很好,对运动很奇怪。保持身份低避免了不安的转变。
- 导出:我写到 ProRes 进行分级。H.264 很好用于快速检查,但当我在 Resolve 中进行轻度处理时颜色看起来更好。
在各次运行中,与拼接通用节点相比,我节省了大约 15-20 分钟每个剪辑。更大的胜利是更少的重启。更少的调整,更多的决策。
LoRA 和 IC-LoRA 基础
我倾向于只在需要时才使用 LoRA。使用 LTXVideo,它们值得额外的步骤,特别是为了一致性。
- LoRA:把它想象成一个轻微的风格指纹。在视频中,温和地推动。强度超过约 0.8 看起来脆弱,因为运动累积。
- 身份 LoRA:有助于保持角色或产品在帧之间的稳定性。我喜欢 0.15-0.35 范围内的值。
- IC-LoRA(图像条件 LoRA):这是我发现最多实际价值的地方。将干净的参考图像输入 IC-LoRA 稳定了细节(徽标、面孔)而不冻结场景。我使用了一个清晰的正面图像,有时还有一个侧面角度作为次要提示。
在实践中重要的是:
- 干净的参考击败聪慧的提示。垃圾进垃圾出,它在运动中显示得更多。
- 混合更少,调整更轻。两个 LoRA 轻轻应用比三个互相争斗更有效。
- 如果微观抖动出现,重新播种。一个新的种子加上相同的锚定通常解决了微小的面部闪烁。
“缺失节点”修复
在测试时我遇到了三种风味的”缺失节点”。没有一个是戏剧性的,但它们确实会破坏流程。
- 扩展未加载:确保 LTXVideo 文件夹位于
ComfyUI/custom_nodes下,并且它有一个__init__.py。重启 ComfyUI。如果日志显示导入错误,为该节点重新安装需求。 - 依赖项漂移:Torch/CUDA 不匹配表现为导入错误。对齐扩展 README 中列出的 PyTorch 和 CUDA 版本。新的虚拟环境比调试纠缠的更快。
- 旧工作流、新节点:一些图表引用重命名的节点。打开 JSON,搜索节点类,并将其映射到新名称。扩展 CHANGELOG 通常会注意这些。
快速健全性检查:
- 更新 ComfyUI-Manager,然后”扫描更新”。
- 清除 ComfyUI 的缓存并重启。
- 确认加载节点中的模型路径,缺失的检查点从 UI 的角度看起来就像缺失的节点一样。
在 WaveSpeed 上应用这些工作流
我尝试了一次云运行以查看这如何从我的桌子上转移。在 WaveSpeed,我启动了一个带有 RTX 类 GPU 的 ComfyUI 工作空间,并以相同的方式删除了 LTXVideo 扩展。
如果你走这条路,两个说明:
- 保持你的模型有序:我首先将 LTX-Video 检查点和 LoRA 同步到预期的文件夹(
models/ltxvideo、models/loras),然后打开示例图表。相信我,一旦路径匹配就没有惊喜。 - 运行长度:云 GPU 让我在不担心 VRAM 的情况下测试 12-16 秒剪辑的更高分辨率。它本身并不能解决漂移,但它加快了迭代,我可以并行渲染三个版本并选择最好的。
如果你在笔记本电脑上工作,这是在提交本地安装之前测试想法的低压力方式。你的里程可能会有所不同,但它为我省去了一些深夜编译循环。
小小的挥之不去的想法:ComfyUI 内部的 LTXVideo 不会试图在最初让你惊艳。它只是缩小了你一次必须在脑子里保持的事物数量。在忙碌的日子里,那已经足够了。





