LTX-2 ComfyUI 快速入门:10分钟生成首个视频(第0天原生支持)

LTX-2 ComfyUI 快速入门:10分钟生成首个视频(第0天原生支持)

我是多拉。上周末我其实没打算在ComfyUI里试**LTX-2**。只是遇到了一个客户视频的小问题:需要两段风格一致的短片,我常用的工具总是漂移。看到一条关于*“ltx-2 comfyui day-0 支持”*的信息,我深吸一口气,花了一个晚上试试。我在2026年1月6-8日期间,在主工作站和便携式笔记本电脑上进行了测试。

接下来的内容不是评测,只是我在**ComfyUI**里实际运行LTX-2的感受——哪些地方有帮助,哪些地方遇到了阻力,以及如果明天要再做一次我会重复使用的设置。


什么是Day-0原生支持(2026年1月5-6日发布)

这里的Day-0支持意味着LTX-2在模型发布的同一周内就附带了能在ComfyUI里正常工作的节点和参考工作流。没有垫片脚本,没有神秘的分支。我在1月6日拉取了更新,看到:

  • 为LTX-2标记的内置节点(加载器、采样器和一条简单的预览路径)。
  • 一个示例工作流,能够端到端运行,无需手动连接。不算漂亮,但能用。
  • 指向官方权重的模型下载链接。我仍然需要手动将它们放在我的模型目录里,但至少链接与文档相符。

我没指望有魔法,事实上也没有。第一遍看起来有点简陋:预设有限,几个模糊的错误。但它足够稳定,能渲染4-6秒的片段,而且多次运行之间的色彩一致性比我之前用过的要好。对于day-0的ComfyUI发布来说,这已经很罕见了。

如果你关心再现性:种子能用,我可以调整动作强度而不会让场景崩溃。这个小惊喜让我继续探索。


最低要求(GPU / VRAM / ComfyUI版本)

这是基于我自己的机器。你的设置可能会不同。

  • ComfyUI: 2026年1月6日当天的新拉取版本。较旧的分支给我报了节点导入错误。如果你维护着一个长期存在的环境,可以考虑为LTX-2单独建一个干净的venv。参考官方ComfyUI文档
  • GPU/VRAM:
    • 12 GB VRAM: 512×288到512×320分辨率可行,4-5秒片段,动作保守。
    • 16 GB VRAM: 512×512分辨率4-6秒感觉舒适。在激进动作或更多步骤时偶尔会爆显存。
    • 24 GB+ VRAM: 768×432到768×768分辨率5-8秒运行顺畅。有足够的余量应对更高的CFG。
  • CPU/RAM: 没什么特殊的。我用了32 GB系统内存:占用率保持很低。
  • 驱动/运行环境: CUDA 12.x,PyTorch版本与你的CUDA匹配。xformers在12 GB显卡上有帮助,但在24 GB上不是必需的。

如果你用的是8 GB笔记本显卡,我建议先跳过本地运行,改用云服务。


5步首次运行工作流

这是我在1月6日采取的确切步骤。没有多余的花哨操作。

  1. 拉取ComfyUI更新并创建干净的环境 我从GitHub克隆了一个新的ComfyUI文件夹,并从附带的文件安装了需求。将旧节点与新视频模型混合通常会导致奇怪的无声失败。从干净环境开始为我节省了一小时。

  2. 添加LTX-2节点和权重 我使用了1月5-6日更新中附带的LTX-2节点。对于权重,我跟着节点提示中的链接,将文件放在models/ltx下(建议的路径)。如果你的节点找不到权重,它会告诉你,只需要仔细检查确切的文件名。

  3. 加载示例工作流 提供的示例给了我一个有效的基线:文本提示进,视频预览出。我只改了三件事:种子、分辨率和动作强度。从简单开始能让错误很明显。

  4. 以低分辨率运行2-4秒的测试 我的第一次运行是512×320、4秒、16帧、采样器步骤20。在24 GB 4090上耗时约50-70秒,在12 GB 3060上耗时约2-3分钟。目标不是速度:是验证管道。

  5. 微调提示和动作,然后延长长度 一旦我喜欢上基础看起来,我调整CFG和动作强度,然后推进到6-8秒。如果场景崩溃了,我会退回:降低动作、锁定种子、保持相同分辨率。

小提示: 我用种子和设置在文件名里保存了每次测试。当凌晨1点时视频开始模糊地混在一起,那条面包屑线索真是天赐之物。


推荐设置(分辨率 / fps / 长度默认值)

这些是对我来说表现不错的起点。根据需要调整。

  • 分辨率

    • 512×320或512×512用于首次预看。稳定、足够快、显存友好。
    • 768×432当你需要更多细节但不想承诺方形。
  • FPS

    • 12-16 fps用于概念阶段。你能看到动作轨迹,不会有很长的渲染时间。
    • 24 fps仅在你对外观有信心时:它会复合时间和内存。
  • 长度

    • 4-6秒是迭代的甜蜜点。超过8秒,模型开始漂移,除非你的提示锚定得很好。
  • CFG / 步骤

    • CFG从3-5开始。更高的值会增加对比度,但会过度锁定场景。
    • 18-24步在大多数情况下足够了。我没有看到过28步的大收益。
  • 动作

    • 早期保持保守。如果你需要大动作,逐步逐步构建,当调整时锁定种子。

我还保留了一个”理智默认值”预设:512×512、16 fps、6秒、CFG 4、步骤22、动作0.6。很无聊,但无聊是可靠的。


3个能用的复制粘贴提示

这些不是魔法词汇,只是在1月6-8日间产生稳定、可重复片段的提示。我为每个提示包含了一条简短的设置说明。

  1. 带有温和视差的产品宏观拍摄

    • 提示: "一个简单的陶瓷杯子在木制书桌上,柔和的早晨窗光,浅景深,缓慢的视差从左到右,自然色彩,最小颗粒感"
    • 说明:背景名词要简单。如果你添加品牌语言,往往会产生幻觉标志。
  2. 带有克制动作的街道场景

    • 提示: "黄昏安静的城市街道,霓虹灯反射在潮湿的人行道上,细微毛毛雨,相机缓慢推进,微妙的镜头光晕,电影感但低调"
    • 说明:如果你的光开始闪烁,降低动作并将CFG降低1。
  3. 自然纹理循环

    • 提示: "湖面涟漪的特写,微风,温暖的日落色调,相机锁定,微小微动作,温和高光,平静心情"
    • 说明:很适合背景。种子锁定会使其在你修剪尾部时接近循环。

提示: 如果你想要更严格的风格控制,在对象前放置音调词(“低调、自然光、干净构图”)。这似乎能更好地锚定调色板。


常见首次运行错误 + 快速修复

这些是我实际遇到的问题及其解决方法。

  • 启动时CUDA显存溢出

    • 修复:先降分辨率,然后步骤,然后动作。如果你用12 GB,保持512宽度并让片段少于6秒。关闭吃显存的浏览器(认真地)。
  • 节点未找到 / 缺少类

    • 修复:将ComfyUI更新到1月5-6日的提交:删除捆绑了旧视频加载器的较旧自定义节点,然后重新启动。如果错误指向特定的节点名,在你的custom_nodes文件夹中搜索重复项。
  • 权重文件未检测到

    • 修复:匹配节点期望的确切文件名。保持路径为ASCII-only;在Windows上尽量避免符号链接。移动文件后重启ComfyUI。
  • Torch / CUDA不匹配

    • 修复:确保你的PyTorch版本与你的CUDA工具包匹配。如果你不想调试,使用ComfyUI GitHub README中为你的GPU建议的pip wheel。
  • 导出时未找到FFmpeg

    • 修复:安装FFmpeg并将其添加到PATH。作为快速后备,导出帧并用你信任的任何编码器组装。
  • 片段中间闪烁或风格漂移

    • 修复:降低动作,将CFG降低1-2,保持提示干净。过度描述往往会与时间一致性冲突。

专业提示: 如果什么都不行并且你时间紧张,以12-16 fps渲染并在后期制作中用帧混合减速到24 fps。这不优雅,但在风暴中平静。

我喜欢的

  • 没有依赖问题。我在不到五分钟内测试了一个提示。
  • 合理的默认值。第一个输出不完美,但不是混乱。

阻碍我的

  • 控制不如完整的ComfyUI图表。我想念能够连接自定义后续步骤的能力。
  • 队列时间。我最长的等待约6分钟,在峰值时段。

适合谁

  • 如果你在探索外观并且不想接触驱动,很容易。
  • 如果你需要一个可重现的管道,跨项目追踪版本和种子,本地ComfyUI仍然更胜一筹。
  • 如果你只是需要立即运行LTX-2而无需设置,WaveSpeed让你在浏览器中渲染并在提交到本地管道前检查提示的合理性。

这对我有效;你的情况可能不同。如果你在旅行或用8 GB GPU,值得一看。


最后一个小想法:ComfyUI内的LTX-2没有立即让我速度更快。它确实让我的选择更清晰:更少的重要旋钮,更多没用的。比起速度,这才是一周后我注意到的。