← 博客

LTX 2.3 Video Extend现已登陆WaveSpeedAI

LTX-2.3 是一款基于 DiT 架构的音视频基础模型,专为在单一模型内生成同步视频与音频而设计,具备更优质的音频和视觉效果。

1 min read
Wavespeed Ai Ltx.2.3 Video Extend
Wavespeed Ai Ltx.2.3 Video Extend LTX-2.3 是一款基于 DiT 架构的音视频基础模型,专为在单一模型内生成同步视频与音频而设计,具备更优质的音频和视...
Try it
LTX 2.3 Video Extend现已登陆WaveSpeedAI

使用 LTX-2.3 Video Extend 无缝延长您的视频

在创作引人入胜的视频内容时,常常会遇到素材时长差那么几秒的情况。也许你的无人机镜头在风景完全展开之前就结束了,或者产品演示需要再多几个节拍才能充分传达信息。在此之前,延长视频素材意味着重新拍摄、使用繁琐的剪辑技巧,或者接受生硬的切换。

LTX-2.3 Video Extend 彻底改变了这一切。该模型现已在 WaveSpeedAI 上线,能够生成自然延续现有素材的额外帧——在动态、风格和氛围上的衔接天衣无缝,让观众根本无法分辨原始内容在哪里结束、延伸部分从哪里开始。

什么是 LTX-2.3 Video Extend?

LTX-2.3 Video Extend 基于 LTX-2.3 基础模型构建,采用基于 DiT(扩散 Transformer)的架构,专为具有强时序一致性的高质量视频生成而设计。LTX-2.3 系列模型涵盖文本生成视频和图像生成视频等多种能力,而 Video Extend 变体则专注于一项具体且极具实用价值的任务:获取现有视频片段,并生成自然延续内容的新帧。

上传一段视频,指定需要额外延伸的秒数(1 到 20 秒均可),并可选择性地描述场景应如何发展。模型会分析源素材的运动规律、视觉风格、光线和构图,然后生成从最后一帧自然流淌而出的延续内容。

最终得到的延伸素材完整保留了原始视频的气质——摄像机运动沿其轨迹继续,物体保持各自的运动惯性,环境细节始终如一。

核心功能

  • 时序一致性:模型不只是生成看似合理的帧——它生成的是与您特定源视频保持连贯的帧。运动轨迹、光线变化和场景动态都能自然延续。

  • 灵活的时长控制:每次生成可将视频延伸最短 1 秒、最长 20 秒。这种精细控制让您能精准添加所需内容,避免资源浪费。

  • 可选的提示词引导:模型无需任何文字输入即可延伸视频,但您也可以提供提示词来描述场景的演变方式。想让镜头向左平移?让角色开始行走?只需描述出来,模型便会将您的指引融入延续内容中。

  • 内置提示词增强器:不确定如何描述想要的延续效果?集成的提示词增强器会自动优化您的描述,带来更好的结果。

  • WaveSpeedAI 上无冷启动:模型始终处于热备状态,随时可用。提交请求即可获得结果,无需等待基础设施启动——这对于需要快速反馈循环的创意项目至关重要。

实际应用场景

社交媒体与短视频内容

一段 4 秒的日落画面固然美丽,但在 Instagram 或 TikTok 上转瞬即逝。将其延伸至 15 秒,就能发布一条完整的、能抓住注意力的内容。内容创作者可以将用手机捕捉的短暂瞬间转化为精心制作的完整视频,无需重新拍摄。

影视与视频制作

空镜头是专业视频的骨架,而素材永远不嫌多。延伸空镜、风景素材或氛围镜头,填补剪辑中的空白。一段 3 秒的无人机俯拍镜头,可以变成承载整段场景过渡的 20 秒序列。

产品演示与营销

产品视频需要精确的时长,以配合旁白和屏幕文字。当素材时长不足时,延伸几秒钟可以在不产生尴尬停顿或跳切的情况下维持视觉流畅。这对于电商产品展示尤为有用——流畅连续的画面能增强买家信心。

循环视频制作

生成额外帧,弥合视频结尾与开头之间的差距,为数字标牌、网站背景视频或环境展示创建无缝循环。

叙事与动画

动画师和数字内容创作者可以延伸关键场景,让关键时刻有更充分的呼吸空间。角色的反应镜头、戏剧性的停顿或缓慢的揭示,都可以在不增加额外手动制帧工作的情况下延伸,以服务于叙事需求。

在 WaveSpeedAI 上快速上手

使用 WaveSpeed Python SDK,只需几行代码即可开始:

import wavespeed

output = wavespeed.run(
    "wavespeed-ai/ltx-2.3/video-extend",
    {
        "video": "https://your-video-url.com/clip.mp4",
        "duration": 10,
        "prompt": "The camera continues to push forward through the forest as sunlight filters through the canopy"
    },
)

print(output["outputs"][0])

就这些。无需配置基础设施,无需管理 GPU 实例,无需等待冷启动。您只需提供视频和参数,WaveSpeedAI 负责其余一切。

价格

LTX-2.3 Video Extend 采用简单直接的按秒计费方式:

延伸时长费用
1 秒$0.10
5 秒$0.50
10 秒$1.00
20 秒$2.00

每秒仅需 $0.10,您可以自由地进行实验——先测试 1 秒的延伸效果以验证方向,满意后再扩展至更长时长。

最佳实践建议

  • 提供清晰的源素材:运动方向明确、光线一致的视频能为模型提供最强的延续信号。
  • 先短后长:在投入生成 20 秒内容之前,先测试 2-3 秒的延伸效果。这样可以快速且低成本地进行迭代。
  • 使用描述性提示词:尽管提示词是可选的,但它们能显著改善结果。请描述摄像机运动、主体行为和环境变化。
  • 考虑运动轨迹:当存在清晰的延续方向时,模型表现最佳——移动中的摄像机、行走的主体、流动的水或漂移的云朵。

突破创意边界

LTX-2.3 Video Extend 消除了视频制作中最顽固的痛点之一:素材时长固定的限制。无论您是将手机拍摄的素材打磨成精品内容的独立创作者,还是延伸精心拍摄的空镜素材的专业制作团队,该模型都能以极具实验价值的价格提供自然、连贯的延续效果。

立即在 WaveSpeedAI 上体验 LTX-2.3 Video Extend,开始将您的短片素材转化为真正所需的完整画面。