PixVerse V6文字转视频现已登陆WaveSpeedAI
PixVerse V6文字转视频可根据文本提示生成高质量视频,支持1-15秒时长、最高1080p分辨率、可选音频以及针对复杂场景的思考模式。提供REST API,起价$0.025/秒,无冷启动。
PixVerse V6文本生成视频现已登陆WaveSpeedAI:带原生音频的影院级AI视频
PixVerse V6为文本生成视频带来了全新的控制维度。描述一个场景,将分辨率设置至最高1080p,选择1到15秒的时长,并可选择生成同步音频——一次API调用即可完成。全新的思维模式能够处理早期模型难以应对的复杂场景描述。
PixVerse V6文本生成视频的工作原理
编写一段描述场景的提示词——主体、动作、镜头风格、光线、氛围。V6解析描述后生成具有流畅动作和自然细节的视频。内置的提示词增强器会自动将简单描述扩展为丰富的生成提示词。
V6的独特之处:针对复杂场景的思维模式(模型在生成前会推理空间关系和运动路径),以及为视频添加同步环境音效的原生音频功能。
PixVerse V6文本生成视频的核心功能
-
1-15秒时长:灵活的片段长度,精确到秒——从短循环到长序列均可。
-
最高1080p分辨率:四档选择——360p用于快速测试,540p/720p用于生产环境,1080p用于高品质输出。
-
原生音频生成:可选同步音效——环境音频、氛围音效——与视频在单次生成中同步产出。
-
思维模式:针对复杂或细腻场景描述的扩展推理,生成更连贯的动作和构图。
-
提示词增强器:内置工具,将简单描述转化为详细的生成提示词。
PixVerse V6文本生成视频的最佳使用场景
影院级叙事
具有特定镜头运动、光线和氛围的详细叙事场景。V6的思维模式能处理简单模型难以驾驭的多元素构图。
社交媒体内容
为TikTok、Reels和Shorts优化的短视频内容,支持灵活的宽高比,快速交付。
营销与广告
仅凭文字描述即可生成推广视频内容——无需拍摄、无需素材库、无需版权授权。
视听体验
开启音频生成,打造沉浸式场景——海浪声、城市环境音、人群噪声——与视觉内容同步呈现。
PixVerse V6文本生成视频定价
| 分辨率 | 不含音频 | 含音频 |
|---|---|---|
| 360p | $0.025/秒 | $0.035/秒 |
| 540p | $0.035/秒 | $0.045/秒 |
| 720p | $0.045/秒 | $0.060/秒 |
| 1080p | $0.090/秒 | $0.115/秒 |
一段5秒720p的视频,不含音频费用为$0.225,含音频为$0.30。
PixVerse V6文本生成视频的最佳实践建议
- 在提示词中加入镜头角度、光线质感和运动风格,以获得影院级效果
- 在提交1080p渲染前,先用360p/540p进行测试
- 对于具有强烈环境元素的场景,建议开启音频功能
- 针对复杂的多元素场景,使用思维模式
常见问题
什么是PixVerse V6文本生成视频?
一款AI视频生成模型,可根据文本提示生成1-15秒的视频片段,分辨率最高达1080p,并可选配同步音频。
费用是多少?
从$0.025/秒(360p不含音频)到$0.115/秒(1080p含音频)不等。
能生成音频吗?
可以。启用generate_audio_switch即可在生成视频的同时生成同步环境音效。


