#video-generation
499 articles
Gemini Omni Flash 正式发布:10秒多模态视频、SynthID水印,音频编辑功能暂未开放
谷歌在I/O 2026上发布了Gemini Omni Flash——一个能够跨文本、图像、音频和视频进行推理的单一模型,可生成带同步音频的连贯视频输出。本文详解已发布功能、尚未开放的功能,以及它与Veo的区别。
Seedance 2.1 与 Seedance 2.0 Mini 即将到来:画质提升,价格更低
字节跳动正在准备两个全新的 Seedance 版本:Seedance 2.1 据报道生成质量提升约 20%,而全新的 Mini 版本定价将远低于当前 Seedance 价格,同时性能超越 Seedance 2.0 Fast。
Gemini Omni 演示视频泄露——谷歌全新视频模型究竟能做什么
在最初的UI字符串泄露八天后,首批Gemini Omni样本视频浮出水面。其对话驱动编辑能力表现强劲,但在原始画质方面落后于Seedance 2.0,且每段视频消耗约43%的AI Pro每日配额。这是I/O 2026开幕前一周的客观评测。
Seedance 2.0 完整指南:多模态视频创作
Seedance 2.0 现已在 WaveSpeedAI 上线。通过这份全面指南掌握其多模态视频生成能力——结合图像、视频、音频与文本,精确控制运动、风格和叙事表达。
谷歌神秘的'Omni'视频模型:Gemini界面泄露在I/O 2026前告诉我们什么
谷歌似乎正在Gemini内部测试一款名为Omni的新视频生成模型,该消息通过一段在谷歌I/O 2026前被发现的界面字符串曝光。以下是我们已知的、未知的,以及它为何可能影响重大——包括对WaveSpeedAI上Veo的影响。
PixVerse C1 图像转视频现已登陆WaveSpeedAI
PixVerse C1 图像转视频——将静态图像转化为最高 1080p、时长 1-15 秒的电影级视频片段,支持可选原生音频。现已在 WaveSpeedAI 上线。
PixVerse C1 文字生成视频现已登陆WaveSpeedAI
PixVerse C1 文字生成视频——电影级画质,最高支持1080p,时长1至15秒,可选原生音频。现已在WaveSpeedAI生产环境REST API上线。
PixVerse C1 Transition现已登陆WaveSpeedAI
PixVerse C1 Transition — 在任意两张图像之间生成流畅的电影级过渡效果。支持最高1080p分辨率、1-15秒时长,并可选配原生音频。现已在WaveSpeedAI上线。
2026年7款最佳RunwayML替代方案:更便宜、更快速的AI视频生成
正在寻找2026年的RunwayML替代方案?比较包括WaveSpeed、Kling、Pika、Luma等在内的7款顶级AI视频生成器,涵盖定价、功能和API访问。
ByteDance Seedance 2.0文生视频现已登陆WaveSpeedAI
Seedance 2.0文生视频可从文本提示词生成好莱坞级电影质量视频,具备原生音画同步、导演级镜头控制以及卓越的运动稳定性。
OpenAI Sora 2 Pro 现已登陆WaveSpeedAI
OpenAI Sora 2 Pro 是一款顶尖的文本生成视频模型,具备逼真的物理效果、同步音频和强大的可控性。支持多种分辨率,最高可达 1080p,时长最长可达 20 秒。
Seedance 2.0评测:5大主要问题与更优替代方案
Seedance 2.0拥有令人印象深刻的基准测试成绩,但激进的内容审查、高昂的费用、漫长的生成时间以及内容限制,让WAN 2.7、Sora 2和Veo 3.1等替代方案值得考虑。