#ai-video
32 articles
Gemini Omni Flash 正式发布:10秒多模态视频、SynthID水印,音频编辑功能暂未开放
谷歌在I/O 2026上发布了Gemini Omni Flash——一个能够跨文本、图像、音频和视频进行推理的单一模型,可生成带同步音频的连贯视频输出。本文详解已发布功能、尚未开放的功能,以及它与Veo的区别。
Seedance 2.1 与 Seedance 2.0 Mini 即将到来:画质提升,价格更低
字节跳动正在准备两个全新的 Seedance 版本:Seedance 2.1 据报道生成质量提升约 20%,而全新的 Mini 版本定价将远低于当前 Seedance 价格,同时性能超越 Seedance 2.0 Fast。
Seedance 2.0 完整指南:多模态视频创作
Seedance 2.0 现已在 WaveSpeedAI 上线。通过这份全面指南掌握其多模态视频生成能力——结合图像、视频、音频与文本,精确控制运动、风格和叙事表达。
2026年7款最佳RunwayML替代方案:更便宜、更快速的AI视频生成
正在寻找2026年的RunwayML替代方案?比较包括WaveSpeed、Kling、Pika、Luma等在内的7款顶级AI视频生成器,涵盖定价、功能和API访问。
2026年8款最佳免费AI视频生成器
2026年最佳免费AI视频生成器全面对比,涵盖免费层限制、生成质量、速度与功能。从Kling和WAN 2.7到Sora 2和Veo 3.1,一文看清。
WAN 2.7 vs Seedance 2.0 vs Sora 2 vs Veo 3.1 Fast:图生视频横向对比
在WaveSpeedAI上对比四款主流图生视频AI模型:WAN 2.7、Seedance 2.0、Sora 2 和 Veo 3.1 Fast。涵盖定价、画质、时长、音频及使用场景推荐。
PixVerse V6 Extend 现已登陆WaveSpeedAI
PixVerse V6 Extend 通过生成与原视频动作和风格一致的新帧来延续现有视频。支持最高 1080p 分辨率,可选音频,风格可控。REST API,低至 $0.025/秒,无冷启动。
PixVerse V6图生视频现已登陆WaveSpeedAI
PixVerse V6图生视频可将任意照片转化为电影级视频,支持1-15秒时长、最高1080p分辨率、可选音频及思考模式。提供REST API,起价$0.025/秒,无冷启动。
PixVerse V6文字转视频现已登陆WaveSpeedAI
PixVerse V6文字转视频可根据文本提示生成高质量视频,支持1-15秒时长、最高1080p分辨率、可选音频以及针对复杂场景的思考模式。提供REST API,起价$0.025/秒,无冷启动。
PixVerse V6 Transition 现已登陆WaveSpeedAI
PixVerse V6 Transition 可在起始与结束图像之间生成流畅的 AI 视频过渡效果,支持多片段生成、风格控制与音频,分辨率最高达 1080p。提供 REST API,起价 $0.025/秒,无冷启动。
PixVerse V6 正式发布:摄像机控制、原生音频与多镜头视频生成
PixVerse V6 推出20+电影级镜头控制、原生音频多镜头视频、15秒1080p稳定输出及开发者CLI工作流支持。了解V6带来的全新功能,以及现在可用的最佳AI视频模型。
daVinci-MagiHuman:碾压所有数字人生成器的开源模型
daVinci-MagiHuman 是一个 150 亿参数的开源模型,能在单张 H100 上 2 秒内生成唇形同步的说话头像视频。胜过 Ovi 1.1(80% 胜率)和 LTX 2.3(60.9%),采用 Apache 2.0 许可,支持多语言,速度极快。