Agnes-Video-V2.0 以 $0.30/分钟登场:Artificial Analysis 排行榜上的价格颠覆者
Agnes AI 的 V2.0 视频模型本周发布,支持原生音视频同步生成,定价仅 $0.30/分钟——比 Seedance 2.0 便宜约 28 倍。它在 Artificial Analysis 的 Elo 排名中跻身前 10,但仍远落后于前三名领跑者。以下是对其市场定位的客观解读。
本周,Artificial Analysis视频排行榜迎来了一位新入局者,其定价主张足够尖锐,值得细细审视:Agnes-Video-V2.0定价$0.30/分钟,原生支持音视频生成。为了让这个数字更直观——这比Seedance 2.0标准版每秒价格便宜约28倍,也远低于此前前十榜单中的任何模型。Agnes AI公开将此定位为”价格屠夫”策略。
客观来看,比标题所呈现的更为复杂。Agnes V2.0确实是一个有意义的价格破局者。同时它在Elo评分上也明显低于当前质量领先者。以下是该产品的发布详情、Agnes V2在排行榜上的真实位置,以及$0.30/分钟的定价究竟改变了哪些工作场景。
发布详情
| 详情 | 内容 |
|---|---|
| 模型名称 | Agnes-Video-V2.0 |
| 开发方 | Agnes AI(AgnesAI Sapiens) |
| 定价 | $0.30/分钟(约$0.005/秒) |
| 原生音视频 | 支持 |
| 模式 | 文本生成视频、图像生成视频、首帧、首尾帧、多帧 |
| 发行渠道 | Agnes应用、PAVO应用、API |
| 发布时间 | 2026年5月19日当周 |
模式列表值得关注。这个价位的大多数视频模型仅支持文本生成视频;Agnes V2.0原生支持首尾帧插值和多帧条件控制。这使其功能面更接近Seedance 2.0标准接口,而非廉价版Veo或Sora的功能集。
排行榜位置,如实说来
Agnes自家的公告称”全球AI实验室前十”。这个表述准确,但掩盖了差距。以下是Agnes在发布时随附发布的Artificial Analysis Elo数据:
| 类别 | Agnes-V2 Elo | 样本量 | 95%置信区间 |
|---|---|---|---|
| 文本生成视频(含音频) | 885 | 2,463 | ±13 |
| 图像生成视频(含音频) | 934 | 2,576 | ±12 |
作为参照——我上次报道时同一排行榜的顶部模型:
| 模型 | T2V Elo | 状态 |
|---|---|---|
| HappyHorse-1.0 | ~1,333 | 神秘模型,无API |
| Seedance 2.0 | ~1,273 | 生产可用,已上线WaveSpeedAI |
| SkyReels V4 | ~1,245 | 生产可用 |
| Kling 3.0 Pro | ~1,241 | 生产可用 |
| Agnes-Video-V2.0 | ~885 | 刚刚发布 |
所以Agnes V2确实进入了前十——但落后领先者约400个Elo点。400点的Elo差距意味着Agnes在与Seedance 2.0的头对头对比中,绝大多数情况下会落败。这不是边际质量差异;这是不同的层级。
客观定位:Agnes V2.0并非在质量上与Seedance 2.0竞争。它竞争的是你原本愿意花$0.30生成的内容——而在今天,前沿层级里这基本上是空白。
$0.30/分钟的定价究竟改变了哪些场景
真正有趣的工作场景,不是那些Seedance 2.0已经能产出可接受效果的场景——那些场景会继续使用Seedance。有趣的是那些在此之前根本无法经济可行地使用前沿视频的场景:
- 大批量草稿生成。 当单价从约$8/分钟(Seedance 2.0)降至$0.30/分钟,每花一美元你可以生成25+个变体,而此前只能生成一个。即便质量有所下降,提示词工程的迭代循环也会大幅提速。
- 规模化个性化内容。 面向教育、培训或社交信息流个性化工作流的按用户视频生成。在$0.14/秒时不成立的经济账,在$0.005/秒时开始成立。
- 内部评估流水线。 生成参考片段以对新模型版本进行评分,在重评估的技术栈中一直是真实的成本来源。将参考生成成本降低28倍,改变了你构建基准循环的方式。
- 高端视频原本不可行的市场。 长篇教育平台、低CPM广告网络、低预算创作者工具——在Seedance/Veo从未具备可行性的价格区间和地区。
Agnes V2不适用的场景,是当今大多数生产视频工作流真正关心的那种:一条发给付费用户的高质量单片。对此,400点Elo差距至关重要。但对于这之前的批量工作,差距就没那么重要了。
我们尚不知道的
三件尚未公开、但会改变判断的事:
- 独立基准测试。 Agnes的排行榜排名基于Artificial Analysis。在不同评测维度上——文字渲染精度、多角色一致性、接触物理——质量是否保持一致,尚无文献记录。“全球前十”的说法在一个基准上是真实的;复现才能使其普遍成立。
- 音画同步质量。 原生音视频已在规格表中标注。唇形同步、环境音效和音乐节点的质量是否与视觉层级相匹配,尚无文献记录。在Veo 3.1为音画一致性树立高标准的背景下,这一维度决定了”含音频”究竟是真正的产品功能还是仅仅勾选了一个框。
- 延迟与吞吐量。 一个$0.30/分钟但每次生成需要10分钟的模型,与一个30秒内完成的模型,经济性截然不同。我查看Artificial Analysis面板时,Agnes V2的”生成时间”数据尚未填充。
这些问题无法通过新闻报道解答,只能在开发者运行自己的评测之后才会明朗,而这需要未来两到四周的公开讨论。
Agnes V2在当前阵容中的定位
具体部署参考如下:
适合使用Agnes V2的场景:
- 单价成本主导质量决策的提示词批量A/B测试
- 分镜工作流中的草稿生成
- 在Seedance/Veo上经济上不可行的规模化个性化视频
- 内部评估参考片段生成
继续使用Seedance / Veo / Sora的场景:
- 面向用户的最终输出视频
- 400点Elo质量差距会明显降低效果的内容
- 需要Seedance 2.0擅长的多模态参考输入的工作流(图像+视频+音频组合,详见我们的Seedance 2.0指南)
- 任何Artificial Analysis”含音频”350+点Elo差距会被终端用户感知到的场景
值得关注的信号
未来一个月内的两个信号:
- 第三方基准测试复现。 Agnes V2能否在Artificial Analysis以外的基准测试套件上保持前十位置?关注Vidu跨平台评测以及独立实验室开展的人类偏好评估。
- 下一个Agnes版本。 Agnes AI迭代速度较快——V1.2到V2.0的周期相对较短。如果V2.1或V3在维持$0.30/分钟定价的同时缩小Elo差距,产品故事将变得更加有趣。如果他们为追求质量而涨价,则会成为一个普通的中间层玩家。
目前的结论
对于当前生产视频工作流,Seedance 2.0系列——标准版、快速版以及即将发布的Mini和2.1变体——仍是最稳妥的默认选择。Agnes V2是值得纳入任何视频技术栈批量层的补充选项,而非Seedance的替代品。在决定哪个层级承担什么工作之前,请先针对你的特定提示词集运行自己的Elo风格A/B对比测试。
来源:Agnes AI的X公告、搜狐关于此次发布的报道、Artificial Analysis Agnes Video页面、文本生成视频排行榜。
