← 博客

HappyHorse-1.0 是什么?神秘的 #1 AI 视频模型

HappyHorse-1.0 在 Artificial Analysis 上跃居第一,却没有公开的团队信息。以下是已确认的事实与仍待核实的内容。

By Dora 3 min read
HappyHorse-1.0 是什么?神秘的 #1 AI 视频模型

大家好,我是 Dora。我几乎每周都会关注 Artificial Analysis Video Arena 排行榜——这是一个基于盲测用户投票和 Elo 评分的榜单,没有任何实验室自报数据。上周,一个我从未见过的名字出现在文生视频和图生视频两项排名的榜首:HappyHorse-1.0。没有已知团队,没有品牌背景,GitHub 和 HuggingFace 链接都显示”即将上线”。

如果你在将视频模型集成到工作流之前需要评估其质量,并且已经学会对排行榜炒作保持警惕——这篇文章会帮你梳理哪些信息已经得到确认、哪些只是声称,以及两者之间的差距对当下决策意味着什么。

HappyHorse-1.0 是如何进入视野的

Artificial Analysis Video Arena:这个排行榜是什么,为什么值得关注

Artificial Analysis 运营着一个视频竞技场。用户提交一段文字提示或参考图片,系统从两个模型各生成一段输出,用户并排查看两段视频,在不知道哪个模型生成哪段的情况下选出自己更喜欢的那个。

这些投票数据会输入 Elo 评分系统——与国际象棋排名使用的算法相同。当用户选择某个模型时,该模型的分数上升,反之下降,并根据对手强度进行调整。最终排名完全基于盲测条件下的用户集体偏好,没有精心挑选的实验室提交内容,没有自报基准。

盲测投票与 Elo:不是自报基准

我见过的其他视频模型排名都有同一个问题——报告数据的人正是构建模型的人。Artificial Analysis 消除了这一问题。质量信号完全来自不知道自己在投票支持哪个模型的用户。

Elo 分差是相对的。60 分的差距意味着一个模型在头对头对决中赢得约 58-59% 的胜率,5 分的差距则基本属于噪声。

T2V 第 1(Elo 1333)、I2V 第 1(Elo 1392)——这些数字的背景意义

截至 2026 年 4 月初,HappyHorse-1.0 在 Artificial Analysis 排行榜 上的位置:

类别Elo排名
文生视频(无音频)1333第 1
图生视频(无音频)1392第 1
文生视频(含音频)1205第 2
图生视频(含音频)1161第 2

此前无音频文生视频类别的第 1 名是 Dreamina Seedance 2.0,Elo 为 1273。60 分的 Elo 差距不容小觑。在无音频图生视频类别中,HappyHorse 领先 Seedance 2.0 37 分。

加入音频后,情况反转——Seedance 2.0 以微弱优势夺回第 1,差距较小:含音频文生视频中相差 14 分,含音频图生视频中仅差 1 分。

有一点需要诚实面对:新加入模型的 Elo 分数比成熟模型更不稳定。Seedance 2.0 在文生视频类别中已积累超过 7500 个投票样本,而 HappyHorse 的样本数量目前尚未公开细分。随着更多投票涌入,这些数字会发生变化,变化方向尚不得知。这一结论有有效期——模型更新很快。

关于该模型我们已知的信息

本节所有内容均来自 happyhorses.io 我提前说明这一点,因为截至本文发布日期(2026 年 4 月 8 日),这些技术声明均未经第三方独立验证。

单一自注意力 Transformer 架构,40 层设计(happyhorse-ai.com 声称,未经验证)

该网站描述了一个统一的 40 层 Transformer。据网站介绍,文本 token、参考图像隐向量、带噪声的视频和音频 token 在一个 token 序列内联合去噪。前 4 层和后 4 层据称使用模态特定的投影层,中间 32 层跨所有模态共享参数,无交叉注意力机制。

另一个营销网站(happy-horse.art)声称拥有 150 亿参数。这一数字既未出现在主域名上,也没有出现在任何独立报道中。

架构描述足够具体,具有可证伪性——一旦权重可用,有人会在数小时内验证或反驳。

多语言音视频联合生成:中文、英文、日文、韩文、德文、法文(声称)

该网站列出了六种原生支持的音视频联合生成语言:中文、英文、日文、韩文、德文和法文。happy-horse.art 页面还将粤语列为第七种,并提及”超低 WER 唇形同步”。

我无法验证这些声明,没有权重、没有 API、没有可复现的演示。Artificial Analysis 上可见的竞技场输出并未系统性地测试多语言音频能力。

文生视频与图生视频统一管线(已报告)

该网站描述了一个统一管线,可同时处理文生视频和图生视频。这与排行榜数据一致——HappyHorse-1.0 以同一模型名称出现在两个竞技场中,表明是单一模型而非独立的专用模型。

网站还声称支持音频联合合成——对话、环境音和拟音效果在一次推理中与视频同步生成。在”含音频”类别中排名第 2,表明音频生成功能确实存在且具有竞争力,即便尚未领先。

尚未经过验证的信息

团队身份:Artificial Analysis 称其为匿名,推测来自亚洲

至今没有人公开认领 HappyHorse-1.0。Artificial Analysis 在宣布将该模型加入竞技场时使用了”匿名”一词——意味着提交时没有附上可验证的团队或组织信息。

X 上的社区猜测指向亚洲起源。理由部分来自其多语言能力(CJK 语言尤为突出),部分来自与此前中国 AI 实验室秘密发布模式相似的时间规律。这些都不构成确认。对来源的推测不等于对来源的认定。

开源声明:GitHub 和 HuggingFace 链接标注”即将上线”,截至发布日期无法访问

happyhorse-ai.com 网站声明:“基础模型、蒸馏模型、超分辨率模型和推理代码——全部已发布。“还称:“一切皆开放。”

截至 2026 年 4 月 8 日,同一网站上的 GitHub 链接和模型库链接均显示”即将上线”,无法访问。我在 HuggingFace 和 GitHub 上搜索了 HappyHorse 权重,一无所获。

网站说一切已发布,链接说并没有。这与文档描述不符。

参数量和硬件要求:无独立确认

150 亿参数的声明出现在二级网站(happy-horse.art)上,而非主域名。主网站提到了推理速度——在 H100 上生成 5 秒、256p 的视频约需 2 秒,生成 1080p 约需 38 秒——但这些都是供应商自报数字,没有第三方发布独立的推理速度或内存需求基准测试。

在权重可下载之前,模型创建者以外的任何人都无法验证参数量、架构细节或硬件要求。这是我能掌握的数据边界。

WAN 2.7 猜测:驱动因素及为何仍未确认

部分社区成员猜测 HappyHorse-1.0 实际上是 WAN 2.7——阿里巴巴 WAN 视频模型系列的下一个版本,在正式发布前以匿名形式测试。

逻辑如下:WAN 2.6 在 Artificial Analysis 排行榜上的文生视频 Elo 为 1189(远低于 HappyHorse)。匿名模型在正式发布前亮相已成为中国 AI 生态系统的一种规律。2026 年 2 月的 Pony Alpha 事件是最典型的先例——一个神秘模型出现在 OpenRouter 上,引发一轮猜测游戏,最终被证实是 Z.ai 的 GLM-5 在进行秘密压力测试。

但相似的规律并不能证明同一性。HappyHorse 网站上的架构描述并不明显符合公开已知的 WAN 架构。没有泄露的权重、没有 API 指纹识别、没有内部确认将两者联系起来。我不知道答案,但这比凭空捏造要好。

“来源神秘”对开发者意味着什么

Elo 是盲测——质量信号真实存在,与团队身份无关

那些投票支持 HappyHorse 输出结果而非 Seedance 2.0 和 Kling 3.0 的用户,并不知道自己在投票支持什么。如果该模型在盲测对比中持续胜出,这确实说明了其输出质量——无论是谁构建的。

质量信号不需要知道团队是谁,只需要信任测评方法论。

访问不确定性:目前没有稳定的 API 或公开权重

质量信号和实际可用性是两回事。截至今日:没有公开 API,没有可下载权重,没有定价文档,没有 SLA。

对于任何正在构建工作流或发布产品的人来说,HappyHorse-1.0 目前还不是一个可用的选项。排行榜排名是真实的,但访问权限尚不存在。

需要关注的信号:GitHub 发布、权重可用性、API 访问

三件事能让 HappyHorse 从”排行榜条目”变成”真正的选项”:一个包含实际权重和推理代码的 GitHub 仓库,一个附有可验证细节和许可证的 HuggingFace 模型卡,或者一个附有定价文档的 API 端点。

截至本文撰写时,以上三者均不存在。

它在当前视频模型格局中的位置

当前文生视频和图生视频排行榜背景

2026 年 4 月初,Artificial Analysis 无音频文生视频排行榜前列:

排名模型EloAPI 可用性发布时间
#1HappyHorse-1.013332026 年 4 月
#2Seedance 2.0 720p1273无公开 API2026 年 3 月
#3SkyReels V41245是($7.20/分钟)2026 年 3 月
#4Kling 3.0 1080p Pro1241是($13.44/分钟)2026 年 2 月
#5PixVerse V61240是($5.40/分钟)2026 年 3 月

图生视频(无音频)呈现相同规律:HappyHorse 以 1392 领先,Seedance 2.0 为 1355,PixVerse V6 为 1338,Grok Imagine Video 为 1333,Kling 3.0 Omni 为 1297。

按 Elo 排名最高的两个模型——HappyHorse 和 Seedance 2.0——均无法通过公开 API 访问。文生视频第 3 至第 5 名之间仅相差 5 个 Elo 分——统计上属于并列。

这对评估视频生成技术栈的团队意味着什么

这涉及两个独立问题。哪个模型在盲测对比中产出最佳结果?基于当前数据,是 HappyHorse-1.0。哪个模型今天就能实际集成?不是 HappyHorse。

实用排行榜从第 3 名开始。在可访问的选项中,SkyReels V4 提供最佳性价比。Kling 3.0 Pro 价格更高,但原生支持 1080p。PixVerse V6 是顶级梯队中每分钟费用最低的。

如果 HappyHorse 在未来几周内发布权重或 API,格局将会改变。这是一个真实的可能性——秘密发布后正式开放的模式今年已多次上演。也有可能数月内什么都不会发生。

常见问题

HappyHorse-1.0 是谁做的?

不明。Artificial Analysis 将其描述为”匿名”。社区猜测指向一个亚洲团队,但没有任何组织认领。

HappyHorse-1.0 现在可以使用吗?

没有任何可供生产使用的方式。GitHub 和模型库链接显示”即将上线”。截至 2026 年 4 月 8 日,没有公开 API,没有可下载权重,没有定价文档。

HappyHorse-1.0 和 WAN 2.7 是同一个模型吗?

未确认。这一猜测的依据是:匿名预发布测试在中国 AI 生态系统中很常见——Pony Alpha / GLM-5 先例是最近的案例。没有直接证据将 HappyHorse 与阿里巴巴的 WAN 系列联系起来。

Artificial Analysis 如何对视频模型排名?

盲测用户投票。用户在不知道哪个模型生成哪段视频的情况下,对来自相同提示词的两段视频进行比较,然后选出自己的偏好。投票数据输入 Elo 评分系统。

HappyHorse-1.0 的权重什么时候发布?

没有给出时间表。GitHub 和模型库均显示”即将上线”,没有公开承诺可供参考。

排行榜数字是真实的。其他一切——团队、权重、访问权限、时间表——均待确认,有待验证。

在 WaveSpeedAI 上体验 HappyHorse-1.0

HappyHorse-1.0 现已在 WaveSpeedAI 上线:

往期文章: