HappyHorse-1.0 是什麼?神秘的 AI 影片模型排名第一
HappyHorse-1.0 在沒有公開團隊的情況下登上 Artificial Analysis 排行榜第一。以下是已確認的資訊以及仍需驗證的內容。
嗨,大家好,我是 Dora。我幾乎每週都會追蹤 Artificial Analysis Video Arena 排行榜——這是基於盲測用戶投票和 Elo 評分的排名,沒有任何實驗室自我報告的數據。上週,我在文字轉影片和圖片轉影片兩個類別的排名頂端,看到了一個從未見過的名字:HappyHorse-1.0。沒有已知的開發團隊,沒有品牌,GitHub 和 HuggingFace 連結都顯示「即將推出」。
如果你在將影片模型整合到工作流程之前會先進行評估,而且已經學會對排行榜炒作保持懷疑態度——這篇文章將梳理哪些已確認、哪些只是聲稱,以及兩者之間的差距對當下決策意味著什麼。
HappyHorse-1.0 如何進入視野

Artificial Analysis Video Arena:這個排行榜是什麼,為何重要
Artificial Analysis 運營一個影片競技場。用戶提交文字提示或參考圖片,系統從兩個模型生成輸出。用戶並排看到兩段影片,不知道哪個模型生成了哪段,然後選出他們更喜歡的那個。
這些投票進入 Elo 評分系統——與西洋棋排名使用的數學方法相同。當用戶選擇某個模型時,它的分數上升,反之則下降,並根據對手強度進行調整。結果是一個完全基於盲測條件下人類整體偏好的排名。沒有精心挑選的實驗室提交,沒有自我報告的基準測試。
盲測用戶投票與 Elo:不是自我報告的基準測試
我看過的所有其他影片模型排名都有同樣的問題——報告數字的人就是構建模型的人。Artificial Analysis 消除了這個問題。品質信號完全來自不知道自己在投票給什麼的用戶。
Elo 差距是相對的。60 分的差距意味著一個模型在一對一對決中大約贏得 58-59% 的勝率。5 分的差距是噪音。
T2V 第 1 名(Elo 1333)、I2V 第 1 名(Elo 1392)——這些數字的背景含義
截至 2026 年 4 月初,HappyHorse-1.0 在 Artificial Analysis 排行榜 上的排名:

| 類別 | Elo | 排名 |
|---|---|---|
| 文字轉影片(無音訊) | 1333 | 第 1 名 |
| 圖片轉影片(無音訊) | 1392 | 第 1 名 |
| 文字轉影片(含音訊) | 1205 | 第 2 名 |
| 圖片轉影片(含音訊) | 1161 | 第 2 名 |
此前無音訊 T2V 類別的第 1 名是 Dreamina Seedance 2.0,Elo 為 1,273。60 分的 Elo 差距並不小。在無音訊 I2V 類別中,HappyHorse 領先 Seedance 2.0 37 分。
含音訊的情況則相反——Seedance 2.0 在第 1 名上略勝 HappyHorse。那裡的差距很小:含音訊 T2V 差 14 分,含音訊 I2V 差 1 分。
有一點需要誠實說明:新加入模型的 Elo 分數比已有模型更不穩定。Seedance 2.0 在 T2V 類別中有超過 7,500 個投票樣本。HappyHorse 的樣本數量目前尚未公開分析。隨著更多投票湧入,這些數字將會變動。變動方向未知。這個結論有時效性——模型更新很快。
我們對這個模型的了解
本節所有內容均來自 happyhorses.io。 我先說明這一點,因為截至本文發布日期(2026 年 4 月 8 日),這些技術聲明均未經第三方獨立核實。

單一自注意力 Transformer 架構,40 層設計(happyhorse-ai.com 聲稱,未經核實)
該網站描述了一個具有 40 層的統一 Transformer。根據網站說法,文字 token、參考圖片潛在向量,以及嘈雜的影片和音訊 token 在一個 token 序列中被聯合去噪。前 4 層和後 4 層據稱使用模態特定投影。中間 32 層在所有模態之間共享參數。沒有交叉注意力。
一個獨立的行銷網站(happy-horse.art)聲稱有 150 億個參數。這個數字沒有出現在主要域名或任何獨立報導中。
架構描述具體到可以被證偽——如果且當權重可用時,有人會在幾小時內核實或反駁它。
多語言音訊-影片生成:中文、英文、日文、韓文、德文、法文(聲稱)
網站列出了六種原生支援的聯合音訊-影片生成語言:中文、英文、日文、韓文、德文和法文。happy-horse.art 頁面還新增了粵語作為第七種語言,並提到「超低 WER 唇形同步」。
我無法測試這些聲明。沒有權重,沒有 API,沒有可重現的演示。Artificial Analysis 上可見的競技場輸出並未系統性地測試多語言音訊能力。
一個管道同時處理文字轉影片和圖片轉影片(已報告)
網站描述了一個處理 T2V 和 I2V 的統一管道。這與排行榜數據一致——HappyHorse-1.0 在兩個競技場中以相同的模型名稱出現,表明是單一模型而非獨立的專用模型。
網站還聲稱可以聯合合成音訊——對話、環境音效和 Foley 音效在一次處理中與影片一起生成。「含音訊」類別的第 2 名排名表明音訊生成確實存在且具有競爭力,即使它沒有領先。
仍未經核實的內容
團隊身份:Artificial Analysis 稱為匿名,猜測為亞洲起源
沒有人公開宣稱對 HappyHorse-1.0 負責。Artificial Analysis 自己在宣布將該模型加入競技場時使用了「匿名」一詞——意味著它是在沒有可核實的團隊或組織的情況下提交的。

X 上的社群猜測指向亞洲起源。理由部分是多語言能力(突出支援 CJK 語言),部分是時間模式類似於中國 AI 實驗室之前的隱身發布。這些都不構成確認。對起源的猜測不等於對起源的認定。
開源聲明:GitHub 和 HuggingFace 連結標記為「即將推出」,截至發布時無法存取
happyhorse-ai.com 網站聲明:「基礎模型、蒸餾模型、超解析度模型和推理程式碼——全部已發布。」還說:「一切都是開放的。」
截至 2026 年 4 月 8 日,同一網站上的 GitHub 連結和模型庫連結都顯示「即將推出」,指向無效頁面。我在 HuggingFace 和 GitHub 上搜尋了 HappyHorse 的權重,什麼都沒有找到。
網站說一切都已發布。連結卻說沒有。這與文件說明不符。
參數數量和硬體需求:無獨立確認
150 億參數的聲明出現在次要網站(happy-horse.art)上,而非主要域名。主要網站提到了推理速度——在 H100 上,5 秒 256p 影片大約需要 2 秒,1080p 大約需要 38 秒——但這些是供應商自我報告的數字。沒有第三方發布過關於推理速度或記憶體需求的獨立基準測試。
在沒有可下載權重的情況下,模型創作者以外的任何人都無法核實參數數量、架構細節或硬體需求。這就是我的數據止步之處。
WAN 2.7 的猜測:是什麼推動了它,為何仍未確認
一些社群成員猜測 HappyHorse-1.0 實際上是 WAN 2.7——阿里巴巴 WAN 影片模型系列的下一個版本——在官方發布前以匿名身份測試。
邏輯如下:WAN 2.6 在 Artificial Analysis 排行榜上的 T2V Elo 為 1,189(遠低於 HappyHorse)。在發布前匿名模型出現已成為中國 AI 生態系統中的一種模式。2026 年 2 月的 Pony Alpha 事件是最明顯的先例——一個神秘模型出現在 OpenRouter 上,引發了猜謎遊戲,最終被證實是 Z.ai 的 GLM-5 進行的隱身壓力測試。
但相似的模式並不能證明身份。HappyHorse 網站上的架構描述與公開已知的 WAN 架構並不明顯吻合。沒有洩露的權重、沒有 API 指紋識別、沒有內部確認將兩者聯繫起來。我不知道。比胡亂猜測要好。
「神秘起源」為何與開發者相關
Elo 是盲測的——無論團隊身份如何,品質信號都是真實的
投票選擇 HappyHorse 輸出優於 Seedance 2.0 和 Kling 3.0 的用戶,並不知道他們在投票給什麼。如果一個模型在盲測比較中持續獲勝,這無論誰構建了它,都告訴你一些關於輸出品質的真實信息。
品質信號不需要知道團隊。它需要信任方法論。
存取不確定性:今天沒有穩定的 API 或公開權重
品質信號和實際可用性是兩回事。截至今天:沒有公開 API,沒有可下載的權重,沒有文件化的定價,沒有 SLA。
對於任何構建管道或交付產品的人來說,HappyHorse-1.0 目前還不是一個可用的選項。排行榜排名是真實的。存取性卻不是。
需要關注的事項:GitHub 發布、權重可用性、API 存取信號
有三件事會讓 HappyHorse 從「排行榜條目」變成「真正的選項」:一個包含實際權重和推理程式碼的 GitHub 儲存庫、一個帶有可核實細節和授權的 HuggingFace 模型卡,或者一個具有文件化定價的 API 端點。
截至本文撰寫時,這些都不存在。
它在當前影片模型格局中的位置
當前 T2V 和 I2V 排行榜背景
Artificial Analysis T2V 排行榜(無音訊)頂部,2026 年 4 月初:
| 排名 | 模型 | Elo | API 可用性 | 發布時間 |
|---|---|---|---|---|
| 第 1 名 | HappyHorse-1.0 | 1333 | 否 | 2026 年 4 月 |
| 第 2 名 | Seedance 2.0 720p | 1273 | 無公開 API | 2026 年 3 月 |
| 第 3 名 | SkyReels V4 | 1245 | 是($7.20/分鐘) | 2026 年 3 月 |
| 第 4 名 | Kling 3.0 1080p Pro | 1241 | 是($13.44/分鐘) | 2026 年 2 月 |
| 第 5 名 | PixVerse V6 | 1240 | 是($5.40/分鐘) | 2026 年 3 月 |
I2V(無音訊)遵循相同模式:HappyHorse 為 1,392,Seedance 2.0 為 1,355,PixVerse V6 為 1,338,Grok Imagine Video 為 1,333,Kling 3.0 Omni 為 1,297。

按 Elo 排名最高品質的兩個模型——HappyHorse 和 Seedance 2.0——都無法透過公開 API 存取。T2V 第 3 到第 5 名之間相差 5 個 Elo 分——統計上可視為並列。
為何這對評估影片生成技術棧的團隊重要
兩個問題是分開的。哪個模型在盲測比較中產生最佳輸出?根據當前數據,是 HappyHorse-1.0。哪個模型今天可以實際整合?不是 HappyHorse。
實際可用的排行榜從第 3 名開始。SkyReels V4 在可存取選項中提供最佳的品質價格比。Kling 3.0 Pro 成本更高,但原生支援 1080p。PixVerse V6 在頂級選項中每分鐘費用最低。
如果 HappyHorse 在未來幾週內發布權重或 API,計算方式會改變。這是一個真實的可能性——隱身發布後再公開已在今年多次上演。也有可能幾個月內什麼都不會出現。
常見問題
誰製作了 HappyHorse-1.0?
不明。Artificial Analysis 將其描述為「匿名」。社群猜測指向亞洲團隊,但沒有任何組織認領。
HappyHorse-1.0 現在可以使用嗎?
沒有任何可投入生產的方式。GitHub 和模型庫連結顯示「即將推出」。截至 2026 年 4 月 8 日,沒有公開 API,沒有可下載的權重,沒有文件化的定價。
HappyHorse-1.0 和 WAN 2.7 是同一個嗎?
未確認。這種猜測存在是因為匿名預發布在中國 AI 生態系統中很常見——Pony Alpha / GLM-5 先例是最近的案例。沒有直接證據將 HappyHorse 與阿里巴巴的 WAN 系列聯繫起來。
Artificial Analysis 如何對影片模型排名?
盲測用戶投票。用戶在不知道哪個模型生成哪段的情況下,比較來自同一提示的兩段影片,然後選擇他們的偏好。投票進入 Elo 評分系統。
HappyHorse-1.0 的權重何時發布?
沒有給出時間表。GitHub 和模型庫都顯示「即將推出」。沒有可以讓任何人負責的公開承諾。
排行榜數字是真實的。其他一切——團隊、權重、存取、時間表——都是待定的。有待核實。
在 WaveSpeedAI 上試用 HappyHorse-1.0
HappyHorse-1.0 現已在 WaveSpeedAI 上提供:
往期文章:


