HappyHorse-1.0 是什麼？神秘的 AI 影片模型排名第一

嗨，大家好，我是 Dora。我幾乎每週都會追蹤 Artificial Analysis Video Arena 排行榜——這是基於盲測用戶投票和 Elo 評分的排名，沒有任何實驗室自我報告的數據。上週，我在文字轉影片和圖片轉影片兩個類別的排名頂端，看到了一個從未見過的名字：HappyHorse-1.0。沒有已知的開發團隊，沒有品牌，GitHub 和 HuggingFace 連結都顯示「即將推出」。

如果你在將影片模型整合到工作流程之前會先進行評估，而且已經學會對排行榜炒作保持懷疑態度——這篇文章將梳理哪些已確認、哪些只是聲稱，以及兩者之間的差距對當下決策意味著什麼。

HappyHorse-1.0 如何進入視野

Artificial Analysis Video Arena：這個排行榜是什麼，為何重要

Artificial Analysis 運營一個影片競技場。用戶提交文字提示或參考圖片，系統從兩個模型生成輸出。用戶並排看到兩段影片，不知道哪個模型生成了哪段，然後選出他們更喜歡的那個。

這些投票進入 Elo 評分系統——與西洋棋排名使用的數學方法相同。當用戶選擇某個模型時，它的分數上升，反之則下降，並根據對手強度進行調整。結果是一個完全基於盲測條件下人類整體偏好的排名。沒有精心挑選的實驗室提交，沒有自我報告的基準測試。

盲測用戶投票與 Elo：不是自我報告的基準測試

我看過的所有其他影片模型排名都有同樣的問題——報告數字的人就是構建模型的人。Artificial Analysis 消除了這個問題。品質信號完全來自不知道自己在投票給什麼的用戶。

Elo 差距是相對的。60 分的差距意味著一個模型在一對一對決中大約贏得 58-59% 的勝率。5 分的差距是噪音。

T2V 第 1 名（Elo 1333）、I2V 第 1 名（Elo 1392）——這些數字的背景含義

截至 2026 年 4 月初，HappyHorse-1.0 在 Artificial Analysis 排行榜上的排名：

類別	Elo	排名
文字轉影片（無音訊）	1333	第 1 名
圖片轉影片（無音訊）	1392	第 1 名
文字轉影片（含音訊）	1205	第 2 名
圖片轉影片（含音訊）	1161	第 2 名

此前無音訊 T2V 類別的第 1 名是 Dreamina Seedance 2.0，Elo 為 1,273。60 分的 Elo 差距並不小。在無音訊 I2V 類別中，HappyHorse 領先 Seedance 2.0 37 分。

含音訊的情況則相反——Seedance 2.0 在第 1 名上略勝 HappyHorse。那裡的差距很小：含音訊 T2V 差 14 分，含音訊 I2V 差 1 分。

有一點需要誠實說明：新加入模型的 Elo 分數比已有模型更不穩定。Seedance 2.0 在 T2V 類別中有超過 7,500 個投票樣本。HappyHorse 的樣本數量目前尚未公開分析。隨著更多投票湧入，這些數字將會變動。變動方向未知。這個結論有時效性——模型更新很快。

我們對這個模型的了解

本節所有內容均來自 happyhorses.io。 我先說明這一點，因為截至本文發布日期（2026 年 4 月 8 日），這些技術聲明均未經第三方獨立核實。

單一自注意力 Transformer 架構，40 層設計（happyhorse-ai.com 聲稱，未經核實）

該網站描述了一個具有 40 層的統一 Transformer。根據網站說法，文字 token、參考圖片潛在向量，以及嘈雜的影片和音訊 token 在一個 token 序列中被聯合去噪。前 4 層和後 4 層據稱使用模態特定投影。中間 32 層在所有模態之間共享參數。沒有交叉注意力。

一個獨立的行銷網站（happy-horse.art）聲稱有 150 億個參數。這個數字沒有出現在主要域名或任何獨立報導中。

架構描述具體到可以被證偽——如果且當權重可用時，有人會在幾小時內核實或反駁它。

多語言音訊-影片生成：中文、英文、日文、韓文、德文、法文（聲稱）

網站列出了六種原生支援的聯合音訊-影片生成語言：中文、英文、日文、韓文、德文和法文。happy-horse.art 頁面還新增了粵語作為第七種語言，並提到「超低 WER 唇形同步」。

我無法測試這些聲明。沒有權重，沒有 API，沒有可重現的演示。Artificial Analysis 上可見的競技場輸出並未系統性地測試多語言音訊能力。

一個管道同時處理文字轉影片和圖片轉影片（已報告）

網站描述了一個處理 T2V 和 I2V 的統一管道。這與排行榜數據一致——HappyHorse-1.0 在兩個競技場中以相同的模型名稱出現，表明是單一模型而非獨立的專用模型。

網站還聲稱可以聯合合成音訊——對話、環境音效和 Foley 音效在一次處理中與影片一起生成。「含音訊」類別的第 2 名排名表明音訊生成確實存在且具有競爭力，即使它沒有領先。

仍未經核實的內容

團隊身份：Artificial Analysis 稱為匿名，猜測為亞洲起源

沒有人公開宣稱對 HappyHorse-1.0 負責。Artificial Analysis 自己在宣布將該模型加入競技場時使用了「匿名」一詞——意味著它是在沒有可核實的團隊或組織的情況下提交的。

X 上的社群猜測指向亞洲起源。理由部分是多語言能力（突出支援 CJK 語言），部分是時間模式類似於中國 AI 實驗室之前的隱身發布。這些都不構成確認。對起源的猜測不等於對起源的認定。

開源聲明：GitHub 和 HuggingFace 連結標記為「即將推出」，截至發布時無法存取

happyhorse-ai.com 網站聲明：「基礎模型、蒸餾模型、超解析度模型和推理程式碼——全部已發布。」還說：「一切都是開放的。」

截至 2026 年 4 月 8 日，同一網站上的 GitHub 連結和模型庫連結都顯示「即將推出」，指向無效頁面。我在 HuggingFace 和 GitHub 上搜尋了 HappyHorse 的權重，什麼都沒有找到。

網站說一切都已發布。連結卻說沒有。這與文件說明不符。

參數數量和硬體需求：無獨立確認

150 億參數的聲明出現在次要網站（happy-horse.art）上，而非主要域名。主要網站提到了推理速度——在 H100 上，5 秒 256p 影片大約需要 2 秒，1080p 大約需要 38 秒——但這些是供應商自我報告的數字。沒有第三方發布過關於推理速度或記憶體需求的獨立基準測試。

在沒有可下載權重的情況下，模型創作者以外的任何人都無法核實參數數量、架構細節或硬體需求。這就是我的數據止步之處。

WAN 2.7 的猜測：是什麼推動了它，為何仍未確認

一些社群成員猜測 HappyHorse-1.0 實際上是 WAN 2.7——阿里巴巴 WAN 影片模型系列的下一個版本——在官方發布前以匿名身份測試。

邏輯如下：WAN 2.6 在 Artificial Analysis 排行榜上的 T2V Elo 為 1,189（遠低於 HappyHorse）。在發布前匿名模型出現已成為中國 AI 生態系統中的一種模式。2026 年 2 月的 Pony Alpha 事件是最明顯的先例——一個神秘模型出現在 OpenRouter 上，引發了猜謎遊戲，最終被證實是 Z.ai 的 GLM-5 進行的隱身壓力測試。

但相似的模式並不能證明身份。HappyHorse 網站上的架構描述與公開已知的 WAN 架構並不明顯吻合。沒有洩露的權重、沒有 API 指紋識別、沒有內部確認將兩者聯繫起來。我不知道。比胡亂猜測要好。

「神秘起源」為何與開發者相關

Elo 是盲測的——無論團隊身份如何，品質信號都是真實的

投票選擇 HappyHorse 輸出優於 Seedance 2.0 和 Kling 3.0 的用戶，並不知道他們在投票給什麼。如果一個模型在盲測比較中持續獲勝，這無論誰構建了它，都告訴你一些關於輸出品質的真實信息。

品質信號不需要知道團隊。它需要信任方法論。

存取不確定性：今天沒有穩定的 API 或公開權重

品質信號和實際可用性是兩回事。截至今天：沒有公開 API，沒有可下載的權重，沒有文件化的定價，沒有 SLA。

對於任何構建管道或交付產品的人來說，HappyHorse-1.0 目前還不是一個可用的選項。排行榜排名是真實的。存取性卻不是。

需要關注的事項：GitHub 發布、權重可用性、API 存取信號

有三件事會讓 HappyHorse 從「排行榜條目」變成「真正的選項」：一個包含實際權重和推理程式碼的 GitHub 儲存庫、一個帶有可核實細節和授權的 HuggingFace 模型卡，或者一個具有文件化定價的 API 端點。

截至本文撰寫時，這些都不存在。

它在當前影片模型格局中的位置

當前 T2V 和 I2V 排行榜背景

Artificial Analysis T2V 排行榜（無音訊）頂部，2026 年 4 月初：

排名	模型	Elo	API 可用性	發布時間
第 1 名	HappyHorse-1.0	1333	否	2026 年 4 月
第 2 名	Seedance 2.0 720p	1273	無公開 API	2026 年 3 月
第 3 名	SkyReels V4	1245	是（$7.20/分鐘）	2026 年 3 月
第 4 名	Kling 3.0 1080p Pro	1241	是（$13.44/分鐘）	2026 年 2 月
第 5 名	PixVerse V6	1240	是（$5.40/分鐘）	2026 年 3 月

I2V（無音訊）遵循相同模式：HappyHorse 為 1,392，Seedance 2.0 為 1,355，PixVerse V6 為 1,338，Grok Imagine Video 為 1,333，Kling 3.0 Omni 為 1,297。

按 Elo 排名最高品質的兩個模型——HappyHorse 和 Seedance 2.0——都無法透過公開 API 存取。T2V 第 3 到第 5 名之間相差 5 個 Elo 分——統計上可視為並列。

為何這對評估影片生成技術棧的團隊重要

兩個問題是分開的。哪個模型在盲測比較中產生最佳輸出？根據當前數據，是 HappyHorse-1.0。哪個模型今天可以實際整合？不是 HappyHorse。

實際可用的排行榜從第 3 名開始。SkyReels V4 在可存取選項中提供最佳的品質價格比。Kling 3.0 Pro 成本更高，但原生支援 1080p。PixVerse V6 在頂級選項中每分鐘費用最低。

如果 HappyHorse 在未來幾週內發布權重或 API，計算方式會改變。這是一個真實的可能性——隱身發布後再公開已在今年多次上演。也有可能幾個月內什麼都不會出現。

常見問題

誰製作了 HappyHorse-1.0？

不明。Artificial Analysis 將其描述為「匿名」。社群猜測指向亞洲團隊，但沒有任何組織認領。

HappyHorse-1.0 現在可以使用嗎？

沒有任何可投入生產的方式。GitHub 和模型庫連結顯示「即將推出」。截至 2026 年 4 月 8 日，沒有公開 API，沒有可下載的權重，沒有文件化的定價。

HappyHorse-1.0 和 WAN 2.7 是同一個嗎？

未確認。這種猜測存在是因為匿名預發布在中國 AI 生態系統中很常見——Pony Alpha / GLM-5 先例是最近的案例。沒有直接證據將 HappyHorse 與阿里巴巴的 WAN 系列聯繫起來。

Artificial Analysis 如何對影片模型排名？

盲測用戶投票。用戶在不知道哪個模型生成哪段的情況下，比較來自同一提示的兩段影片，然後選擇他們的偏好。投票進入 Elo 評分系統。

HappyHorse-1.0 的權重何時發布？

沒有給出時間表。GitHub 和模型庫都顯示「即將推出」。沒有可以讓任何人負責的公開承諾。

排行榜數字是真實的。其他一切——團隊、權重、存取、時間表——都是待定的。有待核實。

在 WaveSpeedAI 上試用 HappyHorse-1.0

HappyHorse-1.0 現已在 WaveSpeedAI 上提供：

往期文章：