← Blog

Was ist HappyHorse-1.0? Das mysteriöse KI-Videomodell auf Platz 1

HappyHorse-1.0 hat Platz 1 auf Artificial Analysis erreicht – ohne bekanntes Team. Hier ist, was bestätigt ist und was noch überprüft werden muss.

By Dora 10 min read
Was ist HappyHorse-1.0? Das mysteriöse KI-Videomodell auf Platz 1

Hey, Leute. Hier ist Dora. Ich verfolge die Artificial Analysis Video Arena-Rangliste die meisten Wochen — blinde Nutzerabstimmungen, Elo-Bewertungen, keine Labor-Selbstberichte. Letzte Woche stand ein Name, den ich noch nie gesehen hatte, an der Spitze sowohl der Text-to-Video- als auch der Image-to-Video-Rankings. HappyHorse-1.0. Kein bekanntes Team. Keine Marke. GitHub- und HuggingFace-Links, die „Demnächst verfügbar” anzeigen.

Wenn Sie Videomodelle vor der Integration in eine Pipeline bewerten — und gelernt haben, gegenüber Leaderboard-Hype skeptisch zu sein — ist dies eine Aufschlüsselung dessen, was bestätigt ist, was nur behauptet wird, und was die Lücke zwischen diesen beiden für aktuelle Entscheidungen bedeutet.

Wie HappyHorse-1.0 auf dem Radar erschien

Artificial Analysis Video Arena: Was diese Rangliste ist und warum sie wichtig ist

Artificial Analysis betreibt eine Video-Arena. Nutzer reichen einen Textprompt oder ein Referenzbild ein. Das System generiert Ausgaben von zwei Modellen. Nutzer sehen beide nebeneinander, wissen nicht, welches Modell welches erstellt hat, und wählen das bevorzugte aus.

Diese Stimmen fließen in ein Elo-Bewertungssystem ein — dieselbe Mathematik wie bei Schach-Rankings. Der Score eines Modells steigt, wenn Nutzer es auswählen, sinkt wenn nicht, angepasst an die Stärke des Gegners. Das Ergebnis ist ein Ranking, das ausschließlich auf aggregierten menschlichen Präferenzen unter blinden Bedingungen basiert. Keine selektiven Labor-Einreichungen. Keine selbst berichteten Benchmarks.

Blinde Nutzerabstimmungen und Elo: Keine selbst berichteten Benchmarks

Jedes andere Videomodell-Ranking, das ich gesehen habe, hat dasselbe Problem — die Personen, die die Zahlen berichten, sind die Personen, die das Modell gebaut haben. Artificial Analysis beseitigt das. Das Qualitätssignal kommt ausschließlich von Nutzern, die nicht wissen, wofür sie abstimmen.

Elo-Unterschiede sind relativ. Ein Vorsprung von 60 Punkten bedeutet, dass ein Modell in direkten Vergleichen ungefähr 58–59 % der Zeit gewinnt. Ein Vorsprung von 5 Punkten ist Rauschen.

T2V #1 (Elo 1333), I2V #1 (Elo 1392) — Was diese Zahlen im Kontext bedeuten

Stand Anfang April 2026, HappyHorse-1.0’s Positionen auf der Artificial Analysis-Rangliste:

KategorieEloRang
Text-to-Video (ohne Audio)1333#1
Image-to-Video (ohne Audio)1392#1
Text-to-Video (mit Audio)1205#2
Image-to-Video (mit Audio)1161#2

Der vorherige #1 in T2V ohne Audio war Dreamina Seedance 2.0 mit 1.273. Ein Elo-Vorsprung von 60 Punkten ist nicht gering. In der I2V-Kategorie ohne Audio führt HappyHorse Seedance 2.0 um 37 Punkte.

Mit einbezogenem Audio dreht sich das Bild um — Seedance 2.0 überholt HappyHorse für #1. Der Vorsprung dort ist gering: 14 Punkte in T2V mit Audio, 1 Punkt in I2V mit Audio.

Etwas, das man ehrlich halten sollte: Elo-Scores für neu hinzugefügte Modelle sind volatiler als für etablierte. Seedance 2.0 hat über 7.500 Abstimmungsproben in der T2V-Kategorie. HappyHorse’s Stichprobenanzahl ist noch nicht öffentlich aufgeschlüsselt. Diese Zahlen werden sich mit mehr Stimmen verändern. Die Richtung dieser Veränderung ist unbekannt. Diese Schlussfolgerung hat ein Ablaufdatum — Modelle aktualisieren sich schnell.

Was wir über das Modell wissen

Alles in diesem Abschnitt stammt von happyhorses.io. Ich weise das vorab darauf hin, weil keine dieser technischen Behauptungen zum Zeitpunkt der Veröffentlichung dieses Artikels (8. April 2026) von einer dritten Partei unabhängig verifiziert wurde.

Einzelne Self-Attention-Transformer-Architektur, 40-Schichten-Design (behauptet von happyhorse-ai.com, nicht verifiziert)

Die Website beschreibt einen einzelnen einheitlichen Transformer mit 40 Schichten. Text-Token, ein Referenzbild-Latent sowie verrauschte Video- und Audio-Token werden — laut der Website — gemeinsam innerhalb einer Token-Sequenz entrauscht. Die ersten und letzten 4 Schichten verwenden angeblich modalitätsspezifische Projektionen. Die mittleren 32 Schichten teilen Parameter über alle Modalitäten. Kein Cross-Attention.

Eine separate Marketing-Website (happy-horse.art) behauptet 15 Milliarden Parameter. Diese Zahl erscheint weder auf der primären Domain noch in unabhängigen Berichten.

Die Architekturbeschreibung ist spezifisch genug, um falsifizierbar zu sein — wenn und sobald die Gewichte verfügbar werden, wird jemand sie innerhalb von Stunden verifizieren oder widerlegen.

Mehrsprachige Audio-Video-Generierung: Chinesisch, Englisch, Japanisch, Koreanisch, Deutsch, Französisch (behauptet)

Die Website listet sechs nativ unterstützte Sprachen für die gemeinsame Audio-Video-Generierung auf: Chinesisch, Englisch, Japanisch, Koreanisch, Deutsch und Französisch. Die Seite happy-horse.art fügt Kantonesisch als siebte hinzu und erwähnt „ultra-niedrige WER-Lippensynchronisation.”

Ich habe keine Möglichkeit, diese Behauptungen zu testen. Keine Gewichte, keine API, keine reproduzierbare Demo. Die in Artificial Analysis sichtbaren Arena-Ausgaben testen die mehrsprachige Audio-Fähigkeit nicht systematisch.

Text-to-Video und Image-to-Video in einer Pipeline (berichtet)

Die Website beschreibt eine einheitliche Pipeline, die sowohl T2V als auch I2V verarbeitet. Dies stimmt mit den Leaderboard-Daten überein — HappyHorse-1.0 erscheint unter demselben Modellnamen in beiden Arenen, was auf ein einzelnes Modell hindeutet statt auf separate spezialisierte Modelle.

Die Website behauptet auch gemeinsame Audio-Synthese — Dialog, Umgebungsgeräusche und Foley-Effekte, die zusammen mit dem Video in einem Durchgang generiert werden. Die #2-Rankings in den „mit Audio”-Kategorien deuten darauf hin, dass die Audio-Generierung existiert und wettbewerbsfähig ist, auch wenn sie nicht führend ist.

Was noch unverifiziert ist

Teamidentität: laut Artificial Analysis pseudonym, vermutete asiatische Herkunft

Niemand hat öffentlich die Verantwortung für HappyHorse-1.0 beansprucht. Artificial Analysis selbst verwendete das Wort „pseudonym”, als sie die Aufnahme des Modells in die Arena ankündigten — was bedeutet, dass es ohne ein verifizierbares Team oder eine Organisation eingereicht wurde.

Community-Spekulationen auf X haben auf einen asiatischen Ursprung hingedeutet. Die Begründung liegt teilweise in den mehrsprachigen Fähigkeiten (CJK-Sprachen werden prominent hervorgehoben), teilweise in Zeitmustern, die früheren Stealth-Drops chinesischer KI-Labore ähneln. All das ist keine Bestätigung. Spekulationen über den Ursprung sind keine Identifizierung des Ursprungs.

Die happyhorse-ai.com-Website gibt an: „Basismodell, destilliertes Modell, Super-Resolution-Modell und Inferenzcode — alles veröffentlicht.” Sie sagt auch: „Alles ist offen.”

Stand 8. April 2026 zeigen sowohl der GitHub-Link als auch der Model-Hub-Link auf derselben Website „Demnächst verfügbar.” Sie führen nirgendwo hin. Ich habe HuggingFace und GitHub nach HappyHorse-Gewichten durchsucht. Nichts.

Die Website sagt, alles sei veröffentlicht. Die Links sagen, es sei nicht so. Das stimmte nicht mit der Dokumentation überein.

Parameteranzahl und Hardware-Anforderungen: keine unabhängige Bestätigung

Die 15B-Parameter-Behauptung erscheint auf einer sekundären Website (happy-horse.art), nicht auf der primären Domain. Die primäre Website erwähnt Inferenzgeschwindigkeiten — ungefähr 2 Sekunden für einen 5-Sekunden-Clip bei 256p, ungefähr 38 Sekunden für 1080p auf einem H100 — aber das sind selbst berichtete Herstellerzahlen. Keine dritte Partei hat unabhängige Benchmarks zur Inferenzgeschwindigkeit oder Speicheranforderungen veröffentlicht.

Ohne herunterladbare Gewichte kann niemand außerhalb der Modellersteller die Parameteranzahl, Architekturdetails oder Hardware-Anforderungen verifizieren. Hier enden meine Daten.

WAN 2.7-Spekulation: Was sie antreibt, warum sie unbestätigt bleibt

Einige Community-Mitglieder haben spekuliert, dass HappyHorse-1.0 eigentlich WAN 2.7 ist — eine nächste Version aus Alibabas WAN-Videomodellfamilie — das unter einem Pseudonym vor dem offiziellen Launch getestet wird.

Die Logik: WAN 2.6 befindet sich auf der Artificial Analysis-Rangliste bei Elo 1.189 für T2V (weit unter HappyHorse). Anonyme Modell-Drops vor Launches sind in der chinesischen KI-Landschaft zu einem Muster geworden. Die Pony Alpha-Situation im Februar 2026 ist der deutlichste Präzedenzfall — ein Mysterie-Modell erschien auf OpenRouter, löste ein Ratespiel aus, und stellte sich als Z.ai’s GLM-5 bei einem Stealth-Stresstest heraus.

Aber parallele Muster beweisen keine Identität. Die Architekturbeschreibung auf HappyHorses Website stimmt nicht offensichtlich mit der öffentlich bekannten WAN-Architektur überein. Keine geleakten Gewichte, kein API-Fingerprinting, keine Insider-Bestätigung hat die beiden verbunden. Ich weiß es nicht. Besser als etwas zu erfinden.

Warum „mysteriöse Herkunft” für Entwickler relevant ist

Elo ist blind — das Qualitätssignal ist real, unabhängig von der Teamidentität

Nutzer, die HappyHorse-Ausgaben über Seedance 2.0 und Kling 3.0 gewählt haben, wussten nicht, wofür sie stimmten. Wenn das Modell konsistent blinde Vergleiche gewinnt, sagt das etwas Reales über die Ausgabequalität aus — unabhängig davon, wer es gebaut hat.

Das Qualitätssignal erfordert keine Kenntnis des Teams. Es erfordert Vertrauen in die Methodik.

Zugangsunsicherheit: heute keine stabile API oder öffentliche Gewichte

Qualitätssignal und praktische Nutzbarkeit sind zwei verschiedene Dinge. Stand heute: keine öffentliche API, keine herunterladbaren Gewichte, keine dokumentierte Preisgestaltung, kein SLA.

Für jeden, der eine Pipeline aufbaut oder ein Produkt liefert, existiert HappyHorse-1.0 noch nicht als Option. Das Leaderboard-Ranking ist real. Der Zugang ist es nicht.

Was zu beobachten ist: GitHub-Veröffentlichung, Verfügbarkeit der Gewichte, API-Zugangssignale

Drei Dinge würden HappyHorse von einem „Leaderboard-Eintrag” zu einer „echten Option” machen: ein GitHub-Repository mit tatsächlichen Gewichten und Inferenzcode, eine HuggingFace-Modellkarte mit verifizierbaren Details und einer Lizenz, oder ein API-Endpunkt mit dokumentierter Preisgestaltung.

Nichts davon existiert zum Zeitpunkt dieses Schreibens.

Wo es in der aktuellen Videomodell-Landschaft steht

Aktueller T2V- und I2V-Leaderboard-Kontext

Spitze der Artificial Analysis T2V-Rangliste (ohne Audio), Anfang April 2026:

RangModellEloAPI verfügbarVeröffentlicht
#1HappyHorse-1.01333NeinApr 2026
#2Seedance 2.0 720p1273Keine öffentliche APIMär 2026
#3SkyReels V41245Ja (7,20 $/min)Mär 2026
#4Kling 3.0 1080p Pro1241Ja (13,44 $/min)Feb 2026
#5PixVerse V61240Ja (5,40 $/min)Mär 2026

I2V (ohne Audio) folgt demselben Muster: HappyHorse bei 1.392, Seedance 2.0 bei 1.355, PixVerse V6 bei 1.338, Grok Imagine Video bei 1.333, Kling 3.0 Omni bei 1.297.

Die zwei qualitativ hochwertigsten Modelle nach Elo — HappyHorse und Seedance 2.0 — sind beide über die öffentliche API nicht zugänglich. Die Positionen 3 bis 5 in T2V sind durch 5 Elo-Punkte getrennt — ein statistisches Unentschieden.

Warum das für Teams wichtig ist, die Video-Generierungs-Stacks evaluieren

Zwei separate Fragen. Welches Modell produziert die beste Ausgabe im blinden Vergleich? HappyHorse-1.0, basierend auf aktuellen Daten. Welches Modell kann man heute tatsächlich integrieren? Nicht HappyHorse.

Die praktische Rangliste beginnt bei Position #3. SkyReels V4 bietet das beste Qualitäts-Preis-Verhältnis unter den zugänglichen Optionen. Kling 3.0 Pro kostet mehr, läuft aber nativ in 1080p. PixVerse V6 ist das günstigste pro Minute in der Spitzengruppe.

Wenn HappyHorse in den kommenden Wochen Gewichte oder eine API veröffentlicht, ändert sich die Kalkulation. Das ist eine reale Möglichkeit — Stealth-Drop-dann-Veröffentlichung hat sich dieses Jahr mehrfach ereignet. Es ist auch möglich, dass monatelang nichts passiert.

FAQ

Wer hat HappyHorse-1.0 erstellt?

Unbekannt. Artificial Analysis beschreibt es als „pseudonym.” Community-Spekulationen deuten auf ein asiatisches Team hin, aber keine Organisation hat es beansprucht.

Ist HappyHorse-1.0 jetzt verfügbar?

Nicht in produktionsbereiter Weise. GitHub- und Model-Hub-Links sagen „Demnächst verfügbar.” Keine öffentliche API, keine herunterladbaren Gewichte, keine dokumentierte Preisgestaltung stand 8. April 2026.

Ist HappyHorse-1.0 dasselbe wie WAN 2.7?

Unbestätigt. Die Spekulation existiert, weil anonyme Pre-Launch-Drops im chinesischen KI-Ökosystem üblich sind — der Pony Alpha / GLM-5-Präzedenzfall ist der jüngste. Kein direkter Beweis verbindet HappyHorse mit Alibabas WAN-Familie.

Wie bewertet Artificial Analysis Videomodelle?

Blinde Nutzerabstimmung. Nutzer vergleichen zwei Videos vom selben Prompt, ohne zu wissen, welches Modell welches erstellt hat, und wählen dann ihre Präferenz. Stimmen fließen in ein Elo-Bewertungssystem ein.

Wann werden HappyHorse-1.0-Gewichte veröffentlicht?

Kein Zeitplan angegeben. „Demnächst verfügbar” für sowohl GitHub als auch Model Hub. Keine öffentliche Verpflichtung, an der jemand festgehalten werden könnte.

Die Leaderboard-Zahlen sind real. Alles andere — Team, Gewichte, Zugang, Zeitplan — steht noch aus. Zu verifizieren.

HappyHorse-1.0 auf WaveSpeedAI ausprobieren

HappyHorse-1.0 ist jetzt auf WaveSpeedAI verfügbar:

Frühere Beiträge: