Apa Itu HappyHorse-1.0? Model AI Video Misterius Peringkat #1
HappyHorse-1.0 baru saja mencapai peringkat #1 di Artificial Analysis tanpa tim publik. Berikut yang sudah dikonfirmasi dan yang masih perlu diverifikasi.
Hei, teman-teman. Ini Dora. Saya memantau papan peringkat Artificial Analysis Video Arena hampir setiap minggu — suara pengguna yang buta, peringkat Elo, tanpa laporan mandiri dari lab. Minggu lalu, sebuah nama yang belum pernah saya lihat berada di posisi teratas peringkat text-to-video maupun image-to-video. HappyHorse-1.0. Tidak ada tim yang dikenal. Tidak ada merek. Tautan GitHub dan HuggingFace yang bertuliskan “coming soon.”
Jika Anda mengevaluasi model video sebelum mengintegrasikannya ke dalam pipeline — dan Anda sudah belajar untuk skeptis terhadap hype papan peringkat — ini adalah uraian tentang apa yang sudah dikonfirmasi, apa yang hanya diklaim, dan apa arti kesenjangan antara keduanya untuk keputusan saat ini.
Bagaimana HappyHorse-1.0 Muncul di Radar

Artificial Analysis Video Arena: apa papan peringkat ini dan mengapa penting
Artificial Analysis menjalankan sebuah arena video. Pengguna mengirimkan prompt teks atau gambar referensi. Sistem menghasilkan output dari dua model. Pengguna melihat keduanya secara berdampingan, tidak tahu model mana yang membuat mana, dan memilih yang mereka sukai.
Suara-suara tersebut dimasukkan ke dalam sistem peringkat Elo — matematika yang sama yang digunakan dalam peringkat catur. Skor model naik ketika pengguna memilihnya, turun ketika tidak, disesuaikan dengan kekuatan lawan. Hasilnya adalah peringkat yang sepenuhnya berdasarkan preferensi manusia secara agregat dalam kondisi buta. Tidak ada kiriman lab yang dipilih secara selektif. Tidak ada tolok ukur yang dilaporkan sendiri.
Suara pengguna yang buta dan Elo: bukan tolok ukur yang dilaporkan sendiri
Setiap peringkat model video lain yang pernah saya lihat memiliki masalah yang sama — orang yang melaporkan angkanya adalah orang yang membangun modelnya. Artificial Analysis menghilangkan hal itu. Sinyal kualitas sepenuhnya berasal dari pengguna yang tidak tahu apa yang mereka pilih.
Perbedaan Elo bersifat relatif. Selisih 60 poin berarti satu model menang sekitar 58-59% dari pertandingan head-to-head. Selisih 5 poin adalah noise.
T2V #1 (Elo 1333), I2V #1 (Elo 1392) — apa arti angka-angka ini dalam konteks
Per awal April 2026, posisi HappyHorse-1.0 di papan peringkat Artificial Analysis:

| Kategori | Elo | Peringkat |
|---|---|---|
| Text-to-Video (tanpa audio) | 1333 | #1 |
| Image-to-Video (tanpa audio) | 1392 | #1 |
| Text-to-Video (dengan audio) | 1205 | #2 |
| Image-to-Video (dengan audio) | 1161 | #2 |
#1 sebelumnya dalam T2V tanpa audio adalah Dreamina Seedance 2.0 di 1.273. Selisih Elo 60 poin tidak kecil. Dalam kategori I2V tanpa audio, HappyHorse unggul atas Seedance 2.0 sebesar 37 poin.
Dengan audio disertakan, gambarannya terbalik — Seedance 2.0 mengalahkan HappyHorse untuk #1. Selisih di sana sempit: 14 poin dalam T2V dengan audio, 1 poin dalam I2V dengan audio.
Satu hal yang perlu dijaga kejujurannya: skor Elo untuk model yang baru ditambahkan lebih volatil daripada model yang sudah mapan. Seedance 2.0 memiliki lebih dari 7.500 sampel suara dalam kategori T2V. Jumlah sampel HappyHorse belum dipecah secara publik. Angka-angka ini akan berubah seiring masuknya lebih banyak suara. Arah perubahan tersebut tidak diketahui. Kesimpulan ini memiliki tanggal kedaluwarsa — model diperbarui dengan cepat.
Apa yang Kita Ketahui Tentang Model
Semua hal dalam bagian ini berasal dari happyhorses.io. Saya menyebutkan itu di awal karena tidak ada klaim teknis ini yang telah diverifikasi secara independen oleh pihak ketiga per tanggal publikasi artikel ini (8 April 2026).

Arsitektur Transformer self-attention tunggal, desain 40 lapisan (diklaim oleh happyhorse-ai.com, belum diverifikasi)
Situs ini mendeskripsikan Transformer terpadu tunggal dengan 40 lapisan. Token teks, laten gambar referensi, serta token video dan audio yang berisik — menurut situs tersebut — didenoising secara bersama dalam satu urutan token. 4 lapisan pertama dan terakhir dilaporkan menggunakan proyeksi spesifik modalitas. 32 lapisan tengah berbagi parameter di semua modalitas. Tanpa cross-attention.
Situs pemasaran terpisah (happy-horse.art) mengklaim 15 miliar parameter. Angka tersebut tidak muncul di domain utama atau dalam laporan independen mana pun.
Deskripsi arsitektur cukup spesifik untuk dapat difalsifikasi — jika dan ketika bobot tersedia, seseorang akan memverifikasi atau membantahnya dalam hitungan jam.
Generasi audio-video multibahasa: Mandarin, Inggris, Jepang, Korea, Jerman, Prancis (diklaim)
Situs ini mencantumkan enam bahasa yang didukung secara native untuk generasi audio-video bersama: Mandarin, Inggris, Jepang, Korea, Jerman, dan Prancis. Halaman happy-horse.art menambahkan Kanton sebagai ketujuh dan menyebutkan “ultra-low WER lip-sync.”
Saya tidak memiliki cara untuk menguji klaim-klaim ini. Tidak ada bobot, tidak ada API, tidak ada demo yang dapat direproduksi. Output arena yang terlihat di Artificial Analysis tidak menguji kemampuan audio multibahasa secara sistematis.
Text-to-video dan image-to-video dalam satu pipeline (dilaporkan)
Situs ini mendeskripsikan pipeline terpadu yang menangani T2V maupun I2V. Ini konsisten dengan data papan peringkat — HappyHorse-1.0 muncul di kedua arena dengan nama model yang sama, menunjukkan satu model daripada model khusus yang terpisah.
Situs ini juga mengklaim sintesis audio bersama — dialog, suara ambien, dan efek Foley dihasilkan bersama video dalam satu proses. Peringkat #2 dalam kategori “dengan audio” menunjukkan bahwa generasi audio ada dan kompetitif, meskipun tidak memimpin.
Apa yang Masih Belum Diverifikasi
Identitas tim: pseudonim menurut Artificial Analysis, spekulasi berasal dari Asia
Tidak ada yang secara publik mengklaim kredit untuk HappyHorse-1.0. Artificial Analysis sendiri menggunakan kata “pseudonim” ketika mengumumkan penambahan model ke arena — artinya dikirimkan tanpa tim atau organisasi yang dapat diverifikasi.

Spekulasi komunitas di X mengarah ke asal Asia. Alasannya sebagian karena kemampuan multibahasa (bahasa CJK yang ditonjolkan), sebagian karena pola waktu yang menyerupai rilis stealth sebelumnya dari lab AI Tiongkok. Tidak ada dari ini yang merupakan konfirmasi. Spekulasi tentang asal usul bukan identifikasi asal usul.
Klaim open source: tautan GitHub dan HuggingFace bertanda “coming soon,” tidak dapat diakses per publikasi
Situs happyhorse-ai.com menyatakan: “Model dasar, model yang didistilasi, model super-resolusi, dan kode inferensi — semuanya dirilis.” Juga menyatakan: “Semuanya terbuka.”
Per 8 April 2026, tautan GitHub maupun tautan Model Hub di situs yang sama bertuliskan “coming soon.” Tidak mengarah ke mana-mana. Saya mencari bobot HappyHorse di HuggingFace dan GitHub. Tidak ada.
Situs menyatakan semuanya dirilis. Tautan-tautan menyatakan belum. Ini tidak cocok dengan dokumentasinya.
Jumlah parameter dan kebutuhan hardware: tidak ada konfirmasi independen
Klaim 15 miliar parameter muncul di situs sekunder (happy-horse.art), bukan domain utama. Domain utama menyebutkan kecepatan inferensi — sekitar 2 detik untuk klip 5 detik pada 256p, sekitar 38 detik untuk 1080p pada H100 — tetapi ini adalah angka vendor yang dilaporkan sendiri. Tidak ada pihak ketiga yang mempublikasikan tolok ukur independen tentang kecepatan inferensi atau kebutuhan memori.
Tanpa bobot yang dapat diunduh, tidak ada yang di luar pembuat model dapat memverifikasi jumlah parameter, detail arsitektur, atau kebutuhan hardware. Di sinilah data saya berakhir.
Spekulasi WAN 2.7: apa yang mendorongnya, mengapa tetap belum dikonfirmasi
Beberapa anggota komunitas telah berspekulasi bahwa HappyHorse-1.0 sebenarnya adalah WAN 2.7 — versi berikutnya dari keluarga model video WAN Alibaba — yang diuji dengan nama samaran sebelum peluncuran resmi.
Logikanya: WAN 2.6 berada di papan peringkat Artificial Analysis pada Elo 1.189 untuk T2V (jauh di bawah HappyHorse). Rilis model anonim sebelum peluncuran telah menjadi pola dalam ekosistem AI Tiongkok. Situasi Pony Alpha pada Februari 2026 adalah preseden paling jelas — sebuah model misterius muncul di OpenRouter, memicu permainan tebak-tebakan, dan ternyata adalah GLM-5 dari Z.ai yang melakukan uji stres stealth.
Tetapi pola paralel tidak membuktikan identitas. Deskripsi arsitektur di situs HappyHorse tidak secara jelas cocok dengan arsitektur WAN yang diketahui publik. Tidak ada kebocoran bobot, tidak ada fingerprinting API, tidak ada konfirmasi orang dalam yang menghubungkan keduanya. Saya tidak tahu. Lebih baik daripada membuat-buat sesuatu.
Mengapa “Asal Usul Misterius” Relevan bagi Para Developer
Elo bersifat buta — sinyal kualitas nyata terlepas dari identitas tim
Pengguna yang memilih output HappyHorse di atas Seedance 2.0 dan Kling 3.0 tidak tahu apa yang mereka pilih. Jika model secara konsisten menang dalam perbandingan buta, itu memberitahu Anda sesuatu yang nyata tentang kualitas output — terlepas dari siapa yang membuatnya.
Sinyal kualitas tidak memerlukan pengetahuan tentang tim. Ini memerlukan kepercayaan pada metodologinya.
Ketidakpastian akses: tidak ada API stabil atau bobot publik saat ini
Sinyal kualitas dan kegunaan praktis adalah dua hal yang berbeda. Per hari ini: tidak ada API publik, tidak ada bobot yang dapat diunduh, tidak ada harga yang terdokumentasi, tidak ada SLA.
Bagi siapa pun yang membangun pipeline atau merilis produk, HappyHorse-1.0 belum ada sebagai opsi. Peringkat papan peringkatnya nyata. Aksesnya tidak.
Yang perlu diperhatikan: rilis GitHub, ketersediaan bobot, sinyal akses API
Tiga hal yang akan memindahkan HappyHorse dari “entri papan peringkat” menjadi “opsi nyata”: repositori GitHub dengan bobot dan kode inferensi aktual, kartu model HuggingFace dengan detail yang dapat diverifikasi dan lisensi, atau endpoint API dengan harga yang terdokumentasi.
Tidak ada yang ada per tulisan ini.
Di Mana Posisinya dalam Lanskap Model Video Saat Ini
Konteks papan peringkat T2V dan I2V saat ini
Teratas papan peringkat T2V Artificial Analysis (tanpa audio), awal April 2026:
| Peringkat | Model | Elo | API Tersedia | Dirilis |
|---|---|---|---|---|
| #1 | HappyHorse-1.0 | 1333 | Tidak | Apr 2026 |
| #2 | Seedance 2.0 720p | 1273 | Tidak ada API publik | Mar 2026 |
| #3 | SkyReels V4 | 1245 | Ya ($7,20/menit) | Mar 2026 |
| #4 | Kling 3.0 1080p Pro | 1241 | Ya ($13,44/menit) | Feb 2026 |
| #5 | PixVerse V6 | 1240 | Ya ($5,40/menit) | Mar 2026 |
I2V (tanpa audio) mengikuti pola yang sama: HappyHorse di 1.392, Seedance 2.0 di 1.355, PixVerse V6 di 1.338, Grok Imagine Video di 1.333, Kling 3.0 Omni di 1.297.

Dua model berkualitas tertinggi berdasarkan Elo — HappyHorse dan Seedance 2.0 — keduanya tidak dapat diakses melalui API publik. Posisi 3 hingga 5 dalam T2V dipisahkan oleh 5 poin Elo — seri statistik.
Mengapa ini penting bagi tim yang mengevaluasi stack generasi video
Dua pertanyaan terpisah. Model mana yang menghasilkan output perbandingan buta terbaik? HappyHorse-1.0, berdasarkan data saat ini. Model mana yang benar-benar dapat Anda integrasikan hari ini? Bukan HappyHorse.
Papan peringkat praktis dimulai dari posisi #3. SkyReels V4 menawarkan rasio kualitas-harga terbaik di antara opsi yang dapat diakses. Kling 3.0 Pro lebih mahal tetapi menjalankan 1080p secara native. PixVerse V6 adalah yang termurah per menit di tingkat teratas.
Jika HappyHorse merilis bobot atau API dalam beberapa minggu mendatang, kalkulasinya berubah. Itu adalah kemungkinan nyata — stealth-drop-then-release telah terjadi beberapa kali tahun ini. Juga mungkin tidak ada yang terwujud selama berbulan-bulan.
FAQ
Siapa yang membuat HappyHorse-1.0?
Tidak diketahui. Artificial Analysis mendeskripsikannya sebagai “pseudonim.” Spekulasi komunitas mengarah ke tim berbasis Asia, tetapi tidak ada organisasi yang mengklaimnya.
Apakah HappyHorse-1.0 tersedia untuk digunakan sekarang?
Tidak dengan cara yang siap produksi. Tautan GitHub dan Model Hub bertuliskan “coming soon.” Tidak ada API publik, tidak ada bobot yang dapat diunduh, tidak ada harga yang terdokumentasi per 8 April 2026.
Apakah HappyHorse-1.0 sama dengan WAN 2.7?
Belum dikonfirmasi. Spekulasi ada karena rilis pra-peluncuran anonim umum dalam ekosistem AI Tiongkok — preseden Pony Alpha / GLM-5 yang paling terbaru. Tidak ada bukti langsung yang menghubungkan HappyHorse dengan keluarga WAN Alibaba.
Bagaimana Artificial Analysis memberi peringkat model video?
Pemilihan suara pengguna yang buta. Pengguna membandingkan dua video dari prompt yang sama tanpa mengetahui model mana yang membuat mana, kemudian memilih preferensi mereka. Suara dimasukkan ke dalam sistem peringkat Elo.
Kapan bobot HappyHorse-1.0 akan dirilis?
Tidak ada jadwal yang diberikan. “Coming soon” untuk GitHub maupun Model Hub. Tidak ada komitmen publik yang dapat dipegang siapapun.
Angka papan peringkat itu nyata. Semua yang lain — tim, bobot, akses, jadwal — masih tertunda. Untuk diverifikasi.
Coba HappyHorse-1.0 di WaveSpeedAI
HappyHorse-1.0 kini tersedia di WaveSpeedAI:
Postingan sebelumnya:


