Apa Itu HappyHorse-1.0? Model AI Video Misterius Peringkat #1

Hei, teman-teman. Ini Dora. Saya memantau papan peringkat Artificial Analysis Video Arena hampir setiap minggu — suara pengguna yang buta, peringkat Elo, tanpa laporan mandiri dari lab. Minggu lalu, sebuah nama yang belum pernah saya lihat berada di posisi teratas peringkat text-to-video maupun image-to-video. HappyHorse-1.0. Tidak ada tim yang dikenal. Tidak ada merek. Tautan GitHub dan HuggingFace yang bertuliskan “coming soon.”

Jika Anda mengevaluasi model video sebelum mengintegrasikannya ke dalam pipeline — dan Anda sudah belajar untuk skeptis terhadap hype papan peringkat — ini adalah uraian tentang apa yang sudah dikonfirmasi, apa yang hanya diklaim, dan apa arti kesenjangan antara keduanya untuk keputusan saat ini.

Bagaimana HappyHorse-1.0 Muncul di Radar

Artificial Analysis Video Arena: apa papan peringkat ini dan mengapa penting

Artificial Analysis menjalankan sebuah arena video. Pengguna mengirimkan prompt teks atau gambar referensi. Sistem menghasilkan output dari dua model. Pengguna melihat keduanya secara berdampingan, tidak tahu model mana yang membuat mana, dan memilih yang mereka sukai.

Suara-suara tersebut dimasukkan ke dalam sistem peringkat Elo — matematika yang sama yang digunakan dalam peringkat catur. Skor model naik ketika pengguna memilihnya, turun ketika tidak, disesuaikan dengan kekuatan lawan. Hasilnya adalah peringkat yang sepenuhnya berdasarkan preferensi manusia secara agregat dalam kondisi buta. Tidak ada kiriman lab yang dipilih secara selektif. Tidak ada tolok ukur yang dilaporkan sendiri.

Suara pengguna yang buta dan Elo: bukan tolok ukur yang dilaporkan sendiri

Setiap peringkat model video lain yang pernah saya lihat memiliki masalah yang sama — orang yang melaporkan angkanya adalah orang yang membangun modelnya. Artificial Analysis menghilangkan hal itu. Sinyal kualitas sepenuhnya berasal dari pengguna yang tidak tahu apa yang mereka pilih.

Perbedaan Elo bersifat relatif. Selisih 60 poin berarti satu model menang sekitar 58-59% dari pertandingan head-to-head. Selisih 5 poin adalah noise.

T2V #1 (Elo 1333), I2V #1 (Elo 1392) — apa arti angka-angka ini dalam konteks

Per awal April 2026, posisi HappyHorse-1.0 di papan peringkat Artificial Analysis:

Kategori	Elo	Peringkat
Text-to-Video (tanpa audio)	1333	#1
Image-to-Video (tanpa audio)	1392	#1
Text-to-Video (dengan audio)	1205	#2
Image-to-Video (dengan audio)	1161	#2

#1 sebelumnya dalam T2V tanpa audio adalah Dreamina Seedance 2.0 di 1.273. Selisih Elo 60 poin tidak kecil. Dalam kategori I2V tanpa audio, HappyHorse unggul atas Seedance 2.0 sebesar 37 poin.

Dengan audio disertakan, gambarannya terbalik — Seedance 2.0 mengalahkan HappyHorse untuk #1. Selisih di sana sempit: 14 poin dalam T2V dengan audio, 1 poin dalam I2V dengan audio.

Satu hal yang perlu dijaga kejujurannya: skor Elo untuk model yang baru ditambahkan lebih volatil daripada model yang sudah mapan. Seedance 2.0 memiliki lebih dari 7.500 sampel suara dalam kategori T2V. Jumlah sampel HappyHorse belum dipecah secara publik. Angka-angka ini akan berubah seiring masuknya lebih banyak suara. Arah perubahan tersebut tidak diketahui. Kesimpulan ini memiliki tanggal kedaluwarsa — model diperbarui dengan cepat.

Apa yang Kita Ketahui Tentang Model

Semua hal dalam bagian ini berasal dari happyhorses.io. Saya menyebutkan itu di awal karena tidak ada klaim teknis ini yang telah diverifikasi secara independen oleh pihak ketiga per tanggal publikasi artikel ini (8 April 2026).

Arsitektur Transformer self-attention tunggal, desain 40 lapisan (diklaim oleh happyhorse-ai.com, belum diverifikasi)

Situs ini mendeskripsikan Transformer terpadu tunggal dengan 40 lapisan. Token teks, laten gambar referensi, serta token video dan audio yang berisik — menurut situs tersebut — didenoising secara bersama dalam satu urutan token. 4 lapisan pertama dan terakhir dilaporkan menggunakan proyeksi spesifik modalitas. 32 lapisan tengah berbagi parameter di semua modalitas. Tanpa cross-attention.

Situs pemasaran terpisah (happy-horse.art) mengklaim 15 miliar parameter. Angka tersebut tidak muncul di domain utama atau dalam laporan independen mana pun.

Deskripsi arsitektur cukup spesifik untuk dapat difalsifikasi — jika dan ketika bobot tersedia, seseorang akan memverifikasi atau membantahnya dalam hitungan jam.

Generasi audio-video multibahasa: Mandarin, Inggris, Jepang, Korea, Jerman, Prancis (diklaim)

Situs ini mencantumkan enam bahasa yang didukung secara native untuk generasi audio-video bersama: Mandarin, Inggris, Jepang, Korea, Jerman, dan Prancis. Halaman happy-horse.art menambahkan Kanton sebagai ketujuh dan menyebutkan “ultra-low WER lip-sync.”

Saya tidak memiliki cara untuk menguji klaim-klaim ini. Tidak ada bobot, tidak ada API, tidak ada demo yang dapat direproduksi. Output arena yang terlihat di Artificial Analysis tidak menguji kemampuan audio multibahasa secara sistematis.

Text-to-video dan image-to-video dalam satu pipeline (dilaporkan)

Situs ini mendeskripsikan pipeline terpadu yang menangani T2V maupun I2V. Ini konsisten dengan data papan peringkat — HappyHorse-1.0 muncul di kedua arena dengan nama model yang sama, menunjukkan satu model daripada model khusus yang terpisah.

Situs ini juga mengklaim sintesis audio bersama — dialog, suara ambien, dan efek Foley dihasilkan bersama video dalam satu proses. Peringkat #2 dalam kategori “dengan audio” menunjukkan bahwa generasi audio ada dan kompetitif, meskipun tidak memimpin.

Apa yang Masih Belum Diverifikasi

Identitas tim: pseudonim menurut Artificial Analysis, spekulasi berasal dari Asia

Tidak ada yang secara publik mengklaim kredit untuk HappyHorse-1.0. Artificial Analysis sendiri menggunakan kata “pseudonim” ketika mengumumkan penambahan model ke arena — artinya dikirimkan tanpa tim atau organisasi yang dapat diverifikasi.

Spekulasi komunitas di X mengarah ke asal Asia. Alasannya sebagian karena kemampuan multibahasa (bahasa CJK yang ditonjolkan), sebagian karena pola waktu yang menyerupai rilis stealth sebelumnya dari lab AI Tiongkok. Tidak ada dari ini yang merupakan konfirmasi. Spekulasi tentang asal usul bukan identifikasi asal usul.

Klaim open source: tautan GitHub dan HuggingFace bertanda “coming soon,” tidak dapat diakses per publikasi

Situs happyhorse-ai.com menyatakan: “Model dasar, model yang didistilasi, model super-resolusi, dan kode inferensi — semuanya dirilis.” Juga menyatakan: “Semuanya terbuka.”

Per 8 April 2026, tautan GitHub maupun tautan Model Hub di situs yang sama bertuliskan “coming soon.” Tidak mengarah ke mana-mana. Saya mencari bobot HappyHorse di HuggingFace dan GitHub. Tidak ada.

Situs menyatakan semuanya dirilis. Tautan-tautan menyatakan belum. Ini tidak cocok dengan dokumentasinya.

Jumlah parameter dan kebutuhan hardware: tidak ada konfirmasi independen

Klaim 15 miliar parameter muncul di situs sekunder (happy-horse.art), bukan domain utama. Domain utama menyebutkan kecepatan inferensi — sekitar 2 detik untuk klip 5 detik pada 256p, sekitar 38 detik untuk 1080p pada H100 — tetapi ini adalah angka vendor yang dilaporkan sendiri. Tidak ada pihak ketiga yang mempublikasikan tolok ukur independen tentang kecepatan inferensi atau kebutuhan memori.

Tanpa bobot yang dapat diunduh, tidak ada yang di luar pembuat model dapat memverifikasi jumlah parameter, detail arsitektur, atau kebutuhan hardware. Di sinilah data saya berakhir.

Spekulasi WAN 2.7: apa yang mendorongnya, mengapa tetap belum dikonfirmasi

Beberapa anggota komunitas telah berspekulasi bahwa HappyHorse-1.0 sebenarnya adalah WAN 2.7 — versi berikutnya dari keluarga model video WAN Alibaba — yang diuji dengan nama samaran sebelum peluncuran resmi.

Logikanya: WAN 2.6 berada di papan peringkat Artificial Analysis pada Elo 1.189 untuk T2V (jauh di bawah HappyHorse). Rilis model anonim sebelum peluncuran telah menjadi pola dalam ekosistem AI Tiongkok. Situasi Pony Alpha pada Februari 2026 adalah preseden paling jelas — sebuah model misterius muncul di OpenRouter, memicu permainan tebak-tebakan, dan ternyata adalah GLM-5 dari Z.ai yang melakukan uji stres stealth.

Tetapi pola paralel tidak membuktikan identitas. Deskripsi arsitektur di situs HappyHorse tidak secara jelas cocok dengan arsitektur WAN yang diketahui publik. Tidak ada kebocoran bobot, tidak ada fingerprinting API, tidak ada konfirmasi orang dalam yang menghubungkan keduanya. Saya tidak tahu. Lebih baik daripada membuat-buat sesuatu.

Mengapa “Asal Usul Misterius” Relevan bagi Para Developer

Elo bersifat buta — sinyal kualitas nyata terlepas dari identitas tim

Pengguna yang memilih output HappyHorse di atas Seedance 2.0 dan Kling 3.0 tidak tahu apa yang mereka pilih. Jika model secara konsisten menang dalam perbandingan buta, itu memberitahu Anda sesuatu yang nyata tentang kualitas output — terlepas dari siapa yang membuatnya.

Sinyal kualitas tidak memerlukan pengetahuan tentang tim. Ini memerlukan kepercayaan pada metodologinya.

Ketidakpastian akses: tidak ada API stabil atau bobot publik saat ini

Sinyal kualitas dan kegunaan praktis adalah dua hal yang berbeda. Per hari ini: tidak ada API publik, tidak ada bobot yang dapat diunduh, tidak ada harga yang terdokumentasi, tidak ada SLA.

Bagi siapa pun yang membangun pipeline atau merilis produk, HappyHorse-1.0 belum ada sebagai opsi. Peringkat papan peringkatnya nyata. Aksesnya tidak.

Yang perlu diperhatikan: rilis GitHub, ketersediaan bobot, sinyal akses API

Tiga hal yang akan memindahkan HappyHorse dari “entri papan peringkat” menjadi “opsi nyata”: repositori GitHub dengan bobot dan kode inferensi aktual, kartu model HuggingFace dengan detail yang dapat diverifikasi dan lisensi, atau endpoint API dengan harga yang terdokumentasi.

Tidak ada yang ada per tulisan ini.

Di Mana Posisinya dalam Lanskap Model Video Saat Ini

Konteks papan peringkat T2V dan I2V saat ini

Teratas papan peringkat T2V Artificial Analysis (tanpa audio), awal April 2026:

Peringkat	Model	Elo	API Tersedia	Dirilis
#1	HappyHorse-1.0	1333	Tidak	Apr 2026
#2	Seedance 2.0 720p	1273	Tidak ada API publik	Mar 2026
#3	SkyReels V4	1245	Ya ($7,20/menit)	Mar 2026
#4	Kling 3.0 1080p Pro	1241	Ya ($13,44/menit)	Feb 2026
#5	PixVerse V6	1240	Ya ($5,40/menit)	Mar 2026

I2V (tanpa audio) mengikuti pola yang sama: HappyHorse di 1.392, Seedance 2.0 di 1.355, PixVerse V6 di 1.338, Grok Imagine Video di 1.333, Kling 3.0 Omni di 1.297.

Dua model berkualitas tertinggi berdasarkan Elo — HappyHorse dan Seedance 2.0 — keduanya tidak dapat diakses melalui API publik. Posisi 3 hingga 5 dalam T2V dipisahkan oleh 5 poin Elo — seri statistik.

Mengapa ini penting bagi tim yang mengevaluasi stack generasi video

Dua pertanyaan terpisah. Model mana yang menghasilkan output perbandingan buta terbaik? HappyHorse-1.0, berdasarkan data saat ini. Model mana yang benar-benar dapat Anda integrasikan hari ini? Bukan HappyHorse.

Papan peringkat praktis dimulai dari posisi #3. SkyReels V4 menawarkan rasio kualitas-harga terbaik di antara opsi yang dapat diakses. Kling 3.0 Pro lebih mahal tetapi menjalankan 1080p secara native. PixVerse V6 adalah yang termurah per menit di tingkat teratas.

Jika HappyHorse merilis bobot atau API dalam beberapa minggu mendatang, kalkulasinya berubah. Itu adalah kemungkinan nyata — stealth-drop-then-release telah terjadi beberapa kali tahun ini. Juga mungkin tidak ada yang terwujud selama berbulan-bulan.

FAQ

Siapa yang membuat HappyHorse-1.0?

Tidak diketahui. Artificial Analysis mendeskripsikannya sebagai “pseudonim.” Spekulasi komunitas mengarah ke tim berbasis Asia, tetapi tidak ada organisasi yang mengklaimnya.

Apakah HappyHorse-1.0 tersedia untuk digunakan sekarang?

Tidak dengan cara yang siap produksi. Tautan GitHub dan Model Hub bertuliskan “coming soon.” Tidak ada API publik, tidak ada bobot yang dapat diunduh, tidak ada harga yang terdokumentasi per 8 April 2026.

Apakah HappyHorse-1.0 sama dengan WAN 2.7?

Belum dikonfirmasi. Spekulasi ada karena rilis pra-peluncuran anonim umum dalam ekosistem AI Tiongkok — preseden Pony Alpha / GLM-5 yang paling terbaru. Tidak ada bukti langsung yang menghubungkan HappyHorse dengan keluarga WAN Alibaba.

Bagaimana Artificial Analysis memberi peringkat model video?

Pemilihan suara pengguna yang buta. Pengguna membandingkan dua video dari prompt yang sama tanpa mengetahui model mana yang membuat mana, kemudian memilih preferensi mereka. Suara dimasukkan ke dalam sistem peringkat Elo.

Kapan bobot HappyHorse-1.0 akan dirilis?

Tidak ada jadwal yang diberikan. “Coming soon” untuk GitHub maupun Model Hub. Tidak ada komitmen publik yang dapat dipegang siapapun.

Angka papan peringkat itu nyata. Semua yang lain — tim, bobot, akses, jadwal — masih tertunda. Untuk diverifikasi.

Coba HappyHorse-1.0 di WaveSpeedAI

HappyHorse-1.0 kini tersedia di WaveSpeedAI:

Postingan sebelumnya: