¿Qué es HappyHorse-1.0? El misterioso modelo de video de IA número 1

Hola, chicos. Soy Dora. Rastro el clasificador Artificial Analysis Video Arena casi todas las semanas — votos ciegos de usuarios, puntuaciones Elo, sin autoinformes de laboratorios. La semana pasada, un nombre que nunca había visto ocupaba el primer puesto tanto en los rankings de texto a video como de imagen a video. HappyHorse-1.0. Sin equipo conocido. Sin marca. Links de GitHub y HuggingFace que dicen “próximamente”.

Si evalúas modelos de video antes de integrarlos en un pipeline — y has aprendido a ser escéptico ante el bombo de los clasificadores — esto es un desglose de lo que está confirmado, lo que solo se afirma, y lo que esa brecha entre ambos significa para las decisiones en este momento.

Cómo HappyHorse-1.0 Apareció en el Radar

Artificial Analysis Video Arena: qué es este clasificador y por qué importa

Artificial Analysis gestiona una arena de video. Los usuarios envían un prompt de texto o una imagen de referencia. El sistema genera salidas de dos modelos. Los usuarios ven ambas lado a lado, no saben qué modelo generó cuál, y eligen la que prefieren.

Esos votos se introducen en un sistema de puntuación Elo — la misma matemática usada en los rankings de ajedrez. La puntuación de un modelo sube cuando los usuarios lo eligen, baja cuando no, ajustada por la fortaleza del oponente. El resultado es un ranking basado enteramente en la preferencia humana agregada bajo condiciones ciegas. Sin submissions de laboratorio seleccionados a mano. Sin benchmarks autoinformados.

Votos ciegos de usuarios y Elo: no son benchmarks autoinformados

Todos los demás rankings de modelos de video que he visto tienen el mismo problema — las personas que informan los números son las personas que construyeron el modelo. Artificial Analysis elimina eso. La señal de calidad proviene enteramente de usuarios que no saben sobre qué están votando.

Las diferencias Elo son relativas. Una brecha de 60 puntos significa que un modelo gana aproximadamente el 58-59% de los enfrentamientos directos. Una brecha de 5 puntos es ruido.

T2V #1 (Elo 1333), I2V #1 (Elo 1392) — qué significan estos números en contexto

A principios de abril de 2026, las posiciones de HappyHorse-1.0 en el clasificador de Artificial Analysis:

Categoría	Elo	Puesto
Texto a Video (sin audio)	1333	#1
Imagen a Video (sin audio)	1392	#1
Texto a Video (con audio)	1205	#2
Imagen a Video (con audio)	1161	#2

El anterior #1 en T2V sin audio era Dreamina Seedance 2.0 con 1.273. Una brecha Elo de 60 puntos no es pequeña. En la categoría I2V sin audio, HappyHorse supera a Seedance 2.0 por 37 puntos.

Con audio incluido, el panorama se invierte — Seedance 2.0 supera a HappyHorse en el #1. La brecha allí es estrecha: 14 puntos en T2V con audio, 1 punto en I2V con audio.

Una cosa que hay que ser honesto: las puntuaciones Elo para modelos recién añadidos son más volátiles que las de los establecidos. Seedance 2.0 tiene más de 7.500 muestras de votos en la categoría T2V. El recuento de muestras de HappyHorse todavía no está desglosado públicamente. Estos números cambiarán a medida que lleguen más votos. La dirección de ese cambio es desconocida. Esta conclusión tiene fecha de caducidad — los modelos se actualizan rápido.

Lo Que Sabemos Sobre el Modelo

Todo en esta sección proviene de happyhorses.io. Lo señalo de antemano porque ninguna de estas afirmaciones técnicas ha sido verificada de forma independiente por un tercero a la fecha de publicación de este artículo (8 de abril de 2026).

Arquitectura Transformer de auto-atención única, diseño de 40 capas (afirmado por happyhorse-ai.com, no verificado)

El sitio describe un único Transformer unificado con 40 capas. Tokens de texto, un latente de imagen de referencia, y tokens ruidosos de video y audio son — según el sitio — desnoisados conjuntamente dentro de una secuencia de tokens. Las primeras y últimas 4 capas supuestamente usan proyecciones específicas por modalidad. Las 32 capas intermedias comparten parámetros entre todas las modalidades. Sin atención cruzada.

Un sitio de marketing separado (happy-horse.art) afirma 15 mil millones de parámetros. Ese número no aparece en el dominio principal ni en ningún reporte independiente.

La descripción de la arquitectura es suficientemente específica para ser falsificable — si y cuando los pesos estén disponibles, alguien la verificará o contradirá en cuestión de horas.

Generación de audio-video multilingüe: chino, inglés, japonés, coreano, alemán, francés (afirmado)

El sitio enumera seis idiomas con soporte nativo para la generación conjunta de audio-video: chino, inglés, japonés, coreano, alemán y francés. La página happy-horse.art añade el cantonés como séptimo e menciona “sincronización labial con WER ultra-bajo”.

No tengo forma de verificar estas afirmaciones. Sin pesos, sin API, sin demo reproducible. Las salidas de la arena visibles en Artificial Analysis no prueban sistemáticamente la capacidad de audio multilingüe.

Texto a video e imagen a video en un solo pipeline (reportado)

El sitio describe un pipeline unificado que maneja tanto T2V como I2V. Esto es consistente con los datos del clasificador — HappyHorse-1.0 aparece en ambas arenas bajo el mismo nombre de modelo, lo que sugiere un único modelo en lugar de modelos especializados separados.

El sitio también afirma síntesis de audio conjunta — diálogo, sonidos ambientales y efectos Foley generados junto al video en un solo paso. Los rankings #2 en las categorías “con audio” sugieren que la generación de audio existe y es competitiva, aunque no lidere.

Lo Que Aún No Está Verificado

Identidad del equipo: seudónimo según Artificial Analysis, con especulación de origen asiático

Nadie ha reclamado públicamente el crédito por HappyHorse-1.0. El propio Artificial Analysis usó la palabra “seudónimo” cuando anunció la adición del modelo a la arena — lo que significa que fue enviado sin un equipo u organización verificable adjunto.

La especulación de la comunidad en X ha apuntado hacia un origen en Asia. El razonamiento es en parte las capacidades multilingües (idiomas CJK prominentemente destacados), en parte patrones de temporización que se asemejan a lanzamientos sigilosos previos de laboratorios de IA chinos. Nada de esto constituye confirmación. La especulación sobre el origen no es identificación del origen.

Afirmación de código abierto: links de GitHub y HuggingFace marcados como “próximamente”, no accesibles a la fecha de publicación

El sitio happyhorse-ai.com afirma: “Modelo base, modelo destilado, modelo de súper resolución y código de inferencia — todo publicado”. También dice: “Todo está abierto”.

A partir del 8 de abril de 2026, tanto el link de GitHub como el link del Model Hub en ese mismo sitio dicen “próximamente”. No llevan a ningún lado. Busqué en HuggingFace y GitHub pesos de HappyHorse. Nada.

El sitio dice que todo está publicado. Los links dicen que no lo está. Esto no coincidía con la documentación.

Recuento de parámetros y requisitos de hardware: sin confirmación independiente

La afirmación de 15B parámetros aparece en un sitio secundario (happy-horse.art), no en el dominio principal. El sitio principal menciona velocidades de inferencia — aproximadamente 2 segundos para un clip de 5 segundos a 256p, aproximadamente 38 segundos para 1080p en una H100 — pero estos son números del proveedor autoinformados. Ningún tercero ha publicado benchmarks independientes sobre velocidad de inferencia o requisitos de memoria.

Sin pesos descargables, nadie fuera de los creadores del modelo puede verificar el recuento de parámetros, los detalles de la arquitectura o los requisitos de hardware. Aquí es donde terminan mis datos.

Especulación sobre WAN 2.7: qué la impulsa, por qué sigue sin confirmarse

Algunos miembros de la comunidad han especulado que HappyHorse-1.0 es en realidad WAN 2.7 — una próxima versión de la familia de modelos de video WAN de Alibaba — probada bajo un seudónimo antes del lanzamiento oficial.

La lógica: WAN 2.6 está en el clasificador de Artificial Analysis con Elo 1.189 para T2V (muy por debajo de HappyHorse). Los lanzamientos anónimos previos a los oficiales se han convertido en un patrón en el ecosistema de IA chino. La situación de Pony Alpha en febrero de 2026 es el precedente más claro — un modelo misterioso apareció en OpenRouter, desencadenó un juego de adivinanzas, y resultó ser GLM-5 de Z.ai haciendo una prueba de estrés sigilosa.

Pero los patrones paralelos no prueban identidad. La descripción de la arquitectura en el sitio de HappyHorse no coincide obviamente con la arquitectura WAN conocida públicamente. Ningún peso filtrado, ninguna huella digital de API, ninguna confirmación interna ha conectado los dos. No lo sé. Mejor que inventarme algo.

Por Qué el “Origen Misterioso” es Relevante para los Desarrolladores

El Elo es ciego — la señal de calidad es real independientemente de la identidad del equipo

Los usuarios que votaron las salidas de HappyHorse por encima de Seedance 2.0 y Kling 3.0 no sabían sobre qué estaban votando. Si el modelo gana consistentemente comparaciones ciegas, eso te dice algo real sobre la calidad de salida — independientemente de quién lo construyó.

La señal de calidad no requiere conocer el equipo. Requiere confiar en la metodología.

Incertidumbre de acceso: sin API estable ni pesos públicos hoy

La señal de calidad y la usabilidad práctica son dos cosas diferentes. A día de hoy: sin API pública, sin pesos descargables, sin precios documentados, sin SLA.

Para cualquiera que construya un pipeline o entregue un producto, HappyHorse-1.0 no existe como opción todavía. El ranking del clasificador es real. El acceso no lo es.

Qué vigilar: publicación en GitHub, disponibilidad de pesos, señales de acceso a API

Tres cosas moverían a HappyHorse de “entrada en el clasificador” a “opción real”: un repositorio de GitHub con pesos reales y código de inferencia, una model card en HuggingFace con detalles verificables y una licencia, o un endpoint de API con precios documentados.

Ninguno existe a la fecha de este escrito.

Dónde Se Sitúa en el Panorama Actual de Modelos de Video

Contexto actual del clasificador T2V e I2V

Parte superior del clasificador T2V de Artificial Analysis (sin audio), principios de abril de 2026:

Puesto	Modelo	Elo	API Disponible	Publicado
#1	HappyHorse-1.0	1333	No	Abr 2026
#2	Seedance 2.0 720p	1273	Sin API pública	Mar 2026
#3	SkyReels V4	1245	Sí ($7,20/min)	Mar 2026
#4	Kling 3.0 1080p Pro	1241	Sí ($13,44/min)	Feb 2026
#5	PixVerse V6	1240	Sí ($5,40/min)	Mar 2026

I2V (sin audio) sigue el mismo patrón: HappyHorse con 1.392, Seedance 2.0 con 1.355, PixVerse V6 con 1.338, Grok Imagine Video con 1.333, Kling 3.0 Omni con 1.297.

Los dos modelos de mayor calidad por Elo — HappyHorse y Seedance 2.0 — son ambos inaccesibles mediante API pública. Las posiciones 3 a 5 en T2V están separadas por 5 puntos Elo — un empate estadístico.

Por qué esto importa para los equipos que evalúan stacks de generación de video

Dos preguntas separadas. ¿Qué modelo produce la mejor salida en comparación ciega? HappyHorse-1.0, según los datos actuales. ¿Qué modelo puedes integrar realmente hoy? No HappyHorse.

El clasificador práctico empieza en la posición #3. SkyReels V4 ofrece la mejor relación calidad-precio entre las opciones accesibles. Kling 3.0 Pro cuesta más pero ejecuta 1080p de forma nativa. PixVerse V6 es el más barato por minuto en el nivel superior.

Si HappyHorse publica pesos o una API en las próximas semanas, el cálculo cambia. Esa es una posibilidad real — el lanzamiento sigiloso seguido de publicación se ha producido múltiples veces este año. También es posible que no se materialice nada durante meses.

Preguntas Frecuentes

¿Quién hizo HappyHorse-1.0?

Desconocido. Artificial Analysis lo describe como “seudónimo”. La especulación de la comunidad apunta a un equipo con base en Asia, pero ninguna organización lo ha reclamado.

¿Está HappyHorse-1.0 disponible para usar ahora mismo?

No de ninguna manera lista para producción. Los links de GitHub y Model Hub dicen “próximamente”. Sin API pública, sin pesos descargables, sin precios documentados a 8 de abril de 2026.

¿Es HappyHorse-1.0 lo mismo que WAN 2.7?

Sin confirmar. La especulación existe porque los lanzamientos anónimos previos al oficial son comunes en el ecosistema de IA chino — el precedente de Pony Alpha / GLM-5 siendo el más reciente. Ninguna evidencia directa conecta HappyHorse con la familia WAN de Alibaba.

¿Cómo clasifica Artificial Analysis los modelos de video?

Votación ciega de usuarios. Los usuarios comparan dos videos del mismo prompt sin saber qué modelo generó cuál, y luego eligen su preferencia. Los votos se introducen en un sistema de puntuación Elo.

¿Cuándo se publicarán los pesos de HappyHorse-1.0?

Sin cronograma dado. “Próximamente” tanto para GitHub como para Model Hub. Sin compromiso público al que responsabilizar a nadie.

Los números del clasificador son reales. Todo lo demás — equipo, pesos, acceso, cronograma — está pendiente. Por verificar.

Prueba HappyHorse-1.0 en WaveSpeedAI

HappyHorse-1.0 ya está disponible en WaveSpeedAI:

Publicaciones anteriores: