← Blog

Claude Opus 4.6 y Sonnet 4.6: Todo lo que Necesitas Saber

Un análisis profundo de Claude Opus 4.6 y Sonnet 4.6 de Anthropic — los modelos Claude más capaces hasta la fecha, con ventanas de contexto de 1M, pensamiento adaptativo y benchmarks de última generación.

6 min read

Anthropic ha vuelto a elevar el listón. Con el lanzamiento de Claude Opus 4.6 (5 de febrero de 2026) y Claude Sonnet 4.6 (17 de febrero de 2026), la familia de modelos Claude logra avances significativos en programación, flujos de trabajo agénticos, razonamiento con contexto extenso y uso del ordenador — todo ello manteniendo los precios sin cambios respecto a la generación anterior.

Esto es lo que hace que la generación 4.6 sea un salto adelante significativo.

Claude Opus 4.6: El Claude Más Capaz de la Historia

Opus 4.6 es el modelo insignia de Anthropic, diseñado para las tareas más exigentes en programación, investigación y razonamiento complejo.

Ventana de Contexto de 1M a Precio Estándar

Por primera vez, un modelo de clase Opus incluye una ventana de contexto de 1 millón de tokens — y no hay recargos por contexto extenso. Esto significa que puedes introducir bases de código completas, documentos legales extensos o conjuntos de datos masivos en un solo prompt sin preocuparte por costes adicionales.

128K Tokens de Salida

Opus 4.6 duplica la salida máxima de 64K a 128K tokens, lo que lo hace mucho más práctico para generar contenido extenso, código detallado o análisis exhaustivos en una sola respuesta.

Pensamiento Adaptativo

Atrás quedaron los días de ajustar manualmente los presupuestos de pensamiento extendido. Opus 4.6 introduce el pensamiento adaptativo, donde Claude decide dinámicamente cuándo y con qué profundidad razonar. Puedes establecer uno de cuatro niveles de esfuerzo — bajo, medio, alto (predeterminado) o máximo — y dejar que el modelo asigne su presupuesto de razonamiento en consecuencia.

Pensamiento Intercalado

En flujos de trabajo agénticos, Claude ahora puede pensar entre llamadas a herramientas. En lugar de planificarlo todo de antemano y luego ejecutar, el modelo razona en cada paso, ajustando su enfoque según los resultados intermedios. Esto hace que las tareas de múltiples pasos sean significativamente más fiables.

Compactación de Contexto

Cuando las conversaciones se acercan al límite de contexto, Opus 4.6 resume y reemplaza automáticamente el contexto más antiguo en lugar de simplemente truncarlo. Esto permite interacciones sostenidas más largas — especialmente valioso para sesiones de programación, depuración y flujos de trabajo de investigación que abarcan muchos turnos.

Claude Sonnet 4.6: Cerrando la Brecha

Sonnet 4.6 es ahora el modelo predeterminado para los usuarios Free y Pro en claude.ai. Lo notable de este lanzamiento es lo cerca que Sonnet llega al rendimiento de nivel Opus — la brecha entre ambos es la más estrecha que ha existido.

Sonnet 4.6 comparte las mismas mejoras fundamentales: ventana de contexto de 1M, pensamiento adaptativo, pensamiento extendido y pensamiento intercalado. Todo a un precio significativamente más bajo.

Aspectos Destacados de los Benchmarks

Los números cuentan una historia convincente:

BenchmarkOpus 4.6Sonnet 4.6
SWE-bench Verified (issues reales de GitHub)~80.8%79.6%
OSWorld-Verified (uso del ordenador)72.7%72.5%
Terminal-Bench 2.0 (programación agéntica)#1 general59.1%
Humanity’s Last Exam#1 general
ARC-AGI-258.3% (mejora 4.3x)
BigLaw Bench (razonamiento legal)90.2%
MRCR v2 8-needle @ 1M (contexto extenso)76%

Algunos resultados destacables:

  • SWE-bench Verified: Sonnet 4.6 obtiene 79.6%, casi igualando a Opus en 80.8%. Para la mayoría de las tareas de programación, la diferencia es insignificante.
  • OSWorld: Ambos modelos superan el 72% en el uso autónomo del ordenador — un salto enorme respecto a la generación anterior y muy por delante de los modelos competidores.
  • ARC-AGI-2: Sonnet 4.6 saltó del 13.6% al 58.3%, una mejora de 4.3x — la mayor ganancia en una sola generación en la historia de Claude.
  • Recuperación en contexto extenso: Opus 4.6 obtiene 76% en la tarea de recuperación de 8 agujas con 1M de contexto, frente al 18.5% de Sonnet 4.5. Una mejora de 4x en la localización de información enterrada en documentos extensos.

Precios

Ambos modelos mantienen los mismos precios que sus predecesores de la versión 4.5:

ModeloEntrada (por 1M tokens)Salida (por 1M tokens)
Opus 4.6$5$25
Sonnet 4.6$3$15
Haiku 4.5$1$5

La ventana de contexto de 1M está incluida al precio estándar tanto para Opus como para Sonnet — sin niveles premium ni recargos.

Cuándo Usar Cada Modelo

Elige Opus 4.6 cuando necesites:

  • Máxima precisión en razonamiento complejo de múltiples pasos
  • Tareas de contexto extenso que requieran recuperación precisa en documentos masivos
  • Flujos de trabajo de programación agéntica donde la fiabilidad es primordial
  • Análisis legal, científico o financiero que exija la mayor precisión

Elige Sonnet 4.6 cuando necesites:

  • Programación y razonamiento sólidos a un coste menor
  • Uso del ordenador y tareas agénticas (el rendimiento es casi idéntico al de Opus)
  • Un gran equilibrio entre capacidad y velocidad
  • Cargas de trabajo de alto volumen donde el ahorro del 40% en costes se acumula

Elige Haiku 4.5 cuando necesites:

  • Tareas rápidas y ligeras como clasificación, resumen o preguntas y respuestas simples
  • Aplicaciones sensibles al presupuesto a escala

Qué Significa Esto para los Desarrolladores

La generación 4.6 representa un cambio en cómo los desarrolladores pueden construir con Claude:

  1. Los flujos de trabajo agénticos son ahora prácticos. El pensamiento intercalado y el uso mejorado de herramientas significan que Claude puede manejar tareas complejas de múltiples pasos con muchos menos errores. Las puntuaciones de Terminal-Bench y OSWorld lo confirman.

  2. El contexto ya no es un cuello de botella. Con 1M de tokens al precio estándar y compactación automática de contexto, puedes construir aplicaciones que razonen sobre repositorios enteros, colecciones de documentos o historiales de conversación.

  3. El nivel de valor es excepcionalmente sólido. Sonnet 4.6 rinde dentro del 1-2% de Opus en la mayoría de los benchmarks de programación y uso del ordenador. Para muchas cargas de trabajo en producción, es la opción predeterminada inteligente.

  4. El pensamiento adaptativo simplifica la integración. En lugar de ajustar los presupuestos de pensamiento por tarea, estableces un nivel de esfuerzo y dejas que el modelo se encargue del resto. Esto reduce la carga de ingeniería de prompts y hace que el rendimiento sea más consistente.

La Conclusión Final

Claude Opus 4.6 y Sonnet 4.6 ofrecen el mayor salto de capacidad en una sola generación de Claude. La ventana de contexto de 1M, el pensamiento adaptativo y el razonamiento intercalado no son solo mejoras en las especificaciones — cambian fundamentalmente lo que puedes construir.

Opus 4.6 establece nuevos benchmarks en todos los ámbitos. Sonnet 4.6 se acerca notablemente al 60% del precio. Y con Haiku 4.5 todavía disponible para tareas ligeras, la línea completa de Claude cubre todos los casos de uso, desde el presupuestario hasta la frontera tecnológica.

Los modelos están disponibles ahora a través de la API de Claude, claude.ai, y plataformas asociadas como Amazon Bedrock y Google Cloud Vertex AI.