Anthropic lanza Claude Sonnet 4.6: rendimiento al nivel de Opus y menor coste operacional

Anthropic lanza Sonnet 4.6 con contexto de 1M de tokens y precios más bajos que Opus, pero sin benchmarks estándar que respalden sus cifras

Anthropic lanza Claude Sonnet 4.6: rendimiento al nivel de Opus y menor coste operacional
El modelo promete igualar a Opus 4.6 en comprensión de documentos y a Opus 4.5 en codificación de largo horizonte, según pruebas internas de la compañía
Publicado en Tecnología
Por por Sergio Agudo

Anthropic ha presentado Claude Sonnet 4.6, un modelo de lenguaje con razonamiento híbrido pensado para agentes, codificación y automatización a gran escala. La compañía lo sitúa como opción para quien necesite equilibrio entre capacidad y coste, y lo hace con una ventana de contexto de 1 millón de tokens —actualmente en beta y solo en la API— que hasta ahora solo se veía en su gama alta.

Según detalla Anthropic en la página del modelo, las cifras del lanzamiento incluyen mejoras de más de 10 puntos en detección de bugs frente a Sonnet 4.5, un 38% más de precisión y un 70% más de eficiencia en tokens en una evaluación interna de sistemas de archivos —sin especificar condiciones ni comparadores externos— e igualdad con Opus 4.6 en OfficeQA, benchmark que mide comprensión de documentos, extracción de datos y razonamiento.

Rendimiento de gama alta, precio de gama media: ¿se sostiene la promesa?

A principios de febrero, Anthropic presentaba su modelo más potente de la gama 4.6 con ventanas de contexto extendidas y razonamiento avanzado. Sonnet 4.6 llega ahora a por ese mismo territorio con otro precio: 3 dólares por millón de tokens de entrada y 15 por millón de salida, cifras que bajan hasta un 90% con caché de prompts y un 50% adicional con procesamiento por lotes.

Lo que distingue a este modelo dentro de la gama es que combina modo estándar y razonamiento extendido en un solo servicio, sin necesidad de cambiar de modelo según la tarea. Desde la API se puede ajustar el esfuerzo de razonamiento para priorizar velocidad o precisión según lo que se esté construyendo, lo que tiene sentido directo sobre el coste por petición.

Los testimonios que publica Anthropic —todos positivos, seleccionados por la propia compañía— apuntan a mejoras concretas: cero enlaces alucinados en pruebas de automatización de navegador frente al uno de cada tres que aparecían antes, mejor código iOS en pruebas de Rakuten AI, y equipos que ya han migrado "la mayoría del tráfico" desde Sonnet 4.5.

El lanzamiento llega en un momento delicado. Hace apenas una semana, el jefe de seguridad de Anthropic presentó su dimisión con una carta en la que acusaba a la empresa de ignorar sus propios protocolos internos. Que Sonnet 4.6 llegue con buenas cifras no borra ese contexto: la página del modelo remite a una "model card" de seguridad separada, sin desglosar mitigaciones, límites ni riesgos conocidos. ¿Cuánto se puede acelerar el ciclo de lanzamientos antes de que la evaluación quede atrás?

Sonnet 4.6 está disponible desde ya en Claude.ai y en Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry, lo que facilita su integración en infraestructuras ya existentes sin cambiar de proveedor. Para quienes accedan por API, el identificador es claude-sonnet-4-6. Si las cifras internas que maneja Anthropic se sostienen en producción real, la relación precio-rendimiento es el argumento más sólido del lanzamiento.

Para ti
Queremos saber tu opinión. ¡Comenta!