A medida que las capacidades de agencia se convierten en el nuevo estándar entre las empresas de modelos de inteligencia artificial, Anthropic ha lanzado Claude Sonnet 5, una versión más potente y orientada a la agencia de su modelo de gama media. Este movimiento posiciona a la compañía en una competencia directa con gigantes como OpenAI y Google, no solo en capacidad, sino también en eficiencia de costes.
Capacidades Autónomas
El nuevo modelo puede hacer planes, utilizar herramientas como navegadores y terminales, y funcionar de forma autónoma a un nivel que, hace apenas unos meses, requería modelos más grandes y caros.
La Nueva Frontera: Eficiencia en Agentes de IA
El lanzamiento de Sonnet 5 refleja una tendencia clara en el sector. Recientemente, OpenAI presentó una versión preliminar de GPT-5.6 Sol, su modelo más avanzado en capacidades de agencia, que permite dividir tareas complejas entre subagentes autónomos. De manera similar, Google lanzó en mayo su Gemini 3.5 Flash, presentándolo como una herramienta de agente que planifica, construye e itera con mínima intervención humana.
Con Sonnet 5, la capacidad de agencia se consolida como una expectativa básica en todos los niveles de precios. El factor diferenciador ya no es solo quién puede ejecutar mejor estas tareas, sino quién puede hacerlo de la forma más económica y fiable sin supervisión constante.
Estructura de Precios y Rendimiento
Sonnet 5 promete un rendimiento cercano al del modelo superior, Opus 4.8, pero con un coste significativamente menor. Desde su lanzamiento, Claude Sonnet 5 se ha convertido en el modelo predeterminado para los planes Pro y gratuitos de Anthropic, estando disponible para todas las suscripciones.
Esta estructura de precios sitúa a Sonnet 5 como una opción más económica que Opus 4.8, GPT-5.5 de OpenAI y Gemini 3.1 Pro de Google, aunque sigue siendo más caro que Gemini 3.5 Flash.
Salto Cualitativo en Capacidades
El nuevo modelo demuestra mejoras significativas respecto a su predecesor, Sonnet 4.6, en áreas clave como el razonamiento, el uso de herramientas, la codificación de software y el trabajo de conocimiento.
Comparativa de rendimiento en codificación agente.
Curiosamente, en pruebas de trabajo de conocimiento, Sonnet 5 supera ligeramente a Opus 4.8, conocido por su capacidad para resolver problemas complejos. Anthropic aclara que «Opus 4.8 sigue siendo el modelo elegido para una mayor precisión, pero Sonnet 5 ofrece a los desarrolladores opciones de menor precio y mayor calidad que las disponibles anteriormente».
Perfil: Anthropic
Anthropic es una empresa de investigación y seguridad en inteligencia artificial fundada en 2021 por ex-miembros de alto nivel de OpenAI, incluyendo a Dario y Daniela Amodei. Su misión es construir sistemas de IA fiables, interpretables y orientables, con un fuerte enfoque en la seguridad y el desarrollo responsable. La compañía ha desarrollado la familia de modelos de lenguaje Claude como competidores directos de la serie GPT de OpenAI.
- Sede: San Francisco, California, EE. UU.
- Fundación: 2021 por Dario Amodei, Daniela Amodei, Tom Brown, Chris Olah, entre otros.
- Valoración: Aproximadamente $18.4 mil millones (a principios de 2024).
- Inversores Clave: Google, Amazon, Salesforce Ventures, Sound Ventures.
- Web: Visitar sitio oficial | LinkedIn | X (Twitter)
Validación en el Mundo Real
Los primeros evaluadores destacan la capacidad de Sonnet 5 para completar tareas complejas de principio a fin, algo en lo que versiones anteriores flaqueaban. Además, el modelo es capaz de verificar sus propios resultados sin necesidad de una solicitud explícita.
«Le asignamos a Claude Sonnet 5 un trabajo de dos partes (actualizar los niveles de cuentas de Salesforce, enviar un anuncio de lanzamiento a los contactos empresariales) y terminó de principio a fin. Eso solía quedarse a medio camino. Para la automatización del día a día, es una obviedad.»
– Daniel Shepard, Ingeniero Senior en Zapier
Avances en Seguridad
En materia de seguridad, Sonnet 5 muestra una tasa más baja de “comportamientos indeseables” como la cooperación con el mal uso o el engaño. Es más robusto al rechazar solicitudes maliciosas y evitar ataques de inyección de prompts. También presenta menores tasas de alucinaciones y comportamiento adulador en comparación con Sonnet 4.6.
A pesar de estas mejoras, Anthropic señala que no alcanza el nivel de seguridad de Opus 4.8 o Claude Mythos Preview, y tiene una capacidad significativamente menor para realizar tareas peligrosas de ciberseguridad.
Fabian Hedin, cofundador de Lovable, afirmó que Claude Sonnet 5 «rechaza solicitudes inseguras de manera limpia y consistente», subrayando que «un modelo que sabe cuándo decir no es tan importante como uno que sabe cómo construir».
Cronología Clave de Anthropic
| Marzo 2024 | Lanzamiento de la familia de modelos Claude 3, incluyendo Haiku, Sonnet y el modelo de gama alta Opus. |
| Junio 2024 | Presentación de Claude Sonnet 5, una versión mejorada con capacidades de agencia avanzadas y un coste optimizado. |
