Llega Claude 4.5 Sonnet: todo sobre la IA más potente del mundo para programar

Detalles: Escrito por: : La Redacción; Categoría: Software; Publicado: 01 Octubre 2025; Visitas: 100

inteligencia artificial

Múltiples empresas se están centrando en el desarrollo de sus propios proyectos de inteligencia artificial, tal y como sucede con Anthropic. La empresa acaba de lanzar Claude Sonnet 4.5 y afirma que es el mejor y más seguro modelo de codificación IA del mundo.

Lo cierto es que la firma lleva tiempo trabajando en este proyecto centrado en la programación y además de todo el potencial que nos propone, dispone de múltiples herramientas para desarrolladores y capacidades de autonomía mejoradas. Además, la nueva Claude Sonnet 4.5 cuenta con agentes software complejos y supera a sus predecesores y rivales, tales como GPT-5 de OpenAI o Gemini de Google.

Ventajas de Claude Sonnet 4.5 para programadores

Quieren destacar importantes actualizaciones en las herramientas para desarrolladores de Anthropic, como la nueva extensión de VS Code y un SDK de agente. Todo ello con el objetivo de ofrecernos tareas autónomas más sofisticadas y de larga duración. Y no solo eso, ya que la compañía quiere resaltar la seguridad mejorada del modelo. Tanto es así que lo lanza bajo protecciones ASL-3 con el fin de mitigar riesgos y reducir comportamientos dañinos.

Como suele ser habitual, todas estas afirmaciones que nos comunica Anthropic, vienen respaldadas por un conjunto de métricas que posicionan a Sonnet 4.5 en la cima de varias clasificaciones de la industria actual. Por ejemplo, el anuncio oficial destaca su trabajo en evaluaciones exigentes como SWE-bench Verified. Este es un punto de referencia que mide la capacidad de una IA para resolver problemas reales de ingeniería de software desde repositorios de GitHub.

También merece la pena destacar que el modelo IA estableció un nuevo récord en OSWorld, la suite que evalúa su capacidad para realizar tareas informáticas prácticas en el mundo real. En concreto, alcanzó una puntuación del 61,4 %, un salto significativo respecto al 42,2 % obtenido por su predecesor, Sonnet 4. Al mismo tiempo, este rendimiento lo sitúa por delante de competidores como Gemini 2.5 Pro de Google o GPT-5 en múltiples aspectos.

Estos valores posicionan el nuevo modelo por encima de competidores directos como Gemini 2.5 Pro con un 55.1% o GPT-5 con un 58.3%, según las métricas publicadas por Anthropic en su comunicado oficial.

Claude 4.5 Sonnet supera a GPT-5 Codex y GPT-5 Gemini 2.5 Pro

Llegados a este punto, un diferenciador clave es la notable mejora en la resistencia del modelo para el trabajo autónomo. Anthropic informa que Sonnet 4.5 puede operar en proyectos complejos de varios pasos durante más de 30 horas de forma continuada. Este es un avance enorme respecto a la capacidad de unas siete horas de Claude 4 Opus.

De este modo, el nuevo modelo IA demuestra un alto nivel de autonomía práctica y de largo plazo que va más allá de las tareas de codificación aisladas. Todo ello se ve respaldado por su excelente rendimiento en una amplia gama de evaluaciones que miden las habilidades matemáticas y de razonamiento.

Más que una simple actualización del modelo, el lanzamiento de Sonnet 4.5 supone un crecimiento significativo del ecosistema para desarrolladores de Anthropic. Como os comentamos antes, la compañía ha implementado un conjunto de nuevas y potentes herramientas y funciones diseñadas para que el desarrollo con Claude sea más fiable y autónomo. Se pretende abordar directamente los principales problemas de los desarrolladores en la vida real. A su vez, la experiencia del desarrollador en este sentido mejora aún más con una extensión nativa de VS Code, actualmente en versión beta y que se puede bajar desde aquí. Este complemento que os comentamos integra las capacidades de Claude Code directamente en el IDE.

Así, ofrece una interfaz gráfica más completa con una barra lateral dedicada a la IA. Todo dirigido a los desarrolladores que prefieren trabajar en su entorno gráfico habitual. Diversas pruebas demuestran que la combinación de estas herramientas mejora el rendimiento del agente en tareas complejas en un 39 %. De manera paralela reduce el consumo de tokens en un 84 %.

Fuente: softzone