Claude 4

Claude 4: nueva generación IA de Anthropic

El jueves 22 de mayo de 2025, Anthropic presentó su nueva generación de modelos Claude: Claude Opus 4 y Claude Sonnet 4.

Ambos moldeos establecen nuevos estándares en programación, razonamiento avanzado y agentes de IA.

Claude Opus 4 es el mejor modelo de programación del mundo, con un rendimiento sostenido en tareas complejas y de larga duración, así como en flujos de trabajo de agentes.

Claude Sonnet 4 representa una mejora significativa respecto a Claude Sonnet 3.7, ofreciendo una codificación y razonamiento superiores, además de responder con mayor precisión a tus instrucciones.

Junto a los dos modelos nuevos, también se anunció:

  • Pensamiento extendido con uso de herramientas: Ambos modelos pueden utilizar herramientas —como búsquedas web— durante procesos de pensamiento extendido, lo que permite a Claude alternar entre razonamiento y uso de herramientas para mejorar sus respuestas.
  • Nuevas capacidades del modelo: Ambos modelos pueden usar herramientas en paralelo, seguir instrucciones con mayor precisión y, cuando los desarrolladores les dan acceso a archivos locales, demuestran capacidades de memoria significativamente mejoradas, extrayendo y guardando hechos clave para mantener la continuidad y construir conocimiento tácito con el tiempo.
  • Claude Code ya está disponible de forma general: Tras recibir comentarios muy positivos durante la vista previa de investigación, ampliamos las formas en que los desarrolladores pueden colaborar con Claude. Claude Code ahora admite tareas en segundo plano mediante GitHub Actions e integraciones nativas con VS Code y JetBrains, mostrando las ediciones directamente en tus archivos para una programación en pareja fluida.
  • Nuevas capacidades de API: Cuatro nuevas funciones en la API de Anthropic que permiten a los desarrolladores crear agentes de IA más potentes: herramienta de ejecución de código, conector MCP, API de archivos y la capacidad de almacenar en caché prompts durante hasta una hora.

Modelos híbridos

Claude Opus 4 y Sonnet 4 son modelos híbridos que ofrecen dos modos: respuestas casi instantáneas y pensamiento extendido para un razonamiento más profundo.

Los planes Pro, Max, Team y Enterprise de Claude incluyen ambos modelos y pensamiento extendido, con Sonnet 4 también disponible para usuarios gratuitos.

Ambos modelos están disponibles en la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud. Los precios se mantienen consistentes con los modelos anteriores de Opus y Sonnet:

  • Opus 4 a $15/$75 por millón de tokens (entrada/salida).
  • Sonnet 4 a $3/$15 por millón de tokens (entrada/salida).

Claude 4

Claude Opus 4 es el modelo más potente de Anthropic y el mejor modelo de programación del mundo, liderando en SWE-bench (72.5%) y Terminal-bench (43.2%). Ofrece un rendimiento sostenido en tareas de larga duración que requieren esfuerzo concentrado y miles de pasos, con la capacidad de trabajar continuamente durante varias horas, superando dramáticamente a todos los modelos Sonnet y expandiendo significativamente lo que los agentes de IA pueden lograr.

Claude Opus 4

Claude Opus 4 sobresale en programación y resolución de problemas complejos, impulsando productos de agentes de vanguardia.

  • Cursor lo llama el estado del arte en programación y un avance en la comprensión de bases de código complejas.
  • Replit informa una mayor precisión y avances dramáticos en cambios complejos en múltiples archivos.
  • Block lo llama el primer modelo en mejorar la calidad del código durante la edición y depuración en su agente, nombre en clave goose, manteniendo el rendimiento y la fiabilidad completos.
  • Rakuten validó sus capacidades con una refactorización de código abierto exigente que se ejecutó de forma independiente durante 7 horas con un rendimiento sostenido.
  • Cognition señala que Opus 4 sobresale en la resolución de desafíos complejos que otros modelos no pueden, manejando con éxito acciones críticas que los modelos anteriores han pasado por alto.

Claude Sonnet 4

Claude Sonnet 4 mejora significativamente las capacidades líderes en la industria de Sonnet 3.7, sobresaliendo en programación con un 72.7% en SWE-bench. El modelo equilibra rendimiento y eficiencia para casos de uso internos y externos, con una mayor capacidad de dirección para un mayor control sobre las implementaciones. Aunque no iguala a Opus 4 en la mayoría de los dominios, ofrece una mezcla óptima de capacidad y practicidad.

  • GitHub dice que Claude Sonnet 4 sobresale en escenarios agénticos y lo presentará como el modelo que impulsa el nuevo agente de programación en GitHub Copilot.
  • Manus destaca sus mejoras en seguir instrucciones complejas, razonamiento claro y resultados estéticos.
  • iGent informa que Sonnet 4 sobresale en el desarrollo autónomo de aplicaciones con múltiples características, así como en la resolución de problemas y navegación de bases de código, reduciendo los errores de navegación del 20% a casi cero.
  • Sourcegraph dice que el modelo muestra promesas como un avance sustancial en el desarrollo de software, manteniéndose en el camino por más tiempo, entendiendo los problemas más profundamente y proporcionando una calidad de código más elegante.
  • Augment Code informa tasas de éxito más altas, ediciones de código más precisas y un trabajo más cuidadoso en tareas complejas, convirtiéndolo en la mejor opción para su modelo principal.

Opus 4 empuja los límites en programación, investigación, escritura y descubrimiento científico, mientras que Sonnet 4 lleva el rendimiento de vanguardia a casos de uso cotidianos como una mejora instantánea de Sonnet 3.7.

Los modelos Claude 4 lideran en SWE-bench Verified, un benchmark que evalúa el rendimiento en tareas reales de ingeniería de software. Consulta el apéndice para más información sobre la metodología.
Los modelos Claude 4 lideran en SWE-bench Verified, un benchmark que evalúa el rendimiento en tareas reales de ingeniería de software. Consulta el apéndice para más información sobre la metodología.

Mejoras del modelo

Además del pensamiento extendido con uso de herramientas, la ejecución paralela de herramientas y las mejoras de memoria, se ha reducido significativamente el comportamiento en el que los modelos utilizan atajos para completar tareas. Ambos modelos tienen un 65 % menos de probabilidad de incurrir en este comportamiento en comparación con Sonnet 3.7 en tareas agénticas especialmente susceptibles a este tipo de estrategias.

Claude Opus 4 también supera de forma notable a todos los modelos anteriores en capacidades de memoria. Cuando los desarrolladores crean aplicaciones que permiten a Claude acceder a archivos locales, Opus 4 se vuelve experto en crear y mantener “archivos de memoria” para almacenar información clave. Esto permite una mejor conciencia de tareas a largo plazo, mayor coherencia y mejor rendimiento en tareas de agentes, como cuando Opus 4 crea una “Guía de navegación” mientras juega a Pokémon.

Memoria: Cuando se le da acceso a archivos locales, Claude Opus 4 registra información clave para ayudar a mejorar su rendimiento en el juego. Las notas mostradas arriba son notas reales tomadas por Opus 4 mientras jugaba a Pokémon.
Memoria: Cuando se le da acceso a archivos locales, Claude Opus 4 registra información clave para ayudar a mejorar su rendimiento en el juego. Las notas mostradas arriba son notas reales tomadas por Opus 4 mientras jugaba a Pokémon.

Finalmente, se han introducido resúmenes de pensamiento para los modelos Claude 4, que utilizan un modelo más pequeño para condensar procesos de pensamiento extensos. Esta condensación solo es necesaria aproximadamente el 5 % del tiempo, ya que la mayoría de los procesos de pensamiento son lo suficientemente breves como para mostrarse completos. Los usuarios que necesiten cadenas de pensamiento sin procesar para ingeniería de prompts avanzada pueden contactar con el equipo de ventas para acceder al nuevo Modo Desarrollador y conservar el acceso completo.

Claude Code

Claude Code lleva el poder de Claude a más partes de tu flujo de trabajo de desarrollo: en el terminal, tus IDEs favoritos y ejecutándose en segundo plano con el SDK de Claude Code.

Nuevas extensiones para VS Code y JetBrains integran Claude Code directamente en tu IDE. Las ediciones propuestas por Claude aparecen en línea en tus archivos, agilizando la revisión y el seguimiento dentro de la interfaz familiar del editor. Simplemente ejecuta Claude Code en el terminal de tu IDE para instalar.

Más allá del IDE, se está lanzando un SDK extensible de Claude Code, para que puedas construir tus propios agentes y aplicaciones usando el mismo agente central que Claude Code.

Un gran paso hacia el colaborador virtual

Estos modelos son un gran paso hacia el colaborador virtual, manteniendo el contexto completo, sosteniendo el enfoque en proyectos más largos y generando un impacto transformador. Vienen con pruebas y evaluaciones extensivas para minimizar riesgos y maximizar la seguridad, incluyendo la implementación de medidas para niveles de seguridad de IA más altos como ASL-3.

¿Quieres saber más sobre las soluciones de inteligencia artificial generativa de Microsoft? En DQS/ te asesoramos. ¿Por qué no nos preguntas cómo podemos ayudarte?

Información basada en la publicación oficial «Introducing Claude 4 \ Anthropic.

Publicaciones Similares

¿Te ha parecido interesante? ¿Tienes dudas sobre el contenido?
Para cualquier pregunta ponte en contacto conmigo.