OpenAI AgentKit: ecosistema para construir agentes de IA

OpenAI AgentKit: ecosistema para construir agentes de IA

OpenAI AgentKit es una plataforma integral que permite a los desarrolladores construir, desplegar y optimizar agentes de IA.

El 6 de octubre de 2025, OpenAI ha lanzado AgentKit, un conjunto completo de herramientas para desarrolladores y empresas que permite crear, implementar y optimizar agentes. Hasta ahora al usar las herramientas de OpenAI, construir agentes implicaba lidiar con herramientas fragmentadas: orquestación compleja sin control de versiones, conectores personalizados, pipelines de evaluación manuales, ajuste de prompts y semanas de trabajo en frontend antes del lanzamiento. Con AgentKit, los desarrolladores ahora pueden diseñar flujos de trabajo de forma visual e integrar interfaces agenticas más rápido usando nuevos bloques como:

  • Agent Builder: un lienzo visual para crear y versionar flujos de trabajo multiagente.
  • Connector Registry: un lugar central para que los administradores gestionen cómo se conectan los datos y herramientas en los productos de OpenAI.
  • ChatKit: un conjunto de herramientas para integrar experiencias de agentes basadas en chat, personalizables, dentro de tu producto.

También se están ampliando las capacidades de evaluación con nuevas funciones como conjuntos de datos, calificación de trazas, optimización automática de prompts y compatibilidad con modelos de terceros para medir y mejorar el rendimiento de los agentes.

Desde el lanzamiento de la Responses API y el Agents SDK en marzo, los desarrolladores y empresas han creado flujos de trabajo agenticos de extremo a extremo para investigación profunda, atención al cliente y más.

Recalcar que esto es algo que ya tenemos en Microsoft Copilot Studio desde hace tiempo pero en OpenAI es una novedad.

Diseña flujos de trabajo con Agent Builder

A medida que los flujos de trabajo de agentes se vuelven más complejos, los desarrolladores necesitan una visibilidad más clara de cómo funcionan. Agent Builder ofrece un lienzo visual para componer lógica con nodos de arrastrar y soltar, conectar herramientas y configurar reglas personalizadas. Admite ejecuciones de prueba, configuración de evaluación integrada y control de versiones completo, ideal para iteraciones rápidas.

Los creadores pueden empezar con un lienzo en blanco o con plantillas predefinidas.
Los creadores pueden empezar con un lienzo en blanco o con plantillas predefinidas.

OpenAI también está lanzando un Connector Registry para que las empresas puedan gobernar y mantener datos en múltiples espacios de trabajo y organizaciones. El Connector Registry consolida las fuentes de datos en un único panel de administración para ChatGPT y la API. El registro incluye todos los conectores predefinidos como Dropbox, Google Drive, SharePoint y Microsoft Teams, así como MCPs de terceros.

Los desarrolladores también pueden habilitar Guardrails en Agent Builder: una capa de seguridad modular y de código abierto que ayuda a proteger a los agentes contra comportamientos no deseados o maliciosos. Guardrails puede enmascarar o marcar información personal (PII), detectar intentos de jailbreak y aplicar otras medidas de protección, facilitando la creación e implementación de agentes seguros y fiables. Guardrails se puede desplegar de forma independiente o mediante la librería guardrails para Python y JavaScript.

Integra experiencias de chat agenticas con ChatKit

Implementar interfaces de chat para agentes puede ser sorprendentemente complejo: gestionar respuestas en streaming, manejar hilos, mostrar el razonamiento del modelo y diseñar experiencias atractivas dentro del chat. ChatKit1 simplifica la integración de agentes basados en chat que se sienten nativos en tu producto. Se puede incrustar en aplicaciones o sitios web y personalizar para que coincida con tu tema o marca.

Mide el rendimiento de los agentes con las nuevas capacidades de Evals

Crear agentes fiables y listos para producción requiere evaluaciones de rendimiento rigurosas. El año OpenAI lanzó Evals para ayudar a los desarrolladores a probar prompts y medir el comportamiento del modelo. Ahora se añaden cuatro nuevas capacidades que facilitan aún más la creación de evaluaciones:

  • Datasets: crea rápidamente evaluaciones de agentes desde cero y amplíalas con el tiempo mediante calificadores automáticos y anotaciones humanas.
  • Trace grading: realiza evaluaciones de extremo a extremo de flujos de trabajo agenticos y automatiza la calificación para identificar deficiencias.
  • Optimización automática de prompts: genera prompts mejorados basados en anotaciones humanas y resultados de los calificadores.
  • Compatibilidad con modelos de terceros: evalúa modelos de otros proveedores dentro de la plataforma OpenAI Evals.

Ya se han visto mejoras significativas en el rendimiento gracias al uso de Evals.

Conjuntos de datos
Conjuntos de datos
Prompts optimizados
Prompts optimizados
Evaluación de trazas
Evaluación de trazas

Impulsa el rendimiento de los agentes con ajuste fino por refuerzo

El ajuste fino por refuerzo (RFT – Reinforcement fine-tuning⁠) permite a los desarrolladores personalizar los modelos de razonamiento de OpenAI. Está disponible de forma general en OpenAI o4-mini y en beta privada para GPT‑5.

Hay dos nuevas funciones de RFT diseñadas para llevar el rendimiento de los agentes aún más lejos:

  • Llamadas a herramientas personalizadas: entrena modelos para que llamen a las herramientas correctas en el momento adecuado para mejorar el razonamiento.
  • Calificadores personalizados: establece criterios de evaluación adaptados a lo que más importa en tu caso de uso.

¿Quieres saber más sobre las soluciones de inteligencia artificial generativa de Microsoft? En DQS/ te asesoramos. ¿Por qué no nos preguntas cómo podemos ayudarte?

Información basada en la publicación de OpenAI: «Introducing AgentKit | OpenAI«

  1. ChatKit es la mejor forma de crear experiencias de chat agenticas. Tanto si estás desarrollando un asistente para la base de conocimiento interna, un ayudante para incorporación de RR. HH., un compañero de investigación, un asistente de compras o programación, un bot de resolución de problemas, un asesor de planificación financiera o un agente de soporte, ChatKit ofrece un chat incrustado personalizable que gestiona todos los detalles de la experiencia del usuario.
    Utiliza los widgets de interfaz incrustables de ChatKit, prompts personalizables, soporte para invocación de herramientas, adjuntos de archivos y visualizaciones del razonamiento en cadena para crear agentes sin tener que reinventar la interfaz de chat. ↩︎
Resume o comparte este contenido a través de:

Publicaciones Similares

¿Te ha parecido interesante? ¿Tienes dudas sobre el contenido?
Para cualquier pregunta ponte en contacto conmigo.