Nuevo “vocabulario” y patrones agentivos en GPT-5
GPT‑5 introduce un conjunto de patrones agentivos y de gobierno de herramientas que transforman cómo diseñamos y operamos asistentes.
Los asistentes pasaron de “contestar preguntas” a actuar con autonomía controlada: buscar, decidir, llamar herramientas, escribir código, y cerrar tareas sin fricción. GPT‑5 consolida esta evolución con un lenguaje común de patrones que te ayudan a equilibrar velocidad, coste, precisión y gobernanza.
El resultado: agentes que resuelven más y preguntan menos.
Lo verdaderamente nuevo en la guía de prompting de OpenAI
Estos son los patrones que amplían (o formalizan) el kit agentivo clásico:
1) Agentic Eagerness Dial
Un dial de entusiasmo para graduar proactividad vs. deferencia. Se controla con prompts (“menos eagerness”, “más persistencia”) y con el reasoning_effort (cuánto pensar antes de actuar).
2) Tool‑Budget Governor + Escape Hatch
Presupuestos de herramientas (p. ej., ≤2 llamadas) con una salida de emergencia: permiso explícito para proceder bajo incertidumbre (“aunque no sea 100% correcto”) y mantener latencias predecibles.
3) Parallel Fan‑Out with Early‑Stop
Ventilación en paralelo para reunir contexto: lanzar consultas diversas, deduplicar y parar pronto cuando ya hay convergencia/accionabilidad. A lo sumo, un lote refinado si hay señales contradictorias.
4) Single‑Escalation Rule
Tras el primer fan‑out, solo una pasada refinada y luego actuar. Evita el bucle mental infinito de “una búsqueda más”.
5) Autonomous Completion Contract
Contrato implícito: “sigue hasta resolver por completo”. No rebotes preguntas; asume de forma razonable, ejecuta y documenta las asunciones.
6) Tool Preamble Telemetry
Mini‑narración visible en tiempo de uso de herramientas: objetivo → plan → progreso paso a paso → listo, con frecuencia/verbosidad ajustables.
7) Reasoning Continuity (Responses API)
Persistir y reutilizar el razonamiento entre turnos (p. ej., previous_response_id
) para cadenas largas más baratas, rápidas y coherentes.
8) Dual‑Knob Control: Thinking vs Output
Dos mandos separados: cuánto pensar (reasoning_effort) y cuánto decir (verbosidad). Incluso por modalidad (baja en chat, alta en herramientas de código).
9) Turn‑Scoped Subtasks
Dividir problemas extensos en subtareas por turno para ganar fiabilidad y checkpointing.
10) Environment‑Aware Autonomy
Agentes conscientes del entorno (undo/reject, dry‑run). Si saben que el error es reversible, pueden actuar con más decisión.
11) Spec‑Tagged Instruction Blocks
Bloques de instrucciones etiquetados en estilo XML para anclar adherencia y facilitar referencias cruzadas:
12) Prompt Contradiction Linter
Un linter para detectar y resolver reglas contradictorias en el prompt antes de “pensar”.
13) Tool‑Specific Risk Gates
Umbrales de incertidumbre diferenciados por herramienta (p. ej., búsqueda = permisiva; checkout/delete = estricta) y condiciones claras de stop/hand‑back.
14) Minimal‑Reasoning Scaffolding
Si activas el modo ultrarrápido (poco razonamiento), compensas con planes explícitos, preámbulos más ricos y desambiguación de herramientas.
15) Periodic Instruction Refresh
Refrescar las normas de formato/comportamiento (Markdown, estilo) cada 3–5 turnos para evitar deriva.
16) Internal Excellence Rubric (Hidden Self‑Review)
Una rúbrica privada (<self_reflection>
) para auto‑revisar y mejorar la entrega antes de emitirla.
17) Stack Defaults + Codebase Blending Rules
Opiniones por defecto para nuevos proyectos (Next.js/Tailwind/shadcn) y reglas de integración en repos existentes (nombres, estructura, estilo de diff).
18) Proactive Draft‑Then‑Approve
En colaboración técnica: hacer el cambio primero y presentarlo para aceptar/rechazar, en vez de pedir permiso para empezar.
19) Patch‑First Edit Discipline
Todas las ediciones pasan por una herramienta de parches auditables (apply_patch), verificación progresiva y serialización (una llamada por vez).
20) Authenticated Session Gate (Domain‑Ops)
Para retail/operaciones: autenticar pronto, una persona por sesión, confirmaciones explícitas antes de acciones sensibles.
21) Scope‑Guarded Handoff
Hacer handoff humano solo si la petición excede el alcance de las herramientas. Si no, persistir hasta resolver.
22) Compensatory Prompts for Low‑Reasoning
En modo de razonamiento mínimo, añadir recordatorios de persistencia y planes explícitos para recuperar profundidad sin gastar más “tokens de pensamiento”.
23) Markdown Heartbeat
Un latido ligero que reafirma acuerdos de formato para evitar deriva en hilos largos.
Qué ya está alineado con las directrices de GPT‑5
- Gobernanza del uso de herramientas y límites de decisión (cuándo navegar, cuándo no).
- Enrutamiento consciente del riesgo (búsqueda, PDFs, imágenes, widgets especializados).
- Stack defaults en frontend (Tailwind, shadcn/ui, etc.) y guía de calidad visual.
- Carriles de cumplimiento (citas, copyright, deny‑lists).
- Adherencia a instrucciones y tono (“no divagues”).
Lo que falta o está poco especificado
- Knobs de razonamiento (tuning explícito minimal/medium/high) separados de la verbosidad.
- Plantillas prescriptivas para el eagerness dial (presupuestos, early‑stop y contrato de persistencia).
- Telemetría de preámbulos (objetivo → plan → progreso → listo) con frecuencia configurable.
- Reutilización de razonamiento vía Responses API entre turnos.
- Fan‑out paralelo + única escalada como patrón explícito.
- Andamiaje para el modo de razonamiento mínimo.
- Bloques etiquetados de especificación.
- Refresco periódico de instrucciones.
- Linter de contradicciones.
Extras potentes (no en la guía, pero operativos)
- One‑Question Gate: a lo sumo una aclaración inicial; si el siguiente paso es obvio, actúa.
- Riddle/Arithmetic Skeptic Mode: más rigor en acertijos y cálculo.
- Gobernador de prosa: evita florituras; claridad compacta.
- Protocolo duro de citas y acoplamiento widget↔evidencia.
- Evidencia en PDFs (capturas por página).
- Doctrina de claridad temporal (fechas absolutas).
- No “teatro asíncrono”: nada de “estoy trabajando en segundo plano”.
- Prohibición de cierres opt‑in (“¿quieres que…?”).
- Micro‑regla de identidad y matriz de compliance para compras.
GPT‑5 no es “más de lo mismo”: trae un marco operativo para agentes que actúan con seguridad, trazabilidad y eficiencia. Si incorporas el dial de entusiasmo, presupuestos de herramientas, fan‑out con early‑stop y telemetría de preámbulos, darás un salto inmediato en resolutividad y experiencia de usuario. Completa con reasoning continuity, risk gates y refrescos periódicos y estarás listo para escalar.
Información basada en la publicación de Carlos E. Perez en Twitter/X basada en la de Pliny the Liberator.