¿Crees que la IA puede ver todo tu sitio web?
Un análisis de qué tipo de contenido puede ver ChatGPT en las páginas web que usa en sus respuestas.
AISO hizo una auditoría técnica integral que revela las capacidades y limitaciones de recuperación web de ChatGPT, con recomendaciones prácticas para optimizar tu sitio web para su descubrimiento por parte de la IA.
Este es el resumen de lo que descubrieron:
- ⛔ El contenido que depende de JavaScript (como pestañas, acordeones, etc.) no es accesible.
- ⛔ El texto dentro de imágenes es prácticamente invisible.
- ⚠️ El texto blanco sobre fondo blanco puede ser usado para spam (aunque recuerda que los vacíos legales se cierran, pero el spam queda registrado).
- 🕷️ Solo se siguen los enlaces cuyos títulos sean semánticamente relevantes para la consulta.
Y esto refuerza la importancia de las buenas prácticas de SEO ya existentes:
- ✅ Renderizado del lado del servidor = éxito
- ✅ Usa entidades con nombre en los títulos
En detalle
Esto fue lo que se descubrió analizando 41 millones de prompts de IA:
- La IA usa sus propias fuentes. Herramientas como ChatGPT, Perplexity y Copilot prefieren plataformas como Wikipedia, Reddit o Forbes — no necesariamente los sitios con más backlinks o tráfico.
- La IA es perezosa — le encantan las listas y los resúmenes. Piensa en formatos como:
- “Las 10 mejores herramientas para…”
- “La diferencia entre X y Y”
- Tablas comparativas rápidas o FAQs
- Mantén tu contenido actualizado: el contenido fresco tiene más visibilidad.
- SEO para Bing ≠ SEO para ChatGPT porque solo hay un 26% de coincidencia entre los resultados de Bing y ChatGPT.
- Eso si, si tu sitio no está indexado en Bing, no aparecerás en ChatGPT. Punto.
- JavaScript = invisible para los rastreadores de IA. Si tu contenido clave está dentro de JavaScript, las herramientas de IA no lo verán. Asegúrate de que el contenido importante esté en HTML.
- Usa llms.txt. Ayuda a los rastreadores de IA a entender mejor la estructura de tu sitio web — piensa en ello como un robots.txt, pero para modelos de lenguaje.
- Las URLs semánticas ganan. Al comparar enlaces, ChatGPT prefiere los que son claros y descriptivos:
- ✅ ejemplo.com/chatgpt-vs-bard
- 🚫 ejemplo.com/page123
La IA no rederiza Javascript
¿El contexto? La IA no puede renderizar JavaScript — igual que Google antes de 2019.
- ❓ ¿Puede (ChatGPT) renderizar JavaScript?
- ❗ Respuesta corta: No.
CChatGPT no puede renderizar JavaScript como un navegador; esto es lo que puede analizar de un sitio web:
- ✅ Código fuente HTML
- ✅ Metaetiquetas, enlaces, datos estructurados
- ✅ Contenido visible incrustado en el HTML
Pero si tu contenido se carga dinámicamente con JavaScript, no lo podrá ver — a menos que haya una versión renderizada (como HTML guardado o una captura de pantalla), o se usen herramientas como Puppeteer o Playwright para pre-renderizar y compartir el resultado.
Esto también aplica a Gemini y otros LLMs.
👨💻 Así que sí — a los desarrolladores esto les encantará (o no 😅).
Pero ya hemos pasado por esto. Google no rastreaba JS por defecto hasta hace poco. Ahora las herramientas de IA están siguiendo la misma curva de evolución.
Configuración básica de contenido amigable con IA
Aquí tienes una lista de verificación para optimizar el contenido de tu sitio web para descubrimiento y visibilidad en IA:
- Haz que el contenido sea accesible (sin depender de JavaScript)
✅ Mantén el contenido clave directamente en HTML
✅ Evita ocultar información valiosa detrás de pestañas, acordeones o scripts - Usa estructura HTML semántica
✅ Usa encabezados (,, etc.) para estructurar
✅ Incluye metaetiquetas descriptivas (título, descripción)
✅ Añade marcado schema donde sea relevante (FAQ, How-To, Organización) - Mantén URLs limpias y descriptivas
✅ Mejor: /crm-vs-automatizacion-marketing
🚫 Evita: /page?id=456 - Usa pre-renderizado si es necesario
Si tu sitio usa frameworks pesados en JS (como React o Angular), considera pre-renderizar o usar renderizado del lado del servidor. - Crea un archivo llms.txt
✅ Usa llms.txt para dirigir a los rastreadores de IA hacia tu contenido más relevante, estático y útil
✅ Ejemplo: enlaza directamente a páginas de FAQ, información de empresa, desgloses de servicios - Los mecanismos de respaldo importan y si no tienes llms.txt:
👉 La IA probablemente revisará robots.txt
👉 Luego seguirá sitemap.xml
👉 Luego rastreará enlaces internos
Así que incluso sin llms.txt, los fundamentos del SEO técnico siguen ayudando — pero ahora es momento de ser más intencional.
Para reflexionar
llms.txt no es solo una configuración técnica — es una oportunidad estratégica.
Puedes ayudar a la IA a evitar rastrear páginas irrelevantes o temporales.
Guía a los LLMs hacia contenido que sea:
- útil
- confiable
- representativo de tu marca
Consejo 1: revisa los logs de tu servidor
Mira si los LLMs ya están accediendo a tu sitio.
Bots como PerplexityBot o GPTBot de OpenAI podrían estar apareciendo más de lo que crees.
Consejo 2: mide el tráfico de IA en GA4
Agrega IA como fuente de tráfico con esta expresión regular:
^.*ai|.*\.openai.*|.*copilot.*|.*chatgpt.*|.*gemeni.*|.*claude.*$
El contenido que debes destacar
Empieza con esta base:
- ✔️ Información general sobre tu empresa (qué, quién, dónde, cómo)
- ✔️ Preguntas y respuestas (estilo FAQ)
- ✔️ Desglose y comparativas de servicios
- ✔️ Resúmenes y guías (listas top 5, pros y contras, etc.)
Si tu sitio responde bien a esas preguntas —y la IA puede encontrarlas y leerlas— estarás muy por delante del resto.
Información basada en la publicación de GETAISO: «What ChatGPT Can (and Cannot) See on Your Website: A Comprehensive Audit«