¿Qué buscadores de IA desvirtúan la analítica web?

El problema de medición del tráfico desde la IA generativa

Los motores de búsqueda generativos (como ChatGPT, Perplexity o Gemini) están afectando a la precisión de las herramientas de analítica web.

El problema de los motores de búsqueda de la inteligencia artificial generativa es que muchos de ellos no transmiten correctamente (o directamente no la transmiten) la información de referencia (referrer) cuando los usuarios hacen clic en enlaces de sus resultados.

¿Qué buscadores de IA generativa atribuyen correctamente la información de referencia?

Atribución correcta

  • Copilot (WEB)
  • Perplexity (WEB)
  • Claude
  • Meta AI
  • Mistral

Atribución con matices

  • ChatGPT
  • Gemini
  • DeepSeek

Sin atribución

  • Copilot (Windows)
  • Perplexity (Desktop)
  • Grok

Análisis por buscador de IA

🔍 ChatGPT (OpenAI)

  • Tráfico generado: Es el principal generador de tráfico desde motores de IA, representando aproximadamente el 50% del total.
  • En general, ChatGPT transmite correctamente la información de referencia, lo que permite a las herramientas de analítica web rastrear el origen del tráfico.
    • Los enlaces dentro del contenido en la cuenta de pago de ChatGPT tienen un atributo noreferrer. Esto impide que se envíe el valor del «referrer«. En Google Analytics, se clasificaría como tráfico Directo, porque agrupa el tráfico de fuentes desconocidas y el tráfico interno del sitio web como Directo.
    • Lo interesante es que, al observar el mismo tipo de enlace en una cuenta gratuita, este no tenía el atributo noreferrer y por tanto se rastrea correctamente.
    • Las listas de enlaces se rastrean correctamente.
    • Los enlaces a las fuentes dentro del contenido y al final de la respuesta también se rastrean correctamente, y además añaden un parámetro de URL “?utm_source=chatgpt.com” a las URLs.
    • La mayoría de los enlaces en el modo de Búsqueda Web tienen el «referrer» pero a veces cuando hay múltiples referencias, solo la primera lo tiene; las demás no.
    • En el modo DeepResearch, los enlaces dentro del contenido se atribuyeron correctamente, pero las fuentes al final estaban marcadas con noreferrer.

🧠 Perplexity

  • Tráfico generado: Aporta alrededor del 30.7% del tráfico desde motores de IA, situándose como el segundo más importante.
  • Al igual que ChatGPT, Perplexity transmite adecuadamente la información de referencia.

🌐 Google Gemini

  • Tráfico generado: Representa aproximadamente el 17.6% del tráfico desde motores de IA, ocupando el tercer lugar.
  • Existen problemas con la transmisión de la información de referencia, lo que dificulta el rastreo del tráfico en las herramientas de analítica web.
    • La mayoría de los enlaces contextuales y citados dentro de Gemini sí incluían el referente (referrer).
    • La única excepción fue la sección “Researching websites” en el modo Deep Research. Estos están marcados con noreferrer.
    • El nuevo modo de IA en la Búsqueda de Google, que también está impulsado por Gemini, también está marcado con noreferrer. John Mueller, de Google, ha confirmado que se trata de un error y que probablemente lo corregirán. UPDATE: El 29 de mayo de 2025, parece que se ha corregido este error y el referrer se pasa correctamente.

🤖 Copilot (Microsoft)

  • Tráfico generado: A pesar de su integración con el navegador Edge y su capacidad para citar fuentes, Copilot genera menos del 2% del tráfico desde motores de IA.
  • Se ha observado una disminución en la visibilidad del tráfico proveniente de Copilot, posiblemente debido a cambios en la forma en que se transmite la información de referencia.

🧭 Deepseek

  • Tráfico generado: Deepseek está dentro del conjunto de otras IAs junto a Claude, Jasper, Mistral, etc que en conjunto representan menos del 2% del tráfico desde motores de IA.
  • El modo normal de DeepSeek y Deep Research no transmite la información de referencia (referrer). En el caso de la búsqueda web, las citas individuales sí transmiten el referrer, pero los enlaces al final, no.

Problema de tráfico «invisible»

Al analizar los filtros de tráfico de modelos de lenguaje se nota la ausencia de datos provenientes de motores generativos comunes. Esto se debe a que muchos de estos sistemas eliminan o no proporcionan el valor de referencia («referrer»), lo que impide a las herramientas de analítica web rastrear adecuadamente el origen del tráfico. Este problema, inicialmente observado con el modo de IA de Google, es común entre los motores generativos.

Impacto en la analítica web

La falta de información de referencia significa que el tráfico proveniente de estos motores se clasifica como «directo» o «desconocido» en las herramientas de analítica, lo que dificulta a los propietarios de sitios web comprender y medir el impacto real de estos motores en su tráfico. Esto también afecta la capacidad de evaluar la calidad del tráfico y tomar decisiones informadas sobre estrategias de contenido y marketing.

Contrato social entre motores y sitios web

Existe un «contrato social» entre los motores de búsqueda y los propietarios de sitios web: los motores deben proporcionar tráfico a cambio de poder rastrear y utilizar el contenido de los sitios. Si los motores generativos no cumplen con esta parte del acuerdo al no proporcionar información de referencia, los propietarios de sitios podrían optar por bloquear el acceso de estos motores a sus contenidos.

Conclusión

Necesidad urgente de que los motores de búsqueda generativos mejoren la transparencia y proporcionen datos precisos de referencia para mantener una relación beneficiosa con los propietarios de sitios web. Sin esta transparencia, los sitios web podrían restringir el acceso a sus contenidos, lo que afectaría la calidad y diversidad de la información disponible para los usuarios de estos motores.

¿Quieres saber más sobre las soluciones de inteligencia artificial generativa de Microsoft? En DQS/ te asesoramos. ¿Por qué no nos preguntas cómo podemos ayudarte?

Información basada en la publicación en Twitter/X de Patrick Stox (I’ve been called Mr. Technical SEO & the technical SEOs’ technical SEO): «Generative Engines Are Breaking Web Analytics and Hurting Their Future».

Publicaciones Similares

¿Te ha parecido interesante? ¿Tienes dudas sobre el contenido?
Para cualquier pregunta ponte en contacto conmigo.