Por qué la enciclopedia se volvió más importante que el sitio web para la máquina
Cuando una empresa piensa en su visibilidad en internet, Wikipedia no suele entrar en la lista de prioridades. Es comprensible: un artículo en Wikipedia parece algo secundario frente al sitio web propio, el blog, la publicidad o el SEO. Pero para los sistemas de respuestas la jerarquía es muy distinta.
El análisis de 680 millones de citaciones de ChatGPT entre agosto de 2024 y junio de 2025 mostró que, dentro del top 10 de las fuentes más citadas, Wikipedia representa casi la mitad: el 47,9 % [1]. No es casualidad. Todos los grandes modelos lingüísticos —ChatGPT, Gemini, Claude, Llama— se entrenaron con corpus en los que Wikipedia recibió deliberadamente un peso mayor. El dataset Google C4, uno de los principales conjuntos de entrenamiento, aumentó de forma intencionada la proporción de Wikipedia frente a otras fuentes web [2]. Y en junio de 2025 ChatGPT se convirtió en la principal fuente de tráfico hacia Wikipedia: surgió así un bucle simbiótico en el que la IA cita a la enciclopedia y los usuarios vuelven a ella a través de los enlaces [3].
Para una marca esto significa algo muy concreto: si una empresa tiene una página de calidad en Wikipedia, el sistema de respuestas obtiene una fuente fiable, neutral y verificada para identificar la entidad. Si esa página no existe, el modelo se ve obligado a reunir la información a partir de fuentes menos estructuradas y menos autorizadas, y el resultado será menos preciso.
Wikidata: el pasaporte legible por máquina de la marca
Wikipedia es una enciclopedia textual para personas. Wikidata es una base de datos estructurada para máquinas. Cada entrada en Wikidata tiene un identificador único (Q-ID), que se usa para vincular una entidad de manera inequívoca. Google Knowledge Graph se alimenta directamente de los datos de Wikidata [4]. Cuando un sistema de respuestas se encuentra con el nombre de una marca, primero comprueba si existe una entrada para ella en el grafo de conocimiento; ahí es precisamente donde Wikidata se convierte en un eslabón crítico.
A diferencia de Wikipedia, Wikidata no tiene requisitos estrictos de «notabilidad» (notability). Una empresa que no puede conseguir un artículo en Wikipedia por falta de cobertura mediática suficiente puede, aun así, crear una entrada en Wikidata: indicar el tipo de organización, el sector, el fundador, los productos y el sitio web oficial. Eso basta para dar a la máquina un identificador estable y un conjunto de atributos básicos.
Las marcas sin entrada en Wikidata tienen una desventaja estructural. El sistema de respuestas comprueba primero si la entidad existe en el grafo de conocimiento y luego decide si merece la pena citar el contenido del sitio web. Si esa comprobación no se supera, el modelo será más prudente en sus recomendaciones o incluso dejará la marca completamente de lado [5].
Knowledge Graph: el mapa con el que se orienta la IA
Google Knowledge Graph no es un producto independiente, sino una capa de infraestructura sobre la que se construyen Knowledge Panel, AI Overviews y AI Mode. Contiene miles de millones de entidades y billones de relaciones entre ellas. Cuando un usuario formula una pregunta, la IA no se limita a buscar documentos relevantes: primero identifica las entidades a través del grafo de conocimiento y después selecciona las fuentes para la respuesta.
Para una marca, esto significa que entrar en Knowledge Graph no es un bonus, sino un fundamento. Sin él, el sistema de respuestas tiene que gastar recursos computacionales adicionales para entender quién es usted. Los investigadores llaman a esto «presupuesto de comprensión» (comprehension budget): cuanto menos le cuesta a la máquina identificar su entidad, mayor es la probabilidad de citación [5].
Qué hacer ahora mismo
Comprobar la presencia de la marca en Wikidata (wikidata.org). Si no existe entrada, crearla indicando las propiedades básicas: P31 (tipo de entidad), P452 (sector), P856 (sitio web oficial), P112 (fundador). Esto lleva entre 15 y 30 minutos y no requiere conocimientos técnicos.
Si la marca cumple los criterios de notabilidad de Wikipedia, preparar o mejorar el artículo. Si no los cumple, no forzar el proceso: Wikidata ya proporciona un nivel básico de identificación. Asegurarse de que el marcado de Schema.org en el sitio web (Organization, sameAs) remite al Q-ID de Wikidata y a otros perfiles oficiales. Esto crea un circuito cerrado de identificación que el grafo de conocimiento puede verificar con mayor facilidad.
Mantener la consistencia: el nombre, la descripción y la categoría de la marca deben ser los mismos en Wikidata, en el sitio web, en Google Business Profile y en todos los catálogos externos.
Wikipedia es la fuente más citada por ChatGPT y la segunda más frecuente entre todos los LLM. Wikidata alimenta directamente a Google Knowledge Graph. Las marcas con una entrada en Wikidata tienen una ventaja estructural en la identificación de la entidad por parte de los sistemas de respuestas.
El peso exacto de Wikipedia/Wikidata frente a otras señales de confianza varía según la plataforma y no se revela por completo. Tener una página en Wikipedia no garantiza la citación: la calidad y la actualidad del artículo también importan.
Crear o mejorar una entrada en Wikidata es una de las formas más rápidas y económicas de reforzar la identificación de la marca por parte de la máquina. Es una acción de la categoría «15 minutos de trabajo con un efecto potencialmente duradero».
Fuentes
Materiales relacionados
Autoridad externa frente al sitio web propio: qué fuentes forman realmente el derecho de la marca a ser recomendada
Qué señales externas y fuentes independientes ayudan a la marca a obtener el derecho de ser recomendada en respuestas de IA — y por qué el sitio propio sin ellas no es suficiente.
Abrir material →Mapa práctico de acciones: cómo reforzar la distinguibilidad de máquina de la marca
Seis pasos secuenciales para mejorar la visibilidad en IA: desde la verificación de identidad, pasando por la reconfiguración del lenguaje y el contorno de confianza, hasta la observación.
Abrir material →Cómo se relaciona esto con AI100 en la práctica
Si necesita no una visión general sino un diagnóstico específico para su marca, AI100 permite verificar cómo el modelo ve la empresa en escenarios neutrales de elección, qué competidores se posicionan más arriba y qué mejoras tienen mayor probabilidad de aumentar la visibilidad.
Ver informe de muestra