Cinco mercados en lugar de uno
El artículo «Idioma y geografía de la visibilidad» analiza los mecanismos a través de los cuales el idioma influye en la visibilidad. Aquí miramos el fenómeno desde el ángulo opuesto: de los datos a la conclusión. Es decir, qué ocurre exactamente con una marca concreta y sus competidores cuando se cambia de idioma.
Elegimos Notion, un producto de productividad reconocido a escala global. Lo hicimos a propósito: necesitábamos una marca que el modelo conociera con certeza, para descartar la explicación de «simplemente hay pocos datos». Cinco ejecuciones, cinco idiomas, un modelo, un corpus de escenarios.
La puntuación de Notion osciló de forma moderada: de 62.9 en francés a 75.7 en alemán, con una dispersión de 12.8 puntos. Los intervalos de confianza de las ejecuciones se solapan parcialmente. Si nos hubiéramos detenido aquí, la conclusión habría sido serena: «pequeñas oscilaciones, posiblemente ruido del modelo».
Pero miramos a los competidores.
Matriz competitiva: la prueba principal
| Marca | RU | EN | ES | FR | DE | Dispersión |
|---|---|---|---|---|---|---|
| Notion (objetivo) | 71.2 | 68.8 | 69.1 | 62.9 | 75.7 | 12.8 |
| Slack | 0.0 | 51.0 | 53.8 | 54.3 | 54.9 | 54.9 |
| Monday.com | 47.4 | 30.5 | 29.0 | 7.8 | 13.0 | 39.5 |
| Asana | 70.1 | 52.6 | 51.1 | 39.7 | 59.1 | 30.4 |
| Microsoft Copilot | 36.2 | 39.9 | 42.8 | 51.1 | 24.8 | 26.3 |
| ClickUp | 67.3 | 59.6 | 63.1 | 54.5 | 62.7 | 12.8 |
| Coda | 46.0 | 46.7 | 38.4 | 41.1 | 43.6 | 8.2 |
| Airtable | 33.5 | 37.5 | 30.5 | 28.3 | 40.4 | 12.1 |
| Confluence | 22.3 | 13.2 | 16.6 | 24.0 | 20.6 | 10.8 |
La dispersión de Notion es 12.8. La de Slack, 54.9. Monday.com, 39.5. Asana, 30.4. Son cinco paisajes competitivos distintos condensados en una sola tabla.
Tres patrones que observamos
Desaparición binaria: Slack
En ruso, Slack obtiene una puntuación de 0.0: el modelo no lo menciona en absoluto en el contexto de la productividad y las herramientas de espacio de trabajo. En los otros cuatro idiomas, el resultado es estable: 51–55 puntos, con una dispersión de solo 3.8 puntos. Esa estabilidad en cuatro idiomas, frente a un cero absoluto en el quinto, es un argumento sólido a favor de que se trata de una propiedad estable del campo rusófono y no de un valor atípico aleatorio.
La explicación, muy probablemente, está en los datos de entrenamiento: Slack se discute activamente en fuentes en inglés, francés y alemán como herramienta de trabajo en equipo. En ruso, prácticamente no. El modelo no perdió su conocimiento sobre Slack; en este contexto, nunca llegó a adquirirlo.
Gradiente de desaparición: Monday.com
Monday.com muestra un descenso progresivo de 47.4 en ruso a 7.8 en francés. Es un tercer patrón, distinto tanto de la estabilidad de Notion como del cambio binario de Slack. La marca parece desvanecerse a medida que pasa de un campo lingüístico a otro: mantiene presencia, pero pierde peso.
Inversión: Microsoft Copilot
Donde Notion es más fuerte (alemán: 75.7), Copilot es más débil (24.8). En francés ocurre lo contrario: Notion 62.9, Copilot 51.1. Las dos marcas parecen estar en un balancín, y el idioma determina cuál queda arriba. Según nuestras observaciones, esto puede estar relacionado con la actividad de Microsoft en los mercados francófonos europeos, pero los datos no bastan para afirmarlo con seguridad.
El conocimiento es estable; la recomendación, no
Un análisis independiente de nuestros datos reveló una regularidad que, probablemente, es más importante que la propia matriz de competidores.
Cuando la marca ya aparece nombrada en el prompt (modo diagnóstico), el modelo responde sobre ella con la misma estabilidad en todos los idiomas: 73–79 puntos, con un coeficiente de variación del 3.7%. El modelo conoce Notion igual de bien en ruso, francés y alemán.
Las divergencias empiezan cuando el usuario todavía no ha nombrado la marca. La posición media en la respuesta, la entrada entre los tres primeros y la citación del dominio notion.so dependen fuertemente del idioma. En ruso, notion.so aparece citado en el 24.5% de las respuestas; en alemán, en el 21.4%; en francés, en el 0%.
Para la marca, esta es una conclusión incómoda: el conocimiento que el modelo tiene de ella es una condición necesaria, pero no suficiente. La cuestión es si la marca entra en la lista corta cuando el usuario todavía no ha pronunciado su nombre. La respuesta depende del idioma.
Tres mecanismos que suponemos
Vemos tres canales a través de los cuales el idioma reconfigura el campo competitivo. Los tres son hipótesis respaldadas por los datos de estas ejecuciones, pero no validadas experimentalmente.
El primero es la asimetría de los corpus de entrenamiento. El modelo se entrenó con textos en los que distintas marcas se discuten con diferente frecuencia según el idioma. Los textos en ruso sobre productividad casi no mencionan Slack; los textos en inglés lo mencionan constantemente.
El segundo son las distintas fuentes web. En el modo web, el modelo busca en el idioma de la consulta y encuentra reseñas, comparativas y rankings distintos, con una composición de marcas diferente. La búsqueda en francés devuelve fuentes en francés donde Notion es conocido, pero notion.so no aparece citado.
El tercero son los distintos grafos asociativos de la categoría. En cada idioma, el modelo construye su propio mapa de la categoría «productividad». En ruso, son Notion, Asana, ClickUp y Monday.com. En francés, Notion, Slack, Microsoft Copilot y ClickUp. La composición de actores cambia, y eso determina quién entra en la recomendación.
Qué significa esto en la práctica
Para la marca líder de la categoría, el VLF es más una tarea estratégica que una crisis. La propia puntuación oscila de forma moderada, pero los competidores con los que se compite en un idioma pueden ser otros en otro idioma. Una estrategia construida en torno a un único conjunto de competidores corre el riesgo de volverse irrelevante en el mercado lingüístico vecino.
Para una marca que no domina la categoría, la situación es más dura. Monday.com pierde 40 puntos al pasar del ruso al francés. Slack desaparece por completo en ruso. Si la marca ocupa la segunda o la tercera posición, el VLF es un riesgo directo de negocio: la visibilidad ganada en un idioma no se traslada automáticamente a otro.
La recomendación práctica es simple: lanzar un estudio independiente en cada idioma del mercado objetivo. Comparar no solo la propia puntuación, sino también la composición del campo competitivo. La estrategia de crecimiento de la visibilidad debe tener en cuenta a los competidores concretos que existen en cada idioma, porque en distintos idiomas pueden ser empresas distintas.
Observaciones metodológicas
Los datos se obtuvieron a partir de cinco ejecuciones de una sola marca (Notion) en el modelo GPT-5.4. Todas las ejecuciones utilizaron el corpus estándar de AI100 de 200 escenarios. Dos ejecuciones (RU y FR) se realizaron el 2 de abril; tres (EN, DE, ES), el 3 de abril de 2026. Las diferencias entre días (day effect) no se separaron del efecto del idioma.
Los intervalos de confianza de las puntuaciones finales se solapan parcialmente. El test Q de Cochran estima en un 4–8% la probabilidad de que toda la dispersión se explique por ruido del modelo, en el límite de la significación estadística. Sin embargo, los patrones estructurales —la estabilidad de Slack en cuatro idiomas frente a un cero en el quinto, el gradiente de Monday.com y la inversión de Copilot— se explican mal por la estocasticidad.
La principal limitación es clara: una sola marca, un solo modelo, una sola categoría y una sola ejecución por idioma. Para una validación completa se necesitan ejecuciones repetidas (mínimo 5 por idioma) y pruebas con otras marcas y modelos. Llamamos a esta observación VLF y la consideramos suficientemente fundamentada para su publicación, pero insuficientemente validada para conclusiones definitivas.
Al cambiar el idioma de los prompts, el entorno competitivo de la marca se reconfigura: unos competidores aparecen, otros desaparecen y otros cambian de posición de manera radical. El conocimiento diagnóstico del modelo sobre la marca permanece estable; lo que cambia es precisamente la capa de recomendación.
Una sola marca, un solo modelo y una sola ejecución por idioma no bastan para concluir cuál es la magnitud del efecto en otras categorías y otros modelos. Aún no se ha trazado la frontera exacta entre el efecto del idioma y el ruido estocástico del modelo.
Una marca internacional necesita probar su visibilidad por separado en cada idioma de su mercado objetivo. El resultado de una ejecución en inglés no se traslada a otros idiomas, sobre todo en el caso de marcas que no son líderes indiscutibles de su categoría.
Fuentes
Materiales relacionados
Visibilidad a través del prisma del idioma y la geografía
Por qué la misma marca se ve diferente en las respuestas de IA en distintos idiomas y países — y qué consecuencias prácticas se derivan.
Abrir material →«Burbuja de respuestas»: por qué una misma marca se ve de manera distinta en ChatGPT, Google, Copilot y otros sistemas
Por qué no existe una visibilidad IA única: la misma marca puede verse notablemente diferente entre ChatGPT, Google AI Overviews, Copilot y Perplexity.
Abrir material →Cómo se relaciona esto con AI100 en la práctica
Si necesita no una visión general sino un diagnóstico específico para su marca, AI100 permite verificar cómo el modelo ve la empresa en escenarios neutrales de elección, qué competidores se posicionan más arriba y qué mejoras tienen mayor probabilidad de aumentar la visibilidad.
Ver informe de muestra