GEO · CONTENIDO Y DATOS

Por qué tener mucho contenido no alcanza: el rol de los datos verificables en la visibilidad ante las IAs

Por Fabián Torres · 24 de junio de 2026 · 7 min de lectura

Hay una idea muy extendida en el mundo del marketing de contenidos: más contenido equivale a más visibilidad. Durante años, esa lógica funcionó razonablemente bien para el SEO. Pero cuando el canal de descubrimiento es una IA —ChatGPT, Gemini, Perplexity, Claude— la ecuación cambia de manera fundamental.

+40%

de aumento en la probabilidad de citación por LLMs al incorporar estadísticas verificables en el contenido

Fuente: Aggarwal et al., Princeton University / KDD 2024

Ese número no viene de una agencia de marketing ni de un blog de SEO. Es el resultado de un benchmark experimental publicado en KDD 2024 por investigadores de Princeton University. Lo que mide es concreto: la diferencia en citación entre un contenido que incluye estadísticas verificables y uno que no las incluye, ante los mismos modelos de lenguaje. La diferencia es del 40%.

La conclusión es directa: para las IAs, el volumen de palabras importa menos que la densidad de evidencia verificable. Un sitio con 20 artículos respaldados por datos reales compite mejor que uno con 200 artículos de opinión, guías genéricas o listas sin fuente.

Por qué los LLMs prefieren los datos a las palabras

Los modelos de lenguaje no leen el contenido de la misma manera que un humano. Un humano puede seguir un argumento sin datos y evaluarlo por coherencia interna o estilo. Un LLM, en cambio, busca patrones asociados a confiabilidad: fechas, cifras, nombres de instituciones, referencias verificables, autoría con credenciales reales.

Cuando un modelo decide qué fuente citar en una respuesta, no está eligiendo "el artículo más completo" ni "el blog más conocido". Está eligiendo el contenido que tiene más señales de que alguien verificó lo que está diciendo. Un número con fuente es una de esas señales. Un porcentaje con cita académica es otra. Una estadística con año y autoría institucional es otra.

"Los métodos de optimización que incorporan estadísticas verificables y citas a fuentes externas son los que mayor incremento producen en la frecuencia de citación por parte de los modelos de lenguaje evaluados." — Aggarwal et al., Princeton University — Proceedings of KDD 2024

Dicho de otra manera: las IAs funcionan como revisores académicos. No solo leen, evalúan. Y lo que evalúan es si el contenido tiene base empírica o no.

El problema del contenido sin ancla

La mayoría del contenido web está escrito para convencer, no para verificar. Frases como "el SEO es fundamental para el crecimiento digital" o "la experiencia del cliente es clave para la retención" son afirmaciones que cualquiera podría hacer, en cualquier momento, sin ningún dato que las respalde. Para un buscador tradicional, ese tipo de contenido puede rankear bien si tiene las palabras clave correctas. Para un LLM, ese contenido no aporta señales de confiabilidad.

A esto lo llamamos contenido sin ancla: texto que flota sin un dato que lo fije a la realidad. Puede estar bien escrito, tener buena estructura, cubrir un tema relevante. Pero a los ojos de un modelo de lenguaje, es indistinguible de la opinión de cualquier persona.

El problema no es escribir mal. El problema es escribir sin evidencia. Un LLM no puede verificar una afirmación sin fuente, y lo que no puede verificar, tiende a no citar.

Qué es un dato verificable, exactamente

No todo número es un dato verificable. "Aumentamos las ventas un 300%" sin contexto ni fuente no le aporta nada a un LLM. Lo que sí aporta:

Estadísticas con origen institucional. Un porcentaje publicado por una universidad, una cámara de comercio, un organismo oficial o un paper académico tiene peso porque hay una institución que lo respalda y una fecha que lo contextualiza.

Referencias a investigaciones con autor y año. Citar "Aggarwal et al., Princeton, 2024" es distinto a decir "según estudios recientes". El primero es verificable; el segundo es ruido.

Datos propios con metodología explícita. "Analizamos 150 sitios web argentinos con nuestra herramienta entre enero y junio de 2026 y encontramos que el 78% no tiene Schema.org implementado" es un dato verificable si se explica cómo se obtuvo. No requiere un paper académico —requiere transparencia metodológica.

Resultados medibles antes y después. Un caso de estudio con métricas reales —score inicial, score final, acciones realizadas— tiene más valor para un LLM que cinco párrafos de argumentación sin números.

Caso de estudio — lo que pasa cuando no hay datos

Caso de estudio — Consultor independiente · Junio 2026

Sitio de un consultor de marketing con más de 60 artículos publicados, buena estructura de navegación y un blog activo con publicaciones mensuales. Ningún artículo incluía estadísticas con fuente. Las afirmaciones eran todas de tipo "la mayoría de las empresas", "los expertos coinciden", "se estima que". Sin fecha de publicación visible en los posts.

Score inicial

→

Score proyectado

El criterio de Densidad de datos quedó en 15/100. El criterio de Frescura y actualización, en 20/100, porque ningún artículo tenía fecha visible ni marcado temporal. El volumen de contenido no compensó la ausencia de datos verificables. El plan de trabajo prioriza incorporar estadísticas con fuente en los 10 artículos de mayor tráfico y agregar fechas de publicación visibles a todos los posts existentes.

Qué cambia cuando el contenido tiene ancla

El cambio no es solo cuantitativo. Cuando un sitio incorpora datos verificables con fuente, cambia la manera en que un LLM lo "lee". El modelo puede asociar el contenido con un corpus de conocimiento verificado —papers, instituciones, fechas— lo que aumenta la probabilidad de que lo use como referencia en sus respuestas.

Además, los datos tienen una ventaja estructural: son específicos. La especificidad es una señal de citabilidad. "El 40% de las empresas argentinas no tiene sitio web" es más citable que "muchas empresas argentinas todavía no están online". El primero permite ser citado con precisión; el segundo no.

Por eso el método de optimización que Aggarwal et al. llama Statistics Addition —agregar estadísticas verificables al contenido existente— produce el mayor incremento de citación de todos los métodos evaluados en el benchmark. No requiere reescribir todo el sitio. Requiere anclar las afirmaciones existentes a datos reales.

Lo que esto implica para tu estrategia de contenido

Si estás produciendo contenido pensando en visibilidad ante IAs, la pregunta que tenés que hacerte en cada artículo no es "¿está bien escrito?" ni "¿tiene las palabras clave correctas?". La pregunta es: ¿hay al menos un dato verificable con fuente en este texto?

Si la respuesta es no, ese artículo es invisible para los LLMs, independientemente de su extensión o calidad editorial.

La buena noticia es que esto es técnicamente solucionable. El contenido existente no se tira: se ancla. Se identifican las afirmaciones centrales de cada pieza y se reemplazan las frases vagas por estadísticas con origen verificable. Es trabajo, pero es trabajo con dirección clara y resultado medible.

¿Sabés cuántos datos verificables tiene tu sitio?

El análisis gratuito de Nostos evalúa tu sitio contra 6 criterios GEO —incluyendo Densidad de datos— y te dice exactamente dónde estás y qué tenés que cambiar.

Analizá tu sitio gratis