Framework · Pilar 4

Cómo auditar un sitio para GEO
antes de proponerlo a tu cliente

Una auditoría GEO no es una auditoría SEO con otro nombre. El evaluador es distinto, los criterios son distintos y las prioridades son distintas. Este es el checklist en 5 áreas que usamos para determinar si un sitio de cliente está listo — y qué hacer cuando no lo está.

Este checklist nació del proceso que seguimos antes de proponer cualquier estrategia GEO a un cliente. Evalúa cinco áreas que los LLMs usan para decidir si citan o ignoran un sitio — y traduce cada hallazgo en un diagnóstico accionable. El tiempo estimado por sitio es de 45 a 90 minutos.

01 Por qué es diferente a una auditoría SEO

En una auditoría SEO clásica, el evaluador principal es Google: sus bots rastrean el sitio, su algoritmo pondera señales de autoridad y relevancia, y el resultado es una posición en el ranking. El proceso está bien documentado y las herramientas son maduras.

En una auditoría GEO, el evaluador es distinto: es un modelo de lenguaje que decide, en tiempo de inferencia, si tu sitio es una fuente suficientemente autoritativa para ser citada en su respuesta. Ese modelo no tiene "ranking" — tiene contexto de entrenamiento y, en los casos de búsqueda aumentada (RAG), tiene resultados de rastreo reciente.

Las implicaciones son concretas:

  • La estructura del contenido importa más que el volumen. Un artículo de 800 palabras con datos propios, autoría clara y definiciones directas puede ser más citable que uno de 3,000 palabras genéricas.
  • La entidad del negocio importa tanto como las keywords. Si el LLM no puede establecer con certeza quién es el negocio, dónde opera y qué hace, no lo citará aunque el contenido sea bueno.
  • El acceso técnico es binario. Si el robots.txt bloquea a GPTBot o ClaudeBot, ese LLM sencillamente no puede ver el sitio. No hay penalización gradual como en SEO — o pueden acceder o no pueden.

Regla práctica: Una auditoría GEO asume que el SEO técnico base ya está en orden. Si el sitio tiene errores de rastreo graves, páginas sin indexar por error, o HTTPS roto — empieza por SEO. GEO sin base técnica sólida no funciona.

02 Área 1: Señales de entidad

Los LLMs construyen su comprensión de un negocio a partir de menciones y señales consistentes en todo el web — no solo del sitio propio. Esta área evalúa si el negocio existe como entidad coherente para un modelo de lenguaje.

Área 01
Señales de entidad
¿Puede el LLM saber con certeza quién es este negocio?
NAP consistente en todo el sitio
Nombre del negocio, dirección y teléfono idénticos en header, footer, página de contacto y schema. Cualquier variación confunde al LLM sobre la identidad.
Básico
Schema Organization con @id canónico
El JSON-LD de Organization debe incluir "@id": "https://dominio.com/#organization" — esta ancla es la que permite a los LLMs referenciar la entidad de forma no ambigua.
Schema
sameAs con perfiles de autoridad
LinkedIn, Instagram, Google Business Profile, Clutch, DesignRush o directorios de industria. Cuantos más perfiles externos apunten al mismo negocio con el mismo nombre, más fuerte la señal de entidad.
Schema
llms.txt implementado
El archivo /llms.txt declara al LLM qué contenido puede procesar. Aún no es un estándar universal, pero los sitios que lo implementan dan una señal explícita de intención de citabilidad. Si no existe, no es bloqueante — pero es una oportunidad.
Emergente
Google Business Profile activo y consistente
Para negocios locales, GBP es una de las fuentes que Google AI y algunos LLMs usan para validar la identidad del negocio. Nombre, categoría y URL deben coincidir exactamente con el sitio.
Local
Menciones externas con el nombre correcto del negocio
Busca el nombre exacto del negocio en Google. ¿Aparecen menciones en medios, notas de prensa, directorios? Un negocio sin menciones externas existe solo para sí mismo — los LLMs no pueden corroborar su identidad.
Off-site

03 Área 2: Schema markup

El schema markup es el lenguaje estructurado que permite a los LLMs (y a Google) leer el contenido sin ambigüedad. No es solo una señal de rastreo — es la forma en que el sitio le dice explícitamente a un modelo qué tipo de entidad es, qué hace, quién lo creó y cómo interpretarlo.

Área 02
Schema markup
¿Habla el sitio el idioma que los LLMs prefieren?
Organization con @id, name, url, logo, sameAs
El schema más importante para GEO. Debe estar en todas las páginas del sitio (generalmente en el head global) y debe ser consistente en todos los campos.
Crítico
Person (fundador o autor principal)
Los LLMs asignan autoridad a personas, no solo a organizaciones. Un schema Person con nombre, jobTitle, url y sameAs (LinkedIn) añade señales E-E-A-T que influyen en la probabilidad de citación.
E-E-A-T
Article o BlogPosting en cada artículo
Debe incluir headline, datePublished, dateModified, author (con referencia al Person), publisher y url. Sin este schema, el LLM no puede determinar si el contenido es actual o quién lo escribió.
Contenido
FAQPage en páginas de servicios o pilares
El schema FAQPage hace que las preguntas y respuestas sean directamente extraíbles por los LLMs. Es uno de los formatos más citados en respuestas de ChatGPT y Google AI, porque entrega información estructurada lista para usar.
Citabilidad
Service en páginas de servicio
Permite que el LLM entienda qué ofrece el negocio, a quién y en qué área. Especialmente importante para negocios locales y B2B donde la consulta suele ser por categoría de servicio más ubicación.
Local / B2B
BreadcrumbList en todas las páginas internas
Le dice al LLM (y a Google) la jerarquía del sitio. Útil para que el modelo entienda la relación entre secciones y la arquitectura de información.
Estructura
Validado con Rich Results Test y schema.org validator
El schema mal formateado no solo no funciona — puede confundir al crawler. Ambas herramientas son gratuitas y toman menos de 5 minutos por página.
Validación

04 Área 3: Citabilidad del contenido

Esta es el área más subjetiva de la auditoría, pero también la más determinante. Un LLM cita un contenido cuando puede extraer de él una respuesta directa y atribuible a una fuente. Eso requiere condiciones específicas que no todos los sitios cumplen.

Área 03
Citabilidad del contenido
¿Está el contenido escrito para ser citado, no solo para posicionar?
Autoría identificable en cada artículo
Nombre real, cargo, enlace a perfil o bio. Los LLMs asignan mayor probabilidad de citación a contenido con autoría explícita — anónimo o "equipo editorial" penaliza en E-E-A-T.
E-E-A-T
Estructura jerárquica clara: H1 → H2 → H3
Los LLMs usan la jerarquía de headings como mapa del contenido. Un artículo sin estructura jerárquica clara es difícil de segmentar para extraer respuestas puntuales.
Estructura
Datos propios o estadísticas con fuente
Porcentajes, números de casos, comparativas propias, tiempos documentados. El contenido genérico sin datos es intercambiable — el LLM no tiene razón para citar esa fuente específica. Un solo dato original eleva la citabilidad del artículo completo.
Diferenciación
Respuestas directas a preguntas frecuentes del sector
¿Hay párrafos que responden preguntas de forma directa, en las primeras 1-2 oraciones? Los LLMs con RAG buscan pasajes que respondan la query del usuario — un contenido que da vueltas antes de responder queda fuera.
Formato
Contenido sin experiencia de primera mano o sin punto de vista
Los LLMs están entrenados para preferir contenido con perspectiva original. Un artículo que solo reordena lo que dice Wikipedia no añade señal de autoridad. Casos reales, errores documentados y posiciones explícitas aumentan la citabilidad.
Autoridad
Fechas de publicación y actualización visibles
Los LLMs con búsqueda en tiempo real priorizan contenido reciente para queries que implican actualidad. Un artículo sin fecha visible puede ser penalizado en contextos de búsqueda aumentada.
Frescura

05 Área 4: Acceso de crawlers LLM

Esta área es la más técnica y la más binaria. Si el sitio bloquea los crawlers de los LLMs, ninguna estrategia de contenido funciona. Es el primer semáforo rojo que puede detener toda la propuesta.

Área 04
Acceso de crawlers LLM
¿Pueden entrar GPTBot, ClaudeBot y PerplexityBot?
robots.txt no bloquea GPTBot, ClaudeBot ni PerplexityBot
Revisa /robots.txt del sitio. Si hay un Disallow: / global o reglas específicas para estos User-agents, ese LLM no puede rastrear el sitio. Es el gap más fácil de corregir y uno de los más comunes.
Crítico
HTTPS activo sin errores de certificado
Un certificado vencido o mal configurado hace que algunos crawlers rechacen el sitio por completo. Verificar en el navegador o con herramientas como SSL Labs.
Técnico
Contenido visible sin JavaScript
Muchos crawlers de LLMs no ejecutan JavaScript. Si el contenido principal se renderiza con JS (SPAs, React sin SSR, Vue sin hidratación), el crawler ve una página vacía. Verificar desactivando JS en el navegador.
Renderizado
Tiempo de carga menor a 3 segundos
Los crawlers de LLMs tienen límites de tiempo de espera más bajos que Googlebot. Un sitio lento puede resultar en rastreo parcial o nulo. Verificar con PageSpeed Insights.
Velocidad
Sitemap XML existente y actualizado
Aunque los crawlers de LLMs no dependen del sitemap tanto como Googlebot, un sitemap limpio facilita el descubrimiento de contenido nuevo. Verificar en /sitemap.xml.
Rastreo

Los User-agents a verificar en el robots.txt del cliente: GPTBot (OpenAI/ChatGPT), ClaudeBot (Anthropic), PerplexityBot (Perplexity), Google-Extended (datos de entrenamiento de Google). Un bloqueo a Google-Extended no afecta Google AI Overviews, pero sí el entrenamiento futuro de Gemini.

06 Área 5: Prueba manual en LLMs

La prueba más directa: ¿el sitio ya aparece citado en algún LLM? Esto no reemplaza las 4 áreas anteriores, pero da contexto inmediato de la situación actual y es lo que el cliente entenderá más rápido.

Área 05
Prueba manual en LLMs
¿Aparece el cliente en ChatGPT, Perplexity o Google AI?
Query de marca: "[nombre del negocio]" o "[nombre] + ciudad"
¿El LLM conoce al negocio? ¿Lo describe correctamente? ¿La descripción coincide con lo que el negocio dice de sí mismo, o está desactualizada / incompleta?
Marca
Query de categoría: "[servicio principal] en [ciudad]"
¿El negocio aparece como referencia para su categoría en su mercado? Esta es la query que más importa comercialmente — es la que hacen los prospectos que no conocen la marca todavía.
Competencia
Query de problema: "cómo [resolver problema que el negocio soluciona]"
¿El contenido del sitio aparece citado cuando alguien busca resolver el problema que el negocio soluciona? Este es el nivel de citabilidad más profundo — requiere contenido educativo, no solo comercial.
Contenido
Documentar resultado con captura de pantalla y fecha
Fecha y LLM usado. Esto es el "antes" de la estrategia GEO. Sin esto, no hay forma de demostrar progreso al cliente después. Es la evidencia más importante de toda la auditoría.
Baseline
Repetir en al menos 3 LLMs: ChatGPT, Perplexity y Google AI
Cada motor tiene su propio índice y lógica de citación. Aparecer en uno no garantiza aparecer en otro. La estrategia GEO debe apuntar a todos, pero el baseline debe mostrar dónde está y dónde no cada cliente.
Multi-motor

07 Semáforo de diagnóstico

Una vez completadas las 5 áreas, el resultado cae en uno de tres estados. Este semáforo define qué proponer al cliente y en qué secuencia.

Verde · Listo
El sitio está preparado para una estrategia GEO completa
Se cumplen:
  • Base técnica SEO sólida
  • Schema Organization + Person implementados
  • robots.txt abierto a crawlers LLM
  • Al menos 3-5 artículos con autoría y estructura
  • NAP consistente en todo el sitio
→ Proponer estrategia GEO completa de inmediato
Amarillo · En construcción
Requiere trabajo previo de 1-2 meses antes de GEO completo
Situación típica:
  • SEO técnico base correcto
  • Schema parcial o sin validar
  • Poco contenido con autoría clara
  • Sin presencia en LLMs todavía
  • GBP inconsistente o sin reclamar
→ Proponer "sprint de cimientos GEO" primero
Rojo · No listo
Primero SEO técnico — GEO no puede funcionar en esta base
Señales de alerta:
  • Errores de rastreo o indexación graves
  • robots.txt bloquea todo o JS no renderable
  • Sin HTTPS o con errores de certificado
  • Sin contenido propio o todo duplicado
  • NAP completamente inconsistente
→ Proponer auditoría SEO técnica primero

08 El gap como propuesta

Cada gap identificado en la auditoría no es un problema — es un argumento de venta. La forma en que presentas los hallazgos determina si el cliente entiende el valor de la intervención o si lo lee como una lista de fallas.

Esta es la tabla de traducción de gaps a propuestas:

Gap encontrado Cómo presentarlo al cliente Entregable propuesto
Entidad débil
Sin schema Organization, NAP inconsistente
"Los LLMs no pueden determinar con certeza quién eres como negocio. Apareces como información ambigua, no como una entidad reconocible." Implementación de schema Organization + limpieza de NAP + sameAs en directorios
Schema ausente
Sin JSON-LD estructurado en páginas clave
"Tu sitio habla en prosa — pero los LLMs prefieren datos estructurados. Sin schema, cada vez que un LLM lee tu sitio tiene que interpretar en lugar de leer." Implementación completa de schema por tipo de página: Organization, Article, FAQPage, Service
Contenido incitable
Artículos genéricos sin datos ni autoría
"El contenido está escrito para posicionar keywords, no para ser citado. Los LLMs no tienen razón para referenciarte cuando el contenido es intercambiable." Reescritura o creación de 3-5 artículos pilares con datos propios, autoría y respuestas directas
Acceso bloqueado
robots.txt bloquea GPTBot o ClaudeBot
"ChatGPT y Claude no pueden ver tu sitio. Aunque hagas todo bien en contenido y schema, esos LLMs trabajan con páginas en blanco cuando rastrean el tuyo." Corrección del robots.txt — entregable en 1 día
Sin baseline
No aparece en ningún LLM todavía
"Todavía estás a tiempo de ser el primero en tu categoría en este mercado. La ventana está abierta — pero no por mucho." Estrategia GEO completa con baseline documentado desde el inicio

Punto clave para agencias: Un sitio en estado rojo no es una venta perdida — es una venta más larga. El cliente necesita SEO primero (que puedes ofrecer tú), y GEO después (que también puedes ofrecer). El audit GEO te da visibilidad de un roadmap de 6-12 meses, no solo de una propuesta puntual.

09 Herramientas necesarias

Una auditoría GEO no requiere herramientas de pago para el diagnóstico inicial. Estas son las que usamos:

Rich Results Test Valida el schema JSON-LD de cada página. Muestra errores, advertencias y una vista previa del resultado estructurado. Gratis
schema.org validator Valida la sintaxis del JSON-LD contra el vocabulario oficial de schema.org. Complementario al Rich Results Test. Gratis
PageSpeed Insights Velocidad de carga y Core Web Vitals. Un sitio lento puede ser rastreado de forma incompleta por crawlers de LLMs. Gratis
ChatGPT (web) Para la prueba manual de queries. La versión gratuita es suficiente. ChatGPT con búsqueda activada da resultados más actuales. Gratis
Perplexity.ai LLM con búsqueda en tiempo real. Sus respuestas muestran fuentes explícitas, lo que facilita verificar si el sitio del cliente aparece citado. Gratis
Google AI (AI Overviews) Buscar en Google.com.mx con las queries del cliente y observar si aparecen AI Overviews y si el cliente está citado en ellos. Gratis
Preguntas frecuentes

Dudas sobre la auditoría GEO

¿Cuánto tiempo toma hacer una auditoría GEO de un sitio de cliente?

Una auditoría GEO completa en las 5 áreas toma entre 45 y 90 minutos dependiendo del tamaño del sitio. El área que más tiempo consume es la prueba manual en LLMs y el levantamiento del schema existente. Con práctica y el checklist estandarizado, el tiempo baja a 45 min por sitio.

¿Se puede hacer GEO si el sitio no tiene SEO técnico en orden?

No de forma efectiva. GEO requiere que los crawlers de LLMs puedan acceder al contenido, lo que depende de una base técnica mínima: HTTPS activo, robots.txt correcto, velocidad de carga aceptable y contenido indexable. Un sitio con errores técnicos graves primero necesita SEO — GEO viene después.

¿Qué herramientas necesito para hacer la auditoría?

Solo necesitas: el validador de Rich Results Test de Google (gratis), el validador de schema.org (gratis), acceso a ChatGPT, Perplexity y Google AI (versiones gratuitas suficientes), y una revisión manual del robots.txt del sitio. No se necesitan herramientas de pago para el diagnóstico inicial.

¿Qué pasa si el robots.txt del cliente bloquea a GPTBot o ClaudeBot?

El sitio no puede ser citado por ese LLM porque el crawler no puede acceder al contenido. Es uno de los gaps más fáciles de corregir: basta con eliminar o ajustar las reglas de User-agent en el robots.txt. Antes de proponer cualquier estrategia GEO, este problema debe resolverse.

¿Cómo diferencio una auditoría GEO de una auditoría SEO convencional?

La diferencia principal está en el evaluador: en SEO clásico el evaluador es Google y sus algoritmos de ranking. En GEO, el evaluador es un modelo de lenguaje que decide si el contenido es autoritativo y estructurado para citarlo en una respuesta. Las señales técnicas se solapan en parte (schema, velocidad, indexabilidad), pero GEO añade criterios de citabilidad del contenido y de entidad que el SEO convencional no considera.

Artículos relacionados

Siguiente paso: implementar

White Label GEO · Para agencias

¿Quieres ofrecer auditorías GEO
bajo tu propia marca?

Ejecutamos la auditoría, el diagnóstico y la estrategia completa — bajo tu marca, con tu cliente. Tú cierras, nosotros entregamos.

Hablemos de white label →