Este checklist nació del proceso que seguimos antes de proponer cualquier estrategia GEO a un cliente. Evalúa cinco áreas que los LLMs usan para decidir si citan o ignoran un sitio — y traduce cada hallazgo en un diagnóstico accionable. El tiempo estimado por sitio es de 45 a 90 minutos.
01 Por qué es diferente a una auditoría SEO
En una auditoría SEO clásica, el evaluador principal es Google: sus bots rastrean el sitio, su algoritmo pondera señales de autoridad y relevancia, y el resultado es una posición en el ranking. El proceso está bien documentado y las herramientas son maduras.
En una auditoría GEO, el evaluador es distinto: es un modelo de lenguaje que decide, en tiempo de inferencia, si tu sitio es una fuente suficientemente autoritativa para ser citada en su respuesta. Ese modelo no tiene "ranking" — tiene contexto de entrenamiento y, en los casos de búsqueda aumentada (RAG), tiene resultados de rastreo reciente.
Las implicaciones son concretas:
- La estructura del contenido importa más que el volumen. Un artículo de 800 palabras con datos propios, autoría clara y definiciones directas puede ser más citable que uno de 3,000 palabras genéricas.
- La entidad del negocio importa tanto como las keywords. Si el LLM no puede establecer con certeza quién es el negocio, dónde opera y qué hace, no lo citará aunque el contenido sea bueno.
- El acceso técnico es binario. Si el robots.txt bloquea a GPTBot o ClaudeBot, ese LLM sencillamente no puede ver el sitio. No hay penalización gradual como en SEO — o pueden acceder o no pueden.
Regla práctica: Una auditoría GEO asume que el SEO técnico base ya está en orden. Si el sitio tiene errores de rastreo graves, páginas sin indexar por error, o HTTPS roto — empieza por SEO. GEO sin base técnica sólida no funciona.
02 Área 1: Señales de entidad
Los LLMs construyen su comprensión de un negocio a partir de menciones y señales consistentes en todo el web — no solo del sitio propio. Esta área evalúa si el negocio existe como entidad coherente para un modelo de lenguaje.
NAP consistente en todo el sitio
Nombre del negocio, dirección y teléfono idénticos en header, footer, página de contacto y schema. Cualquier variación confunde al LLM sobre la identidad.
Básico
Schema Organization con @id canónico
El JSON-LD de Organization debe incluir "@id": "https://dominio.com/#organization" — esta ancla es la que permite a los LLMs referenciar la entidad de forma no ambigua.
Schema
sameAs con perfiles de autoridad
LinkedIn, Instagram, Google Business Profile, Clutch, DesignRush o directorios de industria. Cuantos más perfiles externos apunten al mismo negocio con el mismo nombre, más fuerte la señal de entidad.
Schema
llms.txt implementado
El archivo /llms.txt declara al LLM qué contenido puede procesar. Aún no es un estándar universal, pero los sitios que lo implementan dan una señal explícita de intención de citabilidad. Si no existe, no es bloqueante — pero es una oportunidad.
Emergente
Google Business Profile activo y consistente
Para negocios locales, GBP es una de las fuentes que Google AI y algunos LLMs usan para validar la identidad del negocio. Nombre, categoría y URL deben coincidir exactamente con el sitio.
Local
Menciones externas con el nombre correcto del negocio
Busca el nombre exacto del negocio en Google. ¿Aparecen menciones en medios, notas de prensa, directorios? Un negocio sin menciones externas existe solo para sí mismo — los LLMs no pueden corroborar su identidad.
Off-site
03 Área 2: Schema markup
El schema markup es el lenguaje estructurado que permite a los LLMs (y a Google) leer el contenido sin ambigüedad. No es solo una señal de rastreo — es la forma en que el sitio le dice explícitamente a un modelo qué tipo de entidad es, qué hace, quién lo creó y cómo interpretarlo.
Organization con @id, name, url, logo, sameAs
El schema más importante para GEO. Debe estar en todas las páginas del sitio (generalmente en el head global) y debe ser consistente en todos los campos.
Crítico
Person (fundador o autor principal)
Los LLMs asignan autoridad a personas, no solo a organizaciones. Un schema Person con nombre, jobTitle, url y sameAs (LinkedIn) añade señales E-E-A-T que influyen en la probabilidad de citación.
E-E-A-T
Article o BlogPosting en cada artículo
Debe incluir headline, datePublished, dateModified, author (con referencia al Person), publisher y url. Sin este schema, el LLM no puede determinar si el contenido es actual o quién lo escribió.
Contenido
FAQPage en páginas de servicios o pilares
El schema FAQPage hace que las preguntas y respuestas sean directamente extraíbles por los LLMs. Es uno de los formatos más citados en respuestas de ChatGPT y Google AI, porque entrega información estructurada lista para usar.
Citabilidad
Service en páginas de servicio
Permite que el LLM entienda qué ofrece el negocio, a quién y en qué área. Especialmente importante para negocios locales y B2B donde la consulta suele ser por categoría de servicio más ubicación.
Local / B2B
BreadcrumbList en todas las páginas internas
Le dice al LLM (y a Google) la jerarquía del sitio. Útil para que el modelo entienda la relación entre secciones y la arquitectura de información.
Estructura
Validado con Rich Results Test y schema.org validator
El schema mal formateado no solo no funciona — puede confundir al crawler. Ambas herramientas son gratuitas y toman menos de 5 minutos por página.
Validación
04 Área 3: Citabilidad del contenido
Esta es el área más subjetiva de la auditoría, pero también la más determinante. Un LLM cita un contenido cuando puede extraer de él una respuesta directa y atribuible a una fuente. Eso requiere condiciones específicas que no todos los sitios cumplen.
Autoría identificable en cada artículo
Nombre real, cargo, enlace a perfil o bio. Los LLMs asignan mayor probabilidad de citación a contenido con autoría explícita — anónimo o "equipo editorial" penaliza en E-E-A-T.
E-E-A-T
Estructura jerárquica clara: H1 → H2 → H3
Los LLMs usan la jerarquía de headings como mapa del contenido. Un artículo sin estructura jerárquica clara es difícil de segmentar para extraer respuestas puntuales.
Estructura
Datos propios o estadísticas con fuente
Porcentajes, números de casos, comparativas propias, tiempos documentados. El contenido genérico sin datos es intercambiable — el LLM no tiene razón para citar esa fuente específica. Un solo dato original eleva la citabilidad del artículo completo.
Diferenciación
Respuestas directas a preguntas frecuentes del sector
¿Hay párrafos que responden preguntas de forma directa, en las primeras 1-2 oraciones? Los LLMs con RAG buscan pasajes que respondan la query del usuario — un contenido que da vueltas antes de responder queda fuera.
Formato
Contenido sin experiencia de primera mano o sin punto de vista
Los LLMs están entrenados para preferir contenido con perspectiva original. Un artículo que solo reordena lo que dice Wikipedia no añade señal de autoridad. Casos reales, errores documentados y posiciones explícitas aumentan la citabilidad.
Autoridad
Fechas de publicación y actualización visibles
Los LLMs con búsqueda en tiempo real priorizan contenido reciente para queries que implican actualidad. Un artículo sin fecha visible puede ser penalizado en contextos de búsqueda aumentada.
Frescura
05 Área 4: Acceso de crawlers LLM
Esta área es la más técnica y la más binaria. Si el sitio bloquea los crawlers de los LLMs, ninguna estrategia de contenido funciona. Es el primer semáforo rojo que puede detener toda la propuesta.
robots.txt no bloquea GPTBot, ClaudeBot ni PerplexityBot
Revisa /robots.txt del sitio. Si hay un Disallow: / global o reglas específicas para estos User-agents, ese LLM no puede rastrear el sitio. Es el gap más fácil de corregir y uno de los más comunes.
Crítico
HTTPS activo sin errores de certificado
Un certificado vencido o mal configurado hace que algunos crawlers rechacen el sitio por completo. Verificar en el navegador o con herramientas como SSL Labs.
Técnico
Contenido visible sin JavaScript
Muchos crawlers de LLMs no ejecutan JavaScript. Si el contenido principal se renderiza con JS (SPAs, React sin SSR, Vue sin hidratación), el crawler ve una página vacía. Verificar desactivando JS en el navegador.
Renderizado
Tiempo de carga menor a 3 segundos
Los crawlers de LLMs tienen límites de tiempo de espera más bajos que Googlebot. Un sitio lento puede resultar en rastreo parcial o nulo. Verificar con PageSpeed Insights.
Velocidad
Sitemap XML existente y actualizado
Aunque los crawlers de LLMs no dependen del sitemap tanto como Googlebot, un sitemap limpio facilita el descubrimiento de contenido nuevo. Verificar en /sitemap.xml.
Rastreo
Los User-agents a verificar en el robots.txt del cliente: GPTBot (OpenAI/ChatGPT), ClaudeBot (Anthropic), PerplexityBot (Perplexity), Google-Extended (datos de entrenamiento de Google). Un bloqueo a Google-Extended no afecta Google AI Overviews, pero sí el entrenamiento futuro de Gemini.
06 Área 5: Prueba manual en LLMs
La prueba más directa: ¿el sitio ya aparece citado en algún LLM? Esto no reemplaza las 4 áreas anteriores, pero da contexto inmediato de la situación actual y es lo que el cliente entenderá más rápido.
Query de marca: "[nombre del negocio]" o "[nombre] + ciudad"
¿El LLM conoce al negocio? ¿Lo describe correctamente? ¿La descripción coincide con lo que el negocio dice de sí mismo, o está desactualizada / incompleta?
Marca
Query de categoría: "[servicio principal] en [ciudad]"
¿El negocio aparece como referencia para su categoría en su mercado? Esta es la query que más importa comercialmente — es la que hacen los prospectos que no conocen la marca todavía.
Competencia
Query de problema: "cómo [resolver problema que el negocio soluciona]"
¿El contenido del sitio aparece citado cuando alguien busca resolver el problema que el negocio soluciona? Este es el nivel de citabilidad más profundo — requiere contenido educativo, no solo comercial.
Contenido
Documentar resultado con captura de pantalla y fecha
Fecha y LLM usado. Esto es el "antes" de la estrategia GEO. Sin esto, no hay forma de demostrar progreso al cliente después. Es la evidencia más importante de toda la auditoría.
Baseline
Repetir en al menos 3 LLMs: ChatGPT, Perplexity y Google AI
Cada motor tiene su propio índice y lógica de citación. Aparecer en uno no garantiza aparecer en otro. La estrategia GEO debe apuntar a todos, pero el baseline debe mostrar dónde está y dónde no cada cliente.
Multi-motor
07 Semáforo de diagnóstico
Una vez completadas las 5 áreas, el resultado cae en uno de tres estados. Este semáforo define qué proponer al cliente y en qué secuencia.
Verde · Listo
El sitio está preparado para una estrategia GEO completa
Se cumplen:
- Base técnica SEO sólida
- Schema Organization + Person implementados
- robots.txt abierto a crawlers LLM
- Al menos 3-5 artículos con autoría y estructura
- NAP consistente en todo el sitio
→ Proponer estrategia GEO completa de inmediato
Amarillo · En construcción
Requiere trabajo previo de 1-2 meses antes de GEO completo
Situación típica:
- SEO técnico base correcto
- Schema parcial o sin validar
- Poco contenido con autoría clara
- Sin presencia en LLMs todavía
- GBP inconsistente o sin reclamar
→ Proponer "sprint de cimientos GEO" primero
Rojo · No listo
Primero SEO técnico — GEO no puede funcionar en esta base
Señales de alerta:
- Errores de rastreo o indexación graves
- robots.txt bloquea todo o JS no renderable
- Sin HTTPS o con errores de certificado
- Sin contenido propio o todo duplicado
- NAP completamente inconsistente
→ Proponer auditoría SEO técnica primero
08 El gap como propuesta
Cada gap identificado en la auditoría no es un problema — es un argumento de venta. La forma en que presentas los hallazgos determina si el cliente entiende el valor de la intervención o si lo lee como una lista de fallas.
Esta es la tabla de traducción de gaps a propuestas:
| Gap encontrado |
Cómo presentarlo al cliente |
Entregable propuesto |
Entidad débil
Sin schema Organization, NAP inconsistente
|
"Los LLMs no pueden determinar con certeza quién eres como negocio. Apareces como información ambigua, no como una entidad reconocible." |
Implementación de schema Organization + limpieza de NAP + sameAs en directorios |
Schema ausente
Sin JSON-LD estructurado en páginas clave
|
"Tu sitio habla en prosa — pero los LLMs prefieren datos estructurados. Sin schema, cada vez que un LLM lee tu sitio tiene que interpretar en lugar de leer." |
Implementación completa de schema por tipo de página: Organization, Article, FAQPage, Service |
Contenido incitable
Artículos genéricos sin datos ni autoría
|
"El contenido está escrito para posicionar keywords, no para ser citado. Los LLMs no tienen razón para referenciarte cuando el contenido es intercambiable." |
Reescritura o creación de 3-5 artículos pilares con datos propios, autoría y respuestas directas |
Acceso bloqueado
robots.txt bloquea GPTBot o ClaudeBot
|
"ChatGPT y Claude no pueden ver tu sitio. Aunque hagas todo bien en contenido y schema, esos LLMs trabajan con páginas en blanco cuando rastrean el tuyo." |
Corrección del robots.txt — entregable en 1 día |
Sin baseline
No aparece en ningún LLM todavía
|
"Todavía estás a tiempo de ser el primero en tu categoría en este mercado. La ventana está abierta — pero no por mucho." |
Estrategia GEO completa con baseline documentado desde el inicio |
Punto clave para agencias: Un sitio en estado rojo no es una venta perdida — es una venta más larga. El cliente necesita SEO primero (que puedes ofrecer tú), y GEO después (que también puedes ofrecer). El audit GEO te da visibilidad de un roadmap de 6-12 meses, no solo de una propuesta puntual.
09 Herramientas necesarias
Una auditoría GEO no requiere herramientas de pago para el diagnóstico inicial. Estas son las que usamos:
Rich Results Test
Valida el schema JSON-LD de cada página. Muestra errores, advertencias y una vista previa del resultado estructurado.
Gratis
schema.org validator
Valida la sintaxis del JSON-LD contra el vocabulario oficial de schema.org. Complementario al Rich Results Test.
Gratis
PageSpeed Insights
Velocidad de carga y Core Web Vitals. Un sitio lento puede ser rastreado de forma incompleta por crawlers de LLMs.
Gratis
ChatGPT (web)
Para la prueba manual de queries. La versión gratuita es suficiente. ChatGPT con búsqueda activada da resultados más actuales.
Gratis
Perplexity.ai
LLM con búsqueda en tiempo real. Sus respuestas muestran fuentes explícitas, lo que facilita verificar si el sitio del cliente aparece citado.
Gratis
Google AI (AI Overviews)
Buscar en Google.com.mx con las queries del cliente y observar si aparecen AI Overviews y si el cliente está citado en ellos.
Gratis