Cómo lograr que ChatGPT y Perplexity citen tu sitio web
Para que ChatGPT y Perplexity citen tu sitio web, tu contenido debe ser fácil de entender, extraer y verificar para un modelo de lenguaje: respuestas directas al inicio, datos estructurados válidos, acceso permitido a sus crawlers y señales de autoridad (autor, fechas y fuentes). No hay un botón mágico, pero sí un conjunto de prácticas concretas que aumentan mucho tus probabilidades.
1. Deja que sus crawlers entren
ChatGPT usa GPTBot y OAI-SearchBot; Perplexity usa PerplexityBot; Google AI usa Google-Extended. Revisa tu robots.txt: si tiene Disallow: / para alguno de estos agentes, no podrán leerte. Un robots que los recibe se ve así:
User-agent: GPTBot
User-agent: OAI-SearchBot
User-agent: PerplexityBot
User-agent: Google-Extended
Allow: /
Ojo: si usas Cloudflare, puede estar bloqueando a las IA por defecto. Desactiva la opción "Instruct AI bot traffic with robots.txt" en su panel.
2. Escribe en formato answer-first
Los modelos citan respuestas concretas. Empieza cada página o sección respondiendo la pregunta en 40-60 palabras, y luego desarrolla. Usa encabezados en forma de pregunta (## ¿Cómo funciona X?). Esto le facilita al modelo encontrar y citar la respuesta exacta.
3. Añade datos estructurados
El JSON-LD de Schema.org le dice a la IA qué es cada cosa sin ambigüedad. Los más útiles para que te citen:
- Organization y WebSite: identifican tu marca como entidad.
- FAQPage: marca tus preguntas frecuentes para que se muestren y citen como respuestas.
- Article con
authorydatePublished: aporta autoría y frescura (E-E-A-T).
4. Demuestra autoridad (E-E-A-T)
Las IA prefieren citar fuentes confiables. Muestra el autor del contenido, la fecha de publicación y actualización, y cita tus fuentes con enlaces. Una página "Quiénes somos" sólida y datos de contacto reales también ayudan.
5. Estructura el contenido para extraerlo
Usa listas y tablas. Cuando comparas opciones, una tabla es mucho más citable que un párrafo. Divide el texto en secciones autocontenidas: cada sección debe entenderse por sí sola, porque las IA recuperan fragmentos, no páginas completas.
6. Crea tu llms.txt
Un archivo /llms.txt en la raíz, con un resumen de tu sitio y enlaces a tus páginas clave, guía a los modelos hacia lo importante. Es un estándar emergente y fácil de implementar.
7. Mide y repite
Pregúntale tú mismo a ChatGPT y Perplexity por tu tema y mira si te mencionan. Revisa que tus datos estructurados sigan válidos y que ningún plugin o cambio haya vuelto a bloquear a los crawlers. El AEO es un proceso continuo, no una tarea de una sola vez.
Preguntas frecuentes
¿Puedo garantizar que ChatGPT cite mi sitio? +
No. Los modelos deciden sus fuentes y nadie puede garantizar una citación. Lo que sí se puede es optimizar todas las señales conocidas (acceso de crawlers, answer-first, datos estructurados, autoridad) para aumentar mucho tus probabilidades.
¿Tengo que bloquear a las IA para proteger mi contenido? +
Solo si no quieres aparecer en sus respuestas. Si tu objetivo es que te citen y te traigan tráfico, debes permitir el acceso de sus crawlers en robots.txt.
¿Qué es lo primero que debo revisar? +
Tu robots.txt: confirma que no bloquea a GPTBot, OAI-SearchBot, PerplexityBot ni Google-Extended. Si usas Cloudflare, revisa que no esté bloqueando a las IA por defecto.