Qué es llms.txt y cómo crear el tuyo
Qué es el archivo llms.txt, cómo crear el tuyo paso a paso y la verdad sobre su adopción: por qué hoy es una apuesta de bajo costo y bajo impacto.

Si investigaste sobre GEO, seguro te cruzaste con el llms.txt y con la promesa de que es "la clave para aparecer en la IA". La realidad es más matizada: es un archivo fácil de crear, pero su efecto real hoy está en discusión. Te contamos qué es, cómo crearlo y, sobre todo, qué esperar de verdad.
llms.txt es un archivo de texto (en Markdown) que ponés en la raíz de tu dominio (tudominio.com/llms.txt) para darle a los LLMs una guía curada de tu contenido más importante. Es una convención de la comunidad, no un estándar oficial, y al día de hoy ningún gran proveedor de IA confirmó usarlo para citar o rankear: los estudios no muestran mejora de visibilidad. Conclusión honesta: es una apuesta de bajo costo y bajo impacto. Crealo si te sale gratis o casi, pero no esperes magia.
¿Qué es llms.txt?
Es una propuesta de septiembre de 2024, de Jeremy Howard, para ayudar a los modelos a entender tu sitio. La idea: en vez de hacer que la IA pelee contra tu HTML lleno de navegación, scripts y publicidad, le ofrecés un archivo limpio en Markdown que apunta a tu contenido clave con descripciones de una línea.
Cómo se ve
Es un Markdown simple:
- Un título (H1) con el nombre del sitio o la marca.
- Un resumen breve, en formato cita, de qué es.
- Secciones con enlaces a tus páginas más importantes, cada una con una descripción de una línea.
Empresas como Anthropic, Stripe o Supabase publican uno, sobre todo para su documentación.
llms.txt no es robots.txt
Es el error más común. El robots.txt controla el acceso: qué pueden rastrear los bots. El llms.txt no bloquea nada; es una guía de contenido que dice "esto es lo importante de mi sitio". Si lo que querés es controlar a los crawlers de IA, eso se hace en el robots.txt, no acá.
La verdad sobre su adopción
Acá conviene ser franco, porque hay mucho hype:
- Es una convención de la comunidad (no W3C ni IETF) y no tiene mecanismo de cumplimiento.
- Según un estudio de SE Ranking sobre 300.000 dominios, lo tiene cerca del 10% de los sitios.
- Al primer trimestre de 2026, ningún gran proveedor (OpenAI, Google, Anthropic, Meta, Mistral) confirmó públicamente leerlo o actuar en base a él en producción. GPTBot a veces lo descarga, pero eso no equivale a que influya en las citas.
- Google aclaró, vía John Mueller, que su búsqueda no lo usa ni lo respalda; apareció en sitios de Google por una actualización del CMS, no por ser una señal.
- Los estudios de citas no muestran mejora medible por tenerlo.
¿Conviene crearlo?
Sí, si te sale barato. Es una apuesta de bajo costo y bajo impacto: no te va a dar un salto de visibilidad, pero tampoco te hace daño, y tiene cierta opcionalidad si la adopción crece. Donde sí tiene valor real hoy es para documentación y agentes: servir Markdown limpio reduce mucho el ruido y los tokens para los sistemas que sí lo consumen. Si tu sitio puede autogenerarlo desde el sitemap, hacelo; si implica un proyecto grande, no es prioridad.
Cómo crear el tuyo, paso a paso
- Creá un archivo de texto y publicalo en tudominio.com/llms.txt.
- Arriba, un H1 con el nombre de tu marca y un resumen de una o dos oraciones en formato cita.
- Listá tus páginas clave por secciones, cada enlace con una descripción de una línea. Curado, no todo: no metas cada post del blog.
- Mantenelo por debajo de unos 200.000 tokens para que un modelo lo procese de una sola vez.
- Seguridad: que no sea editable públicamente. Un llms.txt manipulable es un vector de inyección de prompts; tratalo con el mismo cuidado que tu robots.txt.
Errores comunes
- Creer que bloquea o controla el acceso (eso es robots.txt).
- Copiar cada página del sitio como Markdown: no hace falta y lo ensucia.
- Esperar un salto de visibilidad: no hay evidencia.
- Dejarlo editable públicamente: riesgo de seguridad.
Preguntas frecuentes
¿Sirve para aparecer más en ChatGPT?
No hay evidencia de que mejore las citas hoy; es de bajo impacto.
¿Es lo mismo que robots.txt?
No. El robots.txt controla el acceso; el llms.txt es una guía de contenido.
¿Lo usan los LLMs?
Ningún gran proveedor confirmó usarlo en producción; algunos bots lo descargan a veces.
Entonces, ¿para qué lo creo?
Por su bajo costo y su opcionalidad, y porque sirve para documentación y agentes que sí lo consumen.
¿Me puede perjudicar?
No, salvo que lo dejes editable y permitas una inyección de prompts.

Escrito por
Federico Ergang
Co-fundador de Cliro y CEO
Federico Ergang es co-fundador y CEO de Cliro, plataforma de visibilidad en IA y GEO para Latinoamérica.
Artículos relacionados
robots.txt para crawlers de IA: GPTBot, ClaudeBot y más
Qué crawlers de IA existen, cuáles dejar entrar y cómo configurar tu robots.txt para que la IA pueda citarte. Con plantillas listas para copiar.
Errores comunes de GEO (y cómo evitarlos)
Los 8 errores de GEO que más sacan a las marcas de las respuestas de IA, y cómo evitarlos: bloquear crawlers, enterrar la respuesta, no medir y más.
Qué es GEO (Generative Engine Optimization): guía completa
GEO (Generative Engine Optimization) es optimizar tu marca para aparecer en las respuestas de ChatGPT, Gemini y otras IA. Qué es, por qué importa, cómo hacerlo y cómo medirlo.
