Вокруг файла llms.txt снова спор. С одной стороны, Chrome Lighthouse уже добавил его проверку, и это читается как «Google рекомендует». С другой — Google Search прямо заявляет, что не использует llms.txt, а свежие логи показывают: 97% таких файлов не получают ни одного запроса. Разберём обе стороны честно и без культа, чтобы понять, стоит ли русскоязычному сайту тратить на это время.
Что такое llms.txt и зачем он задумывался?
Идея и формат файла
llms.txt предложил Jeremy Howard (Answer.AI) 3 сентября 2024 года1. Это не стандарт ранжирования и не аналог robots.txt, а Markdown-файл в корне сайта (обычно https://site.com/llms.txt), который помогает большим языковым моделям использовать сайт во время работы — даёт краткое описание и ссылки на важные материалы1.
Формат спецификации прост: файл лежит в корне, обязателен заголовок H1, далее опциональный blockquote с пояснением и секции H2 со списками ссылок1. Иногда рядом публикуют llms-full.txt — «полную» Markdown-выгрузку документации для прямого ingestion в контекст модели.
Чем llms.txt отличается от robots.txt
Спецификация специально различает два файла: robots.txt управляет допустимым доступом автоматических инструментов, а llms.txt даёт курируемый обзор и контекст для LLM1. Это разные задачи, и подменять одно другим — ошибка.
Правда ли, что Lighthouse рекомендует llms.txt?
Что именно добавил Lighthouse
Частично — и формулировка важна. Chrome Lighthouse действительно добавил проверку llms.txt в категорию agentic browsing audits2. Документация описывает llms.txt как формирующуюся конвенцию для машиночитаемого описания сайта, предназначенного для LLM и AI-агентов2.
Но статус проверки осторожный:
- если файла нет и сервер отдаёт 404 — аудит помечается как N/A, потому что файл пока опциональный2;
- проблему аудит фиксирует только если при попытке получить файл возникает ошибка сервера2.
То есть отсутствие llms.txt не «ломает» Lighthouse. Технически: категория agentic browsing появилась в Lighthouse 13.2.0, проверку llms.txt добавили там же, а в 13.3.0 категорию включили в конфигурацию по умолчанию3. Документация Chrome обновлена 5 мая 20262.
Нюанс с PageSpeed Insights
Ещё нюанс про PageSpeed Insights: в Lighthouse 13.4.0 (9 июня 2026) есть изменение, отключающее agentic-browsing в вызове PSI API3. Поэтому утверждение «PageSpeed Insights уже рекомендует llms.txt» нужно формулировать осторожно — связь с PSI может быть ограничена.
А Google Search его вообще использует?
Позиция Google Search
Нет — и это прямо сказано. Google Search Central пишет, что для Google Search можно игнорировать llms.txt и другую «специальную» разметку, потому что Google Search их не использует для появления в Search, включая генеративные функции4. В обновлениях Google уточняет: llms.txt не нужен для Google Search и не влияет на видимость или ранжирование ни положительно, ни отрицательно — но его можно поддерживать для других сервисов5.
Здесь и кроется источник путаницы: Lighthouse относится к готовности сайта для браузеров и агентов, а не к ранжированию в Google Search. Это две разные плоскости. О том, какие технические сигналы реально влияют на доступность сайта для AI, читайте в материале «Технический аудит сайта под AI-поисковики».
Что публикуют сами AI-платформы
Позиции остальных платформ неоднородны. Anthropic, OpenAI и Cloudflare публикуют llms.txt для своей документации678 — но публикация собственного файла не равна публичному обещанию, что их боты используют llms.txt чужих сайтов для цитирования или ранжирования.
Заходят ли боты на эти файлы?
Данные Ahrefs: 97% файлов без запросов
Это самая отрезвляющая часть. Самое крупное свежее исследование логов — Ahrefs, 15 июня 2026: изучили 137 210 доменов, получавших трафик в мае 20269.
| Показатель | Значение |
|---|---|
| Доменов с валидным llms.txt | 28%9 |
| Файлов, не получивших ни одного запроса в мае 2026 | 97%9 |
| Доменов, на которые пришёлся весь измеренный трафик к файлам | ~3% (≈1,1 тыс.)9 |
Авторы предупреждают: выборка SEO-aware, поэтому 28% — скорее верхняя граница распространённости, а не средняя по интернету9. То есть даже там, где файл поставили, в подавляющем большинстве случаев его никто не читает.
Кто на самом деле читает llms.txt
Отдельный эксперимент OtterlyAI (5 февраля 2026) на одном сайте за 90 дней зафиксировал 62 100+ визитов AI-ботов, но только 84 визита к /llms.txt — около 0,1% всего AI-bot-трафика10. Картина согласуется с Ahrefs: боты редко специально идут читать этот файл.
Важная деталь по тем редким случаям, когда llms.txt всё-таки читают: это часто не «LLM-поиск». В данных Ahrefs значительная доля обращений приходилась на не-AI-ботов — SEO-аудиторы, техпрофайлеры, обычные краулеры и боты предпросмотра ссылок.
Стоит ли ставить llms.txt русскоязычному сайту?
Когда файл оправдан, а когда нет
Это практический вывод, а не предписание — надёжного доказательства, что llms.txt повышает цитирование в нейросетях, в открытых источниках нет.
Короткий ответ: поставить можно как дешёвый задел на будущее, но не делать из этого ключевой GEO-проект.
Когда это оправдано:
- документация, SaaS, API, help-центр, сложные каталоги — там llms.txt даёт LLM понятную карту материалов;
- файл генерируется и обновляется автоматически за 30–60 минут;
- вы не выдаёте его за «обязательный GEO-фактор».
Когда смысла мало:
- обычный блог или локальный бизнес — боты, судя по логам, к файлу почти не ходят910;
- ради файла нужно вручную поддерживать огромную копию сайта и отвлекать разработку.
Что реально важно для рунета
По Яндексу официальной позиции уровня «использует / не использует llms.txt» в открытых источниках нет. Поэтому для рунета ставить файл можно, но нельзя продавать это как подтверждённый фактор Яндекса, Нейро или Алисы AI. Как на самом деле устроен AI-поиск Яндекса — в материале «Яндекс превращает поиск в интерфейс ответов».
Реальные приоритеты для русскоязычного сайта те же, что и были: индексируемый HTML без JS-ловушек, корректный robots.txt, sitemap.xml, schema.org, понятные страницы с фактами, датами и авторами. Почему сайт на SPA рискует вовсе не попасть в AI-ответы — в материале «Почему сайт на JavaScript (SPA) не попадает в AI-ответы».
Платформа GeoWatch смотрит не на наличие отдельного файла, а на то, находят ли, понимают ли и цитируют ли нейросети ваш сайт по релевантным интентам — и где вместо вас называют конкурентов. Если хотите проверить реальную AI-видимость, а не галочку в аудите, начните с GEO-аудита.
Какие мифы вокруг llms.txt чаще всего встречаются?
- «llms.txt — это новый robots.txt для AI» — нет. Спецификация про курируемый обзор и контекст, а не про запрет или разрешение доступа1. Доступом краулеров по-прежнему управляет robots.txt и серверные правила.
- «Раз Lighthouse советует — Google Search будет ранжировать выше» — нет. Lighthouse про готовность для агентов, а Google Search llms.txt не использует4.
- «Без llms.txt ломается Lighthouse» — нет. При 404 аудит даёт N/A, проблема — только ошибка сервера2.
- «Все крупные AI-боты уже читают llms.txt» — нет подтверждения. 97% валидных файлов не получили ни одного запроса в мае 20269.
- «llms.txt сам по себе улучшит AI-цитирования» — надёжного исследования причинной связи «поставили файл → выросли цитирования» в открытых источниках нет.
Источники
Footnotes
- Answer.AI / llmstxt.org — «The /llms.txt file» — https://llmstxt.org/ (3 сен 2024) ↩ ↩2 ↩3 ↩4 ↩5
- Chrome for Developers — «Lighthouse agentic browsing: llms.txt» — https://developer.chrome.com/docs/lighthouse/agentic-browsing/llms-txt (обновлено 5 мая 2026) ↩ ↩2 ↩3 ↩4 ↩5 ↩6
- GitHub — «Lighthouse Releases (13.2.0–13.4.0)» — https://github.com/GoogleChrome/lighthouse/releases (1 мая – 9 июня 2026) ↩ ↩2
- Google Developers — «AI optimization guide» — https://developers.google.com/search/docs/fundamentals/ai-optimization-guide (обновлено июнь 2026) ↩ ↩2
- Google Search Central — «Search updates: llms.txt» — https://developers.google.com/search/updates (июнь 2026) ↩
- Anthropic — «Writing tools for agents» — https://www.anthropic.com/engineering/writing-tools-for-agents (11 сен 2025) ↩
- OpenAI — «API docs llms.txt» — https://developers.openai.com/api/docs/llms.txt (дата доступа: 19 июня 2026) ↩
- Cloudflare — «Developer Documentation llms.txt» — https://developers.cloudflare.com/llms.txt (дата доступа: 19 июня 2026) ↩
- Ahrefs — «llms.txt Study (137K domains)» — https://ahrefs.com/blog/llmstxt-study/ (15 июня 2026) ↩ ↩2 ↩3 ↩4 ↩5 ↩6 ↩7
- OtterlyAI — «The llms.txt Experiment» — https://otterly.ai/blog/the-llms-txt-experiment/ (5 фев 2026) ↩ ↩2
