Вокруг файла llms.txt снова спор. С одной стороны, Chrome Lighthouse уже добавил его проверку, и это читается как «Google рекомендует». С другой — Google Search прямо заявляет, что не использует llms.txt, а свежие логи показывают: 97% таких файлов не получают ни одного запроса. Разберём обе стороны честно и без культа, чтобы понять, стоит ли русскоязычному сайту тратить на это время.

Что такое llms.txt и зачем он задумывался?

Идея и формат файла

llms.txt предложил Jeremy Howard (Answer.AI) 3 сентября 2024 года1. Это не стандарт ранжирования и не аналог robots.txt, а Markdown-файл в корне сайта (обычно https://site.com/llms.txt), который помогает большим языковым моделям использовать сайт во время работы — даёт краткое описание и ссылки на важные материалы1.

Формат спецификации прост: файл лежит в корне, обязателен заголовок H1, далее опциональный blockquote с пояснением и секции H2 со списками ссылок1. Иногда рядом публикуют llms-full.txt — «полную» Markdown-выгрузку документации для прямого ingestion в контекст модели.

Чем llms.txt отличается от robots.txt

Спецификация специально различает два файла: robots.txt управляет допустимым доступом автоматических инструментов, а llms.txt даёт курируемый обзор и контекст для LLM1. Это разные задачи, и подменять одно другим — ошибка.

Правда ли, что Lighthouse рекомендует llms.txt?

Что именно добавил Lighthouse

Частично — и формулировка важна. Chrome Lighthouse действительно добавил проверку llms.txt в категорию agentic browsing audits2. Документация описывает llms.txt как формирующуюся конвенцию для машиночитаемого описания сайта, предназначенного для LLM и AI-агентов2.

Но статус проверки осторожный:

  • если файла нет и сервер отдаёт 404 — аудит помечается как N/A, потому что файл пока опциональный2;
  • проблему аудит фиксирует только если при попытке получить файл возникает ошибка сервера2.

То есть отсутствие llms.txt не «ломает» Lighthouse. Технически: категория agentic browsing появилась в Lighthouse 13.2.0, проверку llms.txt добавили там же, а в 13.3.0 категорию включили в конфигурацию по умолчанию3. Документация Chrome обновлена 5 мая 20262.

Нюанс с PageSpeed Insights

Ещё нюанс про PageSpeed Insights: в Lighthouse 13.4.0 (9 июня 2026) есть изменение, отключающее agentic-browsing в вызове PSI API3. Поэтому утверждение «PageSpeed Insights уже рекомендует llms.txt» нужно формулировать осторожно — связь с PSI может быть ограничена.

А Google Search его вообще использует?

Нет — и это прямо сказано. Google Search Central пишет, что для Google Search можно игнорировать llms.txt и другую «специальную» разметку, потому что Google Search их не использует для появления в Search, включая генеративные функции4. В обновлениях Google уточняет: llms.txt не нужен для Google Search и не влияет на видимость или ранжирование ни положительно, ни отрицательно — но его можно поддерживать для других сервисов5.

Здесь и кроется источник путаницы: Lighthouse относится к готовности сайта для браузеров и агентов, а не к ранжированию в Google Search. Это две разные плоскости. О том, какие технические сигналы реально влияют на доступность сайта для AI, читайте в материале «Технический аудит сайта под AI-поисковики».

Что публикуют сами AI-платформы

Позиции остальных платформ неоднородны. Anthropic, OpenAI и Cloudflare публикуют llms.txt для своей документации678 — но публикация собственного файла не равна публичному обещанию, что их боты используют llms.txt чужих сайтов для цитирования или ранжирования.

Заходят ли боты на эти файлы?

Данные Ahrefs: 97% файлов без запросов

Это самая отрезвляющая часть. Самое крупное свежее исследование логов — Ahrefs, 15 июня 2026: изучили 137 210 доменов, получавших трафик в мае 20269.

ПоказательЗначение
Доменов с валидным llms.txt28%9
Файлов, не получивших ни одного запроса в мае 202697%9
Доменов, на которые пришёлся весь измеренный трафик к файлам~3% (≈1,1 тыс.)9

Авторы предупреждают: выборка SEO-aware, поэтому 28% — скорее верхняя граница распространённости, а не средняя по интернету9. То есть даже там, где файл поставили, в подавляющем большинстве случаев его никто не читает.

Кто на самом деле читает llms.txt

Отдельный эксперимент OtterlyAI (5 февраля 2026) на одном сайте за 90 дней зафиксировал 62 100+ визитов AI-ботов, но только 84 визита к /llms.txt — около 0,1% всего AI-bot-трафика10. Картина согласуется с Ahrefs: боты редко специально идут читать этот файл.

Важная деталь по тем редким случаям, когда llms.txt всё-таки читают: это часто не «LLM-поиск». В данных Ahrefs значительная доля обращений приходилась на не-AI-ботов — SEO-аудиторы, техпрофайлеры, обычные краулеры и боты предпросмотра ссылок.

Стоит ли ставить llms.txt русскоязычному сайту?

Когда файл оправдан, а когда нет

Это практический вывод, а не предписание — надёжного доказательства, что llms.txt повышает цитирование в нейросетях, в открытых источниках нет.

Короткий ответ: поставить можно как дешёвый задел на будущее, но не делать из этого ключевой GEO-проект.

Когда это оправдано:

  • документация, SaaS, API, help-центр, сложные каталоги — там llms.txt даёт LLM понятную карту материалов;
  • файл генерируется и обновляется автоматически за 30–60 минут;
  • вы не выдаёте его за «обязательный GEO-фактор».

Когда смысла мало:

  • обычный блог или локальный бизнес — боты, судя по логам, к файлу почти не ходят910;
  • ради файла нужно вручную поддерживать огромную копию сайта и отвлекать разработку.

Что реально важно для рунета

По Яндексу официальной позиции уровня «использует / не использует llms.txt» в открытых источниках нет. Поэтому для рунета ставить файл можно, но нельзя продавать это как подтверждённый фактор Яндекса, Нейро или Алисы AI. Как на самом деле устроен AI-поиск Яндекса — в материале «Яндекс превращает поиск в интерфейс ответов».

Реальные приоритеты для русскоязычного сайта те же, что и были: индексируемый HTML без JS-ловушек, корректный robots.txt, sitemap.xml, schema.org, понятные страницы с фактами, датами и авторами. Почему сайт на SPA рискует вовсе не попасть в AI-ответы — в материале «Почему сайт на JavaScript (SPA) не попадает в AI-ответы».

Платформа GeoWatch смотрит не на наличие отдельного файла, а на то, находят ли, понимают ли и цитируют ли нейросети ваш сайт по релевантным интентам — и где вместо вас называют конкурентов. Если хотите проверить реальную AI-видимость, а не галочку в аудите, начните с GEO-аудита.

Какие мифы вокруг llms.txt чаще всего встречаются?

  • «llms.txt — это новый robots.txt для AI» — нет. Спецификация про курируемый обзор и контекст, а не про запрет или разрешение доступа1. Доступом краулеров по-прежнему управляет robots.txt и серверные правила.
  • «Раз Lighthouse советует — Google Search будет ранжировать выше» — нет. Lighthouse про готовность для агентов, а Google Search llms.txt не использует4.
  • «Без llms.txt ломается Lighthouse» — нет. При 404 аудит даёт N/A, проблема — только ошибка сервера2.
  • «Все крупные AI-боты уже читают llms.txt» — нет подтверждения. 97% валидных файлов не получили ни одного запроса в мае 20269.
  • «llms.txt сам по себе улучшит AI-цитирования» — надёжного исследования причинной связи «поставили файл → выросли цитирования» в открытых источниках нет.

Источники

Footnotes

  1. Answer.AI / llmstxt.org — «The /llms.txt file» — https://llmstxt.org/ (3 сен 2024) 2 3 4 5
  2. Chrome for Developers — «Lighthouse agentic browsing: llms.txt» — https://developer.chrome.com/docs/lighthouse/agentic-browsing/llms-txt (обновлено 5 мая 2026) 2 3 4 5 6
  3. GitHub — «Lighthouse Releases (13.2.0–13.4.0)» — https://github.com/GoogleChrome/lighthouse/releases (1 мая – 9 июня 2026) 2
  4. Google Developers — «AI optimization guide» — https://developers.google.com/search/docs/fundamentals/ai-optimization-guide (обновлено июнь 2026) 2
  5. Google Search Central — «Search updates: llms.txt» — https://developers.google.com/search/updates (июнь 2026)
  6. Anthropic — «Writing tools for agents» — https://www.anthropic.com/engineering/writing-tools-for-agents (11 сен 2025)
  7. OpenAI — «API docs llms.txt» — https://developers.openai.com/api/docs/llms.txt (дата доступа: 19 июня 2026)
  8. Cloudflare — «Developer Documentation llms.txt» — https://developers.cloudflare.com/llms.txt (дата доступа: 19 июня 2026)
  9. Ahrefs — «llms.txt Study (137K domains)» — https://ahrefs.com/blog/llmstxt-study/ (15 июня 2026) 2 3 4 5 6 7
  10. OtterlyAI — «The llms.txt Experiment» — https://otterly.ai/blog/the-llms-txt-experiment/ (5 фев 2026) 2