Задача этой проверки не в том, чтобы понять, «нравится» ли ваш сайт ChatGPT. Цель конкретная: убедиться, что поисковый агент может получить страницу, понять её содержание и извлечь критичную информацию — цену, условия, адрес, дату, имя автора. Если хотя бы один из этих шагов сломан, сайт просто выпадает из AI-ответов, даже при хорошем SEO.
Ниже — структурированный процесс из трёх уровней: доступ краулера, индексация и рендеринг, диалоговая проверка восприятия.
Что такое OAI-SearchBot и зачем его проверять первым?
OAI-SearchBot против GPTBot: в чём разница
OAI-SearchBot — это поисковый краулер OpenAI, который собирает контент для показа в ChatGPT Search1. Он отличается от GPTBot: GPTBot обходит сайты для обучения моделей, а OAI-SearchBot — для показа ответов со ссылками2. Если вы заблокировали OAI-SearchBot в robots.txt, ваш сайт не будет появляться в ChatGPT Search в качестве источника2.
Важно: блокировка OAI-SearchBot и GPTBot — это разные политики с разными последствиями. Многие сайты по умолчанию блокируют «всех» AI-ботов и потом удивляются, почему их нет в ChatGPT-ответах.
Как проверить доступ краулера
- Откройте
robots.txtвашего сайта:https://ваш-сайт.ru/robots.txt - Убедитесь, что строки вида
Disallow: /не распространяются наOAI-SearchBot - Если есть правило
User-agent: *сDisallow: /— проверьте, что ниже есть явноеAllowдля нужных агентов - Проверьте, не блокирует ли ваш WAF или CDN запросы от AI User-Agent'ов: выполните
curl -A "OAI-SearchBot" https://ваш-сайт.ru/ключевая-страницаи убедитесь, что в ответе есть текстовое содержимое, а не страница 403 или CAPTCHA
Актуальный список User-agent токенов OpenAI — в официальной документации1.
Как убедиться, что страница проиндексирована и отдаёт читаемый HTML?
Страница должна быть проиндексирована и отдавать полный HTML — не пустой контейнер div#root, который наполняется только после выполнения JavaScript. ChatGPT Search даёт ответы со ссылками на релевантные веб-источники3, но для этого контент должен быть доступен на этапе краулинга, до рендеринга JS.
Используйте два инструмента:
Google URL Inspection: отрендеренная версия страницы
В Search Console этот инструмент показывает проиндексированную версию страницы и позволяет запустить тест «Проверить индексирование URL» на живом URL4. Инструмент отображает отрендеренную версию — именно так страницу видит GoogleBot4. Если отрендеренный вариант пустой или содержит заглушку — у AI-краулеров та же проблема.
Bing URL Inspection: охват через сторонний индекс
Bing URL Inspection проверяет краулинг, индексирование, SEO-параметры и разметку5. Это важно не только для Bing: ChatGPT Search использует сторонних поисковых провайдеров3, и присутствие в Bing-индексе расширяет охват. Подробнее об этом канале — в материале Bing и ChatGPT: зачем добавлять сайт в Bing Webmaster Tools.
Google Rich Results Test: валидность structured data
Google Rich Results Test проверяет доступность страницы и валидность структурированных данных6. Он покажет, какие schema-типы прочитаны правильно, а где ошибки.
| Инструмент | Что проверяет | Где найти |
|---|---|---|
| Google URL Inspection | Индексируемость, отрендеренный HTML, canonical | Google Search Console |
| Bing URL Inspection | Краулинг, индексирование, SEO, markup | Bing Webmaster Tools |
| Google Rich Results Test | Structured data, доступность страницы | search.google.com/test/rich-results6 |
| curl с OAI-SearchBot UA | Наличие текста в initial HTML, ответ CDN/WAF | Терминал / Postman |
Технические детали — JS-рендеринг и его влияние на AI-поиск — подробно разобраны в статье Почему сайт на JavaScript (SPA) не попадает в AI-ответы.
Как проверить, что ChatGPT правильно «понимает» содержание страницы?
Правильный вопрос — не «что видит», а «что извлекает». ChatGPT может получить страницу, но вытащить из неё не те факты или перепутать условия. Диалоговая проверка — это тест восприятия, а не гарантия индексации.
Откройте ChatGPT с включённым поиском и задайте конкретные промпты:
Промпт 1 — проверка критичных фактов
«Открой полный URL. Какая основная услуга, цена, условия доставки и оплаты? Какие конкретные фрагменты со страницы это подтверждают?»
Промпт 2 — проверка цитируемости
«Почему ты не процитировал мой сайт URL в ответе на запрос "запрос"? Назови вероятные причины.»
Промпт 3 — проверка качества фрагментов
«Какие 5 фрагментов с этой страницы URL ты бы использовал для ответа на вопрос "вопрос"?»
Что искать в ответах: правильно ли извлечены цена, условия, адрес, телефон, дата, имя автора? Ссылается ли ChatGPT на конкретные абзацы или даёт общее пересказывание? Если модель «угадывает» факты — значит, они плохо структурированы на странице.
Важно: ответ ChatGPT — это тест восприятия, не абсолютная истина. Диалог показывает, как модель интерпретирует страницу сейчас, а не является подтверждением реальной индексации или попадания в будущие ответы.
Структуру чанков — смысловых блоков, которые ChatGPT извлекает как автономные ответы — подробно разбирает статья Что такое чанк и как писать автономные чанки.
Какие ошибки встречаются чаще всего?
Чаще всего встречаются пять ошибок: проверка только главной страницы, общие вопросы вместо конкретных, игнорирование критичных фактов, путаница между GPTBot и OAI-SearchBot, и восприятие ответа ChatGPT как абсолютной гарантии. Яндекс Нейро поддерживает уточнения в диалоге и работу с многосоставными вопросами7, поэтому часть из этих проверок применима и к Яндексу — с поправкой на его собственный краулер и индекс.
Типичные ошибки при самостоятельной проверке:
- Проверять только главную страницу. ChatGPT извлекает контент со страниц, релевантных конкретному запросу. Проверяйте посадочные, карточки товаров, статьи.
- Задавать общий вопрос «что видишь?». Без конкретного интента ChatGPT даёт размытый пересказ. Спрашивайте о конкретных фактах.
- Не проверять критичную информацию. Именно цена, наличие, адрес, телефон, дата и условие — то, что пользователь ищет в AI-ответе и что ChatGPT должен уметь извлечь точно.
- Путать GPTBot и OAI-SearchBot. Блокировка GPTBot (обучение модели) не означает блокировку OAI-SearchBot (поиск и показ). Они управляются отдельными токенами1.
- Считать ответ ChatGPT гарантией. Диалог — диагностика восприятия. Это полезный инструмент, но не замена URL Inspection и анализу robots.txt.
Полный чек-лист: что проверить за один проход
Уровень 1 — Доступ краулера
robots.txt: OAI-SearchBot не заблокирован- WAF/CDN: не режет запросы с AI User-Agent
- curl-тест:
curl -A "OAI-SearchBot" [URL]возвращает текст статьи, а не ошибку
Уровень 2 — Индексация и рендеринг
- Google URL Inspection: страница проиндексирована, отрендеренный HTML содержит контент
- Bing URL Inspection: нет ошибок краулинга и разметки
- Rich Results Test: structured data валидна
- Initial HTML содержит h1, описание, canonical — без JS
Уровень 3 — Диалоговая проверка
- ChatGPT правильно называет цену, условия, адрес
- ChatGPT ссылается на конкретные фрагменты, а не пересказывает
- На вопрос «почему не цитируешь?» нет технических причин (закрыт, не найден, пустой HTML)
Техническую сторону аудита — robots.txt, рендеринг, доступность AI-ботов — детально описывает материал Технический аудит сайта под AI-поисковики.
Что делать, если ChatGPT «не видит» нужных фактов?
Если диалоговая проверка показала, что модель не извлекает критичные данные, причины обычно в одном из трёх:
- Технический барьер: краулер заблокирован, HTML пустой, CDN возвращает ошибку. Решается через чек-лист выше.
- Слабая структура контента: факты спрятаны в середине абзаца, нет прямого ответа в первом предложении, заголовок не совпадает с интентом. Решается переработкой чанков.
- Нет на странице вовсе: страница не содержит тех данных, которые ищет пользователь. Решается контентом, а не техникой.
О том, как построить контент, чтобы нейросети правильно понимали сигналы доверия — читайте в Оптимизация контента под GPT-поиск: расширенные заголовки и интенты.
Итог
Проверка видимости в ChatGPT — это трёхэтапный процесс: доступ краулера (robots.txt, WAF), индексация и рендеринг (Google/Bing Inspection, Rich Results Test), диалоговая проверка извлечения фактов. Ни один из этапов нельзя пропустить: технически открытый, но плохо структурированный сайт будет проиндексирован, но не процитирован.
Платформа GeoWatch автоматизирует часть этого процесса: прогоняет интенты по нейросетям, фиксирует, где бренд появляется, а где нет, и даёт конкретные рекомендации по устранению разрывов. Если хотите понять, как ChatGPT видит ваш сайт прямо сейчас — это можно проверить в рамках GEO-аудита.
Источники
Footnotes
- OpenAI — Bots documentation — developers.openai.com ↗ (дата доступа: 2026-06-03) ↩ ↩2 ↩3
- OpenAI — Bots documentation (OAI-SearchBot opt-out) — developers.openai.com ↗ (дата доступа: 2026-06-03) ↩ ↩2
- OpenAI — Introducing ChatGPT Search — openai.com ↗ (31 окт 2024) ↩ ↩2
- Google — URL Inspection Tool — support.google.com ↗ (дата доступа: 2026-06-03) ↩ ↩2
- Bing — URL Inspection — bing.com ↗ (дата доступа: 2026-06-03) ↩
- Google — Rich Results Test — search.google.com ↗ (дата доступа: 2026-06-03) ↩ ↩2
- Яндекс — Запуск Нейро — webmaster.yandex.ru ↗ (16 апр 2024) ↩
