Индексация

robots.txt: 7 типичных ошибок, из-за которых сайт пропадает из поиска

Разбираем частые ошибки в robots.txt малого бизнеса: закрытый сайт целиком, заблокированные CSS и JS, отсутствие sitemap. Как проверить за минуту.

2 мин чтения Кир
Готовый инструмент по теме: robots.txt валидатор

robots.txt — это маленький текстовый файл в корне сайта (example.ru/robots.txt), который подсказывает поисковым роботам, какие разделы можно обходить, а какие — нет. Файл крошечный, но одна строка в нём способна убрать из выдачи весь сайт. Ниже — ошибки, которые мы чаще всего находим при аудитах.

1. Случайно закрыт весь сайт

Самая дорогая ошибка. Часто остаётся с этапа разработки:

User-agent: *
Disallow: /

Disallow: / означает «не обходить ничего». Сайт открыт для людей, но невидим для Яндекса и Google. Проверяйте это первым делом после запуска и после каждого переезда с тестового домена.

2. Заблокированы CSS и JavaScript

Disallow: /assets/
Disallow: /wp-includes/

Раньше так «прятали» технические папки. Сегодня Google рендерит страницу как браузер и должен видеть стили и скрипты — иначе он считает страницу сломанной и хуже её ранжирует. Не закрывайте каталоги с CSS/JS.

3. Нет ссылки на sitemap

Директива Sitemap: помогает роботам найти карту сайта быстрее. Её отсутствие — не критично, но это упущенная возможность:

Sitemap: https://example.ru/sitemap.xml

Указывайте полный абсолютный URL, а не относительный путь.

4. robots.txt пытаются использовать как защиту

robots.txt — это рекомендация, а не запрет. Добросовестные роботы её соблюдают, но файл публичный, и закрытые в нём пути видны всем. Никогда не «прячьте» через него админки и приватные разделы — для этого нужны авторизация и заголовок noindex.

5. Путаница Disallow и noindex

  • Disallow в robots.txt — «не заходи на страницу».
  • noindex в мета-теге — «зайди, но не добавляй в индекс».

Если закрыть страницу через Disallow, робот не сможет прочитать noindex на ней — и парадоксально страница может остаться в выдаче (без описания). Чтобы убрать страницу из индекса, оставьте её открытой в robots.txt и поставьте <meta name="robots" content="noindex">.

6. Устаревшая директива Host

Host: example.ru

Host: использовалась Яндексом для указания главного зеркала, но отменена в 2018 году. Сейчас главное зеркало определяется 301-редиректами и rel="canonical". Директиву можно удалить.

7. Опечатки и неверный регистр

Disalow, User-Agnet, лишние пробелы — робот молча проигнорирует строку. Имена директив регистронезависимы, но пути (/Catalog//catalog/) — чувствительны к регистру.

Как проверить свой robots.txt

Открывать файл глазами и сверять с документацией долго и легко что-то пропустить. Мы сделали бесплатный валидатор robots.txt: вставляете содержимое или указываете URL — инструмент за секунду прогоняет 18 проверок и подсвечивает проблемные строки с объяснением, что и почему чинить.

А чтобы увидеть robots.txt в контексте всего технического SEO — запустите бесплатный аудит сайта: он проверит не только индексацию, но и скорость, мета-теги и разметку, и переведёт каждую находку на язык бизнеса.

  • #robots.txt
  • #индексация
  • #технический seo

← Все статьи

проверка сайта

Проверьте, как с этим на вашем сайте

Запустите бесплатный аудит — за 30 секунд проверим всё, о чём эта статья, и переведём каждую проблему на язык бизнеса.