Файл robots.txt играет важную роль в управлении индексацией вашего сайта поисковыми системами. В WordPress этот файл, как правило, создаётся автоматически, но стандартные настройки далеко не всегда подходят для конкретных целей SEO или безопасности. В этой статье мы подробно разберём, как изменить robots.txt без использования плагинов, что позволит сохранить контроль над файлами и избежать избыточных расширений.
Что такое robots.txt и зачем он нужен
Файл robots.txt — это простой текстовый файл, который размещается в корне сайта и сообщает поисковым роботам, какие страницы или разделы сайта могут быть проиндексированы, а какие — нет. Правильная настройка позволяет:
- Убрать из индексации технические страницы (например, админку, страницы входа, корзину и т.д.).
- Оптимизировать бюджет обхода поисковиков.
- Защитить от индексации дублирующегося контента.
В WordPress файл robots.txt может быть как реальным файлом в корне сайта, так и виртуальным, генерируемым системой. Если файла нет, WordPress автоматически отдаёт виртуальный robots.txt с базовыми правилами.
Где находится robots.txt в WordPress и как его изменить
По умолчанию в WordPress нет физического файла robots.txt в корне сайта, если вы его не создали вручную. Вместо этого движок создаёт виртуальный файл динамически. Это означает, что если вы внесёте реальные изменения, вам придётся создать физический robots.txt в корневой папке сайта по FTP или через файловый менеджер хостинга.
Для создания и изменения файла выполните следующие шаги:
- Подключитесь к серверу через FTP или воспользуйтесь файловым менеджером хостинга.
- Перейдите в корневую папку сайта (обычно
public_htmlилиwww). - Если файла
robots.txtнет, создайте новый текстовый файл с именемrobots.txt. - Откройте файл в редакторе и внесите нужные правила.
- Сохраните изменения и проверьте доступность файла по адресу
https://ваш-домен/robots.txt.
Пример базового файла robots.txt для WordPress
User-agent: *
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-login.php
Allow: /wp-admin/admin-ajax.php
Sitemap: https://ваш-домен/sitemap.xmlВ этом примере запрещается индексация административных и системных папок, но разрешается выполнение AJAX-запросов, а также указывается путь к карте сайта.
Динамическое изменение robots.txt через functions.php
Если вы не хотите создавать физический файл или хотите дополнить стандартный виртуальный robots.txt, можно воспользоваться фильтром robots_txt в WordPress. Это позволит программно изменить содержимое файла через тему.
Добавьте следующий код в файл functions.php активной темы:
function wpmanual_modify_robots_txt( $output, $public ) {
if ( $public ) {
$output .= "\nDisallow: /private-folder/";
$output .= "\nDisallow: /temp/";
}
return $output;
}
add_filter( 'robots_txt', 'wpmanual_modify_robots_txt', 10, 2 );Этот код добавляет запрет индексации двух дополнительных папок /private-folder/ и /temp/. Фильтр срабатывает только для публичного сайта.
Преимущества и ограничения метода
Преимущества:
- Не нужно создавать физический файл.
- Изменения централизованы в коде темы.
- Легко модифицировать через код.
Ограничения:
- Изменения исчезнут при смене темы, если не использовать дочернюю тему.
- Некоторые плагины SEO могут переопределять robots.txt.
Практические советы по созданию robots.txt для WordPress
1. Запрещайте индексацию админки. Это простой и обязательный шаг для безопасности и уменьшения нагрузки поисковиков.
2. Не блокируйте важные для индексации страницы. Например, если у вас интернет-магазин, не блокируйте категории и товары.
3. Указывайте путь к sitemap.xml. Большинство SEO-плагинов, таких как Yoast SEO, создают карту сайта — важно добавить её в robots.txt для ускорения индексации.
4. Используйте онлайн-валидаторы для проверки синтаксиса вашего robots.txt.
Использование плагинов для управления robots.txt — когда это нужно
Хотя наша задача — обойтись без плагинов, иногда стоит упомянуть, что для тех, кто предпочитает GUI, существуют плагины:
- Clearfy Pro — мощный плагин для оптимизации и безопасности WordPress, в котором есть удобный редактор
robots.txt. - Yoast SEO — позволяет редактировать robots.txt прямо из админки.
Однако использование плагинов увеличивает нагрузку и сложность, поэтому в простых ситуациях лучше управлять файлом вручную или через фильтр.
Проверка изменений и тестирование robots.txt
После внесения изменений обязательно проверьте файл:
- Откройте
https://ваш-домен/robots.txtв браузере и убедитесь, что содержимое соответствует ожиданиям. - Воспользуйтесь инструментами Google Search Console — раздел «Файл robots.txt» для тестирования.
- Проверьте, что запрещённые страницы действительно не индексируются через поиск или оператор
site:ваш-домен + url.
Если что-то не работает, проверьте синтаксис файла и убедитесь, что нет конфликтов с другими плагинами.