Интерактивный тренажёр по robots.txt

Материал не ориентирован на аудиторию SEO-гуру

Интерактивный тренажёр по robots.txt В январе 2006 г. на заре своего существования SEOnews опубликовал подробную инструкцию по использованию файла robots.txt. И вот спустя 7 лет аудитории сайта предоставляется возможность закрепить знания или проверить усвоенность материала. Уилл Критчлоу (Will Critchlow), основатель и владелец SEO-компании Distilled, разработал и опубликовал на SEOmoz обучающий интерактивный гид по robots.txt.

Вводный инструктаж

Robots.txt – это простой текстовый файл, располагающийся в корневом каталоге домена (www.example.com/robots.txt). Являясь общепризнанным стандартом, он позволяет вебмастерам регулировать все виды автоматического использования сайта – в частности, ограничивать доступ поисковым роботам к содержимому сайта (запрещать сканирование и индексирование).

Каждый из уроков интерактивного учебника по robots.txt завершается практическим заданием. Чтобы проэкзаменовать себя, исправляйте строки команд в полях в соответствии с инструкциями. Если введённый Вами ответ окажется правильным, поле окрасится в зелёный цвет.

Урок 1. Базовое исключение

Теоретическая часть:

Наиболее распространённый сценарий использования robots.txt – это блокировка доступа роботам к определённым страницам. Самый простой вариант – применение правила для всех роботов (агентов пользователя), прописываемое в виде строки User-agent: *. Все последующие за ней строки содержат предписания на запрет сканирования и индексирования конкретных страниц, файлов, каталогов – они начинаются с Disallow: /. Так, например, нижеприведённый код блокирует роботам доступ к /secret.html.

Практическое задание:

Внесите ещё одно предписание, чтобы заблокировать доступ к /secret2.html в дополнение к /secret.html.

User-agent: * Disallow: /secret.html

Урок 2: Исключение каталогов

Теоретическая часть:

Если вы заканчиваете предписание на закрытие от поисковых роботов косым слэшем ("/"), например, так: Disallow: /private/, будет заблокировано всё содержимое данного каталога.

Практическое задание:

Измените правила исключения в нижеприведённой строке, чтобы заблокировать папку под названием secret, вместо страницы secret.html.

User-agent: * Disallow: /secret.html

Урок 3: Разрешение отдельных траекторий

Теоретическая часть:

В дополнение к запрету доступа к конкретным траекториям (ссылкам) синтаксис robots.txt позволяет открывать доступ к отдельным файлам, страницам, каталогам. Необходимо отметить, что доступ поисковым роботам открыт по умолчанию, так что, если в файле нет никаких указаний от вебмастера, все пути для googlebot и его коллег открыты.

Основное применение директивы Allow: – это исключение отдельных страниц/элементов из общего предписания по Disallow:. Закон приоритетного правила гласит:

Наиболее конкретное правило, определяющееся по длине записи [пути], будет превалировать над менее конкретным (более коротким) правилом. Порядок приоритетности предписаний с шаблонами не определён.

Практическое задание:

Подкорректируйте исключение папки /secret/ внизу, разрешив роботам с помощью правила Allow: доступ к /secret/not-secret.html. Поскольку это правило длиннее, ему будет придаваться первостепенное значение.

User-agent: * Disallow: /secret/

Урок 4: Ограничения для отдельных Агентов пользователя

Теоретическая часть:

Каждая из вышерассмотренных директив одинаково распространялась на всех роботов. Такое предписание было заложено в строке User-agent: *, с которой начиналась каждая команда. Заменив * на название конкретного робота, можно создавать правила, касающиеся исключительно его одного.

Практическое задание:

Замените * на googlebot в нижеприведённом примере, чтобы запретить доступ к папке /secret/ одному только роботу Google и открыть для роботов остальных ПС.

User-agent: * Disallow: /secret/

Урок 5: Добавление множественной блокировки

Теоретическая часть:

Можно создавать сразу несколько блоков команд, ориентированных на различные группы роботов. Нижеприведённый пример robots.txt разрешает доступ googlebot ко всем файлам, за исключением тех, которые включены в каталог /secret/, и запрещает всем остальным роботам доступ к сайту в целом. Поскольку имеется набор директив, направленных конкретно на googlebot, googlebot полностью будет игнорировать команды, распространяющиеся на всех роботов сразу. Это свидетельствует о невозможности создания персональных исключений на базе общих предписаний. Если Вы хотите задать правила для отдельно взятых роботов, следует создавать отдельные предписания для каждого из них поимённо.

Практическое задание:

Добавьте второй блок директив, направленный на всех роботов (User-agent: *), который блокирует весь сайт (Disallow: /). Это позволит создать файл robots.txt, который запрещает доступ ко всему сайту всем веб-паукам, за исключением googlebot. Он, согласно первому – персональному – предписанию, может сканировать все страницы, кроме тех, что в папке /secret/. (Каждую директиву прописываем с новой строки!)

User-agent: googlebot Disallow: /secret/

Урок 6: Использование более конкретных User Agents

Теоретическая часть:

Бывают случаи, когда необходимо контролировать поведение отдельных краулеров, таких как паук Google-картинок, отдельно от основного робота Google. Для того чтобы реализовать это в robots.txt, приходится прописывать для каждого из краулеров (как для отдельного User-agent) прямые предписания. К примеру, если при наличии блока инструкций для googlebot есть отдельный для googlebot-images, картиночный паук будет руководствоваться последним. Если же нет персональных указаний для googlebot-images (или других специальных роботов Google), этот краулер будет подчиняться общим директивам для googlebot.

Практическое задание:

В нижеследующем примере robots.txt googlebot-images будет подчиняться директивам для googlebot (т.е. не будет сканировать папку /secret/). Измените предписание так, чтобы инструкции для googlebot (и googlebot-news и т.д.) остались теми же, а для googlebot-images появилось отдельное предписание, запрещающее доступ к папкам /secret/ и /copyright/. (Каждую директиву прописываем с новой строки!)

User-agent: googlebot Disallow: /secret/

Урок 7: Основные шаблоны

Теоретическая часть:

Завершающие строку шаблоны (обозначенные *) игнорируются: Disallow: /private* считывается так же, как и Disallow: /private. Тем не менее, такие шаблоны эффективны для работы с несколькими видами страниц одновременно. Символ звёздочка (*) обозначает любую (в том числе пустую) последовательность любых валидных символов (включая /, ? и т.д.).

К примеру, Disallow: news*.html блокирует:

news.html
news1.html
news1234.html
newsy.html
news1234.html?id=1

Однако оставляет доступным:

newshtml из-за отсутствия «.»
News.html из-за чувствительности к регистру
/directory/news.html

Практическое задание:

Исправьте нижеприведённую схему, чтобы заблокировать в директории blog только те страницы, которые заканчиваются на .html, вместо блокировки каталога целиком.

User-agent: * Disallow: /blog/

Урок 8: Блокировка конкретных параметров

Теоретическая часть:

В числе распространённых вариантов использования шаблонов находится и блокировка конкретных параметров. Например, один из способов обработки фасетной навигации – это блокировка комбинаций из 4-х и более фасетов (параметров). К примеру, можно добавить в своей системе такой параметр для всех комбинаций из 4+ фасетов как ?crawl=no. Это будет означать, к примеру, что URL для 3-х параметров может быть /facet1/facet2/facet3/, но, когда добавится 4-ый, он превратится в /facet1/facet2/facet3/facet4/?crawl=no.

Правило блокировки для роботов в данном случае должно выглядеть как *crawl=no (не *?crawl=no).

Практическое задание:

Добавьте правило Disallow: в robots.txt внизу, чтобы предотвратить сканирование всех страниц, которые содержат crawl=no.

User-agent: * Disallow: /secret/

Урок 9: Работа с целыми именами файлов

Теоретическая часть:

Пример исключения папок, в котором модели /private/ будут соответствовать траектории всех файлов, принадлежащих этой папке (в частности, /private/privatefile.html), показал, что по умолчанию образцы, указанные в robots.txt, соответствуют лишь части имени файла и не позволяют ничему идти после второго слэша, даже без специально заданных шаблонов.

Бывают случаи, когда необходимо закрыть от сканирования и индексации отдельные имена файлов целиком (с шаблонами или без них). Например, следующий образец robots.txt выглядит как предотвращение сканирования jpg-файлов, но на самом деле также предотвращает сканирование файла под именем explanation-of-.jpg.html, так как он тоже соответствует шаблону.

Если Вам нужен шаблон, задающий соответствие конечных символов URL-адреса (имени файла), заканчивайте командную строку знаком $. К примеру, изменение исключения с Disallow: /private.html на Disallow: /private.html$ нарушит шаблонное соответствие /private.html?sort=asc и, следовательно, позволит сканировать эту страницу.

Практическое задание:

Измените нижеприведённый шаблон, чтобы исключить действующие .jpg-файлы (т.е. те, которые заканчиваются .jpg).

User-agent: * Disallow: *.jpg

Урок 10: Добавление XML Карты сайта

Теоретическая часть:

Последняя строка многих файлов robots.txt является директивой, указывающей местоположение XML Карты сайта. Существует множество причин для включения Sitemap для вашего сайта, а также для включения её в Ваш файл robots.txt. Указать местоположение вашей sitemap можно с помощью директивы Sitemap: <ссылка>.

Практическое задание:

Добавьте директиву Sitemap в нижеприведённый robots.txt для карты сайта под названием my-sitemap.xml, которую можно найти по адресу http://www.distilled.net/my-sitemap.xml.

User-agent: * Disallow: /private/

Урок 11: Добавление Sitemap для Видео

Теоретическая часть:

На самом деле Вы можете добавить несколько XML Карт сайта (каждую отдельной строкой), используя тот же синтаксис.

Практическое задание:

Измените нижеприведённый robots.txt, чтобы включить в него video sitemap под названием my-video-sitemap.xml, располагающуюся в /my-video-sitemap.xml.

User-agent: * Disallow: /private/ Sitemap: /my-sitemap.xml

21379.jpg

Комментарии

Добавить комментарий / отзыв

Статьи по теме

Как продвигать сайты-аффилиаты в поиске

Оглавление Определение аффилиатов (сайтов одного владельца) Аффилиаты – проблемы и рис�...

2023-08-10

SEO-продвижение сайтов медицинской тематики: лучшие стратегии и практики

Оглавление Определение целевой аудитории и ключевых слов Создание качественного и уник...

2023-08-10

Смысловая уникальность контента: как писать тексты, учитывая всеобщие требования?

Появление новых алгоритмов существенно усложняет жизнь владельцам сайтов. С каждым годом создавать уникальные тексты становится всё т�...

2019-06-07

Таргетированная реклама: из-за чего она оказывается неэффективной?

Таргетированная реклама − один из наиболее эффективных инструментов для продвижения товаров и услуг вашей компании на интернет-просто...

2019-04-17

Отчёты в Google Analytics: как с ними работать?

Google Analytics − полезный многофункциональный сервис, который позволяет получить статистику посещений интернет-сайта. Отчёты имеют свою спе...

2019-02-12

Google Analytics: специфика системы и особенности работы с ней

Система Google Analytics − продукт, который позволяет собрать и упорядочить данные о том, как именно ведут себя гости на вашем сайте. Если вы ран...

2018-12-13

Ретаргетинг на клиентские базы: как правильно настроить «догоняющую» рекламу

Начиная обсуждение этой темы, проведём аналогию с одной ситуацией из жизни. Представьте, что вы обращаетесь к врачу с жалобами на крайне ...

2018-11-09

Google Merchant Center: особенности размещения магазина

Размещение товарной рекламы − актуальный процесс для компаний. Потенциальные покупатели, выбирая ту или иную продукцию, часто пользуют...

2018-09-24

Фильтры Яндекса: как не попасть под их действие?

Яндекс − активный борец за естественность контента на сайтах и честность продвижения интернет-ресурсов. Чтобы сделать выдачу максимал�...

2018-06-26

Теги h1-h6: как их правильно прописать?

Заголовок представляет собой броское, привлекающее внимание название, в котором заключён смысл всей публикации или её отдельной части. ...

2018-06-20

Сниппет Яндекса: последние изменения

Яндекс продолжает совершать шаги в сторону улучшения качества поиска сведений. Последние трансформации коснулись сниппета. В частност�...

2018-05-31

Увеличение трафика на сайт: ищите помощь у конкурентов

Одна из первоочередных целей, которые ставятся перед веб-сайтом, − привлечение максимально возможного числа посетителей. Добиться этог...

2018-05-11

Формирование семантического ядра для рекламной кампании

Одним из начальных этапов запуска контекстной рекламы является подготовка семантического ядра − базы ключей, которые будут использова...

2018-04-11

Оптимизация сайта под голосовой поиск

В данный момент алгоритмы распознавания человеческой речи находятся на пике популярности, что обусловливает активное использование го...

2017-10-25

Яндекс.Директ: что нового?

За последний год Яндекс существенно изменился, причём некоторые трансформации с уверенностью можно отнести к категории глобальных. Теп...

2017-05-18

| Материал не ориентирован на аудиторию SEO-гуру В январе 2006 г. на заре своего существования SEOnews опубликовал подробную инструкцию по использованию файла robots.txt. И вот спустя 7 лет аудитории | РэдЛайн, создание сайта, заказать сайт, разработка сайтов, реклама в Интернете, продвижение, маркетинговые исследования, дизайн студия, веб дизайн, раскрутка сайта, создать сайт компании, сделать сайт, создание сайтов, изготовление сайта, обслуживание сайтов, изготовление сайтов, заказать интернет сайт, создать сайт, изготовить сайт, разработка сайта, web студия, создание веб сайта, поддержка сайта, сайт на заказ, сопровождение сайта, дизайн сайта, сайт под ключ, заказ сайта, реклама сайта, хостинг, регистрация доменов, хабаровск, краснодар, москва, комсомольск |

Дайджест новых статей по интернет-маркетингу на ваш email

Продающие сайты "под ключ"!

Наши сайты зарабытывают вам деньги. Landing-page. Эффективные продающие сайты точно в срок и под ключ! Всего от 14700 рублей
Подробнее...

Интернет-магазины и каталоги "под ключ"!

Эффективные и удобные инструменты торговли (электронной торговли) "под ключ". Продают, даже когда вы спите! Всего от 33800 рублей
Подробнее...

Комплексный интернет-маркетинг и продвижение сайтов

Максимальную эффективность дает не какой-то конкретный метод, а их комбинация. Комбинация таких методов и называется комплексным интернет-маркетингом. Всего от 8000 рублей в месяц
Подробнее...

Скидка 50% на разработку логотипа

Профессиональный логотип поможет вашему бизнесу привлечь новых покупателей и усилить их приверженность к торговой марке, а также повысить доверие, так как он работает на вас 24 часа в сутки. В заключение к этому можно сказать, что лoготип занимает центральное место в индивидуальности компании.
Подробнее...

Реклама в Yandex и Google

Контекстная реклама нацелена лишь на тех пользователей, которые непосредственно заинтересованы в рекламе Ваших услуг или товаров. Всего от 8000 рублей в месяц
Подробнее...

Social media marketing (SMM) — продвижение в социальных медиа

Реклама в Однокласcниках и на Mail.ru Создание, ведение и раскрутка групп и реклама ВКонтакте и Facebook. Всего от 8000 рублей в месяц
Подробнее...

Приглашаем к сотрудничеству рекламные агентства и веб-студии!

Внимание Акция! Приглашаем к сотрудничеству рекламные агентства и различные веб-студии России! Индивидуальные и взаимовыгодные условия сотрудничества.
Подробнее...

Ускоренная разработка любого сайта от 5 дней!

Внимание Акция! Ускоренная разработка любого сайта! Ваш сайт будет готов за 5-10 дней. Вы можете заказать разработку любого сайта "под ключ" за 5-10 рабочих дней, с доплатой всего 30% от его стоимости!
Подробнее...

Ждем новых друзей!

Внимание Акция! Ждем новых друзей! Скидка 10% на услуги по созданию и(или) обслуживанию вашего сайта при переходе к нам от другого разработчика.
Подробнее...

Приведи друга и получи скидку!

Внимание Акция! Приведи друга и получи скидку! Скидка 10% на услуги по созданию и(или) обслуживанию вашего сайта, если клиент заказавший наши услуги, пришел по Вашей рекомендации.
Подробнее...

1 2 3 4 5 6 7 8 9

Смотреть все акции и спец. предложения Оставить заявку на заказ!

Новые статьи и публикации

2024-04-17 » 23 сервиса для эффективного экспресс-аудита любого сайта
2024-04-08 » Яндекс переходит на новую версию Wordstat
2024-04-08 » Яндекс интегрировал в свой облачный сервис эмпатичную нейросеть
2024-04-08 » Новая версия нейросети Claude превзошла по мощности аналоги Google и OpenAI
2024-04-08 » Как пользоваться GPT 4 и Claude бесплатно и без VPN
2024-03-13 » Стратегии SEO на 2024 год
2024-03-13 » Как использовать анимацию с помощью JavaScript-библиотеки GSAP
2024-03-13 » Использование GSAP 3 для веб-анимации
2024-03-13 » Cогласование топографической съёмки с эксплуатирующими организациями
2024-02-19 » Теряются лиды? Как настроить сквозную аналитику
2024-02-17 » Мерч и IT: на что обратить внимание в 2024 году
2024-02-16 » Копируем с RSync: основные примеры синхронизации файлов
2024-02-15 » Лучшие noCode AI платформы для создания диалоговых ботов
2024-02-14 » Факторы ранжирования Google 2024 — исследование Semrush
2024-02-12 » Перенос сайта на другой хостинг
2024-02-05 » В России сформирован реестр хостинг-провайдеров
2024-02-04 » Использование SSH для подключения к удаленному серверу Ubuntu
2024-02-03 » Подключаемся к серверу за NAT при помощи туннеля SSH. Простая и понятная инструкция
2024-02-02 » Настройка CI/CD для Gitlab-репозитория: схемы и гайд по шагам
2024-02-01 » GitLab CI Pipeline. Запуск сценария через SSH на удаленном сервере
2024-01-29 » Introduction to GitLab’s CI/CD for Continuous Deployments
2024-01-26 » Настройка GitLab CI/CD
2024-01-25 » Установка shell gitlab runner
2024-01-25 » Установка и регистрация gitlab-runner в docker контейнере
2024-01-25 » Переменные Gitlab-Ci
2024-01-25 » Настройка CI/CD в GitLab для синхронизации проекта с веб-серверами
2024-01-25 » Копирование файлов scp
2024-01-21 » Бездепозитные бонусы от казино: обзор условий и правил использования
2024-01-18 » Современная обработка ошибок в PHP
2024-01-18 » Пример шаблона проектирования MVC в PHP

Темы

Все мы сидим в сточной канаве, но некоторые при этом смотрят на звезды

Уайльд Оскар - (1854-1900) - английский писатель

Мы создаем сайты, которые работают! Профессионально обслуживаем и продвигаем их , а также по всей России и ближнему зарубежью с 2006 года!

Качественное и объемное представление своего бизнеса в Сети требуется любой растущей коммерческой структуре, стремящейся увеличить продажи, именно по этой причине среди наших клиентов как крупные так и небольшие компании во многих городах России и ближнего зарубежья.

Как мы работаем

Заявка
Позвоните или оставьте заявку на сайте.

Консультация
Обсуждаем что именно Вам нужно и помогаем определить как это лучше сделать!

Договор
Заключаем договор на оказание услуг, в котором прописаны условия и обязанности обеих сторон.

Выполнение работ
Непосредственно оказание требующихся услуг и работ по вашему заданию.

Поддержка
Сдача выполненых работ, последующие корректировки и поддержка при необходимости.

Остались еще вопросы? Просто позвоните и задайте их специалистам

8 (800) 550-9899

с 2:30 до 11:30 по Мск, звонок бесплатный
Или напишите нам в WhatsApp

8 (924) 311-3435

с 9:30 до 18:30 по Хабаровску
Или напишите нам в WhatsApp

Создание сайта	Копирайтинг
Поисковое продвижение	Контекстная реклама
Реклама в соц. сетях	Сопровождение сайта
Не знаю, посоветуйте

Смена дизайна сайта	Установка модулей
Чистка кода от вирусов	Внутренняя оптимизация
Перенос сайта	Установка аналитики
Нет в списке

Интерактивный тренажёр по robots.txt

Вводный инструктаж

Урок 1. Базовое исключение

Урок 2: Исключение каталогов

Урок 3: Разрешение отдельных траекторий

Урок 4: Ограничения для отдельных Агентов пользователя

Урок 5: Добавление множественной блокировки

Урок 6: Использование более конкретных User Agents

Урок 7: Основные шаблоны

Урок 8: Блокировка конкретных параметров

Урок 9: Работа с целыми именами файлов

Урок 10: Добавление XML Карты сайта

Урок 11: Добавление Sitemap для Видео

Статьи по теме

Дайджест новых статей по интернет-маркетингу на ваш email

Продающие сайты "под ключ"!

Интернет-магазины и каталоги "под ключ"!

Комплексный интернет-маркетинг и продвижение сайтов

Скидка 50% на разработку логотипа

Реклама в Yandex и Google

Social media marketing (SMM) — продвижение в социальных медиа

Приглашаем к сотрудничеству рекламные агентства и веб-студии!

Ускоренная разработка любого сайта от 5 дней!

Ждем новых друзей!

Приведи друга и получи скидку!

Новые статьи и публикации

Темы

Мы создаем сайты, которые работают! Профессионально обслуживаем и продвигаем их , а также по всей России и ближнему зарубежью с 2006 года!

Как мы работаем

Заказать услуги со скидкой \ Бесплатная консультация

КАКИЕ УСЛУГИ ВАС ИНТЕРЕСУЮТ?

КАКИЕ ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ ПОТРЕБУЮТСЯ?

Что нужно сделать, чтобы заказать создание сайта у нас?

Для всех тарифных планов на создание и размещение сайтов включено:

Комплексная раскрутка работает в рамках стратегии развития вашего бизнеса в сети и направлена

ЭФФЕКТИВНОЕ СОПРОВОЖДЕНИЕ (ПОДДЕРЖКА, ОБСЛУЖИВАНИЕ) САЙТОВ

Современный, технологичный, кроссбраузерный ... Профессиональный дизайн сайтов и веб-приложений

Адаптивный дизайн сайтов и веб-приложений

Реклама в поисковых системах Яндекс и Google. Профессиональная настройка рекламы и отслеживание эффективности!