SEO

Что значит Индексируемость (Indexability) страницы донора

Наконец-то в 2021 году на конференциях начали говорить, что ваши ссылки не имеют влияния на поисковик, если они не попадают в его индекс. Такими темпами скоро и до попадания в консоль доноров дойдет (для этого кстати индексация не обязательна).

1. Проверку технических параметров индексируемости, которые написаны ниже, необходимо делать под User-agent‘ом нужного вам поисковика. Идеально, если PTR запись вашего парсера тоже будет отвечать стандартным требованиям ПС.

Эта реализация требует скилла у вебмастера выше, чем в среднем по биржам и на PBN-маркетах, но сами биржи не делают этих проверок, и даже при аутриче эта схема встречается.

2. Ответы сервера, которые отличаются от 200. Таких ссылок в Ahrefs около 10-15%.

  • 301 и 302 (со временем ПС 302 приравнивают к 301) нужно анализировать количество редиректов (в эти же цепочки редиректов попадают <meta> тег canonical). Мы при анализе разрываем цикл на 5 странице (потеря PageRank на одном редиректе 15% = 55% на 5 редиректе). Google проходит 20 редиректов. 
  • 40Х-50Х тут ситуация чаще всего такая, что Google не выкидывает страницу из поиска и будет к ней возвращаться. Поэтому, если это был сбой сервера, и ваш донор снова заработает, то Google его наверняка найдет. Мы даем шанс сайту и делаем в сумме 3 проверки.
  • 410 — Google не будет заходить на эту страницу. Пока не будет новых ссылок. И мы обычно сразу считаем ее мусором.
  • 307 — и дата обновления контента Last-Modified, которая была раньше вставки вашей ссылки. Такое на практике бывает при аутриче в старые статьи и ошибках в работе сайта. Обычно всплывает при анализе консоли и почему там нет ссылки. Но тут же есть возможность для фрода.

3. Открытые robots страницы донора для вашего UserAgent. Тут все очевидно:

  • robots.txt
  • HTTP заголовок X-Robots-Tag
  • <meta> тег robots

в Ahrefs есть много ссылок (около 10-15% зависит от тематики и проекта), которые закрыты для GoogleBot. Достаточно часто вебмастера сайтов доноров прячут страницы с внешними ссылками от поисковиков, поскольку они редко отвечают целям монетизации их проектов, причем чаще всего они это делают со временем. При этом если вы зайдете не под GoogleBot user agent’ом, то контент может быть открыт на индексирование для Google.

4. <meta> тег canonical. Он работает в цикле с 301-302. Тут важно только убрать зеркальные варианты написания ссылок www/index.ххх/слеш/точка абсолютные и относительные ссылки. Проверять нужно конец цепочки.

5. Фильтры на домене доноре. Если сайт под фильтрами, то как бы вы не старались, ваша страница с ссылкой не попадет в индекс. Обычно при этом в индексе домена остается меньше 20 страниц.

6. Рейтинг домена донора (важно, но не критично). Но если донор выбрал весь индекс, который дает ему Google по рейтингу то, чтобы ваша страница попала в индекс, она должна быть лучше, чем те страницы, что есть сейчас в индексе. Особенно это актуально, когда в индексе 30 000 страниц, а на доноре 3 млн. страниц. И вам нужно сделать страницу, которая будет в ТОП 1% по важности на домене.

7. Антисопливый (anti-Supplemental) контент (важно, но не критично). В реалиях 2022 Google отказывается держать в индексе бесполезные страницы для него (просканировано, но не проиндексировано). Но этот пункт всегда можно обойти добавив важности странице — Tier2 dofollow ссылками (иногда их неоправданно много необходимо).

8. Технические ошибки на странице. Есть целый ряд различных ошибок в JavaScript, верстке, серверных библиотеках и т.д., которые могут не давать индексировать страницу. Эту штуку находишь, если донор это ваш PBN-сайт, либо это дорогая ссылка на которую залили много Tier2, а она не лезет в консоль.

Если ваша ссылка не может попасть в индекс, то вы потратили деньги на ветер. Большинство параметров индексируемости можно предугадать до начала работы с донором. Другие данные нужно отслеживать после простановки, чтобы понимать почему донор выпал и можно ли его вернуть в индекс.

Теги
Кнопка «Наверх»
Закрыть
Закрыть