Close

О том, почему PageRank прежнему важен в 2018

На днях получил по e-mail статью,
Beginner’s Guide to Google PageRank: How It Works & Why It Still Matters in 2018, опубликованную на SEO PowerSuite (оригинал). Автор Valerie Niechai.

Прочёл, понравилась. Решил сделать перевод.
В процессе — где-то постарался объяснить более понятно чем было, где-то уточнил, где-то добавил.
Получилось что-то вроде расширенной и дополненной версии оригинала.

Итак:

Google PageRank. Пособие для начинающих. Как он работает, и почему по прежнему важен в 2018 году

Цитата:

Когда малыш только родился, у них были грандиозные планы на его будущее!
Но уже вскоре они поняли, что их ребенок не собирается ни играть на скрипке, ни рыбачить с семьёй…
Вместо этого он увлекся тату, тяжёлым роком, прыжками с парашютом, начал водится с плохой компанией…


Что-то подобное произошло и с Page Rank, замечательным детищем Larry Page (который дал свою фамилию алгоритму) и Сергея Брина. Этот алгоритм с одной стороны — позволил Google стать поисковым гигантом, который диктует всему мира свои правила, а с другой — создал целую массу проблем, которые на определённом этапе вышли из под контроля его создателей.

Page Rank
Математический алгоритм, который оценивает качество и количество входящих на страницу ссылок. Этот алгоритм позволяет оценить относительную авторитетность и важность каждой страницы в сети, присваивая ей "ранг".

В соответствии с этим алгоритмом каждая ссылка со страницы а) на страницу б) — что-то вроде "голосования". Значимость отдаваемого "голоса" пропорциональна Page Rank страниц, которые ссылаются на "голосующую" страницу (т.е. голосуют за неё). Page Rank ссылающихся страниц, в свою очередь, зависят от Page Rank страниц, ссылающихся на них, итд. Вычисление PageRank подобным способом может показаться крайне ресурсоёмким, но к этому вопросу мы вернемся позже.

Google Toolbar
Гугл изначально сделал "ранги страниц" публично доступными с помощью своего плагина Google Toolbar, хоть эти "ранги" и отображались лишь приблизительно. Градация рангов была всего лишь от 0 до 10, но, судя по всему, это была логарифмичная шкала. Её реальные значения были следующими:

Публичный доступ к PR привел к ряду сложностей, и я (Valerie Niechai) понимаю, почему сотрудники Google избегают прямых высказываний в отношении всего, что касается сигналов, используемых Google при ранжировании.

Со временем, Гугл прекратил поддержку тулбара. А затем, 15 апреля 2016 работа плагина была окончательно прекращена, что сделало PageRank "засекреченным" фактором ранжирования.

И хотя Page Rank и недоступен публично — он всё еще существует. А потому, я хочу рассказать, как он работает, что делает, и почему он по прежнему важен.

Расчёт PageRank
Каждому вебмастеру следует в общих чертах понимать, как работает PageRank. Эти знания важны в SEO для того, чтобы понимать, что именно нужно делать, чтобы добиться заметного результата. А так же для того, чтобы понять, что именно "пошло не так" в случае, если у сайта упали позиции.

Расчёт PR выглядит невыполнимой задачей, ведь (как сказано выше) Ранг страницы зависит от Рангов страниц, которые на неё ссылаются.
Но ведь мы не можем знать Ранги и этих страниц до тех пор, пока не вычислим. В результате получается циклическая зависимость, и произвести расчёт PR как будто бы и вовсе невозможно.

Но не всё так плохо. PR может быть высчитан с помощью "Метода итерации" и имеет отношение к собственному вектору нормализованной ссылочной матрицы сети интернет.
Этот математический метод позволяет узнать "вес"(PageRank) любой страницы не зная "весов"(PageRank) страниц, которые на неё ссылаются.

Каким образом?
За счёт того, что каждый раз, производя расчёты (с каждой итерацией) мы приближаемся к окончательным точным значениям. Всё что требуется — повторять итерации расчёта PR запоминая предыдущие найденные значения до тех пор, пока новые найденные значения почти не перестанут отличаться от предыдущих.

Гугл пересчитывает PR после каждого переобхода сети. С ростом количества страниц в интексе Google базовый PR для каждой из отдельных страниц снижается.
Считается (по заявлению автора), что PR имеет некоторые предпочтения в отношении более старых страниц, а новая страница, какой бы хорошей не была, не может иметь множества качественных обратных ссылок, потому получает более низкий PR.

Формула PageRank так же имеет демпинг-фактор (d). В соответствии с теорией PR, можно считать что есть некий воображаемый сёрфер, который рандомно переходит по ссылкам, но на определённом этапе ему это надоедает. Вероятность того, что сёрферу надоест кликать дальше для каждой из страниц называется "демпинг-фактором". Этот фактор введён для того, чтобы не возникло ситуаций, когда отдельные страницы имели бы чересчур большой вес.

В результате демпинг-фактора суммарный "вес голоса", отдаваемый страницей, умножается на понижающий коэффициент 0.85 (предполагаемое значение)

Предполагается, что среднестатистический вес страницы в сети берётся за 1. А формула PageRank предполагает, что даже если на страницу нет внешних ссылок, её "вес" всё равно равен 0.15 (1 — демпинг-фактор 0.85)

Одна из лучших статей по вопросу расчёта PR — вот эта (англ), написанная Ian Rogers.
Он приводит кое-какие примеры, и сопровождает их своими наблюдениями и описанием общих принципов.

Наиболее важные из описанных там моментов:

  • Обратные ссылки.
    Главная страница как правило имеет самый высокий PR, т.к. на неё ведёт больше всего входящих ссылок. Если на страницах, куда ведут исходящие ссылки нет обратных, то PR страницы с исходящими ссылками уменьшается. Есть смысл в том, чтобы страницы по внешним ссылкам ссылались обратно на главную, и таким образом её вес не уменьшался.

    Тем не менее
    Создание структуры сайта, при которой большая часть "веса" сконцентрировано на главной странице не просто не будет работать, но ещё и навредит. С другой стороны — сконцентрировав внимание на главной вы можете сделать опыт её посещения настолько приятным для пользователей, что это в результате принесёт вам куда больше PR, чем тот, который вы "потеряли", сделав на ней чересчур сильный акцент.

  • По поводу иерархии
    Иерархия концентрирует "голоса" и PR на более высокой странице в иерархии.

  • По поводу структуры
    Грамотная и продуманная структура сайта усиливает эффект входящих внешних ссылок

  • По поводу внутренней перелинковки
    Внутренняя перелинковка снижает вес, теряемый в результате размещения внешних ссылок

    Тем не менее
    При отсутствии внешних ссылок количество внутренних ссылок никак не влияет на суммарный PR сайта

  • По поводу спамных ссылок
    Тысячи спамных страниц, указывающих на главную страницу сайта способны дать неплохой прирост к PR. Но если гугл обнаружит это (а он это хорошо умеет) — сайт может навсегда покинуть выдачу. С другой стороны — тысячи страниц (ну или хотя бы несколько) с уникальным контентом, указывающих на главную страницу сайта — самый лучший способ получить высокий PR.

Противоречия PageRank

PR — гениальное изобретение, которое сделало Google столь эффективным и авторитетным. Но любое изобретение можно использовать как во благо, так и и во вред. В случае с PR — им начать манипулировать и использовать так, как не было предусмотрено разработчиками.

Давайте поговорим о причинах, по которым публичный доступ к PageRank наносил ущерб сети интернет, и почему PR был и остаётся таким важным.

Критерий авторитетности

Гугл сделал PR публично доступным, чтобы показать, что поисковый робот способен

  • находить и показывать страницы, которые лучше всего удовлетворят запрос пользователя
  • определять, какие именно страницы — лучшие и самые безопасные

В дальнейшем Гугл разработал Тулбар для Internet Explorer (в дальнейшем поддерживаемый FireFox). Тулбар, будучи активирован, показывал PageRank.
Обычные пользователи были не слишком заинтересованы значениями PR, а вот специалисты по SEO посчитали его превосходной метрикой, которую можно было использовать в работе с клиентами. Мир SEO начал "крутиться вокруг PR", и это сделало его в глазах многих едва ли не единственным фактором ранжирования, к которому стоило стремиться. Даже несмотря на то, что страницы с более низким PR имеют возможность обходить в выдаче страницы с более высоким.

И к чему это привело?

Фермы ссылок.
Рынок тут же подстроился под изменившиеся условия, и началась эпоха манипулирования PageRank. Началась эра "ссылочных ферм".

Конечно же Google не понравилась сложившаяся ситуация, и он начал с этим бороться.
Самые известные меры были приняты в отношении сети searchking.com, в отношении которой были введены пенальти и которая была полностью убрана из поисковой выдачи Google (на данный момент этот сайт снова доступен в Google, т.к. алгоритмы стали совершеннее).

В дальнейшем — продажа ссылок стала "подпольной". Гугл находил и блокировал сети, продающие ссылки, но это не приносило должного эффекта. Как только закрывалась одна сеть, продающая ссылки — тут же появлялась другая. И до тех пор, пока были клиенты, готовые платить за увеличение PR — продолжали появляться и предложения.

Ссылочный спам
Публичный доступ к PR так же запустил волну ссылочного спама. Спамные комментарии начали появляться в каждом мало-мальски значимом месте, которое позволяло эти комментарии оставлять. Технически было возможным оставлять сотни, даже тысячи спамных комментариев, и каждый из них имел ссылку на целевой сайт. И ведь каждая из этих ссылок имела "вес". Такой способ — просто мечта в плане быстрого увеличения PR, не правда ли?

… Не совсем. Это было серьезной проблемой, в отношении которой Гуглу было необходимо принять какое-то серьёзное решение. И был введён новый атрибут ссылок "rel=nofollow". Это был способ не позволить ссылкам передавать PR странице, на которую они указывали.
К сожалению, это не остановило ссылочный спам, хотя данный атрибут и сейчас используется многими сайтами и социальными сетями.

Итог
Даже когда Google сделал свой PageRank "секретным", было очевидно, что это уже не вернёт "мир и покой" мировой сети. До тех пор, пока люди понимают, что Google использует в своём механизме ранжирования ссылки как фактор, их будут продолжать покупать и продавать.

Источник

Добавить комментарий