Как конкретно Google сканирует текст на странице?

Так как я конкретный контентщик, меня всегда интересовало то как ПС сканирует страницу, что конкретно робот видит, а что пропускает мимо.

Все мои исследования показали мне то, что есть всего 2 фактора ранжирования + 1 (мнимый, непостоянный, временный).
1) Соответсвие страницы запросу (релевантность)
2) Авторитетность страницы/домена (PR, DA, PA, TF, etc…)

Ну и тот мнимый фактор — это ПФ… Да он может сработать, но только в ТОП10… На 75-м месте ПФ нет, но ведь ПС как-то ставит сайт на 75-е место.

Итого, у нас остаётся 2 фактора, 1 из которых мы отметаем. Авторитетность — это ссылки и точка на этом.
————-
Теперь вопрос:

Итак, за несколько лет работы с Google столкнулся с тем, что страницы делятся на 2 типа:

1) Страницы, которые всегда на 1-3 месте по куску текста со страницы
2) Страницы, которые на 50-70х местах по поиску того же куска текста
3) Мы не будем рассматривать запрос в ковычках, так как он говорит лишь о том, что этот текст присутствует на странице, но ничего не говорит о релевантности

К сожалению, мои проекты всегда, со временем, попадают во 2-ю категорию страниц. Я не могу найти свой абсолютно эксклюзивный текст по куску этого же текста без ковычек. Поначалу, всё хорошо, но после, либо я нахожу свои страницы на последних местах (в ТОП100) по куску текста, при том, что сами страницы стоят в ТОП10, либо я могу найти только какой-то один абзац и не более…

Отсюда жирный вопрос — Что же все же видит и оценивает поисковик? Почему совершенно эксклюзивный текст не находится по куску этого же текста?
——————
Я работаю в Google USA, потому не спец в Яндексе. Но, все мои сайты там проиндексированы. Ради интереса, я провёл тот же эксперимент и, с удивлением, обнаружил что некоторые страницы не находтся даже по куску текста в ковычках!

Я сам пишу текста. Я знаю что они экслюзивные. Но выходит что они совсем не релевантные!

Это не крик и не плач. Все страницы, о которых я говорю находятся в ТОП10. Это не вопрос о том как попасть в ТОП, а о том как, все же, в реальности ПС видит контент. Если он банально не может найти кусок текста в тексте, то на что тогда могут вообще быть заточены принципы ранжирования?
——————
Проблема в том, что Google, Yahoo, Bing, Yandex, все ПС видят одни и те же страницы на первых местах. Так вот эти страницы всегда попадают в первую категорию.

В независимости от того какое качество контента на них, этот контент можно всегда найти по куску текста. Доходит до абсурда. Есть страницы, где вообще только 1 строчка контента, но эта строчка находится по эйтой же строчке во всех поисковиках, в то время как есть уникальные тексты по 1500 слов, где и одного абзаца не найти!

Хочу услышать мнения, предположения, да и вообще, любую информацию по этому поводу!

P.s.: Еще раз, это не крик ПАМАГИТЕ, вопрос не в ранжировании, а в сканировании и индексировании страниц!

———- Добавлено 02.11.2019 в 16:30 ———-

P.P.S: У меня у самого есть много что сказать по этому поводу, есть много интересных фактов, статистики и предположений. Просто я не хочу раздувать и так большое вводное сообщение. Хотелось бы услышать мнения, которые я буду комментировать.

Источник

Похожие темы:

Добавить комментарий Отменить ответ