[639] UrlInQueryTrigrams Доля триграмм урла среди триграмм транслитерированного запроса
[294] UrlDomainFraction Покрытие домена трехбуквиями из*запроса. (Челябинская лотерея – chelloto. Переводим запрос в*транслит, находим трехбуквия которые покрываются (che, hel, lot, olo), смотрим какую долю от*всех трехбуквиев покрыли )
3 .
yanus: В ролике буквенные триграммы, а ТС о биграммах слов.
И про словарные биграммы в ролике тоже есть ) видео
————-
4 .
verse:
Буквенные н-граммы, а в свете п. 1-2-3-4, буквенные 3-граммы дают приличный результат в плане цена-качество=быстро-более менее. В какой то мере замена стеммеру и лемматизации.
coda:
Имеет ли смысл делать анализ по топов данному критерию?
timo-71
Понятно, что факторов много и это далеко сзади, но:
дилер – дилерский, с точки зрения морфологии разные слова – существительное и прилагательное. С точки зрения моделей ЛСИ/ЛДА и т.д они разные, а по факту одно и тоже
———- Добавлено 24.12.2019 в 01:23 ———-
Накидал бы кто запросов, где ПФ/витальности и т.п нет
[Удален]
timo-71: Почему старый в подсветках для джинсы
джинсы с потёртостями/рваные/состаренные…
timo-71: В какой то мере замена стеммеру и лемматизации
вообще-то, это самое то с чего пс начинали
‘ть’ ‘сы’
там только триплеты должны быть
timo-71
burunduk: джинсы с потёртостями/рваные/состаренные…
Пока не знаю что сказать.
Фильтр
['стар', 'star', 'тёрт', 'рван', 'терт']
Среди всех слов из ‘title’, ‘headline’, ‘passages’ только
timo-71
intro, переосмысление:
1 .
2 .
3 .
В ролике буквенные триграммы, а ТС о биграммах слов.
И про словарные биграммы в ролике тоже есть )
————-
4 .
verse:
Буквенные н-граммы, а в свете п. 1-2-3-4, буквенные 3-граммы дают приличный результат в плане цена-качество=быстро-более менее. В какой то мере замена стеммеру и лемматизации.
coda:
Имеет ли смысл делать анализ по топов данному критерию?
timo-71
Понятно, что факторов много и это далеко сзади, но:
Average top10 YaXml: 0.6649999999999999
Average top20 YaXml: 0.6924999999999998
Average top30 YaXml: 0.6816666666666665
Average top50 YaXml: 0.6609999999999999
Average bottom50 YaXml: 0.6299999999999997
Ключей из букварикса: 5000
Урлов из топа: 100
Подсветок: 5 [‘купить’, ‘квартира’, ‘москва’, ‘продажа’, ‘покупка’]
Average top10 YaXml: 0.766
Average top20 YaXml: 0.7475000000000002
Average top30 YaXml: 0.7473333333333335
Average top50 YaXml: 0.7252
Average bottom50 YaXml: 0.6955999999999999
Ключей из букварикса: 4673
Урлов из топа: 100
Подсветок: 8 [‘купить’, ‘джинса’, ‘джинсы’, ‘москва’, ‘покупка’, ‘джинсовый’, ‘старый‘, ‘покупать’]
Average top10 YaXml: 0.41400000000000003
Average top20 YaXml: 0.40700000000000003
Average top30 YaXml: 0.3940000000000001
Average top50 YaXml: 0.39720000000000005
Average bottom50 YaXml: 0.507000000000000
Ключей из букварикса: 25
Урлов из топа: 100
Подсветок: 11 [‘toyota’, ‘camry’, ‘цена’, ‘тойота’, ‘москва’, ‘купить’, ‘автосалон’, ‘камри’, ‘дилер’, ‘дилерский’, ‘стоимость’]
Слов в сниппетах: 2257
————–
В среднем на как то так (снял 3288 ключей)
rAverage top10 YaXml: 0.7829999999999998
rAverage top20 YaXml: 0.7634999999999998
rAverage top30 YaXml: 0.7543333333333336
rAverage top50 YaXml: 0.7702000000000006
rAverage bottom50 YaXml: 0.7260000000000004
Для любознательных – цифра:
Почему старый в подсветках для джинсы😕
—-
Подсветок: 11 [‘toyota’, ‘camry’, ‘цена’, ‘тойота’, ‘москва’, ‘купить’, ‘автосалон’, ‘камри’, ‘дилер’, ‘дилерский’, ‘стоимость’]
Подсветок: 10 [‘купить’, ‘тойота’, ‘камри’, ‘новосибирск’, ‘toyota’, ‘camry’, ‘цена’, ‘дилер’, ‘автосалон’, ‘стоимость’]
Чего не хватает в Новосибирске – “дилерский”.
Vladimir SEO
Зачем все это ?
timo-71
Зачем все это ?
Ну и старые слитые факторы
—-
Добавлю из добавления к предыдущему
дилер – дилерский, с точки зрения морфологии разные слова – существительное и прилагательное. С точки зрения моделей ЛСИ/ЛДА и т.д они разные, а по факту одно и тоже
———- Добавлено 24.12.2019 в 01:23 ———-
Накидал бы кто запросов, где ПФ/витальности и т.п нет
[Удален]
Почему старый в подсветках для джинсы
джинсы с потёртостями/рваные/состаренные…
В какой то мере замена стеммеру и лемматизации
вообще-то, это самое то с чего пс начинали
‘сы’
там только триплеты должны быть
timo-71
джинсы с потёртостями/рваные/состаренные…
Пока не знаю что сказать.
Фильтр
Среди всех слов из ‘title’, ‘headline’, ‘passages’ только
нашлись, в hlword только старый.
В ключах из букварикса. Рваный лидирует