При построении рейтинга, скажем, для поисковой системы или системы рекомендаций, допустимо ли полагаться на частоту кликов для определения релевантности записи?
При построении рейтинга, скажем, для поисковой системы или системы рекомендаций, допустимо ли полагаться на частоту кликов для определения релевантности записи?
Зависит от намерений пользователя , для начала.
Пользователи обычно просматривают только первый набор ссылок , что означает, что если ссылка не отображается, она не получает клики; Это означает, что вы должны быть уверены, что это лучшие ссылки, иначе клики скорее всего будут отражать место размещения, а не релевантность. Например, вот тепловая карта распределения кликов и внимания для результатов поиска Google:
Кроме того, использование частоты кликов для учета релевантности не является прямой мерой релевантности ресурса. Кроме того, использование кликов является проблематичным, так как такие проблемы, как клик-инфляция, клик-фальсификация и т. Д., Будут всплывать и их трудно будет решить.
Тем не менее, если вы заинтересованы в использовании взаимодействия с пользователем для моделирования релевантности, я бы посоветовал вам попытаться измерить взаимодействие после нажатия кнопки, а не то, как пользователи реагируют на результаты поиска; см. « Главный инженер YouTube, говорящий о кликах против вовлеченности » для получения дополнительной информации, хотя обратите внимание, что сам размер контента также является фактором .
Стоит отметить, что исторически Google был известен алгоритмом PageRank, хотя вполне возможно, что вы намереваетесь только просматривать потоки кликов, поэтому я не буду углубляться в факторы рейтинга Google ; если вас интересует подход Google, вы можете найти обзор рекомендаций Google по оценке качества поиска .
Со своей стороны, я могу сказать, что я использую частоту кликов на продуктах электронной коммерции. Когда вы сочетаете это с днями года, это может даже принести вам отличные предложения.
То есть: у нас есть исторические данные за 1 год по 2 продуктам (Snowboots [], Sandalettes [])
где [0] = январь
Как вы можете видеть, в январе снегоуборки ищут чаще, чем сандалеты, поэтому вам следует предложить снегоходы тем, кто ищет обувь на вашем сайте или / мы в январе.
Вы также можете увидеть, является ли что-то «свежим» в это время, например, когда люди часто щелкают по неизвестному продукту, это может быть знакомством с новой тенденцией или что-то в этом роде.
Это всего лишь несколько примеров, где вы можете использовать частоту кликов для понимания. Я думаю, что нет никаких правил относительно того, что вы можете использовать или не использовать в рекомендациях, если это имеет смысл .
источник
Допустимо ли использовать частоту кликов, тогда да . Допустимо ли использовать только частоту кликов, тогда, вероятно, нет .
Поиск релевантности намного сложнее, чем просто один показатель. Есть целые книги на эту тему . Расширение этого ответа за пределы простого да / нет, вероятно, сделает ответ слишком широким (и самоуверенным)
источник