Система Рекомендатора будет измерять корреляцию между рейтингами разных пользователей и давать рекомендации для данного пользователя относительно пунктов, которые могут быть ему интересны.
Однако вкусы меняются со временем, поэтому старые рейтинги могут не отражать текущие предпочтения и наоборот. Возможно, вы когда-то поместили «отлично» в книгу, которую вы сейчас оценили бы как «не слишком отвратительно» и так далее. Более того, сами интересы также меняются.
Как рекомендующие системы должны работать в изменяющейся среде?
- Один из вариантов - отключить «старые» рейтинги, что может сработать, если вы правильно определите «старые» (можно даже сказать, что рейтинги никогда не истекают и делать вид, что проблема не существует). Но это не самый лучший вариант: конечно, вкусы развиваются, это нормальный жизненный поток, и нет никаких причин, по которым мы не можем использовать дополнительные знания, чтобы однажды исправить прошлые рейтинги.
- Другой вариант - как-то приспособить эти дополнительные знания. Таким образом, мы не могли просто найти «мгновенное соответствие» вашим текущим интересам, но предложить вам то, что вам может понравиться дальше (в отличие от того, что вам может понравиться сейчас ).
Я не уверен, объясняю ли я это достаточно хорошо. По сути, я поддерживаю второй подход и говорю о Системе Рекомендора, которая будет измерять корреляции вкусовых траекторий и давать рекомендации, которые будут удовлетворять ... ну, давайте назовем это личным ростом - потому что они будут исходить от людей, чьи «Траектория вкуса» (а не просто «снимок вкуса») похожа на вашу.
Теперь вопрос: мне интересно, существует ли что-то похожее на «вариант 2», и если да, то мне интересно, как это работает. И если его не существует, вы можете обсудить, как это должно работать! :)
источник
Я не знаю о работающей системе, но не удивлюсь, если у Amazon, NetFlix или у кого-то есть такая система. Даже поисковая система Google может иметь подобный тип системы.
Я думал об этом, когда проходил курс доктора Нг в прошлом семестре. Подход, который я сначала считал оптимальным, заключался бы в добавлении весового коэффициента в зависимости от возраста. Чем актуальнее фрагмент данных, тем тяжелее он будет взвешен. Этот подход будет относительно простым и недорогим в реализации.
Однако после более тщательного обдумывания этого подхода я считаю, что он имеет серьезные недостатки для многих приложений. Лично я буду часто следовать жанру или шоу в течение некоторого времени, уставать от него, переходить к чему-то другому, но позже вернусь к оригинальному жанру. Этот цикл выгорания, разжигания действительно появляется и в обществе.
Поэтому я склоняюсь к чуть более сложной системе. Данные должны быть разделены на два набора; текущие данные - пороговое значение должно будет варьироваться в зависимости от приложения плюс продолжительность взаимодействий индивидуума - которые будут взвешиваться более тяжело, и «исторические» данные, которые будут оцениваться ниже при медленном снижении значений во времени. Во-вторых, будет включен фактор, чтобы попытаться обнаружить «отключение» в случае внезапного исчезновения значительного интереса или участия. «Текущие» данные, которые классифицируются аналогичным образом, будут реклассифицированы, как если бы они были историческими.
Ни один из этих подходов не имеет какой-либо строгости или подтверждения, но я считаю, что стоило бы построить некоторые испытания этой гипотезы.
источник
На мой взгляд, модифицированная версия совместной фильтрации может работать. Тем не менее, вам нужно будет сохранять временную отметку для каждого рейтинга и назначать штраф при расчете веса ранга, который старше.
источник