Вопросы с тегом «information-retrieval»

183
Каков наилучший способ вычисления популярных тем или тегов?

Многие сайты предлагают некоторую статистику, например «Самые горячие темы за последние 24 часа». Например, Topix.com показывает это в разделе «Тенденции новостей». Там вы можете увидеть темы, которые имеют наиболее быстро растущее число упоминаний. Я хочу вычислить такой "шум" и для темы. Как я...

93
Python: tf-idf-cosine: найти сходство документа

Я следил за учебником, который был доступен в частях 1 и 2 . К сожалению, у автора не было времени на последний раздел, в котором использовалось косинусное сходство, чтобы на самом деле найти расстояние между двумя документами. Я следил за примерами в статье с помощью следующей ссылки из...