Наборы эталонных данных для совместной фильтрации

9

Я хотел бы протестировать новый алгоритм совместной фильтрации . Типичный вариант использования - рекомендовать фильмы на основе предпочтений пользователей, похожих на конкретного пользователя.

Какие наборы эталонных данных часто используют исследователи для проверки своих алгоритмов? Я знаю, что в Computer Vision люди часто используют MNIST или CIFAR, но я не нашел подобных наборов данных для совместной фильтрации.

PIR
источник
1
Вы смотрели на призовой набор данных Netflix? Да, конкурс давно закончился, и он был удален с официального сайта по причинам конфиденциальности. Вы все еще можете попробовать найти его в других местах.
Владислав Довгальец
Kaggle.com имеет кучу. Просто найдите «рекомендация в: наборе данных» или «рекомендация в: соревнование».
пробег 8

Ответы:

8

Очевидным ответом будет призовой набор данных Netflix, в нем много исследований, и большинство алгоритмов CF имеют известные оценки.

Существуют и другие доступные наборы данных, которые обычно используются в качестве эталонов:

Жоао Алмейда
источник
1

У меня есть хранилище, которое может вам помочь.

https://github.com/ArthurFortes/Datasets-for-Recommneder-Systems/

Артур Фортес
источник
3
Пожалуйста, не публикуйте только ссылки, ответы должны быть автономными. Я рекомендую отредактировать ваш ответ, чтобы добавить хотя бы немного информации, которую предоставляет ссылка, а затем предоставить ссылку для дальнейшего изучения.
Мефи