Я ищу наборы данных социальных сетей (Twitter, FriendFeed, Facebook, LastFM и т. Д.) Для задач классификации, предпочтительно в формате ARFF.
Мои поиски через UCI и Google пока не увенчались успехом ... есть предложения?
classification
dataset
Tanzeem
источник
источник
Просто нашел это: 476 миллионов твиттеров Twitter (через @yarapavan ).
источник
Мы курировали набор данных Twitter для друзей пользователей в 2009 году, а затем в 2009 году. Вы можете найти больше информации здесь: http://strict.dista.uninsubria.it/?p=364
источник
Проверьте kaggle.com, у них есть несколько конкурсов о социальных сетях, и они выдают наборы данных.
Кроме того, SNAP Стэнфорда является отличным ресурсом. И у него есть исследовательские работы для загрузки.
источник
Социальный график Facebook, установки приложений и пользователи Last.fm, события, группы на http://odysseas.calit2.uci.edu/research/
Два набора данных (собранные в апреле-мае 2009 года), которые содержат репрезентативные выборки ~ 1 миллиона пользователей по всей сети Facebook, с несколькими аннотированными свойствами: для каждого пользователя выборки включены список друзей, параметры конфиденциальности и членство в сети. Третий набор данных (собранный в феврале 2008 г.) включает в себя двудольный график, который представляет установки приложений пользователями Facebook. Четвертый набор данных с ежедневными активными пользователями и установками приложений в течение 6 месяцев (собран с сентября 2007 г. по февраль 2008 г.). Пятый набор данных, который включает репрезентативную выборку пользователей Last.fm, полученную с использованием мультиграфической выборки (собранный в июле 2010 г.).
источник
Хороший ресурс для поиска наборов данных:
/ r / наборы данных на Reddit.
Быстрый взгляд на эту страницу показывает этот источник , который может содержать что-то полезное для вас.
источник
Эта статья использует набор данных facebook, который доступен здесь. Вот описание от авторов:
источник