Я R noob, который должен выполнять различные виды анализа больших наборов данных в R. Поэтому, просматривая этот сайт и другие места, мне показалось, что здесь есть много эзотерических и менее известных проблем, таких как какой пакет использовать, когда, какие преобразования (не) применяются к данным и т. д.
Мне просто интересно, есть ли книга / учебник / руководство, которое демистифицирует все это и представляет информацию систематически? Я предпочитаю делать это, а не смотреть по сторонам и собирать информацию из разных источников в Интернете.
Заранее спасибо.
r
large-data
TeachMeR
источник
источник
Ответы:
Вот несколько постов в блоге, которые я сделал на эту тему «Большие наборы данных с R.». Есть несколько пакетов, таких как ff и bigmemory, которые используют обмен файлами и распределение памяти. Несколько других пакетов используют подключение к базам данных, таким как sqldf, RMySQL и RSQLite.
R Ссылки для обработки больших данных
Логистическая регрессия больших данных в R с ODBC
источник