Я читал книгу Тьюки "Исследовательский анализ данных". Книга, написанная в 1977 году, делает упор на бумажных / карандашных методах. Есть ли более «современный» преемник, который учитывает, что теперь мы можем мгновенно строить большие наборы данных?
52
Ответы:
Самая близкая вещь - Визуализация Данных Кливленда . Речь идет об исследовательском анализе данных, о компьютерных визуализациях, о глубоких, классических.
источник
Ну, это не точная копия, но я нашел множество полезных советов по графику (и R-код) в анализе данных Гельмана и Хилла с использованием регрессионных и многоуровневых / иерархических моделей.
Кроме того, его блог часто полон полезных графических советов.
источник
Интерактивная графика для анализа данных: мне нравятся принципы и примеры ; В описании книги говорится, что в нем «обсуждается анализ поисковых данных (EDA) и как интерактивные графические методы могут помочь получить понимание, а также генерировать новые вопросы и гипотезы из наборов данных».
источник
Книга Хэдли Уикхема ggplot2 интересна тем, что в ней рассказывается как о грамматике графики, так и о том, как использовать программное обеспечение ggplot2.
источник
Стоит упомянуть исследование Рональда Пирсона « Данные в области машиностроения, науки и медицины» . Похоже, что его основной целевой аудиторией являются ученые, которые не боятся немного математики и хотят знать больше статистики. Это довольно большая группа, и одна хорошо представлена здесь. Это немного странно и необычно, но оно охватывает много вопросов и содержит много разумных советов. Это не Туки, в том смысле, что он предлагает много новых идей, но это может быть полезным для изучения, даже если вы думаете, что это немного неправильно.
Эта книга, кажется, привлекла очень мало внимания, вполне возможно, потому что она очень дорогая, явно не подходит в качестве текста курса и пока доступна только в твердом переплете. Но он интеллектуален и читабелен и свободен от мусора современных вводных учебников (страниц и страниц элементарных упражнений, глупых иконок, бесплатных фотографий счастливых молодых людей, суетливого макета с коробками и т. Д.).
источник
Также интерактивная и динамическая графика для анализа данных: с примерами с использованием R и GGobi, Cook и Swayne
Это две главы, общедоступные в Интернете, которые описывают процесс анализа данных и обработки пропущенных значений. Скоро выйдет новая книга Энтони Анвина.
источник
Еще пара хороших книг для чтения - « Красивая визуализация» и «Красивые данные». Это отредактированные книги, есть удивительно хорошие примеры изучения данных с помощью графиков и некоторые совершенно ужасные главы.
Еще одна книга, в которой есть несколько хороших примеров использования ggplot2, - новая книга Уинстона Чанга.
источник
Я думаю о Понимании надежного и исследовательского анализа Хоаглина, Мостеллера и Тьюки и сопутствующего тома по Изучению таблиц данных и форм как технического продолжения EDA. Я также вижу анализ данных и регрессию, второй курс статистики Мостеллера и Тьюки, как продолжение EDA. Различные книги Кливленда, упомянутые выше, являются сокровищами.
источник