Хороший онлайн-ресурс с советами по графическому сопоставлению двух числовых переменных при различных условиях

22

Контекст:

За это время я приобрел набор эвристик о том, как эффективно построить связь между двумя числовыми переменными. Я полагаю, что большинство людей, которые работают с данными, будут иметь подобный набор правил.

Примеры таких правил могут быть:

  • Если одна из переменных имеет положительный перекос, рассмотрите возможность построения этой оси в логарифмическом масштабе.
  • Если точек данных много (например, n> 1000), выберите другую стратегию, например, с использованием некоторой формы частичной прозрачности или выборки данных;
  • Если одна из переменных имеет ограниченное количество отдельных категорий, рассмотрите возможность использования графика дрожания или подсолнечника;
  • Если есть три или более переменных, рассмотрите возможность использования матрицы рассеяния;
  • Подгонка некоторой формы линии тренда часто полезна;
  • Отрегулируйте размер графического символа до размера выборки (для большего n используйте меньший графический символ);
  • и так далее.

Вопрос:

Я хотел бы иметь возможность направлять студентов на веб-страницу или сайт, где объясняются эти и другие приемы для эффективного построения связей между двумя числовыми переменными, возможно, с примерами.

  • Есть ли в Интернете какие-либо страницы или сайты, которые хорошо справляются с этой задачей?
Джером англим
источник
2
Если вы можете найти его, печатное руководство «Графика», которое поставляется с более старыми копиями Systat (до Windows, хотите верьте, хотите нет), было бы отличным ресурсом. Он не только иллюстрировал все эти правила (насколько я помню), он был полон содержательных и отличных советов.
whuber
2
@whuber, отличный комментарий. Леланд Уилкинсон, основной автор Systat, а также автор «Грамматики графики» (которая является скорее книгой по информатике, чем книгой по статистике), очень хорошо разбирается в графическом отображении данных. Его презентации всегда очень эффективны в доставке своих сообщений.
StasK
@Jeromy, вы, возможно, уже знаете пакет ggplot2 для R, но теперь, когда была упомянута Грамматика графики, я подумал упомянуть и ее. Я нахожу пакет, книгу и онлайн- справочник Хэдли Уикхэма очень полезными для преобразования числовых переменных в полезные графики и графики.
NRH
1
@Jeromy, почему бы не перефразировать вопрос (отдельно) как вики сообщества, запрашивая один пост на правило? Таким образом, вместо набора ссылок, мы могли бы иметь набор правил для голосования и создать ресурс здесь.
Дэвид Лебауэр
@David Хорошо, я добавил общий вики-вопрос сообщества о лучших ресурсах для разработки графиков stats.stackexchange.com/questions/16631/…
Jeromy Anglim

Ответы:

13

Я не могу думать о великолепных онлайн-ресурсах, но хорошая (и легко загружаемая) книжная глава, в которой рассказывается о том, как визуально исследовать большой, многомерный набор данных, вдумчиво представляет Брендана О'Коннора и Лукаса Бивальда. глава (предупреждение: ссылка непосредственно на PDF) из Beautiful Data . Эта глава особенно полезна в качестве учебного ресурса, поскольку она включает код R в повествование.

Кроме того, после дальнейшего размышления, я думаю, что классическое «Некоторые графические и полуграфические изображения» Джона Тьюки (удобно размещенные на веб-сайте Эдварда Туфте) является действительно замечательным, хотя и несколько своеобразным, введением в визуализацию.

По некоторым причинам, я, кажется, думаю о главах книги ...

ashaw
источник
+1 По крайней мере, эти главы доступны в Интернете: я думаю, что это подходит. Спасибо, Аарон.
whuber
@ whuber спасибо за публикацию награды; и @ashaw обе ссылки делают для интересного чтения.
Jeromy Anglim
Я замечаю, что статья Тьюки является предшественником расширенного подхода, описанного в его книге EDA (1977) (за исключением последнего раздела о висячих ротограммах и гистограммах).
whuber
11

Последние ссылки:

Старые, но соответствующие ресурсы

Дэвид Лебауэр
источник
3
+1 Правила и учебные пособия выглядят полезными, всеобъемлющими - и запрещающими! Как можно писать о графике, не предоставляя ни одной иллюстрации ? :-)
whuber
1
Выбор был трудным, но я присудил награду за этот ответ, потому что в целом он лучше всего отвечает на поставленный вопрос. Документ ООН представляется особенно полезным и доступным для студентов, с простым языком и множеством наглядных примеров.
whuber