Контекст:
За это время я приобрел набор эвристик о том, как эффективно построить связь между двумя числовыми переменными. Я полагаю, что большинство людей, которые работают с данными, будут иметь подобный набор правил.
Примеры таких правил могут быть:
- Если одна из переменных имеет положительный перекос, рассмотрите возможность построения этой оси в логарифмическом масштабе.
- Если точек данных много (например, n> 1000), выберите другую стратегию, например, с использованием некоторой формы частичной прозрачности или выборки данных;
- Если одна из переменных имеет ограниченное количество отдельных категорий, рассмотрите возможность использования графика дрожания или подсолнечника;
- Если есть три или более переменных, рассмотрите возможность использования матрицы рассеяния;
- Подгонка некоторой формы линии тренда часто полезна;
- Отрегулируйте размер графического символа до размера выборки (для большего n используйте меньший графический символ);
- и так далее.
Вопрос:
Я хотел бы иметь возможность направлять студентов на веб-страницу или сайт, где объясняются эти и другие приемы для эффективного построения связей между двумя числовыми переменными, возможно, с примерами.
- Есть ли в Интернете какие-либо страницы или сайты, которые хорошо справляются с этой задачей?
data-visualization
correlation
teaching
rule-of-thumb
scatterplot
Джером англим
источник
источник
Ответы:
Я не могу думать о великолепных онлайн-ресурсах, но хорошая (и легко загружаемая) книжная глава, в которой рассказывается о том, как визуально исследовать большой, многомерный набор данных, вдумчиво представляет Брендана О'Коннора и Лукаса Бивальда. глава (предупреждение: ссылка непосредственно на PDF) из Beautiful Data . Эта глава особенно полезна в качестве учебного ресурса, поскольку она включает код R в повествование.
Кроме того, после дальнейшего размышления, я думаю, что классическое «Некоторые графические и полуграфические изображения» Джона Тьюки (удобно размещенные на веб-сайте Эдварда Туфте) является действительно замечательным, хотя и несколько своеобразным, введением в визуализацию.
По некоторым причинам, я, кажется, думаю о главах книги ...
источник
Последние ссылки:
Kelleher and Wagner 2011 «Десять руководящих принципов для эффективной визуализации данных в научных публикациях» предоставляет хороший набор правил. Правила со ссылками (но не с полной статьей) доступны без подписки, хотя студенты университетов, скорее всего, будут иметь полный доступ.
Организация Объединенных Наций 2009 г. «Делая данные значимыми» предоставляет хороший обзор с правилами и примерами, включая раздел «Новые технологии».
Старые, но соответствующие ресурсы
SIGGGRAPH предлагает несколько отличных учебных пособий, хотя в них отсутствуют примеры, в том числе:
Сеней и Игнатий 1999 "Правила и принципы визуализации научных данных"
Домик 1999 "Учебник по визуализации"
Хорошее резюме Tufte можно найти здесь:
источник