(Это действительно комментарий, но поскольку он требует иллюстрации, он должен быть опубликован как ответ.)
Эд Туфте переработал коробочную диаграмму в своем « Визуальном отображении количественной информации» (стр. 125, первое издание 1983 г.) именно для того, чтобы обеспечить «неформальный исследовательский анализ данных, когда время исследователя должно быть посвящено другим вопросам, помимо рисования линий». Я (совершенно естественным образом) расширил его редизайн, чтобы в нем можно было отображать выбросы в этом примере, показывая 70 параллельных коробочных графиков:
Я могу придумать несколько способов улучшить это далее, но это характерно для того, что можно получить в разгар исследования сложного набора данных: мы готовы делать визуализации, которые позволяют нам видеть данные; хорошая презентация может прийти позже.
Сравните это с обычной передачей тех же данных:
Tufte представляет несколько других редизайнов, основанных на его принципе «максимизировать соотношение чернил данных». Их ценность заключается в том, чтобы показать, как этот принцип может помочь нам разработать эффективную исследовательскую графику. Как видите, механизм их построения сводится к поиску любой графической платформы, на которой вы можете рисовать точечные маркеры и линии.
Beanplots
Возможно, самые крутые сюжеты из когда-либо существовавших, это, в основном, небольшая кратность реализации скрипичных сюжетов. Сюжеты для скрипки имеют огромное преимущество перед коробочными диаграммами: они могут показать гораздо больше деталей для ненормальных распределений (например, они могут действительно хорошо продемонстрировать бимодальные распределения). Поскольку они обычно основаны на сглаживании по Гауссу (или аналогичны), они не будут работать очень хорошо для распределений с высокими конечными точками (например, экспоненциальных распределений), но тогда и боксплоты не будут.
Beanplots можно легко реализовать в R - просто установите пакет beanplot :
beanplot
Функция имеет множество опций , так что вы можете настроить его желание вашего сердца. Есть также способ сделать beanplots в ggplot2 (нужна последняя версия):источник
Вот пример кода R для нескольких способов сделать это, вы, вероятно, захотите расширить это (включая метки и т. Д.) И, возможно, включить его в функцию:
источник