При построении коробочного графика с помощью python matplotblib линии на половине графика являются медианой распределения.
Есть ли возможность вместо этого иметь линию в среднем. Или построить его рядом с ним в другом стиле.
Кроме того, поскольку для строки характерно быть медианой, действительно ли это смутит моих читателей, если я сделаю ее средней (конечно, я добавлю примечание, что такое средняя линия)?
data-visualization
python
matplotlib
boxplot
Питер Смит
источник
источник
Чтобы ответить на ваш второй вопрос: Да, я думаю, что будет непонятно ставить линию на среднее значение вместо медианы. Точные правила, регулирующие длину «усов» (если таковые имеются) и обработку выбросов, различаются, но все придерживаются того, чтобы Тьюки использовал коробку для отображения медианы, нижнего и верхнего квартилей. Для сильно искаженных распределений среднее значение может находиться за пределами рамки, что выглядит очень странно. Обычно используется то, что медиана соответствует межквартильному диапазону, а среднее - стандартному отклонению (или стандартной ошибке среднего, если вас интересует вывод, а не описание данных). Если вы хотите показать среднее значение визуально, я бы использовал другой символ для его отображения, чтобы избежать путаницы.
источник