Можно ли добавить вертикальную линию к гистограмме для визуализации среднего значения?
Мне кажется, это нормально, но я никогда не видел этого в учебниках и тому подобном, поэтому мне интересно, есть ли какое-то соглашение не делать этого?
График предназначен для курсовой работы, я просто хочу убедиться, что случайно не нарушил какое-то очень важное правило невысказанной статистики. :)
Ответы:
Конечно, почему нет?
Вот пример (один из десятков, которые я нашел с помощью простого поиска Google):
(Источник изображения - это блог по измерению юзабилити, здесь .)
Я видел, значит, означает плюс или минус стандартное отклонение, различные квантили (например, медиана, квартили, 10-й и 90-й процентили) все отображаются по-разному.
Вместо того, чтобы рисовать линию прямо на графике, вы можете пометить информацию вдоль ее нижней части - например, так:
Там пример (один из многих можно найти) с boxplot через вершину , а не на дне, здесь .
Иногда люди отмечают в данных:
(Я слегка встряхнул расположение данных, потому что значения были округлены до целых чисел, и вы не могли хорошо видеть относительную плотность.)
На этой странице есть пример такого рода, сделанный в Stata (см. Третий здесь )
Гистограммы лучше с небольшим количеством дополнительной информации - они могут вводить в заблуждение самостоятельно
Вам просто нужно позаботиться, чтобы объяснить, из чего состоит ваш сюжет! (Для начала вы бы хотели получить заголовок и метку оси X лучше, чем я использовал здесь. Плюс объяснение в подписи к рисунку, объясняющее, что вы на нем отметили.)
-
Последний сюжет:
-
Мои графики генерируются в R.
Редактировать:
Как и предполагал @gung,
abline(v=mean...
он использовался для рисования средней линии на графике иrug
использовался для рисования значений данных (хотя на самом деле я использовал,rug(jitter(...
потому что данные были округлены до целых чисел).Вот способ сделать блокпост между гистограммой и осью:
Я не собираюсь перечислять, для чего все это нужно, но вы можете проверить аргументы в справке (
?boxplot
), чтобы выяснить, для чего они нужны, и поиграть с ними самостоятельно.Однако это не общее решение - я не гарантирую, что оно всегда будет работать так же, как и здесь (обратите внимание, что я уже изменил параметры
at
иboxwex
*). Если вы не пишете интеллектуальную функцию, чтобы позаботиться обо всем, необходимо обратить внимание на то, что все делает, чтобы убедиться, что он делает то, что вы хотите.Вот как создать данные, которые я использовал (я пытался показать, как регрессия Тейла действительно могла справиться с несколькими влиятельными выбросами). Это просто были данные, с которыми я играл, когда впервые ответил на этот вопрос.
* - соответствующее значение
at
примерно в 0,5 раза большеboxwex
; это было бы хорошим значением по умолчанию, если вы напишите функцию для этого;boxwex
необходимо будет масштабировать таким образом, чтобы это соответствовало шкале y (высоте) коробчатого графика; Я бы посоветовал от 0,04 до 0,05 раз, верхний предел у часто может быть в порядке.Код для маргинальной полосы:
источник
abline(v=mean(Davis2[,2]))
Иrug(Davis2[,2])
я бы догадался, но как ты втиснул там поле?boxplot
функции. Между,boxplot
иboxp
вы можете сделать некоторые довольно изящные вещи без особых усилий.at
иboxwex
так далее ... но в лучшем случае я делаю только несколько таких графиков в год, и каждый раз требуется несколько секунд, чтобы набрать? Boxplot и установить правильные параметры. Я подумал, что проще просто обратить внимание на то, что я делаю.Конечно вы можете. Просто не забудьте четко обозначить / указать, что означает эта линия, и не делайте сюжет слишком «занятым».
Нет ничего хуже, чем график, который передает слишком много информации, чтобы ее было легко понять. Таблица часто упускается из виду для отображения сводной статистики в ясном и лаконичном виде.
источник
Предыдущие ответы дают отличные оценки, но здесь следует добавить один фундаментальный момент.
Среднее значение - это центр тяжести распределения и, следовательно, опорная точка гистограммы. Это где распределение будет сбалансировано. Таким образом, существует взаимная связь: не только среднее может помочь вам думать о гистограмме, но и гистограмма может помочь вам подумать о среднем. Это даже, возможно, более полезно, когда распределение искажено, а среднее значение распределения не обязательно находится в середине.
источник
Я не вижу проблем с этим, вижу это , это и это в качестве примеров.
источник