Я знаю, что если медиана и среднее значение приблизительно равны, то это означает, что существует симметричное распределение, но в данном конкретном случае я не уверен. Среднее значение и медиана довольно близки (разница составляет всего 0,487 м / галл), что заставляет меня сказать, что существует симметричное распределение, но, глядя на коробочный график, похоже, что оно слегка положительно перекошено (медиана ближе к Q1, чем к Q3, что подтверждается по значениям).
(Я использую Minitab, если у вас есть какой-то конкретный совет для этого программного обеспечения.)
Ответы:
Без сомнения, вам сказали иначе, но среднее значение медиана не подразумевает симметрию.знак равно
Существует мера асимметрии, основанная на среднем минус медиана (вторая асимметрия Пирсона), но она может быть 0, когда распределение не симметрично (как любая из общих мер асимметрии).
Точно так же, отношения между средним и медианой не обязательно подразумевают аналогичные отношения между серединой ( ) и медианой. Они могут предложить противоположную асимметрию, или один может равняться медиане, а другой нет.( Q1+ Q3) / 2
Одним из способов исследования симметрии является использование графика симметрии *.
Если являются упорядоченными наблюдениями от наименьшего к наибольшему (статистика порядка), а является медианой, то строится график симметрии против , против , ... и так далее. M Y ( n ) - M M - Y ( 1 ) Y ( n - 1 ) - M M - Y ( 2 )Y( 1 ), Y( 2 ), . , , , Y( н ) M Y( н )- М M- Y( 1 ) Y( n - 1 )- М M- Y( 2 )
* Minitab может сделать это . Действительно, я поднимаю этот сюжет как возможность, потому что я видел их в Minitab.
Вот четыре примера:
(Фактические распределения были (слева направо, сначала верхний ряд) - Laplace, Gamma (форма = 0,8), бета (2,2) и бета (5,2). Код Росса Ихаки, отсюда )
С симметричными примерами с тяжелыми хвостами часто бывает так, что самые крайние точки могут быть очень далеко от линии; вы бы меньше обращали внимание на расстояние от линии в одну или две точки, когда вы находитесь в правом верхнем углу фигуры.
Конечно, есть и другие сюжеты (я упомянул сюжет симметрии не из особого смысла адвокации этого конкретного, а потому, что знал, что он уже реализован в Minitab). Итак, давайте рассмотрим некоторые другие.
Вот соответствующие сценарии, которые Ник Кокс предложил в комментариях:
На этих графиках тренд вверх будет означать, как правило, более тяжелый правый хвост, чем левый, а тренд вниз будет означать, как правило, более тяжелый левый хвост, чем правый, в то время как симметрия будет предложена на относительно плоском (хотя, возможно, довольно шумном) графике.
Ник предполагает, что этот сюжет лучше (конкретно «более прямой»). Я склонен согласиться; следовательно, интерпретация графика выглядит немного проще, хотя информация на соответствующих графиках часто очень похожа (после того, как вы вычли наклон единицы в первом наборе, вы получите нечто очень похожее на второй набор).
[Конечно, ни одна из этих вещей не скажет нам, что распределение, из которого были взяты данные, фактически симметрично; мы получаем указание на то, насколько близка симметричная выборка, и поэтому в этой степени мы можем судить, насколько данные соответствуют разумным данным, взятым из почти симметричной популяции.]
источник
skewplot
(SSC). Идея восходит, по крайней мере, к предложению, приписанному Дж. У. Тьюки в Wilk, MB and Gnanadesikan, R. 1968. Методы построения вероятности для анализа данных. Биометрика 55: 1-17.Проще всего вычислить асимметрию образца . Для этого в Minitab есть функция. Симметричные распределения будут иметь нулевую асимметрию. Нулевая асимметрия не обязательно означает симметричный, но в большинстве практических случаев это будет.
Как отметил @NickCox, существует более одного определения асимметрии. Я использую тот, который совместим с Excel , но вы можете использовать любой другой.
источник
Сосредоточьте свои данные около нуля, вычитая из выборочного среднего. Теперь разделите ваши данные на две части, отрицательную и положительную. Возьмите абсолютное значение отрицательных точек данных. Теперь проведите двухэлементный тест Колмогорова-Смирнова, сравнив два раздела друг с другом. Сделайте свой вывод на основе р-значения.
источник
Поместите ваши наблюдения, отсортированные по возрастающим значениям, в один столбец, а затем поместите их, отсортированные по убывающим значениям, в другой столбец.
Затем вычислите коэффициент корреляции (назовите его Rm) между этими двумя столбцами.
Вычислить хиральный индекс: CHI = (1 + Rm) / 2.
CHI принимает значения в интервале [0..1].
CHI является нулевым, ЕСЛИ И ТОЛЬКО ЕСЛИ ваш образец распределен симметрично.
Нет необходимости третьего момента.
Теория:
http://petitjeanmichel.free.fr/itoweb.petitjean.skewness.html
http://petitjeanmichel.free.fr/itoweb.petitjean.html
(большинство работ, цитируемых на этих двух страницах, можно скачать в формате pdf).
Надеюсь помогает, даже в последнее время.
источник