Обозначим среднее ( среднее), медиану, \ sigma стандартное отклонение и M мод. Наконец, пусть X - образец, реализация непрерывного унимодального распределения F, для которого существуют первые два момента.≠ m σ M X Fμ≠mσMXF
Хорошо известно, что
|μ−m|≤σ(1)
Это частое учебное упражнение:
|μ−m|=≤≤=≤=|E(X−m)|E|X−m|E|X−μ|E(X−μ)2−−−−−−−√E(X−μ)2−−−−−−−−−√σ
Первый равенство вытекает из определения среднего значения, то третье происходит потому , что медиана является уникальным minimiser (среди всех
c «ами)
E|X−c|и четвертое из неравенства Дженсена (т. е. определение выпуклой функции). На самом деле, это неравенство можно ужесточить. Фактически для любого
F , удовлетворяющего приведенным выше условиям, можно показать [3], что
|m−μ|≤0.6−−−√σ(2)
Хотя в общем случае неверно ( Abadir, 2005 ), что любое унимодальное распределение должно удовлетворять одному из
все же можно показать, что неравенство
M≤m≤μ or M≥m≥μ
|μ−M|≤3–√σ(3)
справедливо для любого унимодального квадратично интегрируемого распределения (независимо от перекоса). Это доказано формально в Johnson and Rogers (1951), хотя доказательство зависит от многих вспомогательных лемм, которые здесь трудно уместить. Пойди посмотри оригинальную статью.
Достаточное условие для распределения удовлетворяющего , дано в [2]. Если :μ ≤ m ≤ M FFμ≤m≤MF
F(m−x)+F(m+x)≥1 for all x(4)
затем . Кроме того, если , то неравенство строгое. Распределения Пирсона типа I - XII являются одним примером семейства распределений, удовлетворяющих [4] (например, Вейбулл - это одно общее распределение, для которого не выполняется, см. [5]).μ ≠ m ( 4 ) ( 4 )μ≤m≤Mμ≠m(4)(4)
Теперь, предполагая, что строго соблюдается и записывая, что , мы имеем
σ = 1 3 ( m - μ ) ∈ ( 0 , 3 √(4)σ=1
3(m−μ)∈(0,30.6−−−√] and M−μ∈(m−μ,3–√]
и поскольку второй из этих двух диапазонов не пуст, безусловно, можно найти распределения, для которых утверждение верно (например, когда ) для некоторого диапазона значений параметров распределения, но это не верно для всех распределений и даже не для всех распределений, удовлетворяющих .(4)0<m−μ<3√3<σ=1(4)
- [0]: Проблема моментов для унимодальных распределений. Н.Л. Джонсон и К.А. Роджерс. Анналы математической статистики. 22, № 3 (сентябрь 1951 г.), стр. 433-439.
- [1]: Неравенство средней медианной моды: контрпримеры Карим М. Абадир Эконометрическая теория, вып. 21, № 2 (апрель 2005 г.), с. 477-482.
- [2]: WR van Zwet, Среднее значение, медиана, режим II, статистика. Neerlandica, 33 (1979), стр. 1-5.
- [3]: среднее значение, медиана и способ унимодального распределения: характеристика. С. Басу и А. ДасГупта (1997). Теория вероятност. Appl., 41 (2), 210–223.
- [4]: некоторые замечания о среднем, среднем, моде и асимметрии. Мичикадзу Сато. Австралийский журнал статистики. Том 39, выпуск 2, стр. 219–224, июнь 1997 г.
- [5]: PT von Hippel (2005). Среднее значение, медиана и перекос: исправление правила из учебника. Журнал статистики образования том 13, номер 2.
В статье, на которую указывает chl, дается некоторая важная информация, показывающая, что она не близка к общему правилу (даже для непрерывных, гладких, «хорошо управляемых» переменных, таких как Вейбулл). Так что, хотя это часто может быть примерно правдой, часто это не так.
Так откуда же Пирсон? Как он пришел к этому приближению?
К счастью, Пирсон в значительной степени говорит нам ответ сам.
Первое использование термина «перекос» в том смысле, в котором мы его используем, кажется, Пирсон, 1895 г. [1] (он появляется прямо в заголовке). Похоже, что в этой статье он вводит термин « мода» (сноска, стр.345):
Это также, кажется, его первая реальная детализация его системы частотных кривых .
Поэтому, обсуждая оценку параметра формы в распределении Пирсона Типа III (то, что мы сейчас назвали бы смещенной - и, возможно, перевернутой - гаммой), он говорит (p375):
* это соответствует гамме, имеющей параметр формы>1
здесь намерение «максимум» - это значение x максимальной частоты (моды), как видно из начала кавычки, а не максимума случайной величины.† x
И действительно, если мы посмотрим на отношение (среднее значение) к (среднее значение) для гамма-распределения, мы увидим следующее:
(Синяя часть обозначает область, которую Пирсон говорит, что приближение является разумным).
Существует довольно много хорошо известных распределений, некоторые из которых были знакомы Пирсону, для которых оно близко к истинному для широкого диапазона значений параметров; он заметил это с гамма-распределением, но эту идею подтвердили бы, когда он пришел посмотреть на несколько других распределений, которые он мог бы рассмотреть.
[1]: Пирсон, К. (1895),
«Вклад в математическую теорию эволюции, II: Косая вариация в однородном материале», «
Философские труды Королевского общества», серия А, 186, 343-414
[Из авторского права. Свободно доступен здесь ]
источник
Это отношение не было выведено. Было замечено, что эмпирически приближенно держатся на почти симметричных распределениях . См. Описание Йоля в «Введение в теорию статистики» (1922), с.121, глава VII, раздел 20. Он представляет эмпирический пример.
источник