Ненормальные распределения с нулевой асимметрией и нулевым избыточным эксцессом?
19
В основном теоретический вопрос. Есть ли примеры ненормальных распределений, у которых первые четыре момента равны нормальным? Могут ли они существовать в теории?
Рассматривая даже просто смесь из 2 нормалей (5 параметров - 2 средних, 2 дисперсий и вероятность смешивания), вы можете решить для самых разных первых четырех моментов.
Шеридан Грант
Ответы:
29
Да, примеры с асимметрией и избыточным эксцессом, равными нулю, относительно легко построить. (Действительно, примеры (a) - (d) ниже также имеют среднечисленную асимметрию Пирсона 0)
(а) Например, в этом ответе приводится пример, в котором берется смесь 50-50 гамма-переменной (которую я называю X ) и отрицательная величина второй, плотность которой выглядит следующим образом:
Очевидно, что результат является симметричным и не нормальным. Параметр масштаба здесь не важен, поэтому мы можем сделать его 1. Тщательный выбор параметра формы гаммы дает требуемый эксцесс:
Дисперсию этой двойной гаммы ( Y ) легко определить с точки зрения гамма-вариации, на которой она основана: Var(Y)=E(X2)=Var(X)+E(X)2=α+α2 .
Четвертый центральный момент переменной Y такой же, как Е( X4) , который для гаммы ( α ) равен α ( α + 1 ) ( α + 2 ) ( α + 3 )
В результате эксцесс равен α(α+1)(α+2)(α+3)α2(α+1)2=(α+2)(α+3)α(α+1) . Это3когда(α+2)(α+3)=3α(α+1), что происходит, когдаα=(13−−√+1)/2≈2.303.
(б) Мы могли бы также создать пример в виде смеси двух форм. Пусть U1∼U(−1,1) и U2∼U(−a,a) , и пусть M=12U1+12U2. Ясно, что, учитывая, чтоMсимметричен и имеет конечный диапазон, мы должны иметьE(M)=0; асимметрия также будет равна 0, а центральные моменты и исходные моменты будут одинаковыми.
Var(M)=E(M2)=12Var(U1)+12Var(U2)=16[1+a2].
Аналогично, E(M4)=110(1+a4)и поэтому эксцесс равен110(1+a4)[16(1+a2)]2=3.61+a4(1+a2)2
Если мы выберем = √a=5+24−−√−−−−−−−√≈3.1463, тогда эксцесс равен 3, а плотность выглядит следующим образом:
(с) вот забавный пример. Пусть Xi∼iidPois(λ) , для i=1,2 .
Пусть Y представляет собой смесь из 50-50 X1−−−√ и−X2−−−√
E(Y)=0E(|Y|)E(X1)
Var(Y)=E(Y2)=E(X1)=λ
по симметрии (и тому факту, что абсолютный третий момент существует) косо = 0
4th moment: Е( Y4) = E( X21) = λ + λ2
куртоз = λ + λ2λ2= 1 + 1 / λ
так когда λ = 12, эксцесс равен 3. Это случай, показанный выше.
(d) все мои примеры до сих пор были симметричными, так как симметричные ответы легче создавать - но также возможны асимметричные решения. Вот отдельный пример.
Как видите, ни один из этих примеров не выглядит особенно «нормальным». Было бы просто создать любое количество дискретных, непрерывных или смешанных переменных с одинаковыми свойствами. Хотя большинство моих примеров были сконструированы как смеси, в них нет ничего особенного , кроме того, что они часто являются удобным способом создания распределений со свойствами так, как вы хотите, немного похоже на создание объектов с помощью Lego.
Этот ответ дает некоторые дополнительные подробности о эксцессах, которые должны прояснить некоторые соображения, связанные с построением других примеров.
Вы можете подобрать больше моментов подобным образом, хотя для этого требуется больше усилий. Однако, поскольку MGF нормали существует, вы не можете сопоставить все целочисленные моменты нормали с некоторым ненормальным распределением, поскольку это будет означать, что их MGF совпадают, подразумевая, что второе распределение также было нормальным.
Хорошие моменты сделаны Glen_b. Я бы только добавил рассмотрение функции Дельты Дирака в качестве дополнительного зерна для мельницы. Как отмечает Википедия, «DDF - это обобщенная функция, или распределение, на линии вещественных чисел, которая равна нулю везде, кроме нуля, с интегралом одного по всей вещественной линии», вследствие чего все более высокие моменты DDF нуль.
Пол Дирак применяет его к квантовой механике в своей книге 1931 года «Принципы квантовой механики», но ее истоки восходят к Фурье, Лесбегу, Коши и другим. У DDF также есть физические аналоги в моделировании распределения, например, трещины летучей мыши, поражающей бейсбольный мяч.
Вопрос в том, чтобы сделать «первые четыре момента равными моментам [a] нормального [распределения]». У вас нет надежды даже на совпадение со вторым центральным моментом, когда вы используете дельта-дистрибутив.
whuber
3
Возможно, вы можете привести пример совпадения моментов со стандартной нормалью (среднее значение 0, дисперсия 1, Е[ ( X- μ )3] = E( X3) = 0 и Е[ ( X- μ )4] = E( X4) = 3). Если вы сделаете это, он ответит на поставленные вопросы и прояснит вашу точку зрения.
Glen_b
3
@A. Донда: Избыточный эксцесс - это 4-й стандартизированный момент о среднем минус 3, т.е.E (X- E X)4/ ( E (X- E X)2)2, поэтому я не думаю, что вы можете сказать, что это -3 в случае дельта-функции Дирака - скорее, она не определена, так как дисперсия равна нулю.
Scortchi - Восстановить Монику
2
@Mike Hunter: Я думаю, что вопросы в названии и теле эквивалентны: если у вас есть распределение с определенной асимметрией и избыточным эксцентриком, равным нулю, соответствие среднего значения и дисперсии любому гауссову, которое вы хотите, просто сдвигается и растягивается. Я подчеркиваю определенность, потому что и асимметрия, и эксцесс являются стандартизированными моментами, поэтому у дельта-функции Дирака их нет.
Ответы:
Да, примеры с асимметрией и избыточным эксцессом, равными нулю, относительно легко построить. (Действительно, примеры (a) - (d) ниже также имеют среднечисленную асимметрию Пирсона 0)
(а) Например, в этом ответе приводится пример, в котором берется смесь 50-50 гамма-переменной (которую я называюX ) и отрицательная величина второй, плотность которой выглядит следующим образом:
Очевидно, что результат является симметричным и не нормальным. Параметр масштаба здесь не важен, поэтому мы можем сделать его 1. Тщательный выбор параметра формы гаммы дает требуемый эксцесс:
Дисперсию этой двойной гаммы (Y ) легко определить с точки зрения гамма-вариации, на которой она основана: Var(Y)=E(X2)=Var(X)+E(X)2=α+α2 .
Четвертый центральный момент переменнойY такой же, как Е( X4) , который для гаммы ( α ) равен α ( α + 1 ) ( α + 2 ) ( α + 3 )
В результате эксцесс равенα(α+1)(α+2)(α+3)α2(α+1)2=(α+2)(α+3)α(α+1) . Это3 когда(α+2)(α+3)=3α(α+1) , что происходит, когдаα=(13−−√+1)/2≈2.303 .
(б) Мы могли бы также создать пример в виде смеси двух форм. ПустьU1∼U(−1,1) и U2∼U(−a,a) , и пусть M=12U1+12U2 . Ясно, что, учитывая, чтоM симметричен и имеет конечный диапазон, мы должны иметьE(M)=0 ; асимметрия также будет равна 0, а центральные моменты и исходные моменты будут одинаковыми.
Аналогично,E(M4)=110(1+a4) и поэтому эксцесс равен110(1+a4)[16(1+a2)]2=3.61+a4(1+a2)2
Если мы выберем = √a=5+24−−√−−−−−−−√≈3.1463 , тогда эксцесс равен 3, а плотность выглядит следующим образом:
(с) вот забавный пример. ПустьXi∼iidPois(λ) , для i=1,2 .
ПустьY представляет собой смесь из 50-50 X1−−−√ и−X2−−−√
по симметрии (и тому факту, что абсолютный третий момент существует) косо = 0
4th moment:Е( Y4) = E( X21) = λ + λ2
куртоз =λ + λ2λ2= 1 + 1 / λ
так когдаλ = 12 , эксцесс равен 3. Это случай, показанный выше.
(d) все мои примеры до сих пор были симметричными, так как симметричные ответы легче создавать - но также возможны асимметричные решения. Вот отдельный пример.
Как видите, ни один из этих примеров не выглядит особенно «нормальным». Было бы просто создать любое количество дискретных, непрерывных или смешанных переменных с одинаковыми свойствами. Хотя большинство моих примеров были сконструированы как смеси, в них нет ничего особенного , кроме того, что они часто являются удобным способом создания распределений со свойствами так, как вы хотите, немного похоже на создание объектов с помощью Lego.
Этот ответ дает некоторые дополнительные подробности о эксцессах, которые должны прояснить некоторые соображения, связанные с построением других примеров.
Вы можете подобрать больше моментов подобным образом, хотя для этого требуется больше усилий. Однако, поскольку MGF нормали существует, вы не можете сопоставить все целочисленные моменты нормали с некоторым ненормальным распределением, поскольку это будет означать, что их MGF совпадают, подразумевая, что второе распределение также было нормальным.
источник
Хорошие моменты сделаны Glen_b. Я бы только добавил рассмотрение функции Дельты Дирака в качестве дополнительного зерна для мельницы. Как отмечает Википедия, «DDF - это обобщенная функция, или распределение, на линии вещественных чисел, которая равна нулю везде, кроме нуля, с интегралом одного по всей вещественной линии», вследствие чего все более высокие моменты DDF нуль.
Пол Дирак применяет его к квантовой механике в своей книге 1931 года «Принципы квантовой механики», но ее истоки восходят к Фурье, Лесбегу, Коши и другим. У DDF также есть физические аналоги в моделировании распределения, например, трещины летучей мыши, поражающей бейсбольный мяч.
источник