Замкнутая форма выражения для распределения выборочного эксцесса гауссовского распределения

10

Существует ли выражение в замкнутой форме для распределения выборочного куртоза данных, взятых из распределения Гаусса? т.е.

КP(K^<a) где - примерный эксцесс.K^

Yoki
источник
2
Образцовый эксцесс дается выражениями в замкнутой форме; Существуют разные формулы, но я никогда не видел, какой из них использовать, зависит от того, какой дистрибутив, по вашему мнению, у вас есть. Возможно, вы имеете в виду, есть ли выражение замкнутой формы для функции плотности вероятности эксцесса при выборке из гауссиана?
Ник Кокс
Я ужасно сожалею, я имею в виду распределение выборочного эксцесса, а не сам примерный эксцесс.
Йоки
Благодарю за разъяснение. Более подробно см., Например, meta.stats.stackexchange.com/questions/1479/… о том, что нет необходимости благодарить людей и т. Д. Просто задайте вопрос!
Ник Кокс

Ответы:

11

Точное распределение выборки сложно получить; были первые несколько моментов (начиная с 1929 года), различные приближения (начиная с начала 1960-х годов) и таблицы, часто основанные на симуляции (начиная с 1960-х годов).

Чтобы быть более конкретным:

Фишер (1929) приводит моменты выборочного распределения асимметрии и эксцесса в нормальных образцах, а Пирсон (1930) (также) дает первые четыре момента выборочного распределения асимметрии и эксцесса и предлагает тесты на их основе.

Так например :

E(b2)=3(n1)n+1

Var(b2)=24n(n2)(n3)(n+1)2(n+3)(n+5)

Асимметрия равна216b2216n(129n+519n27637n3+)

Избыточный эксцесс равен .540b2540n20196n2+470412n3+

* Остерегайтесь - значения моментов и т. Д. Зависят от точного определения используемого эксцесса образца. Например, если вы видите другую формулу для или , это, как правило, происходит из-за немного другого определения выборочного эксцесса.Var ( b 2 )E(b2)Var(b2)

В этом случае вышеуказанные формулы должны применяться к .b2=ni(XiX¯)4(i(XiX¯)2)2

Пирсон (1963) обсуждает аппроксимацию выборочного распределения эксцесса в нормальных образцах с помощью распределения Пирсона типа IV или распределения Джонсона (несомненно, причина, по которой первые четыре момента были даны тремя десятилетиями ранее, была в значительной степени для возможности использования семейства Пирсонов) ,SU

Pearson (1965) приводит таблицы процентилей куртоза для некоторых значений .n

D'Agostino и Tietjen (1971) приводят более обширные таблицы процентилей для куртоза.

Д'Агостино и Пирсон (1973) приводят графики процентных точек куртоза, которые снова охватывают более широкий диапазон случаев.

Фишер, Р. А. (1929),
«Моменты и моменты продукта распределений выборки»,
Труды Лондонского математического общества , Серия 2, 30: 199-238.

Пирсон, Е.С., (1930)
«Дальнейшая разработка тестов на нормальность»,
Биометрика , 22 (1-2), 239-249.

Пирсон, Е.С. (1963)
"Некоторые проблемы, возникающие при приближении к вероятностным распределениям с использованием моментов",
Биометрика , 50 , 95-112

Пирсон, Е.С. (1965)
"Таблицы процентных точек и в нормальных выборках: округление", Биометрика , 52 , 282-285 б2b1b2

Д'Агостино, Р.Б. и Титджен, Г.Л. (1971),
"Моделирование точек вероятности для малых выборок", Биометрика , 58 , 669-672.b2

Д'Агостино, Р.Б. и Пирсон, Е.С. (1973),
"Тесты на отклонение от нормальности. Эмпирические результаты для распределения и ", Biometrika , 60 , 613-622.b2b1

Glen_b - Восстановить Монику
источник
6

Образец Куртоза из нормальной выборки приблизительно распределен как нормаль с нулевым средним с дисперсией , где - размер выборки (естественно, чем больше тем лучше аппроксимация. Более сложные выражения для дисперсии могут быть находится на странице википедии ). Для гауссовых образцов малого размера (<40) процентили были получены в этой статье: Lacher, DA (1989). Выборочное распределение асимметрии и эксцесса. Клиническая химия, 35 (2), 330-331.n n24/nnn

Алекос Пападопулос
источник
2
n = 500 n > 1000n должно быть умеренно большим, прежде чем нормальное приближение станет разумным. Статистика смоделированного куртоза достоверно искажена (положительно), когда ; они начинают выглядеть нормально для или около того. n=500n>1000
whuber