Как подобрать приблизительный PDF (т.е. оценку плотности), используя первые k (эмпирических) моментов?

11

У меня есть ситуация, когда я могу оценить (первые) моментов набора данных и хотел бы использовать его для оценки функции плотности.k

Я уже сталкивался с распределением Пирсона , но понял, что он опирается только на первые 4 момента (с некоторыми ограничениями на возможные комбинации моментов).

Я также понимаю, что любого конечного набора моментов недостаточно, чтобы «закрепить» конкретное распределение, когда не используются дополнительные предположения. Тем не менее, я все еще хотел бы для более общего класса распределений (кроме семейства распределений Пирсона). Глядя на другие вопросы, я не смог найти такой рассылки (см .: здесь , здесь , здесь , здесь , здесь и здесь ).

Существует ли некоторое («простое») обобщенное семейство распределений, которое можно определить для любого набора из моментов? (может быть набор преобразований, которые могут принимать стандартное нормальное распределение и преобразовывать его, пока он не будет подтвержден всем набором моментов)кkk

(Мне все равно, если предположить, что другие моменты равны 0 или нет)k+1

Спасибо.

PS: Я был бы рад за расширенный пример. Предпочтительно с примером кода R.

Таль Галили
источник
2
Первые моментов определяют первые k производных характеристической функции в нуле: E [ X k ] = ( - i ) k ϕ ( k ) X ( 0 ) . Итак, вы знаете первые k членов разложения Тейлора характеристической функции около нуля. После этого вы сможете использовать теоремы обращения для получения плотности. ККЕ[ИксК]знак равно(-я)КφИкс(К)(0)К
Стефан Коласса
Спасибо @StephanKolassa - есть ли шанс для расширенного ответа / примера кода R?
Тал Галили
2
en.wikipedia.org/wiki/Maximum_entropy_probability_distribution предлагает общий метод.
whuber
Уважаемый @whuber, не могли бы вы предложить пример кода R? (также, это идет с ответом волков?)
Тал Галили
Это совершенно другой подход к этому ответу.
whuber

Ответы:

11

Метод 1: системы Пирсона высшего порядка

п(Икс)

dп(Икс)dИксзнак равно-(a+Икс)с0+с1Икс+с2Икс2п(Икс)

(a,с0,с1,с2)

с0+с1Икс+с2Икс2п(Икс)

dп(Икс)dИксзнак равно-(a+Икс)с0+с1Икс+с2Икс2+с3Икс3п(Икс)

что дает решение:

введите описание изображения здесь

Некоторое время назад я решил это ради забавы (имея ту же последовательность мыслей, что и ОП): вывод и решение даны в главе 5 нашей книги; если интересно, бесплатная загрузка доступна здесь:

http://www.mathstatica.com/book/bookcontents.html

Заметим, что, хотя семейство Пирсона второго порядка (квадратичное) можно выразить через первые 4 момента, семейство Пирсона в третьем порядке (кубическое) требует первых 6 моментов.

Метод 2: Расширения Грамм-Шарлье

КTчас

Моменты населения или примеры моментов ??

Для системы в стиле Пирсона: если моменты населения известны, то использование более высоких моментов должно однозначно привести к лучшей подгонке. Однако, если наблюдаемые данные представляют собой случайную выборку, взятую из совокупности, существует компромисс: полином более высокого порядка подразумевает, что требуются моменты более высокого порядка, и оценки последних могут быть ненадежными (иметь высокую дисперсию), если размер выборки не является «большим». Другими словами, учитывая данные выборки, подгонка с использованием более высоких моментов может стать «нестабильной» и привести к худшим результатам. То же самое верно для расширений Грамм-Шарлье: добавление дополнительного термина может фактически привести к худшему соответствию, поэтому требуется некоторая осторожность.

wolfies
источник
Уважаемые @wolfies - спасибо за ваш ответ! Если я вас правильно понимаю, расширения Грамм-Шарлье больше соответствуют тому, что я ищу (хотя интересует более распространенное распределение Пирсона). Я посмотрел на вашу книгу (глава 5, начиная со страницы 175) и увидел, что вы действительно даете там подробное описание (с упоминанием того, как поступать с предполагаемыми моментами, как в моем случае). Единственное, что я не могу использовать ваш код (так как я пользователь R). Спасибо за ваш ответ (а также за вашу книгу, которая кажется впечатляющей и интересной в целом)
Таль Галили
2
Просто нашел пакет R для работы с различными методами: cran.us.r-project.org/web/packages/PDQutils/vignettes/…
Галили