Имеем, скажем, следующие данные:
8232302 684531 116857 89724 82267 75988 63871
23718 1696 436 439 248 235
Хотите простой способ приспособить этот (и несколько других наборов данных) к распределению Парето. В идеале это будет выводить совпадающие теоретические значения, а в идеале - параметры.
r
pareto-distribution
Феликс
источник
источник
Ответы:
Хорошо, если у вас есть образец из распределения Парето с параметрами и (где - параметр нижней границы, а - параметр формы), логарифмическая вероятность этого образец является: m > 0 α > 0 m αИкс1, . , , , XN m > 0 α > 0 м α
это монотонно возрастает в , поэтому максимальный максимальный показатель является наибольшим значением, которое согласуется с наблюдаемыми данными. Поскольку параметр определяет нижнюю границу носителя для распределения Парето, оптимуммм м
который не зависит от . Далее, используя обычные трюки исчисления, MLE для должно удовлетворятьαα α
некоторая простая алгебра говорит нам ОМП являетсяα
Во многих важных смыслах (например, оптимальная асимптотическая эффективность в том смысле, что достигается нижняя граница Крамера-Рао), это лучший способ согласовать данные с распределением Парето. Приведенный ниже код R вычисляет MLE для данного набора данных
X
.Редактировать: Основываясь на комментариях @cardinal и I ниже, мы также можем заметить, что является обратной величиной среднего значения выборки , которые происходят с имеют экспоненциальное распределение. Следовательно, если у нас есть доступ к программному обеспечению, которое может соответствовать экспоненциальному распределению (что более вероятно, так как оно возникает во многих статистических задачах), то подгонка распределения Парето может быть достигнута путем преобразования набора данных таким образом и подгонки его экспоненциальному распределению в преобразованном масштабе. войти(Хя/ м )α^ журнал( Xя/ м^)
источник
Вы можете использовать
fitdist
функцию, представленную вfitdistrplus
пакете:источник
library(fitdistrplus)
?library(actuar)
для этого требуется вызов .