Надежная оценка куртоза?

11

Я использую обычный оценщик для , но я заметилчто даже небольшие «выбросы» в моем эмпирическом распределении, то есть небольшие пики далеко от центра, влияютего чрезвычайно. Существует ли более надежная оценка эксцесса?

K^=μ^4σ^4
Yoki
источник

Ответы:

8

Есть несколько. В этой ссылке вы найдете исчерпывающее сравнение с версией статьи без документации (соответствующая ссылка внизу этого ответа).

Из-за ограничений задачи разбивка наиболее надежных из этих алгоритмов (L / RMC) составляет не более 12,5%. Преимущество L / RMC состоит в том, что он основан на квантилях и остается интерпретируемым, даже если в базовом распределении нет моментов. Другое преимущество состоит в том, что он не предполагает симметрию распределения незагрязненной части данных для измерения веса хвоста: фактически, алгоритм возвращает два числа: RMC для веса правого хвоста и LMC для веса левого хвоста.

[0,1]по конструкции: никакое количество загрязнения не может, например, заставить алгоритм вернуть -1!). На практике можно обнаружить, что можно заменить около 5% выборки даже очень патологическими выбросами, не заставляя наиболее затронутые оценки (их всегда две) слишком сильно отклоняться от значения, которое было у незагрязненной выборки.

L / RMC также широко применяется. Например, вы можете найти реализацию R здесь . Как объяснено в статье, приведенной выше, чтобы вычислить L / RMC, вам нужно вычислить MC (оценщик, реализованный в ссылке) отдельно для левой и правой половины ваших данных. Здесь (левая) правая половина - это подвыборки, сформированные из наблюдения (меньшего), большего, чем медиана вашей исходной выборки.

  • Брис, Хьюберт, Стрейф. (2006). Надежные меры веса хвоста.
user603
источник
2
Разве эти альтернативные измерения веса хвоста, а не надежные оценки эксцесса за скажем? Это может быть то, что он действительно хочет. но это не совсем то, что он просил. Сходятся ли какие-либо / все эти оценки к эксцессу для больших выборок?
andrewH
Резюме из статьи: При незагрязненных данных, удовлетворяющих условиям выпуклого упорядочения Ван Цвета (при которых мера куртоза имеет смысл), они сходятся к монотонной функции куртоза.
user603
1
Куртоз Пирсона измеряет выбросы (редкие экстремальные наблюдения), простые и понятные. Так что вы ищете вместо этого? Мера "пик"? Во-первых, это совсем не то, что измеряет эксцесс Пирсона. Во-вторых, если вы хотите измерить «пик», вы должны сначала определить, что это значит. Если вы можете определить это, вы можете оценить это. Одной из возможностей является вторая производная от pdf стандартизированных данных, оцененных на пике. (Пожалуйста). Я уверен, что есть другие.
Питер
1
На самом деле, я даю три математические теоремы, которые связывают эксцесс с хвостами распределения, поэтому их невозможно сфальсифицировать: (i) Для всех распределений с конечным четвертым моментом эксцесс находится между E (Z ^ 4 * I (| Z |> 1) )) и E (Z ^ 4 * I (| Z |> 1)) +1. (ii) В подклассе, для которого плотность Z ^ 2 непрерывна и уменьшается на (0,1), «+1» можно заменить на «+.5». (iii) Для любой последовательности распределений, имеющих эксцесс -> бесконечность, E (Z ^ 4 * I (| Z |> b)) / эксцесс -> 1, для любого вещественного b. Это все здесь: ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Питер Уэстфолл,