Как эксцесс распределения связан с геометрией функции плотности?

12

Куртоз - это измерение пика и плоскостности распределения. Функция плотности распределения, если она существует, может рассматриваться как кривая и имеет геометрические особенности (такие как кривизна, выпуклость, ...), связанные с ее формой.

Поэтому мне интересно, связан ли эксцесс распределения с некоторыми геометрическими особенностями функции плотности, которые могут объяснить геометрический смысл эксцесса?

Тим
источник
Я прошу какое-то отношение в формуле к некоторому геометрическому количеству кривой плотности, а не только к смутному значению, которое я указал в своем посте. Или просто иметь какое-то объяснение того, почему эксцесс имеет геометрическое значение
Тим
@ Питер Это далеко от истины. Можно изменить геометрию графа PDF практически произвольно, не изменяя ни одного заданного (конечного числа его) моментов.
whuber
Тесно связанный вопрос по адресу stats.stackexchange.com/questions/25010/… предлагает правильный ответ на этот вопрос.
whuber
@whuber, хотя я согласен и благодарю вас за этот пример, мне также интересно, не говорит ли он больше о замечательном свойстве этого конкретного семейства pdf, чем о куртозе в целом.
user603
@ user603 Интересно, хорошо. Однако утверждение не об этом конкретном семействе: просто случается, что для логнормального распределения можно получить явное представление класса альтернативных PDF-файлов с одинаковыми моментами. Особенность в том, что все моменты одинаковы, но возмущение большинства распределений таким образом, что фиксирует конечное число их моментов, не сложно. (Это сложно для некоторых дискретных дистрибутивов, таких как Бернулли, но у них нет PDF-файлов.)
whuber

Ответы:

17

Моменты непрерывного распределения и их функции, такие как эксцесс, очень мало говорят о графике его функции плотности.

Рассмотрим, например, следующие графики.

введите описание изображения здесь

Каждый из них представляет собой график неотрицательной функции, интегрируемой в : все они являются PDF-файлами. Более того, все они имеют одинаковые моменты - каждое их бесконечное количество. Таким образом, у них общий куртоз (который равен )- 3 + 3 е 2 + 2 е 3 + е 413+3e2+2e3+e4

Формулы для этих функций

fk,s(x)=12πxexp(12(log(x))2)(1+ssin(2kπlog(x))

для и- 1 s 1 , K Z .x>0, 1s1,kZ.

На рисунке слева показаны значения и значения сверху. В левом столбце показан PDF для стандартного логнормального распределения.кsk

Упражнение 6.21 в Продвинутой теории статистики Кендалла (Stuart & Ord, 5-е издание) просит читателя показать, что все они имеют одинаковые моменты.

Можно аналогичным образом модифицировать любой PDF-файл, чтобы создать другой PDF-файл совершенно другой формы, но с такими же вторыми и четвертыми центральными моментами (скажем), который, следовательно, будет иметь такой же эксцесс. Только из этого примера должно быть совершенно ясно, что эксцесс не является легко интерпретируемой или интуитивно понятной мерой симметрии, унимодальности, бимодальности, выпуклости или любой другой знакомой геометрической характеристики кривой.

Следовательно, функции моментов (и эксцесс как частный случай) не описывают геометрические свойства графика pdf. Интуитивно это имеет смысл: поскольку pdf представляет вероятность с помощью области, мы можем почти свободно перемещать плотность вероятности из одного места в другое, радикально изменяя внешний вид pdf, в то же время фиксируя любое конечное число предварительно определенных моментов.

Whuber
источник
1
«Только из этого примера это должно быть совершенно ясно ... любая другая знакомая геометрическая характеристика кривой». Я понимаю, что вы имеете в виду, но здесь есть основания для разумного расхождения в толковании. Другая интерпретация - это Дарлингтон, который показывает, как, начиная с симметричного распределения, перемещение некоторой массы в определенных точках увеличивает / уменьшает эксцесс (опять же, не противоречие вашего примера, просто более «позитивное» понимание).
user603
1
@ user603 Я не согласен, но я думаю, что «позитивный» подход не учитывает особые предположения, которые неявно сделаны для того, чтобы он вообще работал. Можно также начать с графика чрезвычайно асимметричного PDF, у которого асимметрия равна нулю (их нетрудно построить). Таким образом, этот позитивный подход просто описывает, что происходит с некоторыми очень специальными PDF-файлами, когда масса перемещается. Хотя это может быть весьма полезно для интуиции, похоже, что оно не имеет никакого логического отношения к настоящему вопросу.
whuber
1
Я согласен на асимметрию (и на ваш ответ в целом). Но эксцесс, как функция, имеет минимум. Это делает вещи немного интереснее.
user603
1
@ user603 Спасибо; это проницательное различие. Я не думаю, что это меняет какие-либо из существующих выводов важными способами, но это, безусловно, помогает интуиции и указывает на важное различие между четными и нечетными моментами.
whuber
6

Для симметричных распределений (то есть тех, для которых четные центрированные моменты имеют смысл) эксцесс измеряет геометрическую особенность лежащего в основе pdf. Неверно, что эксцесс измеряет (или вообще связан) с остротой распределения. Скорее, эксцесс измеряет, насколько далеко лежащее в основе распределение от симметричного и бимодального (алгебраически, идеально симметричное и бимодальное распределение будет иметь эксцесс 1, что является наименьшим возможным значением, которое может иметь эксцесс) [0].

В двух словах, если вы определите:

k=E(xμ)4/σ4

с , тоE(X)=μ,V(X)=σ2

k=V(Z2)+11

для .Z=(Xμ)/σ

Это подразумевает, что можно рассматривать как меру дисперсии вокруг его ожидания 1. Другими словами, если у вас есть геометрическая интерпретация дисперсии и ожидания, то следует то, что следует за эксцессом.kZ2

[0] Р.Б. Дарлингтон (1970). Куртоз действительно "пик"? Американский статистик, вып. 24, № 2.

[1] JJA Moors (1986). Значение куртоза: Дарлингтон пересмотрен. Американский статистик, том 40, выпуск 4.

user603
источник
1
Везде, где вы пишете «бимодальный», возможно, вы имеете в виду «унимодальный»?
whuber
1
Да, эти примеры работают для симметричных распределений. Явный можно построить из псевдологнормальных семейств: возьмите один из этих (бесконечно модальных) pdfs со средним значением и определите новый pdf какСмешивая небольшое количество с распределением минимального эксцесса, вы обнаружите, что есть распределения с бесконечным числом мод, эксцесс которых произвольно близок к минимальному значению . Таким образом, по крайней мере, куртоз ничего не говорит о бимодальности. Так как это не так, какое именно геометрическое свойство PDF он описывает? fμg(x)=(f(x)+f(2μx))/2.g1
whuber
1
Куртоз не указывает на бимодальность, за исключением крайнего случая, когда он близок к своему минимуму, где он указывает на что-то похожее на двухточечное равновероятное распределение. Вы можете иметь бимодальные распределения с любым возможным значением эксцесса. См. Ncbi.nlm.nih.gov/pmc/articles/PMC4321753 для примеров.
Питер Уэстфолл,
1
Да; см. документ, который я связал. Первое предложение тезисов Де Карло абсолютно неверно. Если вы не хотите читать мою статью, вот математика: возьмите любое симметричное бимодальное распределение и смешайте его с гораздо более широким симметричным распределением, имеющим ту же медиану, что и бимодальное. Смесь симметричная и бимодальная для малых . Изменяя более широкое распределение и смешивая , вы можете сделать kurtosis дальностью до бесконечности. И вы можете получить минимальный эксцесс, если хотите, используя .5N (-1, v) + .5N (1, v), позволяя . Симметричные и бимодальные PDF легко построить для любого эксцесса. ppv0
Питер Уэстфолл,
5

[NB это было написано в ответ на другой вопрос на сайте; ответы были объединены с настоящим вопросом. Вот почему этот ответ, похоже, отвечает на другой вопрос. Однако большая часть поста должна быть уместна здесь.]

Куртоз на самом деле не измеряет форму распределений. Возможно, в некоторых распределительных семьях вы можете сказать, что он описывает форму, но в целом куртоз не говорит вам ужасно о фактической форме. На форму влияют многие вещи, в том числе не связанные с куртозом.

Если кто-то выполняет поиск изображений для эксцесса, появляется немало таких изображений:

п

которые вместо этого, кажется, показывают изменяющуюся дисперсию, а не увеличивающийся эксцесс. Для сравнения вот три нормальных плотности, которые я только что нарисовал (используя R) с различными стандартными отклонениями:

введите описание изображения здесь

Как видите, выглядит он практически идентично предыдущему рисунку. Все они имеют одинаковый эксцесс. Напротив, вот пример, который, вероятно, ближе к тому, к чему стремился график

введите описание изображения здесь

Зеленая кривая более остроконечная и более тяжелая с хвостами (хотя этот дисплей не очень подходит для определения того, насколько тяжелее хвост на самом деле). Синяя кривая менее остроконечна и имеет очень легкие хвосты (на самом деле она вообще не имеет хвостов за пределами стандартных отклонений от среднего значения).6

Обычно это то, что люди имеют в виду, когда говорят о куртозе, указывая на форму плотности. Тем не менее, эксцесс может быть тонким - он не должен так работать.

Например, при данной дисперсии более высокий эксцесс может происходить с более низким пиком.

Нужно также остерегаться соблазна (и во многих книгах об этом открыто говорится), что нулевой избыточный эксцесс подразумевает нормальность. Существуют распределения с избыточным эксцессом 0, которые не похожи на нормальные. Вот пример:

дгам 2,3

Действительно, это также иллюстрирует предыдущий пункт. Я мог бы с легкостью построить похожее распределение с более высоким эксцессом, чем нормальное, но которое все еще равно нулю в центре - полное отсутствие пика.

На сайте есть несколько постов, которые описывают куртоз в дальнейшем. Один пример здесь .

Glen_b - Восстановить Монику
источник
Но я не сказал это? Книга говорит это?
Стат Тистициан
Я знаю это. Я никогда не говорил, что ты это сказал. Как бы вы посоветовали мне ответить на явно некорректные заявления, о которых вы спрашиваете? Просто притвориться, что они не правы?
Glen_b
1
@Glen_b Фотографии не из книги. Книга не дает иллюстраций. Я использовал поиск картинок goolge для этих иллюстраций.
Стат Тистициан
2
Некоторые авторы пишут о куртозе как о пике, а некоторые пишут о нем как о весе хвоста, но скептическая интерпретация того, что куртоз - это то, что измеряет куртоз, является единственной полностью безопасной историей. Численных примеров, приведенных одним только Ирвингом Капланским (1945), достаточно, чтобы показать, что эксцесс не имеет однозначной интерпретации. (Бумага Капланского - одна из немногих, написанных им в середине 1940-х годов о вероятности и статистике. Он гораздо более известен как выдающийся алгебраист.) Полная ссылка и многое другое в stata-journal.com/sjpdf.html?articlenum=st0204
Ник Кокс
1
Существуют книги и газеты, в которых утверждается, что куртоз - это пик, поэтому мое первое предложение остается верным и подкрепляется как утверждение о том, что в литературе. Что более важно, так это отношение к примерам и аргументам Капланского.
Ник Кокс
3

Куртоз вообще не связан с геометрией распределения, по крайней мере, не в центральной части распределения. В центральной части распределения (в пределах диапазона ) геометрия может показывать бесконечный пик, плоский пик или бимодальные пики как в случаях, когда эксцесс является бесконечным, так и в случаях, когда эксцесс является меньше, чем у нормального распределения. Куртоз измеряет только поведение хвоста (выбросы). См. Https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/μ±σ

Редактировать 23.11.2008: С момента написания этого поста я разработал некоторые геометрические перспективы куртоза. Одним из них является то, что избыточный эксцесс может действительно визуализироваться геометрически в терминах отклонений от ожидаемой линии 45 градусов в хвостах нормального квантильно-квантильного графика; см. Показывает ли этот график QQ лептокуротическое или платикуртичное распределение?

Другая (возможно, более физическая, чем геометрическая) интерпретация куртоза состоит в том, что куртоз можно представить как точку баланса распределения , где . Обратите внимание, что (не избыточный) эксцесс равен . Таким образом, распределение остатков на эксцесс .pV(v)V={(Xμ)/σ}4XE(V)VX

Другой результат, который показывает, что геометрия в диапазоне практически не имеет отношения к куртозу, приводится ниже. Рассмотрим pdf любого RV имеющего конечный четвертый момент. (Таким образом, результат применим ко всем эмпирическим распределениям.) Произведите произвольную замену массы (или геометрии) в диапазоне чтобы получить новое распределение, но оставьте среднее и стандартное отклонение полученного распределения равным и оригинального . Тогда максимальная разница в эксцессах для всех таких замен составляет . С другой стороны, если вы замените массу внеμ±σXμ±σμσX0.25μ±σВ диапазоне, сохраняя центральную массу, а также , фиксированными, разница в эксцессе не ограничена для всех таких замен.μσ

Питер Уэстфолл
источник
3
Вместо того, чтобы просто продолжать отсылать людей к статье в большинстве ваших постов, не могли бы вы обобщить приведенные здесь аргументы? См. Здесь помощь в разделе «всегда предоставлять контекст для ссылок», в частности там, где написано «всегда указывайте важную часть». Это не обязательно буквально цитировать его там, где аргумент является обширным, но по крайней мере необходимо краткое изложение аргумента. Вы просто делаете пару радикальных заявлений и затем ссылаетесь на статью. Утверждение о том, что куртоз измеряет поведение хвоста (отсутствует контекст), вводит в заблуждение (очевидно, так)
Glen_b
2
... но невозможно не согласиться с аргументами, которых вы здесь не представляете, и, возможно, прийти к более тонкому заключению.
Glen_b
Мои аргументы четко изложены здесь: en.wikipedia.org/wiki/… Комментарии приветствуются! Кстати, эксцесс IS меры хвоста веса, просто не такой же , как и другие , которые были рассмотрены. Он измеряет вес хвоста через E (Z ^ 4), который является мерой веса хвоста, так как значения | Z | <1 вносят в него так мало. По той же логике E (Z ^ n) для более высоких четных степеней n также являются мерами хвостового веса.
Питер Уэстфолл,
Привет, Питер! Пожалуйста, посетите stats.stackexchange.com/help/merging-accounts, чтобы объединить свои учетные записи и изменить свои старые сообщения.
whuber
3

Ответ другого рода: мы можем проиллюстрировать эксцесс геометрически, используя идеи из http://www.quantdec.com/envstats/notes/class_06/properties.htm : графические моменты.

Начните с определения : где - плотность , соответственно ожидание и дисперсия. Неотрицательная функция под знаком интеграла интегрируется в эксцесс и дает вклад в эксцесс около . Мы можем назвать это плотностью эксцесса , и на графике она показывает графически. (Обратите внимание, что в этом посте мы вообще не используем избыточный эксцесс ).

k=E(Xμσ)4=(xμσ)4f(x)dx
fXμ,σ2xk e = k - 3 ke=k3

В следующем я покажу график графического эксцесса для некоторых симметричных распределений, все с центром в нуле и масштабированными, чтобы иметь дисперсию 1.

визуальный эксцесс для некоторых симметричных распределений

Обратите внимание на фактическое отсутствие вклада в эксцесс из центра, показывающий, что эксцесс не имеет большого отношения к «остроте».

Къетил б Халворсен
источник
1
Z2b+bb