Интуиция для моментов о среднем распределении?

13

Может ли кто-то представить интуицию о том, почему более высокие моменты распределения вероятности , такие как третий и четвертый моменты, соответствуют асимметрии и эксцессу соответственно? В частности, почему отклонение от среднего значения, возведенного в третью или четвертую степень, в конечном итоге переходит в меру асимметрии и эксцесса? Есть ли способ связать это с третьей или четвертой производной функции?pX

Рассмотрим это определение асимметрии и эксцесса:

Skewness(X)=E[(XμX)3]/σ3,Kurtosis(X)=E[(XμX)4]/σ4.

В этих уравнениях мы возводим нормированное значение в степень и принимаем его ожидаемое значение. Мне не ясно, почему повышение нормированной случайной величины до степени четырех дает «пик» или почему повышение нормированной случайной величины до степени три дает «асимметрию». Это кажется волшебным и загадочным!(Xμ)/σ

user248237
источник
4
Моя интуитивная склонность состоит в том, чтобы отметить, что третья сила сохраняет негативы. Так что если у вас больше больших отрицательных отклонений от среднего значения, чем у вас положительных (очень просто), то вы получите отрицательное асимметричное распределение. Моя интуиция относительно эксцесса заключается в том, что четвертая степень усиливает большие отклонения от среднего значения намного больше, чем вторая степень. Вот почему мы рассматриваем куртоз как меру того, насколько толсты хвосты распределения. Обратите внимание, что очень большие возможности x от среднего mu повышаются до четвертой степени, что делает их усиленными, но игнорирует знак.
wolfsatthedoor
1
Поскольку на 4-й степени гораздо больше влияют выбросы, чем на 1-й, я ожидаю, что вы мало выиграете, если взглянуть на четвертый момент о медиане - по крайней мере, если целью была устойчивость.
Glen_b
1
Во-первых, обратите внимание, что эти более высокие моменты не обязательно являются хорошими / надежными показателями асимметрии / пика. Тем не менее, я думаю, что лучи дают хорошую физическую интуицию для первых трех моментов, например, среднее значение = баланс / масштаб луча , дисперсия = изгиб кантилевера , асимметрия = качели .
GeoMatt22
1
Вы правы, интерпретация эксцесса как измерение «островершинность» является магическим и загадочным. Это потому, что это совсем не так. Kurtosis абсолютно ничего не говорит о пике. Он измеряет только хвосты (выбросы). Математически легко доказать, что наблюдения вблизи пика вносят минимальный вклад в показатель эксцесса, независимо от того, является ли пик плоским, с шипами, бимодальным, синусоидальным или колоколообразным.
Питер

Ответы:

7

Для этих определений есть веская причина, которая становится понятнее, когда вы смотрите на общую форму моментов стандартизированных случайных величин. Чтобы ответить на этот вопрос, сначала рассмотрим общий вид го стандартизированного центрального момента :n

ϕn=E[(XE[X]S[X])n ].

Первые два стандартизированных центральных момента - это значения и , которые выполняются для всех распределений, для которых вышеуказанная величина четко определена. Следовательно, мы можем рассмотреть нетривиальные стандартизированные центральные моменты, которые возникают для значений . Для облегчения нашего анализа мы определяем:ϕ1=0ϕ2=1n3

ϕn+=E[|XE[X]S[X]|n |X>E[X]]P(X>E[X]),ϕn=E[|XE[X]S[X]|n |X<E[X]]P(X<E[X]).

Это неотрицательные величины, которые дают ую абсолютную мощность стандартизированной случайной величины при условии, что она выше или ниже ожидаемого значения. Теперь мы разложим стандартизированный центральный момент на эти части.n


Нечетные значения измеряют перекос в хвостах:n для любого нечетного значения мы имеем нечетную степень в уравнении момента, и поэтому мы можем записать стандартизированный центральный момент в виде . Из этой формы мы видим, что стандартизированный центральный момент дает нам разницу между й абсолютной степенью стандартизированной случайной величины, при условии, что она выше или ниже среднего значения соответственно.n3ϕn=ϕn+ϕnn

Таким образом, для любой нечетной степени мы получим меру, которая дает положительные значения, если ожидаемая абсолютная мощность стандартизированной случайной величины выше для значений выше среднего, чем для значений ниже среднего, и дает отрицательные значения, если ожидаемые абсолютная мощность ниже для значений выше среднего, чем для значений ниже среднего. Любая из этих величин может обоснованно рассматриваться как мера типа «асимметрии», причем более высокие степени дают больший относительный вес значениям, далеким от среднего.n3

Поскольку это явление имеет место для каждой нечетной степени , естественным выбором для архетипической меры "асимметрии" является определение как асимметрии. Это более низкий стандартизированный центральный момент, чем более высокие нечетные степени, и естественно рассмотреть моменты более низкого порядка, прежде чем рассматривать моменты более высокого порядка. В статистике мы приняли условное обозначение этого стандартизированного центрального момента как асимметрии , поскольку это самый низкий стандартизированный центральный момент, который измеряет этот аспект распределения. (Более высокие нечетные силы также измеряют типы асимметрии, но с большим и большим акцентом на значениях, далеких от среднего.)n3ϕ3


Четные значения измеряют жирность хвостов:n для любого четного значения у нас есть четная степень в уравнении момента, и поэтому мы можем записать стандартизированный центральный момент в виде . Из этой формы мы видим, что стандартизированный центральный момент дает нам сумму й абсолютной степени стандартизированной случайной величины, при условии, что она выше или ниже среднего значения соответственно.n3ϕn=ϕn++ϕnn

Таким образом, для любой четной степени мы получим меру, которая дает неотрицательные значения, причем более высокие значения возникают, если хвосты распределения стандартизированной случайной величины толще. Обратите внимание, что это результат по отношению к стандартизированной случайной переменной, и поэтому изменение масштаба (изменение дисперсии) не влияет на этот показатель. Скорее это эффективная мера жирности хвостов после стандартизации дисперсии распределения. Любая из этих величин может быть разумно расценена как мера типа «эксцесса», с более высокими степенями, дающими больший относительный вес значениям, далеким от среднего.n3

Поскольку это явление имеет место для каждой четной степени , естественным выбором для архетипической меры эксцесса является определение как эксцесс. Это более низкий стандартизированный центральный момент, чем более высокие четные степени, и естественно рассмотреть моменты более низкого порядка, прежде чем рассматривать моменты более высокого порядка. В статистике мы приняли условное обозначение этого стандартизированного центрального момента как «эксцесс», поскольку это самый низкий стандартизированный центральный момент, который измеряет этот аспект распределения. (Более высокие четные степени также измеряют типы эксцессов, но с большим и большим акцентом на значениях, далеких от среднего.)n3ϕ4


Это уравнение хорошо определено для любого распределения, первые два момента которого существуют и которое имеет ненулевую дисперсию. Мы будем предполагать, что распределение процентов попадает в этот класс для остальной части анализа.

Бен - Восстановить Монику
источник
2

Подобный вопрос Что такое «момент» о «моментах» распределения вероятностей? Я дал физический ответ на то, что касалось моментов.

«Угловое ускорение является производной угловой скорости, которая является производной угла по времени, то есть . Считайте, что второй момент аналогичен крутящему моменту, приложенному к круговому движению, или, если вы хотите ускорение / замедление (также вторая производная) этого кругового (то есть углового, ) движения. Точно так же третий момент будет быть скоростью изменения крутящего момента и так далее, и так далее, для еще более высоких моментов, чтобы сделать скорости изменения скоростей изменения скоростей изменения, то есть последовательных производных кругового движения .... "dωdt=α,dθdt=ωθ

Посмотрите на ссылку, так как это, возможно, легче визуализировать с помощью физических примеров

Асимметрия легче понять, чем эксцесс. Отрицательная асимметрия - это более тяжелый левый хвост (или дальнейшее отклонение в отрицательном направлении), чем справа, а положительная асимметрия - наоборот.

Википедия цитирует Westfall (2014) и подразумевает, что высокий эксцесс возникает как для случайных переменных, которые имеют большие выбросы, так и для функций плотности с одним или двумя тяжелыми хвостами, в то же время утверждая, что любая центральная тенденция данных или плотности имеет относительно небольшое влияние на величину эксцесса. Низкие значения эксцессов означают обратное, то есть отсутствие выбросов по оси и относительную легкость обоих хвостов.x

деревенщина
источник
Асимметрия - это точка равновесия PDF из , а эксцесс - точка равновесия PDF из . Обе трансформации «растягивают» хвосты, куртоз больше. Если pdf падает вправо, когда точка опоры помещается в 0, то в исходном распределении наблюдается положительный перекос. Если pdf падает вправо, когда точка опоры помещается на 3.0, то исходное распределение имеет более узкий хвост, чем нормальное распределение. Здесь «тяжесть хвостов» относится скорее к рычагу, чем к массе. Интерпретация мавров не совсем верна в отношении обоих упоминаний о «концентрации». Z3Z4Z3Z4
Питер Уэстфолл
@PeterWestfall Я согласен, что интерпретация мавров несовершенна. Точный язык нелегко достичь, не запутавшись. Взять хотя бы «плечо». Плечо означает первый момент, и нужно было бы изобрести что-то вроде «левереджа» для второго момента, что может сбить с толку больше, чем осветить. Ваш подход, кажется, изобретает новую концепцию, т. Е. «Растянутый рычаг», который намекает на геометрические преобразования, для которых можно также требовать от некоторых защитников, которые предпочитают его, как самосогласованных, с риском быть спорным и нефизическим для других. ,
Карл
«Плечо» относится к первому моменту переменной , где . Это не ракетостроение. UU=Z4
Питер Уэстфолл
@PeterWestfall Не будь слишком маленьким, но ты используешь рычаги. Конечно, вы все еще можете использовать слово, и если не был объектом четвертого измерения, по сравнению с одномерным расстоянием , это может быть даже полезно. Контекст здесь - это момент и создание физической модели для моментов. Есть несколько способов, которые можно сделать, например, см. Мой ответ об этом здесь . Другими словами, чтобы поместить моменты в любой физический контекст, мы должны делать больше, чем просто махать рукой и вызывать четвертое измерение. ZZ4Z
Карл
@PeterWestfall В контексте кругового движения мы бы назвали момент второго момента , а не рычаг , который, хотя и не является неправильным, не напоминает ничего физического. Z2
Карл