Т-распределение с более тяжелым хвостом, чем нормальное распределение

10

В моих конспектах говорится:

Т-распределение выглядит нормально, хотя и с немного более тяжелыми хвостами.

Я понимаю, почему это выглядело бы нормально (из-за центральной предельной теоремы). Но мне трудно понять, как математически доказать, что у него более тяжелые хвосты, чем у нормального распределения, и есть ли способ измерить, насколько он тяжелее нормального распределения.

hmi2015
источник

Ответы:

12

Первое, что нужно сделать, это формализовать то, что мы подразумеваем под «более тяжелым хвостом». Можно условно посмотреть, насколько высока плотность в крайнем хвосте после стандартизации обоих распределений, чтобы иметь одинаковое местоположение и масштаб (например, стандартное отклонение):

введите описание изображения здесь
(из этого ответа, который также имеет отношение к вашему вопросу )

[Для этого случая масштабирование в действительности не имеет значения; t все равно будет «тяжелее», чем нормальное, даже если вы используете очень разные весы; нормальное всегда опускается в конце концов]

Тем не менее, это определение - хотя оно работает хорошо для этого конкретного сравнения - не очень хорошо обобщает.

В более общем смысле, гораздо лучшее определение можно найти в ответе Уубера . Поэтому, если имеет более тяжелый хвост, чем , так как становится достаточно большим (для всех некоторого ), то , где , где - это cdf (для более тяжелых - справа, есть аналогичное очевидное определение с другой стороны).YXtt>t0SY(t)>SX(t)S=1FF

введите описание изображения здесь

Здесь он находится в логарифмическом масштабе и в квантильной шкале нормали, что позволяет нам увидеть более подробно:

введите описание изображения здесь

Таким образом, «доказательство» более тяжелой хвостика будет включать сравнение cdf и показ того, что верхний хвост t-cdf в конечном итоге всегда лежит выше, чем у нормали, а нижний хвост t-cdf в конечном итоге всегда лежит ниже, чем у нормали.

В этом случае проще всего сравнить плотности, а затем показать, что из этого должно следовать соответствующее относительное положение файлов cdf (/ функций оставшихся в живых).

Так, например, если вы можете утверждать, что (при некотором заданном )ν

x2(ν+1)log(1+x2ν)>2log(k)

для необходимой константы (функция ), для всех некоторого , тогда можно было бы установить более тяжелый хвост для также в определении в терминах большего (или большего на левый хвост).kνx>x0tν1FF

(эта форма следует из разности логарифмов плотностей, если это имеет место для соблюдения необходимой взаимосвязи между плотностями)

[На самом деле это возможно показать для любого (не только для конкретного, который нам нужен, исходя из соответствующих констант, нормализующих плотность), поэтому результат должен сохраняться для нам нужно.]kk

Glen_b - Восстановить Монику
источник
1
График с (и, возможно , немного расширяющий ) может более четко демонстрировать более тяжелые хвосты, а также может работать с более высокими степенями свободы,logS(x)x
Генри
1
@ Генри Я создал такой сюжет, но не был уверен, сколько он добавил, поэтому я не включил его. Я подумаю над тем, чтобы
вставить
1
@ Генри, я включил сюжет.
Glen_b
2

Одним из способов увидеть разницу является использование моментовE{xn}.

«Более тяжелые» хвосты будут означать более высокие значения для четных моментов мощности (степень 4, 6, 8), когда дисперсия одинакова. В частности, момент 4-го порядка (около нуля) называется куртозом и в определенном смысле сравнивает тяжесть хвоста.

Подробности смотрите в Википедии ( https://en.wikipedia.org/wiki/Kurtosis ).

Дакиан Бонта
источник
1
Хотя для распределения с или степенями свободы, эксцесс является бесконечным, в то время как с степенями свободы стандартное отклонение бесконечно, поэтому вы не можете рассчитать эксцесс, а с степенью свободы вы даже не можете рассчитать среднее или - й момент. 3 4 2 1 4t34214
Генри
3
@ Генри Тем не менее, эта идея хороша. Расширение CDF распределения Стьюдента вокруг показывает, что оно асимптотически пропорционально . Таким образом, существуют все абсолютные моменты веса, меньшие и все абсолютные моменты веса, превышающие расходятся. При нормальном распределении все абсолютные моменты существуют. Это обеспечивает определенную упорядоченность хвостов всех Студенческий распределения и нормального распределение. По сути, параметр дает один ответ на исходный вопрос о том, как измерить тяжесть хвоста. + x - ν ν ν t νt(ν)+xνννtν
whuber
2

Вот формальное доказательство, основанное на функциях выживания. Я использую следующее определение «более тяжелого хвоста», вдохновленное википедией :

Случайная величина с функцией выживания имеет более тяжелые хвосты, чем случайная величина с функцией выживания если YSy(t)XSx(t)

limtSy(t)Sx(t)=

Рассмотрим случайную переменную распределенную как t Стьюдента со средним нулем, степенями свободы и масштабным параметром . Мы сравниваем это со случайной величиной . Для обеих переменных функции выживания дифференцируемы. Следовательно, YνaXN(0,σ2)

limtSy(t)Sx(t)=limtfy(t)fx(t)=explimt(logfy(t)logfx(t))=explimt(ν+12log(1+t2νa2)(12σ2t2)+C)=exp(limtν+12log(1+t2νa2)(12σ2t2)+C)=exp(limt12σ2t2ν+12log(1+t2νa2)+C)=exp(12limua2σ2u(ν+1)log(1+uν)+C)=exp(12limuu(a2σ2(ν+1)log(1+uν)u+Cu))
Где мы подставили . Обратите внимание, что является константой, и Следовательно, по алгебраической предельной теореме u=t2/a20<a2/σ2<limuC/u=0
limu(ν+1)log(1+uν)u=limu(ν+1)(1)(1+uν)(ν)=0
limtSy(t)Sx(t)=exp(12limuu(a2σ2(0)+(0)))=

Важно отметить, что результат справедлив для произвольных (конечных) значений , и , поэтому вы можете столкнуться с ситуациями, когда распределение имеет меньшую дисперсию, чем нормальное, но при этом имеет более тяжелые хвосты.aσ2ν

Уилл Таунс
источник
1
Просто отметим, что это «определение» более тяжелых хвостов не всегда приемлемо. Например, распределение N (0,1) по этому определению имеет более тяжелые хвосты, чем распределение .9999 * U (-1,1) + .0001 * U (-1000, 1000), даже если последнее распределение производит случайные значения до 175 стандартных отклонений от среднего, несмотря на ограниченную поддержку. Конечно, N (0,1) также дает такие значения, но с вероятностями значительно ниже того, что можно считать актуальным для практических целей.
Питер