Пусть из t-распределения Стьюдента с степенями свободы для среднего размера (скажем, менее 100). Определить Распространяется ли почти как хи-квадрат с k степенями свободы? Есть ли что-то вроде центральной предельной теоремы для суммы квадратов случайных величин?
chi-squared
central-limit-theorem
t-distribution
shabbychef
источник
источник
Ответы:
Отвечая на первый вопрос.
Мы могли бы начать с того факта, что mpiktas отметил, что . А затем попробуйте сначала сделать более простой шаг - найти распределение суммы двух случайных величин, распределенных по F ( 1 , n ) . Это можно сделать либо путем вычисления свертки двух случайных величин, либо путем вычисления произведения их характеристических функций.t2∼F(1,n) F(1,n)
Статья на PCB Филлипс показывает , что мое первое предположение о «[сливающемся] гипергеометрических функциях , связанных» было действительно так. Это означает, что решение будет не тривиальным, а грубая сила - сложным, но необходимым условием для ответа на ваш вопрос. Так как фиксировано и вы суммируете t-распределения, мы не можем точно сказать, каким будет конечный результат. Если только у кого-то нет хороших навыков игры с продуктами слитых гипергеометрических функций.n
источник
Это даже не близкое приближение. Для малых ожидание T равно k nn T тогда как ожиданиеχ2(k)равноk. Когдаkневелико (скажем, менее 10), гистограммыlog(T)иlog(χ2(k))даже не имеют одинаковую форму, что указывает на то, что сдвиг и изменение масштабаTвсе равно не сработает.knn−2 χ2(k) k k log(T) log(χ2(k)) T
Наглядно, для малых степеней свободы Стьюдента тяжела хвостатых. Квадрат подчеркивает эту тяжесть. Следовательно, суммы будут более искажены - обычно гораздо больше - чем суммы квадратов нормалей ( распределение χ 2 ). Расчеты и моделирование подтверждают это.t χ2
Иллюстрация (по запросу)
Каждая гистограмма изображает независимое моделирование 100 000 испытаний с указанными степенями свободы ( ) и слагаемыми ( k ), стандартизированными, как описано в @mpiktas. Значение русского = 9999 на нижней строке аппроксимирует χ 2 случая. Таким образом, вы можете сравнить T с χ 2 , просматривая каждый столбец.n k n=9999 χ2 T χ2
Обратите внимание, что стандартизация невозможна при потому что соответствующие моменты даже не существуют. Отсутствие стабильности формы (при сканировании слева направо по любому ряду или сверху вниз по любому столбцу) еще более заметно при n ≤ 4 .n<5 n≤4
источник
Я отвечу на второй вопрос. Центральная предельная теорема для любой последовательности iid, квадрат или не квадрат. Так что в вашем случае, если достаточно велико, мы имеемk
где и V a r ( t 2 1 ) - соответственно среднее значение и дисперсия квадрата распределения Стьюдента t с n степенями свободы. Обратите внимание, что t 2 1 распространяется как F-распределение с 1 и n степенями свободы. Таким образом, мы можем получить формулы для среднего и дисперсии со страницы Википедии . Окончательный результат тогда:Et21 Var(t21) n t21 1 n
источник