Когда использовать распределение Стьюдента или Нормального в линейной регрессии?

10

Я смотрю на некоторые проблемы, а в некоторых, чтобы проверить коэффициенты, иногда я вижу людей, использующих распределение Стьюдента, а иногда я вижу Нормальное распределение. Какое правило?

Лео
источник
3
Это не ответ, но обратите внимание, что -распределение приближается к нормальному распределению, когда параметр степеней свободы ν увеличивается. В прошлом ν 30 заметных отличий не было, особенно в большинстве систем проверки гипотез. Предельное поведение «сверху» в том смысле, что если T t ν и Z N ( 0 , 1 ) , то | T | является стохастический больше , чем | Z | , Tνν30T~TνZ~N(0,1)|T||Z|
кардинал

Ответы:

15

Нормальное распределение - это большое выборочное распределение во многих значимых статистических задачах, которые включают в себя некоторую версию центральной предельной теоремы: у вас есть (приблизительно) независимые фрагменты информации, которые добавляются для получения ответа. Если оценки параметров асимптотически нормальны, их функции также будут асимптотически нормальными (в обычных случаях).

С другой стороны, студенческий распределение происходит при более жестких условиях н.о.р. нормальных ошибок регрессии. Если вы можете купить это предположение, вы можете купить t- распределение, используемое для проверки гипотезы в линейной регрессии. Использование этого распределения обеспечивает более широкие доверительные интервалы, чем использование нормального распределения. Смысл этого в том, что в небольших выборках вам необходимо оценить меру неопределенности, среднеквадратичную ошибку регрессии или стандартное отклонение невязок, σ . (В больших выборках у вас есть столько информации, сколько вы знаете, поэтому t- распределение вырождается в нормальное распределение.)ttσt

Есть несколько случаев линейной регрессии, даже с конечными выборками, когда распределение Стьюдента не может быть оправдано. Они связаны с нарушениями условий второго порядка по ошибкам регрессии; а именно, что они (1) постоянная дисперсия и (2) независимы. Если эти предположения нарушаются, и вы исправляете свои стандартные ошибки, используя оценку Eicker / White для гетероскедастических, но независимых остатков; или оценка Ньюи-Уэста для последовательно коррелированных ошибок или кластерных стандартных ошибокдля кластерно-коррелированных данных невозможно найти разумное обоснование для распределения учеников. Однако, используя подходящую версию аргумента асимптотической нормальности (трингулярные массивы и т. Д.), Вы можете обосновать нормальное приближение (хотя вы должны иметь в виду, что ваши доверительные интервалы, скорее всего, будут слишком узкими).

Stask
источник
1
(+1) Мне нравится, что в начале третьего абзаца подразумевается, что линейная регрессия выполняется с бесконечными (не «конечными») выборками!
whuber
@whuber: :) В моих книгах, если это нормально, он должен полагаться на CLT или что-то асимптотическое. В противном случае это имеет такой же смысл, как этот .
StasK
6

Мне нравится представление t-распределения Стьюдента в виде смеси нормального распределения и гамма-распределения:

STUdеNT(Икс|μ,σ2,ν)знак равно0NормaL(Икс|μ,σ2ρ)гaммa(ρ|ν2,ν2)dρ

Обратите внимание, что среднее значение гамма-распределения равно и дисперсия этого распределения равна V [ ρ | ν ] = 2Е[ρ|ν]знак равно1 . Таким образом, мы можем рассматривать t-распределение как обобщающее предположение о постоянной дисперсии к «похожему» предположению о дисперсии. νВ[ρ|ν]знак равно2νν основном контролирует, насколько схожим мы допускаем отклонения. Вы также рассматриваете это как «случайную взвешенную» регрессию, поскольку мы можем использовать вышеуказанный интеграл как представление «скрытой переменной» следующим образом:

yi=μi+eiρi

Где и ρ iG a m m a ( νeiN(0,σ2)ρiGamma(ν2,ν2)Gamma(ν2,ν2)1νχν2

yiμiσ2ρiσ2ρiρiμi=xiTβρiρi

β^=(iρixixiT)1(iρixiyi)

ρiρi . Следовательно, этому наблюдению будет уделяться больше внимания в регрессии. Это соответствует тому, что можно было бы интуитивно сделать с выбросом или хорошей точкой данных.

Обратите внимание, что не существует «правила» для решения этих вопросов, хотя мой и другие ответы на этот вопрос могут быть полезны для нахождения некоторых тестов, которые вы можете выполнить по конечному пути дисперсии (студент t - бесконечная дисперсия для степеней свободы, меньших или равных до двух).

probabilityislogic
источник
+1: это выглядит правильно, но я не думаю, что вы должны говорить о смеси нормального и гамма-распределения, а скорее о нормальном гамма-нормальном составном распределении и мотивировать эту конструкцию, говоря, что нормальное гамма-распределение является сопряженный до нормального распределения (параметризованный по среднему и точности).
Нил Дж
Да, точка зрения о смеси - хотя я не могу придумать неуклюжий способ исправить это прямо сейчас. Обратите внимание, что эта форма не является уникальной для сопряженных распределений - например, если мы заменим гамма-pdf инвертированным экспоненциальным pdf, мы получим распределение Лапласа. Это приводит к «наименьшим абсолютным отклонениям» вместо наименьших квадратов как форме робастизации нормального распределения. Другие дистрибутивы привели бы к другим «робустификациям» - возможно, не так аналитически, как у студентов.
вероятностная
Икс(U/ν)
Карл