Нормально распределенные ошибки и центральная предельная теорема

9

Во Вводной эконометрике Вулдриджа есть цитата:

Аргумент, оправдывающий нормальное распределение ошибок, обычно выполняется примерно так: поскольку является суммой многих ненаблюдаемых факторов, влияющих на , мы можем вызвать центральную предельную теорему, чтобы заключить, что имеет приблизительное нормальное распределение.uyu

Эта цитата относится к одному из предположений линейной модели, а именно:

uN(μ,σ2)

где u - погрешность в популяционной модели.

Теперь, насколько мне известно, Центральная предельная теорема утверждает, что распределение

Zi=(Yi¯μ)/(σ/n)

(где Yi¯ - средние значения случайных выборок, взятых из любой популяции со средним μ и дисперсией σ2 )

приближается к стандартной нормальной переменной как n .

Вопрос:

Помогите мне понять, как асимптотическая нормальность Zi подразумевает uN(μ,σ2)

Гусь
источник

Ответы:

13

Это может быть лучше оценено, если выразить результат CLT в виде сумм iid случайных величин. У нас есть

nX¯μσN(0,1)asymptotically

Умножьте частное на и используйте тот факт, что чтобы получитьσnVar(cX)=c2Var(X)

X¯μN(0,σ2n)

Теперь добавьте к LHS и используйте тот факт, что чтобы получитьμE[aX+μ]=aE[X]+μ

X¯=1ni=1nXiN(μ,σ2n)

Наконец, умножьте на и используйте приведенные выше два результата, чтобы увидеть, чтоn

i=1nXiN(nμ,nσ2)

И какое это имеет отношение к заявлению Вулдриджа? Хорошо, если ошибка является суммой многих случайных величин iid, то она будет приблизительно нормально распределена, как только что видно. Но здесь есть проблема, а именно, что ненаблюдаемые факторы не обязательно будут одинаково распределены, и они могут даже не быть независимыми!

Тем не менее, CLT был успешно распространен на независимые неидентично распределенные случайные величины и даже случаи слабой зависимости при некоторых дополнительных условиях регулярности. По сути, это условия, которые гарантируют, что ни один член в сумме не оказывает непропорционального влияния на асимптотическое распределение, см. Также страницу википедии на CLT . Вам не нужно знать эти результаты, конечно; Цель Вулдриджа - просто обеспечить интуицию.

Надеюсь это поможет.

JohnK
источник
Я хотел бы добавить (так как автор изучает эконометрику), что в его области исследования много случайных величин (по крайней мере, те, которые используются для моделирования) не имеют первых моментов, таких как распределение Коши. Таким образом, CLT - это не тот, на кого вы можете положиться в этой области.
Герман Демидов