Почему выборочное распределение дисперсии является распределением хи-квадрат?

22

Заявление

Распределение выборки дисперсии выборки представляет собой распределение хи-квадрат со степенью свободы, равной , где - размер выборки (учитывая, что интересующая случайная величина обычно распределена).nn1n

Источник

Моя интуиция

Мне это кажется интуитивно понятным: 1) потому что критерий хи-квадрат выглядит как сумма квадратов и 2) потому что распределение хи-квадрат - это просто сумма квадратов нормального распределения. Но, тем не менее, я не очень хорошо понимаю это.

Вопрос

Это утверждение верно? Зачем?

Remi.b
источник
1
Первоначальное утверждение вообще неверно (оно ложно по двум отдельным причинам). Каков ваш источник (ваша ссылка отсутствует), и что он на самом деле говорит?
Glen_b
Мой вопрос также касается реакции на вопрос-ответ во вводном классе статистики, доступ к которому защищен. Вопрос состоит в том, «Какое распределение является выборочным распределением дисперсии длины крыла у мух?» и ответ "распределение хи-квадрат"
Remi.b
1
Цитируемое утверждение в вашем первом комментарии все еще в целом неверно. Комментарий в конце источника верен (с необходимыми допущениями): « когда выборки размером n берутся из нормального распределения с дисперсией , распределение выборок ( n - 1 ) s 2 / σ 2 имеет распределение хи-квадрат с n-1 степенями свободы.σ2(N-1)s2/σ2 "... Ответ на вопрос в вашем втором комментарии также будет ложным - если, я полагаю, кто-то не показал, что длина крыла нормально распределена. (На каком основании можно утверждать, что это правда?)
Glen_b
Итак, давайте предположим, что крылья нормально распределены, тогда распределение выборки будет распределено по хи-квадрату. Почему это так? (N-1)s2/σ2
Remi.b
Знаете ли вы, что сумма квадратов iid N (0,1) случайных величин хи-квадрат с k df? Или это та часть, которую вы ищете доказательство? КК
Glen_b

Ответы:

27

[Я предполагаю из обсуждения в вашем вопросе, что вы рады принять за факт, что если являются независимыми одинаково распределенными N ( 0 , 1 ) случайными величинами, то k i знак равноZя,язнак равно1,2,...,КN(0,1) .]Σязнак равно1КZя2~χК2

Формально результат, который вам нужен, следует из теоремы Кохрана . (Хотя это можно показать другими способами)

Менее формально, учтите, что если мы знали среднее значение популяции, и оценили дисперсию о нем (а не о среднем по выборке): , тогдаs 2 0 /σ2=1s02знак равно1NΣязнак равно1N(Икся-μ)2 , (Zi=(Xi-μ)/σ), которое будет равно1s02/σ2знак равно1NΣязнак равно1N(Икся-μσ)2знак равно1NΣязнак равно1NZя2Zязнак равно(Икся-μ)/σ раз aχ 2 n случайная величина.1NχN2

Тот факт, что используется среднее значение выборки, вместо среднего значения совокупности ( ) делает сумму квадратов отклонений меньшей, но именно таким образом, чтобы nZя*знак равно(Икся-Икс¯)/σ (о чем см. Теорему Кохрана). Следовательно, вместо n s 2 0 / σ 2χ 2 n теперь мы имеем ( n - 1 ) s 2 / σ 2Σязнак равно1N(Zя*)2~χN-12Ns02/σ2~χN2 .(N-1)s2/σ2~χN-12

Glen_b - Восстановить Монику
источник
@Glen_b Можете ли вы дать ссылку на другие доказательства этого факта? Я действительно хочу это знать.
Генри. L
Какой из нескольких фактов вы после доказательства?
Glen_b
@Glen_b Единственными двумя методами, помимо теоремы Кохрана-Мадоу, которые доказывают этот факт, что выборочная дисперсия и среднее значение выборки статистически независимы с распределением хи-квадрат, являются: (1) канонический базис Шеффе (Scheffe, 1959) (2) методы кумулянта (Или mgfs, который эквивалентен этому). Если вы знаете больше методов, я действительно хочу знать их.
Henry.L
Еще один комментарий, который я хочу добавить, заключается в том, что используется хотя бы среднее значение выборки, но иногда нам требуется фиксированная мощность, независимая от фиксированной дисперсии, этот метод заменяется двухэтапным методом Стейна (1949).
Henry.L
Что я не получаю об этом ответе, так это то, что не зависит от всех X i sИкс¯Икся's , так как мы можем применить теорему Кохрена? это говорит о том, что все они должны быть независимыми.
user56834