Степени свободы в моей F-таблице недостаточно высоки для моей большой выборки.
Например, если у меня есть F с 5 и 6744 степенями свободы, как мне найти 5% критическое значение для ANOVA?
Что если бы я делал тест хи-квадрат с большими степенями свободы?
[Подобный вопрос был опубликован некоторое время назад, но ОП допустил ошибку и на самом деле имел меньшую df, уменьшив ее до дубликата - но исходный вопрос большой df должен иметь ответ где-то на сайте]
chi-squared
degrees-of-freedom
f-distribution
tables
Glen_b - Восстановить Монику
источник
источник
Ответы:
F таблицы :
Самый простой способ - если вы можете - использовать статистический пакет или другую программу, чтобы дать вам критическое значение. Так, например, в R мы можем сделать это:
(но вы можете также легко вычислить точное значение p для вашего F).
Обычно F столы поставляются с «бесконечными» степенями свободы в конце стола, но некоторые не имеют. Если у вас действительно большой df (например, 6744 очень большой), вы можете использовать вместо него запись infinity ( ).∞
Таким образом, у вас могут быть таблицы для которые дают 120 df и df:ν1=5 ∞
ДФ строки будет работать для любого действительно большой (знаменатель ФР). Если мы используем это, мы имеем 2.2141 вместо точного 2.2154, но это не так уж плохо.∞ ν2
Если у вас нет бесконечного ввода степеней свободы, вы можете получить его из таблицы хи-квадрат, используя критическое значение для числителя df, деленное на эти df
Так, например, для критического значения возьмите критическое значение и разделите на . Критическое значение 5% для составляет . Если мы разделим на , это что является строкой из таблицы выше.F5,∞ χ25 5 χ25 11.0705 5 2.2141 ∞
Если ваши степени свободы могут быть слишком малы, чтобы использовать запись «бесконечность» (но все же намного больше, чем 120 или что бы ваша таблица ни подходила), вы можете использовать обратную интерполяцию между наибольшим конечным df и записью бесконечности. Допустим, мы хотим вычислить критическое значение для dfF5,674
Затем мы вычисляем неизвестное критическое значение, какC
(Точное значение , так что это работает довольно хорошо.)2.2274
Более подробная информация об интерполяции и обратной интерполяции дана в этом связанном посте.
Таблицы хи-квадрат :
Если ваш хи-квадрат действительно велик, вы можете использовать обычные таблицы, чтобы получить приближение.
Для больших df распределение хи-квадрат примерно нормальное со средним и дисперсией . Чтобы получить верхнее 5% -ное значение, возьмите одностороннее 5% -ное критическое значение для стандартного нормального значения ( ), умножьте на и добавьте .ν ν 2ν 1.645 2ν−−√ ν
Например, представьте, что нам нужно верхнее 5% критическое значение для .χ26744
Мы рассчитали бы . Точный ответ (до значимых цифр) .1.645×2×6744−−−−−−−√+6744≈6935 5 6936.2
Если степени свободы меньше, мы можем использовать тот факт, что если равен то .X χ2ν 2X−−−√∼˙N(2ν−1−−−−−√,1)
Так, например, если бы у нас было df, мы могли бы использовать это приближение. Точное верхнее 5% критическое значение для хи-квадрат с 674 df составляет (до 5 цифр) . В этом приближении мы рассчитали бы следующее:674 735.51
Возьмите верхнее (одностороннее) 5% критическое значение для стандартного нормального значения (1.645), добавьте , возведите в квадрат сумму и разделите на 2. В этом случае:2ν−1−−−−−√
Как видим, это довольно близко.
Для значительно меньших степеней свободы можно использовать преобразование Уилсона-Хилферти - оно хорошо работает вплоть до нескольких степеней свободы - но таблицы должны охватывать это. Это приближение ,(Xν)13∼˙N(1−29ν,29ν)
источник
R
df2/df1 * (-1 + 1/(1-qchisq(0.95, df1) / df2))