Какая связь между

17

Мне было интересно, есть ли связь между и F-Test.R2

Обычно и измеряет силу линейные отношения в регрессии.

R2=(Y^tY¯)2/T1(YtY¯)2/T1

F-тест просто подтверждает гипотезу.

Есть ли связь между и F-тестом?R2

Ле Макс
источник
2
Формула для R2 выглядит неверно не только потому, что в знаменателе отсутствуют некоторые символы: эти термины « 1 » не принадлежат. Правильная формула больше похожа на F статистику :-).
whuber
См. Stats.stackexchange.com/questions/58107/…
Стефан Лоран

Ответы:

23

Если все предположения верны и вы имеете правильную форму для тогда обычная F-статистика может быть вычислена как F = R 2R2 . Затем это значение можно сравнить с соответствующим F-распределением для проведения F-теста. Это может быть получено / подтверждено с помощью базовой алгебры.F=R21R2×df2df1

Грег Сноу
источник
2
не могли бы вы определить df1 и df2?
бонобо
1
@bonobo, df1 - это степень свободы числителя (в зависимости от количества предикторов), а df2 - это степень свободы знаменателя.
Грег Сноу
1
Чтобы уточнить далее о степенях свободы: df1 = k, где k - количество предикторов. df1 называется «степенью свободы числителя», даже если он находится в знаменателе в этой формуле. df2 = n− (k + 1), где n - количество наблюдений, а k - количество предикторов. df2 называется «степенями свободы знаменателя», даже если он находится в числителе в этой формуле.
Тим Суаст
5
@GregSnow, не могли бы вы добавить в ответ определения степеней свободы? Я предложил такое изменение по адресу stats.stackexchange.com/review/suggested-edits/175306, но оно было отклонено.
Тим Суаст
22

Напомним, что в настройке регрессии статистика F выражается следующим образом.

F=(TSSRSS)/(p1)RSS/(np)

где TSS = общая сумма квадратов и RSS = остаточная сумма квадратов, - количество предикторов (включая константу), а n - количество наблюдений. Эта статистика имеет F- распределение со степенями свободы p - 1 и n - p .pnFp1np

Также напомним, что

R2=1RSSTSS=TSSRSSTSS

простая алгебра скажет вам, что

R2=1(1+Fp1np)1

где F - статистика F сверху.

Это теоретическое соотношение между F-статистикой (или F-тестом) и .R2

Практическая интерпретация состоит в том, что большее значение приводит к большим значениям F, поэтому, если R 2 велико (что означает, что линейная модель хорошо соответствует данным), то соответствующая статистика F должна быть большой, что означает, что быть убедительным доказательством того, что по крайней мере некоторые из коэффициентов отличны от нуля.R2R2

Чжэн Ли
источник
1

Интуитивно, мне нравится думать, что результат отношения F сначала дает ответ «да-нет» на вопрос «могу ли я отклонить ?» (это определяется, если отношение намного больше 1 или значение p < α ).H0α

Затем, если я решу, что могу отклонить , тогда R 2 указывает на силу отношений между ними.H0R2

R2

Entropica
источник
-1

Также быстро:

R2 = F / (F + np / p-1)

Например, R2 теста 1df F = 2,53 с размером выборки 21 будет:

R2 = 2,53 / (2,53 + 19) R2 = 0,1115

rystoli
источник
1
Я не понимаю, как это добавляет что-то помимо того, что уже есть в ответе Чжэн Ли.
Glen_b