Классический F-тест для подмножеств переменных в полилинейной регрессии имеет вид где - сумма квадратов ошибок в «уменьшенной» модели, которая вложена в «большую» модель , а - степени свободы две модели. При нулевой гипотезе, что дополнительные переменные в «большой» модели не имеют линейной объяснительной силы, статистика распределяется как F с степенями свободы и .
Какое распределение, однако, под альтернативой? Я предполагаю, что это нецентральный F (надеюсь, не вдвойне нецентральный), но я не могу найти ссылку на то, что именно является параметром нецентральности. Я собираюсь догадаться, что это зависит от истинных коэффициентов регрессии , и, вероятно, от проектной матрицы , но в этом я не уверен.
Я подтвердил ответ @ Каракала экспериментом Монте-Карло. Я генерировал случайные экземпляры из линейной модели (со случайным размером), вычислял F-статистику и вычислял p-значение, используя нецентральный параметр затем я построил эмпирический cdf этих p-значений. Если параметр нецентральности (и код!) Верен, я должен получить почти одинаковый cdf, что имеет место:
Вот код R (простите за стиль, я все еще учусь):
источник