Какое критическое значение p используется step()
функцией в R для ступенчатой регрессии? Я предполагаю, что это 0,15, но верно ли мое предположение? Как я могу изменить критическое значение p?
r
regression
p-value
stepwise-regression
Джейсон Сэмюэлс
источник
источник
Description
часть страницы справки, которая полностью?step
говорит: Выберите модель на основе формул AIC.Ответы:
Как я объяснил в своем комментарии к вашему другому вопросу,
step
используется AIC, а не p-значения.Тем не менее, для одной переменной в то время, АИК делает , соответствуют с использованием р-значение 0,15 (или , чтобы быть более точным, 0,1573):
Рассмотрим сравнение двух моделей, которые отличаются одной переменной. Назовите модели (модель меньшего размера) и (модель большего размера), и пусть их AIC будутM0 M1 AIC0 и соответственно.AIC1
Используя критерий AIC, вы использовали бы большую модель, если . Это будет иметь место, если - 2 log L 0 - ( - 2 log L 1 ) > 2 .AIC1<AIC0 −2logL0−(−2logL1)>2
Но это просто статистика в тесте отношения правдоподобия. Из теоремы Уилкса мы отклоним нуль, если статистика превысит верхний квантиль a . Поэтому, если мы используем тест гипотезы для выбора между меньшей моделью и большей, мы выбираем большую модель, когда .α χ21 −2logL0−(−2logL1)>Cα
Теперь лежит на 84.27 процентиле a . Следовательно, если мы выберем более крупную модель, когда она имеет меньшую AIC, это соответствует отклонению нулевой гипотезы для проверки дополнительного члена с p-значением или2 χ21 1−0.843=0.157 15.7%
Так как вы это измените?
Легко. Измените
k
параметрstep
с 2 на что-то другое. Вы хотите 10% вместо этого? Сделай это 2.7:Вы хотите 2,5%? Установить
k=5
:и так далее.
Однако, несмотря на то, что это решает ваш вопрос, я советую вам обратить пристальное внимание на ответ Фрэнка Харрелла на ваш другой вопрос и выяснить ответы большого числа статистиков по другим вопросам, касающимся ступенчатой регрессии, которые обычно бывают очень последовательно избегать пошаговых процедур в целом.
источник
Как сказано выше,
step
функция в R основана на критериях AIC. Но я предполагаю, что под p-значением подразумевается альфа для входа и альфа для выхода. Что вы можете сделать, это использовать функцию,stepwise
написанную Полом Рубином и доступную здесь . Как видите, у вас есть аргументы alpha.to.enter и alpha.to.leave, которые вы можете изменить. Обратите внимание, что эта функция использует F-тест или эквивалентный t-тест для выбора моделей. Более того, он может обрабатывать не только ступенчатую регрессию, но также прямой выбор и обратное исключение, если вы правильно определите аргументы.источник