В прошлом поэтапная регрессия использовалась во многих биомедицинских работах, но, похоже, она улучшается благодаря лучшему пониманию многих ее проблем. Однако многие старые рецензенты все еще просят об этом. В каких обстоятельствах ступенчатая регрессия играет свою роль и должна использоваться, если таковая имеется?
13
Ответы:
Я не знаю ситуаций, в которых пошаговая регрессия была бы предпочтительным подходом. Это может быть хорошо (особенно в его понижающую версии , начиная с полной модели) с самозагрузкой всего процесса ступенчатого на чрезвычайно больших массивах данных с . Здесь n - количество наблюдений в непрерывном результате (или количество записей с событием в анализе выживания), p - число кандидатов-предикторов, включая все рассматриваемые взаимодействия, т.е. когда любые даже небольшие эффекты становятся очень ясными, и это не имеет значения сколько вы делаете построение вашей модели (это будет означать, что п будет намного больше, чем рп > > р N п N п чем значительно больше, чем иногда цитируемый коэффициент 20).
Конечно, причина, по которой большинство людей склонны делать что-то вроде ступенчатой регрессии, заключается в том, что
Т.е. такой метод, как ступенчатая регрессия, (если бы он имел хорошие рабочие характеристики) был бы особенно привлекательным в тех ситуациях, когда он не имеет хороших рабочих характеристик.
источник
Два случая, в которых я не стал бы возражать против поэтапной регрессии:
В обоих этих очень важных случаях использования вас не слишком беспокоит традиционный статистический вывод, поэтому тот факт, что значения p и т. Д. Больше не действительны, не представляет большой проблемы.
Например, если в исследовательской работе говорилось: «В нашем пилотном исследовании мы использовали пошаговую регрессию, чтобы найти 3 интересные переменные из 1000. В последующем исследовании с новыми данными мы показали, что эти 3 интересные переменные были тесно связаны с Интересный результат », у меня не было бы проблем с использованием пошаговой регрессии. Точно так же «Мы использовали пошаговую регрессию для построения прогностической модели. Эта альтернативная модель X с предварительным преобразованием в нашем наборе данных о удержании в отношении MSE» также полностью устраивает меня.
Чтобы было ясно, я не говорю, что поэтапная регрессия - лучший способ решения этих проблем. Но это легко и может дать вам удовлетворительные решения.
РЕДАКТИРОВАТЬ:
В комментариях возникает вопрос о том, может ли ступенчатая AIC быть полезной для прогнозирования. Вот симуляция, которая показывает, что она работает намного лучше, чем линейная регрессия со всеми ковариатами, и почти так же, как и эластичные сети со штрафом, выбранным путем перекрестной проверки.
Я бы не стал воспринимать эту симуляцию как конец дискуссии; несложно придумать сценарий, в котором пошаговая АПК будет хуже преформироваться. Но на самом деле это не необоснованный сценарий, а именно тот тип ситуации, для которого предназначены эластичные сети (высокая корреляция ковариат с очень небольшим большим эффектом)!
Примечание:
Я действительно не фанат ступенчатой регрессии по многим, многим причинам, поэтому я чувствую себя несколько неловко, заняв эту позицию в защиту этого. Но я просто думаю, что важно быть точным в том, что мне не нравится в этом.
источник