Когда неправильные линейные модели становятся очень красивыми?

9

Вопросов:

  • Используются ли ненадлежащие линейные модели на практике, или же они время от времени описываются любопытством в научных журналах? Если да, то в каких областях они используются?
  • Есть ли другие примеры таких моделей?
  • Наконец, будут ли правильные стандартные ошибки, , R 2 и т. Д., Взятые из OLS для таких моделей, или они должны быть как-то исправлены?pR2

Справочная информация: в литературе время от времени описываются неправильные линейные модели. В целом, такие модели можно описать как

y=a+biwixi+ε

что отличает их от регрессии, так это то, что - это не коэффициенты, оцениваемые в модели, а веса, которыеwj

  • равны для каждой переменной ( регрессия с единичным взвешиванием ),wi=1
  • на основе корреляций (Dana and Dawes, 2004),wi=ρ(y,xi)
  • выбран случайным образом (Dawes, 1979),
  • 1y1y

Z

y=a+bv+ε

v=wix

Ссылки:
Дауэс, Робин М. (1979). Надежная красота неподходящих линейных моделей при принятии решений . Американский психолог, 34, 571-582.

Graefe, A. (2015). Улучшение прогнозов с использованием одинаково взвешенных предикторов . Журнал Бизнес исследований, 68 (8), 1792-1799.

Wainer, Howard (1976). Оценка коэффициентов в линейных моделях: это не имеет значения . Психологический вестник 83 (2), 213.

Dana, J. and Dawes, RM (2004). Превосходство простых альтернатив регрессии для общественных наук . Журнал образовательной и поведенческой статистики, 29 (3), 317-331.

Тим
источник
3
В каком смысле статистика, полученная из этих моделей, будет «неверной»?
whuber
1
wibywi
1
Это не был осознанный комментарий - бумаги все еще находятся в моей «для чтения» куче. Я просто задавался вопросом: «почему« неподходящий »?». Предсказатель нередко представляет собой линейную комбинацию других переменных - среднее значение по нескольким измерениям, оценку основного компонента, прогноз по другой регрессии, уровень по экспоненциально сглаженному временному ряду или вычисленное значение по хорошо установленному или специальный индекс. Не оценка весов от ответа лишает степени свободы, помогая избежать чрезмерного соответствия с меньшими размерами выборки.
Scortchi - Восстановить Монику
1
xiwixi
4
wi=ρ(y,xi)ρ

Ответы:

1

По сути, мне кажется, что это набор предполагаемых ковариационных структур. Другими словами, это тип байесовского предварительного моделирования.

|β^|<|β|R^2<R2

Мой личный опыт показывает, что превосходство байесовского подхода заключается в использовании лучшего моделирования; преобразовывать параметры, использовать другие нормы и / или использовать нелинейные методы. То есть, как только физика проблемы и методы должным образом изучены и скоординированы, статистика F, коэффициент детерминации и т. Д. Улучшаются, а не ухудшаются.

деревенщина
источник