Какова объективная оценка R-квадрата населения?

14

Я заинтересован в получении объективной оценки в множественной линейной регрессии.R2

Подумав, я могу подумать о двух разных значениях, которым может соответствовать несмещенная оценка .R2

  1. Из образца :R2 R-квадрат , который можно было бы получить , если уравнение регрессии , полученный из образца ) были применены к бесконечным количеством данных , внешних по отношению к образцу , но из того же самого процесса генерирования данных.β^
  2. Население :R2 r-квадрат, который был бы получен, если бы был получен бесконечный образец, и модель соответствовала этому бесконечному образцу (то есть, ) или, в качестве альтернативы, просто R-квадрат, подразумеваемый известным процессом генерирования данных.β

Я понимаю, что скорректированный R2 предназначен для компенсации переоснащения, наблюдаемого в образце . Тем не менее, неясно, является ли скорректированный R 2 действительно несмещенной оценкой R 2 , и если это несмещенная оценка, какое из двух приведенных выше определений R 2 он намеревается оценить.R2R2R2R2

Итак, мои вопросы:

  • Что такое объективная оценка того, что я называю выше из образца ?R2
  • Что такое объективная оценка того, что я называю выше населения ?R2
  • Существуют ли ссылки, которые обеспечивают симуляцию или другое доказательство непредвзятости?
Джером англим
источник
Вопрос, какая формула для прил. R ^ 2 менее предвзято было поднято, например, здесь .
ttnphns
Благодарю. Сейчас я читаю упоминание, которое вы упоминаете: Инь, П. и Фан, Х. (2001). Оценка усадки при множественной регрессии: сравнение различных аналитических методов. Журнал экспериментального образования, 69 (2), 203-224. р2
Jeromy Anglim

Ответы:

14

Оценка аналитических корректировок R-квадрата

@ttnphns направил меня к статье «Инь и Фан» (2001), в которой сравниваются различные аналитические методы оценки . Согласно моему вопросу, они различают два типа оценок. Они используют следующую терминологию:R2

  • ρ2
  • ρc2

Их результаты обобщены в аннотации:

R2ρ2ρ2ρc2

ρ2

R^2=1(N3)(1R2)(Np1)[1+2(1R2)Np2.3]

где N - размер выборки, а p - количество предикторов.

Эмпирические оценки поправок к R-квадрату

R2ρ2ρc2ρ2 .

Ссылки

  • Kromrey, JD & Hines, CV (1995). Использование эмпирических оценок усадки при множественной регрессии: предостережение. Образовательные и психологические измерения, 55 (6), 901-925.
  • R2
Джером англим
источник