Я заинтересован в получении объективной оценки в множественной линейной регрессии.
Подумав, я могу подумать о двух разных значениях, которым может соответствовать несмещенная оценка .
- Из образца : R-квадрат , который можно было бы получить , если уравнение регрессии , полученный из образца ) были применены к бесконечным количеством данных , внешних по отношению к образцу , но из того же самого процесса генерирования данных.
- Население : r-квадрат, который был бы получен, если бы был получен бесконечный образец, и модель соответствовала этому бесконечному образцу (то есть, ) или, в качестве альтернативы, просто R-квадрат, подразумеваемый известным процессом генерирования данных.
Я понимаю, что скорректированный предназначен для компенсации переоснащения, наблюдаемого в образце . Тем не менее, неясно, является ли скорректированный R 2 действительно несмещенной оценкой R 2 , и если это несмещенная оценка, какое из двух приведенных выше определений R 2 он намеревается оценить.
Итак, мои вопросы:
- Что такое объективная оценка того, что я называю выше из образца ?
- Что такое объективная оценка того, что я называю выше населения ?
- Существуют ли ссылки, которые обеспечивают симуляцию или другое доказательство непредвзятости?
estimation
multiple-regression
r-squared
bias
Джером англим
источник
источник
Ответы:
Оценка аналитических корректировок R-квадрата
@ttnphns направил меня к статье «Инь и Фан» (2001), в которой сравниваются различные аналитические методы оценки . Согласно моему вопросу, они различают два типа оценок. Они используют следующую терминологию:R2
Их результаты обобщены в аннотации:
где N - размер выборки, а p - количество предикторов.
Эмпирические оценки поправок к R-квадрату
Ссылки
источник