Стремится ли скорректированный R-квадрат оценить фиксированную или случайную оценку популяции в квадрате?

Популяция r-квадрат может быть определена исходя из фиксированных или случайных оценок: $\rho^2$

Фиксированные оценки: размер выборки и конкретные значения предикторов остаются фиксированными. Таким образом, представляет собой долю дисперсии, объясняемой в результате уравнением регрессии населения, когда значения предикторов поддерживаются постоянными. $\rho^2_f$
Случайные оценки: конкретные значения предикторов взяты из распределения. Таким образом, относится к доле дисперсии, объясненной в результате в совокупности, где значения предикторов соответствуют распределению предикторов в совокупности. $\rho^2_r$

Ранее я спрашивал, имеет ли это различие большое значение для оценок $\rho^2$ . Я также обычно спрашивал о том, как рассчитать объективную оценку $\rho^2$ .

Я вижу, что с увеличением размера выборки различие между фиксированной и случайной оценкой становится менее важным. Тем не менее, я пытаюсь подтвердить, предназначен ли скорректированный для оценки фиксированной оценки или случайной оценки . $R^2$ $\rho^2$

Вопросов

Предназначен ли скорректированный для оценки фиксированной или случайной оценки ? $R^2$ $\rho^2$
Существует ли принципиальное объяснение того, как формула для скорректированного r-квадрата относится к той или иной форме ? $\rho^2$

Предыстория моей путаницы

Когда я читаю «Инь и Фань» (2001, стр. 206), они пишут:

Одним из основных допущений модели множественной регрессии является то, что значения независимых переменных являются известными константами и фиксируются исследователем перед экспериментом. Только зависимая переменная может варьироваться от образца к образцу. Эта модель регрессии называется моделью фиксированной линейной регрессии .

Однако в социальных и поведенческих науках значения независимых переменных редко фиксируются исследователями и также подвержены случайным ошибкам. Поэтому была предложена вторая модель регрессии для приложений, в которой как зависимые, так и независимые переменные могут варьироваться (Binder, 1959; Park & Dudycha, 1974). Эта модель называется случайной моделью (или моделью коррекции). Хотя оценки максимального правдоподобия коэффициентов регрессии, полученные из случайной и фиксированной моделей, одинаковы при предположениях о нормальности, их распределения сильно различаются. Случайная модель настолько сложна, что необходимы дополнительные исследования, прежде чем ее можно будет принять вместо обычно используемой модели фиксированной линейной регрессии. Поэтому обычно применяется фиксированная модель, даже когда предположения не выполнены полностью (Claudy, 1978). Такое применение модели фиксированной регрессии с нарушенными допущениями может привести к «переоснащению», потому что случайная ошибка, вносимая из неидеальных выборочных данных, имеет тенденцию быть заглавной в процессе. В результате выборочный коэффициент множественной корреляции, полученный таким образом, имеет тенденцию переоценивать истинную множественную корреляцию населения (Claudy, 1978; Cohen & Cohen, 1983; Cummings, 1982).

$R^2$

Ссылки

$R^2$

regression estimation r-squared Джером англим
источник

Раджу и др. (1997) отмечают, что

Pedhazur (1982) и Mitchell & Klimoski (1986) утверждают, что результаты
относительно не зависят от модели [fixed-x или random-x], выбранной, когда Ns имеют по меньшей мере умеренный размер (приблизительно 50).

$R^2$ $\rho^2$

Фиксированные формулы X: упоминается несколько формул, включая формулу, предложенную Иезекиилем (1930), которая является стандартной в большинстве статистических программ:

{\hat{ρ}}_{(E)}^{2} = 1 - \frac{N - 1}{N - p - 1} (1 - R^{2})

$\hat{\rho}_{(E)}^2 = 1 - \frac{N-1}{N-p-1}(1-R^2)$

$R^2$ $\rho^2$

Случайные X формулы:

Олкин и Пратт (1958) предложили формулу

{\hat{ρ}}_{(O P)}^{2} = 1 - [\frac{N - 3}{N - p - 1}] (1 - R^{2}) F [1, 1; \frac{N - p + 1}{2}; (1 - R^{2})]

$\hat{ \rho}^2 _{(OP)} = 1 - \left[ {\frac{{N - 3}}{{N - p - 1}}} \right](1 - {R^2})F\left[ {1,1;\frac{{N - p + 1}}{2};(1 - {R^2})} \right]$

Раджу и др. (1997) объясняют, как различные другие формулы, такие как формулы Пратта и Герцберга, являются «приближениями к ожидаемой гипергеометрической функции». Например, формула Пратта

{\hat{ρ}}_{(P)}^{2} = 1 - \frac{(N - 3) (1 - R^{2})}{N - p - 1} [1 + \frac{2 (1 - R^{2})}{N - p - 2.3}]

${\hat \rho}^2_{(P)} = 1 - \frac{{(N - 3)(1 - {R^2})}}{{N - p - 1}}\left[ {1 + \frac{{2(1 - {R^2})}}{{N - p - 2.3}}} \right]$

$R^2_{adj}$ $R^2_{adj}$ $R^2_{adj}$ .2910. Согласно первоначальной цитате Раджу и др. О том, что различие между формулами с фиксированным и случайным-x наиболее важно для малых размеров выборки, таблица Лича и Хансена показывает, как наиболее заметно различие между формулой с фиксированным-x Иезекииля и формулой случайного-x Олкина и Пратта в небольших размерах выборки, особенно менее 50.

Ссылки

Leach, LF & Henson, RK (2003). Использование и влияние скорректированных эффектов R2 в опубликованных регрессионных исследованиях. На ежегодной встрече Юго-Западной образовательной исследовательской ассоциации, Сан-Антонио, Техас. PDF
Митчелл, TW, & Klimoski, RJ (1986). Оценка достоверности оценки перекрестной достоверности. Журнал прикладной психологии, 71 , 311-317.
Педазур Э.Дж. (1982). Множественная регрессия в поведенческих исследованиях (2-е изд.) Нью-Йорк: Холт, Райнхарт и Уинстон.
Раджу Н.С., Билгик Р., Эдвардс Дж. И Флер П.Ф. (1997). Обзор методологии: оценка достоверности и перекрестной достоверности населения и использование равных весов при прогнозировании. Прикладные психологические измерения, 21 (4), 291-305.

Джером англим
источник

Стремится ли скорректированный R-квадрат оценить фиксированную или случайную оценку популяции в квадрате?

Вопросов

Предыстория моей путаницы

Ссылки

Ответы:

Ссылки