Вот мой контекст для этого вопроса: Из того, что я могу сказать, мы не можем запустить обычную регрессию наименьших квадратов в R при использовании взвешенных данных и survey
пакета. Здесь мы должны использовать svyglm()
, который вместо этого запускает обобщенную линейную модель (что может быть тем же самым? Я нечеткий здесь с точки зрения того, что отличается).
В OLS и через lm()
функцию он вычисляет значение R-квадрата, интерпретацию которого я понимаю. Однако, svyglm()
кажется, не рассчитывает это, а вместо этого дает мне отклонение, которое, как говорит моя короткая поездка по Интернету, является мерой соответствия, которая интерпретируется иначе, чем R-квадрат.
Так что, по-моему, у меня, по сути, есть два вопроса, на которые я надеялся получить какое-то направление:
- Почему мы не можем запустить OLS в
survey
пакете, хотя кажется, что это возможно сделать со взвешенными данными в Stata? - Какая разница в интерпретации между отклонением обобщенной линейной модели и значением r-квадрата?
Ответы:
svyglm
даст вам линейную модель, если вы используете,family = gaussian()
которая, кажется, по умолчанию из виньетки опроса (в версии 3.32-1). Смотрите пример, где они находятregmodel
.Кажется, что пакет просто гарантирует, что вы используете правильные веса при вызове
glm
. Таким образом, если ваш результат является непрерывным, и вы предполагаете, что он обычно распределяется, тогда вам следует использоватьfamily = gaussian()
. Результатом является взвешенная линейная модель. Этот ответзаявив, что вы действительно можете сделать это с
survey
пакетом. Что касается следующего вопросаfamily = gaussian()
Отклонение - это просто сумма квадратичных ошибок при использовании
family = gaussian()
.Предостережения
Я предполагаю, что вы хотите линейную модель из вашего вопроса. Кроме того, я никогда не использовал
survey
пакет, но быстро просмотрел его и сделал предположения о том, что он делает, что я заявляю в своем ответе.источник