Как поясняется в раздаточном материале этого курса (стр. 1) , линейная модель может быть записана в виде:
где - переменная ответа, а - пояснительная переменная .
Часто с целью удовлетворения предположений теста можно преобразовать переменную ответа. Например, мы применяем функцию log к каждому . Преобразование переменной ответа НЕ равносильно выполнению GLM.
GLM может быть написано в следующей форме (из раздаточного материала курса (стр. 3) )
где - просто еще один символ для как я понял на странице 2 раздаточного материала курса. называется функцией связи.
Я не очень понимаю разницу между GLM и LM с преобразованной переменной из слайдов в курсе. Вы можете помочь мне с этим?
Ответы:
Преобразование ответа до выполнения линейной регрессии делает это:
где - заданная функция, и мы предполагаем, что g ( Y ) имеет заданное распределение (обычно нормальное).g g(Y)
Обобщенная линейная модель делает это:
где такой же, как и раньше, и мы предполагаем, что Y имеет заданное распределение (обычно ненормальное).g Y
источник
Я не уверен, будет ли это полным ответом для вас, но это может помочь освободиться от концептуальных проблем.
Кажется, в вашем аккаунте есть два заблуждения:
Имейте в виду, что обычная наименьших квадратов (OLS - «линейная») регрессия является частным случаем обобщенной линейной модели. Таким образом, когда вы говорите «[t] преобразование переменной ответа НЕ равносильно выполнению GLM», это неверно. Подгонка линейной модели или преобразование переменной отклика, а затем подгонка линейной модели представляют собой «выполнение GLM».
(Я не хочу говорить об ошибках, я просто подозреваю, что это может привести к вашей путанице.)
Есть еще один аспект обобщенной линейной модели, о котором я не упоминаю. То есть мы указываем распределение ответов. В случае регрессии OLS распределение ответа является гауссовым (нормальным), а функция связи является тождественной функцией. В случае, скажем, логистической регрессии (которая может быть тем, о чем люди впервые думают, когда они думают о GLM), распределение ответов - это Бернулли (/ binomial), а функция связи - это logit. При использовании преобразований для обеспечения выполнения предположений для OLS мы часто пытаемся сделать условное распределение ответов приемлемым нормальным. Однако никакое такое преобразование не сделает распределение Бернулли приемлемо нормальным.
источник