Общая линейная модель против обобщенной линейной модели (с функцией тождественной связи?)

25

Это мой первый пост, поэтому, пожалуйста, будьте спокойны, если я не соблюдаю некоторые стандарты! Я искал свой вопрос, и ничего не пришло.

Мой вопрос касается в основном практических различий между общим линейным моделированием (GLM) и обобщенным линейным моделированием (GZLM). В моем случае это будет несколько непрерывных переменных в качестве ковариат и несколько факторов в ANCOVA по сравнению с GZLM. Я хочу изучить основные эффекты каждой переменной, а также одно трехстороннее взаимодействие, которое я выделю в модели. Я вижу, как эта гипотеза проверяется в ANCOVA или с помощью GZLM. В некоторой степени я понимаю математические процессы и обоснование работы общей линейной модели, такой как ANCOVA, и до некоторой степени понимаю, что GZLM допускают функцию связи, соединяющую линейную модель и зависимую переменную (хорошо, я солгал, возможно, я не действительно понимаю математику). Что я на самом деле не делаю Понятно, являются ли практические различия или причины для проведения одного анализа, а не другого, когда распределение вероятностей, используемое в GZLM, является нормальным (т. е. функция идентификационной связи?). Я получаю совсем другие результаты, когда бегу один за другим. Могу ли я бежать? Мои данные несколько ненормальны, но в некоторой степени работают как в ANCOVA, так и в GZLM. В обоих случаях моя гипотеза поддерживается, но в GZLM значение p «лучше».

Я думал, что ANCOVA - это линейная модель с нормально распределенной зависимой переменной, использующая функцию тождественной связи, и это именно то, что я могу ввести в GZLM, но они все еще разные.

Пожалуйста, пролите немного света на эти вопросы для меня, если можете!


На основании первого ответа у меня есть дополнительный вопрос:

Если они идентичны, за исключением теста на значимость, который он использовал (т. Е. F-критерий в сравнении с квадратом Вальда-Чи), какой из них лучше всего использовать? ANCOVA - это метод перехода, но я не уверен, почему F-тест предпочтительнее. Может кто-нибудь пролить свет на этот вопрос для меня? Благодарность!

Behacad
источник
tF

Ответы:

23

Обобщенная линейная модель, определяющая функцию тождественной связи и нормальное семейное распределение, в точности эквивалентна (общей) линейной модели. Если вы получаете заметно разные результаты от каждого, вы делаете что-то не так.

Обратите внимание, что указание идентификационной ссылки - это не то же самое, что указание нормального распределения. Распределение и функция связи являются двумя различными компонентами обобщенной линейной модели, и каждый из них может быть выбран независимо от другого (хотя определенные ссылки лучше работают с определенными дистрибутивами, поэтому большинство пакетов программного обеспечения определяют выбор ссылок, разрешенных для каждого распределения).

пptFtF Программное обеспечение для обобщенных линейных моделей может также использовать их в качестве приближений при подборе других семейств с масштабным параметром, который оценивается по данным.

универсальный
источник
Спасибо за ваш ответ! Я рад услышать ваш ответ, так как это было мое первоначальное предположение. Профессор в моем институте сказал мне иначе, поэтому мне действительно пришлось копать. Я использую SPSS, и теперь я вижу, что оценки параметров действительно идентичны (например, значения B). Теперь я вижу, что первоначально меня смутили разные значения p. Статистика ANCOVA основана на стандартном F-тесте, а GZLM основана на квадрате Вальда, верно? Я читал, что хи-квадрат Вальда используется, когда вы используете параметры образца (например, в GZLM).
Behacad
Основываясь на этом ответе, я добавил вопрос к оригинальному сообщению!
Behacad
Хорошо, я добавил соответствующий пункт в мой ответ в ответ.
OneStop
5

Я хотел бы включить мой опыт в эту дискуссию. Я видел, что обобщенная линейная модель (с указанием функции единичного звена и нормального семейного распределения) идентична общей линейной модели только в том случае, если вы используете оценку максимального правдоподобия в качестве метода масштабного параметра. В противном случае, если в качестве метода параметра масштаба выбрано «фиксированное значение = 1», вы получите очень разные значения p. Мой опыт подсказывает, что обычно следует избегать «фиксированное значение = 1». Мне любопытно узнать, знает ли кто-нибудь, когда уместно выбрать фиксированное значение = 1 в качестве метода параметра масштаба. Заранее спасибо. отметка


источник
3
Обычно используется фиксированная шкала только с такими моделями, как логистическая регрессия или пуассоновская регрессия, где ответом является переменная счетчика или показателя / частоты. В этом случае нет аналога параметра шкалы в нормальной регрессии.
Hong Ooi