Я определил несколько мест в учебниках, где GLM описан с 5 распределениями (а именно: гамма, гауссовский, биномиальный, обратный гауссовский и пуассоновский). Это также иллюстрируется в функции семьи в R.
Иногда я сталкиваюсь с ссылками на GLM, где включены дополнительные дистрибутивы ( пример ). Может кто-нибудь объяснить, почему эти 5 являются особенными или всегда в GLM, но иногда другие?
Из того, что я узнал до сих пор, распределения GLM в экспоненциальном семействе все вписываются в форму: где - параметр дисперсии, а - канонический параметр.ϕθ
Разве любой дистрибутив не может быть преобразован в GLM?
r
probability
distributions
generalized-linear-model
timothy.s.lau
источник
источник
Ответы:
Как вы указываете, квалификация для использования распределения в GLM состоит в том, что он принадлежит экспоненциальному семейству (примечание: это не то же самое, что экспоненциальное распределение! Хотя экспоненциальное распределение, как гамма-распределение, само является частью экспоненциальная семья). Пять перечисленных вами дистрибутивов принадлежат этому семейству и, что более важно, являются ОЧЕНЬ распространенными дистрибутивами, поэтому они используются в качестве примеров и пояснений.
Как отмечает Чжансян, равномерное распределение (с неизвестными границами) является классическим примером неэкспоненциального семейного распределения. shf8888 путает общее равномерное распределение на любом интервале с равномерным (0, 1). Равномерное (0,1) распределение является частным случаем бета-распределения, которое является экспоненциальным семейством. Другими неэкспоненциальными семейными распределениями являются смешанные модели и t-распределение.
У вас есть правильное определение экспоненциального семейства, и канонический параметр очень важен для использования GLM. Тем не менее, мне всегда было немного легче понять экспоненциальное семейство, написав его так:
Есть более общий способ написать это, используя вектор вместо скаляра ; но одномерный случай многое объясняет. В частности, вы должны быть в состоянии разделить неэкспонированную часть вашей плотности на две функции: одну с неизвестным параметром но не наблюдаемые данные и одну из и not ; и то же самое для возведенной в степень части. Может быть трудно понять, как, например, биномиальное распределение может быть записано таким образом; но с некоторой алгебраической подтасовкой это становится ясно в конце концов.θ θ x x θθ θ θ x x θ
Мы используем экспоненциальное семейство, потому что оно значительно облегчает многие вещи: например, поиск достаточной статистики и проверка гипотез. В GLM канонический параметр часто используется для поиска функции связи. Наконец, смежная иллюстрация того, почему статистики предпочитают использовать экспоненциальное семейство почти в каждом случае, пытается сделать какой-либо классический статистический вывод, скажем, о равномерном ( , ) распределении, где и и неизвестны , Это не невозможно, но это намного сложнее и сложнее, чем делать то же самое для экспоненциальных семейств.θ 2 θ 1 θ 2θ1 θ2 θ1 θ2
источник