Сколько дистрибутивов в GLM?

11

Я определил несколько мест в учебниках, где GLM описан с 5 распределениями (а именно: гамма, гауссовский, биномиальный, обратный гауссовский и пуассоновский). Это также иллюстрируется в функции семьи в R.

Иногда я сталкиваюсь с ссылками на GLM, где включены дополнительные дистрибутивы ( пример ). Может кто-нибудь объяснить, почему эти 5 являются особенными или всегда в GLM, но иногда другие?

Из того, что я узнал до сих пор, распределения GLM в экспоненциальном семействе все вписываются в форму: где - параметр дисперсии, а - канонический параметр.ϕθ

f(y;θ,ϕ)=exp{yθb(θ)ϕ+c(y,ϕ)}
ϕθ

Разве любой дистрибутив не может быть преобразован в GLM?

timothy.s.lau
источник
5
Понятно, что равномерное распределение не принадлежит экспоненциальному семейству.
Zhanxiong
Хороший вопрос Например, как насчет логнормального?
Майкл М,
1
@Zhanxiong, разве не является особый случай бета-распределения, а бета-распределение находится в экспоненциальном семействе?
shf8888
@ shf8888 AFAIK это только экспоненциальное семейство в пределе, когда оно сходится к гамма-распределению.
теневик
@Zhanxiong, спасибо за разъяснения! Извините, вы правы, с неизвестными границами это не экспоненциальное семейное распределение.
shf8888

Ответы:

4

Как вы указываете, квалификация для использования распределения в GLM состоит в том, что он принадлежит экспоненциальному семейству (примечание: это не то же самое, что экспоненциальное распределение! Хотя экспоненциальное распределение, как гамма-распределение, само является частью экспоненциальная семья). Пять перечисленных вами дистрибутивов принадлежат этому семейству и, что более важно, являются ОЧЕНЬ распространенными дистрибутивами, поэтому они используются в качестве примеров и пояснений.

Как отмечает Чжансян, равномерное распределение (с неизвестными границами) является классическим примером неэкспоненциального семейного распределения. shf8888 путает общее равномерное распределение на любом интервале с равномерным (0, 1). Равномерное (0,1) распределение является частным случаем бета-распределения, которое является экспоненциальным семейством. Другими неэкспоненциальными семейными распределениями являются смешанные модели и t-распределение.

У вас есть правильное определение экспоненциального семейства, и канонический параметр очень важен для использования GLM. Тем не менее, мне всегда было немного легче понять экспоненциальное семейство, написав его так:

f(x;θ)=a(θ)g(x)exp[b(θ)R(x)]

Есть более общий способ написать это, используя вектор вместо скаляра ; но одномерный случай многое объясняет. В частности, вы должны быть в состоянии разделить неэкспонированную часть вашей плотности на две функции: одну с неизвестным параметром но не наблюдаемые данные и одну из и not ; и то же самое для возведенной в степень части. Может быть трудно понять, как, например, биномиальное распределение может быть записано таким образом; но с некоторой алгебраической подтасовкой это становится ясно в конце концов.θ θ x x θθθθxxθ

Мы используем экспоненциальное семейство, потому что оно значительно облегчает многие вещи: например, поиск достаточной статистики и проверка гипотез. В GLM канонический параметр часто используется для поиска функции связи. Наконец, смежная иллюстрация того, почему статистики предпочитают использовать экспоненциальное семейство почти в каждом случае, пытается сделать какой-либо классический статистический вывод, скажем, о равномерном ( , ) распределении, где и и неизвестны , Это не невозможно, но это намного сложнее и сложнее, чем делать то же самое для экспоненциальных семейств.θ 2 θ 1 θ 2θ1θ2θ1θ2

Генри
источник
Бета-распределение с обоими параметрами неизвестно - все еще экспоненциальное семейство (но 2-параметрическое семейство). Что заставляет вас думать, что это не так? www2.stat.duke.edu/courses/Spring11/sta114/lec/… или википедия
DavidR
Спасибо за указание на это, я изменил свой комментарий ... вы правы! Я действительно не знаю, что я имел в виду
Генри