Предпосылка это цитата из виньетки R пакета betareg
1 .
Более того, модель разделяет некоторые свойства (такие как линейный предиктор, функция связи, параметр дисперсии) с обобщенными линейными моделями (GLM; McCullagh and Nelder 1989), но это не частный случай этой структуры (даже для фиксированной дисперсии) )
Этот ответ также намекает на тот факт:
[...] Это тип регрессионной модели, который подходит, когда переменная ответа распространяется как бета-версия. Вы можете думать об этом как об аналоге обобщенной линейной модели. Это именно то, что вы ищете [...] (выделение мое)
Название вопроса говорит само за себя: почему регрессия Бета / Дирихле не считается обобщенной линейной моделью (не так ли)?
Насколько я знаю, Обобщенная линейная модель определяет модели, построенные на ожидании их зависимых переменных, зависящих от независимых.
g Y X β σ 2 - функция связи, которая отображает ожидание, - распределение вероятностей, - результаты и - предикторы, - линейные параметры и дисперсия.
Различные GLM навязывают (или ослабляют) взаимосвязь между средним и дисперсией, но должно быть распределением вероятностей в экспоненциальном семействе, желательным свойством, которое должно улучшить надежность оценки, если я правильно помню. Однако дистрибутивы Beta и Dirichlet являются частью экспоненциального семейства, поэтому у меня нет идей.
[1] Cribari-Neto, F. & Zeileis, A. (2009). Бета-регрессия в R.
Ответы:
Проверьте исходную ссылку:
Как отмечают авторы, параметры пере-параметризованного бета-распределения коррелируют, поэтому
Таким образом, хотя модель выглядит как GLM и крякает как GLM, она не совсем соответствует структуре.
источник
Ответ @probabilityislogic находится на правильном пути.
Бета-распределение находится в двухпараметрическом экспоненциальном семействе . Простые модели GLM, описанные Nelder и Wedderburn (1972) , не включают в себя все распределения в двухпараметрическом семействе экспонент.
С точки зрения статьи N & W, GLM применяется к функциям плотности следующего типа (это позже было названо семейством экспоненциальной дисперсии в Jørgensen 1987 ):
с дополнительной функцией связи и линейной моделью для естественного параметра .θ = f ( μ ) = f ( X β )f() θ=f(μ)=f(Xβ)
Таким образом, мы могли бы также переписать вышеприведенный дистрибутив:
Семейство экспонент с двумя параметрами:
который выглядит похожим, но более общим (также, если один из является постоянным).θ
Разница очевидна, и также невозможно представить бета-дистрибутив в форме GLM.
Тем не менее, мне не хватает понимания, чтобы создать более интуитивный и хорошо информированный ответ (у меня есть ощущение, что могут быть более глубокие и элегантные отношения с различными фундаментальными принципами). GLM обобщает распределение ошибки, используя модель экспоненциальной дисперсии с одной вариацией вместо модели наименьших квадратов, и обобщает линейную зависимость в среднем, используя функцию связи.
Лучшей и самой простой интуицией, по-видимому, является дисперсионный -термин в экспоненте, который умножается на все и, следовательно, дисперсия не меняется с . Принимая во внимание, что несколько двухпараметрических экспоненциальных семейств и методы квази-правдоподобия позволяют параметру дисперсии также быть функцией .θ θα(ϕ) θ θ
источник
Я не думаю, что бета-распределение является частью семейства экспоненциальной дисперсии . Чтобы получить это, вам нужно иметь плотность
для указанных функций и . Среднее значение дается как а дисперсия дается как . Параметр называется каноническим параметром.c() d() c′(θ) τc′′(θ) θ
Бета-дистрибутив не может быть написан таким образом - один из способов увидеть это, заметив, что в журнале нет вероятности термина - вместо него есть иy log[y] log[1−y]
Еще один способ увидеть, что бета не является экспоненциальным семейством дисперсий, состоит в том, что его можно записать в виде где и независимы и оба следуют гамма-распределению с одинаковым параметром масштаба (и гаммой это экспоненциальная семья).y=xx+z x z
источник