Какие распределения имеют замкнутые решения для оценки максимального правдоподобия?

21

Какие распределения имеют решения в замкнутой форме для оценки максимального правдоподобия параметров из выборки независимых наблюдений?

Полковник паника
источник

Ответы:

25

Без какой-либо заметной потери общности мы можем предположить, что плотность вероятности (или масса) для любого наблюдения (из наблюдений) строго положительна, что позволяет нам записать ее как экспоненциальнуюе(Икся)ИксяN

е(Икся)знак равноехр(грамм(Икся,θ))

для вектора параметров .θзнак равно(θJ)

Приравнивая градиент логарифмической функции правдоподобия к нулю (который находит стационарные точки правдоподобия, среди которых будут все внутренние глобальные максимумы, если таковые существуют), дает набор уравнений вида

Σяdграмм(Икся,θ)dθJзнак равно0,

один для каждого . Для любого из них , чтобы иметь готовое решение, мы хотели бы, чтобы иметь возможность отделить условия от условий . (Все вытекает из этой ключевой идеи, мотивированной принципом математической лени : выполняйте как можно меньше работы; думайте заранее, прежде чем вычислять; сначала займитесь простыми версиями сложных задач.) Самый общий способ сделать это - взять уравнения формаJИксяθ

Σя(ηJ(θ)τJ(Икся)-αJ(θ))знак равноηJ(θ)ΣяτJ(Икся)-NαJ(θ)

для известных функций ηJ , τJ и αJ , для которых решение получается путем решения уравнений уравнения

NαJ(θ)ηJ(θ)знак равноΣяτJ(Икся)

для . В общем случае их будет трудно решить, но при условии, что набор значений даст полную информацию о , мы могли бы просто используйте этот вектор вместо самой (таким образом, несколько обобщая идею решения "закрытой формы", но с высокой производительностью). В таком случае интегрирование по дает( n α j ( θ )θθθθj(NαJ(θ)ηJ(θ))θ θθJ

грамм(Икс,θ)знак равноτJ(Икс)θηJ(θ)dθJ-θαJ(θ)dθJ+В(Икс,θJ')

(где обозначает все компоненты кроме ). Поскольку левая часть функционально не зависит от , мы должны иметь это для некоторой фиксированной функции ; что вообще не должен зависеть от ; и являются производными некоторой функции а являются производными некоторой другой функции , причем обе они функционально независимы от данных. Откуда & thetas ; & thetas ; J & thetas ; J τ J ( х ) = Т ( х ) Т Б & thetas ; п J Н ( & thetas ; ) α J ( & thetas ; )θJ'θθJθJτJ(Икс)знак равноТ(Икс)ТВθηJЧАС(θ)αJA(θ)

грамм(Икс,θ)знак равноЧАС(θ)Т(Икс)-A(θ)+В(Икс),

Плотности, которые можно записать в этой форме, составляют известную семью Купмана-Питмана-Дармуа , или экспоненциальную семью. Он включает в себя важные параметрические семейства, как непрерывные, так и дискретные, в том числе гамма, нормаль, хи-квадрат, пуассон, мультиномиал и многие другие .

Whuber
источник
А для тех, у кого нет закрытых форм, мы могли бы использовать алгоритм EM. Например, рассмотрим модель Пуассона с нулевым давлением: stats.stackexchange.com/questions/32133/…
Дэмиен
0

Я не знаю, смогу ли я перечислить их все. На ум приходят экспоненциальные, нормальные и биномиальные, и все они попадают в класс экспоненциальных семейств. Экспоненциальное семейство имеет достаточную статистику по экспоненте, и mle часто является хорошей функцией этой достаточной статистики.

Майкл Р. Черник
источник
8
Этот вопрос невероятно широк, но кажется, что OP, возможно, спрашивает, что характеризует дистрибутив, который имеет решение MLE в закрытой форме, а не запрашивает исчерпывающий список. В любом случае, исчерпывающий список даже невозможен.
Макро
2
Это не всегда «хорошая функция», например, достаточная статистика бета-распределения , из которого требуются численные методы для поиска параметров формы и . [журналИксжурнал(1-Икс)]Тaб
Нейл Дж
Спасибо Нил за указание на это. Я думаю, что не все экспоненциальные семейные распределения имеют решения в замкнутой форме.
Майкл Р. Черник