Сколько исчисления необходимо, чтобы понять оценку максимального правдоподобия?

11

Я пытаюсь спланировать учебный план для изучения MLE. Чтобы сделать это, я пытаюсь выяснить, какой минимальный уровень исчисления необходим для понимания MLE.

Достаточно ли понять основы исчисления (то есть найти минимум и максимум функций), чтобы понять MLE?

histelheim
источник
2
Как всегда, это зависит . Если вы только пытаетесь понять основы, то возможность найти экстремумы функций поможет вам найти правильный путь (хотя во многих практических случаях MLE L - это M численно, и в этом случае вам также нужны некоторые другие навыки). как некоторые основные исчисления).
Glen_b
Спасибо. Не могли бы вы объяснить случай, который вы упомянули более подробно? Звучит интересно.
histelheim
хорошо, но теперь я должен сделать это ответ. Подожди.
Glen_b

Ответы:

20

Чтобы расширить мой комментарий - это зависит. Если вы только пытаетесь понять основы, то возможность найти экстремумы функций дает вам правильный путь (хотя во многих практических случаях MLE вероятность максимизируется численно, и в этом случае вам потребуются некоторые другие навыки, а также некоторые Основное исчисление).

Я оставлю в стороне хорошие простые случаи, когда вы получаете явные алгебраические решения. Тем не менее, исчисление часто очень полезно.

Я буду принимать независимость во всем. Давайте рассмотрим простейший случай оптимизации с 1 параметром. Сначала мы рассмотрим случай, когда мы можем взять производные и отделить функцию параметра и статистику.

Рассмотрим плотность гaммa(α,1)

еИкс(Икс;α)знак равно1Γ(α)Иксα-1ехр(-Икс);Икс>0;α>0

Тогда для выборки размера N вероятность равна

L(α;Икс)знак равноΠязнак равно1NеИкс(Икся;α)

и, следовательно, логарифмическая правдоподобность равна

L(α;Икс)знак равноΣязнак равно1NпереИкс(Икся;α)знак равноΣязнак равно1Nпер(1Γ(α)Иксяα-1ехр(-Икся))
=i=1nlnΓ(α)+(α-1)перИкся-Икся
знак равно-NперΓ(α)+(α-1)SИкс-NИкс¯
гдеSИксзнак равноΣязнак равно1NперИкся . Принимая производные,

ddαL(α;Икс)знак равноddα(-NперΓ(α)+(α-1)SИкс-NИкс¯)
знак равно-NΓ'(α)Γ(α)+SИкс
знак равно-Nψ(α)+SИкс

Так что, если мы устанавливаем , что к нулю и попытаться решить для альфа , мы можем получить это: ψ ( α ) = LN G ( х )α^

ψ(α^)знак равноперг(Икс)

ψ()г()

α^

ψ(α^)знак равног

гзнак равноперг(Икс)

Это не имеет решения с точки зрения элементарных функций, оно должно быть рассчитано численно; по крайней мере, мы смогли получить функцию параметра с одной стороны и функцию данных с другой. Существуют различные алгоритмы нахождения нуля, которые можно использовать, если у вас нет явного способа решения уравнения (даже если вы без производных, например, есть двоичный раздел).

е(Икс;μ)знак равно14сечь2(Икс-μ2),
μ

θ

еИкс(Икс;θ)знак равно1π(1+(Икс-θ)2),

В целом вероятность здесь не имеет уникального локального максимума, а несколько локальных максимумов. Если вы обнаружили на локальный максимум, может быть другой, больше одного в другом месте. (Иногда люди сосредотачиваются на определении локального максимума, ближайшего к медиане, или чего-то подобного.)

(0,θ)

В других случаях пространство параметров может быть дискретным.

Иногда поиск максимума может быть довольно сложным.

И это только выборка проблем с одним параметром. Когда у вас есть несколько параметров, все становится более сложным.

Glen_b - Восстановить Монику
источник
4

рпр

Определенное средство с логарифмами определенно будет полезно, поскольку максимизация логарифма вероятности обычно намного проще, чем максимизация самой вероятности.

рпр

Стефан Коласса
источник