Статистика для меня - это синоним попытки принять решение, подходящее для всех возможных выборок. Т.е., правило принятия решений для частых всегда должно пытаться свести к минимуму частый риск, который зависит от функции потерь и истинного состояния природы :L θ 0
Как оценка максимального правдоподобия связана с частым риском? Учитывая, что это наиболее часто используемая техника оценки баллов, используемая частыми лицами, должна быть некоторая связь. Насколько я знаю, оценка максимального правдоподобия старше, чем концепция риска для частых, но все же должна быть какая-то связь, почему бы еще так много людей заявить, что это метод для частых случаев?
Самое близкое соединение, которое я нашел, состоит в том, что
«Для параметрических моделей, которые удовлетворяют условиям слабой регулярности, оценка максимального правдоподобия приблизительно минимальна», Вассерманн 2006, с. 201 "
Принятый ответ либо связывает оценку точки максимального правдоподобия с частым риском, либо предоставляет альтернативное формальное определение логического вывода, которое показывает, что MLE является методом логического вывода.
источник
Ответы:
Вы применяете относительно узкое определение частоты и MLE - если мы немного более щедры и определяем
Частота: цель согласованности, (асимптотической) оптимальности, непредвзятости и контролируемой частоты ошибок при повторной выборке, независимо от истинных параметров
MLE = точечная оценка + доверительные интервалы (ДИ)
тогда кажется довольно ясным, что MLE удовлетворяет всем идеалам частых людей. В частности, CI в MLE, как p-значения, контролируют частоту ошибок при многократной выборке и не дают 95% -ную область вероятности для истинного значения параметра, как думают многие люди - следовательно, они насквозь и часто используются.
Не все эти идеи уже присутствовали в основополагающей статье Фишера 1922 года «О математических основах теоретической статистики» , но идея оптимальности и беспристрастности есть, и Нейман последний добавил идею построения КИ с фиксированной частотой ошибок. Эфрон, 2013 год, «250-летний аргумент: вера, поведение и самозагрузка» , подводит итог своей очень читаемой истории дебатов Байеса и частых:
Относительно вашего более узкого определения - я, мягко говоря, не согласен с вашей предпосылкой, что минимизация риска частых случаев (FR) является основным критерием, чтобы решить, следует ли метод философии частот. Я бы сказал, что тот факт, что минимизация FR является желательным свойством, следует из философии часто, а не предшествует ей. Следовательно, правило принятия решения / оценка не должны минимизировать FR, чтобы быть частым, и минимизация FR также не обязательно говорит о том, что метод является частым, но сомневающийся в частом предпочтении предпочтет минимизацию FR.
Если мы посмотрим на MLE конкретно: Фишер показал, что MLE асимптотически оптимален (в целом эквивалентен минимизации FR), и это, безусловно, было одной из причин продвижения MLE. Тем не менее, он знал, что оптимальность не имеет места для конечного размера выборки. Тем не менее, он был доволен этой оценкой из-за других желательных свойств, таких как согласованность, асимптотическая нормальность, инвариантность при преобразованиях параметров, и давайте не будем забывать: простота вычисления. В частности, инвариантность особенно подчеркивается в статье 1922 года - из моего прочтения я бы сказал, что поддержание инвариантности при преобразовании параметров и способность избавляться от априорных значений в целом были одной из его основных мотивов при выборе MLE. Если вы хотите лучше понять его рассуждения, я действительно рекомендую статью 1922 года:
источник
В основном по двум причинам:
источник
MAP
также является точечной оценкой, которую осуждают «Истинные байесовцы»