Как оценка, которая минимизирует взвешенную сумму квадратов смещения и дисперсии, вписывается в теорию принятия решений?

10

Хорошо, мое оригинальное сообщение не смогло получить ответ; Итак, позвольте мне поставить вопрос по-другому. Я начну с объяснения моего понимания оценки с точки зрения теории решения. У меня нет формального обучения, и меня не удивит, если мое мышление каким-то образом ошибочно.

Предположим , у нас есть некоторая функция потерь L(θ,θ^(x)) . Ожидаемая потеря является (частым) риском:

R(θ,θ^(x))=L(θ,θ^(x))L(θ,θ^(x))dx,

где является вероятность; и риск Байеса является ожидаемым частым риском:L(θ,θ^(x))

r(θ,θ^(x))=R(θ,θ^(x))π(θ)dxdθ,

где является нашим предшественником.π(θ)

В общем, мы находим & thetas ( х ) , что минимизирует г , и все это работает хорошо; кроме того , теорема Фубини применяется , и мы можем изменить порядок интегрирования так , что любой θ ( х ) , что сводит к минимуму гθ^(x)rθ^(x)r не зависит от всех остальных. Таким образом, принцип правдоподобия не нарушается, и мы можем чувствовать себя хорошо, будучи байесовскими и так далее.

Например, если знакомый квадрат ошибки, потери наш частотный риск среднеквадратичной ошибки или сумму квадратов ошибки и дисперсии и нашей Риск байесовского риска - это ожидаемая сумма квадратов смещения и дисперсии с учетом наших предыдущих, то есть апостериорных ожидаемых потерь.L(θ,θ^(x))=(θθ^(x))2,

Это пока кажется мне разумным (хотя я могу быть совершенно неправым); но, в любом случае, для меня некоторые вещи имеют куда меньшее значение. Например, предположим , что вместо минимизации суммы одинаково взвешенной квадратичной ошибки и дисперсии, я хочу минимизировать неравномерным взвешенную сумму - то есть, я хочу & thetas ( х ) , которые минимизируют:θ^(x)

(E[θ^(x)]θ)2+kE[(θ^(x)E[θ^(x)])2],

где - некоторая положительная вещественная постоянная (отличная от 1).k

Обычно я называю такую ​​сумму «целевой функцией», хотя, возможно, я неправильно использую этот термин. Мой вопрос не о том , как найти решение - находя & thetas ( х ) , которые минимизируют эту целевую функцию выполнимо численно - скорее, мой вопрос имеет два аспекта:θ^(x)

  1. Может ли такая целевая функция вписаться в парадигму теории решений? Если нет, есть ли другая структура, в которую он вписывается? Если да, то как? Похоже , что соответствующая функция потерь была бы функция & , θ ( х ) , и E [ θ ( х ) ] , что - из - за ожидания - это (я думаю) не правильный.θθ^(x)E[θ^(x)]

  2. Такая целевая функция нарушает принцип правдоподобия , поскольку любая данная оценка θ ( х J ) зависит от всех других оценок θ ( х я J ) (даже гипотетических). Тем не менее, бывают случаи, когда обмен на увеличение дисперсии ошибок для уменьшения смещения желателен. Учитывая такую ​​цель, есть ли способ концептуализировать проблему так, чтобы она соответствовала принципу вероятности?θ^(xj)θ^(xij)

Я предполагаю, что мне не удалось понять некоторые фундаментальные понятия о теории принятия решений / оценке / оптимизации. Заранее благодарен за любые ответы и, пожалуйста, предположите, что я ничего не знаю, поскольку у меня нет обучения в этой области или математике в целом. Кроме того, любые предлагаемые ссылки (для наивного читателя) приветствуются.

user153935
источник

Ответы:

2

Это довольно интересный и новый вопрос! На формальном уровне, с использованием функции риски частотной означает использование (например) функции потерь определяется как L ( θ , θ ) = ( E

(Eθ[θ^(X)]θ)2+kEθ[(θ^(X)E[θ^(X)])2],
, так как нет никаких оснований запретить ожиданиякак Е θ [ θ ( Х ) ] появляться в функция потерь. Точто они зависят от целого распределения thetas ; ( X ) является функциейкоторая может показаться странным, но в целом распределение устанавливается как функция
L(θ,θ^)=(Eθ[θ^(X)]θ)2+k(θ^Eθ[θ^(X)])2
Eθ[θ^(X)]θ^(X) и в результате потери, таким образомявляется функцией & thetas , & thetas и распределение & thetas ; ( X ) .θθθ^θ^(X)

L(θ,δ)θδΘδxXXθ, не может быть рассмотрено. То, что оно может нарушать принцип правдоподобия, не имеет прямого отношения к теории принятия решений и не препятствует формальному выводу оценки Байеса.

Сиань
источник