Связь между гессенской матрицей и ковариационной матрицей

12

Пока я изучаю оценку максимального правдоподобия, чтобы сделать вывод в оценке максимального правдоподобия, нам нужно знать дисперсию. Чтобы выяснить разницу, мне нужно знать нижнюю границу Рао Крамера, которая выглядит как гессианская матрица со вторым производным по кривизне. Я вроде как перепутал, чтобы определить связь между ковариационной матрицей и гессианской матрицей. Надеюсь услышать некоторые объяснения по этому вопросу. Простой пример будет оценен.

user122358
источник

Ответы:

13

Сначала вы должны проверить этот базовый вопрос о информационной матрице Фишера и связи с гессенскими и стандартными ошибками.

Предположим, у нас есть статистическая модель (семейство распределений) . В наиболее общем случае мы имеем д я м ( & thetas ; ) = d , так что это семейство параметризовано θ = ( θ 1 , ... , θ d ) Т . При определенных условиях регулярности мы имеем{fθ:θΘ}dim(Θ)=dθ=(θ1,,θd)T

Ii,j(θ)=Eθ[2l(X;θ)θiθj]=Eθ[Hi,j(l(X;θ))]

где - информационная матрица Фишера (как функция от θ ), а X - наблюдаемое значение (образец)Ii,JθИкс

L(Икс;θ)знак равноLN(еθ(Икс)), для некоторых θΘ

Таким образом, информационная матрица Фишера представляет собой отрицательное ожидаемое значение гесиана логарифмической вероятности при некотором θ

Теперь предположим, что мы хотим оценить некоторую векторную функцию неизвестного параметра . Обычно желательно, чтобы оценка T ( X ) = ( T 1 ( X ) , , T d ( X ) ) была несмещенной, т.е.ψ(θ)T(Икс)знак равно(T1(Икс),...,Td(Икс))

θΘ Еθ[T(Икс)]знак равноψ(θ)

Крамер Рао нижняя грань гласит , что для каждого несмещенной в с õ v & thetas ( T ( X ) ) удовлетворяетT(Икс)соvθ(T(Икс))

соvθ(T(Икс))ψ(θ)θя-1(θ)(ψ(θ)θ)Tзнак равноВ(θ)

где для матриц означает, что A - B является положительно-полуопределенным , ψ ( θ )AВA-В - просто якобианJi,j(ψ). Обратите внимание, что если мы оценимθ, то естьψ(θ)=θ, то выше упрощаетсяψ(θ)θJя,J(ψ)θψ(θ)знак равноθ

соvθ(T(Икс))я-1(θ)

Но что это говорит нам на самом деле? Например, напомним, что

varθ(Ti(X))=[covθ(T(Икс))]я,я

A

я Aя,я0

В(θ)

я vaрθ(Tя(Икс))[В(θ)]я,я

Таким образом, CRLB не говорит нам дисперсию нашей оценки, но является ли наша оценка оптимальной или нет , т.е. имеет ли она наименьшую ковариацию среди всех несмещенных оценок.

Лукаш Град
источник
2
Я ценю ваше объяснение здесь. Я на самом деле не математик, но я серьезно изучаю математику. Тем не менее, это все еще выглядит слишком абстрактным для меня. Я надеюсь, что есть простой пример с простыми числами, который определенно поймет это.
user122358