Интуитивное понимание теоремы Халмоса-Сэвиджа

13

Теорема Халмоса-Сэвиджа говорит, что для доминирующей статистической модели статистика достаточно, если (и только если) для всех существует -измеримая версия производной Радона Никодима где является привилегированный мера такая , что для и .(Ω,A,P)T:(Ω,A,P)(Ω,A){PP}TdPdPdPP=i=1Picici>0,i=1ci=1PiP

Я пытался понять, почему теорема верна, но у меня ничего не получилось, поэтому мой вопрос в том, существует ли интуитивный способ понять теорему.

Себастьян
источник
Я считаю, что у меня есть правильная ссылка здесь. Пожалуйста, проверьте и удалите его, если я допустил ошибку.
gung - Восстановить Монику
4
Может быть, помочь читателю с терминологией, например, определить «доминирующие статистические модели», « измеримость» и «привилегированные меры»T
Карл

Ответы:

7

Техническая лемма

Я не уверен, насколько это интуитивно понятно, но основной технический результат, лежащий в основе вашего утверждения теоремы Халмоса-Сэвиджа, заключается в следующем:

Лемма. Пусть - -конечная мера на . Предположим, что - это набор мер на таких что для каждого , . Тогда существует последовательность неотрицательных чисел и последовательность элементов , такая что и для каждого .μσ(S,A)(S,A)ννμ{ci}i=1{νi}i=1i=1ci=1νi=1ciνiν

Это дословно взято из теоремы A.78 в теории статистики Шервиша (1995) . В нем он приписывает это проверочным статистическим гипотезам Лемана (1986) ( ссылка на третье издание ), где результат приписывается самим Халмосу и Сэвиджу (см. Лемму 7). Другой хороший справочник - « Математическая статистика Шао» (второе издание, 2003 г.) , где соответствующими результатами являются лемма 2.1 и теорема 2.2.

Приведенная выше лемма гласит, что если вы начнете с семейства мер, в которых доминирует σ конечная мера, то фактически вы можете заменить доминирующую меру счетной выпуклой комбинацией мер изнутри семейства. Шервиш пишет перед утверждением теоремы А.78,

«В статистических приложениях у нас часто будет класс мер, каждый из которых является абсолютно непрерывным по отношению к одной σ конечной мере. Было бы хорошо, если бы одна доминирующая мера находилась в исходном классе или могла быть построена из класс. Следующая теорема решает эту проблему. "

Конкретный пример

Предположим, что мы проводим измерение величины X которая, по нашему мнению, распределена равномерно на интервале [0,θ] для некоторого неизвестного θ>0 . В этой статистической задаче мы неявно рассматриваем множество P борелевских вероятностных мер на R состоящее из равномерных распределений на всех интервалах вида [0,θ] . То есть, если λ обозначает меру Лебега и, при θ>0 , Pθ обозначает Uniform([0,θ]) распределение (т. Е.

Pθ(A)=1θλ(A[0,θ])=A1θ1[0,θ](x)dx
для каждого борелевскогоAR ), то мы просто имеем
P={Pθ:θ>0}.
Это множество распределений кандидатов для нашего измеренияX .

В семействе P явно доминирует мера Лебега λ (которая является σ конечной), поэтому приведенная выше лемма (с =P ) гарантирует существование последовательности {ci}i=1 неотрицательных чисел, суммирующих 1 и a последовательность {Qi}i=1 равномерных распределений в P таким образом, что

Pθi=1ciQi
для каждого θ>0 . В этом примере мы можем построить такие последовательности явно!

Во-первых, пусть (θi)i=1 будет перечислением положительных рациональных чисел ( это можно сделать явно ), и пусть Qi=Pθi для каждого i . Далее, пусть ci=2i , так что i=1ci=1 . Я утверждаю, что эта комбинация {ci}i=1 и {Qi}i=1 работает.

Чтобы увидеть это, зафиксируем θ>0 и пусть A - борелевское подмножество в R такое, что i=1ciQi(A)=0 . Нам нужно показать, что Pθ(A)=0 . Так как i=1ciQi(A)=0 и каждое слагаемое неотрицательно, то отсюда следует , что ciQi(A)=0 для каждого. Более того, поскольку каждоеположительно, из этого следует, чтодля каждого. То есть для всехимеем Так как каждыйположительно, следовательно,для каждого.iciQi(A)=0ii

Qi(A)=Pθi(A)=1θiλ(A[0,θi])=0.
θiλ(A[0,θi])=0i

Теперь выберите подпоследовательность из которая сходится к сверху (это можно сделать поскольку плотно в ). Тогда как , поэтому по непрерывности меры мы заключаем, что поэтому . Это доказывает претензию.{θik}k=1{θi}i=1θQRA[0,θθik]A[0,θ]k

λ(A[0,θ])=limkλ(A[0,θik])=0,
Pθ(A)=0

Таким образом, в этом примере мы смогли явно построить счетную выпуклую комбинацию вероятностных мер из нашей доминирующей семьи, которая все еще доминирует над всей семьей. Приведенная выше лемма гарантирует, что это может быть сделано для любой доминируемой семьи (по крайней мере, пока доминирующая мера -finite).σ

Теорема Халмоса-Сэвиджа

Итак, теперь перейдем к теореме Халмоса-Сэвиджа (для которой я буду использовать несколько иные обозначения, чем в вопросе из-за личных предпочтений). Учитывая теорему Халмоса-Сэвиджа, теорема факторизации Фишера-Неймана является лишь одним из применений леммы Дуба-Дынкина и правила цепочки для производных Радона-Никодима!

Теорема Халмоса-Сэвиджа. Пусть будет доминирующей статистической моделью (это означает, что является набором вероятностных мер на и существует конечная мера на такая, что для всех ). Пусть - измеримая функция, где - стандартный борелевский Космос. Тогда следующие значения эквивалентны:(X,B,P)PBσμBPμPPT:(X,B)(T,C)(T,C)

  1. T достаточно для (это означает, что существует ядро ​​вероятности такое что является версией для всех и ).Pr:B×T[0,1]r(B,T)P(BT)BBPP
  2. Существует последовательность неотрицательных чисел, такая что и последовательность вероятностных мер в таких что для всех , где , и для каждого существует -измеримая версия .{ci}i=1i=1ci=1{Pi}i=1PPPPPP=i=1ciPiPPTdP/dP

Доказательство. По вышеприведенной лемме мы можем сразу заменить на для некоторой последовательности неотрицательных чисел, такой что и последовательность вероятностных мер в .μP=i=1ciPi{ci}i=1i=1ci=1{Pi}i=1P

(1. влечет 2.) Пусть достаточно. Затем мы должны показать, что существуют -измеримые версии для всех . Пусть - ядро ​​вероятности в формулировке теоремы. Для каждого и мы имеем Таким образом, является версией для всех .TTdP/dPPPrAσ(T)BB

P(AB)=i=1ciPi(AB)=i=1ciAPi(BT)dPi=i=1ciAr(B,T)dPi=Ar(B,T)dP.
r(B,T)P(BT)BB

Для каждого , пусть обозначает версию Радона-Никодима на измеримом пространстве (так , в частности является измеримый). Тогда для всех и мы имеем Таким образом, на самом деле являетсяPPfPdP/dP(X,σ(T))fPTBBPP

P(B)=XP(BT)dP=Xr(B,T)dP=Xr(B,T)fPdP=XP(BT)fPdP=XEP[1BfPT]dP=BfPdP.
fPT-размерная версия on . Это доказывает, что из первого условия теоремы вытекает второе.dP/dP(X,B)

(2 означает : 1.) Предположим , что можно выбрать -измеримое версии из для каждого . Для каждого пусть обозначает конкретную версию (например, является функцией такой, что является версией ). Поскольку является стандартным борелевским пространством, мы можем выбрать таким образом, чтобы сделать его вероятностным ядром (см., Например, теорему B.32 в « Теории статистики Шервиша» (1995)). Покажем, чтоTfPdP/dPPPBBr(B,t)P(BT=t)r(B,t)r(B,T)P(BT)(T,C)rr(B,T)является версией для любого и любого . Итак, пусть заданы и . Тогда для всех мы имеем Это показывает, что является версией для любого и любого , и доказательство сделано.P(BT)PPBBAσ(T)BBPP

P(AB)=A1BfPdP=AEP[1BfPT]dP=AP(BT)fPdP=Ar(B,T)fPdP=Ar(B,T)dP.
r(B,T)P(BT)PPBB

Резюме. Важным техническим результатом, лежащим в основе теоремы Халмоса-Сэвиджа, который представлен здесь, является тот факт, что в доминирующем семействе вероятностных мер фактически преобладает счетная выпуклая комбинация вероятностных мер из этого семейства. Учитывая этот результат, остальная часть теоремы Халмоса-Сэвиджа в основном представляет собой просто манипуляции с основными свойствами производных Радона-Никодима и условными ожиданиями.

Артем Маврин
источник