У нас есть N выборок из равномерного распределения где неизвестно. Оцените из данных.θ θ
Итак, правило Байеса ...
и вероятность:
0≤Xi≤θi (редактировать: когда для всех и 0 в противном случае - спасибо whuber)
но без какой-либо другой информации о , кажется, что априор должен быть пропорционален (то есть равномерно) или (приор Джеффриса?) на но тогда мои интегралы не не сходятся, и я не знаю, как поступить. Любые идеи?1 1 [0,∞]
Ответы:
Это вызвало некоторые интересные дебаты, но обратите внимание, что это действительно не имеет большого значения для вопроса интереса. Лично я думаю, что, поскольку является параметром масштаба, аргумент группы преобразования является подходящим, приводя кθ
Это распределение имеет ту же форму при масштабировании задачи (вероятность также остается «инвариантной» при масштабировании). Ядро этого априора может быть получено путем решения функционального уравнения . Значения зависят от проблемы и действительно имеют значение, только если размер выборки очень мал (например, 1 или 2). Задняя часть представляет собой усеченное парето, определяемое как:f(y)=y−1 af(ay)=f(y) L,U
Но теперь предположим, что мы используем более общий априор, заданный (обратите внимание, что мы сохраняем пределы чтобы гарантировать, что все правильно - никаких особых математических выражений тогда ). Апостериор тогда такой же, как и выше, но с заменой на - при условии, что . Повторяя приведенные выше расчеты, мы упростили среднееp(θ|cI)∝θ−c−1 L,U N c+N c+N≥0
Таким образом, единообразный априор ( ) даст оценку при условии, что (среднее значение для бесконечно ). Это показывает, что спор здесь немного похож на то, использовать или нет или в качестве делителя в оценке дисперсии.c=−1 N−1N−2X(N) N≥2 N=2 N N−1
Один аргумент против использования неподходящей униформы априора в этом случае состоит в том, что апостериор неправильный, когда , так как он пропорционален . Но это имеет значение только если или очень мало.N=1 θ−1 N=1
источник
Поскольку цель здесь, по-видимому, заключается в получении некоторой достоверной и полезной оценки , предварительное распределение должно соответствовать спецификации распределения населения, из которого происходит выборка. Это никоим образом не означает, что мы «вычислим» предшествующее использование самого образца - это сведет на нет действительность всей процедуры. Мы действительно знаем, что совокупность, из которой происходит выборка, представляет собой совокупность одинаковых случайных величин, каждая из которых находится в диапазоне . Это предположение поддерживается и является частью предшествующей информации, которой мы обладаем (и она не имеет ничего общего с выборкой , то есть с конкретной реализацией подмножества этих случайных переменных).θ [0,θ]
Теперь предположим, что эта совокупность состоит из случайных величин (в то время как наша выборка состоит из реализаций случайных величин). Поддерживаемое предположение говорит нам, чтоm n<m n
Обозначим для компактности . Тогда у нас есть который также может быть записан какmaxi=1,...,n{Xi}≡X∗ θ≥X∗
Функция плотности из из IID Равномерное с.в. в диапазоне являетсяmax N [0,θ]
для поддержки и ноль в другом месте. Затем, используя и применяя формулу изменения переменной, мы получаем предварительное распределение для , которое согласуется с поддерживаемым предположением:[0,θ] θ=cX∗ θ
что может быть неправильно, если мы не укажем константу соответствующим образом. Но наш интерес заключается в том, чтобы иметь правильную апостериор для , а также мы не хотим ограничивать возможные значения (за исключением ограничения, подразумеваемого поддерживаемым предположением). Таким образом , мы выходим неопределенными. Затем, написав апостериорныйc θ θ c
X={x1,..,xn}
для некоторой нормализующей константы A. Мы хотим
Вставка в заднюю часть
Обратите внимание, что неопределенная константа предыдущего распределения удобно удаляется.c
Апостериор суммирует всю информацию, которую конкретный образец может дать нам относительно значения . Если мы хотим получить конкретное значение для мы можем легко рассчитать ожидаемое значение апостериора,θ θ
Есть ли интуиция в этом результате? Что ж, по мере того, как число увеличивается, более вероятно, что максимальная реализация среди них будет все ближе и ближе к их верхней границе, - что в точности соответствует последнему среднему значению : если, скажем, , , но если , Это показывает, что наша тактика в отношении выбора предыдущего была разумной и соответствовала рассматриваемой проблеме, но не обязательно «оптимальной» в некотором смысле.X θ θ N=2⇒E(θ∣X)=2x∗ N=10⇒E(θ∣X)=109x∗
источник
Теорема о равномерном априорном распределении (интервальный случай):
«Если вся информация о внешняя по отношению к данным , захвачена одним предложением тогда Ваша единственная возможная логически-внутренне согласованная предварительная спецификация - этоθ D
Таким образом, ваша предварительная спецификация должна соответствовать предварительной версии Джеффри, если вы действительно верите в приведенную выше теорему ".
Не является частью теоремы о равномерном предыдущем распределении:
В качестве альтернативы вы можете указать свое предыдущее распределение как распределение Парето, которое является сопряженным распределением для униформы, зная, что ваше последующее распределение должно быть другим равномерным распределением по сопряженности. Однако, если вы используете дистрибутив Pareto, вам нужно будет каким-то образом указать параметры распределения Pareto.f(θ)
источник