Как байесовцы сравнивают распределения?

Итак, я думаю, что у меня есть приличное понимание основ вероятностного и статистического анализа (и как плохо его можно использовать). В частом мире имеет смысл задать такой вопрос, как «отличается ли это распределение от этого распределения», поскольку предполагается, что распределения являются реальными, объективными и неизменными (по крайней мере, для данной ситуации), и поэтому мы можем вычислить насколько вероятно, что один образец взят из распределения, имеющего форму другого образца.

В байесовском мировоззрении нас интересует только то, что мы ожидаем увидеть, учитывая наш прошлый опыт (я все еще немного расплывчат в этой части, но я понимаю концепцию байесовского обновления). Если это так, как байесовец может сказать, что «этот набор данных отличается от этого набора данных»?

Для целей этого вопроса меня не волнует статистическая значимость или подобное, только то, как количественно определить разницу. Меня одинаково интересуют параметрические и непараметрические распределения.

distributions bayesian naught101
источник

Не могли бы вы уточнить, что вы подразумеваете под "этим набором данных, отличным от этого набора данных?" Например, вы имеете в виду сравнение двух или более групп, таких как доходы мужчин и доходы женщин? Или, может быть, как байесовец сравнивает две выборки доходов без знания пола?

ramhiser

@ JohnA.Ramey: Какая разница? Раз это все числа, не являются ли "мужской" и "женский" просто ярлыками для образцов?

naught101

Ответы:

Продумайте свое заявление как Frequentist и сделайте его более конкретным в первую очередь. Частый участник не может сказать, что «набор данных A отличается от набора данных B», без каких-либо дополнительных пояснений.

Во-первых, вы должны заявить, что вы подразумеваете под «другим». Возможно, вы имеете в виду «имеют разные средние значения». Опять же, вы могли бы иметь в виду «иметь разные отклонения». Или, может быть, что-то еще?

Затем вам нужно будет указать, какой тип теста вы будете использовать, что зависит от того, что вы считаете верными предположениями относительно данных. Предполагаете ли вы, что наборы данных нормально распределены по некоторым средствам? Или вы верите, что они оба бета-распространены? Или что-то другое?

Теперь вы видите, что второе решение во многом похоже на априорные показатели в байесовской статистике? Это не просто «мой прошлый опыт», а скорее то, во что я верю, и то, во что я верю моим сверстникам, - это разумные предположения о моих данных. (А байесовцы могут использовать единообразные приоры, что подталкивает к расчетам Frequentist.)

РЕДАКТИРОВАТЬ: В ответ на ваш комментарий: следующий шаг содержится в первом решении, которое я упомянул. Если вы хотите решить, являются ли средства двух групп различными, вы должны посмотреть на распределение разности средних двух групп, чтобы увидеть, содержит ли это распределение ноль или нет, на некотором уровне достоверности. То, насколько близко к нулю вы считаете ноль, и какая именно часть (апостериорного) распределения вы используете, определяется вами и желаемым уровнем доверия.

Обсуждение этих идей можно найти в статье Крушке , который также написал очень читабельную книгу « Анализ байесовских данных» , которая охватывает пример на страницах 307–309 «Равны ли разные группы?». (Второе издание: стр. 468-472.) У него также есть пост в блоге на эту тему с некоторыми вопросами и ответами .

ДОПОЛНИТЕЛЬНОЕ РЕДАКТИРОВАНИЕ: Ваше описание байесовского процесса также не совсем корректно. Байесовцы заботятся только о том, что говорят нам данные, в свете того, что мы знали независимо от данных. (Как указывает Крушке, априор не обязательно происходит перед данными. Это то, что подразумевает эта фраза, но на самом деле это только наше знание, исключающее некоторые данные.) То, что мы знали независимо от определенного набора данных, может быть расплывчатым или конкретным и может основываться на консенсусе, модели лежащего в основе процесса генерации данных, или может быть просто результатом другого (не обязательно предварительного) эксперимента.

Wayne
источник

Да, хорошо, часто участники предполагают распространение, и это субъективно. Но тогда они могут просто измерить параметры каждой выборки с ошибкой и сказать: «Хорошо, это параметры истинной совокупности каждой выборки, и теперь какова вероятность того, что разница обусловлена только ошибкой выборки». Мой вопрос касается шага после вашего ответа - как байесовский анализ выводит различия между выборками (давайте предположим, что выборки относятся к одному и тому же типу распределения, параметрическому или нет).

naught101

@ naught101: Пожалуйста, смотрите мои изменения.

Уэйн

@ Уэйн, с которой ты связался, отлично. Спасибо, что поделились

Cam.Davidson.Pilon

@ naught101: я обновил ссылку на блог. Он, очевидно, сохранил старые версии статьи, и каждая из них ссылается на более новую, а та, на которую я впервые ссылался, является устаревшей на три версии.

Уэйн

Это довольно крутой метод, и он действительно проясняет, как может работать байесовский вывод (рассматривая параметры распределения как источник неопределенности). Жаль, что это так интенсивно в вычислительном отношении. Кроме того, использование 95% КИ выглядит слишком похоже на установку уровня значимости, но я не могу понять, существует ли реальный способ получить отчетный эквивалент значения p (возможно, сумму вероятностей значений больше крайнее, чем 0 от среднего, для разницы в средствах?).

naught101

этот документ может представлять интерес: http://arxiv.org/pdf/0906.4032v1.pdf

В нем дается хорошее резюме некоторых частых и байесовских подходов к проблеме двух примеров, а также обсуждаются как параметрические, так и непараметрические случаи.

$\mathbf{x}$ $\mathbf{y}$ $x_i$ $y_j$ $0$ $1$ $x_i\sim Bern(p)$ $y_i\sim Bern(q)$

$\mathcal{H}_0: \: \: p=q$

$\mathcal{H}_1: \: \: p,q$

Вероятности для данных в каждом случае:

$\mathcal{H}_0$ $L_0(p) = f(\mathbf{x},\mathbf{y};p) = \prod_i p^i (1-p)^{1-i} \prod_j p^j(1-p)^{1-j}$

$\mathcal{H}_1$ $L_1(p,q) = f(\mathbf{x},\mathbf{y};p,q) = \prod_i p^i (1-p)^{1-i} \prod_j q^j(1-q)^{1-j}$

$\mathcal{H}_0 \:\: q=p$

$W = -2\log\left\{ \frac{L_0(p_{max})}{L_1(p_{max},q_{max})}\right\},$

$p_{max},q_{max}$ $p$ $q$ $p_{max}$ $p_{max}$ $W$ $\chi^2_1$ $\mathcal{H}_0$

$p\sim \pi_0$ $\mathcal{H}_0$ $p,q\sim \pi_1$ $\mathcal{H}_1$

$BF = \frac{ f(\mathbf{x},\mathbf{y}|\mathcal{H}_0) }{f(\mathbf{x},\mathbf{y}|\mathcal{H}_1)} = \frac{ \int_0^1 L_0(p)\pi_0(p)dp}{\int_0^1 \int_0^1 L_1(p,q)\pi_1(p,q)dpdq}$

$\mathcal{H}_0$ $\mathcal{H}_1$ $\mathcal{H}_0$ $\mathcal{H}_1$ $p(\mathcal{H}_0)=p(\mathcal{H}_1) = 1/2$

$\frac{p(\mathcal{H}_0|\mathbf{x},\mathbf{y})}{p(\mathcal{H}_1|\mathbf{x},\mathbf{y})} = BF \times \frac{p(\mathcal{H}_0)}{p(\mathcal{H}_1)} = BF \times \frac{1/2}{1/2} = BF.$

$>1$ $\mathcal{H}_0$ $\mathcal{H}_1$ $\mathcal{H}_0$

$\mathcal{H}_1$

Надеюсь, что это поможет вместе с другими уже опубликованными ответами.

Сэм Ливингстон
источник

Учитывая данные, насколько сильно мы считаем, что 2 группы не принадлежат к одной и той же популяции (H_1: они не принадлежат к одной и той же популяции по сравнению с H_0: они принадлежат к одной и той же популяции). Это можно сделать с помощью байесовского t-критерия.

Сложность используется, чтобы выяснить, насколько априор совпадает с одной гипотезой. Fit используется, чтобы выяснить, насколько апостериор перекрывается с одной гипотезой. В совокупности вы можете сравнить гипотезы и выразить свое убеждение в том, что они принадлежат одной и той же популяции.

PascalVKooten
источник