Я не ищу метод plug and play, такой как BEST в R, а скорее математическое объяснение того, какие байесовские методы я могу использовать, чтобы проверить разницу между средним двух сэмплов.
39
Я не ищу метод plug and play, такой как BEST в R, а скорее математическое объяснение того, какие байесовские методы я могу использовать, чтобы проверить разницу между средним двух сэмплов.
Ответы:
Это хороший вопрос, который часто всплывает: ссылка 1 , ссылка 2 . В статье байесовской Оценка Superseeds Т-тест , который Cam.Davidson.Pilon отметил отличный ресурс по этому вопросу. Это также совсем недавно, опубликовано в 2012 году, что, я думаю, частично из-за текущего интереса к области.
Я попытаюсь обобщить математическое объяснение байесовской альтернативы t-критерию с двумя образцами. Это краткое изложение аналогично работе BEST, в которой оценивается разница в двух образцах путем сравнения различий в их апостериорном распределении (объяснение приведено ниже в разделе R).
Чтобы сравнить выборочные средства, нам нужно оценить, что они собой представляют. Для этого в байесовском методе используется теорема Байеса: P (A | B) = P (B | A) * P (A) / P (B) (синтаксис P (A | B) читается как вероятность Данный б)
Давайте поместим это в код. Кодекс делает все лучше.
В предыдущем я сделал некоторые предположения, которые должны быть обоснованы. Чтобы приоры не наносили ущерба предполагаемому среднему значению, я хотел сделать их широкими и единообразными по правдоподобным значениям, с тем чтобы позволить данным получить черты апостериорного значения. Я использовал рекомендованную настройку из BEST и распределила мю обычно со средним = средним (в пуле) и широким стандартным отклонением = 1000 * SD (в пуле). Стандартные отклонения я установил для широкого экспоненциального распределения, потому что я хотел широкого неограниченного распределения.
Теперь мы можем сделать заднюю
Мы опробуем апостериорное распределение, используя цепочку Марков Монте-Карло (MCMC) с модификацией Metropolis Hastings. Это проще всего понять с помощью кода.
Матрица результатов представляет собой список выборок из апостериорного распределения для каждого параметра, который мы можем использовать для ответа на наш первоначальный вопрос: отличается ли sample.1 от sample.2? Но сначала, чтобы избежать влияния исходных значений, мы «сгорим» первые 500 значений цепочки.
Теперь образец1 отличается от образца.2?
Из этого анализа я бы пришел к выводу, что есть вероятность 99,5%, что среднее значение для образца 1 меньше, чем среднее значение для образца 2.
Преимущество байесовского подхода, как указано в статье BEST, заключается в том, что он может создавать сильные теории. Например, какова вероятность того, что sample.2 на 5 единиц больше, чем sample.1.
Мы пришли бы к выводу, что с 93% вероятностью, что среднее значение образца 2 на 5 единиц больше, чем значение образца 1. Наблюдательный читатель найдет это интересным, потому что мы знаем, что истинные популяции имеют средние значения 100 и 103 соответственно. Это, скорее всего, связано с небольшим размером выборки и выбором нормального распределения для вероятности.
Я закончу этот ответ предупреждением: этот код предназначен для учебных целей. Для реального анализа используйте RJAGS и в зависимости от размера вашей выборки подберите t-распределение для вероятности. Если есть интерес, я опубликую t-тест с использованием RJAGS.
РЕДАКТИРОВАТЬ: В соответствии с просьбой здесь модель JAGS.
источник
Отличный ответ от user1068430, реализованный на Python
источник
С байесовским анализом у вас есть больше вещей, которые нужно указать (это на самом деле хорошо, так как это дает гораздо большую гибкость и возможность моделировать то, что вы считаете правдой). Вы предполагаете нормальные для вероятностей? Будут ли две группы иметь одинаковую дисперсию?
Один прямой подход состоит в том, чтобы смоделировать 2 средних (и 1 или 2 дисперсии / дисперсии), а затем рассмотреть апостериорную разницу 2 средних значений и / или достоверный интервал разности 2 средних.
источник
Есть несколько подходов к «тестированию» этого. Я упомяну пару:
Если вы хотите получить четкое решение, вы можете взглянуть на теорию принятия решений.
Довольно простая вещь, которая иногда делается, состоит в том, чтобы найти интервал для разницы в средних и рассмотреть, включает ли он 0 или нет. Это будет включать в себя начало с модели для наблюдений, априорных значений параметров и вычисления апостериорного распределения разницы в средних, зависящих от данных.
Вам нужно будет сказать, какая у вас модель (например, нормальная, постоянная дисперсия), а затем (по крайней мере) несколько для разницы в средних и априора для дисперсии. У вас могут быть приоры по параметрам этих приоров по очереди. Или вы не можете предполагать постоянную дисперсию. Или вы можете предположить что-то, кроме нормальности.
источник