В последнее время я изучаю байесовский подход к классической статистике. После прочтения о байесовском факторе мне стало интересно, необходим ли анализ мощности в этом виде статистики. Моя главная причина удивления - это фактор Байеса, который на самом деле просто выглядит как отношение правдоподобия. Как только это становится 25: 1, кажется, что я могу назвать это ночью.
Я далеко? Любое другое чтение я могу сделать, чтобы узнать больше? В настоящее время читаю эту книгу: Введение в байесовскую статистику , WM Bolstad (Wiley-Interscience; 2nd ed., 2007).
bayesian
power-analysis
Джастин Бозонье
источник
источник
Ответы:
Власть о длительной вероятности р <0,05 (альфа) в будущих исследованиях. В Байесе доказательства из исследования А подразделяются на приоры для исследования В и т. Д. В дальнейшем. Таким образом, сила, как это определено в статистике часто, на самом деле не существует.
источник
Вы можете выполнить проверку гипотез с байесовской статистикой. Например, можно сделать вывод, что эффект больше нуля, если более 95% апостериорной плотности больше нуля. Или, альтернативно, вы можете использовать некоторую форму двоичного решения, основанного на байесовских факторах.
Как только вы создадите такую систему принятия решений, можно оценить статистическую мощность, исходя из заданного процесса генерирования данных и размера выборки. Вы можете легко оценить это в данном контексте, используя симуляцию.
Тем не менее, байесовский подход часто фокусируется больше на интервале достоверности, чем на точечной оценке, и степени убежденности, а не на бинарном решении. Используя этот более непрерывный подход к выводу, вы могли бы вместо этого оценить другие эффекты на вывод вашего дизайна. В частности, вы можете оценить ожидаемый размер вашего интервала достоверности для данного процесса генерирования данных и размер выборки.
источник
Эта проблема приводит к большому количеству недоразумений, потому что люди используют байесовскую статистику, чтобы задавать частые вопросы. Например, люди хотят определить, лучше ли вариант B, чем вариант A. Они могут ответить на этот вопрос с помощью байесовской статистики, определив, является ли интервал 95% наибольшей плотности разницы между этими двумя задними распределениями (BA) больше 0 или область практического значения около 0. Если вы используете байесовскую статистику для ответов на часто задаваемые вопросы, тем не менее, вы все равно можете делать частые ошибки: тип I (ложные срабатывания; оппозиции - B на самом деле не лучше) и тип II (мисс; не понимают что Б действительно лучше).
Целью анализа мощности является уменьшение ошибок типа II (например, с вероятностью не менее 80% найти эффект, если он существует). Анализ мощности должен также использоваться при использовании байесовской статистики, чтобы задавать частые вопросы, подобные приведенному выше.
Если вы не используете анализ мощности, а затем вы неоднократно просматриваете свои данные во время сбора и затем останавливаетесь только после того, как обнаружите существенную разницу, то вы будете совершать больше ошибок типа I (ложные тревоги), чем вы ожидаете - так же, как если бы вы использовали частую статистику.
проверять, выписываться:
https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html
http://varianceexplained.org/r/bayesian-ab-testing/
Следует отметить, что некоторые байесовские подходы могут уменьшить, но не исключить, вероятность ошибки типа I (например, соответствующий информационный предварительный отчет).
источник
Например, необходимость в анализе мощности в клинических испытаниях заключается в том, чтобы иметь возможность рассчитать / оценить, сколько участников набрать, чтобы иметь шанс найти эффект лечения (заданного минимального размера), если он существует. Невозможно набрать бесконечное количество пациентов, во-первых, из-за нехватки времени и, во-вторых, из-за нехватки средств.
Итак, представьте, что мы применяем байесовский подход к упомянутому клиническому испытанию. Хотя плоские априорные значения теоретически возможны, чувствительность к априорному в любом случае целесообразна, поскольку, к сожалению, доступно более одного плоского априора (что странно, я сейчас думаю, поскольку на самом деле должен быть только один способ выразить полную неопределенность).
Итак, представьте себе, что в дальнейшем мы проводим анализ чувствительности (модель, а не только предыдущая также будет находиться под пристальным вниманием). Это включает в себя моделирование из правдоподобной модели «истины». В классической статистике / статистике есть четыре кандидата на «правду»: H0, mu = 0; H1, mu! = 0, где либо наблюдаются с ошибкой (как в нашем реальном мире), либо без ошибки (как в ненаблюдаемом реальном мире). В байесовской статистике здесь есть два кандидата на «правду»: mu - случайная величина (как в ненаблюдаемом реальном мире); mu - это случайная величина (как в нашем наблюдаемом реальном мире с точки зрения неопределенного индивида).
Так что на самом деле все зависит от того, кого вы пытаетесь убедить: а) с помощью испытания и б) с помощью анализа чувствительности. Если это не тот же человек, это было бы довольно странно.
На самом деле речь идет о консенсусе относительно того, что такое истина и на чем основаны материальные доказательства. Общим основанием является то, что сигнатурные вероятностные распределения наблюдаются в нашем реальном наблюдаемом мире, который в некотором роде, очевидно, имеет некоторую основополагающую математическую истину, которая случайно оказывается таковой или является намеренной. Я остановлюсь на этом, поскольку это не страница искусств, а страница науки, или это мое понимание.
источник