Вопрос:
Одно из распространенных заблуждений относительно р-значений заключается в том, что они представляют вероятность того, что нулевая гипотеза верна. Я знаю, что это не правильно, и я знаю, что p-значения представляют только вероятность найти образец столь же экстремальный, как этот, учитывая, что нулевая гипотеза верна. Однако, интуитивно, нужно уметь вывести первое из последнего. Должна быть причина, почему никто не делает это. Какую информацию мы упускаем, которая ограничивает нас от получения вероятности того, что гипотеза верна из p-значения и связанных данных?
Пример:
Наша гипотеза «Витамин D влияет на настроение» (нулевая гипотеза «не влияет»). Допустим, мы проводим соответствующее статистическое исследование с 1000 человек и находим корреляцию между настроением и уровнем витаминов. При прочих равных условиях значение р 0,01 указывает на более высокую вероятность истинной гипотезы, чем значение р 0,05. Допустим, мы получаем значение р 0,05. Почему мы не можем рассчитать фактическую вероятность того, что наша гипотеза верна? Какую информацию нам не хватает?
Альтернативная терминология для частых статистиков:
Если вы принимаете предпосылку моего вопроса, вы можете перестать читать здесь. Следующее предназначено для людей, которые отказываются признать, что гипотеза может иметь вероятностную интерпретацию. Давайте забудем терминологию на мгновение. Вместо...
Допустим, вы делаете ставку со своим другом. Ваш друг показывает вам тысячи статистических исследований по не связанным предметам. Для каждого исследования вам разрешается просматривать только значение p, размер выборки и стандартное отклонение выборки. Для каждого исследования ваш друг предлагает вам несколько шансов сделать ставку на то, что гипотеза, представленная в исследовании, верна. Вы можете либо принять ставку, либо не принимать ее. После того, как вы сделали ставки на все 1000 занятий, на вас взошел оракул и сказал, какая гипотеза верна. Эта информация позволяет вам урегулировать ставки. Я утверждаю, что существует оптимальная стратегия для этой игры, В моем мировоззрении это эквивалентно знанию вероятности того, что гипотеза верна, но если мы не согласны с этим, это нормально. В этом случае мы можем просто говорить о способах использования p-значений, чтобы максимизировать ожидание ставок.
источник
Ответы:
Другие ответы получаются философскими, но я не понимаю, зачем это здесь нужно. Давайте рассмотрим ваш пример:
Для получение соответствует выборочному коэффициенту корреляции . Нулевая гипотеза . Альтернативная гипотеза .р = 0,05 р = 0,062 Н 0 : р = 0 Н 1 : р ≠ 0n=1000 p=0.05 ρ^=0.062 H0:ρ=0 ЧАС1: ρ ≠ 0
Значение p равно и мы можем вычислить его на основе выборки распределение под нулевым значением; больше ничего не нужно.ρ
Вы хотите вычислить
и для этого вам понадобится целая куча дополнительных ингредиентов. Действительно, применяя теорему Байеса, мы можем переписать ее следующим образом:
Таким образом, чтобы вычислить апостериорную вероятность нуля, вам нужно иметь две дополнительные вещи:
Если вы готовы предположить, что - даже если я лично не уверен, почему это должно быть осмысленным предположением, - вам все равно придется предполагать распределение соответствии с альтернатива. В этом случае вы сможете вычислить нечто, называемое фактором Байеса :п( ρ = 0 ) = 0,5 ρ
Как вы видите, байесовский фактор никак не зависит от уровня вероятности нуля, но это зависит от уровня вероятности (при альтернативе).ρ
[Обратите внимание, что знаменатель в байесовском факторе не является p-значением из-за равенства вместо знака неравенства. Таким образом , при вычислении коэффициента Байеса или мы не используем р-значение сам вообще. Но мы, конечно, используем выборочное распределение .]P(H0) P(ρ^|ρ=0)
источник
Quid Est Veritas?
Я могу принять ответ @ amoeba так же легко, как и оригинальный постер. Однако я предупреждаю, что во всей моей работе я не сталкивался с байесовским анализом, который вычислял «вероятность того, что нулевая гипотеза верна». И такой вывод привлечет целый ряд аргументов от тех, кто рассматривает вашу работу! Философски, это делаетверните нас к вопросу: "что есть истина?" Возможно, «правда» неопровержима даже для самого доказательства. Статистика - это научный инструмент для количественной оценки неопределенности. Я по-прежнему утверждаю, что, хотя доказательства могут строго указывать на правду, всегда существует риск ложного положительного результата, и Хороший статистик должен сообщить об этом риске. Даже в теореме байесовского решения о принятии решения дается правило принятия решения, чтобы мы могли принимать или отклонять гипотезы, основанные на байесовских факторах, которые приблизительно пропорциональны , но наше убеждение никогда не бывает равным или даже если мы принимаем решение. Теория принятия решений дает нам возможность «идти вперед» с частичным знанием и принимать эти риски.Pr(H0|X) 1 0
Частью обоснования статистического тестирования нулевой гипотезы (NHST) и значения является философия фальсификации Карла Поппера . В этом: критическое предположение состоит в том, что «истина» никогда не известна, мы можем только опровергнуть другие гипотезы. Интересное и действительная критика NHST является то , что вы вынуждены делать нелепые предположения, как , что курение делает не причина рака , когда вы действительно заинтересованы в описательном (не логических выводе) исследований: и вы просто описывая , как много рак курения вызывает ,p
Обратная критика была применена к Байесовским исследованиям, где вы можете свободно применять априоры: «Деннис Линдли сказал:« При прежней вероятности 0, что луна сделана из сыра, астронавты, возвращающиеся с руками, полными сыра, все еще не могли убедить ».
Отсутствующая информация, позволяющая определить, верна ли нулевая гипотеза, - это, как правило, знание о том, верна ли нулевая гипотеза. По иронии судьбы, когда мы сфокусированы на описательной статистике, мы можем принять допустимые диапазоны возможных эффектов и сделать несколько решительный вывод о том, что тенденция, вероятно, верна: но статистическое тестирование не приводит нас к таким выводам. Даже в байесовском умозаключении никакие данные не приведут к единственному апостериорному описанию без каких-либо методологических проблем, поэтому включение априорного решения не решает эту проблему.
источник
Есть две попытки сделать именно то, что вы сказали в статистической истории, Байесовский и Фидуциальный. Р.А. Фишер основал две школы статистического мышления: школу правдоподобия, построенную на методе максимального правдоподобия, и доверительную, которая закончилась неудачей, но пытается сделать именно то, что вы хотите.
Короткий ответ относительно того, почему он потерпел неудачу, состоит в том, что его распределения вероятностей не в конечном итоге объединяются в единое целое. В итоге урок состоял в том, что предварительная вероятность - это необходимая вещь для создания того, что вы пытаетесь создать. В самом деле, вы идете по пути одного из величайших статистиков истории, и более чем несколько других великих людей погибли в надежде решить эту проблему. Если бы это было найдено, это поместило бы методы нулевой гипотезы в один ряд с байесовскими методами с точки зрения типов проблем, которые они могли бы решить. В самом деле, это протолкнуло бы Байеса за исключением тех случаев, когда существовала реальная предварительная информация.
Вы также хотите быть осторожным со своим утверждением, что значение p указывает на более высокую вероятность для альтернативы. Это верно только для школы фишерианского правдоподобия. Это совсем не так в школе Пирсона-Неймана. Ваша нижняя ставка выглядит как ставка Пирсона-Неймана, в то время как ваша p-величина несовместима, поскольку она поступает из школы Fisherian.
Чтобы быть благотворительным, я собираюсь предположить, что для вашего примера, что нет предвзятости публикации, и поэтому только значительные результаты появляются в журналах, создавая высокий уровень ложных открытий. Я рассматриваю это как случайную выборку всех выполненных исследований, независимо от результатов. Я бы сказал, что ваши шансы на ставки не будут соответствовать классическому значению слова де Финетти.
В мире де Финетти ставка является последовательной, если букмекер не может быть разыгран игроками, чтобы они понесли определенную потерю. В простейшей конструкции это похоже на решение проблемы разрезания торта. Один человек разрезает кусок пополам, а другой выбирает, какой кусок он хочет. В этой конструкции один человек будет указывать цены для ставок по каждой гипотезе, но другой человек будет либо покупать, либо продавать ставку. По сути, вы можете коротко продать ноль. Чтобы быть оптимальным, шансы должны быть строго справедливыми. P-значения не приводят к честным разногласиям.
Чтобы проиллюстрировать это, рассмотрим исследование Wetzels и др. На http://ejwagenmakers.com/2011/WetzelsEtAl2011_855.pdf.
Вот цитата: Рууд Ветцельс, Дора Мацке, Майкл Д. Ли, Джеффри Н. Роундер, Джеффри Дж. Айверсон и Эрик-Ян Вагенмакерс. Статистические данные в экспериментальной психологии: эмпирическое сравнение с использованием 855 т тестов. Перспективы психологической науки. 6 (3) 291-298. 2011
Это прямое сравнение 855 опубликованных t-тестов с использованием байесовских коэффициентов, чтобы обойти проблему предыдущего распределения. В 70% значений р между 0,05 и 0,01 байесовские факторы были в лучшем случае анекдотичными. Это связано с математической формой, используемой Frequentists для решения проблемы.
Методы нулевой гипотезы предполагают, что модель верна, и по своей конструкции используют минимаксное статистическое распределение, а не распределение вероятностей. Оба эти фактора влияют на различия между байесовскими и небайесовскими решениями. Рассмотрим исследование, в котором байесовский метод оценивает апостериорную вероятность гипотезы как три процента. Представьте, что значение p составляет менее пяти процентов. Оба верны, так как три процента - меньше чем пять процентов. Тем не менее, р-значение не является вероятностью. В нем указывается только максимальное значение, которое может быть вероятностью просмотра данных, а не фактической вероятностью гипотезы, истинной или ложной. Действительно, при построении p-значения вы не можете различить эффекты из-за случайности с истинным нулем и ложным нулем с хорошими данными.
Если вы посмотрите на исследование Ветцеля, вы заметите, что совершенно очевидно, что шансы, подразумеваемые значениями р, не совпадают с шансы, вытекающие из байесовской меры. Поскольку байесовская мера является как допустимой, так и когерентной, а небайесовская - не когерентной, небезопасно предполагать, что р-значения отображаются в истинные вероятности. Принудительное предположение о допустимости нулевого значения обеспечивает хорошие вероятности покрытия, но не дает хороших вероятностей азартных игр.
Чтобы лучше понять, почему, рассмотрим первую аксиому Кокса о том, что правдоподобность гипотезы можно описать действительным числом. Неявно это означает, что все гипотезы имеют действительные числа, связанные с их правдоподобием. В методах нулевой гипотезы только нулевое имеет действительное число, связанное с его правдоподобием. Альтернативная гипотеза не имеет измерения, и это, конечно, не дополнение к вероятности наблюдения данных, учитывая, что нулевое значение истинно. Действительно, если значение равно нулю, то допущение ложно по предположению, независимо от данных.
Если вы построите вероятности, используя p-значения в качестве основы для своих измерений, то байесовский метод, использующий байесовские измерения, всегда сможет получить преимущество над вами. Если бы байесовские шансы установили коэффициенты, то теория решений Пирсона и Неймана предоставила бы отчет о ставке или не делала ставки, но они не смогли бы определить сумму ставки. Поскольку шансы Байеса были справедливыми, ожидаемый выигрыш от использования метода Пирсона и Неймана был бы нулевым.
Действительно, исследование Wetzel - это то, о чем вы говорите, но на 145 ставок меньше. Если вы посмотрите на таблицу три, вы увидите некоторые исследования, в которых Frequentist отклоняет ноль, но байесовский обнаруживает, что вероятность благоприятствует нулю.
источник
Частотный анализ не может дать вам вероятность того, что конкретная гипотеза верна (или ложна), потому что у нее нет длительной частоты (она либо истинна, либо нет), поэтому мы не можем присвоить ей вероятность (кроме, возможно, 0 или 1). ). Если вы хотите узнать вероятность того, что конкретная гипотеза верна, нам нужно принять байесовскую структуру (где она проста, нам просто нужно рассмотреть априорные вероятности и т. Д.).
Частые пользователи могут найти оптимальные стратегии для действия на тестах нулевой гипотезы (структура Неймана-Пирсона ), но они не могут перевести это в вероятность того, что гипотеза верна, но только из-за их определения вероятности.
источник
Проблема в вашей настройке - Oracle. Это обычно не приходит, чтобы уладить ставки. Скажем, вы держите пари, что вероятность того, что курение вызывает рак, составляет 97%. Когда этот Оракул придет, чтобы уладить ставку? Никогда. Тогда как бы вы доказали, что ваша оптимальная стратегия оптимальна?
Однако если вы удалите Oracle и представите других агентов, таких как конкуренты и клиенты, тогда будет оптимальная стратегия. Боюсь, это не будет основано на p-значениях. Это было бы больше похоже на подход Госсета с функциями потерь. Например, вы и ваши конкуренты в сельскохозяйственном секторе делают ставку на прогноз погоды, который будет верным. Кто выберет лучшую стратегию, тот заработает больше денег. В Oracle нет необходимости, а ставки рассчитываются на рынках. Вы не можете основывать стратегию на p-значениях здесь, вы должны учитывать потери и прибыль в долларах.
источник
Для потока на p-значениях см. Непонимание P-значения?
источник