Итак, я много читал о том, как правильно интерпретировать P-значение, и из того, что я прочитал, p-значение НИЧЕГО не говорит о вероятности того, что нулевая гипотеза верна или неверна. Однако при прочтении следующего утверждения:
Значение p представляет вероятность допустить ошибку типа I или отклонить нулевую гипотезу, если она верна. Чем меньше значение p, тем меньше вероятность того, что вы ошибочно отклоните нулевую гипотезу.
РЕДАКТИРОВАТЬ: И затем 5 минут спустя я прочитал:
Неправильные интерпретации значений P очень распространены. Наиболее распространенной ошибкой является интерпретация значения P как вероятности совершения ошибки путем отклонения истинной нулевой гипотезы (ошибка типа I).
Это смутило меня. Какой из них правильный? И кто-нибудь может объяснить, как правильно интерпретировать значение p и как оно правильно соотносится с вероятностью ошибки типа I?
The p – value represents the probability of making a type I error, or rejecting the null hypothesis when it is true
Значение p представляет априорную вероятность ошибки типа I, то есть отклонения нулевой гипотезы в предположении, что она верна.Ответы:
Из-за ваших комментариев я сделаю два отдельных раздела:
р-значение
В тестировании статистических гипотез вы можете найти «статистические доказательства» альтернативной гипотезы; Как я объяснил в разделе Что следует, если мы не сможем отвергнуть нулевую гипотезу? , это похоже на «доказательство от противного» в математике.
Поэтому, если мы хотим найти «статистическое доказательство», мы предполагаем обратное, которое мы обозначаем того, что мы пытаемся доказать, что мы называем H 1 . После этого мы рисуем образец, а из него вычисляем так называемую статистику теста (например, t-значение в t-тесте).H0 H1
Затем, поскольку мы предполагаем, что истинно и что наша выборка случайным образом взята из распределения под H 0 , мы можем вычислить вероятность наблюдения значений, которые превышают или равны значению, полученному из нашей (случайной) выборки. Эта вероятность называется р-значением.H0 H0
Если это значение «достаточно мало», то есть меньше, чем уровень значимости, который мы выбрали, то мы отвергаем и считаем, что H 1 «статистически доказано».H0 H1
В этом способе важно несколько вещей:
Итак, что же такое ошибка типа I: ошибка типа I возникает, когда выборка, случайным образом взятая из , приводит к выводу, что H 0 является ложным, тогда как в действительности оно истинно.H0 H0
Обратите внимание , что это означает , что р-значение не вероятность ошибки типа I . Действительно, ошибка типа I - это неправильное решение теста, и решение может быть принято только путем сравнения p-значения с выбранным уровнем значимости, с одним только p-значением решение не может быть принято, это только после сравнения p-значение для выбранного уровня значимости, по которому принимается решение , и пока решение не принято, ошибка типа I даже не определяется.
Что тогда является p-значением? Потенциально неправильное отклонение связано с тем, что мы рисуем случайную выборку под H 0 , поэтому может случиться так, что у нас будет «неудача» при рисовании выборки, и эта «неудача» приведет ложное отклонение H 0 . Таким образом, значение p (хотя это не совсем правильно) больше похоже на вероятность получения «плохой выборки». Правильная интерпретация значения p состоит в том, что это вероятность того, что тестовая статистика превышает или равна значению тестовой статистики, полученной из случайно выбранной выборки при H 0H0 H0 H0 H0
Скорость ложного обнаружения (FDR)
Как объяснено выше, каждый раз, когда нулевая гипотеза отклоняется, каждый рассматривает это как «статистическое доказательство» для . Итак, мы нашли новое научное знание, поэтому оно называется открытием . Выше также объясняется, что мы можем делать ложные открытия (то есть ложно отвергать H 0 ), когда совершаем ошибку типа I. В этом случае у нас ложное убеждение в научной истине. Мы только хотим обнаружить действительно правдивые вещи, и поэтому стараемся свести к минимуму ложные открытия, то есть каждый будет контролировать ошибку типа I. Нетрудно понять, что вероятность ошибки типа I является выбранным уровнем значимости α . Поэтому для того , чтобы контролировать наличие ошибок I типа, один фиксирует альфаH1 H0 α α уровень, отражающий вашу готовность принять «ложное доказательство».
Интуитивно понятно, что это означает, что если мы рисуем огромное количество образцов, и с каждым образцом мы проводим тест, то доля этих тестов приведет к неверному выводу. Важно отметить, что мы «усредняем по многим выборкам» ; так же тест, много образцов.α
Таким образом, вероятность ошибки типа I связана с выполнением одного и того же теста на разных образцах. Для огромного количества выборок вероятность ошибки типа I будет сходиться к количеству выборок, ведущих к ложному отклонению, деленному на общее количество взятых выборок .
Обратите внимание, что, сравнивая два абзаца выше:
источник
The correct interpretation of the p-value is that it is the probability that the test-statistic exceeds the value of the test-statistic derived from a randomly drawn sample under H0
Это так? Разве это не «равно или превышает»? P-значение - это вероятность того, что при истинном значении H0 мы наблюдаем разницу или связь, равную или превышающую реально наблюдаемую.Первое утверждение не совсем верно.
Из изящной статьи о недопонимании значимости: ( http://myweb.brooklyn.liu.edu/cortiz/PDF%20Files/Misinterpretations%20of%20Significance.pdf )
Проще говоря, для оценки вероятности того, что вы неправильно отклонили H0, вам требуется вероятность того, что H0 истинно, которую вы просто не можете получить с помощью этого теста.
источник
Правильная интерпретация p-значения - это условная вероятность исхода, по крайней мере, столь же благоприятная для альтернативной гипотезы, как наблюдаемое значение (по крайней мере, как «крайняя»), предполагая, что нулевая гипотеза верна . Неправильные интерпретации обычно включают в себя либо предельную вероятность, либо изменение условия:
источник
Значение p позволяет нам определить, может ли нулевая гипотеза (или заявленная гипотеза) быть отклонена или нет. Если значение p меньше уровня значимости, α, то это представляет статистически значимый результат, и нулевая гипотеза должна быть отклонена. Если значение p больше уровня значимости, α, нулевая гипотеза не может быть отклонена. Это и есть причина поиска значения p, если вы используете таблицу или онлайн-калькулятор, например калькулятор значения p , чтобы найти значение p в статистике теста.
Теперь я знаю, что вы упомянули ошибки типа I и типа II. Это действительно не имеет ничего общего с p-значением. Это связано с исходными данными, такими как размер выборки и значения, полученные для данных. Например, если размер выборки слишком мал, это может привести к ошибке типа I.
источник