Когда мы проводим тестирование, мы получаем два результата.
1) Мы отвергаем нулевую гипотезу
2) Мы не можем отвергнуть нулевую гипотезу.
Мы не говорим о принятии альтернативных гипотез. Если мы не говорим о принятии альтернативной гипотезы, зачем вообще нужна альтернативная гипотеза?
Вот обновление: кто-нибудь может дать мне два примера:
1) отклонение нулевой гипотезы равнозначно принятию альтернативной гипотезы
2) отказ от нулевой гипотезы не равен принятию альтернативной гипотезы
hypothesis-testing
user1700890
источник
источник
Ответы:
Я сосредоточусь на том, «Если мы не говорим о принятии альтернативной гипотезы, зачем вообще нужна альтернативная гипотеза?»
Потому что это помогает нам выбрать значимую статистику теста и спроектировать наше исследование таким образом, чтобы оно имело высокую мощность - высокую вероятность отклонения нуля, когда альтернатива верна. Без альтернативы у нас нет понятия власти.
Представьте, что у нас есть только нулевая гипотеза и никакой альтернативы. Тогда нет никаких указаний о том, как выбрать тестовую статистику, которая будет иметь высокую мощность. Все, что мы можем сказать: «Отклонять нуль, когда вы наблюдаете статистику теста, значение которой меньше нуля». Мы можем выбрать что-то произвольное: мы можем нарисовать равномерное (0,1) случайное число и отклонить ноль, когда они ниже 0,05. Это случается при нулевом значении «редко», не более 5% времени - но это также так же редко, когда нулевое значение ложно. Так что это технически статистический тест, но он не имеет смысла как доказательство за или против чего-либо.
Вместо этого, как правило, у нас есть некоторая научно-правдоподобная альтернативная гипотеза («В моем эксперименте есть положительная разница в результатах между группой лечения и контрольной группой»). Мы хотели бы защитить его от потенциальных критиков, которые выдвинули бы нулевую гипотезу в качестве защитников дьявола («Я еще не убежден - может быть, ваше лечение на самом деле причиняет боль или не имеет никакого эффекта , и любая очевидная разница в данные обусловлены только вариацией выборки ").
Имея в виду эти 2 гипотезы, теперь мы можем настроить мощный тест, выбрав статистику теста, типичные значения которой при альтернативе вряд ли будут меньше нуля. (Положительная t-статистика из 2 выборок, далекая от 0, была бы неудивительной, если альтернатива верна, но удивительна, если значение равно нулю.) Затем мы выясняем распределение выборки тестовой статистики под нулем, чтобы мы могли вычислить p-значения --- и интерпретировать их. Когда мы наблюдаем статистику теста, которая вряд ли будет равна нулю, особенно если дизайн исследования, размер выборки и т. Д. Были выбраны, чтобы иметь высокую мощность , это дает некоторые доказательства альтернативы.
Итак, почему мы не говорим о «принятии» альтернативной гипотезы? Потому что даже мощное исследование не дает абсолютно точных доказательств того, что ноль неверен. Это все еще своего рода доказательство, но слабее, чем некоторые другие виды доказательств.
источник
Исторически существовало разногласие относительно необходимости альтернативной гипотезы. Позвольте мне объяснить эту точку несогласия с учетом мнений Фишера и Неймана, в контексте статистических данных и байесовского ответа.
Фишер - нам не нужна альтернативная гипотеза; мы можем просто проверить нулевую гипотезу, используя критерий соответствия. Результатом является значение, обеспечивающее меру доказательств нулевой гипотезы.p
Нейман - Мы должны выполнить проверку гипотезы между нулем и альтернативой. Тест таков, что он может привести к ошибкам типа 1 с фиксированной заранее заданной скоростью . Результатом является решение - отклонить или не отклонить нулевую гипотезу на уровне .α α
Нам нужна альтернатива с точки зрения теории принятия решений - мы делаем выбор между двумя направлениями действий - и потому что мы должны сообщить о силе теста Мы должны искать самые мощные из возможных тестов, чтобы иметь наилучшие шансы отклонить когда альтернатива верна.1−p(Accept H0|H1) H0
Чтобы удовлетворить обе эти точки, альтернативная гипотеза не может быть неопределенной, а не .H0
Байесовский. Мы должны рассмотреть как минимум две модели и обновить их относительную правдоподобность данными. Имея только одну модель, мы просто имеем независимо от того, какие данные мы собираем. Чтобы сделать вычисления в этой структуре, альтернативная гипотеза (или модель, как это было бы известно в этом контексте) не может быть плохо определенной «не ». Я называю это плохо определенным, так как мы не можем написать модель .p(H0)=1 H0 p(data|not H0)
источник
Я не уверен на 100%, является ли это формальным требованием, но обычно нулевая гипотеза и альтернативная гипотеза являются: 1) дополнительными и 2) исчерпывающими. То есть: 1) они не могут быть правдой одновременно; 2) если одно неверно, другое должно быть правдой.
Рассмотрим простой тест высоты между девочками и мальчиками. Типичная нулевая гипотеза в этом случае заключается в том, что . Альтернативной гипотезой была бы . Так что, если ноль не верно - альтернатива должна быть истиной.heightboys=heightgirls heightboys≠heightgirls
источник
В классическом тесте гипотезы единственная математическая роль, которую играет альтернативная гипотеза, состоит в том, что она влияет на упорядоченность доказательств через выбранную статистику теста. Альтернативная гипотеза используется для определения соответствующей статистики теста для теста, которая эквивалентна установке порядкового ранжирования всех возможных результатов данных от тех, которые наиболее благоприятны для нулевой гипотезы (против заявленной альтернативы), к тем, которые наименее благоприятны для нулевых гипотез (против заявленной альтернативы). После того, как вы сформировали этот порядковый рейтинг возможных результатов данных, альтернативная гипотеза больше не играет никакой математической роли в тесте .
Эта функция p-значения полностью определяет свидетельство в тесте для любого вектора данных. В сочетании с выбранным уровнем значимости он определяет результат теста для любого вектора данных. (Мы описали это для фиксированного числа точек данных но это можно легко расширить, чтобы учесть произвольное .) Важно отметить, что на значение p влияет тестовая статистика только через порядковый масштаб, который она вызываетn n , поэтому, если вы применяете монотонно возрастающее преобразование к статистике теста, это не имеет значения для теста гипотезы (т. е. это тот же тест). Это математическое свойство просто отражает тот факт, что единственная цель тестовой статистики состоит в том, чтобы индуцировать порядковый масштаб в пространстве всех возможных векторов данных, чтобы показать, какие из них более благоприятны для нулевой / альтернативной.
Альтернативная гипотеза влияет на это измерение только через функциюT , которая выбирается на основе заявленной нулевой и альтернативной гипотез в рамках общей модели. Следовательно, мы можем рассматривать тестовую статистическую функцию как функцию общей модели и двух гипотез. Например, для теста отношения правдоподобия тестовая статистика формируется путем взятия отношения (или логарифма отношения) супремумов функции правдоподобия в диапазонах параметров, относящихся к нулевой и альтернативной гипотезам.T≡g(M,H0,HA) M
Что это значит, если мы сравниваем тесты с разными альтернативами? Предположим, у вас есть фиксированная модель и вы хотите провести два разных теста гипотез, сравнивающих одну и ту же нулевую гипотезу с двумя разными альтернативами и . В этом случае у вас будет две разные функции статистики теста:M H0 HA H′A
приводя к соответствующим функциям p-значения:
Важно отметить, что если и являются монотонными возрастающими преобразованиями друг друга, то функции p-значения и идентичны, поэтому оба теста являются одним и тем же тестом. Если функции и не являются монотонными возрастающими преобразованиями друг друга, то у нас есть два действительно разных теста гипотез.T T′ p p′ T T′
источник
Причина, по которой я бы не подумал принять альтернативную гипотезу, заключается в том, что это не то, что мы проверяем. Тестирование значимости нулевой гипотезы (NHST) вычисляет вероятность наблюдения данных как экстремальных, как наблюдалось (или больше), учитывая, что нулевая гипотеза верна, или, другими словами, NHST вычисляет значение вероятности, которое обусловлено тем фактом, что нулевая гипотеза верна , . Таким образом, это вероятность того, что данные предполагают, что нулевая гипотеза верна. Он никогда не использует и не дает вероятности гипотезы (ни нулевой, ни альтернативной). Поэтому, когда вы наблюдаете небольшое значение p, все, что вы знаете, это то, что данные, которые вы наблюдали, кажутся маловероятными приP(data|H0) H0 Таким образом, вы собираете доказательства против нуля и в пользу любого альтернативного объяснения.
Прежде чем приступить к эксперименту, вы можете выбрать уровень отсечения ( ), который сочтет ваш результат значительным, то есть, если ваше значение p упадет ниже этого уровня, вы придете к выводу, что доказательства против нуля настолько высоки, что данные должны быть получены из какого-то другого процесса генерирования данных, и вы отклоняете нулевую гипотезу, основанную на этом свидетельстве. Если значение p выше этого уровня, вы не сможете отвергнуть нулевую гипотезу, поскольку ваши доказательства не являются достаточно существенными, чтобы полагать, что ваша выборка пришла из другого процесса генерирования данных.α
Причина, по которой вы формулируете альтернативную гипотезу, заключается в том, что вы, скорее всего, имели в виду эксперимент до того, как начали пробовать. Формулировка альтернативной гипотезы также может решить, используете ли вы односторонний или двухсторонний тест, и, следовательно, дает вам больше статистических возможностей (в одностороннем сценарии). Но технически, чтобы запустить тест, вам не нужно формулировать альтернативную гипотезу, вам просто нужны данные.
источник