Зачем нам нужна альтернативная гипотеза?

14

Когда мы проводим тестирование, мы получаем два результата.

1) Мы отвергаем нулевую гипотезу

2) Мы не можем отвергнуть нулевую гипотезу.

Мы не говорим о принятии альтернативных гипотез. Если мы не говорим о принятии альтернативной гипотезы, зачем вообще нужна альтернативная гипотеза?

Вот обновление: кто-нибудь может дать мне два примера:

1) отклонение нулевой гипотезы равнозначно принятию альтернативной гипотезы

2) отказ от нулевой гипотезы не равен принятию альтернативной гипотезы

user1700890
источник
1
Потому что вы пытаетесь сделать некоторые выводы. Если это не нулевая гипотеза, то, возможно, это альтернативная гипотеза (даже если вы не совсем уверены, что альтернативная гипотеза верна, если вы отвергаете нулевую гипотезу). Когда вы отвергаете нулевую гипотезу, вы говорите, что у вас есть «доказательства», позволяющие сделать вывод, что альтернативная гипотеза может быть верной.
Nbro
@nbro, спасибо, я добавил вопрос в свой оригинальный пост. Не могли бы вы посмотреть?
user1700890
1
Я не очень знаком с проверкой гипотез, в целом. Лучше подождать, пока более компетентный человек ответит на ваши вопросы.
nbro
Если ваша альтернативная гипотеза является дополнением к нулевой гипотезе, нет смысла использовать ее вообще. Никто не использует альтернативные гипотезы на практике по этим причинам за пределами учебников.
Аксакал
«Мы не говорим о принятии альтернативных гипотез» - неправда для всех возможных «мы». Некоторые люди говорят о принятии альтернативной гипотезы, и многие другие думают об этом, даже если они уважают табу против высказывания этого. Несколько педантично избегать разговоров о принятии альтернативной гипотезы, когда нет разумных сомнений в ее истинности. Но, поскольку статистика так склонна к неправильному использованию, в этом случае педантизм, вероятно, полезен, поскольку прививает осторожность при интерпретации результатов.
Джон Коулман

Ответы:

8

Я сосредоточусь на том, «Если мы не говорим о принятии альтернативной гипотезы, зачем вообще нужна альтернативная гипотеза?»

Потому что это помогает нам выбрать значимую статистику теста и спроектировать наше исследование таким образом, чтобы оно имело высокую мощность - высокую вероятность отклонения нуля, когда альтернатива верна. Без альтернативы у нас нет понятия власти.

Представьте, что у нас есть только нулевая гипотеза и никакой альтернативы. Тогда нет никаких указаний о том, как выбрать тестовую статистику, которая будет иметь высокую мощность. Все, что мы можем сказать: «Отклонять нуль, когда вы наблюдаете статистику теста, значение которой меньше нуля». Мы можем выбрать что-то произвольное: мы можем нарисовать равномерное (0,1) случайное число и отклонить ноль, когда они ниже 0,05. Это случается при нулевом значении «редко», не более 5% времени - но это также так же редко, когда нулевое значение ложно. Так что это технически статистический тест, но он не имеет смысла как доказательство за или против чего-либо.

Вместо этого, как правило, у нас есть некоторая научно-правдоподобная альтернативная гипотеза («В моем эксперименте есть положительная разница в результатах между группой лечения и контрольной группой»). Мы хотели бы защитить его от потенциальных критиков, которые выдвинули бы нулевую гипотезу в качестве защитников дьявола («Я еще не убежден - может быть, ваше лечение на самом деле причиняет боль или не имеет никакого эффекта , и любая очевидная разница в данные обусловлены только вариацией выборки ").

Имея в виду эти 2 гипотезы, теперь мы можем настроить мощный тест, выбрав статистику теста, типичные значения которой при альтернативе вряд ли будут меньше нуля. (Положительная t-статистика из 2 выборок, далекая от 0, была бы неудивительной, если альтернатива верна, но удивительна, если значение равно нулю.) Затем мы выясняем распределение выборки тестовой статистики под нулем, чтобы мы могли вычислить p-значения --- и интерпретировать их. Когда мы наблюдаем статистику теста, которая вряд ли будет равна нулю, особенно если дизайн исследования, размер выборки и т. Д. Были выбраны, чтобы иметь высокую мощность , это дает некоторые доказательства альтернативы.

Итак, почему мы не говорим о «принятии» альтернативной гипотезы? Потому что даже мощное исследование не дает абсолютно точных доказательств того, что ноль неверен. Это все еще своего рода доказательство, но слабее, чем некоторые другие виды доказательств.

civilstat
источник
7

Исторически существовало разногласие относительно необходимости альтернативной гипотезы. Позвольте мне объяснить эту точку несогласия с учетом мнений Фишера и Неймана, в контексте статистических данных и байесовского ответа.

  • Фишер - нам не нужна альтернативная гипотеза; мы можем просто проверить нулевую гипотезу, используя критерий соответствия. Результатом является значение, обеспечивающее меру доказательств нулевой гипотезы.p

  • Нейман - Мы должны выполнить проверку гипотезы между нулем и альтернативой. Тест таков, что он может привести к ошибкам типа 1 с фиксированной заранее заданной скоростью . Результатом является решение - отклонить или не отклонить нулевую гипотезу на уровне .αα

    Нам нужна альтернатива с точки зрения теории принятия решений - мы делаем выбор между двумя направлениями действий - и потому что мы должны сообщить о силе теста Мы должны искать самые мощные из возможных тестов, чтобы иметь наилучшие шансы отклонить когда альтернатива верна.

    1p(Accept H0|H1)
    H0

    Чтобы удовлетворить обе эти точки, альтернативная гипотеза не может быть неопределенной, а не .H0

  • Байесовский. Мы должны рассмотреть как минимум две модели и обновить их относительную правдоподобность данными. Имея только одну модель, мы просто имеем независимо от того, какие данные мы собираем. Чтобы сделать вычисления в этой структуре, альтернативная гипотеза (или модель, как это было бы известно в этом контексте) не может быть плохо определенной «не ». Я называю это плохо определенным, так как мы не можем написать модель .

    p(H0)=1
    H0p(data|not H0)

Innisfree
источник
1
Ваше последнее замечание превосходно и часто игнорируется в публикациях, которые основывают всю свою аргументацию на одном, немотивированном NHST.
Конрад Рудольф
Почему «не » плохо определено? H0
Майкл
Что это? Можете ли вы рассчитать ? p(data|notH0)
Innisfree
@innisfree в частой концепции нет, но, вероятно, под байесовским.
Майкл
Попробуйте и сделайте это, не представив хотя бы 2 модели ...
innisfree
4

Я не уверен на 100%, является ли это формальным требованием, но обычно нулевая гипотеза и альтернативная гипотеза являются: 1) дополнительными и 2) исчерпывающими. То есть: 1) они не могут быть правдой одновременно; 2) если одно неверно, другое должно быть правдой.

Рассмотрим простой тест высоты между девочками и мальчиками. Типичная нулевая гипотеза в этом случае заключается в том, что . Альтернативной гипотезой была бы . Так что, если ноль не верно - альтернатива должна быть истиной.heightboys=heightgirlsheightboysheightgirls

Каролис Концевичюс
источник
1
Я полностью согласен с вашими утверждениями, но следует отметить, что как и обычно представляют собой бесконечно большие наборы нулевых гипотез. Также кажется, что многие убеждены, что и не должны быть исчерпывающими, например, посмотрите это или это обсуждение. H0HaH0Ha
bi_scholar
2
@bi_scholar спасибо за обсуждение темы. Я не эксперт в этом, но, основываясь на простых рассуждениях, я считаю, что они должны быть исчерпывающими. Подумайте об этом странном тесте: кто-то находит на дороге 5 камней, расположенных по порядку. Его : ветер сделал это. Его : это были инопланетяне. Теперь, если он проверяет вероятность того, что ветер сделал это, и находит вероятность 0,0001 - он отвергает гипотезу ветра. Но это не дает ему права утверждать, что это были инопланетяне. Все, на что он может претендовать, - это то, что вероятность того, что это ветер, мала. Но ЛЮБОЕ другое объяснение остается открытым. H0H1
Каролис Концевичюс,
1
Согласен. Я рассуждал о том, что проверка гипотез заключается в принятии или отклонении при отклонении или принятии . Если и не являются исчерпывающими, нет никакого смысла вообще определять , поскольку даже когда мы отвергаем мы не можем принять , так как существуют другие гипотезы вне и которые также могут быть верными. К сожалению, мне не удалось донести свою точку зрения в первой теме. H a H 0 H a H a H 0 H a H 0 H aH0HaH0HaHaH0HaH0Ha
bi_scholar
1
@innisfree можно было бы проверить две точечные гипотезы в некоторой структуре вероятности - конечно. Но эта процедура не будет называться «проверка нулевой гипотезы», и она неточна. Он выберет ближайший вариант как истинный, даже если ни один из них не соответствует действительности. Кроме того, что касается мощности - при расчете мощности теста можно выбрать альтернативную гипотезу или величину эффекта, но (на мой взгляд) следует забыть об этом после проведения тестирования. Если нет какой-либо предварительной информации, которая говорит ему о возможных эффектах, присутствующих в данных. Как, может быть, белые / черные пиксели на шумной фотографии.
Каролис Концевичюс
1
@innisfree Мне интересно, как бы выглядел такой тест, не могли бы вы привести небольшой пример? Я убежден, что мы не можем принять , отвергая если что соответствует и является исчерпывающим. H 0 θ { 0 , 1 } H 0 H 1θ=1H0θ{0,1}H0H1
bi_scholar
2

Зачем нам вообще нужна альтернативная гипотеза?

В классическом тесте гипотезы единственная математическая роль, которую играет альтернативная гипотеза, состоит в том, что она влияет на упорядоченность доказательств через выбранную статистику теста. Альтернативная гипотеза используется для определения соответствующей статистики теста для теста, которая эквивалентна установке порядкового ранжирования всех возможных результатов данных от тех, которые наиболее благоприятны для нулевой гипотезы (против заявленной альтернативы), к тем, которые наименее благоприятны для нулевых гипотез (против заявленной альтернативы). После того, как вы сформировали этот порядковый рейтинг возможных результатов данных, альтернативная гипотеза больше не играет никакой математической роли в тесте .


nx=(x1,...,xn)T:RnRэто отображает каждый возможный результат данных в порядковом масштабе, который измеряет, является ли это более благоприятным для нулевой или альтернативной гипотезы. (Без ограничения общности мы будем предполагать, что более низкие значения более благоприятны для нулевой гипотезы, а более высокие значения более благоприятны для альтернативной гипотезы. Иногда мы говорим, что более высокие значения тестовой статистики являются «более экстремальными», поскольку они составляют более экстремальные доказательства альтернативной гипотезы.) Тогда значение p теста определяется как:

p(x)pT(x)P(T(X)T(x)|H0).

Эта функция p-значения полностью определяет свидетельство в тесте для любого вектора данных. В сочетании с выбранным уровнем значимости он определяет результат теста для любого вектора данных. (Мы описали это для фиксированного числа точек данных но это можно легко расширить, чтобы учесть произвольное .) Важно отметить, что на значение p влияет тестовая статистика только через порядковый масштаб, который она вызываетnn, поэтому, если вы применяете монотонно возрастающее преобразование к статистике теста, это не имеет значения для теста гипотезы (т. е. это тот же тест). Это математическое свойство просто отражает тот факт, что единственная цель тестовой статистики состоит в том, чтобы индуцировать порядковый масштаб в пространстве всех возможных векторов данных, чтобы показать, какие из них более благоприятны для нулевой / альтернативной.

Альтернативная гипотеза влияет на это измерение только через функциюT , которая выбирается на основе заявленной нулевой и альтернативной гипотез в рамках общей модели. Следовательно, мы можем рассматривать тестовую статистическую функцию как функцию общей модели и двух гипотез. Например, для теста отношения правдоподобия тестовая статистика формируется путем взятия отношения (или логарифма отношения) супремумов функции правдоподобия в диапазонах параметров, относящихся к нулевой и альтернативной гипотезам.Tg(M,H0,HA)M


Что это значит, если мы сравниваем тесты с разными альтернативами? Предположим, у вас есть фиксированная модель и вы хотите провести два разных теста гипотез, сравнивающих одну и ту же нулевую гипотезу с двумя разными альтернативами и . В этом случае у вас будет две разные функции статистики теста:MH0HAHA

T=g(M,H0,HA)T=g(M,H0,HA),

приводя к соответствующим функциям p-значения:

p(x)=P(T(X)T(x)|H0)p(x)=P(T(X)T(x)|H0).

Важно отметить, что если и являются монотонными возрастающими преобразованиями друг друга, то функции p-значения и идентичны, поэтому оба теста являются одним и тем же тестом. Если функции и не являются монотонными возрастающими преобразованиями друг друга, то у нас есть два действительно разных теста гипотез.TTppTT

Бен - Восстановить Монику
источник
2
Я бы согласился с этим, сказав, что тест предназначен для отклонения нулевой гипотезы, когда он сталкивается с экстремальными результатами, и роль альтернативной гипотезы заключается в том, чтобы указать на то, какие результаты будут рассматриваться как экстремальные, если бы нулевая гипотеза была верной
Генри
1

Причина, по которой я бы не подумал принять альтернативную гипотезу, заключается в том, что это не то, что мы проверяем. Тестирование значимости нулевой гипотезы (NHST) вычисляет вероятность наблюдения данных как экстремальных, как наблюдалось (или больше), учитывая, что нулевая гипотеза верна, или, другими словами, NHST вычисляет значение вероятности, которое обусловлено тем фактом, что нулевая гипотеза верна , . Таким образом, это вероятность того, что данные предполагают, что нулевая гипотеза верна. Он никогда не использует и не дает вероятности гипотезы (ни нулевой, ни альтернативной). Поэтому, когда вы наблюдаете небольшое значение p, все, что вы знаете, это то, что данные, которые вы наблюдали, кажутся маловероятными приP(data|H0)H0Таким образом, вы собираете доказательства против нуля и в пользу любого альтернативного объяснения.

Прежде чем приступить к эксперименту, вы можете выбрать уровень отсечения ( ), который сочтет ваш результат значительным, то есть, если ваше значение p упадет ниже этого уровня, вы придете к выводу, что доказательства против нуля настолько высоки, что данные должны быть получены из какого-то другого процесса генерирования данных, и вы отклоняете нулевую гипотезу, основанную на этом свидетельстве. Если значение p выше этого уровня, вы не сможете отвергнуть нулевую гипотезу, поскольку ваши доказательства не являются достаточно существенными, чтобы полагать, что ваша выборка пришла из другого процесса генерирования данных.α

Причина, по которой вы формулируете альтернативную гипотезу, заключается в том, что вы, скорее всего, имели в виду эксперимент до того, как начали пробовать. Формулировка альтернативной гипотезы также может решить, используете ли вы односторонний или двухсторонний тест, и, следовательно, дает вам больше статистических возможностей (в одностороннем сценарии). Но технически, чтобы запустить тест, вам не нужно формулировать альтернативную гипотезу, вам просто нужны данные.

Стефан
источник
NHST не рассчитывает ; он вычисляет . Различие важно. P ( данные столь же экстремальные, как и наблюдаемые | H 0 )P(data|H0)P(data as extreme as that observed|H0)
Innisfree
@innisfree Я согласен, и именно так я определил данные в том же предложении.
Стефан
? Я нигде не вижу, где определяются данные (таким или иным образом)
innisfree
И даже если бы это было, зачем это делать? Зачем переопределять данные таким образом? Я бы посоветовал уточнить части текста вокруг p (данные ..
innisfree