В недавней статье, обсуждающей недостатки использования p-значения для статистического вывода, под названием «Matrixx v. Siracusano and Student v. Fisher Статистическая значимость в испытании» (DOI: 10.1111 / j.1740-9713.2011.00511.x), Стивен Т. Зиляк выступает против использования р-значений. В заключительных параграфах он говорит:
Данные это единственное, что мы уже знаем, и наверняка. То, что мы на самом деле хотим знать, - это нечто совершенно иное: вероятность того, что гипотеза верна (или, по крайней мере, практически полезна), учитывая имеющиеся у нас данные. Мы хотим знать вероятность того, что эти два препарата различны, и насколько, учитывая имеющиеся доказательства. Тест значимости, основанный на заблуждении транспонированной условной ловушки, в которую попал Фишер, не дает и не может сказать нам эту вероятность. Степенная функция, функция ожидаемых потерь и многие другие теоретико-решающие и байесовские методы, происходящие от Student и Jeffreys, теперь широко доступны и бесплатны в режиме онлайн.
Что такое степенная функция, функция ожидаемых потерь и «другие теоретико-решающие и байесовские методы»? Широко ли используются эти методы? Они доступны в R? Как реализуются эти новые предлагаемые методы? Как, например, я бы использовал эти методы для проверки своей гипотезы в наборе данных, в противном случае я бы использовал обычные t-тесты с двумя выборками и p-значения?
Ответы:
Это звучит как другая резкая газета смущенного человека. Фишер не попал ни в одну из таких ловушек, хотя многие исследователи статистики это делают.
Проверка гипотез является теоретической проблемой решения. Как правило, вы получаете тест с заданным порогом между двумя решениями (гипотеза верна или гипотеза ложна). Если у вас есть гипотеза, которая соответствует одной точке, такой как , тогда вы можете рассчитать вероятность получения ваших данных, когда они верны. Но что вы делаете, если это не единственная точка? Вы получаете функцию . Гипотеза является такой гипотезой, и вы получаете такую функцию для вероятности получения ваших наблюдаемых данных, если они верны. Эта функция является степенной функцией. Это очень классически. Фишер знал все об этом.θ = 0 θ θ ≠ 0
Ожидаемая потеря является частью основного механизма теории принятия решений. У вас есть различные состояния природы и различные возможные данные, вытекающие из них, и некоторые возможные решения, которые вы можете принять, и вы хотите найти хорошую функцию от данных до решения. Как вы определяете хорошее? С учетом определенного состояния природы, лежащего в основе полученных вами данных, и решения, принятого с помощью этой процедуры, какова ваша ожидаемая потеря? Это проще всего понять в бизнес-задачах (если я сделаю это, основываясь на продажах, которые я наблюдал за последние три квартала, какова ожидаемая денежная потеря?).
Байесовские процедуры являются подмножеством процедур принятия решений. Ожидаемая потеря недостаточна для определения уникально лучших процедур во всех случаях, кроме тривиальных. Если одна процедура лучше другой в обоих состояниях A и B, очевидно, вы предпочтете ее, но если одна лучше в состоянии A, а другая лучше в состоянии B, что вы выбираете? Именно сюда входят вспомогательные идеи, такие как байесовские процедуры, минимаксность и непредвзятость.
T-критерий на самом деле является отличным решением теоретической задачи решения. Вопрос заключается в том, как вы выбираете отсечку по вы рассчитываете. Заданное значение соответствует заданному значению , вероятности ошибки типа I и заданному набору степеней зависимости от размера оцениваемого базового параметра. Это приближение, чтобы использовать точечную нулевую гипотезу? Да. Это обычно проблема на практике? Нет, точно так же, как использование приближенной теории Бернулли для отклонения луча, как правило, прекрасно в структурной инженерии. Бесполезно ли иметь значение? Нет. Другой человек, просматривающий ваши данные, может использовать другуюT T α β п α чем вы, и значение учитывает это использование.п
Я также немного озадачен тем, почему он называет Студента и Джеффриса вместе, учитывая, что Фишер был ответственен за широкое распространение работы Студента.
По сути, слепое использование p-значений - плохая идея, и они представляют собой довольно тонкое понятие, но это не делает их бесполезными. Должны ли мы возражать против их неправильного использования исследователями с плохим математическим образованием? Абсолютно, но давайте вспомним, как это выглядело до того, как Фишер попытался отогнать что-то для использования человеком в поле.
источник
Я рекомендую сосредоточиться на таких вещах, как доверительные интервалы и проверка моделей. Эндрю Гельман проделал большую работу над этим. Я рекомендую его учебники, но также проверяю, что он выложил в Интернете, например, http://andrewgelman.com/2011/06/the_holes_in_my/
источник
Пакет ez обеспечивает отношения правдоподобия, когда вы используете
ezMixed()
функцию для моделирования смешанных эффектов. Соотношения правдоподобия нацелены на количественную оценку фактических данных о явлении путем сравнения вероятности (с учетом наблюдаемых данных) двух моделей: «ограниченной» модели, которая ограничивает влияние явления до нуля, и «неограниченной» модели, которая допускает ненулевое влияние феномен. После исправления наблюдаемых правдоподобий для дифференциальной сложности моделей (с помощью информационного критерия Акаике, который асимптотически эквивалентен перекрестной проверке), отношение количественно свидетельствует о наличии явления.источник
Все эти техники доступны в R в том же смысле, что вся алгебра доступна в вашем карандаше. Даже значения p доступны через множество различных функций в R, решение о том, какую функцию использовать для получения значения p или байесовского апостериора, является более сложным, чем указатель на одну функцию или пакет.
Как только вы узнаете об этих методах и решите, на какой вопрос вы действительно хотите получить ответ, вы сможете увидеть (или мы можем предоставить дополнительную помощь), как это сделать с помощью R (или других инструментов). Просто сказать, что вы хотите минимизировать свою функцию потери или получить последующее распределение, примерно так же полезно, как отвечать на «еду», когда вас спрашивают, что вы хотите съесть на обед.
источник