«Намерение исследователя» и пороговые значения / p-значения

21

Я читаю слайды Джона Крушке «Анализ байесовских данных» , но на самом деле у меня есть вопрос о его интерпретации t-тестов и / или всей основы тестирования значимости нулевой гипотезы. Он утверждает, что p-значения плохо определены, потому что они зависят от намерений следователя.

В частности, он приводит пример (страницы 3-6) двух лабораторий, которые собирают идентичные наборы данных, сравнивая две обработки. Одна лаборатория обязуется собирать данные от 12 субъектов (по 6 на условие), а другая собирает данные в течение фиксированного периода времени, что также дает 12 субъектов. Согласно слайдам, критическое значение для отличается между этими двумя схемами сбора данных: для первой, но для последней !р < 0,05 т крит = 2,33 т крит = 2,45tp<0.05tcrit=2.33tcrit=2.45

В блоге, который я сейчас не могу найти, предполагается, что сценарий с фиксированной продолжительностью имеет больше степеней свободы, поскольку они могли собирать данные от 11, 13 или любого другого числа субъектов, в то время как сценарий с фиксированным N - определение, имеет .N=12

Может ли кто-нибудь, пожалуйста, объясните мне:

  • Почему критическое значение будет отличаться между этими условиями?

  • (Предполагая, что это проблема) Как можно было бы исправить или сравнить эффекты различных критериев остановки?

Я знаю, что установка критериев остановки на основе значимости (например, выборка до ) может повысить вероятность ошибки типа I, но здесь это не происходит, поскольку ни одно из правил остановки не зависит от результата Анализ.p<0.05

Мэтт Краузе
источник

Ответы:

11

Вот еще немного информации: http://doingbayesiandataanalysis.blogspot.com/2012/07/sampling-distributions-of-t-when.html

Более полное обсуждение приведено здесь: http://www.indiana.edu/~kruschke/BEST/. В этой статье рассматриваются значения p для остановки при пороге N, остановки при пороговой продолжительности и остановки при пороговом значении t.

Джон К. Крушке
источник
Вот Это Да! Как будто прямо изо рта лошади ... Это определенно интересная идея, которая не пришла мне в голову. Спасибо за дополнительную информацию.
Мэтт Краузе
Я хотел добавить, что это подробно обсуждается в книге доктора Крушке (в главе 11).
Мэтт Краузе
13

Я , наконец , выследили бумагу , связанную с горками: Kruschke (2010) , также доступны непосредственно от автора (через CiteSeerX) здесь , так как журнал не так широко проводится. Объяснение немного прозаично, но я все еще не уверен, что куплю это.

В случае фиксированного N критическое значение вычисляется следующим образом: 2 N выборок случайным образом выбираются из (одной и той же) совокупности, и вычисляется значение t . Этот процесс повторяется много раз для создания нулевого распределения. Наконец, т с т я т устанавливается , чтобы быть 95 - й процентиль этого распределения.t2Nttcrit

В случае фиксированной продолжительности он предполагает, что субъекты достигают средней скорости . Нулевое распределение строится путем повторения двух шагов. На первом этапе количество субъектов для каждого условия N 1 и N 2 берется из распределения опционов с параметром λ . Затем для вычисления t- значения используются случайные выборки N 1 и N 2 из совокупности. Это повторяется много раз, и т с т я т устанавливается , чтобы быть 95 - й процентиль этого распределения.λN1N2λN1N2ttcrit

Это кажется немного ... дерзким ... для меня. Насколько я понимаю, нет ни одного распределения; вместо этого это семейство распределений, форма которых частично определяется параметром степеней свободы. Для условия с фиксированным N в каждой группе имеется N субъектов, и подходящее значение t для непарного критерия Стьюдента - это число с 2 N - 2 степенями свободы, что, по-видимому, и воспроизводит его симуляция. tNNT2N-2

В другом состоянии кажется, что « » -подобное распределение на самом деле является комбинацией выборок из множества различных t- распределений, в зависимости от конкретных розыгрышей. Установив λ = N , можно получить средние степени свободы равными 2 N - N , но этого недостаточно. Например, среднее значение t -распределений для ν = 1 и ν = 5 , по-видимому, не является t -распределением с 3 степенями свободы.TTλзнак равноN2N-NTνзнак равно1νзнак равно5T

В итоге:

  • TсряT
  • T
  • Я не уверен, что это действительно проблема, но был бы рад прочитать / повысить / принять ответы, если кто-то думает иначе.
Мэтт Краузе
источник
Почему вы можете ответить на свой вопрос и поставить галочку? Не похоже, что вы должны быть в состоянии дать себе репутацию!
Майкл Р. Черник
5
Нет ничего плохого в том, чтобы ответить на его собственный вопрос , Майкл.
Хл
@MichaelChernick, я считаю, что вы не получите ни одного представителя, если вы примете свой собственный ответ. В то время казалось, что это правильно, так как я более или менее отследил ответ за прошедшие две недели, но я переключил свое согласие с ответом Джона К. Крушке, поскольку он сам по себе является авторитетом. слайды :-)
Мэтт Краузе
Интересное спасибо. Но я не понимаю, почему нужно проверять свой ответ в любое время, даже если он кажется правильным и лучшим. Мы установили, что проверка вашего собственного ответа не дает вам очков репутации.
Майкл Р. Черник
3
Поскольку пометить ответ как принятый не имеет никакой другой цели, кроме как указать правильное решение (для будущих посетителей), особенно там, где не было предложено ничего другого, я не вижу в этом проблемы. Лично я давно проголосовал за этот ответ, потому что я ценю, что ОП позволяет нам извлекать выгоду из его собственных исследований. И мне очень жаль, что я не смог дать дополнительный голос за простой факт следования этой теме и обновления своего решения. PS «Мы установили ...» относится к Почему можно дать себе очки репутации? ,
Хл