«Намерение исследователя» и пороговые значения / p-значения

Я читаю слайды Джона Крушке «Анализ байесовских данных» , но на самом деле у меня есть вопрос о его интерпретации t-тестов и / или всей основы тестирования значимости нулевой гипотезы. Он утверждает, что p-значения плохо определены, потому что они зависят от намерений следователя.

В частности, он приводит пример (страницы 3-6) двух лабораторий, которые собирают идентичные наборы данных, сравнивая две обработки. Одна лаборатория обязуется собирать данные от 12 субъектов (по 6 на условие), а другая собирает данные в течение фиксированного периода времени, что также дает 12 субъектов. Согласно слайдам, критическое значение для отличается между этими двумя схемами сбора данных: для первой, но для последней ! $t$ $p<0.05$ $t_{\textrm{crit}}=2.33$ $t_{\textrm{crit}}=2.45$

В блоге, который я сейчас не могу найти, предполагается, что сценарий с фиксированной продолжительностью имеет больше степеней свободы, поскольку они могли собирать данные от 11, 13 или любого другого числа субъектов, в то время как сценарий с фиксированным N - определение, имеет . $N=12$

Может ли кто-нибудь, пожалуйста, объясните мне:

Почему критическое значение будет отличаться между этими условиями?
(Предполагая, что это проблема) Как можно было бы исправить или сравнить эффекты различных критериев остановки?

Я знаю, что установка критериев остановки на основе значимости (например, выборка до ) может повысить вероятность ошибки типа I, но здесь это не происходит, поскольку ни одно из правил остановки не зависит от результата Анализ. $p<0.05$

hypothesis-testing Мэтт Краузе
источник

Ответы:

Вот еще немного информации: http://doingbayesiandataanalysis.blogspot.com/2012/07/sampling-distributions-of-t-when.html

Более полное обсуждение приведено здесь: http://www.indiana.edu/~kruschke/BEST/. В этой статье рассматриваются значения p для остановки при пороге N, остановки при пороговой продолжительности и остановки при пороговом значении t.

Джон К. Крушке
источник

Вот Это Да! Как будто прямо изо рта лошади ... Это определенно интересная идея, которая не пришла мне в голову. Спасибо за дополнительную информацию.

Мэтт Краузе

Я хотел добавить, что это подробно обсуждается в книге доктора Крушке (в главе 11).

Мэтт Краузе

Я , наконец , выследили бумагу , связанную с горками: Kruschke (2010) , также доступны непосредственно от автора (через CiteSeerX) здесь , так как журнал не так широко проводится. Объяснение немного прозаично, но я все еще не уверен, что куплю это.

В случае фиксированного N критическое значение вычисляется следующим образом: выборок случайным образом выбираются из (одной и той же) совокупности, и вычисляется значение . Этот процесс повторяется много раз для создания нулевого распределения. Наконец, устанавливается , чтобы быть 95 - й процентиль этого распределения. $t$ $2N$ $t$ $t_{crit}$

В случае фиксированной продолжительности он предполагает, что субъекты достигают средней скорости . Нулевое распределение строится путем повторения двух шагов. На первом этапе количество субъектов для каждого условия и берется из распределения опционов с параметром . Затем для вычисления значения используются случайные выборки и из совокупности. Это повторяется много раз, и устанавливается , чтобы быть 95 - й процентиль этого распределения. $\lambda$ $N_1$ $N_2$ $\lambda$ $N_1$ $N_2$ $t$ $t_{crit}$

Это кажется немного ... дерзким ... для меня. Насколько я понимаю, нет ни одного распределения; вместо этого это семейство распределений, форма которых частично определяется параметром степеней свободы. Для условия с фиксированным каждой группе имеется субъектов, и подходящее значение для непарного критерия Стьюдента - это число с степенями свободы, что, по-видимому, и воспроизводит его симуляция. $t$ $N$ $N$ $t$ $2N-2$

В другом состоянии кажется, что « » -подобное распределение на самом деле является комбинацией выборок из множества различных распределений, в зависимости от конкретных розыгрышей. Установив , можно получить средние степени свободы равными , но этого недостаточно. Например, среднее значение -распределений для и , по-видимому, не является -распределением с 3 степенями свободы. $t$ $t$ $\lambda=N$ $2N-N$ $t$ $\nu=1$ $\nu=5$ $t$

В итоге:

$t_{crit}$
$t$
Я не уверен, что это действительно проблема, но был бы рад прочитать / повысить / принять ответы, если кто-то думает иначе.

Мэтт Краузе
источник

Почему вы можете ответить на свой вопрос и поставить галочку? Не похоже, что вы должны быть в состоянии дать себе репутацию!

Майкл Р. Черник

Нет ничего плохого в том, чтобы ответить на его собственный вопрос , Майкл.

Хл

@MichaelChernick, я считаю, что вы не получите ни одного представителя, если вы примете свой собственный ответ. В то время казалось, что это правильно, так как я более или менее отследил ответ за прошедшие две недели, но я переключил свое согласие с ответом Джона К. Крушке, поскольку он сам по себе является авторитетом. слайды :-)

Мэтт Краузе

Интересное спасибо. Но я не понимаю, почему нужно проверять свой ответ в любое время, даже если он кажется правильным и лучшим. Мы установили, что проверка вашего собственного ответа не дает вам очков репутации.

Майкл Р. Черник

Поскольку пометить ответ как принятый не имеет никакой другой цели, кроме как указать правильное решение (для будущих посетителей), особенно там, где не было предложено ничего другого, я не вижу в этом проблемы. Лично я давно проголосовал за этот ответ, потому что я ценю, что ОП позволяет нам извлекать выгоду из его собственных исследований. И мне очень жаль, что я не смог дать дополнительный голос за простой факт следования этой теме и обновления своего решения. PS «Мы установили ...» относится к Почему можно дать себе очки репутации? ,

Хл