Я читаю слайды Джона Крушке «Анализ байесовских данных» , но на самом деле у меня есть вопрос о его интерпретации t-тестов и / или всей основы тестирования значимости нулевой гипотезы. Он утверждает, что p-значения плохо определены, потому что они зависят от намерений следователя.
В частности, он приводит пример (страницы 3-6) двух лабораторий, которые собирают идентичные наборы данных, сравнивая две обработки. Одна лаборатория обязуется собирать данные от 12 субъектов (по 6 на условие), а другая собирает данные в течение фиксированного периода времени, что также дает 12 субъектов. Согласно слайдам, критическое значение для отличается между этими двумя схемами сбора данных: для первой, но для последней !р < 0,05 т крит = 2,33 т крит = 2,45
В блоге, который я сейчас не могу найти, предполагается, что сценарий с фиксированной продолжительностью имеет больше степеней свободы, поскольку они могли собирать данные от 11, 13 или любого другого числа субъектов, в то время как сценарий с фиксированным N - определение, имеет .
Может ли кто-нибудь, пожалуйста, объясните мне:
Почему критическое значение будет отличаться между этими условиями?
(Предполагая, что это проблема) Как можно было бы исправить или сравнить эффекты различных критериев остановки?
Я знаю, что установка критериев остановки на основе значимости (например, выборка до ) может повысить вероятность ошибки типа I, но здесь это не происходит, поскольку ни одно из правил остановки не зависит от результата Анализ.
источник
Я , наконец , выследили бумагу , связанную с горками: Kruschke (2010) , также доступны непосредственно от автора (через CiteSeerX) здесь , так как журнал не так широко проводится. Объяснение немного прозаично, но я все еще не уверен, что куплю это.
В случае фиксированного N критическое значение вычисляется следующим образом: 2 N выборок случайным образом выбираются из (одной и той же) совокупности, и вычисляется значение t . Этот процесс повторяется много раз для создания нулевого распределения. Наконец, т с т я т устанавливается , чтобы быть 95 - й процентиль этого распределения.T 2 N T Tс т я т
В случае фиксированной продолжительности он предполагает, что субъекты достигают средней скорости . Нулевое распределение строится путем повторения двух шагов. На первом этапе количество субъектов для каждого условия N 1 и N 2 берется из распределения опционов с параметром λ . Затем для вычисления t- значения используются случайные выборки N 1 и N 2 из совокупности. Это повторяется много раз, и т с т я т устанавливается , чтобы быть 95 - й процентиль этого распределения.λ N1 N2 λ N1 N2 T Tс т я т
Это кажется немного ... дерзким ... для меня. Насколько я понимаю, нет ни одного распределения; вместо этого это семейство распределений, форма которых частично определяется параметром степеней свободы. Для условия с фиксированным N в каждой группе имеется N субъектов, и подходящее значение t для непарного критерия Стьюдента - это число с 2 N - 2 степенями свободы, что, по-видимому, и воспроизводит его симуляция.T N N T 2 N- 2
В другом состоянии кажется, что « » -подобное распределение на самом деле является комбинацией выборок из множества различных t- распределений, в зависимости от конкретных розыгрышей. Установив λ = N , можно получить средние степени свободы равными 2 N - N , но этого недостаточно. Например, среднее значение t -распределений для ν = 1 и ν = 5 , по-видимому, не является t -распределением с 3 степенями свободы.T T λ = N 2 N- N T ν= 1 ν= 5 T
В итоге:
источник