Сила леди, дегустирующая чайный эксперимент

9

В известном эксперименте Фишера наблюдаемый является количеством скорректированного отгаданнога чашки имеющим два виду чашки и . Обычно интересно вычислить критическую область, чтобы отвергнуть нулевую гипотезу (дама случайным образом угадывает), учитывая размер теста . Это легко сделать с помощью гипергеометрического распределения. Таким же образом я могу вычислить размер теста с учетом критической области.kABα

Другой вопрос: как рассчитать мощность теста, учитывая альтернативную гипотезу? Предположим, например, что дама способна правильно с вероятностью угадать на одной чашке ( ). Какова мощность теста, если предположить, что общее количество чашек равно а общее количество чашек одного вида ? (К сожалению) дама знает .p=90%P(guessA|trueA)=P(guess B|true B)=0.9N=8n=N/2=4n

Другими словами: каково распределение (количество правильных чашек согласно альтернативной гипотезе), если женщина знает, что существует чашек одного вида?k=n

Руджеро Турра
источник
Подумайте о своем посте ... Если Фишер решил отказаться от нуля, только если дама была права во всех своих догадках (я думаю, что так и было), и есть только один возможный способ сделать все кубки правильными, не стоит вероятность того, что это будет фактическая мощность? 0.94=0.6561
Антони Пареллада
Вы не отказываетесь, когда она угадывает все чашки в целом. Но это правда, что с это критическая область. Вы не принимаете во внимание, что леди знает, что есть 4 чашки каждого типа. Кстати меня интересует общее решениеN=8N8
Ruggero Turra
1
Это интересная, но сложная проблема. Легко определить таблицы, которые приведут к отклонению Ho, но нужно подумать о вероятности увидеть эти таблицы под Ha. В следующей статье рассчитывается мощность для слегка модифицированной таблицы с заданной чувствительностью и специфичностью: «Обобщение процедуры« Дегустация чая », чтобы связать качественные и количественные подходы в психиатрических исследованиях», автор Falissard et al. Я не уверен, что расчеты верны. Если у вас действительно есть биноминальная проблема, то вы можете использовать пакет Exact R, но это другая проблема, о которой вы спрашиваете
Питер Калхун

Ответы:

3

Согласно альтернативе, дама не случайно угадывает, но «не случайно угадывает» охватывает бесконечность различных ситуаций. Она всегда может угадать идеально, или она может сделать только немного лучше, чем случайное угадывание ... и в общем случае нет даже "случайной" шкалы с одной переменной, чтобы работать случайно (так что у нас даже нет силы кривой, если мы не ограничиваем виды неслучайных ответов, которые она может дать).

Таким образом, чтобы вычислить мощность, мы должны быть очень конкретными о том, как она неслучайна (и насколько она неслучайна именно таким образом).

Мы могли бы предположить, например, что она получает ощущение того, насколько каждая чашка имеет вкус, как молоко было добавлено первым - индекс «молочности», который является случайной величиной на который имеет другое (более высокое) среднее, когда молоко добавляется первым - например, мы можем предположить, что оно, скажем, нормальное или логоистическое, со средним значением и дисперсией ( известно как " точность "), когда молоко добавляется в последнюю очередь, и означает и дисперсию когда молоко добавляется первым (действительно, более простая, но более ограничительная презумпция может состоять в том, чтобы установить, скажем,(,)μ0σ2=1/ω2ω2μ1σ2μ1=μ0=1так что теперь все зависит от одной переменной (точности). Таким образом, для любых заданных значений этих параметров мы могли бы вычислить вероятность того, что она получит правильные все 8 чашек (что четыре наименьших значения «молочности», которые она испытывает, связаны с четырьмя чашками со второй молоком); если точный расчет был для нас слишком сложным, мы могли бы смоделировать его с любой желаемой точностью. [В случае, когда предполагается, что неслучайность является функцией только одной переменной, мы получили бы кривую степени - значение мощности для каждого значения параметра.]

Это один конкретный тип модели того, как она может работать «лучше, чем случайный», с помощью которой мы можем указать параметры и получить значение для мощности.

Конечно, мы могли бы предположить много других форм неслучайности, кроме этой.

Glen_b - Восстановить Монику
источник
3

Распределение правильного числа догадок согласно альтернативной гипотезе следует нецентральному гипергеометрическому распределению , которое параметризуется в терминах отношения шансов, то есть насколько выше шансы, что дама будет угадывать «чай первым», когда в Фактически, чай был действительно добавлен первым, в отличие от того, когда на самом деле молоко было добавлено первым (или наоборот). Если отношение шансов равно 1, то мы получаем центральное гипергеометрическое распределение.

Посмотрим, работает ли это. Я буду использовать R в целях иллюстрации, используя MCMCpackпакет, который имеет функцию dnoncenhypergeom()для вычисления плотности (нецентрального) гипергеометрического распределения. Он имеет аргументы xдля правильного количества догадок (осторожно: это правильное количество догадок при одном из двух условий, например, когда чай был действительно добавлен первым), аргументы n1, n2и m1для трех из четырех краев, а также psiдля истинное соотношение шансов. Давайте вычислим плотность для xзначений от 0 до 4 (со всеми полями, равными 4), когда истинное отношение шансов равно 1:

install.packages("MCMCpack")
library(MCMCpack)
sapply(0:4, function(x) dnoncenhypergeom(x, n1=4, n2=4, m1=4, psi=1))

Это дает:

[1] 0.01428571 0.22857143 0.51428571 0.22857143 0.01428571

Таким образом, есть вероятность 1,43%, что дама сделает 8 правильных предположений (т.е. она угадывает все 4 чашки правильно, где чай был добавлен первым, и, следовательно, она также угадывает все 4 чашки правильно, где молоко было добавлено первым) при нулевой гипотезе. На самом деле это количество доказательств, которые Фишер считал достаточными, чтобы отвергнуть нулевую гипотезу.

Вероятности, указанные в вопросе, могут быть использованы для вычисления отношения шансов, а именно (то есть ). Какова вероятность того, что дама угадает все 8 чашек правильно (то есть она угадает все 4 чашки правильно, где чай был добавлен первым, а следовательно, и 4 чашки правильно, где молоко было добавлено первым)?коэффициент ( предположение A | истинный A ) / коэффициент ( предположение A | истинный B )(.90/(1.90))/(.10/(1.10))=81odds(guessA|trueA)/odds(guessA|trueB)

dnoncenhypergeom(4, n1=4, n2=4, m1=4, psi=81)

Это дает:

[1] 0.8312221

Таким образом, мощность составляет около 83% тогда.

Wolfgang
источник