В известном эксперименте Фишера наблюдаемый является количеством скорректированного отгаданнога чашки имеющим два виду чашки и . Обычно интересно вычислить критическую область, чтобы отвергнуть нулевую гипотезу (дама случайным образом угадывает), учитывая размер теста . Это легко сделать с помощью гипергеометрического распределения. Таким же образом я могу вычислить размер теста с учетом критической области.
Другой вопрос: как рассчитать мощность теста, учитывая альтернативную гипотезу? Предположим, например, что дама способна правильно с вероятностью угадать на одной чашке ( ). Какова мощность теста, если предположить, что общее количество чашек равно а общее количество чашек одного вида ? (К сожалению) дама знает .
Другими словами: каково распределение (количество правильных чашек согласно альтернативной гипотезе), если женщина знает, что существует чашек одного вида?
источник
Ответы:
Согласно альтернативе, дама не случайно угадывает, но «не случайно угадывает» охватывает бесконечность различных ситуаций. Она всегда может угадать идеально, или она может сделать только немного лучше, чем случайное угадывание ... и в общем случае нет даже "случайной" шкалы с одной переменной, чтобы работать случайно (так что у нас даже нет силы кривой, если мы не ограничиваем виды неслучайных ответов, которые она может дать).
Таким образом, чтобы вычислить мощность, мы должны быть очень конкретными о том, как она неслучайна (и насколько она неслучайна именно таким образом).
Мы могли бы предположить, например, что она получает ощущение того, насколько каждая чашка имеет вкус, как молоко было добавлено первым - индекс «молочности», который является случайной величиной на который имеет другое (более высокое) среднее, когда молоко добавляется первым - например, мы можем предположить, что оно, скажем, нормальное или логоистическое, со средним значением и дисперсией ( известно как " точность "), когда молоко добавляется в последнюю очередь, и означает и дисперсию когда молоко добавляется первым (действительно, более простая, но более ограничительная презумпция может состоять в том, чтобы установить, скажем,(−∞,∞) μ0 σ2=1/ω2 ω2 μ1 σ2 μ1=−μ0=1 так что теперь все зависит от одной переменной (точности). Таким образом, для любых заданных значений этих параметров мы могли бы вычислить вероятность того, что она получит правильные все 8 чашек (что четыре наименьших значения «молочности», которые она испытывает, связаны с четырьмя чашками со второй молоком); если точный расчет был для нас слишком сложным, мы могли бы смоделировать его с любой желаемой точностью. [В случае, когда предполагается, что неслучайность является функцией только одной переменной, мы получили бы кривую степени - значение мощности для каждого значения параметра.]
Это один конкретный тип модели того, как она может работать «лучше, чем случайный», с помощью которой мы можем указать параметры и получить значение для мощности.
Конечно, мы могли бы предположить много других форм неслучайности, кроме этой.
источник
Распределение правильного числа догадок согласно альтернативной гипотезе следует нецентральному гипергеометрическому распределению , которое параметризуется в терминах отношения шансов, то есть насколько выше шансы, что дама будет угадывать «чай первым», когда в Фактически, чай был действительно добавлен первым, в отличие от того, когда на самом деле молоко было добавлено первым (или наоборот). Если отношение шансов равно 1, то мы получаем центральное гипергеометрическое распределение.
Посмотрим, работает ли это. Я буду использовать R в целях иллюстрации, используя
MCMCpack
пакет, который имеет функциюdnoncenhypergeom()
для вычисления плотности (нецентрального) гипергеометрического распределения. Он имеет аргументыx
для правильного количества догадок (осторожно: это правильное количество догадок при одном из двух условий, например, когда чай был действительно добавлен первым), аргументыn1
,n2
иm1
для трех из четырех краев, а такжеpsi
для истинное соотношение шансов. Давайте вычислим плотность дляx
значений от 0 до 4 (со всеми полями, равными 4), когда истинное отношение шансов равно 1:Это дает:
Таким образом, есть вероятность 1,43%, что дама сделает 8 правильных предположений (т.е. она угадывает все 4 чашки правильно, где чай был добавлен первым, и, следовательно, она также угадывает все 4 чашки правильно, где молоко было добавлено первым) при нулевой гипотезе. На самом деле это количество доказательств, которые Фишер считал достаточными, чтобы отвергнуть нулевую гипотезу.
Вероятности, указанные в вопросе, могут быть использованы для вычисления отношения шансов, а именно (то есть ). Какова вероятность того, что дама угадает все 8 чашек правильно (то есть она угадает все 4 чашки правильно, где чай был добавлен первым, а следовательно, и 4 чашки правильно, где молоко было добавлено первым)?коэффициент ( предположение A | истинный A ) / коэффициент ( предположение A | истинный B )(.90/(1−.90))/(.10/(1−.10))=81 odds(guessA|trueA)/odds(guessA|trueB)
Это дает:
Таким образом, мощность составляет около 83% тогда.
источник