Я пытаюсь найти решение для сравнения двух тестов "хи-квадрат". Точнее, я хочу сравнить результаты двух независимых экспериментов. В этих экспериментах авторы использовали хи-квадрат добротности, чтобы сравнить случайное предположение (ожидаемые частоты) с наблюдаемыми частотами. Два эксперимента получили одинаковое количество участников, и экспериментальные процедуры идентичны, только стимулы изменены. Результаты двух экспериментов показали значительный хи-квадрат (эксп. 1: X² (18) = 45; р <.0005 и эксп. 2: X² (18) = 79; р <.0001).
Теперь я хочу проверить, есть ли разница между этими двумя результатами. Я думаю, что решением может быть использование доверительных интервалов, но я не знаю, как рассчитать эти доверительные интервалы только с этими результатами. Или, может быть, тест для сравнения размера эффекта (W Коэна)?
У кого-нибудь есть решение?
Большое спасибо!
FD
источник
Ответы:
Очень ограниченная информация, которую вы имеете, безусловно, является серьезным ограничением! Однако вещи не совсем безнадежны.
При тех же предположениях, которые приводят к асимптотическому распределению для тестовой статистики одноименного теста на соответствие, тестовая статистика в рамках альтернативной гипотезы имеет асимптотически нецентральное распределение χ 2 . Если мы предположим, что два стимула а) значимы и б) имеют одинаковый эффект, соответствующая статистика теста будет иметь такое же асимптотическое нецентральное распределение χ 2 . Мы можем использовать это , чтобы построить тест - в основном, путем оценки параметра смещенности Л и , видя ли статистические данные испытаний далеко в хвостах нецентральном х 2 ( 18 , λ )χ2 χ2 χ2 λ χ2( 18 , λ^) распределение. (Это не значит, что этот тест будет иметь большую силу.)
Мы можем оценить параметр нецентральности, исходя из двух тестовых статистик, взяв их среднее значение и вычтя степени свободы (методы оценки моментов), получив оценку 44 или по максимальной вероятности:
Хорошее согласие между нашими двумя оценками, не удивительно, учитывая две точки данных и 18 степеней свободы. Теперь для расчета p-значения:
Таким образом, наше p-значение равно 0,12, что недостаточно, чтобы отвергнуть нулевую гипотезу о том, что два стимула одинаковы.
что дает следующее:
Глядя на истинные нулевые точки гипотезы (значение по оси x = 0), мы видим, что тест является консервативным, поскольку он не отклоняется так часто, как указывал бы уровень, но в подавляющем большинстве случаев так. Как мы и ожидали, у него мало силы, но лучше, чем ничего. Интересно, есть ли лучшие тесты, учитывая очень ограниченный объем имеющейся у вас информации?
источник
Вы можете получить V Крамера, который интерпретируется как корреляция, преобразовать его в Z Фишера, и тогда доверительный интервал будет простым (SE = 1 / sqrt (n-3): Z ± se * 1,96). После того, как вы получите концы CI, вы можете преобразовать их обратно в r.
Рассматривали ли вы все свои показатели в таблице на случай непредвиденных обстоятельств с дальнейшим измерением эксперимента?
источник