Я провожу тест на соответствие критерию хи-квадрат (GOF) с тремя категориями и специально хочу проверить нулевое, что пропорции населения в каждой категории равны (то есть пропорция составляет 1/3 в каждой группе):
НАБЛЮДЕННЫЕ ДАННЫЕ
Группа 1 Группа 2 Группа 3 Всего
686 928 1012 2626
Таким образом, для этого теста GOF ожидаемые значения составляют 2626 (1/3) = 875,333, и тест дает очень значимое p- значение <0,0001.
Теперь очевидно, что группа 1 значительно отличается от 2 и 3, и вряд ли 2 и 3 значительно отличаются. Тем не менее, если бы я хотел проверить все это формально и быть в состоянии предоставить p- значение для каждого случая, какой метод будет подходящим?
Я искал по всему онлайн, и, кажется, есть разные мнения, но без официальной документации. Мне интересно, есть ли текст или рецензируемый документ, который обращается к этому.
Мне кажется разумным, в свете значительного общего теста, провести z- тесты на разницу в каждой паре пропорций, возможно, с поправкой на значение (например, Bonferroni).
Ответы:
К моему удивлению, пара поисков, похоже, не привела к предварительному обсуждению вопроса о пригодности; Я предполагаю, что, возможно, где-то здесь есть один, но так как я не могу найти его легко, я думаю, что разумно превратить мои комментарии в ответ, чтобы люди могли по крайней мере найти это, используя те же самые поисковые термины, которые я только что использовал.
Парные сравнения, которые вы стремитесь выполнить (при условии сравнения только двух участвующих групп), имеют смысл.
Это равносильно взятию групповых пар и проверке, отличается ли пропорция в одной из групп от 1/2 (тест пропорций одной выборки). Это, как вы предлагаете, может быть выполнено в виде z-теста (хотя биномиальный тест и добротность хи-квадрат также подойдут).
Многие из обычных подходов к работе с общей частотой ошибок типа I должны работать здесь (включая Bonferroni - наряду с обычными проблемами, которые могут идти с этим).
источник
so you suggest compare 16 and 14 against 15/15
@ Никср, нет. Глен сравнивает две группы в50/50
процентах. 3-я группа исключена из сравнения.У меня была такая же проблема (и был счастлив найти этот пост). Я также нашел короткую заметку по этому вопросу в Sheskin (2003: 225), которой я просто хотел поделиться:
«Другим типом сравнения, которое можно провести, является сравнение двух исходных шести ячеек друг с другом. В частности, давайте предположим, что мы хотим сравнить ячейку l / понедельник с ячейкой 2 / вторник [...] Обратите внимание, что в Приведенный выше пример, поскольку мы используем только две ячейки, вероятность для каждой ячейки будет равна π_i = 1/2. Ожидаемая частота каждой ячейки получается умножением π_i = 1/2 на общее количество наблюдений в двух ячейках (которое равно 34). Как отмечалось ранее, при проведении сравнения, такого как приведенное выше, критический вопрос, который должен решить исследователь, заключается в том, какую ценность альфа использовать при оценке нулевой гипотезы ».
Шескин Д.Ю. 2003. Справочник по параметрическим и непараметрическим статистическим процедурам: третье издание. CRC Press.
источник