Я пытался читать из разных источников, но мне все еще не ясно, какой тест будет уместным в моем случае. Есть три разных вопроса о моем наборе данных:
Испытуемые проверяются на инфекции от X в разное время. Я хочу знать, связана ли доля положительного для X после доли с положительным для X до:
After |no |yes| Before|No |1157|35 | |Yes |220 |13 | results of chi-squared test: Chi^2 = 4.183 d.f. = 1 p = 0.04082 results of McNemar's test: Chi^2 = 134.2 d.f. = 1 p = 4.901e-31
Насколько я понимаю, поскольку данные представляют собой повторные измерения, я должен использовать критерий Макнемара, который проверяет, изменилась ли доля положительных значений для X.
Но мои вопросы, похоже, нуждаются в тесте хи-квадрат - тестировании, если доля положительного по X после связана с долей положительного по X до.
Я даже не уверен, правильно ли я понимаю разницу между тестом Макнемара и хи-квадратом. Каков был бы правильный тест, если бы мой вопрос был: «Соотношение субъектов, зараженных Х, отличается от того, что было раньше?»
Аналогичный случай, но вместо измерения до и после я измеряю две разные инфекции в один момент времени:
Y |no |yes| X|No |1157|35 | |Yes |220 |13 |
Какой тест был бы здесь, если бы вопрос «Связаны ли более высокие пропорции одной инфекции с более высокими пропорциями Y»?
Если бы мой вопрос был «Связана ли инфекция Y в момент t2 с инфекцией X в момент t1?», Какой тест подойдет?
Y at t2 |no |yes| X at t1|No |1157|35 | |Yes |220 |13 |
Я использовал тест Макнемара во всех этих случаях, но я сомневаюсь, что это правильный тест для ответа на мои вопросы. Я использую R. Могу ли я использовать бином glm
? Будет ли это аналогично критерию хи-квадрат?
источник
Ответы:
Очень жаль, что тест МакНемара так труден для понимания людьми. Я даже замечаю, что в верхней части страницы в Википедии говорится, что людям сложно понять объяснение на этой странице. Типичное краткое объяснение критерия Макнемара: либо «критерий хи-квадрат» внутри субъекта, либо «критерий предельной однородности таблицы сопряженности». Я не нахожу ничего из этого очень полезным. Во-первых, неясно, что подразумевается под «хи-квадрат» внутри субъекта, потому что вы всегда измеряете свои предметы дважды (один раз для каждой переменной) и пытаетесь определить взаимосвязь между этими переменными. Кроме того, «предельная однородность» (К сожалению, даже этот ответ может сбивать с толку. Если это так, это может помочь прочитать мою вторую попытку ниже.)
Давайте посмотрим, сможем ли мы проработать процесс рассуждения о вашем лучшем примере, чтобы увидеть, можем ли мы понять, подходит ли (и если да, то почему) тест Макнемара. Вы положили:
Это таблица непредвиденных обстоятельств, поэтому она содержит анализ хи-квадрат. Более того, вы хотите понять взаимосвязь между и , и тест хи-квадрат проверяет связь между переменными, поэтому на первый взгляд кажется, что тест хи-квадрат должен быть анализ, который отвечает на ваш вопрос. е т е рБ е фо г е А Фт е р
Однако стоит отметить, что мы также можем представить эти данные так:
Когда вы смотрите на данные таким образом, вы можете подумать, что можете провести обычный старый тест. Но тест не совсем правильно. Есть две проблемы: во-первых, поскольку в каждой строке перечислены данные, измеренные по одному и тому же предмету, мы не хотели бы проводить тест между субъектами , мы хотели бы проводить тест внутри субъектов . Во-вторых, поскольку эти данные распределены в виде бинома , дисперсия является функцией среднего значения. Это означает, что нет никакой дополнительной неопределенности, о которой следует беспокоиться после оценки среднего значения выборки (т. Е. Вам не нужно впоследствии оценивать дисперсию), поэтому вам не нужно ссылаться на распределение, вы можете использоватьT т т т з з х 2 зT T T T Z распределение. (Более подробно об этом, это может помочь , чтобы прочитать мой ответ здесь: -test по сравнению с теста .) Таким образом, нам потребуется в-субъекты -test. То есть нам нужен внутри-предметный тест на равенство пропорций. Z χ2 Z
Мы видели, что существует два разных способа мышления и анализа этих данных (вызванные двумя разными взглядами на данные). Таким образом, мы должны решить, каким образом мы должны использовать. Тест хи-квадрат оценивает, являются ли и независимыми. То есть люди, которые болели заранее, чаще болеют потом, чем люди, которые никогда не болели. Очень трудно понять, как это не будет иметь место, учитывая, что эти измерения оцениваются на одних и тех же объектах. Если вы получили незначительный результат (как вы почти что), то это просто ошибка типа II. Вместо того, чтобы ие тБ е фо г е Б е е о р е е т е р т гА Фт е р Б е фо г е А Фт е р независимы, вы почти наверняка хотите знать, работает ли лечение (вопрос хи-квадрат не отвечает). Это очень похоже на любое количество исследований лечения и контроля, где вы хотите увидеть, равны ли средние значения, за исключением того, что в этом случае ваши измерения да / нет, и они относятся к субъектам. Рассмотрим более типичную -тесту ситуацию с артериального давления , измеренного до и после некоторой обработки. Те, чей bp был выше среднего по вашей выборке заранее, почти наверняка будут иметь тенденцию быть среди более высоких bps впоследствии, но вы не хотите знать о последовательности ранжирования, вы хотите знать, привело ли лечение к изменению среднего bp , Ваша ситуация здесь прямо аналогична. В частности, вы хотите запустить в пределах субъектаT Z тест на равенство пропорций. Вот что такое тест МакНемара.
Итак, поняв, что мы хотим провести тест Макнемара, как он работает? Провести тест между субъектами легко, но как нам запустить внутрисубъектную версию? Ключом к пониманию того, как выполнить проверку пропорций внутри предмета, является изучение таблицы сопряженности, которая разбивает пропорции:Z
B
1322035220/(
R
результатом.)Здесь еще одно обсуждение теста МакНемара с расширениями таблиц сопряженности, превышающими 2x2, здесь .
Вот
R
демо с вашими данными:Если бы мы не принимали во внимание характер ваших данных внутри объекта, у нас был бы чуть менее мощный тест на равенство пропорций:
То есть13 N= 2850 N= 1425
X-squared = 133.6627
вместоchi-squared = 134.2157
. В этом случае они очень мало отличаются, потому что у вас много данных, и только случаев перекрываются, как обсуждалось выше. (Другая, и более важная проблема здесь заключается в том, что при этом ваши данные учитываются дважды, т. вместо ) N = 2850 N = 1425Вот ответы на ваши конкретные вопросы:
Эта версия более хитрая, и выражение «действительно ли более высокие пропорции одной инфекции связаны с более высокими пропорциями Y» неоднозначно. Есть два возможных вопроса:
Поскольку это опять та же инфекция, конечно, они будут связаны. Я понимаю, что эта версия не до и после лечения, а только в какой-то более поздний момент времени. Таким образом, вы спрашиваете, изменяется ли уровень фоновой инфекции органически, что опять-таки является вполне обоснованным вопросом. В любом случае, правильный анализ - это тест Макнемара.Изменить: Кажется, я неправильно истолковал ваш третий вопрос, возможно, из-за опечатки. Теперь я интерпретирую это как две разные инфекции в двух разных временных точках. Согласно этой интерпретации, критерий хи-квадрат будет уместным.
источник
Ну, кажется, я сделал хэш этого. Позвольте мне попытаться объяснить это снова, по-другому, и мы посмотрим, может ли это помочь прояснить ситуацию.
Традиционный способ объяснить критерий Макнемара в сравнении с критерием хи-квадрат состоит в том, чтобы спросить, являются ли данные «парными», и рекомендовать тест МакНемара, если данные являются парными, и тест хи-квадрат, если данные «непарные». Я обнаружил, что это приводит к большой путанице (этот поток является примером!). Вместо этого я обнаружил, что наиболее полезно сосредоточиться на вопросе, который вы пытаетесь задать , и использовать тест, соответствующий вашему вопросу. Чтобы сделать это более конкретным, давайте посмотрим на вымышленный сценарий:
Вот данные:
На этом этапе важно выяснить, какой вопрос мы хотим задать из наших данных. Здесь можно задать три разных вопроса:
BP
иNationality
связаны или независимы;Наконец, мы могли бы задаться вопросом, равна ли доля статистиков с высоким кровяным давлением той доле статистиков США, с которой мы говорили. Это относится к предельным пропорциям таблицы. Они не печатаются по умолчанию в R, но мы можем получить их таким образом (обратите внимание, что в этом случае они точно такие же):
Как я уже сказал, традиционный подход, обсуждаемый во многих учебниках, заключается в определении того, какой тест использовать, основываясь на том, являются ли данные «парными» или нет. Но это очень запутанно, эта таблица непредвиденных обстоятельств "спарена"? Если мы сравниваем соотношение с высоким артериальным давлением между статистиками США и Великобритании, вы сравниваете две пропорции (хотя и с одной и той же переменной), измеренные для разных групп людей. С другой стороны, если вы хотите сравнить пропорцию с высоким кровяным давлением с долей США, вы сравниваете две пропорции (хотя и с разными переменными), измеренные для одного и того же набора людей. Эти данные оба«спаренный» и «непарный» одновременно (хотя и в отношении различных аспектов данных). Это приводит к путанице. Чтобы попытаться избежать этой путаницы, я утверждаю, что вы должны подумать о том, какой вопрос вы задаете. В частности, если вы хотите знать:
Кто-то может не согласиться со мной здесь, утверждая, что, поскольку таблица сопряженности не является «парной», критерий Макнемара не может быть использован для проверки равенства предельных пропорций и что вместо этого следует использовать критерий хи-квадрат. Так как это предмет спора, давайте попробуем оба, чтобы увидеть, имеют ли результаты смысл:
Тест хи-квадрат дает значение р приблизительно 0. То есть, он говорит, что вероятность получения данных как можно дальше или дальше от равных предельных пропорций, если предельные пропорции фактически были равны, по существу равна 0. Но предельные пропорции точно так же, , как мы видели выше! Результаты теста хи-квадрат просто не имеют никакого смысла в свете данных. С другой стороны, тест Макнемара дает p-значение 1. То есть, он говорит, что у вас будет 100% шанс найти предельные пропорции, близкие к равенству или дальше от равенства, если истинные предельные пропорции равны. Поскольку наблюдаемые предельные пропорции не могут быть ближе к равным, чем они есть, этот результат имеет смысл.50 % = 50 %
Давайте попробуем другой пример:
В этом случае предельные пропорции очень разные, . Давайте попробуем два теста еще раз, чтобы увидеть, как их результаты сравниваются с наблюдаемой большой разницей в предельных пропорциях:97,5 % ≫ 50 %
На этот раз критерий хи-квадрат дает значение p, равное 1, что означает, что предельные пропорции равны, насколько они могут быть. Но мы увидели, что предельные пропорции явно не равны, поэтому этот результат не имеет никакого смысла в свете наших данных. С другой стороны, критерий Макнемара дает p-значение приблизительно 0. Другими словами, крайне маловероятно получить данные с предельными пропорциями, столь же далекими от равенства, как эти, если они действительно равны в популяции. Поскольку наши наблюдаемые предельные пропорции далеко не равны, этот результат имеет смысл.
Тот факт, что тест хи-квадрат дает результаты, которые не имеют смысла, учитывая наши данные, говорит о том, что с использованием теста хи-квадрат здесь что-то не так. Конечно, тот факт, что тест Макнемара дал ощутимые результаты, не доказывает, что он действителен, возможно, это было просто совпадение, но критерий хи-квадрат явно ошибочен.
Давайте посмотрим, сможем ли мы проработать аргумент о том, почему тест МакНемара может быть правильным. Я буду использовать третий набор данных:
На этот раз мы хотим сравнить с и задаться вопросом, могли ли бы те же самые предельные пропорции в населении быть одинаковыми. Поскольку мы сравниваем две пропорции, наиболее интуитивным вариантом будет использование z-критерия равенства двух пропорций. Мы можем попробовать это здесь: 62,5 %51,25 % 62,5 %
(Чтобы использовать
prop.test()
для проверки предельных пропорций, мне пришлось вручную вводить числа «успехов» и общее количество «испытаний», но из последней строки выходных данных видно, что пропорции правильные.) Это говорит о том, что маловероятно, чтобы предельные пропорции были настолько далеки от равенства, если бы они были фактически равны, учитывая количество данных, которые у нас есть.Этот тест действителен? Здесь есть две проблемы: Тест полагает, что у нас есть 800 данных, тогда как у нас фактически только 400. Этот тест также не учитывает, что эти две пропорции не являются независимыми, в том смысле, что они были измерены на тех же людях.
Посмотрим, сможем ли мы разобрать это на части и найти другой путь. Из таблицы непредвиденных обстоятельств мы можем видеть, что предельные пропорции: То, что мы видим здесь, это то, что американских статистиков с высоким кровяным давлением обнаруживаются в обоих предельных пропорциях. Они оба учитываются дважды и не дают никакой информации о различиях в предельных пропорциях. Более того, общее количество отображается в обоих знаменателях. Вся уникальная и отличительная информация содержится в двух недиагональных ячейках ( и
1904001560π=.5
В этой версии используются только информативные наблюдения, и они не учитываются дважды. Здесь значение р намного меньше, 0,0000001588, что часто бывает, когда учитывается зависимость в данных. То есть этот тест является более мощным, чем z-тест разности пропорций. Далее мы можем видеть, что вышеприведенная версия по сути такая же, как тест МакНемара:
Если неидентичность вводит в заблуждение, критерий Макнемара, как правило, и в R возводит в квадрат результат и сравнивает его с распределением хи-квадрат, которое не является точным тестом, подобным приведенному выше биному:
Таким образом, если вы хотите проверить, что предельные пропорции таблицы сопряженности равны, тест Макнемара (или точный биномиальный тест, вычисленный вручную) является правильным. Он использует только соответствующую информацию без незаконного использования каких-либо данных дважды. Это не просто «результат», чтобы получить результаты, которые имеют смысл данных.
Я продолжаю верить, что попытка выяснить, является ли таблица непредвиденных обстоятельств «парной», бесполезна. Я предлагаю использовать тест, который соответствует вопросу, который вы задаете для данных.
источник
Например, у вас может быть выборка из 20 статистиков из США и отдельная независимая выборка из 37 статистиков из Великобритании, и вы можете измерить, являются ли эти статистики гипертоническими или нормотензивными. Ваша нулевая гипотеза состоит в том, что как британские, так и американские статистики имеют одинаковую базовую вероятность развития гипертонии (т. Е. Знание того, кто из США или Великобритании, ничего не говорит о вероятности гипертонии). Конечно, возможно, что у вас может быть одинаковый размер выборки в каждой группе, но это не меняет факт независимости выборок (то есть непарных ).
Например, у вас могут быть индивидуально подобранные данные исследования «случай-контроль», взятые из международной конференции статистиков, где 30 статистиков с артериальной гипертензией (случаи) и 30 статистиков без артериальной гипертензии (контроли; индивидуально подбираются по возрасту, полу, ИМТ и статусу курения). в особых случаях), ретроспективно оцениваются на предмет профессионального проживания в Великобритании по сравнению с местом проживания в другом месте. Нулевым является то, что вероятность проживания в Великобритании среди случаев совпадает с вероятностью проживания в Великобритании в качестве контроля (то есть, что знание о своем гипертоническом статусе ничего не говорит об истории проживания в Великобритании).
Кроме того, в вашем примере ваши данные являются парными (одна и та же переменная, измеренная дважды для одного и того же субъекта), и поэтому тест Макнемара является подходящим выбором теста для ассоциации.
[Gung и я некоторое время не соглашались с более ранним ответом.]
Цитируемые ссылки
«Предполагая, что мы все еще заинтересованы в сравнении пропорций, что мы можем сделать, если наши данные являются парными, а не независимыми? ... В этой ситуации мы используем тест Макнемара». - Пагано и Говро, Принципы биостатистики , 2-й издание, стр. 349. [ Акцент сделан ]
«Выражение более известно как статистика теста согласованных пар McNemar (McNemar, 1949) и является основой анализа согласованных пар », - Ротман, Гренландия и Лэш. Современная эпидемиология , стр. 286. [ Выделение подчеркнуто ]
«Парный t- тест и повторные измерения дисперсионного анализа могут быть использованы для анализа экспериментов, в которых изучаемая переменная может быть измерена в интервальной шкале (и удовлетворяет другим предположениям, требуемым для параметрических методов). Как насчет экспериментов, аналогичных тем в главе 5, где результат измеряется по номинальной шкале? Эта проблема часто возникает, когда спрашивают, ответил ли человек на лечение или сравнивают результаты двух разных диагностических тестов, которые классифицированы как положительные или отрицательные у одних и тех же людей. Мы разработаем процедуру для анализа таких экспериментов, тест Макнемара на изменения , в контексте одного такого исследования ". - Гланц, Учебник по биостатистикеχ2
«Для сопоставленных данных« случай-контроль »с одним контролем на случай анализ результатов прост, и соответствующим статистическим тестом является критерий хи-квадрат Макнемара ... обратите внимание, что для расчета как отношения шансов, так и статистики, единственные вкладчики это пары, которые являются разрозненными в воздействии , то есть пары, где случай был раскрыт, но контроль не был, и те, где контроль был выставлен, но случай не был ". - Элвуд. Критическая оценка эпидемиологических исследований и клинических испытаний , 1-е издание, стр. 189–190. [ Акцент добавлен ]
источник
Мое понимание теста Макнемара следующее: оно используется для того, чтобы увидеть, оказало ли вмешательство существенное влияние на бинарный результат. В вашем примере группа субъектов проверяется на наличие инфекции, и ответ записывается как да или нет. Все субъекты затем получают некоторое вмешательство, скажем, антибиотик. Затем они снова проверяются на наличие инфекции, и ответ снова записывается как да / нет. Ответы (пары) могут быть помещены в таблицу соответствия:
И тест Макнемара подойдет для этого.
Из таблицы видно, что гораздо больше из «да» перешло в «нет» (220 / (220 + 13) или 94,4%), чем из «нет» в «да» (35 / (1157 + 35) или 2,9 %). Учитывая эти пропорции, значение P Макнемара (4.901e-31) представляется более правильным, чем значение P хи-квадрат (0.04082).
Если в таблице соответствия указаны 2 разные инфекции (вопрос 2), то хи-квадрат будет более уместным.
Ваш третий вопрос неоднозначен: сначала вы указываете связь Y в момент t2 с Y в момент t1, но в таблице вы пишете «X» в момент времени t1 против Y в момент времени t2. Y в момент времени t2 против Y в момент времени t1 совпадает с вашим первым вопросом, и поэтому необходим тест МакНемара, в то время как значения X в момент времени t1 и Y в момент времени t2 указывают на сравнение различных событий, и, следовательно, хи-квадрат будет более подходящим.
Редактировать: Как упомянуто Алексис в комментарии, сопоставленные данные контроля случая также анализируются тестом Макнемара. Например, 1425 больных раком набираются для исследования, и для каждого пациента также подбирается соответствующий контроль. Все эти (1425 * 2) проверены на наличие инфекции. Результаты каждой пары могут быть показаны по аналогичной таблице:
Более четко:
Это показывает, что больной раком гораздо чаще заражался инфекцией, а контроль - нет, а не наоборот. Его значение может быть проверено тестом Макнемара.
Если эти пациенты и контроли не были сопоставлены и независимы, можно только составить следующую таблицу и выполнить критерий квадратуры:
Более четко:
Обратите внимание, что эти числа совпадают с полями первой таблицы:
Это должно быть причиной использования таких терминов, как «предельные частоты» и «предельная однородность» в тесте Макнемара.
Интересно, что функция addmargins также может помочь решить, какой тест использовать. Если общая сумма составляет половину от числа наблюдаемых объектов (что указывает на спаривание), тогда применяется критерий Макнемара, в противном случае уместен критерий чисел:
Коды R для таблиц выше приведены в ответах выше:
Следующий псевдокод также может помочь узнать разницу:
Редактировать:
mid-p
интересен вариант проведения теста Макнемара ( https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3716987/ ). Он сравниваетb
иc
таблицу непредвиденных обстоятельств, т.е. число, которое изменилось с «да» на «нет», и число, которое изменилось с «нет» на «да» (игнорируя число тех, кто оставался «да» или «нет» в ходе исследования). Это может быть выполнено с использованием биномиального теста в Python, как показано на https://gist.github.com/kylebgorman/c8b3fb31c1552ecbaafbЭто может быть эквивалентно тому, что
binom.test(b, b+c, 0.5)
при случайном изменении можно ожидать,b
что оно будет равноc
.источник