Краткое содержание
Почему логистическая регрессия (с коэффициентами вероятности) чаще используется в когортных исследованиях с бинарными исходами, а не с пуассоновской регрессией (с относительными рисками)?
Задний план
Курсы по статистике и эпидемиологии для студентов и аспирантов, по моему опыту, обычно преподают, что логистическая регрессия должна использоваться для моделирования данных с бинарными результатами, а оценки риска представлены как отношения шансов.
Однако регрессия Пуассона (и связанная с ней: квази-Пуассон, отрицательный биномиал и т. Д.) Также может использоваться для моделирования данных с бинарными результатами и с помощью соответствующих методов (например, надежной оценки сэндвич-дисперсии) обеспечивает достоверные оценки риска и уровни достоверности. Например,
- Гренландия С. Модельная оценка относительных рисков и других эпидемиологических мер в исследованиях общих исходов и в исследованиях случай-контроль , Am J Epidemiol. 2004 год 15 августа; 160 (4): 301-5.
- Зу Г., Модифицированный подход Пуассона регрессии к проспективным исследованиям с бинарными данными , Am J Epidemiol. 1 апреля 2004 года; 159 (7): 702-6.
- Zou GY и Donner A. Распространение модифицированной модели регрессии Пуассона на проспективные исследования с коррелированными двоичными данными , Stat Methods Med Res. 2011 ноя 8.
Из регрессии Пуассона можно сообщать об относительных рисках, которые, как утверждают некоторые, легче интерпретировать по сравнению с коэффициентами вероятности, особенно для частых исходов, особенно для лиц без значительного опыта в статистике. См. Чжан Дж. И Ю. К.Ф., Каков относительный риск? Метод коррекции отношения шансов в когортных исследованиях общих исходов , JAMA. 1998 18 ноября; 280 (19): 1690-1.
Из чтения медицинской литературы, среди когортных исследований с бинарными исходами, кажется, что все еще гораздо чаще сообщать отношения шансов от логистических регрессий, а не относительные риски от регрессий Пуассона.
Вопросов
Для когортных исследований с бинарными результатами:
- Есть ли веские основания сообщать о коэффициентах вероятности от логистических регрессий, а не об относительных рисках от регрессий Пуассона?
- Если нет, то можно ли объяснить частоту пуассоновских регрессий с относительными рисками в медицинской литературе главным образом из-за несоответствия между методологической теорией и практикой среди ученых, клиницистов, статистиков и эпидемиологов?
- Должны ли промежуточные курсы по статистике и эпидемиологии включать дополнительное обсуждение регрессии Пуассона для бинарных результатов?
- Должен ли я поощрять студентов и коллег к рассмотрению регрессии Пуассона над логистической регрессией, когда это уместно?
exp(beta_M1) =/= 1/exp(beta_M2)
). Это беспокоит меня совсем немного.Ответы:
Ответ на все четыре ваших вопроса, перед которыми стоит примечание:
В современных исследованиях по эпидемиологии не так часто встречается сообщение о соотношении шансов из логистической регрессии для когортного исследования. Остается регрессионный метод выбора для исследований случай-контроль, но более сложные методы в настоящее время стандартом де - факто для анализа в крупных эпидемиологических журналах , как эпидемиология , AJE или IJE, У них будет большая тенденция появляться в клинических журналах, сообщающих о результатах обсервационных исследований. Также будут некоторые проблемы, потому что регрессию Пуассона можно использовать в двух контекстах: то, на что вы ссылаетесь, где она заменяет модель биномиальной регрессии, и в контексте времени до события, что чрезвычайно характерно для когорты. исследования. Подробнее в ответах на конкретный вопрос:
Для когортного исследования на самом деле нет. Есть несколько крайне специфических случаев, когда, скажем, кусочно-логистическая модель могла быть использована, но это выбросы. Весь смысл когортного исследования заключается в том, что вы можете напрямую измерить относительный риск или множество связанных показателей, и вам не нужно полагаться на отношение шансов. Однако я сделаю два замечания: регрессия Пуассона часто оценивает скорость, а не риск, и, следовательно, оценка эффекта от него часто будет отмечаться как коэффициент коэффициента (в основном, на мой взгляд, вы все еще можете сократить его RR) или коэффициент плотности заболеваемости (IRR или IDR). Поэтому убедитесь, что в своем поиске вы действительно ищете правильные термины: существует множество когортных исследований с использованием методов анализа выживаемости. Для этих исследований регрессия Пуассона делает некоторые предположения, которые являются проблематичными, в частности, что опасность постоянна. Таким образом, гораздо чаще анализировать когортное исследование с использованием моделей пропорциональных рисков Кокса, а не моделей Пуассона, и сообщать о следующем соотношении рисков (ЧСС). Если нажать на название метода «по умолчанию», с помощью которого можно анализировать когорту, я бы сказал, что в эпидемиологии доминирует модель Кокса. У этого есть свои проблемы, и некоторые очень хорошие эпидемиологи хотели бы изменить это,
Есть две вещи, которые я мог бы приписать нечастости - нечастость, которую я не обязательно думаю, существует в той степени, в которой вы предлагаете. Во-первых, да - «эпидемиология» как область не совсем закрыта, и вы получаете огромное количество работ от врачей, социологов и т. Д., А также от эпидемиологов разного статистического происхождения. Логистическая модель обычно преподается, и, по моему опыту, многие исследователи обращаются к знакомому инструменту, а не к лучшему.
Второе - это вопрос о том, что вы подразумеваете под «когортным» исследованием. Что-то вроде модели Кокса или модели Пуассона требует фактической оценки времени человека. Можно получить когортное исследование, которое следует за несколько закрытой популяцией в течение определенного периода - особенно в ранних примерах «Intro to Epi», где методы выживания, такие как модели Пуассона или Кокса, не так полезны. Логистическая модель можетиспользоваться для оценки отношения шансов, которое при достаточно низкой распространенности заболевания приближается к относительному риску. Другие методы регрессии, которые непосредственно оценивают ее, такие как биномиальная регрессия, имеют проблемы сходимости, которые могут легко расстроить нового ученика. Имейте в виду, что в цитируемых вами работах Зоу используются методы регрессии Пуассона, чтобы обойти проблемы сходимости биномиальной регрессии. Но биномиально подходящие когортные исследования на самом деле представляют собой небольшой кусочек «когортного пирога».
Да. Откровенно говоря, методы анализа выживания должны появиться раньше, чем они часто делают. Моя любимая теория состоит в том, что причина этого не в том, что такие методы, как логистическая регрессия, легче кодировать . Методы, которые легче кодировать, но сопровождаются гораздо большими предостережениями относительно обоснованности их оценок воздействия, рассматриваются как «базовый» стандарт, что является проблемой.
Вы должны поощрять студентов и коллег использовать соответствующий инструмент. В целом для области, я думаю, вам, вероятно, было бы лучше предложить рассмотреть модель Кокса, а не регрессию Пуассона, поскольку большинство рецензентов быстро (и должны) выразить обеспокоенность по поводу предположения о постоянной опасности. Но да, чем раньше вы сможете отвести их от вопроса «Как мне сформулировать мой вопрос в модели логистической регрессии?» тем лучше мы все будем. Но да, если вы смотрите на исследование без времени, студенты должны быть ознакомлены как с биномиальной регрессией, так и с альтернативными подходами, такими как регрессия Пуассона, которые можно использовать в случае проблем сходимости.
источник
Я также размышляю о распространенности логистических моделей в литературе, когда модель относительного риска была бы более подходящей. Мы, как статистики, слишком хорошо знакомы с соблюдением соглашений или с «выпадающим меню». Это создает гораздо больше проблем, чем решает. Логистическая регрессия преподается как «стандартный готовый инструмент» для анализа бинарных результатов, когда у человека есть тип «да / нет», такой как смерть или инвалидность.
Регресс Пуассона часто преподается как метод анализа подсчетов . Несколько подчеркивается, что такая вероятностная модель работает исключительно хорошо для моделирования результатов 0/1, особенно когда они редки. Тем не менее, логистическая модель также хорошо применяется с редкими исходами: отношение шансов является приблизительно отношением риска, даже с выборкой, зависящей от результата, как в исследованиях типа «случай-контроль». Чего нельзя сказать об относительном риске или моделях Пуассона.
Модель Пуассона также полезна, когда люди могут иметь «результат» более одного раза, и вас может заинтересовать совокупная заболеваемость, такая как вспышка герпеса, госпитализация или рак молочной железы. По этой причине возведенные в степень коэффициенты можно интерпретировать как относительные показатели . Чтобы обозначить разницу между показателями и рисками: если имеется 100 случаев на 1000 человеко-лет, но все 100 случаев произошли в одном человеке, заболеваемость (показатель) по-прежнему составляет 1 случай на 10 человеко-лет. В условиях оказания медицинской помощи вам все равно необходимо вылечить 100 случаев, а вакцинация 80% людей имеет снижение заболеваемости на 80% (априори). Однако риск хотя бы одного исхода составляет 1/1000. Характер результата и вопрос вместе определяют, какая модель является подходящей.
Между прочим, статья Чжана предоставляет предвзятую оценку логического вывода, основанную на оценке относительного риска, которая не учитывает изменчивость термина перехвата. Вы можете исправить оценку, начав загрузку.
Чтобы ответить на конкретные вопросы:
2,3. Я думаю, что вы обвиняете и предполагаете слишком много о том, что происходит в медицинских обзорах и академиках.
http://biostats.bepress.com/cgi/viewcontent.cgi?article=1128&context=uwbiostat
источник