У меня есть следующий вывод логистической регрессии:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.5716 0.1734 3.297 0.000978 ***
R1 -0.4662 0.2183 -2.136 0.032697 *
R2 -0.5270 0.2590 -2.035 0.041898 *
Уместно ли сообщить об этом следующим образом:
Коэффициент бета, коэффициент шансов, Zvalue, P значение. Если да, как я могу получить коэффициент шансов?
Ответы:
Предлагаемые вами отчеты для таблицы кажутся разумными, хотя z-значения и p-значения избыточны. Многие знакомые мне журналы вообще не сообщают о z-значении / p-значении, а используют только звездочки для сообщения о статистической значимости. Я также видел логистические таблицы только с сообщенными коэффициентами нечетности, хотя лично я предпочитаю как коэффициенты логарифмов, так и коэффициенты вероятности, если пространство позволяет в таблице.
Но разные места могут иметь разные руководства по процедурам отчетности, поэтому ожидаемые результаты могут отличаться. Если я отправляю статью в журнал, я часто просто вижу, как другие недавние газеты создали свои таблицы, и просто подражаю им. Если это ваша личная газета, разумно было бы спросить, кто бы ее ни просматривал. Как я уже упоминал выше, ограниченное пространство в некоторых местах может помешать вам сообщать в конечном итоге избыточную информацию (например, как коэффициенты входа и отношения). Некоторые места могут заставить вас сообщить результаты полностью в тексте!
exp(coefficient)
Также в качестве примечания, хотя это текущий принятый ответ, Леджон и Фрэнк Харрелл оба дают очень полезные советы. В то время как я обычно всегда хотел бы, чтобы статистика в вопросе сообщалась где-то, другие ответы на вопросы о других показателях являются полезными способами оценки размеров эффекта по сравнению с другими оцененными эффектами в модели. Графические процедуры также полезны для изучения относительных величин эффекта, и посмотрите на эти две статьи о превращении таблиц в графики в качестве примеров ( Kastellec & Leoni, 2007 ; Gelman et al., 2002 )
источник
Ответ на этот вопрос может зависеть от вашего дисциплинарного прошлого.
Вот некоторые общие соображения.
Бета в логистической регрессии довольно сложно интерпретировать напрямую. Таким образом, отчет о них явно имеет очень ограниченное применение. Вы должны придерживаться коэффициентов шансов или даже незначительных эффектов. Предельный эффект переменной x является производной от вероятности того, что ваши зависимые переменные равны 1 по отношению к x. Такой способ представления результатов очень популярен среди экономистов. Лично я считаю, что предельные эффекты легче понять мирянам (но не только им ...), чем коэффициентам шансов.
Еще одна интересная возможность - использовать графические дисплеи. Место, где вы найдете некоторые иллюстрации этого подхода, - книга Гельмана и Хилла . Я нахожу это даже лучше, чем сообщать о предельных эффектах.
Что касается вопроса о том, как получить отношения шансов, вот как вы можете сделать это в R:
источник
Это только в особых случаях, когда коэффициенты и их анти-журналы (отношения шансов) являются хорошими итогами. Это когда отношения являются линейными, и существует один коэффициент, связанный с предиктором, и когда изменение на одну единицу является хорошей основой для вычисления отношения шансов (более приемлемо для возраста, не так много для анализа белой крови, имеющего диапазон 500-100,000). В общем, полезны такие вещи, как отношение шансов между квартилями. У меня есть более подробная информация об этом на http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdf, и
rms
пакет R делает все это автоматически (обработка нелинейных терминов и взаимодействий, вычисление квартилей X, и т.д.).источник
Скорее всего, это зависит от вашей аудитории и дисциплины. Ответ ниже - это то, что обычно делается для журналов по эпидемиологии и, в меньшей степени, для медицинских журналов.
Чтобы быть тупым, мы не заботимся о p-значениях. Серьезно, мы не делаем. Эпидемиология даже не позволит вам сообщать о них, если только у вас не возникнет действительно насущная необходимость, а область практически последовала его примеру.
Мы можем даже не заботиться о бета-оценках, в зависимости от вопроса. Если ваш отчет о чем-то более методологическом или ориентированном на моделирование, я бы, вероятно, сообщил о бета-оценке и стандартной ошибке. Если вы пытаетесь сообщить об эффекте, рассчитанном для населения, я бы придерживался коэффициента вероятности и 95% доверительного интервала. Это основа вашей оценки и того, что будут искать читатели в этой области.
Ответы были опубликованы выше, как узнать соотношение шансов, но для ИЛИ и 95% ДИ:
источник