Отчетность о результатах логистической регрессии

13

У меня есть следующий вывод логистической регрессии:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   0.5716     0.1734   3.297 0.000978 ***
R1           -0.4662     0.2183  -2.136 0.032697 *  
R2           -0.5270     0.2590  -2.035 0.041898 *

Уместно ли сообщить об этом следующим образом:

Коэффициент бета, коэффициент шансов, Zvalue, P значение. Если да, как я могу получить коэффициент шансов?

logistic вышеперечисленное
источник

Связанный вопрос: Логистическая регрессия в R (отношение шансов) .

Landroni

9

Предлагаемые вами отчеты для таблицы кажутся разумными, хотя z-значения и p-значения избыточны. Многие знакомые мне журналы вообще не сообщают о z-значении / p-значении, а используют только звездочки для сообщения о статистической значимости. Я также видел логистические таблицы только с сообщенными коэффициентами нечетности, хотя лично я предпочитаю как коэффициенты логарифмов, так и коэффициенты вероятности, если пространство позволяет в таблице.

Но разные места могут иметь разные руководства по процедурам отчетности, поэтому ожидаемые результаты могут отличаться. Если я отправляю статью в журнал, я часто просто вижу, как другие недавние газеты создали свои таблицы, и просто подражаю им. Если это ваша личная газета, разумно было бы спросить, кто бы ее ни просматривал. Как я уже упоминал выше, ограниченное пространство в некоторых местах может помешать вам сообщать в конечном итоге избыточную информацию (например, как коэффициенты входа и отношения). Некоторые места могут заставить вас сообщить результаты полностью в тексте!

$R^2$ $R^2$

$e^{\hat{\beta}}$ $e$ $\hat{\beta}$ exp(coefficient)

Также в качестве примечания, хотя это текущий принятый ответ, Леджон и Фрэнк Харрелл оба дают очень полезные советы. В то время как я обычно всегда хотел бы, чтобы статистика в вопросе сообщалась где-то, другие ответы на вопросы о других показателях являются полезными способами оценки размеров эффекта по сравнению с другими оцененными эффектами в модели. Графические процедуры также полезны для изучения относительных величин эффекта, и посмотрите на эти две статьи о превращении таблиц в графики в качестве примеров ( Kastellec & Leoni, 2007 ; Gelman et al., 2002 )

Энди У
источник

Ссылка Kastellec & Leoni, 2007 разорвана, но вот пример из той же статьи с кодом.

ACNB

11

Ответ на этот вопрос может зависеть от вашего дисциплинарного прошлого.

Вот некоторые общие соображения.

Бета в логистической регрессии довольно сложно интерпретировать напрямую. Таким образом, отчет о них явно имеет очень ограниченное применение. Вы должны придерживаться коэффициентов шансов или даже незначительных эффектов. Предельный эффект переменной x является производной от вероятности того, что ваши зависимые переменные равны 1 по отношению к x. Такой способ представления результатов очень популярен среди экономистов. Лично я считаю, что предельные эффекты легче понять мирянам (но не только им ...), чем коэффициентам шансов.

Еще одна интересная возможность - использовать графические дисплеи. Место, где вы найдете некоторые иллюстрации этого подхода, - книга Гельмана и Хилла . Я нахожу это даже лучше, чем сообщать о предельных эффектах.

Что касается вопроса о том, как получить отношения шансов, вот как вы можете сделать это в R:

model <- glm(y ~ x1 + x2, family=binomial("logit"))
oddrat <- exp(coef(model))

Scortchi - Восстановить Монику
источник

Есть ли у вас примеры превращения оценок предельного эффекта в таблицы (или ссылки на конкретные страницы в Gelman and Hill?)

Энди В.

1

Гельман и Хилл на самом деле используют не предельные эффекты, а графики, основанные на предсказанных вероятностях. Посмотрите на

10

Это только в особых случаях, когда коэффициенты и их анти-журналы (отношения шансов) являются хорошими итогами. Это когда отношения являются линейными, и существует один коэффициент, связанный с предиктором, и когда изменение на одну единицу является хорошей основой для вычисления отношения шансов (более приемлемо для возраста, не так много для анализа белой крови, имеющего диапазон 500-100,000). В общем, полезны такие вещи, как отношение шансов между квартилями. У меня есть более подробная информация об этом на http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdf, и rmsпакет R делает все это автоматически (обработка нелинейных терминов и взаимодействий, вычисление квартилей X, и т.д.).

Фрэнк Харрелл
источник

5

Скорее всего, это зависит от вашей аудитории и дисциплины. Ответ ниже - это то, что обычно делается для журналов по эпидемиологии и, в меньшей степени, для медицинских журналов.

Чтобы быть тупым, мы не заботимся о p-значениях. Серьезно, мы не делаем. Эпидемиология даже не позволит вам сообщать о них, если только у вас не возникнет действительно насущная необходимость, а область практически последовала его примеру.

Мы можем даже не заботиться о бета-оценках, в зависимости от вопроса. Если ваш отчет о чем-то более методологическом или ориентированном на моделирование, я бы, вероятно, сообщил о бета-оценке и стандартной ошибке. Если вы пытаетесь сообщить об эффекте, рассчитанном для населения, я бы придерживался коэффициента вероятности и 95% доверительного интервала. Это основа вашей оценки и того, что будут искать читатели в этой области.

Ответы были опубликованы выше, как узнать соотношение шансов, но для ИЛИ и 95% ДИ:

OR = exp(beta)
95% CI = exp(beta +/- 1.96*std error)

фомиты
источник

Спасибо за ответ! можно спросить, что означает 1,96 в расчете?

выше

1

Нет проблем :) 95% доверительный интервал - это интервал, который должен охватывать примерно от 2,5-го процентиля до 97,5-го процентиля от нормального распределения вашей бета-оценки. Каждый из этих пунктов составляет примерно 1,96 стандартного отклонения от среднего значения (в данном случае бета).

Fomite

да, но я должен сделать это для каждого коэффициента бета? также меняется 1,96? также это биномиальные данные это все еще основано на нормальном распределении?

выше

2

Да - для каждого бета-коэффициента вы можете получить коэффициент шансов и 95% доверительный интервал. 1.96 не изменится, если вы не захотите рассчитать другой процентиль для доверительного интервала (90%, 99% и т. Д.), Но, поскольку 95% является стандартным значением, делать это не нужно. И пока вы работаете в логарифмическом масштабе, параметры из модели логистической регрессии обычно распределяются. Как только вы возводите их в степень, это перестает быть правдой.

Fomite

Отчетность о результатах логистической регрессии

Ответы: