Интерпретация результатов логистической регрессии в R

13

Я работаю над множественной логистической регрессией в R, используя glm. Переменные предиктора являются непрерывными и категориальными. Выдержка из резюме модели показывает следующее:

Coefficients:
               Estimate Std. Error z value Pr(>|z|)
(Intercept)   2.451e+00  2.439e+00   1.005   0.3150
Age           5.747e-02  3.466e-02   1.658   0.0973 .
BMI          -7.750e-02  7.090e-02  -1.093   0.2743
...
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Доверительные интервалы:

                  2.5 %       97.5 %
(Intercept)  0.10969506 1.863217e+03
Age          0.99565783 1.142627e+00
BMI          0.80089276 1.064256e+00
...

Нечетные соотношения:

                 Estimate Std. Error   z value Pr(>|z|)
(Intercept)  1.159642e+01  11.464683 2.7310435 1.370327
Age          1.059155e+00   1.035269 5.2491658 1.102195
B            9.254228e-01   1.073477 0.3351730 1.315670
...

AgeAgeAgeAge

SabreWolfy
источник
8
Это имеет значение только при уровне достоверности 10%, но доверительные интервалы составляют 5%.
Ник Сабби
Таким образом, доверительные интервалы для 10% не будут включать 1 тогда?
SabreWolfy
Значение p (последняя таблица в первой колонке) - это вероятность того, что полученный результат или хуже будет достигнут, если нулевая гипотеза окажется верной. Доверительный интервал - это область, в которой будет храниться истинное значение, например, в 95% случаев. Если он не содержит гипотетическое истинное значение, то существует не более 5% вероятности того, что мы получим полученный результат или хуже, если гипотеза верна. Таким образом, это подразумевает, что ваше значение p будет ниже 5%. Существует очень тесная связь между p-значениями и доверительными интервалами (статистика 101). Но вкратце: да, КИ на 10% будет включать в себя 1.
Ник Сабби
Похоже, вы предполагаете линейность. Как это оправдано?
Фрэнк Харрелл

Ответы:

8

Здесь на сайте есть множество вопросов, которые помогут с интерпретацией выходных данных моделей (вот три различных примера, 1 2 3 , и я уверен, что есть и другие, если вы покопаетесь в архиве). Вот также учебник на веб-сайте статистики UCLA о том, как интерпретировать коэффициенты для логистической регрессии.

Хотя отношение шансов для коэффициента возраста близко к единице, оно не обязательно означает, что эффект мал (большой или малый эффект часто является настолько же нормативным вопросом, сколь и эмпирическим). Нужно знать типичные различия в возрасте между наблюдениями, чтобы составить более обоснованное мнение.

Энди У
источник
Спасибо за ссылку на учебник, который выглядит всеобъемлющим. Я сделал поиск здесь, прежде чем опубликовать свой вопрос. Ссылки 1 и 3 не связаны с моим вопросом.
SabreWolfy
@SabreWolfy, ссылка 1 дополнительно объясняет, как интерпретировать коэффициенты с точки зрения исходных единиц, ссылка 3 описывает шаги для интерпретации эффектов с точки зрения вероятностей (что действительно применимо к вашему вопросу, и предлагаемые графики в этом вопросе будут разумный ответ мне, говоря, что размер прямого эффекта трудно интерпретировать, не зная разницы в возрасте).
Энди В.
5
(1.059301)×100%=458%
Ссылка UCLA не работает, но эта, вероятно, соответствует (по крайней мере, ее содержание помогает мне понять этот вопрос).
MBR