Логистическая регрессия: интерпретация непрерывных переменных

11

У меня было несколько вопросов о том, как интерпретировать отношения шансов для непрерывных переменных в логистической регрессии. Я чувствую, что это основные вопросы о логистической регрессии (и, вероятно, о регрессии в целом), и, хотя мне немного стыдно, что я не знаю ответов, я проглочу свою гордость и задам их, чтобы я знал их в будущее!

Вот моя ситуация ... Я рассматриваю выборку осужденной молодежи, которая в рамках стажировки была зачислена в программу обучения навыкам работы / жизненным навыкам. Я хотел увидеть, в какой степени возраст, в котором они были освобождены от участия в программе, предсказывал занятость через шесть месяцев после выхода из программы.

(Также имейте в виду, что в модели есть другие предикторы, но я исключил их, потому что они не являются статистически значимыми, и я хочу, чтобы это было как можно более ясным.)

Предиктор: возраст освобождения от программы обучения (средний возраст = 17,4, SD = 1,2, диапазон 14,3-20,5)

Результат: занят или нет (занят = 1, не занят = 0)

Результат: отношение шансов 3,01 (р <0,005) (я исключил статистику соответствия и т. Д., Потому что я ищу ответы только об интерпретации отношения шансов; я чувствую себя комфортно с оценкой соответствия модели, КИ , так далее.)

Если выразить это словами: если возраст увеличивается на один год, шансы на то, что он будет работать через шесть месяцев после выписки, увеличатся на три единицы.

Вопросов:

1) Когда я говорю: «Когда возраст увеличивается на один год ...», что является отправной точкой для возраста?

Возраст начинается с нуля? Например, «По мере того, как возраст увеличивается с 0 [т.е. самый низкий возраст, если вы должны были разместить эту модель на графике] ...»

Возраст начинается с самого низкого возраста из диапазона возрастов в выборке? Например, «Как возраст увеличивается с 14,3 ...»

ИЛИ

Возраст начинается со среднего возраста образца? Например, «возраст увеличивается с 17,4 ...»,

2) Поможет ли центрирование мне интерпретировать этот результат или это эффективно только при интерпретации y-int? Если бы это помогло, я подумал о том, чтобы либо сосредоточиться, либо вычесть самый низкий возраст в диапазоне из всех других возрастов в выборке. Какие-либо предложения?

3) Наконец, уместно ли сказать, что по сравнению с 14-летней молодежью 17-летняя молодежь имеет в девять раз больше шансов трудоустроиться? Я спрашиваю, потому что знаю, что логистическая регрессия предполагает сигмоидальные отношения, и мне любопытно, остается ли постоянное увеличение шансов на 3 единицы в любой точке вдоль линии регрессии.

Спасибо!

Аарон

user44992
источник
1
Вы можете быть заинтересованы в этом .
Чакраварти
4
Удаление «незначительных» переменных очень проблематично.
Фрэнк Харрелл
@FrankHarrell, не могли бы вы рассказать, почему удаление незначительных переменных в этом случае весьма проблематично?
Марк Уайт
Это подробно обсуждалось на этом сайте. Вкратце это разрушает стандартные ошибки, P-значения, покрытие доверительных интервалов и т. Д.
Фрэнк Харрелл,

Ответы:

6

1) Поскольку отношение шансов не имеет значения, с чего начать. Шансы для 18-летнего в 3 раза выше, чем для 17-летнего. Или шансы для 17-летнего - 1/3 от 18-летнего. То же самое. Если вы хотите получить вероятность того, что человек определенного возраста будет трудоустроен, вы можете использовать формулу с оценками параметров (не OR). Или вы можете получить программу, которую вы используете, чтобы сделать это для вас.

2) Помогает ли центрирование - это вопрос мнения. Я не нахожу центрированные модели более ясными, но некоторые люди делают.

3) Шансы не совсем такие же, как «вероятно» (хотя многие говорят так, как если бы они были), а шансы для 17-летнего будут в 27 раз больше, чем для 14-летнего.

Наконец, я буду осторожен с этой моделью. Модель предполагает, что OR одинаково между 14 и 15, 15 и 16 и так далее. Это кажется мне маловероятным, основываясь на том, что я знаю об этом предмете.

Питер Флом
источник
0

Средние шансы зачисления в учебную задачу для одного человека # умножены на шансы для другого человека, который на один год моложе / старше, после того, как все остальные переменные остаются постоянными.

Это мое мнение.

Иван Йе
источник
1
Можете ли вы рассказать о том, как это добавляет к предыдущему ответу?
Mdewey