У меня было несколько вопросов о том, как интерпретировать отношения шансов для непрерывных переменных в логистической регрессии. Я чувствую, что это основные вопросы о логистической регрессии (и, вероятно, о регрессии в целом), и, хотя мне немного стыдно, что я не знаю ответов, я проглочу свою гордость и задам их, чтобы я знал их в будущее!
Вот моя ситуация ... Я рассматриваю выборку осужденной молодежи, которая в рамках стажировки была зачислена в программу обучения навыкам работы / жизненным навыкам. Я хотел увидеть, в какой степени возраст, в котором они были освобождены от участия в программе, предсказывал занятость через шесть месяцев после выхода из программы.
(Также имейте в виду, что в модели есть другие предикторы, но я исключил их, потому что они не являются статистически значимыми, и я хочу, чтобы это было как можно более ясным.)
Предиктор: возраст освобождения от программы обучения (средний возраст = 17,4, SD = 1,2, диапазон 14,3-20,5)
Результат: занят или нет (занят = 1, не занят = 0)
Результат: отношение шансов 3,01 (р <0,005) (я исключил статистику соответствия и т. Д., Потому что я ищу ответы только об интерпретации отношения шансов; я чувствую себя комфортно с оценкой соответствия модели, КИ , так далее.)
Если выразить это словами: если возраст увеличивается на один год, шансы на то, что он будет работать через шесть месяцев после выписки, увеличатся на три единицы.
Вопросов:
1) Когда я говорю: «Когда возраст увеличивается на один год ...», что является отправной точкой для возраста?
Возраст начинается с нуля? Например, «По мере того, как возраст увеличивается с 0 [т.е. самый низкий возраст, если вы должны были разместить эту модель на графике] ...»
Возраст начинается с самого низкого возраста из диапазона возрастов в выборке? Например, «Как возраст увеличивается с 14,3 ...»
ИЛИ
Возраст начинается со среднего возраста образца? Например, «возраст увеличивается с 17,4 ...»,
2) Поможет ли центрирование мне интерпретировать этот результат или это эффективно только при интерпретации y-int? Если бы это помогло, я подумал о том, чтобы либо сосредоточиться, либо вычесть самый низкий возраст в диапазоне из всех других возрастов в выборке. Какие-либо предложения?
3) Наконец, уместно ли сказать, что по сравнению с 14-летней молодежью 17-летняя молодежь имеет в девять раз больше шансов трудоустроиться? Я спрашиваю, потому что знаю, что логистическая регрессия предполагает сигмоидальные отношения, и мне любопытно, остается ли постоянное увеличение шансов на 3 единицы в любой точке вдоль линии регрессии.
Спасибо!
Аарон
источник
Ответы:
1) Поскольку отношение шансов не имеет значения, с чего начать. Шансы для 18-летнего в 3 раза выше, чем для 17-летнего. Или шансы для 17-летнего - 1/3 от 18-летнего. То же самое. Если вы хотите получить вероятность того, что человек определенного возраста будет трудоустроен, вы можете использовать формулу с оценками параметров (не OR). Или вы можете получить программу, которую вы используете, чтобы сделать это для вас.
2) Помогает ли центрирование - это вопрос мнения. Я не нахожу центрированные модели более ясными, но некоторые люди делают.
3) Шансы не совсем такие же, как «вероятно» (хотя многие говорят так, как если бы они были), а шансы для 17-летнего будут в 27 раз больше, чем для 14-летнего.
Наконец, я буду осторожен с этой моделью. Модель предполагает, что OR одинаково между 14 и 15, 15 и 16 и так далее. Это кажется мне маловероятным, основываясь на том, что я знаю об этом предмете.
источник
Средние шансы зачисления в учебную задачу для одного человека # умножены на шансы для другого человека, который на один год моложе / старше, после того, как все остальные переменные остаются постоянными.
Это мое мнение.
источник