Я пытаюсь понять использование логистической регрессии в таблицах сопряженности 2x2 и Ix2. Например, используя это в качестве примера
В чем разница между использованием критерия хи-квадрат и логистической регрессией? Как насчет таблицы с несколькими номинальными коэффициентами (таблица Ix2), например:
Существует аналогичный вопрос здесь - но ответ в основном , что хи-квадрат может обрабатывать MXN таблицы, но мой вопрос , что specificalyl когда есть двоичный результат и один номинальный коэффициент. (Связанный поток также ссылается на этот поток , но это касается нескольких переменных / факторов).
Если это всего лишь один фактор (т.е. нет необходимости контролировать другие переменные) с двоичным ответом, то в чем состоит различие в выполнении логистической регрессии?
источник
Ответы:
В конечном итоге это яблоки и апельсины.
Логистическая регрессия - это способ моделирования номинальной переменной как вероятностного результата одной или нескольких других переменных. Подгонка модели логистической регрессии может сопровождаться проверкой, существенно ли отличаются коэффициенты модели от 0, вычислением доверительных интервалов для коэффициентов или проверкой того, насколько хорошо модель может предсказывать новые наблюдения.
Тест χ² независимости является критерием значимости конкретного , которая проверяет нулевую гипотезу , что два номинальных переменные являются независимыми.
Следует ли вам использовать логистическую регрессию или тест χ², зависит от вопроса, на который вы хотите ответить. Например, тест χ² может проверить, не является ли необоснованным полагать, что зарегистрированная политическая партия человека независима от его расы, тогда как логистическая регрессия может вычислить вероятность того, что человек с данной расой, возрастом и полом принадлежит каждой политической партии ,
источник