Как я могу адаптировать ANOVA для двоичных данных?

11

У меня есть четыре конкурирующих модели, которые я использую, чтобы предсказать бинарную переменную результата (скажем, статус занятости после окончания, 1 = занятый, 0 = не занятый) для n предметов. Естественным показателем производительности модели является коэффициент попадания, который представляет собой процент правильных прогнозов для каждой из моделей.

Мне кажется, что я не могу использовать ANOVA в этой настройке, поскольку данные нарушают предположения, лежащие в основе ANOVA. Есть ли эквивалентная процедура, которую я мог бы использовать вместо ANOVA в приведенной выше настройке, чтобы проверить гипотезу о том, что все четыре модели одинаково эффективны?

Питер Эллис
источник

Ответы:

6

Таблица непредвиденных расходов (хи-квадрат). Также Логистическая регрессия - ваш друг - используйте фиктивные переменные.

Стивен Тернер
источник