Я пытался создать некоторые тестовые данные для логистической регрессии, и я нашел этот пост Как имитировать искусственные данные для логистической регрессии?
Это хороший ответ, но он создает только непрерывные переменные. Как насчет категориальной переменной x3 с 5 уровнями (ABCDE), связанной с y для того же примера, что и в ссылке?
r
logistic
simulation
user1301295
источник
источник
Ответы:
Модель
Пусть если есть категория «B», и x B = 0 в противном случае. Определите x C , x D и x E аналогично. Если x B = x C = x D = x E = 0 , то у нас есть категория «A» (т. Е. «A» - контрольный уровень). Ваша модель может быть записана какИксВ= 1 ИксВ= 0 ИксС ИксD ИксЕ ИксВ= хС= хD= хЕ= 0
с β 0 перехват.
Генерация данных в R
(А)
x
Вектор имеетn
компоненты (один для каждого человека). Каждый компонент представляет собой «A», «B», «C», «D» или «E». Каждая из «A», «B», «C», «D» и «E» одинаково вероятна.(Б)
dummy(x)
n
(С)
Вероятности успеха вытекают из логистической модели:
(Д)
pi[i]
Несколько быстрых симуляций, чтобы проверить это нормально
источник