Я хочу смоделировать логистическую регрессию с несбалансированными данными (9: 1). Я хотел попробовать опцию весов в glm
функции в R, но я не уверен на 100%, что она делает.
Допустим , моя переменная выход c(0,0,0,0,0,0,0,0,0,1)
. Теперь я хочу дать «1» в 10 раз больше веса. поэтому я даю весовой аргумент weights=c(1,1,1,1,1,1,1,1,1,1,1,10)
.
Когда я это сделаю, это будет учитываться при расчете максимальной вероятности. Я прав? неправильная классификация «1» лишь в 10 раз хуже, чем неправильная классификация «0».