Я хочу сделать множественную линейную регрессию, а затем предсказать новые значения с небольшой экстраполяцией. У меня есть переменная ответа в диапазоне от -2 до +7 и три предиктора (диапазоны от +10 до +200). Распределение почти нормальное. Но отношения между ответом и предикторами не являются линейными, я вижу кривые на графиках. Например, вот так: http://cs10418.userapi.com/u17020874/153949434/x_9898cf38.jpg
Я хотел бы применить преобразование для достижения линейности. Я попытался преобразовать переменную ответа, проверив различные функции и просмотрев полученные графики, чтобы увидеть линейную связь между ответом и предикторами. И я обнаружил, что есть много функций, которые могут дать мне видимые линейные отношения. Например, функции
Как я могу выбрать лучшее преобразование для моих данных? Есть ли количественный (и не очень сложный) способ оценки линейности? Чтобы доказать, что выбранное преобразование является лучшим или найти его автоматически, если это возможно.
Или единственный способ сделать нелинейную множественную регрессию?
plot(lm(1/(y+5)~r))
Ответы:
Это отчасти искусство, но есть некоторые стандартные, простые вещи, которые всегда можно попробовать.
источник
r
r
Если ваша переменная ответа (или, скорее, то, что станет остатками вашей переменной ответа) в исходной шкале, как вы подразумеваете, имеет нормальное распределение, то преобразование его для создания линейной связи с другими переменными будет означать, что оно больше не является нормальным. и это также изменит отношение между его дисперсией и средними значениями. Так что из этой части вашего описания я думаю, что вам лучше использовать нелинейную регрессию, чем трансформировать ответ. В противном случае после линейного преобразования ответа вам понадобится более сложная структура ошибок (хотя это может быть предметом суждения, и вам нужно будет проверить, используя графические методы).
В качестве альтернативы, исследуйте преобразование объясняющих переменных. Наряду с прямыми преобразованиями у вас также есть возможность добавления в квадратичных терминах.
В более общем смысле, трансформация - это больше искусство, чем наука, если нет существующей теории, предлагающей то, что вы должны использовать в качестве основы для трансформации.
источник