Как выбрать между использованием модели линейной регрессии или модели нелинейной регрессии?
Моя цель - предсказать Y.
В случае простого набора данных и y я мог легко решить, какую регрессионную модель использовать, построив график рассеяния.
В случае многокамерных варианта как и у . Как я могу решить, какую регрессионную модель использовать? То есть, как я решу поступить с простой линейной моделью или нелинейными моделями, такими как квадрик, куб и т. Д.
Есть ли какой-либо метод или статистический подход или графические графики, чтобы сделать вывод и решить, какую регрессионную модель следует использовать?
Ответы:
Это область статистики, которая называется выбором модели. Много исследований сделано в этой области, и нет однозначного и простого ответа.
Если ваша цель номер 1, то я рекомендую тест вероятностного отношения (LRT). LRT используется, когда у вас есть вложенные модели, и вы хотите знать, «являются ли данные значительно более вероятными из сложной модели, чем экономная модель?». Это даст вам представление о том, какая модель лучше объясняет связь между вашими данными.
источник
Когда я использую Google для «линейной или нелинейной модели регрессии», я получаю ссылки, которые ведут к этой книге: http://www.graphpad.com/manuals/prism4/RegressionBook.pdf Эта книга не интересна, и я не не доверяйте в 100% (по некоторым причинам).
Я также нашел эту статью: http://hunch.net/?p=524 с заголовком: почти все естественные проблемы требуют нелинейности
Я также нашел похожий вопрос с довольно хорошим объяснением: /programming/1148513/difference-between-a-linear-problem-and-a-non-linear-problem-essence-of-dot-pro
Исходя из моего опыта, когда вы не знаете, какую модель использовать, используйте обе и попробуйте другие функции.
источник
Как вы заявляете, линейные модели, как правило, проще, чем нелинейные модели, то есть они работают быстрее (построение и прогнозирование), их легче интерпретировать и объяснять, и, как правило, они просты в измерениях ошибок. Таким образом, цель состоит в том, чтобы выяснить, соответствуют ли предположения линейной регрессии вашим данным (если вы не поддерживаете линейную, то просто переходите к нелинейной). Обычно вы повторяете график одной переменной со всеми переменными индивидуально, сохраняя все остальные переменные постоянными.
Возможно, еще важнее то, что вы хотите знать, можете ли вы применить какое-то преобразование, взаимодействие с переменной или фиктивную переменную для перемещения ваших данных в линейное пространство. Если вы можете проверить допущения или если вы знаете свои данные достаточно хорошо, чтобы применить хорошо мотивированные или иным образом разумно обоснованные преобразования или модификации, то вы захотите продолжить это преобразование и использовать линейную регрессию. Когда у вас есть остатки, вы можете отобразить их в зависимости от прогнозируемых значений или независимых переменных, чтобы дополнительно решить, нужно ли переходить к нелинейным методам.
Здесь, в герцоге, есть отличная разбивка предположений о линейной регрессии . Перечислены четыре основных допущения, каждое из которых разбито на влияние на модель, способы ее диагностики в данных и возможные способы «исправить» (т.е. преобразовать или добавить) данные, чтобы сделать предположение выполненным. Вот небольшая выдержка сверху, суммирующая четыре допущения, которые вы рассмотрели, но вы должны пойти туда и прочитать разбивки.
источник