Я пытаюсь определить лучшую модель для прогнозирования цен на автомобили, используя цены и функции, доступные на сайтах, рекламируемых автомобилями.
Для этого я использовал пару моделей из библиотеки scikit-learn и модели нейронной сети из pybrain и neurolab. Подход, который я использовал до сих пор, состоит в том, чтобы прогонять фиксированный объем данных через некоторые модели (алгоритмы машинного обучения) и сравнивать там значения которые были рассчитаны с помощью модуля показателей scikit-learn.
- Является ли хорошим методом для сравнения производительности разных моделей?
- Хотя я получил вполне приемлемые результаты для таких моделей, как Эластичная сеть и Случайные леса, я получил очень плохие значения для моделей нейронных сетей, поэтому является ли подходящим методом для оценки нейронных сетей (или нелинейных методов)?
Ответы:
Я думаю, что важнейшая часть, которую следует учитывать при ответе на ваш вопрос,
потому что это утверждение подразумевает кое-что о том, почему вы хотите использовать модель. Выбор и оценка модели должны основываться на том, чего вы хотите достичь с вашими установленными значениями.
Во-первых, давайте вспомним, что делаетR2 : он вычисляет масштабированную меру на основе функции квадратичной потери, которую, я уверен, вы уже знаете. Чтобы убедиться в этом, определить остаточные для г-го наблюдения у я и соответствующее встроено значение у я . Используя удобные обозначения S S R : = ∑ N i = 1 e 2 i , S S T : = ∑ei=yi−y^i yi y^i SSR:=∑Ni=1e2i ,R2является просто определена какR2=1-SSR/SST.SST: = ∑Nя = 1( уя- у¯)2 R2 R2=1−SSR/SST
Во-вторых, давайте посмотрим, что означает использование для выбора / оценки моделиR2 . Предположим, мы выбираем из набора предсказаний которые были сгенерированы с использованием модели M : M ∈ M , где M - коллекция рассматриваемых моделей (в вашем примере эта коллекция будет содержать нейронные сети, случайные леса, упругие сети, ...). Так как S S T будет оставаться постоянной среди всех моделей, если свести к минимуму R 2 вы будете выбирать именно ту модель , которая сводит к минимуму S S R . Другими словами, вы выберетеY¯M M:M∈M M SST R2 SSR который дает минимальную квадратную потерю ошибки!M∈M
Таким образом, выбор / оценка модели не может рассматриваться независимо от цели модели.
источник