Я читал в нескольких местах, что R Squared не является идеальной мерой, когда модель подгоняется с использованием LASSO. Однако я не совсем понимаю, почему это так.
Кроме того, не могли бы вы порекомендовать лучшую альтернативу?
Я читал в нескольких местах, что R Squared не является идеальной мерой, когда модель подгоняется с использованием LASSO. Однако я не совсем понимаю, почему это так.
Кроме того, не могли бы вы порекомендовать лучшую альтернативу?
Целью использования LASSO является получение разреженного представления (прогнозируемой величины) в смысле отсутствия множества ковариат. Сравнение моделей с имеет тенденцию отдавать предпочтение моделям с большим количеством ковариат: фактически, добавление ковариат, не связанных с результатом, никогда не уменьшит R 2 и почти всегда увеличивает его хотя бы немного. Модель LASSO идентифицирует модель с оптимальным логарифмическим правдоподобием (непенализованное логарифмическое правдоподобие монотонно связано с R 2 ). Статистика валидации, которая более широко используется для сравнения моделей LASSO с моделями других типов, представляет собой, например, BIC или перекрестную проверку R 2 .