LASSO / LARS против общего к специфическому (GETS) методу

Мне было интересно, почему методы выбора моделей LASSO и LARS так популярны, даже если они в основном представляют собой просто варианты пошагового прямого выбора (и, следовательно, страдают от зависимости пути)?

Точно так же, почему методы General to Specific (GETS) для выбора модели в основном игнорируются, даже если они работают лучше, чем LARS / LASSO, потому что они не страдают от проблемы пошаговой регрессии? (базовая ссылка на GETS: http://www.federalreserve.gov/pubs/ifdp/2005/838/ifdp838.pdf - новейший алгоритм в этом начинается с широкого поиска модели и дерева, который избегает зависимости пути, и был показан для часто делают лучше, чем LASSO / LARS).

Просто кажется странным, LARS / LASSO, похоже, получают гораздо больше информации и ссылок, чем General to Specific (GETS), у кого-нибудь есть мысли?

Не пытаясь начать горячие дебаты, скорее ищите рациональное объяснение того, почему литература, кажется, фокусируется на LASSO / LARS, а не GETS, и мало кто на самом деле указывает на недостатки LASSO / LARS.

feature-selection model-selection lasso stepwise-regression lars плоская маисовая лепешка
источник

Что вы подразумеваете под зависимостью пути здесь? Кроме того, есть ли еще авторитетные ссылки, которые вы можете дать для GETS? Я не знаком с этим.

кардинал

Вот лучшая, более «авторитетная» ссылка, в которой также упоминается Лассо: degruyter.com/view/j/jtse.2011.3.1/jtse.2011.3.1.1097/… .

тортилья

Также собирался добавить, что я имел в виду: поэтому вы добавляете значимые регрессоры один за другим, но этот подход не позволяет отбрасывать единицу, если из-за корреляции между регрессорами один может стать незначительным. Таким образом, после добавления есть зависимость от пути, что этот регрессор теперь установлен и не может быть отброшен. Разве это не так?

тортилья

Переменные могут быть сброшены на полпути лассо, если путь коэффициента пересекает ноль на этом пути. Вы знакомы с Efron et al. оригинальная статья о LARS? Это объясняет это довольно подробно с приятным геометрическим колоритом.

кардинал

Я думаю, что Lasso популярен, потому что он эффективно перенастраивает проблему выбора модели от проверки гипотез до оценки параметров.

вероятностная

Ответы:

Отказ от ответственности: я только отдаленно знаком с работой по выбору модели Дэвидом Ф. Хендри среди других. Однако я знаю от уважаемых коллег, что Хендри сделал очень интересный прогресс в решении проблем выбора моделей в эконометрике. Чтобы судить о том, что статистическая литература не уделяет достаточного внимания его работе по подбору моделей, потребовалось бы гораздо больше работы с моей стороны.

Тем не менее, интересно попытаться понять, почему один метод или идея генерирует гораздо больше активности, чем другие. Нет сомнений, что в науке тоже есть аспекты моды. На мой взгляд, у лассо (и его друзей) есть одно важное преимущество - решение очень легко выраженной проблемы оптимизации. Это ключ к детальному теоретическому пониманию решения и разработанным эффективным алгоритмам. Недавняя книга Bühlmann and Van De Geer « Статистика для многомерных данных » иллюстрирует, сколько уже известно о лассо.

Вы можете проводить бесконечные симуляционные исследования и, конечно, применять методы, которые вы считаете наиболее подходящими и подходящими для конкретного применения, но для частей статистической литературы также должны быть получены существенные теоретические результаты. То, что лассо вызвало большую активность, свидетельствует о том, что есть теоретические вопросы, к которым можно подойти, и у них есть интересные решения.

Другое дело, что лассо или вариация этого работает хорошо во многих случаях. Я просто не уверен, что правильно, что Лассо так легко превосходит другие методы, как предлагает ОП. Может быть, с точки зрения (искусственного) выбора модели, но не с точки зрения прогнозирующей эффективности. Кажется, что ни одна из упомянутых ссылок действительно не сравнивает Гетса и Лассо.

NRH
источник

почему методы выбора моделей LASSO и LARS так популярны, хотя в основном они представляют собой лишь вариации пошагового выбора вперед

Существует различие между выбором поднабора LASSO и (GETS): LASSO сжимает коэффициенты к нулю зависимым от данных способом, в то время как выбор поднабора (GETS) не делает. Похоже, это является преимуществом выбора подмножества LASSO over (GETS), даже если иногда он может потерпеть неудачу (требуется настройка параметров, что обычно выполняется с помощью перекрестной проверки, а иногда нам может случиться плохая настройка).

(ПОЛУЧАЕТ) методы <...> делают лучше, чем LARS / LASSO

Производительность GETS, кажется, сопоставима по качеству с LASSO, когда она проводится беспристрастными (?) Исследователями (хотя это не обязательно так в статьях, где предлагается новая версия GETS - но это то, что вы ожидаете); увидеть некоторые ссылки в этой теме .

Возможно, сэр Хендри и Ко получают хорошие результаты, используя GETS из-за специфики своих приложений (в основном, моделирование временных макроэкономических рядов)? Но почему это может быть? Это отдельный вопрос .

Ричард Харди
источник