Предположим, у меня есть продольные данные вида (у меня есть несколько наблюдений, это просто форма одного). Я заинтересован в ограничениях . Неограниченная эквивалентна взятию с .Σ Σ Y j = α j + j - 1 ∑ ℓ = 1 ϕ ℓ j Y j j - ℓ + ε j
Обычно это не делается, поскольку требует оценки параметров ковариации. Модель является "lag- " если мы возьмем т.е. мы используем только предшествующее терминов, чтобы предсказать из истории.k Y j = α j + k ∑ ℓ = 1 ϕ ℓ j Y j - ℓ + ε j , k Y j
То, что я действительно хотел бы сделать, это использовать какую-то идею сжатия, чтобы обнулить некоторые из , такие как LASSO. Но дело в том, что я также хотел бы метод я использую , чтобы предпочесть модели , которые lag- для некоторых ; Я хотел бы штрафовать лаги более высокого порядка больше, чем лаги более низкого порядка. Я думаю, что это то, что мы особенно хотели бы сделать, учитывая, что предикторы сильно коррелируют. k k
Еще одна проблема заключается в том, что если (скажем) сокращено до мне бы также хотелось, чтобы сокращено до , т. Е. Одинаковое запаздывание используется во всех условных распределениях. 0 ϕ 36 0
Я мог бы спекулировать на этом, но я не хочу изобретать велосипед. Существуют ли какие-либо методы LASSO, предназначенные для решения этой проблемы? Мне лучше просто делать что-то еще, например, поэтапное включение ордеров с задержкой? Так как мое модельное пространство мало, я мог бы даже использовать штраф для этой проблемы, я полагаю?
источник
Это решает вторую задачу обнуления коэффициентов для лагов более высокого порядка, но является более ограничительным, чем единственное ограничение предпочтения модели с более низким лагом. И, как отмечают другие, это серьезное ограничение, которое может быть очень трудно оправдать.
Не обращая внимания на предостережения, в статье представлены результаты метода как на реальных, так и на смоделированных данных временных рядов, а также подробно описаны алгоритмы для нахождения коэффициентов. В заключении упоминается пакет R, но статья довольно свежая, и поиск в CRAN для «заказанного LASSO» оказывается пустым, поэтому я подозреваю, что пакет все еще находится в разработке.
В статье также предлагается обобщенный подход, в котором два параметра регуляризации «поощряют почти монотонность». (См. Стр. 6.) Другими словами, нужно уметь настраивать параметры, чтобы можно было упростить порядок. К сожалению, ни примеры, ни сравнения расслабленного метода не предоставлены. Но авторы пишут, что реализация этого изменения - это простой вопрос замены одного алгоритма другим, поэтому можно надеяться, что он станет частью следующего пакета R.
источник
Можно использовать вложенный штраф LASSO ( pdf ), но для него нет пакетов R.
источник
Я знаю, что вы написали это как предпосылку, но я бы не использовал упорядоченный LASSO, не будучи абсолютно уверенным, что это то, что нужно, потому что допущения упорядоченного LASSO не подходят непосредственно для прогнозирования временных рядов. В качестве контрпримера рассмотрим случай, когда у вас есть время задержки, скажем, десять временных шагов между измерением и целью. Очевидно, что упорядоченные ограничения LASSO не могут справиться с такими эффектами, не приписывая бессмысленности первым девяти параметрам.
источник