Наказанные модели могут использоваться для оценки моделей, в которых количество параметров равно или даже превышает размер выборки. Такая ситуация может возникнуть в лог-линейных моделях больших разреженных таблиц категориальных данных или данных подсчета. В этих настройках часто также желательно или полезно сворачивать таблицы, комбинируя уровни фактора, где эти уровни не различимы с точки зрения их взаимодействия с другими факторами. Два вопроса:
- Есть ли способ использовать оштрафованные модели, такие как LASSO или эластичная сетка, для проверки способности уровней к каждому фактору?
- Если ответ на первый вопрос - да, можно и нужно ли это настроить таким образом, чтобы коллапс уровней и оценка коэффициентов модели происходили за один шаг?
Ответы:
Это возможно. Мы можем использовать вариант слитого лассо, чтобы достигнуть этого.
Обратите внимание, что является функцией потерь для логарифмической линейной функции моделей.- 1NΣNя = 1( уяβTИкся- еβTИкся)
Это поощряет равные коэффициенты в группе. Это равенство коэффициентов эквивалентно сворачиванию и уровней фактора вместе. В случае, когда , это эквивалентно свертыванию уровня с опорным уровнем. Параметры настройки могут рассматриваться как константы, но если есть только несколько факторов, было бы лучше рассматривать их как отдельные. к т ч β J = 0 J т ч λ гJт ч Кт ч β^J= 0 Jт ч λг
Оценка является минимизатором выпуклой функции, поэтому она может быть эффективно вычислена с помощью произвольных решателей. Вполне возможно, что если фактор имеет много-много уровней, эти попарные различия выйдут из-под контроля - в этом случае потребуется знать больше структуры о возможных закономерностях коллапса.
Обратите внимание, что все это выполняется за один шаг! Это часть того, что делает оценки типа лассо такими крутыми!
Другой интересный подход заключается в использовании оценщика ОСКАР, который аналогичен приведенному выше, за исключением того, что штраф заменяется на . ‖ [ β i∥ [ - 11 ] ⋅ [ βяβJ]'∥1 ∥ [ βяβJ] ∥∞
источник