Применять «трюк с ядром» к линейным методам?

20

Трюк ядра используется в нескольких моделях машинного обучения (например , SVM ). Впервые он был представлен в статье «Теоретические основы метода потенциальных функций в обучении распознаванию образов» в 1964 году.

Определение Википедии говорит, что это

способ использования алгоритма линейного классификатора для решения нелинейной задачи путем отображения исходных нелинейных наблюдений в многомерное пространство, где впоследствии используется линейный классификатор; это делает линейную классификацию в новом пространстве эквивалентной нелинейной классификации в исходном пространстве.

Одним из примеров линейной модели, которая была распространена на нелинейные задачи, является ядро PCA . Может ли трюк ядра быть применен к любой линейной модели, или у него есть определенные ограничения?

Шейн
источник
1
Кстати, ядра не очень важны для SVM. «Сердцем» SVM является принцип максимизации мягких полей. Переход к представлению ядра делает размерность вашей задачи O (m ^ 2) вместо O (d), где m - количество примеров, а d - размерность вашего пространственного объекта, поэтому, если m ^ 2 больше, чем d, вы можете лучше покончить с ядрами jmlr.csail.mit.edu/papers/v6/keerthi05a.html
Ярослав Булатов
@ Ярослав: Спасибо за ссылку. Вам известны какие-либо реализации этого «модифицированного метода конечных ньютонов»?
Шейн
нет, но на страницах Keerthi и Langford есть ссылки на некоторые программы, которые могут быть связаны, так как они оба работали в Yahoo Research
Ярослав Булатов

Ответы:

17

Трюк с ядром можно применить только к линейным моделям, где примеры в постановке задачи отображаются в виде точечных продуктов (Support Vector Machines, PCA и т. Д.).

ebony1
источник
Спасибо за ответ. @mbq @ ebony1: IMO, нам нужно приложить больше усилий, чтобы разместить на сайте более серьезные вопросы по машинному обучению, чтобы привлечь больше этого сообщества.
Шейн
@ Шейн, я полностью согласен, но как насчет другого SO-сайта, такого как metaoptimize.com/qa ?
ЧЛ
@chl: Это тоже вариант, но он не является частью StackExchange (он контролируется одним человеком и на другом программном обеспечении), и я лично предпочел бы, чтобы эти разные сообщества по анализу данных смешивались в одном месте.
Шейн
@ Шейн Хорошо, это имеет смысл.
ЧЛ
есть также предложение об
Ярослав Булатов
2

@ ebony1 дает ключевую точку (+1), я был соавтором статьи, обсуждающей, как создать обобщенные линейные модели, например, логистическую регрессию и пуассоновскую регрессию, это довольно просто.

GC Cawley, GJ Janacek и NLC Talbot, машины обобщенного ядра, в материалах Международной совместной конференции IEEE / INNS по нейронным сетям (IJCNN-2007), страницы 1732-1737, Орландо, Флорида, США, 12-17 августа 2007 г. ( www , pdf )

Я также написал набор инструментов MATLAB (качество исследований) (к сожалению, без инструкций), который вы можете найти здесь .

Возможность моделирования целевого распределения довольно полезна для количественного определения неопределенности и т. Д., Поэтому она является полезным (хотя и довольно инкрементным) дополнением к методам обучения ядра.

Дикран Сумчатый
источник