(Почему) SOM в стиле Кохонена потерял популярность?

33

Насколько я могу судить, SOM в стиле Кохонена достигли пика примерно в 2005 году и в последнее время не пользовались такой большой пользой. Я не нашел ни одной статьи, в которой говорилось бы, что SOM были включены в другой метод или оказались эквивалентными чему-то другому (во всяком случае, в более высоких измерениях). Но похоже, что в наши дни tSNE и другие методы получают намного больше чернил, например, в Википедии или в SciKit Learn, а SOM упоминается скорее как исторический метод.

(На самом деле, статья в Википедии, кажется, указывает на то, что СДЛ по-прежнему имеют определенные преимущества перед конкурентами, но это также самая короткая запись в списке. РЕДАКТИРОВАТЬ: По запросу Гунга, одна из статей, о которых я думаю, это: Нелинейное уменьшение размерности Обратите внимание, что SOM написал об этом меньше, чем другие методы. Я не могу найти статью, в которой упоминается преимущество, которое SOM, похоже, сохраняет над большинством других методов.)

Есть идеи? Кто-то еще спросил, почему SOM не используются, и получил ссылки, сделанные недавно, и я обнаружил материалы конференций SOM, но мне было интересно, затмил ли рост SVM или tSNE и др. Только SOM в обучении на поп-машинах.

РЕДАКТИРОВАТЬ 2: По стечению обстоятельств, я только что читал обзор 2008 года по нелинейному уменьшению размерности этим вечером, и для примеров он упоминает только: Isomap (2000), локально линейное вложение (LLE) (2000), Hessian LLE (2003), Laplacian собственные карты (2003) и полуопределенные вложения (SDE) (2004).

Wayne
источник
3
Можете ли вы дать ссылку на любой из ресурсов, на которые вы ссылаетесь? (Например, какая статья в Википедии ", кажется, указывает ..."?)
gung - Восстановить Монику
11
Похоже, они потеряли популярность до такой степени, что я не знаю, на что ссылается СДЛ.
Мэтью Друри
5
видимо, самоорганизующаяся карта
Кристоф Ханк
SOM - это просто вариант многомерного масштабирования (MDS), который намного старше.
kjetil b halvorsen
@kjetilbhalvorsen: Есть ли у вас какие-либо упоминания о SOM и MDS? Насколько я понимаю, MDS носит глобальный характер (связан с PCA), а SOM - локальный. Или, может быть, я их неправильно понимаю.
Уэйн

Ответы:

18

Я думаю, что вы что-то делаете, отмечая влияние того, что машинное обучение в настоящее время преподносит как «лучшие» алгоритмы для уменьшения размерности. Хотя t-SNE продемонстрировал свою эффективность в соревнованиях, таких как Merck Viz Challenge , лично мне удалось внедрить SOM как для извлечения признаков, так и для двоичной классификации. Хотя, конечно, есть некоторые, которые отклоняют SOM без объяснения причин, кроме возраста алгоритма (посмотрите это обсуждение , за последние несколько лет был опубликован ряд статей, в которых были реализованы SOM и достигнуты положительные результаты (см. Mortazavi et al., 2013 ; Френкель и др., 2013например). Поиск в Google Scholar покажет, что SOM все еще используются в нескольких доменах приложений. Однако, как правило, лучшим алгоритмом для конкретной задачи является именно это - лучший алгоритм для конкретной задачи. Если случайный лес мог хорошо работать для конкретной задачи двоичной классификации, он может ужасно выполнять другую. То же самое относится к задачам кластеризации, регрессии и оптимизации. Это явление связано с теоремой об отсутствии бесплатного обеда , но это тема для другого обсуждения. В итоге, если SOM лучше всего работает для вас в конкретной задаче, это алгоритм, который вы должны использовать для этой задачи, независимо от того, что популярно.

Dirigo
источник
5

Я провел исследование по сравнению SOM с t-SNE и многим другим, а также предложил улучшение SOM, которое выводит его на новый уровень эффективности. Пожалуйста, проверьте это здесь и дайте мне знать ваши отзывы. Хотелось бы получить представление о том, что люди думают об этом, и стоит ли публиковать их на python для использования людьми.

IEEE ссылка на статью: http://ieeexplore.ieee.org/document/6178802/

Реализация Matlab. https://www.mathworks.com/matlabcentral/fileexchange/35538-cluster-reinforcement--cr--phase

Спасибо за ваш отзыв.

Наринэ Холл
источник
4
Добро пожаловать в Cross Validated! Было бы полезно дать краткое изложение ваших выводов и достигнутых вами улучшений, а также, возможно, для более прямого решения вопроса.
Scortchi - Восстановить Монику
1

Моя субъективная точка зрения заключается в том, что СДЛ менее известны и воспринимаются как менее «сексуальные», чем многие другие методы, но все еще весьма актуальны для определенных классов проблем. Вполне возможно, что они могли бы внести существенный вклад, если бы их использовали более широко. Они неоценимы на ранних этапах изучения исследовательских данных для понимания «ландшафта» или «топологии» многомерных данных.

Развитие таких библиотек, как Somoclu , и исследования, проведенные Генаэлем Кабанесом (среди многих других), показывают, что SOM по-прежнему актуальны.

Мэтт Уэнам
источник