Как применять нейронные сети в задачах классификации по нескольким меткам?

12

Описание:

Пусть проблемная область будет классификацией документов, где существует набор векторов признаков, каждый из которых принадлежит одному или нескольким классам. Например, документ doc_1может принадлежать Sportsи Englishкатегориям.

Вопрос:

Используя нейронную сеть для классификации, какой будет метка для вектора признаков? будет ли это вектор, составляющий все классы, так что значение 0 дается не относящимся к классу, а 1 - соответствующим классам? Итак, если список меток класса есть [Sports, News, Action, English, Japanese], то для документа doc_1метка будет [1, 0, 0, 1, 0]?

любознательный
источник

Ответы:

3

Да, при изучении нескольких меток информация меток часто кодируется как описанный вами двоичный вектор. Это также проще для оценки.

Мы можем захотеть проверить MULAN , библиотеку Java с открытым исходным кодом для изучения нескольких меток. Это расширение Weka, в котором реализовано много классификаторов с несколькими метками, включая нейронные сети. Например, вы можете найти BP-MLL здесь .

Вэйвэй
источник
8

Кажется, это бумага, которую вы ищете:

Мин-Лин Чжан и Чжи-Хуа Чжоу: многокомпонентные нейронные сети с приложениями к функциональной геномике и категоризации текста

Из аннотации:

В обучении с использованием нескольких меток каждый экземпляр в обучающем наборе связан с набором меток, и задача состоит в том, чтобы вывести набор меток, размер которых априори неизвестен для каждого невидимого экземпляра. В этой статье эта проблема решается в способ, которым предложен алгоритм нейронной сети с именем BP-MLL, то есть обратное распространение для обучения по нескольким меткам. ... Приложения к двум реальным задачам обучения с использованием нескольких меток, а именно к функциональной геномике и категоризации текста, показывают, что производительность BP-MLL превосходит производительность некоторых хорошо известных алгоритмов обучения с несколькими метками.

Штеффен
источник