Окончательное редактирование со всеми обновленными ресурсами:
Для проекта я применяю алгоритмы машинного обучения для классификации.
Задача: довольно ограниченные помеченные данные и гораздо больше непомеченных данных.
Цели:
- Применить классификацию под наблюдением
- Применять как-то полу-контролируемый процесс маркировки (известный как активное обучение)
Я нашел много информации из исследовательских работ, таких как применение EM, Transductive SVM или S3VM (Semi Supervised SVM), или как-то с использованием LDA и т. Д. Даже по этой теме мало книг.
Вопрос: Где находятся реализации и практические источники?
Окончательное обновление (на основе справок, предоставленных mpiktas, bayer и Dikran Marsupial)
Обучение под наблюдением:
Активное изучение:
- Dualist : реализация активного обучения с исходным кодом по классификации текста
- Эта веб-страница служит прекрасным обзором активного обучения.
- Экспериментальная Конструкторская мастерская: здесь .
Глубокое обучение:
- Вступительное видео здесь .
- Общий сайт .
- Стэнфордское учебное пособие по неконтролируемому обучению и углубленному обучению .
machine-learning
classification
software
svm
text-mining
расслаиваться
источник
источник
Ответы:
Кажется, что глубокое обучение может быть очень интересным для вас. Это очень недавняя область моделей глубокого коннекционизма, которые проходят предварительную подготовку без присмотра, а затем настраиваются под наблюдением. Точная настройка требует гораздо меньшего количества образцов, чем предварительная подготовка.
Чтобы намочить язык, я рекомендую [Семантиг Хашинг Салахутдинов, Хинтон . Посмотрите на коды, которые он находит для различных документов корпуса Reuters: (без присмотра!)
Если вам нужен какой-то реализованный код, посмотрите deeplearning.net . Я не верю, что есть нестандартные решения.
источник
Некоторое время назад Изабель Гийон (и ее коллеги) организовали соревнование по активному обучению, материалы которого опубликованы здесь (открытый доступ). Преимущество этого состоит в том, что он достаточно практичен, и вы можете напрямую сравнивать характеристики различных подходов в соответствии с непредвзятым (в разговорном смысле) протоколом (случайный выбор шаблонов на удивление трудно преодолеть).
источник
Вот хороший список библиотек.
http://www.infoworld.com/article/2608742/predictive-analytics/5-ways-to-add-machine-learning-to-java--javascript--and-more.html
источник