В контексте машинного обучения, в чем разница между
- неконтролируемое обучение
- контролируемое обучение и
- полу-контролируемое обучение?
И каковы некоторые из основных алгоритмических подходов?
В контексте машинного обучения, в чем разница между
И каковы некоторые из основных алгоритмических подходов?
Ответы:
Как правило, проблемы машинного обучения могут рассматриваться как варианты оценки функции для классификации, прогнозирования или моделирования.
В контролируемом обучении каждый снабжен входными ( , , ...,) и выходными ( , , ...,) и сталкивается с проблемой поиска функции, которая приближает это поведение обобщенным образом. Результатом может быть метка класса (в классификации) или действительное число (в регрессии) - это «надзор» в контролируемом обучении.x1 x2 y1 y2
В случае неконтролируемого обучения , в базовом случае вы получаете входные данные , , ..., но не предоставляются ни целевые выходные данные, ни вознаграждения из его среды. Основываясь на проблеме (классифицировать или прогнозировать) и ваших базовых знаниях о пробоотборном пространстве, вы можете использовать различные методы: оценка плотности (оценка некоторого базового PDF для прогнозирования), кластеризация с помощью k-средних (классификация немаркированных реальных данных), k- режимы кластеризации (классификация немаркированных категориальных данных) и т. д.x1 x2
Обучаемое обучение под контролем включает в себя оценку функции на помеченных и немаркированных данных. Этот подход мотивируется тем фактом, что помеченные данные часто являются дорогостоящими для создания, в то время как немеченые данные, как правило, нет. Проблема здесь в основном связана с техническим вопросом о том, как обрабатывать данные, смешанные таким образом. Посмотрите это Обследование Литературы Обучения Полу-контролируемого для получения дополнительной информации о полу-контролируемых методах обучения.
В дополнение к этим видам обучения, есть и другие, такие как армирующего обучения посредством метода обучения взаимодействует с окружающей средой, производя действия , ,. , .. которые производят награды или наказания , , ...a1 a2 r1 r2
источник
Обучение без учителя
Обучение без учителя - это когда у вас нет данных, помеченных для обучения. Примерами этого часто являются методы кластеризации.
Контролируемое обучение
В этом случае ваши тренировочные данные существуют из помеченных данных. Проблема, которую вы решаете здесь, часто заключается в прогнозировании меток для точек данных без меток.
Полу-контролируемое обучение
В этом случае используются как помеченные, так и непомеченные данные. Это, например, может использоваться в сетях глубокого убеждения, где некоторые уровни изучают структуру данных (без контроля), а один уровень используется для классификации (обучение с использованием данных, контролируемых)
источник
Я не думаю, что контролируемый / неконтролируемый - лучший способ думать об этом. Для интеллектуального анализа данных лучше подумать о том, что вы пытаетесь сделать. Есть четыре основные задачи:
прогнозирование. если вы предсказываете реальное число, оно называется регрессией. если вы предсказываете целое число или класс, это называется классификацией.
моделирование. моделирование - это то же самое, что и прогнозирование, но эта модель понятна людям. Нейронные сети и опорные векторные машины прекрасно работают, но не дают понятных моделей [1]. деревья решений и классическая линейная регрессия - примеры простых для понимания моделей.
сходство. если вы пытаетесь найти естественные группы атрибутов, это называется факторный анализ. если вы пытаетесь найти естественные группы наблюдений, это называется кластеризацией.
ассоциация. это очень похоже на корреляцию, но для огромных наборов двоичных данных.
[1] Очевидно, Goldman Sachs создал тонны отличных нейронных сетей для предсказания, но затем никто не понял их, поэтому им пришлось написать другие программы, чтобы попытаться объяснить нейронные сети.
источник