Вопросы с тегом «classification»

Экземпляр контролируемого обучения, который определяет категорию или категории, к которым принадлежит новый экземпляр набора данных.

130
Как установить веса классов для несбалансированных классов в Керасе?

Я знаю, что в Керасе есть возможность при подборе class_weightsсловаря параметров, но я не смог найти ни одного примера. Будет ли кто-то так любезно предоставить? Кстати, в этом случае подходящей практикой является просто взвесить класс меньшинства пропорционально его...

103
Микро-средняя и Макро-средняя производительность в настройке классификации мультикласса

Я пробую настройку мультиклассовой классификации с 3 классами. Распределение классов искажено, большая часть данных попадает в 1 из 3 классов. (метки классов 1,2,3, при этом 67,28% данных попадают в метку класса 1, 11,99% данных в классе 2 и остаются в классе 3) Я обучаю мультиклассовый...

41
Как подготовить / дополнить изображения для нейронной сети?

Я хотел бы использовать нейронную сеть для классификации изображений. Я начну с предварительно обученного CaffeNet и обучу его для моего приложения. Как подготовить входные изображения? В этом случае все изображения имеют один и тот же объект, но с вариациями (подумайте: контроль качества). Они...

41
Косинусное сходство против точечного произведения как метрики расстояния

Похоже, что косинусное сходство двух признаков - это просто их точечное произведение, масштабированное произведением их величин. Когда косинусное сходство делает лучшую метрику расстояния, чем скалярное произведение? Т.е. имеют ли точечное произведение и косинусное сходство разные сильные или...

30
Глубокое обучение против повышения градиента: когда и что использовать?

У меня проблема с большими данными с большим набором данных (например, 50 миллионов строк и 200 столбцов). Набор данных состоит из около 100 числовых столбцов и 100 категориальных столбцов и столбца ответов, представляющего проблему двоичного класса. Мощность каждого из категориальных столбцов...

30
Какая модель Keras лучше всего подходит для мультиклассовой классификации?

Я работаю на исследования, где необходимо классифицировать один из WINNER три события = ( win, draw, lose) WINNER LEAGUE HOME AWAY MATCH_HOME MATCH_DRAW MATCH_AWAY MATCH_U2_50 MATCH_O2_50 3 13 550 571 1.86 3.34 4.23 1.66 2.11 3 7 322 334 7.55 4.1 1.4 2.17 1.61 Моя текущая модель: def...

29
Краткое руководство по обучению сильно несбалансированных наборов данных

У меня проблема с классификацией примерно 1000 положительных и 10000 отрицательных образцов в тренировочном наборе. Так что этот набор данных довольно несбалансированный. Обычный случайный лес просто пытается пометить все тестовые образцы как мажоритарный класс. Некоторые хорошие ответы о...

29
Почему xgboost намного быстрее, чем sklearn GradientBoostingClassifier?

Я пытаюсь обучить модели повышения градиента более чем на 50 тыс. Примеров с 100 числовыми функциями. XGBClassifierобрабатывает 500 деревьев в течение 43 секунд на моей машине, в то время как GradientBoostingClassifierобрабатывает только 10 деревьев (!) за 1 минуту и ​​2 секунды :( Я не стал...

28
Какие алгоритмы я должен использовать для выполнения классификации работы на основе данных резюме?

Обратите внимание, что я делаю все в R. Проблема заключается в следующем: В основном, у меня есть список резюме (резюме). Некоторые кандидаты будут иметь опыт работы раньше, а некоторые нет. Цель здесь состоит в том, чтобы: основываясь на тексте их резюме, я хочу классифицировать их по различным...

28
Когда использовать Random Forest поверх SVM и наоборот?

Когда можно использовать Random Forestснова SVMи наоборот? Я понимаю, что cross-validationсравнение моделей является важным аспектом выбора модели, но здесь я хотел бы узнать больше о практических правилах и эвристике этих двух методов. Может кто-нибудь объяснить, какие тонкости, сильные и слабые...

28
Понимание Forex_Proba из MultiOutputClassifier

Я следую этому примеру на веб-сайте scikit-learn, чтобы выполнить многопользовательскую классификацию с использованием модели Random Forest. from sklearn.datasets import make_classification from sklearn.multioutput import MultiOutputClassifier from sklearn.ensemble import RandomForestClassifier...

21
Являются ли алгоритмы дерева решений линейными или нелинейными

Недавно моего друга спросили, являются ли алгоритмы дерева решений линейными или нелинейными алгоритмами в интервью. Я пытался найти ответы на этот вопрос, но не смог найти удовлетворительного объяснения. Может кто-нибудь ответить и объяснить решение этого вопроса? Кроме того, каковы некоторые...

21
Как получить точность, F1, точность и отзыв, для модели Keras?

Я хочу вычислить точность, отзыв и оценку F1 для моей двоичной модели KerasClassifier, но не нашел никакого решения. Вот мой фактический код: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the...

20
В чем разница между классификацией текста и тематическими моделями?

Я знаю разницу между кластеризацией и классификацией в машинном обучении, но я не понимаю разницу между классификацией текста и тематическим моделированием для документов. Могу ли я использовать моделирование темы поверх документов, чтобы определить тему? Могу ли я использовать методы классификации...

20
Несбалансированные мультиклассовые данные с XGBoost

У меня есть 3 класса с этим распределением: Class 0: 0.1169 Class 1: 0.7668 Class 2: 0.1163 И я использую xgboostдля классификации. Я знаю, что есть параметр с именем scale_pos_weight. Но как это обрабатывается для случая «мультикласса», и как я могу правильно установить...

20
Почему большинство опубликованных работ по медицинской визуализации пытаются уменьшить количество ложных срабатываний?

При обработке медицинских изображений большинство опубликованных работ пытаются снизить частоту ложных срабатываний (FPR), тогда как в действительности ложные отрицания более опасны, чем ложные срабатывания. Что за этим...

20
Что значит «делиться параметрами между объектами и классами»

При чтении этой статьи есть строка, в которой говорится, что «линейные классификаторы не разделяют параметры между функциями и классами». В чем смысл этого утверждения? Означает ли это, что линейные классификаторы, такие как логистическая регрессия, нуждаются во взаимно независимых...

19
Текстовая категоризация: объединение различных видов функций

Проблема, с которой я сталкиваюсь, состоит в классификации коротких текстов на несколько классов. Мой текущий подход заключается в использовании частотных терминов tf-idf и изучении простого линейного классификатора (логистическая регрессия). Это работает достаточно хорошо (около 90% макроса F-1 в...

18
Когда можно использовать манхэттенское расстояние как противоположное евклидову?

Я пытаюсь найти хороший аргумент о том, почему в машинном обучении можно использовать расстояние Манхэттена над евклидовым расстоянием . До сих пор я нашел хороший аргумент в этой лекции в Массачусетском технологическом институте . В 36:15 вы можете увидеть на слайдах следующее утверждение: «Обычно...

18
В чем разница между Inception v2 и Inception v3?

В статье « Пройдя глубже с извилинами» описывается GoogleNet, в которой содержатся оригинальные начальные модули: Переход к началу v2 заключался в том, что они заменили свертки 5x5 на две последовательные свертки 3x3 и применили объединение: В чем разница между Inception v2 и Inception...