Вопросы с тегом «machine-learning»

27
Оценка дисперсии в k-кратной перекрестной проверке

K-кратная перекрестная проверка может использоваться для оценки возможности обобщения данного классификатора. Могу ли я (или я должен) также вычислить объединенную дисперсию из всех проверочных прогонов, чтобы получить лучшую оценку ее дисперсии? Если нет, то почему? Я нашел документы, в которых...

26
Почему PCA чувствителен к выбросам?

В этой SE много постов, в которых обсуждаются надежные подходы к анализу главных компонентов (PCA), но я не могу найти ни одного хорошего объяснения того, почему PCA в первую очередь чувствителен к...

26
Какие классические обозначения в статистике, линейной алгебре и машинном обучении? И какие связи между этими обозначениями?

Когда мы читаем книгу, понимание обозначений играет очень важную роль в понимании содержания. К сожалению, разные сообщества имеют разные условные обозначения для формулировки модели и задачи оптимизации. Может ли кто-нибудь суммировать некоторые обозначения формулировки здесь и указать возможные...

26
Потеря обучения идет вниз и снова. Что происходит?

Моя потеря тренировки снижается, а затем снова растет. Это очень странно. Потеря перекрестной проверки отслеживает потерю обучения. Что происходит? У меня есть два сложенных LSTMS следующим образом (на Keras): model = Sequential() model.add(LSTM(512, return_sequences=True, input_shape=(len(X[0]),...

26
Количество особенностей против количества наблюдений

Существуют ли какие-либо документы / книги / идеи о взаимосвязи между количеством признаков и количеством наблюдений, которые необходимы для обучения «надежного» классификатора? Например, предположим, что у меня есть 1000 объектов и 10 наблюдений из двух классов в качестве обучающего набора и 10...

26
Один против всех и Один против одного в свм?

В чем разница между классификатором SVM «один против всех» и «один против одного»? Означает ли «один против всех» один классификатор, чтобы классифицировать все типы / категории нового изображения, и означает, что каждый тип / категория нового изображения классифицируется с помощью другого...

26
Стоит ли когда-нибудь стандартизировать бинарные переменные?

У меня есть набор данных с набором функций. Некоторые из них являются двоичными активен или запущен, неактивен или неактивен), а остальные являются действительными, например, .( 1 =(1=(1=4564,3420 =0=0=4564.3424564.3424564.342 Я хочу , чтобы кормить эти данные для алгоритма машинного обучения, так...

26
Нейронная сеть с пропуском слоев

Я заинтересован в регрессии с нейронными сетями. Нейронные сети с нулевыми скрытыми узлами + соединения с пропуском слоев являются линейными моделями. А как насчет тех же нейронных сетей, но со скрытыми узлами? Мне интересно, какова будет роль соединений с пропуском слоя? Интуитивно, я бы сказал,...

26
Как выбрать между ROC AUC и F1 баллом?

Я недавно закончил соревнование Kaggle, в котором по требованию соревнования использовался roc auc. До этого проекта я обычно использовал показатель f1 в качестве метрики для измерения производительности модели. В будущем мне будет интересно, как выбрать между этими двумя показателями? Когда...

26
В сущности, какова реальная разница между cv и repeatcv?

Это похоже на методы повторной выборки вопроса Карета , хотя в действительности это никогда не отвечало на эту часть вопроса согласованным образом. Функция поезда Caret предлагает cvи repeatedcv. В чем разница, скажем, делать: MyTrainControl=trainControl( method = "cv", number=5, repeats=5 ) против...

26
Зачем кому-то использовать KNN для регрессии?

Из того, что я понимаю, мы можем построить только регрессионную функцию, которая находится в интервале данных обучения. Например (необходима только одна из панелей): Как бы я мог предсказать будущее, используя регрессор KNN? Опять же, это, кажется, только приближает функцию, которая находится в...

26
Тематические модели и методы совместного использования слов

Популярные тематические модели, такие как LDA, обычно объединяют слова, которые обычно объединяются в одну и ту же тему (кластер). В чем основное различие между такими тематическими моделями и другими простыми подходами кластеризации на основе совпадений, такими как PMI? (PMI расшифровывается как...

26
Как оценить потери KLD и потери реконструкции в вариационном авто-кодировщике

почти во всех примерах кода, которые я видел в VAE, функции потерь определяются следующим образом (это код с тензорным потоком, но я видел похожее для theano, torch и т. д. Это также для коннета, но это также не слишком актуально) , только влияет на оси, суммы принимаются): # latent space loss. KL...

25
Процедура кластеризации, где каждый кластер имеет равное количество точек?

У меня есть несколько точек в R p , и я хочу сгруппировать точки так, чтобы:Икс= { х1, . , , , хN}Иксзнак равно{Икс1,,,,,ИксN}X=\{x_1,...,x_n\}рпрпR^p Каждый кластер содержит равное количество элементов . (Предположим, что число кластеров делит n .)ИксИксXNNn Каждый кластер в некотором смысле...

25
Как вы используете тестовый набор данных после перекрестной проверки?

В некоторых лекциях и уроках, которые я видел, они предлагают разделить ваши данные на три части: обучение, проверка и тестирование. Но не ясно, как следует использовать набор тестовых данных, и как этот подход лучше, чем перекрестная проверка по всему набору данных. Допустим, мы сохранили 20%...

25
Когда следует избегать Random Forest?

Хорошо известно, что случайные леса достаточно хорошо справляются с различными задачами, и их называют кожевниками методов обучения . Существуют ли какие-либо проблемы или особые условия, в которых следует избегать использования случайного...

25
Почему бы просто не выбросить нейронные сети и глубокое обучение? [закрыто]

Закрыто . Этот вопрос основан на мнении . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы ответить на него фактами и цитатами, отредактировав этот пост . Закрыто 2 года назад . Фундаментальная проблема с глубоким обучением и нейронными сетями в целом....

25
Каков распорядок дня ученого-машиностроителя?

Я магистрант CS в немецком университете, сейчас пишу свою диссертацию. Я закончу через два месяца, и мне придется принять очень трудное решение, если я продолжу работу над докторской диссертацией или найду работу в отрасли. Мои причины для получения докторской степени: Я очень любопытный человек ,...