Вопросы с тегом «machine-learning»

15

Является ли сумма двух деревьев решений эквивалентной одному дереву решений?

Предположим, у нас есть два дерева регрессии (дерево A и дерево B), которые отображают входные данные на выходные данные . Пусть \ hat {y} = f_A (x) для дерева A и f_B (x) для дерева B. Каждое дерево использует двоичные разбиения с гиперплоскостями в качестве разделяющих функций.x∈Rdx∈Rdx \in...

regression machine-learning cart

15

Нейронные сети против всего остального

Я не нашел удовлетворительного ответа на этот вопрос от Google . Конечно, если у меня есть данные порядка нескольких миллионов, то глубокое обучение - это путь. И я прочитал, что, когда у меня нет больших данных, тогда, возможно, лучше использовать другие методы в машинном обучении. Приведенная...

regression machine-learning classification neural-networks deep-learning

15

Что такое * искусственная нейронная сеть?

Когда мы углубимся в литературу по нейронным сетям , мы сможем идентифицировать другие методы с нейроморфными топологиями (архитектура, подобная «нейронной сети»). И я не говорю о теореме универсального приближения . Примеры приведены ниже. Тогда это заставляет меня задуматься: каково определение...

machine-learning neural-networks deep-learning unsupervised-learning supervised-learning

15

Почему один ReLU не может выучить ReLU?

В качестве продолжения Моей нейронной сети не могу даже изучить евклидово расстояние, я упростил еще больше и попытался обучить один ReLU (со случайным весом) одному ReLU. Это самая простая сеть, которая существует, и все же половину времени она не может сходиться. Если исходное предположение имеет...

machine-learning neural-networks optimization keras

14

Чем плавное повышение отличается от AdaBoost?

Существует вариант повышения, называемый gentleboost . Чем плавное повышение отличается от более известного AdaBoost

machine-learning boosting

14

Почему оценка ошибки случайного леса OOB улучшается при уменьшении количества выбранных объектов?

Я применяю алгоритм случайного леса в качестве классификатора для набора данных микрочипов, который разделен на две известные группы с тысячами объектов. После первого запуска я смотрю на важность функций и снова запускаю алгоритм дерева с 5, 10 и 20 наиболее важными функциями. Я обнаружил, что для...

r machine-learning classification random-forest

14

Заказ временных рядов для машинного обучения

Прочитав один из «Советов по исследованию» Р. Дж. Хиндмана о перекрестной проверке и временных рядах, я вернулся к своему старому вопросу, который я постараюсь сформулировать здесь. Идея состоит в том, что в задачах классификации или регрессии порядок данных не важен, и, следовательно, можно...

time-series machine-learning cross-validation

14

Какими должны быть оптимальные параметры для классификатора Random Forest?

В настоящее время я использую набор инструментов RF на MATLAB для двоичной классификации. Набор данных: 50000 образцов и более 250 функций Так, каково должно быть количество деревьев и случайным образом выбранная особенность на каждом разделении, чтобы вырастить деревья? Может ли какой-либо другой...

machine-learning classification random-forest

14

Когда можно использовать AdaBoost?

Как я слышал о классификаторе AdaBoost, который неоднократно упоминался на работе, я хотел лучше понять, как он работает и когда его можно использовать. Я прочитал несколько статей и учебных пособий, которые я нашел в Google, но есть некоторые аспекты классификатора, которые я до сих пор не могу...

machine-learning boosting adaboost

14

Как начать читать о майнинге данных?

Я новичок, который собирается начать читать о интеллектуальном анализе данных. У меня есть базовые знания по ИИ и статистике. Поскольку многие говорят, что машинное обучение также играет важную роль в интеллектуальном анализе данных, нужно ли читать о машинном обучении, прежде чем я смогу...

machine-learning references data-mining

14

Интерпретация расстояния от гиперплоскости в SVM

У меня есть несколько сомнений в интуитивном понимании SVM. Предположим, что мы обучили модель SVM для классификации с использованием некоторого стандартного инструмента, такого как SVMLight или LibSVM. Когда мы используем эту модель для прогнозирования тестовых данных, модель генерирует файл,...

machine-learning svm max-margin

14

Когда несбалансированные классы с избыточной / недостаточной выборкой, отличается ли максимальная точность от минимизации затрат на неправильную классификацию?

Прежде всего, я хотел бы описать некоторые распространенные макеты, которые используются в книгах Data Mining, и объяснить, как работать с несбалансированными наборами данных . Обычно основной раздел называется несбалансированными наборами данных, и они охватывают эти два подраздела: чувствительная...

machine-learning classification unbalanced-classes

14

Каковы «горячие алгоритмы» для машинного обучения?

Это наивный вопрос от того, кто начинает изучать машинное обучение. Я читаю в эти дни книгу «Машинное обучение: алгоритмическая перспектива» от Марсленда. Я считаю ее полезной в качестве вводной книги, но теперь я хотел бы перейти к продвинутым алгоритмам, которые в настоящее время дают лучшие...

machine-learning clustering bioinformatics

14

Кодирование категориальных функций в числа для машинного обучения

Многие алгоритмы машинного обучения, например нейронные сети, предполагают работу с числами. Поэтому, когда у вас есть категорические данные, вам необходимо преобразовать их. Под категориальным я имею в виду, например: Марки автомобилей: Audi, BMW, Chevrolet ... Идентификаторы пользователей: 1, 25,...

machine-learning many-categories

14

Что можно рассказать школьнику о статистике и машинном обучении?

На следующей неделе у нас есть стажер из местной школы в доме. Идея его короткой стажировки заключается в том, чтобы понять, как работает реальный мир и с чем связаны определенные рабочие места, как выглядит повседневная работа и т. Д. Теперь мне стало интересно, что можно рассказать / показать /...

machine-learning teaching

14

Работа с наборами данных с переменным количеством функций

Каковы некоторые подходы для классификации данных с переменным количеством признаков? В качестве примера рассмотрим проблему, в которой каждая точка данных представляет собой вектор точек x и y, и у нас не одинаковое количество точек для каждого экземпляра. Можем ли мы рассматривать каждую пару...

machine-learning missing-data

14

Градиентный спуск против функции lm () в R?

Я просматриваю видео в бесплатном онлайн-курсе Эндрю Нг по машинному обучению в Стэнфорде. Он рассматривает Gradient Descent как алгоритм для решения функций линейной регрессии и записи в Octave для его выполнения. Предположительно я мог бы переписать эти функции в R, но мой вопрос в том, разве...

r regression machine-learning gradient-descent

14

Скрытая марковская модель, порог

Я разработал концептуальную систему для распознавания звука с использованием моделей mfcc и скрытых марков. Это дает многообещающие результаты, когда я тестирую систему на известные звуки. Хотя система, когда вводится неизвестный звук, возвращает результат с наиболее близким соответствием, и оценка...

machine-learning hidden-markov-model pattern-recognition

14

Хорошие обзоры (обзоры, книги) о различных применениях цепи Маркова Монте-Карло (MCMC)?

Есть ли хорошие обзоры (обзоры, книги) о различных применениях цепи Маркова Монте-Карло (MCMC)? Я видел Марковскую цепь Монте-Карло на практике , но эта книга кажется немного старой. Есть ли еще книги с обновлениями по различным приложениям MCMC в таких областях, как машинное обучение, компьютерное...

machine-learning mcmc inference references application

14

Как бороться со смесью двоичных и непрерывных входов в нейронных сетях?

Я использую пакет nnet в R, чтобы попытаться построить ANN для прогнозирования цен на недвижимость для квартир (личный проект). Я новичок в этом и не имею математического образования, поэтому, пожалуйста, держись со мной. У меня есть входные переменные, которые являются двоичными и непрерывными....

r machine-learning data-transformation neural-networks nnet