Вопросы с тегом «machine-learning»

14
Прогнозирующие модели: статистика не может превзойти машинное обучение? [закрыто]

Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он был сосредоточен только на одной проблеме, отредактировав этот пост . Закрыто 2 года назад . В настоящее время я слежу за магистерской...

14
Каково максимальное значение дивергенции Кульбака-Лейблера (КЛ)

Я собираюсь использовать дивергенцию KL в своем коде Python, и я получил это руководство . На этом уроке реализовать дивергенцию KL довольно просто. kl = (model * np.log(model/actual)).sum() Как я понимаю, распределение вероятностей modelи actualдолжно быть <= 1. Мой вопрос: какова максимальная...

14
Статистическая значимость (p-значение) для сравнения двух классификаторов в отношении (среднего) ROC AUC, чувствительности и специфичности

У меня есть тестовый набор из 100 случаев и два классификатора. Я генерировал прогнозы и вычислял ROC AUC, чувствительность и специфичность для обоих классификаторов. Вопрос 1: Как я могу вычислить значение p, чтобы проверить, является ли одно значительно лучше другого по всем показателям (ROC AUC,...

14
Случайный лес и алгоритм дерева решений

Случайный лес - это набор деревьев решений, следующих концепции бэгинга. Когда мы переходим от одного дерева решений к следующему дереву решений, то как информация, полученная с помощью последнего дерева решений, переходит к следующему? Потому что, насколько я понимаю, нет ничего лучше обученной...

14
Как обрабатывать многократные серии одновременно?

У меня есть набор данных, включающий спрос на несколько продуктов (1200 продуктов) за 25 периодов, и мне нужно спрогнозировать спрос каждого продукта на следующий период. Сначала я хотел использовать ARIMA и обучать модели для каждого продукта, но из-за количества продуктов и настройки параметров...

13
Уменьшение размерности SVD для временных рядов различной длины

Я использую Singular Value Decomposition в качестве техники уменьшения размерности. Заданные Nвекторы размерностиD идея состоит в том, чтобы представить элементы в преобразованном пространстве некоррелированных измерений, в котором большая часть информации данных содержится в собственных векторах...

13
GLMNET или LARS для вычисления решений LASSO?

Я хотел бы получить коэффициенты для задачи LASSO ||Y−Xβ||+λ||β||1.||Y−Xβ||+λ||β||1.||Y-X\beta||+\lambda ||\beta||_1. Проблема в том, что функции glmnet и lars дают разные ответы. Для функции glmnet я спрашиваю коэффициенты вместо просто λ , но я все еще получаю разные...

13
Обучение под наблюдением с «редкими» событиями, когда редкость обусловлена ​​большим количеством контр-фактических событий

Предположим, вы наблюдаете «совпадения» между покупателями и продавцами на рынке. Вы также можете наблюдать характеристики как покупателей, так и продавцов, которые вы хотели бы использовать для прогнозирования будущих совпадений и выработки рекомендаций для обеих сторон рынка. Для простоты...

13
Оптимальный алгоритм решения n-вооруженных бандитских задач?

Я читал о ряде алгоритмов для решения проблем с n-вооруженными бандитами, таких как -greedy, softmax и UCB1, но у меня возникли некоторые проблемы при выборе лучшего подхода для минимизации сожалений.εε\epsilon Существует ли известный оптимальный алгоритм для решения проблемы вооруженного бандита?...

13
Как лучше всего изучить основы вероятности, необходимые для алгоритмов машинного обучения?

Несколько лет назад я проходил курс вероятностного обучения в университете, но сейчас я прорабатываю некоторые алгоритмы машинного обучения, и некоторые математические навыки просто сбивают с толку. В частности, сейчас я изучаю алгоритм EM (максимизация ожидания), и кажется, что между тем, что...

13
Существуют ли учебные пособия по Байесовской теории вероятностей или графические модели на примере?

Я видел ссылки на изучение байесовской теории вероятностей в R, и мне было интересно, есть ли еще что-то подобное, возможно, конкретно в Python? Направлены на изучение байесовской теории вероятностей, умозаключений, оценки максимального правдоподобия, графических моделей и тому...

13
Почему производные функции используются в нейронных сетях?

Например, кто-то хочет предсказать цены на жилье и имеет две входные характеристики: длину и ширину дома. Иногда, один также включает в себя «производные» полиномиальные входные объекты, такие как площадь, которая является длиной * шириной. 1) Какой смысл включать производные функции? Разве...

13
Проблема с либсвм е1071?

У меня есть набор данных с двумя перекрывающимися классами, семь точек в каждом классе, точки находятся в двухмерном пространстве. В R, и я бегу svmиз e1071пакета, чтобы построить разделяющую гиперплоскость для этих классов. Я использую следующую команду: svm(x, y, scale = FALSE, type =...

13
Поиск лучших функций в моделях взаимодействия

У меня есть список белков с их характеристиками. Пример таблицы выглядит так: ...............Feature1...Feature2...Feature3...Feature4 Protein1 Protein2 Protein3 Protein4 Ряды - это белки, а столбцы - это особенности. У меня также есть список белков, которые также взаимодействуют; например...

13
Какие хорошие, свободно доступные журналы для отслеживания последних событий в области машинного обучения?

Не стесняйтесь заменять «журналы» любым другим полезным порталом знаний. Я заинтересован в том, чтобы следить за новыми разработками в области машинного обучения с целью практического применения. Я не академик, стремящийся опубликовать свою собственную работу (по крайней мере, не в этой области),...

13
Ресурсы для изучения того, как реализовать методы ансамбля

Я теоретически (вроде) понимаю, как они будут работать, но не уверен, как на самом деле использовать метод ансамбля (такой как голосование, взвешенные смеси и т. Д.). Каковы хорошие ресурсы для реализации методов ансамбля? Существуют ли какие-либо конкретные ресурсы относительно реализации в...

13
Подходящие методы кластеризации для временных данных?

У меня есть временные данные частот активности. Я хочу идентифицировать кластеры в данных, которые указывают различные периоды времени с подобными уровнями активности. В идеале я хочу идентифицировать кластеры без указания количества кластеров априори. Каковы подходящие методы кластеризации? Если в...