Вопросы с тегом «machine-learning»

11
Почему неправильно интерпретировать SVM как вероятности классификации?

Я понимаю, что SVM очень похож на логистическую регрессию (LR), то есть взвешенная сумма признаков передается в сигмовидную функцию, чтобы получить вероятность принадлежности к классу, но вместо кросс-энтропийной (логистической) потери Функция тренировки выполняется с использованием потери шарнира....

11
Искусственные нейронные сети, эквивалентные линейной регрессии с полиномиальными признаками?

Я хочу улучшить свое понимание нейронных сетей и их преимуществ по сравнению с другими алгоритмами машинного обучения. Мое понимание, как показано ниже, и мой вопрос: Можете ли вы исправить и дополнить мое понимание, пожалуйста? :) Мое понимание: (1) Искусственные нейронные сети = функция, которая...

11
Почему бы нам просто не изучить гиперпараметры?

Я реализовывал довольно популярную статью « ОБЪЯСНЕНИЕ И ПРИМЕНЕНИЕ ОБОБЩЕННЫХ ПРИМЕРОВ », и в статье она обучает противоборствующей целевой функции. J '' (θ) = αJ (θ) + (1 - α) J '(θ). Он рассматривает α как гиперпараметр. α может быть 0,1, 0,2, 0,3 и т. д. Независимо от этой конкретной статьи,...

11
Что именно означает заимствовать информацию?

Я часто говорю, что люди заимствуют или обмениваются информацией в байесовских иерархических моделях. Кажется, я не могу получить прямой ответ о том, что это на самом деле означает и является ли это уникальным для байесовских иерархических моделей. Я вроде понял: некоторые уровни в вашей иерархии...

11
Вывод без правдоподобия - что это значит?

Недавно я узнал о методах «без правдоподобия», которые обсуждаются в литературе. Однако мне не ясно, что означает, что метод логического вывода или метод оптимизации не имеют правдоподобия . В машинном обучении цель обычно состоит в том, чтобы максимизировать вероятность того, что некоторые...

11
Пророк из Facebook отличается от линейной регрессии?

Итак, что я прочитал о пророке Facebook, так это то, что он в основном разбивает временные ряды на тренды и сезонность. Например, аддитивная модель будет записана как: Y( т ) = г( t ) + s ( t ) + h ( t ) + eTY(T)знак равног(T)+s(T)+час(T)+еT y(t) = g(t) + s(t) + h(t) + e_t с TTt время г( т...

10
Создание интерфейсов MATLAB и R для C5.0 Росса Куинлана

Я рассматриваю построение интерфейсов MATLAB и R для Ross Куинланом «s C5.0 (для тех , кто не знаком с ним, C5.0 является алгоритм дерева решений и пакет программного обеспечения, расширение C4.5 ), и я пытаюсь получить представление о компонентах, которые мне нужно написать. Единственная...

10
Документированные / воспроизводимые примеры успешного применения эконометрических методов в реальных условиях?

Этот вопрос может показаться очень широким, но вот что я ищу. Я знаю, что есть много прекрасных книг об эконометрических методах и много отличных пояснительных статей об эконометрических методах. Существуют даже превосходные воспроизводимые примеры эконометрики, как описано в этом перекрестном...

10
Лучшие методы выбора признаков для непараметрической регрессии

Вопрос новичка здесь. В настоящее время я выполняю непараметрическую регрессию, используя пакет np в R. У меня есть 7 функций, и я использую метод грубой силы, я определил лучшие 3. Но скоро у меня будет гораздо больше, чем 7 функций! Мой вопрос заключается в том, каковы в настоящее время лучшие...

10
Значение (GAM) коэффициентов регрессии, когда вероятность модели не значительно выше нуля

Я запускаю регрессию на основе GAM, используя пакет R gamlss и предполагаю, что бета-распределение данных с нулевым раздуванием. У меня есть только один объясняющей переменной в моей модели, так это в основном: mymodel = gamlss(response ~ input, family=BEZI). Алгоритм дает мне коэффициент для...

10
Обоснование использования AUC?

Особенно в области компьютерной науки, ориентированной на информатику, AUC (область под характеристической кривой оператора приемника) является популярным критерием для оценки классификаторов. Каковы основания для использования AUC? Например, есть ли конкретная функция потерь, для которой...

10
Сравните R-квадрат из двух разных моделей Random Forest

Я использую пакет randomForest в R для разработки модели случайного леса, чтобы попытаться объяснить непрерывный результат в «широком» наборе данных с большим количеством предикторов, чем выборок. В частности, я подгоняю одну модель RF, позволяющую процедуре выбрать из набора ~ 75 переменных...

10
Какой алгоритм можно использовать для прогнозирования использования расходных материалов с учетом данных прошлых покупок?

Размышляя о предположительно простой, но интересной проблеме, я хотел бы написать код для прогнозирования расходных материалов, которые мне понадобятся в ближайшем будущем, учитывая полную историю моих предыдущих покупок. Я уверен, что проблема такого рода имеет более общее и хорошо изученное...

10
Работа с очень большими наборами данных временных рядов

У меня есть доступ к очень большому набору данных. Данные взяты из записей MEG людей, слушающих музыкальные отрывки из одного из четырех жанров. Данные следующие: 6 предметов 3 экспериментальных повторения (эпохи) 120 испытаний за эпоху 8 секунд данных на испытание при 500 Гц (= 4000 отсчетов) по...

10
Помимо ядер Фишера

Какое-то время казалось, что ядра Фишера могут стать популярными, поскольку они, похоже, являются способом построения ядер из вероятностных моделей. Однако я редко видел, чтобы они использовались на практике, и у меня есть все основания полагать, что они не очень хорошо работают. Они полагаются на...

10
Подходит при обучении из огромных наборов данных?

По сути, есть два распространенных способа обучения на огромных наборах данных (когда вы сталкиваетесь с ограничениями времени / пространства): Обман :) - используйте только «управляемое» подмножество для обучения. Потеря точности может быть незначительной из-за закона убывающей отдачи -...

10
Являются ли MFCC оптимальным методом представления музыки в поисковой системе?

Техника обработки сигналов, Мелкополосный Кепстр , часто используется для извлечения информации из музыкальной пьесы для использования в задаче машинного обучения. Этот метод дает кратковременный спектр мощности, а коэффициенты используются в качестве входных данных. При проектировании систем...

10
Относительно использования биграммы (N-грамма) для построения векторного элемента для текстового документа

Традиционный подход к построению объектов для интеллектуального анализа текста - это подход «мешок слов», и его можно усовершенствовать с помощью tf-idf для настройки вектора объектов, характеризующего данный текстовый документ. В настоящее время я пытаюсь использовать модель языка биграмм или...

10
R линейная регрессия категориальной переменной «скрытое» значение

Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод,...

10
Как сравнить точность двух разных моделей, используя статистическую значимость

Я работаю над прогнозированием временных рядов. У меня есть два набора данных: и . У меня есть три модели прогнозирования: M1, M2, M3 . Все эти модели обучаются с использованием выборок в наборе данных D1 , и их производительность измеряется с использованием выборок в наборе данных D2 . Допустим,...