Вопросы с тегом «machine-learning»

12

Я не могу найти общее определение того, что такое классификатор? Я понимаю, как это может работать, но я не могу прийти к

machine-learning classification

12

Рекурсивный (онлайн) регуляризованный алгоритм наименьших квадратов

Может ли кто-нибудь указать мне направление онлайнового (рекурсивного) алгоритма регуляризации Тихонова (регуляризованных наименьших квадратов)? В автономном режиме я вычисляю β^=(XTX+λI)−1XTYβ^=(XTX+λI)−1XTY\hat\beta=(X^TX+λI)^{−1}X^TY используя мой исходный набор данных, где λλλ находится с...

regression machine-learning least-squares regularization online

12

Точный критерий Фишера и гипергеометрическое распределение

Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст мешал....

fishers-exact hypergeometric clustering supervised-learning modeling econometrics r regression residuals heteroscedasticity independence distributions self-study matlab libsvm self-study conditional-probability conditional-expectation hypothesis-testing self-study multiple-comparisons mode statistical-significance chi-squared multiple-comparisons maximum-likelihood poisson-process optimization uncertainty genetic-algorithms bayesian model-selection overfitting maximum-likelihood optimization approximation r prediction model-evaluation r machine-learning survival neural-networks cox-model machine-learning bayesian bayesian-network hierarchical-bayesian pooling

12

Можете ли вы сравнить различные методы кластеризации в наборе данных без какой-либо базовой правды путем перекрестной проверки?

В настоящее время я пытаюсь проанализировать набор данных текстового документа, который не имеет основательной правды. Мне сказали, что вы можете использовать k-кратную перекрестную проверку для сравнения различных методов кластеризации. Однако примеры, которые я видел в прошлом, используют...

machine-learning clustering cross-validation unsupervised-learning

12

Как рассчитать точность и вспомнить в матрице путаницы 3 x 3

Predicted class Cat Dog Rabbit Actual class Cat 5 3 0 Dog 2 3 1 Rabbit 0 2 11 Как я могу рассчитать точность и вспомнить, чтобы стало легко рассчитать F1-счет. Нормальная матрица путаницы - это размерность 2 x 2. Тем не менее, когда он становится 3 х 3, я не знаю, как рассчитать точность и...

machine-learning precision-recall

12

Понимание параметров функции Gaussian Basis для использования в линейной регрессии

Я хотел бы применить базисную функцию Гаусса в реализации линейной регрессии. К сожалению, мне сложно понять пару параметров в базовой функции. В частности, и .σμμ\muσσ\sigma Мой набор данных - это матрица размером 10 000 x 31 10000 образцов и 31 функций. Я читал, что «Каждая базисная функция...

regression machine-learning basis-function

12

Как сравнить два алгоритма ранжирования?

Я хочу сравнить два алгоритма ранжирования. В этих алгоритмах клиент указывает некоторые условия в своем поиске. В соответствии с требованиями клиента, этот алгоритм должен назначать оценку для каждого элемента в базе данных и извлекать элементы с наивысшими оценками. Я прочитал различные темы,...

machine-learning precision-recall average-precision

12

Есть ли разница между дистанционным наблюдением, самообучением, самообучаемым обучением и слабым наблюдением?

Из того, что я прочитал: Дистанционное наблюдение : A Distant supervision algorithm usually has the following steps: 1] It may have some labeled training data 2] It "has" access to a pool of unlabeled data 3] It has an operator that allows it to sample from this unlabeled data and label them and...

machine-learning terminology unsupervised-learning semi-supervised

12

Алгоритмы машинного обучения для панельных данных

В этом вопросе. Существует ли метод построения деревьев решений, который учитывает структурированные / иерархические / многоуровневые предикторы? - они упоминают метод данных панели для деревьев. Существуют ли специальные методы данных панели для поддержки векторных машин и нейронных сетей? Если...

r machine-learning svm panel-data cart

12

Учебник по усилению обучения

Я ищу учебник / лекционные заметки в обучении подкреплению. Мне нравится «Введение в статистическое обучение» , но, к сожалению, они не охватывают эту тему. Я знаю, что книга Саттона и Барто является стандартным справочником, и, возможно, НДП также хороша, но они датированы 1997-98 гг., И я...

machine-learning references

12

Различия между рандомизированной логистической регрессией и простой ванильной логистической регрессией

Я хотел бы знать различия между рандомизированной логистической регрессией (RLR) и простой логистической регрессией (LR), поэтому я читаю статью «Выбор стабильности» , опубликованную Meinshausen et al. ; однако я не понимаю, что такое RLR и каковы различия между RLR и LR. Может ли кто-нибудь...

machine-learning logistic

12

Существуют ли современные способы использования джекнифинга?

Вопрос: Bootstrapping превосходит джекнифинг; однако мне интересно, есть ли случаи, когда джекнифинг является единственным или, по крайней мере, жизнеспособным вариантом для характеристики неопределенности из оценок параметров. Кроме того, в практических ситуациях, насколько предвзятый / неточный...

machine-learning cross-validation bootstrap maximum-entropy jackknife

12

В чем разница между нейронной сетью и персептроном?

Есть ли разница между терминами «нейронная сеть» и

machine-learning neural-networks terminology perceptron

12

Как понять, что MLE дисперсии смещен в распределении Гаусса?

Я читаю PRML, и я не понимаю картину. Не могли бы вы дать несколько советов, чтобы понять картину и почему MLE дисперсии в распределении Гаусса смещены? формула 1.55: формула 1.56 σ 2 M L E =1μMLE=1N∑n=1NxnμMLE=1N∑n=1Nxn \mu_{MLE}=\frac{1}{N} \sum_{n=1}^N x_n...

machine-learning self-study maximum-likelihood

12

Когда использовать байесовские сети поверх других подходов машинного обучения?

Я ожидаю, что не может быть никакого определенного ответа на этот вопрос. Но в прошлом я использовал несколько алгоритмов машинного обучения и пытаюсь узнать о байесовских сетях. Я хотел бы понять, при каких обстоятельствах или для каких типов проблем вы бы выбрали использование байесовской сети по...

machine-learning bayesian-network

12

почему метод повышения чувствительности к выбросам

Я нашел много статей, в которых говорится, что методы повышения чувствительны к выбросам, но нет статей, объясняющих почему. По моему опыту, выбросы плохи для любого алгоритма машинного обучения, но почему методы повышения выделяются как особенно чувствительные? Как бы оценили следующие алгоритмы с...

machine-learning svm outliers cart boosting

12

VC измерение регрессионных моделей

В серии лекций « Изучение данных» профессор упоминает, что измерение VC измеряет сложность модели по тому, на сколько точек данная модель может разбиться. Так что это прекрасно работает для моделей классификации, где мы можем сказать из N точек, если классификатор способен эффективно разбить k...

regression machine-learning vc-dimension

12

Как рассчитать вес критерия Фишера?

Я изучаю распознавание образов и машинное обучение, и я столкнулся со следующим вопросом. Рассмотрим задачу классификации двух классов с равной вероятностью предшествующего класса P(D1)=P(D2)=12P(D1)=P(D2)=12P(D_1)=P(D_2)= \frac{1}{2} и распределение экземпляров в каждом классе, заданное...

machine-learning self-study classification discriminant-analysis

12

Почему n-грамм используется в идентификации текста вместо слов?

В двух популярных библиотеках идентификации языка, Compact Language Detector 2 для C ++ и Language Detector для Java, обе они использовали (на основе символов) n-граммы для извлечения текстовых функций. Почему пакет слов (одно слово / словарь) не используется, и каковы преимущества и недостатки...

machine-learning classification text-mining natural-language

12

Почему люди не используют более глубокие RBF или RBF в сочетании с MLP?

Поэтому, рассматривая нейронные сети с радиальной базисной функцией, я заметил, что люди рекомендуют использовать только 1 скрытый слой, тогда как в многослойных нейронных сетях персептрона больше слоев считается лучшим. Учитывая, что сети RBF могут быть обучены с использованием версии обратного...

machine-learning neural-networks rbf-network