Вопросы с тегом «machine-learning»

12
Рекурсивный (онлайн) регуляризованный алгоритм наименьших квадратов

Может ли кто-нибудь указать мне направление онлайнового (рекурсивного) алгоритма регуляризации Тихонова (регуляризованных наименьших квадратов)? В автономном режиме я вычисляю β^=(XTX+λI)−1XTYβ^=(XTX+λI)−1XTY\hat\beta=(X^TX+λI)^{−1}X^TY используя мой исходный набор данных, где λλλ находится с...

12
Точный критерий Фишера и гипергеометрическое распределение

Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст мешал....

12
Можете ли вы сравнить различные методы кластеризации в наборе данных без какой-либо базовой правды путем перекрестной проверки?

В настоящее время я пытаюсь проанализировать набор данных текстового документа, который не имеет основательной правды. Мне сказали, что вы можете использовать k-кратную перекрестную проверку для сравнения различных методов кластеризации. Однако примеры, которые я видел в прошлом, используют...

12
Как рассчитать точность и вспомнить в матрице путаницы 3 x 3

Predicted class Cat Dog Rabbit Actual class Cat 5 3 0 Dog 2 3 1 Rabbit 0 2 11 Как я могу рассчитать точность и вспомнить, чтобы стало легко рассчитать F1-счет. Нормальная матрица путаницы - это размерность 2 x 2. Тем не менее, когда он становится 3 х 3, я не знаю, как рассчитать точность и...

12
Понимание параметров функции Gaussian Basis для использования в линейной регрессии

Я хотел бы применить базисную функцию Гаусса в реализации линейной регрессии. К сожалению, мне сложно понять пару параметров в базовой функции. В частности, и .σμμ\muσσ\sigma Мой набор данных - это матрица размером 10 000 x 31 10000 образцов и 31 функций. Я читал, что «Каждая базисная функция...

12
Как сравнить два алгоритма ранжирования?

Я хочу сравнить два алгоритма ранжирования. В этих алгоритмах клиент указывает некоторые условия в своем поиске. В соответствии с требованиями клиента, этот алгоритм должен назначать оценку для каждого элемента в базе данных и извлекать элементы с наивысшими оценками. Я прочитал различные темы,...

12
Есть ли разница между дистанционным наблюдением, самообучением, самообучаемым обучением и слабым наблюдением?

Из того, что я прочитал: Дистанционное наблюдение : A Distant supervision algorithm usually has the following steps: 1] It may have some labeled training data 2] It "has" access to a pool of unlabeled data 3] It has an operator that allows it to sample from this unlabeled data and label them and...

12
Алгоритмы машинного обучения для панельных данных

В этом вопросе. Существует ли метод построения деревьев решений, который учитывает структурированные / иерархические / многоуровневые предикторы? - они упоминают метод данных панели для деревьев. Существуют ли специальные методы данных панели для поддержки векторных машин и нейронных сетей? Если...

12
Учебник по усилению обучения

Я ищу учебник / лекционные заметки в обучении подкреплению. Мне нравится «Введение в статистическое обучение» , но, к сожалению, они не охватывают эту тему. Я знаю, что книга Саттона и Барто является стандартным справочником, и, возможно, НДП также хороша, но они датированы 1997-98 гг., И я...

12
Различия между рандомизированной логистической регрессией и простой ванильной логистической регрессией

Я хотел бы знать различия между рандомизированной логистической регрессией (RLR) и простой логистической регрессией (LR), поэтому я читаю статью «Выбор стабильности» , опубликованную Meinshausen et al. ; однако я не понимаю, что такое RLR и каковы различия между RLR и LR. Может ли кто-нибудь...

12
Существуют ли современные способы использования джекнифинга?

Вопрос: Bootstrapping превосходит джекнифинг; однако мне интересно, есть ли случаи, когда джекнифинг является единственным или, по крайней мере, жизнеспособным вариантом для характеристики неопределенности из оценок параметров. Кроме того, в практических ситуациях, насколько предвзятый / неточный...

12
Как понять, что MLE дисперсии смещен в распределении Гаусса?

Я читаю PRML, и я не понимаю картину. Не могли бы вы дать несколько советов, чтобы понять картину и почему MLE дисперсии в распределении Гаусса смещены? формула 1.55: формула 1.56 σ 2 M L E =1μMLE=1N∑n=1NxnμMLE=1N∑n=1Nxn \mu_{MLE}=\frac{1}{N} \sum_{n=1}^N x_n...

12
Когда использовать байесовские сети поверх других подходов машинного обучения?

Я ожидаю, что не может быть никакого определенного ответа на этот вопрос. Но в прошлом я использовал несколько алгоритмов машинного обучения и пытаюсь узнать о байесовских сетях. Я хотел бы понять, при каких обстоятельствах или для каких типов проблем вы бы выбрали использование байесовской сети по...

12
почему метод повышения чувствительности к выбросам

Я нашел много статей, в которых говорится, что методы повышения чувствительны к выбросам, но нет статей, объясняющих почему. По моему опыту, выбросы плохи для любого алгоритма машинного обучения, но почему методы повышения выделяются как особенно чувствительные? Как бы оценили следующие алгоритмы с...

12
VC измерение регрессионных моделей

В серии лекций « Изучение данных» профессор упоминает, что измерение VC измеряет сложность модели по тому, на сколько точек данная модель может разбиться. Так что это прекрасно работает для моделей классификации, где мы можем сказать из N точек, если классификатор способен эффективно разбить k...

12
Как рассчитать вес критерия Фишера?

Я изучаю распознавание образов и машинное обучение, и я столкнулся со следующим вопросом. Рассмотрим задачу классификации двух классов с равной вероятностью предшествующего класса P(D1)=P(D2)=12P(D1)=P(D2)=12P(D_1)=P(D_2)= \frac{1}{2} и распределение экземпляров в каждом классе, заданное...

12
Почему n-грамм используется в идентификации текста вместо слов?

В двух популярных библиотеках идентификации языка, Compact Language Detector 2 для C ++ и Language Detector для Java, обе они использовали (на основе символов) n-граммы для извлечения текстовых функций. Почему пакет слов (одно слово / словарь) не используется, и каковы преимущества и недостатки...

12
Почему люди не используют более глубокие RBF или RBF в сочетании с MLP?

Поэтому, рассматривая нейронные сети с радиальной базисной функцией, я заметил, что люди рекомендуют использовать только 1 скрытый слой, тогда как в многослойных нейронных сетях персептрона больше слоев считается лучшим. Учитывая, что сети RBF могут быть обучены с использованием версии обратного...