Вопросы с тегом «machine-learning»

16
В теории статистического обучения, нет ли проблемы переоснащения на тестовом наборе?

Давайте рассмотрим проблему классификации набора данных MNIST. Согласно веб -странице MNIST Яна ЛеКуна , «Ciresan et al.» получил 0,23% ошибок в тестовом наборе MNIST с использованием сверточной нейронной сети. Давайте обозначим обучающий набор MNIST как , тестовый набор MNIST как , окончательную...

16
Я учусь у Распознавания образов и машинного обучения, Крис Бишоп, какие хорошие ресурсы?

Есть ли какие-либо видео или другие книги / заметки, которые кто-нибудь встречал, которые следуют за Распознаванием образов и машинным обучением Криса Бишопа? Я купил эту книгу, чтобы изучать машинное обучение, и у меня возникли некоторые трудности с ее...

16
Вывод замены переменных функции плотности вероятности?

В книге распознавания образов и машинного обучения (формула 1.27) она дает py(y)=px(x)∣∣∣dxdy∣∣∣=px(g(y))|g′(y)|py(y)=px(x)|dxdy|=px(g(y))|g′(y)|p_y(y)=p_x(x) \left | \frac{d x}{d y} \right |=p_x(g(y)) | g'(y) | гдеx=g(y)x=g(y)x=g(y),px(x)px(x)p_x(x) - это pdf, соответствующийpy(y)py(y)p_y(y)...

16
Какие теории причинности я должен знать?

Какие теоретические подходы к причинности я должен знать как прикладной статистик / эконометрик? Я знаю (очень немного) Причинно-следственная модель Неймана – Рубина (и Рой , Гавелмо и т. Д.) Работа Перла о причинности Причинность Грейнджера (хотя и менее ориентированная на лечение) Какие концепции...

16
Как ансамблевые методы превосходят всех составляющих?

Я немного запутался в изучении ансамбля. Короче говоря, он запускает k моделей и получает среднее значение этих k моделей. Как можно гарантировать, что среднее значение k моделей будет лучше, чем у любой другой модели? Я понимаю, что уклон "распределен" или "усреднен". Однако что, если в ансамбле...

16
Что считается хорошей потерей журнала?

Я пытаюсь лучше понять потерю журналов и как это работает, но я не могу найти одну вещь - поместить число потерь журналов в какой-то контекст. Если у моей модели потеря журнала 0,5, это хорошо? Что считается хорошим и плохим счетом? Как меняются эти...

16
Почему информационный критерий Акаике больше не используется в машинном обучении?

Я просто наткнулся на «Информационный критерий Акайке» и заметил большое количество литературы по выбору моделей (кажется, существуют и такие вещи, как BIC). Почему современные методы машинного обучения не используют эти критерии выбора моделей BIC и...

16
Что здесь происходит, когда я использую квадрат потерь в настройке логистической регрессии?

Я пытаюсь использовать квадратичные потери, чтобы выполнить двоичную классификацию для набора данных игрушек. Я использую mtcarsнабор данных, использую милю на галлон и вес, чтобы предсказать тип передачи. На приведенном ниже графике показаны два типа данных типа передачи в разных цветах и...

16
Является ли контролируемое обучение подмножеством обучения с подкреплением?

Похоже, что определение контролируемого обучения является подмножеством обучающего обучения с особым типом функции вознаграждения, основанной на помеченных данных (в отличие от другой информации в среде). Это точное...

16
Как причинно-следственная связь определяется математически?

Каково математическое определение причинно-следственной связи между двумя случайными величинами? Учитывая выборку из совместного распределения двух случайных величин и , когда мы скажем, что вызывает ?XXXYYYXXXYYY Для контекста, я читаю эту статью о причинно-следственной связи...

15
Каков наилучший двухклассный классификатор для вашего приложения? [закрыто]

Закрыто . Этот вопрос основан на мнении . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы ответить на него фактами и цитатами, отредактировав этот пост . Закрыто 3 года назад . Правила: один классификатор за ответ голосовать, если вы согласны уменьшить...

15
Применение методов машинного обучения в небольших выборочных клинических исследованиях.

Что вы думаете о применении методов машинного обучения, таких как случайные леса или штрафная регрессия (со штрафом L1 или L2 или их комбинацией) в небольших выборочных клинических исследованиях, когда цель состоит в том, чтобы выделить интересные предикторы в контексте классификации? Это не вопрос...

15
Кластеризация: я должен использовать расхождение Дженсена-Шеннона или его квадрат?

Я группирую распределения вероятностей, используя алгоритм распространения сродства , и планирую использовать расхождение Дженсена-Шеннона в качестве метрики расстояния. Правильно ли использовать сам JSD в качестве расстояния или JSD в квадрате? Почему? Какие различия могут возникнуть в результате...

15
Что такое хороший ресурс, который включает в себя сравнение плюсов и минусов различных классификаторов?

Какой самый лучший из двух классификаторов из коробки? Да, я думаю, это вопрос на миллион долларов, и да, я знаю теорему об отсутствии бесплатного обеда , и я также прочитал предыдущие вопросы: Каков наилучший двухклассный классификатор для вашего приложения? и худший классификатор Тем не менее,...

15
Увеличение числа функций приводит к снижению точности, но увеличению предварительного / повторного вызова

Я новичок в машинном обучении. В настоящее время я использую классификатор Наивного Байеса (NB), чтобы классифицировать небольшие тексты в 3 классах как положительные, отрицательные или нейтральные, используя NLTK и python. Проведя несколько тестов с набором данных, состоящим из 300 000 экземпляров...

15
Какой алгоритм статистической классификации может предсказать истину / ложь для последовательности входных данных?

Учитывая последовательность входов, мне нужно определить, обладает ли эта последовательность определенным желаемым свойством. Свойство может быть только истинным или ложным, то есть существует только два возможных класса, к которым может принадлежать последовательность. Точная связь между...

15
Какой алгоритм машинного обучения можно использовать для прогнозирования фондового рынка?

В качестве альтернативы можно прогнозировать валютные рынки. Я знаю, что это может быть довольно сложно, поэтому в качестве вступления я ищу простой алгоритм прогнозирования, который имеет некоторую точность. (Это для магистерского проекта университета, который длится четыре месяца) Я читал, что...

15
Объединение классификаторов путем подбрасывания монеты

Я изучаю курс машинного обучения, и слайды лекций содержат информацию, которая, на мой взгляд, противоречит рекомендуемой книге. Проблема в следующем: существует три классификатора: классификатор А, обеспечивающий лучшую производительность в нижнем диапазоне порогов, классификатор B, обеспечивающий...

15
Преимущества кривых ROC

В чем преимущества кривых ROC? Например, я классифицирую некоторые изображения, что является проблемой двоичной классификации. Я выделил около 500 объектов и применил алгоритм выбора объектов, чтобы выбрать набор функций, а затем применил SVM для классификации. В этом случае, как я могу получить...