Вопросы с тегом «machine-learning»

16

В теории статистического обучения, нет ли проблемы переоснащения на тестовом наборе?

Давайте рассмотрим проблему классификации набора данных MNIST. Согласно веб -странице MNIST Яна ЛеКуна , «Ciresan et al.» получил 0,23% ошибок в тестовом наборе MNIST с использованием сверточной нейронной сети. Давайте обозначим обучающий набор MNIST как , тестовый набор MNIST как , окончательную...

16

Я учусь у Распознавания образов и машинного обучения, Крис Бишоп, какие хорошие ресурсы?

Есть ли какие-либо видео или другие книги / заметки, которые кто-нибудь встречал, которые следуют за Распознаванием образов и машинным обучением Криса Бишопа? Я купил эту книгу, чтобы изучать машинное обучение, и у меня возникли некоторые трудности с ее...

machine-learning references pattern-recognition

16

Вывод замены переменных функции плотности вероятности?

В книге распознавания образов и машинного обучения (формула 1.27) она дает py(y)=px(x)∣∣∣dxdy∣∣∣=px(g(y))|g′(y)|py(y)=px(x)|dxdy|=px(g(y))|g′(y)|p_y(y)=p_x(x) \left | \frac{d x}{d y} \right |=p_x(g(y)) | g'(y) | гдеx=g(y)x=g(y)x=g(y),px(x)px(x)p_x(x) - это pdf, соответствующийpy(y)py(y)p_y(y)...

machine-learning probability self-study derivative jacobian

16

Какие теории причинности я должен знать?

Какие теоретические подходы к причинности я должен знать как прикладной статистик / эконометрик? Я знаю (очень немного) Причинно-следственная модель Неймана – Рубина (и Рой , Гавелмо и т. Д.) Работа Перла о причинности Причинность Грейнджера (хотя и менее ориентированная на лечение) Какие концепции...

machine-learning causality theory treatment-effect

16

Как ансамблевые методы превосходят всех составляющих?

Я немного запутался в изучении ансамбля. Короче говоря, он запускает k моделей и получает среднее значение этих k моделей. Как можно гарантировать, что среднее значение k моделей будет лучше, чем у любой другой модели? Я понимаю, что уклон "распределен" или "усреднен". Однако что, если в ансамбле...

machine-learning ensemble

16

Что считается хорошей потерей журнала?

Я пытаюсь лучше понять потерю журналов и как это работает, но я не могу найти одну вещь - поместить число потерь журналов в какой-то контекст. Если у моей модели потеря журнала 0,5, это хорошо? Что считается хорошим и плохим счетом? Как меняются эти...

machine-learning loss-functions log-loss

16

Почему информационный критерий Акаике больше не используется в машинном обучении?

Я просто наткнулся на «Информационный критерий Акайке» и заметил большое количество литературы по выбору моделей (кажется, существуют и такие вещи, как BIC). Почему современные методы машинного обучения не используют эти критерии выбора моделей BIC и...

machine-learning model-selection aic bic

16

Что здесь происходит, когда я использую квадрат потерь в настройке логистической регрессии?

Я пытаюсь использовать квадратичные потери, чтобы выполнить двоичную классификацию для набора данных игрушек. Я использую mtcarsнабор данных, использую милю на галлон и вес, чтобы предсказать тип передачи. На приведенном ниже графике показаны два типа данных типа передачи в разных цветах и...

r machine-learning logistic optimization loss-functions

16

Является ли контролируемое обучение подмножеством обучения с подкреплением?

Похоже, что определение контролируемого обучения является подмножеством обучающего обучения с особым типом функции вознаграждения, основанной на помеченных данных (в отличие от другой информации в среде). Это точное...

machine-learning terminology reinforcement-learning supervised-learning definition

16

Как причинно-следственная связь определяется математически?

Каково математическое определение причинно-следственной связи между двумя случайными величинами? Учитывая выборку из совместного распределения двух случайных величин и , когда мы скажем, что вызывает ?XXXYYYXXXYYY Для контекста, я читаю эту статью о причинно-следственной связи...

machine-learning causality

15

Каков наилучший двухклассный классификатор для вашего приложения? [закрыто]

Закрыто . Этот вопрос основан на мнении . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы ответить на него фактами и цитатами, отредактировав этот пост . Закрыто 3 года назад . Правила: один классификатор за ответ голосовать, если вы согласны уменьшить...

machine-learning classification application

15

Применение методов машинного обучения в небольших выборочных клинических исследованиях.

Что вы думаете о применении методов машинного обучения, таких как случайные леса или штрафная регрессия (со штрафом L1 или L2 или их комбинацией) в небольших выборочных клинических исследованиях, когда цель состоит в том, чтобы выделить интересные предикторы в контексте классификации? Это не вопрос...

machine-learning feature-selection

15

Кластеризация: я должен использовать расхождение Дженсена-Шеннона или его квадрат?

Я группирую распределения вероятностей, используя алгоритм распространения сродства , и планирую использовать расхождение Дженсена-Шеннона в качестве метрики расстояния. Правильно ли использовать сам JSD в качестве расстояния или JSD в квадрате? Почему? Какие различия могут возникнуть в результате...

machine-learning clustering entropy distance-functions

15

Что такое хороший ресурс, который включает в себя сравнение плюсов и минусов различных классификаторов?

Какой самый лучший из двух классификаторов из коробки? Да, я думаю, это вопрос на миллион долларов, и да, я знаю теорему об отсутствии бесплатного обеда , и я также прочитал предыдущие вопросы: Каков наилучший двухклассный классификатор для вашего приложения? и худший классификатор Тем не менее,...

machine-learning classification references

15

Увеличение числа функций приводит к снижению точности, но увеличению предварительного / повторного вызова

Я новичок в машинном обучении. В настоящее время я использую классификатор Наивного Байеса (NB), чтобы классифицировать небольшие тексты в 3 классах как положительные, отрицательные или нейтральные, используя NLTK и python. Проведя несколько тестов с набором данных, состоящим из 300 000 экземпляров...

machine-learning classification naive-bayes precision-recall

15

Какой алгоритм статистической классификации может предсказать истину / ложь для последовательности входных данных?

Учитывая последовательность входов, мне нужно определить, обладает ли эта последовательность определенным желаемым свойством. Свойство может быть только истинным или ложным, то есть существует только два возможных класса, к которым может принадлежать последовательность. Точная связь между...

machine-learning classification modeling

15

Анализ времени выполнения общих алгоритмов машинного обучения

Есть ли у кого-нибудь ссылка на резюме анализа времени выполнения для общих алгоритмов машинного обучения (различные варианты NN, SVM и т.

machine-learning references algorithms

15

Какой алгоритм машинного обучения можно использовать для прогнозирования фондового рынка?

В качестве альтернативы можно прогнозировать валютные рынки. Я знаю, что это может быть довольно сложно, поэтому в качестве вступления я ищу простой алгоритм прогнозирования, который имеет некоторую точность. (Это для магистерского проекта университета, который длится четыре месяца) Я читал, что...

machine-learning finance

15

Объединение классификаторов путем подбрасывания монеты

Я изучаю курс машинного обучения, и слайды лекций содержат информацию, которая, на мой взгляд, противоречит рекомендуемой книге. Проблема в следующем: существует три классификатора: классификатор А, обеспечивающий лучшую производительность в нижнем диапазоне порогов, классификатор B, обеспечивающий...

machine-learning probability data-visualization classification roc

15

Преимущества кривых ROC

В чем преимущества кривых ROC? Например, я классифицирую некоторые изображения, что является проблемой двоичной классификации. Я выделил около 500 объектов и применил алгоритм выбора объектов, чтобы выбрать набор функций, а затем применил SVM для классификации. В этом случае, как я могу получить...

machine-learning roc