Вопросы с тегом «machine-learning»

15
Что такое смешивание данных?

Этот термин часто встречается в темах, связанных с методом . Является ли смешивание конкретным методом в интеллектуальном анализе данных и статистическом обучении? Я не могу получить соответствующий результат от Google. Кажется, смешивание смешивает результаты многих моделей и приводит к лучшему...

15
Как выбрать метрику ошибки при оценке классификатора?

Я видел разные метрики ошибок, используемые в соревнованиях Kaggle: RMS, среднее значение, AUC и другие. Каково общее правило выбора метрики ошибки, т. Е. Как узнать, какую метрику ошибки использовать для данной проблемы? Есть ли...

15
Значение выходных терминов в пакете gbm?

Я использую пакет gbm для классификации. Как и следовало ожидать, результаты хорошие. Но я пытаюсь понять вывод классификатора. В выводе пять терминов. `Iter TrainDeviance ValidDeviance StepSize Improve` Может ли кто-нибудь объяснить значение каждого термина, особенно значение улучшения...

15
Регуляризация и масштабирование функций в онлайн-обучении?

Допустим, у меня есть классификатор логистической регрессии. В обычном пакетном обучении я бы использовал термин регуляризатор, чтобы предотвратить переоснащение и сохранить вес небольшим. Я также нормализую и масштабирую свои функции. В режиме онлайн обучения я получаю непрерывный поток данных. Я...

15
Почему масштабирование важно для линейной классификации SVM?

При выполнении линейной классификации SVM часто бывает полезно нормализовать тренировочные данные, например, путем вычитания среднего значения и деления на стандартное отклонение, а затем масштабировать данные теста со средним и стандартным отклонением обучающих данных. Почему этот процесс резко...

15
Какова интуиция за сменными образцами при нулевой гипотезе?

Тесты перестановки (также называемые тестом рандомизации, тестом повторной рандомизации или точным тестом) очень полезны и оказываются полезными, когда предположение о нормальном распределении, требуемое, например, t-testне выполняется, и когда преобразование значений путем ранжирования...

15
Что такое точность Top-n?

Я читаю научную статью о классификации изображений. В экспериментальных результатах они говорят о точности топ-1 и топ-5, но я никогда не слышал этого термина и не могу найти его с помощью Google. Может кто-нибудь дать мне определение или указать мне где-нибудь?...

15
Тезаурус для статистики и терминов машинного обучения

Существует ли справочный тезаурус для статистики и терминов машинного обучения? Я знаю, что статьи в Википедии часто содержат синонимы, но я хотел бы иметь простой тезаурус, через который я мог бы легко пройти (вместо полной энциклопедии), чтобы убедиться, что я знаю весь...

15
Предложения по обучению с учетом затрат в крайне несбалансированной среде

У меня есть набор данных с несколькими миллионами строк и ~ 100 столбцов. Я хотел бы обнаружить около 1% примеров в наборе данных, которые относятся к общему классу. У меня есть ограничение минимальной точности, но из-за очень асимметричной стоимости я не слишком заинтересован в каком-либо...

15
Классификатор против модели против оценки

В чем разница между классификатором, моделью и оценщиком? Из того, что я могу сказать: оценка - это предиктор, найденный по алгоритму регрессии классификатор - это предиктор, найденный из алгоритма классификации модель может быть как оценщиком, так и классификатором Но, глядя в онлайн, кажется, что...

15
Значение скрытых черт?

Я пытаюсь понять модели матричной факторизации для рекомендательных систем и всегда читаю «скрытые функции», но что это значит? Я знаю, что означает особенность для учебного набора данных, но я не могу понять идею скрытых возможностей. Каждая статья по теме, которую я могу найти, слишком мелкая....

15
В сглаживании Кнезера-Нея, как обрабатываются невидимые слова?

Из того, что я видел, формула сглаживания Кнезера-Ней (второго порядка) так или иначе задается как P2KN(wn|wn−1)=max{C(wn−1,wn)−D,0}∑w′C(wn−1,w′)+λ(wn−1)×Pcont(wn)PKN2(wn|wn−1)=max{C(wn−1,wn)−D,0}∑w′C(wn−1,w′)+λ(wn−1)×Pcont(wn) \begin{align} P^2_{KN}(w_n|w_{n-1}) &= \frac{\max \left\{...

15
Сколько данных вам нужно для сверточной нейронной сети?

Если у меня есть сверточная нейронная сеть (CNN), которая имеет около 1 000 000 параметров, сколько нужно обучающих данных (предположим, я делаю стохастический градиентный спуск)? Есть ли эмпирическое правило? Дополнительные примечания: Когда я выполнил стохастический градиентный спуск (например,...

15
Как CNN's избегают исчезающей проблемы градиента

Я много читал о сверточных нейронных сетях и удивлялся, как они избегают исчезающей проблемы градиента. Я знаю, что сети глубокого убеждения объединяют одноуровневые автокодеры или другие предварительно обученные мелкие сети и, таким образом, могут избежать этой проблемы, но я не знаю, как этого...

15
Что означает теория обучения PAC?

Я новичок в машинном обучении. Я изучаю курс машинного обучения (Стэнфордский университет), и я не понял, что подразумевается под этой теорией и в чем ее польза. Мне интересно, может ли кто-нибудь описать эту теорию для меня. Эта теория основана на этом уравнении....

15
Что делать, если высокая точность проверки, но низкая точность испытаний в исследованиях?

У меня есть конкретный вопрос о проверке в исследованиях машинного обучения. Как мы знаем, режим машинного обучения требует от исследователей обучать свои модели данным обучения, выбирать модели-кандидаты по набору проверок и сообщать о точности на наборе испытаний. В очень строгом исследовании...

15
Что измерение VC говорит нам о глубоком обучении?

В базовом машинном обучении нас учат следующим «правилам большого пальца»: а) размер ваших данных должен как минимум в 10 раз превышать размер VC вашего набора гипотез. б) нейронная сеть с N соединениями имеет размерность VC приблизительно N. Итак, когда в нейронной сети с глубоким обучением...

15
Включение условий взаимодействия в случайном лесу

Предположим, у нас есть ответ Y и предикторы X1, ...., Xn. Если бы мы попытались согласовать Y с помощью линейной модели X1, ...., Xn, и так получилось, что истинные отношения между Y и X1, ..., Xn не были линейными, мы могли бы исправить модель, преобразовав X как-то, а затем подгоняя модель....

15
Какую меру ошибки обучения сообщать для случайных лесов?

В настоящее время я подгоняю случайные леса для задачи классификации, используя randomForestпакет в R, и не уверен, как сообщить об ошибке обучения для этих моделей. Моя ошибка обучения близка к 0%, когда я вычисляю ее, используя прогнозы, которые я получаю с помощью команды: predict(model,...

15
Ядро SVM: я хочу, чтобы интуитивное понимание отображения на пространство пространственных объектов было более многомерным, и как это делает возможным линейное разделение

Я пытаюсь понять интуицию ядра SVM. Теперь я понимаю, как работает линейный SVM, благодаря чему создается линия принятия решений, которая разбивает данные как можно лучше. Я также понимаю принцип, лежащий в основе переноса данных в многомерное пространство, и то, как это может облегчить нахождение...