Вопросы с тегом «machine-learning»

23

Может ли кто-нибудь объяснить достаточно статистику в самых простых терминах? Я из инженерного образования, и я прошел через многое, но не смог найти интуитивного...

machine-learning mathematical-statistics intuition

22

Обратное распространение градиента через пропускаемые соединения ResNet

Мне любопытно, как градиенты распространяются обратно через нейронную сеть с помощью модулей ResNet / пропуска соединений. Я видел пару вопросов о ResNet (например, Нейронная сеть с пропускаемыми соединениями ), но этот вопрос специально задает о обратном распространении градиентов во время...

machine-learning neural-networks conv-neural-network gradient-descent backpropagation

22

Отбрасывание одного из столбцов при использовании быстрого кодирования

Насколько я понимаю, в машинном обучении может возникнуть проблема, если ваш набор данных имеет сильно коррелированные функции, поскольку они эффективно кодируют одну и ту же информацию. Недавно кто-то указал, что когда вы выполняете однократное кодирование для категориальной переменной, вы...

regression machine-learning categorical-data discrete-data categorical-encoding

22

Выбор оптимального альфа в упругой сети логистической регрессии

Я выступаю упругую внутрисетевые логистическую регрессию по набору данных медико - санитарной помощи с использованием glmnetпакета в R путем выбора значения лямбды над сеткой αα\alpha от 0 до 1. Моего сокращенного кода ниже: alphalist <- seq(0,1,by=0.1) elasticnet <- lapply(alphalist,...

machine-learning cross-validation glmnet elastic-net

22

О «силе» слабых учеников

У меня есть несколько тесно связанных вопросов относительно слабых учеников в обучении ансамблю (например, повышение). Это может показаться глупым, но каковы преимущества использования слабых по сравнению с сильными учениками? (например, почему бы не повысить с "сильными" методами обучения?) Есть...

machine-learning boosting ensemble

22

Регрессия опорных векторов для многомерного прогнозирования временных рядов

Кто-нибудь пытался прогнозировать временные ряды, используя регрессию опорных векторов? Я понимаю машины опорных векторов и частично понимаю регрессию опорных векторов, но не понимаю, как их можно использовать для моделирования временных рядов, особенно многомерных временных рядов. Я пытался...

time-series machine-learning svm

22

Все ли алгоритмы машинного обучения разделяют данные линейно?

Я энтузиаст программирования и машинного обучения. Всего несколько месяцев назад я начал изучать программирование машинного обучения. Как и многие люди, у которых нет количественного научного опыта, я также начал изучать ML, работая с алгоритмами и наборами данных в широко используемом пакете ML...

machine-learning

22

Когда мы должны дискретизировать / bin непрерывные независимые переменные / функции, а когда нет?

Когда мы должны дискретизировать / bin независимые переменные / функции, а когда нет? Мои попытки ответить на вопрос: В общем, мы не должны bin, потому что binning потеряет информацию. Биннинг на самом деле увеличивает степень свободы модели, поэтому после биннинга возможна чрезмерная подгонка....

machine-learning continuous-data feature-construction binning

22

Выбор среди правильных правил подсчета очков

В большинстве ресурсов о правильных правилах оценки упоминается ряд различных правил оценки, таких как потеря журнала, оценка Бриера или сферическая оценка. Тем не менее, они часто не дают больших указаний на различия между ними. (Приложение A: Википедия .) Выбор модели, которая максимизирует...

machine-learning classification model-selection theory scoring-rules

22

Как определить достоверность предсказания нейронной сети?

Чтобы проиллюстрировать мой вопрос, предположим, что у меня есть тренировочный набор, где на входе есть уровень шума, а на выходе нет, например; # Training data [1.02, 1.95, 2.01, 3.06] : [1.0] [2.03, 4.11, 5.92, 8.00] : [2.0] [10.01, 11.02, 11.96, 12.04] : [1.0] [2.99, 6.06, 9.01, 12.10] : [3.0]...

regression machine-learning neural-networks confidence-interval prediction-interval

22

Как бы вы разработали систему машинного обучения для игры в Angry Birds?

После игры слишком много Angry Birds я начал наблюдать за своими собственными стратегиями. Оказывается, я разработал очень специфический подход к получению 3 звезд на каждом уровне. Это заставило меня задуматься о проблемах разработки системы машинного обучения, которая могла бы играть в Angry...

machine-learning reinforcement-learning

22

Следующие шаги после «Байесовского рассуждения и машинного обучения»

В настоящее время я изучаю «Байесовское рассуждение и машинное обучение» Дэвида Барбера, и это очень хорошо написанная и интересная книга для изучения основ. Так что вопрос к тому, кто уже сделал это. Какую следующую серию книг я должен пройти после того, как у меня будет достаточное знание...

machine-learning bayesian references graphical-model

22

Выполнять K-средние (или их близкие родственники) кластеризацию только с матрицей расстояний, а не с данными по точкам

Я хочу выполнить кластеризацию K-средних на имеющихся у меня объектах, но объекты не описываются как точки в пространстве, то есть objects x featuresнабором данных. Тем не менее, я могу вычислить расстояние между любыми двумя объектами (оно основано на функции подобия). Итак, я избавляюсь от...

machine-learning clustering data-mining k-means distance

22

Почему Lars и Glmnet предлагают разные решения проблемы Лассо?

Я хочу лучше понять пакеты R Larsи Glmnet, которые используются для решения проблемы Лассо: (для переменных и выборок, см. www.stanford.edu/~hastie/Papers/glmnet.pdf на стр. 3)м я н( β0β) ∈ Rр + 1[ 12 NΣя = 1N( уя- β0- хTяβ)2+ λ | |β| |L1]мяN(β0β)∈рп+1[12NΣязнак...

r regression machine-learning lasso regularization

22

Почему функция стоимости нейронных сетей невыпуклая?

Здесь есть похожая тема ( функция стоимости нейронной сети невыпуклая? ), Но я не смог понять суть вопросов в ответах и мою причину повторного запроса, надеясь, что это прояснит некоторые проблемы: Если я использую функцию суммы квадратов разницы стоимости, я в конечном итоге оптимизирую что-то в...

machine-learning neural-networks optimization loss-functions convex

22

Ограниченные машины Больцмана против многослойных нейронных сетей

Я давно хотел поэкспериментировать с нейронной сетью для решения проблемы классификации, с которой я столкнулся. Я столкнулся с бумагами, которые говорят о УКР. Но из того, что я могу понять, они ничем не отличаются от наличия многослойной нейронной сети. Это точно? Более того, я работаю с R и не...

r machine-learning classification neural-networks

22

Relu против Sigmoid против Softmax как скрытые нейроны слоя

Я играл с простой нейронной сетью только с одним скрытым слоем от Tensorflow, а затем пробовал разные активации для скрытого слоя: Relu сигмоид Softmax (ну, обычно softmax используется в последнем слое ..) Relu дает лучшую точность поезда и точность проверки. Я не уверен, как это объяснить. Мы...

machine-learning neural-networks conv-neural-network tensorflow sigmoid-curve

22

Как называется этот график, показывающий ложные и истинные положительные показатели и как он генерируется?

На рисунке ниже показана непрерывная кривая ложноположительных показателей по сравнению с истинно положительными показателями: Однако я не сразу понимаю, как рассчитываются эти ставки. Если метод применяется к набору данных, он имеет определенную скорость FP и определенную скорость FN. Не означает...

machine-learning data-visualization roc auc

22

Для статистиков важно изучать машинное обучение?

Является ли машинное обучение важным предметом, с которым любой статистик может познакомиться? Кажется, машинное обучение - это статистика. Почему программы статистики (бакалавриат и магистратура) не требуют машинного...

machine-learning careers

21

«Полу-контролируемое обучение» - это переобучение?

Я читал отчет о победившем решении конкурса Kaggle ( Malware Classification ). Отчет можно найти в этом сообщении на форуме . Эта проблема была проблемой классификации (девять классов, метрика - логарифмическая потеря) с 10000 элементами в наборе поездов, 10000 элементов в наборе испытаний. Во...

machine-learning random-forest boosting overfitting semi-supervised