Вопросы с тегом «machine-learning»

13
Особенности построения и нормализации в машинном обучении

Допустим, я хочу создать классификатор логистики для фильма М. Мои особенности будут примерно такими, как возраст человека, пол, род занятий, местоположение. Так что тренировочный набор будет примерно таким: Возраст Пол Род занятий Расположение Нравится (1) / Не нравится (0) 23 M Software США 1 24...

13
Ограниченные машины Больцмана для регрессии?

Я слежу за вопросом, который я задавал ранее по УКР . Я вижу много литературы, описывающей их, но ни одной, которая фактически говорит о регрессии (даже не классификация с помеченными данными). У меня такое ощущение, что он используется только для немаркированных данных. Есть ли ресурсы для...

13
Как далеко зайдет самообучение?

Я никогда не участвовал в официальных или структурированных курсах анализа данных или машинного обучения (кроме недавних онлайн-предложений) и узнал большую часть того, что я знаю, читая и пробуя что-то. Я знаю, что далеко от возможности устроиться на работу. Мой вопрос не в том, что лучше (...

13
Когда регистрировать / расширять ваши переменные при использовании моделей с произвольным лесом?

Я делаю регрессию, используя случайные леса для прогнозирования цен на основе нескольких атрибутов. Код написан на Python с использованием Scikit-learn. Как вы решаете, должны ли вы преобразовывать свои переменные, используя exp/ logперед тем, как использовать их для соответствия регрессионной...

13
Гауссовские процессы: как использовать GPML для многомерного вывода

Есть ли способ выполнить Гауссовскую регрессию процесса на многомерном выходе (возможно, коррелированном) с использованием GPML ? В демонстрационном скрипте я мог найти только 1D пример. Аналогичный вопрос о том , что CV тали случай многомерного ввода. Я просмотрел их книгу, чтобы узнать, смогу ли...

13
Как может работать мультиклассовый персептрон?

У меня нет математических знаний, но я понимаю, как работает простой Персептрон, и мне кажется, что я понимаю концепцию гиперплоскости (я представляю ее геометрически как плоскость в трехмерном пространстве, которая разделяет два облака точек, так же как линия разделяет облака двух точек в...

13
Выбор подходящего размера мини-партии для стохастического градиентного спуска (SGD)

Есть ли литература, в которой рассматривается выбор размера мини-партии при выполнении стохастического градиентного спуска? По моему опыту, это, кажется, эмпирический выбор, обычно находящийся в перекрестной проверке или с использованием различных практических правил. Является ли хорошей идеей...

13
Объясните шаги алгоритма LLE (локальное линейное вложение)?

Я понимаю, что основной принцип, лежащий в основе алгоритма LLE, состоит из трех этапов. Нахождение окрестности каждой точки данных по некоторой метрике, такой как k-nn. Найти веса для каждого соседа, которые обозначают влияние, которое сосед оказывает на точку данных. Построить низкоразмерное...

13
Должен ли я использовать трюк с ядром, когда это возможно, для нелинейных данных?

Недавно я узнал об использовании трюка Ядра, который отображает данные в пространства более высоких измерений в попытке линеаризовать данные в этих измерениях. Есть ли случаи, когда я должен избегать использования этой техники? Это просто вопрос поиска правильной функции ядра? Для линейных данных...

13
Случайный лес на многоуровневых / иерархически структурированных данных

Я довольно новичок в машинном обучении, методиках CART и тому подобном, и я надеюсь, что моя наивность не слишком очевидна. Как случайный лес обрабатывает многоуровневые / иерархические структуры данных (например, когда интерес представляет межуровневое взаимодействие)? То есть наборы данных с...

13
Чем перекрестная проверка отличается от отслеживания данных?

Я только что закончил «Введение в статистическое обучение» . Я задавался вопросом, отличается ли использование перекрестной проверки для нахождения наилучших параметров настройки для различных методов машинного обучения от отслеживания данных? Мы неоднократно проверяем, какое значение параметра...

13
Связи между (d-prime) и AUC (область под кривой ROC); скрытые предположения

В машинном обучении мы можем использовать область под кривой ROC (часто сокращенно AUC или AUROC), чтобы суммировать, насколько хорошо система может различать две категории. В теории обнаружения сигналов часто (индекс чувствительности) используется для аналогичной цели. Эти два тесно связаны, и я...

13
Является ли сообщество машинного обучения «обусловленным» и «параметризованным»?

Скажем, зависит от . Строго говоря,αXXXαα\alpha если и α обе случайные величины, мы могли бы написать p ( X ∣ α ) ;XXXαα\alphap(X∣α)p(X∣α)p(X\mid\alpha) однако, если - случайная величина, а α - параметр, мы должны написать p ( X ; α ) .XXXαα\alphap(X;α)p(X;α)p(X; \alpha) Я заметил несколько раз,...

13
В чем разница между выбором объектов и уменьшением размерности?

Я знаю, что как выбор элементов, так и уменьшение размерности направлены на уменьшение количества элементов в исходном наборе элементов. Какая разница между ними, если мы делаем одно и то же в...

13
Случайный лес и усиление являются параметрическими или непараметрическими?

Прочитав отличное статистическое моделирование: две культуры (Breiman 2001) , мы можем использовать все различия между традиционными статистическими моделями (например, линейной регрессией) и алгоритмами машинного обучения (например, Bagging, Random Forest, Boosted trees ...). Брейман критикует...

13
Как именно сверточные нейронные сети используют свертку вместо умножения матриц?

Я читал Книгу Йошуа Бенжио по глубокому обучению, и на странице 224 написано: Сверточные сети - это просто нейронные сети, которые используют свертку вместо общего умножения матриц, по крайней мере, на одном из их уровней. однако я не был уверен на 100% в том, как «заменить умножение матриц...

13
Контролируемое уменьшение размерности

У меня есть набор данных, состоящий из 15K помеченных образцов (из 10 групп). Я хочу применить уменьшение размерности к двум измерениям, которые бы учитывали знание меток. Когда я использую «стандартные» неконтролируемые методы уменьшения размерности, такие как PCA, график рассеяния, кажется, не...

13
Теоретические результаты за искусственными нейронными сетями

Я только что рассказал об искусственных нейронных сетях на курсе машинного обучения Coursera, и я хотел бы узнать больше теории за ними. Я нахожу мотивацию, что они подражают биологии, несколько неудовлетворительно. На первый взгляд кажется, что на каждом уровне мы заменяем ковариаты линейной...