Вопросы с тегом «machine-learning»

10
Регуляризация нормы и нормы эмпирического исследования

Существует много способов выполнения регуляризации - например, регуляризация на основе норм , и . Согласно Friedman Hastie & Tibsharani , лучший регуляризатор зависит от проблемы: а именно от природы истинной целевой функции, конкретной используемой основы, отношения сигнал / шум и размера...

10
Гауссовская регрессия процесса для наборов данных больших размеров

Просто хотел посмотреть, есть ли у кого-нибудь опыт применения Гауссовой регрессии процессов (GPR) к многомерным наборам данных. Я изучаю некоторые из различных методов разреженного георадара (например, разреженных псевдо-входов георадара), чтобы увидеть, что может работать для наборов данных...

10
Каков наиболее эффективный способ тренировки данных с наименьшим объемом памяти?

Это мои тренировочные данные: 200 000 примеров х 10 000 функций. Итак, моя матрица тренировочных данных - 200 000 x 10 000. Мне удалось сохранить это в плоском файле без проблем с памятью, сохраняя каждый набор данных один за другим (один пример за другим), поскольку я генерировал функции для...

10
Можно ли обучить модель P (Y | X) с помощью стохастического градиентного спуска из неидеальных выборок P (X) и iid выборок P (Y | X)?

При обучении параметризованной модели (например, для максимизации вероятности) посредством стохастического градиентного спуска на некотором наборе данных обычно предполагается, что обучающие выборки извлекаются из распределения обучающих данных. Таким образом, если цель состоит в том, чтобы...

10
Алгоритм машинного обучения для ранжирования

У меня есть набор элементов которые я могу описать в соответствии с n характеристиками. Таким образом:ИксИксXNNn Икся: { cя 1, ся 2, … , Ся н} ∣ хя∈ XИкся:{ся1,ся2,...,сяN}|Икся∈Иксx_i: \{c_{i1}, c_{i2}, \ldots, c_{in}\} \mid x_i \in X где - (числовая) оценка для элемента i согласно характеристикам...

10
Статистика по машинному обучению, документы для начала?

У меня есть опыт работы в области компьютерного программирования и теории элементарных чисел, но я не изучал реальную статистику, и недавно «обнаружил», что удивительный мир целого ряда методов на самом деле является статистическим миром. Кажется, что матричные факторизации, матричное пополнение,...

10
Как вы решаете, каков ваш процент обучения, валидации и тестирования?

При разделении моих помеченных данных на обучающие, проверочные и тестовые наборы я слышал все от 50/25/25 до 85/5/10. Я уверен, что это зависит от того, как вы собираетесь использовать свою модель и насколько склонен к переоснащению вашего алгоритма обучения. Есть ли способ решить или все по...

10
Как мне включить инновационный выброс при наблюдении 48 в мою модель ARIMA?

Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1). Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных. Как включить этот выброс в мою...

10
Как получить доверительный интервал по изменению r-квадрата населения

Ради простого примера предположим, что есть две модели линейной регрессии Модель 1 имеет три предсказатели, x1a, x2b, иx2c Модель 2 имеет три предиктора из модели 1 и два дополнительных предиктора x2aиx2b Существует уравнение регрессии населения, где объясняется дисперсия населения для Модели 1 и...

10
Сходимость весов нейронной сети

Я попал в ситуацию, когда веса моей нейронной сети не сходятся даже после 500 итераций. Моя нейронная сеть содержит 1 входной слой, 1 скрытый слой и 1 выходной слой. Это около 230 узлов на входном слое, 9 узлов на скрытом слое и 1 выходной узел на выходном слое. Я хотел знать, выполняю ли я условие...

10
Гибкие и негибкие модели в машинном обучении

Я столкнулся с простым вопросом о сравнении гибких моделей (т.е. сплайнов) с негибкими моделями (например, линейной регрессией) при различных сценариях. Вопрос в том: В целом, ожидаем ли мы, что эффективность гибкого статистического метода обучения будет лучше или хуже, чем у негибкого метода,...

10
В каких реализациях требуется масштабирование переменных (возможностей) и нормализация (настройка) переменных деревьев решений?

Во многих алгоритмах машинного обучения масштабирование функций (или переменное масштабирование, нормализация) является обычным этапом предварительной обработки. Википедия - Масштабирование функций - этот вопрос был близким Вопрос № 41704 - Как и почему работают нормализация и масштабирование...

10
относительно условной независимости и ее графического представления

При изучении выбора ковариации я однажды прочитал следующий пример. Что касается следующей модели: Его ковариационная матрица и обратная ковариационная матрица имеют следующий вид: Я не понимаю, почему независимость и определяется здесь обратной ковариацией?уИксxxYyy Какая математическая логика...

10
Каковы ограничения методов ядра и когда использовать методы ядра?

Методы ядра очень эффективны во многих контролируемых задачах классификации. Итак, каковы ограничения методов ядра и когда использовать методы ядра? Каковы успехи методов ядра, особенно в эпоху крупномасштабных данных? В чем разница между методами ядра и обучением нескольких экземпляров? Если...

10
Классификатор только для одного класса

В простой классификации у нас есть два класса: класс-0 и класс-1. В некоторых данных у меня есть только значения для класса-1, поэтому нет для класса-0. Сейчас я думаю о создании модели для моделирования данных для класса 1. Таким образом, когда поступают новые данные, эта модель применяется к...

10
Могут ли случайные леса справиться с MNIST намного лучше, чем ошибка тестирования 2,8%?

Я не нашел никакой литературы по применению случайных лесов к MNIST, CIFAR, STL-10 и т. Д., Поэтому я решил попробовать их с MNIST, не зависящим от перестановок . В R я попробовал: randomForest(train$x, factor(train$y), test$x, factor(test$y), ntree=500) Это работало в течение 2 часов и получило...

10
Почему KNN не «на основе модели»?

Глава 2.4 ESL, по- видимому, классифицирует линейную регрессию как «основанную на модели», потому что она предполагает , тогда как для k-ближайших соседей подобная аппроксимация не указана. Но разве оба метода не делают предположений о ?f ( x )е( х ) ≈ х ⋅ βе(Икс)≈Икс⋅βf(x) \approx x\cdot\betaе( х...

10
Сравнение CPH, модели времени ускоренного отказа или нейронных сетей для анализа выживаемости

Я новичок в анализе выживания, и недавно я узнал, что есть разные способы сделать это с определенной целью. Я заинтересован в фактической реализации и целесообразности этих методов. Мне представили традиционные модели пропорционального риска Кокса , модели времени ускоренного отказа и нейронные...

10
Оцениваете производительность регрессионной модели с использованием обучающих и тестовых наборов?

Я часто слышу об оценке эффективности модели классификации, проводя тестовый набор и обучая модель на тренировочном наборе. Затем создаем 2 вектора, один для прогнозируемых значений и один для истинных значений. Очевидно, что сравнение позволяет судить о производительности модели по ее...