Вопросы с тегом «algorithms»

22
Можно ли накапливать набор статистических данных, описывающих большое количество образцов, чтобы я мог затем создать коробочный график?

Я должен немедленно уточнить, что я являюсь практикующим разработчиком программного обеспечения, а не статистиком, и что мой класс по статистике в колледже был очень давно ... Тем не менее, я хотел бы знать, существует ли метод для накопления набора описательной статистики, который затем может быть...

21
Как выбрать между алгоритмами обучения

Мне нужно реализовать программу, которая будет классифицировать записи на 2 категории (истина / ложь) на основе некоторых обучающих данных, и мне было интересно, какой алгоритм / методология мне следует рассмотреть. Кажется, из них есть из чего выбирать - искусственная нейронная сеть, генетический...

21
Как спроецировать новый вектор на пространство PCA?

После выполнения анализа главных компонентов (PCA) я хочу спроецировать новый вектор на пространство PCA (т.е. найти его координаты в системе координат PCA). Я рассчитал PCA на языке R, используя prcomp. Теперь я должен быть в состоянии умножить свой вектор на матрицу вращения PCA. Должны ли...

21
Примеры скрытых проблем моделей Маркова?

Я прочитал довольно много скрытых марковских моделей и смог сам написать довольно простую версию. Но есть два основных способа, которыми я, кажется, учусь. Один из них - прочитать и внедрить его в код (что и делается), а второй - понять, как он применяется в различных ситуациях (чтобы я мог лучше...

20
Моделирование временных рядов с учетом мощности и кросс-спектральных плотностей

У меня возникают проблемы при создании набора стационарных цветных временных рядов, учитывая их ковариационную матрицу (их спектральные плотности мощности (PSD) и спектральные плотности перекрестных мощностей (CSD)). Я знаю, что, учитывая два временных ряда и , я могу оценить их спектральные...

20
Вычислить приблизительные квантили для потока целых чисел, используя моменты?

мигрировал из math.stackexchange . Я обрабатываю длинный поток целых чисел и рассматриваю возможность отслеживания нескольких моментов, чтобы иметь возможность приблизительно рассчитать различные процентили для потока без сохранения большого количества данных. Какой самый простой способ вычислить...

20
Когда генетические алгоритмы являются хорошим выбором для оптимизации?

Генетические алгоритмы являются одной из форм метода оптимизации. Часто стохастический градиентный спуск и его производные являются лучшим выбором для оптимизации функций, но генетические алгоритмы все еще иногда используются. Например, антенна космического корабля НАСА ST5 была создана с...

20
Как случайный лес генерирует случайный лес

Я не эксперт по случайным лесам, но я четко понимаю, что ключевая проблема со случайным лесом - это (случайное) генерирование деревьев. Можете ли вы объяснить мне, как создаются деревья? (т.е. что такое используемый дистрибутив для генерации дерева?) Заранее спасибо !...

18
Попарное расстояние Махаланобис

Мне нужно рассчитать выборочное расстояние Махаланобиса в R между каждой парой наблюдений в матрице ковариат n×pn×pn \times p . Мне нужно решение, которое является эффективным, то есть только n(n−1)/2n(n−1)/2n(n-1)/2 Е. Рассчитываются расстояний, и желательно, чтобы они были реализованы в C / RCpp...

18
Скорость, вычислительные затраты PCA, LASSO, эластичная сеть

Я пытаюсь сравнить сложность вычислений / скорость оценки трех групп методов для линейной регрессии, как это различается в Hastie et al. «Элементы статистического обучения» (2-е изд.), Глава 3: Выбор подмножества Методы усадки Методы с использованием производных направлений ввода (PCR, PLS)...

18
Чем экстремальный случайный лес отличается от случайного леса?

Является ли ER более эффективной реализацией (что-то вроде Extreme Gradient Boostingповышения градиента) - важно ли различие с практической точки зрения? Существует пакет R, который их реализует. Это новый алгоритм, который преодолевает «универсальную» реализацию (пакет RandomForest от R) не только...

17
Каковы эффективные алгоритмы для вычисления разложения по сингулярным числам (SVD)?

В статье Википедии об анализе основных компонентов говорится, что Существуют эффективные алгоритмы для вычисления SVD без необходимости формирования матрицы , поэтому вычисление SVD теперь является стандартным способом вычисления анализа главных компонентов из матрицы данных, если только не...

17
Обновление декомпозиции SVD после добавления одной новой строки в матрицу

Предположим , что у меня плотную матрицу AA \textbf{A} из m×nm×nm \times n размера, с SVD разложения A=USV⊤.A=USV⊤.\mathbf{A}=\mathbf{USV}^\top.В Rможно вычислить СВД следующим образом : svd(A). Если в добавлена новая -я строка , можно ли вычислить новую декомпозицию SVD на основе старой (т. Е....

17
Какой алгоритм оптимизации используется в функции glm в R?

Можно выполнить логит-регрессию в R, используя такой код: > library(MASS) > data(menarche) > glm.out = glm(cbind(Menarche, Total-Menarche) ~ Age, + family=binomial(logit), data=menarche) > coefficients(glm.out) (Intercept) Age -21.226395 1.631968 Похоже, что алгоритм оптимизации...

16
Онлайн алгоритм для среднего абсолютного отклонения и большого набора данных

У меня есть небольшая проблема, которая заставляет меня волноваться. Я должен написать процедуру для онлайн-процесса приобретения многомерного временного ряда. На каждом временном интервале (например, 1 секунда) я получаю новую выборку, которая в основном представляет собой вектор с плавающей...

16
Auto.arima vs autobox они отличаются?

Из чтения сообщений на этом сайте я знаю, что есть функция R auto.arima(в forecast пакете ). Я также знаю, что IrishStat , участник этого сайта, создал коммерческий пакет autobox в начале 1980-х годов. Поскольку эти два пакета существуют сегодня и автоматически выбирают модели arima для заданных...

15
Что такое «метод передачи сообщений»?

У меня есть смутное представление о том, что такое метод передачи сообщений: алгоритм, который строит аппроксимацию к распределению путем итеративного построения аппроксимаций каждого из факторов распределения, условных для всех аппроксимаций всех других факторов. Я полагаю, что оба являются...

15
Каковы плюсы и минусы изучения алгоритмического распределения (моделирования) по сравнению с математическим?

Каковы плюсы и минусы изучения свойств дистрибутива алгоритмически (посредством компьютерного моделирования) по сравнению с математически? Кажется, что компьютерное моделирование может быть альтернативным методом обучения, особенно для тех новых студентов, которые не чувствуют себя сильными в...

15
Метрики для оценки алгоритмов ранжирования

Я заинтересован в рассмотрении нескольких различных метрик для алгоритмов ранжирования - на странице Википедии «Обучение для ранжирования» перечислены некоторые из них, в том числе: • Средняя средняя точность (MAP); • DCG и NDCG; • Точность @ n, NDCG @ n, где «@n» означает, что метрики оцениваются...