Вопросы с тегом «computational-statistics»

11
Обнаружение выбросов во временных рядах: как уменьшить количество ложных срабатываний?

Я пытаюсь автоматизировать обнаружение выбросов во временных рядах, и я использовал модификацию решения, предложенного здесь Робом Хиндманом . Скажем, я измеряю ежедневные посещения сайта из разных стран. В некоторых странах, где ежедневные посещения составляют несколько сотен или тысяч, мой метод,...

11
Что это за «максимальный коэффициент корреляции»?

Типичная статистика обработки изображений - это использование текстурных характеристик Харалика , которых 14. Я задаюсь вопросом о 14-й из этих функций: учитывая карту смежности (которую мы можем просто посмотреть на эмпирическое распределение двух целых чисел ), она определяется как: квадратный...

10
Почему требуется градиентный спуск?

Когда мы можем дифференцировать функцию стоимости и найти параметры, решая уравнения, полученные посредством частичного дифференцирования по каждому параметру, и выяснить, где функция стоимости минимальна. Также я думаю, что можно найти несколько мест, где производные равны нулю, поэтому мы можем...

10
Возможно ли в R (или вообще) заставить коэффициенты регрессии быть определенным знаком?

Я работаю с некоторыми реальными данными, и регрессионные модели дают противоречивые результаты. Обычно я доверяю статистике, но на самом деле некоторые из этих вещей не могут быть правдой. Основная проблема, которую я вижу, состоит в том, что увеличение одной переменной вызывает увеличение...

10
Обратная ковариационная матрица против ковариационной матрицы в PCA

В PCA, имеет ли значение, если мы выбираем главные компоненты обратной ковариационной матрицы ИЛИ, если мы отбрасываем собственные векторы ковариационной матрицы, соответствующие большим собственным значениям? Это связано с обсуждением в этом посте...

10
Как сделать выборку из дискретного распределения по неотрицательным целым числам?

У меня есть следующее дискретное распределение, где - известные константы:α,βα,β\alpha,\beta p(x;α,β)=Beta(α+1,β+x)Beta(α,β)for x=0,1,2,…p(x;α,β)=Beta(α+1,β+x)Beta(α,β)for x=0,1,2,… p(x;\alpha,\beta) = \frac{\text{Beta}(\alpha+1, \beta+x)}{\text{Beta}(\alpha,\beta)} \;\;\;\;\text{for } x =...

10
Обнаружение аномалий временных рядов с помощью Python

Мне нужно реализовать обнаружение аномалий в нескольких наборах данных временных рядов. Я никогда не делал этого раньше и надеялся на некоторые советы. Я очень хорошо разбираюсь в python, поэтому я бы предпочел, чтобы в нем было реализовано решение (большая часть моего кода - это python для других...

10
Быстрое вычисление / оценка линейной системы низкого ранга

Линейные системы уравнений распространены в вычислительной статистике. Одна особая система, с которой я столкнулся (например, в факторном анализе), это система A x = bAx=bAx=b где Здесь D - диагональная матрица n × n со строго положительной диагональю, Ω - симметричная положительная...

10
Тестирование статистического программного обеспечения

Какие методы / подходы полезны при тестировании статистического программного обеспечения? Мне особенно интересны программы, которые выполняют параметрическую оценку с максимальной вероятностью. Сравнение результатов с результатами других программ или опубликованных источников не всегда возможно,...

9
Алгебраические классификаторы, больше информации?

Я прочитал алгебраические классификаторы: общий подход к быстрой перекрестной проверке, онлайн-обучению и параллельному обучению, и был поражен эффективностью производных алгоритмов. Тем не менее, кажется, что помимо наивных байесовских (и GBM), не так много алгоритмов, адаптированных к этой...

9
Генератор случайных чисел Mathematica отклоняется от биномиальной вероятности?

Итак, допустим, вы подбрасываете монету 10 раз и называете это «событием». Если вы запустите 1000000 из этих «событий», какова доля событий с головами от 0,4 до 0,6? Биноминальная вероятность предполагает, что это будет около 0,65, но мой код Mathematica говорит мне о 0,24 Вот мой синтаксис:...

9
Как найти оптимальные значения параметров настройки в бустинге деревьев?

Я понимаю, что в модели деревьев повышения есть 3 параметра настройки, т.е. количество деревьев (количество итераций) параметр усадки количество разбиений (размер каждого составляющего дерева) У меня вопрос: для каждого из параметров настройки, как мне найти его оптимальное значение? А какой метод?...

9
Как я могу вычислить апостериорную оценку плотности из априорной и вероятностной?

Я пытаюсь понять, как использовать теорему Байеса для вычисления апостериорного значения, но я застреваю с вычислительным подходом, например, в следующем случае мне не ясно, как взять произведение предыдущего и вероятности, а затем вычислить задний: Для этого примера меня интересует вычисление...

9
Может кто-нибудь объяснить, как мне 5 лет, об этой проблеме из Книги ESL Хасти?

Я работаю над книгой Хэсти по ESL, и мне тяжело с вопросом 2.3. Вопрос в следующем: Мы рассматриваем оценку ближайшего соседа в начале координат, и среднее расстояние от начала координат до ближайшей точки данных задается этим уравнением. Я понятия не имею, с чего начать, пытаясь вывести это. Я...

9
Полезен ли функциональный анализ и гильбертовы пространства в машинном обучении? Если так, то как?

Мне было интересно, как гильбертовы пространства и функциональный анализ полезны для машинного обучения? Я думал, что машинное обучение - это смесь статистики, информатики и оптимизации. Как функциональный анализ связан с...

9
стоимость выборки

Я столкнулся со следующей проблемой моделирования: для заданного набора известных действительных чисел распределение по { - 1 , 1 } d определяется как P ( X = ( x 1 , … , x d) ) ) ∝ ( x 1 ω 1 + … + x d ω d ) + где ( z ){ ω1, ... , ωd}{ω1,…,ωd}\{\omega_1,\ldots,\omega_d\}{ - 1 , 1...