Вопросы с тегом «metric»

12
Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...

12
Непараметрическая мера силы ассоциации между порядковым и непрерывным случайным числом

Я бросаю здесь проблему, как я получил это. У меня есть две случайные величины. Один из которых является непрерывным (Y), а другой - дискретным и будет обозначаться как ординал (X). Я поместил ниже график, который я получил вместе с запросом. Человек, который посылает мне данные, хочет измерить...

12
Как называется метод оценки плотности, при котором все возможные пары используются для создания нормального распределения смеси?

Я просто подумал о аккуратном (не обязательно хорошем) способе создания одномерных оценок плотности, и мой вопрос: У этого метода оценки плотности есть имя? Если нет, то является ли это частным случаем какого-либо другого метода в литературе? Вот метод: Мы имеем вектор который мы предполагаем, взят...

11
Метрики для ковариационных матриц: недостатки и сильные стороны

Каковы «лучшие» метрики для ковариационных матриц и почему? Мне ясно, что Frobenius и c не подходят, и у параметризации угла тоже есть свои проблемы. Интуитивно можно хотеть компромисса между этими двумя, но я также хотел бы знать, есть ли другие аспекты, о которых следует помнить, и, возможно,...

11
Как правильно применять тест Nemenyi post-hoc после теста Фридмана

Я сравниваю производительность нескольких алгоритмов на нескольких наборах данных. Поскольку эти показатели производительности не гарантируются для нормального распределения, я выбрал тест Фридмана с последующим специальным тестом Немени, основанным на Демшаре (2006) . Затем я нашел другую статью,...

11
Тест Фридмана против теста Уилкоксона

Я пытаюсь оценить производительность алгоритма классификации машинного обучения под наблюдением. Наблюдения делятся на номинальные классы (2 на данный момент, однако я хотел бы обобщить это для многоклассовых проблем), составленные из 99 субъектов. Один из вопросов, на которые я бы хотел ответить,...

11
Введение в непараметрическую статистику

Я изучал статистику в течение последних двух лет. Почти все, что я узнал, о параметрической статистике. Теперь я хотел бы узнать больше о непараметрической статистике. Кто-нибудь может предложить какое-то краткое (возможно, читабельное) введение в эту...

11
Многократные сравнения в непараметрическом тесте

Я работаю с набором данных, который является непараметрическим и имеет 12 обработок. Я выполнил тест Крускала-Уоллиса и получил значительное значение, и теперь я хотел бы провести процедуру множественных сравнений, чтобы увидеть, какие из обработок значительно различаются. По этой теме имеется...

10
Лучшие методы выбора признаков для непараметрической регрессии

Вопрос новичка здесь. В настоящее время я выполняю непараметрическую регрессию, используя пакет np в R. У меня есть 7 функций, и я использую метод грубой силы, я определил лучшие 3. Но скоро у меня будет гораздо больше, чем 7 функций! Мой вопрос заключается в том, каковы в настоящее время лучшие...

10
Лечение выбросов, вызванных куртозом

Мне было интересно, может ли кто-нибудь помочь мне с информацией о куртозе (т.е. есть ли способ преобразовать ваши данные, чтобы уменьшить его?) У меня есть набор данных анкеты с большим количеством случаев и переменных. Для некоторых из моих переменных данные показывают довольно высокие значения...

10
Какова нулевая гипотеза в тесте Манна-Уитни?

Пусть - случайное значение из распределения 1, а - случайное значение из распределения 2. Я думал, что нулевой гипотезой для теста Манна-Уитни было P (X_1 <X_2) = P (X_2 <X_1) .X1X1X_1X2X2X_2P(X1<X2)=P(X2<X1)P(X1<X2)=P(X2<X1)P(X_1 < X_2) = P(X_2 < X_1) Если я запускаю симуляции...

10
Какова вероятность того, что n человек из списка m людей будут случайным образом выбирать x людей из списка y людей?

Если я выбираю 232 человека из группы из 363 человек без замены, какова вероятность того, что 2 из списка из 12 конкретных людей будут включены в этот выбор? Это случайная ничья для ультра гонки, в которой было 363 участника на 232 места. Есть аргумент о том, был ли выбор предвзятым по отношению к...

10
Критические значения Вилкоксона-Манна-Уитни в R

Я заметил, что когда я пытаюсь найти критические значения для Манна-Уитни U, используя R, значения всегда 1 + критическое значение. Например, для критическое значение (двусторонний) равно 8, а для α = 0,05 , n = 12 , m = 8 критическое (двустороннее) значение равно 22 (проверьте таблицы ), но:α =...

10
Требуются ли порядковые или интервальные данные для теста с ранговым знаком Вилкоксона?

Посмотрев на несколько онлайн-источников, я не могу получить прямой ответ. Может ли кто-нибудь уточнить для меня, достаточно ли порядковых данных для использования в WSRT, и если нет, является ли проверка знака подходящей альтернативой? Наконец, это относится к моему диссертационному проекту в...

10
Гистограмма с однородными и неоднородными ячейками

Этот вопрос описывает принципиальное различие между равномерной и неоднородной гистограммой. И в этом вопросе обсуждается эмпирическое правило для выбора количества бинов однородной гистограммы, которое оптимизирует (в некотором смысле) степень, в которой гистограмма представляет распределение, из...

10
Модель истории дискретного времени (выживания) в R

Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки:...

10
Как мне включить инновационный выброс при наблюдении 48 в мою модель ARIMA?

Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1). Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных. Как включить этот выброс в мою...

10
Имеют ли плотности случайные процессы, такие как процесс Гаусса / процесс Дирихле? Если нет, то как к ним можно применить правило Байеса?

Процесс Дирихле и процесс Гаусса часто называют «распределениями по функциям» или «распределениями по распределениям». В таком случае, могу ли я осмысленно говорить о плотности функции под GP? То есть, есть ли у гауссовского процесса или процесса Дирихле понятие плотности вероятности? Если это не...

10
Вероятность пересечения из нескольких выборок одной и той же популяции

Вот пример случая: У меня есть население 10000 предметов. Каждый элемент имеет уникальный идентификатор. Я случайно выбираю 100 предметов и записываю идентификаторы Я положил 100 предметов обратно в население Я снова выбираю 100 предметов, записываю идентификаторы и заменяю их. В общей сложности я...