Вопросы с тегом «ties»

46
Процент перекрывающихся областей двух нормальных распределений

Мне было интересно, учитывая два нормальных распределения с и \ sigma_2, \ \ mu_2σ1, μ1σ1, μ1\sigma_1,\ \mu_1σ2, μ2σ2, μ2\sigma_2, \ \mu_2 Как я могу рассчитать процент перекрывающихся регионов двух распределений? Я полагаю, что у этой проблемы есть определенное имя, знаете ли вы какое-либо...

37
Вероятностные неравенства

Я ищу некоторые вероятностные неравенства для сумм неограниченных случайных величин. Я был бы очень признателен, если кто-нибудь может дать мне некоторые мысли. Моя задача состоит в том, чтобы найти экспоненциальную верхнюю границу вероятности того, что сумма неограниченных случайных величин iid,...

34
Иерархическая кластеризация с данными смешанного типа - какое расстояние / сходство использовать?

В моем наборе данных у нас есть как непрерывные, так и естественно дискретные переменные. Я хочу знать, можем ли мы сделать иерархическую кластеризацию, используя оба типа переменных. И если да, то какое расстояние...

32
Существует ли примерная версия одностороннего чебышевского неравенства?

Меня интересует следующая односторонняя версия неравенства Чебышева Кантелли : P ( X- E ( X) ≥ t ) ≤ V a r ( X)V a r (X) + т2,п(Икс-Е(Икс)≥T)≤Вaр(Икс)Вaр(Икс)+T2, \mathbb P(X - \mathbb E (X) \geq t) \leq \frac{\mathrm{Var}(X)}{\mathrm{Var}(X) + t^2} \,. По сути, если вы знаете среднее значение и...

30
Когда функция биномиального распределения выше / ниже предельной функции распределения Пуассона?

Обозначим через биномиальную функцию распределения (DF) с параметрами и вычисленными при : и пусть обозначает пуассоновский DF с параметром оцененным при : B(n,p,r)B(n,p,r)B(n,p,r)n∈Nn∈Nn \in \mathbb Np∈(0,1)p∈(0,1)p \in (0,1)r∈{0,1,…,n}r∈{0,1,…,n}r \in...

28
Сравнение иерархических кластерных дендрограмм, полученных разными расстояниями и методами

[Первоначальный заголовок «Измерение подобия для деревьев иерархической кластеризации» был позже изменен @ttnphns, чтобы лучше отражать тему] Я выполняю ряд иерархических кластерных анализов на базе данных записей пациентов (например, аналогично...

28
Значение «Частота» для данных интервалов секунд / минут в R

Я использую R (3.1.1) и модели ARIMA для прогнозирования. Я хотел бы знать, каким должен быть параметр «частоты», который назначается в ts()функции , если я использую данные временных рядов, которые: разделено минутами и распространяется в течение 180 дней (1440 минут / день) отделяется секундами и...

27
Преобразование матрицы подобия в (евклидову) матрицу расстояний

В алгоритме «Случайный лес» Брейман (автор) строит матрицу подобия следующим образом: Посылайте все учебные примеры по каждому дереву в лесу Если два примера попадают в один и тот же лист, увеличивайте соответствующий элемент в матрице подобия на 1 Нормализовать матрицу количеством деревьев Он...

25
Ежедневный анализ временных рядов

Я пытаюсь провести анализ временных рядов, и я новичок в этой области. У меня есть ежедневный подсчет событий с 2006 по 2009 год, и я хочу приспособить модель временного ряда к нему. Вот прогресс, который я сделал: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) В...

22
Как разложить временной ряд с несколькими сезонными компонентами?

У меня есть временной ряд, который содержит двойные сезонные компоненты, и я хотел бы разбить ряд на следующие компоненты временного ряда (тренд, сезонный компонент 1, сезонный компонент 2 и нерегулярный компонент). Насколько я знаю, процедура STL для разложения ряда в R допускает только один...

20
Анализ выживания: непрерывное и дискретное время

Я не совсем понимаю, как решить, следует ли считать время непрерывным или дискретным в анализе выживания. В частности, я хочу использовать анализ выживаемости для определения переменных на уровне детей и домохозяйств, которые имеют наибольшее расхождение в их влиянии на выживаемость мальчиков и...

20
Есть ли R-функция, которая будет вычислять матрицу косинусных различий? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . Я хотел бы сделать тепловую карту с кластеризацией строк на основе косинусных расстояний. Я использую...

20
Коэффициенты подобия для двоичных данных: почему Жаккар предпочел Рассела и Рао?

Из энциклопедии статистических наук я понимаю, что, учитывая дихотомических (двоичных: 1 = присутствующих; 0 = отсутствующих) атрибутов (переменных), мы можем сформировать таблицу сопряженности для любых двух объектов i и j выборки:ппp j 1 0 ------- 1 | a | b | i ------- 0 | c | d | ------- a =...

20
Какова жесткая нижняя граница времени сбора купонов?

В классической задаче по сбору купонов хорошо известно, что время необходимое для завершения набора из случайно выбранных купонов, удовлетворяет , и .TТTnNnE[T]∼nlnnE[T]∼nln⁡nE[T] \sim n \ln n Var(T)∼n2Var(T)∼n2Var(T) \sim n^2Pr(T>nlnn+cn)<e−cPr(T>nln⁡n+cn)<e−c\Pr(T > n \ln n + cn) <...

17
Меры сходства между кривыми?

Я хотел бы вычислить меру сходства между двумя упорядоченными наборами точек - теми, что под Пользователем, и теми, что под Учителем : Точки - это кривые в трехмерном пространстве, но я думал, что проблема упрощается, если я нанесу их в двух измерениях, как на картинке. Если точки перекрываются,...

17
Понимание теста Колмогорова-Смирнова в R

Я пытаюсь понять вывод тестовой функции Колмогорова-Смирнова (два примера, двухсторонние). Вот простой тест. x <- c(1,2,2,3,3,3,3,4,5,6) y <- c(2,3,4,5,5,6,6,6,6,7) z <- c(12,13,14,15,15,16,16,16,16,17) ks.test(x,y) # Two-sample Kolmogorov-Smirnov test # #data: x and y #D = 0.5, p-value =...

16
В теории статистического обучения, нет ли проблемы переоснащения на тестовом наборе?

Давайте рассмотрим проблему классификации набора данных MNIST. Согласно веб -странице MNIST Яна ЛеКуна , «Ciresan et al.» получил 0,23% ошибок в тестовом наборе MNIST с использованием сверточной нейронной сети. Давайте обозначим обучающий набор MNIST как , тестовый набор MNIST как , окончательную...

15
Прогнозирование временных рядов с ежедневными данными: ARIMA с регрессором

Я использую ежедневные временные ряды данных о продажах, которые содержат около 2 лет ежедневных точек данных. Основываясь на некоторых онлайн-уроках / примерах, я попытался определить сезонность в данных. Кажется, что есть еженедельная, ежемесячная и, вероятно, годовая периодичность / сезонность....

14
Связанный момент производящей функции

Этот вопрос возникает из вопроса, который здесь задают о функции, порождающей момент (MGF). Предположим, что XXX - ограниченная случайная величина со средним нулем, принимающая значения в [−σ,σ][−σ,σ][-\sigma, \sigma] и пусть G(t)=E[etX]G(t)=E[etX]G(t) = E[e^{tX}] - ее MGF. Из а связаны...

14
Почему связи непросты в непараметрической статистике?

Мой непараметрический текст, Практическая непараметрическая статистика , часто дает четкие формулы для ожиданий, отклонений, статистики тестов и т. П., Но содержит предостережение о том, что это работает, только если мы игнорируем связи. При расчете U-статистики Манна-Уитни рекомендуется...