Вопросы с тегом «ties»

46

Процент перекрывающихся областей двух нормальных распределений

Мне было интересно, учитывая два нормальных распределения с и \ sigma_2, \ \ mu_2σ1, μ1σ1, μ1\sigma_1,\ \mu_1σ2, μ2σ2, μ2\sigma_2, \ \mu_2 Как я могу рассчитать процент перекрывающихся регионов двух распределений? Я полагаю, что у этой проблемы есть определенное имя, знаете ли вы какое-либо...

37

Вероятностные неравенства

Я ищу некоторые вероятностные неравенства для сумм неограниченных случайных величин. Я был бы очень признателен, если кто-нибудь может дать мне некоторые мысли. Моя задача состоит в том, чтобы найти экспоненциальную верхнюю границу вероятности того, что сумма неограниченных случайных величин iid,...

probability mathematical-statistics probability-inequalities mgf

34

Иерархическая кластеризация с данными смешанного типа - какое расстояние / сходство использовать?

В моем наборе данных у нас есть как непрерывные, так и естественно дискретные переменные. Я хочу знать, можем ли мы сделать иерархическую кластеризацию, используя оба типа переменных. И если да, то какое расстояние...

clustering similarities distance-functions mixed-type-data

32

Существует ли примерная версия одностороннего чебышевского неравенства?

Меня интересует следующая односторонняя версия неравенства Чебышева Кантелли : P ( X- E ( X) ≥ t ) ≤ V a r ( X)V a r (X) + т2,п(Икс-Е(Икс)≥T)≤Вaр(Икс)Вaр(Икс)+T2, \mathbb P(X - \mathbb E (X) \geq t) \leq \frac{\mathrm{Var}(X)}{\mathrm{Var}(X) + t^2} \,. По сути, если вы знаете среднее значение и...

probability mathematical-statistics probability-inequalities mean

30

Когда функция биномиального распределения выше / ниже предельной функции распределения Пуассона?

Обозначим через биномиальную функцию распределения (DF) с параметрами и вычисленными при : и пусть обозначает пуассоновский DF с параметром оцененным при : B(n,p,r)B(n,p,r)B(n,p,r)n∈Nn∈Nn \in \mathbb Np∈(0,1)p∈(0,1)p \in (0,1)r∈{0,1,…,n}r∈{0,1,…,n}r \in...

binomial poisson-distribution convergence probability-inequalities

28

Сравнение иерархических кластерных дендрограмм, полученных разными расстояниями и методами

[Первоначальный заголовок «Измерение подобия для деревьев иерархической кластеризации» был позже изменен @ttnphns, чтобы лучше отражать тему] Я выполняю ряд иерархических кластерных анализов на базе данных записей пациентов (например, аналогично...

r clustering distance-functions similarities dendrogram

28

Значение «Частота» для данных интервалов секунд / минут в R

Я использую R (3.1.1) и модели ARIMA для прогнозирования. Я хотел бы знать, каким должен быть параметр «частоты», который назначается в ts()функции , если я использую данные временных рядов, которые: разделено минутами и распространяется в течение 180 дней (1440 минут / день) отделяется секундами и...

r time-series arima multiple-seasonalities mape

27

Преобразование матрицы подобия в (евклидову) матрицу расстояний

В алгоритме «Случайный лес» Брейман (автор) строит матрицу подобия следующим образом: Посылайте все учебные примеры по каждому дереву в лесу Если два примера попадают в один и тот же лист, увеличивайте соответствующий элемент в матрице подобия на 1 Нормализовать матрицу количеством деревьев Он...

random-forest distance similarities euclidean

25

Ежедневный анализ временных рядов

Я пытаюсь провести анализ временных рядов, и я новичок в этой области. У меня есть ежедневный подсчет событий с 2006 по 2009 год, и я хочу приспособить модель временного ряда к нему. Вот прогресс, который я сделал: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) В...

r time-series seasonality multiple-seasonalities tbats hypothesis-testing beta-distribution machine-learning unsupervised-learning supervised-learning reinforcement-learning

22

Как разложить временной ряд с несколькими сезонными компонентами?

У меня есть временной ряд, который содержит двойные сезонные компоненты, и я хотел бы разбить ряд на следующие компоненты временного ряда (тренд, сезонный компонент 1, сезонный компонент 2 и нерегулярный компонент). Насколько я знаю, процедура STL для разложения ряда в R допускает только один...

r time-series forecasting decomposition multiple-seasonalities

20

Анализ выживания: непрерывное и дискретное время

Я не совсем понимаю, как решить, следует ли считать время непрерывным или дискретным в анализе выживания. В частности, я хочу использовать анализ выживаемости для определения переменных на уровне детей и домохозяйств, которые имеют наибольшее расхождение в их влиянии на выживаемость мальчиков и...

survival ties

20

Есть ли R-функция, которая будет вычислять матрицу косинусных различий? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . Я хотел бы сделать тепловую карту с кластеризацией строк на основе косинусных расстояний. Я использую...

r clustering similarities

20

Коэффициенты подобия для двоичных данных: почему Жаккар предпочел Рассела и Рао?

Из энциклопедии статистических наук я понимаю, что, учитывая дихотомических (двоичных: 1 = присутствующих; 0 = отсутствующих) атрибутов (переменных), мы можем сформировать таблицу сопряженности для любых двух объектов i и j выборки:ппp j 1 0 ------- 1 | a | b | i ------- 0 | c | d | ------- a =...

binary-data similarities association-measure

20

Какова жесткая нижняя граница времени сбора купонов?

В классической задаче по сбору купонов хорошо известно, что время необходимое для завершения набора из случайно выбранных купонов, удовлетворяет , и .TТTnNnE[T]∼nlnnE[T]∼nln⁡nE[T] \sim n \ln n Var(T)∼n2Var(T)∼n2Var(T) \sim n^2Pr(T>nlnn+cn)<e−cPr(T>nln⁡n+cn)<e−c\Pr(T > n \ln n + cn) <...

probability probability-inequalities coupon-collector-problem

17

Меры сходства между кривыми?

Я хотел бы вычислить меру сходства между двумя упорядоченными наборами точек - теми, что под Пользователем, и теми, что под Учителем : Точки - это кривые в трехмерном пространстве, но я думал, что проблема упрощается, если я нанесу их в двух измерениях, как на картинке. Если точки перекрываются,...

multiple-comparisons similarities curves procrustes-analysis

17

Понимание теста Колмогорова-Смирнова в R

Я пытаюсь понять вывод тестовой функции Колмогорова-Смирнова (два примера, двухсторонние). Вот простой тест. x <- c(1,2,2,3,3,3,3,4,5,6) y <- c(2,3,4,5,5,6,6,6,6,7) z <- c(12,13,14,15,15,16,16,16,16,17) ks.test(x,y) # Two-sample Kolmogorov-Smirnov test # #data: x and y #D = 0.5, p-value =...

r kolmogorov-smirnov ties

16

В теории статистического обучения, нет ли проблемы переоснащения на тестовом наборе?

Давайте рассмотрим проблему классификации набора данных MNIST. Согласно веб -странице MNIST Яна ЛеКуна , «Ciresan et al.» получил 0,23% ошибок в тестовом наборе MNIST с использованием сверточной нейронной сети. Давайте обозначим обучающий набор MNIST как , тестовый набор MNIST как , окончательную...

machine-learning classification overfitting probability-inequalities

15

Прогнозирование временных рядов с ежедневными данными: ARIMA с регрессором

Я использую ежедневные временные ряды данных о продажах, которые содержат около 2 лет ежедневных точек данных. Основываясь на некоторых онлайн-уроках / примерах, я попытался определить сезонность в данных. Кажется, что есть еженедельная, ежемесячная и, вероятно, годовая периодичность / сезонность....

r time-series forecasting arima multiple-seasonalities

14

Связанный момент производящей функции

Этот вопрос возникает из вопроса, который здесь задают о функции, порождающей момент (MGF). Предположим, что XXX - ограниченная случайная величина со средним нулем, принимающая значения в [−σ,σ][−σ,σ][-\sigma, \sigma] и пусть G(t)=E[etX]G(t)=E[etX]G(t) = E[e^{tX}] - ее MGF. Из а связаны...

probability probability-inequalities mgf

14

Почему связи непросты в непараметрической статистике?

Мой непараметрический текст, Практическая непараметрическая статистика , часто дает четкие формулы для ожиданий, отклонений, статистики тестов и т. П., Но содержит предостережение о том, что это работает, только если мы игнорируем связи. При расчете U-статистики Манна-Уитни рекомендуется...

nonparametric ties