Вопросы с тегом «r»

9
Эффективная свертка (в R)

Я хочу рассчитать / оценить свертку g(x)=∫Df(x−t)ϕ(t)dt,g(x)=∫Df(x−t)ϕ(t)dt,g(x)=\int_D f(x-t) \phi(t) dt, где является плотностью и гладкая функция с компактным носителем . Свертка недоступна в закрытом виде, и мне нужно интегрировать ее численно. Мой вопрос: есть ли эффективный способ сделать...

9
Проверка предположения о пропорциональных шансах выполняется в порядковой логистической регрессии с использованием функции polr

Я использовал функцию 'polr' в пакете MASS, чтобы запустить порядковую логистическую регрессию для порядковой категориальной переменной ответа с 15 непрерывными объясняющими переменными. Я использовал код (показанный ниже), чтобы проверить, что моя модель соответствует предположению о...

9
Обратная выборка CDF для смешанного распределения

Вне контекста короткая версия Пусть будет случайной величиной с CDF yyyF(⋅)≡{θθ+(1−θ)×CDFlog-normal(⋅;μ,σ) y = 0  y > 0F(⋅)≡{θ y = 0 θ+(1−θ)×CDFlog-normal(⋅;μ,σ) y > 0 F(\cdot) \equiv \cases{\theta & y = 0 \\ \theta + (1-\theta) \times \text{CDF}_{\text{log-normal}}(\cdot; \mu, \sigma) & y >...

9
Как интерпретировать дисперсию случайного эффекта в обобщенной линейной смешанной модели

В логистической обобщенной линейной смешанной модели (семейство = бином) я не знаю, как интерпретировать дисперсию случайных эффектов: Random effects: Groups Name Variance Std.Dev. HOSPITAL (Intercept) 0.4295 0.6554 Number of obs: 2275, groups: HOSPITAL, 14 Как мне интерпретировать этот числовой...

9
Доверительный интервал для среднего эффекта лечения от веса оценки склонности?

Я пытаюсь оценить средний эффект лечения по данным наблюдений, используя весовые коэффициенты склонности (особенно IPTW). Я думаю, что я правильно рассчитываю ATE, но я не знаю, как рассчитать доверительный интервал ATE, принимая во внимание весовые коэффициенты обратной склонности. Вот уравнение,...

9
Подгонка гетероскедастической обобщенной линейной модели для биномиальных ответов

У меня есть данные из следующего экспериментального плана: мои наблюдения - это подсчет числа успехов ( K) из соответствующего числа испытаний ( N), измеренных для двух групп, каждая из которых состоит из Iиндивидуумов, из Tобработок, где в каждой такой комбинации факторов есть Rповторения , Таким...

9
Как переставить 2D данные, чтобы получить заданную корреляцию?

У меня есть следующий простой набор данных с двумя непрерывными переменными; то есть: d = data.frame(x=runif(100,0,100),y = runif(100,0,100)) plot(d$x,d$y) abline(lm(y~x,d), col="red") cor(d$x,d$y) # = 0.2135273 Мне нужно переставить данные таким образом, чтобы корреляция между переменными...

9
Каковы различия между различными решателями квадратичного программирования R?

Я ищу пакет, который поможет мне решить некоторые задачи квадратичной оптимизации, и я вижу, что есть как минимум полдюжины различных пакетов. Согласно этой странице: QP (квадратичное программирование, 90C20): cplexAPI , kernlab , limSolve , LowRankQP , quadprog , Rcplex , Rmosek Некоторые из них...

9
R сезонные временные ряды

Я использую decomposeфункцию Rи придумываю 3 компонента моего ежемесячного временного ряда (тренд, сезонный и случайный). Если я строю график или смотрю на таблицу, я ясно вижу, что временные ряды зависят от сезонности. Тем не менее, когда я регрессирую временной ряд на 11 сезонных фиктивных...

9
Линейная комбинация двух случайных ненормалей, которые все еще являются членами одной семьи

Хорошо известно, что линейная комбинация 2 случайных нормальных переменных также является случайной нормальной переменной. Существуют ли общие семейства ненормальных распределений (например, Вейбулла), которые также имеют это свойство? Кажется, есть много контрпримеров. Например, линейная...

9
Как найти и оценить оптимальную дискретизацию для непрерывной переменной с критерием

У меня есть набор данных с непрерывной переменной и двоичной целевой переменной (0 и 1). Мне нужно дискретизировать непрерывные переменные (для логистической регрессии) по отношению к целевой переменной и с ограничением, что частота наблюдений в каждом интервале должна быть сбалансирована. Я...

9
Как использовать anova для сравнения двух моделей?

Как понимать anovaрезультат при сравнении двух моделей? Пример: Res.Df RSS Df Sum of Sq F Pr(>F) 1 9 54.032 2 7 4.632 2 49.4 37.329 0.0001844 *** На странице руководства указано: «Вычислить таблицы отклонений (или отклонений) для одного или нескольких подходящих объектов модели». Однако наш...

9
Оценка многоуровневых моделей логистической регрессии

Следующая многоуровневая логистическая модель с одной пояснительной переменной на уровне 1 (индивидуальный уровень) и одной пояснительной переменной на уровне 2 (групповой уровень): π 0 j = γ 00 + γ 01 z j + u 0 j … ( 2 ) π 1 j = γ 10 + γ 11 z j + u 1 j … ( 3 )логит ( ря ж) = π0 Дж+ π1 JИкся ж… ( 1...

9
Как установить пользовательские контрасты с помощью lmer в R

Я использую lmer в R, чтобы проверить влияние условия ( cond) на некоторый результат. Вот некоторые составные данные, где s - идентификатор субъекта a, bи c- условия. library("tidyr") library("dplyr") set.seed(123) temp <- data.frame(s = paste0("S", 1:30), a = rnorm(30, -2, 1), b = rnorm(30, -3,...

9
Как интерпретировать и делать прогнозирование с использованием пакета tsoutliers и auto.arima

У меня есть ежемесячные данные с 1993 по 2015 год, и я хотел бы сделать прогноз на этих данных. Я использовал пакет tsoutliers для определения выбросов, но я не знаю, как мне продолжать прогнозировать с моим набором данных. Это мой код: product.outlier<-tso(product,types=c("AO","LS","TC"))...

9
Сколько сторон у кубика? Байесовский вывод в JAGS

проблема Я хотел бы сделать некоторые выводы о системе, аналогичной смерти с неизвестным числом сторон. Матрица бросается несколько раз, после чего я хотел бы вывести распределение вероятностей по параметру, соответствующему количеству сторон, которые имеет матрица, θ. Интуиция Если после 40...

9
Почему столбец пересечения в model.matrix заменяет первый фактор?

Я пытаюсь преобразовать столбец фактора в фиктивные переменные: str(cards$pointsBin) # Factor w/ 5 levels ".lte100",".lte150",..: 3 2 3 1 4 4 2 2 4 4 ... labels <- model.matrix(~ pointsBin, data=cards) head(labels) # (Intercept) pointsBin.lte150 pointsBin.lte200 pointsBin.lte250 pointsBin.lte300...

9
Выбор функций для проблем кластеризации

Я пытаюсь сгруппировать разные наборы данных, используя неконтролируемые алгоритмы (кластеризация). Проблема в том, что у меня много функций (~ 500) и небольшое количество дел (200-300). До сих пор я занимался только задачами классификации, для которых я всегда отмечал данные как обучающие наборы....