Вопросы с тегом «r»

9

Я хочу рассчитать / оценить свертку g(x)=∫Df(x−t)ϕ(t)dt,g(x)=∫Df(x−t)ϕ(t)dt,g(x)=\int_D f(x-t) \phi(t) dt, где является плотностью и гладкая функция с компактным носителем . Свертка недоступна в закрытом виде, и мне нужно интегрировать ее численно. Мой вопрос: есть ли эффективный способ сделать...

r convolution

9

Проверка предположения о пропорциональных шансах выполняется в порядковой логистической регрессии с использованием функции polr

Я использовал функцию 'polr' в пакете MASS, чтобы запустить порядковую логистическую регрессию для порядковой категориальной переменной ответа с 15 непрерывными объясняющими переменными. Я использовал код (показанный ниже), чтобы проверить, что моя модель соответствует предположению о...

r logistic assumptions ordered-logit polr

9

Обратная выборка CDF для смешанного распределения

Вне контекста короткая версия Пусть будет случайной величиной с CDF yyyF(⋅)≡{θθ+(1−θ)×CDFlog-normal(⋅;μ,σ) y = 0 y > 0F(⋅)≡{θ y = 0 θ+(1−θ)×CDFlog-normal(⋅;μ,σ) y > 0 F(\cdot) \equiv \cases{\theta & y = 0 \\ \theta + (1-\theta) \times \text{CDF}_{\text{log-normal}}(\cdot; \mu, \sigma) & y >...

r distributions sampling simulation copula

9

Как интерпретировать дисперсию случайного эффекта в обобщенной линейной смешанной модели

В логистической обобщенной линейной смешанной модели (семейство = бином) я не знаю, как интерпретировать дисперсию случайных эффектов: Random effects: Groups Name Variance Std.Dev. HOSPITAL (Intercept) 0.4295 0.6554 Number of obs: 2275, groups: HOSPITAL, 14 Как мне интерпретировать этот числовой...

r lme4-nlme

9

Доверительный интервал для среднего эффекта лечения от веса оценки склонности?

Я пытаюсь оценить средний эффект лечения по данным наблюдений, используя весовые коэффициенты склонности (особенно IPTW). Я думаю, что я правильно рассчитываю ATE, но я не знаю, как рассчитать доверительный интервал ATE, принимая во внимание весовые коэффициенты обратной склонности. Вот уравнение,...

r survey causality propensity-scores observational-study

9

Подгонка гетероскедастической обобщенной линейной модели для биномиальных ответов

У меня есть данные из следующего экспериментального плана: мои наблюдения - это подсчет числа успехов ( K) из соответствующего числа испытаний ( N), измеренных для двух групп, каждая из которых состоит из Iиндивидуумов, из Tобработок, где в каждой такой комбинации факторов есть Rповторения , Таким...

r generalized-linear-model heteroscedasticity log-linear dglm

9

Как переставить 2D данные, чтобы получить заданную корреляцию?

У меня есть следующий простой набор данных с двумя непрерывными переменными; то есть: d = data.frame(x=runif(100,0,100),y = runif(100,0,100)) plot(d$x,d$y) abline(lm(y~x,d), col="red") cor(d$x,d$y) # = 0.2135273 Мне нужно переставить данные таким образом, чтобы корреляция между переменными...

r correlation

9

Каковы различия между различными решателями квадратичного программирования R?

Я ищу пакет, который поможет мне решить некоторые задачи квадратичной оптимизации, и я вижу, что есть как минимум полдюжины различных пакетов. Согласно этой странице: QP (квадратичное программирование, 90C20): cplexAPI , kernlab , limSolve , LowRankQP , quadprog , Rcplex , Rmosek Некоторые из них...

r optimization

9

R сезонные временные ряды

Я использую decomposeфункцию Rи придумываю 3 компонента моего ежемесячного временного ряда (тренд, сезонный и случайный). Если я строю график или смотрю на таблицу, я ясно вижу, что временные ряды зависят от сезонности. Тем не менее, когда я регрессирую временной ряд на 11 сезонных фиктивных...

r regression time-series

9

Выводы из результатов анализа главных компонентов

Я пытаюсь понять вывод анализа главных компонентов, выполняемого следующим образом: > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7...

r pca interpretation

9

Линейная комбинация двух случайных ненормалей, которые все еще являются членами одной семьи

Хорошо известно, что линейная комбинация 2 случайных нормальных переменных также является случайной нормальной переменной. Существуют ли общие семейства ненормальных распределений (например, Вейбулла), которые также имеют это свойство? Кажется, есть много контрпримеров. Например, линейная...

distributions linear

9

Как найти и оценить оптимальную дискретизацию для непрерывной переменной с критерием

У меня есть набор данных с непрерывной переменной и двоичной целевой переменной (0 и 1). Мне нужно дискретизировать непрерывные переменные (для логистической регрессии) по отношению к целевой переменной и с ограничением, что частота наблюдений в каждом интервале должна быть сбалансирована. Я...

r machine-learning chi-squared discrete-data supervised-learning

9

Как использовать anova для сравнения двух моделей?

Как понимать anovaрезультат при сравнении двух моделей? Пример: Res.Df RSS Df Sum of Sq F Pr(>F) 1 9 54.032 2 7 4.632 2 49.4 37.329 0.0001844 *** На странице руководства указано: «Вычислить таблицы отклонений (или отклонений) для одного или нескольких подходящих объектов модели». Однако наш...

r regression anova

9

Оценка многоуровневых моделей логистической регрессии

Следующая многоуровневая логистическая модель с одной пояснительной переменной на уровне 1 (индивидуальный уровень) и одной пояснительной переменной на уровне 2 (групповой уровень): π 0 j = γ 00 + γ 01 z j + u 0 j … ( 2 ) π 1 j = γ 10 + γ 11 z j + u 1 j … ( 3 )логит ( ря ж) = π0 Дж+ π1 JИкся ж… ( 1...

r logistic generalized-linear-model simulation multilevel-analysis

9

Что такое VectorSource и VCorpus в пакете 'tm' (Text Mining) в R

Я не совсем уверен, что именно VectorSource и VCorpus находятся в пакете 'tm'. Документация по ним неясна, кто-нибудь может заставить меня понять в простых

r text-mining

9

Как установить пользовательские контрасты с помощью lmer в R

Я использую lmer в R, чтобы проверить влияние условия ( cond) на некоторый результат. Вот некоторые составные данные, где s - идентификатор субъекта a, bи c- условия. library("tidyr") library("dplyr") set.seed(123) temp <- data.frame(s = paste0("S", 1:30), a = rnorm(30, -2, 1), b = rnorm(30, -3,...

r lme4-nlme contrasts

9

Как интерпретировать и делать прогнозирование с использованием пакета tsoutliers и auto.arima

У меня есть ежемесячные данные с 1993 по 2015 год, и я хотел бы сделать прогноз на этих данных. Я использовал пакет tsoutliers для определения выбросов, но я не знаю, как мне продолжать прогнозировать с моим набором данных. Это мой код: product.outlier<-tso(product,types=c("AO","LS","TC"))...

r time-series forecasting arima outliers

9

Сколько сторон у кубика? Байесовский вывод в JAGS

проблема Я хотел бы сделать некоторые выводы о системе, аналогичной смерти с неизвестным числом сторон. Матрица бросается несколько раз, после чего я хотел бы вывести распределение вероятностей по параметру, соответствующему количеству сторон, которые имеет матрица, θ. Интуиция Если после 40...

r probability bayesian jags

9

Почему столбец пересечения в model.matrix заменяет первый фактор?

Я пытаюсь преобразовать столбец фактора в фиктивные переменные: str(cards$pointsBin) # Factor w/ 5 levels ".lte100",".lte150",..: 3 2 3 1 4 4 2 2 4 4 ... labels <- model.matrix(~ pointsBin, data=cards) head(labels) # (Intercept) pointsBin.lte150 pointsBin.lte200 pointsBin.lte250 pointsBin.lte300...

r categorical-data categorical-encoding

9

Выбор функций для проблем кластеризации

Я пытаюсь сгруппировать разные наборы данных, используя неконтролируемые алгоритмы (кластеризация). Проблема в том, что у меня много функций (~ 500) и небольшое количество дел (200-300). До сих пор я занимался только задачами классификации, для которых я всегда отмечал данные как обучающие наборы....

r clustering feature-selection unsupervised-learning