Вопросы с тегом «r»

10

Модель истории дискретного времени (выживания) в R

Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки:...

r survival pca sas matlab neural-networks r logistic spatial spatial-interaction-model r time-series econometrics var statistical-significance t-test cross-validation sample-size r regression optimization least-squares constrained-regression nonparametric ordinal-data wilcoxon-signed-rank references neural-networks jags bugs hierarchical-bayesian gaussian-mixture r regression svm predictive-models libsvm scikit-learn probability self-study stata sample-size spss wilcoxon-mann-whitney survey ordinal-data likert group-differences r regression anova mathematical-statistics normal-distribution random-generation truncation repeated-measures variance variability distributions random-generation uniform regression r generalized-linear-model goodness-of-fit data-visualization r time-series arima autoregressive confidence-interval r time-series arima autocorrelation seasonality hypothesis-testing bayesian frequentist uninformative-prior correlation matlab cross-correlation

10

Что является более точным glm или glmnet?

R glm и glmnet используют разные алгоритмы. Я замечаю нетривиальные различия между оценочными коэффициентами, когда использую оба. Меня интересует, когда одно является более точным, чем другое, и время, чтобы решить / точность компромисса. В частности, я имею в виду случай, когда в glmnet-й...

r generalized-linear-model glmnet

10

Исправлено против случайных эффектов

Совсем недавно я начал изучать обобщенные линейные смешанные модели и использовал R для изучения того, какое значение имеет отношение к членству в группе как к фиксированному, так и к случайному эффекту. В частности, я смотрю на пример набора данных, который обсуждался здесь:...

r random-effects-model glmm

10

Есть ли общее определение величины эффекта?

У effect-sizeтега нет вики. Страница википедии о размере эффекта не дает точного общего определения. И я никогда не видел общего определения величины эффекта . Однако, читая некоторые дискуссии, подобные этой, у меня складывается впечатление, что люди имеют в виду общее представление о величине...

hypothesis-testing effect-size power

10

Несколько логистических регрессий против полиномиальной регрессии

Является ли целесообразным сделать несколько бинарных логистических регрессий вместо полиномиальной регрессии? Из этого вопроса: Полиномиальная логистическая регрессия против бинарной логистической регрессии один-против-остальных Я вижу, что полиномиальная регрессия может иметь более низкие...

r logistic multinomial

10

Методы наказания за категориальные данные: объединение уровней в фактор

Наказанные модели могут использоваться для оценки моделей, в которых количество параметров равно или даже превышает размер выборки. Такая ситуация может возникнуть в лог-линейных моделях больших разреженных таблиц категориальных данных или данных подсчета. В этих настройках часто также желательно...

categorical-data lasso elastic-net log-linear many-categories

10

Как записать термин ошибки в повторных измерениях ANOVA в R: Ошибка (субъект) vs Ошибка (субъект / время)

Мой вопрос очень тесно связан с предыдущим постом указания срока Error () в повторных измерениях ANOVA в R . Тем не менее, я хотел бы получить более полное представление о том, как определить термин ошибки. Предположим, у меня есть двухсторонний повторный ANOVA. Фактором межгруппового эффекта...

r anova repeated-measures

10

Как рассчитать расхождение / расстояние Кульбака-Лейблера?

У меня есть три набора данных X, Y и Z. Каждый набор данных определяет частоту происходящего события. Например: Набор данных X: E1: 4, E2: 0, E3: 10, E4: 5, E5: 0, E6: 0 и т. Д. Набор данных Y: E1: 2, E2: 3, E3: 7, E4: 6, E5: 0, E6: 0 и т. Д. Набор данных Z: E1: 0, E2: 4, E3: 8, E4: 4, E5: 1, E6: 0...

kullback-leibler

10

Смещение оценок максимального правдоподобия для логистической регрессии

Я хотел бы понять несколько фактов о максимальных вероятностных оценках (MLE) для логистических регрессий. Правда ли, что в целом MLE для логистической регрессии является предвзятой? Я бы сказал "да". Я знаю, например, что размер выборки связан с асимптотическим смещением MLE. Знаете ли вы...

logistic maximum-likelihood unbiased-estimator bias

10

Что означает пропускная способность?

Я построил функцию плотности в R и под графиком - число полос. Что означает это

r

10

Как мне включить инновационный выброс при наблюдении 48 в мою модель ARIMA?

Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1). Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных. Как включить этот выброс в мою...

r time-series arima outliers hypergeometric fishers-exact r time-series intraclass-correlation r logistic glmm clogit mixed-model spss repeated-measures ancova machine-learning python scikit-learn distributions data-transformation stochastic-processes web standard-deviation r machine-learning spatial similarities spatio-temporal binomial sparse poisson-process r regression nonparametric r regression logistic simulation power-analysis r svm random-forest anova repeated-measures manova regression statistical-significance cross-validation group-differences model-comparison r spatial model-evaluation parallel-computing generalized-least-squares r stata fitting mixture hypothesis-testing categorical-data hypothesis-testing anova statistical-significance repeated-measures likert wilcoxon-mann-whitney boxplot statistical-significance confidence-interval forecasting prediction-interval regression categorical-data stata least-squares experiment-design skewness reliability cronbachs-alpha r regression splines maximum-likelihood modeling likelihood-ratio profile-likelihood nested-models

10

Как получить доверительный интервал по изменению r-квадрата населения

Ради простого примера предположим, что есть две модели линейной регрессии Модель 1 имеет три предсказатели, x1a, x2b, иx2c Модель 2 имеет три предиктора из модели 1 и два дополнительных предиктора x2aиx2b Существует уравнение регрессии населения, где объясняется дисперсия населения для Модели 1 и...

regression confidence-interval estimation r-squared shrinkage anova t-test references tukey-hsd machine-learning boosting r clustering fishers-exact generalized-linear-model model probit link-function r survival probability distributions dice logistic lme4-nlme glmm meta-analysis distributions distributions factor-analysis r anova repeated-measures post-hoc

10

Корректировка значения p для локальной статистики Морана I (LISA)

Я работаю с некоторым исследовательским пространственным анализом в R с использованием пакета spdep. Я наткнулся на вариант настройки p- значений локальных показателей пространственной ассоциации (LISA), рассчитанных с помощью localmoranфункции. Согласно документам он нацелен на: ... корректировка...

r multiple-comparisons bonferroni

10

Добавление случайного эффекта влияет на оценки коэффициентов

Меня всегда учили, что случайные эффекты влияют только на дисперсию (ошибку), а фиксированные эффекты влияют только на среднее значение. Но я нашел пример, где случайные эффекты влияют и на среднее значение - оценку коэффициента: require(nlme) set.seed(128) n <- 100 k <- 5 cat <-...

r mixed-model random-effects-model

10

SMOTE выдает ошибку для мультиклассовой проблемы дисбаланса

Я пытаюсь использовать SMOTE для исправления дисбаланса в моей проблеме классификации нескольких классов. Хотя SMOTE отлично работает с набором данных iris согласно справочному документу SMOTE, он не работает с аналогичным набором данных. Вот как выглядят мои данные. Обратите внимание, что у него...

r classification unbalanced-classes oversampling

10

Оценка параметра равномерного распределения: неправильный априор?

У нас есть N выборок из равномерного распределения где неизвестно. Оцените из данных.XiXiX_iθ θ[0,θ][0,θ][0,\theta]θθ\thetaθθ\theta Итак, правило Байеса ... f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)f(\theta | {X_i}) = \frac{f({X_i}|\theta)f(\theta)}{f({X_i})} и вероятность:...

bayesian estimation uniform uninformative-prior

10

Ошибка распространения SD против SE

У меня от 3 до 5 показателей качества на человека в двух разных состояниях (A и B). Я черчения в среднем для каждого человека в каждом состоянии , и я использую стандартную ошибку ( то есть , , с = число измерений) как погрешностями.SD/N−−√SD/NSD/\sqrt{N}NNN Теперь я хочу построить график разницы...

standard-deviation standard-error error error-propagation

10

Объяснение фильтров Калмана в моделях пространства состояний

Каковы этапы использования фильтров Калмана в моделях пространства состояний? Я видел несколько разных формулировок, но я не уверен в деталях. Например, Cowpertwait начинается с этого набора уравнений: θt=Gtθt-1+wtyt=F′tθt+vtyt=Ft′θt+vty_{t} = F^{'}_{t}\theta_{t}+v_{t}...

kalman-filter state-space-models

10

Лог вероятности для GLM

В следующем коде я выполняю логистическую регрессию для сгруппированных данных, используя glm, и «вручную», используя mle2. Почему функция logLik в R дает мне вероятность логирования logLik (fit.glm) = - 2.336, отличную от той, что logLik (fit.ml) = - 5.514, которую я получаю вручную?...

r self-study generalized-linear-model

10

Пересчитать логарифмическое правдоподобие из простой модели R lm

Я просто пытаюсь пересчитать с помощью dnorm () логарифмическую вероятность, обеспечиваемую функцией logLik из модели lm (в R). Это работает (почти идеально) для большого количества данных (например, n = 1000): > n <- 1000 > x <- 1:n > set.seed(1) > y <- 10 + 2*x + rnorm(n, 0,...

r generalized-linear-model likelihood lm