Вопросы с тегом «r»

12

Проверка большого набора данных на нормальность - как и насколько это надежно?

Я изучаю часть моего набора данных, содержащую 46840 двойных значений в диапазоне от 1 до 1690, сгруппированных в две группы. Чтобы проанализировать различия между этими группами, я начал с изучения распределения значений, чтобы выбрать правильный тест. Следуя руководству по тестированию на...

r normal-distribution normality-assumption large-data

12

Дисперсионно-ковариационная матричная интерпретация

Предположим, у нас есть линейная модель Model1и vcov(Model1)дает следующую матрицу: (Intercept) latitude sea.distance altitude (Intercept) 28.898100 -23.6439000 -34.1523000 0.50790600 latitude -23.643900 19.7032500 28.4602500 -0.42471450 sea.distance -34.152300 28.4602500 42.4714500 -0.62612550...

r interpretation multicollinearity assumptions covariance-matrix

12

Ступенчатая регрессия в R - Критическое значение p

Какое критическое значение p используется step()функцией в R для ступенчатой регрессии? Я предполагаю, что это 0,15, но верно ли мое предположение? Как я могу изменить критическое значение...

r regression p-value stepwise-regression

12

Модель Лмера не сходится

Мои данные описаны здесь. Что может вызвать «Ошибка () модель сингулярной ошибки» в AOV при подборе повторяющихся мер ANOVA? Я пытаюсь увидеть эффект взаимодействия, используя lmerмой базовый случай: my_null.model <- lmer(value ~ Condition+Scenario+ (1|Player)+(1|Trial), data = my, REML=FALSE)...

r lme4-nlme

12

Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...

r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

12

Каков наилучший способ изменить / реструктурировать данные?

Я научный сотрудник лаборатории (волонтер). Мне и небольшой группе было поручено провести анализ данных для набора данных, извлеченных из большого исследования. К сожалению, данные были собраны с помощью какого-то онлайн-приложения, и оно не было запрограммировано на вывод данных в наиболее удобной...

r excel data-cleaning

12

Понимание результатов анализа посредничества в R

Я пытаюсь разобраться с пакетом посредничества в R, используя виньетку для пакета. Я изо всех сил пытаюсь понять вывод mediate()функции. require("mediation") require("sandwich") data("framing") med.fit <- lm(emo ~ treat + age + educ + gender + income, data = framing) out.fit <- glm(cong_mesg...

r mediation

12

тестирование коэффициентов логистической регрессии с использованием и степеней свободы остаточного отклонения

Резюме: существует ли статистическая теория, поддерживающая использование распределения (со степенями свободы, основанными на остаточном отклонении) для тестов коэффициентов логистической регрессии, а не стандартного нормального распределения?Ttt Некоторое время назад я обнаружил, что при подборе...

r logistic mathematical-statistics sas degrees-of-freedom

12

t.test возвращает ошибку «данные по существу постоянны»

R version 3.1.1 (2014-07-10) -- "Sock it to Me" > bl <- c(140, 138, 150, 148, 135) > fu <- c(138, 136, 148, 146, 133) > t.test(fu, bl, alternative = "two.sided", paired = TRUE) Error in t.test.default(fu, bl, alternative = "two.sided", paired = TRUE) : data are essentially constant...

r t-test

12

Почему SAS PROC GLIMMIX дает ОЧЕНЬ разные случайные уклоны, чем glmer (lme4) для биномиального glmm

Я - пользователь, более знакомый с R, и пытался оценить случайные уклоны (коэффициенты отбора) примерно для 35 особей в течение 5 лет для четырех переменных среды обитания. Переменная ответа - является ли место «использованным» (1) или «доступным» (0) местом обитания («использование» ниже). Я...

r binomial sas random-effects-model lme4-nlme

12

Логистическая регрессия со сплайнами регрессии в R

Я разрабатывал модель логистической регрессии на основе ретроспективных данных из национальной базы данных о травмах головы в Великобритании. Ключевым результатом является 30-дневная смертность (обозначается как «выживаемая» мера). Другие меры с опубликованным доказательством существенного влияния...

r logistic generalized-linear-model goodness-of-fit regression-strategies

12

Какие популярные варианты визуализации 4-мерных данных?

Скажем, у меня есть следующие четырехмерные данные, где первые три можно рассматривать как координаты, а последние можно рассматривать как значения. c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95 Как лучше визуализировать влияние первых трех координат на последнее значение? Я знаю...

r data-visualization

12

Как прочитать результаты теста Данна?

Как мне прочитать результаты теста Данна ? В частности, что говорят значения в таблице ниже? У меня есть непараметрические данные в 4 группах, и я сначала выполнил тест Крускала-Уоллиса, чтобы подтвердить, что распределения групп отличались друг от друга и совокупного набора данных. Затем я...

r distributions kruskal-wallis dunn-test

12

Какие параметры есть у Wishart-Wishart posterior?

При выводе матрицы точности ΛΛ\boldsymbol{\Lambda} нормального распределения, используемой для создания NNN D-мерных векторов, x1,..,xNx1,..,xN\mathbf{x_1},..,\mathbf{x_N} xi∼N(μ,Λ−1)xi∼N(μ,Λ−1)\begin{align} \mathbf{x_i} &\sim \mathcal{N}(\boldsymbol{\mu, \Lambda^{-1}}) \\ \end{align} мы обычно...

bayesian posterior hierarchical-bayesian conjugate-prior wishart

12

Алгоритмы машинного обучения для панельных данных

В этом вопросе. Существует ли метод построения деревьев решений, который учитывает структурированные / иерархические / многоуровневые предикторы? - они упоминают метод данных панели для деревьев. Существуют ли специальные методы данных панели для поддержки векторных машин и нейронных сетей? Если...

r machine-learning svm panel-data cart

12

Оптимизатор lme4 по умолчанию требует много итераций для многомерных данных

TL; DR: lme4оптимизация кажется линейной по количеству параметров модели по умолчанию и намного медленнее, чем эквивалентная glmмодель с фиктивными переменными для групп. Что я могу сделать, чтобы ускорить это? Я пытаюсь соответствовать довольно большой иерархической модели логита (~ 50 тыс. Строк,...

r mixed-model optimization lme4-nlme numerics

12

Линейное преобразование случайной величины с помощью высокой прямоугольной матрицы

Допустим, у нас есть случайный вектор , взятый из распределения с функцией плотности вероятности . Если мы линейно преобразуем его с помощью матрицы полного ранга, чтобы получить , то плотность определяется каке → Х ( → х )п×п → Y = → X → Y F → Y ( → Y )=1Икс⃗ ∈ RNX→∈Rn\vec{X} \in...

references random-variable pdf linear

12

Использование фильтров Калмана для расчета недостающих значений во временных рядах

Меня интересует, как фильтры Калмана могут использоваться для расчета отсутствующих значений в данных временных рядов. Это также применимо, если отсутствуют некоторые последовательные моменты времени? Я не могу найти много по этой теме. Любые объяснения, комментарии и ссылки приветствуются и...

data-imputation kalman-filter

12

Как называется метод оценки плотности, при котором все возможные пары используются для создания нормального распределения смеси?

Я просто подумал о аккуратном (не обязательно хорошем) способе создания одномерных оценок плотности, и мой вопрос: У этого метода оценки плотности есть имя? Если нет, то является ли это частным случаем какого-либо другого метода в литературе? Вот метод: Мы имеем вектор который мы предполагаем, взят...

r estimation nonparametric pdf kernel-smoothing

12

Когда мне следует беспокоиться о парадоксе Джеффриса-Линдли в выборе байесовской модели?

Я рассматриваю большое (но конечное) пространство моделей различной сложности, которые я исследую с помощью RJMCMC . Приоритет вектора параметров для каждой модели достаточно информативен. В каких случаях (если таковые имеются) я должен беспокоиться о парадоксе Джеффриса-Линдли в пользу более...

bayesian model-selection mcmc prior improper-prior