Вопросы с тегом «r»

10
Модель истории дискретного времени (выживания) в R

Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки:...

10
Что является более точным glm или glmnet?

R glm и glmnet используют разные алгоритмы. Я замечаю нетривиальные различия между оценочными коэффициентами, когда использую оба. Меня интересует, когда одно является более точным, чем другое, и время, чтобы решить / точность компромисса. В частности, я имею в виду случай, когда в glmnet-й...

10
Исправлено против случайных эффектов

Совсем недавно я начал изучать обобщенные линейные смешанные модели и использовал R для изучения того, какое значение имеет отношение к членству в группе как к фиксированному, так и к случайному эффекту. В частности, я смотрю на пример набора данных, который обсуждался здесь:...

10
Есть ли общее определение величины эффекта?

У effect-sizeтега нет вики. Страница википедии о размере эффекта не дает точного общего определения. И я никогда не видел общего определения величины эффекта . Однако, читая некоторые дискуссии, подобные этой, у меня складывается впечатление, что люди имеют в виду общее представление о величине...

10
Несколько логистических регрессий против полиномиальной регрессии

Является ли целесообразным сделать несколько бинарных логистических регрессий вместо полиномиальной регрессии? Из этого вопроса: Полиномиальная логистическая регрессия против бинарной логистической регрессии один-против-остальных Я вижу, что полиномиальная регрессия может иметь более низкие...

10
Методы наказания за категориальные данные: объединение уровней в фактор

Наказанные модели могут использоваться для оценки моделей, в которых количество параметров равно или даже превышает размер выборки. Такая ситуация может возникнуть в лог-линейных моделях больших разреженных таблиц категориальных данных или данных подсчета. В этих настройках часто также желательно...

10
Как записать термин ошибки в повторных измерениях ANOVA в R: Ошибка (субъект) vs Ошибка (субъект / время)

Мой вопрос очень тесно связан с предыдущим постом указания срока Error () в повторных измерениях ANOVA в R . Тем не менее, я хотел бы получить более полное представление о том, как определить термин ошибки. Предположим, у меня есть двухсторонний повторный ANOVA. Фактором межгруппового эффекта...

10
Как рассчитать расхождение / расстояние Кульбака-Лейблера?

У меня есть три набора данных X, Y и Z. Каждый набор данных определяет частоту происходящего события. Например: Набор данных X: E1: 4, E2: 0, E3: 10, E4: 5, E5: 0, E6: 0 и т. Д. Набор данных Y: E1: 2, E2: 3, E3: 7, E4: 6, E5: 0, E6: 0 и т. Д. Набор данных Z: E1: 0, E2: 4, E3: 8, E4: 4, E5: 1, E6: 0...

10
Смещение оценок максимального правдоподобия для логистической регрессии

Я хотел бы понять несколько фактов о максимальных вероятностных оценках (MLE) для логистических регрессий. Правда ли, что в целом MLE для логистической регрессии является предвзятой? Я бы сказал "да". Я знаю, например, что размер выборки связан с асимптотическим смещением MLE. Знаете ли вы...

10
Как мне включить инновационный выброс при наблюдении 48 в мою модель ARIMA?

Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1). Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных. Как включить этот выброс в мою...

10
Как получить доверительный интервал по изменению r-квадрата населения

Ради простого примера предположим, что есть две модели линейной регрессии Модель 1 имеет три предсказатели, x1a, x2b, иx2c Модель 2 имеет три предиктора из модели 1 и два дополнительных предиктора x2aиx2b Существует уравнение регрессии населения, где объясняется дисперсия населения для Модели 1 и...

10
Корректировка значения p для локальной статистики Морана I (LISA)

Я работаю с некоторым исследовательским пространственным анализом в R с использованием пакета spdep. Я наткнулся на вариант настройки p- значений локальных показателей пространственной ассоциации (LISA), рассчитанных с помощью localmoranфункции. Согласно документам он нацелен на: ... корректировка...

10
Добавление случайного эффекта влияет на оценки коэффициентов

Меня всегда учили, что случайные эффекты влияют только на дисперсию (ошибку), а фиксированные эффекты влияют только на среднее значение. Но я нашел пример, где случайные эффекты влияют и на среднее значение - оценку коэффициента: require(nlme) set.seed(128) n <- 100 k <- 5 cat <-...

10
SMOTE выдает ошибку для мультиклассовой проблемы дисбаланса

Я пытаюсь использовать SMOTE для исправления дисбаланса в моей проблеме классификации нескольких классов. Хотя SMOTE отлично работает с набором данных iris согласно справочному документу SMOTE, он не работает с аналогичным набором данных. Вот как выглядят мои данные. Обратите внимание, что у него...

10
Оценка параметра равномерного распределения: неправильный априор?

У нас есть N выборок из равномерного распределения где неизвестно. Оцените из данных.XiXiX_iθ θ[0,θ][0,θ][0,\theta]θθ\thetaθθ\theta Итак, правило Байеса ... f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)f(\theta | {X_i}) = \frac{f({X_i}|\theta)f(\theta)}{f({X_i})} и вероятность:...

10
Ошибка распространения SD против SE

У меня от 3 до 5 показателей качества на человека в двух разных состояниях (A и B). Я черчения в среднем для каждого человека в каждом состоянии , и я использую стандартную ошибку ( то есть , , с = число измерений) как погрешностями.SD/N−−√SD/NSD/\sqrt{N}NNN Теперь я хочу построить график разницы...

10
Объяснение фильтров Калмана в моделях пространства состояний

Каковы этапы использования фильтров Калмана в моделях пространства состояний? Я видел несколько разных формулировок, но я не уверен в деталях. Например, Cowpertwait начинается с этого набора уравнений: θt=Gtθt-1+wtyt=F′tθt+vtyt=Ft′θt+vty_{t} = F^{'}_{t}\theta_{t}+v_{t}...

10
Лог вероятности для GLM

В следующем коде я выполняю логистическую регрессию для сгруппированных данных, используя glm, и «вручную», используя mle2. Почему функция logLik в R дает мне вероятность логирования logLik (fit.glm) = - 2.336, отличную от той, что logLik (fit.ml) = - 5.514, которую я получаю вручную?...

10
Пересчитать логарифмическое правдоподобие из простой модели R lm

Я просто пытаюсь пересчитать с помощью dnorm () логарифмическую вероятность, обеспечиваемую функцией logLik из модели lm (в R). Это работает (почти идеально) для большого количества данных (например, n = 1000): > n <- 1000 > x <- 1:n > set.seed(1) > y <- 10 + 2*x + rnorm(n, 0,...