Вопросы с тегом «model»

9
Как получить стандартные ошибки из регрессии данных подсчета с нулевым раздувом? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 2 года назад . Следующий код PredictNew <- predict (glm.fit, newdata = Predict, X1 =X1, Y1= Y1, type =...

9
Почему введение эффекта случайного уклона увеличило SE наклона?

Я пытаюсь проанализировать влияние года на переменную logInd для конкретной группы лиц (у меня есть 3 группы). Самая простая модель: > fix1 = lm(logInd ~ 0 + Group + Year:Group, data = mydata) > summary(fix1) Call: lm(formula = logInd ~ 0 + Group + Year:Group, data = mydata) Residuals: Min 1Q...

9
Модель пропорционального риска Кокса и интерпретация коэффициентов, когда задействовано взаимодействие в верхнем регистре

Вот краткий вывод использованной мною модели Кокша (я использовал R, и вывод основан на наилучшей конечной модели, т.е. включены все значимые объясняющие переменные и их взаимодействия): coxph(formula = Y ~ LT + Food + Temp2 + LT:Food + LT:Temp2 + Food:Temp2 + LT:Food:Temp2) #...

9
Некоторые из моих предикторов имеют очень разные масштабы - нужно ли их трансформировать перед подбором модели линейной регрессии?

Я хотел бы запустить линейную регрессию по многомерному набору данных. Существуют различия между различными измерениями с точки зрения их величины порядка. Например, измерение 1 обычно имеет диапазон значений [0, 1], а измерение 2 имеет диапазон значений [0, 1000]. Нужно ли выполнять какие-либо...

9
Как сравнить наблюдаемые и ожидаемые события?

Предположим, у меня есть одна выборка частот из 4 возможных событий: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 и у меня есть ожидаемые вероятности того, что мои события произойдут: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 С суммой наблюдаемых частот моих четырех событий (18) я могу рассчитать ожидаемые частоты...

9
Распределение ошибок для линейной и логистической регрессии

При непрерывных данных линейная регрессия Y=β1+β2X2+uYзнак равноβ1+β2Икс2+UY=\beta_1+\beta_2X_2+u предполагает, что член ошибки распределен N (0, σ2σ2\sigma^2 ) 1) Предполагаем ли мы, что Var (Y | x) также ~ N (0, σ2σ2\sigma^2 )? 2) Что это за распределение ошибок в логистической регрессии? Когда...

9
Интервал цензурированной модели пропорциональных рисков Кокса в R

С учетом цензурированного интервала времени выживания, как я могу выполнить интервальную цензуру модели Кокса PH в R? Поиск в rseek обнаруживает пакет intcox, которого больше нет в Rхранилище. Я почти уверен, что coxphфункция в survivalпакете не может обрабатывать данные выживания с интервалом...

9
Путаница, связанная с линейными динамическими системами

Я читал эту книгу епископом «Распознавание образов и машинное обучение». У меня была путаница, связанная с выводом линейной динамической системы. В LDS мы предполагаем, что скрытые переменные непрерывны. Если Z обозначает скрытые переменные, а X обозначает наблюдаемые переменные p ( zN| Zn - 1) =...

9
Когда включать случайный эффект в модель

Я новичок в смешанном моделировании, и меня смущает вопрос о целесообразности использования случайного эффекта в анализе, который я делаю. Любой совет будет принят во внимание. мое исследование проверяет, насколько хорошо недавно разработанный индекс численности млекопитающих может предсказать...

9
Огромные коэффициенты в логистической регрессии - что это значит и что делать?

Я получаю огромные коэффициенты во время логистической регрессии, смотрите коэффициенты с krajULKV: > summary(m5) Call: glm(formula = cbind(ml, ad) ~ rok + obdobi + kraj + resid_usili2 + rok:obdobi + rok:kraj + obdobi:kraj + kraj:resid_usili2 + rok:obdobi:kraj, family = "quasibinomial") Deviance...

9
Предположения обобщенных линейных моделей

На странице 232 «Компаньон R в прикладной регрессии» записка Фокса и Вейсберга Только семейство Гауссов имеет постоянную дисперсию, а во всех других GLM условная дисперсия y в зависит отИксИкс\bf{x}μ ( х )μ(Икс)\mu(x) Ранее они отмечали, что условная дисперсия Пуассона равна а дисперсия бинома -...

9
AIC, ошибка anova: модели не все соответствуют одному и тому же количеству наблюдений, модели не все соответствуют одному и тому же размеру набора данных

У меня есть такие модели: require(nlme) set.seed(123) n <- 100 k <- 5 cat <- as.factor(rep(1:k, n)) cat_i <- 1:k # intercept per kategorie x <- rep(1:n, each = k) sigma <- 0.2 alpha <- 0.001 y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma) plot(x, y) m1 <- lm(y ~ x)...

9
Использование процентилей в качестве предикторов - хорошая идея?

Я думаю о проблеме, которая заключается в прогнозировании журнала (расходов) клиента с использованием линейной регрессии. Я рассматриваю, какие функции использовать в качестве входных данных, и задаюсь вопросом, будет ли нормально использовать процентиль переменной в качестве входных данных....

9
Обобщенная аддитивная модель: что такое ref.df в выводе R?

Привет, я изо всех сил, чтобы понять Ref.df на экране вывода в R: Approximate significance of smooth terms: edf Ref.df F p-value s(meangrain) 1.779 2.209 3.193 0.0451 * s(depth) 2.108 2.697 3.538 0.0254 * Что это значит и нужно ли включать этот термин для представления результатов GAM в статье? Это...

9
Скрытая марковская модель для прогнозирования событий

Вопрос : Является ли установка ниже разумной реализации скрытой марковской модели? У меня есть набор данных 108,000наблюдений (взятых в течение 100 дней) и приблизительно 2000событий на протяжении всего периода наблюдения. Данные выглядят как на рисунке ниже, где наблюдаемая переменная может...

9
Структура данных и вызов функции для данных повторяющихся событий с переменными во времени

Я пытаюсь оценить влияние 2 препаратов ( drug1, drug2) на вероятность падения пациента ( event). Пациенты могут падать более одного раза и могут быть введены или сняты с лекарств в любой момент. Мой вопрос заключается в том, как данные должны быть структурированы с учетом периода времени (дней), в...

9
Оценка параметров с помощью обобщенных линейных моделей

По умолчанию, когда мы используем glmфункцию в R, она использует метод итеративно перевешиваемых наименьших квадратов (IWLS), чтобы найти оценку максимального правдоподобия параметров. Теперь у меня есть два вопроса. Гарантируют ли оценки IWLS глобальный максимум функции правдоподобия? Основываясь...

9
Почему остатки Пирсона из отрицательной биномиальной регрессии меньше, чем из пуассоновской регрессии?

У меня есть эти данные: set.seed(1) predictor <- rnorm(20) set.seed(1) counts <- c(sample(1:1000, 20)) df <- data.frame(counts, predictor) Я провел пуассоновскую регрессию poisson_counts <- glm(counts ~ predictor, data = df, family = "poisson") И отрицательная биноминальная регрессия:...

9
Модель линейной регрессии, которая лучше всего подходит для данных с ошибками

Я ищу алгоритм линейной регрессии, который наиболее подходит для данных, чья независимая переменная (x) имеет постоянную ошибку измерения, а зависимая переменная (y) имеет ошибку, зависящую от сигнала. Изображение выше иллюстрирует мой...

9
Логистическая регрессия на больших данных

У меня есть набор данных около 5000 функций. Для этих данных я сначала использовал тест Chi Square для выбора функции; после этого я получил около 1500 переменных, которые показали связь значимости с переменной отклика. Теперь мне нужно приспособить логистическую регрессию к этому. Я использую...