Вопросы с тегом «linear-model»

9
Подгонка смешанной модели Пуассона GLM со случайным наклоном и пересечением

В настоящее время я работаю над серией моделей временных рядов Пуассона, пытаясь оценить влияние изменения в том, как были получены подсчеты (переключение с одного диагностического теста на другой), в то же время контролируя другие тренды во времени (скажем, общее увеличение заболеваемость). У меня...

9
Как получить стандартные ошибки из регрессии данных подсчета с нулевым раздувом? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 2 года назад . Следующий код PredictNew <- predict (glm.fit, newdata = Predict, X1 =X1, Y1= Y1, type =...

9
Некоторые из моих предикторов имеют очень разные масштабы - нужно ли их трансформировать перед подбором модели линейной регрессии?

Я хотел бы запустить линейную регрессию по многомерному набору данных. Существуют различия между различными измерениями с точки зрения их величины порядка. Например, измерение 1 обычно имеет диапазон значений [0, 1], а измерение 2 имеет диапазон значений [0, 1000]. Нужно ли выполнять какие-либо...

9
Распределение ошибок для линейной и логистической регрессии

При непрерывных данных линейная регрессия Y=β1+β2X2+uYзнак равноβ1+β2Икс2+UY=\beta_1+\beta_2X_2+u предполагает, что член ошибки распределен N (0, σ2σ2\sigma^2 ) 1) Предполагаем ли мы, что Var (Y | x) также ~ N (0, σ2σ2\sigma^2 )? 2) Что это за распределение ошибок в логистической регрессии? Когда...

9
Путаница, связанная с линейными динамическими системами

Я читал эту книгу епископом «Распознавание образов и машинное обучение». У меня была путаница, связанная с выводом линейной динамической системы. В LDS мы предполагаем, что скрытые переменные непрерывны. Если Z обозначает скрытые переменные, а X обозначает наблюдаемые переменные p ( zN| Zn - 1) =...

9
Огромные коэффициенты в логистической регрессии - что это значит и что делать?

Я получаю огромные коэффициенты во время логистической регрессии, смотрите коэффициенты с krajULKV: > summary(m5) Call: glm(formula = cbind(ml, ad) ~ rok + obdobi + kraj + resid_usili2 + rok:obdobi + rok:kraj + obdobi:kraj + kraj:resid_usili2 + rok:obdobi:kraj, family = "quasibinomial") Deviance...

9
Предположения обобщенных линейных моделей

На странице 232 «Компаньон R в прикладной регрессии» записка Фокса и Вейсберга Только семейство Гауссов имеет постоянную дисперсию, а во всех других GLM условная дисперсия y в зависит отИксИкс\bf{x}μ ( х )μ(Икс)\mu(x) Ранее они отмечали, что условная дисперсия Пуассона равна а дисперсия бинома -...

9
Использование процентилей в качестве предикторов - хорошая идея?

Я думаю о проблеме, которая заключается в прогнозировании журнала (расходов) клиента с использованием линейной регрессии. Я рассматриваю, какие функции использовать в качестве входных данных, и задаюсь вопросом, будет ли нормально использовать процентиль переменной в качестве входных данных....

9
Оценка параметров с помощью обобщенных линейных моделей

По умолчанию, когда мы используем glmфункцию в R, она использует метод итеративно перевешиваемых наименьших квадратов (IWLS), чтобы найти оценку максимального правдоподобия параметров. Теперь у меня есть два вопроса. Гарантируют ли оценки IWLS глобальный максимум функции правдоподобия? Основываясь...

9
Почему остатки Пирсона из отрицательной биномиальной регрессии меньше, чем из пуассоновской регрессии?

У меня есть эти данные: set.seed(1) predictor <- rnorm(20) set.seed(1) counts <- c(sample(1:1000, 20)) df <- data.frame(counts, predictor) Я провел пуассоновскую регрессию poisson_counts <- glm(counts ~ predictor, data = df, family = "poisson") И отрицательная биноминальная регрессия:...

9
Модель линейной регрессии, которая лучше всего подходит для данных с ошибками

Я ищу алгоритм линейной регрессии, который наиболее подходит для данных, чья независимая переменная (x) имеет постоянную ошибку измерения, а зависимая переменная (y) имеет ошибку, зависящую от сигнала. Изображение выше иллюстрирует мой...

9
Логистическая регрессия на больших данных

У меня есть набор данных около 5000 функций. Для этих данных я сначала использовал тест Chi Square для выбора функции; после этого я получил около 1500 переменных, которые показали связь значимости с переменной отклика. Теперь мне нужно приспособить логистическую регрессию к этому. Я использую...

9
Подгонка гетероскедастической обобщенной линейной модели для биномиальных ответов

У меня есть данные из следующего экспериментального плана: мои наблюдения - это подсчет числа успехов ( K) из соответствующего числа испытаний ( N), измеренных для двух групп, каждая из которых состоит из Iиндивидуумов, из Tобработок, где в каждой такой комбинации факторов есть Rповторения , Таким...

9
Данные подсчета моделирования, где переменная смещения равна 0 для некоторых наблюдений

Я пытаюсь помочь студенту коллеги. Студент наблюдал и подсчитывал поведение птицы (количество вызовов) в экспериментальной обстановке. Количество вызовов, относящихся к конкретной наблюдаемой птице во время каждого эксперимента, определить невозможно, но подсчет числа птиц, внесших вклад в...

9
Оценка многоуровневых моделей логистической регрессии

Следующая многоуровневая логистическая модель с одной пояснительной переменной на уровне 1 (индивидуальный уровень) и одной пояснительной переменной на уровне 2 (групповой уровень): π 0 j = γ 00 + γ 01 z j + u 0 j … ( 2 ) π 1 j = γ 10 + γ 11 z j + u 1 j … ( 3 )логит ( ря ж) = π0 Дж+ π1 JИкся ж… ( 1...

9
Когда неправильные линейные модели становятся очень красивыми?

Вопросов: Используются ли ненадлежащие линейные модели на практике, или же они время от времени описываются любопытством в научных журналах? Если да, то в каких областях они используются? Есть ли другие примеры таких моделей? Наконец, будут ли правильные стандартные ошибки, , R 2 и т. Д., Взятые из...

9
Какой хороший способ графического представления очень большого количества парных точек данных?

В моей области обычным способом построения парных данных является серия тонких наклонных отрезков, накладывающих их на медиану и КИ медианы для двух групп: Однако этот тип графика становится намного сложнее для чтения, так как количество точек данных становится очень большим (в моем случае у меня...

9
Что обычного, в обычных наименьших квадратах?

Мой друг недавно спросил, что же такого обычного, в отношении наименьших квадратов. Похоже, мы ни к чему не привели в обсуждении. Мы оба согласились, что OLS является частным случаем линейной модели, она имеет много применений, хорошо известна и является частным случаем многих других моделей. Но...

9
Нормально распределенные ошибки и центральная предельная теорема

Во Вводной эконометрике Вулдриджа есть цитата: Аргумент, оправдывающий нормальное распределение ошибок, обычно выполняется примерно так: поскольку является суммой многих ненаблюдаемых факторов, влияющих на , мы можем вызвать центральную предельную теорему, чтобы заключить, что имеет приблизительное...

9
Каково практическое значение альфы в GLM с гамма-семейством?

Я подгоняю несколько моделей формы .. glm(DV ~ I(1/IV), family = Gamma(link = "log") .. и ищу способы сравнить модели, полученные для разных переменных. Мне интересно, имеет ли значение альфа какое-либо практическое применение? Для трех графиков ниже значения альфа 17,85, 9,03 и 6,27. Содержат ли...