Вопросы с тегом «linear-model»

11
Интервал прогнозирования = вероятный интервал?

Мне интересно, если интервал прогнозирования и вероятный интервал оценивают одно и то же. Например, при линейной регрессии, когда вы оцениваете интервал прогнозирования подобранных значений, вы оцениваете пределов интервала, в котором вы ожидаете, что ваше значение упадет. В противоположность...

11
Логистическая регрессия и точка перегиба

У нас есть данные с двоичным результатом и некоторыми ковариатами. Я использовал логистическую регрессию для моделирования данных. Просто простой анализ, ничего необычного. Предполагается, что конечным результатом будет кривая доза-эффект, где мы показываем, как изменяется вероятность для...

11
Тест отношения правдоподобия и тест Вальда дают разные выводы для glm в R

Я воспроизводлю пример из обобщенных, линейных и смешанных моделей . Мой MWE ниже: Dilution <- c(1/128, 1/64, 1/32, 1/16, 1/8, 1/4, 1/2, 1, 2, 4) NoofPlates <- rep(x=5, times=10) NoPositive <- c(0, 0, 2, 2, 3, 4, 5, 5, 5, 5) Data <- data.frame(Dilution, NoofPlates, NoPositive) fm1 <-...

11
Допущение нормальности в линейной регрессии

В качестве допущения о линейной регрессии нормальность распределения ошибки иногда ошибочно «расширяется» или интерпретируется как необходимость нормальности y или x. Можно ли построить сценарий / набор данных, где X и Y ненормальны, но ошибочный член есть, и, следовательно, полученные оценки...

11
Всегда ли существует каноническая функция связи для обобщенной линейной модели (GLM)?

В GLM предполагается скаляр YYY и θθ\theta для базового распределения с pdf еY( у| θ,τ) = ч ( у, т) опыт( θ у- A ( θ )d( τ))fY(y|θ,τ)=h(y,τ)exp⁡(θy−A(θ)d(τ))f_Y(y | \theta, \tau) = h(y,\tau) \exp{\left(\frac{\theta y - A(\theta)}{d(\tau)} \right)} Можно показать, чтоμ=E(Y)=A′(θ)μ=E⁡(Y)=A′(θ) \mu =...

11
Как выбрать вероятность отсечения для редкого события Логистическая регрессия

У меня есть 100 000 наблюдений (9 фиктивных переменных индикатора) с 1000 положительных результатов. Логистическая регрессия должна работать нормально в этом случае, но вероятность отсечения озадачивает меня. В обычной литературе мы выбираем 50% -ное сокращение, чтобы предсказать 1 и 0. Я не могу...

11
OLS vs. Poisson GLM с идентификационной связью

Мой вопрос показывает мое плохое понимание регрессии Пуассона и GLM в целом. Вот некоторые поддельные данные, чтобы проиллюстрировать мой вопрос: ### some fake data x=c(1:14) y=c(0, 1, 2, 3, 1, 4, 9, 18, 23, 31, 20, 25, 37, 45) Некоторые пользовательские функции для возврата psuedo-R2: ###...

11
Должен ли я использовать смещение для моего Poisson GLM?

Я провожу исследование, чтобы посмотреть на различия в плотности и богатстве видов рыб при использовании двух разных методов подводной визуальной переписи. Мои данные изначально были данными подсчета, но затем они обычно меняются на плотность рыбы, но я все же решил использовать Poisson GLM, что, я...

11
GLM с непрерывными данными, накопленными в нуле

Я пытаюсь использовать модель для оценки того, насколько катастрофические заболевания, такие как туберкулез, СПИД и т. Д., Влияют на расходы на госпитализацию. У меня есть «стоимость госпитализации» в качестве зависимой переменной и различные индивидуальные маркеры в качестве независимых...

11
Как обсудить диаграмму рассеяния с несколькими появляющимися линиями?

Мы измерили две переменные, и диаграмма рассеяния, кажется, предлагает несколько «линейных» моделей. Есть ли способ попытаться отогнать эти модели? Выявление других независимых переменных оказалось трудным. Обе переменные сильно смещены влево (в сторону небольших чисел), это ожидаемое распределение...

11
Использование децибел в статистике

Я работаю над проектом, который включает чтение меток RFID и сравнение уровня сигнала, который читатель видит при изменении конфигурации антенны (количество антенн, положение и т. Д.). Как часть проекта, мне нужно сравнить настройки, чтобы увидеть, какие из них наиболее эффективны. В идеале я мог...

11
Следует ли использовать поправки степеней свободы для определения параметров GLM?

Этот вопрос вдохновлен ответом Мартина здесь . Предположим, что мы подходим к GLM для однопараметрического семейства, такого как биномиальная модель или модель Пуассона, и что это процедура полного правдоподобия (в отличие от квазипуассона). Тогда дисперсия является функцией среднего значения. С...

11
Биномиальный блеск с категориальной переменной с полным успехом

Я использую glmm с биномиальной переменной ответа и категориальным предиктором. Случайный эффект дается вложенным дизайном, используемым для сбора данных. Данные выглядят так: m.gen1$treatment [1] sucrose control protein control no_injection ..... Levels: no_injection control sucrose protein...

11
Протестируйте модель GLM, используя нулевые и модельные отклонения

Я построил модель glm в R и протестировал ее с помощью группы тестирования и обучения, поэтому уверен, что она работает хорошо. Результаты от R: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -2.781e+00 1.677e-02 -165.789 < 2e-16 *** Coeff_A 1.663e-05 5.438e-06 3.059 0.00222...

11
Сколько дистрибутивов в GLM?

Я определил несколько мест в учебниках, где GLM описан с 5 распределениями (а именно: гамма, гауссовский, биномиальный, обратный гауссовский и пуассоновский). Это также иллюстрируется в функции семьи в R. Иногда я сталкиваюсь с ссылками на GLM, где включены дополнительные дистрибутивы ( пример )....

11
Байесовская модель логита - интуитивное объяснение?

Я должен признаться, что раньше я не слышал об этом термине ни в одном из моих классов, старшекурсников или выпускников. Что значит для логистической регрессии быть байесовским? Я ищу объяснение с переходом от обычной логистики к байесовской логистике, подобное следующему: Это уравнение в модели...

11
Как бороться с «нецелым» предупреждением от отрицательного биномиального GLM?

Я пытаюсь смоделировать среднюю интенсивность паразитов, воздействующих на хозяина в R, используя отрицательную биномиальную модель. Я продолжаю получать 50 или более предупреждений, которые говорят: In dpois(y, mu, log = TRUE) : non-integer x = 251.529000 Как я могу справиться с этим? Мой код...

10
Вывод логистической модели в R

Я пытаюсь интерпретировать следующий тип логистической модели: mdl <- glm(c(suc,fail) ~ fac1 + fac2, data=df, family=binomial) Является ли вывод predict(mdl)ожидаемых шансов на успех для каждой точки данных? Есть ли простой способ табулировать шансы для каждого факторного уровня модели, а не для...