Вопросы с тегом «generalized-linear-model»

Обобщение линейной регрессии, учитывающее нелинейные отношения с помощью «функции связи» и дисперсии отклика, зависящей от прогнозируемого значения. (Не путать с «общей линейной моделью», которая расширяет обычную линейную модель до общей ковариационной структуры и многомерного отклика.)

299
Разница между логитовой и пробитной моделями

В чем разница между моделью Logit и Probit ? Мне больше интересно знать, когда использовать логистическую регрессию, а когда использовать Probit. Если есть какая-либо литература, которая определяет это, используя R , это также было бы...

88
Диагностические участки для подсчета регрессии

Какие диагностические графики (и, возможно, формальные тесты) вы считаете наиболее информативными для регрессий, где результат представляет собой переменную счета? Я особенно заинтересован в пуассоновских и отрицательных биномиальных моделях, а также в аналогах с нулевой раздувкой и препятствием...

88
Когда использовать гамма GLM?

Гамма-распределение может принимать довольно широкий диапазон форм, и, учитывая связь между средним и дисперсией через два его параметра, оно кажется подходящим для работы с гетероскедастичностью в неотрицательных данных таким образом, что лог-преобразованный OLS может не обойтись без WLS или...

78
Пример: регрессия LASSO с использованием glmnet для двоичного результата

Я начинаю баловаться с использованием glmnetс LASSO регрессией , где мой результат представляет интерес дихотомический. Я создал небольшой фрейм данных ниже: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91,...

76
Каковы современные, легко используемые альтернативы ступенчатой ​​регрессии?

У меня есть набор данных с около 30 независимыми переменными, и я хотел бы построить обобщенную линейную модель (GLM), чтобы исследовать отношения между ними и зависимой переменной. Я знаю, что метод, которому меня учили в этой ситуации, ступенчатая регрессия, теперь считается статистическим грехом...

65
В чем разница между «функцией связи» и «канонической функцией связи» для GLM

В чем разница между терминами «функция связи» и «функция канонического соединения»? Кроме того, есть ли (теоретические) преимущества использования одного над другим? Например, двоичная переменная ответа может быть смоделирована с использованием многих функций связи, таких как logit , probit и т. Д....

64
Как интерпретировать коэффициенты в регрессии Пуассона?

Как я могу интерпретировать основные эффекты (коэффициенты для фиктивного фактора) в регрессии Пуассона? Предположим следующий пример: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13,...

62
Что означают остатки в логистической регрессии?

Отвечая на этот вопрос, Джон Кристи предложил оценить соответствие моделей логистической регрессии путем оценки остатков. Я знаком с тем, как интерпретировать невязки в OLS, они находятся в том же масштабе, что и DV, и очень четко различие между y и y, предсказанное моделью. Однако для...

57
Почему преобразование квадратного корня рекомендуется для данных подсчета?

Часто рекомендуется брать квадратный корень, когда у вас есть данные подсчета. (Некоторые примеры CV можно найти в ответе @ HarveyMotulsky здесь или в ответе @ whuber здесь .) С другой стороны, при подборе обобщенной линейной модели с переменной отклика, распределенной как Пуассон, журнал является...

55
Расширенные рекомендации по статистике книг

На этом сайте есть несколько веток для рекомендаций по вводной статистике и машинному обучению, но я ищу текст по расширенной статистике, в том числе в порядке приоритета: максимальная вероятность, обобщенные линейные модели, анализ главных компонентов, нелинейные модели . Я пробовал Статистические...

55
Выбор между LM и GLM для лог-преобразованной переменной ответа

Я пытаюсь понять философию использования Обобщенной линейной модели (GLM) по сравнению с линейной моделью (LM). Я создал пример набора данных ниже, где: журнал( у) = x + εlog⁡(y)=x+ε\log(y) = x + \varepsilon В этом примере ошибка εε\varepsilon зависит от величины Yyy , поэтому я предположил бы, что...

50
Получение прогнозных значений (Y = 1 или 0) из модели логистической регрессии

Допустим, у меня есть объект класса glm(соответствующий модели логистической регрессии), и я хотел бы превратить предсказанные вероятности, заданные с predict.glmпомощью аргумента, type="response"в двоичные ответы, то есть или Y = 0 . Какой самый быстрый и самый канонический способ сделать это в...

47
Интерпретация остаточного и нулевого отклонения в GLM R

Как интерпретировать нулевое и остаточное отклонение в GLM в R? Мол, мы говорим, что чем меньше AIC, тем лучше. Существует ли аналогичная и быстрая интерпретация отклонений? Нулевое отклонение: 1146,1 на 1077 степеней свободы Остаточное отклонение: 4589,4 на 1099 степеней свободы AIC:...

46
Линейная модель с лог-преобразованным откликом против обобщенной линейной модели с лог-связью

В этой статье под названием «ВЫБОР СРЕДИ ОБОБЩЕННЫХ ЛИНЕЙНЫХ МОДЕЛЕЙ, ПРИМЕНЯЕМЫХ К МЕДИЦИНСКИМ ДАННЫМ» авторы пишут: В обобщенной линейной модели среднее значение преобразуется функцией связи вместо преобразования самого отклика. Два метода преобразования могут привести к совершенно разным...

46
Интерпретация логарифмически преобразованного предиктора и / или ответа

Мне интересно, имеет ли это значение при интерпретации того, являются ли логически преобразованными только зависимые, как зависимые, так и независимые, или только независимые переменные. Рассмотрим случай log(DV) = Intercept + B1*IV + Error Я могу интерпретировать IV как процентное увеличение, но...

45
Как смоделировать искусственные данные для логистической регрессии?

Я знаю, что чего-то не хватает в моем понимании логистической регрессии, и буду очень признателен за любую помощь. Насколько я понимаю, логистическая регрессия предполагает, что вероятность результата «1» с учетом входных данных представляет собой линейную комбинацию входных данных, пропущенных...

43
Регрессия за результат (отношение или доля) между 0 и 1

Я думаю о построении модели, предсказывающей отношение , где и и . Таким образом, соотношение будет между и .а / бa/ba/ba > 0 b > 0 0 1a ≤ ba≤ba \le bа > 0a>0a > 0б > 0b>0b > 0000111 Я мог бы использовать линейную регрессию, хотя она, естественно, не ограничивается 0..1. У меня...

39
Моделирование анализа мощности логистической регрессии - разработанные эксперименты

Этот вопрос является ответом на ответ @Greg Snow на вопрос, который я задал относительно анализа мощности с помощью логистической регрессии и SAS Proc GLMPOWER. Если я планирую эксперимент и проанализирую результаты в факторной логистической регрессии, как я могу использовать симуляцию (и здесь )...