Вопросы с тегом «linear-model»

Относится к любой модели, в которой случайная величина связана с одной или несколькими случайными переменными функцией, которая является линейной по конечному числу параметров.

299
Разница между логитовой и пробитной моделями

В чем разница между моделью Logit и Probit ? Мне больше интересно знать, когда использовать логистическую регрессию, а когда использовать Probit. Если есть какая-либо литература, которая определяет это, используя R , это также было бы...

118
Когда можно удалить перехват в модели линейной регрессии?

Я работаю на моделях линейной регрессии и задаюсь вопросом, каковы условия удаления термина «перехват». Сравнивая результаты двух разных регрессий, где один имеет перехват, а другой нет, я замечаю, что функции без перехвата намного выше. Существуют ли определенные условия или предположения, которым...

101
Удаление статистически значимого члена перехвата увеличивает в линейной модели

В простой линейной модели с одной объясняющей переменной αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i Я считаю, что удаление члена перехвата значительно улучшает соответствие (значение идет от 0,3 до 0,9). Однако термин «перехват» представляется статистически...

97
В чем разница между линейной регрессией по y с x и x с y?

Коэффициент корреляции Пирсона для x и y одинаков, независимо от того, вычисляете ли вы Pearson (x, y) или Pearson (y, x). Это говорит о том, что выполнение линейной регрессии y с учетом x или x с учетом y должно быть таким же, но я не думаю, что это так. Может ли кто-то пролить свет на то, когда...

91
PCA и пропорции объяснены

В общем, что подразумевается под тем, чтобы сказать, что доля дисперсии в анализе, подобном PCA, объясняется первым основным компонентом? Может ли кто-то объяснить это интуитивно, но также дать точное математическое определение того, что означает «объяснение отклонений» в терминах анализа главных...

88
Диагностические участки для подсчета регрессии

Какие диагностические графики (и, возможно, формальные тесты) вы считаете наиболее информативными для регрессий, где результат представляет собой переменную счета? Я особенно заинтересован в пуассоновских и отрицательных биномиальных моделях, а также в аналогах с нулевой раздувкой и препятствием...

88
Когда использовать гамма GLM?

Гамма-распределение может принимать довольно широкий диапазон форм, и, учитывая связь между средним и дисперсией через два его параметра, оно кажется подходящим для работы с гетероскедастичностью в неотрицательных данных таким образом, что лог-преобразованный OLS может не обойтись без WLS или...

78
Пример: регрессия LASSO с использованием glmnet для двоичного результата

Я начинаю баловаться с использованием glmnetс LASSO регрессией , где мой результат представляет интерес дихотомический. Я создал небольшой фрейм данных ниже: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91,...

76
Каковы современные, легко используемые альтернативы ступенчатой ​​регрессии?

У меня есть набор данных с около 30 независимыми переменными, и я хотел бы построить обобщенную линейную модель (GLM), чтобы исследовать отношения между ними и зависимой переменной. Я знаю, что метод, которому меня учили в этой ситуации, ступенчатая регрессия, теперь считается статистическим грехом...

69
Форма доверительного интервала для прогнозируемых значений в линейной регрессии

Я заметил, что доверительный интервал для предсказанных значений в линейной регрессии имеет тенденцию быть узким вокруг среднего значения предиктора, а жирность - вокруг минимального и максимального значений предиктора. Это можно увидеть на графиках этих 4 линейных регрессий: Сначала я думал, что...

65
В чем разница между «функцией связи» и «канонической функцией связи» для GLM

В чем разница между терминами «функция связи» и «функция канонического соединения»? Кроме того, есть ли (теоретические) преимущества использования одного над другим? Например, двоичная переменная ответа может быть смоделирована с использованием многих функций связи, таких как logit , probit и т. Д....

64
Как интерпретировать коэффициенты в регрессии Пуассона?

Как я могу интерпретировать основные эффекты (коэффициенты для фиктивного фактора) в регрессии Пуассона? Предположим следующий пример: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13,...

62
Что означают остатки в логистической регрессии?

Отвечая на этот вопрос, Джон Кристи предложил оценить соответствие моделей логистической регрессии путем оценки остатков. Я знаком с тем, как интерпретировать невязки в OLS, они находятся в том же масштабе, что и DV, и очень четко различие между y и y, предсказанное моделью. Однако для...

57
Почему преобразование квадратного корня рекомендуется для данных подсчета?

Часто рекомендуется брать квадратный корень, когда у вас есть данные подсчета. (Некоторые примеры CV можно найти в ответе @ HarveyMotulsky здесь или в ответе @ whuber здесь .) С другой стороны, при подборе обобщенной линейной модели с переменной отклика, распределенной как Пуассон, журнал является...

55
Расширенные рекомендации по статистике книг

На этом сайте есть несколько веток для рекомендаций по вводной статистике и машинному обучению, но я ищу текст по расширенной статистике, в том числе в порядке приоритета: максимальная вероятность, обобщенные линейные модели, анализ главных компонентов, нелинейные модели . Я пробовал Статистические...

55
Выбор между LM и GLM для лог-преобразованной переменной ответа

Я пытаюсь понять философию использования Обобщенной линейной модели (GLM) по сравнению с линейной моделью (LM). Я создал пример набора данных ниже, где: журнал( у) = x + εlog⁡(y)=x+ε\log(y) = x + \varepsilon В этом примере ошибка εε\varepsilon зависит от величины Yyy , поэтому я предположил бы, что...

50
Быстрая линейная регрессия, устойчивая к выбросам

Я имею дело с линейными данными с выбросами, некоторые из которых находятся на расстоянии более 5 стандартных отклонений от расчетной линии регрессии. Я ищу технику линейной регрессии, которая уменьшает влияние этих точек. Пока что я сделал, чтобы оценить линию регрессии со всеми данными, затем...

50
Получение прогнозных значений (Y = 1 или 0) из модели логистической регрессии

Допустим, у меня есть объект класса glm(соответствующий модели логистической регрессии), и я хотел бы превратить предсказанные вероятности, заданные с predict.glmпомощью аргумента, type="response"в двоичные ответы, то есть или Y = 0 . Какой самый быстрый и самый канонический способ сделать это в...