Допущение нормальности в линейной регрессии

11

В качестве допущения о линейной регрессии нормальность распределения ошибки иногда ошибочно «расширяется» или интерпретируется как необходимость нормальности y или x.

Можно ли построить сценарий / набор данных, где X и Y ненормальны, но ошибочный член есть, и, следовательно, полученные оценки линейной регрессии действительны?

ECII
источник
5
Тривиальный пример: X имеет распределение Бернулли (т.е. принимает значения 0 или 1); Y = X + N (0, 0,1). Ни X, ни Y обычно не распространяются сами по себе, но регрессия Y на X все еще работает.
Hong Ooi
Я думаю, вы думаете о распределении остатков, а не о распределении переменных.
Ташухка
5
У меня есть пример, разработанный здесь: что если остатки нормально распределены, а Y нет?
gung - Восстановить Монику
Связанный: stats.stackexchange.com/questions/148803/…
kjetil b halvorsen

Ответы:

16

Расширяем комментарий Хон Уа с изображением. Вот изображение набора данных, в котором ни один из маргиналов не распределяется нормально, но остатки все еще остаются, поэтому предположения о линейной регрессии все еще верны:

введите описание изображения здесь

Изображение было сгенерировано следующим кодом R:

library(psych)
x <- rbinom(100, 1, 0.3)
y <- rnorm(length(x), 5 + x * 5, 1)

scatter.hist(x, y, correl=F, density=F, ellipse=F, xlab="x", ylab="y")
Расмус Батх
источник