Реальные примеры различий между независимостью и корреляцией

9

Хорошо известно, что независимость случайных величин подразумевает нулевую корреляцию, но нулевая корреляция не обязательно подразумевает независимость.

Я наткнулся на множество математических примеров, демонстрирующих зависимость, несмотря на нулевую корреляцию. Есть ли реальные примеры, подтверждающие этот факт?

user46697
источник
2
Будьте осторожны, только нулевая корреляция и совместно нормальные переменные подразумевают независимость.
Фрэнсис
2
@Siddesh "Но так как объем не является линейной функцией длины, они не коррелируют." Ну, не совсем коррелированные. Но они будут положительно коррелированы.
Серебряная рыбка
1
@Siddhesh: это будет работать, только если ...Е[LеNгTчас4]-Е[LеNгTчас]Е[LеNгTчас3]знак равно0
Фрэнсис
1
Не стесняйтесь помещать комментарий о нормальном распределении обратно, если вы не согласны с моим редактированием. Но я подумал, что это будет лучше удалить, так как (1) это отвлекающая сторона вашего основного вопроса, (2) его (я думаю) уже задавали в резюме, так что это будет дубликат существующего материала здесь, ( 3) Я не хотел, чтобы это приводило в замешательство будущих читателей. Я попытался отредактировать вопрос таким образом, чтобы увеличить вероятность его повторного открытия: я думаю, что этот вопрос совершенно отличается от вопросов «математической статистики» по той же теме.
Серебряная рыба
2
Я все еще думаю, что этот вопрос действительно хорош, и может привлечь некоторые дополнительные интересные ответы, если его можно будет вновь открыть (что может потребовать некоторого редактирования, чтобы четко отличить его от потока, который в настоящее время считается дубликатом). Я поднял тему на Meta о том, что потребуется для повторного открытия этого вопроса. Все комментарии приветствуются.
Серебряная рыба

Ответы:

6

Возврат акций - это достойный пример того, что вы просите. Между сегодняшней и вчерашней доходностью S & P 500 очень близка к нулю корреляция. Тем не менее, существует четкая зависимость: квадрат доходности автокоррелируется положительно; периоды высокой волатильности сгруппированы во времени.

Код R:

library(ggplot2)
library(grid)
library(quantmod)

symbols   <- new.env()
date_from <- as.Date("1960-01-01")
date_to   <- as.Date("2016-02-01")
getSymbols("^GSPC", env=symbols, src="yahoo", from=date_from, to=date_to)  # S&P500

df <- data.frame(close=as.numeric(symbols$GSPC$GSPC.Close),
                 date=index(symbols$GSPC))
df$log_return     <- c(NA, diff(log(df$close)))
df$log_return_lag <- c(NA, head(df$log_return, nrow(df) - 1))

cor(df$log_return,   df$log_return_lag,   use="pairwise.complete.obs")  # 0.02
cor(df$log_return^2, df$log_return_lag^2, use="pairwise.complete.obs")  # 0.14

acf(df$log_return,     na.action=na.pass)  # Basically zero autocorrelation
acf((df$log_return^2), na.action=na.pass)  # Squared returns positively autocorrelated

p <- (ggplot(df, aes(x=date, y=log_return)) +
      geom_point(alpha=0.5) +
      theme_bw() + theme(panel.border=element_blank()))
p
ggsave("log_returns_s&p.png", p, width=10, height=8)

Временные ряды журналов возвращаются на S & P 500:

время возврата журнала

Если бы возвраты были независимыми во времени (и постоянными), было бы очень маловероятно увидеть эти паттерны кластеризованной волатильности, и вы бы не увидели автокорреляцию в квадратах журнальных возвратов.

Adrian
источник
3

Другим примером является связь между стрессом и оценками на экзамене. Отношение является обратной U-формой, и корреляция очень низкая, хотя причинно-следственная связь кажется довольно ясной.

Питер Флом
источник
2
Это отличный пример. У вас есть данные или это просто на основе самоанализа / опыта преподавания?
Адриан
1
Я видел исследование этого, но я видел это много лет назад, поэтому у меня нет ни цитаты, ни фактических данных.
Питер Флом