Возможно ли, что 3 вектора имеют все отрицательные попарные корреляции?

16

Учитывая три вектора , и , возможно ли, чтобы корреляции между и , и , а также и были отрицательными? Т.е. возможно ли это?abcabacbc

corr(a,b)<0corr(a,c)<0corr(b,c)<0
Антти А
источник
3
Отрицательные корреляции геометрически означают, что центрированные векторы взаимно образуют тупые углы. У вас не должно возникнуть проблем при рисовании конфигурации трех векторов на плоскости, которые имеют это свойство.
whuber
Они не могут быть полностью отрицательно коррелированными ( ), но в целом может быть некоторая отрицательная корреляция, опять же границы, установленные другими корреляциями. ρ=1
karakfa
2
@whuber Ваш комментарий противоречит ответу Хейкки Пулккинена, который утверждает, что это невозможно для векторов на плоскости. Если вы поддерживаете это, вы должны превратить свой комментарий в ответ.
RM
2
@ RM Нет противоречия между Вубером и Хейкки. Этот вопрос задает вопрос о матрице данных размером . Обычно мы будем говорить о точках данных в 3 измерениях, но этот Q говорит о трех «векторах» в измерениях. Хейкки говорит, что все отрицательные корреляции не могут произойти, если (действительно, две точки после центрирования всегда идеально коррелированы, поэтому корреляции должны быть и не могут быть всеми -1 ). Уубер говорит, что 3 вектора в n измерениях могут эффективно лежать в 2-мерном подпространстве (т. Е. X имеет ранг 2), и предлагает представить логотип Mercedes. n × 3 n n n = 2 ± 1 - 1 n XXn×3nnn=2±11nX
Амеба говорит Восстановить Монику
1
Связанный: Оценка для корреляции трех случайных величин . (cc, @amoeba)
Восстановить Монику

Ответы:

19

Это возможно, если размер вектора равен 3 или больше. Например

a=(1,1,1)b=(1,9,3)c=(2,3,1)

Корреляции следующие:

cor(a,b)=0.80...cor(a,c)=0.27...cor(b,c)=0.34...

Мы можем доказать, что для векторов размера 2 это невозможно:

cor(a,b)<02(iaibi)(iai)(ibi)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)a1b1+a1b2+a2b1+a2b2<0a1b1+a2b2a1b2+a2b1<0a1(b1b2)+a2(b2b1)<0(a1a2)(b1b2)<0

Формула имеет смысл: если больше, чем a 2 , b 1 должно быть больше, чем b 1, чтобы сделать корреляцию отрицательной.a1a2b1b1

Аналогично для соотношений между (a, c) и (b, c) получаем

(a1a2)(c1c2)<0(b1b2)(c1c2)<0

Clearly, all of these three formulas can not hold in the same time.

Heikki Pulkkinen
источник
3
Another example of something unexpected that only happens in dimension three or higher.
nth
1
With vectors of size 2, correlations are usually ±1 (straight line through two points), and you cannot have three correlations of 1 with three vectors of any size
Henry
9

Yes, they can.

Suppose you have a multivariate normal distribution XR3,XN(0,Σ). The only restriction on Σ is that it has to be positive semi-definite.

So take the following example Σ=(10.20.20.210.20.20.21)

Its eigenvalues are all positive (1.2, 1.2, 0.6), and you can create vectors with negative correlation.

Kozolovska
источник
7

let's start with a correlation matrix for 3 variables

Σ=(1pqp1rqr1)

non-negative definiteness creates constraints for pairwise correlations p,q,r which can be written as

pqrp2+q2+r212

For example, if p=q=1, the values of r is restricted by 2rr2+1, which forces r=1. On the other hand if p=q=12, r can be within 2±34 range.

Answering the interesting follow up question by @amoeba: "what is the lowest possible correlation that all three pairs can simultaneously have?"

Let p=q=r=x<0, Find the smallest root of 2x33x2+1, which will give you 12. Perhaps not surprising for some.

A stronger argument can be made if one of the correlations, say r=1. From the same equation 2pqp2+q2, we can deduce that p=q. Therefore if two correlations are 1, third one should be 1.

karakfa
источник
2

A simple R function to explore this:

f <- function(n,trials = 10000){
  count <- 0
  for(i in 1:trials){
    a <- runif(n)
    b <- runif(n)
    c <- runif(n)
    if(cor(a,b) < 0 & cor(a,c) < 0 & cor(b,c) < 0){
      count <- count + 1
    }
  }
  count/trials
}

As a function of n, f(n) starts at 0, becomes nonzero at n = 3 (with typical values around 0.06), then increases to around 0.11 by n = 15, after which it seems to stabilize:

enter image description here So, not only is it possible to have all three correlations negative, it doesn't seem to be terribly uncommon (at least for uniform distributions).

John Coleman
источник