Простые примеры некоррелированных, но не независимых

26

Любой трудолюбивый студент является контрпримером к тому, что «все студенты ленивы».

Каковы некоторые простые контрпримеры, если «случайные переменные и некоррелированы, то они независимы»?XY

Клэр Браун
источник
8
Я думаю, что это дубликат, но мне лень его искать. Возьмем XN(0,1) и Y=X2 . cov(X,Y)=EX3=0 , но ясно, что две переменные не являются независимыми.
mpiktas
1
простой пример (хотя, возможно, есть и более простые)
Glen_b
1
Возьмите равномерно распределены на [ 0 , 2 П ] и X = соз U , Y = грешить U . U[0,2π]X=cosUY=sinU
Dilip Sarwate
Поскольку смысл «простейшего» не определен, этот вопрос не является объективно ответственным. Я выбрал дубликат на stats.stackexchange.com/questions/41317 на основе самой простой = наименьшей суммы кардиналов опор маржинальных распределений.
whuber
3
@whuber: Несмотря на то, что «простейший» действительно не очень хорошо определен, ответы здесь, например, ответ Glen_b, явно предоставляют гораздо более простой пример, чем тема, которую вы закрыли в качестве дубликата. Я предлагаю вновь открыть этот (я уже проголосовал) и, возможно, сделать его CW, чтобы подчеркнуть тот факт, что «простейший» плохо определен, и OP, возможно, просит различные «простые» примеры.
говорит амеба: восстанови Монику

Ответы:

18

Пусть .XU(1,1)

Пусть .Y=X2

Переменные некоррелированы, но зависимы.

В качестве альтернативы рассмотрим дискретное двумерное распределение, состоящее из вероятности в 3 точках (-1,1), (0, -1), (1,1) с вероятностью 1/4, 1/2, 1/4 соответственно. Тогда переменные некоррелированы, но зависимы.

Рассмотрим двумерную форму данных в ромбе (квадрат повернут на 45 градусов). Переменные будут некоррелированными, но зависимыми.

Это о самых простых случаях, которые я могу придумать.

Glen_b - Восстановить Монику
источник
Все ли случайные переменные, которые симметричны и сосредоточены вокруг 0, некоррелированы?
Мартин Тома
1
@moose Ваше описание неоднозначно. Если вы имеете в виду «если симметричен относительно нуля, а Y симметричен относительно нуля», то нет, поскольку, например, можно сопоставить двумерную нормаль со стандартными нормальными полями. Если вы имеете в виду «если X симметричен относительно нуля, а Y - четная функция от X », то, пока существуют различия, я считаю, что ответ - да. Если вы имеете в виду что-то еще, вам придется объяснить. ИксYИксYИкс
Glen_b
7

Я думаю, что суть некоторых простых контрпримеров можно увидеть, начав с непрерывной случайной величины центром в нуле, то есть E [ X ] = 0 . Предположим, что pdf файла X четен и определен на отрезке вида ( - a , a ) , где a > 0 . Теперь предположим, что Y = f ( X ) для некоторой функции f . Теперь зададимся вопросом: для каких функций f ( X ) мы можем иметь C o?XE[X]=0X(a,a)a>0Y=f(X)еf(X) ?Соv(Икс,е(Икс))знак равно0

Мы знаем, что . Наше предположение, что E [ X ] = 0, приводит нас прямо к C o v ( X , f ( X ) ) = E [ X fСоv(Икс,е(Икс))знак равноЕ[Иксе(Икс)]-Е[Икс]Е[е(Икс)]Е[Икс]знак равно0 . Обозначая pdf X через p ( ) , мы имеемСоv(Икс,е(Икс))знак равноЕ[Иксе(Икс)]Иксп()

.Соv(Икс,е(Икс))знак равноЕ[Иксе(Икс)]знак равноaaИксе(Икс)п(Икс)dИкс

Мы хотим , , а один из способов достижения этого является обеспечением ф ( х ) является четной функцией, которая подразумевает й ф ( х ) р ( х ) является нечетной функцией. Отсюда следует , что - х е ( х ) р ( х ) д х = 0 , и так С о vСоv(Икс,е(Икс))знак равно0f(x)xf(x)p(x)aaxf(x)p(x)dx=0 .Cov(X,f(X))=0

Таким образом, мы можем видеть , что точное распределение не имеет значения , как вдоль , как PDF симметрично вокруг некоторой точки и любой четной функции F ( ) будет делать для определения Y .Xf()Y

Надеемся, что это может помочь студентам увидеть, как люди придумывают эти типы контрпримеров.

Harjoat Bhamra
источник
5

Будь контрпримером (т. Е. Трудолюбивым студентом)! С этим сказал:

Я пытался придумать пример из реального мира, и это было первое, что пришло мне в голову. Это не будет математически простым случаем (но если вы поймете этот пример, вы сможете найти более простой пример с урнами, шарами или чем-то еще).

Согласно некоторым исследованиям, средний IQ мужчин и женщин одинаков, но дисперсия IQ мужчин больше, чем дисперсия IQ женщин. Для конкретности предположим, что мужской IQ следует за а женский IQ следует за N ( 100 , α σ 2 ) с α < 1 . Половина населения - мужчины, а половина - женщины.N(100,σ2)N(100,ασ2)α<1

Предполагая, что это исследование является правильным:

Каково соотношение пола и IQ?

Является ли пол и IQ независимым?

Har
источник
4

Мы можем определить дискретную случайную величину с P ( X = - 1 ) = P ( X = 0 ) = P ( X = 1 ) = 1X{1,0,1}P(X=1)=P(X=0)=P(X=1)=13

а затем определить Y={1,ifX=00,otherwise

Легко проверить, что и Y некоррелированы, но не независимы.XY

StubbornAtom
источник
2

Попробуйте это (код R):

x=c(1,0,-1,0);  
y=c(0,1,0,-1);  

cor(x,y);  
[1] 0

Это из уравнения круга x2+y2r2=0

не коррелирует с x , но является функционально зависимым (детерминированным). Yx

Аналитик
источник
1
Выборочная корреляция ноль не означает, что истинная корреляция равна нулю.
mpiktas
3
@mpiktas Если эти четыре значения представляют собой двумерное распределение, каждое из которых имеет вероятность 1/4, corфункция, возвращающая ноль, будет указывать на нулевую корреляцию совокупности.
Glen_b
@Glen_b Я должен был сделать лучшие комментарии к коду. Это может быть не всем известно. Вы можете использовать точки с запятой, хотя я думаю, что это не рекомендуется в качестве стиля кодирования в R.
Аналитик
1
@Glen_b да, ты прав. Но это не было заявлено. Хорошее наблюдение, кстати.
mpiktas
1

Единственный общий случай, когда отсутствие корреляции подразумевает независимость, это когда совместное распределение X и Y является гауссовым.

Фредерик Майнертсен
источник
2
Это не дает прямого ответа на вопрос, приводя простой пример - в этом смысле это скорее комментарий - но он дает косвенный ответ, поскольку предлагает очень широкий набор возможных примеров. Возможно, стоит перефразировать этот пост, чтобы прояснить, как он отвечает на исходный вопрос.
Серебряная
-1

Ответ из двух предложений: наиболее ясным случаем некоррелированной статистической зависимости является нелинейная функция RV, скажем, Y = X ^ n. Эти два RV явно зависимы, но еще не коррелированы, потому что корреляция является линейной зависимостью.

Джон Стронг
источник
XXY=Xn
Этот ответ неверен. В R: выражение: {x <- runif (100); cor (x, x ^ 3)} Результат: 0.9062057
Джош