Какова корреляция, если стандартное отклонение одной переменной равно 0?

15

Как я понимаю, мы можем получить корреляцию путем нормализации ковариации с помощью уравнения

ρi,j=cov(Xi,Xj)σiσj

где - стандартное отклонениеXi.σi=E[(Xiμi)2]Xi

Меня беспокоит, что, если стандартное отклонение равно нулю? Есть ли условие, гарантирующее, что оно не может быть нулевым?

Благодарю.

chepukha
источник
11
Ни одна переменная, имеющая стандартное отклонение 0, не может быть сопоставлена ​​с другой (непостоянной) переменной. Корреляция - это мера того, насколько большие / маленькие значения в одной переменной соответствуют большим / маленьким значениям в другой переменной - если одна из переменных равна константе с вероятностью 1 (вследствие наличия стандартного отклонения 0), то она может ' t возможно дать информацию о том, является ли другая переменная маленькой или большой. Я не знаю, что такое соглашение, но похоже, что корреляция должна быть определена как 0 в этом случае.
Макро
Большое спасибо Макро. Я думаю, что ваша идея такая же, как ответ ниже. Однако я не смог проголосовать за ваш комментарий из-за ограничения в баллах. Благодарю.
Чепуха 14.11.11
4
Вы уже приняли ответ, и поэтому я напишу только комментарий. Если случайная величина имеет стандартное отклонение σ Y = 0 , то cov ( X , Y ) = E [ ( X - μ X ) ( Y - μ Y ) ] = 0 для любой другой случайной величины X (так как ( Y - μ Y ) = 0 с вероятностью 1YσY=0
cov(X,Y)=E[(XμX)(YμY)]=0
X(YμY)=01). Таким образом, определение коэффициента корреляции дает неопределенную форму0ρX,Y=cov(X,Y)σXσY . В этом случае принятоопределятьρX,Yравным0, и это можно защитить на основании предельного значенияρX,YприσY0и т. Д.00 ρX,Y0ρX,YσY0
Dilip Sarwate
6
@ Dilip, если это ответ, он должен идти как ответ. Не должно иметь значения, принят ли ответ уже.
Энди W
1
@Dilip Проблема с форма - это то, что даже если это может быть сделано, чтобы иметь определенное значение посредством операции ограничения, значение зависит оттого, каквы берете ограничение. Следовательно, аргумент, чтоρX,Y=0,является неполным (и неубедительным). Можете ли вы привести источник, который принимает это соглашение и поддерживает его по уважительной причине? 00ρX,Y=0
uber

Ответы:

14

Это правда, что если один из ваших SD равен 0, это уравнение не определено. Тем не менее, лучший способ думать об этом состоит в том, что, если один из ваших SD равен 0, корреляции нет. В общих концептуальных терминах корреляция говорит вам о том, как одна переменная перемещается, а другая переменная перемещается. SD 0 означает, что переменная не «движется». Вы должны иметь вектор константы, такой как rep(constant, n_times).

Gung - Восстановить Монику
источник
Большое спасибо. Я думаю, что это имеет смысл. Интересно, что я не видел ни одного учебника, упоминающего этот случай.
Чепуха 14.11.11
@ gung Так ли это ограничение в определении коэффициента корреляции, я имею в виду, что уравнение корреляции может иметь два значения, одно из которых приведено в приведенном выше уравнении, и 0, когда SD одной из переменных равно 0.
prashanth
@prashanth, я полагаю.
gung - Восстановить Монику
2

Еще одна вещь, о которой стоит подумать, это лежащие в основе предположения, когда мы говорим о средних, стандартных отклонениях и корреляциях.

Если мы говорим о выборке данных, то одним из распространенных предположений является то, что данные (по крайней мере, приблизительно) нормально распределены или могут быть преобразованы таким образом, что они есть (например, с помощью лог-преобразования). Если вы наблюдаете стандартное отклонение нуля, есть два сценария: либо стандартное отклонение фактически ненулевое, но очень маленькое, и поэтому в вашем наборе данных есть выборки, все из которых имеют среднее значение (это может, например, произойти если вы измеряете данные с грубой точностью); или модель не указана.

В этом втором сценарии стандартное отклонение и, следовательно, корреляция являются бессмысленной мерой.

В более общем смысле базовые распределения должны иметь конечные вторые моменты и, следовательно, ненулевые стандартные отклонения, чтобы корреляция была действительной концепцией.

TDC
источник
Возможно, стоит отметить, что первоначальный вопрос касается (теоретического) распределения, а не данных.
whuber
Если это так, то стандартное отклонение нуля будет означать вырожденное распределение с мерой только на среднее значение (т. Е. Постоянную функцию) ... опять же, стандартное отклонение имеет смысл только в том смысле, что базовое распределение является нормальным. Если стандартное отклонение равно нулю, PDF гауссиана не определен должным образом и, следовательно, не допускается в модели.
TDC
Я удивлен появлением гауссиан в вашем комментарии, Том. Это кажется ненужным ограничением. Требование существования pdf также кажется ограничительным (в конце концов, ни у одного дискретного распределения нет pdf). Также обратите внимание, что SD четко определено - «значимое» - всякий раз, когда второй момент конечен, и это включает атомы вероятности (ваши функции «дельта Дирака»).
Whuber
Хорошо, я согласен, что, вероятно, был чрезмерно ограничительным, но в целом это то, что люди подразумевают под SD. например, из Wolfram: «Стандартное отклонение может быть определено для любого распределения с конечными первыми двумя моментами, но чаще всего предполагается, что базовое распределение является нормальным». Вы принимаете мою точку зрения, однако, что если SD = 0 для одной из переменных, основные предположения, лежащие в основе статистической концепции корреляции, не выполняются?
TDC
Да, Том, твое последнее заявление на месте, и я с радостью его принимаю. Однако идея, которую она выражает, не очень заметна в вашем ответе; если он есть, он скрыт в комментариях о нормальных распределениях, журналах, дельта-функциях и фокусе на данных, а не на самих распределениях. Кстати, нужно быть осторожным с статистическими отчетами, появляющимися на сайте Wolfram: он настолько сильно ориентирован на математику, что его характеристики статистической практики могут быть сомнительными. Здесь все совершенно неправильно: использование SD выходит далеко за рамки нормального распределения.
whuber
2

Корреляция - это косинус угла между двумя векторами. Сказать, что стандартное отклонение для Y равно нулю, равносильно тому, что среднее значение вектора Y (Y) равно нулю (или, что более строго, представляет ноль в соответствующем векторном пространстве). Таким образом, возникает вопрос: «Что можно сказать о (косинусе) угла между нулевым вектором и вектором Х-среднего значения (Х)?». В более общем смысле, в любом векторном пространстве с внутренним произведением, что подразумевается под углом между нулевым вектором и некоторым другим вектором? На мой взгляд, есть только один ответ на этот вопрос: концепция «угла» в этой ситуации не имеет смысла, и поэтому концепция корреляции в этой ситуации не имеет смысла.

Дэвид Эпштейн
источник
0

Отказ от ответственности, я понимаю, что уже принят качественный ответ, так что это должен быть ответ, но у меня нет опыта, чтобы это позволить. @Dilip упомянул, что вы можете определить корреляцию как 0 для соглашения, но это кажется проблематичным, так как это будет иметь очень отличную интерпретацию от корреляции, которая действительно равна нулю (с ненулевыми SD). В первоначальном вопросе говорится «если SD одной переменной равен нулю». Если мы просто остановимся и подумаем над определением «переменной», то получим гораздо более прямой путь к ответу. Переменная с 0 SD вообще не является переменной, она является константой. Поэтому в этом случае у вас нет двух переменных, поэтому концептуально вообще не имеет смысла определять корреляцию.

Скай Бакнер-Петти
источник
Если у вас недостаточно очков для комментариев, вы не должны комментировать ответы.
Майкл Р. Черник