Означает ли корреляция = 0,2, что существует ассоциация «только у 1 из 5 человек»?

48

В книге «Идиотский мозг: нейробиолог объясняет, чем на самом деле занимается ваша голова», - писал Дин Бернетт

Корреляция между ростом и интеллектом обычно указывается как около , что означает, что рост и интеллект, по-видимому, связаны только у 1 из 5 человек.0.215

Для меня это звучит неправильно: я понимаю корреляцию больше как (отсутствие) ошибки, которую мы получаем, когда пытаемся предсказать одну меру (здесь интеллект), если единственное, что мы знаем об этом человеке, это другая мера (здесь высота). Если корреляция или - 1 , то мы не будем делать какие - либо ошибки в нашем предсказании, если корреляция 0,8 , то есть больше ошибок. Таким образом, корреляция будет относиться к любому человеку, а не только к 1 из 5 человек.110.815

Я посмотрел на этот вопрос, но я не достаточно хорош в математике, чтобы понять ответ. Этот ответ, который говорит о силе линейных отношений, кажется мне понятным, но я не уверен.

Ситак
источник
6
@JamesPhillips, вы имеете в виду , а не r . Если r = 0,2, то r 2 = 0,04, то есть 4%. r2rr=0.2r2=0.04
Ричард Харди
4
4 процента имеет гораздо больше смысла, чем 20 процентов, спасибо за исправление, я согласен с вами.
Джеймс Филлипс
29
Этот 0,01% -ный образец книги заставляет меня задуматься, что за глупости можно найти в остальных ...
Ник Кокс
11
Я одобрил этот пост, потому что это именно тот тип чрезвычайно простого вопроса, который, когда его задают студенту stats 001 (или любому другому неофиту или соискателю), мгновенно и безошибочно определит, понимают ли они, что означает корреляция.
whuber
4
Я бы перестал читать эту книгу, прямо сейчас
доктор философии

Ответы:

69

Процитированный отрывок действительно неверен. Коэффициент корреляции количественно определяет степень ассоциации всей совокупности (или выборки, в случае выборочного коэффициента корреляции). Он не делит население на части, одна часть показывает связь, а другая - нет. Это может быть случай, когда популяция на самом деле состоит из двух подгрупп населения с разной степенью ассоциации, но только коэффициент корреляции не подразумевает этого.

Kodiologist
источник
19
Более того, даже в популяции, где 20% людей показали идеальную корреляцию между ростом и интеллектом, а 80% показали нулевую корреляцию, корреляция по всей популяции не обязательно равна 0,2. Утверждение неверно в нескольких отношениях!
Ядерный Ван
Странные вещи случаются с потоками, которые попадают в список Hot Network. Этот ответ, очевидно, правильный и хороший ... но 57 голосов ?! :-)
говорит амеба Восстановить Монику
2
@amoeba Если вы думаете, что это дико, посмотрите мой самый результативный ответ .
Kodiologist
Хаха, ты хозяин!
говорит амеба, восстановите Монику
Считается ли это троллингом +1 к чему-то, что только усиливает странность SE?
Nat
18

Нет, 0,2 не означает, что 1 из 5 человек показывает корреляцию. Я не знаю, как он мог написать эту ерунду.

Вот источник числа 0,2: «Об источниках корреляции высота-интеллект: новые взгляды из двумерной модели ACE с ассортативным сопряжением», https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3044837/ По-видимому, корреляция является устойчивой.

Я уже знал об этом: мой IQ значительно вырос с моим ростом, когда я стал выше. Теперь я знаю, почему я больше не становлюсь умнее: мой рост стабилен.

Конечно, это была шутка, но она указывает на проблему с аргументом автора этой книги "Идиот": никто не измеряет в рамках предметной корреляции роста и IQ, по крайней мере, насколько я знаю. Я не уверен, как бы вы сделали это чисто, было бы так много путаницы.

Сказав, что исследователи используют такие приемы, как поиск близнецов и семейных корреляций роста и IQ, это помогает им решать сложные вопросы. Предположительно, близнецы растут в схожих условиях и имеют одинаковую ДНК, поэтому в наблюдательных исследованиях это помогает решать проблемы эндогенности и другие проблемы. Однако, если вы отложите все это в сторону, суть в том, что «0,2 корреляция» не дает оснований говорить глупости, как у некоторых людей есть корреляция, а у других ее нет. Это просто смешная интерпретация результатов корреляционных исследований.

Аксакал
источник
8
-1: хотя я понимаю дух последнего абзаца этого ответа, я считаю, что это увеличивает путаницу, так как излишне вводит понятие причинности ( whyздесь это не имеет значения).
Хорхе Лейтао
1
Вы должны быть одним из пяти, для которых есть корреляция.
Карстен С.
@ JorgeLeitão Конечно, нет, нет причинно-следственной связи, они выросли вместе, это корреляция! :)
Firebug
@ JorgeLeitão, если что-нибудь NN исследование показывает, что размер имеет значение. И больший мозг, и больший образец. Таким образом, мы, когда мы вырастаем, наши мозги увеличиваем и проходим через них больше вещей, следовательно, мы должны стать умнее. Кроме того, мужчины в среднем выше женщин, поэтому в среднем они тоже должны быть умнее.
Аксакал
Ха, что за чушь.
Легкость гонок с Моникой
8

Ирония в утверждении почти слишком толстая, чтобы ее можно было разобрать. Учитывая название текста, я предполагаю, что некоторые насмешки были предназначены. Тем не менее, ваша интуиция, говорящая, что это неправильно, вероятно, на правильном пути, если интуиция что-то значит. К сожалению, многие научные репортажи ускользают от интуиции при работе с понятиями, с которыми мы не сталкивались.

XYXYXY

Выше приведена лишь одна из возможных интерпретаций корреляции 0,2; это чрезвычайно надумано, потому что в жизни так мало вещей имеют корреляцию 1 или 0, и у меньшего количества вещей эффект модификации еще достаточно силен, чтобы произвести такие противоречивые корреляции.

Adamo
источник
1
«Возможно, что при измерении связи между X и Y корреляция между X и Y составляет 1,0 в 20% населения и 0 в оставшихся 80%». - в исследовании, которое я разместил, они смотрели в пределах семьи и между близнецами, они отличаются от общей популяции. Однако я уверен, что автор имел в виду не это, а то, как он интерпретирует, в чем корреляция,
Аксакал,
Интересно, что @Aksakal эти методы компонентов дисперсии предназначены для оценки той же корреляции уровня популяции, что и измерение в популяции, они просто утверждают, что используют наследуемость, чтобы «сбрить» фенотипическую дисперсию, относящуюся к текущему влиянию окружающей среды (компонент E ACE модель): важный источник смешения в рассматриваемой гипотезе.
AdamO
10
Если корреляция составляет 1 на 20% населения и 0 на 80%, это не означает, что в целом это 0,2. Зависит от относительной дисперсии в каждой подгруппе.
говорит амеба, восстанови Монику
1
@amoeba да, хорошая точка зрения, еще раз подчеркивает, какой идиопатический сценарий оправдал бы такое утверждение.
AdamO
4
«Я предполагаю, что некоторые насмешки были предназначены». Вы более благотворительны, чем я. Это просто неправильно. Я не вижу оснований думать, что автор был намеренно неправ в том смысле, который должен был быть умным. Самая благотворительная интерпретация заключается в том, что автор хотел подчеркнуть вероятностный характер корреляции и бездумно выбрал плохой способ проиллюстрировать его; способ, с которым сам автор, вероятно, согласится, на самом деле не имеет смысла, если бы ему было указано.
Джон Колман
2

Было бы трудно придумать осмысленную интерпретацию этого, не говоря уже о том, чтобы исправить. Ассоциация не является свойством отдельных точек данных. Если бы у вас был только рост и интеллект одного человека, как вы могли бы сказать, связаны ли рост и интеллект? Я полагаю, что если бы у нас было среднее значение роста и интеллекта, мы могли бы сказать, что каждый, кто выше среднего в обоих или ниже среднего в обоих, демонстрирует «ассоциацию». Но если у вас были совершенно случайные данные (без корреляции), вы должны ожидать, что половина людей проявит «ассоциацию» в этом смысле. Я сгенерировал случайный набор данных с корреляцией около 0,2 (фактически 0,22) и обнаружил, что 55 показывает «ассоциацию» в этом смысле.

Возможно, что Y будет увеличивающейся функцией X, и корреляция между ними будет только .5; было бы глупо говорить, что только половина людей демонстрирует ассоциацию, если у каждого человека более высокий интеллект, чем у каждого более низкого человека, и более низкий интеллект, чем у всех выше. Более того, теоретически возможно иметь один выброс, создающий всю корреляцию, и корреляция множества без этой точки будет нулевой. Возможно даже, чтобы 20% населения имели отрицательную корреляцию, а остальные 80% также имели бы отрицательную корреляцию, и общая корреляция была бы .2.

Acccumulation
источник