Кто-нибудь имеет представление о том, почему условную корреляцию между двумя переменными называют «частичной» корреляцией, а простую корреляцию между ними (то есть, если она не обусловлена какой-либо другой переменной) называют «предельной» корреляцией? Что такое интуиция за словами «частичный» и «маргинальный»? Что они делают с «частями» или «полями»?
Было бы хорошо узнать ответ, чтобы лучше понять эти понятия.
Ответы:
Термин «маргинальный» очень старый. Если вы вернетесь достаточно далеко в историю, научных журналов не было (очевидно, они начали около 1665 года ). Вместо этого промежуточные результаты были сообщены с помощью рукописных писем, а окончательные результаты были записаны в книгах. До Playfair не было особого интереса к графике данных , но в книгах часто могут быть таблицы с числами в разных условиях. Рассмотрим эту таблицу:
xI,AIAIx
Какое отношение эти числа имеют к корреляциям? Что ж, это не прямая связь, но если у вас есть идея «не учитывать другие переменные», и у вас есть имя для этого («маргинальный»), когда возникает новый аналогичный контекст (то есть корреляции) имя и идея просто применяются.
Я не знаю этимологии частичных корреляций, но я могу дать вам интуицию. На самом деле это довольно просто: вы имеете дело с корреляцией между частью одной переменной и частью другой. Рассмотрим эту цифру:
Мы можем представить себе , левый круг является переменной , правый круг является переменной , а верхний круг является переменной . Корреляция между двумя переменными связана с тем, насколько сильно перекрываются круги (фактически, мы можем представить, что площадь окружностей представляет изменчивость каждой переменной и что процент площади равен ). Теперь ясно , что существует некоторая корреляция между и , но есть некоторая корреляция между и , а также между и . Что если вы хотите знать, какова корреляция между этими частямиY Z r 2 X Y X Z Y Z X Y ZИкс Y Z р2 Икс Y Икс Z Y Z Икс и , которые не были связаны сY Z ? Это было бы частичной корреляцией . Это связано с перекрытием между двумя частями кругов, которые не включают верхние ленты, которые пересекаются с верхним кругом.
Мне нравится эта веб-страница, которая позволяет легко понять частичные корреляции и смежные темы. Только первый раздел посвящен частичным корреляциям как таковым, но я настоятельно рекомендую прочитать всю страницу (хотя она довольно длинная). Хотя это и не связано напрямую, обсуждение в этой теме: где общая дисперсия между всеми IV в линейном уравнении множественной регрессии? также может быть полезным.
источник
Корреляция между 2 переменными (которую вы называете предельной корреляцией) указывает на то, что выборки обеих переменных показывают некоторую зависимость.ρXY X,Y
Частичная корреляция измеряет остаточную корреляцию между после устранения влияния смешивающей переменной с помощью линейной регрессии.ρXY⋅Z X,Y Z
В математических терминах это выражается как:ρXY⋅Z:=ρXY−ρXZρYZ1−ρ2XZ−−−−−−−√1−ρ2YZ−−−−−−√
Чтобы проиллюстрировать свойства, вытекающие из этого определения, мы можем рассмотреть два предельных случая:
если и оба на 0% связаны с переменной , то частичная корреляция является корреляцией:X Y Z ρXY⋅Z=ρXY
Однако если на 100% коррелирует с , тогда частичная корреляция всегда равна 0 независимо от значения .Y Z ρXY
источник