Все мы знаем мантру «корреляция не подразумевает причинно-следственную связь», которую разыгрывают все студенты первого курса статистики. Есть некоторые хорошие примеры здесь , чтобы проиллюстрировать эту идею.
Но иногда корреляция делает подразумевает причинно - следственную связь. Следующий пример взят из этой страницы Википедии
Например, можно провести эксперимент на идентичных близнецах, которые, как известно, постоянно получали одинаковые оценки в своих тестах. Одного близнеца отправляют на учебу на шесть часов, а другого отправляют в парк развлечений. Если их результаты тестов внезапно сильно расходятся, это будет убедительным доказательством того, что учеба (или посещение парка развлечений) оказала причинное влияние на результаты тестов. В этом случае корреляция между результатами обучения и тестами почти наверняка подразумевает причинно-следственную связь.
Существуют ли другие ситуации, когда корреляция подразумевает причинно-следственную связь?
источник
Ответы:
Корреляции недостаточно для причинности. Можно обойти пример Википедии, представив, что эти близнецы всегда обманывают в своих тестах, имея устройство, которое дает им ответы. Близнец, идущий в парк развлечений, теряет устройство, отсюда и низкий класс.
Хороший способ разобраться в этом - подумать о структуре байесовской сети, которая может генерировать измеренные величины, как это сделал Перл в своей книге « Причинность» . Его основной целью является поиск скрытых переменных. Если существует скрытая переменная, которая не изменяется в измеряемом образце, то корреляция не будет подразумевать причинно-следственную связь. Выставьте все скрытые переменные, и у вас есть причинно-следственная связь.
источник
Я просто добавлю несколько дополнительных комментариев о причинно-следственной связи с точки зрения эпидемиологии . Большинство из этих аргументов взято из книги « Практическая психиатрическая эпидемиология » Prince et al. (2003).
Причинность, или интерпретация причинно-следственной связи , безусловно, являются наиболее сложными аспектами эпидемиологических исследований. Когортные и поперечные исследования могут привести, например, к путанице. Цитируя С. Менар (« Продольное исследование» , Sage University Paper 76, 1991), Х.Б. Ашер в « Причинно-следственном моделировании» (Sage, 1976) первоначально предложил следующий набор критериев, которые должны быть выполнены:
В то время как первые два критерия можно легко проверить с помощью перекрестного или упорядоченного по времени исследования поперечного сечения, последнее можно оценить только по продольным данным, за исключением биологических или генетических характеристик, для которых временный порядок можно предположить без продольных данных. Конечно, ситуация становится более сложной в случае нерекурсивных причинно-следственных связей.
Мне также нравится следующая иллюстрация (глава 13, в вышеупомянутой ссылке), которая суммирует подход, обнародованный Хиллом (1965), который включает в себя 9 различных критериев, связанных с эффектом причинности, которые также цитируются @James. Оригинальная статья действительно была озаглавлена «Окружающая среда и болезни: связь или причинность?» ( PDF версия ).
Наконец, глава 2 самой известной книги Ротмана « Современная эпидемиология» (Lippincott Williams & Wilkins, 2-е издание, 1998) предлагает очень полное обсуждение причинно-следственных связей и причинно-следственных связей как с точки зрения статистики, так и философии.
Я хотел бы добавить следующие ссылки (примерно взятые из онлайн-курса по эпидемиологии) также очень интересные:
Наконец, этот обзор предлагает более широкий взгляд на причинное моделирование, Причинный вывод в статистике: обзор (J Pearl, SS 2009 (3)).
источник
В основе вашего вопроса лежит вопрос "когда отношения являются причиной?" Это не просто должна быть корреляция, подразумевающая (или нет) причинность.
Хорошая книга на эту тему под названием Johua Angrist и Jorn-Steffen Pischke называется « В основном безвредная эконометрика ». Они исходят из экспериментального идеала, в котором мы можем каким-то образом рандомизировать исследуемое «лечение», а затем переходят к альтернативным методам генерации этой рандомизации для получения причинных влияний. Это начинается с изучения так называемых натурных экспериментов.
Одним из первых примеров естественного эксперимента, используемого для выявления причинно-следственных связей, является статья Ангриста 1989 года «Прибыль на всю жизнь и лотерея эпохи Вьетнама». Эта статья пытается оценить влияние военной службы на заработок. Ключевая проблема с оценкой любого причинного эффекта состоит в том, что определенные типы людей могут быть более склонны к зачислению, что может повлиять на любое измерение отношений. Angrist использует естественный эксперимент, созданный во время розыгрыша во Вьетнаме, чтобы эффективно «случайным образом» назначить «военную службу» для группы мужчин.
Итак, когда у нас есть причинность? В условиях эксперимента. Когда мы приблизимся? По естественным экспериментам. Есть и другие методы, которые приближают нас к «причинности», то есть они намного лучше, чем просто использование статистического контроля. Они включают разрывы регрессии, различия в различиях и т. Д.
источник
Существует также проблема с противоположным случаем, когда отсутствие корреляции используется в качестве доказательства отсутствия причинно-следственной связи. Это проблема нелинейности; при рассмотрении корреляции люди обычно проверяют Пирсона, который является лишь верхушкой айсберга.
источник
Ваш пример - пример контролируемого эксперимента . Единственный другой известный мне контекст, где корреляция может подразумевать причинность, - это естественный эксперимент .
По сути, естественный эксперимент использует назначение некоторых респондентов на лечение, которое происходит естественным образом в реальном мире. Поскольку распределение респондентов по группам лечения и контроля не контролируется экспериментатором, степень, в которой корреляция может означать причинность, возможно, в некоторой степени слабее.
Смотрите вики-ссылки для получения дополнительной информации контролируемых / естественных экспериментов.
источник
По моему мнению, Статистическая рабочая группа АПА суммировала это довольно хорошо
источник
В обращении президента сэра Остина Брэдфорда Хилла к Королевскому обществу медицины ( «Окружающая среда и болезни: ассоциация или причинность?» ) Объясняются девять критериев, которые помогают судить о наличии причинно-следственной связи между двумя коррелированными или связанными переменными.
Они есть:
источник
В примере близнецов это не только корреляция, которая предлагает причинность, но также и связанную информацию или предшествующее знание.
Предположим, я добавлю еще одну информацию. Предположим, что прилежный близнец потратил 6 часов на подготовку к экзамену по статистике, но из-за неудачной ошибки экзамен остался в истории. Будем ли мы все-таки делать вывод, что исследование стало причиной превосходных результатов?
Определение причинно-следственной связи - это такой же философский вопрос, как и научный, поэтому возникает тенденция привлекать таких философов, как Дэвид Юм и Карл Поппер, когда обсуждается причинность.
Неудивительно, что медицина внесла значительный вклад в установление причинно-следственной связи с помощью эвристики, такой как постулаты Коха об установлении причинно-следственной связи между микробами и болезнями. Они были распространены на «молекулярные постулаты Коха», необходимые для того, чтобы показать, что ген в патогене кодирует продукт, который способствует заболеванию, вызываемому патогеном.
К сожалению, я не могу публиковать гиперссылки, предположительно, потому что я новый пользователь (не правда) и у меня недостаточно «очков репутации». Настоящая причина - чье-то предположение.
источник
Одна только корреляция никогда не подразумевает причинно-следственную связь. Это так просто.
Но очень редко иметь только корреляцию между двумя переменными. Часто вы также знаете кое-что о том, что это за переменные, и теорию, или теории, предполагающие, почему между переменными может быть причинно-следственная связь. Если нет, то мы пытаемся проверить корреляцию? (Однако люди, добывающие массивные матрицы корреляции для получения значительных результатов, часто не имеют случайной теории - иначе зачем беспокоиться о майнинге. Контраргументом этого является то, что часто требуется некоторое исследование, чтобы получить идеи для случайных теорий. И так далее, и так далее ...)
Ответ на общую критику: «Да, но это всего лишь корреляция: это не подразумевает причинно-следственную связь»:
источник
Одно полезное достаточное условие для некоторых определений причинности:
Причинность может быть заявлена, когда одной из коррелированных переменных можно управлять (мы можем непосредственно установить ее значение), и корреляция все еще присутствует.
источник
Большинство алгоритмов обнаружения реализованы в Tetrad IV
источник
Смежный вопрос может быть - при каких условиях вы можете надежно извлечь причинно-следственные связи из данных?
На семинаре 2008 года NIPS попытаться решить этот вопрос эмпирически. Одна из задач состояла в том, чтобы вывести направление причинности из наблюдений за парами переменных, в которых одна переменная, как было известно, вызывало другую, и наилучший метод смог правильно определить причинное направление в 80% случаев.
источник
Почти наверняка в хорошо продуманном эксперименте. (Разработанный, конечно, чтобы выявить такую связь .)
источник
Предположим, мы думаем, что фактор A является причиной явления B. Затем мы пытаемся изменить его, чтобы увидеть, изменится ли B. Если B не меняется и если мы можем предположить, что все остальное не изменилось, убедительные доказательства того, что A не является причиной B. Если B действительно изменяется, мы не можем сделать вывод, что A является причиной, потому что изменение A могло вызвать изменение фактической причинности C, что сделало B изменением.
источник
Я заметил, что «доказательство» использовалось здесь при обсуждении эмпирической парадигмы. Там нет такой вещи. Сначала идет гипотеза, где идея продвигается; затем идет тестирование в «контролируемых условиях» [примечание а], и если встречается «достаточное» отсутствие опровержения , оно переходит к стадии гипотезы... период. Доказательств нет, если только 1) удается при каждом возникновении указанного события [примечание b] и, конечно, 2) устанавливать причинно-следственную связь. 1) маловероятно в бесконечной вселенной [примечание бесконечность по природе не может быть доказано]. Примечание А; Никакой эксперимент не проводится в полностью контролируемых условиях, и чем более контролируемыми являются условия, тем меньше сходство с внешней вселенной с явно бесконечными линиями причинности. Примечание б; имейте в виду, вы должны были идеально описать упомянутое «событие», что, по-видимому, означает совершенно правильный язык, предположительно не человеческий язык. Напоследок, вся причинность предположительно восходит к первому событию. Теперь иди поговори со всеми с теорией. Да, я учился формально и неформально. В конце; нет, близость не подразумевает причинно-следственную связь или даже что-то кроме временной корреляции.
источник
Быть беспристрастным является желательным свойством оценщика, но вы также хотели бы, чтобы ваш оценщик был эффективным (низкая дисперсия) и последовательным (имеет тенденцию к истинному значению). См. Предположения Гаусса-Маркова.
источник