Я знаю, что этот вопрос задавался миллиард раз, поэтому, посмотрев онлайн, я полностью убежден, что корреляция между двумя переменными не подразумевает причинно-следственную связь. На одной из моих сегодняшних лекций по статистике у нас была гостевая лекция физика о важности статистических методов в физике. Он сказал поразительное утверждение:
корреляция не подразумевает причинно-следственной связи, если только одна из переменных не является временем. Таким образом, если существует сильная корреляция между некоторой независимой переменной и временем, то это также подразумевает причинность.
Я никогда не слышал этого заявления раньше. Видят ли физики / релятивисты «Причинность» иначе, чем статистика людей?
correlation
mathematical-statistics
causality
Томас Мур
источник
источник
Ответы:
Я дам другой ответ, так как я думаю, что предоставленные в настоящее время пропускают важный пункт заявления, сделанного физиком. Цитируемое утверждение:
Физик не говорит:
Это было бы неправильно. То , что физика является высказывание:
Примером может быть энтропия. Если у нас есть сильная корреляция между течением времени и увеличением энтропии, то мы можем сказать, что увеличение времени вызывает увеличение энтропии. Обратите внимание, что это игнорирует физические причины увеличения энтропии (распад частиц, расширение вселенной и т. Д.).
Одним из традиционных требований к причинности является прогрессия по времени, а именно то, что X может вызвать Y только в том случае, если X предшествует Y. Но если одна из ваших переменных - это время, то прогрессия по времени уже встроена в отношение (если отношение существует).
РЕДАКТИРОВАТЬ: Основываясь на различных комментариях, я собираюсь добавить следующее. Я думаю, что физик может использовать здесь другую идею слова «причинность». Похоже, он говорит, что если существует корреляция между независимой переменной и временем, вы можете сделать вывод, что независимая переменная изменяется предсказуемо с течением времени. Некоторые люди могут сказать, что изменения «вызваны» течением времени, на самом деле статистики не используют слова «причина» или «причинно-следственная связь», так что это может вызвать некоторую путаницу.
источник
Мы не знаем, что имел в виду физик. Далее следуют две разные интерпретации.
Утверждение, что предшествует Y и соотносится с Y, подразумевает, что X вызывает Y неправильно. Это не достаточно для X и Y , зависит даже если X предшествует Y . Так , например, X и Y оба могут быть вызваны некоторыми другими переменным Вт : Х ← W → Y . Или может возникнуть еще более сложная модель: X ← V → Z ← W → Y, где ZИкс Y Y Икс Y Икс Y Икс Y Икс Y W Икс← W→ Y Икс←V→Z←W→ Y Z наблюдается. Теперь и Y зависимы и не имеют общей причины, но ни одна не вызывает другую.Икс Y
Тем не менее, временное превосходство значительно упрощает условия для установления причинно-следственных связей, которые вы можете найти в книге 2.7 «Причинность Жемчуга» в главе «Локальные критерии причинно-следственных связей».
По существу, (1) следует , что является потенциальной причиной , учитывая временное преимущество, и (2) следует , что может нарушить эту связь, которая может произойти только в том случае вызывает .Y X X YZ Y Икс Икс Y
Это условие намного проще, чем определение Перлом подлинной причины без временной информации.
Другая возможность изложена в некоторых других ответах , что физик означает , что если является течением времени , и это коррелирует с , то вызывает . Это утверждение верно, но бессмысленно, поскольку ход времени является причиной всех других переменных, под которыми я подразумеваю, что именно так и действует причинная графическая структура. Причинно-следственная графическая структура - это набор утверждений о независимости отношений с учетом наблюдений и вмешательств.Y X YИкс Y Икс Y
источник
Я предполагаю, что ваш приглашенный лектор имел в виду, что в физике единственные корреляции, которые выживают при репликации, - это те, где существуют основные причинно-следственные связи. Переменная времени является исключением, потому что это единственная переменная, которая не контролируется физиком. Вот почему
В физике мы обычно имеем дело с повторяемыми явлениями и экспериментами. На самом деле, почти наверняка, любой эксперимент повторяется и может быть воспроизведен вами позже или другими исследователями. Итак, допустим, вы наблюдаете выборку, где - наблюдения интересующей переменной и независимых переменных x k . Как я упоминал выше, мы полностью контролируем переменные x k и можем установить для них любое значение, какое пожелаем.Yя, хк я ИксК ИксК
Ваш физик парень говорит , что в этой установке вы не увидите никакой корреляции , если нет причинно - следственная связь. Зачем? Потому что кто-то еще или даже вы сами повторите эксперимент с любой комбинацией и последовательностью x k j , и только корреляции с причинно-следственными связями переживут повторения эксперимента. Все другие (ложные) корреляции исчезнут, как только вы соберете достаточно данных во всех возможных комбинациях эксперимента.Со г г [ г, хК] Икск J
Эта ситуация резко контрастирует с общественными науками и бизнес-приложениями, в которых нельзя проводить эксперименты. Вы наблюдаете только одну последовательность ВВП страны и не можете изменить уровень безработицы, оставляя все остальное равным, и наблюдаете корреляции.
Теперь время - единственная переменная, которую физик не может контролировать. Там только один 1 января 2017 года. Он не может повторить этот день. Он может повторить любую другую переменную, но не время. Вот почему, когда дело доходит до времени ( не прошедшего времени или возраста), физик находится в той же лодке, что и все остальные: корреляция не подразумевает причинно-следственную связь для него.
источник
Я не слышал этого раньше, и это не будет правдой в соответствии с концепциями причинности, с которыми я знаком (хотя я не физик).
Как правило, для , чтобы вызвать Y это необходимо , что Х предшествует Y во времени. Таким образом, если Y предшествует X, то оно не может быть «вызвано» X независимо от какой-либо корреляции. Более того, X, предшествующий Y , не является достаточным условием для причинности (также независимо от какой-либо корреляции).Икс Y Икс Y Y Икс Икс Икс Y
источник
Я не думаю, что время обязательно уникально в этом, но это, безусловно, хороший пример. Дело в том, что, как правило, если A & B коррелируют, вы можете предположить, что есть некоторая общая причинность, но вы не знаете, вызывает ли A B или B, вызывает A, или, возможно, третья переменная C вызывает A и B. Однако в некоторых случаях вы можете исключить, что любая другая переменная вызвала A, и поэтому должно быть, что A вызвала B. Одним из таких примеров является контролируемый эксперимент, в котором вы , экспериментатор, контролируете A. Тогда, если изменение, которое вы вносите в «Коррелирует» с изменением В, вы знаете, что именно А вызвало изменение В, а не наоборот.
Другой тип сценария, к которому относится этот пример со временем, - это если вы просто знаете, что никакая другая переменная не могла вызвать A, потому что вы знаете, что ничто не может повлиять на A. Поскольку время течет только на одну секунду за раз, независимо от того, любой другой переменной в мире, то, если время коррелирует с изменениями какой-либо переменной, которая вас интересует (скажем, количество людей на планете), вы точно знаете, что с течением времени эта переменная, скорее всего, изменилась, а скорее чем ваша переменная, приводящая ко времени или другому изменению (то есть время не шло вперед, потому что рождалось больше людей, это должно быть наоборот).
Конечно, вы все еще не знаете, является ли причинность прямой. Предположительно, само течение времени не производит автоматически больше людей. Скорее, разворачивание истории вызывает прогресс в различных аспектах общества, и это приводит к увеличению численности населения (и даже это упрощение многих небольших причинных отношений). Но независимо от конкретных факторов, которые вы играете, вы точно знаете, что A (в конечном счете) ведет к B, а не наоборот.
источник
На самом деле корреляция подразумевает причинно-следственную связь.
Возможно, A вызвало B, или C вызвало A и B.
Однако корреляция не доказывает причинно-следственную связь.
Это самоочевидно.
источник
Я бы интерпретировал это как семантический, а не математический / статистический аргумент. Я бы также воспринял это как довольно серьезное обобщение.
В критерии Bradford Hill , часто используемые в эпидемиологии, обеспечивают хорошую основу для размышлений о причинно - следственной связи. Ничто не может окончательно доказать причинность, независимо от того, является ли время фактором, и я подозреваю, что лектор не пытался сделать такое сильное утверждение. Тем не менее, многие различные факторы могут быть использованы в качестве разумных аргументов для причинно-следственной связи.
Например, критерии Брэдфорда Хилла предполагают, что сила связи между переменными может служить доказательством причинно-следственной связи, но сама по себе она недостаточна. Точно так же ассоциация, которая согласуется с другими известными / предполагаемыми фактами, может предложить причинно-следственную связь сильнее, чем ассоциация, которая несовместима с преобладающими знаниями. Временность также является одним из критериев - причина должна предшествовать своему следствию. Ассоциация и выводы, которые мы делаем о причинности, должны иметь временный смысл. Я рекомендую пересмотреть другие критерии. Некоторые из них специфичны для эпидемиологии и не так применимы к физике, но это все еще полезный способ мышления.
Суть в том, что, хотя ни одно доказательство не собирается окончательно доказать причинно-следственную связь, вы можете создать для нее хорошее обоснование на основе ряда различных логических проверок. Я бы сказал, что предоставление абсолютного приоритета какому-либо одному критерию, такому как время, нецелесообразно, но временность может быть важным фактором при обосновании причинно-следственной связи.
Это приводит к более широкому пониманию статистики: в общем, мы используем статистику для аргументации. Мы используем данные и статистические инструменты, чтобы сделать определенную точку зрения. Часто одни и те же данные (и даже одни и те же инструменты) могут использоваться для противоречивых мнений. Мы не можем найти окончательное доказательство причинности в самой математике, но мы можем использовать наши статистические инструменты как часть более широкого аргумента. Более подробно об этом я рекомендую в качестве принципиального аргумента статистику Абельсона .
Чтобы вернуться к исходной ситуации, скажем, вы провели эксперимент о влиянии концентрации определенного химического вещества в растворе на температуру этого раствора. Вы подозреваете, что добавление большего количества этого химического вещества приведет к реакции, которая увеличивает температуру. Вы добавляете более постепенно с течением времени. Вы можете посмотреть на температуру в зависимости от времени и увидеть увеличение. Все это показывает, что температура увеличивается со временем; это не доказывает, что само время (или что-либо еще, в этом отношении) имеет некоторый причинный эффект. Это, однако, предоставляет некоторые доказательства в более широком аргументе, что увеличение концентрации этого химического вещества приводит к реакции, которая повышает температуру.
источник
Предложение довольно простое и не стоит обдумывать (и не имеет ничего общего с приоритетом).
Если существует установленная корреляция между переменной и временем (то есть мы знаем, что увеличение времени сопровождается увеличением переменной, и это данность ), то мы знаем «причинное» направление: то есть увеличение времени вызывает переменная для увеличения.
Поскольку альтернативная гипотеза «не-а-а, это может быть время только увеличено, потому что переменная сначала увеличивается » просто не может устоять, если время работает.
Это может показаться глупым наблюдением, но оно имеет важные последствия для дизайна исследования, пытающегося доказать причинное направление. Важным примером в медицине является различие между проведением перекрестного и когортного исследования.
Например, перекрестное исследование, пытающееся найти связь между курением и раком, может провести группу людей, разделить ее на курящих и некурящих и посмотреть, сколько в каждой группе больных раком и раком. Тем не менее, это слабое доказательство, потому что корреляция между курением и раком может также интерпретироваться как «люди, у которых рак, с большей вероятностью будут любить курить»
Однако, если вы проводите когортное исследование, то есть берете группу курильщиков и группу некурящих, следите за ними во времени и измеряете переменную «рак у курильщиков минус рак у некурящих», и устанавливаете положительный результат. корреляция этой переменной со временем (при разумных допущениях, таких, что количество курящих после начала является постоянным и не зависит от времени и т. д.), тогда вы знаете, что «время» является причиной различия рака, поскольку вы не можете утверждать, что увеличение частоты рака заставил время больше проходить в курительной группе. Таким образом, вы можете утверждать, что причинно-следственная связь между течением времени и положительной разницей рака связана с более высокими показателями в группе курильщиков. (или, проще говоря, время, проведенное в группе курения, вызывает пропорциональное увеличение риска рака).
Кроме того, слабость перекрестного исследования, то есть вероятность того, что «люди, больные раком, более склонны к курению», теперь исчезла из окна, так как курение как переменная выбрано из «время против рака» уравнение (здесь предполагается постоянным и, следовательно, не зависит от времени). Другими словами, формулируя исследование таким образом, мы рассмотрели очень специфическое причинное направление . Если бы мы хотели выяснить, в какой степени применяется обратное причинно-следственное направление (т. Е. Какова вероятность того, что люди, которые в конечном итоге заболеют раком, будут бросать курить с течением времени), то нам обязательно нужно было бы разработать когортное исследование, разбитое на «будущий рак против рака будущего» и оцените потребление курения с течением времени.
Обновление отвечая на комментарии:
Обратите внимание, что это обсуждение причинно-следственной связи, а не поиск прямой причинно-следственной связи. Вопрос смешивания является отдельным. (т.е. нет ничего , чтобы предположить , что не является независимой третьей переменной, и заставляет вас больше шансов быть курильщиком и увеличивает ваши шансы на рак со временем). То есть с точки зрения контрафактной причинности мы не доказали окончательно, что «если бы не курение, эти люди не заболели бы раком». Но у нас естьпоказали, что «связь между группой курящих и раком не увеличилась бы, если бы время не прошло». (т.е. связь не сводится к снимку больных раком, просто предпочтение быть в группе курящих или нет, но со временем усиливается).
источник
Это действительно вопрос о том, как установить причинность, потому что события, которые связаны, но не причинны, вероятно, будут коррелировать во времени или пространстве. Итак, глядя на некоторые коррелированные данные, как мы можем определить, зависят ли отношения? Один мудрый научный руководитель однажды сказал мне: «Корреляция не подразумевает причинно-следственную связь, она просто говорит вам, где искать».
Давайте рассмотрим ситуацию, когда события A и B оказываются коррелированными во времени или пространстве. Если мы хотим исследовать предлог, что A вызывает B , традиционное мышление состоит в том, чтобы ввести тесты необходимости и достаточности - вот что на самом деле означает причинность.
Если отсутствие молока заставляет меня идти в магазин , мы говорим не о том, чтобы я садился в пустое молоко и водил машину. Абсолютная причинность означала бы, что всякий раз, когда у меня все еще есть молоко , я не могу потрудиться пойти в магазин; и наоборот, когда я в магазине, это потому , что у меня нет молока. Теперь легко увидеть проблему с положительным установлением причинности в строгом смысле: большинство вещей не являются абсолютно причинными. Есть много других причин, по которым я мог бы пойти в магазин, которые не связаны с состоянием молока.
Это простой способ отличить отличную бумагу от обычной бумаги. В тщательном исследовании вы увидите тесты достаточности и необходимости везде. Вы заявляете, что низкомолекулярный препарат А может привести к разборке белкового комплекса В? Вы сразу увидите тесты:
необходимость
----test---- ----result---- everything but B --> [nothing] (check for false positive) everything but A --> assembled everything with A-like compound --> assembled (control group)
достаточность
A + B alone (in vitro) --> disassembled (check for false negative) A + B + everything --> disassembled (trial group)
Это традиционный способ, которым вы могли бы создать индуктивный аргумент для причинности экспериментально ИСПОЛЬЗУЯ корреляцию, к чему, я уверен, ваш лектор избегал!
источник