Я только что сдал экзамен, где нам представили две переменные. В игре с диктатором, где диктатору дается 100 долларов США, и он может выбирать, сколько отправить или оставить для себя, была положительная корреляция между возрастом и количеством денег, которые участники решили оставить.
Я думаю, что вы не можете сделать вывод о причинности из этого, потому что вы не можете сделать вывод о причинности из корреляции. Мой одноклассник думает, что вы можете, потому что, если вы, например, разделите участников на три отдельные группы, вы сможете увидеть, как они различаются по тому, сколько они держат и сколько они делят, и, следовательно, сделать вывод, что возраст заставляет их сохранять больше. Кто прав и почему?
correlation
causality
JonnyBravo
источник
источник
Ответы:
В общем, вы не должны предполагать, что корреляция подразумевает причинность - даже в тех случаях, когда кажется, что это единственно возможная причина.
Учтите, что есть и другие вещи, которые связаны, например, с возрастными аспектами культуры. Возможно, эти три группы останутся такими же, даже когда они все состарятся, но следующее поколение будет противостоять этой тенденции?
При всем этом, вы, вероятно, правы, что молодые люди с большей вероятностью будут держать больше, но просто знайте, что есть и другие возможности.
источник
Я могу постулировать несколько причинно-следственных связей из ваших данных.
Возраст измеряется, а затем сумма денег сохраняется. Пожилые участники предпочитают хранить больше денег (возможно, они умнее или менее идеалистичны, но это не главное).
Количество денег сохраняется, а затем возраст. Люди, которые держат больше денег, тратят больше времени на их подсчет и поэтому старше, когда измеряется возраст.
Больные люди держат больше денег, потому что им нужны деньги на (возможно, спасающие жизнь) лекарства или лечение. Фактическая корреляция между болезнью и сохраненными деньгами, но эта переменная «скрыта», и поэтому мы делаем неверный вывод, потому что возраст и вероятность болезни коррелируют в демографической группе лиц, выбранных для эксперимента.
(Пропустив 143 теории; мне нужно сделать это достаточно кратким)
Вывод: вы правы, но ваш одноклассник может претендовать на 147-кратную корректировку.
Другая известная корреляция - между низким IQ и часами просмотра телевизора ежедневно. Смотря телевизор, ты становишься тупее, или тупые люди смотрят телевизор? Это может быть и то и другое.
источник
Вывод причинно-следственной связи от корреляции в целом проблематичен, поскольку может быть ряд других причин для корреляции. Например, ложные корреляции из-за нарушителей , смещения выбора (например, только выбор участников с доходом ниже определенного порога) или причинный эффект могут просто идти в другом направлении (например, термометр коррелирует с температурой, но, конечно, не вызывает Это). В каждом из этих случаев процедура вашего одноклассника может найти причинный эффект там, где его нет.
Однако, если бы участники были выбраны случайным образом, мы могли бы исключить участников и предвзятость выбора. В этом случае, либо возраст должен привести деньги хранятся или деньги хранятся должны вызывать возраст . Последнее подразумевает, что принуждение кого-либо удерживать определенную сумму денег каким-то образом изменит его возраст. Таким образом, мы можем смело предположить, что возраст приводит к сохранению денег .
Обратите внимание, что причинный эффект может быть «прямым» или «косвенным» . Люди разного возраста будут получать различное образование, иметь разное количество материальных ценностей и т. Д., И по этим причинам могут выбрать другую сумму в размере 100 долларов США. Причинные эффекты через этих медиаторов все еще являются причинными, но косвенными.
источник
Корреляция - это математическая концепция; Причинность это философская идея.
С другой стороны, ложная корреляция - это в основном техническая (вы не найдете ее в учебниках по теории вероятностей) мера, которую можно определить таким образом, чтобы она была в основном действенной.
Эта идея тесно связана с идеей фальсификационизма в науке, когда цель состоит в том, чтобы никогда не доказывать вещи, а только опровергать их.
Статистика для математики, как медицина для биологии. Вас просят высказать свое мнение при поддержке множества технических знаний, но этих знаний никогда не бывает достаточно, чтобы охватить весь мир. Поэтому, если вы собираетесь выносить суждения как статистик и представлять их другим, вам необходимо соблюдать определенные стандарты качества; то есть что вы даете здравый совет, давая им ценность своих денег. Это также означает, что необходимо учитывать асимметрию рисков - при медицинском тестировании стоимость предоставления ложноотрицательного результата (который может помешать людям получать раннее лечение) может быть выше, чем стоимость ложного положительного результата (который вызывает дистресс) ,
На практике эти стандарты будут варьироваться от поля к полю - иногда это тройные слепые рандомизированные клинические испытания, иногда это инструментальные переменные и другие методы для контроля обратной причинности и скрытых общих причин, иногда это причинно-следственная связь Грейнджера - что-то в прошлом последовательно коррелирует с что-то еще в наличии, но не в обратном направлении. Это может быть даже строгая регуляризация и перекрестная проверка.
источник
Взаимосвязь между корреляцией и причинно-следственной связью философов и статистиков ставила в тупик на протяжении веков. Наконец, за последние двадцать лет или около того ученые-компьютерщики утверждают, что разобрались со всем этим. Это не кажется широко известным. К счастью, Иудея Перл, первопроходец в этой области, недавно опубликовала книгу, объясняющую эту работу для популярной аудитории: «Книга почему».
https://www.amazon.com/Book-Why-Science-Cause-Effect/dp/046509760X
https://bigthink.com/errors-we-live-by/judea-pearls-the-book-of-why-brings-news-of-a-new-science-of-causes
Оповещение о спойлере: Вы можете вывести причинность из корреляции в некоторых обстоятельствах, если знаете, что делаете. Для начала вам необходимо сделать несколько причинных предположений (причинная модель, в идеале основанная на науке). И вам нужны инструменты, чтобы делать контрфактуальные рассуждения (Do-алгебра). Извините, я не могу развести это до нескольких строчек (я все еще читаю книгу), но я думаю, что ответ на ваш вопрос там.
источник
Причинная претензия по возрасту была бы неуместной в этом случае
Проблема с требованием причинно-следственной связи в вашем вопросе к экзамену сводится к одному простому факту: старение не было лечением, возраст вообще не манипулировали. Основная причина для проведения контролируемых исследований именно потому, что из-за манипулирования и контроля над интересующими переменными, вы можете сказать, что изменение одной переменной вызывает изменение результата (в чрезвычайно специфических экспериментальных условиях и при нагрузке с лодки). других предположений, таких как случайное назначение и то, что экспериментатор не напортачил в деталях исполнения, которые я здесь случайно примыкаю).
Но это не то, что описывает дизайн экзамена - он просто имеет две группы участников, с одним конкретным фактом, который отличает их (их возраст); но у вас нет возможности узнать какие-либо другие отличия группы. Из-за отсутствия контроля вы не можете знать, была ли разница в возрасте причиной изменения результата, или же причина в том, что 40-летние участвуют в исследовании, потому что им нужны деньги, в то время как 20-летние были учащиеся, которые участвовали в зачетных классах и у которых были другие мотивы, или любые другие тысячи возможных естественных различий в ваших группах.
Теперь техническая терминология для такого рода вещей варьируется в зависимости от области. Общими терминами для таких вещей, как возраст и пол участника, являются «атрибут участника», «посторонняя переменная», «независимая от атрибута переменная» и т. Д. В конечном итоге вы получите нечто, что не является «истинным экспериментом» или «истинно контролируемым экспериментом», потому что то, о чем вы хотите заявить - например, о возрасте - на самом деле не зависело от вас, чтобы измениться, поэтому вы можете надеяться на самое большее без гораздо более продвинутых методов (таких как причинный вывод, дополнительные условия, продольные данные и т. д.) это утверждать, что есть корреляция.
Это также является одной из причин того, почему эксперименты в области социальных наук и понимание трудно контролируемых качеств людей настолько сложны на практике - люди отличаются друг от друга во многих отношениях, и когда вы не можете изменить то, что хотите чтобы узнать о них, вам, как правило, нужны более сложные экспериментальные и логические методы или совершенно другая стратегия.
Как вы могли бы изменить дизайн, чтобы сделать причинную претензию?
Представьте себе гипотетический сценарий, подобный следующему: группа A и B состоят из участников, которым по 20 лет.
У вас есть группа А, чтобы играть в игру диктатуры, как обычно.
Для группы B вы вынимаете магический стареющий луч науки (или, возможно, призрак обращается с ними с ужасающим обликом ), который вы тщательно настроили, чтобы состарить всех участников группы B, чтобы им было уже 40 лет, но в противном случае оставьте их без изменений, а затем попросите их сыграть в игру диктатора, как это сделала Группа А.
Для большей строгости вы можете получить группу C, состоящую из 40-летних людей естественного возраста, чтобы подтвердить, что синтетическое старение сопоставимо с естественным старением, но давайте сделаем все просто и скажем, что мы знаем, что искусственное старение - это то же самое, что реальная вещь, основанная на Работа".
Теперь, если группа B хранит больше денег, чем группа A, вы можете утверждать, что эксперимент показывает, что старение заставляет людей хранить больше денег. Конечно, есть еще приблизительно тысяча причин, по которым ваше утверждение может оказаться неверным, но ваш эксперимент, по крайней мере, имеет достоверную причинную интерпретацию.
источник
Нет. Между причинностью и корреляцией существует односторонняя логическая связь.
Рассмотрим корреляцию - свойство, которое вы вычисляете по некоторым данным, например, наиболее распространенную (линейную) корреляцию, определенную Пирсоном. Для этого конкретного определения корреляции вы можете создать случайные точки данных, которые будут иметь корреляцию ноль или единицу без какой-либо причинной связи между ними, просто имея определенные (a) симметрии. Для любого определения корреляции вы можете создать рецепт, который будет показывать оба поведения: высокие значения корреляции без математической связи между ними и низкие значения корреляции, даже если существует фиксированное выражение.
Да, отношение из «не связанных, но сильно коррелированных» слабее, чем «без корреляции, несмотря на то, что связано». Но единственный индикатор (!), Который у вас есть, если есть корреляция, - это то, что вам нужно больше искать объяснения.
источник
Как правило, вы не можете перейти от соотношения к причинности. Например, существует известный феномен социальных наук о социальном статусе / классе и склонности тратить / сберегать. В течение многих многих лет считалось , что это свидетельствует о причинно - следственной связи. В прошлом году более интенсивные исследования показали, что это не так.
Классическая «корреляция - это не причинно-следственная связь» - в данном случае смешивающим фактором было то, что рост в бедности учит людей по-разному использовать деньги и тратить, если есть излишки, потому что завтра их может не быть, даже если они будут сохранены по разным причинам. ,
В вашем примере, предположим, что все пожилые люди пережили войну, а молодые люди - нет. Связь может заключаться в том, что люди, которые выросли в социальном хаосе с реальным риском причинения вреда и гибели людей, учатся расставлять приоритеты в сбережении ресурсов для себя и против нужды, в большей степени, чем те, кто растет в более счастливых обстоятельствах, когда государство, работодатели или об этом позаботятся медицинские страховщики, и выживание не является проблемой, которая определяла их взгляды. Тогда вы получите ту же очевидную связь - пожилые люди (включая тех, кто ближе к их поколению) держат больше, но это, очевидно, будет связано только с возрастом. В действительности причинным элементом является социальная ситуация, в которой человек провел годы становления, а также то, чему он научил, а не возраст как таковой .
источник
Есть несколько причин, почему этот вывод не имеет смысла.
Предлагаемое усовершенствование дизайна - следующее перекрестное исследование типа.
Та же настройка: случайные деспоты любого возраста, которые правят землями. Дизайн: Выберите подходящие пары молодых и старых диктаторов. Дайте им горшок с деньгами, осмотрите пропорции удержанных (старый - молодой =п1 ). Украсть деньги обратно, чтобы у страны и правителя были в основном те же активы, что и раньше. Свергните их с соответствующих престолов и установите их на чужой земле. Повторяйте подачу горшков, проверяйте удерживаемую пропорцию (старый - молодой =п2 ).
источник
Причинность и корреляция - это разные категории вещей. Вот почему одной корреляции недостаточно, чтобы вывести причинность.
Например, причинность является направленной , а корреляция - нет. Делая вывод о причинности, вы должны установить, что является причиной и что является следствием.
Есть и другие вещи, которые могут помешать вашему выводу. Скрытые или третьи переменные и все вопросы статистики (выборка, размер выборки и т. Д.)
Но при условии, что ваша статистика сделана правильно, корреляция может дать подсказки о причинности. Как правило, если вы обнаружите корреляцию, это означает, что где-то есть какая-то причинность, и вы должны начать ее искать.
Вы можете абсолютно начать с гипотезы, основанной на вашей корреляции. Но гипотеза - это не причинность, это просто возможность причинности. Затем вам нужно проверить это. Если ваша гипотеза сопротивляется достаточным попыткам фальсификации, вы можете что-то предпринять.
Например, в вашей гипотезе о возрастных причинах жадности одна альтернативная гипотеза будет заключаться в том, что это не возраст, а продолжительность диктатуры. Таким образом, вы будете искать старых, но недавно уполномоченных диктаторов в качестве контрольной группы, и молодых, но диктаторов с детства в качестве второй, и проверять результаты там.
источник
Спасибо @AdamO за то, что вы предложили много обсуждений и споров на этот пост. Я пытаюсь предложить физическое представление о причинно-следственной связи, которое может быть незнакомо среднему читателю статистики.
Вы правы с точки зрения физических наук. В простейшей форме возможность не зависящего от времени представления о причинности лежит в основе дедуктивно-номологического (DN) представления о научном объяснении, рассматривая событие, подлежащее объяснению, если оно может быть отнесено к научному закону. В представлении DN физическое состояние считается объясненным, если, применяя (детерминированный) закон, оно может быть получено из заданных начальных условий. (Такие начальные условия могут включать импульсы и расстояние друг от друга двойных звезд в любой данный момент.) Такое «объяснение детерминизмом» иногда называют причинным детерминизмом.
Получив немного более полную информацию об этом, можно было бы включить индуктивно-статистическую модель Хемпеля, чтобы сформировать научное объяснение , и эта ссылка предлагает более полное обсуждение причинности.
Что касается рассматриваемой проблемы, возраст может быть связан с опытом, но отношения не являются простыми, более того, функции мозга в разных возрастах различны (демаркация времени увеличивается с возрастом). Опыт как модификатор поведения весьма разнообразен, и тот факт, что когорта в определенном территориальном и временном смысле может иметь схожие исторические переживания, не означает, что любое поведение, вытекающее из этого опыта, может быть экстраполировано на другие когорты без страха противоречия. Что касается контролируемого испытания, общность переживаний представляет собой неконтролируемую переменную, которая вводит неизвестное и неисследованное количество ложной корреляции в любое двоичное сравнение, так что любое обнаруженное различие не следует рассматривать как выявление вероятной причинной связи. Более того, вероятная причина, когда обнаружена, будет представлять собой только подозрение, а не то, что можно утверждать с убеждением; в лучшем случае это рабочая гипотеза, а не лучший вывод. Осуждения относительно причинности должны быть получены только из совокупности доказательств, достаточно инклюзивных, чтобы эти убеждения не вызывали разумных сомнений. Это не относится к вышеуказанному вопросу, для которого недостаточно информации, чтобы требовать каких-либо причинно-следственных связей вне совпадения контекста из когортной группировки. Действительно, можно сформулировать так много гипотез, например, что эволюция щедрости с возрастом модифицируется опытом культурной / исторической эпохи, что из сформулированной проблемы нельзя сделать четких выводов. Осуждения относительно причинности должны быть получены только из совокупности доказательств, достаточно инклюзивных, чтобы эти убеждения не вызывали разумных сомнений. Это не относится к вышеуказанному вопросу, для которого недостаточно информации, чтобы требовать каких-либо причинно-следственных связей вне совпадения контекста из когортной группировки. Действительно, можно сформулировать так много гипотез, например, что эволюция щедрости с возрастом модифицируется опытом культурной / исторической эпохи, что из сформулированной проблемы нельзя сделать четких выводов. Осуждения относительно причинности должны быть получены только из совокупности доказательств, достаточно инклюзивных, чтобы эти убеждения не вызывали разумных сомнений. Это не относится к вышеуказанному вопросу, для которого недостаточно информации, чтобы требовать каких-либо причинно-следственных связей вне совпадения контекста из когортной группировки. Действительно, можно сформулировать так много гипотез, например, что эволюция щедрости с возрастом модифицируется опытом культурной / исторической эпохи, что из сформулированной проблемы нельзя сделать четких выводов.
источник