Существует старая поговорка: «Соотношение не означает причинность». Когда я преподаю, я склонен использовать следующие стандартные примеры, чтобы проиллюстрировать этот момент:
- количество аистов и рождаемость в Дании;
- количество священников в Америке и алкоголизм;
- в начале 20-го века было отмечено, что существует сильная корреляция между «количеством радиоприемников» и «количеством людей в безумных приютах».
- и мой любимый: пираты вызывают глобальное потепление .
Тем не менее, у меня нет ссылок на эти примеры, и хотя они забавны, они явно ложны.
У кого-нибудь есть другие хорошие примеры?
correlation
teaching
csgillespie
источник
источник
Ответы:
Может быть полезно объяснить, что «причины» - это асимметричное отношение (X причин Y отличается от Y причин X), тогда как «связано с» - симметричное отношение.
Например, число бездомных и уровень преступности могут быть взаимосвязаны, так как оба имеют тенденцию быть высокими или низкими в одних и тех же местах. В равной степени справедливо сказать, что численность бездомных связана с уровнем преступности, а уровень преступности - с количеством бездомных. Сказать, что преступление является причиной бездомности, или что бездомное является преступлением, - это разные заявления. И корреляция не означает, что либо это правда. Например, основной причиной может быть третья переменная, такая как злоупотребление наркотиками или безработица.
Математика статистики не умеет выявлять основные причины, которые требуют какой-то другой формы суждения.
источник
Мои любимые:
1) Чем больше пожарных отправляют на огонь, тем больше наносится ущерба.
2) Дети, которые обучаются, получают худшие оценки, чем дети, которые не обучаются
и (это мой лучший)
3) В первые годы начальной школы астрологический знак коррелирует с IQ, но эта корреляция ослабевает с возрастом и исчезает в зрелом возрасте.
источник
Мне всегда нравился этот:
источник: http://pubs.acs.org/doi/abs/10.1021/ci700332k
источник
Иногда корреляции достаточно. Например, в автомобильном страховании водители-мужчины связаны с большим количеством несчастных случаев, поэтому страховые компании взимают с них больше. Нет никакого способа проверить это на предмет причинности. Вы не можете изменить пол водителей экспериментально. Google заработал сотни миллиардов долларов, не заботясь о причинно-следственной связи.
Чтобы найти причинно-следственную связь, вам обычно нужны экспериментальные данные, а не данные наблюдений. Хотя в экономике они часто используют наблюдаемые «шоки» системы для проверки причинности, например, если генеральный директор внезапно умирает и цена акций растет, вы можете предположить причинность.
Корреляция является необходимым, но не достаточным условием причинности. Чтобы показать причинно-следственную связь, требуется контр-факт.
источник
У меня есть несколько примеров, которые я люблю использовать.
При расследовании причины преступления в Нью-Йорке в 80-х годах, когда они пытались навести порядок в городе, академик обнаружил сильную корреляцию между количеством совершенных серьезных преступлений и количеством мороженого, продаваемого уличными торговцами! (Что является причиной, а что является следствием?) Очевидно, что была ненаблюдаемая переменная, вызывающая оба. Лето - это когда преступность самая большая и когда продается больше всего мороженого.
Размер вашей ладони отрицательно коррелирует с тем, как долго вы будете жить (правда!). На самом деле, женщины, как правило, имеют меньшие ладони и живут дольше.
[Мой любимый] Я слышал об исследовании, которое несколько лет назад показало, что количество выпитого человеком напитка положительно коррелирует с вероятностью ожирения.(Я сказал себе - это имеет смысл, потому что это должно быть из-за людей, пьющих сладкую соду и получающих все эти пустые калории.) Через несколько дней появилось больше деталей. Почти вся корреляция была обусловлена увеличением потребления диетических безалкогольных напитков. (Это подорвало мою теорию!) Итак, какова причина? Приводят ли диетические безалкогольные напитки к увеличению веса или увеличение веса вызывает увеличение потребления диетических безалкогольных напитков? (Прежде чем сделать вывод, что это последнее, посмотрите исследование, в котором контролируемые эксперименты с крысами показали, что группа, которой давали йогурт с искусственным подсластителем, набрала больше веса, чем группа, которой давали обычный йогурт.) Две ссылки: Пейте больше диетической соды , Набрать больше веса? ; Диетические газированные напитки, связанные с ожирением, Я думаю, что они все еще пытаются разобраться с этим.
источник
Количество Нобелевских премий, выигранных страной (с учетом населения), хорошо коррелирует с потреблением шоколада на душу населения. ( Медицинский журнал Новой Англии )
источник
Хотя это скорее иллюстрация проблемы множественных сравнений, это также хороший пример неверно распределенной причины:
Регби (религия Уэльса) и его влияние на католическую церковь: стоит ли волноваться папе Бенедикту XVI?
источник
Там же два аспекта этой постфактум эрго propter специальной проблемы , которые я люблю , чтобы покрыть: (I) вскрывать причинно - следственную связь и (б) эндогенности
Пример «возможной» обратной причинно-следственной связи: социальное употребление алкоголя и заработок - пьющие зарабатывают больше денег, согласно Бетани Л. Питерс и Эдварду Стрингхэму (2006 год. «Не выпивай? Ты можешь проиграть: почему пьющие зарабатывают больше денег, чем неопытные», « Журнал труда»). Research, Transaction Publishers, том 27 (3), страницы 411-421, июнь). Или люди, которые зарабатывают больше денег, пьют больше либо потому, что имеют больший располагаемый доход, либо из-за стресса? Это отличная статья для обсуждения по разным причинам, включая ошибку измерения, смещение ответа, причинность и т. Д.
Пример «возможной» эндогенности. Уравнение Минсера объясняет логарифмическую доходность по образованию, опыту и опыту в квадрате. Существует много литературы на эту тему. Экономисты труда хотят оценить причинно-следственную связь образования с доходом, но, возможно, образование является эндогенным, поскольку «способность» может увеличить объем образования, которое имеет человек (за счет снижения стоимости его получения), и может привести к увеличению заработка независимо от уровень образования. Потенциальное решение этого может быть инструментальной переменной. Книга Ангриста и Пишке «В основном безвредная эконометрика» освещает это и очень подробно и ясно описывает темы.
Другие глупые примеры, которые я не поддерживаю, включают: - Количество телевизоров на душу населения и уровень смертности. Итак, давайте отправим телевизоры в развивающиеся страны. Очевидно, что оба являются эндогенными для чего-то вроде ВВП. - Количество нападений акул и продажи мороженого. Оба эндогенные к температуре, возможно?
Мне также нравится рассказывать ужасную шутку о сумасшедшем и пауке. Сумасшедший бродит по коридорам убежища с пауком, которого он несет в ладони. Он видит доктора и говорит: «Смотри, Док, я могу поговорить с пауками. Посмотри на это.» Паук, иди налево! »Паук должным образом двигается влево. Он продолжает:« Паук, иди направо. справа от его ладони. Доктор отвечает: «Интересно, может быть, мы должны поговорить об этом на следующем групповом занятии». Сумасшедшие реплики: «Это ничего, док. Понаблюдайте за этим. »Он тянет каждую ногу паука одну за другой, а затем кричит:« Паук, иди налево! »Паук неподвижно лежит на ладони, и сумасшедший поворачивается к доктору и делает вывод:« Если ты снимешь паука ноги он оглохнет ".
источник
Лучшее, чему меня учили, было количество утоплений, и продажи мороженого могут быть сильно коррелированными, но это не означает, что одно вызывает другое. Потопление и продажи мороженого, очевидно, выше в летние месяцы, когда погода хорошая. Третья переменная, иначе хорошая погода, вызывает их.
источник
Как обобщение «пираты вызывают глобальное потепление»: выберите любые две величины, которые (монотонно) увеличиваются или уменьшаются со временем, и вы должны увидеть некоторую корреляцию.
источник
Вы можете потратить несколько минут на Google Correlate и придумать всевозможные ложные корреляции.
источник
Я работаю со студентами, обучая соотношениям причинно-следственной связи на уроках алгебры Один. Мы рассмотрим множество возможных примеров. Мне показалась полезной статья «Связанные младенцы и опасное мороженое: корреляционные головоломки» от февральского учителя математики 2013 года. Мне нравится идея говорить о «скрывающихся переменных». Также этот мультфильм - симпатичный стартер беседы:
Мы определяем независимую и зависимую переменную в карикатуре и говорим о том, является ли это примером причинности, если нет, то почему.
источник
Я прочитал (давно) интересный пример снижения рождаемости (или коэффициента рождаемости, если вы предпочитаете эту меру), особенно в США, начиная с начала 1960-х годов, поскольку испытания ядерного оружия были на рекордно высоком уровне (в 1961 году самая большая из когда-либо взорвавшихся ядерных бомб была испытана в СССР). Цены продолжали снижаться до конца двадцатого века, когда большинство стран наконец прекратили это делать.
Я не могу найти ссылку, которая объединяет эти цифры сейчас, но в этой статье Википедии есть цифры по количеству испытаний ядерного оружия по странам.
Конечно, было бы разумнее взглянуть на соотношение рождаемости с введением и легализацией противозачаточных таблеток «по совпадению», начиная с начала 1960-х годов. (Сначала только в некоторых штатах, затем во всех штатах только для замужних женщин, затем в некоторых для незамужних, а затем по всем направлениям), но даже это могло быть только частью причины; множество других аспектов равенства, экономических изменений и других факторов играют важную роль.
источник
Корреляция сама по себе никогда не сможет установить причинную связь. Дэвид Юм (1771-1776) весьма эффективно доказывал, что мы не можем получить определенные знания о причинности чисто эмпирическими средствами. Кант попытался решить эту проблему, страница Википедии для Канта, кажется, довольно неплохо подытожила:
Другими словами, Юм говорит нам, что мы никогда не узнаем, что причинно-следственная связь существует, просто наблюдая корреляцию, но Кант полагает, что мы можем использовать наш разум, чтобы различать корреляции, которые подразумевают причинную связь, от тех, кто этого не делает. Я не думаю, что Юм был бы не согласен, если бы Кант писал с точки зрения правдоподобия, а не определенного знания.
Короче говоря, корреляция предоставляет косвенные доказательства, подразумевающие причинно-следственную связь, но вес доказательств сильно зависит от конкретных обстоятельств, и мы никогда не можем быть абсолютно уверены. Способность предсказать последствия вмешательств является одним из способов обрести уверенность (мы не можем ничего доказать, но мы можем опровергнуть это с помощью наблюдательных данных, поэтому мы хотя бы попытались фальсифицировать теорию причинно-следственной связи). Наличие простой модели, которая объясняет, почему мы должны наблюдать корреляцию, которая также объясняет другие формы доказательств, является еще одним способом применения наших рассуждений, как предлагает Кант.
Будьте бдительны: вполне возможно, что я неправильно понял философию, однако остается тот случай, когда корреляция никогда не может служить доказательством причинно-следственной связи.
источник
источник
Стандартная цитата, указывающая на корреляцию между количеством новорожденных и пар размножения аистов в Западной Германии, новым параметром полового воспитания , Nature 332, 495 (07 апреля 1988 г.); DOI: 10.1038 / 332495a0
источник
Количество сперматозоидов у самцов в словенских деревнях и количество медведей (также в Словении) показывают отрицательную корреляцию. Некоторые люди находят это очень тревожным. Я постараюсь получить исследование, которое сделало это.
источник
Недавно я был на конференции, и один из докладчиков привел этот очень интересный пример (хотя цель состояла в том, чтобы проиллюстрировать что-то еще):
Американцы и англичане едят много жирной пищи. Существует высокий уровень сердечно-сосудистых заболеваний в США и Великобритании.
Французы едят много жирной пищи, но у них низкий уровень сердечно-сосудистых заболеваний.
Американцы и англичане пьют много алкоголя. Существует высокий уровень сердечно-сосудистых заболеваний в США и Великобритании.
Итальянцы пьют много алкоголя, но, опять же, у них низкий уровень сердечно-сосудистых заболеваний.
Вывод? Ешь и пей, что хочешь. И у вас больше шансов получить сердечный приступ, если вы говорите по-английски!
источник
Этот мультфильм из XKCD также размещен в другом месте на CrossValidated.
источник
Другим примером корреляции, который я использовал, является значительное увеличение числа людей, употребляющих органические продукты питания, и увеличение числа детей, у которых диагностирован аутизм в США. В сети есть график пародии -
источник
http://tylervigen.com/
Это показывает массу корреляций, которые, очевидно, не имеют никакого отношения к причинно-следственной связи. Или у вас есть какая-то хорошая идея, что причинно-следственная связь между возрастом Мисс Америка и убийствами связана с паром, горячими парами и горячими предметами?
??
источник
Преподавание «Корреляция не означает причинность» на самом деле никому не помогает, потому что в конце концов все дедуктивные аргументы частично основаны на корреляции.
Человек очень плохо умеет что-то делать.
Скорее, цель должна быть конструктивной: всегда думайте об альтернативах исходным предположениям, которые могут дать одни и те же данные.
источник
Ну, мой профессор использовал их во вводном классе вероятности:
1) Размер обуви соотносится с умением читать
2) Атака акулы связана с продажей мороженого.
источник
Чем больше пожарных машин отправлено в огонь, тем больше урон.
источник
Я думаю, что лучшей парадигмой может быть причинность, требующая корреляции, связанной с надежным и предпочтительно проверенным механизмом. Я думаю, что слово «подразумевать» следует использовать в этом контексте очень экономно, поскольку оно имеет несколько значений, в том числе и «внушение».
источник
Пример аистов приведен на странице 8 первого издания (1978 г.) книги Бокса, «Охотник и охотник», озаглавленной «Статистика для экспериментаторов ...» (Wiley). Я не знаю, во втором ли это. Они идентифицируют город как Ольденбург и период времени как 1930-1936.
Они ссылаются на Ornithologische Monatsberichte , 44 , № 2, Jahrgang, 1936, Berlin, и 48 , No 1, Jahrgang, 1940, Berlin, и Statistiches Jahrbuch Deutscher Gemeinden , 27-33, 1932-1938, Gustav Fischer, Jena.
источник
Я видел забавный в статье.
Производство масла в Бангладеш имеет одну из самых высоких корреляций с S & P 500 за десятилетний период.
источник
Вот идеальный. И, к сожалению, его можно использовать в качестве отличного учебного материала, потому что ни сотрудники «Вашингтон пост», ни Центры по контролю и профилактике заболеваний не демонстрируют никаких знаний о том, что эта статья должна быть сатирической в «Луке».
https://www.washingtonpost.com/health/trumps-presidency-may-be-making-latinos-sick/2019/07/19/4e89b9f0-a97f-11e9-9214-246e594de5d5_story.html?utm_term=.9dd329c2e837
источник
Кто-то сказал, корреляция может не означать причинно-следственную связь, но это, безусловно, может быть хорошим намеком :)
Хорошо, оставляя в стороне самое интересное, что именно является причиной? Действительно ли мы уверены, что пираты не вызывают глобального потепления?
Противо-интуитивно, но что понимается как причина, а что как следствие (в исследовании корреляции не так ясно). Конечно, много раз оба могут быть просто следствием общей причины (и, следовательно, коррелировать)
Все сводится к методу определения причинно-следственной связи.
Это причина (каламбур) высказывания:
Есть мелкая ложь. Есть большая ложь И есть статистика.
источник