Допустим, у меня есть таблица с колонками "A", "B"
Есть ли статистический метод, чтобы определить, вызывает ли «А» «В»? Нельзя реально использовать Пирсона, потому что:
- это только проверяет корреляцию между значениями
- корреляция не причинно-следственная
- R Пирсона может коррелировать только линейные отношения
Итак, какие еще варианты у меня есть здесь?
correlation
causality
chutsu
источник
источник
Ответы:
Пока ответы и комментарии в основном верны на практическом уровне, но для полноты картины ведутся исследования так называемых моделей причинности, основанных на байесовской статистике и теории графов. Поэтому, хотя в целом корреляция действительно не подразумевает причинно-следственную связь, существуют более сложные модели, которые пытаются выявить причинно-следственную связь. См. Книгу « Причинность » Иудеи Перл для более подробной информации, но это очень тяжелая математика и, вероятно, не то, что вам нужно.
источник
Существует много так называемых квазиэкспериментальных методов, с помощью которых вы можете достоверно спорить о причинности, даже если ваши данные являются наблюдательными. Эти методы обычно основаны на поиске источника экзогенных изменений в вашей переменной.
Я думаю, что хороший и доступный обзор приведен в книге «В основном безвредная эконометрика». Они охватывают в основном все квазиэкспериментальные методы, в которые верят люди (то есть экономисты) (по крайней мере, иногда). Они не охватывают методы, упомянутые, например, trb456 (по той же причине: не многие верят в них).
источник
Для определения причинно-следственной связи вам необходимо выполнить рандомизацию. Вы берете своих испытуемых и случайным образом выбираете половину из них, чтобы иметь качество А, а другую половину, чтобы не иметь его. Затем вы увидите, есть ли статистически значимая разница в качестве B между двумя группами.
Важно, чтобы вы сделали рандомизацию, прежде чем делать какие-либо измерения. В частности, если вам дан набор данных с уже измеренными и , тогда невозможно определить причинно-следственную связь.BA B
Обратите внимание, что может оказаться невозможным выполнить тест рандомизации, который вы хотите сделать. Например, как вы можете проверить, если высокий рост заставляет вас весить больше? Конечно, существует корреляция между ростом и весом, но вы не можете случайным образом распределить одну группу людей в «высокую» группу, а другую в «короткую». В этом случае тест рандомизации не может быть сделан.
источник
Somers пытался объяснить связь между порядковыми переменными так, как это делает коэффициент корреляции Пирсона для наборов данных.
источник