Я знаю, что корреляция подразумевает не причинно-следственную связь, а силу и направление отношений. Означает ли простая линейная регрессия причинную связь? Или для этого требуется статистический тест (t-критерий и т. Д.)?
regression
correlation
causality
user4572
источник
источник
Ответы:
Быстрый ответ - нет. Вы можете легко найти несвязанные данные, которые при регрессии будут проходить всевозможные статистические тесты. Ниже приведена старая картина из Википедии (которая по некоторым причинам была недавно удалена), которая использовалась для иллюстрации управляемой данными "причинности".
Нам нужно больше пиратов, чтобы охладить планету?
Для временных рядов существует термин «причинность Грейнджера», который имеет очень специфическое значение.
http://en.wikipedia.org/wiki/Granger_causality
Помимо этого, «причинность» находится в глазах смотрящего.
источник
В математике регрессии нет ничего явного, что устанавливают причинно-следственные связи, и, следовательно, нет необходимости явно интерпретировать наклон (силу и направление) или р-значения (то есть вероятность того, что такое сильное или более сильное отношение наблюдалось бы, если бы отношения были нулевыми в популяции) в причинно-следственной связи.
При этом я бы сказал, что регрессия имеет гораздо более сильное значение, чем оценка явной направленной связи, чем оценка корреляции между двумя переменными. Предполагая, что под корреляцией вы подразумеваете r Пирсона , он обычно не имеет явной причинной интерпретации, поскольку метрика симметрична (то есть вы можете выбрать, какая переменная равна X, а какая - Y, и вы все равно будете иметь ту же меру). Также разговорный термин «корреляция не подразумевает причинно-следственную связь», я подозреваю, настолько хорошо известен, что утверждение о двух переменных коррелирует, если допустить, что причина не является причинно-следственной.
Предполагаемые эффекты в регрессионном анализе не симметричны, поэтому, выбирая, какая переменная находится справа, а не левой, вы делаете неявное утверждение, в отличие от корреляции. Я подозреваю, что в подавляющем большинстве обстоятельств, в которых используется регрессия, предполагается сделать какое-то причинно-следственное утверждение (логический вывод против прогноза в стороне). Я подозреваю, что даже в случаях простого установления корреляций люди часто имеют в виду некоторые подразумеваемые цели причинного вывода. Учитывая некоторые ограничения, корреляция может подразумевать причинно-следственную связь !
источник
Ни корреляция, ни регрессия не могут указывать причинно-следственную связь (как показано в ответе @ bill_080), но как @Andy W указывает, что регрессия часто основана на явно фиксированной (т.е. независимой) переменной и явной (т.е. случайной) зависимой переменной. Эти обозначения не подходят для корреляционного анализа.
По словам Сокаля и Рольфа, 1969, с. 496
Сокаль Р. Р. и Ф. Дж. Рольф, 1969. Биометрия. Фримен и Ко
источник
С семантической точки зрения альтернативной целью является сбор доказательств хорошей прогностической модели вместо доказательства причинности. Простая процедура для создания доказательства прогностической ценности регрессионной модели состоит в том, чтобы разделить ваши данные на 2 части и согласовать регрессию с одной частью данных и с другой частью теста данных, насколько хорошо она прогнозирует.
Понятие причинности Грейнджера интересно.
источник
где Var (.) и Cov (.) - оценки из выборки (данных).
Следовательно, сами эти параметры являются не чем иным, как некоторыми функциями корреляции между x и y. В частности, бета - это просто «нормализованный» коэффициент корреляции. Таким образом, в регрессии не более подразумеваемой причинности, чем в корреляции. Причинная регрессия - это особый метод в эконометрике, где приходится полагаться, например, на инструментальные переменные, чтобы обойти такие феномены, как смешение, которые скрывают причинную интерпретацию любой конкретной модели регрессии.
Моя точка: регрессия может быть сделана причинной но не причинная у по умолчанию.
Для получения дополнительной информации см. Эти видео: https://www.youtube.com/watch?v=Sqy_b5OSiXw&list=PLwJRxp3blEvaxmHgI2iOzNP6KGLSyd4dz&index=55&t=0s
«Модель Рубина» самого Рубина: http://www.stat.columbia.edu/~cook/qr33.pdf
Отличный вводный курс по причинно-следственной связи (хотя пока нет регрессии): https://www.coursera.org/learn/crash-course-in-causality
источник
Мое понимание (я начинающий причинно-следственной связи) заключается в следующем:
Линейная регрессия подразумевает причинность, если ваши ковариаты взяты из контролируемого эксперимента, и ваш эксперимент хорошо выделяет гипотетический причинный фактор (см. Линейная регрессия и причинность в рандомизированном контролируемом эксперименте ).
источник
Регрессия предполагает наличие причинно-следственных связей .... если нет причин для причинности в результате физического / интеллектуального / научного анализа проблемы, нет причин для причинного анализа и нет оснований для регрессии. Вот почему FDA и подобные правительственные учреждения всегда заявляют: «Это вызывает это!» только чтобы убрать это годы и миллиарды долларов в ущерб, позже. Примерами являются легион: кофе, шоколад, кофеин, бекон, яйца и т.д ....
Еще хуже, когда две переменные имеют петлю обратной связи. Один может вызвать другой в одной точке; только для другого, чтобы вызвать один, позже. Это всегда происходит в моей области экономики: именно поэтому большая часть экономического анализа не стоит той бумаги, на которой он напечатан.
источник