Почему «объяснение в стороне» имеет интуитивный смысл?

36

Недавно я узнал о принципе вероятностных рассуждений, называемом « объяснение прочь », и я пытаюсь понять его интуицию.

Позвольте мне создать сценарий. Пусть A будет событием землетрясения. Пусть событие B будет событием, когда веселый зеленый гигант прогуливается по городу. Позвольте C быть случаем, что земля дрожит. Пусть AB . Как вы видите, либоили B может вызвать C .ABC

Я использую «объяснить» рассуждение, если C имеет место, один из P(A) или P(B) возрастает, а другой уменьшается , так как я не нужно альтернативные причины , чтобы объяснить , почему C произошло. Однако, моя нынешняя интуиция подсказывает мне , что и P(A) и P(B) должна возрастать , если C происходит , поскольку C происходит делает его более вероятно , что какой - либо из причин C произошли.

Как мне совместить мою нынешнюю интуицию с идеей объяснений? Как я могу использовать объяснения, чтобы обосновать, что A и B условно зависят от C ?

Дэвид Фокс
источник
4
Что делает смысле? AB
mark999
2
Это означает, что не зависит от B , извините. AB
Дэвид Фокс
1
Я бы выбрал сценарий, который с меньшей вероятностью запутает вас. «Сотрясение земли» может быть причиной или следствием «землетрясения», и оба они, вероятно, вызваны «прогуливанием зеленого гиганта». Чтобы объяснить, что происходит, и А, и В должны быть причинами С.
Нейл Г.
@DavidFaux вам не нужно извиняться. Это стандартная математическая запись для определения независимости переменных. Кстати, спасибо за хороший вопрос, а также +1, потому что ссылка, которую вы предоставляете, действительно очень хорошая! Я был озадачен всеми этими концепциями, и эта статья, которую вы предоставили, действительно хороша. Благодарность! :)
Чарли Паркер

Ответы:

39

Разъяснения и обозначения

если происходит C, один из P (A) или P (B) увеличивается, а другой уменьшается

Это не правильно. Вы (неявно и разумно) предположили, что A (незначительно) не зависит от B, а также что A и B являются единственными причинами C. Это означает, что A и B действительно зависят от C , их совместного влияния. Эти факты согласуются, потому что объяснение - это P (A | C), который отличается от P (A). Обозначение бара кондиционирования здесь важно.

Тем не менее, моя текущая интуиция говорит мне, что и P (A), и P (B) должны увеличиться, если происходит C, так как возникновение C повышает вероятность возникновения любой из причин возникновения C.

Вы получаете «вывод из полуконтролируемого сноса» (подробности см. Ниже). Начнем с того, что вы уже верите, что C указывает на то, что произошло A или B, поэтому вы не можете быть более уверенными в том, что A или B произошли, когда вы видите C. Но как насчет A и B с учетом C? Ну, это возможно, но менее вероятно, чем A, а не B или B и не A. Это «объяснение» и то, для чего вы хотите интуицию.

Интуиция

Давайте перейдем к непрерывной модели, чтобы нам было проще визуализировать вещи и думать о корреляции как о конкретной форме независимости. Предположим, что показатели чтения (A) и оценки по математике (B) независимо распределены среди населения в целом. Теперь предположим, что школа допустит (С) учащегося с комбинированным баллом по чтению и математике, превышающим некоторый порог. (Неважно, что это за порог, если он хотя бы немного избирателен).

Вот конкретный пример: предположим, что независимые единицы обычно распределяют баллы по чтению и математике, а также выборку учащихся, кратко изложенную ниже. Когда показатели чтения и математики учащегося превышают порог приема (здесь 1,5), учащимся обозначается красная точка.

объясняя как отношения коллайдера

Поскольку хорошие оценки по математике компенсируют плохие оценки по чтению и наоборот, число принятых студентов будет таким, что чтение и математика теперь зависят и имеют отрицательную корреляцию (-0,65 здесь). Это также верно в отношении недопущенного населения (-0,19 здесь).

Итак, когда вы встречаете случайно выбранного студента и слышите о ее высоком балле по математике, вы должны ожидать, что она получила более низкий балл за чтение - математический балл «объясняет» ее поступление. Конечно, она также может иметь высокий балл чтения - это, безусловно, происходит в сюжете - но это менее вероятно. И ничто из этого не влияет на наше ранее сделанное предположение о том, что между математикой и показателями чтения в общей популяции нет корреляции, отрицательной или положительной.

Проверка на интуицию

Возвращаясь к отдельному примеру, ближе к вашему оригиналу. Рассмотрим лучший (и, возможно, единственный) мультфильм о «объяснении».

полууправляемый снос

Правительственный заговор - это А, террористический заговор - это В, и общее разрушение рассматривается как С, игнорируя тот факт, что есть две башни. Если понятно, почему аудитория ведет себя достаточно рационально, когда они сомневаются в теории говорящего, тогда вы понимаете «объяснение в стороне».

conjugateprior
источник
3
Я думаю, что примеры являются самыми неудачными, хотя математика и умение читать считаются независимыми, это, вероятно, на самом деле не так, что приводит к некоторой путанице в отношении последующего использования термина «факт».
Роберт Джонс
Я думаю, что лучшим примером был бы случай человека, который мог съесть фунт чего-то, что могло быть картофелем или колбасами. Если бы этот человек не прибавил в весе в течение периода эксперимента, то вероятность того, что он съел картофель или колбасу, была бы меньше, чем если бы он прибавил в весе.
Роберт Джонс
Очевидно, что этот человек мог бы вместо этого съесть что-то еще, и, чтобы еще больше запутать проблему, возможно, это было и в туалете, поэтому совершенно очевидно, что нужно быть готовым искать объяснения в другом месте.
Роберт Джонс
@RobertJones, пример, который я привел в классе, был «умным» и «спортивным» в качестве критерия приема.
GWG
1
Насколько я понимаю, психическое и физическое состояние обычно считаются взаимосвязанными.
Роберт Джонс
26

Я думаю, что ваша интуиция в порядке, но ваше понимание «объяснения» неверно.

В статье вы ссылались на

«Объяснение» - это общая схема рассуждений, в которой подтверждение одной причины наблюдаемого или предполагаемого события уменьшает необходимость вызывать альтернативные причины.

(выделение добавлено)

Это сильно отличается от вашего:

Я использую «объяснить» рассуждение, если имеет место, один из P ( A ) или P ( B ) возрастает, а другой уменьшается , так как я не нужно альтернативные причины , чтобы объяснить , почему С произошло.CP(A)P(B)C

Вам не просто нужен чтобы это произошло, это также должно быть объяснено подтверждением A или B, прежде чем вы уменьшите вероятность другого возможного объяснения.CAB

BCCP(A|C)P(B|C)P(A)P(B) соответственно, согласно ответу @ Glen_b.

Питер Эллис
источник
+1 за пару других ответов, но я думаю, что акцент не сделан на том, что я считаю ошибочным чтением ОП «объяснений».
Питер Эллис
+1: кратко и точно. Возможно, вы также захотите указать, что OP также может отсутствовать, что A и B должны быть причинами C.
Нейл Г.
5

AB

P(A|C)=P(C|A)P(A)P(C)P(B|C)

P(C|A)P(C)P(C|B)P(C) ABC

C

P(A|C)P(B|C)=P(C|A)P(A)P(C|B)P(B)

CP(A)/P(B)C

Glen_b - Восстановить Монику
источник
2

ABP(CA)P(CB)

Zen
источник
2

Из связанного реферата становится ясно, что «объяснение в стороне» - это обсуждение механизма обучения, обычного способа мышления людей, а не формального метода логики или вероятности. Это человеческий способ мышления, который не является формально правильным, так же как индуктивное мышление не является формально правильным (в отличие от дедуктивного мышления). Поэтому я думаю, что формальная логика и вероятностные ответы очень хороши, но не применимы. (Обратите внимание, что реферат находится в контексте Machine Intelligence.)

Ваш пример гигантов очень хорош для этого. Мы верим, что землетрясения или гиганты могут вызвать дрожание земли. Но мы также считаем, что гиганты не существуют или крайне маловероятны. Земля дрожит. Мы не будем исследовать, ходит ли вокруг гигант, а скорее спросим, ​​произошло ли землетрясение. Услышав, что землетрясение действительно произошло, мы еще больше убеждены в том, что землетрясения являются адекватным объяснением сотрясений, и что гиганты еще более уверены в том, что они не существуют или, по крайней мере, еще более маловероятны.

Мы бы только согласились с тем, что гигант вызвал сотрясение земли только в том случае, если: 1) мы действительно стали свидетелями гиганта и были готовы поверить, что нас не обманывают и что наше предыдущее предположение, что гиганты крайне маловероятны или невозможны, было неверным, или 2) мы могли бы полностью исключить возможность землетрясения, а также исключить все возможности D, E, F, G, ... о которых мы раньше не думали, но которые сейчас кажутся более вероятными, чем гигантские.

В гигантском случае это имеет смысл. Этот механизм обучения (объяснение, которое мы находим вероятным, становится еще более вероятным и приводит к тому, что другие объяснения становятся менее вероятными, каждый раз, когда объяснение работает) в целом разумно, но и нас сожжет. Например, идеи о том, что Земля вращается вокруг Солнца или что язвы вызваны бактериями, с трудом набирают обороты из-за «объяснений», которые в этом случае мы бы назвали предвзятым подтверждением.

Тот факт, что реферат находится в настройке «Машинного интеллекта», также заставляет меня задуматься о том, чтобы обсуждать механизм обучения, обычно используемый людьми (и, я полагаю, другими животными), который мог бы принести пользу системам обучения, даже если он также может иметь серьезные недостатки. Сообщество ИИ годами пыталось использовать формальные системы, не приближаясь к человеческому интеллекту, и я считаю, что прагматика победила формализм, и «объяснение» - это то, что мы делаем, и поэтому ИИ должен делать.

Wayne
источник
1

Я думаю, что более простой способ думать об этом: если есть какая-либо переменная С (0<п(С)<1) так что возникновение С увеличивает вероятность обоих A а также В, тогда A а также Вне может быть независимым В вашем примере вы фактически выбрали переменные, которые вы интуитивно понимаете как зависимые, а не независимые. То есть событие, когда происходит землетрясение и гигантское топание вокруг, не являются независимыми, так как они оба, более вероятно, произойдут, когда пол трясется. Вот еще один пример: пусть C будет событием, когда идет дождь, и A будет событием, когда вы используете зонтик, и B, если вы будете носить дождевые сапоги. Ясно, что A и B не являются независимыми, потому что, когда возникает C, вы, скорее всего, будете носить как галоши, так и переноску и зонтик. Но если вы жили в районе, где никогда не было дождей, то А и В потенциально могли бы быть независимыми - ни зонтик, ни галоши не использовались в качестве дождевиков, поэтому, возможно, вы носите галоши в саду и используете зонт для ловли рыбы.

Вот доказательство: предположим, A а также В являются независимыми, а также условно независимыми С,

  1. P(AB)=P(A)P(B)=P(A|C)P(B|C)P(C)2 since A is independent of B
  2. P(AB)=P(AB|C)P(C)=P(A|C)P(B|C)P(C) since A is cond. independent of B given C.

It follows from 1 and 2 that P(C)=P(C)2 hence P(C)=0 or P(C)=1.

guest47
источник
I think the OP is wondering how to understand A and B being marginally independent but dependent conditional on C, not how to understand A and B being marginally dependent but independent conditional on C.
conjugateprior