У этой величины, связанной с независимостью, есть имя?

18

Очевидно, события A и B независимы, если Pr = Pr Pr . Давайте определим связанное количество Q:( A ) ( B )(AB)(A)(B)

QPr(AB)Pr(A)Pr(B)

Таким образом, A и B независимы тогда и только тогда, когда Q = 1 (при условии, что знаменатель ненулевой). У Q есть имя? Я чувствую, что это относится к некоторой элементарной концепции, которая ускользает от меня прямо сейчас, и что я буду чувствовать себя довольно глупо, даже если спросить это.

Майкл МакГоуэн
источник
1
Я думаю, что это зависит от контекста. Обратите внимание, что так что \ Pr (A | B) = Q \ Pr (A) и \ Pr (B | A) = Q \ Pr (B) . Эта форма имеет больше вкуса байесовского вывода.
Q=Pr(A|B)Pr(A)=Pr(B|A)Pr(B)
Pr(A|B)=QPr(A)Pr(B|A)=QPr(B)
vqv
Этот SE мог бы сделать с некоторыми более "довольно глупыми" вопросами. Это очень пугающе, даже для тех, кто любит базовую статистику уровня старшекурсников. +1 за глупость
naught101
1
Перейти на "Migdal вероятность";)
побитовое
1
@PiotrMigdal Спасибо за любезное предложение. Я бы предпочел увидеть ваш собственный ответ. Может быть, в том числе, как вы пришли к этому вопросу и как это количество может быть полезным.

Ответы:

14

Это наблюдается к ожидаемому отношению (сокращение: o / e ).

Цитирую ответ на вопрос о совместной вероятности, деленный на произведение вероятностей в Math.SE (на что указывает прокрастинатор ):

Тогда, по крайней мере, в литературе по окружающей среде, медицине и наукам о жизни P (A∩B) / (P (A) P (B)) называют наблюдаемым отношением к ожидаемому (сокращение o / e). Идея состоит в том, что числитель - это фактическая вероятность A∩B, а знаменатель - это то, что было бы, если бы A и B были независимы.

Петр Мигдаль
источник
11

Я думаю, что вы ищете Lift(или улучшение). Подъем - это отношение вероятности того, что A и B встречаются вместе, к кратному двух отдельных вероятностей для A и B. Он используется для интерпретации важности правила в интеллектуальном анализе правил ассоциации . Подъем - это способ измерить, насколько лучше модель по сравнению с эталоном, и он определяется как достоверность, деленная на эталон, где любое значение, превышающее одно, предполагает, что в правиле есть некоторая полезность. Смотрите эту страницу также в качестве другого примера.

Джордж Донтас
источник
(+1) Хороший ответ. Arules виньетка также есть некоторые хорошие ссылки о лифте .
хл
Спасибо, это, наверное, где я видел это раньше. Я думаю, я видел подъем с немного другим определением в контексте машинного обучения, хотя раньше ... Я ненавижу, что иногда отсутствует консенсус по определению, в то время как в других случаях есть много терминов для того же понятия.
Майкл МакГоуэн
8

В анализе соответствия люди называют одну из этих величин коэффициентом непредвиденных обстоятельств в контексте перекрестных таблиц. Расстояния, кратные нескольким таким соотношениям от 1, - это то, что визуализируют болты. Смотри, например, Greenacre (1993) гл.13.

Люди старой школы машинного обучения называют журнал этого количества точечной взаимной информацией . См., Например, Manning and Schütze (1999), с.66.

conjugateprior
источник
Спасибо за указание на «коэффициент непредвиденных обстоятельств» и «точечная взаимная информация».
Петр Мигдал
0

Возможно, вы спрашиваете, как эта величина связана с коэффициентом шансов, как величина для измерения независимости.

Я думаю, что вы ищете "Отношение к статистической независимости". Смотрите http://en.wikipedia.org/wiki/Odds_ratio

Кеннет Кабрера
источник