1 : , В , С , Е 2 : , С , Д , Е 3 : В , С , Е 4 : , С , Д , Е 5 : С , Д , E 6 : A , D , E
Я хочу узнать максимальные частые наборы предметов и закрытые частые наборы предметов .
- Частое множество элементов является максимальным, если оно не имеет частых надмножеств.
- Частое множество элементов X ∈ F замкнуто, если у него нет надмножества с той же частотой
Поэтому я посчитал вхождение каждого набора предметов.
{A} = 4 ; {B} = 2 ; {C} = 5 ; {D} = 4 ; {E} = 6
{A,B} = 1; {A,C} = 3; {A,D} = 3; {A,E} = 4; {B,C} = 2;
{B,D} = 0; {B,E} = 2; {C,D} = 3; {C,E} = 5; {D,E} = 3
{A,B,C} = 1; {A,B,D} = 0; {A,B,E} = 1; {A,C,D} = 2; {A,C,E} = 3;
{A,D,E} = 3; {B,C,D} = 0; {B,C,E} = 2; {C,D,E} = 3
{A,B,C,D} = 0; {A,B,C,E} = 1; {B,C,D,E} = 0
Min_Support установлен на // Очень важно. Спасибо Штеффен за напоминание об этом.
Максимально ли = ?
Имеет ли закрыт = ?
data-mining
dataset
association-rules
Майк Джон
источник
источник
Вы можете прочитать об алгоритме APRIORI. Это позволяет избежать ненужных наборов элементов путем умного сокращения.
Б не частый, удали.
Создайте и посчитайте наборы из двух предметов (никакой магии пока нет, кроме
B
уже вышедшей)Все это часто (обратите внимание, что все, что было,
B
не может быть частым!)Теперь используйте префиксное правило. ТОЛЬКО объединяйте наборы предметов, начиная с одинаковых n-1 предметов. Удалите все, где любое подмножество встречается не часто. Подсчитайте оставшиеся наборы предметов.
Обратите внимание, что
{A,C,D}
это не часто. Поскольку нет общего префикса, не может быть большего частого набора элементов!Обратите внимание, как много меньше работы я сделал!
Для максимальных / закрытых наборов элементов, проверьте наборы / супернаборы.
Обратите внимание, что, например
{E}=6
, и{A,E}=4
.{E}
является подмножеством, но имеет более высокую поддержку, т.е. оно закрыто, но не максимально.{A}
не является ни тем, ни другим, поскольку не имеет более высокой поддержки, чем{A,E}
, то есть является избыточным .источник