Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
2.4.PODSTAWOWYALGORYTMODKRYWANIAREGUŁ
L2
zbiórczęsty
coca_cola,orzeszki
coca_cola,pieluszki
coca_cola,piwo
orzeszki,pieluszki
orzeszki,piwo
pieluszki,piwo
trans_id_list
1,4
2,5
2,4,5
2,5
2,4,5
2,5
wsparcie[%]
40
40
60
40
60
40
Wnastępnymkrokuwszystkie2-elementowezbioryczęstedzielimyna
rozłączneklasyzawierającezbioryczęstemającewspólny1-elementowypre-
fiks(wszystkiezbioryczęstewewnętrznieuporządkowaneleksykograficznie).
WwynikupodziałuzbioruL2otrzymujemy3klasyzbiorów.Dopierwszejkla-
synależązbioryczęste,którychpierwszymelementemjestzbiór{coca_cola},do
drugiejklasynależąte,którychpierwszymelementemjestzbiór{orzeszki},atrze-
ciąklasętworzązbioryczęste,którychpierwszymelementemjestzbiór{pieluszki}
(tab.2.6).
Tabela2060PodziałzbioruL2naklasyzbiorów
owspólnymprefiksie1-elementowym
prefiksklasy
{coca_cola}
{orzeszki}
{pieluszki}
zbiórczęsty
{coca_cola,orzeszki}
{coca_cola,pieluszki}
{coca_cola,piwo}
{orzeszki,pieluszki}
{orzeszki,piwo}
{pieluszki,piwo}
NastępniedlakażdejklasywykonujemyalgorytmEclat.Algorytmge-
nerujezbiorykandydujące,łączącwramachkażdejklasyparyzbiorówczę-
stych.Zbióridentyfikatorówtransakcjiwygenerowanegozbiorukandydującego
X,trans_id_list(X),otrzymanegoprzezpołączeniezbiorówczęstychXiiXj,jest
iloczynemlogicznymzbiorówidentyfikatorówtransakcjizbiorówXiiXj,tojest
trans_id_list(X)=trans_id_list(Xi)trans_id_list(Xj).Wsparciezbiorukan-
dydującegoXjestrównerozmiarowizbioruidentyfikatorówtransakcjizbioruX,
|trans_id_list(X)|.Wwynikudziałaniaalgorytmuotrzymujemycztery3-elemen-
towezbioryczęste.
L3
zbiórczęsty
coca_cola,orzeszki,pieluszki
coca_cola,orzeszki,piwo
coca_cola,pieluszki,piwo
orzeszki,pieluszki,piwo
trans_id_list
2,5
2,4,5
2,5
2,5
wsparcie[%]
40
60
40
40
45