Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
ROZDZIAŁ2.ODKRYWANIEASOCJACJI
grupyklientów.Zdrugiejstronyregułyowysokimwsparciunajczęściejmało
interesującedlaużytkowników,gdyżzewzględunaswojąpowszechnośćużyt-
kownikomdobrzeznaneiniewnosząniczegonowegodoichwiedzyoświecie.
Ufnośćokreśla,naileodkrytaregułaasocjacyjnajestnpewna”inprzewidywalna”.
Regułyomałejufnościmałowiarygodne,natomiastregułycharakteryzującesię
dużąufnościąnprawiepewne”.Miaraufności,wprzeciwieństwiedowsparcia,
jestasymetrycznawzględemzbiorówstanowiącychpoprzednikinastępnikreguły
wtymsensie,żenajczęściejufność(XY)/=ufność(YX).
Sformułowanieproblemuodkrywaniabinarnychregułasocjacyjnych
Problemodkrywaniabinarnychregułasocjacyjnychmożnasformułowaćnastępu-
jąco.
DanyjestzbiórtransakcjiD.Celemprocesuodkrywaniabinarnychregułaso-
cjacyjnychjestznalezieniewszystkichsilnychbinarnychregułasocjacyjnych,to
jesttakichbinarnychregułasocjacyjnych,którychwsparciejestwiększelubrów-
neminsupiktórychufnośćjestwiększalubrównaminconf.
Przykład202(binarneregułyasocjacyjne)
Rozważmyuproszczonyprzykładbazydanychsupermarketuprzedstawionej
wtab.2.3,zawierającejinformacjeotransakcjachzrealizowanychprzezklientów
supermarketu.Każdatransakcjaskładasięzezbioruproduktów.Dlakażdegoza-
kupionegoproduktujestpamiętanawbaziedanychliczbasprzedanychsztuktego
produktuorazjegocena.Dodatkowo,zkażdątransakcjąklientajestzwiązanyuni-
kalnyidentyfikatortransakcjiorazdatarealizacjitransakcji,tojestdatazakupu.
Zauważmy,żeprzedstawionabazadanychzawieraidentycznyzbiórtransakcjijak
tenprzedstawionywtablicyobserwacjizawartejwtab.2.2.
Tabela2030Przykładowabazadanychsupermarketu
trans_id
1
1
2
2
2
3
4
4
4
5
5
5
produkt
coca_cola
orzeszki
piwo
orzeszki
pieluszki
coca_cola
coca_cola
piwo
orzeszki
piwo
orzeszki
pieluszki
data
02/22/98
02/22/98
02/22/98
02/22/98
02/22/98
02/23/98
02/24/98
02/24/98
02/24/98
02/24/98
02/24/98
02/24/98
liczba
10
10
6
3
4
1
1
6
2
4
2
4
cena
0,20
0,99
0,49
0,99
1,49
0,20
0,20
0,49
0,99
0,49
0,99
1,49
18