Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
ROZDZIAŁ2.ODKRYWANIEASOCJACJI
Regułęasocjacyjnąnazywamybinarną,jeżeliwregulewystępujądane
(zmienne)binarne,toznaczydane,któremogąprzyjmowaćtylkodwiewartości:
1(true)lub0(false).Przykładembinarnejregułyasocjacyjnejjestreguła:
pieluszki=1piwo=1[wsparcie=5%,ufność=75%].
(2.2)
Binarneregułyasocjacyjnereprezentują,najogólniejmówiąc,współwystępowa-
niedanych.Reguła(2.2),wywiedzionawramachanalizykoszykazakupówklien-
tówsupermarketu,stwierdza,żeproduktpieluszkiczęstowystępujewkoszykach
klientówłączniezproduktempiwo.Przedstawionąwregule(2.2)notację:
X=1Y=1[wsparcie=5%,ufność=75%]
możnauprościćdopostaci:
XY
[wsparcie=5%,ufność=75%],
(2.3)
(2.4)
gdyżtransformacjazjednejnotacjidodrugiejjestjednoznaczna.Łatwozatem
zauważyć,żereguła(2.1)jestrównieżprzykładembinarnejregułyasocjacyjnej.
Regułęasocjacyjnąnazywamyilościową,jeżeliwystępującewniejdaneto
daneciągłei/lubkategoryczne.Przykłademilościowejregułyasocjacyjnejjestre-
guła:
wiek=’30…40’wykształcenie=’średnie’dochód=’500…800’
[wsparcie=5%,ufność=75%].(2.5)
Ilościoweregułyasocjacyjnereprezentują,najogólniejmówiąc,współwystępowa-
niewartościniektórychdanych.Reguła(2.5),wywiedzionazanalizydanychoso-
bowych,stwierdza,żejeżeliwiekpracownikanależydoprzedziału[30,40]ipra-
cownikmawykształcenieśrednie,toczęstojegodochódmiesięcznykształtujesię
pomiędzy500a800.Atrybutywiekorazdochódatrybutamiciągłymi,nato-
miastatrybutwykształceniejestatrybutemkategorycznym.Wprocesieodkrywa-
niailościowychregułasocjacyjnychatrybutyciągłepodlegajądyskretyzacji.Stąd
wregule(2.5)wartościąatrybutuwiekorazdochódjestpewienprzedziałwartości.
Wymiarowośćprzetwarzanychdanych.Zpunktuwidzeniawymiarowościprze-
twarzanychdanychwyróżniamydwarodzajeregułasocjacyjnych:
(1)jednowymiaroweregułyasocjacyjne(ang.single-dimensionalassociation
rules);
(2)wielowymiaroweregułyasocjacyjne(ang.multidimensionalassociation
rules).
Regułęasocjacyjnąnazywamyjednowymiarową,jeżeliwystępującewniej
danereprezentująsamądziedzinęwartości.Przykłademjednowymiarowejre-
gułyasocjacyjnejjestreguła:
produkt=’pieluszki’produkt=’piwo’[wsparcie=5%,ufność=75%].
(2.6)
12