Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
20
Rozdział2.Dane
2.2.2
Miary
odległości
i
podobieństwa
dla
jakościowych,imieszanych
cech
Wprzypadkuporównaniaobiektówocechachjakościowychnajczęściej
stosowanąmiarąjestodległośćHamminga.Biorączaśpoduwagędane
mieszane,dlaktórychczęśćcechmacharakterjakościowyaczęść
ilościowystosowanyjesttzw.współczynnikGowera[92,217].
Współczynniktenmożnazdefiniowaćjakoważonąsumęcząstkowych
wagwpostaci(2.11).
dGowerł(xi,xj)=
Σ
n
i=1w(ź,j,k)δ(ź,j,k)
Σ
n
i=1w(ź,j,k)
(2.11)
Dla
cech
nominalnych
(jakościowych)
przyjmuje
się,
że
współczynnikiodmiennościδ(ź,j,k)wyznaczanedlakażdejcechy
obiektówxiorazxjbędąprzyjmowaływartość1,jeślijejwartość
wobuobiektachbędzieróżna.Wprzeciwnymprzypadkuδ(ź,j,k)=0.
Dlaobiektówocechachilościowychzprzedziału[xmin
k
,xmłx
k
]wartość
cząstkowychwspółczynnikówδ(ź,j,k)wyznaczamyzgodniez(2.12).
Wagiw(ź,j,k)przyjmująwartości0lub1.JakpodajeWierzchoń
iKłopotekw[217],atakżeKoronacki[92]wprzypadku,gdymamy
do
czynienia
z
asymetryczną
cechą
binarną,
dla
jednego
zporównywanychobiektówlubjeślijednazwartościxiklubxjkma
wagęw(ź,j,k)równą0.
δ(ź,j,k)=
xmłx
|xikxjk|
k
xmin
k
miaraCanberra
dCłnberrł(x,y)=
Σ
i=1
n
|
xiyi
xi+yi
|
MiaraSebestyena
dS(x,y)=(xi,xj)=(xixj)
TW(xixj)
W=
(
|
|
|
\
w10...0
0w2...0
00...wm
.
.
.
.
.
.
.
\
|
|
|
)
.
.
...
(2.12)
(2.13)
(2.14)
gdzied(xi,xj)toodległośćmiędzyobiektamixiorazxj,zaśxikto
wartośćk-tejcechydlaź-tejjednostkiwzbiorze.