Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
18
Rozdział2.Dane
związkumiędzynimi.Wartościąokreślającąowepowiązaniedwóch
obiektówjeststopieńpodobieństwa[37].Podobieństwoomówionejest
równieżw[201].Analizującobiektywoparciuometodygrupowania
czyklasyfikacjinależyzwrócićuwagę,podstawąichdziałaniajest
zdefiniowanie
podobieństwa.to:
funkcji
bliskości
obiektów
lub
inaczej
miary
ůmiaryodległości,miarypodobieństw,któreową"bliskość"
wyznaczająwyłącznienapodstawiedanychoobiektach;
ůmiaryasocjacji,miarykoincydencji,któreużywająinformacji
oinnychobiektach,ichotoczeniuczyteżśrodowisku.
Każdyrodzajmiarydefiniowanywoparciuojednązwyżejwymienionych
skalspełniawarunkimetrykipodanejwDef.2.1.
Definicja2.1NiechXbędziezbioremobiektów,zaśfunkcja
d:X×X−→R+będziemiarąodległościmiędzydwomaobiektami.
Wówczasfunkcjędnazywamymiarą,inaczejmetryką,jeżelidlakażdej
paryobiektówx,yX,x̸=yspełnionenastępującewarunki:
d(x,y)=0x=y
d(x,y)0
d(x,y)=d(x,y)
d(x,y)d(x,y)+d(y,x)
2.2.1
Miaryodległościipodobieństwadlacech
ilościowych
(2.3)
Najbardziejpopularnąmiarąumożliwiającąporównanieobiektów
o
cechachilościowychjestmiaraodległościeuklidesowej(ang.
Euclideandistance)zdefiniowanarównaniem(2.4).Innąpopularną
miarąjestodległośćMinkowskiego(ang.Minkowskimetric)(2.5)oraz
jejszczególneuogólnieniatakiejakodległośćmiejska,zwanamiarą
taksówkowąlubodległościąManhattan(2.6),miaraCzebyszewa(ang.
Chebychevdistancemetric)(2.7).Wprzypadkutychodległościmogą
zaistniećdwietrudnesytuacje.Popierwszewrazzewzrostem
wymiarowościniewidocznastajesięróżnicamiędzybliskimiidalekimi
punktami
w
danej
przestrzeni.
Po
drugie
wartość
odległości
Minkowskiegozawierawartościdominowaneprzezcechyznajwiększą
rozpiętością.