Treść książki
Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
1.2.Miarypodobieństwa/odmienności
27
dmax
p,n−dmin
p,nrośnieproporcjonalniedon1/p11/2bezwzględunarozkładda-
nych[4].Własnośćtaodgrywadominującąrolę,gdyn>15.Wszczególności
(por.rys.1.4(a))
dmax
p,n−dmin
p,n→
(
I
I
4
C1√n,jeżelip=1
C2,
jeżelip=2
I
I
l
0,
jeżelip>3.
Rysunek1.4.WpływparametrupnawłasnościodległościMinkowskiego.
(a)Przeciętnewartościróżnicymiędzynajbardziejodległymipunktamize
100-elementowegozbioruwzależnościodliczbywymiarów,niwartościwykładni-
(a)
(b)
kap.(b)Okręgijednostkowedlap<1
Abyzapobiectemuzjawisku,Aggarwal,HinnenburgiKeimzapropono-
waliw[4]stosowanieułamkowychodległościMinkowskiegozparametrem
p∈(0,1]–por.rys.1.4(b).Jednakwtymprzypadku(1.3)przestajebyć
odległością,gdyżniejestspełnionywarunektrójkąta.Jeżelinp.X=(0,0),
y=(1,1)iz=(1,0),to
d(X,y)=21/p>d(X,z)+d(y,z)=1+1.
Kolejnym,nietakjednakkrytycznymproblememjestto,żewartość
odległościMinkowskiegodominowanajestprzeztecechy,któremierzo-
nesąnaskalionajwiększejrozpiętości.Wadytejmożnałatwouniknąć,
wprowadzającważonąodległość,tzn.zastępująckażdyskładnikrównania
(1.3)wyrażeniemωl(xil−xjl)p,gdziewljestwagąrównąnp.odwrotności
odchyleniastandardowegol-tejcechylubodwrotnościzakresuzmienności
l-tejcechy.Odpowiednikiemtegodrugiegowariantujestwstępnanormali-
zacjadanychzapewniająca,żexil∈[0,1]dlakażdejcechyl=1,
...,n.
Jesttonaogółrutynowaprocedurapoprzedzającawłaściwąanalizędanych.