Treść książki
Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
28
1.Analizaskupień
Czasemzamiastprostejnormalizacjistosujesięstandaryzację,tzn.orygi-
nalnawartośćxilzastępowanajestilorazem(xil−Pl)/σl,gdziePl,σlto
wartośćśredniaiodchyleniestandardowel-tejcechy.
1.2.1.2.OdległośćMahalanobisa
Definiującodległość(1.3),zakładasię,żecechyniesązesobąskorelowane.
Jeżelizałożenietoniejestspełnione,stosujesięodległośćMahalanobisa
dΣ(Xi,Xj)=J(Xi−Xj)TΣ11(Xi−Xj)
(1.7)
będącąwariantemodległości(1.2),wktórejzaWprzyjętoodwrotnośćma-
cierzykowariancji.Macierzkowariancjiobliczamynastępująco
Σ=
m
1
Σ
il1
m
(Xi−u)(Xi−u)
T,
przyczym
u=
m
1
Σ
il1
m
Xi
(1.8)
(1.9)
jestwektoremwartościśrednich.
Zauważmy,że:
(a)Stosującprzekształcenieyi=Σ11/2XisprowadzamyodległośćMahala-
nobisadΣ(Xi,Xj)doodległościeuklidesowejmiędzyprzekształconymi
wektorami,tzn.dΣ(Xi,Xj)="yi−yj".
(b)Jeżelicechysąniezależne,wówczasmacierzkowariancjijestmacierzą
diagonalną:niezeroweelementysąrównewariancjiposzczególnychcech.
WtymwypadkuodległośćMahalanobisastajesięważonąodległością
euklidesowąpostaci
dS(Xi,Xj)=
r
|
|
¶
Σ
ll1
n
(
xil−xjl
sl
)
2
,
gdziesltoodchyleniestandardowepomiarówl-tejcechy.
(1.10)
OdległośćMahalanobisajestużytecznadoidentyfikacjitzw.outlierów
(obserwacjinietypowych).Szeregjejwłasnościomówionowtutorialu[255].
1.2.1.3.DywergencjaBregmana
Omawianedotychczasodległości,czylimiaryodmienności,mającharakter
różnicowy:d(X,y)=ϕ(X−y),gdzieϕ:Rn→Rjestodpowiedniodobraną