Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
28
1.Analizaskupień
Czasemzamiastprostejnormalizacjistosujesięstandaryzację,tzn.orygi-
nalnawartośćxilzastępowanajestilorazem(xilPl)l,gdziePl,σlto
wartośćśredniaiodchyleniestandardowel-tejcechy.
1.2.1.2.OdległośćMahalanobisa
Definiującodległość(1.3),zakładasię,żecechyniezesobąskorelowane.
Jeżelizałożenietoniejestspełnione,stosujesięodległośćMahalanobisa
dΣ(Xi,Xj)=J(XiXj)TΣ11(XiXj)
(1.7)
będącąwariantemodległości(1.2),wktórejzaWprzyjętoodwrotnośćma-
cierzykowariancji.Macierzkowariancjiobliczamynastępująco
Σ=
m
1
Σ
il1
m
(Xiu)(Xiu)
T,
przyczym
u=
m
1
Σ
il1
m
Xi
(1.8)
(1.9)
jestwektoremwartościśrednich.
Zauważmy,że:
(a)Stosującprzekształcenieyi=Σ11/2XisprowadzamyodległośćMahala-
nobisadΣ(Xi,Xj)doodległościeuklidesowejmiędzyprzekształconymi
wektorami,tzn.dΣ(Xi,Xj)="yiyj".
(b)Jeżelicechyniezależne,wówczasmacierzkowariancjijestmacierzą
diagonalną:niezeroweelementyrównewariancjiposzczególnychcech.
WtymwypadkuodległośćMahalanobisastajesięważonąodległością
euklidesowąpostaci
dS(Xi,Xj)=
r
|
|
Σ
ll1
n
(
xilxjl
sl
)
2
,
gdziesltoodchyleniestandardowepomiarówl-tejcechy.
(1.10)
OdległośćMahalanobisajestużytecznadoidentyfikacjitzw.outlierów
(obserwacjinietypowych).Szeregjejwłasnościomówionowtutorialu[255].
1.2.1.3.DywergencjaBregmana
Omawianedotychczasodległości,czylimiaryodmienności,mającharakter
różnicowy:d(X,y)=ϕ(Xy),gdzieϕ:RnRjestodpowiedniodobraną