Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
40
Rozdział1.Probabilistycznemetodyklasyfikacyjne
Siatkapunktów(λ,γ)nałożonanajednostkowykwadratzawieraza-
zwyczajod25do50różnychkombinacjiparametrówregularyzującychλ
iγ.Tenproblemdwuparametrowejoptymalizacjibędziewymagałnadmier-
nychobliczeń,jeżelizostaniezaimplementowanywsposóbnaiwny.Jeżeli
przezNpoznaczymyliczbępunktównasiatce,towtejprocedurzemusimy
wykonaćNpnobliczeńwskaźnikówdyskryminacyjnych.
JednakżeFriedmanpodałwzoryprzystosowanedoobliczeńregularyzo-
wanegoestymatoramacierzykowariancjiijegoodwrotnościwprzypadku,
gdyzpróbyuczącejsukcesywnieusuwamypojedynczeiróżneobserwacje
(takjaktosiędziejewmetodziesprawdzaniakrzyżowego).
PrzewagametodyRDAnadmetodąLDAiQDArośniewrazzewzro-
stemwymiaruprzestrzenicech.Ponadtoregularyzacjaokazujesiępotrzeb-
na,jeśliliczebnościpróbekuczącychwgrupachmałewporównaniuzwy-
miaremprzestrzenicech.
Pewnąniedogodnościąjestfakt,żeoptymalnypoziombłędujestczęsto
osiąganydlakilkuróżnychpunktów(λ,γ)nasiatce.Wtakimprzypadku
wybieramytakipunkt,abydlanajwiększejdopuszczalnejwartościλwybrać
największąwartośćγ.Dodatkowookazujesię,żewprzeciwieństwiedoLDA
orazQDAmetodaRDAniejestniezmienniczazewzględunaskalowanie
danych.Tenbrakniezmienniczościjestspowodowanywprowadzeniempara-
metruγ.Jednak,jakwykazująbadania,usunięcietegoparametruzmodelu
prowadzidospadkuefektywnościmetodyRDA.
ZainteresowanychCzytelnikówodsyłamydooryginalnejpracyFriedma-
na(1989).
Przykład1.4.
Danezaczerpniętezestrony501monografiiJohnsonaiWicherna(1982)za-
wierająwynikidwóchtestówwykonanychnagrupien=85kandydatówdo
szkołyhandlowej,którzyzostalizaklasyfikowanidotrzechgrup:przyjęci,nie-
przyjęciiprzypadkiwątpliweoliczebnościachodpowiednion1=31,n2=28,
n3=26.
Wektorywartościśrednichimacierzekowariancjizpróbdlatychtrzechgrup
równe:
X1=(3.4,561.2)
¯
!,
X2=(2.5,447.1)
¯
!,
X3=(3.0,446.2)
¯
!,
S1=0.040.28
0.28461.25,S2=0.031.19
1.193891.25,
S3=0.035.40
5.402246.90.