Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
Pouruchomieniutegokoduuzyskaliśmyprawie9%poprawęwprzypadkumodelu,który
używałtylkojednejcechywejściowej.Biorącpoduwagęliczbęcechwtypowymmodelu
uczeniamaszynowego,oszczędnościmogąsięsumować.
Innymważnympowodemskalowaniajestto,żepewnealgorytmyitechnikiuczenia
maszynowegobardzowrażliwenawzględnemodułyróżnychcech.Naprzykładalgo-
rytmklastrowaniak-średnich,któryużywaodległościeuklidesowejjakomiaryprzybli-
żenia,dojdziedopoleganiamocnonacechachzwiększymimodułami.Brakskalowania
wpływatakżenaskutecznośćregularyzacjiL1lubL2,ponieważmodułwagdlacechyza-
leżyodmodułuwartościtejcechy,azatemregularyzacjabędziewpływaćróżnienaróżne
cechy.Dziękiskalowaniuwszystkichcech,abyleżałymiędzy[1,1]zapewniamy,żenie
mazbytwielkiejróżnicymiędzywzględnymimodułamiróżnychcech.
Skalowanieliniowe
Powszechniestosowaneczteryformyskalowania:
Skalowaniemin-max
Wartośćliczbowajestskalowanaliniowo,abyminimalnawartość,którąmożnaprzyjąć
nawejściu,byłaskalowanado1,amożliwamaksymalnawartośćdo1:
x1-scaled:(2*x1-max-x1-min-x1)/(max-x1-min-x1)
Problemzeskalowaniemmin-maxpoleganatym,żemaksymalnaiminimalnawar-
tość(max_x1imin_x1)musząbyćoszacowanenapodstawiezbioruuczącego,aczęsto
towartościodstające.Rzeczywistedaneczęstokurcząsiędobardzomałegozakresu
wpaśmie[1,1].
Przycinanie(wpołączeniuzeskalowaniemmin-max)
Pomagarozwiązaćproblemzelementamiodstającymiprzezużycienrozsądnych”war-
tościzamiastszacowaniaminimumimaksimumzezbioruuczącego.Wartośćliczbowa
jestliniowoskalowanamiędzydwiemarozsądnymigranicami,anastępnieprzycinana
dozakresu[1,1].Wefekcieelementyodstającetraktowanejako1lub1.
StandaryzacjaZ
Rozwiązujeproblemzelementamiodstającymibezwymaganiawcześniejszejwiedzy
orozsądnymzakresie,dziękilinowemuskalowaniuwejściaprzyużyciuśredniejiod-
chyleniastandardowego,oszacowanychdlazbioruuczącego:
x1-scaled:(x1-mean-x1)/stddev-x1
Nazwametodyodzwierciedlafakt,żeskalowanawartośćmaśredniąrównązeroijest
normalizowanaprzezodchyleniestandardowe,takabymiałajednostkowąwariancję
nazbiorzeuczącym.Skalowanawartośćjestnieograniczona,alemieścisięwprze-
dziale[1,1]większośćrazy(67%,jeśliużywamyrozkładunormalnego).Wartości
pozatymzakresemcorazrzadsze,gdyzwiększasięichwartośćbezwzględna,ale
nadalobecne.
Prostereprezentacjedanych
|
23