Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
Słabestrony
KNNsłabosobieradzi,gdyliczbaobserwacjiicechrośnie.AlgorytmKNNstajesię
nieefektywnypodwzględemobliczeniowymwtakiejzatłoczonej,wysokowymiarowej
przestrzeni,ponieważmusiobliczaćodległościodnowegopunktudowielupobliskich
oznakowanychpunktów,abyprzewidywaćoznakowania.Niemożepolegaćnawydaj-
nymmodeluzograniczonąliczbąparametrów,abydokonaćkoniecznychprognoz.
AlgorytmKNNjestteżbardzoczułynawybórliczbyk.Gdykbędziezbytniskie,KNN
możenadmierniedopasowywaćdane,agdykbędziezbytwysokie,KNNmożezbyt
małodopasowywaćdane.
Zastosowania
AlgorytmKNNjestczęstoużywanywsystemachpolecających,takichjaktedoprzewi-
dywaniazainteresowaniafilmami(Netfix),muzyką(Spotify),znajomymi(Facebook),
zdjęciami(Instagram),wyszukiwaniami(Google)izakupami(Amazon).Naprzykład
KNNmożeprzewidywać,cobędziesiępodobaćużytkownikowinapodstawietego,
colubiąpodobniużytkownicy(znanejakofltrowaniekolektywne)albocoużytkownik
lubiłwprzeszłości(znanejakofltrowanieopartenazawartości).
Metodyopartenadrzewach
Zamiastkorzystaćzmetodyliniowej,możemykazaćsztucznejinteligencjizbudować
drzewodecyzyjne,wktórymwszystkieprzypadkizostanąrozdzielonelubrozwarstwione
nawieleregionówwoparciuoposiadaneoznakowania.Pozakończeniutegopodziału
każdyregionodpowiadaokreślonejklasieoznakowania(dlaproblemówklasyfikacyj-
nych)lubzakresowiprzewidywanychwartości(dlaproblemówzwiązanychzregresją).
Tenprocesjestpodobnydoautomatycznegobudowaniazasadprzezsztucznąinteligencję
zwyraźnymcelempodejmowanialepszychdecyzjilubprzewidywań.
Pojedynczedrzewodecyzyjne
Najprostsząmetodąopartąnadrzewiejestpojedynczedrzewodecyzyjne,wktórymsztucz-
nainteligencjaprzechodzirazprzezdaneszkoleniowe,tworzyzasadypodziałudanych
woparciuooznakowaniaiwykorzystujetodrzewodoprzewidywaniadladanychznigdy
wcześniejniewidzianychzestawówweryfikacyjnychlubtestowych.Jednakżepojedyncze
drzewodecyzyjnezwyklesłaboradzisobiezuogólnianiemtego,czegonauczyłosiępod-
czasszkolenia,donigdywcześniejniewidzianychprzypadków,ponieważzwyklenadmier-
niedopasowujedaneszkoleniowepodczasswojejjedynejiteracjiszkolenia.
Grupowanietypubootstrap
Abypoprawićpojedynczedrzewodecyzyjne,możemywprowadzićgrupowanietypuboot-
strap(bootstrapaggregatingalbowskróciebagging),wktórymbierzemywielelosowych
próbekwystąpieńzdanychszkoleniowych,tworzymydrzewodecyzyjnedlakażdejpróbki,
anastępnieprzewidujemydanewyjściowedlakażdegowystąpienia,uśredniającprognozy
14
|
Rozdział1:Uczenienienadzorowanewekosystemieuczeniamaszynowego