Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
przypadkualgorytmnadmierniedopasowujedaneszkoleniowewyciągajączbytwiele
zszumuobecnegowdanychcodajebardzodużybłąduogólnienia.Innymisłowy,
algorytmzapamiętujedaneszkoleniowe,zamiastuczyćsię,jakuogólniaćzdobytąnaich
podstawiewiedzę2.
Abyrozwiązaćtenproblem,możemywprowadzićuczenienienadzorowanejakore-
gularyzator.Regularyzacjajestprocesemstosowanymwceluzmniejszeniazłożoności
algorytmuuczeniamaszynowego,pomagającmuprzechwytywaćprawdziweinformacje
wdanychbezdostosowywaniasięzbytniodoszumu.Wstępneszkolenienienadzorowa-
nejestjednąztakichformregularyzacji.Zamiastpodawaniapierwotnychdanychwej-
ściowychbezpośredniodoalgorytmuuczenianadzorowanego,możemypodawaćnowe
przedstawieniepierwotnychdanychwejściowych,którewygenerujemy.
Tonoweprzedstawienieoddajeistotęoryginalnychdanychprawdziwąwewnętrzną
strukturętracącpodrodzeczęśćmniejreprezentatywnegoszumu.Gdypodamytonowe
przedstawieniealgorytmowiuczenianadzorowanego,otrzymaonmniejszumu,przez
którymusiałbyprzebrnąćiprzechwyciwięcejsygnału(istotnychdanych),poprawiając
swójbłąduogólnienia.Zajmiemysięwyodrębnianiemcechwrozdziale7.
Przekleństwowymiarowości
Nawetprzyobecnychpostępachwzakresiemocyobliczeniowej,algorytmomuczeniama-
szynowegotrudnojestobsługiwaćogromnezbiorydanych.Ogólnierzeczbiorąc,doda-
waniedalszychelementówniejestzbytproblematyczne,ponieważmożemyzrównoleglić
wykonywaneoperacje,wykorzystującnowoczesnerozwiązaniatypumap-reduce,takiejak
Spark.Imwięcejjednakmamycech,tymszkoleniestajesiętrudniejsze.
Wprzestrzeniobardzodużejliczbiewymiarówalgorytmynadzorowanemusząna-
uczyćsię,jakoddzielaćpunktyibudowaćaproksymacjęfunkcji,abypodejmowaćdobre
decyzje.Gdycechybardzoliczne,towyszukiwaniestajesiębardzokosztownezarówno
zpunktuwidzeniaczasu,jakiobliczeń.Wniektórychprzypadkachznalezieniedobrego
rozwiązaniawystarczającoszybkomożebyćniemożliwe.
Tenproblemjestznanyjakoprzekleństwowymiarowości,auczenienienadzorowane
jestdobrzeprzystosowanedoradzeniasobieznim.Dziękiredukcjiwymiarowościmo-
żemyznaleźćnajbardziejistotnecechyworyginalnymzestawiecech,zmniejszyćliczbę
wymiarówdołatwiejszejdoogarnięcia,tracącprzytymbardzomałoistotnychinfor-
macji,anastępniezastosowaćalgorytmynadzorowane,abyskuteczniejprzeprowadzać
wyszukiwaniedobrejaproksymacjifunkcji.Redukcjęwymiarowościbędziemyomawiać
wrozdziale3.
2
Zbytmałedopasowaniejestinnymproblemem,którymożewystąpićprzybudowaniuaplikacjiucze-
niamaszynowego,alejestłatwiejszedorozwiązania.Zbytmałedopasowaniewystępuje,ponieważ
modeljestzbytprostyalgorytmniemożezbudowaćwystarczającozłożonegoprzybliżeniafunkcji,
abypodejmowaćdobredecyzjezwiązanezdanymzadaniem.Abytorozwiązać,możemyzwiększyć
rozmiaryalgorytmu(dodaćwięcejparametrów,przeprowadzićwięcejiteracjiszkolenia,itd.)albo
zastosowaćbardziejskomplikowanyalgorytmuczeniamaszynowego.
Używanieuczenianienadzorowanegodopoprawyrozwiązańwykorzystującychuczeniemaszynowe|
9