Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
16
Przedstawieniupodstawmetodologicznychuczeniastatystycznegopoświęcony
zostałrozdziałpiąty.Kluczowympojęciemuczeniastatystycznego,odróżniającym
jeodwnioskowaniastatystycznego,jestpojęciezbioruuczącego,czylizestawu
pardanychwykorzystywanychwprocesieuczenia.Zbióruczącyskładasięzpar
danychwejście–wyjściedlaobiektówpochodzącychzokreślonejdziedziny,opisa-
nychzapomocąpewnychcech.Wklasycznymprzypadkujesttozbiórdanych
dotyczącychrealizacjiwartościpewnejzmiennejdwuwymiarowej,będącypróbą
zpopulacji.Wkategoriachuczeniastatystycznegojesttopojęcieszersze,obejmu-
jącezarównopróbęlosową,jakinielosową,możetobyćzbiórtypubigdatalub
wynikibadaniawyczerpującego,dotyczącegocałejpopulacji.
Funkcjałączącatakżemabardzoogólnycharakter.Możeonaprzyjmować
określonąisparametryzowanąpostaćanalityczną,byćfunkcjąniesparametryzo-
waną,możeteżbyćtraktowanatylkojakoczarnaskrzynka,któradajemożliwie
dokładneprognozyzmiennejwyjściowej.Wujęciuuczeniastatystycznegofunkcja
łączącamaowieleszerszycharakterniżfunkcjaregresjiczyfunkcjadyskrymi-
nacyjnawklasycznejstatystyce.Funkcjęłączącąaproksymujemynapodstawie
dostępnegozbioruuczącego.Efektywnośćipraktycznąużytecznośćfunkcji
regresji,estymowanejzdanych,oceniamy,badającistotnośćjejparametrów
orazmiarydobrocidopasowaniadodanychzpróby.Zkoleidokonującwyboru
najlepszejfunkcjiłączącejwuczeniustatystycznym,efektywnośćnajczęściej
mierzymyśredniokwadratowymbłędemszacunkuliczonymnazbiorzetestowym,
czyliniezaangażowanymwprocesuczenia.
Wprocesieuczeniastatystycznegoistotnymproblememjestposzukiwanie
kompromisupomiędzydokładnościąpredykcjiainterpretacjąmodeluuczenia.
Metodyuczeniastatystycznegoproponująfunkcjełączące,bardziejlubmniej
elastyczniedopasowującesiędodanychzezbioruuczącego.Wskazujesię,że
pomiędzyelastycznościąainterpretowalnościąmetoduczeniastatystycznegojest
wprzybliżeniuzależnośćodwrotnieproporcjonalna.Jeślicelemmetoduczenia
statystycznegojestdokonaniemożliwieprecyzyjnejpredykcji,tonależywybierać
możliwieelastycznąmetodęuczenia.Jeślizaśistotnajestinterpretacjapowiązań
pomiędzyzmiennąobjaśnianąazmiennymiobjaśniającymi,tonależywybierać
raczejklasycznemetody.
Zzarysowanychpowyżejprzesłanekzasaduczeniastatystycznegowyłania
sięnowy,bardziejuniwersalnyparadygmatbadaństatystycznychparadygmat
uczeniastatystycznego.Kluczowymjegoelementemjestzastąpieniepojęcia
próbylosowejpojęciemzbioruuczącego.Wdobieszybkichkomputerówodużej
mocywykonywanieobliczeństatystycznychniejestjużproblemem.Jednakże,
wbrewpotocznemurozumieniumetoduczeniastatycznegojakoużytecznych
tylkowprzypadkuanalizydużychzbiorówdanych,metodytemogąbyćtakże
efektywnymnarzędziemanalizyniezbytlicznychzbiorówdanych.Paradygmat