Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
1.2.Zadanieklasyfikacjinadzorowanej
7
czylidokonującąodwzorowaniaprzestrzenireprezentacjiEwzbiórdecyzji,nazywamy
klasyfikatorem,aprocesprzypisywaniaetykietyklasowej?(x)danejreprezentacjix
pewnegoobiektuklasyfikacjąlubczasamipredykcją.Odwzorowanie?maumożli-
wićprzypisywaniereprezentacjixdowolnegoobiektuozezbioruOdojednejzcklas
lubniepodejmowaniedecyzjioklasiewsytuacjachwątpliwych.Celemjestznalezienie
takiegoklasyfikatora?,którydajedokładnąpredykcję.Wprzypadkureprezentacji
wektorowejmiarąjakościklasyfikatora?jestnajczęściejjegoprawdopodobieństwo
błędnejklasyfikacji:
Err(?)=P(?(x)T).
(1.18)
Jakpokażemywnastępnymrozdziale,zewzględunaprawdopodobieństwobłędu
optymalnyjestklasyfikatorbayesowski,któryjeminimalizuje.Niestetyzależyonod
rozkładuprawdopodobieństwapary(Z,T),którynajczęściejniejestznany.Dlatego
pojawiasięproblemskonstruowaniaklasyfikatora
?
ˆ(x)=?
ˆ(x;U
n)
(1.19)
napodstawiezbioruuczącegoUn={(X1,T1),...,(Xn,Tn)}.procedurękonstruowa-
niaklasyfikatoranapodstawiezbioruuczącegonazywamyjegouczeniem,dokładniej
uczeniemznauczycielemlubuczeniemnadzorowanym(ang.supervisedlearning).
Ponieważklasyfikatorzostajenauczonytylkonapewnymmałympodzbiorzepopulacji,
jakimjestzbióruczący,powinienmiećjaknajwiększezdolnościdouogólniania(genera-
lizacji)własnościzbioruuczącego.Dobrageneralizacjaoznacza„zapamiętanie”tylko
własnościnajbardziejistotnychdlacałejpopulacji,anietychzwiązanychzkonkretnym
zbioremuczącym.Zbytdokładne„dopasowanie”dokonkretnegozbioruuczącego
skutkujeprzeuczeniemklasyfikatora.Odwrotnasytuacja,niedouczenie,występuje,gdy
klasyfikatornieodzwierciedlaistotnychwłasnościpopulacji.Niedouczenieiprzeucze-
nieobniżajądokładnośćpredykcji,atymsamymjakośćklasyfikatora.Wrozdziale8
zajmiemysiędokładniejwłasnościamigeneralizacyjnymiklasyfikatoraizilustrujemyto
pojęcieprzykładem.
Jakośćklasyfikatora?
ˆjestdefiniowanaprzezwarunkoweprawdopodobieństwo
błędnejklasyfikacji:
Err(?
ˆ;U
n)=(P(?
ˆ(x)T)l(U
n),
(1.20)
czylidlaustalonegozbioruuczącegoUn.WielkośćErr(?
ˆ;U
n)jestzmiennąlosową,
zależybowiemodlosowegozbioruuczącegoUn.Właściwiepowinniśmyoznaczaćkla-
syfikator?
ˆwyuczonynazbiorzeuczącymU
njako?
ˆ(x;U
n),częstojednakpiszemy
tylko?
ˆ(x).Chcielibyśmyznaleźćtakiklasyfikator?
ˆ,dlaktóregoErr(?
ˆ;U
n)jestnie-
wielewiększeodbłęduklasyfikatorabayesowskiego.Różnymmetodomszacowania
powyższegoprawdopodobieństwabłędnejklasyfikacjipoświęconyjestrozdział8.
Prezentowanetamoszacowaniarównieżstosowanedlaocenybłęduklasyfikatora
opartegonareprezentacjistrukturalnej.
Opierającsięnawprowadzonympojęciufunkcjidyskryminacyjnejoraznajczęściej
stosowanymsposobiepodejmowaniadecyzjimetodziepodstawowej,możnazapisać
klasyfikator?
ˆwnastępującejpostaci: