Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
26
Rozdział1.Probabilistycznemetodyklasyfikacyjne
lub
dB(x)=1,jeżeliπ1f1(x)>πofo(x),
0,pozatym.
(1.10)
Definicja1.3.
Zbiórpostaci
{x:P(Y=1|X=x)=P(Y=0|X=x)}
będziemynazywaćpowierzchniąrozdzielającągrupy1i0.
TWIERDZENIE1.1.
Klasyfikatorbayesowskijestoptymalny,tj.jeżelidjestjakimkolwiekinnym
klasyfikatorem,toe(dB)e(d),gdziee(d)jestrzeczywistympoziomembłędu
klasyfikatoraddanymwzorem(1.5).
Niestety,klasyfikatorbayesowskizależyodrozkładuprawdopodobień-
stwapary(X,Y).Jeżelirozkładtenjestznany,tomożemyposługiwać
sięklasyfikatorembayesowskimdB.Najczęściejrozkładtenniejestznany
istądrównieżniejestznanyklasyfikatorbayesowskidB.
Pojawiasięzatemproblemskonstruowaniaklasyfikatoraˆ
d(x)=ˆ
d(x;Ln)
opartegonapróbieuczącejLn={(X1,Y1),
...,(Xn,Yn)}zaobserwowa-
nejwprzeszłości.
Proceskonstruowaniaklasyfikatoraˆ
djestnazywanyuczeniemsię,ucze-
niempodnadzoremlubuczeniemsięznauczycielem.
Wnaszymmodeluklasyfikacyjnymzakładamy,żepróbauczącaLn=
{(X1,Y1),
...,(Xn,Yn)}jestciągiemniezależnychparlosowychoiden-
tycznymrozkładzieprawdopodobieństwatakim,jakrozkładpary(X,Y).
Jakośćklasyfikatoraˆ
dmierzonajestzapomocąwarunkowegoprawdo-
podobieństwabłędu
e(ˆ
d)=P(ˆ
d(X)/=Y|Ln),
gdzieparalosowa(X,Y)jestniezależnaodpróbyuczącejLn.Wielkość
e(ˆ
d)nazywamyaktualnympoziomem2błęduklasyfikatoraˆ
d.
2Poang.theactualerrorrate.