Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
20
Liniowemetodyklasyfikacji
i
G
jestskończonym;
g
-elementowymzbioremetykietklas;doktórychnależą
obserwacje;przyczym
g2
.Wygodnienambędzieoznaczać(zakodować)
elementyzbioru
G
wjednolitysposóbzapomocąliczb;od1do
g
(wdo-
wolny;ustalonysposób).Odtądbędziemyutożsamiaćzbiór
G
zezbiorem
{1,2,...,g}
;choćniebędziemytejkonwencjiwykorzystywaćwżadnychra-
chunkach(pozajednymwyjątkiem;októrymbędziemowawpodrozdz.1.3;
gdzieŹznowuwyjątkowoŹelementyzbioru
G
będązakodowanejako0i1).
Wygodniebędzieprzyjąć;żetypywartościwspółrzędnych
x
(d)
ź
;
d=1,2,...
...,p
;wektorów
xź
mogąbdowolne;czyliżemogątobyćzmiennecią-
głe;dyskretne;porządkowelubnominalne;bylebymiałymatematycznysens
pojawiającesięwtekściewielkościzależneod
xź
(prawdopodobieństwowa-
runkowe
P(·|xź
);warunkowawartośćoczekiwana
E(·|xź)
itd.).1nnasprawa;
żeitaknajczęściejbędziemyowartościachwspółrzędnychwektora
x
zakła-
dać;żezmiennymiliczbowymi(ciągłymilubdyskretnymi).Współrzędne
wektoraobserwacji;
x
(d)
ź
;będziemynazywaćcechamialboatrybutami;
albopoprostuzmiennymi.Poniewmianempróbyokreślamytucały
ciąg
n
-elementowy;
k
-typodciągtegociągu;zawierającywszystkieelementy
z
k
-tejklasy;itylkotakieelementy;będziemynieraznazywać
k
-tąpodpróbą
próbyuczącej.
Zadanieklasyfikacjipodnadzorempoleganapodaniuregułydecyzyj-
nej;zwanejtakżeregułądyskryminacyjnąlubklasyfikacyjną;przypi-
sującejdowolnejobserwacji
xX
przynależnośćdoklasyzezbioruklas
G
;
zadaniepolegazatemnapodaniuodwzorowania
d(x):X−→G.
Regułędecyzyjnątworzysięnapodstawiepróby
(xź,yź)
;
ź=1,...,n
;zwanej
odtądpróbąuczącą(niekiedybędziemywić;żepróbauczącaskłada
sięz
g
podprób;każdazktórychzawieraobserwacjeztylkojednejklasy).
Zadanieklasyfikacjipodnadzoremnazywamyinaczejklasyfikacjązpróbą
uczącąi;jeszczeinaczej;klasyfikacjąznauczycielem.Odkilkudziesięciulat
statystycyrozwiązujątozadaniemetodamianalizydyskryminacyjnej.1
Utworzonanapodstawiepróbyuczącejreguładecyzyjna
d
pozwalakażdemu
zaobserwowanemuwektorowi
x
;októrymniewiemy;dojakiejklasyzezbioru
G
należy;przypisaćprzynależnośćdo(domniemanejprzezregułę)klasy.
1Ściślebiorąc,wstatystycerozróżniasięniekiedyzadaniaanalizydyskryminacyjnej
iklasyfikacjipodnadzorem,zwracającuwagę,żewpierwszymchodziojaknajlepsze
wwybranymsensieopisanieróżnicmiędzyklasami(populacjami),wdrugimzaśŻszcze~
gólnymprzypadkupierwszegoŻchodziomniejniżopisklas,czyróżnicymiędzynimi,bo
tylkooskonstruowaniemożliwiedobrejregułyprzydziałuobserwacjionieznanejklasie
dojakiejśklasyº