Treść książki
Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
38
EwaFrątcząk
1070Znaczeniekodowaniazmiennychjakościowych
wmodelachregresjilogistycznej
Zapiszmiennejjakościowejwpostacizmiennychsztucznychnapotrzebymode-
lowanianazywasiękodowaniemlubparametryzacją
15
.Kodowaniezmiennych
jakościowychmożnaprzeprowadzićnawielesposobów.Odsposobukodowania
zależyinterpretacjaotrzymanychwynikówestymacji.Poniżejprzedstawionote
najważniejszeinajczęściejwykorzystywanesposobykodowania:
1.Kodowaniereferencyjne(referencecoding).Istotakodowaniapoleganatym,
żezmiennasztucznaodpowiadającadanejkategoriiprzyjmujewartość1,gdy
obiektnależydotejkategorii,i0wprzeciwnymprzypadku.Obiektynależące
dokategoriireferencyjnejdlakażdejztychzmiennychbędąmiaływartość0.
Kodowaniereferencyjnejestbardzonaturalne.Zmiennebinarnezapisaneza
pomocą0i1sązkonstrukcjizakodowanewtensposób.Ponadtokodowanie
topozwalanaprostąinterpretacjęuzyskanychwynikówestymacji:parametr
przyzmiennejzero-jedynkowejodpowiadającejk-tejkategoriiinformujeotym,
oileróżnisięwartośćzmiennejobjaśnianejdlaobiektunależącegodok-tej
kategoriiodwartościzmiennejobjaśnianejdlaobiektunależącegodokatego-
riireferencyjnej.Istotnymzagadnieniem,zwłaszczadlategokodowania,jest
wybórkategoriireferencyjnej,atozdwóchpowodów.Popierwsze,złydobór
kategoriireferencyjnejmożepogłębićirozszerzyćproblemyzwiązanezmałą
liczebnościąkategoriiwzależnościodrozkładu.Podrugie,odkategoriirefe-
rencyjnejzależynelegancja”interpretacji.Kategorietypunpozostałe”
,ninne”
,
nbrakdanych”ztegowzględunienajlepiejnadająsięnakategoriereferencyjne.
Kategorieoznaczającezjawiskarzadkielubpatologiczneteżniesądobrym
wyborem,chybażeodnosząsiędonichhipotezybadawcze.Jeżelibowiemjakaś
kategoriajestszczególnieinteresującazpunktuwidzeniahipotezbadawczych,
naturalnejestodnoszeniedoniej,bowiadomo,żesądladanegoproblemu
badawczegocharakterystyczne.Bardzodobrymikategoriamireferencyjnymi
sąrównieżdominanty-wówczasinterpretacjaodnosisiędosytuacjitypowej.
Dlategonależyprzedprzystąpieniemdomodelowaniadokładnieocenićroz-
kładybadanychzmiennychwpróbiebadanejidokonaćtakichprzekształceń
wkategoriach,abywmiaręmożliwościotrzymaćrozkładzjednymośrod-
15
OpisnajczęściejstosowanychsposobówkodowaniaprzytaczasięzapracąKsiążek(2012,
s.47-50).