Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
38
EwaFrątcząk
1070Znaczeniekodowaniazmiennychjakościowych
wmodelachregresjilogistycznej
Zapiszmiennejjakościowejwpostacizmiennychsztucznychnapotrzebymode-
lowanianazywasiękodowaniemlubparametryzacją
15
.Kodowaniezmiennych
jakościowychmożnaprzeprowadzićnawielesposobów.Odsposobukodowania
zależyinterpretacjaotrzymanychwynikówestymacji.Poniżejprzedstawionote
najważniejszeinajczęściejwykorzystywanesposobykodowania:
1.Kodowaniereferencyjne(referencecoding).Istotakodowaniapoleganatym,
żezmiennasztucznaodpowiadającadanejkategoriiprzyjmujewartość1,gdy
obiektnależydotejkategorii,i0wprzeciwnymprzypadku.Obiektynależące
dokategoriireferencyjnejdlakażdejztychzmiennychbędąmiaływartość0.
Kodowaniereferencyjnejestbardzonaturalne.Zmiennebinarnezapisaneza
pomocą0i1zkonstrukcjizakodowanewtensposób.Ponadtokodowanie
topozwalanaprostąinterpretacjęuzyskanychwynikówestymacji:parametr
przyzmiennejzero-jedynkowejodpowiadającejk-tejkategoriiinformujeotym,
oileróżnisięwartośćzmiennejobjaśnianejdlaobiektunależącegodok-tej
kategoriiodwartościzmiennejobjaśnianejdlaobiektunależącegodokatego-
riireferencyjnej.Istotnymzagadnieniem,zwłaszczadlategokodowania,jest
wybórkategoriireferencyjnej,atozdwóchpowodów.Popierwsze,złydobór
kategoriireferencyjnejmożepogłębićirozszerzyćproblemyzwiązanezmałą
liczebnościąkategoriiwzależnościodrozkładu.Podrugie,odkategoriirefe-
rencyjnejzależynelegancja”interpretacji.Kategorietypunpozostałe”
,ninne”
,
nbrakdanych”ztegowzględunienajlepiejnadająsięnakategoriereferencyjne.
Kategorieoznaczającezjawiskarzadkielubpatologiczneteżniedobrym
wyborem,chybażeodnosząsiędonichhipotezybadawcze.Jeżelibowiemjakaś
kategoriajestszczególnieinteresującazpunktuwidzeniahipotezbadawczych,
naturalnejestodnoszeniedoniej,bowiadomo,żedladanegoproblemu
badawczegocharakterystyczne.Bardzodobrymikategoriamireferencyjnymi
równieżdominanty-wówczasinterpretacjaodnosisiędosytuacjitypowej.
Dlategonależyprzedprzystąpieniemdomodelowaniadokładnieocenićroz-
kładybadanychzmiennychwpróbiebadanejidokonaćtakichprzekształceń
wkategoriach,abywmiaręmożliwościotrzymaćrozkładzjednymośrod-
15
OpisnajczęściejstosowanychsposobówkodowaniaprzytaczasięzapracąKsiążek(2012,
s.47-50).