Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
Aterazwyobraźmysobie,żezbliżamysiędokońcawyjątkowociepłegotygodniapaź-
dziernika,więcnapodstawieprzewidywańmodelufirmazwyprzedzeniemzwiększyła
zapasywstoiskachzlodami.Jednaktygodniowasprzedaż,choćwyższaniżzwyklewta-
kimczasie,spadłaznacznieponiżejilościprzewidywanejprzezmodel.Oj,cosięstało?
Czyanalitykdanychpowinienzostaćzwolniony?
Stałosięto,żemodelnieuwzględniakluczowegofaktu-tego,żewiększośćsprzedaży
lodówmamiejscewmiesiącachletnich,gdydzieciniechodządoszkoły.Modelregre-
sjiutworzyłnajlepsząprognozęnapodstawiedostępnychdanych,aleczęściowypowód
zwiększonejsprzedażylodów(wakacjeletniedlauczniów)zostałczęściowobłędnieprzy-
pisanytemperaturze,ponieważmiesiąceletniedodatnioskorelowaneztemperaturą.
Ponieważwzrosttemperaturywpaździernikuniespowodowałprzerwaniazajęćszkol-
nych(przykromi,dzieciaki!),odnotowanoniższąsprzedaż,niżwprzypadkuletnichdni
ztymisamymitemperaturami.
Zformalnegopunktuwidzeniaczynnikiemzakłócającymrelacjęmiędzytemperaturą
asprzedażąjestmiesiąc.Czynnikzakłócającytozmienna,którawprowadzabłąddore-
gresji.Gdywystępujeonwanalizowanejsytuacji,oznaczato,żeinterpretowaniewspół-
czynnikaregresjijakoprzyczynydoprowadzidoniewłaściwychwniosków.Weźmypod
uwagęmiejscetakiejakChicago,któremaklimatkontynentalny-zimajestbardzochłod-
na,alatobardzogorące.Podczasporównywaniapoziomusprzedażywprzypadkowy,
upalnydzieńzpoziomemsprzedażywprzypadkowy,chłodnydzieńbezjednoczesnego
uwzględnieniawpływumiesiącanajprawdopodobniejbierzesiępoduwagęjakiśgorący,
wakacyjnydzieńorazchłodnydzieńzimowy,gdydzieciwszkole.Zawyżatopozorny
związekmiędzytemperaturąasprzedażą.
Wprzypadkutegoprzykładumożnasięrównieżspodziewaćkonsekwentnegoniedo-
szacowaniasprzedażywchłodniejszedni.Wrzeczywistościwmiesiącachletnichnastępu-
jezmianaparadygmatu.Gdyzmianatazależywyłącznieodtemperaturywregresjilinio-
wej,jejwspółczynnikjestzbytwysokidlawyższychtemperaturizbytniskidlaniższych.
Zbytwielezmiennychmożezepsućzabawę
Potencjalnymrozwiązaniemproblemuzczynnikamizakłócającymibyłobyuwzględnienie
wregresjiwszystkichmożliwychzmiennych.Sposóbmyślenianweźwszystko,cowpadnie
wręce”wciążmazwolennikówwśródstatystyków.WksiążcemeBookofWhyJudeaPearl
iDanaMackenziepiszą,żenjedenzczołowychstatystykówniedawnostwierdził,że«uni-
kaniewarunkowaniadlaniektórychobserwowalnychzmiennychtowarzyszących(…)jest
nienaukowymimprowizowaniem»”(PearliMackenzie,2018,str.1602).Jesttorównież
zachowaniedośćpowszechniespotykanewśródnaukowcówzajmującychsiędanymi.
Prawdęmówiąc,jeślicelemjesttylkoprognozowaniezmiennej,istniejejużmodel,który
zostałstaranniezaprojektowany,abyodpowiednioprzewidywaćwartościspozazakresu
danychtestowych.Jeśliniejesteśmyzainteresowani,dlaczegoprognozowanazmienna
przyjmujeokreślonąwartość,takierozwiązaniejestzupełniewystarczające.Niestety,nie
2
TymwspomnianymstatystykiembyłDonaldRubin.
Zakłócenia,czyliukryteniebezpieczeństwarozwiązywaniaproblemówzapomocąregresji
|
11