Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
obejmująfunkcjęsigmoidalnąirozwinięciawielomianowe(kwadrat,pierwiastekkwadra-
towy,sześcian,pierwiasteksześciennyitd.).To,żemamydobrąfunkcjęprzekształcenia,
poznamypotym,gdyprzekształconawartośćuzyskarozkładjednostajnylubnormalny.
Rysunek2-4Lewypanel:rozkładliczbywyświetleństronWikipediijestmocnoskośnyiobej-
mujedużyzakresdynamiki.Nadrugimpaneluzademonstrowano,żeteproblemy
możnarozwiązaćprzezprzekształcenieliczbywyświetleńprzyużyciukolejnologa-
rytmu,funkcjipotęgowejorazskalowanialiniowego.Natrzecimpanelupokazano
efektywyrównaniahistogramu,anaczwartymefektprzekształceniaBoxa-Coxa.
Załóżmy,żekonstruujemymodeldopredykcjisprzedażyksiążkizkategoriiliteraturyfaktu.
JednymzwejśćmodelujestpopularnośćstronyWikipediizwiązanejztymtematem.Liczba
wyświetleństronwWikipediijestjednakmocnoskośnaizajmujedużyzakresdynamiki
(patrzlewypanelnarysunku2-4:rozkładjestmocnoskośnywkierunkurzadkowyświet-
lanychstron,alenajpopularniejszestronywyświetlanemilionyrazy).Dziękiobliczeniu
logarytmuwyświetleń,anastępnieobliczeniupierwiastkaczwartegostopniazwartościtego
logarytmuiliniowemuprzeskalowaniuwyników,otrzymujemycoś,cojestżądanymza-
kresemimakształttrochęprzypominającydzwon.Wceluuzyskaniaszczegółowegokodu
doodpytywaniadanychzWikipedii,zastosowaniaprzekształceńigenerowaniawykresu,
zobaczznajdującesięwwitrynieGitHubwrepozytoriumdotejksiążki4.
Wynalezieniefunkcjilinearyzacji,którasprawia,żerozkładwyglądajakkrzywadzwo-
nowa,możebyćtrudne.Łatwiejszympodejściemjestutworzeniezasobnikówdlawielu
widokówitakiedobraniegraniczasobników,abypasowałydożądanegorozkładuwyj-
ściowego.Pryncypialnympodejściemdowyborutychzasobnikówjestwykonaniewyrów-
naniahistogramu,gdziezasobnikihistogramuwybranenabaziekwantyliwsurowym
4
https://github.com/GoogleCloudPlatform/ml-design-patterns/blob/master/02_data_representation/sim-
ple_data_representation.ipynb
26
|
Rozdział2:Wzorceprojektowereprezentacjidanych