Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
WSTĘP
Częstocelemeksperymentówdatasciencejestuzupełnieniebrakującychdanych(pre-
dykcja).Mogątobyćdanenatematprzyszłości(takiejakprognozowanawartośćsprze-
dażyproduktuczyprzewidywanadatauszkodzeniaelementu)albobrakującedanelub
wartościzmiennychniewystępującychwzbiorzeźródłowym(np.wyznaczeniewartości
niewykonanegopomiaru,określenieryzyka,żedanaosobaniespłacipożyczki,czydia-
gnozapacjenta).Wniniejszejksiążcesąprzedstawionetegotypueksperymenty.
Drugirodzajeksperymentówdatasciencepoleganaautomatycznymodkryciuogólnych
wzorcówukrytychwdanych(deskrypcja).Przykłademtegotypuzastosowańmożebyć
określenieczęstokupowanychrazemtowarów(znalezienietypowychkoszykówzakupów)
czysekwencjizdarzeńprowadzącychdoutratyklientabądźuszkodzeniaurządzenia.
Uczeniemaszynowe
Niektórychproblemówniepotrafimyrozwiązaćwsposóbalgorytmiczny.Przykładem
możebyćrozpoznawanieobrazówwciążniepotrafimywścisłysposóbopisać,jak
tenproceszachodziwmózguczłowieka,anieznającalgorytmu,niemożemygozaim-
plementowaćwjakimkolwiekjęzykuprogramowania.Nieoznaczatojednak,żenie
potrafimynauczyćkomputerarozpoznawaniaobrazów,czegodowodemsąnietylko
takieusługijakhttps://www.microsoft.com/cognitive-services/en-us/face-api,ale
równieżsystemyautomatycznegoprowadzeniasamochodów.
Próbyalgorytmicznegorozwiązaniawieluinnychproblemówbyłybynietylkobardzo
skomplikowane,lecztakżewysocenieskutecznewpraktyce.Dobrymprzykładempro-
blemówtegotypujestzagadnieniewykrywaniamożliwychoszustwpopełnianychza
pomocąkartkredytowych.Nawetpoudanymzakodowaniuwszystkichreguł,napodsta-
wiektórychtransakcjapowinnabyćsklasyfikowanajakopróbaoszustwa,otrzymalibyśmy
niezwykleskomplikowanyprogram(opróczogólnychregułtypufitasamakartazostała
użytawodstępniekrótszymniżgodzinawdwóchodległychodsiebieoponad100km
miejscach”,należałobyuwzględnićregułyspecyficznedladanejosoby,np.fikartaporaz
pierwszyzostałaużytawnocnymklubiewBangkoku”).Cogorsza,regułytegotypuczę-
stosięzmieniają(użytkownicykartkredytowychniezachowująsięprzezcałyczaswten
samsposób,aoszuścidostosowująswojedziałania,byobejśćwdrożonezabezpieczenia),
awięcchcąc,abynaszprogrambyłskuteczny,musielibyśmynabieżącogoaktualizować.
Kolejnymtypemproblemów,którenienadająsiędorozwiązaniawsposóbalgorytmiczny,
sąsystemy,którychniepotrafimy,czytozpowoduilościprzetwarzanychdanych,czyzło-
żonościalgorytmu,wwystarczającysposóbskalować.Przykłademmogąbyćpowszechnie
używaneprzezwszystkiesklepyinternetowesystemyrekomendujące.
Rozwiązaniemwszystkichtychproblemówjestzastosowanietechnikuczeniamaszy-
nowego.
XX