Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
1
Jaktodziała
Podstawowepojęcia
Spróbujmyzdefiniowaćiusystematyzowaćkluczowepojęciawykorzystywanewprocesie
analizydanych,czylidatascience,bigdata,uczeniemaszynowe(ang.machinelearning)
isztucznainteligencja(ang.artificialintelligence).Niejesttoproste,ponieważwtejkwestii
istniejewielepoglądówiniemajednejpowszechnieprzyjętejdefinicji.
Datasciencetomiędzydyscyplinarnadziedzinawiedzykorzystającazdorobku
m.in.matematyki,statystyki,ekonometriiiinformatyki,którejprzedmiotemjestanaliza
wszelkichmożliwychtypówdanychwcelupozyskaniawiedzyozjawiskachiproblemach
opisywanychprzeztedane.Datasciencejestnajobszerniejszymterminem,włączawswoją
definicjępojęciaopisaneponiżej.W2012rokufiHarvardBusinessReview”nazwałdata
sciencenajbardziejseksownym(czyliatrakcyjnym)stanowiskiem/zawodemwXXIwieku.
Bigdataczylidużedane;tozbiórdanych,którycechujesięprzynajmniejkilkoma
zczterechcech,określanychjakoczteryV,zjęzykaangielskiegoVolume,Variety,Velocity
iVeracity(Wikipedia:https://pl.wikipedia.org/wiki/Big_data):
Volumedanychjestdużo,zregułymówimyomilionachlubmiliardachobserwacji
idanych,któremierzysięwgigabajtachlubterabajtach(tysiącachgigabajtów),aostatnio
wrazzpojawieniemsięinterneturzeczynawetwpetabajtach(milionachgigabajtów).
Dlaporównania,jedenfilmpełnometrażowyzregułyzajmujeodjednegodo2giga-
bajtów,pamięćoperacyjnalaptopamieścitypowo16gigabajtów,adyskkomputera
500gigabajtów.
Varietymamyżnetypydanych,liczbowe(np.daneotransakcjachklientów),tekstowe
(np.zapislogówrozmówklientówzcallcenterfirmylubopinieklientówoproduktach
nażnychforachdyskusyjnych),obrazifilm(np.zapiskamersklepowych)orazdźwięk
(nagraniarozmówwklientami).
Velocitydanepojawiająsięszybko,częstowczasierzeczywistym(np.aplikacjekredy-
toweklientówwdużymbanku,transakcjekartamikredytowymi,gdziesprawdzasię,czy
niesątotransakcjekradzionąkartąlubodczytyzczujnikówprzemysłowych),decyzje
napodstawietychdanychteżmusząbyćpodejmowanewczasierzeczywistym.
Veracityjakośćdanychjestbardzożna,odbardzoprecyzyjnych(daneopisująceklien-
ta)ponieprecyzyjne(np.identyfikacjadanejosobynapodstawiesłabejjakościfotografii
lubanalizatekstu,którymożezawieraćwieloznacznesłowalubsarkazm).
Podstawowepojęcia
23