Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
10
Kluczowekompetencjespecjalistydanych
wroku2015mógłbyćuznanyzaduży,niebędziejużnimwroku2020,ponieważ
wmiędzyczasietechnologiarozwinęłasięnatyle,żemożemygozłatwościąprzetwarzać.
Model3V
Żebyzbiórdanychuznaćzaduży,musionspełnićconajmniejjedenztrzechwarunków:
wielkość(volume)rozmiarzbiorudanych(np.liczbawierszy)musibyćwyra-
żonywmiliardach;
zmienność(velocity)szybkość,zjakądanezbierane(np.jakostreamingwideo)
musibyćtakduża,żebyuniemożliwiałaichprzetwarzanietradycyjnymimetodami;
różnorodność(variety)możeoznaczaćróżnorodnośćtypówdanych,naprzykład
tekstów,wideo,audioiobrazów(znanychjakonieustrukturyzowanedane),albo
różnorodnośćprzechowywanychwkolumnachtabeliatrybutówmusibyćduża.
Dużezbiorydanychznamiznaczniedłużejniżtosobiewyobrażamyjedynieich
nazwanieistniałaprzedlatami90.Dużezbiorydanychużywanewnajróżniejszych
dziedzinachodwielulat,dłużejniżprzypuszczasz.Pozwól,żeCitowyjaśniębigdata
nieniczymnowym.Wżadnymrazienienowympomysłem.Wiele,jeśliniewszyst-
kienajwiększeświatowekorporacjedysponujągigantycznymi,zbieranymiprzezdługie
lata,zbioramidanychnatematichklientów,produktówiświadczonychusług.Rządy
zbierajądaneoobywatelach,posługującsięcałymwachlarzemmetododspisów
powszechnychpoinwigilację.Muzeaprzechowujądaneokulturzeodeksponatów
iprofilikolekcjonerówpoarchiwawystaw.Nawetnaszewłasneciałaprzechowują
dużyzbiórdanychwpostacigenomu.
Podsumowując,jeśliniemożeszpracowaćzezbioremdanych,nazywaszgodużym
zbioremdanych.Kiedyspecjaliścidanychużywajątegoterminu,nadająmukonkret-
neznacznie.Chcąpodkreślićfakt,żewprzypadkutegozbiorustandardowemetody
analizowanianiewystarczające.
Skądtocałezamieszaniewokółdużychzbiorówdanych?
MożewydaćCisiędziwne,żedopieroodniedawnazaczęliśmyzdawaćsobiesprawę
zpotęgiukrytejwdanych.Choćdanezbieramyodwieków,czymścowprzeszłościza-
trzymywałonasprzedprzekształceniemichwcośużytecznego,byłbrakodpowiednich
technologii.Wsumietoniewielkośćdanychmaznaczenie,aleto,copotrafimyznimi
zrobić.Dowolnedane,dużeczynie,przydatne,oilepotrafimywydobyćukryte
wnichinformacje,azanimzostałyopracowaneskalowalnetechnologiepomagają-
cenamanalizowaćiprzechowywaćdane,ichprzydatnośćwyznaczałyintelektualne
możliwościpracującejznimiosoby.