Treść książki
Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
10
Kluczowekompetencjespecjalistydanych
wroku2015mógłbyćuznanyzaduży,niebędziejużnimwroku2020,ponieważ
wmiędzyczasietechnologiarozwinęłasięnatyle,żemożemygozłatwościąprzetwarzać.
Model3V
Żebyzbiórdanychuznaćzaduży,musionspełnićconajmniejjedenztrzechwarunków:
●
wielkość(volume)–rozmiarzbiorudanych(np.liczbawierszy)–musibyćwyra-
żonywmiliardach;
●
zmienność(velocity)–szybkość,zjakądanesązbierane(np.jakostreamingwideo)–
musibyćtakduża,żebyuniemożliwiałaichprzetwarzanietradycyjnymimetodami;
●
różnorodność(variety)–możeoznaczaćróżnorodnośćtypówdanych,naprzykład
tekstów,wideo,audioiobrazów(znanychjakonieustrukturyzowanedane),albo
różnorodnośćprzechowywanychwkolumnachtabeliatrybutów–musibyćduża.
Dużezbiorydanychsąznamiznaczniedłużejniżtosobiewyobrażamy–jedynieich
nazwanieistniałaprzedlatami90.Dużezbiorydanychsąużywanewnajróżniejszych
dziedzinachodwielulat,dłużejniżprzypuszczasz.Pozwól,żeCitowyjaśnię–bigdata
niesąniczymnowym.Wżadnymrazieniesąnowympomysłem.Wiele,jeśliniewszyst-
kienajwiększeświatowekorporacjedysponujągigantycznymi,zbieranymiprzezdługie
lata,zbioramidanychnatematichklientów,produktówiświadczonychusług.Rządy
zbierajądaneoobywatelach,posługującsięcałymwachlarzemmetod–odspisów
powszechnychpoinwigilację.Muzeaprzechowujądaneokulturze–odeksponatów
iprofilikolekcjonerówpoarchiwawystaw.Nawetnaszewłasneciałaprzechowują
dużyzbiórdanychwpostacigenomu.
Podsumowując,jeśliniemożeszpracowaćzezbioremdanych,nazywaszgodużym
zbioremdanych.Kiedyspecjaliścidanychużywajątegoterminu,nadająmukonkret-
neznacznie.Chcąpodkreślićfakt,żewprzypadkutegozbiorustandardowemetody
analizowaniasąniewystarczające.
Skądtocałezamieszaniewokółdużychzbiorówdanych?
MożewydaćCisiędziwne,żedopieroodniedawnazaczęliśmyzdawaćsobiesprawę
zpotęgiukrytejwdanych.Choćdanezbieramyodwieków,czymścowprzeszłościza-
trzymywałonasprzedprzekształceniemichwcośużytecznego,byłbrakodpowiednich
technologii.Wsumietoniewielkośćdanychmaznaczenie,aleto,copotrafimyznimi
zrobić.Dowolnedane,dużeczynie,sąprzydatne,oilepotrafimywydobyćukryte
wnichinformacje,azanimzostałyopracowaneskalowalnetechnologiepomagają-
cenamanalizowaćiprzechowywaćdane,ichprzydatnośćwyznaczałyintelektualne
możliwościpracującejznimiosoby.