Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
ROZDZIAŁ1.WPROWADZENIE
w1996r.archiwuminternetowe(InternetArchive)zgromadziłodochwiliobecnej
ponad300TBdanychmultimedialnych[Int07].
Nasuwasięnaturalnepytanieocelowośćprzechowywaniatakolbrzymich
wolumenówdanych.Okazujesię,jakwynikazprzeprowadzonychbadań,żetylko
niewielkaczęśćzgromadzonychdanychjestanalizowanawpraktyce.Wielefirm
iprzedsiębiorstwdysponującychzasobamidanych,przechowywanychwzakłado-
wychbazachihurtowniachdanych,stanęłoprzedproblemem,wjakisposóbefek-
tywnieiracjonalniewykorzystaćnagromadzonąwtychdanychwiedzędlacelów
wspomaganiaswojejdziałalnościbiznesowej.Przykładowo,nawetniewielkiesieci
supermarketówrejestrującodzienniesprzedażtysięcyartykułówwkasachfiskal-
nych.Czymożnawykorzystaćzgromadzonedaneotransakcjach,abyzwiększyć
sprzedażipoprawićrentowność?
Jakjużwspomnieliśmy,zdecydowanawiększośćdanychjestgromadzonana
nośnikachmagnetycznychwsystemachbazihurtownidanych.Tradycyjnydostęp
dotychdanychsprowadzasięnajczęściejdorealizacjiprostychzapytańprzezpre-
definiowaneaplikacjelubraporty.Sposób,wjakiużytkownikkorzystairealizu-
jedostępdobazydanych,nazywamymodelemprzetwarzania.Tradycyjnymodel
przetwarzaniadanychwbazachdanych,tzn.przetwarzanietransakcjiwtrybieon-
-line(ang.on-linetransactionprocessingOLTP),jestwpełnisatysfakcjonujący
wprzypadkubieżącejobsługidziałalnościdanejfirmy,dladobrzezdefiniowanych
procesów(obsługaklientawbanku,rejestracjazamówień,obsługasprzedażyitp.).
Modeltendostarczaefektywnychrozwiązańdlatakichproblemówjak:efektywne
ibezpieczneprzechowywaniedanych,transakcyjneodtwarzaniedanychpoawarii,
optymalizacjadostępudodanych,zarządzaniewspółbieżnościądostępudodanych
itd.WznaczniemniejszymstopniumodelOLTPwspomagaprocesyanalizyda-
nych,agregacjidanych,wykonywaniapodsumowań,optymalizacjizłożonychza-
pytańformułowanychadhoc,czywreszcieaplikacjiwspomagającychpodejmo-
waniedecyzji.Pracebadawczeirozwojoweprowadzonenadrozszerzeniemfunk-
cjonalnościsystemówbazdanychdoprowadziłydoopracowanianowegomodelu
przetwarzaniadanych,któregopodstawowymcelemjestwspomaganieprocesów
podejmowaniadecyzji,oraznowegotypubazydanychnazwanegohurtowniąda-
nych(ang.datawarehouse).
Nowymodelprzetwarzaniadanychopracowanydlahurtownidanychna-
zwanyprzetwarzaniemanalitycznymon-line(ang.on-lineanalyticalprocessing
OLAP)mazazadaniewspieranieprocesówanalizyhurtownidanych,dostar-
czającnarzędziumożliwiającychanalizęhurtowniwwieluwymiarachdefiniowa-
nychprzezużytkowników(czas,miejsce,klasyfikacjaproduktówitp.).Analiza
hurtownipoleganaobliczaniuagregatów(podsumowań)dlazadanychwymiarów
hurtowni.Należypodkreślić,żeprocesanalizyjestcałkowiciesterowanyprzez
użytkownika.Mówimyczasamioanaliziedanychsterowanejzapytaniami(ang.
query-drivenexploration).Typowymprzykłademtakiejanalizywodniesieniudo
hurtownidanychzawierającejdanedotyczącesprzedażyproduktówwsupermar-
2