Treść książki
Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
1.1.Pojęciapodstawowe
17
jednoznaczneokreśleniedopuszczalnychwartości.Daneopisującetesameinforma-
cjepowinnymiećtakisamformat,sposóbkodowaniaorazpostać.Informacjeza-
silającehurtownięzazwyczajpochodzązwieluźródeł:innychbazdanych,arkuszy
kalkulacyjnych,plikówtekstowych.Postulatspójnościoznacza,żedanebędąprzecho-
wywanezawszewtakimsamymformacie,bezwzględunaźródło,zktóregopocho-
dzą.Otokilkatypowychproblemów,zktórymimusiuporaćsięprojektanthurtowni:
•datypochodzącezróżnychźródełmogąznacznieróżnićsięformatem,anawetty-
pemdanych–czasembędzietotypDATA,czasemTIMESTAMP,azdarzasiętakże
typCHARlubVARCHAR(wprzypadkupobieraniadanychzplikówtekstowych
mamydoczynieniawyłączniezłańcuchamiznakowymi);
•poszczególneźródładanychmogąwykorzystywaćróżnestronykodoweASCII,
awstarszychsystemachtypumainframemożnanatknąćsięnakodowaniewsys-
temieEBCDIC(jesttosystemodchodzącypowoliwzapomnienie);
•informacjeprzechowywanewtejsamejtechnologii(np.wrelacyjnejbazieda-
nych)mogąmiećróżnetypyzewzględunaróżnedecyzjeprojektowe.Naprzykład
wspomnianywcześniejadresplacówkimedycznejmożewjednejaplikacjibyć
reprezentowanyjakoCHAR(25),awinnejjakoVARCHAR(50);
•systemyźródłowemogąprzechowywaćwartościliczbowewróżnychformatach,
począwszyodróżnicytypudanych:INTEGERalboDECIMAL,jakidefinicjiwob-
rębiesamegotypu(różnicewzadeklarowanejdokładnościiskali).
Pułapka
.Gdydaneźródłowemająniejednakowyformat,częśćprojektantówde-
cydujesięnanajbardziejrestrykcyjnytyp.Decyzjętakąuzasadniająnajczęściejtro-
skąoracjonalnewykorzystaniezasobów.Naprzykład,mającdowyboruCHAR(10)
iCHAR(20),wybierająCHAR(10),podobniegdywgręwchodziINTEGERalboDECI-
MAL(19,4),wybiorąINTEGER.Napierwszyrzutokadecyzjatakawydajesięlogiczna
–jeślidanezmieściłysięwtypiebardziejograniczonym,towidoczniedrugisystem
jestzbytHrozrzutny”.Wrzeczywistościnależyjednakstosowaćodwrotnepodejście
–jeśligdzieśrozszerzonotypdanych,towidoczniezaistniałatakapotrzeba.Zwła-
snegodoświadczeniapamiętamsytuację,gdymusieliśmywsystemiekadrowym
znacznieposzerzyćkolumnęADRES,byupchnąćwniejnazwęulicyHDwudziestego
PierwszegoPraskiegoPułkuPiechotyimieniaDzieciWarszawy”.Winnymsystemie,
zpowodówtechnicznych,wszystkieliczbyzapisywanojakowartościcałkowite,ado-
pieroaplikacjadzieliłajeprzez1000.
1.1.2DefnicjahurtownidanychwedługRalphaKimballa
ZgodniezdefinicjąprzytoczonąnapoczątkurozdziałuwedługKimballahurtownię
należytraktowaćjakokompleksoweśrodowiskozłożonezwieluelementów.Każdy
znichzkoleimaodrębnyprojekt,odrębnenarzędzia,wymagaodrębnejmetodologii.
Dopieropopołączeniuwszystkichfragmentówwspójnącałośćotrzymujemysystem
hurtownidanych.Wtymujęciuhurtowniajestwięcprocesem,anieproduktem.
Wszczególnościhurtowniniemożnautożsamiaćzkopiądanychtransakcyjnychani
zwielowymiarowymmodelemdanych.