Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
1.1.Pojęciapodstawowe
17
jednoznaczneokreśleniedopuszczalnychwartości.Daneopisującetesameinforma-
cjepowinnymiećtakisamformat,sposóbkodowaniaorazpostać.Informacjeza-
silającehurtownięzazwyczajpochodzązwieluźródeł:innychbazdanych,arkuszy
kalkulacyjnych,plikówtekstowych.Postulatspójnościoznacza,żedanebędąprzecho-
wywanezawszewtakimsamymformacie,bezwzględunaźródło,zktóregopocho-
dzą.Otokilkatypowychproblemów,zktórymimusiuporaćsięprojektanthurtowni:
datypochodzącezróżnychźródełmogąznacznieróżnićsięformatem,anawetty-
pemdanychczasembędzietotypDATA,czasemTIMESTAMP,azdarzasiętakże
typCHARlubVARCHAR(wprzypadkupobieraniadanychzplikówtekstowych
mamydoczynieniawyłączniezłańcuchamiznakowymi);
poszczególneźródładanychmogąwykorzystywaćróżnestronykodoweASCII,
awstarszychsystemachtypumainframemożnanatknąćsięnakodowaniewsys-
temieEBCDIC(jesttosystemodchodzącypowoliwzapomnienie);
informacjeprzechowywanewtejsamejtechnologii(np.wrelacyjnejbazieda-
nych)mogąmiećróżnetypyzewzględunaróżnedecyzjeprojektowe.Naprzykład
wspomnianywcześniejadresplacówkimedycznejmożewjednejaplikacjibyć
reprezentowanyjakoCHAR(25),awinnejjakoVARCHAR(50);
systemyźródłowemogąprzechowywaćwartościliczbowewróżnychformatach,
począwszyodróżnicytypudanych:INTEGERalboDECIMAL,jakidefinicjiwob-
rębiesamegotypu(różnicewzadeklarowanejdokładnościiskali).
Pułapka
.Gdydaneźródłowemająniejednakowyformat,częśćprojektantówde-
cydujesięnanajbardziejrestrykcyjnytyp.Decyzjętakąuzasadniająnajczęściejtro-
skąoracjonalnewykorzystaniezasobów.Naprzykład,mającdowyboruCHAR(10)
iCHAR(20),wybierająCHAR(10),podobniegdywgręwchodziINTEGERalboDECI-
MAL(19,4),wybiorąINTEGER.Napierwszyrzutokadecyzjatakawydajesięlogiczna
jeślidanezmieściłysięwtypiebardziejograniczonym,towidoczniedrugisystem
jestzbytHrozrzutny”.Wrzeczywistościnależyjednakstosowaćodwrotnepodejście
jeśligdzieśrozszerzonotypdanych,towidoczniezaistniałatakapotrzeba.Zwła-
snegodoświadczeniapamiętamsytuację,gdymusieliśmywsystemiekadrowym
znacznieposzerzyćkolumnęADRES,byupchnąćwniejnazwęulicyHDwudziestego
PierwszegoPraskiegoPułkuPiechotyimieniaDzieciWarszawy”.Winnymsystemie,
zpowodówtechnicznych,wszystkieliczbyzapisywanojakowartościcałkowite,ado-
pieroaplikacjadzieliłajeprzez1000.
1.1.2DefnicjahurtownidanychwedługRalphaKimballa
ZgodniezdefinicjąprzytoczonąnapoczątkurozdziałuwedługKimballahurtownię
należytraktowaćjakokompleksoweśrodowiskozłożonezwieluelementów.Każdy
znichzkoleimaodrębnyprojekt,odrębnenarzędzia,wymagaodrębnejmetodologii.
Dopieropopołączeniuwszystkichfragmentówwspójnącałośćotrzymujemysystem
hurtownidanych.Wtymujęciuhurtowniajestwięcprocesem,anieproduktem.
Wszczególnościhurtowniniemożnautożsamiaćzkopiądanychtransakcyjnychani
zwielowymiarowymmodelemdanych.