"Hurtownie danych. Teoria i praktyka"

Identyfikator Librowy: 119454

Spis treści

CZĘŚĆ I. ŁYK TEORII Z ODROBINĄ PRAKTYKI 12

Rozdział 1. Czym jest hurtownia danych 14

1.1. Pojęcia podstawowe 16

1.1.1. Definicja hurtowni danych według Billa Inmona 17

1.1.2. Definicja hurtowni danych według Ralpha Kimballa 18

1.1.3. Data mart 19

1.2. Model wielowymiarowy 20

1.3. ETL 28

1.4. Jak powstaje hurtownia 28

1.5. Wprowadzenie do przykładowego projektu oraz studium przypadku 29

Rozdział 2. Wymiary 32

2.1. Klasyfikacja wymiarów ze względu na zawartość 34

2.1.1. Wymiary uzgodnione 34

2.1.2. Wymiary abstrakcyjne 36

2.1.3. Wymiary zdegenerowane 40

2.1.4. Wymiary wielokrotnego stosowania 42

2.2. Klasyfikacja wymiarów ze względu na obsługę zmian 43

2.2.1. Wymiary stałe 43

2.2.2. Wymiary wolnozmienne 46

2.2.2.1. Typy podstawowe – typ 0 46

2.2.2.2. Typy podstawowe – typ 1 48

2.2.2.3. Typy podstawowe – typ 2 49

2.2.2.4. Typy podstawowe – typ 3 54

2.2.2.5. Typy podstawowe – typ 4 55

2.2.2.6. Typy podstawowe – podsumowanie 57

2.2.2.7. Typy hybrydowe - zastosowanie 59

2.2.2.8. Typy hybrydowe – miniwymiary 59

2.2.2.9. Typy hybrydowe – typ 5 62

2.2.2.10. Typy hybrydowe – typ 6 64

2.2.2.11. Typy hybrydowe – typ 6 z serią kolumn historycznych 64

2.2.2.12. Typy hybrydowe – typ 7 66

2.2.3. Wymiary szybkozmienne 67

2.2.2.13. Typy hybrydowe – podsumowanie 67

2.3. Rozważania na temat daty i czasu 69

Rozdział 3. Fakty 76

3.1. Ziarnistość 78

3.1.1. Tabele faktów o mieszanej ziarnistości 80

3.2. Struktura tabeli faktów 81

3.3. Klasyfikacja tabel faktów 83

3.4. Miary 100

3.4.1. Wartości tekstowe jako miary 102

3.5. Fakty bez miar 103

CZĘŚĆ II. DWA ŁYKI PRAKTYKI ZE SZCZYPTĄ TEORII 106

Rozdział 4. Gromadzenie wymagań 108

4.1. Wymagania biznesowe 111

4.1.1. Wykresy w modelu koncepcyjnym 114

4.1.2. Arkusze obiektów w modelu koncepcyjnym 117

4.2. Wymagania systemowe 122

4.2.1. Analiza danych źródłowych 123

4.2.2. Wymagania dotyczące interfejsu użytkownika 133

4.3. Studium przypadku 135

4.2.3. Wymagania dotyczące implementacji 135

Rozdział 5. Model logiczny 142

5.1. Model hurtowni i modele cząstkowe 144

5.2. Konwencje nazewnictwa 145

5.3. Mosty 145

5.4. Hierarchia wymiarów 156

5.4.1. Definiowanie hierarchii w poziomie 157

5.4.1.1. Definiowanie w poziomie hierarchii niesymetrycznych 162

5.4.2. Definiowanie hierarchii w pionie 165

5.4.2.1. Mosty hierarchii 165

5.4.2.2. Historia zmian hierarchii 177

5.5. Schemat gwiazdy 180

5.6. Schemat płatka śniegu 180

5.7. Konstelacja faktów 182

5.8. Studium przypadku 182

CZĘŚĆ III. PRAKTYKA W CZYSTEJ POSTACI 186

Rozdział 6. Model fizyczny 188

6.1. Standardy nazewnictwa 190

6.2. Bazy kolumnowe a bazy tradycyjne 193

6.2.1. Koncepcja bazy kolumnowej i podstawowe operacje 194

6.2.2. Inne operacje na danych w bazach kolumnowych 197

6.3. Fizyczna lokalizacja danych 201

6.3.1. Partycjonowanie 203

6.4. Indeksy i indeksowanie 205

6.4.1. B+-drzewo 206

6.4.2. Indeks klastrowy 209

6.4.3. Indeks bitmapowy 210

6.4.4. Indeks połączeniowy 212

6.4.5. Inne typy indeksów 214

6.4.6. Indeksowanie tabel wymiarów i faktów 215

6.5. Wartość NULL 216

6.6. Arkusz obiektów dla modelu fizycznego 217

6.7. Studium przypadku 218

Rozdział 7. Projektowanie procesu ETL 224

7.1. Obszar przejściowy 226

7.1.1. Obiekty w obszarze przejściowym 228

7.2. Sekwencja ładowania 231

7.3. Arkusz obiektów 233

7.4. Opóźnione dane 239

7.4.1. Opóźnione wiersze wymiarów 239

7.4.2. Opóźnione fakty 244

7.5. Okres przechowywania danych 245

7.6. Kłopoty z danymi źródłowymi 250

7.7. Studium przypadku 253

Rozdział 8. Zapytania analityczne 260

8.1. Zabawy z operatorem GROUP BY 263

8.1.1. Operator ROLLUP 265

8.1.2. Operator CUBE 268

8.1.3. Operator GROUPING SETS 269

8.1.4. Grupowanie a wartość NULL 272

8.2. Instrukcja CASE 276

8.3. Funkcje OLAP 279

8.3.1. Tworzenie rankingów 293

8.3.2. Przetwarzanie wartości NULL przez funkcje OLAP 297

Rozdział 9. Hurtowniany miszmasz 300

9.1. Tam i z powrotem, czyli z hurtowni do aplikacji operacyjnej 302

9.2. Analiza wydajnościowa 303

9.3. Strategie bezpieczeństwa 308

9.4. Zapewnienie wysokiej dostępności 309

9.5. Widoki zmaterializowane 321

9.6. Kontrola jakości 323

9.7. Zapytania i raporty ad hoc 324

Zakończenie 328

Dodatek A. Glosariusz 330

Dodatek B. Słowniczek angielsko-polski 334

Dodatek C. Słowniczek polsko-angielski 336

Bibliografia 338