Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
ROZDZIAŁ1.WPROWADZENIE
zbiórdanychsurowychwzbiórwzorców,któremogąbyćnastępniewykorzystane
wprocesiewspomaganiapodejmowaniadecyzji.
Wprocesieodkrywaniawiedzywyróżniamynastępująceetapy:
(1)czyszczeniedanych(ang.datacleaning)wykonywany,abypozbyćsięze
zbiorueksplorowanychdanychniepełnych,niepoprawnychlubnieistotnych
danych;
(2)integracjadanych(ang.dataintegration)poleganałączeniudanychzróż-
nychheterogenicznychirozproszonychźródełdanychwjedenzintegrowany
zbiórdanych;
(3)selekcjadanych(ang.dataselection)celemetapujestselekcjadanychistot-
nychzpunktuwidzeniaprocesuanalizydanych;
(4)konsolidacjaitransformacjadanych(ang.datatransformation,dataconsoli-
dation)poleganaprzekształceniuwyselekcjonowanychdanychdopostaci
wymaganejprzezmetodyeksploracjidanych;
(5)eksploracjadanych(ang.datamining)następujetuodkrywaniepotencjalnie
użytecznychwzorcówzezbioruwyselekcjonowanychdanych;
(6)ocenawzorców(ang.patternevaluation)jakwskazujenazwa,jesttuwy-
konywanaocenaiidentyfikacjainteresującychwzorców;
(7)wizualizacjawzorców(ang.knowledgerepresentation)przedstawienie
otrzymanychinteresującychwzorcówwtakisposób,abyumożliwićużytkow-
nikowiichinterpretacjęizrozumienie.
Wprzedstawionymujęciueksploracjadanychstanowitylkojedenzetapów
procesuodkrywaniawiedzy,któregocelemjestodkrywaniewzorcówwzbiorze
eksplorowanychdanych.Celempozostałychetapówprocesuodkrywaniawiedzy
jestprzygotowaniedanych,ichselekcjadoeksploracji,czyszczenie,definiowanie
dodatkowejwiedzyprzedmiotowej,interpretacjawynikóweksploracjiiwizualiza-
cja.Najczęściejniektóreetapyprocesuodkrywaniawiedzywykonywanełącz-
nie.Przykładowo,etapyczyszczeniadanychorazintegracjidanychstanowiąinte-
gralnączęśćprocesubudowyhurtownidanych,aetapyselekcjidanych,transfor-
macjiikonsolidacjidanychmogąbyćzrealizowanepoprzezzbiórzapytań.Wzor-
ceodkrytenaetapieeksploracjidanychprezentowaneużytkownikowi,alemogą
byćzapamiętanewbaziedanychlubmagazyniedanychdodalszejeksploracji.
Oprogramowanieimplementującemetodyeksploracjidanychnazywamysys-
tememeksploracjidanych(ang.dataminingsystem).Wpoczątkowymetapieroz-
wojusystemóweksploracjidanychalgorytmyeksploracjidanychbyłyimplemen-
towanealbowpostaciniezależnychaplikacji(ang.stand-alonedataminingsys-
tems),albobezpośredniowewnątrzaplikacjiużytkownika.Danedoeksploracji
byłynajczęściejprzechowywanewlokalnychsystemachplikówużytkownikalub
systemachbazdanych.Wtymdrugimprzypadkusystembazydanychbyłwyłącz-
nierepozytoriumdanych,azaimplementowanealgorytmyeksploracjidanychnie
korzystałyzfunkcjonalnościoferowanejprzezsystemzarządzaniabaządanych.
Pracebadawczeprowadzonenadrozszerzeniemfunkcjonalnościsystemówbaz
5