Treść książki
Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
ROZDZIAŁ1.WPROWADZENIE
zbiórdanychsurowychwzbiórwzorców,któremogąbyćnastępniewykorzystane
wprocesiewspomaganiapodejmowaniadecyzji.
Wprocesieodkrywaniawiedzywyróżniamynastępująceetapy:
(1)czyszczeniedanych(ang.datacleaning)–wykonywany,abypozbyćsięze
zbiorueksplorowanychdanychniepełnych,niepoprawnychlubnieistotnych
danych;
(2)integracjadanych(ang.dataintegration)–poleganałączeniudanychzróż-
nychheterogenicznychirozproszonychźródełdanychwjedenzintegrowany
zbiórdanych;
(3)selekcjadanych(ang.dataselection)–celemetapujestselekcjadanychistot-
nychzpunktuwidzeniaprocesuanalizydanych;
(4)konsolidacjaitransformacjadanych(ang.datatransformation,dataconsoli-
dation)–poleganaprzekształceniuwyselekcjonowanychdanychdopostaci
wymaganejprzezmetodyeksploracjidanych;
(5)eksploracjadanych(ang.datamining)–następujetuodkrywaniepotencjalnie
użytecznychwzorcówzezbioruwyselekcjonowanychdanych;
(6)ocenawzorców(ang.patternevaluation)–jakwskazujenazwa,jesttuwy-
konywanaocenaiidentyfikacjainteresującychwzorców;
(7)wizualizacjawzorców(ang.knowledgerepresentation)–przedstawienie
otrzymanychinteresującychwzorcówwtakisposób,abyumożliwićużytkow-
nikowiichinterpretacjęizrozumienie.
Wprzedstawionymujęciueksploracjadanychstanowitylkojedenzetapów
procesuodkrywaniawiedzy,któregocelemjestodkrywaniewzorcówwzbiorze
eksplorowanychdanych.Celempozostałychetapówprocesuodkrywaniawiedzy
jestprzygotowaniedanych,ichselekcjadoeksploracji,czyszczenie,definiowanie
dodatkowejwiedzyprzedmiotowej,interpretacjawynikóweksploracjiiwizualiza-
cja.Najczęściejniektóreetapyprocesuodkrywaniawiedzysąwykonywanełącz-
nie.Przykładowo,etapyczyszczeniadanychorazintegracjidanychstanowiąinte-
gralnączęśćprocesubudowyhurtownidanych,aetapyselekcjidanych,transfor-
macjiikonsolidacjidanychmogąbyćzrealizowanepoprzezzbiórzapytań.Wzor-
ceodkrytenaetapieeksploracjidanychsąprezentowaneużytkownikowi,alemogą
byćzapamiętanewbaziedanychlubmagazyniedanychdodalszejeksploracji.
Oprogramowanieimplementującemetodyeksploracjidanychnazywamysys-
tememeksploracjidanych(ang.dataminingsystem).Wpoczątkowymetapieroz-
wojusystemóweksploracjidanychalgorytmyeksploracjidanychbyłyimplemen-
towanealbowpostaciniezależnychaplikacji(ang.stand-alonedataminingsys-
tems),albobezpośredniowewnątrzaplikacjiużytkownika.Danedoeksploracji
byłynajczęściejprzechowywanewlokalnychsystemachplikówużytkownikalub
systemachbazdanych.Wtymdrugimprzypadkusystembazydanychbyłwyłącz-
nierepozytoriumdanych,azaimplementowanealgorytmyeksploracjidanychnie
korzystałyzfunkcjonalnościoferowanejprzezsystemzarządzaniabaządanych.
Pracebadawczeprowadzonenadrozszerzeniemfunkcjonalnościsystemówbaz
5