Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
ROZDZIAŁ1.WPROWADZENIE
Najpopularniejsząklasyfikacjąmetodeksploracjidanychjestklasyfikacja
tychmetodzewzględunaceleksploracji.Ztegopunktuwidzeniametodyeks-
ploracjidanychmożnapodzielić,bardzoogólnie,nanastępująceklasy[HK98,
TSK06]:
Odkrywanieasocjacjinajszerszaklasametodobejmująca,najogólniej,me-
todyodkrywaniainteresującychzależnościlubkorelacji,nazywanychogólnie
asocjacjami,pomiędzydanymiwdużychzbiorachdanych.Wynikiemdzia-
łaniametododkrywaniaasocjacjizbioryregułasocjacyjnychopisujących
znalezionezależnościi/lubkorelacje.
Klasyfikacjaipredykcjametodyodkrywaniamodeli(takzwanychklasy-
fikatorów)lubfunkcjiopisującychzależnościpomiędzyzadanąklasyfikacją
obiektówaichcharakterystyką.Odkrytemodeleklasyfikacjinastępniewy-
korzystywanedoklasyfikacjinowychobiektów.
Grupowanie(analizaskupień,klastrowanie)metodyznajdowaniaskończo-
nychzbiorówklasobiektówmającychpodobnecechy.Wprzeciwieństwie
dometodklasyfikacjiipredykcjiklasyfikacjaobiektów(podziałnaklasy)
niejestznanaapriori,leczjestcelemmetodgrupowania.Metodytegrupu-
obiektywklasywtakisposób,abymaksymalizowaćpodobieństwowe-
wnątrzklasoweobiektówiminimalizowaćpodobieństwopomiędzyklasami
obiektów.
Analizasekwencjiiprzebiegówczasowychmetodyanalizysekwencjida-
nychkategorycznych(np.sekwencjibiologicznych),sekwencjizbiorówda-
nychkategorycznychorazprzebiegówczasowych.Metodyanalizysekwencji
danychmająnaceluznajdowanieczęstychpodsekwencji(tzw.wzorcówse-
kwencji,częstychepizodów),klasyfikacjęigrupowaniesekwencji,ametody
analizyprzebiegówczasowychsłużągłówniedoznajdowaniatrendów,po-
dobieństw,anomaliiorazcykliwprzebiegachczasowych.
Odkrywaniecharakterystykmetodyznajdowaniazwięzłychopisówlub
podsumowańogólnychwłasnościklasobiektów.Znajdowaneopisymogą
miećpostaćregułcharakteryzującychlubregułdyskryminacyjnych.Wtym
drugimprzypadkuopisująróżnicemiędzyogólnymiwłasnościamitakzwa-
nejklasydocelowej(klasyanalizowanej)awłasnościamitakzwanejklasy
(zbioruklas)kontrastującej(klasyporównywanej).
Eksploracjatekstuidanychsemistrukturalnychmetodyreprezentacjiiana-
lizydanychtekstowychorazdanychsemistrukturalnych(XML)wceluich
grupowania,klasyfikacjiorazwspieraniaprocesuwyszukiwania.
EksploracjawwwmetodyanalizykorzystaniazsieciWebwceluznajdowa-
niatypowychwzorcówzachowańużytkownikówsieci,metodyanalizypo-
wiązaństronwsieciWebwceluokreśleniaważnościikoncentratywności
stron(atymsamym,poprawyefektywnościprocesuwyszukiwaniastron),
metodygrupowaniaiklasyfikacjistronwwwnapodstawieichzawartości
ischematuzewnętrznego,wreszcie,metodyanalizyukrytychsiecispołecz-
8