Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
16
Przedmowa
cji,gdzieważnejestograniczenieliczbykosztownycheksperymentów
chemicznychbezryzykaprzeoczeniaistotnychrodzajówstrukturche-
micznych.
(e)Wypadawreszciewspomniećorolianalizyskupieńiwyzwaniach,jakie
stwarzakoniecznośćprzetwarzaniaogromnychzbiorówdanych[306].
Abynadmiernienierozwijaćlistypotencjalnychzastosowań,powiedzmytyl-
ko,żekorzystaniezanalizyskupieńwynikaprzynajmniejztrzechpowodów:
(a)Abyuzyskaćwglądwnaturędanych,aprzedewszystkim:wskazaćdane
typoweinietypowe(outliery),wykryćpotencjalneanomalie,znaleźć
ukrytecechy,czywreszcieabymócformułowaćiweryfikowaćhipotezy
odnoszącesiędorelacjimiędzyobserwacjami.
(b)Abyuzyskaćzwartyopisdanych,wybraćnajbardziejreprezentatywne
obiekty.Klasycznymzastosowaniemjesttukompresjaobrazów.
(c)Abyotrzymaćnaturalnąklasyfikacjędanych,np.wyznaczającpodo-
bieństwamiędzyparamiobiektów,utworzyćstosownestrukturyhierar-
chiczne.
Metodyanalizyskupieństosowanetam,gdziezależynamnazrozu-
mieniunaturyzjawiskareprezentowanegoprzezzbiórobserwacji,naswo-
istymstreszczaniuzawartościdużychzbiorówdanychinaichefektywnym
przetwarzaniu.
JainiDubes[198]wymieniająnastępującewyzwaniazwiązanezprak-
tycznymstosowaniemanalizyskupień:
(a)Cotojestskupienie(grupa,moduł)?
(b)Jakichcechnależyużywaćdoanalizyzebranychdanych?
(c)Czynormalizowaćdane?
(d)Czywanalizowanymzbiorzewystępujądaneodstające,ajeślitakjak
jetraktować?
(e)Jakdefiniowaćpodobieństwomiędzyparamiobiektów?
(f)Corobić,jeżeliwanalizowanymzbiorzewystępujądaneniekompletne?
(g)Jakwieleskupieńistniejerzeczywiściewzbiorzedanych?Czywogóle
mamydoczynieniazeskupieniami?
(g)Jakiejmetodyużyćwkonkretnejsytuacji?
(i)Czywyłonionypodziałdanychjestzasadny?
Naniektóreztychpytańmożnaznaleźćprzynajmniejczęścioweodpo-
wiedziwmnogościksiążekpoświęconychróżnymaspektomanalizysku-
pień:[10],[51],[111],[198],[6]czy[120].
Ostatnielataprzynosząjednakszeregnowychwyzwań.Popierwsze,
analizaskupieństosowanajestobecniedoprzetwarzaniaogromnychzbiorów