Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
1.UCZENIEMASZYNOWEJAKOELEMENTEKSPERYMENTÓWDATASCIENCE
1.1.
Eksploracjadanychjakotechnika
wspomaganiadecyzji
Eksploracjadanych(datamining)jestrelatywnienowądziedzinąinformatykipowstałą
zpołączeniastatystyki,technologiibazodanowychialgorytmiki.Wramachalgorytmiki
najważniejszarolęodgrywajątusiecineuronoweczydrzewadecyzyjne.
Odsamegopoczątku(czyliostatniejdekadyXXw.)eksploracjadanychbyłaetapem
procesuodkrywaniawiedzy(knowledgediscovery)itakąjejdefinicjęmożemyodnaleźć
wpionierskimartykuleFayyada,Piatetsky’ego-ShapiroiSmytha[26](rys.1.1).
Rysunek1.1.Procesodkrywaniawiedzyeksploracjadanychjestczwartymzpięciuetapów
tegoprocesu
Wyraźniewidać,żecentralnymelementemprocesusądane,którezostająpoddane
kolejnymprzekształceniomimodelowanewceluwydobyciaukrytychwnichinformacji.
Procestenniezmieniłsiędodziś,copodkreślonomiędzyinnymiwopublikowa-
nymw2012r.przezComputingCommunityConsortiumdokumencieChallengesand
OpportunitieswithBigData[8](rys.1.2).
Ponieważrewolucjabigdataizwiązanezniątechnologieinformatyczneniewpłynęły
zasadniczonazmianęprocesuwydobywaniawiedzyzdanych,eksperymentydata
sciencemożemyzsukcesemprzeprowadzać,wykorzystującopracowanąw2000r.meto-
dykęCRISP-DM(CRossIndustryStandardProcessforDataMining)[9](rys.1.3).
2