Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
12
WykorzystyWanienarzędzidataMiningWsysteMiesas
darstwdomowych)orazutworzonegonajegopodstawiezbioru
F2007ZYWN,przedstawiającegowydatkinażywność,alkohole
itytońwgospodarstwachdomowych,uwzględniającego31pozycji
takichwydatków(zbiorydanychpochodzązbadaniabudżetów
gospodarstwdomowychprzeprowadzanegoprzezGUSidotyczą
danychz2007r.)[Budżetygospodarstwdomowych…,2008;Me-
todologiabadańbudżetów...,2011;M.Pęczkowski,2011(a)],
zbioruHMEQdotyczącegoudzielaniakredytówprzezbank,liczą-
cego5960obiektów(klientówbanku),zbioruHMEQ_Scoreowy-
bieranejliczbieobserwacji(klientówlubpotencjalnychklientów)
dlaprowadzenianabieżącobadańskoringowychanalizyryzyka
niewywiązaniasięklientówzpłatności(badaniaichewentualnej
niewypłacalności)orazzbiorudanychBANKousługachświad-
czonychprzezbank,liczącego32367obserwacjireprezentujących
transakcjebankoweusługiświadczoneklientomprzezbank,re-
alizowaneprzezokoło8000klientówbanku(tedwazbiorydanych
używanenakursachprowadzonychprzezSASInstituteInc.,np.
[AppliedAnalyticsUsing…,2008]),
zbioruCHURNzdanymidotyczącymiwykorzystywaniausług
przezklientówfirmytelefonicznej,liczącego3333obiekty(klien-
tów,którzyzrezygnowalilubniezrezygnowalizusługfirmy)oraz
zbiorutransakcjisprzedażyizakuputowarów,którymiwanalizo-
wanymprzypadkubyłyrozmaitewarzywa(w[D.T
.Larose,2006]
podaneadresydostroninternetowych,gdziemożnaznaleźć
zbiórCHURN;danedotyczącehandluwarzywamizamieszczone
bezpośredniowtejksiążce).
Pracaskładasięzsiedmiurozdziałów.
Wrozdziale1.zapoznajemyczytelnikazpodstawamiposługiwania
sięprogramemEnterpriseMiner.Opisujemy
,jakrozpocząćpracęzpro-
gramem,jakprzygotowaćdane,którebędąwykorzystywanewanali-
zach,orazjakutworzyćprojektanalizydanych,którybędziezłożony
zdiagramówdefiniującychposzczególnekrokiskładającesięnaanalizę
danych,począwszyodwprowadzeniadanychiwstępnejichanalizy
orazobróbki,poprzezzastosowaniewybranychmetodeksploracjida-
nych,kończącnainterpretacjiuzyskanychwyników.
Wrozdziale2.przedstawiamymetodyprzydatnedoprzeprowa-
dzaniaanalizdanych.Oddzielnączęśćtegorozdziału(podrozdz.2.2)
poświęcamymetodyceanalizydanychSEMMA(Sample,Explore,Modi-
fy,Model,Assess).Jesttooryginalnametodykaopracowanaprzezfirmę
SASInstitute,definiującakolejnekrokiinarzędziaanalizydanych.Opi-
sujemyudostępnianewEnterpriseMinernarzędziaanalizydanych,któ-
rezalecanewramachposzczególnychkrokówmetodyki.Narzędzia