Treść książki
Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
XIVPRZEDMOWA
PodstawyjęzykaPython3.
ZaczynamyodomówieniainstalacjidystrybucjiAna-
czerpującysposóbpodstawy„bazowego”językaPython–wkażdymraziewzakresie
potrzebnymdorozpoczęciaprawdziwejprzygodyzdatascience.Wszczególności
Przetwarzaniedanych.
Wdrugiejczęścizajmujemysięzagadnieniamizwiązanymi
zewstępnymprzetwarzaniemdanychiprzygotowaniemichdoanalizy.Omawiamy
szczegółowopakietnumpy,któryudostępniawektory,macierzeiinnen-wymiarowe
skupiamysięnaopartymnanumpypakieciepandas,przyktóregoużyciumożemy
zapominamyprzytymoinnychważnychzagadnieniach:przetwarzaniunapisówiwydo-
kilkudziesięciućwiczeń,któresąpoświęconenajczęściejwykonywanymwpraktyce
operacjomnaramkachdanych,m.in.wyszukiwaniuinformacji,przekształceniuzmien-
nych,filtrowaniuwierszyikolumn,agregacjizmiennychwpodgrupachutworzonych
przezkombinacjewieluczynnikóworazzłączaniutabel.
Analizadanych.Wtrzeciejczęścinaszauwagajestskupionanaszerokopojętej
analiziedanych,czylinaróżnorakichmetodach,którepozwalająprzekuwaćsurowe
informacjenaużytecznąwiedzę.Najpierwpoznajemypakietymatplotlibiseaborn,na
którychpodstawiebędziemydokonywaćwizualizacjiróżnychaspektówudostępnionych
–wszczególnościproblemówestymacjinieznanychparametrówicharakterystykroz-
kładóworazweryfikacjihipotez.Dziękinimbędziemypotrafiliodpowiadaćnapewne
istotnepytaniawsytuacji,gdymamydoczynieniaznie-wielkimipróbkami,np.czy
wpływokreślonegoczynnikanazachowaniesiępewnejzmiennejjestrzeczywiście
wegouczeniasię:regresji,klasyfikacjiianalizyskupień.Przyichużyciumożemymode-
lowaćróżnerodzajezależnościmiędzyzmiennymi,przewidywaćwartościkluczowych
charakterystykdlajeszczeniezaobserwowanychpróbekorazdokonywaćautomatycznej
segmentacji(podziału)zbiorudanychnaciekawepodgrupy.
Tworzeniewłasnegooprogramowania.Ostatniączęśćksiążkipoświęcamyzagad-
nieniomzdziedzinyinżynieriioprogramowania–dobrzedziałającyprocesprzetwa-
rzaniaczymodelowaniadanychnierzadkonależywdrożyćjakoczęśćwiększegopro-