Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
XIVPRZEDMOWA
PodstawyjęzykaPython3.
ZaczynamyodomówieniainstalacjidystrybucjiAna-
condaisposobówpracyznotatnikamiJupyterwrozdz.1.Następnieomawiamywwy-
czerpującysposóbpodstawy„bazowego”językaPythonwkażdymraziewzakresie
potrzebnymdorozpoczęciaprawdziwejprzygodyzdatascience.Wszczególności
interesująnasnajważniejszetypydanych:wartościskalarne(rozdz.2),listy,krotki
iinnetypysekwencyjneoraziterowalne(rozdz.3),słownikiizbiory(rozdz.4),atakże
instrukcjesterujące(rozdz.5)isposobydefiniowaniawłasnychfunkcji(rozdz.6).
Przetwarzaniedanych.
Wdrugiejczęścizajmujemysięzagadnieniamizwiązanymi
zewstępnymprzetwarzaniemdanychiprzygotowaniemichdoanalizy.Omawiamy
szczegółowopakietnumpy,któryudostępniawektory,macierzeiinnen-wymiarowe
tabliceatakżeszerokągamęmetodifunkcjioperującychnanich(rozdz.7).Dalej
skupiamysięnaopartymnanumpypakieciepandas,przyktóregoużyciumożemy
reprezentowaćiprzekształcaćrekordyzapisanewpostacitabelarycznej(rozdz.8).Nie
zapominamyprzytymoinnychważnychzagadnieniach:przetwarzaniunapisówiwydo-
bywaniuwiedzyzinformacjitekstowych(rozdz.9),obsłudzeplikówiautomatycznym
zbieraniuinformacjizinternetu(rozdz.10),atakżełączeniusięzbazamidanych
SQL(rozdz.11).Cowięcej,nazakończenietejpartiimateriałuprzedstawiamyzestaw
kilkudziesięciućwiczeń,którepoświęconenajczęściejwykonywanymwpraktyce
operacjomnaramkachdanych,m.in.wyszukiwaniuinformacji,przekształceniuzmien-
nych,filtrowaniuwierszyikolumn,agregacjizmiennychwpodgrupachutworzonych
przezkombinacjewieluczynnikóworazzłączaniutabel.
Analizadanych.Wtrzeciejczęścinaszauwagajestskupionanaszerokopojętej
analiziedanych,czylinaróżnorakichmetodach,którepozwalająprzekuwaćsurowe
informacjenaużytecznąwiedzę.Najpierwpoznajemypakietymatplotlibiseaborn,na
którychpodstawiebędziemydokonywaćwizualizacjiróżnychaspektówudostępnionych
namdanychorazwynikówprzeprowadzanychanaliz(rozdz.12).Następnieprzecho-
dzimydoopisudostępnychwśrodowiskuPythonmetodstatystycznych(rozdz.13)
wszczególnościproblemówestymacjinieznanychparametrówicharakterystykroz-
kładóworazweryfikacjihipotez.Dziękinimbędziemypotrafiliodpowiadaćnapewne
istotnepytaniawsytuacji,gdymamydoczynieniaznie-wielkimipróbkami,np.czy
wpływokreślonegoczynnikanazachowaniesiępewnejzmiennejjestrzeczywiście
istotny.Zkoleiwrozdz.14omawiamytrzynajważniejszegrupyalgorytmówmaszyno-
wegouczeniasię:regresji,klasyfikacjiianalizyskupień.Przyichużyciumożemymode-
lowaćróżnerodzajezależnościmiędzyzmiennymi,przewidywaćwartościkluczowych
charakterystykdlajeszczeniezaobserwowanychpróbekorazdokonywaćautomatycznej
segmentacji(podziału)zbiorudanychnaciekawepodgrupy.
Tworzeniewłasnegooprogramowania.Ostatniączęśćksiążkipoświęcamyzagad-
nieniomzdziedzinyinżynieriioprogramowaniadobrzedziałającyprocesprzetwa-
rzaniaczymodelowaniadanychnierzadkonależywdrożyćjakoczęśćwiększegopro-
jektuinformatycznego.Itakwrozdz.15poznajemysposobytworzeniawłasnych
modułów,pakietówiskryptów,aw16własnychklas,czylinowychtypówdanych.