Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
cjipołączeńsynaptycznychmiędzyneuronami.Oczywiściemózgczłowiekaod
początkumapotencjał,abytekompetencjenabyć,aleostatecznienabywaje
dziękiadaptacjiiuczeniusię.
1050Organizacjapodręcznika
Niniejszypodręcznikjestpodzielonynaczteryczęści.Częśćpierwszazawiera
preliminariadotyczącepodstawowychpojęćikoncepcjizwiązanychzadapta-
cjąisekwencyjnympodejmowaniemdecyzji.Częśćdrugajestpoświęconadzie-
dzinieuczeniasięzewzmocnieniem.Częśćtrzeciaopisujesterowanieadapta-
cyjne.Częśćczwartajestpoświęconawybranyminnympodejściomdoadaptacji
iuczeniasięwkontekściesekwencyjnegopodejmowaniadecyzjiisterowania.
Wczęścipierwszej,pozaniniejszym,takżetrzyrozdziały.Rozdział2jest
poświęconyoptymalizacjistochastycznej,czylipodstawowemumechanizmowi
służącemuadaptacjidolosowonastępującychzdarzeń.Rozdział3poświęcony
jestzagadnieniuaproksymacjifunkcji,czylipodstawowemunośnikowiinfor-
macjizdobytejnadrodzeuczeniasięiadaptacji.Kolejnyrozdziałomawiase-
kwencyjnyproblemdecyzyjnywwarunkachniepewności,jegomodelwpostaci
procesudecyzyjnegoMarkowaorazpodstawowetechnikirozwiązywaniatego
problemu,tj.metodprogramowaniadynamicznego.
Częśćdrugajestpoświęconauczeniusięzewzmocnieniem.Rozdziały5Ź7
poświęconeklasycznymkoncepcjomialgorytmomztejdziedziny.Rozdział8
jestpoświęconyteoriiimetodom,którychzbieżnośćzostałaformalnieudowod-
niona.Rozdziały9,1Oopisująnajbardziejefektywneobecniealgorytmyuczenia
sięzewzmocnieniem,znanewchwilipisaniapodręcznika.Rozdziały11Ź13doty-
cząuczeniasięzewzmocnieniemwspecyficznych,aczistotnychzpraktycznego
punktuwidzenia,warunkach:wgęstejdyskretyzacjiczasu,znieobserwowalnym
stanemiuczeniasięwspólniezinnymiagentami.
Częśćtrzeciaopisujesterowanieadaptacyjne.Rozdziały14,15zawierają
preliminariazteoriisterowania.Rozdziały16,17opisująsterowanieadapta-
cyjnezmodelemreferencyjnym,zaśrozdział18opisujekoncepcjęsamostroją-
cychsięregulatorów.
Częśćczwartastanowiprzeglądpodejśćdouczenia-się/adaptacji,którenie
wpisująsięjednoznaczniedożadnegozgłównychnurtów.to,odpowied-
nio,AproksymowaneProgramowanieDynamiczne(ang.ApproximateDynamic
Programming),StochastyczneSterowanieAdaptacyjne(ang.StochasticAdap-
tiveControl),Sterowaniez1teracyjnymUczeniemsię(ang.IterativeLearning
Control)orazFiltrKalmana.
18