Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
Spistreści
I
1O
wprowadzenie
Preliminaria|||||||||||||||||||||||||||||
1|1|Przykładyzagadnień,wktórychpojawiasiępotrzebaadaptacji
iuczeniasię||||||||||||||||||||||||||||
1|2|Celpodręcznikaiporuszanezagadnienia||||||||||||
1|3|Dziedzinyskładającesięnazawartośćpodręcznika||||||
1|4|Adaptacjaiuczeniesięjakodrogadointeligentnegozachowania
sięmaszyniprogramów|||||||||||||||||||||
1|5|Organizacjapodręcznika|||||||||||||||||||||
1|6|Potrzebnawiedzawstępna||||||||||||||||||||
2O
Optymalizacjastochastyczna
2|1|Algorytmgradientuprostego|||||||||||||||||||
2|2|ProceduraStochastycznegoNajszybszegoSpadku,SGD||||
3O
Aproksymacjafunkcjiipodstawowemechanizmyadaptacji
3|1|Aproksymatoryizagadnienieaproksymacji|||||||||||
3|2|Zagadnienieuczenianazbiorzenieskończonym,on-line||||
3|3|Perceptronwielowarstwowy|||||||||||||||||||
3|4|Uczeniesięprzyużyciuaproksymacjistochastycznej|||||
3|5|Zagadnieniapraktycznezwiązanezużywaniemsiecineurono-
wychwsystemachuczącychsię|||||||||||||||||
4O
ProcesDecyzyjnyMarkowaiprogramowaniedynamiczne
4|1|ProcesDecyzyjnyMarkowa|||||||||||||||||||
4|2|Funkcjawartości-akcjiiindukowaniestrategii|||||||||
4|3|Klasycznyalgorytmprogramowaniadynamicznego||||||
4|4|Programowaniedynamicznewalgorytmice|||||||||||
4|5|AlgorytmIteracjiStrategii||||||||||||||||||||
4|6|AlgorytmIteracjiFunkcjiwartości|||||||||||||||
II
UczenieSięzeWzmocnieniem||||||||||||||||||
5O
Podstawy
5|1|NieznanyzgóryProcesDecyzyjnyMarkowa||||||||||
5|2|AlgorytmyQ-Le!rnźngiSARSA|||||||||||||||||
9
11
13
14
15
16
18
19
21
21
23
31
31
35
37
43
46
4g
49
52
53
56
58
59
61
63
63
66
5