Treść książki
Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
Wewspółczesnymświeciecorazbardziejpotrzebnesąautonomiczneste-
rowniki(programy)działającewskomplikowanym,trudnymdozamodelowa-
niazgóryotoczeniu.Ichprojektowaniewtakisposób,abydziałaływsposób
optymalnynatychmiastpouruchomieniu,byłobybardzokosztownelubnie-
możliwe.Zamiasttegolepiejjestprojektowaćsterownikibyćmożedziałające
początkowowsposóbnieoptymalny,jednakwyposażonewmechanizmyadap-
tacji,iumożliwićimuczeniesięoptymalnegozachowaniawtrakciedziałania.
Wkolejnychrozdziałachomawianesątechnikiadaptacji(uczeniasię),które
mogąbyćzastosowanewtakichsterownikach.
1030DziedzinySkładająceSięnazawartośćpodręcz-
nika
Powyżejnakreślonezagadnieniaporuszanewpodręcznikupojawiająsięwróż-
nychformachwwieluobszarachisąinteresującezwielupunktówwidzenia.Nic
więcdziwnego,żezostałysformalizowanewkilkudziedzinach.Dlanasszczegól-
nieinteresującebędącztery:badaniaoperacyjne,uczeniesięzewzmocnieniem,
teoriasterowaniaisterowanieadaptacyjne.
Badaniaoperacyjne.Dziedzinatapojawiłasięwtrakciedrugiejwojnyświa-
towejjakozalgorytmizowaneinaukowepodejściedopodejmowaniadecyzji.
Badaniaoperacyjnemiałyoferowaćnarzędziadorozwiązywaniaproblemów
związanychzplanowaniemdużychoperacjiwojskowych.Wjejramachzostał
zdefiniowanysekwencyjnyproblemdecyzyjnywwarunkachniepewnościiszereg
algorytmówjegorozwiązywaniaskładającychsięnagałąŹbadańoperacyjnych,
podnazwąprogramowaniedynamiczne[6],znajdująceobecnielicznezastoso-
waniaprzedewszystkimwplanowaniuprodukcjiilogistyce.
UczenieSięzeWzmocnieniem.Decydowanieopodejmowanychakcjachto
zagadnienieinteresującezpunktuwidzeniasztucznejinteligencji.Stajesięono
szczególnieinteresującewówczas,gdyagentpodejmującyteakcjepierwotnienie
wieoichkonsekwencjach,aledokonujecorazlepszychwyborówswoichakcji
wmiaręjakzdobywadoświadczenie.Azatemagentpodejmujeróżnewybory
wanalogicznychokolicznościachiuczysię,któreznichsąnajlepsze.Teoria
opisującazasadęuczeniasięagentanapodstawiedoświadczeniaagentawpo-
dejmowaniuakcjiidoświadczaniaichkonsekwencjitouczeniesięzewzmoc-
nieniem.Rozwiązaniaopracowywanewramachtejteoriibyłypierwotniein-
spirowanepsychologiąbehawioralnąorazobserwacjamiuczeniasięodruchów
warunkowychprzezzwierzęta.Stądwłaśniepochodzisamanazwaπuczeniesię
zewzmocnieniemπ.Pierwsząpublikacjąproponującąmetodytegorodzajuwob-
szarzesztucznejinteligencjibyłartykuł[4].
15