Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
Wewspółczesnymświeciecorazbardziejpotrzebneautonomiczneste-
rowniki(programy)działającewskomplikowanym,trudnymdozamodelowa-
niazgóryotoczeniu.Ichprojektowaniewtakisposób,abydziałaływsposób
optymalnynatychmiastpouruchomieniu,byłobybardzokosztownelubnie-
możliwe.Zamiasttegolepiejjestprojektowaćsterownikibyćmożedziałające
początkowowsposóbnieoptymalny,jednakwyposażonewmechanizmyadap-
tacji,iumożliwićimuczeniesięoptymalnegozachowaniawtrakciedziałania.
Wkolejnychrozdziałachomawianetechnikiadaptacji(uczeniasię),które
mogąbyćzastosowanewtakichsterownikach.
1030DziedzinySkładająceSięnazawartośćpodręcz-
nika
Powyżejnakreślonezagadnieniaporuszanewpodręcznikupojawiająsięwróż-
nychformachwwieluobszarachiinteresującezwielupunktówwidzenia.Nic
więcdziwnego,żezostałysformalizowanewkilkudziedzinach.Dlanasszczegól-
nieinteresującebędącztery:badaniaoperacyjne,uczeniesięzewzmocnieniem,
teoriasterowaniaisterowanieadaptacyjne.
Badaniaoperacyjne.Dziedzinatapojawiłasięwtrakciedrugiejwojnyświa-
towejjakozalgorytmizowaneinaukowepodejściedopodejmowaniadecyzji.
Badaniaoperacyjnemiałyoferowaćnarzędziadorozwiązywaniaproblemów
związanychzplanowaniemdużychoperacjiwojskowych.Wjejramachzostał
zdefiniowanysekwencyjnyproblemdecyzyjnywwarunkachniepewnościiszereg
algorytmówjegorozwiązywaniaskładającychsięnagałąŹbadańoperacyjnych,
podnazwąprogramowaniedynamiczne[6],znajdująceobecnielicznezastoso-
waniaprzedewszystkimwplanowaniuprodukcjiilogistyce.
UczenieSięzeWzmocnieniem.Decydowanieopodejmowanychakcjachto
zagadnienieinteresującezpunktuwidzeniasztucznejinteligencji.Stajesięono
szczególnieinteresującewówczas,gdyagentpodejmującyteakcjepierwotnienie
wieoichkonsekwencjach,aledokonujecorazlepszychwyborówswoichakcji
wmiaręjakzdobywadoświadczenie.Azatemagentpodejmujeróżnewybory
wanalogicznychokolicznościachiuczysię,któreznichnajlepsze.Teoria
opisującazasadęuczeniasięagentanapodstawiedoświadczeniaagentawpo-
dejmowaniuakcjiidoświadczaniaichkonsekwencjitouczeniesięzewzmoc-
nieniem.Rozwiązaniaopracowywanewramachtejteoriibyłypierwotniein-
spirowanepsychologiąbehawioralnąorazobserwacjamiuczeniasięodruchów
warunkowychprzezzwierzęta.Stądwłaśniepochodzisamanazwaπuczeniesię
zewzmocnieniemπ.Pierwsząpublikacjąproponującąmetodytegorodzajuwob-
szarzesztucznejinteligencjibyłartykuł[4].
15