Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
ROZDZIAŁ3
Przezzdefiniowanie
p
(
x
)jakowartości
δ
przesuniętejo
p
otrzymujemy
nieskończeniewąskiszczytmasyprawdopodobieństwa,gdziex=p.
PowszechnymzastosowaniemrozkładudeltaDiracajestużyciegojako
składnikarozkładuempirycznego:
p(x)=
ˆ
m
1
Σ
źl1
m
δ(xx(ź)).
(3.28)
Przypisujeonmasęprawdopodobieństwa
m
1
dokażdegoz
m
punktów
x(1)j...jx(m)
napodstawiezbiorudanychlubkolekcjipróbek.Rozkładdelta
Diracajestkoniecznyjedyniedozdefiniowaniarozkładuempirycznegowzglę-
demzmiennychciągłych.Dlazmiennychdyskretnychsytuacjajestprostsza:
rozkładempirycznymożnaokreślićjakorozkładwielopunktowyzprawdo-
podobieństwemzwiązanymzkażdąmożliwąwartościąwejściową,którajest
równaempirycznejczęstotliwościtejwartościwzbiorzeszkoleniowym.
Możnatraktowaćrozkładempirycznyutworzonyzezbiorudanychprzy-
kładówtestowychjakookreślenierozkładupróbkowanegopodczasszkolenia
modelunatymzbiorzedanych.Innaważnąperspektywądlarozkładuempi-
rycznegojestfakt,żejesttogęstośćprawdopodobieństwamaksymalizująca
wiarygodnośćdanychszkoleniowych(patrzpunkt5.5).
3.9.6.Rozkładymieszane
Częstodefiniujesięrozkładyprawdopodobieństwa,łączączesobąprostsze
rozkłady.Jednymzesposobówłączeniarozkładówjestbudowa
rozkładu
mieszanego
.Składasięonzkilkurozkładówskładowych.Przykażdejpróbie
wybór,któregoskładnikaużyćdowygenerowaniapróbki,jestokreślonyprzez
próbkowanietożsamościskładnikazrozkładuwielopunktowego:
P(x)=Σ
P(c=ź)P(x|c=ź)j
(3.29)
ź
gdzieP(c)torozkładwielopunktowywzględemtożsamościskładników.
Widzieliśmyjużjedenprzykładrozkładumieszanegorozkładempiryczny
względemwartościrzeczywistychtorozkładmieszanyzjednymskładnikiem
Diracadlakażdegoprzykładuszkoleniowego.
Modelmieszanyjestprostąstrategiąłączeniarozkładówprawdopodobień-
stwa,abyutworzyćrozkładbogatszy.Wrozdziale16bardziejszczegółowo
analizujemysztukębudowaniazłożonychrozkładówprawdopodobieństwa
napodstawietychprostych.
Modelmieszanypozwalapobieżniezapoznaćsięzpojęciem,którebędzie
późniejmiałoogromneznaczenie
zmiennejutajonej.
Zmiennautajona
tozmiennalosowa,którejniemożnabezpośrednioobserwować.Składowa
64