Treść książki
Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
1.2.Miarypodobieństwa/odmienności
23
wwiększymstopniuniżdowolnedwaobiektywybranezdwóchróżnych
skupień,tzn.
s(1′,1′′)>s(y′,y′′),
jeżelitylko1′,1′′∈Ci,y′∈Cj
1,y′′∈Cj
2orazj1/=j2.
Symbolemsoznaczonotupewnąmiarępodobieństwa,tzn.odwzoro-
wanies:X×X→R.Wwielusytuacjachwygodniejjestposługiwaćsię
pojęciemodmienności(np.odległości)iwymagać,abyobiektynależącedo
różnychskupieńróżniłysiębardziejniżobiektynależącedotegosamego
skupienia.Różnedefinicjemiarpodobieństwabądźodmiennościomawiamy
wkolejnympodrozdziale.Wybórwłaściwejmiarytododatkowyczynnik
komplikującyzadanieanalizydanych.Kolejnymtakimczynnikiemjestdo-
bórwłaściwegokryteriumwyznaczającegopodziałzbioruX.
Większośćmetodgrupowaniapolegana„inteligentnym”wydobywaniu
informacjizmacierzyS,którejelementyprzedstawiająpodobieństwobądź
odmiennośćparobiektów.Znakomitymprzykłademtakiegopostępowania
sąmetodyhierarchiczne,omawianekrótkowpodrozdz.1.3,czy–będące
głównymtematemrozdziału4–metodyspektralne.
Donajpopularniejszychmetodgrupowaniadanychzaliczasięmetody:
hierarchiczne,kombinatoryczne(nazywaneteżpodziałowymi),gęstościowe,
gridoweorazmetodykorzystającezmodeli.Ichomówienieizwartyopis
możnaznaleźćwwielupracachprzeglądowych,np.[199],[197]czy[390].
Wdalszejczęścirozdziałuprzedstawiamyichkrótkącharakterystykę.
1.2.Miarypodobieństwa/odmienności
Abykwantyfikowaćpodobieństwomiędzyparamiobiektów,wprowadzasię
miarępodobieństwas:X×X→R(lubodmienności).Obiemiarysąwza-
sadziedualne,tzn.immniejszawartośćodmienności,tymbardziejpodobne
dosiebiesąporównywaneobiekty.Szczególnymprzykłademodmienności
jestodległość(metryka),czylifunkcjad:X×X→R+∪{0}spełniająca
trzywarunki:
(a)d(1,y)=0wtedyitylkowtedy,gdy1≡y,
(b)d(1,y)=d(y,1)(symetria),
(c)d(1,y)<d(1,z)+d(z,y)(nierównośćtrójkąta),
dladowolnych1,y,z∈X.Jeżelispełnionesątylkowarunki(b)i(c),tod
nazywamypseudoodległością.