Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
Przedmowa
Podstawowymcelemanalizyskupieńjestpodziałzbioruobiektówna(nie-
koniecznierozłączne)homogenicznegrupy.Najpopularniejszymkryterium
podziałujestwzajemnepodobieństwo,bądźodmienność,obiektów.Wyma-
gasię,abydwadowolneobiektyprzypisanedotejsamejgrupybyłydo
siebiebardziejpodobneniżdowolnedwaobiektynależącedoróżnychgrup.
Równoważnie:abydwadowolneobiektyprzypisanedotejsamejgrupyróż-
niłysięodsiebiemniejniżdowolnedwaobiektywybranezdwóchróżnych
grup.Chcączastosowaćtenprzepiswpraktyce,należyodpowiedziećnadwa
podstawowepytania:(a)jakokreślaćpodobieństwomiędzyobiektamioraz
(b)wjakisposóbkorzystaćztakokreślonegopodobieństwawprocesiegru-
powania?Fakt,żeistniejewiele,częstobardzoodmiennych,odpowiedzina
obatepytaniaskutkujewielościąalgorytmów[5],[246],[119].
Metodyanalizydanychmożnazgrubszapodzielićnadwiekategorie1:
(a)opisowe(eksploracyjne),zalecanewówczas,gdypozbawieniwstęp-
nychmodeliczyhipotezstaramysięzrozumiećogólnąnaturęistrukturę
wysokowymiarowychdanych,oraz(b)metodykonfirmacyjne(inferential),
stosowanewcelupotwierdzeniapoprawnościmodelulubroboczychhipotez
dotyczącychzebranychdanych.Szczególnąrolęodgrywajątumetodysta-
tystyczne,jakchociażbyanalizawariancji,regresjaliniowa,analizadyskry-
minacyjna,skalowaniewielowymiarowe,analizaczynnikowa,czywreszcie
stanowiącaprzedmiotnaszychzainteresowańanalizaskupień2[221],[169].
1Por.np.J.W.Tukey.Exploratorydataanalysis.Addison-Wesley,1977.
2Inne,równoważne,określeniatejdziedzinyto:taksonomia,grupowanieczyprze-
niesionezangielskiegoklasteryzacja.Wliteraturzeanglojęzycznejstosujesiętermi-
ny:clusteranalysis,Q-analysis,typology,clumpingoraztaxonomy[198].Częstodane
określeniejestściślezwiązanezdziedzinązastosowań.Naprzykładtermintaksono-
miakojarzysięznaukamibiologicznymi;wprzetwarzaniusygnałówużywasięterminu
kwantyzacjaitd.