Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
6
1.Wstęp
Powstanieinternetuimnogośćprzechowywanychtaminformacjista-
wianowewymaganiaprzedsystemamiwyszukiwaniainformacji.Kryte-
rianajważniejszetokrótkiczaswyszukiwaniaorazwysokadokładność
odpowiedzi(kosztemniższejkompletności).Wynikatozkonieczności
przeszukaniaogromudanychwjaknajkrótszymczasie.Różnorodność
reprezentacjidokumentówhipertekstowych(atakimiwwiększości
stronyinternetowe),wymagaodpowiedniejstrukturydoprzechowywania
wiedzywnichzawartejtak,byzadawaniepytań,wyszukiwanieodpowie-
dzinatepytania,anastępnieichprzejrzysteprzedstawienieużytkowni-
kowibyłymożliwe.Wdużejmierze,efektywnośćsystemuwyszukiwania
informacjiwynikazużytegomodeluwyszukiwania.Wśródnajczęściej
wykorzystywanychmodeliwymieniasię:boolowski[8,9],modelopar-
tynaprzestrzeniwektorowej(omówionyszerzejwrozdzialesiódmym)
[21]orazmodelprobabilistyczny[29,73].Poszczegółoweinformacjedo-
tyczącetegozagadnieniaautorzyodsyłajądoprac[2,3,72,65,95].
Niezależnieodwybranegomodeluwyszukiwaniaistotnymitakie
parametryjaknp.długośćdokumentu,odktórejpotemzależy-między
innymi-wybórmetodyanalizyważnościposzczególnychsłówtworzących
dokumenty.Ważnymjestrównieżczaskoniecznynaanalizęzawartości,
zwłaszczadługichdokumentów.Wykorzystującmetodyekstrakcjiinfor-
macjimożliwejestutworzeniedlakażdegodokumentu(naetapiejego
indeksowania)krótkiejcharakterystyki.Najczęściejjesttopewienze-
stawsłówkluczowych(ang.keywords)najlepiejreprezentującychzawar-
tośćcałegodokumentu.Większośćsystemówwyszukiwaniainformacji
wykorzystujezatemmetodyautomatycznejekstrakcjisłówkluczowych
ibazującnanichrealizujenastępnieproceswyszukiwania[30,24].
PodkoniecXXwiekurozpoczętopracenadprojektemsieciseman-
tycznej(tzw.Web3.0),któregozadaniemmiałobyćumożliwienie,maszy-
nomiprogramomwyszukującyminformacje,przetwarzaniainformacji
wsposóbodpowiednidoichznaczeniabazującnatworzonymwtymce-
lustandardzieopisywaniatreściwinternecie.Wyszukiwarkisemantycz-
nemająsprostaćpotrzebominternautówbardziejniżstosowanedotąd
narzędzia,jaknp.Google.Założeniejestnastępujące.Celemwyszukiwa-
niapowinnabyćkompletnaodpowiedźnapostawionepytaniezamiast
ograniczaćsiędoprzedstawienialistlinkówprowadzącychdostron(do-
kumentów),wktórychnajprawdopodobniejzawartoodpowiedźnapyta-
nie.Pierwowzoremsemantycznejwyszukiwarki,szerokoopisanymwlite-
raturze,jestHakia,zaśwśródobecnierozwijanychprojektównauwagę
zasługujeWolframAlpha[22].Użytkownikwprowadzazapytanie(wjęzy-
kuangielskim)lubformułęmatematycznądopolatekstowego,następnie