Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
42
RozdziałII.Wyszukiwarkainternetowacharakterystykaogólna
sitemaplxml,jakiwieleinnychplików,wtymmultimedialnych34l
Niektórerobotykopiująwyłącznieadresystroninternetowych,inne
mogąkopiowaćsłowa,zdania,anawetcałązawartośćwitrynyinter-
netowej35l
Przeszukiwanieigromadzenieorazaktualizowaniedanychzsiecista-
nowidziałaniewymagająceogromnychzasobówsprzętowych,orga-
nizacyjnychorazfinansowych36lWskazaćprzytymnależy,żezapo-
trzebowaniebędziewzrastałowrazznieustającymrozwojemsieci37l
PrzykładowoGooglew2003rlwceluobsługiswojejwyszukiwarki
internetowejwykorzystywało15000komputerów,ajużw2009rl
liczbatawzrosłado50000038l
Kolejnyelementwyszukiwarkiinternetowej,zwanyindekserem,
odpowiadazaprzetworzeniedanychuzyskanychzpełzaczaistwo-
rzenieindeksu39lKoniecznośćmodyfikacjidanychwynikazfaktu,że
znajdowaneprzezpełzaczainformacjemająróżnącharakterystykę,
nplróżnyrodzaj,format,wielkość,kod,języklZadaniemindeksera
jestnormalizacjatychinformacjinapotrzebystworzeniaindeksul
Indekserwydobywarównieżróżnegotypudaneorazmetadane
potrzebnewyszukiwarceinternetowej40l
Indeksstanowibazędanychzawierającąodniesieniadoinformacji
znajdującychsięwsieciorazsłowakluczowelZawierarównieżinfor-
macjepotrzebnedotworzeniaalgorytmówrankingowych,któresta-
nowiąpodstawęprezentowanychużytkownikowiodniesień(linków),
wtymichkolejności41lStrukturaorganizacjidanychznajdujących
sięwindeksiezbliżonajestdoindeksuznajdującegosięzwyklena
34JlIlJerkovic,WojownikSEO...,sl48l
35DlOvanezian,InternetSearchEngineCopying:FairUseDefensetoCopyright
Infringement,nSantaClaraHighTechnologyLawJournal”1998/14,sl271-272l
36DlLewandowski,NewPerspectivesonWeb...,sl2l
37AlHalavais,Wyszukiwarkiinternetowe...,sl36l
38MlLevene,Anintroductiontosearchengines...,sl85l
39MlLevene,Anintroductiontosearchengines...,sl79l
40JlvanHoboken,Searchenginefreedom...,sl35l
41JlvanHoboken,Searchenginefreedom...,sl36l