Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
Przedmowa
vii
trudny,aczęstowręczniemożliwydointerpretacji,tostrukturabowiemwskazuje
namłączącewyrazyzależności(por.Mążwpiecpiecżonatłustybaba.zMężowi
wpiecupiekłażonatłustąbabę.,nieodróżnialnymodMężowiewpiecachpieką
żonomtłustymbaby.iinnychwariacji,wtymMężowiwpiecupiekłyżonętłuste
baby.).Wwypadkudłuższych,bardziejzłożonychwypowiedzeńpowodowałoby
tojeszczewiększetrudności.
Wwypadkuprzetwarzaniakomputerowegonaprocestennakładasięelement
masy.Możemybowiemsprawdzić,jakczęstopojawiasiędanyschemat(np.
składniowy),jakiewyrazyijakczęstownimwystępują.Komputerynie
bowiemrównieelastycznejakludzkiemózgi,jednakbeztruduprecyzyjnie
przetworzą,przelicząizapamiętajądużezbiorydanych.Zresztączłowiektakże
potrafisięuczyćwtensposób.Czytająctekstwobcymjęzyku,potrafimypojąć
nieznanenamsłowo,jeślitylkodostatecznieczęstopojawisięwwystarczająco
zróżnicowanymkontekście(Gilletteiin.,1999;Wittek,2002).
Dlategowiększośćpropozycjitworzeniaustrukturyzowanychzasobówjęzy-
kowychwsposóbpółautomatycznyiautomatycznyopierasięnazastosowaniu
metodstatystycznychimaszynowegouczeniasiędowydobyciaodpowiednich
zależnościznajdującychsięwsposóbniejawnywtekstach,np.wkorpusachjęzy-
kowych.Dużyrozmiarkorpusuumożliwiabowiemposługiwaniesiętechnikami
statystycznymibezutratywiarygodnościuzyskiwanychwyników.
Kolejnerozdziałytejksiążkipoświęconezostaływykorzystywanymzasobom
inarzędziomorazmetodomwydobywaniaznichcorazbardziejzłożonych
informacji.Równieobszernepotraktowaniewszystkichetapówprzetwarzania
danychjęzykowychdodatkowozwiększyłobyrozmiarpracy,zkonieczności
skupiłamsięwięcnapoziomiesemantycznym.
Jakwspominałampowyżej,wpełniautomatycznaakwizycjawiedzylingwi-
stycznejjestwobecnejchwiliniemożliwa.Takwięcniektórezasobywykorzysty-
wanewopisywanychbadaniach,takiejaksłownikanalizatoramorfologicznego
czyteżgramatykawykorzystywanaprzezanalizatorskładniowy,zostałyopraco-
wanepodpełnąkontrolączłowieka.Jednakjużpozostałezasoby,takiejakkorpus,
wordnetczysyntaktycznysłownikwalencyjnybyłytworzonepółautomatycznie
(dwaostatnieprzywykorzystaniudanychkorpusowych).
Książkaprzeznaczonajestwzasadziedlalingwistóworazinformatyków,
szczególniespecjalistówzzakresusztucznejinteligencji,zainteresowanychau-
tomatycznymprzetwarzaniemjęzyka.Zewzględunaichcałkowicieróżneprzy-
gotowanie(specjalizacjainżynierialingwistycznajeszczewPolscenieistnie-
je,jedynieprowadzonewykładyztegozakresunakilkuuczelniach),inne
fragmentypracymogąwydaćimsiętrudnebądźinteresujące.Dlainformatyka
pewnątrudnośćmożenieśćnieznanamuterminologialingwistyczna,dlatego
starałamsiędokładnieopisywaćużywaneterminy.Osobombezprzygotowania
informatycznegoodradzamwczytywaniesięwszczegółyalgorytmówiwzorów
statystycznych;dlazrozumieniaogólnychopisywanychwpracyideizazwyczaj
niejesttoniezbędne.