Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
28
DianaBlagoeva
Źródłaimetodyekscerpcjimateriałuleksykalnego
Materiałneologicznyzostałwyekscerpowanyzespecjalniezgromadzo-
negoarchiwumelektronicznego,którezawieraznaczącąliczbęnajnow-
szychtekstówwjęzykubułgarskim,pochodzącychznajnowszychpublikacji
(książek,gazet,czasopism,rocznikówitp.)oszerokiejtematyceiróżno-
rodnościgatunkowej(БлагоеваиКолковска2007).Archiwumskładasię
zponad40tysięcytekstówprzedstawionychwformiecyfrowejiobejmuje
około600milionówsłowoform.Zapomocąspecjalnegooprogramowa-
niakomputerowegozostałaprzeprowadzonapółautomatycznaprocedura
ekstrakcjineologizmów
2
ztegoarchiwumnapodstawiewstępnegoltra
(Blagoeva2009).Jakoltrzastosowanobazędanych,zawierającąlistysłowo-
formsporządzonenapodstawieróżnychźródeł.tozdigitalizowanewersje
kilkuwcześniejwydanychsłowników(opisowych,ortograficznych,przekła-
dowych,neologicznych),referencyjnearchiwumelektroniczneobejmujące
szerokiwachlarztekstówopublikowanychodpołowyXIXwiekudokońca
XXwieku,wykazzawierającyponad70tysięcynazwwłasnych(antropo-
nimówitoponimów)orazinneuzupełniającewykazy.Wyekscerpowano
pojedynczesłowagraficzne(odspacjidospacji),którerozważanejako
słowapotencjalnieodbieranejakoneologizmy.
Oczywiścienależyzdawaćsobiesprawęztego,żewyodrębnionalista
potencjalnychneologizmówzawierawrzeczywistościnietylkoprawdziwe
neologizmyleksykalne,lecztakżeokazjonalizmyoraznierozpoznane
przezoprogramowaniekomputerowesłowoformydawnoistniejących
wjęzykuwyrazów,imionawłasne,pewnebłędydrukarskieiortograficzne
itd.Poodrzuceniunieodpowiednichelementówiwprowadzeniukorekt
powstałaskróconalista,napodstawiektórejdokonanokońcowejselekcji
hasełsłownikowych.
Przedstawionametodagromadzeniamateriałuneologicznegoniejest
pozbawionaograniczeń,ponieważjestnastawionajedynienaidentyfikację
neologizmówleksykalnych.Opracowanieodpowiednichnarzędzikompu-
terowychdoautomatycznegoodkrywaniaiekstrakcjineosemantyzmów
iwieloskładnikowychneologizmówwciążpozostajezadaniemprzyszłości,
więcnadalkoniecznejestpołączeniedziałańautomatycznychitradycyjnych
(wformieekstrakcjimanualnej).
WspółczesnetechnologiezwiększająmożliwościkorzystaniazInternetu
jakoszczególnegorodzajukorpusu,będącegopodstawąbadańlingwistycznych
2Przeglądróżnychmetodipodejśćbadawczychdotyczącychautomatycznejekstrakcji
neologizmówleksykalnychwobrębieróżnychjęzyków,wtymjęzykabułgarskiego,przed-
stawiaА.Atanasowa(Атанасова2017).