W prezentowanej monografii przedstawiono przykładowy korpus dla języka polskiego opracowany na podstawie własnych koncepcji, odpowiednio zweryfikowany w modelowaniu językowym i akustycznym w systemie rozpoznawania mowy polskiej o bardzo dużym słowniku LVCSR Large Vocabulary Continuous Speech Recognition). Stanowi on największy obecnie w Europie zasób słowny i może posłużyć zarówno lingwistycznym badaniom porównawczym dla różnych języków, jak i różnorodnym aplikacjom technologii mowy.
Celem książki jest syntetyczne przedstawienie niektórych najważniejszych problemów korpusowego przetwarzania języka i mowy w sposób praktycznie niezależny od technicznych założeń i formalizmów. Monografia stanowi próbę obiektywnego spojrzenia na aktualny stan badań, sygnalizuje trudności, jakie ma współczesna technologia języka i mowy, oraz wskazuje na ewentualne możliwości ich rozwiązywania, które: a) z punktu widzenia teorii oraz aplikacji ujmują problematykę korpusowego przetwarzania języka i mowy bazującego w większym niż dotychczas stopniu na wiedzy fonologicznej i fonetyczno-akustycznej, b) uwzględniają problem modelowania prozodycznego (zwłaszcza w zakresie przetwarzania cech pozajęzykowych) oraz c) sygnalizują zmianę metod przetwarzania mowy z obliczeniowych na poznawcze, kognitywne, to jest takie, które nie tylko statystycznie przetwarzają dane, ale również wyjaśniają złożone relacje między nimi.
Autor: Grażyna Demenko
Znajdź bibliotekę blisko siebie, i uzyskaj dostęp do ebooka w systemie IBUK Libra