ВСЕ КНИГИ
Karolina I. Wieczorek
Agata Opolska-Bielańska
W monografii przedstawiono zagadnienia dotyczące opisu treści dokumentów tekstowych za pomocą modeli statystycznych. Modele te znajdują zastosowanie we wszystkich warstwach języka – od warstwy morfologicznej, przez warstwę frazeologiczną i syntaktyczną, aż po warstwę semantyczną. Są przydatne do rozwiązywania różnych typów zadań, przy czym za najważniejsze zadanie należy uznać wyznaczanie podobieństwa pomiędzy wyrazami, zdaniami czy całymi dokumentami. Odpowiednio skonstruowany model może z powodzeniem opisywać zawartość pojedynczego dokumentu lub zbioru dokumentów określanego mianem korpusu. Pozwala również na ekstrakcję, porównywanie czy klasyfikowanie informacji pochodzących z dokumentów. Może stanowić także narzędzie służące do zmiany ich formy, czego przykładem może być automatyczna identyfikacja słów kluczowych lub wizualizacja. W pracy zaprezentowano wyniki przeprowadzonych prac obliczeniowych, które w każdym przypadku dotyczyły analizy dokumentów polskojęzycznych i zostały zrealizowane przy użyciu narzędzi dostępnych w języku R. Pozwoliło to na ocenę tych produktów pod względem ich przydatności do analizy tekstów przygotowanych w rodzimym języku. Przedstawione wyniki badań potwierdzają przydatność zaprezentowanych metod do analizy dokumentów przygotowanych w języku polskim.
Настройте текст для его корректного отображения на любом устройстве
Создавайте заметки
Начните читать с того места, на котором закончили
У меня уже есть учетная запись в онлайн библиотеке IBUK Libra
У меня нет аккаунта в онлайн библиотеке IBUK Libra
PAMIĘTAJ!
Twój PIN do zasobów w:
Wygasa: сегодня
Aby zdobyć nowy PIN, skontaktuj się z Twoją biblioteką.
В течение нескольких минут вы получите сообщение на .
Нажмите на кнопку в нем, чтобы подтвердить подписку на рассылку и получить бесплатную электронную книгу.
Примите Пользовательское соглашение, чтобы продолжить использование веб-сайта.