"Statystyczne metody klasyfikacji tekstów"
Identyfikator Librowy: 265059
Spis treści
Wstęp 7
1.1. Podstawowe pojęcia 11
Rozdział 1. Wprowadzenie w problematykę klasyfikacji tekstów 11
1.2. Uwagi terminologiczne i oznaczenia 16
1.3. Etapy wstępnej obróbki tekstu 18
1.4. Klasyfikatory wykorzystywane w badaniach 23
1.4.1. Naiwny klasyfikator Bayesa 23
1.4.1.1. Model zero-jedynkowy 24
1.4.1.2. Model wielomianowy 24
1.4.1.3. Model Gaussa 25
1.4.2. Regresja logistyczna 25
1.4.3. Metoda SVM 27
1.5. Miary jakości klasyfikacji 29
1.6. Testowe zbiory danych 30
1.6.1. Zbiór Reuters-21578 31
1.6.2. Zbiór Polarity 31
1.6.3. Zbiór OHSUMED 32
1.6.4. Zbiór bank 32
1.6.5. Zbiór perfumy 32
1.6.6. Zbiór perfumyzbil 33
1.6.7. Zbiór ksiazki 33
1.6.8. Zbiór ksiazkizbil 33
1.6.9. Zbiór apteki 33
1.6.10. Zbiór aptekizbil 34
1.6.11. Zbiór esklepy 34
1.6.12. Zbiór esklepyzbil 34
1.6.13. Zbiór kurier 34
1.6.14. Zbiór kurierzbil 35
1.6.15. Zbiór hotele 35
1.6.16. Zbiór hotelezbil 35
1.7. Oprogramowanie używane w badaniach 35
1.7.1. Wstępna obróbka tekstu 36
1.7.2. Klasyfikacja 38
2.1. Podejścia modelowe 41
Rozdział 2. Metody doboru zmiennych na potrzeby klasyfikacji tekstów 41
2.2. Podejścia heurystyczne 43
2.3. Metody inspirowane naturą 58
2.4. Metody z grupy ensamble 60
2.5. Wybrane metody wykorzystujące źródła zewnętrzne 62
3.1. Wnioski z przeglądu literatury – zadania badawcze 65
Rozdział 3. Autorska propozycja metody klasyfikacji tekstów 65
3.2. Sformułowanie nowej metody 66
3.3. Organizacja badania 73
3.4. Wyniki badania i wnioski 73
Zakończenie 105
Załącznik 107
Bibliografia 135