In the paper some issues connected with indexing documents in the Polish
language are discussed. Algorithms for stemming and part of speech tagging,
important in the process of text analysis and indexing are shortly described. Next
their suitability to the Polish language, which has a very extensive inflection, is
discussed. The usefulness for stemming and part of speech tagging of large
dictionaries with inflected forms, like WordNet and open-source dictionary of Polish
language is also described. Two dictionary structures enabling effective word
searching are presented. In the final part, some tests of implemented two dictionary
structures are described. Tests were made on the six actual and three crafted
artificial texts. At the end conclusions of performed tests are formulated.
Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies
Informacja
SZANOWNI CZYTELNICY!
UPRZEJMIE INFORMUJEMY, ŻE BIBLIOTEKA FUNKCJONUJE W NASTĘPUJĄCYCH GODZINACH:
Wypożyczalnia i Czytelnia Główna: poniedziałek – piątek od 9.00 do 19.00