Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Database for optical character recognition" wg kryterium: Temat


Wyświetlanie 1-1 z 1
Tytuł:
Development of Extensive Polish Handwritten Characters Database for Text Recognition Research
Autorzy:
Tokovarov, Mikhail
Kaczorowska, Monika
Miłosz, Marek
Powiązania:
https://bibliotekanauki.pl/articles/102832.pdf
Data publikacji:
2020
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
OCR
Handwriting character samples
Database for optical character recognition
Polish handwritten characters database
Próbki znaków pisma ręcznego
Baza danych do optycznego rozpoznawania znaków
Baza polskich znaków pisanych odręcznie
Opis:
In the modern world, fast and efficient processing of non-digital (handwritten or typed) texts is the task of extreme importance. Similar to many other fields, optical character recognition (OCR) benefits from the application of machine learning (ML) which allows developing effective and accurate methods. In order to achieve good performance, a machine learning algorithm requires great amount of data. Nowadays, a large database of handwritten characters prepared by National Institute of Standards and Technology (NIST), USA, can be used for training an ML model. However, significant differences between the manners of handwriting exist in the US and Poland. That fact, along with the absence of Polish diacritical marks, causes the NIST database to be less useful for development of an OCR model for the Polish language. According to the best of the authors’ knowledge, no database with samples of Polish handwriting exists. The present research is focused at filling this gap, i.e. gathering and preparing an extensive database of Polish handwritten characters. The paper presents the very first database of Polish handwriting samples. The database is by far larger than all the datasets used in the previous attempts of implementing OCR for the Polish handwriting. It is also the first fully publicly accessible database of Polish handwriting of this scale. The same method and developed tools can be used to build handwritten characters databases of other languages.
Źródło:
Advances in Science and Technology. Research Journal; 2020, 14, 3; 30-38
2299-8624
Pojawia się w:
Advances in Science and Technology. Research Journal
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-1 z 1

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies