Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "character recognition" wg kryterium: Temat


Tytuł:
Deep convolutional neural network using a new data set for berber language
Autorzy:
Mokrane, Kemiche
Sadou, Malika
Powiązania:
https://bibliotekanauki.pl/articles/27312869.pdf
Data publikacji:
2023
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
optical character recognition
handwritten character recognition
CNN
Berber-MNIST data set
EMNIST
Tifinagh
Latin characters
Opis:
Currently, handwritten character recognition (HCR) technology has become an interesting and immensely useful technology; it has been explored with impressive performance in many languages. However, few HCR systems have been proposed for the Amazigh (Berber) language. Furthermore, the validation of any Amazigh handwritten character-recognition system remains a major challenge due to the lack of availability of a robust Amazigh database. To address this problem, we first created two new data sets for Tifinagh and Amazigh Latin characters by extending the well-known EMNIST database with the Amazigh alphabet. Then, we proposed a handwritten character recognition system that is based on a deep convolutional neural network to validate the created data sets. The proposed convolutional neural network (CNN) has been trained and tested on our created data sets, the experimental tests showed that it achieves satisfactory results in terms of accuracy and recognition efficiency.
Źródło:
Computer Science; 2023, 24 (2); 225--241
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza porównawcza wybranych programów do optycznego rozpoznawania tekstu
Comparative analysis of selected programs for optical text recognition
Autorzy:
Łukasik, Edyta
Zientarski, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/98410.pdf
Data publikacji:
2018
Wydawca:
Politechnika Lubelska. Instytut Informatyki
Tematy:
rozpoznawanie tekstu
OCR
Tesseract
Ocrad
GOCR
Optical Character Recognition
Opis:
Celem artykułu jest porównanie trzech programów do optycznego rozpoznawania teksu. Zdefiniowany został problem optycznego rozpoznawania tekstu i przedstawione główne jego zastosowania. Opisano działanie tej technologii i krótko scharakteryzowano najważniejsze dostępne na rynku programy realizujące omawiane zagadnienie. Następnie poddano testom wybrane programy wykorzystując dwie próbki pisma maszynowego w języku polskim. Określono szybkość procesu rozpoznawania tekstu. Poprawność rozpoznania znaków i wyrazów w analizowanym tekście została także określona.
The aim of the article is to compare three programs for the optical text recognition. The problem of the optical text recognition has been defined. Next, briefly the functionality of this technology was described. The most important programs realizing the discussed problem were also characterized. The selected programs were tested using two samples of machine writing in Polish. The speed of the text recognition process was determined. The correctness of characters and words recognition in the analyzed text was also specified.
Źródło:
Journal of Computer Sciences Institute; 2018, 7; 191-194
2544-0764
Pojawia się w:
Journal of Computer Sciences Institute
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Position-encoding convolutional network to solving connected text CAPTCHA
Autorzy:
Qing, Ke
Zhang, Rong
Powiązania:
https://bibliotekanauki.pl/articles/2147133.pdf
Data publikacji:
2022
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
deep neural network
position encoding CNN
text-based CAPTCHA recognition
character recognition
Opis:
Text-based CAPTCHA is a convenient and effective safety mechanism that has been widely deployed across websites. The efficient end-to-end models of scene text recognition consisting of CNN and attention-based RNN show limited performance in solving text-based CAPTCHAs. In contrast with the street view image and document, the character sequence in CAPTCHA is non-semantic. The RNN loses its ability to learn the semantic context and only implicitly encodes the relative position of extracted features. Meanwhile, the security features, which prevent characters from segmentation and recognition, extensively increase the complexity of CAPTCHAs. The performance of this model is sensitive to different CAPTCHA schemes. In this paper, we analyze the properties of the text-based CAPTCHA and accordingly consider solving it as a highly position-relative character sequence recognition task. We propose a network named PosConv to leverage the position information in the character sequence without RNN. PosConv uses a novel padding strategy and modified convolution, explicitly encoding the relative position into the local features of characters. This mechanism of PosConv makes the extracted features from CAPTCHAs more informative and robust. We validate PosConv on six text-based CAPTCHA schemes, and it achieves state-of-the-art or competitive recognition accuracy with significantly fewer parameters and faster convergence speed.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2022, 12, 2; 121--133
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Preprocessing Photos of Receipts for Recognition
Przetwarzanie wstępne zdjęć paragonów do celów rozpoznawania
Autorzy:
Korobacz, W.
Tabędzki, M.
Powiązania:
https://bibliotekanauki.pl/articles/88364.pdf
Data publikacji:
2018
Wydawca:
Politechnika Białostocka. Oficyna Wydawnicza Politechniki Białostockiej
Tematy:
cyfrowe przetwarzanie obrazów
rozpoznawanie znaków
OCR
digital image processing
optical character recognition
Opis:
The subject of this work is methods of image pre-processing, applied to receipts photos. The purpose is to improve their quality, allowing to increase the efficiency of the conventional text recognition software (OCR). The authors had mainly difficult cases in mind – photos taken freehand in unfavorable lighting conditions. The work describes the analyzed methods of filtering, binarization, searching for the edge of the image, image straightening, marking the area of interest, thinning. The preliminary results with OCR software on a small data set were also presented. Thanks to pre-processing, character recognition efficiency has been improved by 25%. The final part presents conclusions and plans for future work.
Tematem tej pracy są metody przetwarzania wstępnego obrazów, zastosowane do zdjęć przedstawiających paragony. Celem jest poprawa ich jakości, pozwalająca zwiększyć skuteczność działania oprogramowania do rozpoznawania tekstu. Autorzy mieli na uwadze głównie trudne przypadki – zdjęć robionych „z ręki”, przy słabym oświetleniu. Praca opisuje przeanalizowane metody filtrowania, binaryzacji, wyszukiwania krawędzi, prostowania obrazu, oznaczania obszaru zainteresowania, ścieniania. Przedstawiono również wstępne wyniki testów z oprogramowaniem OCR na niewielkiej bazie obrazów. Przetwarzanie wstępne pozwoliło na poprawę identyfikacji znaków o 25%. W końcowej części przedstawiono wnioski oraz plany przyszłej pracy.
Źródło:
Advances in Computer Science Research; 2018, 14; 87-103
2300-715X
Pojawia się w:
Advances in Computer Science Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Radon-Zernike moments method applied in postal application
Zastosowanie momentów Radona-Zernike do aplikacji pocztowych
Autorzy:
Miciak, M.
Wiatr, R.
Andrysiak, T.
Maszewski, M.
Powiązania:
https://bibliotekanauki.pl/articles/389801.pdf
Data publikacji:
2013
Wydawca:
Politechnika Bydgoska im. Jana i Jędrzeja Śniadeckich. Wydawnictwo PB
Tematy:
character recognition
radon transform
Zernike moments
rozpoznawanie znaków
transformata Radona
momenty Zernike
Opis:
In this paper a new method of a handwritten characters recognition is introduced. The proposed algorithm is applied to classification of post mails on the basis of postal code information. In connection with this work the research was conducted with numeric characters used in real post code of mail pieces. Moreover, the article contains image processing, for instance, filtration of Radon transformation of the character. The main objective of this article is to use the Radon transform parameter space to obtain a set of moment features on basis of which postal code will be recognized.
W artykule przedstawiono nowe rozwiązanie zadania rozpoznawania znaków pisanych ręcznie dla zastosowań pocztowych. Zaproponowano algorytm klasyfikacji przesyłek pocztowych działający na podstawie informacji zawartej w zapisie kodu pocztowego. Główny nacisk położono na wykorzystanie transformaty Radona i momentów Zernike do uzyskania zbioru cech, na podstawie, których rozpoznawano kod pocztowy. Otrzymane wyniki eksperymentów pozwoliły wykazać skuteczno ść proponowanej metody.
Źródło:
Zeszyty Naukowe. Telekomunikacja i Elektronika / Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy; 2013, 17; 17-26
1899-0088
Pojawia się w:
Zeszyty Naukowe. Telekomunikacja i Elektronika / Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Invariant Gabor-Zernike descriptor for postal applications
Inwariantny deskryptor Gabora-Zernika dla zastosowań pocztowych
Autorzy:
Andrysiak, T.
Miciak, M.
Boniecki, R.
Powiązania:
https://bibliotekanauki.pl/articles/389832.pdf
Data publikacji:
2011
Wydawca:
Politechnika Bydgoska im. Jana i Jędrzeja Śniadeckich. Wydawnictwo PB
Tematy:
rozpoznawanie znaków
filtracja Gabora
momenty Zernika
character recognition
Gabor filters
Zernike moments
Opis:
In this paper a new solution of handwritten digits recognition system for postal applications is presented. Moreover, in this paper, a new method of handwritten characters recognition is introduced. The proposed algorithm is applied to classification of post mails on the basis of zip code information. In connection with this work the research was conducted with numeric characters used in real post code of mail pieces. Moreover, the article contains basic image processing for instance filtration binarization and normalization of the character. The main objective of this article is to use the Gabor filtration and Zernike moments to obtain a set of invariant features, on basis of which postal code will be recognized. The reported experiments' results prove the effectiveness of the proposed method. Furthermore, sources of errors as well as possible improvement of classification results will be discussed.
W artykule przedstawiono nowe rozwiązanie zadania rozpoznawania znaków pisanych ręcznie dla zastosowań pocztowych. Zaproponowano algorytm klasyfikacji przesyłek pocztowych działający na podstawie informacji zawartej w zapisie kodu pocztowego. Ponadto w artykule opisano podstawowe operacje przetwarzania wstępnego tj. filtracje, binaryzacje oraz normalizacje obrazu znaku. Głównym nacisk położono na wykorzystanie filtracji Gabora i momentów Zernike do uzyskania zbioru cech na podstawie których rozpoznawano kod pocztowy. Otrzymane wyniki eksperymentów pozwoliły wykazać skuteczność proponowanej metody. Dodatkowo w pracy przedstawiono źródła potencjalnych błędów w procesie rozpoznawania, jak również zaproponowano możliwości poprawy wyników klasyfikacji.
Źródło:
Zeszyty Naukowe. Telekomunikacja i Elektronika / Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy; 2011, 15; 5-17
1899-0088
Pojawia się w:
Zeszyty Naukowe. Telekomunikacja i Elektronika / Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Handwritten laboratory test order form recognition module for distributed clinic
Autorzy:
Sas, J.
Powiązania:
https://bibliotekanauki.pl/articles/333334.pdf
Data publikacji:
2004
Wydawca:
Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Tematy:
inteligentne rozpoznawanie znaków
rozpoznawanie wzorców
szpitalne systemy informatyczne
intelligent character recognition
pattern recognition
hospital information systems
Opis:
The work describes methods used in a laboratory order form recognition module of a hospital information system. Three-level form analysis architecture is proposed. The lower alphabetical level is responsible for separate character recognition. On the intermediate level, recognised strings are verified against the lexicons of items specific for a particular form field. Probabilistic model is used to select the set of most probable items. On the upper level, the dependencies between the form data items are taken into account to further improve the recognition performance. The presented approach was implemented in the medical information system supporting clinic laboratory operation. The laboratory test orders prepared manually by the physician in the paper form, in the net of distributed outpatient clinics are processed in the central hospital laboratory. In the central laboratory the paper forms are scanned, recognised and entered into the information system. The performance tests results are discussed and some further improvements of the applied recognition method are also suggested in the paper.
Źródło:
Journal of Medical Informatics & Technologies; 2004, 8; MM59-68
1642-6037
Pojawia się w:
Journal of Medical Informatics & Technologies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Efektywność sztucznych sieci neuronowych w rozpoznawaniu znaków pisma odręcznego
Effectiveness of artificial neural networks in recognising handwriting characters
Autorzy:
Miłosz, Marek
Gazda, Janusz
Powiązania:
https://bibliotekanauki.pl/articles/98468.pdf
Data publikacji:
2018
Wydawca:
Politechnika Lubelska. Instytut Informatyki
Tematy:
rozpoznawanie znaków
pismo odręczne
sztuczne sieci neuronowe
character recognition
handwriting
artificial neural networks
Opis:
Sztuczne sieci neuronowe są jednym z narzędzi współczesnych systemów odtwarzania z obrazów tekstów, w tym pisanych odręcznie. W artykule przedstawiono rezultaty eksperymentu obliczeniowego mającego na celu analizę jakości rozpoznawania cyfr pisanych odręcznie przez dwie sztuczne sieci neuronowe (SSN) o różnej architekturze i parametrach. Jako podstawowe kryterium jakości rozpoznawania znaków użyto wskaźnika poprawności. Poza tym analizie poddano liczbę neuronów i ich warstw oraz czas uczenia SSN. Do stworzenia SSN, oprogramowania algorytmów ich uczenia i testowania wykorzystano język Python i bibliotekę TensorFlow. Obydwie SSN uczono i testowano przy pomocy tych samych dużych zbiorów obrazów znaków pisanych odręcznie.
Artificial neural networks are one of the tools of modern text recognising systems from images, including handwritten ones. The article presents the results of a computational experiment aimed at analyzing the quality of recognition of handwritten digits by two artificial neural networks (ANNs) with different architecture and parameters. The correctness indicator was used as the basic criterion for the quality of character recognition. In addition, the number of neurons and their layers and the ANNs learning time were analyzed. The Python language and the TensorFlow library were used to create the ANNs, and software for their learning and testing. Both ANNs were learned and tested using the same big sets of images of handwritten characters.
Źródło:
Journal of Computer Sciences Institute; 2018, 7; 210-214
2544-0764
Pojawia się w:
Journal of Computer Sciences Institute
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Rozpoznawanie wzorców cyfrowych za pomocą robota edukacyjnego
Digits recognition using an educational robot
Autorzy:
Dimitrova-Grekow, T.
Grodzki, D.
Powiązania:
https://bibliotekanauki.pl/articles/156236.pdf
Data publikacji:
2014
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
optyczne rozpoznawanie znaków
algorytm ROI
edukacyjny robot
Optical Character Recognition
region of Interest algorithm
educational robot
Opis:
Artykuł przedstawia system rozpoznający liczby rzymskie przy użyciu edukacyjnego zestawu Mindstorms NXT. Algorytm OCR wybrany do rozpoznania znaków został oparty na klasyfikacji cech. Zaadaptowana wersja algorytmu Region of Interest ROI i klasyfikacja cech są głównymi atutami tej pracy. System został skutecznie przetestowany pod wieloma względami. Powstała konstrukcja umożliwiająca skanowanie kartki formatu A4, a obsługujący ją program umożliwia prawidłową interpretację zeskanowanych liczb rzymskich.
Pattern recognition is always associated with powerful calculation [1, 2]. A specific branch in this area is Optical Character Recognition [3, 4, 5] where one of the most popular techniques is Feature Extraction, also known as Intelligent Character Recognition [6]. All ICR algorithms are topological [7, 8, 9]. This paper presents an implementation of Roman Number Recognition system realized on LEGO Mindstorms NXT educational robot. The main point is successful minimalistic realization of an on-board pattern recognition system. The NXT platform allows also an easy reconfiguration of the hardware and more building freedom without extra costs (Fig. 1.). An adapted version of the ROI algorithm is implemented [10]. Based on the extracted features (Fig. 2.) a classification of the roman digits is proposed (Fig. 3.). The final stage of the program includes segmentation, end result calculation and visualization of it on the robot screen. The conducted experimental tests proved a 100% efficiency for digit and number recognition having a process in optimal conditions and quite good stability for the optical noises (Fig. 4.) and color chances (Tab. 1). In spite of many drawbacks of the hardware, the implemented system seems very perspective and invokes many ideas toward pattern recognition technics.
Źródło:
Pomiary Automatyka Kontrola; 2014, R. 60, nr 5, 5; 284-287
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Optical character recognition using artifical inelligence technologies
Optyczne rozpoznawanie znaków z użyciem sztucznej inteligencji
Autorzy:
Musiał, A.
Szczepaniak, P.
Powiązania:
https://bibliotekanauki.pl/articles/408862.pdf
Data publikacji:
2014
Wydawca:
Politechnika Lubelska. Wydawnictwo Politechniki Lubelskiej
Tematy:
character recognition
artificial intelligence
feature extraction
clustering algorithms
rozpoznawanie znaków
sztuczna inteligencja
ekstrakcja cech
algorytmy klastrowania
Opis:
The article represents results of the research of an Optical Character Recognition system. Proposed OCR system is able to convert a raster image into the text string, which represents the text shown on the input image. The main innovation is the fact that the system was created without following any strict rules. It was more an innovative research rather than simple programming using ready guidelines.
Celem projektu opisywanego w artykule było przygotowanie działającego systemu do optycznego rozpoznawania znaków, tj. zdolnego przekształcić rastrowy obraz wejściowy w łańcuch znaków odpowiadający zapisanemu tekstowi na obrazie. Nowością jest m.in. fakt wykonania tego systemu bez podążania za z góry znaną architekturą aplikacji, a przygotowanie go w sposób bardziej doświadczalny, czyli wykorzystując podejście nowatorskie.
Źródło:
Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska; 2014, 2; 41-44
2083-0157
2391-6761
Pojawia się w:
Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Określanie punktów charakterystycznych przestrzeni parametrycznej w systemach rozpoznawania znaków
The characteristic points extraction of the parametric space in character recognition systems
Autorzy:
Miciak, M.
Wiatr, R.
Marchewka, A.
Powiązania:
https://bibliotekanauki.pl/articles/250054.pdf
Data publikacji:
2016
Wydawca:
Instytut Naukowo-Wydawniczy TTS
Tematy:
maszyna sortująca
identyfikacja danych adresowych
rozdział przesyłek
system rozpoznawania znaków
sorting machine
address identification
character recognition system
Opis:
W artykule przedstawiono problematykę automatycznego rozpoznawania kodów adresowych na przesyłkach pocztowych. Rozpoznawanie kodów pocztowych jest kluczowym elementem systemu maszyn sortujących w węzłach pocztowych. Kod pocztowy, najczęściej zapisany w postaci z cyfr może być przedstawiony w postaci obrazów reprezentujących pojedyncze znaki. Ze względu na to, że obrazy znaków zawierają zniekształcenia, zaproponowano transformację obrazu do przestrzeni parametrów, gdzie możliwe będzie przeprowadzenie operacji normalizacji i korekcji rotacji, a ponadto możliwe będzie przetwarzanie obrazu w skali szarości wraz z zakłóceniami specyficznymi dla systemów pocztowych. Zastosowano metodę bazującą na parametryzacji wydzielonych obszarów w otoczeniu punktów charakterystycznych, która pozwala na wprowadzenie do wektora cech znaku wielkości niezależnych od rotacji obrazu znaku. Metoda może być zastosowana zarówno dla transformaty Radona, jak również jej modyfikacji. Dużą zaletą jest to, że zaproponowane rozwiązanie może być dowolnie rozwijane ze względu na inne techniki opisu wydzielonych obszarów, np. wyznaczanie cech bazujących na teksturze wydzielonego obszaru.
The article presents the problem of automatic recognition of postal codes on mail pieces. Recognition of the postal codes is a main component of the system sorting machines in the mail nodes. The postal codes usually written in the form of digits can be presented in the form of digital images representing the particular characters. Due to the fact that the images contain various distortions, has been proposed the image transformation to parameter space, where it will be possible to perform the operation of normalization and correction of rotation. Using this procedure, which is based on parameterization of the areas surrounded by characteristic points which allows to obtain the invariant character feature vector of the sign. The method can be used both for the Radon transform, as well as its various modifications. The big advantage is that the proposed solution can be freely developed due to the different techniques of parameterization on separate areas, for example to determination of the characteristics based on texture isolated area.
Źródło:
TTS Technika Transportu Szynowego; 2016, 12; 156-159
1232-3829
2543-5728
Pojawia się w:
TTS Technika Transportu Szynowego
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Recognition of handwritten Latin characters with diacritics using CNN
Autorzy:
Lukasik, Edyta
Charytanowicz, Małgorzata
Milosz, Marek
Tokovarov, Michail
Kaczorowska, Monika
Czerwinski, Dariusz
Zientarski, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/2090714.pdf
Data publikacji:
2021
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
handwritten documents
diacritic
neural networks
character recognition
deep learning
dokument odręczny
znaki diakrytyczne
sieci neuronowe
rozpoznawanie znaków
głęboka nauka
Opis:
Convolutional Neural Networks (CNN) have achieved huge popularity in solving problems in image analysis and in text recognition. In this work, we assess the effectiveness of CNN-based architectures where a network is trained in recognizing handwritten characters based on Latin script. European languages such as Dutch, French, German, etc., use different variants of the Latin script, so in the conducted research, the Latin alphabet was extended by certain characters with diacritics used in Polish language. To evaluate the recognition results under the same conditions, a handwritten Latin dataset was also developed. The proposed CNN architecture produced an accuracy of 96% for the extended character set. This is comparable to state-of-the-art results found in the domain of identifying handwritten characters. The presented approach extends the usage of CNN-based recognition to different variants of the Latin characters and shows it can be successfully used for a set of languages based on that script. It seems to be an effective technique for a set of languages written using the Latin script.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2021, 69, 1; e136210, 1--12
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Recognition of handwritten Latin characters with diacritics using CNN
Autorzy:
Lukasik, Edyta
Charytanowicz, Małgorzata
Milosz, Marek
Tokovarov, Michail
Kaczorowska, Monika
Czerwinski, Dariusz
Zientarski, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/2173581.pdf
Data publikacji:
2021
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
handwritten documents
diacritic
neural networks
character recognition
deep learning
dokument odręczny
znaki diakrytyczne
sieci neuronowe
rozpoznawanie znaków
głęboka nauka
Opis:
Convolutional Neural Networks (CNN) have achieved huge popularity in solving problems in image analysis and in text recognition. In this work, we assess the effectiveness of CNN-based architectures where a network is trained in recognizing handwritten characters based on Latin script. European languages such as Dutch, French, German, etc., use different variants of the Latin script, so in the conducted research, the Latin alphabet was extended by certain characters with diacritics used in Polish language. To evaluate the recognition results under the same conditions, a handwritten Latin dataset was also developed. The proposed CNN architecture produced an accuracy of 96% for the extended character set. This is comparable to state-of-the-art results found in the domain of identifying handwritten characters. The presented approach extends the usage of CNN-based recognition to different variants of the Latin characters and shows it can be successfully used for a set of languages based on that script. It seems to be an effective technique for a set of languages written using the Latin script.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2021, 69, 1; art. no. e136210
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Development of Extensive Polish Handwritten Characters Database for Text Recognition Research
Autorzy:
Tokovarov, Mikhail
Kaczorowska, Monika
Miłosz, Marek
Powiązania:
https://bibliotekanauki.pl/articles/102832.pdf
Data publikacji:
2020
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
OCR
Handwriting character samples
Database for optical character recognition
Polish handwritten characters database
Próbki znaków pisma ręcznego
Baza danych do optycznego rozpoznawania znaków
Baza polskich znaków pisanych odręcznie
Opis:
In the modern world, fast and efficient processing of non-digital (handwritten or typed) texts is the task of extreme importance. Similar to many other fields, optical character recognition (OCR) benefits from the application of machine learning (ML) which allows developing effective and accurate methods. In order to achieve good performance, a machine learning algorithm requires great amount of data. Nowadays, a large database of handwritten characters prepared by National Institute of Standards and Technology (NIST), USA, can be used for training an ML model. However, significant differences between the manners of handwriting exist in the US and Poland. That fact, along with the absence of Polish diacritical marks, causes the NIST database to be less useful for development of an OCR model for the Polish language. According to the best of the authors’ knowledge, no database with samples of Polish handwriting exists. The present research is focused at filling this gap, i.e. gathering and preparing an extensive database of Polish handwritten characters. The paper presents the very first database of Polish handwriting samples. The database is by far larger than all the datasets used in the previous attempts of implementing OCR for the Polish handwriting. It is also the first fully publicly accessible database of Polish handwriting of this scale. The same method and developed tools can be used to build handwritten characters databases of other languages.
Źródło:
Advances in Science and Technology. Research Journal; 2020, 14, 3; 30-38
2299-8624
Pojawia się w:
Advances in Science and Technology. Research Journal
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Cross-task code reuse in genetic programming applied to visual learning
Autorzy:
Jaśkowski, W.
Krawiec, K.
Wieloch, B.
Powiązania:
https://bibliotekanauki.pl/articles/330367.pdf
Data publikacji:
2014
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
genetic programming
code reuse
knowledge sharing
visual learning
multi task learning
optical character recognition
programowanie genetyczne
dzielenie się wiedzą
uczenie wizualne
optyczne rozpoznawanie znaków
Opis:
We propose a method that enables effective code reuse between evolutionary runs that solve a set of related visual learning tasks. We start with introducing a visual learning approach that uses genetic programming individuals to recognize objects. The process of recognition is generative, i.e., requires the learner to restore the shape of the processed object. This method is extended with a code reuse mechanism by introducing a crossbreeding operator that allows importing the genetic material from other evolutionary runs. In the experimental part, we compare the performance of the extended approach to the basic method on a real-world task of handwritten character recognition, and conclude that code reuse leads to better results in terms of fitness and recognition accuracy. Detailed analysis of the crossbred genetic material shows also that code reuse is most profitable when the recognized objects exhibit visual similarity.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2014, 24, 1; 183-197
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies