Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "text algorithms" wg kryterium: Temat


Wyświetlanie 1-9 z 9
Tytuł:
Detecting approximately duplicate bibliographic records with text algorithms: experience of creating a union catalogue of libraries at the Warsaw University of Technology
Autorzy:
Płoszajski, G.
Powiązania:
https://bibliotekanauki.pl/articles/1954635.pdf
Data publikacji:
2003
Wydawca:
Politechnika Gdańska
Tematy:
duplicate record resolution
n-grams
text algorithms
Opis:
The paper describes a fault-tolerant method of selecting duplicate bibliographic records in catalogues. The method is based on the use of text algorithms; decisions are suggested to librarians who make the final decision. The method was applied to four library catalogues at the Warsaw University of Technology which were compared with the catalogue of the main library. Process of joining catalogues was conducted differently for non-duplicate records and for duplicate ones. Thanks to this method, a significant portion of records in the catalogues of the joining libraries had been found to be duplicate before the catalogues were added. The algorithms proved helpful in assuring high quality of information.
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 2003, 7, 2; 294-297
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Lokalizacja tekstu w obrazie
Localization of text in images
Autorzy:
Pazio, M.
Powiązania:
https://bibliotekanauki.pl/articles/153776.pdf
Data publikacji:
2008
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
image analysis
text detection algorithms
Opis:
W naturalnym otoczeniu człowieka znajduje się duża ilość łatwo rozpoznawalnej informacji przedstawionej w postaci znaków graficznych i tekstu. Informacja taka jest bardzo przydatna w poruszaniu się w środowisku miejskim. Niestety, osoby z upośledzonymi funkcjami wzroku w sposób oczywisty pozbawione są możliwości korzystania z tego rodzaju przekazu. Istniejące na rynku systemy rozpoznawania tekstu (OCR) nie są niestety dostosowane do rozpoznawania tekstu zawartego w obrazach zarejestrowanych kamerą czy aparatem cyfrowym. W artykule przedstawiono, opracowane w Katedrze Systemów Automatyki Wydziału ETI PG, algorytmy wyszukiwania tekstu w obrazie oraz jego przetwarzania do postaci umożliwiającej rozpoznanie przez system OCR i odczytania treści za pomocą syntezatora mowy.
The system capable of localizing and reading aloud text embedded in natural scene images can be very helpful for blind and visually impaired persons - providing information useful in everyday life and increasing their confidence and autonomy. Even though the currently available optical character recognition (OCR) programs are fast and accurate, most of them fail to recognize text embedded in natural scene images. The goal of the algorithm described in this paper is to localize text-like image regions and pre-process them in a way that will make OCR work more reliably. The approach described in the paper is based on color image segmentation and segment shape analysis. Preliminary tests have shown that the proposed algorithm offers satisfactory detection rate and is pretty robust to typical text distortions, such as slant, tilt and bend.
Źródło:
Pomiary Automatyka Kontrola; 2008, R. 54, nr 3, 3; 153-156
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Implementacja oraz porównanie algorytmów tekstowych w środowiskach przetwarzania równoległego na przykładzie procesorów wielordzeniowych i kart graficznych
Multicore and GPGPU implementation of chosen text algorithms
Autorzy:
Pietroń, M.
Wielgosz, M.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/155953.pdf
Data publikacji:
2014
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
algorytmy tekstowe
GPGPU
obliczenia równoległe
text mining
text algorithms
parallel computing
Opis:
Artykuł przedstawia implementację algorytmów tekstowych w wybranych platformach przetwarzania równoległego. Dostępność procesorów wielordzeniowych oraz kart graficznych ogólnego przeznaczenia sprawia, iż badania nad równoległą implementacją algorytmów w celu ich akceleracji nabierają coraz większego znaczenia. Algorytmy tekstowe są niezwykle istotnym i często niezbędnym elementem zaawansowanych algorytmów analizy tekstu oraz są także składowymi funkcji wyszukiwania wzorców w tekście wielu języków programowania. W pracy dokonano analizy najpopularniejszych algorytmów tekstowych oraz dokonano ich analizy pod kątem ich zrównoleglenia w celu ich implementacji w procesorze wielordzeniowym oraz karcie graficznej ogólnego przeznaczenia. Analizowanymi algorytmami są: boyer-moore, algorytm naiwny oraz algorytm knuth-morris-pratt. Następnie dokonano porównania efektywności ich realizacji na wymienionych platformach sprzętowych.
This paper presents implementation of text algorithms in multicore CPU and GPGPU. The text algorithms are very common algorithms used in text analysis process and they are a part of functions used for text patterns recognition. The library functions for text searching implemented in many languages very often use most popular text-algorithms. The paper describes the analysis of these algorithms for parallel implementations in multicore processors and general purpose graphic cards. The research work presented in this paper shows that text algorithms can be partially parallelized. The process of acceleration can be done by appropriate dividing the input text between parallel threads (data parallelism). The comparative studies were performed for the following algorithms: boyer-moore (horspool) , naive and knuth-morris-pratt algorithm. The presented results show the efficiency of these algorithms in the case of different type and size of patterns. In the case of GPU the implementation was made in the CUDA framework. The OpenMP library was used for a multicore version.
Źródło:
Pomiary Automatyka Kontrola; 2014, R. 60, nr 5, 5; 301-304
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Raising a Child to Live in Society – Personality Traits Parents Develop and Prevent from Developing in their Preschool Children
Autorzy:
Szymańska, Agnieszka
Aranowska, Elżbieta
Powiązania:
https://bibliotekanauki.pl/articles/36420330.pdf
Data publikacji:
2022-12-20
Wydawca:
Wydawnictwo Naukowe Chrześcijańskiej Akademii Teologicznej w Warszawie
Tematy:
personality development
disorders of personality
parental goals
data mining algorithms
text mining algorithms
social network analysis
Opis:
Personal characteristics that parents want to shape in their children are called parental goals and can be divided into desired and undesired traits. Which of them are most and the least desirable by parents in context of developing child’s personality? Do parental goals change with the age of the child? The study was conducted on a sample of 319 parents of children aged 3, 4, 5 and 6 years old. Analyses were carried out using two data mining algorithms: (a) text mining algorithms, (b) support vector machine and (c) social network analysis, and (d) Aranowska's λ judge agreement coefficient. The results revealed that parents of preschool children care mainly about the development of competency traits, especially self-reliance. When it comes to undesirable traits, parents make sure that their children do not develop traits from the field of temperament - personality (especially aggressiveness) and traits from the area of lack of virtues (selfishness, laziness, lies). It is noticeable that when the child reaches the age of 4 the parental goals change. Based on the characteristics selected by parents, it can be correctly predicted how old the child is.
Źródło:
Studia z Teorii Wychowania; 2022, XIII(4 (41)); 409-431
2083-0998
2719-4078
Pojawia się w:
Studia z Teorii Wychowania
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wykorzystanie algorytmów Text Mininig do analizy danych tekstowych w psychologii
Usage of text mining algorithms to analyze textual data in psychology
Autorzy:
Szymańska, Agnieszka
Powiązania:
https://bibliotekanauki.pl/articles/475485.pdf
Data publikacji:
2017
Wydawca:
Polska Akademia Nauk. Instytut Języka Polskiego PAN
Tematy:
algorytmy
dane tekstowe
text mining
algorithms
text data
Opis:
W psychologii analizy danych zapisanych w postaci tekstów stanowią ważny element prac badawczych. Niemniej nadal poszukuje się narzędzi, metod, które mogą umożliwić szybką analizę danych zarejestrowanych w postaci tekstów, gdyż analizy te są najczęściej bardzo czasochłonne. W prezentowanym artykule przybliżono metodę text mining, która ma szczególne zastosowanie w analizie informacji zapisanych w postaci danych tekstowych. Wykorzystanie metody text mining jest omawiane na przykładzie analizy obieranych przez rodziców celów wychowawczych.. W artykule przedstawiono sposób, w jaki algorytmy text mining: a) dokonują analizy tekstu przez zliczenie słów i nadanie im wag, b) przeprowadzają analizę relacji między słowami za pomocą składowych głównych (Principal Component Analysis), c) przekształcają dane słownew liczbowe, przygotowując zbiór danych do kolejnych obliczeń.
In the psychology the analysis of data written in the form of texts are an important element of research work. Nevertheless, tools are still sought, methods that can enable rapid analysis of data recorded in the form of texts, because these analyzes are usually very time consuming. This article approximates the text mining method, which is particularly applicable in the analysis of information recorded in the form of text data. Analysing textual data using text mining algorithms is shown on the example of parents’ choice of educational goals. The paper presents the way in which text mining algorithms: a) perform text analysis by counting words and weighting them, b) analyze relationships between words by means of Principal Component Analysis, c) convert verbal data into numerals by preparing a set data for subsequent calculations.
Źródło:
Socjolingwistyka; 2017, 31; 99-116
0208-6808
Pojawia się w:
Socjolingwistyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Assessment of nature-inspired algorithms for text feature selection
Autorzy:
Çoban, Önder
Powiązania:
https://bibliotekanauki.pl/articles/27312909.pdf
Data publikacji:
2022
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
nature-inspired algorithms
feature selection
text categorization
Opis:
This paper provides a comprehensive assessment of basic feature selection (FS) methods that have originated from nature-inspired (NI) meta-heuristics; two well-known filter-based FS methods are also included for comparison. The performances of the considered methods are compared on four balanced highdimensional and real-world text data sets regarding the accuracy, the number of selected features, and computation time. This study differs from existing studies in terms of the extent of experimental analyses that were performed under different circumstances where the classifier, feature model, and term-weighting scheme were different. The results of the extensive experiments indicated that basic NI algorithms produce slightly different results than filter-based methods for the text FS problem. However, filter-based methods often provide better results by using lower numbers of features and computation times.
Źródło:
Computer Science; 2022, 23 (2); 179--204
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Review of Artificial Intelligence Algorithms in Document Classification
Autorzy:
Bilski, A.
Powiązania:
https://bibliotekanauki.pl/articles/226245.pdf
Data publikacji:
2011
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
classifier
text classification
data mining
information retrieval
machine learning algorithms
Opis:
With the evolution of Internet, the meaning and accessibility of text documents and electronic information has increased. The automatic text categorization methods became essential in the information organization and data mining process. A proper classification of e-documents, various Internet information, blogs, emails and digital libraries requires application of data mining and machine learning algorithms to retrieve the desired data. The following paper describes the most important techniques and methodologies used for the text classification. Advantages and effectiveness of contemporary algorithms are compared and their most notable applications presented.
Źródło:
International Journal of Electronics and Telecommunications; 2011, 57, 3; 263-270
2300-1933
Pojawia się w:
International Journal of Electronics and Telecommunications
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Applying a q-Gram based multiple string matching algorithm for approximate matching
Zastosowanie algorytmu wyszukiwania wielu wzorców opartego o technikę q-Gramów do wyszukiwania przybliżonego
Autorzy:
Susik, R.
Powiązania:
https://bibliotekanauki.pl/articles/952718.pdf
Data publikacji:
2017
Wydawca:
Politechnika Lubelska. Wydawnictwo Politechniki Lubelskiej
Tematy:
text processing
approximate string matching
string algorithms
q-gram
przetwarzanie tekstu
wyszukiwanie przybliżone
algorytmy tekstowe
Opis:
We consider the application of multiple pattern matching (Multi AOSO on q-Grams) algorithm for approximate pattern matching. We propose the on-line approach which translates the problem from approximate pattern matching into a multiple pattern one (called partitioning into exact search). Presented solution allows relatively fast search multiple patterns in text with given k-differences(or mismatches). This paper presents comparison of solution based on MAG algorithm, and [4]. Experiments on DNA, English, Proteins and XML texts with up to k errors show that the new proposed algorithm achieves relatively good results in practical use.
Rozważamy zastosowanie algorytmu wyszukiwania wielu wzorców (Multi AOSO on q-Grams) do wyszukiwania przybliżonego. Proponujemy rozwiązanie on-line, upraszczające problem wyszukiwania przybliżonego do wyszukiwania wielu wzorców. Zaprezentowane rozwiązanie umożliwia relatywnie szybko wyszukiwać wiele wzorców dla odległości Levenshteina (lub Hamminga) z ograniczeniem do k. W artykule porównane jest rozwiązanie oparte na algorytmie MAG oraz [4]. Badania eksperymentalne przeprowadzone na zbiorach DNA, English, Proteins and XML z różnymi wartościami k wykazały, że zaproponowany algorytm osiąga relatywnie dobre wyniki w praktycznym zastosowaniu.
Źródło:
Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska; 2017, 7, 3; 47-50
2083-0157
2391-6761
Pojawia się w:
Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Searching Legal Information Using a Natural Language
Autorzy:
Jacek, Peltzel,
Powiązania:
https://bibliotekanauki.pl/articles/902819.pdf
Data publikacji:
2016
Wydawca:
Uniwersytet Warszawski. Wydawnictwa Uniwersytetu Warszawskiego
Tematy:
natural language in retrieval
ranking algorithms
statistical analysis of the text
learning programmes
Google for lawyers
WESTLAW IS NATURAL
FREESTYLE SEEARCHING
WESTLAWNEXT
Opis:
The article deals with a problem of constructing computer retrieval systems based on the use of natural language. Those kind of systems differ from the classical ones and relay on the idea that the user should have the possibility to introduce to the system search instructions in the same manner in which she or he asks a question. Searches in such systems don’t use any retrieval languages. They don’t use Boolean operators and every single word from the instruction is used as a separate search criterion. To the retrieved documents weights are assigned on the basis of statistical analysis of the text of the documents. This allows the ranking of documents and presenting the results of the search in an ordered manner. The first attempts of using such a system took place in 1960s, but in the field of legal information from the beginning of 1990s. The article presents the methods of searching used in WESTLAW IS NATURAL (WIN) created by West Publishing Company, FREESTYLE SEARCHING developed by Lexis Nexis and WESTLAW NEXT based on the idea Google for lawyers. The critical analysis of functioning and estimation of retrieval results shows that those kind of systems cannot replace traditional ones based on Boolean searching but can sometimes play a supplementary role.
Źródło:
Studia Iuridica; 2016, 68; 263-277
0137-4346
Pojawia się w:
Studia Iuridica
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-9 z 9

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies