Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "text mining" wg kryterium: Wszystkie pola


Tytuł:
Linking with BIAM: searching for drugs and pharmaceutical substances
Autorzy:
Węgrzyn-Wolska, K.
Powiązania:
https://bibliotekanauki.pl/articles/333882.pdf
Data publikacji:
2007
Wydawca:
Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Tematy:
eklsporacja tekstów biomedycznych
pochodzenie synonimów i skrótów
biomedicines text mining
named entity recognition
synonyms and abbreviation extraction
Opis:
The quantity of biomedical publications is growing at an exponential rate. With such explosive growth of the content, it is more and more difficult to locate, retrieve and manage the resulting information. This is why text mining has become a necessity. The main goal of biomedical research is to put knowledge to practical use in the form of diagnoses, prevention, and treatment. It is important to pool the resources between the different individuals researching results. The objective of this paper is to discuss the variety of issues and challenges surrounding the perspectives regarding the use of Information Retrieval and Text Mining methods in biomedicine. The article will first look at the directions in biomedical TM and then describe the work done for the BIAM project, the French on-line Medical Data Base.
Źródło:
Journal of Medical Informatics & Technologies; 2007, 11; 255-261
1642-6037
Pojawia się w:
Journal of Medical Informatics & Technologies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Ukryte modele Markowa jako metoda eksploracji danych tekstowych
Hidden Markov Models as a text mining method
Autorzy:
Mazurek, M.
Powiązania:
https://bibliotekanauki.pl/articles/305867.pdf
Data publikacji:
2010
Wydawca:
Wojskowa Akademia Techniczna im. Jarosława Dąbrowskiego
Tematy:
eksploracja danych tekstowych
ukryte modele Markowa
ekstrakcja informacji
text mining
hidden Markov model
information retrieval
Opis:
W eksploracji danych tekstowych z dużym powodzeniem stosuje się probabilistyczne modele dokumentów. W artykule przedstawiony został jeden z podstawowych, dla tej dziedziny informatyki, sposobów reprezentacji dokumentu za pomocą ukrytych modeli Markowa. Przedstawiono definicję ukrytego modelu Markowa oraz sposób wyznaczenia podstawowych wielkości związanych z wykorzystaniem tego modelu, takich jak prawdopodobieństwo wystąpienia obserwowanej sekwencji symboli (słów), wyszukanie najbardziej prawdopodobnej sekwencji stanów procesu, czy też formuły reestymacji parametrów modelu używane w procesie uczenia modelu.
In the text mining applications probabilistic models of document are widely used. In this paper the Hidden Markov Models were described as a fundamental method for text processing. Definition of the HMM was presented and the algorithms to find parameters of the model. Some of the possible applications of HMM were suggested.
Źródło:
Biuletyn Instytutu Systemów Informatycznych; 2010, 6; 27-31
1508-4183
Pojawia się w:
Biuletyn Instytutu Systemów Informatycznych
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Review of Artificial Intelligence Algorithms in Document Classification
Autorzy:
Bilski, A.
Powiązania:
https://bibliotekanauki.pl/articles/226245.pdf
Data publikacji:
2011
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
classifier
text classification
data mining
information retrieval
machine learning algorithms
Opis:
With the evolution of Internet, the meaning and accessibility of text documents and electronic information has increased. The automatic text categorization methods became essential in the information organization and data mining process. A proper classification of e-documents, various Internet information, blogs, emails and digital libraries requires application of data mining and machine learning algorithms to retrieve the desired data. The following paper describes the most important techniques and methodologies used for the text classification. Advantages and effectiveness of contemporary algorithms are compared and their most notable applications presented.
Źródło:
International Journal of Electronics and Telecommunications; 2011, 57, 3; 263-270
2300-1933
Pojawia się w:
International Journal of Electronics and Telecommunications
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Crowdsourcing in rescue fire service - proposed application
Autorzy:
Mirończuk, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/41204253.pdf
Data publikacji:
2011
Wydawca:
Uniwersytet Kazimierza Wielkiego w Bydgoszczy
Tematy:
crowdsourcing
design of information system
information system
text data mining
exploratory analysis of text data
text analyzing
Opis:
This article describes the author's proposal to apply crowdsourcing in Polish rescue fire service. This article also describes basic principles for implementing an crowdsourcing information platform in rescue fire service as well as the scheme of its implementation. The Author of this paper also describes the genesis of this proposal related to the evaluation of research conducted by the author on text mining analysis and extraction of information in the design of information systems.
Źródło:
Studia i Materiały Informatyki Stosowanej; 2011, 5; 15-20
1689-6300
Pojawia się w:
Studia i Materiały Informatyki Stosowanej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Document Clustering : Concepts, Metrics and Algorithms
Autorzy:
Tarczynski, T.
Powiązania:
https://bibliotekanauki.pl/articles/226231.pdf
Data publikacji:
2011
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
document clustering
text mining
k-means
hierarchical clustersting
vector space model
Opis:
Document clustering, which is also refered to as text clustering, is a technique of unsupervised document organisation. Text clustering is used to group documents into subsets that consist of texts that are similar to each orher. These subsets are called clusters. Document clustering algorithms are widely used in web searching engines to produce results relevant to a query. An example of practical use of those techniques are Yahoo! hierarchies of documents [1]. Another application of document clustering is browsing which is defined as searching session without well specific goal. The browsing techniques heavily relies on document clustering. In this article we examine the most important concepts related to document clustering. Besides the algorithms we present comprehensive discussion about representation of documents, calculation of similarity between documents and evaluation of clusters quality.
Źródło:
International Journal of Electronics and Telecommunications; 2011, 57, 3; 271-277
2300-1933
Pojawia się w:
International Journal of Electronics and Telecommunications
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Personalized Knowledge Mining in Large Text Sets
Autorzy:
Chudzian, C.
Granat, J.
Klimasara, E.
Sobieszek, J.
Wierzbicki, A. P.
Powiązania:
https://bibliotekanauki.pl/articles/307901.pdf
Data publikacji:
2011
Wydawca:
Instytut Łączności - Państwowy Instytut Badawczy
Tematy:
human centered computing
knowledge engineering
ontological engineering
personalized ontology
Opis:
The paper starts with a discussion of the concept of knowledge engineering, in particular ontological engineering. Consequently, the paper presents assumptions accepted as a basis for a group research on a radically personalized system of ontological knowledge mining, relying on the perspective of human centered computing and combining ontological concepts of the user with an ontology resulting from an automatic classification of a given set of textual data. The paper presents a pilot system PrOnto that supports research work in two aspects: searching for information interesting for a user according to her/his personalized ontological profile, and supporting research cooperation in a group of users (Virtual Research Community) according, e.g., to a comparison of such personalized ontological profiles. The paper concludes with suggestions concerning diverse applications of ontological engineering tools and future work.
Źródło:
Journal of Telecommunications and Information Technology; 2011, 3; 123-130
1509-4553
1899-8852
Pojawia się w:
Journal of Telecommunications and Information Technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Cross-Cultural Study of Online Marketing in International Higher Education – a Keyword Analysis
Autorzy:
Kincl, Tomáš
Novák, Michal
Štrach, Pavel
Powiązania:
https://bibliotekanauki.pl/articles/26171630.pdf
Data publikacji:
2013-06-30
Wydawca:
Wydawnictwo Adam Marszałek
Tematy:
higher education
cross-cultural marketing
GLOBE
text-mining
Opis:
Higher education is a dynamic global industry with a highly competitive and developed market. Universities communicate their international programs to attract prospective students interested in studying abroad. This study addresses a question whether there is a difference between communicated characteristics of international programs among universities from various cultures. Websites of seventy universities coming from different cultural clusters are analysed using data-mining methods. The results suggests that marketing communications in international higher education do not stand on cultural grounds as there are only minor differences between international program communications across the world. The only difference in the group of prime international higher education providers was found between the Anglo-Saxon universities and the rest of the world.
Źródło:
The New Educational Review; 2013, 32; 49-65
1732-6729
Pojawia się w:
The New Educational Review
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Cluo: web-scale text mining system for open source intelligence purposes
Autorzy:
Maciołek, P.
Dobrowolski, G.
Powiązania:
https://bibliotekanauki.pl/articles/305361.pdf
Data publikacji:
2013
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
text mining
big data
OSINT
natural language processing
monitoring
Opis:
The amount of textual information published on the Internet is considered to be in billions of web pages, blog posts, comments, social media updates and others. Analyzing such quantities of data requires high level of distribution – both data and computing. This is especially true in case of complex algorithms, often used in text mining tasks. The paper presents a prototype implementation of CLUO – an Open Source Intelligence (OSINT) system, which extracts and analyzes significant quantities of openly available information.
Źródło:
Computer Science; 2013, 14 (1); 45-62
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Propozycja mieszanego przetwarzania półstrukturalnego modelu opisu zdarzeń z akcji ratowniczo-gaśniczych Państwowej Straży Pożarnej PSP3
Proposition of hybrid process model semi structured description of event from fire services rescues operation
Autorzy:
Mirończuk, M.
Maciak, T.
Powiązania:
https://bibliotekanauki.pl/articles/373949.pdf
Data publikacji:
2013
Wydawca:
Centrum Naukowo-Badawcze Ochrony Przeciwpożarowej im. Józefa Tuliszkowskiego
Tematy:
eksploracja tekstu
klasyfikator Bayesa
naiwny klasyfikator Bayesa
ontologia służb ratowniczych
reprezentacja meldunków
reprezentacja przypadków zdarzeń
reprezentacja tekstu
wnioskowanie na podstawie przypadków
Bayes classifier
casebased reasoning
naive Bayes classifier
ontology for rescue service
representation of reports
text mining
text representation
Opis:
W opracowaniu przedstawiono aktualnie rozwijane reprezentacje wiedzy i sposoby opisów zdarzeń, dla systemu wnioskowania na podstawie przypadków zdarzeń służb ratowniczych Państwowej Straży Pożarnej PSP. W artykule zaproponowano sposób ich przetwarzania. Przedstawiony sposób bazuje na klasyfikacji i wyszukiwaniu opisów zdarzeń.
This paper describes a review of actual developed knowledge representation and case representation for fire services cases based reasoning system. The article also describes a method of processing the cases of events. This processing method based on classification and information retrieval.
Źródło:
Bezpieczeństwo i Technika Pożarnicza; 2013, 1; 95-106
1895-8443
Pojawia się w:
Bezpieczeństwo i Technika Pożarnicza
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Text mining in practice: exploring patterns in text collections of remote work job offers
Autorzy:
Kuligowska, Karolina
Lasek, Mirosława
Powiązania:
https://bibliotekanauki.pl/articles/431872.pdf
Data publikacji:
2013
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
text mining
text analytics
clustering
concept linking
remote work
telecommuting
Opis:
The aim of this paper is to give an insight into text mining techniques in the context of unstructured text collections of location independent job offers. In order to extract useful information, uncover interesting patterns and features of remote work, we analyze the five most popular and most visited websites containing job offers. We examine clusters of remote job offers, the keywords describing those clusters, as well as the linkages between strongly associated terms describing mobile work offers. It is interesting to observe the maturity of the text mining tools which have broadened their applications to new research topics and have become suitable to explore new phenomena.
Źródło:
Informatyka Ekonomiczna; 2013, 4(30); 181-195
1507-3858
Pojawia się w:
Informatyka Ekonomiczna
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza sentymentu – metoda analizy danych jakościowych. Przykład zastosowania oraz ewaluacja słownika RID i metody klasyfikacji Bayesa w analizie danych jakościowych
Sentiment analysis. An example of application and evaluation of RID dictionary and Bayesian classification methods in qualitative data analysis approach
Autorzy:
Tomanek, Krzysztof
Powiązania:
https://bibliotekanauki.pl/articles/622902.pdf
Data publikacji:
2014
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
analiza danych jakościowych
analiza sentymentu
analiza treści
text mining
kodowanie tekstów
przetwarzanie języka naturalnego słownik RID
naiwny klasyfikator Bayesa
CAQDAS
qualitative data analysis
sentiment analysis
content analysis
coding techniques
natural language processing
RID dictionary
naive Bayes
Opis:
Celem artykułu jest prezentacja podstawowych metod klasyfikacji jakościowych danych tekstowych. Metody te korzystają z osiągnięć wypracowanych w takich obszarach, jak przetwarzanie języka naturalnego i analiza danych nieustrukturalizowanych. Przedstawiam i porównuję dwie techniki analityczne stosowane wobec danych tekstowych. Pierwsza to analiza z zastosowaniem słownika tematycznego. Druga technika oparta jest na idei klasyfikacji Bayesa i opiera się na rozwiązaniu zwanym naiwnym klasyfikatorem Bayesa. Porównuję efektywność dwóch wspomnianych technik analitycznych w ramach analizy sentymentu. Akcentuję rozwiązania mające na celu zbudowanie trafnego, w kontekście klasyfikacji tekstów, słownika. Porównuję skuteczność tak zwanych analiz nadzorowanych do skuteczności analiz zautomatyzowanych. Wyniki, które prezentuję, wzmacniają wniosek, którego treść brzmi: słownik, który w przeszłości uzyskał dobrą ocenę jako narzędzie klasyfikacyjne, gdy stosowany jest wobec nowego materiału empirycznego, powinien przejść fazę ewaluacji. Jest to, w proponowanym przeze mnie podejściu, podstawowy proces adaptacji słownika analitycznego, traktowanego jako narzędzie klasyfikacji tekstów.
The purpose of this article is to present the basic methods for classifying text data. These methods make use of achievements earned in areas such as: natural language processing, the analysis of unstructured data. I introduce and compare two analytical techniques applied to text data. The first analysis makes use of thematic vocabulary tool (sentiment analysis). The second technique uses the idea of Bayesian classification and applies, so-called, naive Bayes algorithm. My comparison goes towards grading the efficiency of use of these two analytical techniques. I emphasize solutions that are to be used to build dictionary accurate for the task of text classification. Then, I compare supervised classification to automated unsupervised analysis’ effectiveness. These results reinforce the conclusion that a dictionary which has received good evaluation as a tool for classification should be subjected to review and modification procedures if is to be applied to new empirical material. Adaptation procedures used for analytical dictionary become, in my proposed approach, the basic step in the methodology of textual data analysis.
Źródło:
Przegląd Socjologii Jakościowej; 2014, 10, 2; 118-136
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Implementacja oraz porównanie algorytmów tekstowych w środowiskach przetwarzania równoległego na przykładzie procesorów wielordzeniowych i kart graficznych
Multicore and GPGPU implementation of chosen text algorithms
Autorzy:
Pietroń, M.
Wielgosz, M.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/155953.pdf
Data publikacji:
2014
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
algorytmy tekstowe
GPGPU
obliczenia równoległe
text mining
text algorithms
parallel computing
Opis:
Artykuł przedstawia implementację algorytmów tekstowych w wybranych platformach przetwarzania równoległego. Dostępność procesorów wielordzeniowych oraz kart graficznych ogólnego przeznaczenia sprawia, iż badania nad równoległą implementacją algorytmów w celu ich akceleracji nabierają coraz większego znaczenia. Algorytmy tekstowe są niezwykle istotnym i często niezbędnym elementem zaawansowanych algorytmów analizy tekstu oraz są także składowymi funkcji wyszukiwania wzorców w tekście wielu języków programowania. W pracy dokonano analizy najpopularniejszych algorytmów tekstowych oraz dokonano ich analizy pod kątem ich zrównoleglenia w celu ich implementacji w procesorze wielordzeniowym oraz karcie graficznej ogólnego przeznaczenia. Analizowanymi algorytmami są: boyer-moore, algorytm naiwny oraz algorytm knuth-morris-pratt. Następnie dokonano porównania efektywności ich realizacji na wymienionych platformach sprzętowych.
This paper presents implementation of text algorithms in multicore CPU and GPGPU. The text algorithms are very common algorithms used in text analysis process and they are a part of functions used for text patterns recognition. The library functions for text searching implemented in many languages very often use most popular text-algorithms. The paper describes the analysis of these algorithms for parallel implementations in multicore processors and general purpose graphic cards. The research work presented in this paper shows that text algorithms can be partially parallelized. The process of acceleration can be done by appropriate dividing the input text between parallel threads (data parallelism). The comparative studies were performed for the following algorithms: boyer-moore (horspool) , naive and knuth-morris-pratt algorithm. The presented results show the efficiency of these algorithms in the case of different type and size of patterns. In the case of GPU the implementation was made in the CUDA framework. The OpenMP library was used for a multicore version.
Źródło:
Pomiary Automatyka Kontrola; 2014, R. 60, nr 5, 5; 301-304
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Information management tools for innovation analysts
Narzędzia zarządzania informacją dla analityków innowacji
Autorzy:
Eito-Brun, R.
Powiązania:
https://bibliotekanauki.pl/articles/256694.pdf
Data publikacji:
2014
Wydawca:
Sieć Badawcza Łukasiewicz - Instytut Technologii Eksploatacji - Państwowy Instytut Badawczy
Tematy:
innovation
scientometrics
text mining
opinion mining
text visualization
innowacja
naukometria
eksploracja tekstu
badanie opinii
wizualizacja tekstu
Opis:
Innovation management is a knowledge-intensive process that requires dealing with different sources of data to identify relationships between the concepts, techniques, and tools that may led to innovations. Innovation analysts need to handle huge amounts of unstructured information: ideas gathered from internal staff and external partners, research papers and technical reports, patents and applications, etc. All these sources constitute valid inputs to assess the innovativeness of ideas, the feasibility of their implementation, and their potential value in the market. Innovation management discipline has widely used techniques and methods developed in the context of Information Science to support the identification of research trends, assess the outputs of innovation efforts and investments, and monitor the market and the activities made by competitors. The fruitful relationship between Information Science techniques and Innovation management needs to be regularly reviewed as new techniques and tools are designed and made available to the community. In the last years, significant progress has been achieved in areas like scientometrics, text visualization, and opinion mining. This paper provides an overview of these techniques and discusses how they can help professionals involved in innovation programs.
Zarządzanie innowacjami to oparty na wiedzy proces, w którym definiowany jest poziom zależności pomiędzy pomysłami, technikami i narzędziami mogącymi skutkować opracowaniem innowacji. Analityk innowacji musi zarządzać treściami niestrukturalnymi: pomysłami zgromadzonymi od pracowników jak i partnerów, wiedzą pochodzącą z publikacji naukowych i raportów technicznych, patentami i zgłoszeniami patentowymi itp. Wszystkie te źródła stanowią istotny wkład w proces oceny innowacyjności pomysłu, możliwości jego realizacji oraz konkurencyjności rynkowej. W zarządzaniu innowacjami powszechnie stosowane są techniki i metody informatyczne, które wspomagają proces identyfikacji trendów, oceny rezultatów, oszacowania niezbędnych nakładów finansowych czy monitorowania rynku. Oznacza to, że należy regularnie monitorować stan wiedzy i techniki w tym obszarze w celu zapewnienia jak najbardziej owocnej współpracy na styku nauk informatycznych i zarządzania innowacjami. W ostatnich latach znaczący postęp osiągnięto w takich dziedzinach jak naukometria, wizualizacja tekstu i badanie opinii. W artykule dokonano przeglądu tych technik i omówiono sposób, w jaki mogą one wspomóc specjalistów zaangażowanych w realizację innowacyjnych programów.
Źródło:
Problemy Eksploatacji; 2014, 4; 73-82
1232-9312
Pojawia się w:
Problemy Eksploatacji
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Identification of Factors Contributing to Self-Reported Anomalies in Civil Aviation
Autorzy:
Andrzejczak, C.
Karwowski, W.
Thompson, W.
Powiązania:
https://bibliotekanauki.pl/articles/90652.pdf
Data publikacji:
2014
Wydawca:
Centralny Instytut Ochrony Pracy
Tematy:
self-reported anomalies
civil aviation
human factors
pilot error
text mining
correspondence analysis
czynnik ludzki
lotnictwo cywilne
błąd pilota
analiza tekstu
Opis:
The main objective of this study was to analyze anomalies voluntarily reported by pilots in civil aviation sector and identify factors leading to such anomalies. Experimental data were obtained from the NASA aviation safety reporting system (ASRS) database. These data contained a range of text records spanning 30 years of civilian aviation, both commercial (airline operations) and general aviation (private aircraft). Narrative data as well as categorical data were used. The associations between incident contributing factors and selfreported anomalies were investigated using data mining and correspondence analysis. The results revealed that a broadly defined human factors category and weather conditions were the main contributors to selfreported civil aviation anomalies. New associations between identified factors and reported anomaly conditions were also reported.
Źródło:
International Journal of Occupational Safety and Ergonomics; 2014, 20, 1; 3-18
1080-3548
Pojawia się w:
International Journal of Occupational Safety and Ergonomics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The system developing of forming research schools basis of publication elements analysis
Autorzy:
Shakhovska, N.
Noha, R
Powiązania:
https://bibliotekanauki.pl/articles/117910.pdf
Data publikacji:
2014
Wydawca:
Polskie Towarzystwo Promocji Wiedzy
Tematy:
research school
clustering
text mining
Opis:
In this paper the method of research publications elements analysis that is determining common qualities of research publications and their clustering as an instrument of selecting and sorting out the information about research schools has been introduced. In module structuring documents transmitted there are tape that indicates the address of the file. Depending on where the file is, it can be a path to a file on the local disk or URL on the Internet.
Źródło:
Applied Computer Science; 2014, 10, 2; 57-66
1895-3735
Pojawia się w:
Applied Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies