Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "text mining" wg kryterium: Wszystkie pola


Wyświetlanie 1-79 z 79
Tytuł:
Kompetencje kierowników projektów – analiza text mining
Project managers’ competences – text mining analysis
Autorzy:
Wyskwarski, M.
Powiązania:
https://bibliotekanauki.pl/articles/323763.pdf
Data publikacji:
2018
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
text mining
competences
project manager
word cloud
kompetencje
kierownik projektu
chmura słów
Opis:
This article presents a proposal of identification of project managers’ competences in order to employers’ requirements. For this purpose the article presents the analysis of job advertisements with use of text analysis. According to that point of view the structure of the paper was created. The second part containing description of competences of project managers’. It shows the definition of competence, how it could be divided and which are the most important according to the authors. The third part of the article is divided into three pieces. First shows how to collect data to analysis. Second part shows procedure of text mining analysis, and the last part shows the results of such kind of analysis. It contains the words which appeared most frequently in the job offers and the correlation of those words with other words in text.
W artykule podjęto próbę identyfikacji oczekiwanych przez pracodawców kompetencji kierowników projektów. W tym celu przeanalizowano treść ofert pracy z wykorzystaniem analizy text mining. Stosownie do przyjętego celu ustalono strukturę pracy. W punkcie drugim przedstawiono najważniejsze informacje dotyczące kompetencji kierowników projektów. Wymieniono cztery modele kompetencji, przedstawiono czym one są, na jakie grupy można je podzielić oraz, które z nich według wybranych autorów są najistotniejsze. Punkt trzeci podzielono na trzy części. W pierwszej z nich przedstawiono sposób zebrania danych do analizy. Kolejna część opisuje procedurę przeprowadzonej analizy text mining. Ostatnia część prezentuje wyniki przeprowadzonej analizy. Ustalono jakie słowa w analizowanych ofertach pojawiały się najczęściej, oraz jak była korelacji tych słów z innymi słowami.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2018, 130; 689-701
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Text mining w analizie zbiorów publikacji naukowych
Text mining in analysis of scientific publications
Autorzy:
Wyskwarski, M.
Powiązania:
https://bibliotekanauki.pl/articles/326570.pdf
Data publikacji:
2017
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
text mining
chmura słów
publikacje naukowe
word clouds
scientific publications
Opis:
Często stosowaną form przechowywania informacji w organizacjach i społeczeństwie jest tekst. Tekst może zostać poddany eksploracji w celu pozyskania wcześniej nieznanej i użytecznej wiedzy. Celem niniejszego artykułu jest prezentacja wyników analizy wybranych publikacji naukowych. Analiza została przeprowadzona z wykorzystaniem text mining’u, a jej celem było ustalenie jakich słów najczęściej używali autorzy publikacji, oraz obliczenie korelacji tych słów z innymi.
Text is often used to store information in organizations and society. Text can be explored to gain previously unknown and useful knowledge. The aim of this article is to present the results of the analysis of selected scientific publications. The analysis was done using text mining. Its purpose was to determine what words were most used by the authors, and to calculate the correlation of those words with others words.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2017, 114; 635-647
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analysis of methods and means of text mining
Autorzy:
Rybchak, Z.
Basystiuk, O.
Powiązania:
https://bibliotekanauki.pl/articles/411072.pdf
Data publikacji:
2017
Wydawca:
Polska Akademia Nauk. Oddział w Lublinie PAN
Tematy:
text mining
text analytics
data analysis
high-quality information
text categorization
text clustering
document summarization
sentiment analysis
sieć językowa
analiza tekstu
analiza danych
wysoka jakość informacji
klasyfikacja tekstowa
kategoryzacja tekstowa
grupowanie tekstu
streszczenie dokumentów tekstowych
technika sentiment analysis
Opis:
In Big Data era when data volume doubled every year analyzing of all this data become really complicated task, so in this case text mining systems, techniques and tools become main instrument of analyzing tones and tones of information, selecting that information that suit the best for your needs and just help save your time for more interesting thing. The main aims of this article are explain basic principles of this field and overview some interesting technologies that nowadays are widely used in text mining.
Źródło:
ECONTECHMOD : An International Quarterly Journal on Economics of Technology and Modelling Processes; 2017, 6, 2; 73-78
2084-5715
Pojawia się w:
ECONTECHMOD : An International Quarterly Journal on Economics of Technology and Modelling Processes
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Identification of desired project manager competence using text mining analysis
Autorzy:
Wyskwarski, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/1845057.pdf
Data publikacji:
2020
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
text mining
competencies
project manager
word cloud
topic modeling
eksploracja tekstu
kompetencje
kierownik projektu
chmura słów
modelowanie tematyczne
Opis:
Purpose: An attempt to identify the competencies of the project manager desired by the employers and to determine whether changes have occurred over time. Design/methodology/approach: Job offers were automatically downloaded from website with job offers. An analysis of text mining of fragments of offers describing the competence was carried out. The analysis of text mining included initial text processing, creation of corpora of analyzed documents, creation of a document-term matrix, topic modeling algorithm and the use of classic methods derived from data mining. Findings: The most frequently used words/n-grams and the correlation of selected words/ n-grams with other words/n-grams were presented in the form of drawings. Based on the frequency of words/n-grams and the correlation value, efforts were made to identify the project manager competencies. The topic modeling algorithm was used to generate topics that can also be used to identify expected project manager competencies. Research limitations/implications: Only offers written in Polish, downloaded from one websites with job offers, which had the phrase “kierownik projektu” (“project manager”) in their job title, were analyzed. Data was collected from 09 to 11 April 2018 and from 09 to 11 April 2019. Practical implications: The method applied can be used by organizations preparing for the profession of a project manager, to modify and better adapt curricula to the needs of the labor market. Originality/value: Studies have shown that text mining of job offers can, to some extent, help determine the desired project manager competence.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2020, 149; 735-749
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Cluo: web-scale text mining system for open source intelligence purposes
Autorzy:
Maciołek, P.
Dobrowolski, G.
Powiązania:
https://bibliotekanauki.pl/articles/305361.pdf
Data publikacji:
2013
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
text mining
big data
OSINT
natural language processing
monitoring
Opis:
The amount of textual information published on the Internet is considered to be in billions of web pages, blog posts, comments, social media updates and others. Analyzing such quantities of data requires high level of distribution – both data and computing. This is especially true in case of complex algorithms, often used in text mining tasks. The paper presents a prototype implementation of CLUO – an Open Source Intelligence (OSINT) system, which extracts and analyzes significant quantities of openly available information.
Źródło:
Computer Science; 2013, 14 (1); 45-62
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Przegląd zastosowań analizy text miningowej
Overview of uses text mining analysis
Autorzy:
Gładysz, A.
Powiązania:
https://bibliotekanauki.pl/articles/311433.pdf
Data publikacji:
2016
Wydawca:
Instytut Naukowo-Wydawniczy "SPATIUM"
Tematy:
dokument tekstowy
eksploracja danych tekstowych
text mining
data mining
analiza danych tekstowych
przetwarzanie informacji
wyszukiwanie informacji
tłumaczenie automatyczne
nadmiar informacji
business intelligence
information retrieval
data processing
document similarity
machine translation
information overload
Opis:
W artykule omówiona została eksploracyjna analiza danych tekstowych ze szczególnym naciskiem na zastosowania analizy text miningowej. We współczesnym świecie istnieje wiele różnych branż biznesowych w których pracownicy stykają się z nadmiarem napływających informacji. Rozwój społeczeństwa informacyjnego oraz technologii informatycznych pociągnął za sobą w sposób naturalny powstanie zautomatyzowanych systemów wspomagających wyszukiwanie i porządkowanie informacji. Techniki text miningu znajdują coraz większe zastosowanie, zaś szeroki przegląd zastosowań wraz ze wskazaniem praktycznym możliwości zastosowania analizy text miningowej został dogłębnie omówiony w artykule.
The article discussed the text mining with particular emphasis on the use of text mining analysis. In the modern world there are many different business industries where workers are in contact with an excess of incoming information. The development of the information society and information technology entailed a natural rise of automated systems to support search and organize information. Text mining techniques are increasingly applied, and a broad overview of applications, together with an indication of the practical possibilities of the use of text mining analysis has been thoroughly discussed in the article.
Źródło:
Autobusy : technika, eksploatacja, systemy transportowe; 2016, 17, 12; 1742-1746
1509-5878
2450-7725
Pojawia się w:
Autobusy : technika, eksploatacja, systemy transportowe
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Responsibilities of project managers. A text mining analysis of job advertisements
Autorzy:
Wyskwarski, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/27313470.pdf
Data publikacji:
2022
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
text mining
duties and responsibilities
project manager
eksploracja tekstu
zadania i obowiązki
menedżer projektu
Opis:
Purpose: To identify the duties and responsibilities of project managers by analysing the content of online job advertisements. Design/methodology/approach: Job advertisements were automatically downloaded for 63 countries/areas available on Indeed. A text mining analysis of fragments of the advertisements describing the scope of duties was carried out. The text mining analysis included initial text processing, creating corpora of the documents, creating a document-term matrix, and using classic methods derived from data mining. Findings: The research established the most frequently used words and n-grams in job advertisements. They have been presented in the form of figures. The 2-grams are also presented in the form of a net, a directed graph. The LDA algorithm identified abstract topics describing the duties and responsibilities of project managers. The most frequent words, n-grams, and topics identified by the LDA algorithm were used to identify the duties and responsibilities of project managers. Research limitations/implications: Only job advertisements written in English were analysed. The postings were downloaded only for six days. An attempt to automatically identify the responsibilities section did not yield the expected results. Therefore, it was carried out manually for random advertisements, which reduced the number of analysed documents. The content of the job advertisements was not analysed by country/area. Practical implications: The method applied can be used by organisations training future project managers, to modify and better adapt curricula to the needs of the labour market. Originality/value: Studies have shown that text mining of job advertisements can help determine the duties and responsibilities of project managers.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2022, 161; 325--348
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Verification of text mining techniques accuracy when dealing with urban buses maintenance data
Weryfikacja dokładności metod text mining w przypadku analizy historycznych zbiorów danych dotyczących serwisu autobusów miejskich
Autorzy:
Marzec, M.
Uhl, T.
Michalak, D.
Powiązania:
https://bibliotekanauki.pl/articles/329366.pdf
Data publikacji:
2014
Wydawca:
Polska Akademia Nauk. Polskie Towarzystwo Diagnostyki Technicznej PAN
Tematy:
text mining
maintenance optimization
urban buses
management
optymalizacja serwisu
zarządzanie
autobus miejski
Opis:
Constantly increasing maintenance costs impose optimal maintenance policy planning. One possible way which helps to minimize maintenance costs and prevent bus fleet availability is analysis of historical maintenance records, which contain information about failures and performed repairs. In many cases this data have free text form and their analysis require individual log-by-log examination of their content. In order to automate this process, text mining methods can be applied. But, accuracy of the analysis depends on data quality and employed methods and should be tested before using this approach. This is especially important when the service decisions, which influence safety and maintenance costs, are made on this basis. The aim of this paper is to determine whether existing and currently used text-mining methods are sufficiently accurate to be used in classification of unstructured urban bus maintenance and repair data. For that purpose the case study and literature review has been conducted. The study shows great capabilities of proposed classification model. The model has 99% of accuracy and can be applied to support maintenance decisions.
Stale rosnące koszty utrzymania taboru autobusowego wymuszają potrzebę kształtowania odpowiedniej polityki serwisowej. Niezbędna w tym zakresie jest analiza danych historycznych, które zawierają informację o zaistniałych awariach i wykonanych naprawach. W wielu przypadkach dane te posiadają formę tekstową, co wymaga ich indywidualnej oceny rekord po rekordzie. W celu zautomatyzowania tego procesu istnieje możliwość zastosowania metod klasy text mining. Aby jednak wyniki analizy text mining mogły zostać wdrożone muszą wykazywać się one odpowiednią dokładnością. Jest to szczególnie istotne w przypadku, gdy na podstawie tych wyników podejmowane są decyzje serwisowe wpływające na bezpieczeństwo i koszty eksploatacyjne. Celem niniejszego artykułu jest weryfikacja, czy powszechnie stosowane metody text mining są wystarczająco dokładne, aby analizować historyczne dane serwisowe autobusów. W tym celu dokonano przeglądu literaturowego oraz analizy text mining tego konkretnego typu danych. Przeprowadzone badania wykazały, że dokładność klasyfikatora wynosi 99%. Na tej podstawie można stwierdzić, że są to metody wystarczająco dokładne, aby za ich pośrednictwem podejmować decyzję serwisowe.
Źródło:
Diagnostyka; 2014, 15, 3; 51-57
1641-6414
2449-5220
Pojawia się w:
Diagnostyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Text mining in the identification of duties and responsibilities of the project manager
Autorzy:
Wyskwarski, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/1882989.pdf
Data publikacji:
2020
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
text mining
duties
responsibilities
project manager
word cloud
topic modeling
eksploracja tekstu
obowiązki
odpowiedzialność
menedżer projektu
chmura słów
modelowanie tematyczne
Opis:
Purpose: An attempt to identify the duties and responsibilities of the project manager by analysing job offers from a job website. An attempt to determine whether there were any changes between 2018 and 2019. Design/methodology/approach: Text mining was performed for fragments of job offers, describing the duties and responsibilities. The text mining analysis consisted of initial processing of the text, creation of a corpus of analysed documents, construction of a word frequency matrix and use of classical methods from the data mining are. Findings: The most common words in job offers are presented, as well as their correlation with other words. With the use of the Topic modeling algorithm, hidden topics describing the analysed job offers have been generated. These topics can also be used to identify the duties and responsibilities of a project manager. Research limitations/implications: Only the job offers meeting the following conditions were analysed: (1) they concerned the job of „project manager”; (2) the content was in Polish; (3) they were provided by www.pracuj.pl website; (4) they were collected from 09 to 11 April in 2018 and 2019. Practical implications: This method can be used by organizations training project managers, in order to modify and better adjust the curriculum to the needs of the labour market. Originality/value: Research has shown that text mining can be used to determine the responsibilities of a project manager by analysing job offers.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2020, 144; 649-659
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Text mining approach to analyse the relation between obesity and breast cancer data
Autorzy:
Kumar, A.
Thakur, P.
Gupta, K.
Pal, A.
Powiązania:
https://bibliotekanauki.pl/articles/10908.pdf
Data publikacji:
2015
Wydawca:
Przedsiębiorstwo Wydawnictw Naukowych Darwin / Scientific Publishing House DARWIN
Opis:
Biomedical research needs to leverage and exploit large amount of information reported in scientific publication. Literature data collected from publications has to be managed to extract information, transforms into an understandable structure using text mining approaches. Text mining refers to the process of deriving high-quality information from text by finding relationships between entities which do not show direct associations. Therefore, as an example of this approach, we present the link between two diseases i.e. breast cancer and obesity.Obesity is known to be associated with cancer mortality, but little is known about the link between lifetime changes in BMI of obese person and cancer mortality in both males and females. In this article, literature data for obesity and breast cancer was obtained using PubMed database and then methodologies which employs groups of common genes and keywords with their frequency of occurrence in the data were used, aimed to establish relation between obesity and breast cancer visualized using Pi-charts and bar graphs. From the data analysis, we obtained 1 gene which showed the link between both the diseases and validated using statistical analysis and disease-connect web server. We also proposed 8 common higher frequency keywords which could be used for indexing while searching the literature for obesity and breast cancer in combination.
Źródło:
International Letters of Natural Sciences; 2015, 44
2300-9675
Pojawia się w:
International Letters of Natural Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Identification of technologies in Industry 4.0 with the use of text mining
Autorzy:
Zdonek, Dariusz
Powiązania:
https://bibliotekanauki.pl/articles/1931589.pdf
Data publikacji:
2020
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
text mining
Industry 4.0
information and communication technology
scientific paper
eksploracja tekstu
Przemysł 4.0
technologie informacyjne i komunikacyjne
praca naukowa
Opis:
Purpose: The objective of this paper is to identify leading technologies in Industry 4.0. Design/methodology/approach: The identification was made with the use of text mining to explore the scientific texts in this field. Assumptions of own iterative method for analyzing scientific texts were proposed, with the use of R language, tokenization, lemmatization, n-grams and correspondence analysis. The assumptions of the proposed method were used to analyze the 40 most often quoted articles indexed in the Web of Science. Findings: On the basis of the obtained results, 4 leading technologies were identified. These are Cloud Computing, Internet of Things, Cyber-physical System and Big Data. Originality/value: The article proposes an original method of identifying the leading technologies used in Industry 4.0. The proposed method is based on text mining and correspondence analysis.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2020, 142; 45-57
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Text mining in practice: exploring patterns in text collections of remote work job offers
Autorzy:
Kuligowska, Karolina
Lasek, Mirosława
Powiązania:
https://bibliotekanauki.pl/articles/431872.pdf
Data publikacji:
2013
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
text mining
text analytics
clustering
concept linking
remote work
telecommuting
Opis:
The aim of this paper is to give an insight into text mining techniques in the context of unstructured text collections of location independent job offers. In order to extract useful information, uncover interesting patterns and features of remote work, we analyze the five most popular and most visited websites containing job offers. We examine clusters of remote job offers, the keywords describing those clusters, as well as the linkages between strongly associated terms describing mobile work offers. It is interesting to observe the maturity of the text mining tools which have broadened their applications to new research topics and have become suitable to explore new phenomena.
Źródło:
Informatyka Ekonomiczna; 2013, 4(30); 181-195
1507-3858
Pojawia się w:
Informatyka Ekonomiczna
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Communicating financial stability in monetary policy reports: a text-mining experiment in postcommunist countries
Autorzy:
Kurowski, Łukasz
Smaga, Paweł
Powiązania:
https://bibliotekanauki.pl/articles/40431429.pdf
Data publikacji:
2024-03-15
Wydawca:
Akademia Leona Koźmińskiego w Warszawie
Tematy:
Monetary policy
Financial stability
Text-mining
Inflation
Opis:
Purpose – Financial stability has become a focal point for central banks since the global financial crisis. However, the optimal mix between monetary and financial stability policies remains unclear. In this study, the “soft” approach to such policy mix was tested – how often monetary policy (in inflation reports) analyses financial stability issues. This paper aims to discuss the aforementioned objective. Design/methodology/approach – A total of 648 inflation reports published by 11 central banks from post-communist countries in 1998-2019 were reviewed using a text-mining method. Findings – Results show that financial stability topics (mainly cyclical aspects of systemic risk) on average account for only 2%of inflation reports’ content. Although this share has grown somewhat since the global financial crisis (in CZ, HU and PL), it still remains at a low level. Thus, not enough evidence was found on the use of a “soft” policy mix in post-communist countries. Practical implications – Given the strong interactions between price and financial stability, this paper emphasizes the need to increase the attention of monetary policymakers to financial stability issues. Originality/value – The study combines two research areas, i.e. monetary policy and modern text mining techniques on a sample of post-communist countries, something which to the best of the authors’ knowledge has not been sufficiently explored in the literature before.
Źródło:
Central European Management Journal; 2024, 32, 1; 57-75
2658-0845
2658-2430
Pojawia się w:
Central European Management Journal
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Exploring the Relationship Between Viewer Experience and Movie Genre – A Study Based on Text Mining of Online Movie Reviews
Relacja pomiędzy doświadczeniami widza a gatunkiem filmowym – badanie oparte na text mining recenzji filmowych
Autorzy:
Świerczyńska-Kaczor, Urszula
Powiązania:
https://bibliotekanauki.pl/articles/1923776.pdf
Data publikacji:
2020-02-18
Wydawca:
Uniwersytet Warszawski. Wydawnictwo Naukowe Wydziału Zarządzania
Tematy:
text mining of online reviews
viewer experience
text mining recenzji filmowych
doświadczenia widza
Opis:
This paper aims to provide insight about viewer experience with movies of different genres: the suspense movie, the western and the comedy. The qualitative and quantitative analyses based on text mining were conducted for online reviews of the three selected movies. The results of text mining were complemented by a qualitative manual analysis of reviews. The results of text mining indicated the spectrum of factors shaping viewer experience at different stages of the consumer journey. These factors relate to, for example, the product features (e.g. the recognized movie director, movie stars, soundtrack, and the historical context of the plot), and different touch points (e.g. movie distribution channel). The categories of viewer experience captured in the study can be assessed as adequate to the genre. The present study is preliminary in nature and is therefore exploratory. The results indicate the potential usefulness of text mining of online reviews as a method constituting the background for studies based on interviewing subjects. The study also points to the importance of looking for interdisciplinary frameworks in the research field of viewer experience. JEL: M30, M31
Niniejsza publikacja oferuje wgląd w doświadczenia widzów związane z konsumpcją filmów należących do różnych gatunków, takich jak suspens, western oraz komedia. Badanie zostało przeprowadzone z wykorzystaniem jakościowej i ilościowej analizy text mining recenzji trzech wybranych tytułów filmowych. Wyniki analizy opartej na text mining uzupełnia badanie jakościowe recenzji filmowych. Wyniki badania pozwoliły na uchwycenie spektrum czynników oddziałujących na doświadczenia widzów na różnych etapach konsumpcji produktu, jakim jest film – podróży zakupowej konsumenta. Czynniki te związane są m.in. z cechami produktu (np. marka reżysera, gwiazdorska obsada, ścieżka dźwiękowa,historyczny kontekst fabuły filmu) oraz różnymi punktami „kontaktu” kreującymi doświadczenia widza (np. kanał dystrybucji filmu). Wyodrębnione kategorie doświadczeń widza odpowiadają analizowanym gatunkom filmowym. Prezentowane w niniejszej publikacji badanie ma charakter badań wstępnych, eksploracyjnych. JEL: M30, M31
Źródło:
Problemy Zarządzania; 2019, 5/2019 (85); 154-175
1644-9584
Pojawia się w:
Problemy Zarządzania
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Metodyka dla analizy treści w projektach stosujących techniki text mining i rozwiązania CAQDAS piątej generacji
Autorzy:
Tomanek, Krzysztof
Powiązania:
https://bibliotekanauki.pl/articles/2033749.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
analiza treści
Mixed Methods
Big Data
techniki text mining
CAQDAS
Content Analysis
Mixed Methods Approach
Text Mining
Opis:
Projekty, w których przychodzi nam pracować z dużymi wolumenami danych tekstowych, pochodzących z rożnych źródeł i zapisanych w różnorodnych formatach, rodzą wiele dylematów natury metodologicznej, wymagają często niestandardowych decyzji i rozwiązań. W szczególności zadanie polegające na opracowaniu danych o różnorodnej jakości, nieustrukturyzowanych typu quan i qual wymagać może pracy, w której dynamicznie zmieniają się strategie analizy danych, sposoby przekształcania danych tekstowych. Artykuł opisuje przykład takiej właśnie „dynamicznej” metodyki. Wykazała ona swoją wartość w zadaniu polegającym na klasyfikacji wypowiedzi pisanych. W tak zarysowanym kontekście autor artykułu mierzy się z następującymi celami: (a) czy można zastosować oprogramowanie klasy CAQDAS do pracy półautomatycznej lub automatycznej zastępującej część manualnej pracy nad klasyfikacją wypowiedzi? (b) jak skonstruować metodykę klasyfikacji dla danych o różnorodnej jakości? (c) kiedy klasyfikacja automatyczna jest przydatna, a kiedy nie ma szans powodzenia? W artykule zaznaczone zostaną momenty, w których analityk sięga po wiedzę typową dla analiz danych jakościowych oraz te, kiedy wiedza z tego obszaru nie jest już wystarczająca do realizacji wskazanych celów (natural language processing, uczenie maszynowe). Przykład projektu będący tłem artykułu wymusił zastosowanie kilku narzędzi i języków wspierających pracę na danych. Praca nad transformacją, klasyfikacją oraz wizualizacją wyników wymagała zastosowania bazy MySQL oraz programów: R, QDA Miner, Wordstat, QlikSense. Roli i ograniczeniom narzędzi klasy CAQDAS poświęconych zostało także kilka uwag.
Projects which we work with—large volumes of text data that are acquired from various sources and stored in a variety of formats—rise many dilemmas of a methodological nature, often require unstandardized decisions and solutions. In particular, compiling data of various quality, unstructured types, and of quan and qual nature requires dynamic strategies, ideas, and ways of analysis. The article describes an example of this approach. It shows its value in classification of written statements. In such context, the author of the article faces the following objectives: (a) can we use CAQDASso that semiautomatic or automatic work would replace some manual work regarding classification of the expressions; (b) how to construct a classification methodology for data of various quality; (c) when the automatic classification is useful and when there is no chance of success? The article will be marked with moments in which the analyst reaches for knowledge typical for qualitative data analysis, and when the knowledge of this area is no longer sufficient to classify content (natural language processing, machine learning). An example of a project being the background of this article forced the use of several tools and languages to support work with the data. Work on the transformation, classification, and visualization of results required applications such as: MySQL, R, QDA Miner, WordStat, Qlik Sense. Role and limits of the computer-assisted qualitative data analysis software tools have also been noted.
Źródło:
Przegląd Socjologii Jakościowej; 2017, 13, 2; 128-143
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Understanding the Film Audience – Providing Insight into the Viewer’s Experience from Text Mining and Manual Text Analysis of Online Film Reviews
Zrozumieć widownię filmową – badanie doświadczeń widzów za pomocą text mining oraz manualnej analizy internetowych recenzji filmów
Autorzy:
Świerczyńska-Kaczor, Urszula
Wachowicz, Jacek
Powiązania:
https://bibliotekanauki.pl/articles/956753.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Warszawski. Wydawnictwo Naukowe Wydziału Zarządzania
Tematy:
text mining
viewer research
film market
badania widowni
rynek kinowy
Opis:
The paper aims to contribute to the research of the film market, starting a discussion and seeking answers to the following problem: What spectrum of film-viewer experiences can be identified and better understood due to the implementation of text mining in the analysis of online film reviews? The presented study was based on the analysis of online audience reviews of five films targeted at a young audience, with their premières in 2016 and 2017. The findings suggest that implementing text mining as a method of analysis of online reviews can provide valuable insight into the film market, which may be helpful for producers in developing future productions, or altering the communication strategy.
Przedstawione w artykule rozważania mają na celu wzbogacenie obszaru badań dotyczących filmu oraz stanowią próbę znalezienia odpowiedzi na pytanie, czy spektrum doświadczeń widza może być zidentyfikowane oraz lepiej rozumiane poprzez zastosowanie text mining w analizie internetowych recenzji filmowych. Niniejsze badanie zostało oparte na analizie internetowych recenzji pięciu filmów kierowanych do młodej widowni, których premiery odbyły się w 2016 oraz w 2017 roku. Prezentowane wyniki badania pozwalają na wysnucie wniosku, iż zastosowanie text mining w analizie recenzji online pozwala na uzyskanie informacji przydatnych w zrozumieniu rynku filmowego, a także użytecznych dla producentów filmowych w przygotowywaniu przyszłych produkcji, lub też w korekcie obranych strategii komunikacji marketingowej.
Źródło:
Problemy Zarządzania; 2017, 4/2017 (71); 177-193
1644-9584
Pojawia się w:
Problemy Zarządzania
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Identifing the destination image and its attributes: The case of Central and Eastern European cities
Identyfikacja atrybutów wizerunku wybranych miast Europy Środkowo-Wschodniej
Autorzy:
Nowacki, Marek
Niezgoda, Agnieszka
Powiązania:
https://bibliotekanauki.pl/articles/583187.pdf
Data publikacji:
2019
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
TripAdvisor
text mining
attributes
image
cities
Text Mining
atrybuty
wizerunek, miasta
Opis:
The aim of the work is to identify the unique attributes of Central and Eastern European cities in the reviews posted on TripAdvisor. These attributes can determine the competitive advantage on the tourism market. The research data were downloaded from the English-language TripAdvisor website [https://www.tripadvisor.co.uk]. The reviews concerning tourist centres of selected cities (“Things to do…” category) were collected. These concerned the areas where tourism is concentrated in the cities: historic centres, old towns or old market squares. The most popular tourism cities in Central and Eastern Europe were selected: Poznan, Wroclaw, Cracow, Warsaw, Prague, Bratislava and Vienna. A total of 28,794 reviews were downloaded. The most common words appearing in the reviews were counted using the text mining procedure. The analysis of frequency revealed 76 unique words. Then the correspondence analysis was performed. Among the examined cities, Bratislava has the largest number of unique attributes (words), and Prague the least. The similarities in terms of image attributes occur in Poznan, Wroclaw and Prague, and in the second group – Warsaw and Bratislava. Vienna and Krakow do not show any similarities towards the other cities.
Celem pracy jest zidentyfikowanie unikatowych atrybutów wybranych miast Europy Środkowo-Wschodniej obecnych w opiniach zamieszczonych na portalu TripAdvisor [https://www.tripadvisor.co.uk]. Pobrano opinie dotyczące centrów turystycznych wybranych miast (kategoria Things to do…) – obszarów, w których koncentruje się ruch turystyczny w miastach: w zabytkowym centrum, na starym mieście, na starym rynku. Do badań wybrano najpopularniejsze pod względem turystycznym miasta Europy Środkowo-Wschodniej: Poznań, Wrocław, Kraków, Warszawę oraz Pragę, Bratysławę i Wiedeń. Łącznie pobrano 28 794 opinie. Procedurą Text Mining zliczono najczęstsze wyrazy pojawiające się w opiniach. Analiza wariancji ujawniła 76 unikatowych słów, które poddano analizie korespondencji. Wśród badanych miast najwięcej unikatowych słów-atrybutów ma Bratysława, najmniej zaś Praga. Zbliżone do siebie pod względem atrybutów wizerunku są: Poznań, Wrocław i Praga, a w drugiej grupie – Warszawa i Bratysława. Wiedeń i Kraków nie wykazują podobieństwa z pozostałymi miastami.
Źródło:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu; 2019, 63, 8; 118-127
1899-3192
Pojawia się w:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Ukryte modele Markowa jako metoda eksploracji danych tekstowych
Hidden Markov Models as a text mining method
Autorzy:
Mazurek, M.
Powiązania:
https://bibliotekanauki.pl/articles/305867.pdf
Data publikacji:
2010
Wydawca:
Wojskowa Akademia Techniczna im. Jarosława Dąbrowskiego
Tematy:
eksploracja danych tekstowych
ukryte modele Markowa
ekstrakcja informacji
text mining
hidden Markov model
information retrieval
Opis:
W eksploracji danych tekstowych z dużym powodzeniem stosuje się probabilistyczne modele dokumentów. W artykule przedstawiony został jeden z podstawowych, dla tej dziedziny informatyki, sposobów reprezentacji dokumentu za pomocą ukrytych modeli Markowa. Przedstawiono definicję ukrytego modelu Markowa oraz sposób wyznaczenia podstawowych wielkości związanych z wykorzystaniem tego modelu, takich jak prawdopodobieństwo wystąpienia obserwowanej sekwencji symboli (słów), wyszukanie najbardziej prawdopodobnej sekwencji stanów procesu, czy też formuły reestymacji parametrów modelu używane w procesie uczenia modelu.
In the text mining applications probabilistic models of document are widely used. In this paper the Hidden Markov Models were described as a fundamental method for text processing. Definition of the HMM was presented and the algorithms to find parameters of the model. Some of the possible applications of HMM were suggested.
Źródło:
Biuletyn Instytutu Systemów Informatycznych; 2010, 6; 27-31
1508-4183
Pojawia się w:
Biuletyn Instytutu Systemów Informatycznych
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
An attempt to determine the scope of duties of the business analyst – application of text mining analysis
Autorzy:
Wyskwarski, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/1927447.pdf
Data publikacji:
2020
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
text mining
duties
responsibilities
business analyst
obowiązek
odpowiedzialność
analityk biznesowy
Opis:
Purpose: An attempt to identify the scope of duties of the business analyst by analyzing job offers from websites. Design/methodology/approach: Job offers were automatically downloaded from five websites. An analysis of text mining of fragments of offers describing the scope of duties was carried out. The analysis of text mining included initial text processing, creation of corpora of analyzed documents, creation of a document-term matrix and the use of classic methods derived from data mining. Findings: The most frequently used words/n-grams and the correlation of selected words/ n-grams with other words/n-grams were presented in the form of drawings. Based on the frequency of words/n-grams and the correlation value, efforts were made to identify the responsibilities of the business analyst. Research limitations/implications: Only offers written in Polish, downloaded from five websites with job offers, which had the phrase “business analyst” in their job title, were analyzed. The data was collected between 13 and 15 April 2020. Practical implications: The method applied can be used by organizations preparing for the profession of a business analyst, to modify and better adapt curricula to the needs of the labor market. Originality/value: Studies have shown that text mining of job offers can, to some extent, help determine the responsibilities of a business analyst.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2020, 148; 795-810
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Identification of the leading research domains and grouping of articles on the smart city using text mining
Autorzy:
Zdonek, Dariusz
Powiązania:
https://bibliotekanauki.pl/articles/1927445.pdf
Data publikacji:
2020
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
smart city
text mining
information and communication technology
scientific paper
research areas
technologia informacyjna
technologia komunikacyjna
referat naukowy
obszar badawczy
Opis:
Purpose: The objective of the paper is to use text mining to identify leading research domains concerning the smart city following an analysis of research articles with a high citation index according to the Web of Science. Design/methodology/approach: An original method is proposed for analysing academic texts using the R language, tokenisation, lemmatisation, n-grams and correspondence analysis. The author analysed fifty of the most cited articles indexed in the Web of Science from 2014 to 2019. Findings: The paper presents the advantages and drawbacks of the proposed method of analysing research publications. The assets include automation and repeatability of the analysis of a large number of documents and improved knowledge about links among the articles in terms of research domains. The disadvantage is the loss of information from diagrams and figures. The method identified two leading research domains related to the notion of the smart city, technologies and systems. The analysed publications were categorised by selected keywords. Research limitations/implications: Future work should include further refinement of the assumptions for the method, analyses of a more significant number of research texts and a narrowing down of the domain of the smart city. It is desirable to consider other functional domains of the city, such as energy, public health, environmental protection or transport. Practical implications: The proposed method can complement a standard literature analysis regarding the smart city. The leading research domains related to the smart city in the analysed articles were systems and technologies employed to improve how the city operates. Social implications: Text mining can be employed by various experts focusing on the smart city and constitutes a refreshing complement for other research methods, such as questionnaire surveys, interviews or observations. Originality/value The publication can be useful for researchers from various fields and managers seeking to create and use simple, useful methods and tools for analysing unstructured text documents for decision-making. The paper proposes a separate text mining analysis of abstracts and whole documents using n-grams. This yielded a more precise list of areas relevant to the smart city. The grouping was done using correspondence analysis of the fifty most cited articles indexed in the Web of Science from 2014 to 2019.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2020, 148; 845-860
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The system developing of forming research schools basis of publication elements analysis
Autorzy:
Shakhovska, N.
Noha, R
Powiązania:
https://bibliotekanauki.pl/articles/117910.pdf
Data publikacji:
2014
Wydawca:
Polskie Towarzystwo Promocji Wiedzy
Tematy:
research school
clustering
text mining
Opis:
In this paper the method of research publications elements analysis that is determining common qualities of research publications and their clustering as an instrument of selecting and sorting out the information about research schools has been introduced. In module structuring documents transmitted there are tape that indicates the address of the file. Depending on where the file is, it can be a path to a file on the local disk or URL on the Internet.
Źródło:
Applied Computer Science; 2014, 10, 2; 57-66
1895-3735
Pojawia się w:
Applied Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A case study in text mining of discussion forum posts: Classification with bag of words and global vectors
Autorzy:
Cichosz, P.
Powiązania:
https://bibliotekanauki.pl/articles/330299.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
text mining
discussion forum
text representation
document classification
word embedding
eksploracja tekstu
forum dyskusyjne
reprezentacja tekstu
klasyfikacja dokumentów
Opis:
Despite the rapid growth of other types of social media, Internet discussion forums remain a highly popular communication channel and a useful source of text data for analyzing user interests and sentiments. Being suited to richer, deeper, and longer discussions than microblogging services, they particularly well reflect topics of long-term, persisting involvement and areas of specialized knowledge or experience. Discovering and characterizing such topics and areas by text mining algorithms is therefore an interesting and useful research direction. This work presents a case study in which selected classification algorithms are applied to posts from a Polish discussion forum devoted to psychoactive substances received from home-grown plants, such as hashish or marijuana. The utility of two different vector text representations is examined: the simple bag of words representation and the more refined embedded global vectors one. While the former is found to work well for the multinomial naive Bayes algorithm, the latter turns out more useful for other classification algorithms: logistic regression, SVMs, and random forests. The obtained results suggest that post-classification can be applied for measuring publication intensity of particular topics and, in the case of forums related to psychoactive substances, for monitoring the risk of drug-related crime.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2018, 28, 4; 787-801
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
ZASTOSOWANIE TECHNIK EKSPLORACJI TEKSTU DO ANALIZY OPINII KONSUMENCKICH
APPLICATION OF TEXT MINING TECHNIQUES FOR THE CUSTOMER REVIEWS ANALYSIS
Autorzy:
Ząbkowski, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/452951.pdf
Data publikacji:
2014
Wydawca:
Szkoła Główna Gospodarstwa Wiejskiego w Warszawie. Katedra Ekonometrii i Statystyki
Tematy:
eksploracja tekstu
reguły asocjacyjne
opinie konsumenckie
text mining
association rules
customer reviews
Opis:
W niniejszej publikacji zaproponowano jedną z metod eksploracji danych – reguły asocjacyjne do wykrycia zależności w opiniach konsumenckich, na przykładzie opinii jednego z hoteli amerykańskich. Wykorzystanie tej techniki wynikało m.in. z dużej ilości dostępnych danych oraz faktu, że otrzymane reguły w sposób niezwykle czytelny prezentują zależności znalezione w danych. W badaniu odkryto szereg reguł, które mogą stanowić cenne źródło informacji o jakości usług oraz postrzeganiu obiektu przez klientów korzystających z usług hotelowych.
This paper presents application of one of data mining techniques – association rules to analyze customer reviews, based on the data gathered at one of the American hotels. The application of association rules is due to the large volume of available review data and the fact that the rules can be presented in a very clear and meaningful way. The study resulted in a number of interesting rules that can be a valuable source of information about the quality of services and the perception of the hotel by the clients.
Źródło:
Metody Ilościowe w Badaniach Ekonomicznych; 2014, 15, 4; 101-110
2082-792X
Pojawia się w:
Metody Ilościowe w Badaniach Ekonomicznych
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The analysis of Polish patent applications in the solar energy technology with the use of text mining methodology
Autorzy:
Bęben, Karolina
Nowakowska, Marzena
Powiązania:
https://bibliotekanauki.pl/articles/27313482.pdf
Data publikacji:
2022
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
solar energy patent analysis
patent documents processing
patent clustering
outliers detection
Polish Patent Office
analiza patentowa energii słonecznej
przetwarzanie dokumentów patentowych
grupowanie patentów
wykrywanie wartości odstających
Urząd Patentowy RP
Opis:
Purpose: Knowledge management belongs to the most important elements of organisational management, including manufacturing enterprises. Patent information plays an increasingly important role in this area. Identification of the main directions of invention activity may inspire new product and process ideas, and can help to improve existing solutions. The above is particularly important in the energy sector, which is currently struggling with increasing problems. In this context, solar energy is the subject of interest to inventive communities. The paper discusses patent applications related to solar energy, taking up the task of discovering the main tendencies of technological solutions in this area. Design/methodology/approach: In the work, a pilot study of the research aimed to indicate the directions of technological development in the field in Poland was undertaken. Shortened descriptions of selected patent documents from the Polish Patent Office (PPO) were the subject of the investigation. The descriptions were reduced to the form of a vector space model by using text mining tools. The exploration of such prepared data was done applying unsupervised text mining techniques. Hierarchical cluster analysis enabled the identification of groups of similar inventions. An algorithm to detect outliers within individual patent groups was also developed and applied. Findings: Five patent clusters were identified covering the following thematic areas: PV panel designs, PV panel component designs, the improvement of solar-heat conversion device performance, and solar collector designs. Six patent applications stood out thematically in four of the five clusters. Research limitations/implications: The research is limited to a selected number of patent documents form PPO. However, the presented method and research area are promising. It is planned to extend the analyses to a larger set of patent documents and solve the problem related to the language uniformity of patent applications along with merging data from various sources. In this aspect, a full patent description will be consider as well. Originality/value: In relation to solar energy issues, main patent areas and patent outliers that may be indicators of special interests of inventors were identified. In relation to methodology issues, new solutions within consecutive research steps were proposed.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2022, 162; 9--34
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Cluster analysis of medical text documents by using semi-clustering approach based on graph representation
Autorzy:
Woźniak, R.
Ożdżyński, P.
Zakrzewska, D.
Powiązania:
https://bibliotekanauki.pl/articles/94773.pdf
Data publikacji:
2018
Wydawca:
Szkoła Główna Gospodarstwa Wiejskiego w Warszawie. Wydawnictwo Szkoły Głównej Gospodarstwa Wiejskiego w Warszawie
Tematy:
cluster analysis
semi-clustering
text mining
Opis:
The development of Internet resulted in an increasing number of online text repositories. In many cases, documents are assigned to more than one class and automatic multi-label classification needs to be used. When the number of labels exceeds the number of the documents, effective label space dimension reduction may significantly improve classification accuracy, what is a major priority in the medical field. In the paper, we propose document clustering for label selection. We use semiclustering method, by considering graph representation, where documents are represented by vertices and edge weights are calculated according to their mutual similarity. Assigning documents to semi-clusters helps in reducing number of labels, further used in multi-label classification process. The performance of the method is examined by experiments conducted on real medical datasets.
Źródło:
Information Systems in Management; 2018, 7, 3; 213-224
2084-5537
2544-1728
Pojawia się w:
Information Systems in Management
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Charakterystyczne elementy marek polskich miast w recenzjach dostępnych online
Autorzy:
Nowacki, Marek
Powiązania:
https://bibliotekanauki.pl/articles/627294.pdf
Data publikacji:
2019
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
kapitał marki
destynacje
TripAdvisor
Text Mining
Opis:
Celem pracy jest zidentyfikowanie charakterystycznych elementów marek polskich miast oraz wskazanie podobieństw i różnic występujących pomiędzy nimi. Praca ma dać odpowiedź na następujące pytania badawcze: Które elementy w istotny sposób wpływają na odróżnianie marek badanych miast w recenzjach dostępnych online? Które z badanych miast są do siebie najbardziej zbliżone pod względem elementów marki, a które różnią się pod tym względem? Dane do analizy pobrano z serwisu TripAdvisor. Były to opinie dotyczące rejonów koncentracji ruchu turystycznego – starych rynków lub starych miast – pięciu polskich miast: Poznania, Wrocławia, Krakowa, Gdańska i Warszawy (N = 5125). Przeprowadzone analizy pozwoliły zidentyfikować unikatowe elementy marek badanych miast i wskazać podobieństwa oraz różnice występujące pomiędzy markami.
Źródło:
Turyzm; 2019, 29, 1; 69-76
0867-5856
2080-6922
Pojawia się w:
Turyzm
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Gospodarstwa agroturystyczne w świetle opinii użytkowników TripAdvisora – cechy determinujące ocenę obiektów
Autorzy:
Bannach, Anna
Powiązania:
https://bibliotekanauki.pl/articles/2084761.pdf
Data publikacji:
2021-09-08
Wydawca:
Wyższa Szkoła Bankowa w Poznaniu
Tematy:
agroturystyka
turystyka wiejska
eWOM
text mining
Opis:
Celem artykułu jest zidentyfikowanie cech gospodarstw agroturystycznych, które mają wpływ na ocenę nadawaną gospodarstwom przez użytkowników TripAdvisora. Materiał badawczy stanowiło 896 opinii dotyczących 57 obiektów agroturystycznych z obszaru całej Polski. W badaniach zastosowano metodę jakościowej analizy treści oraz metodę ilościową (text mining). Zidentyfikowano słowa najczęściej pojawiające się w opiniach użytkowników. Są to: miejsce, polecam, pokoje, właściciel, śniadania, atmosfera. Zauważono, że liczba słów i ich częstotliwość różnią się w zależności od przyznanej przez użytkowników oceny. Zdecydowanie najwięcej wyrazów liczą opinie cztero- i pięciogwiazdkowe. W trakcie badań stwierdzono, że turyści podróżujący z dziećmi wysoko oceniają gospodarstwa agroturystyczne oferujące szereg usług dodatkowych, a także że ważną cechą mającą wpływ na ocenę gospodarstw agroturystycznych jest czystość. Lokalizacja gospodarstwa agroturystycznego i poziom obsługi w obiekcie również mają wpływ na ocenę w TripAdvisorze. Na podstawie badań można stwierdzić, że do cech determinujących ocenę obiektów należą: czystość i porządek na terenie całego gospodarstwa agroturystycznego, atmosfera panująca w gospodarstwie, ale także uprzejmość i gościnność właścicieli. Istotnym czynnikiem jest także stosunek jakości oferowanych usług do ceny, jaką muszą turyści za te usługi zapłacić.
Źródło:
Studia Periegetica; 2021, 34(2); 103-120
1897-9262
2658-1736
Pojawia się w:
Studia Periegetica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Unique elements of Polish city brands in online reviews
Autorzy:
Nowacki, Marek
Powiązania:
https://bibliotekanauki.pl/articles/627580.pdf
Data publikacji:
2019
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
brand equity
destinations
cities
TripAdvisor
Text Mining
Opis:
The aim of the paper is to identify unique elements of the brands of Polish cities and to identify similarities and differences between them. The work attempts to answer the following research questions: Which elements significantly differentiate the brands of studied cities in online reviews? and Which of the studied cities are the most similar in terms of brand elements and which differ in this regard. The data for analysis was obtained from TripAdvisor. Reviews about areas of tourist concentration – old markets or old towns – from five Polish cities: Poznań, Wrocław, Kraków, Gdańsk and Warsaw were analysed (N = 5125). The research shows that Gdańsk and Warsaw as well as Poznań and Wrocław have the most similar brand elements. The Kraków brand is the more unique in relation to other cities.
Źródło:
Turyzm; 2019, 29, 1; 63-70
0867-5856
2080-6922
Pojawia się w:
Turyzm
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Mass Violence Detection Using Data Mining Techniques
Autorzy:
Varma, Rishabh
Ahmad, Sartaj
Powiązania:
https://bibliotekanauki.pl/articles/1159845.pdf
Data publikacji:
2018
Wydawca:
Przedsiębiorstwo Wydawnictw Naukowych Darwin / Scientific Publishing House DARWIN
Tematy:
Data mining
Predictive model
Text mining
Tweet analysis
Opis:
The world is now witnessing a tectonic shift in the way in which people react to social and economic impacts such as rise in fossil fuel prices, implication of new rules and regulations, and other situations which directly affect the emotions of a certain group of people. Violence is the most widely used way of expressing anger and discontent for a particular situation which might have occurred. Such actions can cause loss of millions of dollars and precious lives of people who come in way of such protests. These protests are mainly conducted through social media platforms such as twitter as it is not possible to personally communicate to tens of thousand people to accumulate at a certain place, therefore it is extremely important as well as necessary to keep an eye on the social media statuses and updates of people in the times of crisis and heavy tension. This paper aims to collect the tweets of people uploaded on twitter and then process them to find out the location, time and intensity of the mass violence so that the responsible authorities can handle the situation and prevent violence.
Źródło:
World Scientific News; 2018, 113; 218-225
2392-2192
Pojawia się w:
World Scientific News
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wykorzystanie algorytmów Text Mininig do analizy danych tekstowych w psychologii
Usage of text mining algorithms to analyze textual data in psychology
Autorzy:
Szymańska, Agnieszka
Powiązania:
https://bibliotekanauki.pl/articles/475485.pdf
Data publikacji:
2017
Wydawca:
Polska Akademia Nauk. Instytut Języka Polskiego PAN
Tematy:
algorytmy
dane tekstowe
text mining
algorithms
text data
Opis:
W psychologii analizy danych zapisanych w postaci tekstów stanowią ważny element prac badawczych. Niemniej nadal poszukuje się narzędzi, metod, które mogą umożliwić szybką analizę danych zarejestrowanych w postaci tekstów, gdyż analizy te są najczęściej bardzo czasochłonne. W prezentowanym artykule przybliżono metodę text mining, która ma szczególne zastosowanie w analizie informacji zapisanych w postaci danych tekstowych. Wykorzystanie metody text mining jest omawiane na przykładzie analizy obieranych przez rodziców celów wychowawczych.. W artykule przedstawiono sposób, w jaki algorytmy text mining: a) dokonują analizy tekstu przez zliczenie słów i nadanie im wag, b) przeprowadzają analizę relacji między słowami za pomocą składowych głównych (Principal Component Analysis), c) przekształcają dane słownew liczbowe, przygotowując zbiór danych do kolejnych obliczeń.
In the psychology the analysis of data written in the form of texts are an important element of research work. Nevertheless, tools are still sought, methods that can enable rapid analysis of data recorded in the form of texts, because these analyzes are usually very time consuming. This article approximates the text mining method, which is particularly applicable in the analysis of information recorded in the form of text data. Analysing textual data using text mining algorithms is shown on the example of parents’ choice of educational goals. The paper presents the way in which text mining algorithms: a) perform text analysis by counting words and weighting them, b) analyze relationships between words by means of Principal Component Analysis, c) convert verbal data into numerals by preparing a set data for subsequent calculations.
Źródło:
Socjolingwistyka; 2017, 31; 99-116
0208-6808
Pojawia się w:
Socjolingwistyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The market and quality perspective of CSR and crisis management - a literature review
Autorzy:
Zapłata, Sławomir
Kwiatek, Paweł
Powiązania:
https://bibliotekanauki.pl/articles/27313455.pdf
Data publikacji:
2022
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
CSR
crisis
quality
marketing
text mining
kryzys
jakość
Opis:
Purpose: The study provides a concise overview of the CSR concept in the literature regarding two market’s aspects - quality and marketing. The aim of the study is to analyse to what extent a CSR maps to crisis management phases. Design/methodology/approach: The article entails a literature review of 352 articles published in the years 2006-2021 supported by machine learning. Findings: 15 thematic groups were identified. It is impossible to point to unambiguous thematic trends in relation to the topics in the analysed articles. CSR as a field includes three main elements (economic, environmental, social), but this concept can be considered in many areas and a wide range of organizational activities, which was shown in the article in individual thematic groups. Research limitations/implications: As every literature review serves as a snapshot of a particular period, the results of the study are limited. Future research may also concern the qualitative research (e.g., case-studies in individual companies) and quantitative research (e.g., focusing on specific aspects and/or dedicated samples). Practical implications: The CSR implementation is not a single and short-term organization’s project, but an element of a long-term strategy and market trends. It is an important practical information for all organizations undertaking activities in corporate social responsibility. Social implications: The results of the presented research help the reader to see a broader perspective of CSR activities. Microeconomic activities within the CSR triad influence the macroeconomic scale - the global increase in awareness of business responsibility towards society. Originality/value: This is the first paper containing the literature review results on CSR considering the aspects of quality and marketing. The crisis management perspective was also considered as an issue related to the intensity of organizational activities in CSR.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2022, 162; 755--775
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Cross-Cultural Study of Online Marketing in International Higher Education – a Keyword Analysis
Autorzy:
Kincl, Tomáš
Novák, Michal
Štrach, Pavel
Powiązania:
https://bibliotekanauki.pl/articles/26171630.pdf
Data publikacji:
2013-06-30
Wydawca:
Wydawnictwo Adam Marszałek
Tematy:
higher education
cross-cultural marketing
GLOBE
text-mining
Opis:
Higher education is a dynamic global industry with a highly competitive and developed market. Universities communicate their international programs to attract prospective students interested in studying abroad. This study addresses a question whether there is a difference between communicated characteristics of international programs among universities from various cultures. Websites of seventy universities coming from different cultural clusters are analysed using data-mining methods. The results suggests that marketing communications in international higher education do not stand on cultural grounds as there are only minor differences between international program communications across the world. The only difference in the group of prime international higher education providers was found between the Anglo-Saxon universities and the rest of the world.
Źródło:
The New Educational Review; 2013, 32; 49-65
1732-6729
Pojawia się w:
The New Educational Review
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
An environment for collective perception based on fuzzy and semantic approaches
Autorzy:
D’Aniello, G.
Gaeta, M.
Loia, F.
Reformat, M.
Toti, D.
Powiązania:
https://bibliotekanauki.pl/articles/91892.pdf
Data publikacji:
2018
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
smart cities
fuzzy logic
text mining
sentiment analysis
Opis:
This work proposes a software environment implementing a methodology for acquiring and exploiting the collective perception (CP) of Points of Interests (POIs) in a Smart City, which is meant to support decision makers in urban planning and management. This environment relies upon semantic knowledge discovery techniques and fuzzy computational approaches, including natural language processing, sentiment analysis, POI signatures and Fuzzy Cognitive Maps, turning them into a cohesive architectural blend in order to effectively gather the realistic perception of a user community towards given areas and attractions of a Smart City. The environment has been put to the test via a thorough experimentation against a massive user base of an online community with respect to a large metropolitan city (the City of Naples). Such an experimentation yielded consistent results, useful for providing decision makers with a clear awareness of the positive as well as critical aspects of urban areas, and thus helping them shape the measures to be taken for an improved city management and development.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2018, 8, 3; 191-210
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
„Hańba w Sejmie” – zastosowanie modeli generatywnych do analizy debat parlamentarnych
Autorzy:
Kwiatkowska, Agnieszka
Powiązania:
https://bibliotekanauki.pl/articles/2033754.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
Polska
debaty parlamentarne
elity polityczne
ilościowa analiza treści
text mining
Polska
Parliamentary Debates
Political Elites
Quantitative Content Analysis
Text Mining
Opis:
W ciągu ostatniego dziesięciolecia nastąpił wyraźny wzrost obecności skrajnej retoryki politycznej w debacie parlamentarnej w Polsce. Jednym z aspektów postępującej radykalizacji języka jest nadużywanie słów o wysokim negatywnym natężeniu emocjonalnym w celu opisania zdarzeń występujących w codziennej polityce, co prowadzi do degradacji ich znaczenia. Jak wskazują badania, brutalizacja języka debaty wywołuje negatywne konsekwencje na poziomie elit politycznych i elektoratu, prowadząc do zmniejszonej efektywności działania parlamentu, zaostrzenia konfliktów między partiami i ich zwolennikami oraz do alienacji politycznej obywateli. W artykule przedstawiam możliwości wykorzystania stenogramów parlamentarnych do analizy przemian dyskursu politycznego, w tym wykorzystane algorytmy przeszukiwania korpusów tekstów oraz analizy ukrytych tematów. Jako przykład wykorzystuję zbiór przemówień sejmowych z lat 1991‒2016 odnoszących się do idei hańby, zdrady, niesławy i skandalu. Opieram się głównie na generatywnym modelu tematycznym, wykorzystującym metodę ukrytej alokacji Dirichleta i jej rozszerzeniu – strukturalny model tematyczny, będących nienadzorowanymi metodami ekstrakcji tematów z dużych korpusów tekstów. Wyniki przeprowadzonych analiz potwierdzają wzrost radykalnego słownictwa w czasie, a także określają charakterystyki jego użytkowników oraz najczęściej występujące konteksty (polityka historyczna, kontrola nad mediami, polityka zagraniczna).
Over the last decade there has been a clear increase in extreme political rhetoric in the parliamentary debate in Poland. One aspect of the progressive radicalization of the language is overuse of words having a high negative emotional intensity to describe events in everyday politics, which leads to the degradation of their importance. As research shows, brutalization of the language of the debate has negative consequences at the levels of the political elite and the electorate, leading to reduced efficiency of the parliament, the exacerbation of conflicts between parties and among their supporters, and the political alienation of citizens. In this article, I present the possibilities of using the transcripts of parliamentary discourse to analyze the changes of the political discourse, including the algorithms used for searching text corpora and analysis of the latent topics. As an example, I use a set of parliamentary speeches from the years 1991-2016 related to the idea of shame, betrayal, disgrace and scandal. I base my analyses on generative topic modeling employing on the method of latent Dirichlet allocation and its extension—Structural Topic Model, both being unsupervised methods of extracting topics from large text corpora. The results of the analysis confirm the increase in usage of radical vocabulary in time, and also describe the characteristics of its users and the most common contexts the extreme vocabulary tend to appear (identity politics, control over the media, foreign policy).
Źródło:
Przegląd Socjologii Jakościowej; 2017, 13, 2; 82-109
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
W stronę ontologii pola badań jakościowych
Towards an Ontology of Qualitative Research Practices
Autorzy:
Bryda, Grzegorz
Martini, Natalia
Powiązania:
https://bibliotekanauki.pl/articles/623172.pdf
Data publikacji:
2016-11-30
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
ontologia dziedzinowa
metoda słownikowa
odkrywanie wiedzy
analiza treści
Text Mining
domain ontology
dictionary-based approach
knowledge discovery
content analysis
text mining
Opis:
Celem artykułu jest zapoznanie polskiego środowiska badaczy jakościowych z ideą opracowania ontologii dziedzinowej współczesnego pola badań jakościowych. Opisywane w artykule przedsięwzięcie, oparte na wielowymiarowej analizie zawartości międzynarodowych czasopism metodologicznych, zmierza ku uporządkowaniu aktualnej wiedzy w obszarze teorii i metodologii badań jakościowych z intencją ułatwienia orientacji w rozległym i zróżnicowanym polu jakościowych praktyk badawczych. Artykuł opisuje przebieg oraz wstępne wyniki pilotażowego projektu badawczego stosującego metodę słownikową do odkrywania i systematyzowania wiedzy na temat metodologii badań jakościowych na podstawie licznych, bieżących sprawozdań i refleksji operujących w tym polu badaczy.
The aim of the article is to introduce the Polish community of qualitative researchers to a new perspective in the study of qualitative research practices. The idea is to develop an ontology of contemporary qualitative research. Drawing on experiences from our research project, the article discusses the idea of systematizing the present state of art in the field of theory and methodology of qualitative research. Our study focuses on a new methodology of multidimensional content analysis of three international academic journals. The article describes the preliminary results of a pilot study which employs a dictionary-based approach as a method of knowledge discovery in textual databases and its systematization. Our goal is to provide insight in the vast and diverse approaches in the field of qualitative research practices.
Źródło:
Przegląd Socjologii Jakościowej; 2016, 12, 4; 24-40
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza wpisów na portalu Twitter z wykorzystaniem narzędzi big data zawartych w pakiecie R
Social media analysis with big data tools
Autorzy:
Kisiołek, Arkadiusz
Powiązania:
https://bibliotekanauki.pl/articles/591261.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Analiza danych
Big data
Internet
Social media
Text mining
Opis:
Wraz z rozwojem internetu, mediów społecznościowych oraz technologii mobilnych znacznie wzrosła ilość generowanych danych. Dane te, zarówno w formie ustrukturalizowanej, jak i nieustrukturalizowanej, mogą nieść wartość biznesową dla przedsiębiorców. W danych big data można znaleźć m.in. informacje na temat klientów, konkurencji, rynku pracy, opinii na temat produktów danej firmy, czy aktualnych trendów. Dzięki dokładnej analizie internetu i mediów społecznościowych, interesariusze mogą pozyskać nową wartość, jaką są informacje na temat nastawienia i opinii konsumentów. Celem artykułu jest przedstawienie narzędzi big data jako jednego ze sposobów analizy mediów społecznościowych i wyciągania w ten sposób wartościowych informacji. Przedmiotem przeprowadzonej analizy były tysiące tweetów użytkowników portalu Twitter. Analiza została przeprowadzona przy wykorzystaniu technik text mining oraz sentyment analysis.
Development of Internet, social media and databases has caused a huge increase of data. Structured, semi-structured and unstructured data has a high business value. It contains various information about customers, competition, labor market, and development trends for industries, products and services. The internet and social media are places where customers express their opinions about various products and services. It is a valuable source of information for entrepreneurs. The aim of this paper is to explore the issue of big data and to propose a set of different techniques for the analysis of customer opinions on the example of Twitter.
Źródło:
Studia Ekonomiczne; 2018, 362; 306-317
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Pozyskiwanie i analiza danych na temat ofert pracy z wykorzystaniem big data
The collection and analysis of the data on job advertisements with the use of big data
Autorzy:
Maślankowski, Jacek
Powiązania:
https://bibliotekanauki.pl/articles/962829.pdf
Data publikacji:
2019
Wydawca:
Główny Urząd Statystyczny
Tematy:
big data
text mining
web scraping
rynek pracy
labour market
Opis:
Celem artykułu jest zaprezentowanie korzyści wynikających z wykorzystania na potrzeby statystyki publicznej (rynku pracy) narzędzi do automatycznego pobierania danych na temat ofert pracy zamieszczanych na stronach internetowych zaliczanych do zbiorów big data, a także związanych z tym wyzwań. Przedstawiono wyniki eksperymentalnych badań z wykorzystaniem metod web scrapingu oraz text miningu. Analizie poddano dane z lat 2017 i 2018 pochodzące z najpopularniejszych portali z ofertami pracy. Odwołano się do danych Głównego Urzędu Statystycznego (GUS) zbieranych na podstawie sprawozdania Z-05. Przeprowadzona analiza prowadzi do wniosku, że web scraping może być stosowany w statystyce publicznej do pozyskiwania danych statystycznych z alternatywnych źródeł, uzupełniających istniejące bazy danych statystycznych, pod warunkiem zachowania spójności z istniejącymi badaniami.
The goal of this paper is to present, on the one hand, the benefits for official statistics (labour market) resulting from the use of web scraping methods to gather data on job advertisements from websites belonging to big data compilations, and on the other, the challenges connected to this process. The paper introduces the results of experimental research where web-scraping and text-mining methods were adopted. The analysis was based on the data from 2017–2018 obtained from the most popular jobsearching websites, which was then collated with Statistics Poland’s data obtained from Z-05 forms. The above-mentioned analysis demonstrated that web-scraping methods can be adopted by public statistics services to obtain statistical data from alternative sources complementing the already-existing databases, providing the findings of such research remain coherent with the results of the already-existing studies.
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2019, 64, 9; 60-74
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Document Clustering : Concepts, Metrics and Algorithms
Autorzy:
Tarczynski, T.
Powiązania:
https://bibliotekanauki.pl/articles/226231.pdf
Data publikacji:
2011
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
document clustering
text mining
k-means
hierarchical clustersting
vector space model
Opis:
Document clustering, which is also refered to as text clustering, is a technique of unsupervised document organisation. Text clustering is used to group documents into subsets that consist of texts that are similar to each orher. These subsets are called clusters. Document clustering algorithms are widely used in web searching engines to produce results relevant to a query. An example of practical use of those techniques are Yahoo! hierarchies of documents [1]. Another application of document clustering is browsing which is defined as searching session without well specific goal. The browsing techniques heavily relies on document clustering. In this article we examine the most important concepts related to document clustering. Besides the algorithms we present comprehensive discussion about representation of documents, calculation of similarity between documents and evaluation of clusters quality.
Źródło:
International Journal of Electronics and Telecommunications; 2011, 57, 3; 271-277
2300-1933
Pojawia się w:
International Journal of Electronics and Telecommunications
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Implementacja oraz porównanie algorytmów tekstowych w środowiskach przetwarzania równoległego na przykładzie procesorów wielordzeniowych i kart graficznych
Multicore and GPGPU implementation of chosen text algorithms
Autorzy:
Pietroń, M.
Wielgosz, M.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/155953.pdf
Data publikacji:
2014
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
algorytmy tekstowe
GPGPU
obliczenia równoległe
text mining
text algorithms
parallel computing
Opis:
Artykuł przedstawia implementację algorytmów tekstowych w wybranych platformach przetwarzania równoległego. Dostępność procesorów wielordzeniowych oraz kart graficznych ogólnego przeznaczenia sprawia, iż badania nad równoległą implementacją algorytmów w celu ich akceleracji nabierają coraz większego znaczenia. Algorytmy tekstowe są niezwykle istotnym i często niezbędnym elementem zaawansowanych algorytmów analizy tekstu oraz są także składowymi funkcji wyszukiwania wzorców w tekście wielu języków programowania. W pracy dokonano analizy najpopularniejszych algorytmów tekstowych oraz dokonano ich analizy pod kątem ich zrównoleglenia w celu ich implementacji w procesorze wielordzeniowym oraz karcie graficznej ogólnego przeznaczenia. Analizowanymi algorytmami są: boyer-moore, algorytm naiwny oraz algorytm knuth-morris-pratt. Następnie dokonano porównania efektywności ich realizacji na wymienionych platformach sprzętowych.
This paper presents implementation of text algorithms in multicore CPU and GPGPU. The text algorithms are very common algorithms used in text analysis process and they are a part of functions used for text patterns recognition. The library functions for text searching implemented in many languages very often use most popular text-algorithms. The paper describes the analysis of these algorithms for parallel implementations in multicore processors and general purpose graphic cards. The research work presented in this paper shows that text algorithms can be partially parallelized. The process of acceleration can be done by appropriate dividing the input text between parallel threads (data parallelism). The comparative studies were performed for the following algorithms: boyer-moore (horspool) , naive and knuth-morris-pratt algorithm. The presented results show the efficiency of these algorithms in the case of different type and size of patterns. In the case of GPU the implementation was made in the CUDA framework. The OpenMP library was used for a multicore version.
Źródło:
Pomiary Automatyka Kontrola; 2014, R. 60, nr 5, 5; 301-304
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Mining the EU Global Strategy of 2016
Autorzy:
Szoszkiewicz, Łukasz
Powiązania:
https://bibliotekanauki.pl/articles/1831428.pdf
Data publikacji:
2020-12-30
Wydawca:
Uniwersytet im. Adama Mickiewicza w Poznaniu
Tematy:
European Union
United Nations
resilience
systems theory
human rights
text mining
security
Opis:
This study proposes to apply an automated lexical analysis to the European Security Strategy of 2003, entitled “A Secure Europe in a Better World”, and the European Union Global Strategy of 2016, entitled “Shared Vision, Common Acton: A Stronger Europe”. The findings are not limited to supporting the predominant interpretations of scholars and experts, but aim at exploring the usefulness of text mining techniques in the interpretation of EU documents. Furthermore, the conclusions drawn from the lexical analysis are discussed in the light of complex systems theory, which may be beneficial for the proper understanding of the concept of resilience (mainly its multidimensional nature) and its subsequent operationalization. The last part of the paper includes an in-depth analysis of the EU rhetoric on the UN fora (period: 2014–2019) regarding the concept of resilience, in particular its linkages with human rights.
Źródło:
Adam Mickiewicz University Law Review; 2020, 11; 209-234
2450-0976
Pojawia się w:
Adam Mickiewicz University Law Review
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Comprehensive study: - Sarcasm detection in sentimental analysis
Autorzy:
Ratawal, Yamini
Tayal, Devendra
Powiązania:
https://bibliotekanauki.pl/articles/1159725.pdf
Data publikacji:
2018
Wydawca:
Przedsiębiorstwo Wydawnictw Naukowych Darwin / Scientific Publishing House DARWIN
Tematy:
Sentimental analysis
Web mining
deep learning
machine learning
opinion mining
text mining
Opis:
Sarcasm detection is one of the active research area in sentimental analysis. However this paper talks about one of the recent issue in sentimental analysis that us sarcasm detection. In our work, we have described different techniques used in sarcasm detection that helps a novice researcher in efficient way. This paper represent different methodologies of carrying out research in this field.
Źródło:
World Scientific News; 2018, 113; 1-9
2392-2192
Pojawia się w:
World Scientific News
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Mining Non-Functional Requirements using Machine Learning Techniques
Autorzy:
Jindal, Rajni
Malhotra, Ruchika
Jain, Abha
Bansal, Ankita
Powiązania:
https://bibliotekanauki.pl/articles/2060908.pdf
Data publikacji:
2021
Wydawca:
Politechnika Wrocławska. Oficyna Wydawnicza Politechniki Wrocławskiej
Tematy:
requirement engineering
text mining
non-functional requirements
machine learning
receiver operating characteristics
Opis:
Background: Non-Functional Requirements (NFR) have a direct impact on the architecture of the system, thus it is essential to identify NFRs in the initial phases of software development. Aim: The work is based on extraction of relevant keywords from NFR descriptions by employing text mining steps and thereafter classifying these descriptions into one of the nine types of NFRs. Method: For each NFR type, keywords are extracted from a set of pre-categorized specifications using Information-Gain measure. Then models using 8 Machine Learning (ML) techniques are developed for classification of NFR descriptions. A set of 15 projects (containing 326 NFR descriptions) developed by MS students at DePaul University are used to evaluate the models. Results: The study analyzes the performance of ML models in terms of classification and misclassification rate to determine the best model for predicting each type NFR descriptions. The Naïve Bayes model has performed best in predicting “maintainability” and “availability” type of NFRs. Conclusion: The NFR descriptions should be analyzed and mapped into their corresponding NFR types during the initial phases. The authors conducted cost benefit analysis to appreciate the advantage of using the proposed models.
Źródło:
e-Informatica Software Engineering Journal; 2021, 15, 1; 85--114
1897-7979
Pojawia się w:
e-Informatica Software Engineering Journal
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Brand position in the eyes of customers: assessment of selected airlines by the passengers online reviews
Autorzy:
Hoffmann, Natalia
Powiązania:
https://bibliotekanauki.pl/articles/16729698.pdf
Data publikacji:
2022
Wydawca:
Instytut Badań Gospodarczych
Tematy:
data mining
text mining
branch
brand
opinion
R
client
airline
sentiment analysis
Opis:
Motivation: The motivation to write an article on airlines was the desire to rank them based on customer reviews and see how these reviews reflect the actual brand image. The opinions that companies collect about themselves have a very strong power when it comes to building its reputation. Aim: The aim of the study was to use digital transformation and transform raw data into specific information that expressed customer emotions to create a profile of selected airlines. A secondary goal of the article was also to check how the analyzed airlines perform in similar areas. Materials and methods: The data used for the analysis was collected from the eSky.com website and covers the 2019-2020 period. The airlines concerned by the customer reviews were LOT, Ryanair, Wizzair, Czarter, EasyJet, Lufthansa and Laudamotion. Their selection was dictated by the number of opinions necessary to conduct the analysis. The research based on the use of data mining techniques, but it should be noted that most of it uses text mining tools. Topic modelling was used to prepare the data properly and assign each word to groups with similar themes. In order to obtain information whether a given opinion has a positive, negative or neutral tenor, sentiment analysis was used. The final part of the analysis was based on the net sentiment score indicator. The entire analysis was carried out in the R-Studio. Results: The most common subjects of opinions written by customers were "delay", "service", "boarding" and "airline". It was confirmed that the opinions of each airline concern different topics, although some common topics were noticeable. Two topics were repeated among the 7 analyzed airlines: "service" and "delay". Based on the sentiment analysis, for the Ryanair airline the percentage of negative opinions was highest and equal to 35%, almost 40%, of neutral opinions fell on the WizzAir airline and the largest percentage of positive feedback, as much as 46%, was attributed to EasyJet. EasyJet line looks the best in the eyes of customers. The line that evoked uniformly positive, negative and neutral emotions in the opinions was Ryanair.
Źródło:
Catallaxy; 2022, 7, 1; 7-21
2544-090X
Pojawia się w:
Catallaxy
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Text-Mining Approach to the Evaluation of Sustainability Reporting Practices: Evidence from a Cross-Country Study
Analiza znaczeniowa praktyk raportowania zrównoważonego rozwoju: perspektywa światowa
Autorzy:
Kumar, Ajay
Das, Niladri
Powiązania:
https://bibliotekanauki.pl/articles/1841004.pdf
Data publikacji:
2021
Wydawca:
Polska Akademia Nauk. Komitet Człowiek i Środowisko PAN
Tematy:
sustainability reporting
GRI
CSR
top ten economies
text mining
word cloud
raportowanie zrównoważonego rozwoju
10 największych gospodarek
znaczenie tekstu
chmura słów
Opis:
This study examines the sustainability reports (SRs)of 200 firms in both developed and emerging economies in order to identify the words most frequently used in disclosing sustainability practices within the Triple Bottom Line (TBL) approach to reporting (which emphasizes economic, environmental, and social dimensions). Its aim is to evaluate these sustainability reports under the umbrella of the GRI framework. It adopts a semi-automated Text-Mining (TM) technique to evaluate the corporate SRs of select firms from the top ten economies by GDP at current prices. Based on the GRI Standards guidelines, a total of 208 keywords were identified for analysis. The disclosures were then awarded points based on the appearance of these keywords so that the appearance of one resulted in the awarding of a score of one; if a keyword did not appear then the report was scored a zero for that word. Furthermore, a wordcloud was also generated in order to better understand the inclination of reporting language towards various TBL reporting categories. This analysis of the SRs of 200 firms from the top ten economies of the world sheds light on the differences in reporting practices and priorities as they relate to various aspects of the GRI Standards guidelines. The results indicate that SR practices have grown rapidly in the last half decade of the period selected for study (2013-2017) as compared to the first half (2008-2012). Canada ranked highest for its disclosure practices in this analysis followed by the UK, Germany, US, Japan, France, Italy, Brazil, India, and China. This study found that all included countries improved their sustainability performance over the period 2008-2017.
W niniejszym artykule przeanalizowano raporty dotyczące zrównoważonego rozwoju (SR) z 200 firm, zarówno w gospodarkach rozwiniętych, jak i wschodzących, w celu zidentyfikowania słów najczęściej używanych przy ujawnianiu praktyk zrównoważonego rozwoju w ramach podejścia do raportowania treaple bottom line (TB, które kładzie nacisk na ekonomię, środowisko i wymiary społeczne. Celem jest ocena raportów dotyczących zrównoważonego rozwoju w ramach GRI. Przyjęto półautomatyczną technikę Text-Mining (TM) do oceny korporacyjnych praktyk na rzecz zrównoważonego rozwoju (SR) wybranych firm z dziesięciu największych gospodarek według PKB w cenach bieżących. W oparciu o wytyczne standardów GRI do analizy wytypowano łącznie 208 słów kluczowych. Przyznano im następnie punkty w oparciu o częstotliwość ich występowania, tak że pojawienie się jednorazowe skutkowało przyznaniem jednej punktacji; jeśli słowo kluczowe nie pojawiło się, raport był oceniany jako zero dla tego słowa. Ponadto utworzono chmurę słów, aby lepiej zrozumieć skłonność języka raportowania do różnych kategorii raportów TBL. Ta analiza rekomendacji 200 firm z dziesięciu największych gospodarek świata rzuca światło na różnice w praktykach i priorytetach raportowania, które odnoszą się do różnych aspektów wytycznych GRI. Wyniki wskazują, że praktyki zrównoważonego rozwoju (SR) gwałtownie wzrosły w ostatniej połowie dekady wybranej do badania (2013-2017), w porównaniu z pierwszą połową (2008-2012). W tej analizie Kanada zajęła najwyższe miejsce pod względem praktyk ujawniania informacji, a następnie Wielka Brytania, Niemcy, Stany Zjednoczone, Japonia, Francja, Włochy, Brazylia, Indie i Chiny. Badanie wykazało, że wszystkie uwzględnione kraje poprawiły swoje wyniki w zakresie zrównoważonego rozwoju w latach 2008–2017.
Źródło:
Problemy Ekorozwoju; 2021, 16, 1; 51-60
1895-6912
Pojawia się w:
Problemy Ekorozwoju
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Transparency of Constitutional Reasoning: A Text Mining Analysis of the Hungarian Constitutional Court’s Jurisprudence
O transparentności uzasadnień konstytucyjnych. Analiza tekstowa orzecznictwa węgierskiego Trybunału Konstytucyjnego
Autorzy:
Sebők, Miklós
Gárdos-Orosz, Fruzsina
Kiss, Rebeka
Járay, István
Powiązania:
https://bibliotekanauki.pl/articles/31348120.pdf
Data publikacji:
2023
Wydawca:
Uniwersytet Marii Curie-Skłodowskiej. Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej
Tematy:
Hungarian Constitutional Court
constitutional reasoning
methods of interpretation
text mining
węgierski Trybunał Konstytucyjny
uzasadnienia konstytucyjne
metody interpretacji
analiza tekstowa
Opis:
The analysis of constitutional interpretation has received much attention in recent years. This article is a contribution to research using text mining methods to account for markers of constitutional reasoning in big data-sized text corpora. We examine how often the Hungarian Constitutional Court (the HCC) reflected on the various methods of interpretation. For this purpose, we have created a complex corpus covering all HCC decisions and orders between 1990 and 2021. We found evidence that the methodological practice of the HCC is not self-reflexive in general as only 44% of its decisions make a reference to at least one method of interpretation. We also show that the self-reflexive nature is even more prevalent (in fact, ubiquitous) in 100 doctrinally important decisions from the 30 years of jurisprudence in question. While this study is a first step towards the quantitative analysis of the reasoning of the constitutional judiciary, further mixed methods research is needed to account for intertemporal changes in such data and to refine the measurement of constitutional interpretation.
W ostatnich latach analiza interpretacji konstytucyjnej cieszy się dużym zainteresowaniem. Niniejszy artykuł stanowi wkład do badań z wykorzystaniem metod analizy tekstowej (text mining) celem wyjaśnienia znaczników uzasadnień konstytucyjnych w materiale tekstowym o charakterze big data. Badamy, jak często węgierski Trybunał Konstytucyjny (WTK) rozważał różne metody interpretacji. W tym celu zgromadziliśmy materiał obejmujący wszystkie decyzje i postanowienia WTK z lat 1990–2021. Znaleźliśmy dowody na to, że praktyka metodologiczna WTK generalnie nie jest autorefleksyjna, ponieważ w 44% decyzji powołuje się co najmniej na jedną metodę interpretacji. Wykazujemy także, że autorefleksyjny charakter jest nawet przeważający (wręcz wszechobecny) w 100 doktrynalnie istotnych decyzjach z omawianego 30-lecia orzecznictwa. Chociaż opracowanie stanowi pierwszy krok w kierunku ilościowej analizy rozumowania sądownictwa konstytucyjnego, potrzebne są dalsze badania metodami mieszanymi, aby uwzględnić międzyokresowe zmiany takich danych i udoskonalić pomiar interpretacji konstytucyjnej.
Źródło:
Studia Iuridica Lublinensia; 2023, 32, 3; 11-44
1731-6375
Pojawia się w:
Studia Iuridica Lublinensia
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza dokonań OPP, prezentowanych w ich sprawozdaniach rocznych z wykorzystaniem metody drążenia tekstu
Applying text mining method to analyse performance of PBOs based on their annual statements
Autorzy:
Dyczkowski, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/592046.pdf
Data publikacji:
2016
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Dokonania, drążenie tekstu
Informacje opisowe
Organizacje pożytku publicznego
Narrative information
Performance
Public benefit organisations
Text mining
Opis:
Artykuł ma na celu usystematyzowanie informacji charakteryzujących dokonania OPP, ujawnianych w ich rocznych sprawozdaniach z działalności, oraz zidentyfikowanie tych, które stymulują ofiarność indywidualnych darczyńców. Badanie przeprowadzono z zastosowaniem metod drążenia tekstu oraz eksperymentu laboratoryjnego na losowej próbie 177 polskich OPP. Uzyskane wyniki umożliwiły zidentyfikowanie głównych zagadnień prezentowanych przez OPP w narracyjnej części sprawozdania rocznego oraz wskazanie przesuniętych akcentów w opisach dokonań tych OPP, które szczególnie stymulują darczyńców do współdziałania.
The article systematises performance related information disclosed by PBOs in their annual statements. It identifies also those disclosures which may particularly stimulate individual donations. The research comprises 177 randomly selected Polish PBOs. It applies the methodologies of text mining and of a laboratory experiment. The results obtained allowed identifying the key issues which PBOs focus on in narrative parts of their annual statements. They enabled also to observed a shift in focus of performance related narratives in those PBOs which earned more attention of donors.
Źródło:
Studia Ekonomiczne; 2016, 274; 57-66
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Unsupervised dynamic topic model for extracting adverse drug reaction from health forums
Autorzy:
Eslami, Behnaz
Motlagh, Mehdi Habibzadeh
Rezaei, Zahra
Eslami, Mohammad
Amini, Mohammad Amin
Powiązania:
https://bibliotekanauki.pl/articles/117691.pdf
Data publikacji:
2020
Wydawca:
Polskie Towarzystwo Promocji Wiedzy
Tematy:
Deep Learning
topic modeling
Text Mining
ADR
NMF
analiza tekstu
uczenie maszynowe
modelowanie tematyczne
Opis:
The relationship between drug and its side effects has been outlined in two websites: Sider and WebMD. The aim of this study was to find the association between drug and its side effects. We compared the reports of typical users of a web site called: “Ask a patient” website with reported drug side effects in reference sites such as Sider and WebMD. In addition, the typical users’ comments on highly-commented drugs (Neurotic drugs, Anti-Pregnancy drugs and Gastrointestinal drugs) were analyzed, using deep learning method. To this end, typical users’ comments on drugs' side effects, during last decades, were collected from the website “Ask a patient”. Then, the data on drugs were classified based on deep learning model (HAN) and the drugs’ side effect. And the main topics of side effects for each group of drugs were identified and reported, through Sider and WebMD websites. Our model demonstrates its ability to accurately describe and label side effects in a temporal text corpus by a deep learning classifier which is shown to be an effective method to precisely discover the association between drugs and their side effects. Moreover, this model has the capability to immediately locate information in reference sites to recognize the side effect of new drugs, applicable for drug companies. This study suggests that the sensitivity of internet users and the diverse scientific findings are for the benefit of distinct detection of adverse effects of drugs, and deep learning would facilitate it.
Źródło:
Applied Computer Science; 2020, 16, 1; 41-59
1895-3735
Pojawia się w:
Applied Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Study of the Influence of Online Information on the Changes in the Warsaw Stock Exchange Indexes
Badanie wpływu informacji sieciowych na zmiany indeksów na Giełdzie Papierów Wartościowych w Warszawie
Autorzy:
Młodzianowski, Piotr
Powiązania:
https://bibliotekanauki.pl/articles/660026.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
wiadomości
Giełda Papierow Wartościowych
text mining
analiza sentymentu
news
Warsaw Stock Exchange
sentiment analysis
Opis:
W artykule zaprezentowano wyniki badania nad wpływem informacji sieciowych pochodzących z serwisów internetowych o tematyce finansowej na zmiany indeksów zachodzące na Warszawskiej Giełdzie Papierów Wartościowych. Pierwsza część pracy ma charakter teoretyczny. Przybliżono w niej zagadnienie text miningu oraz analizy sentymentu. Przedstawiono ich zastosowanie w procesie analizy tekstu. W następnej części pracy omówiono charakterystykę prowadzonego badania. Dokonano wyboru polskich serwisów informacyjnych o tematyce finansowej, które mogą wpływać na reakcje inwestorów z Warszawskiej Giełdy Papierów Wartościowych. Przeprowadzono selekcję słów występujących w analizowanych serwisach oraz dokonano ich podziału na klasy. Następnie zaanalizowano zależności między zmianą indeksów GPW a częstością występowania poszczególnych słów w ramach klas. W ostatniej części pracy zaprezentowano wyniki badań, przeprowadzono dyskusję nad możliwościami ich wykorzystania oraz wskazano dalsze kierunki badań.
The article presents the results of a study on the influence of online information originating from financial websites on changes in the Warsaw Stock Exchange indexes. The first part is theoretical. It describes the issue of text mining and sentiment analysis and their use in the text analysis process. The next part of the article describes the characteristics of the study. A selection was made of Polish financial websites that may trigger reactions from investors on the Warsaw Stock Exchange. Words occurring on the analysed websites were selected and put into classes. Then the relation between changes in WSE indexes and the frequency of appearance of individual words within the classes was analysed. The last part of the article presents the study results, discusses the possibilities of using them and indicates further areas for research.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2018, 3, 335; 123-138
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Information management tools for innovation analysts
Narzędzia zarządzania informacją dla analityków innowacji
Autorzy:
Eito-Brun, R.
Powiązania:
https://bibliotekanauki.pl/articles/256694.pdf
Data publikacji:
2014
Wydawca:
Sieć Badawcza Łukasiewicz - Instytut Technologii Eksploatacji - Państwowy Instytut Badawczy
Tematy:
innovation
scientometrics
text mining
opinion mining
text visualization
innowacja
naukometria
eksploracja tekstu
badanie opinii
wizualizacja tekstu
Opis:
Innovation management is a knowledge-intensive process that requires dealing with different sources of data to identify relationships between the concepts, techniques, and tools that may led to innovations. Innovation analysts need to handle huge amounts of unstructured information: ideas gathered from internal staff and external partners, research papers and technical reports, patents and applications, etc. All these sources constitute valid inputs to assess the innovativeness of ideas, the feasibility of their implementation, and their potential value in the market. Innovation management discipline has widely used techniques and methods developed in the context of Information Science to support the identification of research trends, assess the outputs of innovation efforts and investments, and monitor the market and the activities made by competitors. The fruitful relationship between Information Science techniques and Innovation management needs to be regularly reviewed as new techniques and tools are designed and made available to the community. In the last years, significant progress has been achieved in areas like scientometrics, text visualization, and opinion mining. This paper provides an overview of these techniques and discusses how they can help professionals involved in innovation programs.
Zarządzanie innowacjami to oparty na wiedzy proces, w którym definiowany jest poziom zależności pomiędzy pomysłami, technikami i narzędziami mogącymi skutkować opracowaniem innowacji. Analityk innowacji musi zarządzać treściami niestrukturalnymi: pomysłami zgromadzonymi od pracowników jak i partnerów, wiedzą pochodzącą z publikacji naukowych i raportów technicznych, patentami i zgłoszeniami patentowymi itp. Wszystkie te źródła stanowią istotny wkład w proces oceny innowacyjności pomysłu, możliwości jego realizacji oraz konkurencyjności rynkowej. W zarządzaniu innowacjami powszechnie stosowane są techniki i metody informatyczne, które wspomagają proces identyfikacji trendów, oceny rezultatów, oszacowania niezbędnych nakładów finansowych czy monitorowania rynku. Oznacza to, że należy regularnie monitorować stan wiedzy i techniki w tym obszarze w celu zapewnienia jak najbardziej owocnej współpracy na styku nauk informatycznych i zarządzania innowacjami. W ostatnich latach znaczący postęp osiągnięto w takich dziedzinach jak naukometria, wizualizacja tekstu i badanie opinii. W artykule dokonano przeglądu tych technik i omówiono sposób, w jaki mogą one wspomóc specjalistów zaangażowanych w realizację innowacyjnych programów.
Źródło:
Problemy Eksploatacji; 2014, 4; 73-82
1232-9312
Pojawia się w:
Problemy Eksploatacji
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The role of word and n-gram frequency analysis in inference of the content of scientific publication
Autorzy:
Zdonek, Iwona
Powiązania:
https://bibliotekanauki.pl/articles/1931609.pdf
Data publikacji:
2020
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
text mining
R
n-grams
scientific publication analysis
eksploracja tekstu
n-gram
analiza publikacji naukowych
Opis:
Purpose: The paper presents an analysis of a scientific publication with regard to the frequency of words and n-grams. The research problem addressed was the question to what extent the text mining analysis of a scientific publication will allow to infer its content. Design/methodology/approach: The main research method is the analysis of tokenized text using word count functions, bigrams, and trigrams in selected sections of a scientific publication. The results of text mining analysis were compared with the classic, non-automated text analysis of the publication. The presented study is a pilot project in the form of a case study. Findings: The proposed method of analyzing a scientific text using an analysis of the frequency of words and n-grams enables inference of the content of the paper with regard to the names of variables involved in the study, the statistical apparatus used and the key literature cited. It should be observed, however, that the discussed method does not make it possible to establish which variables are moderators and which are mediators. Originality/value: In this paper, the text mining technique was used differently in the discussed study than in previous works. The publication was not examined in its entirety, as previous researchers did, but text mining analysis was applied to individual parts of the paper, i.e. the part discussing theoretical foundations of the research and the part presenting the research method, research results, and their discussion. This allowed for obtaining more precise results regarding the content of the publication.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2020, 142; 21-31
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza dokonań OPP prezentowanych w ich rocznych obligatoryjnych sprawozdaniach z działalności z wykorzystaniem metody eksploracji tekstu
Applying Text Mining to Analyze the Performance of PBOs on the Basis of Their Obligatory Annual Activity Statements
Autorzy:
Dyczkowski, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/525528.pdf
Data publikacji:
2016-11-30
Wydawca:
Uniwersytet Warszawski. Wydawnictwo Naukowe Wydziału Zarządzania
Tematy:
dokonania
eksploracja tekstu
informacje opisowe
organizacje pożytku publicznego
performance
text mining
narrative information
public benefit organizations
Opis:
Niniejsze opracowanie ma na celu zbadanie, czy szczegółowość i dobór informacji dotyczących dokonań organizacji pożytku publicznego (OPP) ujawnianych w ich obligatoryjnych rocznych sprawozdaniach z działalności może stymulować ofiarność indywidualnych darczyńców. Badanie przeprowadzono na losowej próbie 177 polskich OPP z zastosowaniem metod eksploracji tekstu oraz eksperymentu laboratoryjnego. Uzyskane wyniki pozwoliły na zidentyfikowanie dziewięciu głównych grup zagadnień prezentowanych przez OPP w narratywnej części sprawozdania rocznego z działalności. Wskazały także na większą szczegółowość i przesunięte akcenty w opisach dokonań tych OPP, które w najwyższym stopniu stymulują darczyńców do dokonywania odpisów 1% podatku.
The paper’s aims is to investigate if the level of detail and selection of particular performance-related information by public benefit organizations (PBOs) in their obligatory annual activity statements can stimulate individual donations. The research encompassed 177 randomly selected Polish PBOs. It applied text mining methodologies and a laboratory experiment. The results obtained allowed the identification of nine key groups of topics that PBOs focus on the narrative parts of their obligatory annual activity statements. Moreover, it was proven that organizations that potential donors would like to support with their 1% tax write-off discuss their performance in more detail and focus on slightly different issues than other organizations.
Źródło:
Problemy Zarządzania; 2016, 4/2016 (63), t.1; 123 - 138
1644-9584
Pojawia się w:
Problemy Zarządzania
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Formalization of Technological Knowledge in the Field of Metallurgy Using Document Classification Tools Supported with Semantic Techniques
Autorzy:
Regulski, K.
Powiązania:
https://bibliotekanauki.pl/articles/353849.pdf
Data publikacji:
2017
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
application of information technology to the foundry industry
document classification
semantic techniques
knowledge formalization
text mining
Opis:
The process of knowledge formalization is an essential part of decision support systems development. Creating a technological knowledge base in the field of metallurgy encountered problems in acquisition and codifying reusable computer artifacts based on text documents. The aim of the work was to adapt the algorithms for classification of documents and to develop a method of semantic integration of a created repository. Author used artificial intelligence tools: latent semantic indexing, rough sets, association rules learning and ontologies as a tool for integration. The developed methodology allowed for the creation of semantic knowledge base on the basis of documents in natural language in the field of metallurgy.
Źródło:
Archives of Metallurgy and Materials; 2017, 62, 2A; 715-720
1733-3490
Pojawia się w:
Archives of Metallurgy and Materials
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Raising a Child to Live in Society – Personality Traits Parents Develop and Prevent from Developing in their Preschool Children
Autorzy:
Szymańska, Agnieszka
Aranowska, Elżbieta
Powiązania:
https://bibliotekanauki.pl/articles/36420330.pdf
Data publikacji:
2022-12-20
Wydawca:
Wydawnictwo Naukowe Chrześcijańskiej Akademii Teologicznej w Warszawie
Tematy:
personality development
disorders of personality
parental goals
data mining algorithms
text mining algorithms
social network analysis
Opis:
Personal characteristics that parents want to shape in their children are called parental goals and can be divided into desired and undesired traits. Which of them are most and the least desirable by parents in context of developing child’s personality? Do parental goals change with the age of the child? The study was conducted on a sample of 319 parents of children aged 3, 4, 5 and 6 years old. Analyses were carried out using two data mining algorithms: (a) text mining algorithms, (b) support vector machine and (c) social network analysis, and (d) Aranowska's λ judge agreement coefficient. The results revealed that parents of preschool children care mainly about the development of competency traits, especially self-reliance. When it comes to undesirable traits, parents make sure that their children do not develop traits from the field of temperament - personality (especially aggressiveness) and traits from the area of lack of virtues (selfishness, laziness, lies). It is noticeable that when the child reaches the age of 4 the parental goals change. Based on the characteristics selected by parents, it can be correctly predicted how old the child is.
Źródło:
Studia z Teorii Wychowania; 2022, XIII(4 (41)); 409-431
2083-0998
2719-4078
Pojawia się w:
Studia z Teorii Wychowania
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Linking with BIAM: searching for drugs and pharmaceutical substances
Autorzy:
Węgrzyn-Wolska, K.
Powiązania:
https://bibliotekanauki.pl/articles/333882.pdf
Data publikacji:
2007
Wydawca:
Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Tematy:
eklsporacja tekstów biomedycznych
pochodzenie synonimów i skrótów
biomedicines text mining
named entity recognition
synonyms and abbreviation extraction
Opis:
The quantity of biomedical publications is growing at an exponential rate. With such explosive growth of the content, it is more and more difficult to locate, retrieve and manage the resulting information. This is why text mining has become a necessity. The main goal of biomedical research is to put knowledge to practical use in the form of diagnoses, prevention, and treatment. It is important to pool the resources between the different individuals researching results. The objective of this paper is to discuss the variety of issues and challenges surrounding the perspectives regarding the use of Information Retrieval and Text Mining methods in biomedicine. The article will first look at the directions in biomedical TM and then describe the work done for the BIAM project, the French on-line Medical Data Base.
Źródło:
Journal of Medical Informatics & Technologies; 2007, 11; 255-261
1642-6037
Pojawia się w:
Journal of Medical Informatics & Technologies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Comparative study of CNN and LSTM for opinion mining in long text
Autorzy:
Yousf, Siham
Rhanoui, Maryem
Mounia, Mikram
Powiązania:
https://bibliotekanauki.pl/articles/1837369.pdf
Data publikacji:
2020
Wydawca:
Sieć Badawcza Łukasiewicz - Przemysłowy Instytut Automatyki i Pomiarów
Tematy:
deep learning
long text opinion mining
CNN
LSTM
Opis:
The digital revolution has encouraged many companies to set up new strategic and operational mechanisms to supervise the flow of information published about them on the Web. Press coverage analysis is a part of sentiment analysis that allows companies to discover the opinion of the media concerning their activities, products and services. It is an important research area, since it involves the opinion of informed public such as journalists, who may influence the opinion of their readers. However, from an implementation perspective, the analysis of the opinion from media coverage encounters many challenges. In fact, unlike social networks, the Media coverage is a set of large textual documents written in natural language. The training base being huge, it is necessary to adopt large-scale processing techniques like Deep Learning to analyze their content. To guide researchers to choose between one of the most commonly used models CNN and LSTM, we compare and apply both models for opinion mining from long text documents using real datasets.
Źródło:
Journal of Automation Mobile Robotics and Intelligent Systems; 2020, 14, 3; 50-55
1897-8649
2080-2145
Pojawia się w:
Journal of Automation Mobile Robotics and Intelligent Systems
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Governance in Peer Production Communities: the Case of Debian Project Leader Elections
Autorzy:
Rogiński, Mikołaj
Powiązania:
https://bibliotekanauki.pl/articles/22858339.pdf
Data publikacji:
2023-06-28
Wydawca:
Polskie Towarzystwo Socjologiczne
Tematy:
text mining
virtual community
quantitative approach
management practices
FLOSS (free/libre and open source software)
commons-based peer production
Opis:
The purpose of this article is to explore the Debian Project, which is a peer production organization, and to answer the main research question of what topics were discussed in Project Leader candidates’ program statements. One of the organizational solutions, voting for the Project Leader, was subjected to detailed analysis. According to the usual practice, candidates for the leadership position each publish a program declaration. The study collected all such declarations from 1999–2020 and analyzed them using quantitative text analysis methods. As a result, it was possible to define the most important topics appearing in the declarations, and to track changes in their proportions over time. It was found that management has always been an important topic for candidates. In turn, analysis using Structural Topic Modeling showed at a detailed level which sub-topics related to management were discussed, and how their share changed over time.
Źródło:
Polish Sociological Review; 2023, 222, 2; 263-282
1231-1413
2657-4276
Pojawia się w:
Polish Sociological Review
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Supporting the technical management of residential buildings in the process of their exploitation
Wspomaganie zarządzania technicznego budynkami mieszkalnymi w procesie ich eksploatacji
Autorzy:
Gajzler, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/1852506.pdf
Data publikacji:
2021
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
zarządzanie budynkiem
stan techniczny
budynek mieszkalny
eksploatacja
case based reasoning
text mining
building management
technical condition
residential building
exploitation
Opis:
By analyzing the individual stages of the building's life cycle, it can be easily concluded that the building's exploitation process is the longest and at the same time it is the justification for the construction project related to the construction of this building. In the course of the building's exploitation, various phenomena occur that affect its condition and thus the possibility of unlimited use. These are natural phenomena, as well as phenomena derived from external influences, which often lead to deterioration of the building's condition, or even its degradation. In response to these phenomena, maintenance, renovation and modernization activities are undertaken. Technical management is related to the identification of these phenomena, programming of adequate measures and their implementation. The conducted analysis of the results of the survey in the group of property managers allows to state categorically that the process of technical management is relatively little supported by IT tools and is still based on individual analysis and often intuitive actions. The article presents the possibilities of applying an innovative approach in the acquisition and collection of information about the technical condition of buildings, indicating the legitimacy of standardizing information forms and using them in building a database of cases of the CBR (case based reasoning) inference system .
Okres eksploatacji obiektu budowlanego jest docelowo najdłuższym etapem w cyklu życia obiektu, któremu podporządkowane są wszelkie poprzedzające go etapy cyklu życia. Analizując literaturę przedmiotu odnosi się wrażenie, że proporcjonalnie mało uwagi poświęca się zagadnieniom występującym na etapie eksploatacji. Gros uwagi skupione jest na zagadnieniach występujących na etapie projektowania, przygotowania i samej realizacji inwestycji. Poniekąd jest to właściwe, albowiem poprawne zaprojektowanie i zrealizowanie przedsięwzięcia winno skutkować redukcją problemów na etapie eksploatacji. Nie można ich jednak całkowicie wyeliminować, albowiem wynikają również z czynników zewnętrznych jak i naturalnych. Jednocześnie należy zauważyć, że zagadnienia problemowe występujące na etapie eksploatacji mają charakter kompleksowy i obejmują wiele czynników, w tym również pozatechnicznych. Obserwacje bezpośrednie zagadnień jakie występują na etapie eksploatacji budynków mieszkalnych pozwalają sformułować wniosek o konieczności stałego monitorowania stanu technicznego budynku i w związku z jego zmianą aktywnego działania poprzez planowanie adekwatnej polityki utrzymaniowej i remontowej. Również bezpośrednie obserwacje pozwalają stwierdzić, że w wielu przypadkach, pomimo zaistnienia potrzeby wdrożenia działań utrzymaniowych i remontowych, ze względów ekonomicznych, te nie są wdrażane. Wynika to z faktu, że wdrożenie działań, w szczególności remontowych, wymaga odpowiednio wczesnego przygotowania i zapewnienia środków finansowych na niezbędne nakłady. W przypadku drastycznego pogorszenia stanu technicznego budynku, częstokroć wysokość niezbędnych nakładów przewyższa możliwości finansowe właścicieli i użytkowników, co w konsekwencji prowadzi do jeszcze większej degradacji stanu technicznego. Z uwagi na to, istotnym jest prognozowanie nakładów finansowych niezbędnych na działania utrzymaniowe i remontowe, których zakres jak i zasadność wynika ze zmian stanu technicznego budynku. W aspekcie stwierdzonej zasadności prognozowania nakładów finansowych oraz planowania polityki utrzymanioworemontowej dokonano analizy stanu faktycznego poprzez badania ankietowe. Na podstawie uzyskanych wyników stwierdzono m.in., że wykorzystanie rozwiązań IT dedykowanych do zarzadzania nieruchomościami obejmuje 53,06% badanych podmiotów – zarządców nieruchomości. Ponadto stwierdzono, że same rozwiązania IT dedykowane dla zarządzania nieruchomościami w marginalny sposób obejmują zagadnienia typowo techniczne, a akcentują zagadnienia administrowania, rozliczania opłat i ich księgowania, czy komunikacji. Co szczególnie mało satysfakcjonujące, w oparciu o wykonane badanie ankietowe, jak również obserwacje bezpośrednie, zauważa się brak wykorzystania zalet BIM w zarządzaniu nieruchomościami. Ma to jednak uzasadnienie w tym, że technologia BIM obecnie upowszechniła się w projektowaniu i w realizacji i w związku z tym dopiero w pewnej perspektywie czasowej zauważalne będzie wykorzystanie BIM w zarządzaniu nieruchomościami, tym bardziej, że już kilka lat temu stworzono podwaliny BIM 7D.
Źródło:
Archives of Civil Engineering; 2021, 67, 2; 437-454
1230-2945
Pojawia się w:
Archives of Civil Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Modification of the Leacock-Chodorow Measure of the Semantic Relatedness of Concepts
Modyfikacja miary semantycznego podobieństwa pojęć Leacock‑Chodorowa
Autorzy:
Korzeniewski, Jerzy
Powiązania:
https://bibliotekanauki.pl/articles/1033576.pdf
Data publikacji:
2020-12-15
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
badanie tekstu
Sieć WordNet
podobieństwo semantyczne słów
miara Leacock‑Chodorowa
text mining
WordNet network
semantic relatedness
Lecock-Chodorov measure
Opis:
The measures of the semantic relatedness of concepts can be categorised into two types: knowledge‑based methods and corpus‑based methods. Knowledge‑based techniques make use of man‑created dictionaries, thesauruses and other artefacts as a source of knowledge. Corpus‑based techniques assess the semantic similarity of two concepts making use of large corpora of text documents. Some researchers claim that knowledge‑based measures outperform corpus‑based ones, but it is much more important to observe that the latter ones are heavily corpus dependent. In this article, we propose to modify the best WordNet‑based method of assessing semantic relatedness, i.e. the Leacock‑Chodorow measure. This measure has proven to be the best in several studies and has a very simple formula. We asses our proposal on the basis of two popular benchmark sets of pairs of concepts, i.e. the Ruben‑Goodenough set of 65 pairs of concepts and the Fickelstein set of 353 pairs of terms. The results prove that our proposal outperforms the traditional Leacock‑Chodorow measure.
Miary semantycznego podobieństwa pojęć można podzielić na dwa rodzaje: metody oparte na wiedzy i metody oparte na bazie tekstów. Techniki oparte na wiedzy stosują stworzone przez człowieka słowniki oraz inne opracowania. Techniki oparte na bazie tekstów oceniają podobieństwo semantyczne dwóch pojęć, odwołując się do obszernych baz dokumentów tekstowych. Niektórzy badacze twierdzą, że miary oparte na wiedzy są lepsze jakościowo od tych opartych na bazie tekstów, ale o wiele istotniejsze jest to, że te drugie zależą bardzo mocno od użytej bazy tekstów. W niniejszym artykule przedstawiono propozycję modyfikacji najlepszej metody pomiaru semantycznego podobieństwa pojęć, opartej na sieci WordNet, a mianowicie miary Leacock‑Chodorowa. Ta miara była najlepsza w kilku eksperymentach badawczych oraz można zapisać ją za pomocą prostej formuły. Nową propozycję oceniono na podstawie dwóch popularnych benchmarkowych zbiorów par pojęć, tj. zbioru 65 par pojęć Rubensteina‑Goodenougha oraz zbioru 353 par pojęć Fickelsteina. Wyniki pokazują, że przedstawiona propozycja spisała się lepiej od tradycyjnej miary Leacock‑Chodorowa.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2020, 6, 351; 97-106
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Nuclear media discourses after the closure of the Ignalina Nuclear Power Plant: Is the game over?
Autorzy:
Mažeikienė, Natalija
Kasperiūnienė, Judita
Tandzegolskienė, Ilona
Powiązania:
https://bibliotekanauki.pl/articles/471065.pdf
Data publikacji:
2019
Wydawca:
Polskie Towarzystwo Komunikacji Społecznej
Tematy:
critical discourse analysis
Ignalina Nuclear Power Plant
media framing
media news portals
nuclear discourse
nuclear media discourse
text mining
Visaginas
Opis:
The article presents a critical discourse analysis of media coverage of the most important Lithuanian strategic object - the Ignalina Nuclear Power Plant INPP - in the three biggest news portals. Media news focuses mostly on certain aspects of decommissioning of the INPP management issues and the transparency of financing mechanisms. Environmental and social aspects of the decommissioning are not sufficiently disclosed and discussed. The community of Visaginas the satellite town for the workers of the INPP remains an invisible and silent actor of the discourse. In the media news portals, the town is portrayed as disconnected from the INPP. This divide could be explained by assuming that after the closure of the INPP as a major feeding enterprise the town must search for a re-definition of its identity and construct this identity without nuclear energy and without the INPP. On the other hand, such a divide reflects a common trend characteristic of the entire nuclear discourse - to disempower communities and the public, create a boundary between the industry and the public, between the experts and ordinary citizens.
Źródło:
Central European Journal of Communication; 2019, 12, 3/24; 335-360
1899-5101
Pojawia się w:
Central European Journal of Communication
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Whats and Hows? The Practice-Based Typology of Narrative Analyses
Co i jak? Typologia analiz narracyjnych oparta na praktykach badawczych
Autorzy:
Bryda, Grzegorz
Powiązania:
https://bibliotekanauki.pl/articles/1371561.pdf
Data publikacji:
2020-08-31
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
analiza narracyjna
CAQDAS
analiza treści
Text Mining
kodowanie słownikowe
modelowanie tematyczne
Narrative Analysis
Content Analysis
dictionary-based coding
topic modeling
Opis:
The nature of qualitative research practices is multiparadigmaticity which creates coexistence of different research and analytical approaches to the study of human experience in the living world. This diversity is particularly observed in the contemporary field of narrative research and data analysis. The purpose of this article is a methodological reflection on the process of developing typology and a proposition of new data-driven and practice-based typology of narrative analyses used by qualitative researchers in the lived experience research. I merge the CAQDAS, Corpus Linguistics, and Text Mining procedures to examine the analytical strategies inherited in a vivid language of English-language research articles, published in five influential qualitative methodological journals between 2002-2016. Using the dictionary-based content analysis in the coding process, hierarchical clustering, and topic modeling – a text-mining tool for discovering hidden semantic structures in a textual body – I confront Catherine Kohler Riessman’s heuristic typology with the data-driven approach in order to contribute the more coherent image of narrative analysis in the contemporary field of qualitative research. Finally, I propose a new model of thinking about the typology of narrative analyses based upon research practices.
Istotą jakościowych praktyk badawczych jest wieloparadygmatyczność, która rodzi współistnienie różnych podejść metodologicznych w analizie i badaniu ludzkich doświadczeń w świecie życia codziennego. Różnorodność ta jest szczególnie widoczna w dziedzinie badań i analizy danych narracyjnych. Celem artykułu jest refleksja metodologiczna nad tworzeniem typologii analiz narracyjnych i zarazem propozycja nowego sposobu typologizacji podejść analitycznych, opartego na łączeniu lingwistyki korpusowej i przetwarzania języka naturalnego z procedurami CAQDAS, analizy treści i Text Mining. Typologia ta jest oparta na analizie narracyjnych praktyk badawczych odzwierciedlonych w języku anglojęzycznych artykułów opublikowanych w pięciu uznanych na świecie jakościowych czasopismach metodologicznych w latach 2002–2016. W artykule wykorzystuję metodę słownikową w procesie kodowania artykułów, hierarchiczne grupowanie i modelowanie tematyczne w celu odkrywania w tych publikacjach różnych typów analiz narracyjnych i badania relacji semantycznych między nimi. Jednocześnie konfrontuję heurystyczną typologię Riessmana z podejściem opartym na lingwistyce i eksploracji danych w celu rozwijania spójnego obrazu metodologii analizy narracyjnej we współczesnej dziedzinie badań jakościowych. Ostatecznie przedstawiam nowy model myślenia o analizie narracyjnej.
Źródło:
Przegląd Socjologii Jakościowej; 2020, 16, 3; 120-142
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Identification of Factors Contributing to Self-Reported Anomalies in Civil Aviation
Autorzy:
Andrzejczak, C.
Karwowski, W.
Thompson, W.
Powiązania:
https://bibliotekanauki.pl/articles/90652.pdf
Data publikacji:
2014
Wydawca:
Centralny Instytut Ochrony Pracy
Tematy:
self-reported anomalies
civil aviation
human factors
pilot error
text mining
correspondence analysis
czynnik ludzki
lotnictwo cywilne
błąd pilota
analiza tekstu
Opis:
The main objective of this study was to analyze anomalies voluntarily reported by pilots in civil aviation sector and identify factors leading to such anomalies. Experimental data were obtained from the NASA aviation safety reporting system (ASRS) database. These data contained a range of text records spanning 30 years of civilian aviation, both commercial (airline operations) and general aviation (private aircraft). Narrative data as well as categorical data were used. The associations between incident contributing factors and selfreported anomalies were investigated using data mining and correspondence analysis. The results revealed that a broadly defined human factors category and weather conditions were the main contributors to selfreported civil aviation anomalies. New associations between identified factors and reported anomaly conditions were also reported.
Źródło:
International Journal of Occupational Safety and Ergonomics; 2014, 20, 1; 3-18
1080-3548
Pojawia się w:
International Journal of Occupational Safety and Ergonomics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Odkrywanie postaw dydaktyków zawartych w komentarzach studenckich. Analiza treści z zastosowaniem słownika klasyfikacyjnego
Exploring Attitudes of Educators Based on Students Comments. Content Analysis Using a Classification Dictionary
Autorzy:
Tomanek, Krzysztof
Bryda, Grzegorz
Powiązania:
https://bibliotekanauki.pl/articles/413380.pdf
Data publikacji:
2015
Wydawca:
Łódzkie Towarzystwo Naukowe
Tematy:
słownik klasyfikacyjny
analiza opinii
text mining
metody klasyfikacji wypowiedzi
analiza treści
mixed methods
dictionary – based classification
opinion analysis
content analysis
Opis:
Wykorzystanie wiedzy o semantyce, pragmatyce wypowiedzi i logice powiązań pomiędzy elementami wypowiedzi pisemnych w połączeniu z technikami z obszaru Text Mining to nowe podejście w analizie danych jakościowych. Wymaga ono integracji wiedzy z różnych obszarów nauki, m.in. socjologii, językoznawstwa, NLP (Natural Language Processing), logiki, statystyki. W efekcie tej fuzji możliwe jest budowanie słowników klasyfikacyjnych wspomagających proces analizy i odkrywania wiedzy w dużych zbiorach tekstów, komentarzy. Ta perspektywa wywodzi się z tradycyjnej metody służącej opracowaniu treści, jest jednak mniej czasochłonna, a jej rozwiązania służyć mogą w analizie treści jeszcze nie eksplorowanych. Celem artykułu jest przedstawienie trzech różnych podejść metodologicznych w analizie danych tekstowych opartych na wykorzystaniu słownika klasyfikacyjnego w odkrywaniu typów postaw dydaktyków scharakteryzowanych w studenckich komentarzach zawartych w ocenach zajęć dydaktycznych za lata 2008–2013 na Uniwersytecie Jagiellońskim w Krakowie. W artykule pokazujemy przykłady klasyfikacji i ich wyniki, podkreślając wady i korzyści zastosowanych podejść. Zaprezentowane zostały także podstawowe miary opisujące trafność klasyfikacji. Analiza wielowymiarowa wykonana została z zastosowaniem takich technik, jak: miara podobieństwa wypowiedzi tekstowych, analiza dendrogramowa, analiza korespondencji.
The use of knowledge about the semantics and pragmatics of speech and the logic of connections between elements of written statements, in combination with techniques from the Text Mining field, constitutes a new approach in qualitative data analysis. It requires the integration of knowledge from different fields of science i.e. sociology, linguistics, NLP (Natural Language Processing), logic and statistics. As a result of this union is possible to build classification dictionaries that support the process of analysis and knowledge discovery in large text collections. This perspective is derived from the traditional method of content analysis, but is less time-consuming and its solutions can be used in the analysis of contents that have not yet been explored. This article presents three different methodological approaches in the analysis of textual data, based on classification using a dictionary to discover the types of attitudes of academic teachers, as characterized by student’s comments in teacher course evaluations at the Jagiellonian University in Krakow for the period 2008–2013. In this paper we show examples of a students’ comments dictionary-based classification and the results, highlighting the advantages and benefits of applied approaches. Moreover we present basic measures describing the accuracy of such classification and multivariate analysis techniques, such as similarity measures in text analysis, hierarchical cluster analysis and correspondence analysis.
Źródło:
Przegląd Socjologiczny; 2015, 64, 4; 51-81
0033-2356
Pojawia się w:
Przegląd Socjologiczny
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Sentiment Classification of Bank Clients’ Reviews Written in the Polish Language
Analiza sentymentu na podstawie polskojęzycznych recenzji klientów banku
Autorzy:
Idczak, Adam Piotr
Powiązania:
https://bibliotekanauki.pl/articles/2033889.pdf
Data publikacji:
2021-06-30
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
analiza sentymentu
klasyfikacja dokumentów
textmining
regresja logistyczna
naiwny klasyfikator Bayesa
sentiment analysis
opinion mining
text classification
text mining
logistic regression
naive Bayes classifier
Opis:
It is estimated that approximately 80% of all data gathered by companies are text documents. This article is devoted to one of the most common problems in text mining, i.e. text classification in sentiment analysis, which focuses on determining the sentiment of a document. A lack of defined structure of the text makes this problem more challenging. This has led to the development of various techniques used in determining the sentiment of a document. In this paper, a comparative analysis of two methods in sentiment classification, a naive Bayes classifier and logistic regression, was conducted. Analysed texts are written in the Polish language and come from banks. The classification was conducted by means of a bag‑of‑n‑grams approach, where a text document is presented as a set of terms and each term consists of n words. The results show that logistic regression performed better.
Szacuje się, że około 80% wszystkich danych gromadzonych i przechowywanych w systemach informacyjnych przedsiębiorstw ma postać dokumentów tekstowych. Artykuł jest poświęcony jednemu z podstawowych problemów textminingu, tj. klasyfikacji tekstów w analizie sentymentu, która rozumiana jest jako badanie wydźwięku tekstu. Brak określonej struktury dokumentów tekstowych jest przeszkodą w realizacji tego zadania. Taki stan rzeczy wymusił rozwój wielu różnorodnych technik ustalania sentymentu dokumentów. W artykule przeprowadzono analizę porównawczą dwóch metod badania sentymentu: naiwnego klasyfikatora Bayesa oraz regresji logistycznej. Badane teksty są napisane w języku polskim, pochodzą z banków i mają charakter marketingowy. Klasyfikację przeprowadzono, stosując podejście bag‑of‑n‑grams. W ramach tego podejścia dokument tekstowy wyrażony jest za pomocą podciągów składających się z określonej liczby n wyrazów. Uzyskane wyniki pokazały, że lepiej spisała się regresja logistyczna.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2021, 2, 353; 43-56
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
What experiences do tourists seek in national parks? Analysis of TripAdvisor reviews
Jakich doświadczeń poszukują turyści w parkach narodowych? Analiza opinii w serwisie TripAdvisor
Autorzy:
Nowacki, Marek
Niezgoda, Agnieszka
Powiązania:
https://bibliotekanauki.pl/articles/24201139.pdf
Data publikacji:
2023
Wydawca:
Fundacja Ekonomistów Środowiska i Zasobów Naturalnych
Tematy:
content analysis
coding experiences
text mining
Poland’s national park
sustainable tourism
analiza treści
kodowanie doświadczeń
eksploracja tekstu
polski park narodowy
zrównoważona turystyka
Opis:
The article aims to analyse and compare experiences gained by tourists visiting three national parks in Poland. The authors focused on the following questions: What are people's experiences visiting national parks in Poland? Do the natural assets of the national parks affect visitors' unique experiences, or are environmentally valuable areas not crucial for their experiences? The authors used mixed quantitative (text mining, correspondence analysis) and qualitative (content analysis) methods. The data for analysis were opinions written by TripAdvisor users. Reviews on TripAdvisor indicate that the most important experiences for tourists in the National Parks studied were Nature appreciation and Physical activity. The other groups of experiences reflected in the reviews were: Aesthetic, Connection, Tension and Excitement. This confirms that nature is the most important feature of national parks for tourists, but it also indicates a trend to maintain good health and the desire to regenerate physical strength in areas of natural beauty.
Celem artykułu jest analiza i porównanie doświadczeń turystów odwiedzających trzy parki narodowe w Polsce. Autorzy skupili się na następujących pytaniach: Jakie są doświadczenia osób odwiedzających parki narodowe w Polsce? Czy walory przyrodnicze parków narodowych mają wpływ na ich unikalne doświadczenia, czy też obszary cenne przyrodniczo nie są dla nich ważne? Autorzy zastosowali mieszane metody: ilościowe (text mining, analiza korespondencji) i jakościowe (analiza treści). Dane do analizy stanowiły opinie użytkowników serwisu TripAdvisor. Analiza recenzji z TripAdvisora wskazała, że najważniejszymi doświadczeniami turystów uzyskanymi w badanych parkach narodowych było: docenianie przyrody i aktywność fizyczna. Pozostałe grupy doświadczeń odzwierciedlone w recenzjach to: estetyczne, kontaktów, napięcia i ekscytacji. Stwierdzono, że przyroda jest dla turystów najważniejszym walorem parków narodowych. Badania wskazały także na tendencję wśród turystów do dbania o zdrowie i chęć regeneracji sił fizycznych na terenach o wybitnych walorach przyrodniczych.
Źródło:
Ekonomia i Środowisko; 2023, 1; 341--359
0867-8898
Pojawia się w:
Ekonomia i Środowisko
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Text Spotting in the Wild with Embedded Device
Autorzy:
Zacniewski, Artur.
Powiązania:
Scientific Journal of Polish Naval Academy 2019, nr 2, s. 81-95
Współwytwórcy:
Bodnar, Tadeusz. Autor
Data publikacji:
2019
Tematy:
Sztuczna inteligencja
Lingwistyka komputerowa
Text mining
Zaburzenia widzenia
Niedowidzący
Pomoce techniczne dla niepełnosprawnych
Technologie asystujące
Postęp techniczny
Artykuł z czasopisma wojskowego
Artykuł z czasopisma naukowego
Opis:
Bibliografia, netografia na stronach 93-94.
Dostawca treści:
Bibliografia CBW
Artykuł
Tytuł:
Usefulness of mining methods in knowledge source analysis in the construction industry
Użyteczność metod miningowych w analizie źródeł wiedzy w budownictwie
Autorzy:
Gajzler, M.
Powiązania:
https://bibliotekanauki.pl/articles/231299.pdf
Data publikacji:
2016
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
przeszukiwanie zbioru danych
przeszukiwanie tekstu
wiedza
budownictwo
wspomaganie podejmowania decyzji
decyzja technologiczna
zagadnienie lokalizacji
data mining
text mining
knowledge
construction industry
decision-making support
technological decision
localization problem
Opis:
The mining methods are classified as the methods of data analysis and the knowledge acquisition and they are derived from the methods of "Knowledge Discovery". Within the scope of these methods, there are two main variants associated with a form of data, i.e.: "data" and "text mining". The author of the paper tries to find an answer to a question about helpfulness and usefulness of these methods for the purpose of knowledge acquisition in the construction industry. The very process of knowledge acquisition is essential in terms of the systems and tools operating based on knowledge. Nowadays, they are the basis for the tools which support the decision-making processes. The paper presents three cases studies. The mining methods have been applied to practical problems - the selection of an adhesive mortar coupled with alternative solutions, analysis of residential real estate locations under construction by a developer company as well as support of technical management of a building facility with a large floor area.
Metody miningowe są klasyfikowane jako metody akwizycji wiedzy wywodzące się z metod „knowledge discovery”. W zakresie tych metod występują odmiany: data oraz text mining. Artykuł staje przed próbą odpowiedzi na pytanie o ich użyteczność na potrzeby akwizycji wiedzy w budownictwie. Proces akwizycji wiedzy jest nieodzowny w aspekcie operowania systemami i narzędziami bazującymi na wiedzy. Stanowią one aktualnie podstawę narzędzi wspomagających podejmowanie decyzji. Sformułowane w oparciu o analizę przypadków wnioski wskazują na przydatność tych technik, jednocześnie definiując pewne ograniczenia związane z ich stosowaniem. Elementem wniosków są metody redukcji ograniczeń, m.in. poprzez stosowanie podejścia hybrydowego w procesie akwizycji wiedzy. Przydatność metod analizy miningowej scharakteryzowano na trzech zagadnieniach: pierwsze dotyczy wyboru materiału budowlanego – zaprawy klejowej o wysokich właściwościach technicznych, a także znalezienia materiału alternatywnego. Drugie z zagadnień dotyczy problematyki wyboru lokalizacji kolejnych inwestycji mieszkaniowych przez przedsiębiorstwo deweloperskie na podstawie danych wynikających z wcześniejszych doświadczeń – lokalizacji, realizacji i sprzedaży nieruchomości mieszkaniowych. Trzecie zagadnienie dotyczy pozyskiwania wiedzy o zdarzeniach incydentalnych obiektach magazynowych aspekcie zarządzania technicznego.
Źródło:
Archives of Civil Engineering; 2016, 62, 1; 127-142
1230-2945
Pojawia się w:
Archives of Civil Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
New algorithm for determining the number of features for the effective sentiment-classification of text documents
Nowy algorytm ustalania liczby zmiennych potrzebnych do klasyfikacji dokumentów tekstowych ze względu na ich wydźwięk emocjonalny
Autorzy:
Idczak, Adam
Korzeniewski, Jerzy
Powiązania:
https://bibliotekanauki.pl/articles/18105028.pdf
Data publikacji:
2023-05-31
Wydawca:
Główny Urząd Statystyczny
Tematy:
sentiment analysis
document sentiment classification
text mining
logistic regression
naive Bayes classifier
feature selection
correlation
analiza sentymentu
klasyfikacja dokumentów ze względu na wydźwięk emocjonalny
eksploracja tekstu
regresja logistyczna
naiwny klasyfikator Bayesa
dobór cech
korelacja
Opis:
Sentiment analysis of text documents is a very important part of contemporary text mining. The purpose of this article is to present a new technique of text sentiment analysis which can be used with any type of a document-sentiment-classification method. The proposed technique involves feature selection independently of a classifier, which reduces the size of the feature space. Its advantages include intuitiveness and computational noncomplexity. The most important element of the proposed technique is a novel algorithm for the determination of the number of features to be selected sufficient for the effective classification. The algorithm is based on the analysis of the correlation between single features and document labels. A statistical approach, featuring a naive Bayes classifier and logistic regression, was employed to verify the usefulness of the proposed technique. They were applied to three document sets composed of 1,169 opinions of bank clients, obtained in 2020 from a Poland-based bank. The documents were written in Polish. The research demonstrated that reducing the number of terms over 10-fold by means of the proposed algorithm in most cases improves the effectiveness of classification.
Analiza sentymentu, czyli wydźwięku emocjonalnego, dokumentów tekstowych stanowi bardzo ważną część współczesnej eksploracji tekstu (ang. text mining). Celem artykułu jest przedstawienie nowej techniki analizy sentymentu tekstu, która może znaleźć zastosowanie w dowolnej metodzie klasyfikacji dokumentów ze względu na ich wydźwięk emocjonalny. Proponowana technika polega na niezależnym od klasyfikatora doborze cech, co skutkuje zmniejszeniem rozmiaru ich przestrzeni. Zaletami tej propozycji są intuicyjność i prostota obliczeniowa. Zasadniczym elementem omawianej techniki jest nowatorski algorytm ustalania liczby terminów wystarczających do efektywnej klasyfikacji, który opiera się na analizie korelacji pomiędzy pojedynczymi cechami dokumentów a ich wydźwiękiem. W celu weryfikacji przydatności proponowanej techniki zastosowano podejście statystyczne. Wykorzystano dwie metody: naiwny klasyfikator Bayesa i regresję logistyczną. Za ich pomocą zbadano trzy zbiory dokumentów składające się z 1169 opinii klientów jednego z banków działających na terenie Polski uzyskanych w 2020 r. Dokumenty zostały napisane w języku polskim. Badanie pokazało, że kilkunastokrotne zmniejszenie liczby terminów przy zastosowaniu proponowanej techniki na ogół poprawia jakość klasyfikacji.
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2023, 68, 5; 40-57
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Personalized Knowledge Mining in Large Text Sets
Autorzy:
Chudzian, C.
Granat, J.
Klimasara, E.
Sobieszek, J.
Wierzbicki, A. P.
Powiązania:
https://bibliotekanauki.pl/articles/307901.pdf
Data publikacji:
2011
Wydawca:
Instytut Łączności - Państwowy Instytut Badawczy
Tematy:
human centered computing
knowledge engineering
ontological engineering
personalized ontology
Opis:
The paper starts with a discussion of the concept of knowledge engineering, in particular ontological engineering. Consequently, the paper presents assumptions accepted as a basis for a group research on a radically personalized system of ontological knowledge mining, relying on the perspective of human centered computing and combining ontological concepts of the user with an ontology resulting from an automatic classification of a given set of textual data. The paper presents a pilot system PrOnto that supports research work in two aspects: searching for information interesting for a user according to her/his personalized ontological profile, and supporting research cooperation in a group of users (Virtual Research Community) according, e.g., to a comparison of such personalized ontological profiles. The paper concludes with suggestions concerning diverse applications of ontological engineering tools and future work.
Źródło:
Journal of Telecommunications and Information Technology; 2011, 3; 123-130
1509-4553
1899-8852
Pojawia się w:
Journal of Telecommunications and Information Technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Digital innovation in journalism: An analysis of projects financed by Google’s Digital News Initiative Fund
Obraz innowacji cyfrowych w dziennikarstwie na podstawie projektów współfinansowanych przez Google Digital News Initiative
Autorzy:
Andrusiewicz, Piotr
Powiązania:
https://bibliotekanauki.pl/articles/2058247.pdf
Data publikacji:
2021
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
media innovation
digital journalism
new technology text
Google
Digital News Initiative Fund
innowacje w mediach
prasa tradycyjna
dziennikarstwo cyfrowe
badanie nowych technologii
rozwój dziennikarstwa
innowacje w zakresie wiadomości cyfrowych
text mining
Nauki Humanistyczne i Społeczne
Opis:
In 2016–2018 Google ran a special fund to support innovation in European journalism. This article is based on the analysis of over 600 descriptions of successful projects from the Google Digital News Initiative website. The aim of the survey was to get the picture of the digital innovations implemented in the framework of competing projects and to find out whether the language of the descriptions reveals how the participants define their vision of digital innovations in journalism.
W latach 2016–2018 Google poprzez specjalny fundusz wspierał finansowo dziennikarstwo europejskie w realizacji projektów innowacyjnych. Przedmiotem artykułu jest analiza ponad 600 opublikowanych na stronach internetowych Google Digital News Initiative opisów projektów, które uzyskały finansowanie. Badanie miało na celu uchwycenie ogólnego obrazu innowacji cyfrowych wdrażanych w ramach konkurujących projektów oraz ustalenie, czy język opisów ujawnia, jak podmioty uczestniczące w programie definiują swoją wizję innowacji cyfrowych w dziennikarstwie.
Źródło:
Rocznik Historii Prasy Polskiej; 2021, 24, 2; 95-118
1509-1074
Pojawia się w:
Rocznik Historii Prasy Polskiej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Crowdsourcing in rescue fire service - proposed application
Autorzy:
Mirończuk, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/41204253.pdf
Data publikacji:
2011
Wydawca:
Uniwersytet Kazimierza Wielkiego w Bydgoszczy
Tematy:
crowdsourcing
design of information system
information system
text data mining
exploratory analysis of text data
text analyzing
Opis:
This article describes the author's proposal to apply crowdsourcing in Polish rescue fire service. This article also describes basic principles for implementing an crowdsourcing information platform in rescue fire service as well as the scheme of its implementation. The Author of this paper also describes the genesis of this proposal related to the evaluation of research conducted by the author on text mining analysis and extraction of information in the design of information systems.
Źródło:
Studia i Materiały Informatyki Stosowanej; 2011, 5; 15-20
1689-6300
Pojawia się w:
Studia i Materiały Informatyki Stosowanej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza sentymentu – metoda analizy danych jakościowych. Przykład zastosowania oraz ewaluacja słownika RID i metody klasyfikacji Bayesa w analizie danych jakościowych
Sentiment analysis. An example of application and evaluation of RID dictionary and Bayesian classification methods in qualitative data analysis approach
Autorzy:
Tomanek, Krzysztof
Powiązania:
https://bibliotekanauki.pl/articles/622902.pdf
Data publikacji:
2014
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
analiza danych jakościowych
analiza sentymentu
analiza treści
text mining
kodowanie tekstów
przetwarzanie języka naturalnego słownik RID
naiwny klasyfikator Bayesa
CAQDAS
qualitative data analysis
sentiment analysis
content analysis
coding techniques
natural language processing
RID dictionary
naive Bayes
Opis:
Celem artykułu jest prezentacja podstawowych metod klasyfikacji jakościowych danych tekstowych. Metody te korzystają z osiągnięć wypracowanych w takich obszarach, jak przetwarzanie języka naturalnego i analiza danych nieustrukturalizowanych. Przedstawiam i porównuję dwie techniki analityczne stosowane wobec danych tekstowych. Pierwsza to analiza z zastosowaniem słownika tematycznego. Druga technika oparta jest na idei klasyfikacji Bayesa i opiera się na rozwiązaniu zwanym naiwnym klasyfikatorem Bayesa. Porównuję efektywność dwóch wspomnianych technik analitycznych w ramach analizy sentymentu. Akcentuję rozwiązania mające na celu zbudowanie trafnego, w kontekście klasyfikacji tekstów, słownika. Porównuję skuteczność tak zwanych analiz nadzorowanych do skuteczności analiz zautomatyzowanych. Wyniki, które prezentuję, wzmacniają wniosek, którego treść brzmi: słownik, który w przeszłości uzyskał dobrą ocenę jako narzędzie klasyfikacyjne, gdy stosowany jest wobec nowego materiału empirycznego, powinien przejść fazę ewaluacji. Jest to, w proponowanym przeze mnie podejściu, podstawowy proces adaptacji słownika analitycznego, traktowanego jako narzędzie klasyfikacji tekstów.
The purpose of this article is to present the basic methods for classifying text data. These methods make use of achievements earned in areas such as: natural language processing, the analysis of unstructured data. I introduce and compare two analytical techniques applied to text data. The first analysis makes use of thematic vocabulary tool (sentiment analysis). The second technique uses the idea of Bayesian classification and applies, so-called, naive Bayes algorithm. My comparison goes towards grading the efficiency of use of these two analytical techniques. I emphasize solutions that are to be used to build dictionary accurate for the task of text classification. Then, I compare supervised classification to automated unsupervised analysis’ effectiveness. These results reinforce the conclusion that a dictionary which has received good evaluation as a tool for classification should be subjected to review and modification procedures if is to be applied to new empirical material. Adaptation procedures used for analytical dictionary become, in my proposed approach, the basic step in the methodology of textual data analysis.
Źródło:
Przegląd Socjologii Jakościowej; 2014, 10, 2; 118-136
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Using frequent pattern mining algorithms in text analysis
Autorzy:
Ożdżyński, P.
Zakrzewska, D.
Powiązania:
https://bibliotekanauki.pl/articles/95011.pdf
Data publikacji:
2017
Wydawca:
Szkoła Główna Gospodarstwa Wiejskiego w Warszawie. Wydawnictwo Szkoły Głównej Gospodarstwa Wiejskiego w Warszawie
Tematy:
GSP
SuffixArray
PrefixSpan
N-Gram
frequent sequences
Opis:
In text mining, effectiveness of methods depends on document representations. The ones based on frequent word sequences are used in such tasks as categorization, clustering and topic modelling. In the paper a comparison of different algorithms for finding frequent word sequences is presented. There are considered techniques dedicated for market basket analysis such as GSP and PrefixSpan as well as a method based on a suffix array. The investigated techniques are compared with the new approach of searching maximum frequent word sequences in document sets. Performance of the algorithms is examined taking into account execution times for the considered test collections.
Źródło:
Information Systems in Management; 2017, 6, 3; 213-222
2084-5537
2544-1728
Pojawia się w:
Information Systems in Management
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Propozycja mieszanego przetwarzania półstrukturalnego modelu opisu zdarzeń z akcji ratowniczo-gaśniczych Państwowej Straży Pożarnej PSP3
Proposition of hybrid process model semi structured description of event from fire services rescues operation
Autorzy:
Mirończuk, M.
Maciak, T.
Powiązania:
https://bibliotekanauki.pl/articles/373949.pdf
Data publikacji:
2013
Wydawca:
Centrum Naukowo-Badawcze Ochrony Przeciwpożarowej im. Józefa Tuliszkowskiego
Tematy:
eksploracja tekstu
klasyfikator Bayesa
naiwny klasyfikator Bayesa
ontologia służb ratowniczych
reprezentacja meldunków
reprezentacja przypadków zdarzeń
reprezentacja tekstu
wnioskowanie na podstawie przypadków
Bayes classifier
casebased reasoning
naive Bayes classifier
ontology for rescue service
representation of reports
text mining
text representation
Opis:
W opracowaniu przedstawiono aktualnie rozwijane reprezentacje wiedzy i sposoby opisów zdarzeń, dla systemu wnioskowania na podstawie przypadków zdarzeń służb ratowniczych Państwowej Straży Pożarnej PSP. W artykule zaproponowano sposób ich przetwarzania. Przedstawiony sposób bazuje na klasyfikacji i wyszukiwaniu opisów zdarzeń.
This paper describes a review of actual developed knowledge representation and case representation for fire services cases based reasoning system. The article also describes a method of processing the cases of events. This processing method based on classification and information retrieval.
Źródło:
Bezpieczeństwo i Technika Pożarnicza; 2013, 1; 95-106
1895-8443
Pojawia się w:
Bezpieczeństwo i Technika Pożarnicza
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Dozwolony użytek w zakresie eksploracji tekstów i danych w świetle Dyrektywy Parlamentu Europejskiego i Rady (UE) 2019/790
Autorzy:
Bagieńska-Masiota, Aleksandra
Powiązania:
https://bibliotekanauki.pl/articles/2056883.pdf
Data publikacji:
2022-06-09
Wydawca:
Uniwersytet Pedagogiczny im. Komisji Edukacji Narodowej w Krakowie
Tematy:
dozwolony użytek
eksploracja tekstów i danych
Text and Data Mining
Dyrektywa DSM
fair use
DSM Directive
Opis:
W artykule przeprowadzono analizę prawodawstwa europejskiego w zakresie eksploracji tekstów i danych na podstawie Dyrektywy Parlamentu Europejskiego i Rady (UE) 2019/790 w sprawie praw autorskich i pokrewnych na jednolitym rynku cyfrowym (Dyrektywa DSM). Przedmiotowa Dyrektywa wprowadziła dwa obligatoryjne wyjątki od istniejących na gruncie prawa europejskiego praw wyłącznych, na potrzeby eksploracji tekstów i danych (art. 3 i 4). Ponadto artykuł odpowiada na pytanie, czy i w jakim stopniu przepisy polskiego prawa autorskiego wymagają zmian dostosowawczych do porządku europejskiego w przedmiotowym zakresie.
The paper analyzes European legislation on text and data mining, based on Directive 2019/790 of the European Parliament and of the Council on Copyright and related rights in the Digital Single Market (DSM Directive). The Directive has introduced two mandatory exceptions to existing exclusive rights under European law for the purpose of text and data mining (Articles 3 and 4). Moreover, the article answers the question whether and to what extent the provisions of Polish copyright law require adjustment to the European order in this respect.
Źródło:
Annales Universitatis Paedagogicae Cracoviensis. Studia de Cultura; 2022, 14, 1; 118-128
2083-7275
Pojawia się w:
Annales Universitatis Paedagogicae Cracoviensis. Studia de Cultura
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Trenowanie wybranych modeli sztucznej inteligencji a uprawnienia twórców
Authors’ Rights in the Context of Selected Models for AI Training
Autorzy:
Bałos, Iga
Powiązania:
https://bibliotekanauki.pl/articles/476749.pdf
Data publikacji:
2019
Wydawca:
Krakowska Akademia im. Andrzeja Frycza Modrzewskiego
Tematy:
AI generated works
copyright; AI
text and data mining
eksploracja tekstów i danych
prawo autorskie
SI
sztuczna twórczość
Opis:
Artificial Intelligence (AI) is no longer about automatization of routine or repetitive tasks. Its application extends far beyond plain computational power and efficiency. “AI-generated works” is one of the most popular research areas in this filed. It raises the question about intelligent systems singularity and their true capability to perform human-like tasks. This article examines selected models for AI training which generate works mimicking the unique style of given artists provided their works serve as input data. Certain authors, perhaps especially writers, are reluctant to accept such forms of the exploitation of their works. Even though classification of AI-generated works is a challenge, significant legal issues arise at the earlier stage. Does text and data mining (TDM) infringe the copyright monopoly? Is using a collection of works of a single author as training data affects the lawfulness of a process? Are authors entitled, on the basis of their economic or moral rights, to oppose such practices?
Sztuczna inteligencja (SI) przestała być wykorzystywana jedynie w celu automatyzacji powtarzalnych czynności lub przeprowadzania zadań wymagających skrupulatności obliczeniowej. Szczególną ciekawość budzi funkcjonowanie SI prowadzące do uzyskania efektów, które dotąd były osiągalne jedynie dla człowieka. Wśród nich można wyróżnić m.in. wytwory posiadające cechy utworu. Artykuł odnosi się do szczególnego rodzaju trenowania SI, odbywającego się wyłącznie na podstawie utworów jednego twórcy, ze szczególnym uwzględnieniem procesów prowadzących do powstania wytworu „w stylu” danego twórcy. Niektórzy autorzy, zwłaszcza pisarze, nieprzychylnie odnoszą się do tego typu praktyk. Wątpliwości natury prawnej powstają już na etapie trenowania modelu SI. Czy eksploracja tekstów i danych (TDM) stanowi wkroczenie w monopol prawno-autorski? Czy trenowanie SI twórczością wyłącznie jednego twórcy wpływa na legalność procesu? Czy powołując się na autorskie prawa majątkowe lub osobiste, można zakazać wykorzystywania swojej twórczości do trenowania SI?
Źródło:
Studia Prawnicze: rozprawy i materiały; 2019, 2 (25); 15-28
1689-8052
2451-0807
Pojawia się w:
Studia Prawnicze: rozprawy i materiały
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Domain specific key feature extraction using knowledge graph mining
Autorzy:
Barai, Mohit Kumar
Sanyal, Subhasis
Powiązania:
https://bibliotekanauki.pl/articles/2027771.pdf
Data publikacji:
2020
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Feature extraction
Knowledge graph
Natural language processing
Product review
Text processing
Opis:
In the field of text mining, many novel feature extraction approaches have been propounded. The following research paper is based on a novel feature extraction algorithm. In this paper, to formulate this approach, a weighted graph mining has been used to ensure the effectiveness of the feature extraction and computational efficiency; only the most effective graphs representing the maximum number of triangles based on a predefined relational criterion have been considered. The proposed novel technique is an amalgamation of the relation between words surrounding an aspect of the product and the lexicon-based connection among those words, which creates a relational triangle. A maximum number of a triangle covering an element has been accounted as a prime feature. The proposed algorithm performs more than three times better than TF-IDF within a limited set of data in analysis based on domain-specific data.
Źródło:
Multiple Criteria Decision Making; 2020, 15; 1-22
2084-1531
Pojawia się w:
Multiple Criteria Decision Making
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Review of Artificial Intelligence Algorithms in Document Classification
Autorzy:
Bilski, A.
Powiązania:
https://bibliotekanauki.pl/articles/226245.pdf
Data publikacji:
2011
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
classifier
text classification
data mining
information retrieval
machine learning algorithms
Opis:
With the evolution of Internet, the meaning and accessibility of text documents and electronic information has increased. The automatic text categorization methods became essential in the information organization and data mining process. A proper classification of e-documents, various Internet information, blogs, emails and digital libraries requires application of data mining and machine learning algorithms to retrieve the desired data. The following paper describes the most important techniques and methodologies used for the text classification. Advantages and effectiveness of contemporary algorithms are compared and their most notable applications presented.
Źródło:
International Journal of Electronics and Telecommunications; 2011, 57, 3; 263-270
2300-1933
Pojawia się w:
International Journal of Electronics and Telecommunications
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Adapting a constituency parser to user-generated content in polish opinion mining
Autorzy:
Pluwak, A.
Korczynski, W.
Kisiel-Dorohinicki, M.
Powiązania:
https://bibliotekanauki.pl/articles/305485.pdf
Data publikacji:
2016
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
user generated content
text normalization
parsing
sentiment analysis
Opis:
The paper focuses on the adjustment of NLP tools for Polish; e.g., morphological analyzers and parsers, to user-generated content (UGC). The authors discuss two rule-based techniques applied to improve their efficiency: pre-processing (text normalization) and parser adaptation (modified segmentation and parsing rules). A new solution to handle OOVs based on inflectional translation is also offered.
Źródło:
Computer Science; 2016, 17 (1); 23-44
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
„Śmieci na wejściu, śmieci na wyjściu”. Wpływ jakości koderów na działanie sieci neuronowej klasyfikującej wypowiedzi w mediach społecznościowych
„Garbage in, Garbage out”. The Impact of Coders’ Quality on the Neural Network Classifying Text on Social Media
Autorzy:
Matuszewski, Paweł
Powiązania:
https://bibliotekanauki.pl/articles/2131910.pdf
Data publikacji:
2022
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
sieci neuronowe
klasyfikacja danych tekstowych
modele nadzorowane
opinion mining
jakość koderów
text classification
neural networks
supervised models
quality of coders
Opis:
Jedna z głównych decyzji przy ręcznym kodowaniu danych tekstowych dotyczy tego, czy kodowanie ma być weryfikowane. W przypadku modeli nadzorowanych prowadzi to do istotnego dylematu: czy lepszym rozwiązaniem jest dostarczenie modelowi dużej liczby przypadków, na których będzie się uczyć kosztem weryfikacji poprawności danych, czy też zakodowanie każdego przypadku n-razy, co pozwoli porównać kody i sprawdzić ich poprawność, ale jednocześnie n-krotnie zmniejszy zbiór danych treningowych. Taka decyzja może zaważyć nie tylko na ostatecznych wynikach klasyfikatora. Z punktu widzenia badaczy jest istotna również dlatego, że – realistycznie zakładając, że badania mają ograniczone źródło finansowania – nie można jej cofnąć. Wykorzystując 100 tys. unikatowych i ręcznie zakodowanych tweetów przeprowadzono symulacje wyników klasyfikatora w zależności od kontrolowanego odsetka błędnie zakodowanych dokumentów. Na podstawie danych przedstawiono rekomendacje.
One of the critical decisions when manually coding text data is whether to verify the coders’ work. In the case of supervised models, this leads to a significant dilemma: is it better to provide the model with a large number of cases on which it will learn at the expense of verifying the correctness of the data, or whether it is better to code each case n-times, which will allow to compare the codes and check their correctness but at the same time will reduce the training dataset by n-fold. Such a decision not only affect the final results of the classifier. From the researchers’ point of view, it is also crucial because, realistically assuming that research has limited funding, it cannot be undone. The study uses a simulation approach and provides conclusions and recommendations based on 100,000 unique and hand-coded tweets.
Źródło:
Studia Socjologiczne; 2022, 2; 137-164
0039-3371
Pojawia się w:
Studia Socjologiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-79 z 79

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies