Wszystkie pola: text mining - Katalog OPAC zbiorów

Skocz do pozycji: 1.

Tytuł:: Metodyka dla analizy treści w projektach stosujących techniki text mining i rozwiązania CAQDAS piątej generacji
Autorzy:: Tomanek, Krzysztof
Powiązania:: https://bibliotekanauki.pl/articles/2033749.pdf
Data publikacji:: 2017
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: analiza treści
Mixed Methods
Big Data
techniki text mining
CAQDAS
Content Analysis
Mixed Methods Approach
Text Mining
Opis:: Projekty, w których przychodzi nam pracować z dużymi wolumenami danych tekstowych, pochodzących z rożnych źródeł i zapisanych w różnorodnych formatach, rodzą wiele dylematów natury metodologicznej, wymagają często niestandardowych decyzji i rozwiązań. W szczególności zadanie polegające na opracowaniu danych o różnorodnej jakości, nieustrukturyzowanych typu quan i qual wymagać może pracy, w której dynamicznie zmieniają się strategie analizy danych, sposoby przekształcania danych tekstowych. Artykuł opisuje przykład takiej właśnie „dynamicznej” metodyki. Wykazała ona swoją wartość w zadaniu polegającym na klasyfikacji wypowiedzi pisanych. W tak zarysowanym kontekście autor artykułu mierzy się z następującymi celami: (a) czy można zastosować oprogramowanie klasy CAQDAS do pracy półautomatycznej lub automatycznej zastępującej część manualnej pracy nad klasyfikacją wypowiedzi? (b) jak skonstruować metodykę klasyfikacji dla danych o różnorodnej jakości? (c) kiedy klasyfikacja automatyczna jest przydatna, a kiedy nie ma szans powodzenia? W artykule zaznaczone zostaną momenty, w których analityk sięga po wiedzę typową dla analiz danych jakościowych oraz te, kiedy wiedza z tego obszaru nie jest już wystarczająca do realizacji wskazanych celów (natural language processing, uczenie maszynowe). Przykład projektu będący tłem artykułu wymusił zastosowanie kilku narzędzi i języków wspierających pracę na danych. Praca nad transformacją, klasyfikacją oraz wizualizacją wyników wymagała zastosowania bazy MySQL oraz programów: R, QDA Miner, Wordstat, QlikSense. Roli i ograniczeniom narzędzi klasy CAQDAS poświęconych zostało także kilka uwag.
Projects which we work with—large volumes of text data that are acquired from various sources and stored in a variety of formats—rise many dilemmas of a methodological nature, often require unstandardized decisions and solutions. In particular, compiling data of various quality, unstructured types, and of quan and qual nature requires dynamic strategies, ideas, and ways of analysis. The article describes an example of this approach. It shows its value in classification of written statements. In such context, the author of the article faces the following objectives: (a) can we use CAQDASso that semiautomatic or automatic work would replace some manual work regarding classification of the expressions; (b) how to construct a classification methodology for data of various quality; (c) when the automatic classification is useful and when there is no chance of success? The article will be marked with moments in which the analyst reaches for knowledge typical for qualitative data analysis, and when the knowledge of this area is no longer sufficient to classify content (natural language processing, machine learning). An example of a project being the background of this article forced the use of several tools and languages to support work with the data. Work on the transformation, classification, and visualization of results required applications such as: MySQL, R, QDA Miner, WordStat, Qlik Sense. Role and limits of the computer-assisted qualitative data analysis software tools have also been noted.
Źródło:: Przegląd Socjologii Jakościowej; 2017, 13, 2; 128-143
1733-8069
Pojawia się w:: Przegląd Socjologii Jakościowej
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 2.

Tytuł:: Identifing the destination image and its attributes: The case of Central and Eastern European cities
Identyfikacja atrybutów wizerunku wybranych miast Europy Środkowo-Wschodniej
Autorzy:: Nowacki, Marek
Niezgoda, Agnieszka
Powiązania:: https://bibliotekanauki.pl/articles/583187.pdf
Data publikacji:: 2019
Wydawca:: Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:: TripAdvisor
text mining
attributes
image
cities
Text Mining
atrybuty
wizerunek, miasta
Opis:: The aim of the work is to identify the unique attributes of Central and Eastern European cities in the reviews posted on TripAdvisor. These attributes can determine the competitive advantage on the tourism market. The research data were downloaded from the English-language TripAdvisor website [https://www.tripadvisor.co.uk]. The reviews concerning tourist centres of selected cities (“Things to do…” category) were collected. These concerned the areas where tourism is concentrated in the cities: historic centres, old towns or old market squares. The most popular tourism cities in Central and Eastern Europe were selected: Poznan, Wroclaw, Cracow, Warsaw, Prague, Bratislava and Vienna. A total of 28,794 reviews were downloaded. The most common words appearing in the reviews were counted using the text mining procedure. The analysis of frequency revealed 76 unique words. Then the correspondence analysis was performed. Among the examined cities, Bratislava has the largest number of unique attributes (words), and Prague the least. The similarities in terms of image attributes occur in Poznan, Wroclaw and Prague, and in the second group – Warsaw and Bratislava. Vienna and Krakow do not show any similarities towards the other cities.
Celem pracy jest zidentyfikowanie unikatowych atrybutów wybranych miast Europy Środkowo-Wschodniej obecnych w opiniach zamieszczonych na portalu TripAdvisor [https://www.tripadvisor.co.uk]. Pobrano opinie dotyczące centrów turystycznych wybranych miast (kategoria Things to do…) – obszarów, w których koncentruje się ruch turystyczny w miastach: w zabytkowym centrum, na starym mieście, na starym rynku. Do badań wybrano najpopularniejsze pod względem turystycznym miasta Europy Środkowo-Wschodniej: Poznań, Wrocław, Kraków, Warszawę oraz Pragę, Bratysławę i Wiedeń. Łącznie pobrano 28 794 opinie. Procedurą Text Mining zliczono najczęstsze wyrazy pojawiające się w opiniach. Analiza wariancji ujawniła 76 unikatowych słów, które poddano analizie korespondencji. Wśród badanych miast najwięcej unikatowych słów-atrybutów ma Bratysława, najmniej zaś Praga. Zbliżone do siebie pod względem atrybutów wizerunku są: Poznań, Wrocław i Praga, a w drugiej grupie – Warszawa i Bratysława. Wiedeń i Kraków nie wykazują podobieństwa z pozostałymi miastami.
Źródło:: Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu; 2019, 63, 8; 118-127
1899-3192
Pojawia się w:: Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 3.

Tytuł:: Charakterystyczne elementy marek polskich miast w recenzjach dostępnych online
Autorzy:: Nowacki, Marek
Powiązania:: https://bibliotekanauki.pl/articles/627294.pdf
Data publikacji:: 2019
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: kapitał marki
destynacje
TripAdvisor
Text Mining
Opis:: Celem pracy jest zidentyfikowanie charakterystycznych elementów marek polskich miast oraz wskazanie podobieństw i różnic występujących pomiędzy nimi. Praca ma dać odpowiedź na następujące pytania badawcze: Które elementy w istotny sposób wpływają na odróżnianie marek badanych miast w recenzjach dostępnych online? Które z badanych miast są do siebie najbardziej zbliżone pod względem elementów marki, a które różnią się pod tym względem? Dane do analizy pobrano z serwisu TripAdvisor. Były to opinie dotyczące rejonów koncentracji ruchu turystycznego – starych rynków lub starych miast – pięciu polskich miast: Poznania, Wrocławia, Krakowa, Gdańska i Warszawy (N = 5125). Przeprowadzone analizy pozwoliły zidentyfikować unikatowe elementy marek badanych miast i wskazać podobieństwa oraz różnice występujące pomiędzy markami.
Źródło:: Turyzm; 2019, 29, 1; 69-76
0867-5856
2080-6922
Pojawia się w:: Turyzm
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 4.

Tytuł:: Unique elements of Polish city brands in online reviews
Autorzy:: Nowacki, Marek
Powiązania:: https://bibliotekanauki.pl/articles/627580.pdf
Data publikacji:: 2019
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: brand equity
destinations
cities
TripAdvisor
Text Mining
Opis:: The aim of the paper is to identify unique elements of the brands of Polish cities and to identify similarities and differences between them. The work attempts to answer the following research questions: Which elements significantly differentiate the brands of studied cities in online reviews? and Which of the studied cities are the most similar in terms of brand elements and which differ in this regard. The data for analysis was obtained from TripAdvisor. Reviews about areas of tourist concentration – old markets or old towns – from five Polish cities: Poznań, Wrocław, Kraków, Gdańsk and Warsaw were analysed (N = 5125). The research shows that Gdańsk and Warsaw as well as Poznań and Wrocław have the most similar brand elements. The Kraków brand is the more unique in relation to other cities.
Źródło:: Turyzm; 2019, 29, 1; 63-70
0867-5856
2080-6922
Pojawia się w:: Turyzm
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 5.

Tytuł:: „Hańba w Sejmie” – zastosowanie modeli generatywnych do analizy debat parlamentarnych
Autorzy:: Kwiatkowska, Agnieszka
Powiązania:: https://bibliotekanauki.pl/articles/2033754.pdf
Data publikacji:: 2017
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: Polska
debaty parlamentarne
elity polityczne
ilościowa analiza treści
text mining
Polska
Parliamentary Debates
Political Elites
Quantitative Content Analysis
Text Mining
Opis:: W ciągu ostatniego dziesięciolecia nastąpił wyraźny wzrost obecności skrajnej retoryki politycznej w debacie parlamentarnej w Polsce. Jednym z aspektów postępującej radykalizacji języka jest nadużywanie słów o wysokim negatywnym natężeniu emocjonalnym w celu opisania zdarzeń występujących w codziennej polityce, co prowadzi do degradacji ich znaczenia. Jak wskazują badania, brutalizacja języka debaty wywołuje negatywne konsekwencje na poziomie elit politycznych i elektoratu, prowadząc do zmniejszonej efektywności działania parlamentu, zaostrzenia konfliktów między partiami i ich zwolennikami oraz do alienacji politycznej obywateli. W artykule przedstawiam możliwości wykorzystania stenogramów parlamentarnych do analizy przemian dyskursu politycznego, w tym wykorzystane algorytmy przeszukiwania korpusów tekstów oraz analizy ukrytych tematów. Jako przykład wykorzystuję zbiór przemówień sejmowych z lat 1991‒2016 odnoszących się do idei hańby, zdrady, niesławy i skandalu. Opieram się głównie na generatywnym modelu tematycznym, wykorzystującym metodę ukrytej alokacji Dirichleta i jej rozszerzeniu – strukturalny model tematyczny, będących nienadzorowanymi metodami ekstrakcji tematów z dużych korpusów tekstów. Wyniki przeprowadzonych analiz potwierdzają wzrost radykalnego słownictwa w czasie, a także określają charakterystyki jego użytkowników oraz najczęściej występujące konteksty (polityka historyczna, kontrola nad mediami, polityka zagraniczna).
Over the last decade there has been a clear increase in extreme political rhetoric in the parliamentary debate in Poland. One aspect of the progressive radicalization of the language is overuse of words having a high negative emotional intensity to describe events in everyday politics, which leads to the degradation of their importance. As research shows, brutalization of the language of the debate has negative consequences at the levels of the political elite and the electorate, leading to reduced efficiency of the parliament, the exacerbation of conflicts between parties and among their supporters, and the political alienation of citizens. In this article, I present the possibilities of using the transcripts of parliamentary discourse to analyze the changes of the political discourse, including the algorithms used for searching text corpora and analysis of the latent topics. As an example, I use a set of parliamentary speeches from the years 1991-2016 related to the idea of shame, betrayal, disgrace and scandal. I base my analyses on generative topic modeling employing on the method of latent Dirichlet allocation and its extension—Structural Topic Model, both being unsupervised methods of extracting topics from large text corpora. The results of the analysis confirm the increase in usage of radical vocabulary in time, and also describe the characteristics of its users and the most common contexts the extreme vocabulary tend to appear (identity politics, control over the media, foreign policy).
Źródło:: Przegląd Socjologii Jakościowej; 2017, 13, 2; 82-109
1733-8069
Pojawia się w:: Przegląd Socjologii Jakościowej
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 6.

Tytuł:: W stronę ontologii pola badań jakościowych
Towards an Ontology of Qualitative Research Practices
Autorzy:: Bryda, Grzegorz
Martini, Natalia
Powiązania:: https://bibliotekanauki.pl/articles/623172.pdf
Data publikacji:: 2016-11-30
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: ontologia dziedzinowa
metoda słownikowa
odkrywanie wiedzy
analiza treści
Text Mining
domain ontology
dictionary-based approach
knowledge discovery
content analysis
text mining
Opis:: Celem artykułu jest zapoznanie polskiego środowiska badaczy jakościowych z ideą opracowania ontologii dziedzinowej współczesnego pola badań jakościowych. Opisywane w artykule przedsięwzięcie, oparte na wielowymiarowej analizie zawartości międzynarodowych czasopism metodologicznych, zmierza ku uporządkowaniu aktualnej wiedzy w obszarze teorii i metodologii badań jakościowych z intencją ułatwienia orientacji w rozległym i zróżnicowanym polu jakościowych praktyk badawczych. Artykuł opisuje przebieg oraz wstępne wyniki pilotażowego projektu badawczego stosującego metodę słownikową do odkrywania i systematyzowania wiedzy na temat metodologii badań jakościowych na podstawie licznych, bieżących sprawozdań i refleksji operujących w tym polu badaczy.
The aim of the article is to introduce the Polish community of qualitative researchers to a new perspective in the study of qualitative research practices. The idea is to develop an ontology of contemporary qualitative research. Drawing on experiences from our research project, the article discusses the idea of systematizing the present state of art in the field of theory and methodology of qualitative research. Our study focuses on a new methodology of multidimensional content analysis of three international academic journals. The article describes the preliminary results of a pilot study which employs a dictionary-based approach as a method of knowledge discovery in textual databases and its systematization. Our goal is to provide insight in the vast and diverse approaches in the field of qualitative research practices.
Źródło:: Przegląd Socjologii Jakościowej; 2016, 12, 4; 24-40
1733-8069
Pojawia się w:: Przegląd Socjologii Jakościowej
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 7.

Tytuł:: Unsupervised dynamic topic model for extracting adverse drug reaction from health forums
Autorzy:: Eslami, Behnaz
Motlagh, Mehdi Habibzadeh
Rezaei, Zahra
Eslami, Mohammad
Amini, Mohammad Amin
Powiązania:: https://bibliotekanauki.pl/articles/117691.pdf
Data publikacji:: 2020
Wydawca:: Polskie Towarzystwo Promocji Wiedzy
Tematy:: Deep Learning
topic modeling
Text Mining
ADR
NMF
analiza tekstu
uczenie maszynowe
modelowanie tematyczne
Opis:: The relationship between drug and its side effects has been outlined in two websites: Sider and WebMD. The aim of this study was to find the association between drug and its side effects. We compared the reports of typical users of a web site called: “Ask a patient” website with reported drug side effects in reference sites such as Sider and WebMD. In addition, the typical users’ comments on highly-commented drugs (Neurotic drugs, Anti-Pregnancy drugs and Gastrointestinal drugs) were analyzed, using deep learning method. To this end, typical users’ comments on drugs' side effects, during last decades, were collected from the website “Ask a patient”. Then, the data on drugs were classified based on deep learning model (HAN) and the drugs’ side effect. And the main topics of side effects for each group of drugs were identified and reported, through Sider and WebMD websites. Our model demonstrates its ability to accurately describe and label side effects in a temporal text corpus by a deep learning classifier which is shown to be an effective method to precisely discover the association between drugs and their side effects. Moreover, this model has the capability to immediately locate information in reference sites to recognize the side effect of new drugs, applicable for drug companies. This study suggests that the sensitivity of internet users and the diverse scientific findings are for the benefit of distinct detection of adverse effects of drugs, and deep learning would facilitate it.
Źródło:: Applied Computer Science; 2020, 16, 1; 41-59
1895-3735
Pojawia się w:: Applied Computer Science
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 8.

Tytuł:: Whats and Hows? The Practice-Based Typology of Narrative Analyses
Co i jak? Typologia analiz narracyjnych oparta na praktykach badawczych
Autorzy:: Bryda, Grzegorz
Powiązania:: https://bibliotekanauki.pl/articles/1371561.pdf
Data publikacji:: 2020-08-31
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: analiza narracyjna
CAQDAS
analiza treści
Text Mining
kodowanie słownikowe
modelowanie tematyczne
Narrative Analysis
Content Analysis
dictionary-based coding
topic modeling
Opis:: The nature of qualitative research practices is multiparadigmaticity which creates coexistence of different research and analytical approaches to the study of human experience in the living world. This diversity is particularly observed in the contemporary field of narrative research and data analysis. The purpose of this article is a methodological reflection on the process of developing typology and a proposition of new data-driven and practice-based typology of narrative analyses used by qualitative researchers in the lived experience research. I merge the CAQDAS, Corpus Linguistics, and Text Mining procedures to examine the analytical strategies inherited in a vivid language of English-language research articles, published in five influential qualitative methodological journals between 2002-2016. Using the dictionary-based content analysis in the coding process, hierarchical clustering, and topic modeling – a text-mining tool for discovering hidden semantic structures in a textual body – I confront Catherine Kohler Riessman’s heuristic typology with the data-driven approach in order to contribute the more coherent image of narrative analysis in the contemporary field of qualitative research. Finally, I propose a new model of thinking about the typology of narrative analyses based upon research practices.
Istotą jakościowych praktyk badawczych jest wieloparadygmatyczność, która rodzi współistnienie różnych podejść metodologicznych w analizie i badaniu ludzkich doświadczeń w świecie życia codziennego. Różnorodność ta jest szczególnie widoczna w dziedzinie badań i analizy danych narracyjnych. Celem artykułu jest refleksja metodologiczna nad tworzeniem typologii analiz narracyjnych i zarazem propozycja nowego sposobu typologizacji podejść analitycznych, opartego na łączeniu lingwistyki korpusowej i przetwarzania języka naturalnego z procedurami CAQDAS, analizy treści i Text Mining. Typologia ta jest oparta na analizie narracyjnych praktyk badawczych odzwierciedlonych w języku anglojęzycznych artykułów opublikowanych w pięciu uznanych na świecie jakościowych czasopismach metodologicznych w latach 2002–2016. W artykule wykorzystuję metodę słownikową w procesie kodowania artykułów, hierarchiczne grupowanie i modelowanie tematyczne w celu odkrywania w tych publikacjach różnych typów analiz narracyjnych i badania relacji semantycznych między nimi. Jednocześnie konfrontuję heurystyczną typologię Riessmana z podejściem opartym na lingwistyce i eksploracji danych w celu rozwijania spójnego obrazu metodologii analizy narracyjnej we współczesnej dziedzinie badań jakościowych. Ostatecznie przedstawiam nowy model myślenia o analizie narracyjnej.
Źródło:: Przegląd Socjologii Jakościowej; 2020, 16, 3; 120-142
1733-8069
Pojawia się w:: Przegląd Socjologii Jakościowej
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Informacja

Wyszukujesz frazę "text mining" wg kryterium: Wszystkie pola

Źródło danych

Dostawca treści

Kolekcja

Rok wydania

Wydawca

Temat

Autor

Typ dokumentu

Język