Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Content analysis" wg kryterium: Temat


Wyświetlanie 1-9 z 9
Tytuł:
Szanse i słabości wykorzystania crowdsourcingu do analizy treści
The Advantages and Limitations of Using Crowdsourcing for Content Analysis
Autorzy:
Lisek, Katarzyna
Powiązania:
https://bibliotekanauki.pl/articles/1371783.pdf
Data publikacji:
2019-11-30
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
crowdsourcing
analiza treści
tłum
nowe technologie
content analysis
crowd
new technologies
Opis:
Analiza treści jest metodą szeroko wykorzystywaną nie tylko w naukach społecznych, ale też studiach humanistycznych. Automatyzacja oraz wsparcie komputerowe tej metody cieszy się dużym zainteresowaniem badaczy w Polsce i na świecie. Nowe perspektywy dla rozwoju tej dziedziny może otworzyć crowdsourcing, to jest metoda wirtualnej współpracy, do której zapraszani są liczni, anonimowi użytkownicy nowych technologii. Pierwsze próby wykorzystania tego fenomenu w nauce zakończyły się powodzeniem zarówno w obrębie nauk ścisłych, jak i humanistycznych. Rozpoznanie możliwości używania crowdsourcingu w analizie treści wymaga jednak dalszych testów i poszukiwań.Celem artykułu jest przedstawienie próby użycia pilotażowego narzędzia do crowdsourcingowego kodowania treści oraz refleksja na temat potencjału i ograniczeń tego podejścia. Przedstawiona zostanie krótka charakterystyka zjawiska crowdsourcingu, jego zastosowanie w nauce oraz opis proponowanego narzędzia. Podsumowanie artykułu stanowi analiza szans oraz słabości, które crowdsourcing może oferować dla rozwoju tej metody.
Content analysis has become a research method that is widely used not only in social sciences, but also in the humanities in general. The automation and computerization behind this method is gaining a lot of interest among researchers in Poland and around the world. New perspectives for the development of this field can be opened by the phenomenon of crowdsourcing – a virtual collaboration method whereby numerous anonymous users of new technologies are the participants. The first attempts to use this phenomenon in science were successful, both within exact sciences and the humanities. However, confirming the possibility of using crowdsourcing in content analysis requires further research and exploration.The aim of this article is to present the attempt of using a pilot tool for crowdsourcing content coding. A reflection on the potential advantages and limitations of this approach will be offered, too. The author will provide a short characterization of the phenomenon of crowdsourcing and its application in science, as well as the description of the proposed tool. The article is concluded with the analysis of the opportunities and weaknesses that crowdsourcing can offer for the development of content analysis.
Źródło:
Przegląd Socjologii Jakościowej; 2019, 15, 4; 250-270
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
CAQDAS w badaniach digitalizacji i odbioru dziedzictwa kulturowego. Korzyści i ograniczenia
Autorzy:
Dzięglewski, Mariusz
Powiązania:
https://bibliotekanauki.pl/articles/2033761.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
CAQDAS
wywiady pogłębione
analiza treści
digitalizacja
dziedzictwo kulturowe
In-Depth Interviews
Content Analysis
Opis:
Celem artykułu jest refleksja na temat korzyści i ograniczeń płynących z połączenia i wzajemnego przenikania się tradycyjnych metod badania i analizy ze wspomaganą komputerowo analizą danych jakościowych. Artykuł zawiera krytyczną analizę tego procesu przeprowadzoną na przykładzie projektu badawczego pod tytułem „Cyfrowe praktyki i strategie upowszechniania i odbioru dziedzictwa kulturowego w Polsce w latach 2004–2014”. W pierwszej części artykułu omówione zostały założenia projektu ze szczególnym uwzględnieniem roli i sposobu łączenia tych podejść na etapie organizacji badań. Autor artykułu opisuje rolę, jaką w projektowaniu badań odgrywa CAQDAS i sposób, w jaki wpływa ona na percepcję problemu badawczego, oraz późniejszą interpretację wyników badania. W drugiej części artykułu przedstawiono poszczególne etapy badania, ze szczególnym uwzględnieniem przenikania się różnych podejść do badań i analizy na etapie budowania bazy danych, kodowania danych tekstowych, analizy, wizualizacji danych i interpretacji wyników. W sposób szczególny omówiono korzyści i ograniczenia zastosowania CAQDAS do analizy treści i zawartości dokumentów prawnych jako danych zastanych oraz transkrypcji wywiadów pogłębionych. Głównym celem metaanalizy przebiegu badania jest propozycja optymalnego połączenia tradycyjnych i nowoczesnych metod badania i analizy danych w złożonych projektach, które pozwoliłoby na wykorzystanie nowych możliwości technologicznych w badaniach społecznych, a jednocześnie – na uniknięcie „pułapek” i ograniczeń z nimi związanych.
The paper is aimed at the reflection on advantages and constraints emerging from the mutual diffusion of traditional research methods with computer assisted qualitative data analysis. The article includes critical analysis of this process based on the research project “Digital practices and strategies of dissemination and reception of cultural heritage in Poland between 2004- 2014.” In the first part of the paper, the main assumptions of the project are discussed with the special insight into the function and fusion of those two approaches at the stage of the research project conceptualization. The author of the paper discusses the impact of CAQDAS on the perception of the research problem and latter interpretation of findings. In the second part of the article, the fallowing stages of the research project are presented, with the special insight into the fusion of various approaches to the research at the stage of database construction, coding of textual data, analysis, data visualization, and interpretation of findings. The special attention has been paid to advantages and constraints of CAQDAS application to content analysis of legal documents and transcripts of in-depth individual interviews. The main outcome of such meta-analysis of the research process is the proposal of the most effective fusion of traditional and new methods of data analysis in complex research projects. We believe that such proposal enables one to make use of new technological opportunities in social research, avoid “pitfalls,” and overcome constraints embedded in CAQDAS.
Źródło:
Przegląd Socjologii Jakościowej; 2017, 13, 2; 24-45
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Metodyka dla analizy treści w projektach stosujących techniki text mining i rozwiązania CAQDAS piątej generacji
Autorzy:
Tomanek, Krzysztof
Powiązania:
https://bibliotekanauki.pl/articles/2033749.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
analiza treści
Mixed Methods
Big Data
techniki text mining
CAQDAS
Content Analysis
Mixed Methods Approach
Text Mining
Opis:
Projekty, w których przychodzi nam pracować z dużymi wolumenami danych tekstowych, pochodzących z rożnych źródeł i zapisanych w różnorodnych formatach, rodzą wiele dylematów natury metodologicznej, wymagają często niestandardowych decyzji i rozwiązań. W szczególności zadanie polegające na opracowaniu danych o różnorodnej jakości, nieustrukturyzowanych typu quan i qual wymagać może pracy, w której dynamicznie zmieniają się strategie analizy danych, sposoby przekształcania danych tekstowych. Artykuł opisuje przykład takiej właśnie „dynamicznej” metodyki. Wykazała ona swoją wartość w zadaniu polegającym na klasyfikacji wypowiedzi pisanych. W tak zarysowanym kontekście autor artykułu mierzy się z następującymi celami: (a) czy można zastosować oprogramowanie klasy CAQDAS do pracy półautomatycznej lub automatycznej zastępującej część manualnej pracy nad klasyfikacją wypowiedzi? (b) jak skonstruować metodykę klasyfikacji dla danych o różnorodnej jakości? (c) kiedy klasyfikacja automatyczna jest przydatna, a kiedy nie ma szans powodzenia? W artykule zaznaczone zostaną momenty, w których analityk sięga po wiedzę typową dla analiz danych jakościowych oraz te, kiedy wiedza z tego obszaru nie jest już wystarczająca do realizacji wskazanych celów (natural language processing, uczenie maszynowe). Przykład projektu będący tłem artykułu wymusił zastosowanie kilku narzędzi i języków wspierających pracę na danych. Praca nad transformacją, klasyfikacją oraz wizualizacją wyników wymagała zastosowania bazy MySQL oraz programów: R, QDA Miner, Wordstat, QlikSense. Roli i ograniczeniom narzędzi klasy CAQDAS poświęconych zostało także kilka uwag.
Projects which we work with—large volumes of text data that are acquired from various sources and stored in a variety of formats—rise many dilemmas of a methodological nature, often require unstandardized decisions and solutions. In particular, compiling data of various quality, unstructured types, and of quan and qual nature requires dynamic strategies, ideas, and ways of analysis. The article describes an example of this approach. It shows its value in classification of written statements. In such context, the author of the article faces the following objectives: (a) can we use CAQDASso that semiautomatic or automatic work would replace some manual work regarding classification of the expressions; (b) how to construct a classification methodology for data of various quality; (c) when the automatic classification is useful and when there is no chance of success? The article will be marked with moments in which the analyst reaches for knowledge typical for qualitative data analysis, and when the knowledge of this area is no longer sufficient to classify content (natural language processing, machine learning). An example of a project being the background of this article forced the use of several tools and languages to support work with the data. Work on the transformation, classification, and visualization of results required applications such as: MySQL, R, QDA Miner, WordStat, Qlik Sense. Role and limits of the computer-assisted qualitative data analysis software tools have also been noted.
Źródło:
Przegląd Socjologii Jakościowej; 2017, 13, 2; 128-143
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Whats and Hows? The Practice-Based Typology of Narrative Analyses
Co i jak? Typologia analiz narracyjnych oparta na praktykach badawczych
Autorzy:
Bryda, Grzegorz
Powiązania:
https://bibliotekanauki.pl/articles/1371561.pdf
Data publikacji:
2020-08-31
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
analiza narracyjna
CAQDAS
analiza treści
Text Mining
kodowanie słownikowe
modelowanie tematyczne
Narrative Analysis
Content Analysis
dictionary-based coding
topic modeling
Opis:
The nature of qualitative research practices is multiparadigmaticity which creates coexistence of different research and analytical approaches to the study of human experience in the living world. This diversity is particularly observed in the contemporary field of narrative research and data analysis. The purpose of this article is a methodological reflection on the process of developing typology and a proposition of new data-driven and practice-based typology of narrative analyses used by qualitative researchers in the lived experience research. I merge the CAQDAS, Corpus Linguistics, and Text Mining procedures to examine the analytical strategies inherited in a vivid language of English-language research articles, published in five influential qualitative methodological journals between 2002-2016. Using the dictionary-based content analysis in the coding process, hierarchical clustering, and topic modeling – a text-mining tool for discovering hidden semantic structures in a textual body – I confront Catherine Kohler Riessman’s heuristic typology with the data-driven approach in order to contribute the more coherent image of narrative analysis in the contemporary field of qualitative research. Finally, I propose a new model of thinking about the typology of narrative analyses based upon research practices.
Istotą jakościowych praktyk badawczych jest wieloparadygmatyczność, która rodzi współistnienie różnych podejść metodologicznych w analizie i badaniu ludzkich doświadczeń w świecie życia codziennego. Różnorodność ta jest szczególnie widoczna w dziedzinie badań i analizy danych narracyjnych. Celem artykułu jest refleksja metodologiczna nad tworzeniem typologii analiz narracyjnych i zarazem propozycja nowego sposobu typologizacji podejść analitycznych, opartego na łączeniu lingwistyki korpusowej i przetwarzania języka naturalnego z procedurami CAQDAS, analizy treści i Text Mining. Typologia ta jest oparta na analizie narracyjnych praktyk badawczych odzwierciedlonych w języku anglojęzycznych artykułów opublikowanych w pięciu uznanych na świecie jakościowych czasopismach metodologicznych w latach 2002–2016. W artykule wykorzystuję metodę słownikową w procesie kodowania artykułów, hierarchiczne grupowanie i modelowanie tematyczne w celu odkrywania w tych publikacjach różnych typów analiz narracyjnych i badania relacji semantycznych między nimi. Jednocześnie konfrontuję heurystyczną typologię Riessmana z podejściem opartym na lingwistyce i eksploracji danych w celu rozwijania spójnego obrazu metodologii analizy narracyjnej we współczesnej dziedzinie badań jakościowych. Ostatecznie przedstawiam nowy model myślenia o analizie narracyjnej.
Źródło:
Przegląd Socjologii Jakościowej; 2020, 16, 3; 120-142
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wykorzystanie oprogramowania R i RQDA w jakościowo-ilościowej analizie treści orzeczeń Trybunału Konstytucyjnego
Usage of Software Packages R and RQDA in a Qualitative-Quantitative Content Analysis of Verdicts of Polish Constitutional Tribunal
Autorzy:
Winczorek, Jan
Powiązania:
https://bibliotekanauki.pl/articles/622959.pdf
Data publikacji:
2014
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
CAQDA
RQDA
R (oprogramowanie)
analiza treści
rzetelność kodowania
Trybunał Konstytucyjny
R (software)
content analysis
intercoder reliability
Polish Constitutional Tribunal
Opis:
Artykuł opisuje wykorzystanie pakietu statystycznego „R” z nakładką CAQDA „RQDA” w jakościowo-ilościowej triangulowanej analizie treści z kodowaniem swobodnym, analizą rzetelności kodowania i statystycznej istotności wyników, przeprowadzonej na próbie uzasadnień orzeczeń Trybunału Konstytucyjnego z lat 1986–2009. Przedstawia najważniejsze własności oprogramowania, założenia badania, jego metodologię i zastosowane procedury analizy danych, a także pytania epistemologiczne, które pojawiły się w efekcie jego realizacji.
The paper describes utilization of R statistical software with RQDA CAQDA package in a mixed qualitative-quantitative triangulated content analysis with free coding, intercoder reliability analysis, and statistical significance analysis, performed on a sample of justifications of verdicts of Polish Constitutional Tribunal, issued between 1986 and 2009. It presents the most important features of software used, assumptions of the study, its methodology and procedures of data analyses, as well as epistemic questions which arose in the course of its execution.
Źródło:
Przegląd Socjologii Jakościowej; 2014, 10, 2; 138-161
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
„Hańba w Sejmie” – zastosowanie modeli generatywnych do analizy debat parlamentarnych
Autorzy:
Kwiatkowska, Agnieszka
Powiązania:
https://bibliotekanauki.pl/articles/2033754.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
Polska
debaty parlamentarne
elity polityczne
ilościowa analiza treści
text mining
Polska
Parliamentary Debates
Political Elites
Quantitative Content Analysis
Text Mining
Opis:
W ciągu ostatniego dziesięciolecia nastąpił wyraźny wzrost obecności skrajnej retoryki politycznej w debacie parlamentarnej w Polsce. Jednym z aspektów postępującej radykalizacji języka jest nadużywanie słów o wysokim negatywnym natężeniu emocjonalnym w celu opisania zdarzeń występujących w codziennej polityce, co prowadzi do degradacji ich znaczenia. Jak wskazują badania, brutalizacja języka debaty wywołuje negatywne konsekwencje na poziomie elit politycznych i elektoratu, prowadząc do zmniejszonej efektywności działania parlamentu, zaostrzenia konfliktów między partiami i ich zwolennikami oraz do alienacji politycznej obywateli. W artykule przedstawiam możliwości wykorzystania stenogramów parlamentarnych do analizy przemian dyskursu politycznego, w tym wykorzystane algorytmy przeszukiwania korpusów tekstów oraz analizy ukrytych tematów. Jako przykład wykorzystuję zbiór przemówień sejmowych z lat 1991‒2016 odnoszących się do idei hańby, zdrady, niesławy i skandalu. Opieram się głównie na generatywnym modelu tematycznym, wykorzystującym metodę ukrytej alokacji Dirichleta i jej rozszerzeniu – strukturalny model tematyczny, będących nienadzorowanymi metodami ekstrakcji tematów z dużych korpusów tekstów. Wyniki przeprowadzonych analiz potwierdzają wzrost radykalnego słownictwa w czasie, a także określają charakterystyki jego użytkowników oraz najczęściej występujące konteksty (polityka historyczna, kontrola nad mediami, polityka zagraniczna).
Over the last decade there has been a clear increase in extreme political rhetoric in the parliamentary debate in Poland. One aspect of the progressive radicalization of the language is overuse of words having a high negative emotional intensity to describe events in everyday politics, which leads to the degradation of their importance. As research shows, brutalization of the language of the debate has negative consequences at the levels of the political elite and the electorate, leading to reduced efficiency of the parliament, the exacerbation of conflicts between parties and among their supporters, and the political alienation of citizens. In this article, I present the possibilities of using the transcripts of parliamentary discourse to analyze the changes of the political discourse, including the algorithms used for searching text corpora and analysis of the latent topics. As an example, I use a set of parliamentary speeches from the years 1991-2016 related to the idea of shame, betrayal, disgrace and scandal. I base my analyses on generative topic modeling employing on the method of latent Dirichlet allocation and its extension—Structural Topic Model, both being unsupervised methods of extracting topics from large text corpora. The results of the analysis confirm the increase in usage of radical vocabulary in time, and also describe the characteristics of its users and the most common contexts the extreme vocabulary tend to appear (identity politics, control over the media, foreign policy).
Źródło:
Przegląd Socjologii Jakościowej; 2017, 13, 2; 82-109
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Jak obejrzeć tysiąc zdjęć na raz? O narzędziach kategoryzacji obrazów fotograficznych w projekcie "Niewidzialne Miasto"
Watching thousand images at once. Content analysis toolkit in the photo-driven research project “The Invisible City”
Autorzy:
Frąckowiak, Maciej
Powiązania:
https://bibliotekanauki.pl/articles/1373750.pdf
Data publikacji:
2012
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
visual sociology
photography
image content analysis
coding sheet
saturation of categories
ethnography of the research process
“The Invisible City”
everyday urbanism
Opis:
Regardless of the growing popularity of visual studies, the subject of the tools for image content analysis particularly employed in the non-critical paradigms to categorize large amounts of data and allow triangulation between the qualitative and the quantitative techniques is nearly absent in Polish sociological writings. The main goal of this article is to at least partially fill this gap. The author pursues this objective through the adoption of a broad perspective for the discussion of the manner in which the coding sheet has been designed and used in a research project “The Invisible City.” Illustrating the point with the chosen example, he follows the rules in the sheet construction and operation, and also seeks them in a photographing scenario, the initial categorization of data, and sampling. Also, he analysis the aims and the consequences of a non-institutional forms of space modification in a large Polish cities and the methodological dilemmas of studying the subject with a visual means.
Źródło:
Przegląd Socjologii Jakościowej; 2012, 8, 1; 46-59
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
W stronę ontologii pola badań jakościowych
Towards an Ontology of Qualitative Research Practices
Autorzy:
Bryda, Grzegorz
Martini, Natalia
Powiązania:
https://bibliotekanauki.pl/articles/623172.pdf
Data publikacji:
2016-11-30
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
ontologia dziedzinowa
metoda słownikowa
odkrywanie wiedzy
analiza treści
Text Mining
domain ontology
dictionary-based approach
knowledge discovery
content analysis
text mining
Opis:
Celem artykułu jest zapoznanie polskiego środowiska badaczy jakościowych z ideą opracowania ontologii dziedzinowej współczesnego pola badań jakościowych. Opisywane w artykule przedsięwzięcie, oparte na wielowymiarowej analizie zawartości międzynarodowych czasopism metodologicznych, zmierza ku uporządkowaniu aktualnej wiedzy w obszarze teorii i metodologii badań jakościowych z intencją ułatwienia orientacji w rozległym i zróżnicowanym polu jakościowych praktyk badawczych. Artykuł opisuje przebieg oraz wstępne wyniki pilotażowego projektu badawczego stosującego metodę słownikową do odkrywania i systematyzowania wiedzy na temat metodologii badań jakościowych na podstawie licznych, bieżących sprawozdań i refleksji operujących w tym polu badaczy.
The aim of the article is to introduce the Polish community of qualitative researchers to a new perspective in the study of qualitative research practices. The idea is to develop an ontology of contemporary qualitative research. Drawing on experiences from our research project, the article discusses the idea of systematizing the present state of art in the field of theory and methodology of qualitative research. Our study focuses on a new methodology of multidimensional content analysis of three international academic journals. The article describes the preliminary results of a pilot study which employs a dictionary-based approach as a method of knowledge discovery in textual databases and its systematization. Our goal is to provide insight in the vast and diverse approaches in the field of qualitative research practices.
Źródło:
Przegląd Socjologii Jakościowej; 2016, 12, 4; 24-40
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza sentymentu – metoda analizy danych jakościowych. Przykład zastosowania oraz ewaluacja słownika RID i metody klasyfikacji Bayesa w analizie danych jakościowych
Sentiment analysis. An example of application and evaluation of RID dictionary and Bayesian classification methods in qualitative data analysis approach
Autorzy:
Tomanek, Krzysztof
Powiązania:
https://bibliotekanauki.pl/articles/622902.pdf
Data publikacji:
2014
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
analiza danych jakościowych
analiza sentymentu
analiza treści
text mining
kodowanie tekstów
przetwarzanie języka naturalnego słownik RID
naiwny klasyfikator Bayesa
CAQDAS
qualitative data analysis
sentiment analysis
content analysis
coding techniques
natural language processing
RID dictionary
naive Bayes
Opis:
Celem artykułu jest prezentacja podstawowych metod klasyfikacji jakościowych danych tekstowych. Metody te korzystają z osiągnięć wypracowanych w takich obszarach, jak przetwarzanie języka naturalnego i analiza danych nieustrukturalizowanych. Przedstawiam i porównuję dwie techniki analityczne stosowane wobec danych tekstowych. Pierwsza to analiza z zastosowaniem słownika tematycznego. Druga technika oparta jest na idei klasyfikacji Bayesa i opiera się na rozwiązaniu zwanym naiwnym klasyfikatorem Bayesa. Porównuję efektywność dwóch wspomnianych technik analitycznych w ramach analizy sentymentu. Akcentuję rozwiązania mające na celu zbudowanie trafnego, w kontekście klasyfikacji tekstów, słownika. Porównuję skuteczność tak zwanych analiz nadzorowanych do skuteczności analiz zautomatyzowanych. Wyniki, które prezentuję, wzmacniają wniosek, którego treść brzmi: słownik, który w przeszłości uzyskał dobrą ocenę jako narzędzie klasyfikacyjne, gdy stosowany jest wobec nowego materiału empirycznego, powinien przejść fazę ewaluacji. Jest to, w proponowanym przeze mnie podejściu, podstawowy proces adaptacji słownika analitycznego, traktowanego jako narzędzie klasyfikacji tekstów.
The purpose of this article is to present the basic methods for classifying text data. These methods make use of achievements earned in areas such as: natural language processing, the analysis of unstructured data. I introduce and compare two analytical techniques applied to text data. The first analysis makes use of thematic vocabulary tool (sentiment analysis). The second technique uses the idea of Bayesian classification and applies, so-called, naive Bayes algorithm. My comparison goes towards grading the efficiency of use of these two analytical techniques. I emphasize solutions that are to be used to build dictionary accurate for the task of text classification. Then, I compare supervised classification to automated unsupervised analysis’ effectiveness. These results reinforce the conclusion that a dictionary which has received good evaluation as a tool for classification should be subjected to review and modification procedures if is to be applied to new empirical material. Adaptation procedures used for analytical dictionary become, in my proposed approach, the basic step in the methodology of textual data analysis.
Źródło:
Przegląd Socjologii Jakościowej; 2014, 10, 2; 118-136
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-9 z 9

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies