Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "text mining" wg kryterium: Wszystkie pola


Tytuł:
Kompetencje kierowników projektów – analiza text mining
Project managers’ competences – text mining analysis
Autorzy:
Wyskwarski, M.
Powiązania:
https://bibliotekanauki.pl/articles/323763.pdf
Data publikacji:
2018
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
text mining
competences
project manager
word cloud
kompetencje
kierownik projektu
chmura słów
Opis:
This article presents a proposal of identification of project managers’ competences in order to employers’ requirements. For this purpose the article presents the analysis of job advertisements with use of text analysis. According to that point of view the structure of the paper was created. The second part containing description of competences of project managers’. It shows the definition of competence, how it could be divided and which are the most important according to the authors. The third part of the article is divided into three pieces. First shows how to collect data to analysis. Second part shows procedure of text mining analysis, and the last part shows the results of such kind of analysis. It contains the words which appeared most frequently in the job offers and the correlation of those words with other words in text.
W artykule podjęto próbę identyfikacji oczekiwanych przez pracodawców kompetencji kierowników projektów. W tym celu przeanalizowano treść ofert pracy z wykorzystaniem analizy text mining. Stosownie do przyjętego celu ustalono strukturę pracy. W punkcie drugim przedstawiono najważniejsze informacje dotyczące kompetencji kierowników projektów. Wymieniono cztery modele kompetencji, przedstawiono czym one są, na jakie grupy można je podzielić oraz, które z nich według wybranych autorów są najistotniejsze. Punkt trzeci podzielono na trzy części. W pierwszej z nich przedstawiono sposób zebrania danych do analizy. Kolejna część opisuje procedurę przeprowadzonej analizy text mining. Ostatnia część prezentuje wyniki przeprowadzonej analizy. Ustalono jakie słowa w analizowanych ofertach pojawiały się najczęściej, oraz jak była korelacji tych słów z innymi słowami.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2018, 130; 689-701
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Text mining w analizie zbiorów publikacji naukowych
Text mining in analysis of scientific publications
Autorzy:
Wyskwarski, M.
Powiązania:
https://bibliotekanauki.pl/articles/326570.pdf
Data publikacji:
2017
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
text mining
chmura słów
publikacje naukowe
word clouds
scientific publications
Opis:
Często stosowaną form przechowywania informacji w organizacjach i społeczeństwie jest tekst. Tekst może zostać poddany eksploracji w celu pozyskania wcześniej nieznanej i użytecznej wiedzy. Celem niniejszego artykułu jest prezentacja wyników analizy wybranych publikacji naukowych. Analiza została przeprowadzona z wykorzystaniem text mining’u, a jej celem było ustalenie jakich słów najczęściej używali autorzy publikacji, oraz obliczenie korelacji tych słów z innymi.
Text is often used to store information in organizations and society. Text can be explored to gain previously unknown and useful knowledge. The aim of this article is to present the results of the analysis of selected scientific publications. The analysis was done using text mining. Its purpose was to determine what words were most used by the authors, and to calculate the correlation of those words with others words.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2017, 114; 635-647
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Przegląd zastosowań analizy text miningowej
Overview of uses text mining analysis
Autorzy:
Gładysz, A.
Powiązania:
https://bibliotekanauki.pl/articles/311433.pdf
Data publikacji:
2016
Wydawca:
Instytut Naukowo-Wydawniczy "SPATIUM"
Tematy:
dokument tekstowy
eksploracja danych tekstowych
text mining
data mining
analiza danych tekstowych
przetwarzanie informacji
wyszukiwanie informacji
tłumaczenie automatyczne
nadmiar informacji
business intelligence
information retrieval
data processing
document similarity
machine translation
information overload
Opis:
W artykule omówiona została eksploracyjna analiza danych tekstowych ze szczególnym naciskiem na zastosowania analizy text miningowej. We współczesnym świecie istnieje wiele różnych branż biznesowych w których pracownicy stykają się z nadmiarem napływających informacji. Rozwój społeczeństwa informacyjnego oraz technologii informatycznych pociągnął za sobą w sposób naturalny powstanie zautomatyzowanych systemów wspomagających wyszukiwanie i porządkowanie informacji. Techniki text miningu znajdują coraz większe zastosowanie, zaś szeroki przegląd zastosowań wraz ze wskazaniem praktycznym możliwości zastosowania analizy text miningowej został dogłębnie omówiony w artykule.
The article discussed the text mining with particular emphasis on the use of text mining analysis. In the modern world there are many different business industries where workers are in contact with an excess of incoming information. The development of the information society and information technology entailed a natural rise of automated systems to support search and organize information. Text mining techniques are increasingly applied, and a broad overview of applications, together with an indication of the practical possibilities of the use of text mining analysis has been thoroughly discussed in the article.
Źródło:
Autobusy : technika, eksploatacja, systemy transportowe; 2016, 17, 12; 1742-1746
1509-5878
2450-7725
Pojawia się w:
Autobusy : technika, eksploatacja, systemy transportowe
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Metodyka dla analizy treści w projektach stosujących techniki text mining i rozwiązania CAQDAS piątej generacji
Autorzy:
Tomanek, Krzysztof
Powiązania:
https://bibliotekanauki.pl/articles/2033749.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
analiza treści
Mixed Methods
Big Data
techniki text mining
CAQDAS
Content Analysis
Mixed Methods Approach
Text Mining
Opis:
Projekty, w których przychodzi nam pracować z dużymi wolumenami danych tekstowych, pochodzących z rożnych źródeł i zapisanych w różnorodnych formatach, rodzą wiele dylematów natury metodologicznej, wymagają często niestandardowych decyzji i rozwiązań. W szczególności zadanie polegające na opracowaniu danych o różnorodnej jakości, nieustrukturyzowanych typu quan i qual wymagać może pracy, w której dynamicznie zmieniają się strategie analizy danych, sposoby przekształcania danych tekstowych. Artykuł opisuje przykład takiej właśnie „dynamicznej” metodyki. Wykazała ona swoją wartość w zadaniu polegającym na klasyfikacji wypowiedzi pisanych. W tak zarysowanym kontekście autor artykułu mierzy się z następującymi celami: (a) czy można zastosować oprogramowanie klasy CAQDAS do pracy półautomatycznej lub automatycznej zastępującej część manualnej pracy nad klasyfikacją wypowiedzi? (b) jak skonstruować metodykę klasyfikacji dla danych o różnorodnej jakości? (c) kiedy klasyfikacja automatyczna jest przydatna, a kiedy nie ma szans powodzenia? W artykule zaznaczone zostaną momenty, w których analityk sięga po wiedzę typową dla analiz danych jakościowych oraz te, kiedy wiedza z tego obszaru nie jest już wystarczająca do realizacji wskazanych celów (natural language processing, uczenie maszynowe). Przykład projektu będący tłem artykułu wymusił zastosowanie kilku narzędzi i języków wspierających pracę na danych. Praca nad transformacją, klasyfikacją oraz wizualizacją wyników wymagała zastosowania bazy MySQL oraz programów: R, QDA Miner, Wordstat, QlikSense. Roli i ograniczeniom narzędzi klasy CAQDAS poświęconych zostało także kilka uwag.
Projects which we work with—large volumes of text data that are acquired from various sources and stored in a variety of formats—rise many dilemmas of a methodological nature, often require unstandardized decisions and solutions. In particular, compiling data of various quality, unstructured types, and of quan and qual nature requires dynamic strategies, ideas, and ways of analysis. The article describes an example of this approach. It shows its value in classification of written statements. In such context, the author of the article faces the following objectives: (a) can we use CAQDASso that semiautomatic or automatic work would replace some manual work regarding classification of the expressions; (b) how to construct a classification methodology for data of various quality; (c) when the automatic classification is useful and when there is no chance of success? The article will be marked with moments in which the analyst reaches for knowledge typical for qualitative data analysis, and when the knowledge of this area is no longer sufficient to classify content (natural language processing, machine learning). An example of a project being the background of this article forced the use of several tools and languages to support work with the data. Work on the transformation, classification, and visualization of results required applications such as: MySQL, R, QDA Miner, WordStat, Qlik Sense. Role and limits of the computer-assisted qualitative data analysis software tools have also been noted.
Źródło:
Przegląd Socjologii Jakościowej; 2017, 13, 2; 128-143
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Ukryte modele Markowa jako metoda eksploracji danych tekstowych
Hidden Markov Models as a text mining method
Autorzy:
Mazurek, M.
Powiązania:
https://bibliotekanauki.pl/articles/305867.pdf
Data publikacji:
2010
Wydawca:
Wojskowa Akademia Techniczna im. Jarosława Dąbrowskiego
Tematy:
eksploracja danych tekstowych
ukryte modele Markowa
ekstrakcja informacji
text mining
hidden Markov model
information retrieval
Opis:
W eksploracji danych tekstowych z dużym powodzeniem stosuje się probabilistyczne modele dokumentów. W artykule przedstawiony został jeden z podstawowych, dla tej dziedziny informatyki, sposobów reprezentacji dokumentu za pomocą ukrytych modeli Markowa. Przedstawiono definicję ukrytego modelu Markowa oraz sposób wyznaczenia podstawowych wielkości związanych z wykorzystaniem tego modelu, takich jak prawdopodobieństwo wystąpienia obserwowanej sekwencji symboli (słów), wyszukanie najbardziej prawdopodobnej sekwencji stanów procesu, czy też formuły reestymacji parametrów modelu używane w procesie uczenia modelu.
In the text mining applications probabilistic models of document are widely used. In this paper the Hidden Markov Models were described as a fundamental method for text processing. Definition of the HMM was presented and the algorithms to find parameters of the model. Some of the possible applications of HMM were suggested.
Źródło:
Biuletyn Instytutu Systemów Informatycznych; 2010, 6; 27-31
1508-4183
Pojawia się w:
Biuletyn Instytutu Systemów Informatycznych
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
ZASTOSOWANIE TECHNIK EKSPLORACJI TEKSTU DO ANALIZY OPINII KONSUMENCKICH
APPLICATION OF TEXT MINING TECHNIQUES FOR THE CUSTOMER REVIEWS ANALYSIS
Autorzy:
Ząbkowski, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/452951.pdf
Data publikacji:
2014
Wydawca:
Szkoła Główna Gospodarstwa Wiejskiego w Warszawie. Katedra Ekonometrii i Statystyki
Tematy:
eksploracja tekstu
reguły asocjacyjne
opinie konsumenckie
text mining
association rules
customer reviews
Opis:
W niniejszej publikacji zaproponowano jedną z metod eksploracji danych – reguły asocjacyjne do wykrycia zależności w opiniach konsumenckich, na przykładzie opinii jednego z hoteli amerykańskich. Wykorzystanie tej techniki wynikało m.in. z dużej ilości dostępnych danych oraz faktu, że otrzymane reguły w sposób niezwykle czytelny prezentują zależności znalezione w danych. W badaniu odkryto szereg reguł, które mogą stanowić cenne źródło informacji o jakości usług oraz postrzeganiu obiektu przez klientów korzystających z usług hotelowych.
This paper presents application of one of data mining techniques – association rules to analyze customer reviews, based on the data gathered at one of the American hotels. The application of association rules is due to the large volume of available review data and the fact that the rules can be presented in a very clear and meaningful way. The study resulted in a number of interesting rules that can be a valuable source of information about the quality of services and the perception of the hotel by the clients.
Źródło:
Metody Ilościowe w Badaniach Ekonomicznych; 2014, 15, 4; 101-110
2082-792X
Pojawia się w:
Metody Ilościowe w Badaniach Ekonomicznych
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Charakterystyczne elementy marek polskich miast w recenzjach dostępnych online
Autorzy:
Nowacki, Marek
Powiązania:
https://bibliotekanauki.pl/articles/627294.pdf
Data publikacji:
2019
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
kapitał marki
destynacje
TripAdvisor
Text Mining
Opis:
Celem pracy jest zidentyfikowanie charakterystycznych elementów marek polskich miast oraz wskazanie podobieństw i różnic występujących pomiędzy nimi. Praca ma dać odpowiedź na następujące pytania badawcze: Które elementy w istotny sposób wpływają na odróżnianie marek badanych miast w recenzjach dostępnych online? Które z badanych miast są do siebie najbardziej zbliżone pod względem elementów marki, a które różnią się pod tym względem? Dane do analizy pobrano z serwisu TripAdvisor. Były to opinie dotyczące rejonów koncentracji ruchu turystycznego – starych rynków lub starych miast – pięciu polskich miast: Poznania, Wrocławia, Krakowa, Gdańska i Warszawy (N = 5125). Przeprowadzone analizy pozwoliły zidentyfikować unikatowe elementy marek badanych miast i wskazać podobieństwa oraz różnice występujące pomiędzy markami.
Źródło:
Turyzm; 2019, 29, 1; 69-76
0867-5856
2080-6922
Pojawia się w:
Turyzm
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Gospodarstwa agroturystyczne w świetle opinii użytkowników TripAdvisora – cechy determinujące ocenę obiektów
Autorzy:
Bannach, Anna
Powiązania:
https://bibliotekanauki.pl/articles/2084761.pdf
Data publikacji:
2021-09-08
Wydawca:
Wyższa Szkoła Bankowa w Poznaniu
Tematy:
agroturystyka
turystyka wiejska
eWOM
text mining
Opis:
Celem artykułu jest zidentyfikowanie cech gospodarstw agroturystycznych, które mają wpływ na ocenę nadawaną gospodarstwom przez użytkowników TripAdvisora. Materiał badawczy stanowiło 896 opinii dotyczących 57 obiektów agroturystycznych z obszaru całej Polski. W badaniach zastosowano metodę jakościowej analizy treści oraz metodę ilościową (text mining). Zidentyfikowano słowa najczęściej pojawiające się w opiniach użytkowników. Są to: miejsce, polecam, pokoje, właściciel, śniadania, atmosfera. Zauważono, że liczba słów i ich częstotliwość różnią się w zależności od przyznanej przez użytkowników oceny. Zdecydowanie najwięcej wyrazów liczą opinie cztero- i pięciogwiazdkowe. W trakcie badań stwierdzono, że turyści podróżujący z dziećmi wysoko oceniają gospodarstwa agroturystyczne oferujące szereg usług dodatkowych, a także że ważną cechą mającą wpływ na ocenę gospodarstw agroturystycznych jest czystość. Lokalizacja gospodarstwa agroturystycznego i poziom obsługi w obiekcie również mają wpływ na ocenę w TripAdvisorze. Na podstawie badań można stwierdzić, że do cech determinujących ocenę obiektów należą: czystość i porządek na terenie całego gospodarstwa agroturystycznego, atmosfera panująca w gospodarstwie, ale także uprzejmość i gościnność właścicieli. Istotnym czynnikiem jest także stosunek jakości oferowanych usług do ceny, jaką muszą turyści za te usługi zapłacić.
Źródło:
Studia Periegetica; 2021, 34(2); 103-120
1897-9262
2658-1736
Pojawia się w:
Studia Periegetica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
„Hańba w Sejmie” – zastosowanie modeli generatywnych do analizy debat parlamentarnych
Autorzy:
Kwiatkowska, Agnieszka
Powiązania:
https://bibliotekanauki.pl/articles/2033754.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
Polska
debaty parlamentarne
elity polityczne
ilościowa analiza treści
text mining
Polska
Parliamentary Debates
Political Elites
Quantitative Content Analysis
Text Mining
Opis:
W ciągu ostatniego dziesięciolecia nastąpił wyraźny wzrost obecności skrajnej retoryki politycznej w debacie parlamentarnej w Polsce. Jednym z aspektów postępującej radykalizacji języka jest nadużywanie słów o wysokim negatywnym natężeniu emocjonalnym w celu opisania zdarzeń występujących w codziennej polityce, co prowadzi do degradacji ich znaczenia. Jak wskazują badania, brutalizacja języka debaty wywołuje negatywne konsekwencje na poziomie elit politycznych i elektoratu, prowadząc do zmniejszonej efektywności działania parlamentu, zaostrzenia konfliktów między partiami i ich zwolennikami oraz do alienacji politycznej obywateli. W artykule przedstawiam możliwości wykorzystania stenogramów parlamentarnych do analizy przemian dyskursu politycznego, w tym wykorzystane algorytmy przeszukiwania korpusów tekstów oraz analizy ukrytych tematów. Jako przykład wykorzystuję zbiór przemówień sejmowych z lat 1991‒2016 odnoszących się do idei hańby, zdrady, niesławy i skandalu. Opieram się głównie na generatywnym modelu tematycznym, wykorzystującym metodę ukrytej alokacji Dirichleta i jej rozszerzeniu – strukturalny model tematyczny, będących nienadzorowanymi metodami ekstrakcji tematów z dużych korpusów tekstów. Wyniki przeprowadzonych analiz potwierdzają wzrost radykalnego słownictwa w czasie, a także określają charakterystyki jego użytkowników oraz najczęściej występujące konteksty (polityka historyczna, kontrola nad mediami, polityka zagraniczna).
Over the last decade there has been a clear increase in extreme political rhetoric in the parliamentary debate in Poland. One aspect of the progressive radicalization of the language is overuse of words having a high negative emotional intensity to describe events in everyday politics, which leads to the degradation of their importance. As research shows, brutalization of the language of the debate has negative consequences at the levels of the political elite and the electorate, leading to reduced efficiency of the parliament, the exacerbation of conflicts between parties and among their supporters, and the political alienation of citizens. In this article, I present the possibilities of using the transcripts of parliamentary discourse to analyze the changes of the political discourse, including the algorithms used for searching text corpora and analysis of the latent topics. As an example, I use a set of parliamentary speeches from the years 1991-2016 related to the idea of shame, betrayal, disgrace and scandal. I base my analyses on generative topic modeling employing on the method of latent Dirichlet allocation and its extension—Structural Topic Model, both being unsupervised methods of extracting topics from large text corpora. The results of the analysis confirm the increase in usage of radical vocabulary in time, and also describe the characteristics of its users and the most common contexts the extreme vocabulary tend to appear (identity politics, control over the media, foreign policy).
Źródło:
Przegląd Socjologii Jakościowej; 2017, 13, 2; 82-109
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
W stronę ontologii pola badań jakościowych
Towards an Ontology of Qualitative Research Practices
Autorzy:
Bryda, Grzegorz
Martini, Natalia
Powiązania:
https://bibliotekanauki.pl/articles/623172.pdf
Data publikacji:
2016-11-30
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
ontologia dziedzinowa
metoda słownikowa
odkrywanie wiedzy
analiza treści
Text Mining
domain ontology
dictionary-based approach
knowledge discovery
content analysis
text mining
Opis:
Celem artykułu jest zapoznanie polskiego środowiska badaczy jakościowych z ideą opracowania ontologii dziedzinowej współczesnego pola badań jakościowych. Opisywane w artykule przedsięwzięcie, oparte na wielowymiarowej analizie zawartości międzynarodowych czasopism metodologicznych, zmierza ku uporządkowaniu aktualnej wiedzy w obszarze teorii i metodologii badań jakościowych z intencją ułatwienia orientacji w rozległym i zróżnicowanym polu jakościowych praktyk badawczych. Artykuł opisuje przebieg oraz wstępne wyniki pilotażowego projektu badawczego stosującego metodę słownikową do odkrywania i systematyzowania wiedzy na temat metodologii badań jakościowych na podstawie licznych, bieżących sprawozdań i refleksji operujących w tym polu badaczy.
The aim of the article is to introduce the Polish community of qualitative researchers to a new perspective in the study of qualitative research practices. The idea is to develop an ontology of contemporary qualitative research. Drawing on experiences from our research project, the article discusses the idea of systematizing the present state of art in the field of theory and methodology of qualitative research. Our study focuses on a new methodology of multidimensional content analysis of three international academic journals. The article describes the preliminary results of a pilot study which employs a dictionary-based approach as a method of knowledge discovery in textual databases and its systematization. Our goal is to provide insight in the vast and diverse approaches in the field of qualitative research practices.
Źródło:
Przegląd Socjologii Jakościowej; 2016, 12, 4; 24-40
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza wpisów na portalu Twitter z wykorzystaniem narzędzi big data zawartych w pakiecie R
Social media analysis with big data tools
Autorzy:
Kisiołek, Arkadiusz
Powiązania:
https://bibliotekanauki.pl/articles/591261.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Analiza danych
Big data
Internet
Social media
Text mining
Opis:
Wraz z rozwojem internetu, mediów społecznościowych oraz technologii mobilnych znacznie wzrosła ilość generowanych danych. Dane te, zarówno w formie ustrukturalizowanej, jak i nieustrukturalizowanej, mogą nieść wartość biznesową dla przedsiębiorców. W danych big data można znaleźć m.in. informacje na temat klientów, konkurencji, rynku pracy, opinii na temat produktów danej firmy, czy aktualnych trendów. Dzięki dokładnej analizie internetu i mediów społecznościowych, interesariusze mogą pozyskać nową wartość, jaką są informacje na temat nastawienia i opinii konsumentów. Celem artykułu jest przedstawienie narzędzi big data jako jednego ze sposobów analizy mediów społecznościowych i wyciągania w ten sposób wartościowych informacji. Przedmiotem przeprowadzonej analizy były tysiące tweetów użytkowników portalu Twitter. Analiza została przeprowadzona przy wykorzystaniu technik text mining oraz sentyment analysis.
Development of Internet, social media and databases has caused a huge increase of data. Structured, semi-structured and unstructured data has a high business value. It contains various information about customers, competition, labor market, and development trends for industries, products and services. The internet and social media are places where customers express their opinions about various products and services. It is a valuable source of information for entrepreneurs. The aim of this paper is to explore the issue of big data and to propose a set of different techniques for the analysis of customer opinions on the example of Twitter.
Źródło:
Studia Ekonomiczne; 2018, 362; 306-317
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Pozyskiwanie i analiza danych na temat ofert pracy z wykorzystaniem big data
The collection and analysis of the data on job advertisements with the use of big data
Autorzy:
Maślankowski, Jacek
Powiązania:
https://bibliotekanauki.pl/articles/962829.pdf
Data publikacji:
2019
Wydawca:
Główny Urząd Statystyczny
Tematy:
big data
text mining
web scraping
rynek pracy
labour market
Opis:
Celem artykułu jest zaprezentowanie korzyści wynikających z wykorzystania na potrzeby statystyki publicznej (rynku pracy) narzędzi do automatycznego pobierania danych na temat ofert pracy zamieszczanych na stronach internetowych zaliczanych do zbiorów big data, a także związanych z tym wyzwań. Przedstawiono wyniki eksperymentalnych badań z wykorzystaniem metod web scrapingu oraz text miningu. Analizie poddano dane z lat 2017 i 2018 pochodzące z najpopularniejszych portali z ofertami pracy. Odwołano się do danych Głównego Urzędu Statystycznego (GUS) zbieranych na podstawie sprawozdania Z-05. Przeprowadzona analiza prowadzi do wniosku, że web scraping może być stosowany w statystyce publicznej do pozyskiwania danych statystycznych z alternatywnych źródeł, uzupełniających istniejące bazy danych statystycznych, pod warunkiem zachowania spójności z istniejącymi badaniami.
The goal of this paper is to present, on the one hand, the benefits for official statistics (labour market) resulting from the use of web scraping methods to gather data on job advertisements from websites belonging to big data compilations, and on the other, the challenges connected to this process. The paper introduces the results of experimental research where web-scraping and text-mining methods were adopted. The analysis was based on the data from 2017–2018 obtained from the most popular jobsearching websites, which was then collated with Statistics Poland’s data obtained from Z-05 forms. The above-mentioned analysis demonstrated that web-scraping methods can be adopted by public statistics services to obtain statistical data from alternative sources complementing the already-existing databases, providing the findings of such research remain coherent with the results of the already-existing studies.
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2019, 64, 9; 60-74
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Implementacja oraz porównanie algorytmów tekstowych w środowiskach przetwarzania równoległego na przykładzie procesorów wielordzeniowych i kart graficznych
Multicore and GPGPU implementation of chosen text algorithms
Autorzy:
Pietroń, M.
Wielgosz, M.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/155953.pdf
Data publikacji:
2014
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
algorytmy tekstowe
GPGPU
obliczenia równoległe
text mining
text algorithms
parallel computing
Opis:
Artykuł przedstawia implementację algorytmów tekstowych w wybranych platformach przetwarzania równoległego. Dostępność procesorów wielordzeniowych oraz kart graficznych ogólnego przeznaczenia sprawia, iż badania nad równoległą implementacją algorytmów w celu ich akceleracji nabierają coraz większego znaczenia. Algorytmy tekstowe są niezwykle istotnym i często niezbędnym elementem zaawansowanych algorytmów analizy tekstu oraz są także składowymi funkcji wyszukiwania wzorców w tekście wielu języków programowania. W pracy dokonano analizy najpopularniejszych algorytmów tekstowych oraz dokonano ich analizy pod kątem ich zrównoleglenia w celu ich implementacji w procesorze wielordzeniowym oraz karcie graficznej ogólnego przeznaczenia. Analizowanymi algorytmami są: boyer-moore, algorytm naiwny oraz algorytm knuth-morris-pratt. Następnie dokonano porównania efektywności ich realizacji na wymienionych platformach sprzętowych.
This paper presents implementation of text algorithms in multicore CPU and GPGPU. The text algorithms are very common algorithms used in text analysis process and they are a part of functions used for text patterns recognition. The library functions for text searching implemented in many languages very often use most popular text-algorithms. The paper describes the analysis of these algorithms for parallel implementations in multicore processors and general purpose graphic cards. The research work presented in this paper shows that text algorithms can be partially parallelized. The process of acceleration can be done by appropriate dividing the input text between parallel threads (data parallelism). The comparative studies were performed for the following algorithms: boyer-moore (horspool) , naive and knuth-morris-pratt algorithm. The presented results show the efficiency of these algorithms in the case of different type and size of patterns. In the case of GPU the implementation was made in the CUDA framework. The OpenMP library was used for a multicore version.
Źródło:
Pomiary Automatyka Kontrola; 2014, R. 60, nr 5, 5; 301-304
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza dokonań OPP, prezentowanych w ich sprawozdaniach rocznych z wykorzystaniem metody drążenia tekstu
Applying text mining method to analyse performance of PBOs based on their annual statements
Autorzy:
Dyczkowski, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/592046.pdf
Data publikacji:
2016
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Dokonania, drążenie tekstu
Informacje opisowe
Organizacje pożytku publicznego
Narrative information
Performance
Public benefit organisations
Text mining
Opis:
Artykuł ma na celu usystematyzowanie informacji charakteryzujących dokonania OPP, ujawnianych w ich rocznych sprawozdaniach z działalności, oraz zidentyfikowanie tych, które stymulują ofiarność indywidualnych darczyńców. Badanie przeprowadzono z zastosowaniem metod drążenia tekstu oraz eksperymentu laboratoryjnego na losowej próbie 177 polskich OPP. Uzyskane wyniki umożliwiły zidentyfikowanie głównych zagadnień prezentowanych przez OPP w narracyjnej części sprawozdania rocznego oraz wskazanie przesuniętych akcentów w opisach dokonań tych OPP, które szczególnie stymulują darczyńców do współdziałania.
The article systematises performance related information disclosed by PBOs in their annual statements. It identifies also those disclosures which may particularly stimulate individual donations. The research comprises 177 randomly selected Polish PBOs. It applies the methodologies of text mining and of a laboratory experiment. The results obtained allowed identifying the key issues which PBOs focus on in narrative parts of their annual statements. They enabled also to observed a shift in focus of performance related narratives in those PBOs which earned more attention of donors.
Źródło:
Studia Ekonomiczne; 2016, 274; 57-66
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Odkrywanie postaw dydaktyków zawartych w komentarzach studenckich. Analiza treści z zastosowaniem słownika klasyfikacyjnego
Exploring Attitudes of Educators Based on Students Comments. Content Analysis Using a Classification Dictionary
Autorzy:
Tomanek, Krzysztof
Bryda, Grzegorz
Powiązania:
https://bibliotekanauki.pl/articles/413380.pdf
Data publikacji:
2015
Wydawca:
Łódzkie Towarzystwo Naukowe
Tematy:
słownik klasyfikacyjny
analiza opinii
text mining
metody klasyfikacji wypowiedzi
analiza treści
mixed methods
dictionary – based classification
opinion analysis
content analysis
Opis:
Wykorzystanie wiedzy o semantyce, pragmatyce wypowiedzi i logice powiązań pomiędzy elementami wypowiedzi pisemnych w połączeniu z technikami z obszaru Text Mining to nowe podejście w analizie danych jakościowych. Wymaga ono integracji wiedzy z różnych obszarów nauki, m.in. socjologii, językoznawstwa, NLP (Natural Language Processing), logiki, statystyki. W efekcie tej fuzji możliwe jest budowanie słowników klasyfikacyjnych wspomagających proces analizy i odkrywania wiedzy w dużych zbiorach tekstów, komentarzy. Ta perspektywa wywodzi się z tradycyjnej metody służącej opracowaniu treści, jest jednak mniej czasochłonna, a jej rozwiązania służyć mogą w analizie treści jeszcze nie eksplorowanych. Celem artykułu jest przedstawienie trzech różnych podejść metodologicznych w analizie danych tekstowych opartych na wykorzystaniu słownika klasyfikacyjnego w odkrywaniu typów postaw dydaktyków scharakteryzowanych w studenckich komentarzach zawartych w ocenach zajęć dydaktycznych za lata 2008–2013 na Uniwersytecie Jagiellońskim w Krakowie. W artykule pokazujemy przykłady klasyfikacji i ich wyniki, podkreślając wady i korzyści zastosowanych podejść. Zaprezentowane zostały także podstawowe miary opisujące trafność klasyfikacji. Analiza wielowymiarowa wykonana została z zastosowaniem takich technik, jak: miara podobieństwa wypowiedzi tekstowych, analiza dendrogramowa, analiza korespondencji.
The use of knowledge about the semantics and pragmatics of speech and the logic of connections between elements of written statements, in combination with techniques from the Text Mining field, constitutes a new approach in qualitative data analysis. It requires the integration of knowledge from different fields of science i.e. sociology, linguistics, NLP (Natural Language Processing), logic and statistics. As a result of this union is possible to build classification dictionaries that support the process of analysis and knowledge discovery in large text collections. This perspective is derived from the traditional method of content analysis, but is less time-consuming and its solutions can be used in the analysis of contents that have not yet been explored. This article presents three different methodological approaches in the analysis of textual data, based on classification using a dictionary to discover the types of attitudes of academic teachers, as characterized by student’s comments in teacher course evaluations at the Jagiellonian University in Krakow for the period 2008–2013. In this paper we show examples of a students’ comments dictionary-based classification and the results, highlighting the advantages and benefits of applied approaches. Moreover we present basic measures describing the accuracy of such classification and multivariate analysis techniques, such as similarity measures in text analysis, hierarchical cluster analysis and correspondence analysis.
Źródło:
Przegląd Socjologiczny; 2015, 64, 4; 51-81
0033-2356
Pojawia się w:
Przegląd Socjologiczny
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies