Temat: data-mining - Katalog OPAC zbiorów

Skocz do pozycji: 1.

Tytuł:: Exchange Rates: Predictable but not Explainable? Data Mining with Leading Indicators and Technical Trading Rules
Możliwości modelowania i prognozowania kursów walutowych: wskaźniki wyprzedzające i analiza techniczna
Autorzy:: Brandl, Bernd
Powiązania:: https://bibliotekanauki.pl/articles/907593.pdf
Data publikacji:: 2005
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: exchange rates
data mining
artificial neural networks
genetic algorithms
Opis:: This paper presents a data mining approach to forecasting exchange rates. It is assumed that exchange rates are determined by both fundamental and technical factors. The balance of fundamental and technical factors varies for each exchange rate and frequency. It is difficult for forecasters to establish the relative relevance of different kinds of factors given this mixture; therefore the utilization of data mining algorithms is advantageous. The approach applied uses a genetic algorithm and neural networks. Out-of-sample forecasting results are illustrated for five exchange rates on different frequencies and it is shown that data mining is able to produce forecasts that perform well.
W artykule przedstawiono proces eksploracji danych statystycznych w prognozowaniu kursów walutowych. Zakładamy, że kursy walutowe pozostają pod wpływem zarówno czynników o charakterze fundamentalnym, jak i czynników pozaekonomicznych. Równowaga pomiędzy tymi czynnikami różni się w zależności od rodzaju kursu walutowego i częstotliwości jego pomiaru. Prognostykom trudno jest ustalić względną siłę wpływu różnych czynników, stąd analiza polegająca na eksploracji danych ma określone zalety. W proponowanym podejściu wykorzystano algorytmy genetyczne i sztuczne sieci neuronowe. Przedstawiliśmy wyniki eksperymentów prognostycznych poza próbą statystyczną w odniesieniu do pięciu kursów walutowych, obserwowanych z różną częstotliwością. Pokazaliśmy, że metoda eksploracji danych może stanowić skuteczne narzędzie prognostyczne.
Źródło:: Acta Universitatis Lodziensis. Folia Oeconomica; 2005, 192
0208-6018
2353-7663
Pojawia się w:: Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 2.

Tytuł:: Using Permutation Tests in Multiple Correlation Investigation
Wykorzystanie testu permutacyjnego w badaniach korelacji wielowymiarowej
Autorzy:: Stelmach, Jacek
Powiązania:: https://bibliotekanauki.pl/articles/906864.pdf
Data publikacji:: 2012
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: permutation tests
Data Mining
correlation analysis
batch process
Monte Carlo
Opis:: An indication of correlation between dependent variable and predictors is a crucial point in building statistical regression model. The test of Pearson correlation coefficient – with relatively good power – needs to fulfill the assumption about normal distribution. In other cases only non-parametric tests can be used. This article presents a possibility and advantages of permutation tests with the discussion about proposed test statistics. The power of proposed tests was estimated on the basis of Monte Carlo experiments. The investigations were carried out for real data – a sample of refinery process parameters, where the indication of changes in correlation, even for sample with small size is very important. It creates an opportunity to react to changes and update statistical models quickly and keep acceptable quality of prediction
Źródło:: Acta Universitatis Lodziensis. Folia Oeconomica; 2012, 269
0208-6018
2353-7663
Pojawia się w:: Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 3.

Tytuł:: Abridged Symbolic Representation of Time Series for Clustering
Skrócona reprezentacja symboliczna szeregów czasowych dla analizy skupień
Autorzy:: Korzeniewski, Jerzy
Powiązania:: https://bibliotekanauki.pl/articles/658783.pdf
Data publikacji:: 2019
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: analiza skupień
szereg czasowy
reprezentacja symboliczna
data mining
clustering
time series
symbolic representation
Opis:: W ostatnich latach pojawiły się metody symbolicznego reprezentowania szeregów czasowych. Te badania są zasadniczo motywowane względami praktycznymi, takimi jak oszczędzanie pamięci lub szybkie przeszukiwanie baz danych. Niektóre wyniki w temacie symbolicznego reprezentowania szeregów czasowych sugerują, że zapis skrócony może nawet poprawić wyniki grupowania. Artykuł zawiera propozycję nowego algorytmu ukierunkowanego na zagadnienie skróconej symbolicznej reprezentacji szeregów czasowych, a w szczególności na efektywne grupowanie szeregów. Idea propozycji polega na wykorzystaniu techniki PAA (piecewise aggregate approximation) z następną analizą korelacji otrzymanych segmentów szeregu. Podstawowym celem artykułu jest modyfikacja techniki PAA ukierunkowana na możliwość dalszego grupowania szeregów w ich skróconym zapisie. Próbowano również znaleźć odpowiedzi na następujące pytania: „Czy zadanie grupowania szeregów czasowych w ich oryginalnej postaci ma sens?”, „Ile pamięci można oszczędzić, stosując nowy algorytm?”. Efektywność nowego algorytmu została zbadana na empirycznych zbiorach danych szeregów czasowych. Wyniki pokazują, że nowa propozycja jest dość efektywna przy bardzo nikłym stopniu parametryzacji wymaganym od użytkownika.
In recent years a couple of methods aimed at time series symbolic representation have been introduced or developed. This activity is mainly justified by practical considerations such memory savings or fast data base searching. However, some results suggest that in the subject of time series clustering symbolic representation can even upgrade the results of clustering. The article contains a proposal of a new algorithm directed at the task of time series abridged symbolic representation with the emphasis on efficient time series clustering. The idea of the proposal is based on the PAA (piecewise aggregate approximation) technique followed by segmentwise correlation analysis. The primary goal of the article is to upgrade the quality of the PAA technique with respect to possible time series clustering (its speed and quality). We also tried to answer the following questions. Is the task of time series clustering in their original form reasonable? How much memory can we save using the new algorithm? The efficiency of the new algorithm was investigated on empirical time series data sets. The results prove that the new proposal is quite effective with a very limited amount of parametric user interference needed.
Źródło:: Acta Universitatis Lodziensis. Folia Oeconomica; 2019, 2, 341; 43-50
0208-6018
2353-7663
Pojawia się w:: Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 4.

Tytuł:: Dane dotyczące miast jako przedmiot badań geograficznych
Autorzy:: Jażdżewska, Iwona
Powiązania:: https://bibliotekanauki.pl/articles/1024141.pdf
Data publikacji:: 2019-12-30
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: geografia miast
eksploracja danych
otwarte dane
ISO
GIScience
urban geography
data mining
open data
ISO standards
Opis:: W pracy przedstawiono problemy, z jakimi można się spotkać podczas analizy danych o mieście, od ich pozyskiwania, poprzez czyszczenie, aż po zapis w odpowiednim formacie. Problem ten jest na tyle istotny, że powinien być jednym z podmiotów badań geograficznych. Zwrócono uwagę na potrzebę dyskusji o danych geograficznych i jej prezentacji na łamach czasopism naukowych. Zasygnalizowano możliwości korzystania z nich i udostępniania w repozytoriach otwartych danych w ramach „otwartej nauki”.
Contemporary geographical data on cities come from various sources, and the increase in their number is an avalanche. As the perception of data is changing, so is the way a geographer thinks and works. The abundance of data on cities obtained from various sensors and from the society makes the research problem recognizable in the context of existing data, which makes it necessary to examine it. This paper presents the problems that can be encountered when analysing data for a geographical science research project, from its acquisition, through cleaning, to recording in the appropriate format.
Źródło:: Konwersatorium Wiedzy o Mieście; 2019, 32, 4; 121-129
2543-9421
2544-1221
Pojawia się w:: Konwersatorium Wiedzy o Mieście
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 5.

Tytuł:: Automatyczne wykrywanie zagrożeń w systemach teleinformatycznych za pomocą metod Data Mining
Automatic Threat Detection in ICT Systems by Selected Data Mining Methods and Software
Autorzy:: Sapała, Kamil
Piołun-Noyszewski, Marcin
Weiss, Marcin
Powiązania:: https://bibliotekanauki.pl/articles/658278.pdf
Data publikacji:: 2018
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: systemy teleinformatyczne
dokumenty cyfrowe
przekształcenia
metody eksploracji danych
ICT systems
electronic documents
transformations
data mining methods
Opis:: The paper presents some real‑time analytical solutions that work in a proprietary‑designed system for IT security. It describes automatic methods of data transformations and analysis aiming at detection of potential threats (irregular system events, abnormal user behavior) both for time series and text documents without human supervision. Automation procedures used for time series and text documents are presented. Analyzed data was collected by Free Construction while protecting systems of electronic documents repositories (also including the Enterprise Content Management standards).
W pracy przedstawiono wybrane rozwiązania analityczne stosowane w czasie rzeczywistym w autorskim systemie bezpieczeństwa teleinformatycznego. Opisano metody wykorzystywane w celu wykrywania (bez nadzoru człowieka) potencjalnych zagrożeń – niepożądanych zdarzeń systemowych i zachowań użytkowników korzystających z dokumentów cyfrowych. Przestawiono procedury automatyzujące, stosowane w przypadku danych mających postać szeregów czasowych i dokumentów tekstowych. Poddane eksploracji dane pochodziły z testowego funkcjonowania oprogramowania zabezpieczającego systemy przechowywania dokumentów cyfrowych utworzonego przez firmę Free Construction.
Źródło:: Acta Universitatis Lodziensis. Folia Oeconomica; 2018, 4, 337; 39-52
0208-6018
2353-7663
Pojawia się w:: Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 6.

Tytuł:: Recomendaciones para la confección de un corpus oral válido para el análisis fonético
Suggestions for building an accurate oral corpus to phonetics analysis
Autorzy:: Polo Cano, Nuria
Powiązania:: https://bibliotekanauki.pl/articles/676249.pdf
Data publikacji:: 2018
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: corpus orales
análisis fonético
habla real
grabaciones
explotación de los datos.
oral corpus
analysis of phonetics
natural speech
recordings
data-mining
Opis:: Mistakes are often made when an oral corpus is collected and sometimes these mistakes could make impossible a future phonetic analysis of the data. To avoid this happen some advices are proposed in this paper regarded to participants, to recordings, and to available tools in order to build an oral corpus. The purpose of this paper is to advice future researchers in building this kind of corpus. These advices will help them to build an accurate corpus to phonetics analysis following current scientific quality standards.
A menudo se cometen errores en la recogida y tratamiento de datos para la confección de un corpus oral, que en ocasiones pueden llegar hasta imposibilitar un posible análisis fonético posterior. Para evitar esto se proponen en estas páginas una serie de consejos previos relativos a los participantes, a las grabaciones y a las herramientas de construcción del corpus; todo ello con la idea de aconsejar al investigador a la hora de construir un corpus oral. Estos consejos le ayudarán a construir un corpus que permita el análisis fonético adecuado con los estándares de calidad científica actuales.
Źródło:: e-Scripta Romanica; 2018, 5; 71-79
2392-0718
Pojawia się w:: e-Scripta Romanica
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 7.

Tytuł:: Metodyka dla analizy treści w projektach stosujących techniki text mining i rozwiązania CAQDAS piątej generacji
Autorzy:: Tomanek, Krzysztof
Powiązania:: https://bibliotekanauki.pl/articles/2033749.pdf
Data publikacji:: 2017
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: analiza treści
Mixed Methods
Big Data
techniki text mining
CAQDAS
Content Analysis
Mixed Methods Approach
Text Mining
Opis:: Projekty, w których przychodzi nam pracować z dużymi wolumenami danych tekstowych, pochodzących z rożnych źródeł i zapisanych w różnorodnych formatach, rodzą wiele dylematów natury metodologicznej, wymagają często niestandardowych decyzji i rozwiązań. W szczególności zadanie polegające na opracowaniu danych o różnorodnej jakości, nieustrukturyzowanych typu quan i qual wymagać może pracy, w której dynamicznie zmieniają się strategie analizy danych, sposoby przekształcania danych tekstowych. Artykuł opisuje przykład takiej właśnie „dynamicznej” metodyki. Wykazała ona swoją wartość w zadaniu polegającym na klasyfikacji wypowiedzi pisanych. W tak zarysowanym kontekście autor artykułu mierzy się z następującymi celami: (a) czy można zastosować oprogramowanie klasy CAQDAS do pracy półautomatycznej lub automatycznej zastępującej część manualnej pracy nad klasyfikacją wypowiedzi? (b) jak skonstruować metodykę klasyfikacji dla danych o różnorodnej jakości? (c) kiedy klasyfikacja automatyczna jest przydatna, a kiedy nie ma szans powodzenia? W artykule zaznaczone zostaną momenty, w których analityk sięga po wiedzę typową dla analiz danych jakościowych oraz te, kiedy wiedza z tego obszaru nie jest już wystarczająca do realizacji wskazanych celów (natural language processing, uczenie maszynowe). Przykład projektu będący tłem artykułu wymusił zastosowanie kilku narzędzi i języków wspierających pracę na danych. Praca nad transformacją, klasyfikacją oraz wizualizacją wyników wymagała zastosowania bazy MySQL oraz programów: R, QDA Miner, Wordstat, QlikSense. Roli i ograniczeniom narzędzi klasy CAQDAS poświęconych zostało także kilka uwag.
Projects which we work with—large volumes of text data that are acquired from various sources and stored in a variety of formats—rise many dilemmas of a methodological nature, often require unstandardized decisions and solutions. In particular, compiling data of various quality, unstructured types, and of quan and qual nature requires dynamic strategies, ideas, and ways of analysis. The article describes an example of this approach. It shows its value in classification of written statements. In such context, the author of the article faces the following objectives: (a) can we use CAQDASso that semiautomatic or automatic work would replace some manual work regarding classification of the expressions; (b) how to construct a classification methodology for data of various quality; (c) when the automatic classification is useful and when there is no chance of success? The article will be marked with moments in which the analyst reaches for knowledge typical for qualitative data analysis, and when the knowledge of this area is no longer sufficient to classify content (natural language processing, machine learning). An example of a project being the background of this article forced the use of several tools and languages to support work with the data. Work on the transformation, classification, and visualization of results required applications such as: MySQL, R, QDA Miner, WordStat, Qlik Sense. Role and limits of the computer-assisted qualitative data analysis software tools have also been noted.
Źródło:: Przegląd Socjologii Jakościowej; 2017, 13, 2; 128-143
1733-8069
Pojawia się w:: Przegląd Socjologii Jakościowej
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 8.

Tytuł:: Mining, Poverty, and Income Inequality in Central and Eastern European Countries: What Do the Data Tell Us?
Górnictwo, ubóstwo i nierówności dochodowe w krajach Europy Środkowej i Wschodniej: co mówią dane?
Autorzy:: Tsaurai, Kunofiwa
Powiązania:: https://bibliotekanauki.pl/articles/1812119.pdf
Data publikacji:: 2021-09-21
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: górnictwo
ubóstwo
nierówności dochodowe
dane panelowe
kraje Europy Środkowej i Wschodniej
mining
poverty
income inequality
panel data
CEECs
Opis:: The study investigates the effect of mining on both poverty and income inequality in Central and Eastern European countries (CEECs) using econometric estimation methods with panel data spanning from 2009 to 2019. Another objective of this paper was to determine if the complementarity between mining and infrastructural development reduced poverty and or income inequality in CEECs. What triggered the study is the failure of the existing literature to have a common ground regarding the impact of mining on poverty and or income inequality. The existing literaturę on the subject matter is contradictory, mixed, and divergent; hence, it paves the way for further empirical tests. The study confirmed that the vicious cycle of poverty is relevant in CEECs. According to the dynamic generalized methods of moments (GMM), mining had a significant poverty reduction influence in CEECs. The dynamic GMM and random effects revealed that the complementarity between mining and infrastructural development also enhanced poverty reduction in CEECs. Random effects and pooled OLS shows that mining significantly reduced income inequality in CEECs. However, random effects and the dynamic GMM results indicate that income inequality was significantly reduced by the complementarity between mining and infrastructural development. The authorities in CEECs are therefore urged to implement mining growth and infrastructural development-oriented policies in order to successfully fight off the twin challenges of poverty and income inequality.
Artykuł prezentuje wyniki badania wpływu górnictwa zarówno na ubóstwo, jak i na nierówności dochodowe w krajach Europy Środkowej i Wschodniej, przy użyciu metod estymacji ekonometrycznej z wykorzystaniem danych panelowych z lat 2009–2019. Drugim celem tego artykułu było ustalenie, czy komplementarność górnictwa i rozwoju infrastruktury zmniejsza ubóstwo lub nierówności dochodowe w krajach Europy Środkowej i Wschodniej. Impulsem do podjęcia badań był brak w istniejącej literaturze przedmiotu wspólnego stanowiska w kwestii wpływu górnictwa na ubóstwo i nierówności dochodowe. Istniejąca literatura na ten temat jest sprzeczna, niejednoznaczna i rozbieżna, dlatego też otwiera drogę do dalszych badań empirycznych. Badanie potwierdziło, że błędne koło ubóstwa występuje w krajach Europy Środkowej i Wschodniej. Zgodnie z dynamicznymi uogólnionymi metodami momentów (GMM), górnictwo miało znaczący wpływ na redukcję ubóstwa w krajach Europy Środkowej i Wschodniej. Dynamiczna metoda momentów GMM i efektów losowych ujawniły, że komplementarność górnictwa i rozwoju infrastruktury również przyczyniła się do zmniejszenia ubóstwa w krajach Europy Środkowej i Wschodniej. Metoda efektów losowych i metoda pooled OLS pokazują, że górnictwo znacząco zmniejszyło nierówności dochodowe w krajach Europy Środkowej i Wschodniej. Jednak wyniki uzyskane przy zastosowaniu metody efektów losowych i dynamicznej metody GMM wskazują, że nierówności dochodowe zostały znacznie zmniejszone dzięki komplementarności górnictwa i rozwoju infrastruktury. W związku z tym zachęca się władze krajów Europy Środkowej i Wschodniej do wdrażania polityk ukierunkowanych na rozwój górnictwa i rozwój infrastruktury, aby skutecznie walczyć z podwójnymi wyzwaniami związanymi z ubóstwem i nierównościami dochodowymi.
Źródło:: Comparative Economic Research. Central and Eastern Europe; 2021, 24, 3; 7-25
1508-2008
2082-6737
Pojawia się w:: Comparative Economic Research. Central and Eastern Europe
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 9.

Tytuł:: Analiza sentymentu – metoda analizy danych jakościowych. Przykład zastosowania oraz ewaluacja słownika RID i metody klasyfikacji Bayesa w analizie danych jakościowych
Sentiment analysis. An example of application and evaluation of RID dictionary and Bayesian classification methods in qualitative data analysis approach
Autorzy:: Tomanek, Krzysztof
Powiązania:: https://bibliotekanauki.pl/articles/622902.pdf
Data publikacji:: 2014
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: analiza danych jakościowych
analiza sentymentu
analiza treści
text mining
kodowanie tekstów
przetwarzanie języka naturalnego słownik RID
naiwny klasyfikator Bayesa
CAQDAS
qualitative data analysis
sentiment analysis
content analysis
coding techniques
natural language processing
RID dictionary
naive Bayes
Opis:: Celem artykułu jest prezentacja podstawowych metod klasyfikacji jakościowych danych tekstowych. Metody te korzystają z osiągnięć wypracowanych w takich obszarach, jak przetwarzanie języka naturalnego i analiza danych nieustrukturalizowanych. Przedstawiam i porównuję dwie techniki analityczne stosowane wobec danych tekstowych. Pierwsza to analiza z zastosowaniem słownika tematycznego. Druga technika oparta jest na idei klasyfikacji Bayesa i opiera się na rozwiązaniu zwanym naiwnym klasyfikatorem Bayesa. Porównuję efektywność dwóch wspomnianych technik analitycznych w ramach analizy sentymentu. Akcentuję rozwiązania mające na celu zbudowanie trafnego, w kontekście klasyfikacji tekstów, słownika. Porównuję skuteczność tak zwanych analiz nadzorowanych do skuteczności analiz zautomatyzowanych. Wyniki, które prezentuję, wzmacniają wniosek, którego treść brzmi: słownik, który w przeszłości uzyskał dobrą ocenę jako narzędzie klasyfikacyjne, gdy stosowany jest wobec nowego materiału empirycznego, powinien przejść fazę ewaluacji. Jest to, w proponowanym przeze mnie podejściu, podstawowy proces adaptacji słownika analitycznego, traktowanego jako narzędzie klasyfikacji tekstów.
The purpose of this article is to present the basic methods for classifying text data. These methods make use of achievements earned in areas such as: natural language processing, the analysis of unstructured data. I introduce and compare two analytical techniques applied to text data. The first analysis makes use of thematic vocabulary tool (sentiment analysis). The second technique uses the idea of Bayesian classification and applies, so-called, naive Bayes algorithm. My comparison goes towards grading the efficiency of use of these two analytical techniques. I emphasize solutions that are to be used to build dictionary accurate for the task of text classification. Then, I compare supervised classification to automated unsupervised analysis’ effectiveness. These results reinforce the conclusion that a dictionary which has received good evaluation as a tool for classification should be subjected to review and modification procedures if is to be applied to new empirical material. Adaptation procedures used for analytical dictionary become, in my proposed approach, the basic step in the methodology of textual data analysis.
Źródło:: Przegląd Socjologii Jakościowej; 2014, 10, 2; 118-136
1733-8069
Pojawia się w:: Przegląd Socjologii Jakościowej
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Informacja

Wyszukujesz frazę "data-mining" wg kryterium: Temat

Źródło danych

Dostawca treści

Kolekcja

Rok wydania

Wydawca

Temat

Autor

Typ dokumentu

Język