Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "data analysis" wg kryterium: Wszystkie pola


Wyświetlanie 1-10 z 10
Tytuł:
Unfolding analysis adaptation for symbolic data – hybrid and symbolic-numeric approach
Autorzy:
Zaborski, Artur
Pełka, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/425012.pdf
Data publikacji:
2013
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
symbolic data analysis
unfolding analysis
preference data
Opis:
The aim of this paper is to propose and present adaptations of unfolding analysis for symbolic data. In the article, the basic terms of unfolding analysis and symbolic data are presented. The paper presents two approaches – the internal hybrid approach and the external symbolic-numeric approach. In the empirical part, the external symbolic-numeric unfolding for LCD brands is presented. Symbolic multidimensional scaling R source codes were written by authors.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2013, 3(41); 32-39
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analysis of innovations in the European Union via ensemble symbolic density clustering
Analiza innowacyjności krajów Unii Europejskiej z zastosowaniem wielomodelowej klasyfikacji gęstościowej danych symbolicznych
Autorzy:
Pełka, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/425070.pdf
Data publikacji:
2018
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
innovations
European Union
symbolic data analysis
ensemble clustering
Opis:
Innovations play a very important role in the modern economy. They are the key to a higher quality of life, better jobs and economy and sustainable development. The innovation policy is a key element of both national and European Union strategy. The main aim of this paper is to present an ensemble clustering of European Union countries (member states) considering their innovativeness. In the empirical section, symbolic density-based ensemble clustering is used to obtain the co-occurrence matrix. The paper uses symbolicDA, clusterSim and dbscan packages of R software for all calculations. Four different clusters where obtained in the result of clustering. Cluster 1 contains highinnovative countries (innovation leaders). This cluster is also the least homogenous. Cluster 2 contains post-communist countries mainly from central Europe. These countries can be seen as rather mid-low innovative (they try to “catch up” with innovation leaders). Cluster 3 contains moderate innovators. Cluster 4 contains two countries that are also mid-innovative.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2018, 22, 3; 84-98
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analysis of happiness in EU countries using the multi-model classification based on models of symbolic data
Autorzy:
Pełka, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/425036.pdf
Data publikacji:
2019
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
happiness
the European Union
symbolic data analysis
ensemble clustering
Opis:
The results of happiness analysis are presented in the form of a World Happiness Report that covers 156 countries and 17 different indicators. In the article model-based clustering ensemble is built to determine what selected European countries have similar patterns of happiness. The results are analyzed using multidimensional scaling and a decision tree to find out what factors determine cluster memberships. In the empirical part, three clusters were detected The first contains countries: Austria, Denmark, Finland, Germany, Ireland, Luxembourg, the Netherlands, Norway, Sweden, Switzerland and the United Kingdom. They have the highest values for all the variables, except the negative affect. The second cluster contains seven countries: Bulgaria, Estonia, Hungary, Lithuania, Poland, Romania and Slovakia. This cluster is also the most homogeneous one. The third cluster contains eight countries: Cyprus, the Czech Republic, France, Greece, Italy, Portugal, Slovenia and Spain.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2019, 23, 3; 15-25
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Regresja logistyczna dla danych symbolicznych interwałowych
Logistic regression for interval-valued symbolic data
Autorzy:
Pełka, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/424986.pdf
Data publikacji:
2015
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
logistic regression
interval-valued symbolic variables
symbolic data analysis
Opis:
When dealing with real data situation we often have a binary (biomial, dichoto-mous) dependent variable. As the linear probability model is not such a good solution in such a situation there is a need to use nonlinear models. A quite good solution for such a sit-uation is the logistic regression model. The paper presents an adaptation of linear regression model when dealing with symbolic interval-valued variables. Four approaches poposed by de Souza et. al [2011] how to apply such variables are presented. In the empirical part re-sults obtained with the application of artificial and real data sets are shown. The best results are obtained for midpoint and bounds (joint estimation) methods.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2015, 2 (48); 44-52
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Cluster Analysis – Symbolic vs. Classical Data
Analiza skupień – dane symboliczne a dane klasyczne
Autorzy:
Wilk, Justyna
Pełka, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/904587.pdf
Data publikacji:
2013
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
cluster analysis
symbolic data analysis
classification
numerical taxonomy
symbolic taxonomy
Opis:
Clustering problem is addressed in many contexts and disciplines. Although there are numerous studies on cluster analysis, there is a lack of a review to complete and systematize knowledge of research approach depending on data form. The paper presents a concept of clustering, classifications of cluster analysis methods, comparison of numerical and symbolic taxonomy, specificity of symbolic data as regards classical data, methods of numerical and symbolic data analysis applicable in clustering procedure.
Celem artykułu jest usystematyzowanie wiedzy na temat analizy skupień w zależności od rodzaju danych empirycznych opisujących problem badawczy. W artykule zaprezentowano cele analizy skupień, dokonano klasyfikacji metod analizy skupień, porównano metody taksonomii numerycznej i symbolicznej. Omówiono także specyfikę danych symbolicznych w odniesieniu do danych w ujęciu klasycznym oraz ich źródła w badaniach ekonomicznych. Wskazano metody statystyczne, jakie mają zastosowanie w analizie danych klasycznych i symbolicznych na każdym etapie procedury klasyfikacji.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2013, 286
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Isolation Forests for Symbolic Data as a Tool for Outlier Mining
Lasy separujące dla danych symbolicznych jako narzędzie wykrywania obserwacji odstających
Autorzy:
Pełka, Marcin
Dudek, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/31233541.pdf
Data publikacji:
2024
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
symbolic data analysis
isolation forest
outliers
analiza danych symbolicznych
lasy separujące
obserwacje odstające
Opis:
Aim: Outlier detection is a key part of every data analysis. Although there are many definitions of outliers that can be found in the literature, all of them emphasise that outliers are objects that are in some way different from other objects in the dataset. There are many different approaches that have been proposed, compared, and analysed for the case of classical data. However, there are only few studies that deal with the problem of outlier detection in symbolic data analysis. The paper aimed to propose how to adapt isolation forest for symbolic data cases. Methodology: An isolation forest for symbolic data is used to detect outliers in four different artificial datasets with a known cluster structure and a known number of outliers Results: The results show that the isolation forest for symbolic data is a fast and efficient tool for outlier mining. Implications and recommendations: As the isolation forest for symbolic data appears to be an efficient tool for outlier detection for artificial data, further studies should focus on real data sets that contain outliers (i.e. credit card fraud dataset), and this approach should be compared with other outlier mining tools (i.e. DBCSAN). The authors recommend using the same initial settings for the isolation forest for symbolic data as the settings that are proposed for the isolation forest for classical data. Originality/value: This paper is the first of its kind, focusing not only on the problem of outlier detection in general, but also extending the well-known isolation forest model for symbolic data cases. Keywords: symbolic data analysis, isolation forest, outliers
Cel: Identyfikacja obserwacji odstających stanowi kluczowy element w analizie danych. Pomimo że w literaturze funkcjonuje wiele różnych definicji, czym są obserwacje odstające, to ogólnie można stwierdzić, że są to obiekty różniące się od pozostałych obserwacji ze zbioru danych. Literatura przedmiotu wskazuje wiele różnorodnych metod, które można wykorzystać w przypadku danych klasycznych. Niestety w przypadku danych symbolicznych brakuje takich analiz. Celem artykułu jest zaproponowanie modyfikacji lasów separujących (isolation forests) dla danych symbolicznych. Metodyka: W artykule wykorzystano lasy separujące dla danych symbolicznych do identyfikacji obserwacji odstających w sztucznych zbiorach danych o znanej strukturze klas i znanej liczbie obserwacji odstających. Wyniki: Otrzymane wyniki wskazują, że lasy separujące dla danych symbolicznych są efektywnym i szybkim narzędziem w identyfikacji obserwacji odstających. Implikacje i rekomendacje: Ponieważ lasy separujące dla danych symbolicznych okazały się skutecznym narzędziem w identyfikacji obserwacji odstających, celem przyszłych badań powinno być przeanalizowanie skuteczności tej metody w przypadku rzeczywistych zbiorów danych (np. zbioru dotyczącego oszustw z użyciem kart kredytowych), a także porównanie tej metody z innymi metodami, które pozwalają odnaleźć obserwacje odstające (np. DBSCAN). Autorzy sugerują, by w przypadku lasów separujących dla danych symbolicznych stosować te same parametry, jakie zwykle stosuje się w przypadku lasów losowych dla danych klasycznych. Oryginalność/wartość: Artykuł nie tylko stanowi ujęcie teorii w zakresie obserwacji odstających, ale jednocześnie proponuje, jak zastosować lasy separujące w przypadku danych symbolicznych.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2024, 28, 1; 1-10
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Unfolding Analysis for Symbolic Objects Based on the Example of the External Car Advertisement Evaluation
Analiza unfolding obiektów symbolicznych na przykładzie zewnętrznej oceny reklam samochodów
Autorzy:
Zaborski, Artur
Pełka, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/28407778.pdf
Data publikacji:
2023
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
symbolic data analysis
unfolding analysis
preference measurement
car advertisements
symboliczna analiza danych
analiza unfolding
pomiar preferencji
reklamy samochodów
Opis:
Aim: Multidimensional unfolding allows representing both columns (e.g. products, services) and rows (e.g. customers) of the preference matrix on the same low-dimensional map (usually it’s a two or three-dimensional map). The main aim of the paper was to propose how to perform unfolding analysis for symbolic objects. Methodology: The paper describes the possible ways of performing unfolding analysis for symbolic interval-valued data. The external unfolding is described in the details and used in the empirical part of the paper. The data (preferences and dissimilarities) were gathered by using the incomplete method of triads. Results: The empirical part presents an application for unfolding symbolic data to evaluate customers’ preferences, where car advertisements are used as the example. The results presented on a two-dimensional perceptual map allowed to discover seven groups of respondents with different preferences; most of them prefer Skoda, Audi, Volkswagen, and Honda advertisements to Toyota and Volvo. Implications and recommendations: The proposed external approach for symbolic data allows to represent objects as rectangles (on two-dimensional map) or cuboids (in the case of three dimensions). The respondents are represented as points. Further work should focus on creating an algorithm that allows for the presentation of both symbolic objects and preferences expressed by respondents in the form of rectangles or cuboids. Originality/Value: The paper presents an innovative and previously unpresented external unfolding for symbolic data. Besides that it presents how other unfolding approaches could be adapted for symbolic data.
Cel: Wielowymiarowa analiza unfolding pozwala na przedstawienie zarówno kolumn (np. produktów, usług), jak i wierszy (np. klientów) macierzy preferencji na tej samej mapie percepcyjnej (zwykle jest to mapa dwulub trójwymiarowa). Celem artykułu jest wskazanie propozycji przeprowadzenia analizy unfolding dla obiektów symbolicznych. Metodyka: W artykule opisano możliwe sposoby przeprowadzenia analizy unfolding dla symbolicznych danych przedziałowych. Szczegółowo opisana zewnętrzna analiza unfolding została wykorzystana w części empirycznej artykułu. Dane (zarówno preferencje, jak i niepodobieństwa) zebrano z wykorzystaniem niepełnej metody triad. Wyniki: W części empirycznej zaprezentowano możliwości zastosowania analizy unfolding dla danych symbolicznych w badaniu preferencji respondentów na przykładzie oceny wybranych reklam samochodów. Wyniki zilustrowane na dwuwymiarowej mapie percepcyjnej pozwoliły zidentyfikować siedem grup respondentów o różnych preferencjach względem przedstawionych reklam. Wyniki badania wskazują, że dla większości respondentów reklamy Škody, Audi, Hondy i Volkswagena są bardziej preferowane niż reklamy proponowane przez Volvo i Toyotę. Implikacje i rekomendacje: Zaprezentowane podejście do zewnętrznej analizy unfolding pozwala na prezentację obiektów w postaci prostokątów (w przestrzeni dwuwymiarowej) lub prostopadłościanów (w przestrzeni trójwymiarowej), a respondentów – w postaci punktów. Dalsze prace powinny skoncentrować się na stworzeniu algorytmu pozwalającego na prezentację zarówno obiektów symbolicznych, jak i wyrażanych przez respondentów preferencji w postaci prostokątów lub prostopadłościanów. Oryginalność/Wartość: Artykuł prezentuje nowatorskie i nieprezentowane wcześniej podejście do zewnętrznej analizy unfolding dla danych symbolicznych. Ponadto przedstawia inne możliwe podejścia do symbolicznej analizy unfolding.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2023, 27, 4; 15-28
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Comparison of Fuzzy Clustering Methods for Symbolic Interval-Valued Data
Porównanie metod klasyfikacji rozmytej dla danych symbolicznych interwałowych
Autorzy:
Pełka, Marcin
Dudek, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/1364881.pdf
Data publikacji:
2015-09-30
Wydawca:
Główny Urząd Statystyczny
Tematy:
spectral clustering
fuzzy clustering
fuzzy partition
interval-valued data
symbolic data analysis
klasyfikacja spektralna
klasyfikacja rozmyta
dane symboliczne interwałowe
analiza danych symbolicznych
Opis:
Interval-valued data can find their practical applications in such situations as recording monthly interval temperatures at meteorological stations, daily interval stock prices, etc. The primary objective of the presented paper is to compare three different methods of fuzzy clustering for interval-valued symbolic data, i.e.: fuzzy c-means clustering, adaptive fuzzy c-means clustering and fuzzy k-means clustering with fuzzy spectral clustering. Fuzzy spectral clustering combines both spectral and fuzzy approaches in order to obtain better results (in terms of Rand index for fuzzy clustering). The conducted simulation studies with artificial and real data sets confirm both higher usefulness and more stable results of fuzzy spectral clustering method, as compared to other existing fuzzy clustering methods for symbolic interval-valued data, when dealing with data featuring different cluster structures, noisy variables and/or outliers.
Dane symboliczne interwałowe mogą znaleźć zastosowanie w wielu sytuacjach – np. w przypadku notowań giełdowych, zmianach kursów walut, itp. Celem artykułu jest porównanie trzech metod klasyfikacji rozmytej dla danych symbolicznych interwałowych – tj. rozmytej klasyfikacji c-średnich, adaptacyjnej rozmytej klasyfikacji c-średnich oraz rozmytej klasyfikacji k-średnich z rozmytą klasyfikacją spektralną. Rozmyta klasyfikacja spektralna stanowi połączenie podejścia spektralnego oraz klasyfikacji rozmytej c-średnich, dzięki czemu możliwe jest otrzymanie lepszych rezultatów (w sensie indeksu Randa dla klasyfikacji rozmytych). Przeprowadzone badania symulacyjne wskazują, że rozmyta klasyfikacja spektralna dla danych symbolicznych pozwala na uzyskanie lepszych wyników niż inne rozmyte metody klasyfikacji dla tego typu danych jeżeli weźmiemy pod uwagę zbiory danych o różnej strukturze klas, która dodatkowo jest zniekształcana przez obserwacje odstające lub zmienne zakłócające.
Źródło:
Przegląd Statystyczny; 2015, 62, 3; 301-319
0033-2372
Pojawia się w:
Przegląd Statystyczny
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Podejście wielomodelowe analizy danych symbolicznych w ocenie pozycji produktów na rynku
Ensemble learning for symbolic datain product positioning
Autorzy:
Pełka, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/424929.pdf
Data publikacji:
2013
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
ensemble clustering
cluster analysis of symbolic data
product positioning
Opis:
Product positioning is a wide range of business activities. Positioning is the process by which marketers try to create an image or identity in the minds of their target market for its product, brand, or organization. The main aim of the paper is to preset and apply ensemble learning for symbolic data in cluster analysis in order to evaluate a product position. Empirical part of the paper presents the application of co-occurrence matrix and bagging algorithm in ensemble learning for symbolic data (car market data was used). These two approaches reached almost the same results when considering adjusted Rand index.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2013, 2(40); 95-102
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Regression analysis for interval-valued symbolic data versus noisy variables and outliers
Regresja liniowa danych symbolicznych a zmienne zakłócające i obserwacje odstające
Autorzy:
Pełka, Marcin
Dudek, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/425104.pdf
Data publikacji:
2016
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
regression analysis
interval-valued symbolic data
noisy variables
outliers
Opis:
Regression analysis is perhaps the best known and most widely used method used for the analysis of dependence; that is, for examining the relationship between a set of independent variables (X’s) and a single dependent variable (Y). In general regression, the model is a linear combination of independent variables that corresponds as closely as possible to the dependent variable [Lattin, Carroll, Green 2003, p. 38]. The aim of the article is to present two suitable adaptations for a regression analysis of symbolic interval-valued data (centre method and centre and range method) and to compare their usefulness when dealing with noisy variables and/or outliers. The empirical part of the paper presents the results of simulation studies based on artificial and real data, without noisy variables and/or outliers and with noisy variable and outliers. The results are compared according to the values of two coefficients of determination 2 RL and 2 . RU The results show that usually the centre and range method obtains better results even when the data set contains noisy variables and outliers, but in some cases the centre method obtains better results than the centre and range method.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2016, 2 (52); 35-42
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-10 z 10

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies