Temat: analiza danych symbolicznych - Katalog OPAC zbiorów

Skocz do pozycji: 1.

Tytuł:: Podejście wielomodelowe analizy danych symbolicznych w ocenie zdolności kredytowej osób fizycznych
Autorzy:: Pełka, Marcin
Powiązania:: https://bibliotekanauki.pl/articles/580566.pdf
Data publikacji:: 2018
Wydawca:: Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:: zdolność kredytowa
analiza danych symbolicznych
podejście wielomodelowe
Opis:: Ustawa prawo bankowe definiuje zdolność kredytową jako zdolność do spłaty zaciągniętego kredytu wraz z odsetkami w terminach określonych w umowie. Analiza i ocena zdolności kredytowej jest kluczowym zagadnieniem z punktu widzenia banku. W ocenie zdolności kredytowej istotne miejsce zajmują szeroko rozumiane metody analizy danych – w tym podejście wielomodelowe. Głównym celem artykułu jest zaprezentowanie zastosowania podejścia wielomodelowego danych symbolicznych w ocenie zdolności kredytowej osób fizycznych (na przykładzie dwóch zbiorów danych rzeczywistych) oraz porównanie wyników otrzymanych z zastosowaniem podejścia wielomodelowego z pojedynczym modelem oraz znaną przynależnością obiektów do klas. Otrzymane wyniki wskazują, że podejście wielomodelowe analizy danych symbolicznych może być użytecznym narzędziem w ocenie zdolności kredytowej osób fizycznych i pozwala otrzymać z reguły lepsze wyniki niż model pojedynczy.
Źródło:: Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu; 2018, 507; 200-207
1899-3192
Pojawia się w:: Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 2.

Tytuł:: Isolation Forests for Symbolic Data as a Tool for Outlier Mining
Lasy separujące dla danych symbolicznych jako narzędzie wykrywania obserwacji odstających
Autorzy:: Pełka, Marcin
Dudek, Andrzej
Powiązania:: https://bibliotekanauki.pl/articles/31233541.pdf
Data publikacji:: 2024
Wydawca:: Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:: symbolic data analysis
isolation forest
outliers
analiza danych symbolicznych
lasy separujące
obserwacje odstające
Opis:: Aim: Outlier detection is a key part of every data analysis. Although there are many definitions of outliers that can be found in the literature, all of them emphasise that outliers are objects that are in some way different from other objects in the dataset. There are many different approaches that have been proposed, compared, and analysed for the case of classical data. However, there are only few studies that deal with the problem of outlier detection in symbolic data analysis. The paper aimed to propose how to adapt isolation forest for symbolic data cases. Methodology: An isolation forest for symbolic data is used to detect outliers in four different artificial datasets with a known cluster structure and a known number of outliers Results: The results show that the isolation forest for symbolic data is a fast and efficient tool for outlier mining. Implications and recommendations: As the isolation forest for symbolic data appears to be an efficient tool for outlier detection for artificial data, further studies should focus on real data sets that contain outliers (i.e. credit card fraud dataset), and this approach should be compared with other outlier mining tools (i.e. DBCSAN). The authors recommend using the same initial settings for the isolation forest for symbolic data as the settings that are proposed for the isolation forest for classical data. Originality/value: This paper is the first of its kind, focusing not only on the problem of outlier detection in general, but also extending the well-known isolation forest model for symbolic data cases. Keywords: symbolic data analysis, isolation forest, outliers
Cel: Identyfikacja obserwacji odstających stanowi kluczowy element w analizie danych. Pomimo że w literaturze funkcjonuje wiele różnych definicji, czym są obserwacje odstające, to ogólnie można stwierdzić, że są to obiekty różniące się od pozostałych obserwacji ze zbioru danych. Literatura przedmiotu wskazuje wiele różnorodnych metod, które można wykorzystać w przypadku danych klasycznych. Niestety w przypadku danych symbolicznych brakuje takich analiz. Celem artykułu jest zaproponowanie modyfikacji lasów separujących (isolation forests) dla danych symbolicznych. Metodyka: W artykule wykorzystano lasy separujące dla danych symbolicznych do identyfikacji obserwacji odstających w sztucznych zbiorach danych o znanej strukturze klas i znanej liczbie obserwacji odstających. Wyniki: Otrzymane wyniki wskazują, że lasy separujące dla danych symbolicznych są efektywnym i szybkim narzędziem w identyfikacji obserwacji odstających. Implikacje i rekomendacje: Ponieważ lasy separujące dla danych symbolicznych okazały się skutecznym narzędziem w identyfikacji obserwacji odstających, celem przyszłych badań powinno być przeanalizowanie skuteczności tej metody w przypadku rzeczywistych zbiorów danych (np. zbioru dotyczącego oszustw z użyciem kart kredytowych), a także porównanie tej metody z innymi metodami, które pozwalają odnaleźć obserwacje odstające (np. DBSCAN). Autorzy sugerują, by w przypadku lasów separujących dla danych symbolicznych stosować te same parametry, jakie zwykle stosuje się w przypadku lasów losowych dla danych klasycznych. Oryginalność/wartość: Artykuł nie tylko stanowi ujęcie teorii w zakresie obserwacji odstających, ale jednocześnie proponuje, jak zastosować lasy separujące w przypadku danych symbolicznych.
Źródło:: Econometrics. Ekonometria. Advances in Applied Data Analytics; 2024, 28, 1; 1-10
1507-3866
Pojawia się w:: Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 3.

Tytuł:: The Comparison of Fuzzy Clustering Methods for Symbolic Interval-Valued Data
Porównanie metod klasyfikacji rozmytej dla danych symbolicznych interwałowych
Autorzy:: Pełka, Marcin
Dudek, Andrzej
Powiązania:: https://bibliotekanauki.pl/articles/1364881.pdf
Data publikacji:: 2015-09-30
Wydawca:: Główny Urząd Statystyczny
Tematy:: spectral clustering
fuzzy clustering
fuzzy partition
interval-valued data
symbolic data analysis
klasyfikacja spektralna
klasyfikacja rozmyta
dane symboliczne interwałowe
analiza danych symbolicznych
Opis:: Interval-valued data can find their practical applications in such situations as recording monthly interval temperatures at meteorological stations, daily interval stock prices, etc. The primary objective of the presented paper is to compare three different methods of fuzzy clustering for interval-valued symbolic data, i.e.: fuzzy c-means clustering, adaptive fuzzy c-means clustering and fuzzy k-means clustering with fuzzy spectral clustering. Fuzzy spectral clustering combines both spectral and fuzzy approaches in order to obtain better results (in terms of Rand index for fuzzy clustering). The conducted simulation studies with artificial and real data sets confirm both higher usefulness and more stable results of fuzzy spectral clustering method, as compared to other existing fuzzy clustering methods for symbolic interval-valued data, when dealing with data featuring different cluster structures, noisy variables and/or outliers.
Dane symboliczne interwałowe mogą znaleźć zastosowanie w wielu sytuacjach – np. w przypadku notowań giełdowych, zmianach kursów walut, itp. Celem artykułu jest porównanie trzech metod klasyfikacji rozmytej dla danych symbolicznych interwałowych – tj. rozmytej klasyfikacji c-średnich, adaptacyjnej rozmytej klasyfikacji c-średnich oraz rozmytej klasyfikacji k-średnich z rozmytą klasyfikacją spektralną. Rozmyta klasyfikacja spektralna stanowi połączenie podejścia spektralnego oraz klasyfikacji rozmytej c-średnich, dzięki czemu możliwe jest otrzymanie lepszych rezultatów (w sensie indeksu Randa dla klasyfikacji rozmytych). Przeprowadzone badania symulacyjne wskazują, że rozmyta klasyfikacja spektralna dla danych symbolicznych pozwala na uzyskanie lepszych wyników niż inne rozmyte metody klasyfikacji dla tego typu danych jeżeli weźmiemy pod uwagę zbiory danych o różnej strukturze klas, która dodatkowo jest zniekształcana przez obserwacje odstające lub zmienne zakłócające.
Źródło:: Przegląd Statystyczny; 2015, 62, 3; 301-319
0033-2372
Pojawia się w:: Przegląd Statystyczny
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Informacja

Wyszukujesz frazę "analiza danych symbolicznych" wg kryterium: Temat

Źródło danych

Dostawca treści

Kolekcja

Rok wydania

Wydawca

Temat

Autor

Typ dokumentu

Język