Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Imbalanced dataset" wg kryterium: Temat


Wyświetlanie 1-3 z 3
Tytuł:
Ensemble-based Method of Fraud Detection at Self-checkouts in Retail
Autorzy:
Vitynskyi, P.
Tkachenko, R.
Izonin, I.
Powiązania:
https://bibliotekanauki.pl/articles/410756.pdf
Data publikacji:
2019
Wydawca:
Polska Akademia Nauk. Oddział w Lublinie PAN
Tematy:
classification
Ensemble-based method
Random Forest
fraud detection
retail
Ito decomposition
imbalanced dataset
Opis:
The authors consider the problem of fraud detection at self-checkouts in retail in condition of unbalanced data set. A new ensemble-based method is proposed for its effective solution. The developed method involves two main steps: application of the preprocessing procedures and the Random Forest algorithm. The step-by-step implementation of the preprocessing stage involves the sequential execution of such procedures over the input data: scaling by maximal element in a column with row-wise scaling by Euclidean norm, weighting by correlation and applying polynomial extension. For polynomial extension Ito decomposition of the second degree is used. The simulation of the method was carried out on real data. Evaluating performance was based on the use of cost matrix. The experimental comparison of the effectiveness of the developed ensemble-based method with a number of existing (simples and ensembles) demonstrates the best performance of the developed method. Experimental studies of changing the parameters of the Random Forest both for the basic algorithm and for the developed method demonstrate a significant improvement of the investigated efficiency measures of the latter. It is the result of all steps of the preprocessing stage of the developed method use.
Źródło:
ECONTECHMOD : An International Quarterly Journal on Economics of Technology and Modelling Processes; 2019, 8, 2; 3-8
2084-5715
Pojawia się w:
ECONTECHMOD : An International Quarterly Journal on Economics of Technology and Modelling Processes
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wykrywanie zagrożenia upadłością jako problem klasyfikacji danych niezbalansowanych
Bankruptcy prediction as imbalanced classification problem
Autorzy:
Paliński, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/2041253.pdf
Data publikacji:
2020
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Klasyfikacja
Preprocessing
Uczenie maszynowe
Upadłość
Zbiór niezbalansowany
Bankruptcy
Classification
Imbalanced dataset
Machine learning
Opis:
W artykule wykorzystano wybrane algorytmy uczenia maszynowego oraz techniki przygotowania danych (preprocessing) stosowane w klasyfikacji na zbiorach niezbalansowanych w celu oceny ich skuteczności w prognozowaniu upadłości z użyciem danych zawierających wskaźniki finansowe podmiotów gospodarczych. Trafność prognoz upadłości na pierwotnym niezbalansowanym zbiorze danych o przeważającym udziale podmiotów prowadzących działalności nad upadłymi była bliska zero. Trafność prognozowania upadłości klasyfikatorów utworzonych na zbiorach zbalansowanych była odwrotnie proporcjonalna do całkowitej trafności klasyfikacji i wahała się od 10% – dla całkowitej trafności klasyfikacji wynoszącej 93%, do 77% – dla całkowitej trafności klasyfikacji równej 49%. Lepsze wyniki klasyfikacji osiągały algorytmy gradient boosting i drzewo klasyfikacyjne w stosunku do sztucznej sieci neuronowej. W problemie klasyfikacji na zbiorach niezbalansowanych wystąpił efekt wymiany – albo możliwe jest zwiększenie trafności klasyfikacji upadłości kosztem nadmiarowości obiektów kla-syfikowanych jako upadłe, albo – zwiększenie trafności klasyfikacji całkowitej algorytmu kosztem zmniejszenia trafności klasyfikacji samej upadłości.
Selected machine learning algorithms and data preprocessing techniques were used in the article to predict bankruptcy on an unbalanced data set containing financial ratios. The accuracy of bankruptcy forecasts on the original unbalanced data set of the prevailing share of entities still operating over the bankrupt ones was close to zero. The accuracy of bankruptcy forecasting classifiers created on balanced sets ranged from 10% to 77%, but was inversely proportional to the total accuracy of the classification, which ranged from 93% to 49%. Better classification results were achieved by the classification trees algorithms in relation to the artificial neural network. In the problem of classification in unbalanced data sets the effect of substitution occurred – or it is possible to increase the accuracy of classification of bankruptcy at the expense of redundancy of objects classified as bankrupt, or – to increase the accuracy of the overall classification of the algorithm at the expense of decreasing the classification of the bankruptcy itself.
Źródło:
Studia Ekonomiczne; 2020, 395; 66-79
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Bounded-abstaining classification for breast tumors in imbalanced ultrasound images
Autorzy:
Guan, Hongjiao
Zhang, Yingtao
Cheng, Heng-Da
Tang, Xianglong
Powiązania:
https://bibliotekanauki.pl/articles/330479.pdf
Data publikacji:
2020
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
breast ultrasound image
reliable diagnosis
abstaining classification
imbalanced dataset
ultrasonografia piersi
diagnoza wiarygodna
zbiór danych niezrównoważony
Opis:
Computer-aided breast ultrasound (BUS) diagnosis remains a difficult task. One of the challenges is that imbalanced BUS datasets lead to poor performance, especially with regard to low accuracy in the minority (malignant tumor) class. Missed diagnosis of malignant tumors can cause serious consequences, such as delaying treatment and increasing the risk of death. Moreover, many diagnosis methods do not consider classification reliability; thus, some classifications may have a large uncertainty. To resolve such problems, a bounded-abstaining classification model is proposed. It maximizes the area under the ROC curve (AUC) under two abstention constraints. A total of 219 (92 malignant and 127 benign) BUS images are collected from the First Affiliated Hospital of Harbin Medical University, China. The experiment tests BUS datasets of three imbalance levels, and the performance contours are analyzed. The results demonstrate that AUC-rejection curves are less affected by class imbalance than accuracy-rejection curves. Compared with the state-of-the-art, the proposed method yields a significantly larger AUC and G-mean using imbalanced BUS datasets.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2020, 30, 2; 325-336
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-3 z 3

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies