Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "class-imbalanced" wg kryterium: Wszystkie pola


Wyświetlanie 1-6 z 6
Tytuł:
Data preprocessing in the classification of the imbalanced data
Przetwarzanie wstępne w problemie klasyfikacji danych niezrównoważonych
Autorzy:
Borowska, K.
Topczewska, M.
Powiązania:
https://bibliotekanauki.pl/articles/88428.pdf
Data publikacji:
2014
Wydawca:
Politechnika Białostocka. Oficyna Wydawnicza Politechniki Białostockiej
Tematy:
klasy niezrównoważone
klasyfikacja
nowy obiekt
tworzenie
class imbalance
oversampling
classification
Opis:
The article concerns the problem of imbalanced data classification. Two algorithms improving the standard SMOTE method have been created and tested. To measure the distance between objects the Euclidean or the HVDM metric was applied, depending on the number of nominal attributes in a dataset.
Artykuł dotyczy problemu klasyfikacji w przypadku, gdy mamy do czynienia z klasami niezrównoważonymi. W tym celu stworzone zostały dwa algorytmy poprawiające wyniki uzyskiwane za pomocą standardowego algorytmu SMOTE. Do pomiaru odległości między obiektami zastosowano metrykę euklidesową lub metrykę HVDM, w zależności od liczby cech nominalnych w zbiorze.
Źródło:
Advances in Computer Science Research; 2014, 11; 31-46
2300-715X
Pojawia się w:
Advances in Computer Science Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Real-time equipment condition assessment for a class-imbalanced dataset based on heterogeneous ensemble learning
Ocena stanu sprzętu w czasie rzeczywistym dla zbiorów danych o niezrównoważonym rozkładzie w klasach. Metoda oparta na uczeniu zespołowym
Autorzy:
Chen, Xiaohui
Zhang, Zhiyao
Zhang, Ze
Powiązania:
https://bibliotekanauki.pl/articles/300613.pdf
Data publikacji:
2019
Wydawca:
Polska Akademia Nauk. Polskie Naukowo-Techniczne Towarzystwo Eksploatacyjne PAN
Tematy:
condition assessment
heterogeneous ensemble learning
genetic algorithm
class-imbalanced
ocena stanu
uczenie zespołowe
algorytm genetyczny
niezrównoważony rozkład w klasach
Opis:
This study proposes an ensemble learning model for the purpose of performing a real-time equipment condition assessment. This model makes it possible to plan desired preventive maintenance activities before an unexpected failure takes place. This study focuses on the class-imbalanced problem in equipment condition assessment research. In reality, equipment will experience multiple conditions(states), most of the time remaining in the normal condition and relatively rarely being in the critical condition, which means that, from the perspective of data modelling, the distribution of samples is highly imbalanced among different classes(conditions). The majority of samples belong to the normal condition, while the minority belong to the critical condition, which poses a great challenge to the classification performance. To address this problem, a genetic algorithm-based ensemble learning model is presented. Furthermore, a self-updating learning strategy is presented for online monitoring, contributing to adaptability and reliability enhancement along with time. Many previous studies have attempted feature extraction and to set thresholds for equipment health indicators. This study has an advantage of omitting these steps, as it can directly assess the equipment condition through the proposed ensemble learning model. Numerical experiments, including two types of comparison studies, have been conducted. The results show the greater effectiveness of our proposed model over that of previous research in terms of the stability and accuracy of its classification performance.
W pracy przedstawiono model uczenia maszynowego opartego na zespołach niejednorodnych klasyfikatorów (ensemble learning), który pozwala przeprowadzać ocenę stanu sprzętu w czasie rzeczywistym. Model ten umożliwia zaplanowanie niezbędnych czynności konserwacji profilaktycznej przed wystąpieniem niespodziewanego uszkodzenia. Tematem pracy jest zagadnienie niezrównoważonego rozkładu w klasach poruszane w badaniach dotyczących oceny stanu sprzętu. W warunkach rzeczywistych, sprzęt chrakteryzuje wiele różnych stanów, przy czym przez większość czasu pozostaje on w stanie normalnym, a relatywnie rzadko znajduje się w stanie krytycznym, co oznacza, że z punktu widzenia modelowania danych, rozkład prób w poszczególnych klasach (stanach) jest wysoce niezrównoważony. Większość prób należy do stanu normalnego, a mniejszość do stanu krytycznego, co stanowi duże wyzwanie jeśli chodzi o wydajność klasyfikacji. W celu rozwiązania tego problemu, przedstawiono model uczenia zespołowego oparty na algorytmie genetycznym. Ponadto zaprezentowano samoaktualizującą się strategię uczenia wykorzystywaną do monitorowania online, która wraz z upływem czasu zwiększa adaptacyjność i niezawodność modelu . W wielu poprzednich badaniach podejmowano próby ekstrakcji cech oraz ustalania progów dla wskaźników stanu sprzętu. Zaletą przedstawionej metody jest to, że pozwala ona pominąć te etapy i bezpośrednio oceniać stan sprzętu za pomocą proponowanego modelu uczenia zespołowego. Przeprowadzono eksperymenty numeryczne, w tym dwa rodzaje badań porównawczych. Wyniki pokazują większą skuteczność proponowanego modelu w stosunku do poprzednich badań pod względem stabilności i trafności klasyfikacji.
Źródło:
Eksploatacja i Niezawodność; 2019, 21, 1; 68-80
1507-2711
Pojawia się w:
Eksploatacja i Niezawodność
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Using information on class interrelations to improve classification of multiclass imbalanced data: A new resampling algorithm
Autorzy:
Janicka, Małgorzata
Lango, Mateusz
Stefanowski, Jerzy
Powiązania:
https://bibliotekanauki.pl/articles/330287.pdf
Data publikacji:
2019
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
imbalanced data
multi-class learning
re-sampling
data difficulty factor
similarity degree
dane niezrównoważone
ponowne próbkowanie
stopień podobieństwa
Opis:
The relations between multiple imbalanced classes can be handled with a specialized approach which evaluates types of examples’ difficulty based on an analysis of the class distribution in the examples’ neighborhood, additionally exploiting information about the similarity of neighboring classes. In this paper, we demonstrate that such an approach can be implemented as a data preprocessing technique and that it can improve the performance of various classifiers on multiclass imbalanced datasets. It has led us to the introduction of a new resampling algorithm, called Similarity Oversampling and Undersampling Preprocessing (SOUP), which resamples examples according to their difficulty. Its experimental evaluation on real and artificial datasets has shown that it is competitive with the most popular decomposition ensembles and better than specialized preprocessing techniques for multi-imbalanced problems.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2019, 29, 4; 769-781
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The use of data mining models in solving the problem of imbalanced classes based on the example of an online marketing campaign
Wykorzystanie modeli data mining w rozwiązywaniu problemu niezrównoważonych klas na przykładzie kampanii marketingowych w Internecie
Autorzy:
Łapczyński, Mariusz
Surma, Jerzy
Powiązania:
https://bibliotekanauki.pl/articles/424980.pdf
Data publikacji:
2015
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
C&RT
Random Forest
imbalanced class problem
online social network
banner ad campaign
Opis:
While building predictive models in analytical CRM, researchers often encounter the problem of imbalanced classes (skewed distributions of dependent variables), which consists in the fact that the number of observations belonging to one category of the dependent variable is much lower than the number of observations belonging to the second category of that variable. This is related to such areas as churn analysis, customer acquisition models and cross and up-selling models. The purpose of the paper is to present a predictive model that was built to predict the response of Internet users to banner advertising. The dataset used in the study came from an online social network which offers advertisers banner campaigns targeting its users. The advertising campaign of a cosmetics company was carried out in the autumn of 2010 and was mainly targeted at young women. A user of this service was described by 115 independent variables – 3 out of which were demographic variables (sex, age, education), and the remaining 112 referred to the user’s online activity. While building the model there appeared the problem of imbalanced classes due to the low number of users who clicked on the banner ad. The number of cases amounted to 81,000, while the number of positive reactions to the banner was 207, which constitutes approximately 0.25% of the dependent variable. During the study, two popular data mining tools were utilized – the decision trees C&RT and Random Forest. The second goal of this paper is to compare the performance of the predictive models based on both these analytical tools.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2015, 3 (49); 9-19
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
An Ensemble of Statistical Metadata and CNN Classification of Class Imbalanced Skin Lesion Data
Autorzy:
Nayak, Sachin
Vincent, Shweta
Sumathi, K.
Kumar, Om Prakash
Pathan, Sameena
Powiązania:
https://bibliotekanauki.pl/articles/2055258.pdf
Data publikacji:
2022
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
classification
Convolutional Neural Networks
Ensemble Learning
machine learning
metadata
Opis:
Skin Cancer is one of the most widely present forms of cancer. The correct classification of skin lesions as malignant or benign is a complex process that has to be undertaken by experienced specialists. Another major issue of the class imbalance of data causes a bias in the results of classification. This article presents a novel approach to the usage of metadata of skin lesions images to classify them. The usage of techniques addresses the problem of class imbalance to nullify the imbalances. Further, the use of a convolutional neural network (CNN) is proposed to finetune the skin lesion data classification. Ultimately, it is proven that an ensemble of statistical metadata analysis and CNN usage would result in the highest accuracy of skin color classification instead of using the two techniques separately.
Źródło:
International Journal of Electronics and Telecommunications; 2022, 68, 2; 251--257
2300-1933
Pojawia się w:
International Journal of Electronics and Telecommunications
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Automated approach to classification of mine-like objects using multiple-aspect sonar images
Autorzy:
Wang, X.
Liu, X.
Japkowicz, N.
Matwin, S.
Powiązania:
https://bibliotekanauki.pl/articles/91790.pdf
Data publikacji:
2014
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
object
sea bed
multiple side-scan sonar
Dempster-Shafer theory
DS concept
classifier
imbalance
imbalanced problem
multi-instance class
Opis:
In this paper, the detection of mines or other objects on the seabed from multiple side-scan sonar views is considered. Two frameworks are provided for this kind of classification. The first framework is based upon the Dempster–Shafer (DS) concept of fusion from a single-view kernel-based classifier and the second framework is based upon the concepts of multi-instance classifiers. Moreover, we consider the class imbalance problem which is always presents in sonar image recognition. Our experimental results show that both of the presented frameworks can be used in mine-like object classification and the presented methods for multi-instance class imbalanced problem are also effective in such classification.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2014, 4, 2; 133-148
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-6 z 6

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies