- Tytuł:
-
A new hybrid approach for data level balancing classes in classification problems
Nowe hybrydowe podejście równoważenienia liczności klas w problemie klasyfikacji - Autorzy:
-
Szeszko, P.
Topczewska, M. - Powiązania:
- https://bibliotekanauki.pl/articles/404015.pdf
- Data publikacji:
- 2017
- Wydawca:
- Polskie Towarzystwo Symulacji Komputerowej
- Tematy:
-
class imbalance
oversampling
classification
niezbalansowanie liczności klas
nadpróbkowanie
klasyfikacja - Opis:
-
The article concerns the problem of imbalanced data classification. A new algorithm is presented and tested. The HImbA technique is a hybrid method that uses well-known SMOTE algorithm and modified k-nearest neighbours method. 28 datasets have been preprocessed using the HImbA and 10 variants of existing techniques, classified using two algorithms (C4.5 and SMO) and the results have been compared. The new algorithm occurred to give the best results for some datasets.
Praca dotyczy braku zrównoważenia liczności klas w problemie klasyfikacji. Zaprezentowany oraz przetestowany został nowy algorytm. Technika HImbA jest metodą hybrydową, która łączy znany algorytm SMOTE oraz zmodyfikowaną wersję metody k najbliższych sąsiadów. Została ona zastosowana wraz z dziesięcioma wariantami istniejących technik w celu przetwarzania wstępnego 28 zbiorów danych, które zostały następnie poddane klasyfikacji (użyto dwóch algorytmów – C4.5 oraz SMO), a wyniki zostały porównane. Dla wybranych zbiorów przy użyciu nowego algorytmu uzyskano najlepsze rezultaty. - Źródło:
-
Symulacja w Badaniach i Rozwoju; 2017, 8, 3-4; 145-155
2081-6154 - Pojawia się w:
- Symulacja w Badaniach i Rozwoju
- Dostawca treści:
- Biblioteka Nauki