- Tytuł:
-
Application of the recursive feature elimination and the relaxed linear separability feature selection algorithms to gene expression data analysis
Rekurencyjna eliminacja cech z walidacją oraz relaksacja liniowej separowalności jako metody selekcji cech do analizy zbiorów danych zawierających wartości ekspresji genów - Autorzy:
-
Gościk, J.
Łukaszuk, T. - Powiązania:
- https://bibliotekanauki.pl/articles/88402.pdf
- Data publikacji:
- 2013
- Wydawca:
- Politechnika Białostocka. Oficyna Wydawnicza Politechniki Białostockiej
- Tematy:
-
gene expression analysis
feature selection
classification
analiza ekspresji genów
selekcja cech
klasyfikacja - Opis:
-
Most of the commonly known feature selection methods focus on selecting appropriate predictors for image recognition or generally on data mining issues. In this paper we present a comparison between widely used Recursive Feature Elimination (RFE) with resampling method and the Relaxed Linear Separability (RLS) approach with application to the analysis of the data sets resulting from gene expression experiments. Different types of classification algorithms such as K-Nearest Neighbours (KNN), Support Vector Machines (SVM) and Random Forests (RF) are exploited and compared in terms of classification accuracy with optimal set of genes treated as predictors selected by either the RFE or the RLS approaches. Ten-fold cross-validation was used to determine classification accuracy.
Zdecydowana większość znanych metod selekcji cech skupia się na wyborze odpowiednich predyktorów dla takich zagadnień jak rozpoznawanie obrazów czy też ogólnie eksploracji danych. W publikacji prezentujemy porównanie pomiędzy powszechnie stosowaną ˛metodą˛ Rekurencyjnej Eliminacji Cech z walidacja˛ (ang. Recursive Feature Elimination - RFE) a metodą stosującą ˛podejście Relaksacji Liniowej Separowalności (ang. Relaxed Linear Separability - RLS) z zastosowaniem do analizy zbiorów danych zawierających wartości ekspresji genów. W artykule wykorzystano różne algorytmy klasyfikacji, takie jak K-Najbliższych Sąsiadów (ang. K-Nearest Neighbours - KNN), Maszynę˛ Wektorów Wspierających (ang. Support Vector Machines - SVM) oraz Lasy Losowe (ang. Random Forests -RF). Porównana została jakość klasyfikacji uzyskana przy pomocy tych algorytmów z optymalnym zestawem cech wygenerowanym z wykorzystaniem metody selekcji cech RFE bądź RLS. W celu wyznaczenia jakości klasyfikacji wykorzystano 10-krotną walidację˛ krzyżową. - Źródło:
-
Advances in Computer Science Research; 2013, 10; 39-52
2300-715X - Pojawia się w:
- Advances in Computer Science Research
- Dostawca treści:
- Biblioteka Nauki