Temat: dobór cech - Katalog OPAC zbiorów

Skocz do pozycji: 1.

Tytuł:: Decision trees and the effects of feature extraction parameters for robust sensor network design
Wykorzystanie drzew decyzyjnych oraz wpływu parametrów ekstrakcji cech do projektowania odpornych sieci czujników
Autorzy:: Gerdes, M.
Galar, D.
Scholz, D.
Powiązania:: https://bibliotekanauki.pl/articles/301345.pdf
Data publikacji:: 2017
Wydawca:: Polska Akademia Nauk. Polskie Naukowo-Techniczne Towarzystwo Eksploatacyjne PAN
Tematy:: decision trees
feature extraction
sensor optimization
sensor fusion
sensor selection
drzewa decyzyjne
ekstrakcja cech
optymalizacja czujników
fuzja czujników
dobór czujników
Opis:: Reliable sensors and information are required for reliable condition monitoring. Complex systems are commonly monitored by many sensors for health assessment and operation purposes. When one of the sensors fails, the current state of the system cannot be calculated in same reliable way or the information about the current state will not be complete. Condition monitoring can still be used with an incomplete state, but the results may not represent the true condition of the system. This is especially true if the failed sensor monitors an important system parameter. There are two possibilities to handle sensor failure. One is to make the monitoring more complex by enabling it to work better with incomplete data; the other is to introduce hard or software redundancy. Sensor reliability is a critical part of a system. Not all sensors can be made redundant because of space, cost or environmental constraints. Sensors delivering significant information about the system state need to be redundant, but an error of less important sensors is acceptable. This paper shows how to calculate the significance of the information that a sensor gives about a system by using signal processing and decision trees. It also shows how signal processing parameters influence the classification rate of a decision tree and, thus, the information. Decision trees are used to calculate and order the features based on the information gain of each feature. During the method validation, they are used for failure classification to show the influence of different features on the classification performance. The paper concludes by analysing the results of experiments showing how the method can classify different errors with a 75% probability and how different feature extraction options influence the information gain.
Niezawodne monitorowanie stanu wymaga niezawodności czujników i pochodzących z nich informacji. Systemy złożone są zazwyczaj monitorowane przez wiele czujników, co pozwala na ocenę stanu technicznego oraz aspektów eksploatacyjnych. Gdy jeden z czujników ulega uszkodzeniu, uniemożliwia to obliczenie bieżącego stanu systemu z dotychczasową niezawodnością lub uzyskanie kompletnych informacji o bieżącym stanie. Stan można co prawda monitorować nawet przy niekompletnych danych, ale wyniki takiego monitorowania mogą nie odpowiadać rzeczywistemu stanowi systemu. Sytuacja taka ma miejsce w szczególności, gdy uszkodzony czujnik jest odpowiedzialny za monitorowanie istotnego parametru systemu. Problem uszkodzenia czujnika można rozwiązywać na dwa sposoby. Pierwszy polega na zwiększeniu złożoności systemu, co umożliwia jego sprawniejsze działanie w sytuacji, gdy dane są niekompletne. Drugim sposobem jest wprowadzenie nadmiarowego sprzętu (hardware'u) lub oprogramowania. Niezawodność czujników stanowi krytyczny aspekt systemu. Oczywiście, ze względu na ograniczenia przestrzenne, ekonomiczne i środowiskowe nie wszystkie czujniki w systemie mogą być nadmiarowe. Redundancja powinna dotyczyć wszystkich czujników, które dostarczają istotnych informacji na temat stanu systemu, natomiast dopuszczalne są błędy mniej ważnych czujników. W niniejszej pracy pokazano jak obliczać istotność informacji o systemie dostarczanych przez poszczególne czujniki z wykorzystaniem metod przetwarzania sygnałów oraz drzew decyzyjnych. Zademonstrowano również w jaki sposób parametry przetwarzania sygnałów wpływają na poprawność klasyfikacji metodą drzewa decyzyjnego, a tym samym na poprawność dostarczanych informacji. Drzew decyzyjnych używa się do obliczania i porządkowania cech w oparciu o przyrost informacji charakteryzujący poszczególne cechy. Podczas weryfikacji zastosowanej metody, drzewa decyzyjne wykorzystano do klasyfikacji uszkodzeń celem przedstawienia wpływu różnych cech na dokładność klasyfikacji. Pracę kończy analiza wyników eksperymentów pokazujących w jaki sposób zastosowana metoda pozwala na klasyfikację różnych błędów z 75-procentowym prawdopodobieństwem oraz jak różne opcje ekstrakcji cech wpływają na przyrost informacji.
Źródło:: Eksploatacja i Niezawodność; 2017, 19, 1; 31-42
1507-2711
Pojawia się w:: Eksploatacja i Niezawodność
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 2.

Tytuł:: New algorithm for determining the number of features for the effective sentiment-classification of text documents
Nowy algorytm ustalania liczby zmiennych potrzebnych do klasyfikacji dokumentów tekstowych ze względu na ich wydźwięk emocjonalny
Autorzy:: Idczak, Adam
Korzeniewski, Jerzy
Powiązania:: https://bibliotekanauki.pl/articles/18105028.pdf
Data publikacji:: 2023-05-31
Wydawca:: Główny Urząd Statystyczny
Tematy:: sentiment analysis
document sentiment classification
text mining
logistic regression
naive Bayes classifier
feature selection
correlation
analiza sentymentu
klasyfikacja dokumentów ze względu na wydźwięk emocjonalny
eksploracja tekstu
regresja logistyczna
naiwny klasyfikator Bayesa
dobór cech
korelacja
Opis:: Sentiment analysis of text documents is a very important part of contemporary text mining. The purpose of this article is to present a new technique of text sentiment analysis which can be used with any type of a document-sentiment-classification method. The proposed technique involves feature selection independently of a classifier, which reduces the size of the feature space. Its advantages include intuitiveness and computational noncomplexity. The most important element of the proposed technique is a novel algorithm for the determination of the number of features to be selected sufficient for the effective classification. The algorithm is based on the analysis of the correlation between single features and document labels. A statistical approach, featuring a naive Bayes classifier and logistic regression, was employed to verify the usefulness of the proposed technique. They were applied to three document sets composed of 1,169 opinions of bank clients, obtained in 2020 from a Poland-based bank. The documents were written in Polish. The research demonstrated that reducing the number of terms over 10-fold by means of the proposed algorithm in most cases improves the effectiveness of classification.
Analiza sentymentu, czyli wydźwięku emocjonalnego, dokumentów tekstowych stanowi bardzo ważną część współczesnej eksploracji tekstu (ang. text mining). Celem artykułu jest przedstawienie nowej techniki analizy sentymentu tekstu, która może znaleźć zastosowanie w dowolnej metodzie klasyfikacji dokumentów ze względu na ich wydźwięk emocjonalny. Proponowana technika polega na niezależnym od klasyfikatora doborze cech, co skutkuje zmniejszeniem rozmiaru ich przestrzeni. Zaletami tej propozycji są intuicyjność i prostota obliczeniowa. Zasadniczym elementem omawianej techniki jest nowatorski algorytm ustalania liczby terminów wystarczających do efektywnej klasyfikacji, który opiera się na analizie korelacji pomiędzy pojedynczymi cechami dokumentów a ich wydźwiękiem. W celu weryfikacji przydatności proponowanej techniki zastosowano podejście statystyczne. Wykorzystano dwie metody: naiwny klasyfikator Bayesa i regresję logistyczną. Za ich pomocą zbadano trzy zbiory dokumentów składające się z 1169 opinii klientów jednego z banków działających na terenie Polski uzyskanych w 2020 r. Dokumenty zostały napisane w języku polskim. Badanie pokazało, że kilkunastokrotne zmniejszenie liczby terminów przy zastosowaniu proponowanej techniki na ogół poprawia jakość klasyfikacji.
Źródło:: Wiadomości Statystyczne. The Polish Statistician; 2023, 68, 5; 40-57
0043-518X
Pojawia się w:: Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 3.

Tytuł:: The Problem of Redundant Variables in Random Forests
Problem zmiennych redundantnych w metodzie lasów losowych
Autorzy:: Kubus, Mariusz
Powiązania:: https://bibliotekanauki.pl/articles/656761.pdf
Data publikacji:: 2018
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: lasy losowe
zmienne redundantne
dobór zmiennych
taksonomia cech
random forests
redundant variables
feature selection
clustering of features
Opis:: Lasy losowe są obecnie jedną z najchętniej stosowanych przez praktyków metod klasyfikacji wzorcowej. Na jej popularność wpływ ma możliwość jej stosowania bez czasochłonnego, wstępnego przygotowywania danych do analizy. Las losowy można stosować dla różnego typu zmiennych, niezależnie od ich rozkładów. Metoda ta jest odporna na obserwacje nietypowe oraz ma wbudowany mechanizm doboru zmiennych. Można jednak zauważyć spadek dokładności klasyfikacji w przypadku występowania zmiennych redundantnych. W artykule omawiane są dwa podejścia do problemu zmiennych redundantnych. Rozważane są dwa sposoby przeszukiwania w podejściu polegającym na doborze zmiennych oraz dwa sposoby konstruowania zmiennych syntetycznych w podejściu wykorzystującym grupowanie zmiennych. W eksperymencie generowane są liniowo zależne predyktory i włączane do zbiorów danych rzeczywistych. Metody redukcji wymiarowości zwykle poprawiają dokładność lasów losowych, ale żadna z nich nie wykazuje wyraźnej przewagi.
Random forests are currently one of the most preferable methods of supervised learning among practitioners. Their popularity is influenced by the possibility of applying this method without a time consuming pre‑processing step. Random forests can be used for mixed types of features, irrespectively of their distributions. The method is robust to outliers, and feature selection is built into the learning algorithm. However, a decrease of classification accuracy can be observed in the presence of redundant variables. In this paper, we discuss two approaches to the problem of redundant variables. We consider two strategies of searching for best feature subset as well as two formulas of aggregating the features in the clusters. In the empirical experiment, we generate collinear predictors and include them in the real datasets. Dimensionality reduction methods usually improve the accuracy of random forests, but none of them clearly outperforms the others.
Źródło:: Acta Universitatis Lodziensis. Folia Oeconomica; 2018, 6, 339; 7-16
0208-6018
2353-7663
Pojawia się w:: Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 4.

Tytuł:: Breast cancer diagnosis using wrapper-based feature selection and artificial neural network
Autorzy:: Naveed, Nawazish
Madhloom, Hayan T.
Husain, Mohd Shahid
Powiązania:: https://bibliotekanauki.pl/articles/1956040.pdf
Data publikacji:: 2021
Wydawca:: Polskie Towarzystwo Promocji Wiedzy
Tematy:: breast cancer diagnosis
feature selection
neural network
grid search
machine learning
diagnostyka raka piersi
dobór cech
sieć neuronowa
przeszukiwanie sieci
uczenie maszynowe
Opis:: Breast cancer is commonest type of cancers among women. Early diagnosis plays a significant role in reducing the fatality rate. The main objective of this study is to propose an efficient approach to classify breast cancer tumor into either benign or malignant based on digitized image of a fine needle aspirate (FNA) of a breast mass represented by the Wisconsin Breast Cancer Dataset. Two wrapper-based feature selection methods, namely, sequential forward selection(SFS) and sequential backward selection (SBS) are used to identify the most discriminant features which can contribute to improve the classification performance. The feed forward neural network (FFNN) is used as a classification algorithm. The learning algorithm hyper-parameters are optimized using the grid search process. After selecting the optimal classification model, the data is divided into training set and testing set and the performance was evaluated. The feature space is reduced from nine feature to seven and six features using SFS and SBS respectively. The highest classification accuracy recorded was 99.03% with FFNN using the seven SFS selected features. While accuracy recorded with the six SBS selected features was 98.54%. The obtained results indicate that the proposed approach is effective in terms of feature space reduction leading to better accuracy and efficient classification model.
Źródło:: Applied Computer Science; 2021, 17, 3; 19-30
1895-3735
Pojawia się w:: Applied Computer Science
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 5.

Tytuł:: Wpływ doboru tasiemców macierzystych linii wsobnej Hymenolepis diminuta WMS IL1 na zmienność cech u tasiemców potomnych
Autorzy:: Stradowski, M.
Powiązania:: https://bibliotekanauki.pl/articles/2147675.pdf
Data publikacji:: 2002
Wydawca:: Polskie Towarzystwo Parazytologiczne
Tematy:: proglotydy
dobor zwierzat
potomstwo
linie wsobne
zmiennosc cech
parazytologia
hodowla wsobna
osobniki macierzyste
Hymenolepis diminuta
tasiemce
Opis:: A continuation of a single-individual culture of Hymenolepis diminuta WMS ill from generations 37 to 66 revealed a very high infective ability of cysticercoids which is reflected in the percentage of tapeworms detected in relation to the number of cysticercoids given to rats (94.4%). The tapeworms investigated revealed a significant increase in the abundance of type 0p3a proglottids (those wilh no testes on the poral side and 3 on the aporal) in tapeworms of successive generation groups. Each group of tapeworms analysed statistically belonged to three successive generations and numbered 31-34 individuals. The mean abundances of 0p3a type proglottids in tapeworms of the first groups studied in experiment, including generations 37-39 and 40-42 were 9.2% and 9.5%, respectively. The last studied groups, including generations 61-63 and 64-66 had higher mean numbers of type 0p3a proglottids, at 11.1 % and 11.5%, respectively. The quantitative figures of 1p3a type proglottids amounted to 1.6% and 1.3% in first generation groups and in the last two groups 0.8% and 1.0%, respectively. The probable cause of this significant (P < 0.01) relative increase in the numbers of 0p3a type proglottids and decrease (P < 0.01) in the numbers of 1p3a type proglottids was the deliberate selection of maternal tapeworms characterized by numbers of 0p3a type proglottids greater and 1p3a type proglottids smaller than the a verage for their generation.
Źródło:: Wiadomości Parazytologiczne; 2002, 48, 1; 79-85
0043-5163
Pojawia się w:: Wiadomości Parazytologiczne
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 6.

Tytuł:: Wplyw doboru tasiemcow macierzystych linii wsobnej Hymenolepis diminuta WMS IL1 na zmiennosc cech u tasiemcow potomnych
Autorzy:: Stradowski, M
Powiązania:: https://bibliotekanauki.pl/articles/836412.pdf
Data publikacji:: 2002
Wydawca:: Polskie Towarzystwo Parazytologiczne
Tematy:: proglotydy
dobor zwierzat
potomstwo
linie wsobne
zmiennosc cech
parazytologia
hodowla wsobna
osobniki macierzyste
Hymenolepis diminuta
tasiemce
Opis:: A continuation of a single-individual culture of Hymenolepis diminuta WMS ill from generations 37 to 66 revealed a very high infective ability of cysticercoids which is reflected in the percentage of tapeworms detected in relation to the number of cysticercoids given to rats (94.4%). The tapeworms investigated revealed a significant increase in the abundance of type 0p3a proglottids (those wilh no testes on the poral side and 3 on the aporal) in tapeworms of successive generation groups. Each group of tapeworms analysed statistically belonged to three successive generations and numbered 31-34 individuals. The mean abundances of 0p3a type proglottids in tapeworms of the first groups studied in experiment, including generations 37-39 and 40-42 were 9.2% and 9.5%, respectively. The last studied groups, including generations 61-63 and 64-66 had higher mean numbers of type 0p3a proglottids, at 11.1 % and 11.5%, respectively. The quantitative figures of 1p3a type proglottids amounted to 1.6% and 1.3% in first generation groups and in the last two groups 0.8% and 1.0%, respectively. The probable cause of this significant (P < 0.01) relative increase in the numbers of 0p3a type proglottids and decrease (P < 0.01) in the numbers of 1p3a type proglottids was the deliberate selection of maternal tapeworms characterized by numbers of 0p3a type proglottids greater and 1p3a type proglottids smaller than the a verage for their generation.
Źródło:: Annals of Parasitology; 2002, 48, 1; 79-85
0043-5163
Pojawia się w:: Annals of Parasitology
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Informacja

Wyszukujesz frazę "dobór cech" wg kryterium: Temat

Źródło danych

Dostawca treści

Kolekcja

Rok wydania

Wydawca

Temat

Autor

Typ dokumentu

Język