Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Choice" wg kryterium: Temat


Wyświetlanie 1-3 z 3
Tytuł:
An entropy based non-wrapper approach for choosing variables in cluster analysis
Autorzy:
Korzeniewski, Jerzy
Powiązania:
https://bibliotekanauki.pl/articles/657955.pdf
Data publikacji:
2011
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
cluster analysis
entropy
variable choice
Opis:
W artykule badamy sprawność algorytmu wybierania zmiennych w analizie skupień opartego na entropii (por. Dash, Liu, 2000). Ocena oparta jest na eksperymencie, w którym zbiory generowane są w postaci mieszanin rozkładów normalnych. Wyniki wskazują na to. że metoda nie radzi sobie tak dobrze jak to sugerowali Autorzy.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2011, 255
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Modification of Talavera Method of Variable Selection in Cluster Analysis
Badanie efektywności modyfikacji metody Talavery wybierania zmiennych w analizie skupień na empirycznych zbiorach danych
Autorzy:
Korzeniewski, Jerzy
Powiązania:
https://bibliotekanauki.pl/articles/905648.pdf
Data publikacji:
2013
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
cluster analysis
variable choice
correlation of variables
Opis:
Talavera has proposed a method of variable selection in cluster analysis for data sets in which only variables measured on nominal scale are present. He examined the method on a couple of data sets basing his assessment on the case in which one can use a data grouping algorithm (he used the COBWEB algorithm). In other approaches some authors try to select variables without referring to any particular grouping method. In the paper, we investigate the efficiency of the Talavera method on real world data sets, referring only to the succession of variables and the greatest jump criterion. Some data sets with variables measured on stronger scales are also investigated after previous descretization.
Talavera zaproponował metodę wybierania zmiennych tworzących strukturę skupień w zbiorze danych dla zbiorów, w których występują tylko zmienne mierzone na skali nominalnej. Autor zbadał tę metodę na kilku empirycznych zbiorach opierając ocenę na tym jak spisywała się metoda w połączeniu z ustalonym sposobem grupowania danych (algorytm COBWEB). W innych podejściach do tego samego zagadnienia autorzy starają się oprzeć wybór zmiennych na samym uporządkowaniu zbioru zmiennych bez odwoływania się do grupowania obserwacji. W artykule badana jest efektywność metody również w odniesieniu do empirycznych zbiorów danych, uzależniona tylko od uporządkowania zmiennych, oparta na kryterium największego skoku. Rozważane są również zbiory z niektórymi zmiennymi mierzonymi na mocniejszych skalach z po uprzedniej dyskretyzacji zmiennych.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2013, 285
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Modification of Hinov Method of Variable Selection for Multiple Cluster Structure Analysis
Modyfikacja metody HINoV selekcji zmiennych w analizie wielokrotnych struktur skupień
Autorzy:
Korzeniewski, Jerzy
Powiązania:
https://bibliotekanauki.pl/articles/904539.pdf
Data publikacji:
2013
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
cluster analysis
variable choice
multiple cluster structures
Opis:
The original HINoV method (Carmone et al., 1999 ) is not robust to the presence of correlated unimodal and uniform variables among noisy variables (e.g. Korzeniewski, 2012). Moreover, HINoV can be applied only to a single cluster structure analysis. In the article, a modification is proposed consisting in grouping all variables (separately for each reference variable) into two classes. One of the classes consists of variables similar to the reference variable, the other consists of variables which are “less similar”. Similarity between two variables is based on the similarity of the data set division into an established number of clusters (from 2 to 10) measured with the modified Rand index. We arrive at a zero-one matrix describing relations between every pair of variables. Then, a set of variables creating the same (the strongest) cluster structure is selected by means of a criterion optimizing the matrix division into four blocks. After completing the first stage selection one can search another cluster structure applying the same procedure to the set of remaining variables. The modification is assessed in a broad experiment based on 2250 data sets generated from the mixtures of normal distribution.
Oryginalna metoda HINoV jest zupełnie nieodporna na występowanie wśród zmiennych zanieczyszczających strukturę skupień zmiennych skorelowanych jednomodalnych lub równomiernych. Ponadto HINoV można stosować tylko w przypadku jednej struktury skupień.W referacie zaproponowana jest modyfikacja polegająca na tym, by, oddzielnie, dla każdej ustalonej zmiennej, grupować zmienne w dwie klasy zmiennych podobnych i niepodobnych do niej w sensie podobieństwa podziału zbioru danych na daną liczbę skupień (od 2 do 10). Otrzymujemy wówczas macierz zerojedynkową opisującą związki pomiędzy każdą parą zmiennych. Następnie, podzbiór zmiennych tworzących tę samą (najsilniejszą) strukturę skupień wybierany jest za pomocą kryterium optymalizującego podział macierzy na cztery bloki. Po wybraniu zmiennych tworzących jedną strukturę skupień można, w dalszym kroku, wybierać zmienne tworzące następną strukturę skupień spośród zmiennych, które nie zostały wybrane w pierwszym kroku. W celu selekcji właściwego bloku macierzy stosowane jest kryterium stabilności podziału zbioru danych oparte na wielokrotnym losowaniu połowy zbioru i porównywaniu podziałów otrzymanych przy pomocy metody k-średnich. Modyfikacja oceniona jest w obszernym eksperymencie symulacyjnym na 2250 zbiorach danych wygenerowanych w postaci mieszanin rozkładów normalnych.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2013, 286
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-3 z 3

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies