Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "binary data" wg kryterium: Temat


Wyświetlanie 1-2 z 2
Tytuł:
Przydatność wybranych miar podobieństwa dla danych binarnych do analiz wielocechowych w badaniach molekularnych
The application of chosen similarity measures for binary data in multivariate analysis in molecular experiments
Autorzy:
Mańkowski, Dariusz R.
Laudański, Zbigniew
Janaszek, Monika
Powiązania:
https://bibliotekanauki.pl/articles/2198079.pdf
Data publikacji:
2011-12-29
Wydawca:
Instytut Hodowli i Aklimatyzacji Roślin
Tematy:
dane binarne
analizy molekularne
miary podobieństwa
PCoA
analiza skupień
marchew jadalna
binary data
molecular analysis
similarity measures
cluster analysis
carrot
Opis:
W pracy przedstawiono możliwości wykorzystania ośmiu miar podobieństwa genetycznego w analizie danych binarnych, będących matematycznym obrazem żeli elektroforetycznych uzyskiwanych w badaniach molekularnych. Scharakteryzowano miary zgodności (Gowera), Jaccarda, Nei’a i Li (Dice’a), Hamanna, Ochiai, współczynnik Y Yule’a, współczynnik Q Yule’a oraz zero-jedynkowy odpowiednik współczynnika korelacji Pearsona (phi 4-point correlation). Na przykładzie analizy porównawczej 14 odmian marchwi jadalnej (Daucus carota L.) przedstawiono wykorzystanie tych miar w analizach wielocechowych — analizie skupień metodą UPGMA oraz analizie głównych współrzędnych PCoA. Przedstawiono i omówiono wyniki przeprowadzonych analiz oraz opisano różnice pomiędzy nimi. Porównano istniejące w literaturze miary podobieństwa dla danych molekularnych pod względem zgodności wyników uzyskiwanych z analiz statystycznych.
The article presents the possibility of using eight measures of genetic similarity in analysis of binary data which are a mathematical image of the electrophoresis gels obtained in molecular studies. We characterized similarity measures: simple matching (Gower), Jaccard, Nei and Li (Dice), Hamann, Ochiai, Yule Y coefficient, Yule Q coefficient and zero-one equivalent of the Pearson correlation coefficient (phi 4-point correlation). Then, the example of a comparative analysis of 14 varieties of carrots (Daucus carota L.) presents the use of these measures in a multivariate analysis — UPGMA cluster analysis and principal coordinates analysis PCoA. The results of the analysis and the differences between them were presented and discussed. The similarity measures for the molecular data existing in the literature were compared in terms of results compliance obtained from statistical analyses.
Źródło:
Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin; 2011, 262; 155-173
0373-7837
2657-8913
Pojawia się w:
Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The effect of binary data transformation in categorical data clustering
Autorzy:
Cibulková, Jana
Šulc, Zdenek
Sirota, Sergej
Rezanková, Hana
Powiązania:
https://bibliotekanauki.pl/articles/1194463.pdf
Data publikacji:
2019-07-02
Wydawca:
Główny Urząd Statystyczny
Tematy:
hierarchical cluster analysis
nominal variable
binary variable
categorical data
similarity measures
evaluation criteria
generated data
Opis:
This paper focuses on hierarchical clustering of categorical data and compares two approaches which can be used for this task. The first one, an extremely common approach, is to perform a binary transformation of the categorical variables into sets of dummy variables and then use the similarity measures suited for binary data. These similarity measures are well examined, and they occur in both commercial and non-commercial software. However, a binary transformation can possibly cause a loss of information in the data or decrease the speed of the computations. The second approach uses similarity measures developed for the categorical data. But these measures are not so well examined as the binary ones and they are not implemented in commercial software. The comparison of these two approaches is performed on generated data sets with categorical variables and the evaluation is done using both the internal and the external evaluation criteria. The purpose of this paper is to show that the binary transformation is not necessary in the process of clustering categorical data since the second approach leads to at least comparably good clustering results as the first approach.
Źródło:
Statistics in Transition new series; 2019, 20, 2; 33-47
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-2 z 2

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies