Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "data clustering" wg kryterium: Temat


Tytuł:
Spatial data clustering in independent mobile environment
Autorzy:
Gajewski, B.
Martyn, T.
Powiązania:
https://bibliotekanauki.pl/articles/114689.pdf
Data publikacji:
2016
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
peer-to-peer
data clustering
OPTICS
mobile
lexical distance
Opis:
Most geolocation applications for mobile devices assume a constant connection with the network and high computational power nodes. However, with ever-developing devices it now becomes possible to establish peer-to-peer networks in case when the network can be unreachable due to special circumstances (like conflicts or natural disasters). In this paper, a method for clustering spatial data in mobile environment is discussed. A simple solution based on OPTICS algorithm with lexical distance is proposed for grouping the observations.
Źródło:
Measurement Automation Monitoring; 2016, 62, 5; 163-165
2450-2855
Pojawia się w:
Measurement Automation Monitoring
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Method for the Player Profiling in the Turn-based Computer Games
Autorzy:
Bilski, Piotr
Antoniuk, Izabella
Łabędzki, Rafał
Powiązania:
https://bibliotekanauki.pl/articles/27311938.pdf
Data publikacji:
2023
Wydawca:
Polska Akademia Nauk. Czasopisma i Monografie PAN
Tematy:
turn based games
player profiling
data clustering
automated classification
Opis:
The following paper presents the players profiling methodology applied to the turn-based computer game in the audience-driven system. The general scope are mobile games where the players compete against each other and are able to tackle challenges presented by the game engine. As the aim of the game producer is to make the gameplay as attractive as possible, the players should be paired in a way that makes their duel the most exciting. This requires the proper player profiling based on their previous games. The paper presents the general structure of the system, the method for extracting information about each duel and storing them in the data vector form and the method for classifying different players through the clustering or predefined category assignment. The obtained results show the applied method is suitable for the simulated data of the gameplay model and clustering of players may be used to effectively group them and pair for the duels.
Źródło:
International Journal of Electronics and Telecommunications; 2023, 69, 3; 461--468
2300-1933
Pojawia się w:
International Journal of Electronics and Telecommunications
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Structure of organic farmings cultivations in the selected EU countries in 2004-2012
Struktura upraw rolnictwa ekologicznego wybranych krajów UE w latach 2004-2012
Autorzy:
Kukuła, K.
Strojny, J.
Powiązania:
https://bibliotekanauki.pl/articles/2053055.pdf
Data publikacji:
2014
Wydawca:
Akademia Bialska Nauk Stosowanych im. Jana Pawła II w Białej Podlaskiej
Tematy:
organic/farming
structure of land use
taxonomic
method
data clustering
Opis:
The aim of this study is to analyze the structures of land use in organic farming in the EU countries, for which EUROSTAT made the statistics available. The survey concerns the period between 2004 and 2012. The method of data clustering has been used there in order to classify the structure of land use. The taxonomic analysis allowed for differentiating 5 subgroups from the database. They have cross-sectional and time-series character as well as similar cropping patterns. The agricultural sector reacted to the increasing demand for organic products in two ways: by the extension of the crops’ acreage or by the change in the structures of land use (in order to match the product offer with the demand). However, the conducted surveys did not reveal the essential changes in the structures of land use. In consequence, a significant level of stabilization of supply’s structure was noted.
Celem opracowania jest analiza struktury użytkowania gruntów wykorzystywanych przez rolnictwo ekologiczne w krajach należących do UE, dla których EUROSTAT udostępnił odpowiednie dane statystyczne. Badanie objęło lata 2004-2012. Do klasyfikacji struktury użytkowania gruntów zastosowano metodę analizy skupień. Analiza taksonomiczna umożliwiła wydzielenie ze zbioru danych 5 podgrup o charakterze przekrojowo-czasowym, które cechują się podobnymi strukturami upraw. Odpowiedzią sektora rolnego na wzrastający popyt na produkty ekologiczne jest zwiększanie areału upraw bądź zmiana struktury użytkowania ziemi (celem dopasowania oferty produktowej do popytu). Jednak, przeprowadzone badania nie wykazały zasadniczych zmian struktury wykorzystania gruntów w czasie, czego następstwem jest znaczny stopień stabilizacji struktury podaży.
Źródło:
Economic and Regional Studies; 2014, 07, 4; 22-32
2083-3725
2451-182X
Pojawia się w:
Economic and Regional Studies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Clustering large-scale data based on modified affinity propagation algorithm
Autorzy:
Serdah, A. M.
Ashour, W. M.
Powiązania:
https://bibliotekanauki.pl/articles/91694.pdf
Data publikacji:
2016
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
clustering
clustering algorithm
data clustering algorithm
propagation algorithm
Affinity Propagation
AP
klasteryzacja
algorytm klastrowania
algorytm propagacji
Opis:
Traditional clustering algorithms are no longer suitable for use in data mining applications that make use of large-scale data. There have been many large-scale data clustering algorithms proposed in recent years, but most of them do not achieve clustering with high quality. Despite that Affinity Propagation (AP) is effective and accurate in normal data clustering, but it is not effective for large-scale data. This paper proposes two methods for large-scale data clustering that depend on a modified version of AP algorithm. The proposed methods are set to ensure both low time complexity and good accuracy of the clustering method. Firstly, a data set is divided into several subsets using one of two methods random fragmentation or K-means. Secondly, subsets are clustered into K clusters using K-Affinity Propagation (KAP) algorithm to select local cluster exemplars in each subset. Thirdly, the inverse weighted clustering algorithm is performed on all local cluster exemplars to select well-suited global exemplars of the whole data set. Finally, all the data points are clustered by the similarity between all global exemplars and each data point. Results show that the proposed clustering method can significantly reduce the clustering time and produce better clustering result in a way that is more effective and accurate than AP, KAP, and HAP algorithms.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2016, 6, 1; 23-33
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A quaternion clustering framework
Autorzy:
Piórek, Michał
Jabłoński, Bartosz
Powiązania:
https://bibliotekanauki.pl/articles/330038.pdf
Data publikacji:
2020
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
data clustering
quaternions data processing
human gait
data processing
grupowanie danych
chód człowieka
przetwarzanie danych
Opis:
Data clustering is one of the most popular methods of data mining and cluster analysis. The goal of clustering algorithms is to partition a data set into a specific number of clusters for compressing or summarizing original values. There are a variety of clustering algorithms available in the related literature. However, the research on the clustering of data parametrized by unit quaternions, which are commonly used to represent 3D rotations, is limited. In this paper we present a quaternion clustering methodology including an algorithm proposal for quaternion based k-means along with quaternion clustering quality measures provided by an enhancement of known indices and an automated procedure of optimal cluster number selection. The validity of the proposed framework has been tested in experiments performed on generated and real data, including human gait sequences recorded using a motion capture technique.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2020, 30, 1; 133-147
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wyznaczanie wartości granicznych z wykorzystaniem metod grupowania danych
The determination of limit values using methods of data clustering
Autorzy:
Targosz, M.
Timofiejczuk, A.
Powiązania:
https://bibliotekanauki.pl/articles/257429.pdf
Data publikacji:
2011
Wydawca:
Sieć Badawcza Łukasiewicz - Instytut Technologii Eksploatacji - Państwowy Instytut Badawczy
Tematy:
wartości graniczne
grupowanie danych
modelowanie uszkodzeń
limits values
data clustering
failure modeling
Opis:
W artykule zaproponowano podejście do wyznaczenia wartości granicznych za pomocą algorytmów rozmytego grupowania danych. Wykorzystano algorytmy FCM, PCM oraz algorytm Gustafsona-Kessela. Eksperyment przeprowadzano na danych symulacyjnych. W tym celu zbudowano model numeryczny maszyny wirnikowej, symulującej określone stany i wielkości niewyważenia. Wyznaczone wartości graniczne porównano z wartościami otrzymanymi przy pomocy metody statystycznej. Wszystkie obliczenia wykonywano w środowisku Matlab-Simulink.
The paper describes a methodology for estimating the limit values of char-icteristics of diagnostic signals using methods of fuzzy data clustering (FCM, PCM and Gustafson-Kessel algorithms). The experiment was conducted on simulated data, using a numerical model of a rotor machine, simulating given inbalanced states. Limits were compared with value estimating using the statistical method.
Źródło:
Problemy Eksploatacji; 2011, 2; 213-221
1232-9312
Pojawia się w:
Problemy Eksploatacji
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Linguistically defined clustering of data
Autorzy:
Leski, J. M.
Kotas, M. P.
Powiązania:
https://bibliotekanauki.pl/articles/329995.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
data clustering
possibility theory
linguistic rules
data analysis
grupowanie danych
teoria możliwości
analiza danych
Opis:
This paper introduces a method of data clustering that is based on linguistically specified rules, similar to those applied by a human visually fulfilling a task. The method endeavors to follow these remarkable capabilities of intelligent beings. Even for most complicated data patterns a human is capable of accomplishing the clustering process using relatively simple rules. His/her way of clustering is a sequential search for new structures in the data and new prototypes with the use of the following linguistic rule: search for prototypes in regions of extremely high data densities and immensely far from the previously found ones. Then, after this search has been completed, the respective data have to be assigned to any of the clusters whose nuclei (prototypes) have been found. A human again uses a simple linguistic rule: data from regions with similar densities, which are located exceedingly close to each other, should belong to the same cluster. The goal of this work is to prove experimentally that such simple linguistic rules can result in a clustering method that is competitive with the most effective methods known from the literature on the subject. A linguistic formulation of a validity index for determination of the number of clusters is also presented. Finally, an extensive experimental analysis of benchmark datasets is performed to demonstrate the validity of the clustering approach introduced. Its competitiveness with the state-of-the-art solutions is also shown.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2018, 28, 3; 545-557
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Inteligentny model wskaźnika zagrożenia pożarowego w kopalni węgla
Intelligent fire hazards indicator model in coal mine
Autorzy:
Mrozek, B.
Felka, D.
Powiązania:
https://bibliotekanauki.pl/articles/276623.pdf
Data publikacji:
2012
Wydawca:
Sieć Badawcza Łukasiewicz - Przemysłowy Instytut Automatyki i Pomiarów
Tematy:
przenośniki taśmowe
zagrożenie pożarowe
klasteryzacji danych
model rozmyty
belt conveyor
fire hazard
data clustering
fuzzy model
Opis:
Istotny wpływ na wykrywanie zagrożenia pożarowego przenośników taśmowych w kopalniach węgla mają wartości takich parametrów, jak: stężenie tlenku węgla (CO) i cyjanowodoru (HCN) oraz wartości sygnałów z czujników dymu. Wielkości te są uwzględniane podczas wyznaczania wartości wskaźnika zagrożenia pożarowego. Zbudowano rozmyty model wskaźnika zagrożenia pożarowego w oparciu o laboratoryjne dane pomiarowe wymienionych wielkości. Model rozmyty wygenerowano z danych numerycznych przy zastosowaniu czterech algorytmów rozmytej klasteryzacji, które zaimplementowano w kodzie środowiska MATLAB. Uzyskane wyniki pokazano w tabelach i na wykresach. Do budowy i wizualizacji projektowanego modelu rozmytego wykorzystano funkcje oraz interfejsy Fuzzy Logic Toolbox.
Significant influence on detecting the fire hazard of belt conveyor in the coal mine have values such parameters as concentration of carbon monoxide (CO), concentration of hydrogen cyanide (HCN) and signals from smoke detectors. Those values are used to set the fire risk index. Fuzzy model of the fire risk index was built based on laboratory data measurements. Fuzzy model was generated from the above numerical data using four algorithms of fuzzy clustering, implemented in the MATLAB code. The results are shown in tables and graphs. MATLAB and Fuzzy Logic Toolbox library (functions and interfaces) were used to design and visualize the proposed fuzzy model.
Źródło:
Pomiary Automatyka Robotyka; 2012, 16, 2; 540-545
1427-9126
Pojawia się w:
Pomiary Automatyka Robotyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Możliwości wykorzystania statystycznych metod klasyfikacji danych w badaniach natężenia suburbanizacji
Scope of application of statistical methods of data classification in analysing the intensity of suburbanization
Autorzy:
Żelechowski, Maciej
Powiązania:
https://bibliotekanauki.pl/articles/1023252.pdf
Data publikacji:
2015-03-20
Wydawca:
Uniwersytet im. Adama Mickiewicza w Poznaniu
Tematy:
metropolisation
suburbanization
functional urban areas
statistical data classification
data clustering
metropolizacja
suburbanizacja
miejskie obszary funkcjonalne
klasyfikacja danych statystycznych
analiza skupień
Opis:
Suburbanizacja, jako składowa procesu metropolizacji, a jednocześnie jeden z etapów cyklu życia aglomeracji miejskich, dotyczy obecnie prawie wszystkich głównych ośrodków miejskich naszego kraju, stanowiąc podstawowy problem związany z ich rozwojem. Przydatnym narzędziem badania zróżnicowania natężenia suburbanizacji w strefach podmiejskich czy szerzej - na obszarach metropolitalnych - mogą być statystyczne metody klasyfikacji danych, takie jak analiza skupień. Metody te pozwalają na grupowanie jednostek terytorialnych danego obszaru (np. powiatów, gmin, miejscowości statystycznych) we względnie jednorodne klasy pod kątem natężenia zjawisk suburbanizacyjnych. Podstawą takiego grupowania jest podobieństwo pomiędzy poszczególnymi badanymi obiektami (np. gminami) w zakresie wartości zmiennych przyjmowanych za wskaźniki zaawansowania suburbanizacji.
Suburbanization, as a component of the process o f metropolisation, and on the other hand one of the stages of city life-cycle, is now observed in almost all main city agglomerations in our country, being the most important problem connected w ith their development. The useful tools of investigation of intensity of suburbanization in suburban zones, or wider - in metropolitan areas, can be the statistical methods of data classification, such as data clustering. These methods allow grouping the territorial units of given area (e.g. poviats, gminas, statistical locations) in relatively homogeneous classes as regards the intensity of suburbanization. The basis of such grouping is similarity between investigated objects (e.g. gminas) as regards the level of variables accepted for coefficients of intensity of suburbanization.
Źródło:
Rozwój Regionalny i Polityka Regionalna; 2015, 29; 139-148
2353-1428
Pojawia się w:
Rozwój Regionalny i Polityka Regionalna
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Dynamical clustering of streaming data with a growing neural gas network
Grupowanie dynamiczne strumieni danych z zastosowaniem sieci typu growing neural gas
Autorzy:
Migdal-Najman, K.
Najman, K.
Powiązania:
https://bibliotekanauki.pl/articles/37269.pdf
Data publikacji:
2015
Wydawca:
Szkoła Główna Gospodarstwa Wiejskiego w Warszawie. Wydawnictwo Szkoły Głównej Gospodarstwa Wiejskiego w Warszawie
Tematy:
cluster analysis
data stream clustering
Growing Neural Gas network
country
economy
information
globalization
Opis:
One of characteristic feature of contemporary data bases is their growing dynamics. The number of registered entities as well as their group structure tends to dynamically grow. In order to effectively determine the rapidly changing number and structure of clusters, appropriate methods of cluster analysis have to be applied. The paper presents the results of simulation research concerning the possibility of applying self-learning GNG neural networks in clustering data from data streams.
Jedną z charakterystycznych cech współczesnych zbiorów danych jest ich dynamika. Liczba zarejestrowanych obiektów, jak również ich struktura grupowa potrafi zmienić się wielokrotnie w ciągu sekund. W celu skutecznego wykrycia liczby skupień i struktury grupowej rejestrowanych obiektów konieczne staje się zastosowanie specjalnych metod analitycznych. W artykule przedstawiono wyniki badań symulacyjnych w zakresie możliwości zastosowania samouczących się sztucznych sieci neuronowych typu GNG w grupowaniu strumieni danych.
Źródło:
Acta Scientiarum Polonorum. Oeconomia; 2015, 14, 3
1644-0757
Pojawia się w:
Acta Scientiarum Polonorum. Oeconomia
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wybrane aspekty aktywności zawodowej kobiet w państwach UE. Analiza dla lat 2006–2014
Participation of women in the labormarket in the years 2006–2014. EU ststes clustering
Autorzy:
Matuszewska-Janica, Aleksandra
Powiązania:
https://bibliotekanauki.pl/articles/658551.pdf
Data publikacji:
2016
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
rynek pracy
aktywność zawodowa kobiet
grupowanie danych
metoda k-średnich
labour market
female employment activity
data clustering
k-mean method
Opis:
The main aim of the analysis was European Union's states clustering in point of view of female activity on the labour market. The data was obtained from the Eurosat's Labour Force Surveys from years 2006–2014. K-means algorithms was the main analysis method. Obtained results indicate to a wide variety of different forms of women's labour market participation among European Union countries. We can mention three phenomena that have been most highlighted. (1) We found a high percentage of women working in part-time work, especially in the Netherlands. (2) The results show a high proportion of full-time employed women, especially in the EU countries from the former Eastern Bloc. (3) We noted a significant proportion of selfemployed among the employed women in the countries of Southern Europe (Greece, Italy, Portugal, Spain) and in Poland. So, in terms of female economic activity, Poland has a similar pattern as the Southern European countries (also in terms of self-employment).
Jednym z założeń strategii Europa 2020 jest podwyższenie odsetka osób zatrudnionych w wieku 20–64 lata na terenie Unii Europejskiej (UE) do 75%. Realizacja tej strategii ma nastąpić między innymi poprzez zwiększenie aktywności zawodowej kobiet i osób starszych. Powiększenie zasobów siły roboczej ma swoje ekonomiczne uzasadnienie. Związane jest ono przede wszystkim z procesami demograficznymi, a zwłaszcza z powiększaniem się grupy osób w wieku poprodukcyjnym. W różnych państwach UE sytuacja związana z aktywnością zawodową kobiet kształtuje się odmiennie, dlatego też powstało pytanie o podobieństwa i różnice w zaangażowaniu kobiet na rynku pracy w poszczególnych regionach UE. Celem analizy jest grupowanie państw Unii Europejskiej ze względu na różne formy aktywności zawodowej kobiet. Klasyfikacja ta pozwoli na ocenę wzorców dotyczących aktywności zawodowej kobiet w poszczególnych krajach UE. W analizie wykorzystano metodę k-średnich. Dane pochodzą z zasobów Eurostatu z Badania Aktywności Ekonomicznej Ludności. Analizowany okres to lata 2006–2014.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2016, 5, 325
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Multi-swarm that learns
Autorzy:
Trojanowski, K.
Powiązania:
https://bibliotekanauki.pl/articles/969816.pdf
Data publikacji:
2010
Wydawca:
Polska Akademia Nauk. Instytut Badań Systemowych PAN
Tematy:
particle swarm optimization (PSO)
multi-swarm
dynamic optimization
memory
clusters
clustering evolving data streams
quantum particles
Opis:
This paper studies particle swarm optimization approach enriched by two versions of an extension aimed at gathering information during the optimization process. Application of these extensions, called memory mechanisms, increases computational cost, but it is spent to a benefit by incorporating the knowledge about the problem into the algorithm and this way improving its search abilities. The first mechanism is based on the idea of storing explicit solutions while the second one applies one-pass clustering algorithm to build clusters containing search experiences. The main disadvantage of the former mechanism is lack of good rules for identification of outdated solutions among the remembered ones and as a consequence unlimited growth of the memory structures as the optimization process goes. The latter mechanism uses other form of knowledge representation and thus allows us to control the amount of allocated resources more efficiently than the former one. Both mechanisms have been experimentally verified and their advantages and disadvantages in application for different types of optimized environments are discussed.
Źródło:
Control and Cybernetics; 2010, 39, 2; 359-375
0324-8569
Pojawia się w:
Control and Cybernetics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Classification of Large Data Sets. Comparison of Performance of Chosen Algorithms
Klasyfikacja dużych zbiorów porównanie wydajności wybranych algorytmów
Autorzy:
Dudek, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/905663.pdf
Data publikacji:
2013
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
clustering
classification
large data sets
Opis:
Researchers analyzing large (> 100,000 objects) data sets with the methods of cluster analysis often face the problem of computational complexity of algorithms, that sometimes makes it impossible to analyze in an acceptable time. Common solution of this problem is to use less computationally complex algorithms (like k-means), which in turn can in many cases give much worse results than for example algorithms using eigenvalues decomposition . The results of analysis of the actual sets of this type are therefore usually a compromise between quality and computational capabilities of computers. This article is an attempt to present the current state of knowledge on the classification of large datasets, and identify ways to develop and open problems.
Badacze analizujący przy pomocy metod analizy skupień duże (> 100.000 obiektów) zbiory danych, stają często przed problemem złożoności obliczeniowej algorytmów, uniemożliwiającej niekiedy przeprowadzenie analizy w akceptowalnym czasie. Jednym z rozwiązań tego problemu jest stosowanie mniej złożonych obliczeniowo algorytmów (hierarchiczne aglomeracyjne, k-średnich), które z kolei mogą w wielu sytuacjach dawać zdecydowanie gorsze rezultaty niż np. algorytmy wykorzystujące dekompozycję względem wartości własnych. Rezultaty rzeczywistych analiz tego typu zbiorów są więc zazwyczaj kompromisem pomiędzy jakością a możliwościami obliczeniowymi komputerów. Artykuł jest próbą przedstawienia aktualnego stanu wiedzy na temat klasyfikacji dużych zbiorów danych oraz wskazania dróg rozwoju i problemów otwartych.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2013, 285
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A new method for automatic determining of the DBSCAN parameters
Autorzy:
Starczewski, Artur
Goetzen, Piotr
Er, Meng Joo
Powiązania:
https://bibliotekanauki.pl/articles/1837535.pdf
Data publikacji:
2020
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
clustering algorithms
DBSCAN
data mining
Opis:
Clustering is an attractive technique used in many fields in order to deal with large scale data. Many clustering algorithms have been proposed so far. The most popular algorithms include density-based approaches. These kinds of algorithms can identify clusters of arbitrary shapes in datasets. The most common of them is the Density-Based Spatial Clustering of Applications with Noise (DBSCAN). The original DBSCAN algorithm has been widely applied in various applications and has many different modifications. However, there is a fundamental issue of the right choice of its two input parameters, i.e the eps radius and the MinPts density threshold. The choice of these parameters is especially difficult when the density variation within clusters is significant. In this paper, a new method that determines the right values of the parameters for different kinds of clusters is proposed. This method uses detection of sharp distance increases generated by a function which computes a distance between each element of a dataset and its k-th nearest neighbor. Experimental results have been obtained for several different datasets and they confirm a very good performance of the newly proposed method.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2020, 10, 3; 209-221
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Ensemble Approach for Clustering of Interval-Valued Symbolic Data
Autorzy:
Pelka, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/466089.pdf
Data publikacji:
2012
Wydawca:
Główny Urząd Statystyczny
Tematy:
Ensemble clustering
interval-valued symbolic data
Opis:
Ensemble approach has been applied with a success to regression and discrimination tasks [see for example Gatnar 2008]. Nevertheless, the idea of ensemble approach, that is combining (aggregating) the results of many base models, can be applied to cluster analysis of symbolic data. The aim of the article is to present suitable ensemble clustering based on symbolic data. The empirical part of the paper presents results simulation studies (based on artificial data sets with known cluster structure) of ensemble clustering based on co-occurrence matrix for symbolic interval-valued data, compared with single clustering method. The results are compared according to corrected Rand index.
Źródło:
Statistics in Transition new series; 2012, 13, 2; 335-342
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Ant colony metaphor in a new clustering algorithm
Autorzy:
Boryczka, U.
Powiązania:
https://bibliotekanauki.pl/articles/969824.pdf
Data publikacji:
2010
Wydawca:
Polska Akademia Nauk. Instytut Badań Systemowych PAN
Tematy:
data mining
cluster analysis
ant clustering algorithm
Opis:
Among the many bio-inspired techniques, ant clustering algorithms have received special attention, especially because they still require much investigation to improve performance, stability and other key features that would make such algorithms mature tools for data mining. Clustering with swarm-based algorithms is emerging as an alternative to more conventional clustering methods, such as k-means algorithm. This proposed approach mimics the clustering behavior observed in real ant colonies. As a case study, this paper focuses on the behavior of clustering procedures in this new approach. The proposed algorithm is evaluated on a number of well-known benchmark data sets. Empirical results clearly show that the ant clustering algorithm (ACA) performs well when compared to other techniques.
Źródło:
Control and Cybernetics; 2010, 39, 2; 343-358
0324-8569
Pojawia się w:
Control and Cybernetics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Internal Cluster Quality Indexes for Classification of Symbolic Data
Mierniki jakości klasyfikacji dla danych symbolicznych
Autorzy:
Dudek, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/905043.pdf
Data publikacji:
2009
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
classification
clustering
cluster quality indexes
symbolic data
Opis:
This paper describes main classification methods used for symbolic data (e.g. data in form of: single quantitative value, categorical value, interval, multivalued variable, multivaliued variable with weights) presents difficulties of measuring clustering quality for symbolic data (such as lack of "traditional" data matrix), presents which of known indexes like Silhouette index, Ball index, Hartingan index, Baker and Hubert index, Huberta and Levine index, Ratkovski index, Ball index, Hartigan index, Krzanowski and Lai index, Scott index, Marriot index, Rubin index, Friedman index may be used for validation of such type of data and what indexes are specific only for symbolic data. Simulation results arc used to propose most adequate indexes for each classification algorithm.
Artykuł opisuje procedury klasyfikacyjne, które mogą być używane dla danych symbolicznych (tj. dla danych mogących być reprezentowanych w postaci: liczb, danych jakościowych, przedziałów liczbowych, zbioru wartości, zbioru wartości z wagami), przedstawia problemy związane z mierzeniem jakości klasyfikacji dla tych procedur (takie jak brak „klasycznej" macierzy danych) oraz przedstawia, które ze znanych indeksów, takich jak: Silhouette, indeks Calińskiego-Harabasza, indeks Bakera-Huberta, indeks Huberta-Levine, indeks Ratkowskiego, indeks Balia, indeks Hartigana, indeks Krzanowskiego-Lai, indeks Scotta, indeks Marriota, indeks Rubina i indeks Friedmana, mogą być wykorzystane dla tego typu danych oraz jakie są miary jakości podziału specyficzne dla danych symbolicznych. Na podstawie przeprowadzonych symulacji zaproponowane zostały indeksy faktycznie odzwierciedlające strukturę klas dla poszczególnych algorytmów klasyfikacyjnych.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2009, 225
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A novel grid-based clustering algorithm
Autorzy:
Starczewski, Artur
Scherer, Magdalena M.
Książek, Wojciech
Dębski, Maciej
Wang, Lipo
Powiązania:
https://bibliotekanauki.pl/articles/2031101.pdf
Data publikacji:
2021
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
data mining
grid-based clustering
grid structure
Opis:
Data clustering is an important method used to discover naturally occurring structures in datasets. One of the most popular approaches is the grid-based concept of clustering algorithms. This kind of method is characterized by a fast processing time and it can also discover clusters of arbitrary shapes in datasets. These properties allow these methods to be used in many different applications. Researchers have created many versions of the clustering method using the grid-based approach. However, the key issue is the right choice of the number of grid cells. This paper proposes a novel grid-based algorithm which uses a method for an automatic determining of the number of grid cells. This method is based on the kdist function which computes the distance between each element of a dataset and its kth nearest neighbor. Experimental results have been obtained for several different datasets and they confirm a very good performance of the newly proposed method.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2021, 11, 4; 319-330
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Comparative Study of Techniques Used in Prediction of Student Performance
Autorzy:
Chauhan, Minakshi
Gupta, Varsha
Powiązania:
https://bibliotekanauki.pl/articles/1159721.pdf
Data publikacji:
2018
Wydawca:
Przedsiębiorstwo Wydawnictw Naukowych Darwin / Scientific Publishing House DARWIN
Tematy:
Classification
Clustering
Data Mining Techniques
Educational Data Mining
Fuzzy Logic
Opis:
Providing high quality education is a major concern for higher educational institutions. The quality of education in higher institutions can be assessed by the teaching and learning process. The quality of the teaching learning process depends on the performance of instructor as well as performance of students involved. Analysis and prediction of student performance is key step to identify the poor academic performance. On the basis of prediction, the corrective actions must be taken to improve performance of students and enhance the quality of education system. In this study we surveyed the techniques commonly used to predict the performance of students and also analysed the factors affecting the student academic performance.
Źródło:
World Scientific News; 2018, 113; 185-193
2392-2192
Pojawia się w:
World Scientific News
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Grupowanie zmiennych w procesach eksploracji danych (Data Mining)
Variable clustering in exploration data processes
Autorzy:
Lasek, M.
Pęczkowski, M.
Powiązania:
https://bibliotekanauki.pl/articles/399404.pdf
Data publikacji:
2010
Wydawca:
Politechnika Białostocka. Oficyna Wydawnicza Politechniki Białostockiej
Tematy:
procesy eksploracji danych
variable clustering
exploration data
Opis:
Variable clustering is a useful tool for data reduction. It removes collinearity, decreases variable redundancy and helps to interpret results of an analysis. In the paper, Variable Clustering Node of SAS Enterprise Miner is described. An example of clustering of households expenditures on food, alcohol and tobacco is presented.
Źródło:
Ekonomia i Zarządzanie; 2010, 2, 1; 83-94
2080-9646
Pojawia się w:
Ekonomia i Zarządzanie
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A new mechanism for data visualization with TSK-type preprocessed collaborative fuzzy rule based system
Autorzy:
Prasad, M.
Liu, Y.-T.
Li, D.-L.
Lin, C. -T.
Shah, R. R.
Kaiwartya, O. P.
Powiązania:
https://bibliotekanauki.pl/articles/91743.pdf
Data publikacji:
2017
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
fuzzy interference system
collaborative clustering
fuzzy logic
big data
data visualization
Opis:
A novel data knowledge representation with the combination of structure learning ability of preprocessed collaborative fuzzy clustering and fuzzy expert knowledge of TakagiSugeno-Kang type model is presented in this paper. The proposed method divides a huge dataset into two or more subsets of dataset. The subsets of dataset interact with each other through a collaborative mechanism in order to find some similar properties within eachother. The proposed method is useful in dealing with big data issues since it divides a huge dataset into subsets of dataset and finds common features among the subsets. The salient feature of the proposed method is that it uses a small subset of dataset and some common features instead of using the entire dataset and all the features. Before interactions among subsets of the dataset, the proposed method applies a mapping technique for granules of data and centroid of clusters. The proposed method uses information of only half or less/more than the half of the data patterns for the training process, and it provides an accurate and robust model, whereas the other existing methods use the entire information of the data patterns. Simulation results show the proposed method performs better than existing methods on some benchmark problems.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2017, 7, 1; 33-46
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Możliwości zastosowania data mining w sektorze opieki zdrowotnej
Autorzy:
Sala, Karolina
Selwon, Adam
Powiązania:
https://bibliotekanauki.pl/articles/2148180.pdf
Data publikacji:
2018
Wydawca:
Instytut Studiów Międzynarodowych i Edukacji Humanum
Tematy:
health care
data mining
data analysis
clustering
regression
prevention of errors
Opis:
Health care is a dynamically developing sector of the economy, which generates a large amount of useful data about health of the inhabitants of the country and individual regions. These include information on the incidence of selected diseases, data on medical facilities and employees, as well as expenditure on health care. in recent years, many scientific articles about data mining in health care have been published. in this article, presented a review of the literature on health analytics and data mining techniques used in this field. based on the information gathered, the current development in this field and possibilities that can be used in the future are indicated.
Źródło:
Prosopon. Europejskie Studia Społeczno-Humanistyczne; 2018, 3(24); 85-92
1730-0266
Pojawia się w:
Prosopon. Europejskie Studia Społeczno-Humanistyczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analysis of innovations in the European Union via ensemble symbolic density clustering
Analiza innowacyjności krajów Unii Europejskiej z zastosowaniem wielomodelowej klasyfikacji gęstościowej danych symbolicznych
Autorzy:
Pełka, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/425070.pdf
Data publikacji:
2018
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
innovations
European Union
symbolic data analysis
ensemble clustering
Opis:
Innovations play a very important role in the modern economy. They are the key to a higher quality of life, better jobs and economy and sustainable development. The innovation policy is a key element of both national and European Union strategy. The main aim of this paper is to present an ensemble clustering of European Union countries (member states) considering their innovativeness. In the empirical section, symbolic density-based ensemble clustering is used to obtain the co-occurrence matrix. The paper uses symbolicDA, clusterSim and dbscan packages of R software for all calculations. Four different clusters where obtained in the result of clustering. Cluster 1 contains highinnovative countries (innovation leaders). This cluster is also the least homogenous. Cluster 2 contains post-communist countries mainly from central Europe. These countries can be seen as rather mid-low innovative (they try to “catch up” with innovation leaders). Cluster 3 contains moderate innovators. Cluster 4 contains two countries that are also mid-innovative.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2018, 22, 3; 84-98
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Supporting investment decisions using data mining methods
Autorzy:
Sysiak, W.
Trajer, J.
Janaszek, M.
Powiązania:
https://bibliotekanauki.pl/articles/93017.pdf
Data publikacji:
2009
Wydawca:
Uniwersytet Przyrodniczo-Humanistyczny w Siedlcach
Tematy:
data mining
decision support
k-means clustering
neural networks
Opis:
This paper presents an application of k-means clustering in preliminary data analysis which preceded the choice of input variables for the system supporting the decision about stock purchase or sale on capital markets. The model forecasting share prices issued by companies in the food-processing sector quoted at the Warsaw Stock Exchange was created in STATISTICA 7.1. It was based on neural modeling and allowed for the assessment of changes direction in securities values (increase, decrease) and generates the quantitative forecast of their future price.
Źródło:
Studia Informatica : systems and information technology; 2009, 1(12); 67-78
1731-2264
Pojawia się w:
Studia Informatica : systems and information technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Data mining tasks and methods – implementations in R
Autorzy:
Figielska, Ewa
Powiązania:
https://bibliotekanauki.pl/articles/1397482.pdf
Data publikacji:
2020
Wydawca:
Warszawska Wyższa Szkoła Informatyki
Tematy:
data mining
R programming language
classification
prediction
clustering
association
Opis:
The aim of the paper is to present how some of the data mining tasks can be solved using the R programming language. The full R scripts are provided for preparing data sets, solving the tasks and analyzing the results.
Źródło:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki; 2020, 14, 23; 27-49
1896-396X
2082-8349
Pojawia się w:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Reducing the number of paths in a minimized project-network with given bounds on the durations of activities
Autorzy:
Viattchenin, D.
Powiązania:
https://bibliotekanauki.pl/articles/406450.pdf
Data publikacji:
2015
Wydawca:
Politechnika Wrocławska. Oficyna Wydawnicza Politechniki Wrocławskiej
Tematy:
project-network
dominant path
heuristic possibilistic clustering
interval-valued data
stationary clustering structure
typical point
Opis:
This paper deals in a preliminary way with the problem of selecting the smallest possible number of dominant paths in a minimized project-network with given bounds on the permissible values of the durations of activities. For this purpose, a classification technique is proposed. This technique is based on a heuristic possibilistic clustering of interval-valued data. The basic concepts of heuristic possibilistic clustering are defined and methods for preprocessing interval-valued data are described. An illustrative example is considered in detail and some conclusions are formulated.
Źródło:
Operations Research and Decisions; 2015, 25, 4; 71-87
2081-8858
2391-6060
Pojawia się w:
Operations Research and Decisions
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Comparison of Fuzzy Clustering Methods for Symbolic Interval-Valued Data
Porównanie metod klasyfikacji rozmytej dla danych symbolicznych interwałowych
Autorzy:
Pełka, Marcin
Dudek, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/1364881.pdf
Data publikacji:
2015-09-30
Wydawca:
Główny Urząd Statystyczny
Tematy:
spectral clustering
fuzzy clustering
fuzzy partition
interval-valued data
symbolic data analysis
klasyfikacja spektralna
klasyfikacja rozmyta
dane symboliczne interwałowe
analiza danych symbolicznych
Opis:
Interval-valued data can find their practical applications in such situations as recording monthly interval temperatures at meteorological stations, daily interval stock prices, etc. The primary objective of the presented paper is to compare three different methods of fuzzy clustering for interval-valued symbolic data, i.e.: fuzzy c-means clustering, adaptive fuzzy c-means clustering and fuzzy k-means clustering with fuzzy spectral clustering. Fuzzy spectral clustering combines both spectral and fuzzy approaches in order to obtain better results (in terms of Rand index for fuzzy clustering). The conducted simulation studies with artificial and real data sets confirm both higher usefulness and more stable results of fuzzy spectral clustering method, as compared to other existing fuzzy clustering methods for symbolic interval-valued data, when dealing with data featuring different cluster structures, noisy variables and/or outliers.
Dane symboliczne interwałowe mogą znaleźć zastosowanie w wielu sytuacjach – np. w przypadku notowań giełdowych, zmianach kursów walut, itp. Celem artykułu jest porównanie trzech metod klasyfikacji rozmytej dla danych symbolicznych interwałowych – tj. rozmytej klasyfikacji c-średnich, adaptacyjnej rozmytej klasyfikacji c-średnich oraz rozmytej klasyfikacji k-średnich z rozmytą klasyfikacją spektralną. Rozmyta klasyfikacja spektralna stanowi połączenie podejścia spektralnego oraz klasyfikacji rozmytej c-średnich, dzięki czemu możliwe jest otrzymanie lepszych rezultatów (w sensie indeksu Randa dla klasyfikacji rozmytych). Przeprowadzone badania symulacyjne wskazują, że rozmyta klasyfikacja spektralna dla danych symbolicznych pozwala na uzyskanie lepszych wyników niż inne rozmyte metody klasyfikacji dla tego typu danych jeżeli weźmiemy pod uwagę zbiory danych o różnej strukturze klas, która dodatkowo jest zniekształcana przez obserwacje odstające lub zmienne zakłócające.
Źródło:
Przegląd Statystyczny; 2015, 62, 3; 301-319
0033-2372
Pojawia się w:
Przegląd Statystyczny
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Podejście wielomodelowe analizy danych symbolicznych w ocenie pozycji produktów na rynku
Ensemble learning for symbolic datain product positioning
Autorzy:
Pełka, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/424929.pdf
Data publikacji:
2013
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
ensemble clustering
cluster analysis of symbolic data
product positioning
Opis:
Product positioning is a wide range of business activities. Positioning is the process by which marketers try to create an image or identity in the minds of their target market for its product, brand, or organization. The main aim of the paper is to preset and apply ensemble learning for symbolic data in cluster analysis in order to evaluate a product position. Empirical part of the paper presents the application of co-occurrence matrix and bagging algorithm in ensemble learning for symbolic data (car market data was used). These two approaches reached almost the same results when considering adjusted Rand index.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2013, 2(40); 95-102
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analysis of happiness in EU countries using the multi-model classification based on models of symbolic data
Autorzy:
Pełka, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/425036.pdf
Data publikacji:
2019
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
happiness
the European Union
symbolic data analysis
ensemble clustering
Opis:
The results of happiness analysis are presented in the form of a World Happiness Report that covers 156 countries and 17 different indicators. In the article model-based clustering ensemble is built to determine what selected European countries have similar patterns of happiness. The results are analyzed using multidimensional scaling and a decision tree to find out what factors determine cluster memberships. In the empirical part, three clusters were detected The first contains countries: Austria, Denmark, Finland, Germany, Ireland, Luxembourg, the Netherlands, Norway, Sweden, Switzerland and the United Kingdom. They have the highest values for all the variables, except the negative affect. The second cluster contains seven countries: Bulgaria, Estonia, Hungary, Lithuania, Poland, Romania and Slovakia. This cluster is also the most homogeneous one. The third cluster contains eight countries: Cyprus, the Czech Republic, France, Greece, Italy, Portugal, Slovenia and Spain.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2019, 23, 3; 15-25
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Implementation of Big Data Concept for Variability Mapping Control of Financing Assessment of Informal Sector Workers in Bogor City
Autorzy:
Salmah, Salmah
Andria, Fredi
Wahyudin, Irfan
Powiązania:
https://bibliotekanauki.pl/articles/1065325.pdf
Data publikacji:
2019
Wydawca:
Przedsiębiorstwo Wydawnictw Naukowych Darwin / Scientific Publishing House DARWIN
Tematy:
Big Data
Cluster
Informal Worker Sector
K-Means Clustering
Opis:
At present risks and uncertainties occur in protecting health for the community. This requires a national health insurance program that can guarantee health care costs. One of the program participants is a resident who works in the informal sector. This group is vulnerable as well as the potential for the implementation of health insurance programs. However, the level of participation of informal sector workers is still low, so an analysis of the constraints affecting it is needed. This study aims to identify categories of informal sector workers and analyze various obstacles faced by informal sector workers to become health insurance participants in the city of Bogor. The method used is the concept of big data with K-means clustering data mining techniques to group informal sector workers along with the constraints that exist in each of these groups. The results showed that there were 3 clusters with very low Social Security Administrator (BPJS) health ownership, namely cluster 1, cluster 3, and cluster 5. Each cluster had different constraints. Cluster 1 has constraints on the number of dependents it has, Cluster 3 has constraints on the gender side that are dominated by women, while Cluster 5 has constraints on the low-income side. Each cluster has a different obstacle resolution recommendation, namely for cluster 1 by registering workers in JKN contribution recipient (PBI) participants, cluster 2 by giving outreach to women who have only focused on men, and for clusters 5 by involving the community as a forum for the empowerment of informal sector workers.
Źródło:
World Scientific News; 2019, 135; 261-282
2392-2192
Pojawia się w:
World Scientific News
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Grade analysis of data from the European Economic Survey 2005 on Economic Climate in Polish Servicing Sector
Autorzy:
Grabowska, G.
Wiech, M.
Powiązania:
https://bibliotekanauki.pl/articles/969675.pdf
Data publikacji:
2009
Wydawca:
Polska Akademia Nauk. Instytut Badań Systemowych PAN
Tematy:
clustering
data visualization
grade correspondence analysis
overrepresentation
rank correlation
Opis:
The anonymous data from 1352 companies concerning the economic climate in Polish servicing sector from the European Economic Survey 2005 was obtained by courtesy of The Polish Chamber of Commerce. The Grade Correspondence Analysis (GCA) with posterior clustering (GCCA) is introduced and applied to this data. The main task of this analysis is to create the first view of data and to reveal their latent structure. This provides an insight into the economic factors and enables making conclusions about business conditions in Poland.
Źródło:
Control and Cybernetics; 2009, 38, 3; 783-810
0324-8569
Pojawia się w:
Control and Cybernetics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Travel Time Forecasting Based on Fuzzy Patterns
Autorzy:
Kiersztyn, Adam
Gandzel, Agnieszka Gandzel
Koczan, Leopold
Celiński, Maciej
Powiązania:
https://bibliotekanauki.pl/articles/2023310.pdf
Data publikacji:
2021
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
fuzzy clustering
travel time forecasting
fuzzy patterns
transportation data
Opis:
Estimating travel time is one of the most important processes in logistics as well as in everyday life. In particular, when it comes to transportation services, efficient time management can be a competitive advantage, not to mention customer satisfaction, which can be easily translated into business success. Therefore, in this study we analyze various travel time estimation methods in combination with a well-known Fuzzy C-Means clustering algorithm. The proposed FCM-based solution has significant advantages, allowing for the determination of the optimal travel time. In an extensive numerical experiment, we present the application of the proposed method to estimate the time of a taxi trip around New York. Due to division of the city area into detailed areas and taking into account information about the travel time in the analysis, a model was obtained, that perfectly forecasts speed of taxi travel. In this study we consider various, competitive approaches to build such a model.
Źródło:
Advances in Science and Technology. Research Journal; 2021, 15, 3; 224-232
2299-8624
Pojawia się w:
Advances in Science and Technology. Research Journal
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Data mining
Autorzy:
Morzy, Tadeusz
Powiązania:
https://bibliotekanauki.pl/articles/703139.pdf
Data publikacji:
2007
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
data mining
data analysis
evolution of information technology
association analysis
classification
clustering
Web mining
Opis:
Recent advances in data capture, data transmission and data storage technologies have resulted in a growing gap between more powerful database systems and users' ability to understand and effectively analyze the information collected. Many companies and organizations gather gigabytes or terabytes of business transactions, scientific data, web logs, satellite pictures, textreports, which are simply too large and too complex to support a decision making process. Traditional database and data warehouse querying models are not sufficient to extract trends, similarities and correlations hidden in very large databases. The value of the existing databases and data warehouses can be significantly enhanced with help of data mining. Data mining is a new research area which aims at nontrivial extraction of implicit, previously unknown and potentially useful information from large databases and data warehouses. Data mining, also referred to as database mining or knowledge discovery in databases, can help answer business questions that were too time consuming to resolve with traditional data processing techniques. The process of mining the data can be perceived as a new way of querying – with questions such  as ”which clients are likely to respond to our next promotional mailing, and why?”. The aim of this paper is to present an overall picture of the data mining field as well as presents briefly few data mining methods. Finally, we summarize the concepts presented in the paper and discuss some problems related with data mining technology.
Źródło:
Nauka; 2007, 3
1231-8515
Pojawia się w:
Nauka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Poczucie śląskości wśród Ślązaków – analiza empiryczna z wykorzystaniem modeli klas ukrytych
A sense of being Silesian – an empirical analysis with the use of latent class models
Autorzy:
Genge, Ewa
Powiązania:
https://bibliotekanauki.pl/articles/425295.pdf
Data publikacji:
2013
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
latent class analysis
mixture model
model-based clustering
categorical data
Opis:
The paper focuses on latent class models and their application for quantitative data. Latent class modeling is one of multivariate analysis techniques of the contingency table and can be viewed as a special case of model-based clustering, for multivariate discrete data. It is assumed that each observation comes from one of the numbers of subpopulations, with its own probability distribution. We used latent class analysis for grouping and detecting homogeneity of Silesian people using poLCA package of R. We analyzed data collected by the Department of Social Pedagogy, University of Silesia in Katowice.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2013, 4(42); 48-59
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analysis of data aggregation methods and related issues in Wireless Sensor Networks
Autorzy:
Nels, S. Ninisha
Singh, J. Amar Pratap
Powiązania:
https://bibliotekanauki.pl/articles/2050167.pdf
Data publikacji:
2020
Wydawca:
Polska Akademia Nauk. Instytut Badań Systemowych PAN
Tematy:
data aggregation
wireless sensor network
WSN
clustering
cluster head
CH
cluster-based data aggregation
Opis:
Data aggregation is the process aimed at reducing the transmission count of packets being transmitted in the framework of in-network data processing. It is the data transmission model that takes the information transmitted from different nodes and generates a single data packet after finding and eliminating the redundant packets. Accordingly, this process decreases the transmission count and makes it possible to consume less energy. The major issues in data aggregation mechanism are related to reduction of latency and to energy balancing. Moreover, it is very complex to resolve the issue of packet loss, which is the failure of one or more transmitted packets to arrive at their destination due to the bad and/or congested channel conditions. The present survey involves a collection of 50 research papers dealing with the data aggregation models in wireless sensor networks (WSN). Various data aggregation methods, like the cluster-based approach, structure-free method, tree-based approach, in-network methods, and energy based aggregation model are considered in this survey, regarding the application and the energy usage involved. On the basis of the survey, the issues and drawbacks faced by the respective methodologies are highlighted. In addition, the paper presents simple statistics of the studies considered with respect to the performance measures, simulation tools, publication year, and classification of methods. The future dimensions of the respective research are supposed to be based on the challenges identified in this survey.
Źródło:
Control and Cybernetics; 2020, 49, 4; 419-446
0324-8569
Pojawia się w:
Control and Cybernetics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Application of modified fuzzy clustering to medical data classification
Autorzy:
Jeżewski, M.
Powiązania:
https://bibliotekanauki.pl/articles/333509.pdf
Data publikacji:
2011
Wydawca:
Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Tematy:
grupowanie rozmyte
klasyfikacja
dane medyczne
fuzzy clustering
classification
medical data
Opis:
Classification plays very important role in medical diagnosis. This paper presents fuzzy clustering method dedicated to classification algorithms. It focuses on two additional sub-methods modifying obtained clustering prototypes and leading to final prototypes, which are used for creating the classifier fuzzy if-then rules. The main goal of that work was to examine a performance of the classifier which uses such rules. Commonly used including medical benchmark databases were applied. In order to validate the results, each database was represented by 100 pairs of learning and testing subsets. The obtained classification quality was better in relation to the one of the best classifiers - Lagrangian SVM and suggests that presented clustering with additional sub-methods are appropriate to application to classification algorithms.
Źródło:
Journal of Medical Informatics & Technologies; 2011, 17; 51-57
1642-6037
Pojawia się w:
Journal of Medical Informatics & Technologies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Life Insurance Customers segmentation using fuzzy clustering
Autorzy:
Jandaghi, Gholamreza
Moazzez, Hashem
Moradpour, Zahra
Powiązania:
https://bibliotekanauki.pl/articles/1193938.pdf
Data publikacji:
2015
Wydawca:
Przedsiębiorstwo Wydawnictw Naukowych Darwin / Scientific Publishing House DARWIN
Tematy:
Market segmentation
customer segmentation
data mining
fuzzy clustering
life insurance
Opis:
One of the important issues in service organizations is to identify the customers, understanding their difference and ranking them. Recently, the customer value as a quantitative parameter has been used for segmenting customers. A practical solution for analytical development is using analytical techniques such as dynamic clustering algorithms and programs to explore the dynamics in consumer preferences. The aim of this research is to understand the current customer behavior and suggest a suitable policy for new customers in order to attain the highest benefits and customer satisfaction. To identify such market in life insurance customers, We have used the FKM.pf.niose fuzzy clustering technique for classifying the customers based on their demographic and behavioral data of 1071 people in the period April to October 2014. Results show the optimal number of clusters is 3. These three clusters can be named as: investment, security of life and a combination of both. Some suggestions are presented to improve the performance of the insurance company.
Źródło:
World Scientific News; 2015, 21; 24-35
2392-2192
Pojawia się w:
World Scientific News
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Extracting fuzzy classifications rules from three - way data
Autorzy:
Kacprzyk, J.
Owsinski, J. W.
Viattchenin, D. A.
Powiązania:
https://bibliotekanauki.pl/articles/385102.pdf
Data publikacji:
2014
Wydawca:
Sieć Badawcza Łukasiewicz - Przemysłowy Instytut Automatyki i Pomiarów
Tematy:
three-way data
possibilistic clustering
fuzzy cluster
typical point
fuzzy rule
Opis:
The paper deals in the conceptual way with the problem of extracting fuzzy classification rules from the three-way data meant in the sense of Sato and Sato [7]. A novel technique based on a heuristic method of possibilistic clustering is proposed. A description of basic concepts of a heuristic method of possibilistic clustering based on concept of an allotment is provided. A preprocessing technique for three-way data is shown. An extended method of constructing fuzzy classification rules based on clustering results is proposed. An illustrative example of the method’s application to the Sato and Sato’s data [7] is provided. An analysis of the experimental results obtained with some conclusions are given.
Źródło:
Journal of Automation Mobile Robotics and Intelligent Systems; 2014, 8, 2; 47-57
1897-8649
2080-2145
Pojawia się w:
Journal of Automation Mobile Robotics and Intelligent Systems
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Development of Data-mining Technique for Seismic Vulnerability Assessment
Autorzy:
Wojcik, Waldemar
Karmenova, Markhaba
Smailova, Saule
Tlebaldinova, Aizhan
Belbeubaev, Alisher
Powiązania:
https://bibliotekanauki.pl/articles/1844631.pdf
Data publikacji:
2021
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
data analysis
seismic assessment
clustering
h-means
k-means
random forest
Opis:
Assessment of seismic vulnerability of urban infrastructure is an actual problem, since the damage caused by earthquakes is quite significant. Despite the complexity of such tasks, today’s machine learning methods allow the use of “fast” methods for assessing seismic vulnerability. The article proposes a methodology for assessing the characteristics of typical urban objects that affect their seismic resistance; using classification and clustering methods. For the analysis, we use kmeans and hkmeans clustering methods, where the Euclidean distance is used as a measure of proximity. The optimal number of clusters is determined using the Elbow method. A decision-making model on the seismic resistance of an urban object is presented, also the most important variables that have the greatest impact on the seismic resistance of an urban object are identified. The study shows that the results of clustering coincide with expert estimates, and the characteristic of typical urban objects can be determined as a result of data modeling using clustering algorithms.
Źródło:
International Journal of Electronics and Telecommunications; 2021, 67, 2; 261-266
2300-1933
Pojawia się w:
International Journal of Electronics and Telecommunications
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Customer’s Purchase Prediction Using Customer Segmentation Approach for Clustering of Categorical Data
Autorzy:
Singh, Juhi
Mittal, Mandeep
Powiązania:
https://bibliotekanauki.pl/articles/1841413.pdf
Data publikacji:
2020
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
categorical data
clustering algorithm
frequent pattern mining
association rules
customer relationship management
Opis:
Traditional clustering algorithms which use distance between a pair of data points to calculate their similarity are not suitable for clustering of boolean and categorical attributes. In this paper, a modified clustering algorithm for categorical attributes is used for segmentation of customers. Each segment is then mined using frequent pattern mining algorithm in order to infer rules that helps in predicting customer’s next purchase. Generally, purchases of items are related to each other, for example, grocery items are frequently purchased together while electronic items are purchased together. Therefore, if the knowledge of purchase dependencies is available, then those items can be grouped together and attractive offers can be made for the customers which, in turn, increase overall profit of the organization. This work focuses on grouping of such items. Various experiments on real time database are implemented to evaluate the performance of proposed approach.
Źródło:
Management and Production Engineering Review; 2021, 12, 2; 57-64
2080-8208
2082-1344
Pojawia się w:
Management and Production Engineering Review
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Abridged Symbolic Representation of Time Series for Clustering
Skrócona reprezentacja symboliczna szeregów czasowych dla analizy skupień
Autorzy:
Korzeniewski, Jerzy
Powiązania:
https://bibliotekanauki.pl/articles/658783.pdf
Data publikacji:
2019
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
analiza skupień
szereg czasowy
reprezentacja symboliczna
data mining
clustering
time series
symbolic representation
Opis:
W ostatnich latach pojawiły się metody symbolicznego reprezentowania szeregów czasowych. Te badania są zasadniczo motywowane względami praktycznymi, takimi jak oszczędzanie pamięci lub szybkie przeszukiwanie baz danych. Niektóre wyniki w temacie symbolicznego reprezentowania szeregów czasowych sugerują, że zapis skrócony może nawet poprawić wyniki grupowania. Artykuł zawiera propozycję nowego algorytmu ukierunkowanego na zagadnienie skróconej symbolicznej reprezentacji szeregów czasowych, a w szczególności na efektywne grupowanie szeregów. Idea propozycji polega na wykorzystaniu techniki PAA (piecewise aggregate approximation) z następną analizą korelacji otrzymanych segmentów szeregu. Podstawowym celem artykułu jest modyfikacja techniki PAA ukierunkowana na możliwość dalszego grupowania szeregów w ich skróconym zapisie. Próbowano również znaleźć odpowiedzi na następujące pytania: „Czy zadanie grupowania szeregów czasowych w ich oryginalnej postaci ma sens?”, „Ile pamięci można oszczędzić, stosując nowy algorytm?”. Efektywność nowego algorytmu została zbadana na empirycznych zbiorach danych szeregów czasowych. Wyniki pokazują, że nowa propozycja jest dość efektywna przy bardzo nikłym stopniu parametryzacji wymaganym od użytkownika.
In recent years a couple of methods aimed at time series symbolic representation have been introduced or developed. This activity is mainly justified by practical considerations such memory savings or fast data base searching. However, some results suggest that in the subject of time series clustering symbolic representation can even upgrade the results of clustering. The article contains a proposal of a new algorithm directed at the task of time series abridged symbolic representation with the emphasis on efficient time series clustering. The idea of the proposal is based on the PAA (piecewise aggregate approximation) technique followed by segmentwise correlation analysis. The primary goal of the article is to upgrade the quality of the PAA technique with respect to possible time series clustering (its speed and quality). We also tried to answer the following questions. Is the task of time series clustering in their original form reasonable? How much memory can we save using the new algorithm? The efficiency of the new algorithm was investigated on empirical time series data sets. The results prove that the new proposal is quite effective with a very limited amount of parametric user interference needed. 
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2019, 2, 341; 43-50
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Grupowanie trajektorii w analizie wyników badań klinicznych
Clustering trajectories in clinical researches
Autorzy:
Mazurek, M.
Powiązania:
https://bibliotekanauki.pl/articles/404019.pdf
Data publikacji:
2016
Wydawca:
Polskie Towarzystwo Symulacji Komputerowej
Tematy:
uczenie maszynowe
grupowanie trajektorii
algorytmy grupowania
analiza wyników badań klinicznych
statystyka
machine learning
trajectories clustering
clustering algorithms
clinical trials data analysis
statistics
Opis:
Wyniki badań klinicznych mogą tworzyć wielowymiarowe szeregi czasowe, które opisują zmiany w czasie istotnych parametrów opisujących stan zdrowia i kondycję pacjenta. Analiza tego typu danych polega na wyodrębnieniu typowych przebiegów - trajektorii w procesie analizy skupień. Klasteryzacja szeregów medycznych wiąże się z transformacją danych wejściowych: regularyzacją szeregu czasowego, uzupełnieniem brakujących danych, standaryzacją zmiennych. W dalszej kolejności należy dobrać liczbę skupień oraz wykonać grupowanie metodą k-średnich, DTW, PDC lub inną. Te algorytmy są dostępne w otwartych środowiskach obliczeń statystycznych, jednak aby ułatwić analitykom ich zastosowanie, został zbudowany pakiet medclust, który dostarcza wysokopoziomowych procedur, domyślnie sparametryzowanych do wyszukiwania skupień.
Clinical researches often involves measuring time-varying parameters of body condition, which forms multidimensional time-series. Typical, representative trajectories can be extracted with clustering algorithms. In order to apply clustering algorithms, raw data has to be preprocessed and this includes regularization of time series, imputation of missing values, values standardization. Next, one of time-series clustering can be applied: Dynamic Time Warping or Permutation Distribution Clustering. These algorithms are already available in open environments for statistical computing like R. In order to facilitate application of the clustering algorithms to the clinical reasarch data, new R package medclust was implemented. It provides analysts with ready-to-use high-level procedures with predefined set of parameters values to analyze clinical trajectories data.
Źródło:
Symulacja w Badaniach i Rozwoju; 2016, 7, 1-2; 15-24
2081-6154
Pojawia się w:
Symulacja w Badaniach i Rozwoju
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Center-based l1-clustering method
Autorzy:
Sabo, K.
Powiązania:
https://bibliotekanauki.pl/articles/330910.pdf
Data publikacji:
2014
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
l1 clustering
data mining
optimization
weighted median problem
metoda grupowania
eksploracja danych
optymalizacja
Opis:
In this paper, we consider the l1-clustering problem for a finite data-point set which should be partitioned into k disjoint nonempty subsets. In that case, the objective function does not have to be either convex or differentiable, and generally it may have many local or global minima. Therefore, it becomes a complex global optimization problem. A method of searching for a locally optimal solution is proposed in the paper, the convergence of the corresponding iterative process is proved and the corresponding algorithm is given. The method is illustrated by and compared with some other clustering methods, especially with the l2-clustering method, which is also known in the literature as a smooth k-means method, on a few typical situations, such as the presence of outliers among the data and the clustering of incomplete data. Numerical experiments show in this case that the proposed l1-clustering algorithm is faster and gives significantly better results than the l2-clustering algorithm.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2014, 24, 1; 151-163
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Selection of clustering methods for wind turbines operational data
Dobór metod grupowania danych procesowych dla turbin wiatrowych
Autorzy:
Gibiec, M.
Barszcz, T.
Bielecka, M.
Powiązania:
https://bibliotekanauki.pl/articles/327686.pdf
Data publikacji:
2010
Wydawca:
Polska Akademia Nauk. Polskie Towarzystwo Diagnostyki Technicznej PAN
Tematy:
diagnostyka maszyn
turbina wiatrowa
eksploracja danych
grupowanie
machine diagnostics
wind turbine
data mining
clustering
Opis:
Quickly growing number of monitored wind turbines has changed the needs for monitoring and diagnostic algorithms. The data from hundreds of monitoring systems are transferred to the diagnostic centers, where the data should be analyzed. High cost of labor created the need for automated diagnostic methods. The first task in this wide discipline is classification of the data and detection of malfunction states. The paper investigates application of data mining methods for classification of operational data from wind turbines. It is shown, that combination of the agglomeration method with the C-means clustering yields very good results and can be used for automated diagnostics of wind farms.
Szybko rosnąca liczba monitorowanych turbin wiatrowych zmieniła potrzeby w zakresie algorytmów monitorowania diagnostyki. Obecnie dane z setek systemów monitorowania przesyłane są do centrów diagnostycznych, gdzie muszą zostać przeanalizowane. Wysokie koszty pracy ekspertów spowodowały potrzebę zautomatyzowania metod diagnostycznych. Pierwszym zadaniem stała się automatyczna klasyfikacja danych i wykrywanie stanów niesprawności. Artykuł przedstawia zastosowanie metod "data mining" do klasyfikacji danych procesowych z turbin wiatrowych. Pokazano, że połączenie metody aglomeracji danych z metodą K-means daje bardzo dobre wyniki i może być zastosowane do zautomatyzowanej diagnostyki farm wiatrowych.
Źródło:
Diagnostyka; 2010, 4(56); 37-42
1641-6414
2449-5220
Pojawia się w:
Diagnostyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Use a cluster approach to organize and analyze data inside the cloud
Autorzy:
Boyko, N.
Mykhailyshyn, P.
Kryvenchuk, Y.
Powiązania:
https://bibliotekanauki.pl/articles/411080.pdf
Data publikacji:
2018
Wydawca:
Polska Akademia Nauk. Oddział w Lublinie PAN
Tematy:
information process
cloud computing
information system
cloud storage
data cloud
cloud service
cluster approach
clustering
Opis:
In this paper, description of a concept of cloud storage is offered. Cloud data storage is a model of an online storage where the data is being stored in multiple, divided between network servers that are provided for clients’ usage, mostly by a third-party company. The majority of the cloud storages (as opposed to file-exchangers) are offering almost boundless set of functions for free, by only limiting the size of the available storage (mostly a couple of gigabytes). Integrated data mining is being used for extracting potentially useful information from unprocessed data. The methods of data analysis are quite important with cloud computing. The implementation of the methods of integrated data mining inside the cloud will let the users receive the helpful information from non-structured or half-constructed web data sources. The main purpose of this work is to organize huge diverse data coming from different sources into clusters, depending on the type of data.
Źródło:
ECONTECHMOD : An International Quarterly Journal on Economics of Technology and Modelling Processes; 2018, 7, 2; 15-22
2084-5715
Pojawia się w:
ECONTECHMOD : An International Quarterly Journal on Economics of Technology and Modelling Processes
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Geodesic distances for clustering linked text data
Autorzy:
Tekir, S.
Mansmann, F.
Keimer, D.
Powiązania:
https://bibliotekanauki.pl/articles/91737.pdf
Data publikacji:
2012
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
clustering
geodesic distance
text data
k-means algorithm
cosine distance
k-harmonic means
microprecision values
Opis:
The quality of a clustering not only depends on the chosen algorithm and its parameters, but also on the definition of the similarity of two respective objects in a dataset. Applications such as clustering of web documents is traditionally built either on textual similarity measures or on link information. Due to the incompatibility of these two information spaces, combining these two information sources in one distance measure is a challenging issue. In this paper, we thus propose a geodesic distance function that combines traditional similarity measures with link information. In particular, we test the effectiveness of geodesic distances as similarity measures under the space assumption of spherical geometry in a 0-sphere. Our proposed distance measure is thus a combination of the cosine distance of the term-document matrix and some curvature values in the geodesic distance formula. To estimate these curvature values, we calculate clustering coefficient values for every document from the link graph of the data set and increase their distinctiveness by means of a heuristic as these clustering coefficient values are rough estimates of the curvatures. To evaluate our work, we perform clustering tests with the k-means algorithm on a subset of the EnglishWikipedia hyperlinked data set with both traditional cosine distance and our proposed geodesic distance. Additionally, taking inspiration from the unified view of the performance functions of k-means and k-harmonic means, min and harmonic average of the cosine and geodesic distances are taken in order to construct alternate distance forms. The effectiveness of our approach is measured by computing microprecision values of the clusters based on the provided categorical information of each article.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2012, 2, 3; 247-258
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Recognition of lip prints using Fuzzy c-Means clustering
Autorzy:
Wrobel, K.
Froelich, W.
Powiązania:
https://bibliotekanauki.pl/articles/333981.pdf
Data publikacji:
2015
Wydawca:
Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Tematy:
lip print
image processing
clustering techniques
data classification
grafika wargowa
przetwarzanie obrazu
metody grupowania
klasyfikacja danych
Opis:
In this paper a new method for lip print recognition is proposed. The proposed approach is based on Fuzzy c-Means clustering of the characteristics features of lip prints. First, the Hough transform is applied for the recognition of the characteristic features within lip prints, then Fuzzy c-Means clustering is performed to cluster those features. The proposed algorithm applies the results of clustering to find an unknown image withing the collected repository of lip prints. Instead of comparing all pairs of individual characteristic features, the proposed algorithm uses the representatives of clusters for the comparison of images. The advantage of using the proposed method is its increased tolerance to the noise in data and thus the increased efficiency of the recognition. The effectiveness of presented method has been verified experimentally using real-world images. The results are satisfactory and suggest the possibility of using the method in forensic identification systems
Źródło:
Journal of Medical Informatics & Technologies; 2015, 24; 67-73
1642-6037
Pojawia się w:
Journal of Medical Informatics & Technologies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Exploiting multi-core and many-core parallelism for subspace clustering
Autorzy:
Datta, Amitava
Kaur, Amardeep
Lauer, Tobias
Chabbouh, Sami
Powiązania:
https://bibliotekanauki.pl/articles/331126.pdf
Data publikacji:
2019
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
data mining
subspace clustering
multicore processor
many core processor
GPU computing
eksploracja danych
procesor wielordzeniowy
obliczenia GPU
Opis:
Finding clusters in high dimensional data is a challenging research problem. Subspace clustering algorithms aim to find clusters in all possible subspaces of the dataset, where a subspace is a subset of dimensions of the data. But the exponential increase in the number of subspaces with the dimensionality of data renders most of the algorithms inefficient as well as ineffective. Moreover, these algorithms have ingrained data dependency in the clustering process, which means that parallelization becomes difficult and inefficient. SUBSCALE is a recent subspace clustering algorithm which is scalable with the dimensions and contains independent processing steps which can be exploited through parallelism. In this paper, we aim to leverage the computational power of widely available multi-core processors to improve the runtime performance of the SUBSCALE algorithm. The experimental evaluation shows linear speedup. Moreover, we develop an approach using graphics processing units (GPUs) for fine-grained data parallelism to accelerate the computation further. First tests of the GPU implementation show very promising results.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2019, 29, 1; 81-91
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Clustering and filtering of measurement data based on dynamic self-organizing neural networks
Grupowanie i filtracja danych pomiarowych z wykorzystaniem dynamicznych, samoorganizujących się sieci neuronowych
Autorzy:
Gorzałczany, M. B.
Rudziński, F.
Powiązania:
https://bibliotekanauki.pl/articles/153286.pdf
Data publikacji:
2010
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
inteligencja obliczeniowa
samoorganizujące się sieci neuronowe
grupowanie
computational intelligence
self-organizing neural networks
clustering
filtering
measurement data
Opis:
The paper presents an application of dynamic self-organizing neural networks (introduced by the same authors) to clustering of complex, multidimensional measurement-type data using as an example the so-called Synthetic Control Chart Time Series available at WWW server of the Department of Information and Computer Science, the University of California at Irvine. Moreover, after deactivation of some of the mechanisms governing the operation of the proposed networks they become efficient tools for signal and data filtering. The filtering of Equiptemp measurement data set available from Time Series Library by means of the proposed networks is also briefly presented.
Artykuł prezentuje zastosowanie tzw. dynamicznych samoorganizujących się sieci neuronowych (zaproponowanych przez autorów tej pracy) do grupowania złożonych, wielowymiarowych danych pomiarowych na przykładzie zbioru danych Synthetic Control Chart Time Series dostępnego na serwerze WWW Uniwersytetu Kalifornijskiego w Irvine (Department of Information and Computer Science). Proponowane sieci, w trakcie procesu uczenia, są w stanie dzielić swoje łańcuchy neuronów na podłańcuchy, ponownie łączyć wybrane podłańcuchy ze sobą oraz dynamicznie zmieniać całkowitą liczbę neuronów sieci. Cechy te umożliwiają im jak najlepsze dopasowanie się do nieznanych z góry struktur "zakodowanych" w danych. Funkcjonowanie proponowanych sieci zilustrowano najpierw na przykładzie złożonego zbioru danych dwuwymiarowych typu dwóch spiral. Po wyłączeniu pewnych mechanizmów rządzących funkcjonowaniem proponowanych sieci stają się one również efektywnymi narzędziami filtracji sygnałów. Przykłady filtracji danych pomiarowych zawartych w zbiorze Equiptemp pochodzącym z tzw. Time Series Library są również przedstawione w artykule.
Źródło:
Pomiary Automatyka Kontrola; 2010, R. 56, nr 12, 12; 1416-1419
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Inefficiency of data mining algorithms and its architecture: with emphasis to the shortcoming of data mining algorithms on the output of the researches
Autorzy:
Tesema, Workineh
Powiązania:
https://bibliotekanauki.pl/articles/118221.pdf
Data publikacji:
2019
Wydawca:
Polskie Towarzystwo Promocji Wiedzy
Tematy:
data mining
classification
clustering
association
regression
algorithms bottleneck
pozyskiwanie danych
klasyfikacja
grupowanie
asocjacja
regresja
wąskie gardło algorytmów
Opis:
This review paper presents a shortcoming associated to data mining algorithm(s) classification, clustering, association and regression which are highly used as a tool in different research communities. Data mining researches has successfully handling large amounts of dataset to solve the problems. An increase in data sizes was brought a bottleneck on algorithms to retrieve hidden knowledge from a large volume of datasets. On the other hand, data mining algorithm(s) has been unable to analysis the same rate of growth. Data mining algorithm(s) must be efficient and visual architecture in order to effectively extract information from huge amounts of data in many data repositories or in dynamic data streams. Data visualization researchers believe in the importance of giving users an overview and insight into the data distributions. The combination of the graphical interface is permit to navigate through the complexity of statistical and data mining techniques to create powerful models. Therefore, there is an increasing need to understand the bottlenecks associated with the data mining algorithms in modern architectures and research community. This review paper basically to guide and help the researchers specifically to identify the shortcoming of data mining techniques with domain area in solving a certain problems they will explore. It also shows the research areas particularly a multimedia (where data can be sequential, audio signal, video signal, spatio-temporal, temporal, time series etc) in which data mining algorithms not yet used.
Źródło:
Applied Computer Science; 2019, 15, 3; 73-86
1895-3735
Pojawia się w:
Applied Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies