Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Klasyfikacja danych" wg kryterium: Temat


Tytuł:
Problematyka doboru miary odległości w klasyfikacji spektralnej danych symbolicznych
The Problem of Distance Measure Selection for Spectral Clustering of Symbolic Data
Autorzy:
Pełka, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/586131.pdf
Data publikacji:
2014
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Klasyfikacja danych
Pomiary
Data classifications
Measurement
Opis:
Spectral clustering that was proposed by Ng, Jordan and Weiss, is not in fact a new clustering method, but rather a new way to prepare data set for clustering method. This method uses the idea of spectral decomposition. The main aim of the paper is to present a possibility of application spectral clustering when dealing symbolic data, with a special focus on different distance measures that can be applied for this kind of data. In experiment studies artificial data sets with known cluster structure were obtained with application of clusterSim and mlbench packages of R software. Each data set was clustered 40 times with application of each distance measure applied. Received results were compared with known cluster structure with application of adjusted Rand index.
Źródło:
Studia Ekonomiczne; 2014, 195; 141-150
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Sprawozdanie z XVIII Konferencji Naukowej Sekcji Klasyfikacji i Analizy Danych (XXIII Konferencji Taksonomicznej) "Klasyfikacja i analiza danych – teoria i zastosowania"
Autorzy:
Luczak, A.
Powiązania:
https://bibliotekanauki.pl/articles/43297.pdf
Data publikacji:
2010
Wydawca:
Uniwersytet Przyrodniczy w Poznaniu. Wydawnictwo Uczelniane
Tematy:
statystyka
klasyfikacja danych
analiza danych
konferencje
Miedzyzdroje konferencja
Źródło:
Journal of Agribusiness and Rural Development; 2010, 15, 1
1899-5241
Pojawia się w:
Journal of Agribusiness and Rural Development
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Personal identity verification method based on lips photographs
Autorzy:
Wrobel, K.
Doroz, R.
Porwik, P.
Naruniec, J.
Kowalski, M.
Powiązania:
https://bibliotekanauki.pl/articles/333548.pdf
Data publikacji:
2015
Wydawca:
Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Tematy:
biometrics
lip features
data classification
biometria
cechy wargi
klasyfikacja danych
Opis:
The paper presents a personal identification method based on lips photographs. This method uses a new approach to the extraction and classification of characteristic features of the mouth from photographs. It eliminates the drawbacks that occur during the acquisition of lip print images with the use of the forensic method that requires special tools. Geometrical dimensions of the entire mouth as well as of the upper and lower lips were adopted as the features, on the basis of which the verification is performed. An ensemble classifier was used for the classification of the features obtained. The effectiveness of the classifier has been verified experimentally.
Źródło:
Journal of Medical Informatics & Technologies; 2015, 24; 59-65
1642-6037
Pojawia się w:
Journal of Medical Informatics & Technologies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Diagnosing Parkinson’s disease using the classification of speech signals
Autorzy:
Froelich, W.
Wróbel, K.
Porwik, P.
Powiązania:
https://bibliotekanauki.pl/articles/333984.pdf
Data publikacji:
2014
Wydawca:
Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Tematy:
Parkinson's disease
medical diagnosis
data classification
choroba Parkinsona
diagnostyka medyczna
klasyfikacja danych
Opis:
This paper addressees the problem of an early diagnosis of Parkinson’s disease by the classification of characteristic features of person’s voice. A new, two-step classification approach is proposed. In the first step, the voice samples are classified using standard state-of-the-art classifiers. In the second step, the classified samples are assigned to patients and the final classification process based on majority criterion is performed. The advantage of using our new approach is the resulting, reliable patientoriented medical diagnose. The proposed two-step method of classification allows also to deal with the variable number of voice samples gathered for every patient. Preliminary experiments revealed quite satisfactory classification accuracy obtained during the performed leave-one-out cross validation.
Źródło:
Journal of Medical Informatics & Technologies; 2014, 23; 187-193
1642-6037
Pojawia się w:
Journal of Medical Informatics & Technologies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza zbioru danych dotyczących oceny akceptowalności samochodów za pomocą teorii zbiorów przybliżonych i programu RSES
Analysis of the car acceptability assessment dataset using rough set theory and the RSES program
Autorzy:
Gorączka, Mateusz
Powiązania:
https://bibliotekanauki.pl/articles/41203532.pdf
Data publikacji:
2024
Wydawca:
Uniwersytet Kazimierza Wielkiego w Bydgoszczy
Tematy:
teoria zbiorów przybliżonych
zbiór danych
analiza danych
klasyfikacja danych
RSES
rough set theory
dataset
data analysis data classification
Opis:
Artykuł skupia się na analizie danych z wykorzystaniem teorii zbiorów przybliżonych oraz różnych metod, takich jak algorytm genetyczny, klasyfikacja za pomocą zestawu reguł i metoda walidacji krzyżowej. Przedstawiono także kompletny proces analizy danych przy użyciu programu RSES. Wykorzystany zbiór danych oraz wyniki analizy zostałyomówione w kontekście teorii zbiorów przybliżonych. Artykuł kończy się podsumowaniem i wnioskamiskupiającymi się na aspekcie skuteczności wspomnianych metod w analizie zbioru danych oraz efektywności programu w kwestii przeprowadzania w nim analiz.
The article focuses on data analysis using rough set theory and various methods such as the genetic algorithm, rule set classification and the cross-validation method. The complete data analysis process using RSES is also presented. The data set used and the results of the analysis are discussed in the context of rough set theory. The article concludes with a summary and conclusions focusing on the aspect of the effectiveness of aforementioned methods in analysing the dataset and the efficiency of the programin terms of performing analysis in it.
Źródło:
Studia i Materiały Informatyki Stosowanej; 2024, 16, 1; 24-32
1689-6300
Pojawia się w:
Studia i Materiały Informatyki Stosowanej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Basic quantum circuits for classification and approximation tasks
Autorzy:
Wiśniewska, Joanna
Sawerwain, Marek
Obuchowicz, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/1838166.pdf
Data publikacji:
2020
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
quantum circuits
data classification
supervised learning
qubits
qudits
układ kwantowy
klasyfikacja danych
uczenie nadzorowane
kubit
Opis:
We discuss a quantum circuit construction designed for classification. The circuit is built of regularly placed elementary quantum gates, which implies the simplicity of the presented solution. The realization of the classification task is possible after the procedure of supervised learning which constitutes parameter optimization of Pauli gates. The process of learning can be performed by a physical quantum machine but also by simulation of quantum computation on a classical computer. The parameters of Pauli gates are selected by calculating changes in the gradient for different sets of these parameters. The proposed solution was successfully tested in binary classification and estimation of basic non-linear function values, e.g., the sine, the cosine, and the tangent. In both the cases, the circuit construction uses one or more identical unitary operations, and contains only two qubits and three quantum gates. This simplicity is a great advantage because it enables the practical implementation on quantum machines easily accessible in the nearest future.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2020, 30, 4; 733-744
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Recognition of lip prints using Fuzzy c-Means clustering
Autorzy:
Wrobel, K.
Froelich, W.
Powiązania:
https://bibliotekanauki.pl/articles/333981.pdf
Data publikacji:
2015
Wydawca:
Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Tematy:
lip print
image processing
clustering techniques
data classification
grafika wargowa
przetwarzanie obrazu
metody grupowania
klasyfikacja danych
Opis:
In this paper a new method for lip print recognition is proposed. The proposed approach is based on Fuzzy c-Means clustering of the characteristics features of lip prints. First, the Hough transform is applied for the recognition of the characteristic features within lip prints, then Fuzzy c-Means clustering is performed to cluster those features. The proposed algorithm applies the results of clustering to find an unknown image withing the collected repository of lip prints. Instead of comparing all pairs of individual characteristic features, the proposed algorithm uses the representatives of clusters for the comparison of images. The advantage of using the proposed method is its increased tolerance to the noise in data and thus the increased efficiency of the recognition. The effectiveness of presented method has been verified experimentally using real-world images. The results are satisfactory and suggest the possibility of using the method in forensic identification systems
Źródło:
Journal of Medical Informatics & Technologies; 2015, 24; 67-73
1642-6037
Pojawia się w:
Journal of Medical Informatics & Technologies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Enhanced algorithm for energy optimization and improvised synchronization in knee exoskeleton system
Autorzy:
Arunamithra, J.
Saravanan, R.
Venkatesh Babu, S.
Powiązania:
https://bibliotekanauki.pl/articles/24200592.pdf
Data publikacji:
2022
Wydawca:
Stowarzyszenie Komputerowej Nauki o Materiałach i Inżynierii Powierzchni w Gliwicach
Tematy:
knee exoskeleton
feature extraction
data classification
ANN algorithm
egzoszkielet kolana
ekstrakcja cech
klasyfikacja danych
algorytm ANN
Opis:
Purpose: The purpose of the study is to develop an augmented algorithm with optimised energy and improvised synchronisation to assist the knee exoskeleton design. This enhanced algorithm is used to estimate the accurate left and right movement signals from the brain and accordingly moves the lower-limb exoskeleton with the help of motors. Design/methodology/approach: An optimised deep learning algorithm is developed to differentiate the right and left leg movements from the acquired brain signals. The obtained test signals are then compared with the signals obtained from the conventional algorithm to find the accuracy of the algorithm. Findings: The obtained average accuracy rate of about 63% illustrates the improvised differentiation in identifying the right and left leg movement. Research limitations/implications: The future work involves the comparative study of the proposed algorithm with other classification technologies to extract more reliable results. A comparative analysis of the replaceable and rechargeable battery will be done in the future study to exhibit the effectiveness of the proposed model. Originality/value: This study involves the extended study of five frequency regions namely alpha, beta, gamma, delta and theta, to handle the real-time EEG signal processing exoskeleton, model.
Źródło:
Archives of Materials Science and Engineering; 2022, 117, 2; 79--85
1897-2764
Pojawia się w:
Archives of Materials Science and Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Towards gesture recognition in three-dimensional space
Rozpoznawanie gestów w przestrzeni trójwymiarowej
Autorzy:
Gadomer, Ł.
Powiązania:
https://bibliotekanauki.pl/articles/88434.pdf
Data publikacji:
2015
Wydawca:
Politechnika Białostocka. Oficyna Wydawnicza Politechniki Białostockiej
Tematy:
klasyfikacja danych
rozpoznawanie gestów
cechy
przestrzeń trójwymiarowa
kinect
data classification
gesture recognition
data features
three-dimensional space
Opis:
In this work, author describes the continuation of his researches about gesture recognition. The previous varaint of the solution was using plain data and was dependent of the performance velocity. In the described researches author made it speed and position invariant by resolving problem of too long or too short gestures – in a previous solution the user had to decide about gesture duration time before performing, now it is not necessary. He also proposed another data representations, using features computed of recorded data. Previous representation, which assumed storing relative positions between samples, was replaced by transforming each gesture to the axis origin and normalizing. He also tried to connect these two representations – plain data and features – into a single one. All of these new data representations were tested using the SVM classifier, which was judged to be the best for the given problem in the previous work. Each of them was tested using one of four popular SVM kernel functions: linear, polynomial, sigmoid and radial basis function (RBF). All achieved results are presented and compared.
W niniejszym artykule autor opisał kontynuację swoich badań dotyczących rozpoznawania gestów. Ulepszył on stworzone przez siebie rozwiązanie w taki sposób, aby nagrywanie i rozpoznawanie gestów było niezależne od szybkości ich wykonywania, a co za tym idzie — ich zróżnicowanej długości. Zaproponował on także inne reprezentacje danych, za pomocą których wyrażany jest stworzony zbiór gestów. Wcześniejsze rozwiązanie, opierające się na przechowywaniu relatywnego położenia dłoni w stosunku do poprzedniej zarejestrowanej próbki (poprzedniego położenia), zastąpione zostało sprowadzeniem gestu do początku układu współrzędnych i zastąpieniem wartości relatywnych absolutnymi, a następnie ich normalizację Z tak przygotowanego zbioru gestów obliczone zostały cechy stanowiące drugą zaproponowaną reprezentację danych. Trzecia reprezentacja stanowi połączenie dwóch poprzednich: zawiera jednocześnie bezpośrednie wartości wyrażające ruch dłoni, jak i obliczone na podstawie jego cechy. Wszystkie trzy reprezentacje zostały przetestowane przy pomocy klasyfikatora, który okazał się najlepszy dla zadanego problemu podczas przeprowadzania wcześniejszych badań: SVM. Porównano, jak z zadanym problemem radzą sobie cztery popularne funkcje jądra: liniowa, wielomianowa, sigmoidalna i radialna. Otrzymane wyniki zostały przedstawione, porównane i omówione.
Źródło:
Advances in Computer Science Research; 2015, 12; 5-20
2300-715X
Pojawia się w:
Advances in Computer Science Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Hardware acceleration of data classifiers for multimedia processing tasks
Sprzętowe przyspieszenie klasyfikacji danych multimedialnych
Autorzy:
Dziurzański, P.
Mąka, T.
Forczmański, P.
Powiązania:
https://bibliotekanauki.pl/articles/153826.pdf
Data publikacji:
2014
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
feature extraction
multimedia data classification
Network on Chip (NoC)
ImpulseC
ekstrakcja cech
klasyfikacja danych multimedialnych
sieci wewnątrzukładowe
Opis:
In this paper, experimental results of a proposed hardware acceleration of feature extraction and data classifiers for multimedia are presented. This hardware is based on multi-core architecture connected with a mesh Network on Chip (NoC). The cores in the system execute both data classifiers and feature extraction for audio and image data. Using various meta heuristics the system is optimized with regards to different data communication criteria. The system was implemented on an FPGA platform with use of ImpulseC hardware description language.
W artykule zostały zeprezentowane wyniki eksperymentalne dotyczące sprzętowego przyspieszania ekstrakcji cech i klasyfikacji danych multimedialnych. Opracowane rozwiązanie sprzętowe bazuje na architekturze wielordzeniowej, w której każdy blok realizuje przypisaną mu statycznie funkcjonalność. Rdzenie połączone są ze sobą za pomocą sieci wewnątrzukładowej (ang. Network on Chip, NoC) o architekturze siatki. W artykule opisano pokrótce autorskie oprogramowanie służące do generowania kodu sieci wewnątrzukładowej. Graficzny interfejs użytkownika został zaprezentowany na rys. 1. Narzędzie ma za zadanie dokonywać odwzorowania wybranych funkcjonalności do poszczególnych rdzeni z wykorzystaniem takich meta-heurystyk jak algorytmy genetyczne, symulowane wyżarzanie, poszukiwanie losowe czy algorytmu gradientowego. Jako kryterium optymalizacji można wybrać minimalizację całkowitego przesyłu danych, minimalizację maksymalnej liczby danych transmitowanych przez pojedyncze łącze, a także minimalizację odchylenia standardowego rozmiaru strumieni transmitowanych przez poszczególne łącza. Przykładowe wyniki optymalizacji losowej dla sieci wewnątrzukładowej zostały przedstawione w tab. 1, natomiast wyniki optymalizacji dla sieci wewnątrzukładowej wykorzystującej inne podejścia - w tab. 2. Dla systemu zoptymalizowanego w ten sposób został wygnerowany opisujący go kod w języku ImpulseC, który następnie posłużył do syntezy sprzętowej na układzie FPGA z rodziny Xilinx Virtex 5. Zajętość układu XC5VSX50T dla trzech wykorzystanych klasyfikatorów została przedstawiona na rys. 3. Z kolei tab. 3 przedstawia liczbę zasobów wykorzystanych przez narzędzie syntezy wysokiego poziomu dla tych klasyfikatorów. Technika przedstawiona w publikacji umożliwia określenie warunków i ograniczeń implementacji sprzętowej systemu służącego klasyfikacji danych multimedialnych.
Źródło:
Pomiary Automatyka Kontrola; 2014, R. 60, nr 6, 6; 382-384
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The detection of selected marine engine malfunctions on the basis of the exhaust gas composition
Wykrywanie wybranych niesprawności silnika okrętowego w oparciu o skład emitowanych spalin
Autorzy:
Kowalski, J.
Powiązania:
https://bibliotekanauki.pl/articles/327520.pdf
Data publikacji:
2014
Wydawca:
Polska Akademia Nauk. Polskie Towarzystwo Diagnostyki Technicznej PAN
Tematy:
marine engine
malfunctions detection
exhaust gas composition
data classification
silnik okrętowy
wykrywanie niesprawności
skład spalin
klasyfikacja danych
Opis:
Marine diesel engines are generators of mechanical energy, but also are generators of toxic compounds into the atmosphere. The composition of the exhaust gas may be a carrier of diagnostic information about the condition of functional systems of the engine. Results of the classification and selection of diagnostic signals for selected marine engine malfunctions are presented. The analysis was based on results of laboratory tests. Mentioned classification was able to isolate symptoms of malfunctions of marine 4-stroke diesel engine in the composition of the exhaust gas. Complementary detection signals are exhaust gas temperature behind each cylinder. The conclusion of this work is the ability to detect by this method such engine malfunctions as the throttling the air intake duct, the throttling of the exhaust gas duct, the decreasing and the increasing of fuel injection pressure on the selected cylinder, chocked or discalibrated fuel injector, the leakage of the fuel pump, changing of the fuel injection timing and exhaust and inlet valves malfunctions.
Silniki tłokowe generatorami energii mechanicznej, ale również generatorami emisji związków toksycznych do atmosfery. Skład emitowanych spalin może być nośnikiem informacji diagnostycznej o stanie technicznym układów funkcjonalnych silnika. W pracy przedstawiono wyniki klasyfikacji i wyboru sygnałów diagnostycznych dla wybranych niesprawności silnika okrętowego. Analiza została oparta na wynikach badań laboratoryjnych. W wyniku przeprowadzonych działań udało się wyodrębnić symptomy niesprawności 4-suwowego silnika okrętowego w składzie emitowanych spalin. Sygnałami uzupełniającymi detekcję są temperatury gazów spalinowych za poszczególnymi cylindrami. Wnioskiem z prezentowanej pracy jest możliwość wykrycia tą metodą takich niesprawności silnika jak dławienie kanału dolotowego powietrza i wylotowego spalin, obniżenie i zwiększenie ciśnienia wtrysku paliwa do wybranego cylindra, zakoksowanie lub rozkalibrowanie wtryskiwacza, przecieki w pompie paliwowej, zmiana rozpoczęcia wtrysku paliwa oraz wypalenie gniazd zaworów dolotowych i wylotowych.
Źródło:
Diagnostyka; 2014, 15, 3; 39-44
1641-6414
2449-5220
Pojawia się w:
Diagnostyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The dedicated decision support system in recognition of some uncertain disease entities
Autorzy:
Porwik, P.
Powiązania:
https://bibliotekanauki.pl/articles/333041.pdf
Data publikacji:
2009
Wydawca:
Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Tematy:
rozpoznawanie obrazu
klasyfikacja danych
sieci neuronowe
systemy wspomagania decyzji
image recognition
data classification
neural network
decision support systems
Opis:
This work presents the principles of image recognition, where quality-based methods are applied. The neural networks and additional software have been proposed. This goal was achieved by using non-parametric recognition algorithms. In this paper the two-state hybrid classification method has been proposed, where artificial intelligence algorithm is included. In recognition process, the learning method, selection and optimization of diagnostic parameters have been introduced. The integrated part of the classifier structure is voting mechanism, which indicates incorrect states of the system – for example the unrecognized images. Effectiveness of the system has been shown by means of examples, where ambiguous data have been incorporated – it is very often a practice of medical diagnostics.
Źródło:
Journal of Medical Informatics & Technologies; 2009, 13; 97-100
1642-6037
Pojawia się w:
Journal of Medical Informatics & Technologies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Comparing continuity and compactness of choropleth map classes
Autorzy:
Całka, B.
Powiązania:
https://bibliotekanauki.pl/articles/145406.pdf
Data publikacji:
2018
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
klasyfikacja danych
zagospodarowanie przestrzenne
zaludnienie obszaru
data classification
choropleth map
neighbourhood analysis
spatial contiguity analysis
head-tail breaks method
Opis:
Population density varies sharply from place to place on the whole territory of Poland. The largest number of people per 1 km2 is 21,531, while uninhabited areas account for about 48% of the country. Such uneven, non-Gaussian distribution of the data causes some difficulty in choosing the classification method in geometric choropleth maps. A thorough evaluation of a geometric choropleth map of population data is not possible using only traditional indicators such as the Tabular Accuracy Index (TAI). That is why the aim of the article is to develop an innovative index based on distance analysis and neighbour analysis of grid cells. Two indexes have been suggested in this paper: the Spatial Distance Index (SDI) and the Spatial Contiguity Index (SCI). The paper discusses the use of five classification methods to evaluate choropleth maps of population data, like head-tail breaks, natural breaks, equal intervals, quantile, and geometrical intervals. A comprehensive assessment of such geometric choropleth maps is also done. The research was conducted for the whole territory of Poland, using data from the 2011 National Census of Population and Housing. Population data are presented in the 1km grid. The results of the analysis are shown on thematic maps. A compatibility of the choropleth maps with urban-rural typology of the OECD (Organisation for Economic Co-operation and Development) was also checked.
Źródło:
Geodesy and Cartography; 2018, 67, 1; 21-34
2080-6736
2300-2581
Pojawia się w:
Geodesy and Cartography
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Możliwości wykorzystania statystycznych metod klasyfikacji danych w badaniach natężenia suburbanizacji
Scope of application of statistical methods of data classification in analysing the intensity of suburbanization
Autorzy:
Żelechowski, Maciej
Powiązania:
https://bibliotekanauki.pl/articles/1023252.pdf
Data publikacji:
2015-03-20
Wydawca:
Uniwersytet im. Adama Mickiewicza w Poznaniu
Tematy:
metropolisation
suburbanization
functional urban areas
statistical data classification
data clustering
metropolizacja
suburbanizacja
miejskie obszary funkcjonalne
klasyfikacja danych statystycznych
analiza skupień
Opis:
Suburbanizacja, jako składowa procesu metropolizacji, a jednocześnie jeden z etapów cyklu życia aglomeracji miejskich, dotyczy obecnie prawie wszystkich głównych ośrodków miejskich naszego kraju, stanowiąc podstawowy problem związany z ich rozwojem. Przydatnym narzędziem badania zróżnicowania natężenia suburbanizacji w strefach podmiejskich czy szerzej - na obszarach metropolitalnych - mogą być statystyczne metody klasyfikacji danych, takie jak analiza skupień. Metody te pozwalają na grupowanie jednostek terytorialnych danego obszaru (np. powiatów, gmin, miejscowości statystycznych) we względnie jednorodne klasy pod kątem natężenia zjawisk suburbanizacyjnych. Podstawą takiego grupowania jest podobieństwo pomiędzy poszczególnymi badanymi obiektami (np. gminami) w zakresie wartości zmiennych przyjmowanych za wskaźniki zaawansowania suburbanizacji.
Suburbanization, as a component of the process o f metropolisation, and on the other hand one of the stages of city life-cycle, is now observed in almost all main city agglomerations in our country, being the most important problem connected w ith their development. The useful tools of investigation of intensity of suburbanization in suburban zones, or wider - in metropolitan areas, can be the statistical methods of data classification, such as data clustering. These methods allow grouping the territorial units of given area (e.g. poviats, gminas, statistical locations) in relatively homogeneous classes as regards the intensity of suburbanization. The basis of such grouping is similarity between investigated objects (e.g. gminas) as regards the level of variables accepted for coefficients of intensity of suburbanization.
Źródło:
Rozwój Regionalny i Polityka Regionalna; 2015, 29; 139-148
2353-1428
Pojawia się w:
Rozwój Regionalny i Polityka Regionalna
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
„Śmieci na wejściu, śmieci na wyjściu”. Wpływ jakości koderów na działanie sieci neuronowej klasyfikującej wypowiedzi w mediach społecznościowych
„Garbage in, Garbage out”. The Impact of Coders’ Quality on the Neural Network Classifying Text on Social Media
Autorzy:
Matuszewski, Paweł
Powiązania:
https://bibliotekanauki.pl/articles/2131910.pdf
Data publikacji:
2022
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
sieci neuronowe
klasyfikacja danych tekstowych
modele nadzorowane
opinion mining
jakość koderów
text classification
neural networks
supervised models
quality of coders
Opis:
Jedna z głównych decyzji przy ręcznym kodowaniu danych tekstowych dotyczy tego, czy kodowanie ma być weryfikowane. W przypadku modeli nadzorowanych prowadzi to do istotnego dylematu: czy lepszym rozwiązaniem jest dostarczenie modelowi dużej liczby przypadków, na których będzie się uczyć kosztem weryfikacji poprawności danych, czy też zakodowanie każdego przypadku n-razy, co pozwoli porównać kody i sprawdzić ich poprawność, ale jednocześnie n-krotnie zmniejszy zbiór danych treningowych. Taka decyzja może zaważyć nie tylko na ostatecznych wynikach klasyfikatora. Z punktu widzenia badaczy jest istotna również dlatego, że – realistycznie zakładając, że badania mają ograniczone źródło finansowania – nie można jej cofnąć. Wykorzystując 100 tys. unikatowych i ręcznie zakodowanych tweetów przeprowadzono symulacje wyników klasyfikatora w zależności od kontrolowanego odsetka błędnie zakodowanych dokumentów. Na podstawie danych przedstawiono rekomendacje.
One of the critical decisions when manually coding text data is whether to verify the coders’ work. In the case of supervised models, this leads to a significant dilemma: is it better to provide the model with a large number of cases on which it will learn at the expense of verifying the correctness of the data, or whether it is better to code each case n-times, which will allow to compare the codes and check their correctness but at the same time will reduce the training dataset by n-fold. Such a decision not only affect the final results of the classifier. From the researchers’ point of view, it is also crucial because, realistically assuming that research has limited funding, it cannot be undone. The study uses a simulation approach and provides conclusions and recommendations based on 100,000 unique and hand-coded tweets.
Źródło:
Studia Socjologiczne; 2022, 2; 137-164
0039-3371
Pojawia się w:
Studia Socjologiczne
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies