Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "MISZTAL, Małgorzata" wg kryterium: Autor


Tytuł:
Wizualizacja wyników liniowych technik ordynacyjnych na przykładzie analizy przestępczości przeciwko mieniu w Polsce
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/580482.pdf
Data publikacji:
2017
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
analiza redundancji
analiza głównych składowych
biplot
triplot
przestępczość przeciwko mieniu
Opis:
Zaletą liniowych technik ordynacyjnych (analizy głównych składowych – PCA i analizy redundancji – RDA) jest m.in. możliwość prezentacji graficznej uzyskanych wyników w przestrzeni dwuwymiarowej z wykorzystaniem diagramów ordynacyjnych (biplotów i triplotów). W pracy omówiono metody wizualizacji wyników PCA i RDA oraz zwrócono uwagę na rolę metod graficznych przy interpretacji uzyskanych wyników. Ze względu na wykorzystane w przykładzie dane liczbowe, szczegółowym celem pracy jest ocena wpływu wybranych czynników społeczno-ekonomicznych na przestępczość przeciwko mieniu w Polsce oraz ocena przydatności metod wizualizacji w tego typu analizach.
Źródło:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu; 2017, 468; 161-170
1899-3192
Pojawia się w:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On the Use of Selected Ordination Techniques to Analyze the Parliamentary Election Results
O zastosowaniu wybranych technik ordynacyjnych do analizy wyników wyborów parlamentarnych
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/657906.pdf
Data publikacji:
2016
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
techniki ordynacyjne
analiza redundancji
wybory parlamentarne
ordination techniques
redundancy analysis
parliamentary elections
Opis:
Techniki ordynacyjne, takie jak kanoniczna analiza korespondencji (CCA) czy analiza redundancji (RDA), zyskały popularność przede wszystkim w badaniach ekologicznych, trudno natomiast znaleźć ich zastosowania np. w badaniach ekonomiczno-społecznych.Celem pracy jest zwięzłe uporządkowanie pojęć i terminologii związanej z ordynacją oraz wskazanie możliwości aplikacyjnych metod ordynacyjnych w badaniach społecznych na przykładzie analizy wyników wyborów parlamentarnych w 2015 roku.
Ordination techniques such as CCA (Canonical Correspondence Analysis) or RDA (Redundancy Analysis) are very popular in ecological research but almost completely unknown in, for example, socio-economic research. The goal of this paper is to concisely organize the concepts and terminology associated with ordination and to present the possibilities of its application in social research with an example of the analysis of the 2015 parliamentary elections results.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2016, 3, 322
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On the application of bundling in medical diagnosis
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/658859.pdf
Data publikacji:
2010
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Opis:
Metoda wiązania modeli (bundling) została zaproponowana przez Hothorna (2003a) jako modyfikacja metody bagging (Breiman 1996). Polega ona na wykorzystaniu dodatkowych modeli, innych klas niż drzewa klasyfikacyjne, budowanych na podstawie zbioru OOB (out-of-bag), zawierającego obserwacje spoza aktualnej próby bootstrapowej. Na podstawie tych modeli dokonuje się predykcji dla obserwacji w próbie bootstrapowej a następnie wyniki predykcji traktuje się jako dodatkowe zmienne objaśniające przy budowie drzewa klasyfikacyjnego (Hothorn 2003a). W referacie przedstawiono wyniki wykorzystania metody wiązania modeli do poprawy dokładności predykcji w wybranych problemach diagnostyki medycznej.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2010, 235
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On the Use of Redundancy Analysis to Study the Property Crime in Poland
O zastosowaniu analizy redundancji do badania przestępczości przeciwko mieniu w Polsce
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/659221.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
analiza redundancji
diagram ordynacyjny
przestępczość przeciwko mieniu
redundancy analysis
ordination diagram
crime against property
Opis:
Analiza redundancji (RDA) jest kanoniczną formą analizy głównych składowych (PCA) i należy do tzw. liniowych technik ordynacyjnych. Celem analiz ordynacyjnych jest przedstawienie związków między obiektami i zmiennymi objaśnianymi/objaśniającymi w przestrzeni o jak najniższym wymiarze. Analiza redundancji jest także jedną z metod eksploracyjnej analizy danych. Graficzna prezentacja wyników z wykorzystaniem diagramów ordynacyjnych (biplotów i triplotów) może ułatwić analizę powiązań między zmiennością rozkładów badanych zmiennych i czynnikami mogącymi wpływać na tę zmienność. W artykule zastosowano analizę redundancji do oceny zależności między wybranymi czynnikami społeczno‑ekonomicznymi a poziomem przestępczości przeciwko mieniu w Polsce.
Redundancy analysis (RDA) is a canonical form of principal components analysis (PCA) and is one of, so‑called, linear ordination techniques. The goal of ordination is to represent objects and response variables relationships as faithfully as possible in a low‑dimensional space. Redundancy analysis is also a technique of exploratory data analysis. Graphical presentation of the results using the ordination biplots or triplots can facilitate the analysis of the relationship between the variation in the set of the response variables and the variation of the explanatory variables. In the paper, redundancy analysis was applied to assess the relationships between the selected socio‑economic factors and the intensity of the crime against property in Poland.  
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2017, 6, 332; 99-109
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Use of Some Pattern Recognition Algorithms to Classify Patients Undergoing CABG
Zastosowanie wybranych algorytmów rozpoznawania obrazów do klasyfikacji pacjentów z chorobą wieńcową leczonych operacyjnie
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/904928.pdf
Data publikacji:
2004
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
pattern recognition algorithms
classification trees
coronary artery disease
Opis:
The primary goal of pattern recognition is supervised or unsupcrvised classification in order to solve decision - making problems. Medical diagnosis brings about many practical problems, which may be interpreted as pattern recognition tasks. Making diagnosis of a given patient means to solve a classification problem - we must recognize patient’s disease on the basis on some symptoms. The aim of the article is to present the results of using selected pattern recognition algorithms to classify patients with Coronary Artery Disease undergoing Coronary Artery Bypass Grafting (CABG).
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2004, 175
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Some Remarks on the Data Imputation Using “missForest” Method
Kilka uwag o imputacji danych z wykorzystaniem metody "missforest"
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/905779.pdf
Data publikacji:
2013
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
missing values
single and multiple imputation
random forests
missForest
Opis:
Missing data are quite common in practical applications of statistical methods and imputation is a general statistical method for the analysis of incomplete data sets. Stekhoven and Bühlmann (2012) proposed an iterative imputation method (called “missForest”) based on Random Forests (Breiman 2001) to cope with missing values. In the paper a short description of “missForest” is presented and some selected missing data techniques are compared with “missForest” by artificially simulating different proportions and mechanisms of missing data using complete data sets from the UCI repository of machine learning databases.
W pracy Stekhovena i Bühlmanna (2012) zaproponowano nową iteracyjną metodę imputacji (nazwaną „missForest”) opartą na metodzie Random Forests Breimana (2001). W niniejszym artykule omówiono metodę „missForest” i porównano kilka wybranych technik postępowania w sytuacji występowania braków danych z metodą „missForest”. W tym celu wykorzystano podejście symulacyjne generując różne proporcje i mechanizmy powstawania braków danych w zbiorach danych pochodzących głównie z repozytorium baz danych na Uniwersytecie Kalifornijskim w Irvine.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2013, 285
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Proposal for Using Selected Tree-Based Models to Identify Operative Risk Subgroups among Patients Undergoing Coronary Artery Bypass Grafting
Propozycja wykorzystania wybranych modeli drzew klasyfikacyjnych i regresyjnych do identyfikacji grup ryzyka operacyjnego pacjentów z chorobą wieńcową leczonych operacyjnie
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/906886.pdf
Data publikacji:
2007
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
recursive partitioning inethod
classification and regression trees
coronary artery disease
coronary artery bypass grafting
Opis:
Classification and regression trees are very popular and attractive types of classifiers, widely used to solve decision-making problems in different fields of science. The study was conducted to identify preoperative risk factors associated with morbidity outcome among patients undergoing isolated Coronary Artery Bypass Grafting (CABG) and to develop some classification rules assigning patients to selected risk subgroups. Prediction rules were established on the basis of the selected tree-structured models. The following tree-based algorithms were used: QUEST, CRUISE, LOTUS and PLUS.
Drzewa klasyfikacyjne i regresyjne należą do bardzo popularnych metod klasyfikacji, przede wszystkim ze względu na prostotę interpretacji i przejrzystą formę wizualizacji wyników. Stąd też są one szeroko wykorzystywane do rozwiązywania problemów decyzyjnych w różnych dziedzinach nauki. Celem prowadzonych badań była identyfikacja przedoperacyjnych czynników ryzyka, związanych z wystąpieniem powikłań śród- i pooperacyjnych wśród pacjentów z chorobą wieńcową, leczonych w sposób operacyjny. Dodatkowo podjęto próbę zdefiniowania reguł decyzyjnych, które mogłyby umożliwić przydzielenie pacjenta do jednej z wyróżnionych grup ryzyka operacyjnego na podstawie opisujących go cech przedoperacyjnych. Reguły klasyfikacyjne budowano wykorzystując metodę rekurencyjnego podziału. W analizie uwzględniono algorytmy QUEST i CRUJSE, tworzące drzewa klasyfikacyjne oraz algorytmy LOTUS i PLUS, łączące rekurencyjny podział przestrzeni cech z analizą regresji logistycznej.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2007, 206
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Imputation of Missing Data Using R Package
Imputacja brakujących danych z wykorzystaniem środowiska R
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/907623.pdf
Data publikacji:
2012
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
missing values
single imputation
R – project
Opis:
Missing data are quite common in practical applications of statistical methods. Imputation is general statistical method for the analysis of incomplete data sets. The goal of the paper is to review selected imputation techniques. Special attention is paid to methods implemented in some packages working in the R environment. An example is presented to show how to handle missing values using a few procedures of single and multiple imputation implemented in R.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2012, 269
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On the application of selected exploratory data analysis methods to assess differences in the level of sustainable development in the environmental domain of voivodships in Poland
O zastosowaniu wybranych metod eksploracyjnej analizy danych do oceny różnic w poziomie zrównoważonego rozwoju w zakresie ładu środowiskowego województw w Polsce
Autorzy:
MISZTAL, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/435228.pdf
Data publikacji:
2018-06-01
Wydawca:
Uniwersytet Opolski
Tematy:
sustainable development
environmental domain
multivariate exploratory data analysis
principal component analysis
zrównoważony rozwój
ład środowiskowy
wielowymiarowa eksploracyjna analiza danych
analiza składowych głównych
Opis:
The purpose of the study was to assess the differences in the level of sustainable development in environmental domain of voivodships in Poland in the years 2008-2015. Seven indicators belonging to 3 areas of the environmental domain (energy, air protection, waste management) were analysed with the use of principal component analysis (PCA) and the between-class PCA. The results revealed large differences between voivodships mainly due to the level of air pollutants emissions from plants especially noxious to air purity. It has also been shown that in the years 2008-2015 a visible increase in the outlays on fixed assets serving environmental protection and development of ecological awareness of society was observed.
Celem pracy była ocena różnic w poziomie zrównoważonego rozwoju województw w Polsce w zakresie ładu środowiskowego w latach 2008-2015. Do analiz wykorzystano 7 wskaźników ładu środowiskowego należących do 3 obszarów tematycznych (energia, ochrona powietrza, gospodarka odpadami). Zastosowano analizę głównych składowych (PCA) oraz międzygrupową analizę głównych składowych (between-class PCA). Na podstawie uzyskanych wyników stwierdzono występowanie różnic między województwami przede wszystkim ze względu na emisję zanieczyszczeń powietrza (gazowych i pyłowych) z zakładów szczególnie uciążliwych. Wykazano także, że w latach 2008-2015 nastąpił wyraźny wzrost nakładów na środki trwałe służące ochronie środowiska związane z oszczędzaniem energii elektrycznej a także rozwój świadomości ekologicznej społeczeństwa.
Źródło:
Economic and Environmental Studies; 2018, 18, 2; 747-761
1642-2597
2081-8319
Pojawia się w:
Economic and Environmental Studies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On the potential for using selected PCA-based methods to analyze the crime rate in Poland
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/424843.pdf
Data publikacji:
2019
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
crime
criminal offence
multivariate exploratory data analysis
principal component analysis
factorial maps
Opis:
The aim of the paper is to assess the potential for using some selected PCA-based methods to analyze the spatial diversity of crime in Poland during 2000-2017. Classical principal components analysis (PCA) deals with two-way matrices, usually taking into account objects and variables. In the case of data analyzed in the study, apart from two dimensions (objects – voivodships, variables – criminal offences), there is also the dimension of time, so the dataset can be seen as data cube: objects × variables × time. Therefore, this type of data requires the use of methods handling three-way data structures. In the paper the variability of some selected categories of criminal offences in time (2000- -2017) and space (according to voivodships) is analyzed using the between-class and the within-class principal component analysis. The advantage of these methods is, among others, the possibility of the graphical presentation of the results in two-dimensional space with the use of factorial maps.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2019, 23, 2; 15-32
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On the Application of Classification and Regression Trees in Medical Diagnosis
O zastosowaniu drzew klasyfikacyjnych i regresyjnych w diagnostyce medycznej
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/904694.pdf
Data publikacji:
2005
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
classification and regression trees
medical diagnosis
Opis:
Drzewo decyzyjne jest graficzną prezentacją metody rekurencyjnego podziału. Metoda ta polega na stopniowym podziale zbioru obiektów na rozłączne podzbiory aż do momentu uzyskania ich jednorodności ze względu na wyróżnioną cechę y. Gdy у jest zmienną nominalną, mamy do czynienia z nieparametryczną analizą dyskryminacji (drzewa klasyfikacyjne), gdy zaś jest zmienną ilościową z nieparametryczną analizą regresji (drzewa regresyjne). W referacie przedstawiono możliwości zastosowań drzew regresyjnych i klasyfikacyjnych do rozwiązywania problemów o charakterze decyzyjnym w diagnostyce medycznej.
Decision tree is a graphical presentation of the recursive partitioning the learning set into homogenous subsets considering dependent variable y. If dependent variable у is nominal we deal with nonparametric discriminant analysis (classification trees), when у is numerical - with nonparametric regression analysis (regression trees). The aim of the paper is to present some applications of regression and classification trees in medical diagnosis for solving decision - making problems.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2005, 194
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wybrane metody analizy statystycznej w ocenie efektów kształcenia na przykładzie wyników egzaminu ze statystyki opisowej
Selected Statistical Analysis Methods in Assessment of the Learning Outcomes in the Example of the Descriptive Statistics Exam Results
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/905545.pdf
Data publikacji:
2013
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
efekty kształcenia
statystyka opisowa
metody statystyczne
analiza korespondencji
Opis:
An exam is the final way to assess the learning outcomes of each subject during the studies. The results of an exam are usually described by the percentage of students who successfully passed the exam; more detailed analysis is omitted. In the paper the results of the Descriptive Statistics exam are analyzed in detail using correspondence analysis methods.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2013, 280
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
O zastosowaniu analizy redundancji do badania poziomu przestępczości przeciwko mieniu w Polsce w latach 2002-2015
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/580815.pdf
Data publikacji:
2018
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
analiza redundancji
metoda asymetrycznych wektorów własnych
triplot
przestępczość przeciwko mieniu
Opis:
Celem pracy jest analiza i opis zmian poziomu przestępczości przeciwko mieniu w Polsce w latach 2002-2015 z wykorzystaniem analizy redundancji (Redundancy Analysis) oraz zwrócenie uwagi na znaczenie metod graficznych przy interpretacji uzyskanych wyników. W analizie redundancji (kanonicznej formie analizy głównych składowych) w charakterze zmiennych zależnych wykorzystano wskaźniki natężenia pięciu rodzajów przestępstw przeciwko mieniu, natomiast w charakterze zmiennych objaśniających – funkcje własne (eigenfunctions) wyznaczone metodą asymetrycznych wektorów własnych (Asymmetric Eigenvector Maps). Uzyskane wyniki przedstawiono graficznie na triplotach. Ze względu na ograniczoną objętość pracy pokazano wyniki dla trzech wybranych województw
Źródło:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu; 2018, 508; 157-169
1899-3192
Pojawia się w:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
ON THE SELECTED METHODS FOR EVALUATING CLASSIFICATION MODELS
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/655797.pdf
Data publikacji:
2014
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
classifier performance
predictive ability
ROC curve
reclassification
decision curve
Opis:
Traditional measures for assessing the performance of classification models for binary outcomes are the ROC curve and the area under the ROC curve (AUC). Reclassification tables (Cook, 2008), net reclassification improvement (NRI) and integrated discrimination improvement (IDI) (Pencina et al., 2008) or decision – analytic measures with decision curve analysis (Vickers & Elkin, 2006) have been recently proposed for evaluating the predictive ability of classifiers. This paper analyzes the measures mentioned above with some credit taking application.  
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2014, 3, 302
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Comparison of Selected Multiple Imputation Methods for Continuous Variables – Preliminary Simulation Study Results
Porównanie wybranych metod imputacji wielokrotnej dla zmiennych ilościowych – wstępne wyniki badań symulacyjnych
Autorzy:
Misztal, Małgorzata Aleksandra
Powiązania:
https://bibliotekanauki.pl/articles/656755.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
dane niekompletne
imputacja wielokrotna
analiza głównych składowych
missForest
incomplete data
multiple imputation
principal component analysis
Opis:
Problem występowania danych niekompletnych i ich wpływu na wyniki analiz statystycznych nie jest związany z żadną konkretną dziedziną nauki – pojawia się w ekonomii, socjologii, edukacji, naukach behawioralnych czy medycynie. W przypadku większości klasycznych metod statystycznych wymagana jest kompletna informacja o zmiennych charakteryzujących badane obiekty, a typowym podejściem do brakujących danych jest po prostu ich usunięcie. Prowadzi to jednak do niewiarygodnych i obciążonych wyników analiz i nie jest zalecane w literaturze przedmiotu. Rekomendowaną metodą postępowania z brakującymi danymi jest imputacja wielokrotna. W artykule rozważono kilka wybranych jej metod. Szczególną uwagę zwrócono na wykorzystanie analizy głównych składowych (PCA) jako metody imputacji. Celem pracy była ocena jakości imputacji opartej na PCA na tle dwóch innych technik uzupełniania braków danych: imputacji wielokrotnej za pomocą równań łańcuchowych (MICE) i metody missForest. Porównania metod imputacji dokonano, wykorzystując podejście symulacyjne i generując braki danych w 10 kompletnych zbiorach danych z repozytorium baz danych Uniwersytetu Kalifornijskiego w Irvine, z uwzględnieniem różnych mechanizmów generowania braków danych oraz różnych proporcji (10–50%) brakujących wartości. Do imputacji brakujących wartości zastosowano metodę równań łańcuchowych, metodę missForest oraz metodę opartą na głównych składowych (MIPCA). Znormalizowany pierwiastek kwadratowy błędu średniokwadratowego (NRMSE) wykorzystano jako miarę dokładności imputacji. Na podstawie przeprowadzonych analiz metoda missForest może być rekomendowana jako ta metoda wielokrotnej imputacji, która zapewnia najwyższą dokładność imputacji braków danych. Imputacja oparta na analizie głównych składowych (PCA) nie prowadzi do zadowalających wyników.
The problem of incomplete data and its implications for drawing valid conclusions from statistical analyses is not related to any particular scientific domain, it arises in economics, sociology, education, behavioural sciences or medicine. Almost all standard statistical methods presume that every object has information on every variable to be included in the analysis and the typical approach to missing data is simply to delete them. However, this leads to ineffective and biased analysis results and is not recommended in the literature. The state of the art technique for handling missing data is multiple imputation. In the paper, some selected multiple imputation methods were taken into account. Special attention was paid to using principal components analysis (PCA) as an imputation method. The goal of the study was to assess the quality of PCA‑based imputations as compared to two other multiple imputation techniques: multivariate imputation by chained equations (MICE) and missForest. The comparison was made by artificially simulating different proportions (10–50%) and mechanisms of missing data using 10 complete data sets from the UCI repository of machine learning databases. Then, missing values were imputed with the use of MICE, missForest and the PCA‑based method (MIPCA). The normalised root mean square error (NRMSE) was calculated as a measure of imputation accuracy. On the basis of the conducted analyses, missForest can be recommended as a multiple imputation method providing the lowest rates of imputation errors for all types of missingness. PCA‑based imputation does not perform well in terms of accuracy.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2018, 6, 339; 73-98
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies