Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "missing values" wg kryterium: Wszystkie pola


Wyświetlanie 1-14 z 14
Tytuł:
Jackknife winsorized variance estimator under imputed data
Autorzy:
Sohil, Fariha
Sohail, Muhammad Umair
Shabbir, Javid
Gupta, Sat
Powiązania:
https://bibliotekanauki.pl/articles/2106879.pdf
Data publikacji:
2022-06-14
Wydawca:
Główny Urząd Statystyczny
Tematy:
adjusted imputation
jackknife variance estimators
linearized jackknife
missing values
winsorized variance
Opis:
In the present study, we consider the problem of missing and extreme values for the estimation of population variance. The presence of extreme values either in the study variable, or the auxiliary variable, or in both of them, can adversely affect the performance of the estimation procedure. We consider three different situations for the presence of extreme values and also consider jackknife variance estimators for the population variance by handling these extreme values under stratified random sampling. Bootstrap technique ABB is carried out to understand the relative relationship more precisely.
Źródło:
Statistics in Transition new series; 2022, 23, 2; 17-32
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Performance analysis of rough set–based hybrid classification systems in the case of missing values
Autorzy:
Nowicki, Robert K.
Seliga, Robert
Żelasko, Dariusz
Hayashi, Yoichi
Powiązania:
https://bibliotekanauki.pl/articles/2031102.pdf
Data publikacji:
2021
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
rough sets
support vector machine
fuzzy system
neural networks
Opis:
The paper presents a performance analysis of a selected few rough set–based classification systems. They are hybrid solutions designed to process information with missing values. Rough set-–based classification systems combine various classification methods, such as support vector machines, k–nearest neighbour, fuzzy systems, and neural networks with the rough set theory. When all input values take the form of real numbers, and they are available, the structure of the classifier returns to a non–rough set version. The performance of the four systems has been analysed based on the classification results obtained for benchmark databases downloaded from the machine learning repository of the University of California at Irvine.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2021, 11, 4; 307-318
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Prediction of Missing Values in Adult Data Set of UCI Machine Learning : A Case of Study
Autorzy:
Luna, Alejandra
Bello, Mario
Hernandez, Ana
Bonilla, Edmundo
Powiązania:
https://bibliotekanauki.pl/articles/1397481.pdf
Data publikacji:
2020
Wydawca:
Warszawska Wyższa Szkoła Informatyki
Tematy:
Shannon theory
entropy
missing attributes
adult dataset
UCI Machine Learning
Opis:
These days, not having complete data of any kind can be a big problem for different organizations when making decisions. In this article, we propose to use Shannon entropy and information gain to predict and impute missing categorical data in any data set. It is detailed with an example of how entropy is applied and knows the level of uncertainty of each attribute value. Likewise, the imputation of the missing attributes is also carried out with other imputation techniques in the Adult data set of UCI Machine Learning to denote the advantages offered by the proposed methodology.
Źródło:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki; 2020, 14, 22; 7-21
1896-396X
2082-8349
Pojawia się w:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Imputation of missing values by using raw moments
Autorzy:
Sohail, Muhammed Umair
Shabbir, Javid
Sohil, Fariha
Powiązania:
https://bibliotekanauki.pl/articles/1359290.pdf
Data publikacji:
2019-04-25
Wydawca:
Główny Urząd Statystyczny
Tematy:
non-response
imputation
raw moments
relative efficiency
Opis:
The estimation of population parameters might be quite laborious and inefficient, when the sample data have missing values. In comparison follow-up visits, the method of imputation has been found to be a cheaper procedure from a cost point of view. In the present study, we can enhance the performance of imputation procedures by utilizing the raw moments of the auxiliary information rather than their ranks, especially, when the ranking of the auxiliary variable is expensive or difficult to do so. Equations for bias and mean squared error are obtained by large sample approximation. Through the numerical and simulation studies it can be easily understood that the proposed method of imputation can outperform their counterparts.
Źródło:
Statistics in Transition new series; 2019, 20, 1; 21-40
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Lookahead selective sampling for incomplete data
Autorzy:
Abdallah, L.
Shimshoni, I.
Powiązania:
https://bibliotekanauki.pl/articles/330278.pdf
Data publikacji:
2016
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
selective sampling
missing values
ensemble clustering
próbkowanie selektywne
brakujące wartości
grupowanie zespołowe
Opis:
Missing values in data are common in real world applications. There are several methods that deal with this problem. In this paper we present lookahead selective sampling (LSS) algorithms for datasets with missing values. We developed two versions of selective sampling. The first one integrates a distance function that can measure the similarity between pairs of incomplete points within the framework of the LSS algorithm. The second algorithm uses ensemble clustering in order to represent the data in a cluster matrix without missing values and then run the LSS algorithm based on the ensemble clustering instance space (LSS-EC). To construct the cluster matrix, we use the k-means and mean shift clustering algorithms especially modified to deal with incomplete datasets. We tested our algorithms on six standard numerical datasets from different fields. On these datasets we simulated missing values and compared the performance of the LSS and LSS-EC algorithms for incomplete data to two other basic methods. Our experiments show that the suggested selective sampling algorithms outperform the other methods.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2016, 26, 4; 871-884
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Methods for imputation of missing values and their influence on the results of segmentation research
Metody uzupełniania braków danych i ich wpływ na wyniki badań segmentacyjnych.
Autorzy:
Gąsior, Marcin
Skowron, Łukasz
Powiązania:
https://bibliotekanauki.pl/articles/425241.pdf
Data publikacji:
2016
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
missing values
cluster analysis
k-means algorithm
k-medoids algorithm
Opis:
The lack of answers is a common problem in all types of research, especially in the field of social sciences. Hence a number of solutions were developed, including the analysis of complete cases or imputations that supplement the missing value with a value calculated according to different algorithms. This paper evaluates the influence of the adopted method for the supplementation of missing answers regarding the result of segmentation conducted with the use of cluster analysis. In order to achieve this we used a set of data from an actual consumer research in which the cases with missing values were deleted or supplemented with the use of various methods. Cluster analyses were then performed on those sets of data, both with the assumption of ordinal and ratio level of measurement, and then the grouping quality, as expressed by different indicators, was evaluated. This research proved the advantage of imputation over the analysis of complete cases, it also proved the validity of using more complex approaches than the simple supplementation with an average or median value.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2016, 4 (54); 61-71
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wpływ liczebności próby i metody zastępowania braków odpowiedzi na miary dopasowania oraz wyniki modelowania ścieżkowego
Influence of a sample size and a method of hand- ling missing values on the results and goodness of fit of the path relation model
Autorzy:
Skowron, Łukasz
Gąsior, Marcin
Powiązania:
https://bibliotekanauki.pl/articles/424919.pdf
Data publikacji:
2016
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
path relation model
SEM
PLS
data gaps
sample size
Opis:
In the following article the authors describe the problem of influence of a sample size and a method of handling missing values on the results and goodness of fit of the path relation model. In order to estimate the goodness of fit of the model the authors use the indicators which describe the internal (Cronbach’s Alfa, Composite Reliability) and external (R2) stability of the model. By the term “results of the models” the authors mean estimated index values for latent variables and path coefficients of the SEM modeling procedure. In the research the authors analysed outcomes of Partial Least Squares method, used to build a model of Lublin shopping malls sector customers’ satisfaction and loyalty. The research included 43 datasets that varied in a number of observations and a method used for solving the missing values problem. Obtained results not only allowed the authors to statistically verify the main research problem of the study, but also enabled researchers to evaluate practical applicability of the analyzed imputation methods in real market and business consultancy activities. The research showed the supremacy of the Predictive Mean Matching and CART algorithms over other methods in the majority of analyzed ceases. Nevertheless, the differences between obtained results were rather insignificant, so one may assume that there is no visible influence of the used method on the practical interpretation of the obtained model and analyzed phenomenon.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2016, 3 (53); 42-53
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Review of methods for data sets with missing values and practical applications
Autorzy:
Korczyński, Adam
Powiązania:
https://bibliotekanauki.pl/articles/433946.pdf
Data publikacji:
2014
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
missing data pattern
missing data mechanism
complete-case analysis
available-case analysis
single imputation
likelihood-based methods
multiple imputation
weighting methods
Opis:
The aim of this paper is to revise the traditional methods (complete-case analysis, available-case analysis, single imputation) and current methods (likelihood-based methods, multiple imputation, weighting methods) for handling the problem of missing data and to assess their usefulness in statistical research. The paper provides the terminology and the description of traditional and current methods and algorithms used in the analysis of incomplete data sets. The methods are assessed in terms of the statistical properties of their estimators. An example is provided for the multiple imputation method. The review indicates that current methods outweigh traditional ones in terms of bias reduction, precision and efficiency of the estimation.
Źródło:
Śląski Przegląd Statystyczny; 2014, 12(18); 83-104
1644-6739
Pojawia się w:
Śląski Przegląd Statystyczny
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Some Remarks on the Data Imputation Using “missForest” Method
Kilka uwag o imputacji danych z wykorzystaniem metody "missforest"
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/905779.pdf
Data publikacji:
2013
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
missing values
single and multiple imputation
random forests
missForest
Opis:
Missing data are quite common in practical applications of statistical methods and imputation is a general statistical method for the analysis of incomplete data sets. Stekhoven and Bühlmann (2012) proposed an iterative imputation method (called “missForest”) based on Random Forests (Breiman 2001) to cope with missing values. In the paper a short description of “missForest” is presented and some selected missing data techniques are compared with “missForest” by artificially simulating different proportions and mechanisms of missing data using complete data sets from the UCI repository of machine learning databases.
W pracy Stekhovena i Bühlmanna (2012) zaproponowano nową iteracyjną metodę imputacji (nazwaną „missForest”) opartą na metodzie Random Forests Breimana (2001). W niniejszym artykule omówiono metodę „missForest” i porównano kilka wybranych technik postępowania w sytuacji występowania braków danych z metodą „missForest”. W tym celu wykorzystano podejście symulacyjne generując różne proporcje i mechanizmy powstawania braków danych w zbiorach danych pochodzących głównie z repozytorium baz danych na Uniwersytecie Kalifornijskim w Irvine.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2013, 285
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Imputation of Missing Data Using R Package
Imputacja brakujących danych z wykorzystaniem środowiska R
Autorzy:
Misztal, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/907623.pdf
Data publikacji:
2012
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
missing values
single imputation
R – project
Opis:
Missing data are quite common in practical applications of statistical methods. Imputation is general statistical method for the analysis of incomplete data sets. The goal of the paper is to review selected imputation techniques. Special attention is paid to methods implemented in some packages working in the R environment. An example is presented to show how to handle missing values using a few procedures of single and multiple imputation implemented in R.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2012, 269
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Neuro-rough-fuzzy approach for regression modelling from missing data
Autorzy:
Simiński, K.
Powiązania:
https://bibliotekanauki.pl/articles/331298.pdf
Data publikacji:
2012
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
system neuronowo-rozmyty
ANNBFIS
brakujące wartości
zbiór przybliżony
zbiór rozmyty
neuro-fuzzy
missing values
marginalisation
imputation
rough fuzzy set
clustering
Opis:
Real life data sets often suffer from missing data. The neuro-rough-fuzzy systems proposed hitherto often cannot handle such situations. The paper presents a neuro-fuzzy system for data sets with missing values. The proposed solution is a complete neuro-fuzzy system. The system creates a rough fuzzy model from presented data (both full and with missing values) and is able to elaborate the answer for full and missing data examples. The paper also describes the dedicated clustering algorithm. The paper is accompanied by results of numerical experiments.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2012, 22, 2; 461-476
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Stability of Optimal Parameters for Classifier Based on Simple Granules of Knowledge
Badanie stabilności optymalnych parametrów klasyfikatora bazującego na prostych granulach wiedzy
Autorzy:
Artiemjew, P.
Powiązania:
https://bibliotekanauki.pl/articles/298234.pdf
Data publikacji:
2011
Wydawca:
Uniwersytet Warmińsko-Mazurski w Olsztynie
Tematy:
zbiory przybliżone
inkluzje przybliżone
granule wiedzy
klasyfikacja danych
uszkodzenia systemu decyzyjnego
stabilność optymalnych parametrów
rough sets
rough inclusions
granules of knowledge
classification of data
missing values
stability of optimal parameters
Opis:
Searching for optimal parameters of a classifier based on simple granules of knowledge investigated recently by the author (ARTIEMJEW 2010) raises a question about stability of optimal parameters. In this article, we will check dependence of stability of the optimal radius of granulation on random damage of decision system. The results of experiments show the dependence of stability on size of damage and strategies of treating missing values. This kind of research aims at finding methods of protecting decision systems which are vulnerable to damage against decreasing their classification effectiveness, which means preserving classifying possibilities similar to undamaged decision systems.
Przeprowadzone w ostatnim czasie badania (ARTIEMJEW 2010) zmierzające do wyszukiwania optymalnych parametrów klasyfikacji modułów decyzyjnych opartych na prostych granulach wiedzy zrodziły pytanie o stabilność optymalnych parametrów klasyfikacji. W pracy sprawdzono zależność stabilności optymalnych promieni granulacji od losowego uszkadzania systemu decyzyjnego. Wyniki badań wskazały jednoznacznie, że istnieje zależność między stabilnością a wielkością uszkodzenia i strategiami traktowania wartości uszkodzonych. Tego typu badania mają na celu szukanie metod zabezpieczania systemów decyzyjnych, które są podatne na uszkodzenia, przed zmniejszaniem ich efektywności klasyfikacyjnej. Celem było zachowanie możliwości klasyfikacyjnych zbliżonych do efektywności nieuszkodzonych systemów decyzyjnych.
Źródło:
Technical Sciences / University of Warmia and Mazury in Olsztyn; 2011, 14(1); 57-69
1505-4675
2083-4527
Pojawia się w:
Technical Sciences / University of Warmia and Mazury in Olsztyn
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
An improved comparison of three rough set approaches to missing attribute values
Autorzy:
Grzymala-Busse, J. W.
Grzymala-Busse, W. J.
Hippe, Z. S.
Rząsa, W.
Powiązania:
https://bibliotekanauki.pl/articles/969797.pdf
Data publikacji:
2010
Wydawca:
Polska Akademia Nauk. Instytut Badań Systemowych PAN
Tematy:
incomplete data sets
missing attribute values
approximations for incomplete data
LERS data mining system
MLEM2 algorithm
Opis:
In a previous paper three types of missing attribute values: lost values, attribute-concept values and "do not care" conditions were compared using six data sets. Since previous experimental results were affected by large variances due to conducting experiments on different versions of a given data set, we conducted new experiments, using the same pattern of missing attribute values for all three types of missing attribute values and for both certain and possible rules. Additionally, in our new experiments, the process of incremental replacing specified values by missing attribute values was terminated when entire rows of the data sets were full of missing attribute values. Finally, we created new, incomplete data sets by replacing the specified values starting from 5% of all attribute values, instead of 10% as in the previous experiments, with an increment of 5% instead of the previous increment of 10%. As a result, it is becoming more clear that the best approach to missing attribute values is based on lost values, with small difference between certain and possible rules, and that the worst approach is based on "do not care" conditions, certain rules. With our improved experimental setup it is also more clear that for a given data set the type of the missing attribute values should be selected individually.
Źródło:
Control and Cybernetics; 2010, 39, 2; 469-486
0324-8569
Pojawia się w:
Control and Cybernetics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Computer-Intensive Methods in Traffic Safety Research
Autorzy:
Harold, S.
Powiązania:
https://bibliotekanauki.pl/articles/90673.pdf
Data publikacji:
2002
Wydawca:
Centralny Instytut Ochrony Pracy
Tematy:
data analysis
errors
screening
missing values
unknown values
imputation
data mining
analiza komputerowa
komputer
archiwa
bezpieczeństwo ruchu drogowego
analiza danych
Opis:
The analysis of traffic safety data archives has improved markedly with the development of procedures that are heavily dependent upon computers. Three such procedures are described here. The first procedure involves using computers to assist in the identification and correction of invalid data. The second procedure makes greater computational demands, and involves using computerized algorithms to fill in the ‘‘gaps’’ that typically occur in archival data when information regarding key variables is not available. The third and most computer-intensive procedure involves using data mining techniques to search archives for interesting and important relationships between variables. These procedures are illustrated using examples from data archives that describe the characteristics of traffic accidents in the USA and Australia.
Źródło:
International Journal of Occupational Safety and Ergonomics; 2002, 8, 3; 353-363
1080-3548
Pojawia się w:
International Journal of Occupational Safety and Ergonomics
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-14 z 14

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies