Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Outliers" wg kryterium: Temat


Tytuł:
Attenuation matrix in robust, free adjustment
Autorzy:
Duchnowski, R.
Wiśniewski, Z.
Powiązania:
https://bibliotekanauki.pl/articles/225859.pdf
Data publikacji:
2006
Wydawca:
Politechnika Warszawska. Wydział Geodezji i Kartografii
Tematy:
free adjustment
robustness
outliers
Opis:
Equivalent weight matrix Px plays a major role in robust, free adjustment. It is contained in the optimization criterion P(dx) = dtxPxdx where dx is an increment vector to approximate coordinates of all network points. Assuming, that Px = px T(dx ), where Px is a priori weight matrix, the paper presents the way how to calculate an attenuation matrix T(dx)( dx is a standardized increment vector). Special attention is paid to the way of increment standardization and to computation of an increment variance matrix.
Źródło:
Reports on Geodesy; 2006, z. 2/77; 299-305
0867-3179
Pojawia się w:
Reports on Geodesy
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Receiver Autonomous Integrity Monitoring Method Based on Digital Pictures Analysis
Autorzy:
Nowak, A.
Wąż, M.
Powiązania:
https://bibliotekanauki.pl/articles/320799.pdf
Data publikacji:
2010
Wydawca:
Polskie Forum Nawigacyjne
Tematy:
integrity monitoring
RAIM
GNSS outliers
Opis:
The paper presents conception of receiver autonomous integrity monitoring (RAIM) method in urban areas based on digital pictures analysis. The results of considerations the system architecture and finale shape of mobile measurement station are described. The results of experiments done on model pictures are presented, too.
Źródło:
Annual of Navigation; 2010, 16; 89-98
1640-8632
Pojawia się w:
Annual of Navigation
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The proposition of a new damping function for outliers in the adjustment process
Autorzy:
Gargula, T.
Powiązania:
https://bibliotekanauki.pl/articles/100690.pdf
Data publikacji:
2015
Wydawca:
Uniwersytet Rolniczy im. Hugona Kołłątaja w Krakowie
Tematy:
outliers
robust estimation
dumping function
conic curve
Opis:
This study proposes of new damping function in the robust estimation process. The formulae for a behaviour of the damping function were provided and a diagram of adjustment process was presented. The numerical examples are given in order to assess the efficiency of the proposed computational algorithm in accomplishing a typical geodetic task with outliers or gross errors.
Źródło:
Geomatics, Landmanagement and Landscape; 2015, 2; 21-31
2300-1496
Pojawia się w:
Geomatics, Landmanagement and Landscape
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Detection of Outliers in Univariate Circular Data by Means of the Outlier Local Factor (LOF)
Autorzy:
Abuzaid, Ali H.
Powiązania:
https://bibliotekanauki.pl/articles/1058939.pdf
Data publikacji:
2020-09-04
Wydawca:
Główny Urząd Statystyczny
Tematy:
discordancy
distance
multiple outliers
neighbours
spacing theory
Opis:
The problem of outlier detection in univariate circular data was the object of increased interest over the last decade. New numerical and graphical methods were developed for samples from different circular probability distributions. The main drawback of the existing methods is, however, that they are distribution-based and ignore the problem of multiple outliers. The local outlier factor (LOF) is a density-based method for detecting outliers in multivariate data and it depends on the local density of every k nearest neighbours. The aim of this paper is to extend the application of the LOF to the detection of possible outliers in circular samples, where the angles of circular data are represented in two Cartesian coordinates and treated as bivariate data. The performance of the LOF is compared against other existing numerical methods by means of a simulation based on the power of a test and the proportion of correct detection. The LOF performance is compatible with the best existing discordancy tests, while outperforming other tests. The level of the LOF performance is directly related to the contamination and concentration parameters, while having an inverse relationship with the sample size. In order to illustrate the process, the LOF and other existing discordancy tests are applied to detect possible outliers in two common real circular datasets.
Źródło:
Statistics in Transition new series; 2020, 21, 3; 39-51
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Impact of outliers on inequality measures – a comparison between Polish Voivodeships
Autorzy:
Ostasiewicz, Katarzyna
Powiązania:
https://bibliotekanauki.pl/articles/434056.pdf
Data publikacji:
2014
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
inequality
outliers
Gini index
Theil index
Atkinson indexes
Opis:
It is known that outlying (large) incomes strongly influence the results of inequality measuring. Thus, there is a question how to deal with such observations. In this paper the rule of excluding observations based on (Q1 – 1.5Q; Q3 + 1.5Q) interval is investigated, for data from household budget survey in 2011, for Polish voivodeships. It is shown that although including more observations obviously changes the values of inequality measures, the relative values of them are surprisingly quite stable, with the rank correlation coefficient never over 0.9.
Źródło:
Śląski Przegląd Statystyczny; 2014, 12(18); 105-120
1644-6739
Pojawia się w:
Śląski Przegląd Statystyczny
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Dispersion of estimates of linear regression parameters in case of the deepest regression method
Zróżnicowanie ocen parametrów regresji liniowej uzyskanych metodą najgłębszej regresji
Autorzy:
Pruska, Dorota
Powiązania:
https://bibliotekanauki.pl/articles/907023.pdf
Data publikacji:
2008
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
the deepest regression method
outliers
dispersion
breakdown value
Opis:
The deepest regression method is such a method of estimation of regression parameters that the maximal regression depth characterises the obtained model. In this paper the deeepest regression method is presented and the simulation analysis (Monte Carlo experiments) of dispersion of linear regression parameter estimates is conducted in case of data sets with different numbers of outliers. On the basis of the results of Monte Carlo experiments the characteristics of distribution of regression parameter estimates are determined and compared with the results of analogous experiments conducted with the use of the least square method.
Metoda najgłębszej regresji polega na oszacowaniu parametrów liniowej funkcji regresji w taki sposób, aby uzyskanemu modelowi odpowiadała największa głębia regresyjna. W pracy przedstawiono charakterystykę metody najgłębszej regresji i przeprowadzono symulacyjną analizę (metodami Monte Carlo) zróżnicowania ocen parametrów modelu regresji liniowej uzyskanych tą metodą dla zbiorów danych zawierających różną liczbę obserwacji nietypowych. Na podstawie przeprowadzonych eksperymentów Monte Carlo wyznaczono charakterystyki rozkładu ocen parametrów i dokonano porównania otrzymanych wyników z wynikami analogicznych eksperymentów, w których do estymacji parametrów wykorzystano metodę najmniejszych kwadratów.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2008, 216
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Developing calibration estimators for population mean using robust measures of dispersion under stratified random sampling
Autorzy:
Audu, Ahmed
Singh, Rajesh
Khare, Supriya
Powiązania:
https://bibliotekanauki.pl/articles/1054567.pdf
Data publikacji:
2021-06-04
Wydawca:
Główny Urząd Statystyczny
Tematy:
calibration
outliers
percentage relative efficiency (PRE)
stratified sampling
Opis:
In this paper, two modified, design-based calibration ratio-type estimators are presented. The suggested estimators were developed under stratified random sampling using information on an auxiliary variable in the form of robust statistical measures, including Gini’s mean difference, Downton’s method and probability weighted moments. The properties (biases and MSEs) of the proposed estimators are studied up to the terms of firstorder approximation by means of Taylor’s Series approximation. The theoretical results were supported by a simulation study conducted on four bivariate populations and generated using normal, chi-square, exponential and gamma populations. The results of the study indicate that the proposed calibration scheme is more precise than any of the others considered in this paper.
Źródło:
Statistics in Transition new series; 2021, 22, 2; 125-142
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
O odporności na obserwacje odstające wybranych nieparametrycznych modeli regresji
Robustness for outliers of selected nonparametric regression models
Autorzy:
Trzęsiok, Joanna
Powiązania:
https://bibliotekanauki.pl/articles/587772.pdf
Data publikacji:
2015
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Obserwacje odstające
Odporność
Regresja nieparametryczna
Nonparametric regression
Outliers
Robust
Opis:
Artykuł jest poświęcony zagadnieniu odporności metod regresji na obserwacje odstające występujące w zbiorze danych. W pierwszej części przedstawiono wybrane metody identyfikacji obserwacji nietypowych. Następnie badano odporność trzech nieparametrycznych metod regresji: PPR, POLYMARS i RANDOM FORESTS. Analiz dokonano za pomocą procedur symulacyjnych na rzeczywistym zbiorze danych Mieszkania, w którym wykryto obserwacje odstające. Pomimo dosyć powszechnych przekonań o odporności regresji nieparametrycznej, okazało się, że modele zbudowane na całym zbiorze danych mają istotnie mniejsze zdolności predykcyjne niż modele uzyskane na zbiorze, z którego usunięto obserwacje nietypowe.
The paper presents an important problem of robustness for outliers in regression. In the first part selected outliers detection techniques are described. Moreover, we empirically examine the robustness of the following methods: PPR, POLYMARS and RANDOM FORESTS on real world dataset. We show, that after removing outliers the prediction abilities of the models increase.
Źródło:
Studia Ekonomiczne; 2015, 227; 75-84
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Regression analysis for interval-valued symbolic data versus noisy variables and outliers
Regresja liniowa danych symbolicznych a zmienne zakłócające i obserwacje odstające
Autorzy:
Pełka, Marcin
Dudek, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/425104.pdf
Data publikacji:
2016
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
regression analysis
interval-valued symbolic data
noisy variables
outliers
Opis:
Regression analysis is perhaps the best known and most widely used method used for the analysis of dependence; that is, for examining the relationship between a set of independent variables (X’s) and a single dependent variable (Y). In general regression, the model is a linear combination of independent variables that corresponds as closely as possible to the dependent variable [Lattin, Carroll, Green 2003, p. 38]. The aim of the article is to present two suitable adaptations for a regression analysis of symbolic interval-valued data (centre method and centre and range method) and to compare their usefulness when dealing with noisy variables and/or outliers. The empirical part of the paper presents the results of simulation studies based on artificial and real data, without noisy variables and/or outliers and with noisy variable and outliers. The results are compared according to the values of two coefficients of determination 2 RL and 2 . RU The results show that usually the centre and range method obtains better results even when the data set contains noisy variables and outliers, but in some cases the centre method obtains better results than the centre and range method.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2016, 2 (52); 35-42
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Lack of signals of selection at candidate loci at a small geographical scale along a steep altitudinal gradient in Norway spruce (Picea abies [L.] Karst.)
Autorzy:
Hrivnak, M.
Krajmerova, D.
Gomory, D.
Powiązania:
https://bibliotekanauki.pl/articles/2117886.pdf
Data publikacji:
2019
Wydawca:
Polska Akademia Nauk. Czasopisma i Monografie PAN
Tematy:
local adaptation
single nucleotide polymorphisms
FST-outliers
spatial analysis method
Opis:
Local adaptation is a key concept in biology: shift of genetic structures of populations due to differential survival of genotypes is expected to lead to phenotypes providing an advantage in the local environment. Variation of sequences of twelve candidate genes was investigated in 13 Norway spruce (Picea abies (L.) Karst.) provenances originating from sites distributed along an altitudinal gradient from 550 to 1300 m a.s.l. Signals of selection were assessed in 103 single nucleotide polymorphisms (SNP). The Bayesian FST-outlier identification methods as implemented in the programs BayeScan and Arlequin did not identify any SNP with a clear evidence of selection. The approaches relying on SNP-climate associations (spatial analysis method based on logistic regression of allele frequencies with environmental variables, Bayesian method applied in BayEnv2) identified several relationships but none of them remained significant after correction for multiple testing. Gene flow, epigenetic inheritance and former management of the studied populations are discussed as potential reasons for this weak evidence of selec- tion signals.
Źródło:
Acta Biologica Cracoviensia. Series Botanica; 2019, 61, 1; 43-51
0001-5296
Pojawia się w:
Acta Biologica Cracoviensia. Series Botanica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Tail orderings and the total time on test transform
Autorzy:
Bartoszewicz, Jarosław
Powiązania:
https://bibliotekanauki.pl/articles/1339294.pdf
Data publikacji:
1996
Wydawca:
Polska Akademia Nauk. Instytut Matematyczny PAN
Tematy:
partial orderings
outliers
spacings
goodness-of-fit test
density-quantile function
Opis:
The paper presents some connections between two tail orderings of distributions and the total time on test transform. The procedure for testing the pure-tail ordering is proposed.
Źródło:
Applicationes Mathematicae; 1996-1997, 24, 1; 77-86
1233-7234
Pojawia się w:
Applicationes Mathematicae
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Identyfikacja obserwacji oddalonych w szeregach czasowych
Detection of outliers in time series
Autorzy:
Trzęsiok, Michał
Powiązania:
https://bibliotekanauki.pl/articles/591642.pdf
Data publikacji:
2016
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Identyfikacja obserwacji oddalonych
Klasyfikacja
Szeregi czasowe
Classification
Outliers detection
Time series
Opis:
W artykule uwzględniono różne podejścia do zagadnienia identyfikacji obserwacji oddalonych: podejście dedykowane dla szeregów czasowych i modeli ARIMA, mierniki stopnia oddalenia obserwacji oraz metody klasyfikacyjne. Celem cząstkowym jest zestawienie istniejących metod, ze wskazaniem możliwości pewnych modyfikacji dla polepszenia wyników otrzymywanych z prowadzonej diagnostyki.
The paper presents three different methods for detecting anomalies in time series. The first one is dedicated for time series analysis and ARIMA models. Two other two come from very different background: one is associated with measuring the distance from the given observation to the remaining objects in dataset. The other one belongs to the family of classification methods within machine learning framework. The goal of the paper is to present, compare and illustrate these three different approaches on a real world dataset.
Źródło:
Studia Ekonomiczne; 2016, 265; 95-105
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Outliers vs Robustness in Nonparametric Methods of Regression
Obserwacje odstające a problem odporności
Autorzy:
Trzęsiok, Joanna
Powiązania:
https://bibliotekanauki.pl/articles/658308.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
obserwacje odstające
odporność
nieparametryczne metody regresji
outliers
robustness
nonparametric regression methods
Opis:
Artykuł poświęcony jest zagadnieniu odporności metod regresji na obserwacje odstające występujące w zbiorze danych. W pierwszej części przedstawiono wybrane metody identyfikacji obserwacji nietypowych. Następnie badano odporność trzech nieparametrycznych metod regresji: PPR, POLYMARS i RANDOM FORESTS. Analiz dokonano za pomocą procedur symulacyjnych na zbiorach danych, w których wykryto obserwacje odstające. Mimo dosyć powszechnych przekonań o odporności regresji nieparametrycznej okazało się, że modele zbudowane na całych zbiorach danych mają istotnie mniejsze zdolności predykcyjne niż modele uzyskane na zbiorach, z których usunięto obserwacje nietypowe.
The article addresses the question of how robust methods of regression are against outliers in a given data set. In the first part, we presented the selected methods used to detect outliers. Then, we tested the robustness of three nonparametric methods of regression: PPR, POLYMARS, and RANDOM FORESTS. The analysis was conducted applying simulation procedures to the data sets where outliers were detected. Contrary to a relatively common conviction about the robustness of nonparametric regression, the study revealed that the models built on the basis of complete data sets represent a significantly lower predictive capability than models based on the sets from which outliers were discarded.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2018, 4, 337; 99-109
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Metodyka wyznaczania wyników odstających dla testów wytrzymałościowych kompozytów
Methodology of outliers determination for composite materials strength tests
Autorzy:
Jaśkiewicz, R.
Stepniowska, A.
Powiązania:
https://bibliotekanauki.pl/articles/952910.pdf
Data publikacji:
2016
Wydawca:
Sieć Badawcza Łukasiewicz - Instytut Lotnictwa
Tematy:
Maximum Normed Residual
MNR
wartości odstające
badania kompozytów
outliers
composities testing
Opis:
W niniejszym artykule przedstawiono metodykę wyznaczania wartości odstających dla testów wytrzymałościowych próbek kompozytowych. Wykonano przegląd literatury stosowanych metod postępowania z wynikami odstającymi, a także przeanalizowano możliwe przyczyny ich występowania w przypadku testowania materiałów kompozytowych. Badania przeprowadzono na wynikach dwóch serii próbek: jednej z badania rozciągania i jednej z testu ścinania, różniących się dodatkowo wielkością próby. Wpracy zweryfikowano rozrzut wartości analizowanych podczas prób ściskania i ścinania. Do wskazania rezultatów odstających użyto metody MNR (metoda maksymalnej znormalizowanej reszty, (Maximum Normed Residual). Dla każdej z prób wyliczono współczynnik MNR i porównano go z wartością krytyczną CV (Critical Value), odpowiadajacą wielkości próby danej serii próbek. Po przeprowadzonej analizie wskazano wyniki odstające i proces postępowania z nimi.
The article presents methodology of outliers determination for composites specimens strength tests. Review of the literature was made to analyze methods of proceedings with outliers, and to get know possible causes of their occurrence for composite materials. Research has been done with the results of one tension test and one in plane shearing test. The article verified dispersion of max. recorded stress values. The MNR method (Maximum Normed Residual) was used to indicate outliers. The MNR coefficient was calculated for each test. Next, it was compared with corresponding CV (Critical Value). After an analysis, outliers were indicated and it was explained what happened with them next.
Źródło:
Prace Instytutu Lotnictwa; 2016, 3 (244); 77-82
0509-6669
2300-5408
Pojawia się w:
Prace Instytutu Lotnictwa
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wykrywanie funkcjonalnych obserwacji odstających na przykładzie monitorowania jakości powietrza
Functional Outliers Detection by the Example of Air Quality Monitoring
Autorzy:
Kosiorowski, Daniel
Rydlewski, Jerzy P.
Zawadzki, Zygmunt
Powiązania:
https://bibliotekanauki.pl/articles/964970.pdf
Data publikacji:
2018
Wydawca:
Główny Urząd Statystyczny
Tematy:
funkcjonalne obserwacje odstające
wykrywanie funkcjonalnych obserwacji odstających
statystyka odporna
głębia funkcjonalna
analiza zanieczyszczenia powietrza
functional outliers
functional outliers detection
robust statistics
functional depth
air pollution analysis
Opis:
W pracy omówiono sposoby wykrywania obserwacji odstających w zbiorach danych funkcjonalnych. Omówiono mianowicie funkcjonalne obserwacje odstające ze względu na kształt i ze względu na amplitudę. Zdefiniowano wykres wartości odstających, służący do wykrywania funkcjonalnych obserwacji odstających ze względu na kształt. Omówiono też skorygowany funkcjonalny wykres pudełkowy służący do wykrywania funkcjonalnych obserwacji odstających ze względu na amplitudę. Elementy statystycznej analizy służącej do wykrywania obserwacji odstających zobrazowano na przykładzie danych pokazujących zanieczyszczenie powietrza w Katowicach oraz w Krakowie wybranymi czterema rodzajami substancji.
Methods of functional outliers detection in functional setting have been discussed, i.e. shape outliers and magnitude outliers. Outliergram has been discussed, a tool for functional shape outliers detection. Robust adjusted functional boxplot has been discussed as well, a tool for functional magnitude outliers detection. „The elements of functional outliers analysis have been applied to air pollution data for Katowice and Kraków.”
Źródło:
Przegląd Statystyczny; 2018, 65, 1; 83-100
0033-2372
Pojawia się w:
Przegląd Statystyczny
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A review of robust estimation methods applied in surveying
Przegląd metod estymacji odpornej stosowanych w geodezji
Autorzy:
Banaś, M.
Powiązania:
https://bibliotekanauki.pl/articles/386118.pdf
Data publikacji:
2012
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
outliers
robust estimation
adjustment of observations
obserwacje odstające
estymacja odporna
wyrównanie obserwacji
Opis:
This paper provides a review of popular outlier-robust methods used in surveying. The presented methods have been divided into two groups i.e. active and passive methods. The first group comprises the following methods: the Huber Method, the Hampel Method, the Danish Method, the Gaździcki Method, the Least Absolute Deviation and a Choice Rule of Alternative. The second group of methods is represented by the so called iterative data snooping (IDS) and τ-test. There are M-estimation rules presented in the introduction to the review of active methods.
Praca zawiera przegląd popularnych metod odpornych na błędy grube stosowanych w geodezji. Metody te podzielono na dwie grupy, tj. aktywne oraz pasywne. W pierwszej z nich znalazła się metoda Hubera, Hampela, duńska, Gaździckiego, liniowa, najmniejszych odchyleń absolutnych oraz zasada wyboru alternatywy. Druga grupa zawiera metodę Iterative Data Snooping (IDS) oraz τ-test. Wstęp do metod aktywnych stanowi przedstawienie zasad M-estymacji.
Źródło:
Geomatics and Environmental Engineering; 2012, 6, 4; 13-22
1898-1135
Pojawia się w:
Geomatics and Environmental Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
An outlier-robust neuro-fuzzy system for classification and regression
Autorzy:
Siminski, Krzysztof
Powiązania:
https://bibliotekanauki.pl/articles/1838201.pdf
Data publikacji:
2021
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
outliers
neuro-fuzzy system
clustering algorithm
regression
wyjątki
system neurorozmyty
algorytm grupowania
Opis:
Real life data often suffer from non-informative objects—outliers. These are objects that are not typical in a dataset and can significantly decline the efficacy of fuzzy models. In the paper we analyse neuro-fuzzy systems robust to outliers in classification and regression tasks. We use the fuzzy c-ordered means (FCOM) clustering algorithm for scatter domain partition to identify premises of fuzzy rules. The clustering algorithm elaborates typicality of each object. Data items with low typicalities are removed from further analysis. The paper is accompanied by experiments that show the efficacy of our modified neuro-fuzzy system to identify fuzzy models robust to high ratios of outliers.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2021, 31, 2; 303-319
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Small Area Estimation for Skewed Data in the Presence of Zeroes
Autorzy:
Karlberg, Forough
Powiązania:
https://bibliotekanauki.pl/articles/466079.pdf
Data publikacji:
2015
Wydawca:
Główny Urząd Statystyczny
Tematy:
small area estimation
representative outliers
zero-valued observations lognormal-logistic mixture model
Opis:
Skewed distributions with representative outliers pose a problem in many surveys. Various small area prediction approaches for skewed data based on transformation models have been proposed. However, in certain applications of those predictors, the fact that the survey data also contain a non-negligible number of zero-valued observations is sometimes dealt with rather crudely, for instance by arbitrarily adding a constant to each value (to allow zeroes to be considered as “positive observations, only smaller”, instead of acknowledging their qualitatively different nature). On the other hand, while a lognormal-logistic model has been proposed (to incorporate skewed distributions as well as zeroes), that model does not include any hierarchical aspects, and is therefore not explicitly adapted to small area prediction. In this paper, we consolidate the two approaches by extending one of the already established log-transformation mixed small area prediction models to incorporate a logistic component. This allows for the simultaneous, systematic treatment of domain effects, outliers and zero-valued observations in a single framework. We benchmark the resulting model-based predictors (against relevant alternatives) in applications to simulated data as well as empirical data from the Australian Agricultural and Grazing Industries Survey.
Źródło:
Statistics in Transition new series; 2015, 16, 4; 541-562
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A robust fixed-lag smoothing algorithm for dynamic systems with correlated sensor malfunctions
Autorzy:
Grishin, Y. P.
Janczak, D.
Powiązania:
https://bibliotekanauki.pl/articles/199833.pdf
Data publikacji:
2014
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
outliers
robust signal processing
nonlinear filtering
fault detection
systems with changing structures
Opis:
A new robust fixed-lag smoothing algorithm for fault-tolerant signal processing in stochastic dynamic systems in the presence of correlated sensor malfunctions has been developed. The algorithm is developed using a state vector augmentation method and the Gaussian approximation of the current estimate probability density function. The algorithm can be used in the real-time fault-tolerant control systems as well as in radar tracking systems working in the complex interference environment. The performance of the developed algorithm are evaluated by simulations and compared with smoothing and nonlinear filtering algorithms.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2014, 62, 3; 517-523
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Robust estimation in interlaboratory measurements with small number of measurements
Autorzy:
Volodarsky, E. T.
Warsza, Z. L.
Powiązania:
https://bibliotekanauki.pl/articles/114483.pdf
Data publikacji:
2015
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
interlaboratory comparisons
proficiency testing of laboratory outliers
robust statistics
precision
uncertainty of measurements
Opis:
In this paper two robust methods of assessing the value and the uncertainty of the measurand from the samples of small number of experimental data are presented and compared. Those methods can be used when some measurements results contain outliers, i.e. when the values of certain measurement results significantly differ from the others. They allow to set a credible statistical parameters of the measurements with the use of all experimental data. The following considerations are illustrated by the numerical examples of multi-laboratory measurement data key comparison. Compared are the results obtained by a classical method with rejection of outliers with two robust methods: a rescaled median absolute deviation MADS and an iterative two-criteria method. The paper also presents the advantages of the robust iterative statistical method in estimating the accuracy of the tested laboratory measurement results during its accreditation on the sample of four elements with outlier. A comparison with the estimates obtained by the standard procedure for evaluating performance accuracy is also provided.
Źródło:
Measurement Automation Monitoring; 2015, 61, 4; 104-110
2450-2855
Pojawia się w:
Measurement Automation Monitoring
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Application of the Huber and Hampel M-estimation in Real Estate Value Modeling
Zastosowanie metod Hubera i Hampela M-estymacji w modelowaniu wartości nieruchomości
Autorzy:
Adamczyk, T.
Powiązania:
https://bibliotekanauki.pl/articles/385803.pdf
Data publikacji:
2017
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
M-estymacja
obserwacje odstające
modelowanie wartości nieruchomości
M-estimation
outliers
property value modeling
Opis:
Statystyka matematyczna jest potężnym narzędziem w analizie rynku nieruchomości i wyceny nieruchomości w przypadku dużych zbiorów danych. W literaturze często przytaczane są modele regresji dwuwymiarowej oraz wielowymiarowej. Estymacja parametrów modeli jest przeważnie oparta na metodzie najmniejszych kwadratów, mało odpornej na przypadki odstające. Nawet pojedyncza obserwacja odstająca może mieć negatywny wpływ na wyniki estymacji uzyskiwane w modelach opartych na klasycznej metodzie najmniejszych kwadratów. Autor analizuje możliwość zastosowania do modelowania wartości nieruchomości wybranych metod estymacji odpornej – metody Hubera oraz Hampela. Metody estymacji odpornej w porównaniu z klasycznymi metodami estymacji pozwalają uzyskać najmniejsze wartości wariancji estymowanych parametrów, co przekłada się na minimalizację wariancji szacowanych wartości nieruchomości z wykorzystaniem założonego modelu. W celu weryfikacji tezy o możliwości zastosowania metod odpornych w wycenie nieruchomości przeprowadzono analizę na przykładowej bazie nieruchomości. Wnioski sformułowano na podstawie porównania wyników estymacji za pomocą klasycznej metody najmniejszych kwadratów z wynikami wybranych metod estymacji odpornej (Hubera i Hampela). Podstawą wnioskowania była również analiza wariancji.
Mathematical statistics is a powerful tool in real estate analysing and its valuation, when large databases are to be considered. The professional literature very often cites two or multidimensional variables methods of regression. Typically the model parameters estimation is based on the smallest squares method, however, such a method could not be resilient to the outlier cases. Even a single outlier could potentially have a negative impact on estimating results obtained by using the standard smallest squares method. The author analyzes the possibility of application of the chosen robust estimation method in property value modeling – the Huber and Hampel method. Comparing to the most commonly used classic estimation method, the robust estimation method enables us to obtain the smallest variation values for the estimated parameters, that results in property value estimated parameters variance minimizing, based on a given model. To verify the rationale of using the resilience methods in property valuation assumption, a sample of real property database analysis was conducted. The findings were concluded based on result comparison of the classic smallest squares method and the robust estimation method (Huber and Hampel) with variance analysis being also taken as a basis for conclusion.
Źródło:
Geomatics and Environmental Engineering; 2017, 11, 1; 15-23
1898-1135
Pojawia się w:
Geomatics and Environmental Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Obserwacje odstające na rynku energii elektrycznej
Outliers on electric energy market
Autorzy:
Ganczarek-Gamrot, Alicja
Powiązania:
https://bibliotekanauki.pl/articles/586165.pdf
Data publikacji:
2016
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Obserwacje odstające
Rynek energii elektrycznej
Szeregi czasowe
Electric energy market
Outliers
Time series
Opis:
W pracy została przeprowadzona charakterystyka szeregów cen energii elektrycznej pod względem obserwacji, odstających na Polskiej Towarowej Giełdzie Energii (TGE). Do analizy zostały wykorzystane szeregi czasowe o dziennej częstotliwości indeksów IRDN, SIRDN, offIRDN, POLPXbase oraz POLPXpeak. Na podstawie wyników estymacji modelu ARIMA zostały zidentyfikowane obserwacje odstające: addytywne (AO), innowacyjne (IO), przesunięcie poziomu (LS) oraz tymczasowe zmiany (TC).
In the paper outlier observations within time series of prices of electric energy from Polish Power Exchange were characterized. Time series of indexes IRDN, sIRDN, offIRDN, POLPXbase and POLPXpeak with daily frequency were analyzed. Additive outliers (AO), innovative outliers (IO), level shifts (LS), temporary change (TC) were identified using seasonal linear models SARIMA.
Źródło:
Studia Ekonomiczne; 2016, 288; 7-20
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Isolation Forests for Symbolic Data as a Tool for Outlier Mining
Lasy separujące dla danych symbolicznych jako narzędzie wykrywania obserwacji odstających
Autorzy:
Pełka, Marcin
Dudek, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/31233541.pdf
Data publikacji:
2024
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
symbolic data analysis
isolation forest
outliers
analiza danych symbolicznych
lasy separujące
obserwacje odstające
Opis:
Aim: Outlier detection is a key part of every data analysis. Although there are many definitions of outliers that can be found in the literature, all of them emphasise that outliers are objects that are in some way different from other objects in the dataset. There are many different approaches that have been proposed, compared, and analysed for the case of classical data. However, there are only few studies that deal with the problem of outlier detection in symbolic data analysis. The paper aimed to propose how to adapt isolation forest for symbolic data cases. Methodology: An isolation forest for symbolic data is used to detect outliers in four different artificial datasets with a known cluster structure and a known number of outliers Results: The results show that the isolation forest for symbolic data is a fast and efficient tool for outlier mining. Implications and recommendations: As the isolation forest for symbolic data appears to be an efficient tool for outlier detection for artificial data, further studies should focus on real data sets that contain outliers (i.e. credit card fraud dataset), and this approach should be compared with other outlier mining tools (i.e. DBCSAN). The authors recommend using the same initial settings for the isolation forest for symbolic data as the settings that are proposed for the isolation forest for classical data. Originality/value: This paper is the first of its kind, focusing not only on the problem of outlier detection in general, but also extending the well-known isolation forest model for symbolic data cases. Keywords: symbolic data analysis, isolation forest, outliers
Cel: Identyfikacja obserwacji odstających stanowi kluczowy element w analizie danych. Pomimo że w literaturze funkcjonuje wiele różnych definicji, czym są obserwacje odstające, to ogólnie można stwierdzić, że są to obiekty różniące się od pozostałych obserwacji ze zbioru danych. Literatura przedmiotu wskazuje wiele różnorodnych metod, które można wykorzystać w przypadku danych klasycznych. Niestety w przypadku danych symbolicznych brakuje takich analiz. Celem artykułu jest zaproponowanie modyfikacji lasów separujących (isolation forests) dla danych symbolicznych. Metodyka: W artykule wykorzystano lasy separujące dla danych symbolicznych do identyfikacji obserwacji odstających w sztucznych zbiorach danych o znanej strukturze klas i znanej liczbie obserwacji odstających. Wyniki: Otrzymane wyniki wskazują, że lasy separujące dla danych symbolicznych są efektywnym i szybkim narzędziem w identyfikacji obserwacji odstających. Implikacje i rekomendacje: Ponieważ lasy separujące dla danych symbolicznych okazały się skutecznym narzędziem w identyfikacji obserwacji odstających, celem przyszłych badań powinno być przeanalizowanie skuteczności tej metody w przypadku rzeczywistych zbiorów danych (np. zbioru dotyczącego oszustw z użyciem kart kredytowych), a także porównanie tej metody z innymi metodami, które pozwalają odnaleźć obserwacje odstające (np. DBSCAN). Autorzy sugerują, by w przypadku lasów separujących dla danych symbolicznych stosować te same parametry, jakie zwykle stosuje się w przypadku lasów losowych dla danych klasycznych. Oryginalność/wartość: Artykuł nie tylko stanowi ujęcie teorii w zakresie obserwacji odstających, ale jednocześnie proponuje, jak zastosować lasy separujące w przypadku danych symbolicznych.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2024, 28, 1; 1-10
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Two-Component Normal Mixture Alternative to the Fay-Herriot Model
Autorzy:
Chakraborty, Adrijo
Datta, Gauri Sankar
Mandal, Abhyuday
Powiązania:
https://bibliotekanauki.pl/articles/465632.pdf
Data publikacji:
2016
Wydawca:
Główny Urząd Statystyczny
Tematy:
Hierarchical Bayes
heavy-tail distribution
non-informative priors
robustness to outliers
small area estimation
Opis:
This article considers a robust hierarchical Bayesian approach to deal with random effects of small area means when some of these effects assume extreme values, resulting in outliers. In the presence of outliers, the standard Fay-Herriot model, used for modeling area-level data, under normality assumptions of random effects may overestimate the random effects variance, thus providing less than ideal shrinkage towards the synthetic regression predictions and inhibiting the borrowing of information. Even a small number of substantive outliers of random effects results in a large estimate of the random effects variance in the Fay-Herriot model, thereby achieving little shrinkage to the synthetic part of the model or little reduction in the posterior variance associated with the regular Bayes estimator for any of the small areas. While the scale mixture of normal distributions with a known mixing distribution for the random effects has been found to be effective in the presence of outliers, the solution depends on the mixing distribution. As a possible alternative solution to the problem, a two-component normal mixture model has been proposed, based on non-informative priors on the model variance parameters, regression coefficients and the mixing probability. Data analysis and simulation studies based on real, simulated and synthetic data show an advantage of the proposed method over the standard Bayesian Fay-Herriot solution derived under normality of random effects.
Źródło:
Statistics in Transition new series; 2016, 17, 1; 67-90
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On the method of identification of atypical observations in time series
O metodzie identyfikacji obserwacji nietypowych w szeregach czasowych
Autorzy:
Oesterreich, Maciej
Powiązania:
https://bibliotekanauki.pl/articles/424783.pdf
Data publikacji:
2020
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
forecasts
identification
multiple regression
time series
outliers
prognozy
identyfikacja
regresja wieloraka
szeregi czasowe
obserwacje odstające
Opis:
The paper presents a method of detecting atypical observations in time series with or without seasonal fluctuations. Unlike classical methods of identifying outliers and influential observations, its essence consists in examining the impact of individual observations both on the fitted values of the model and the forecasts. The exemplification of theoretical considerations is the empirical example of modelling and forecasting daily sales of liquid fuels at X gas station in the period 2012-2014. As a predictor, a classic time series model was used, in which 7-day and 12-month cycle seasonality was described using dummy variables. The data for the period from 01.01.2012 to 30.06.2014 were for the estimation period and the second half of 2014 which was the period of empirical verification of forecasts. The obtained results were compared with other classical methods used to identify influential observations and outliers, i.e. standardized residuals, Cook distances and DFFIT. The calculations were carried out in the R environment and the Statistica package.
W pracy zaproponowano metodę wykrywania obserwacji nietypowych w szeregach czasowych z wahaniami sezonowymi oraz bez tych wahań. Jej istota jej polega na badaniu wpływu poszczególnych obserwacji szeregu na wartości teoretyczne modelu oraz wielkości prognoz zbudowanych na jego podstawie. Egzemplifikacją rozważań o charakterze teoretycznym jest przykład empiryczny dotyczący modelowania i prognozowania dziennej sprzedaży paliw płynnych na stacji paliw X w latach 2012-2014. Dane za okres od 1.01.2012 do 30.06.2014 stanowią okres estymacyjny, a za II półrocze 2014 r. okres empirycznej weryfikacji prognoz. Wyniki otrzymane za jej pomocą zostały porównane z wynikami uzyskanymi innymi metodami służącymi do identyfikacji obserwacji wpływowych oraz odstających, w tym m.in.: reszt standaryzowanych, odległości Cooka oraz DFFIT. Obliczenia przeprowadzono w środowisku R oraz pakiecie Statistica.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2020, 24, 2; 1-16
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies