Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Obserwacje odstające" wg kryterium: Temat


Wyświetlanie 1-6 z 6
Tytuł:
Outliers vs Robustness in Nonparametric Methods of Regression
Obserwacje odstające a problem odporności
Autorzy:
Trzęsiok, Joanna
Powiązania:
https://bibliotekanauki.pl/articles/658308.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
obserwacje odstające
odporność
nieparametryczne metody regresji
outliers
robustness
nonparametric regression methods
Opis:
Artykuł poświęcony jest zagadnieniu odporności metod regresji na obserwacje odstające występujące w zbiorze danych. W pierwszej części przedstawiono wybrane metody identyfikacji obserwacji nietypowych. Następnie badano odporność trzech nieparametrycznych metod regresji: PPR, POLYMARS i RANDOM FORESTS. Analiz dokonano za pomocą procedur symulacyjnych na zbiorach danych, w których wykryto obserwacje odstające. Mimo dosyć powszechnych przekonań o odporności regresji nieparametrycznej okazało się, że modele zbudowane na całych zbiorach danych mają istotnie mniejsze zdolności predykcyjne niż modele uzyskane na zbiorach, z których usunięto obserwacje nietypowe.
The article addresses the question of how robust methods of regression are against outliers in a given data set. In the first part, we presented the selected methods used to detect outliers. Then, we tested the robustness of three nonparametric methods of regression: PPR, POLYMARS, and RANDOM FORESTS. The analysis was conducted applying simulation procedures to the data sets where outliers were detected. Contrary to a relatively common conviction about the robustness of nonparametric regression, the study revealed that the models built on the basis of complete data sets represent a significantly lower predictive capability than models based on the sets from which outliers were discarded.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2018, 4, 337; 99-109
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A review of robust estimation methods applied in surveying
Przegląd metod estymacji odpornej stosowanych w geodezji
Autorzy:
Banaś, M.
Powiązania:
https://bibliotekanauki.pl/articles/386118.pdf
Data publikacji:
2012
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
outliers
robust estimation
adjustment of observations
obserwacje odstające
estymacja odporna
wyrównanie obserwacji
Opis:
This paper provides a review of popular outlier-robust methods used in surveying. The presented methods have been divided into two groups i.e. active and passive methods. The first group comprises the following methods: the Huber Method, the Hampel Method, the Danish Method, the Gaździcki Method, the Least Absolute Deviation and a Choice Rule of Alternative. The second group of methods is represented by the so called iterative data snooping (IDS) and τ-test. There are M-estimation rules presented in the introduction to the review of active methods.
Praca zawiera przegląd popularnych metod odpornych na błędy grube stosowanych w geodezji. Metody te podzielono na dwie grupy, tj. aktywne oraz pasywne. W pierwszej z nich znalazła się metoda Hubera, Hampela, duńska, Gaździckiego, liniowa, najmniejszych odchyleń absolutnych oraz zasada wyboru alternatywy. Druga grupa zawiera metodę Iterative Data Snooping (IDS) oraz τ-test. Wstęp do metod aktywnych stanowi przedstawienie zasad M-estymacji.
Źródło:
Geomatics and Environmental Engineering; 2012, 6, 4; 13-22
1898-1135
Pojawia się w:
Geomatics and Environmental Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Application of the Huber and Hampel M-estimation in Real Estate Value Modeling
Zastosowanie metod Hubera i Hampela M-estymacji w modelowaniu wartości nieruchomości
Autorzy:
Adamczyk, T.
Powiązania:
https://bibliotekanauki.pl/articles/385803.pdf
Data publikacji:
2017
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
M-estymacja
obserwacje odstające
modelowanie wartości nieruchomości
M-estimation
outliers
property value modeling
Opis:
Statystyka matematyczna jest potężnym narzędziem w analizie rynku nieruchomości i wyceny nieruchomości w przypadku dużych zbiorów danych. W literaturze często przytaczane są modele regresji dwuwymiarowej oraz wielowymiarowej. Estymacja parametrów modeli jest przeważnie oparta na metodzie najmniejszych kwadratów, mało odpornej na przypadki odstające. Nawet pojedyncza obserwacja odstająca może mieć negatywny wpływ na wyniki estymacji uzyskiwane w modelach opartych na klasycznej metodzie najmniejszych kwadratów. Autor analizuje możliwość zastosowania do modelowania wartości nieruchomości wybranych metod estymacji odpornej – metody Hubera oraz Hampela. Metody estymacji odpornej w porównaniu z klasycznymi metodami estymacji pozwalają uzyskać najmniejsze wartości wariancji estymowanych parametrów, co przekłada się na minimalizację wariancji szacowanych wartości nieruchomości z wykorzystaniem założonego modelu. W celu weryfikacji tezy o możliwości zastosowania metod odpornych w wycenie nieruchomości przeprowadzono analizę na przykładowej bazie nieruchomości. Wnioski sformułowano na podstawie porównania wyników estymacji za pomocą klasycznej metody najmniejszych kwadratów z wynikami wybranych metod estymacji odpornej (Hubera i Hampela). Podstawą wnioskowania była również analiza wariancji.
Mathematical statistics is a powerful tool in real estate analysing and its valuation, when large databases are to be considered. The professional literature very often cites two or multidimensional variables methods of regression. Typically the model parameters estimation is based on the smallest squares method, however, such a method could not be resilient to the outlier cases. Even a single outlier could potentially have a negative impact on estimating results obtained by using the standard smallest squares method. The author analyzes the possibility of application of the chosen robust estimation method in property value modeling – the Huber and Hampel method. Comparing to the most commonly used classic estimation method, the robust estimation method enables us to obtain the smallest variation values for the estimated parameters, that results in property value estimated parameters variance minimizing, based on a given model. To verify the rationale of using the resilience methods in property valuation assumption, a sample of real property database analysis was conducted. The findings were concluded based on result comparison of the classic smallest squares method and the robust estimation method (Huber and Hampel) with variance analysis being also taken as a basis for conclusion.
Źródło:
Geomatics and Environmental Engineering; 2017, 11, 1; 15-23
1898-1135
Pojawia się w:
Geomatics and Environmental Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Isolation Forests for Symbolic Data as a Tool for Outlier Mining
Lasy separujące dla danych symbolicznych jako narzędzie wykrywania obserwacji odstających
Autorzy:
Pełka, Marcin
Dudek, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/31233541.pdf
Data publikacji:
2024
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
symbolic data analysis
isolation forest
outliers
analiza danych symbolicznych
lasy separujące
obserwacje odstające
Opis:
Aim: Outlier detection is a key part of every data analysis. Although there are many definitions of outliers that can be found in the literature, all of them emphasise that outliers are objects that are in some way different from other objects in the dataset. There are many different approaches that have been proposed, compared, and analysed for the case of classical data. However, there are only few studies that deal with the problem of outlier detection in symbolic data analysis. The paper aimed to propose how to adapt isolation forest for symbolic data cases. Methodology: An isolation forest for symbolic data is used to detect outliers in four different artificial datasets with a known cluster structure and a known number of outliers Results: The results show that the isolation forest for symbolic data is a fast and efficient tool for outlier mining. Implications and recommendations: As the isolation forest for symbolic data appears to be an efficient tool for outlier detection for artificial data, further studies should focus on real data sets that contain outliers (i.e. credit card fraud dataset), and this approach should be compared with other outlier mining tools (i.e. DBCSAN). The authors recommend using the same initial settings for the isolation forest for symbolic data as the settings that are proposed for the isolation forest for classical data. Originality/value: This paper is the first of its kind, focusing not only on the problem of outlier detection in general, but also extending the well-known isolation forest model for symbolic data cases. Keywords: symbolic data analysis, isolation forest, outliers
Cel: Identyfikacja obserwacji odstających stanowi kluczowy element w analizie danych. Pomimo że w literaturze funkcjonuje wiele różnych definicji, czym są obserwacje odstające, to ogólnie można stwierdzić, że są to obiekty różniące się od pozostałych obserwacji ze zbioru danych. Literatura przedmiotu wskazuje wiele różnorodnych metod, które można wykorzystać w przypadku danych klasycznych. Niestety w przypadku danych symbolicznych brakuje takich analiz. Celem artykułu jest zaproponowanie modyfikacji lasów separujących (isolation forests) dla danych symbolicznych. Metodyka: W artykule wykorzystano lasy separujące dla danych symbolicznych do identyfikacji obserwacji odstających w sztucznych zbiorach danych o znanej strukturze klas i znanej liczbie obserwacji odstających. Wyniki: Otrzymane wyniki wskazują, że lasy separujące dla danych symbolicznych są efektywnym i szybkim narzędziem w identyfikacji obserwacji odstających. Implikacje i rekomendacje: Ponieważ lasy separujące dla danych symbolicznych okazały się skutecznym narzędziem w identyfikacji obserwacji odstających, celem przyszłych badań powinno być przeanalizowanie skuteczności tej metody w przypadku rzeczywistych zbiorów danych (np. zbioru dotyczącego oszustw z użyciem kart kredytowych), a także porównanie tej metody z innymi metodami, które pozwalają odnaleźć obserwacje odstające (np. DBSCAN). Autorzy sugerują, by w przypadku lasów separujących dla danych symbolicznych stosować te same parametry, jakie zwykle stosuje się w przypadku lasów losowych dla danych klasycznych. Oryginalność/wartość: Artykuł nie tylko stanowi ujęcie teorii w zakresie obserwacji odstających, ale jednocześnie proponuje, jak zastosować lasy separujące w przypadku danych symbolicznych.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2024, 28, 1; 1-10
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On the method of identification of atypical observations in time series
O metodzie identyfikacji obserwacji nietypowych w szeregach czasowych
Autorzy:
Oesterreich, Maciej
Powiązania:
https://bibliotekanauki.pl/articles/424783.pdf
Data publikacji:
2020
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
forecasts
identification
multiple regression
time series
outliers
prognozy
identyfikacja
regresja wieloraka
szeregi czasowe
obserwacje odstające
Opis:
The paper presents a method of detecting atypical observations in time series with or without seasonal fluctuations. Unlike classical methods of identifying outliers and influential observations, its essence consists in examining the impact of individual observations both on the fitted values of the model and the forecasts. The exemplification of theoretical considerations is the empirical example of modelling and forecasting daily sales of liquid fuels at X gas station in the period 2012-2014. As a predictor, a classic time series model was used, in which 7-day and 12-month cycle seasonality was described using dummy variables. The data for the period from 01.01.2012 to 30.06.2014 were for the estimation period and the second half of 2014 which was the period of empirical verification of forecasts. The obtained results were compared with other classical methods used to identify influential observations and outliers, i.e. standardized residuals, Cook distances and DFFIT. The calculations were carried out in the R environment and the Statistica package.
W pracy zaproponowano metodę wykrywania obserwacji nietypowych w szeregach czasowych z wahaniami sezonowymi oraz bez tych wahań. Jej istota jej polega na badaniu wpływu poszczególnych obserwacji szeregu na wartości teoretyczne modelu oraz wielkości prognoz zbudowanych na jego podstawie. Egzemplifikacją rozważań o charakterze teoretycznym jest przykład empiryczny dotyczący modelowania i prognozowania dziennej sprzedaży paliw płynnych na stacji paliw X w latach 2012-2014. Dane za okres od 1.01.2012 do 30.06.2014 stanowią okres estymacyjny, a za II półrocze 2014 r. okres empirycznej weryfikacji prognoz. Wyniki otrzymane za jej pomocą zostały porównane z wynikami uzyskanymi innymi metodami służącymi do identyfikacji obserwacji wpływowych oraz odstających, w tym m.in.: reszt standaryzowanych, odległości Cooka oraz DFFIT. Obliczenia przeprowadzono w środowisku R oraz pakiecie Statistica.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2020, 24, 2; 1-16
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Do multi-factor models produce robustresults? Econometric and diagnostic issues in equity risk premia study
Analiza diagnostyczna wieloczynnikowych modeli oszacowań premii za ryzyko akcyjne
Autorzy:
Sakowski, Paweł
Ślepaczuk, Robert
Wywiał, Mateusz
Powiązania:
https://bibliotekanauki.pl/articles/585858.pdf
Data publikacji:
2016
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Asset pricing models
Autocorrelation
Collinearity
Diagnostics
Econometric
Equity risk premia
General Methods of Moments (GMM)
Heteroscedasticity
Maximum Likelihood Estimation (MLE)
Multi-factor models
Normality
Ordinary Least Squares (OLS)
Outliers
Autokorelacja
Diagnostyka modeli
Heteroskedastyczność
Metoda najmniejszych kwadratów
Metoda największej wiarygodności
Modele wieloczynnikowe
Modele wyceny aktywów
Obserwacje odstające
Premia za ryzyko akcyjne
Uogólniona metoda momentów
Współliniowość
Opis:
In recent decades numerous studies verified empirical validity of the CAPM model. Many of them showed that CAPM alone is not able to explain cross-sectional variation of stock returns. Researchers revealed various risk factors which explained outperformance of given groups of stocks or proposed modifications to existing multi-factor models. Surprisingly, we hardly find any discussion in financial literature about potential drawbacks of applying standard OLS method to estimate parameters of such models. Yet, the question of robustness of OLS results to invalid assumptions shouldn't be ignored. This article aims to address diagnostic and econometric issues which can influence results of a time-series multifactor model. Based on the preliminary results of a five-factor model for 81 emerging and developed equity indices [Sakowski, Ślepaczuk and Wywiał, 2016a] obtained with OLS we check the robustness of these results to popular violations of OLS assumptions. We find autocorrelation of error term, heteroscedasticity and ARCH effects for most of 81 regressions and apply an AR-GARCH model using MLE to remove them. We also identify outliers and diagnose collinearity problems. Additionally, we apply GMM to avoid strong assumption of IID error term. Finally, we present comparison of parameters estimates and Rsquared values obtained by three different methods of estimation: OLS, MLE and GMM. We find that results do not differ substantially between these three methods and allow to draw the same conclusions from the investigated five-factor model.
W ostatnich latach liczne prace podejmowały temat empirycznej weryfikacji skuteczności modelu CAPM. Ich autorzy zaproponowali co najmniej kilka czynników ryzyka, które są w stanie wyjaśnić zróżnicowanie przekrojowe zwrotów rozmaitych aktywów finansowych. Zaproponowano także liczne modyfikacje istniejących modeli wieloczynnikowych. W bogatej literaturze rzadko jednak spotykamy dyskusję na temat konsekwencji stosowania standardowej Metody Najmniejszych Kwadratów do oszacowania parametrów tych modeli. Pytanie o odporność oszacowań wieloczynnikowych modeli wyceny aktywów finansowych uzyskanych za pomocą MNK na niespełnienie założeń nie powinno być jednak ignorowane. Celem niniejszego artykułu jest analiza diagnostyczna wyników oszacowań modelu pięcioczynnikowego dla 81 indeksów giełdowych [Sakowski, Ślepaczuk i Wywiał, 2016a]. Weryfikacja założeń modelu wskazuje na obecność autokorelacji i heteroskedastyczności czynnika losowego, a także występowanie efektów ARCH. Analiza obejmuje także identyfikację obserwacji wpływowych oraz weryfikację obecności współliniowości wśród czynników. W końcowej części prezentujemy porównanie oszacowań uzyskanych za pomocą Metody Najmniejszych Kwadratów, Metody Największej Wiarygodności oraz Uogólnionej Metody Momentów. Wszystkie trzy metody dają bardzo zbliżone oszacowania i pozwalają wyciągnąć ten sam zestaw wniosków dla analizowanego modelu pięcioczynnikowego.
Źródło:
Studia Ekonomiczne; 2016, 301; 203-227
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-6 z 6

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies