Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Obserwacje odstające" wg kryterium: Temat


Tytuł:
O odporności na obserwacje odstające wybranych nieparametrycznych modeli regresji
Robustness for outliers of selected nonparametric regression models
Autorzy:
Trzęsiok, Joanna
Powiązania:
https://bibliotekanauki.pl/articles/587772.pdf
Data publikacji:
2015
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Obserwacje odstające
Odporność
Regresja nieparametryczna
Nonparametric regression
Outliers
Robust
Opis:
Artykuł jest poświęcony zagadnieniu odporności metod regresji na obserwacje odstające występujące w zbiorze danych. W pierwszej części przedstawiono wybrane metody identyfikacji obserwacji nietypowych. Następnie badano odporność trzech nieparametrycznych metod regresji: PPR, POLYMARS i RANDOM FORESTS. Analiz dokonano za pomocą procedur symulacyjnych na rzeczywistym zbiorze danych Mieszkania, w którym wykryto obserwacje odstające. Pomimo dosyć powszechnych przekonań o odporności regresji nieparametrycznej, okazało się, że modele zbudowane na całym zbiorze danych mają istotnie mniejsze zdolności predykcyjne niż modele uzyskane na zbiorze, z którego usunięto obserwacje nietypowe.
The paper presents an important problem of robustness for outliers in regression. In the first part selected outliers detection techniques are described. Moreover, we empirically examine the robustness of the following methods: PPR, POLYMARS and RANDOM FORESTS on real world dataset. We show, that after removing outliers the prediction abilities of the models increase.
Źródło:
Studia Ekonomiczne; 2015, 227; 75-84
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Winsoryzacja w ocenie małych przedsiębiorstw
Autorzy:
Dehnel, Grażyna
Powiązania:
https://bibliotekanauki.pl/articles/583245.pdf
Data publikacji:
2017
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
estymacja odporna
statystyka gospodarcza
obserwacje odstające
esty-mator Winsora
Opis:
Rozwój gospodarczy określił nowe zadania dla statystyki przedsiębiorstw. Można zaobserwować wzrost zapotrzebowania na dane statystyczne, które dostarczane są w krótkich odstępach czasu oraz charakteryzują się większą dokładnością i spójnością. Spro-stanie temu wyzwaniu wymusza poszukiwanie metod szacunku zmierzających w kierunku zwiększenia stopnia wykorzystania źródeł administracyjnych. Adaptacja nowych rozwiązań ma przyczynić się do zwiększenia efektywności prowadzonych szacunków, rozszerzenia za-kresu informacji zarówno co do liczby cech, jak i rodzajów przekrojów, w których dane są publikowane. Celem niniejszego badania jest próba uwzględnienia winsoryzacji w estymacji typu GREG proponowanej przez statystykę małych obszarów do szacunku charakterystyk dotyczących małych przedsiębiorstw. W estymacji jako zmienne pomocnicze uwzględniono zmienne opóźnione w czasie. Badanie prowadzono na niskim poziomie agregacji, stanowią-cym przekrój województw z uwzględnieniem rodzaju PKD.
Źródło:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu; 2017, 468; 60-68
1899-3192
Pojawia się w:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wykorzystanie metody TOPSIS do oceny zróżnicowania rozwoju województw Polski w latach 2010-2014 w kontekście kształtowania się ładu instytucjonalnego
Autorzy:
Roszkowska, Ewa
Filipowicz-Chomko, Marzena
Wachowicz, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/581988.pdf
Data publikacji:
2017
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
zrównoważony rozwój
ład instytucjonalny
wspólny wzorzec rozwoju
TOPSIS
obserwacje odstające
Opis:
Celem opracowania jest ocena zróżnicowania rozwoju województw Polski w latach 2010-2014 w kontekście kształtowania się ładu instytucjonalnego. Analizę wyników opisujących poziom rozwoju instytucjonalnego przeprowadzono w ujęciu czasowo- -przestrzennym. Wyznaczono wartości miernika rozwoju oraz zbudowano rankingi woje- wództw w latach 2010-2014 z wykorzystaniem metody TOPSIS ze wspólnym wzorcem rozwoju. Zaproponowano modyfikację tej metody, pozwalającą na pominięcie w konstrukcji wzorca i antywzorca wartości oddalonych cech diagnostycznych. W ujęciu czasowym dokonano oceny postępów województw w kierunku zrównoważonego rozwoju w zakresie poziom rozwoju instytucjonalnego w 2014 roku w odniesieniu do 2010 roku. Przeprowadzono dyskusję wyników otrzymanych za pomocą obu procedur TOPSIS.
Źródło:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu; 2017, 469; 149-158
1899-3192
Pojawia się w:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Outliers vs Robustness in Nonparametric Methods of Regression
Obserwacje odstające a problem odporności
Autorzy:
Trzęsiok, Joanna
Powiązania:
https://bibliotekanauki.pl/articles/658308.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
obserwacje odstające
odporność
nieparametryczne metody regresji
outliers
robustness
nonparametric regression methods
Opis:
Artykuł poświęcony jest zagadnieniu odporności metod regresji na obserwacje odstające występujące w zbiorze danych. W pierwszej części przedstawiono wybrane metody identyfikacji obserwacji nietypowych. Następnie badano odporność trzech nieparametrycznych metod regresji: PPR, POLYMARS i RANDOM FORESTS. Analiz dokonano za pomocą procedur symulacyjnych na zbiorach danych, w których wykryto obserwacje odstające. Mimo dosyć powszechnych przekonań o odporności regresji nieparametrycznej okazało się, że modele zbudowane na całych zbiorach danych mają istotnie mniejsze zdolności predykcyjne niż modele uzyskane na zbiorach, z których usunięto obserwacje nietypowe.
The article addresses the question of how robust methods of regression are against outliers in a given data set. In the first part, we presented the selected methods used to detect outliers. Then, we tested the robustness of three nonparametric methods of regression: PPR, POLYMARS, and RANDOM FORESTS. The analysis was conducted applying simulation procedures to the data sets where outliers were detected. Contrary to a relatively common conviction about the robustness of nonparametric regression, the study revealed that the models built on the basis of complete data sets represent a significantly lower predictive capability than models based on the sets from which outliers were discarded.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2018, 4, 337; 99-109
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A review of robust estimation methods applied in surveying
Przegląd metod estymacji odpornej stosowanych w geodezji
Autorzy:
Banaś, M.
Powiązania:
https://bibliotekanauki.pl/articles/386118.pdf
Data publikacji:
2012
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
outliers
robust estimation
adjustment of observations
obserwacje odstające
estymacja odporna
wyrównanie obserwacji
Opis:
This paper provides a review of popular outlier-robust methods used in surveying. The presented methods have been divided into two groups i.e. active and passive methods. The first group comprises the following methods: the Huber Method, the Hampel Method, the Danish Method, the Gaździcki Method, the Least Absolute Deviation and a Choice Rule of Alternative. The second group of methods is represented by the so called iterative data snooping (IDS) and τ-test. There are M-estimation rules presented in the introduction to the review of active methods.
Praca zawiera przegląd popularnych metod odpornych na błędy grube stosowanych w geodezji. Metody te podzielono na dwie grupy, tj. aktywne oraz pasywne. W pierwszej z nich znalazła się metoda Hubera, Hampela, duńska, Gaździckiego, liniowa, najmniejszych odchyleń absolutnych oraz zasada wyboru alternatywy. Druga grupa zawiera metodę Iterative Data Snooping (IDS) oraz τ-test. Wstęp do metod aktywnych stanowi przedstawienie zasad M-estymacji.
Źródło:
Geomatics and Environmental Engineering; 2012, 6, 4; 13-22
1898-1135
Pojawia się w:
Geomatics and Environmental Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Application of the Huber and Hampel M-estimation in Real Estate Value Modeling
Zastosowanie metod Hubera i Hampela M-estymacji w modelowaniu wartości nieruchomości
Autorzy:
Adamczyk, T.
Powiązania:
https://bibliotekanauki.pl/articles/385803.pdf
Data publikacji:
2017
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
M-estymacja
obserwacje odstające
modelowanie wartości nieruchomości
M-estimation
outliers
property value modeling
Opis:
Statystyka matematyczna jest potężnym narzędziem w analizie rynku nieruchomości i wyceny nieruchomości w przypadku dużych zbiorów danych. W literaturze często przytaczane są modele regresji dwuwymiarowej oraz wielowymiarowej. Estymacja parametrów modeli jest przeważnie oparta na metodzie najmniejszych kwadratów, mało odpornej na przypadki odstające. Nawet pojedyncza obserwacja odstająca może mieć negatywny wpływ na wyniki estymacji uzyskiwane w modelach opartych na klasycznej metodzie najmniejszych kwadratów. Autor analizuje możliwość zastosowania do modelowania wartości nieruchomości wybranych metod estymacji odpornej – metody Hubera oraz Hampela. Metody estymacji odpornej w porównaniu z klasycznymi metodami estymacji pozwalają uzyskać najmniejsze wartości wariancji estymowanych parametrów, co przekłada się na minimalizację wariancji szacowanych wartości nieruchomości z wykorzystaniem założonego modelu. W celu weryfikacji tezy o możliwości zastosowania metod odpornych w wycenie nieruchomości przeprowadzono analizę na przykładowej bazie nieruchomości. Wnioski sformułowano na podstawie porównania wyników estymacji za pomocą klasycznej metody najmniejszych kwadratów z wynikami wybranych metod estymacji odpornej (Hubera i Hampela). Podstawą wnioskowania była również analiza wariancji.
Mathematical statistics is a powerful tool in real estate analysing and its valuation, when large databases are to be considered. The professional literature very often cites two or multidimensional variables methods of regression. Typically the model parameters estimation is based on the smallest squares method, however, such a method could not be resilient to the outlier cases. Even a single outlier could potentially have a negative impact on estimating results obtained by using the standard smallest squares method. The author analyzes the possibility of application of the chosen robust estimation method in property value modeling – the Huber and Hampel method. Comparing to the most commonly used classic estimation method, the robust estimation method enables us to obtain the smallest variation values for the estimated parameters, that results in property value estimated parameters variance minimizing, based on a given model. To verify the rationale of using the resilience methods in property valuation assumption, a sample of real property database analysis was conducted. The findings were concluded based on result comparison of the classic smallest squares method and the robust estimation method (Huber and Hampel) with variance analysis being also taken as a basis for conclusion.
Źródło:
Geomatics and Environmental Engineering; 2017, 11, 1; 15-23
1898-1135
Pojawia się w:
Geomatics and Environmental Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Obserwacje odstające na rynku energii elektrycznej
Outliers on electric energy market
Autorzy:
Ganczarek-Gamrot, Alicja
Powiązania:
https://bibliotekanauki.pl/articles/586165.pdf
Data publikacji:
2016
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Obserwacje odstające
Rynek energii elektrycznej
Szeregi czasowe
Electric energy market
Outliers
Time series
Opis:
W pracy została przeprowadzona charakterystyka szeregów cen energii elektrycznej pod względem obserwacji, odstających na Polskiej Towarowej Giełdzie Energii (TGE). Do analizy zostały wykorzystane szeregi czasowe o dziennej częstotliwości indeksów IRDN, SIRDN, offIRDN, POLPXbase oraz POLPXpeak. Na podstawie wyników estymacji modelu ARIMA zostały zidentyfikowane obserwacje odstające: addytywne (AO), innowacyjne (IO), przesunięcie poziomu (LS) oraz tymczasowe zmiany (TC).
In the paper outlier observations within time series of prices of electric energy from Polish Power Exchange were characterized. Time series of indexes IRDN, sIRDN, offIRDN, POLPXbase and POLPXpeak with daily frequency were analyzed. Additive outliers (AO), innovative outliers (IO), level shifts (LS), temporary change (TC) were identified using seasonal linear models SARIMA.
Źródło:
Studia Ekonomiczne; 2016, 288; 7-20
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Isolation Forests for Symbolic Data as a Tool for Outlier Mining
Lasy separujące dla danych symbolicznych jako narzędzie wykrywania obserwacji odstających
Autorzy:
Pełka, Marcin
Dudek, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/31233541.pdf
Data publikacji:
2024
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
symbolic data analysis
isolation forest
outliers
analiza danych symbolicznych
lasy separujące
obserwacje odstające
Opis:
Aim: Outlier detection is a key part of every data analysis. Although there are many definitions of outliers that can be found in the literature, all of them emphasise that outliers are objects that are in some way different from other objects in the dataset. There are many different approaches that have been proposed, compared, and analysed for the case of classical data. However, there are only few studies that deal with the problem of outlier detection in symbolic data analysis. The paper aimed to propose how to adapt isolation forest for symbolic data cases. Methodology: An isolation forest for symbolic data is used to detect outliers in four different artificial datasets with a known cluster structure and a known number of outliers Results: The results show that the isolation forest for symbolic data is a fast and efficient tool for outlier mining. Implications and recommendations: As the isolation forest for symbolic data appears to be an efficient tool for outlier detection for artificial data, further studies should focus on real data sets that contain outliers (i.e. credit card fraud dataset), and this approach should be compared with other outlier mining tools (i.e. DBCSAN). The authors recommend using the same initial settings for the isolation forest for symbolic data as the settings that are proposed for the isolation forest for classical data. Originality/value: This paper is the first of its kind, focusing not only on the problem of outlier detection in general, but also extending the well-known isolation forest model for symbolic data cases. Keywords: symbolic data analysis, isolation forest, outliers
Cel: Identyfikacja obserwacji odstających stanowi kluczowy element w analizie danych. Pomimo że w literaturze funkcjonuje wiele różnych definicji, czym są obserwacje odstające, to ogólnie można stwierdzić, że są to obiekty różniące się od pozostałych obserwacji ze zbioru danych. Literatura przedmiotu wskazuje wiele różnorodnych metod, które można wykorzystać w przypadku danych klasycznych. Niestety w przypadku danych symbolicznych brakuje takich analiz. Celem artykułu jest zaproponowanie modyfikacji lasów separujących (isolation forests) dla danych symbolicznych. Metodyka: W artykule wykorzystano lasy separujące dla danych symbolicznych do identyfikacji obserwacji odstających w sztucznych zbiorach danych o znanej strukturze klas i znanej liczbie obserwacji odstających. Wyniki: Otrzymane wyniki wskazują, że lasy separujące dla danych symbolicznych są efektywnym i szybkim narzędziem w identyfikacji obserwacji odstających. Implikacje i rekomendacje: Ponieważ lasy separujące dla danych symbolicznych okazały się skutecznym narzędziem w identyfikacji obserwacji odstających, celem przyszłych badań powinno być przeanalizowanie skuteczności tej metody w przypadku rzeczywistych zbiorów danych (np. zbioru dotyczącego oszustw z użyciem kart kredytowych), a także porównanie tej metody z innymi metodami, które pozwalają odnaleźć obserwacje odstające (np. DBSCAN). Autorzy sugerują, by w przypadku lasów separujących dla danych symbolicznych stosować te same parametry, jakie zwykle stosuje się w przypadku lasów losowych dla danych klasycznych. Oryginalność/wartość: Artykuł nie tylko stanowi ujęcie teorii w zakresie obserwacji odstających, ale jednocześnie proponuje, jak zastosować lasy separujące w przypadku danych symbolicznych.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2024, 28, 1; 1-10
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Identyfikacja układu odniesienia sieci niwelacyjnej obszaru Legnicko-Głogowskiego Okręgu Miedziowego
Identification reference system of leveling network an area of Legnica-Głogów Copper District
Autorzy:
Mrówczyńska, M.
Powiązania:
https://bibliotekanauki.pl/articles/341376.pdf
Data publikacji:
2010
Wydawca:
Uniwersytet Przyrodniczy we Wrocławiu
Tematy:
układ odniesienia
obserwacje odstające
geometryczny model przemieszczeń
reference system
outlying observations
model of vertical displacements
Opis:
W artykule przedstawiono próbę określenia przemieszczeń pionowych punktów kontrolowanych położonych na obszarze Legnicko-Głogowskiego Okręgu Miedziowego. Przemieszczenia te zostały wyznaczone na podstawie wyników pomiarów niwelacyjnych prowadzonych w latach 1967–2000. W pierwszej kolejności w celu identyfikacji oraz wyeliminowania obserwacji odstających zostały zastosowane metody estymacji mocnych. Układ odniesienia zdefiniowano na podstawie algorytmu złożonego z dwóch etapów. Na pierwszym etapie wyznaczono moduł wektora przyrostów bazowych cech wewnętrznych, jakie wynikają z dwóch pomiarów okresowych (wyjściowego i aktualnego), na drugim etapie badana była reakcja układu obserwacyjnego w trakcie rozwiązywania kolejnych zadań wyrównawczych, wywołana wzrostem liczby punktów objętych założeniem stałości.
The article presents an attempt to determine the vertical displacements of points located within the area controlled Legnica-Głogów Copper District. Displacements have been found on the basis of measurements carried out in leveling the years 1967 to 2000. In the first place to identify and eliminate gross errors the estimation method of strengths have been applied. Then, the calculations carried out in a reference system defined on the basis of the algorithm, consisting of two phases. The first stage concerns the initial identification, which consists in determining the unit vector basis of increments of internal characteristics, which stem from two periodic measurements (initial and current), the second step is to study the reaction of the observation in the course of solving the following adjustment tasks caused by increase in the number of points covered by the stability condition.
Źródło:
Acta Scientiarum Polonorum. Geodesia et Descriptio Terrarum; 2010, 9, 4; 27-36
1644-0668
Pojawia się w:
Acta Scientiarum Polonorum. Geodesia et Descriptio Terrarum
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On the method of identification of atypical observations in time series
O metodzie identyfikacji obserwacji nietypowych w szeregach czasowych
Autorzy:
Oesterreich, Maciej
Powiązania:
https://bibliotekanauki.pl/articles/424783.pdf
Data publikacji:
2020
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
forecasts
identification
multiple regression
time series
outliers
prognozy
identyfikacja
regresja wieloraka
szeregi czasowe
obserwacje odstające
Opis:
The paper presents a method of detecting atypical observations in time series with or without seasonal fluctuations. Unlike classical methods of identifying outliers and influential observations, its essence consists in examining the impact of individual observations both on the fitted values of the model and the forecasts. The exemplification of theoretical considerations is the empirical example of modelling and forecasting daily sales of liquid fuels at X gas station in the period 2012-2014. As a predictor, a classic time series model was used, in which 7-day and 12-month cycle seasonality was described using dummy variables. The data for the period from 01.01.2012 to 30.06.2014 were for the estimation period and the second half of 2014 which was the period of empirical verification of forecasts. The obtained results were compared with other classical methods used to identify influential observations and outliers, i.e. standardized residuals, Cook distances and DFFIT. The calculations were carried out in the R environment and the Statistica package.
W pracy zaproponowano metodę wykrywania obserwacji nietypowych w szeregach czasowych z wahaniami sezonowymi oraz bez tych wahań. Jej istota jej polega na badaniu wpływu poszczególnych obserwacji szeregu na wartości teoretyczne modelu oraz wielkości prognoz zbudowanych na jego podstawie. Egzemplifikacją rozważań o charakterze teoretycznym jest przykład empiryczny dotyczący modelowania i prognozowania dziennej sprzedaży paliw płynnych na stacji paliw X w latach 2012-2014. Dane za okres od 1.01.2012 do 30.06.2014 stanowią okres estymacyjny, a za II półrocze 2014 r. okres empirycznej weryfikacji prognoz. Wyniki otrzymane za jej pomocą zostały porównane z wynikami uzyskanymi innymi metodami służącymi do identyfikacji obserwacji wpływowych oraz odstających, w tym m.in.: reszt standaryzowanych, odległości Cooka oraz DFFIT. Obliczenia przeprowadzono w środowisku R oraz pakiecie Statistica.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2020, 24, 2; 1-16
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies