Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Outliers" wg kryterium: Temat


Wyświetlanie 1-8 z 8
Tytuł:
Outliers vs Robustness in Nonparametric Methods of Regression
Obserwacje odstające a problem odporności
Autorzy:
Trzęsiok, Joanna
Powiązania:
https://bibliotekanauki.pl/articles/658308.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
obserwacje odstające
odporność
nieparametryczne metody regresji
outliers
robustness
nonparametric regression methods
Opis:
Artykuł poświęcony jest zagadnieniu odporności metod regresji na obserwacje odstające występujące w zbiorze danych. W pierwszej części przedstawiono wybrane metody identyfikacji obserwacji nietypowych. Następnie badano odporność trzech nieparametrycznych metod regresji: PPR, POLYMARS i RANDOM FORESTS. Analiz dokonano za pomocą procedur symulacyjnych na zbiorach danych, w których wykryto obserwacje odstające. Mimo dosyć powszechnych przekonań o odporności regresji nieparametrycznej okazało się, że modele zbudowane na całych zbiorach danych mają istotnie mniejsze zdolności predykcyjne niż modele uzyskane na zbiorach, z których usunięto obserwacje nietypowe.
The article addresses the question of how robust methods of regression are against outliers in a given data set. In the first part, we presented the selected methods used to detect outliers. Then, we tested the robustness of three nonparametric methods of regression: PPR, POLYMARS, and RANDOM FORESTS. The analysis was conducted applying simulation procedures to the data sets where outliers were detected. Contrary to a relatively common conviction about the robustness of nonparametric regression, the study revealed that the models built on the basis of complete data sets represent a significantly lower predictive capability than models based on the sets from which outliers were discarded.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2018, 4, 337; 99-109
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A review of robust estimation methods applied in surveying
Przegląd metod estymacji odpornej stosowanych w geodezji
Autorzy:
Banaś, M.
Powiązania:
https://bibliotekanauki.pl/articles/386118.pdf
Data publikacji:
2012
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
outliers
robust estimation
adjustment of observations
obserwacje odstające
estymacja odporna
wyrównanie obserwacji
Opis:
This paper provides a review of popular outlier-robust methods used in surveying. The presented methods have been divided into two groups i.e. active and passive methods. The first group comprises the following methods: the Huber Method, the Hampel Method, the Danish Method, the Gaździcki Method, the Least Absolute Deviation and a Choice Rule of Alternative. The second group of methods is represented by the so called iterative data snooping (IDS) and τ-test. There are M-estimation rules presented in the introduction to the review of active methods.
Praca zawiera przegląd popularnych metod odpornych na błędy grube stosowanych w geodezji. Metody te podzielono na dwie grupy, tj. aktywne oraz pasywne. W pierwszej z nich znalazła się metoda Hubera, Hampela, duńska, Gaździckiego, liniowa, najmniejszych odchyleń absolutnych oraz zasada wyboru alternatywy. Druga grupa zawiera metodę Iterative Data Snooping (IDS) oraz τ-test. Wstęp do metod aktywnych stanowi przedstawienie zasad M-estymacji.
Źródło:
Geomatics and Environmental Engineering; 2012, 6, 4; 13-22
1898-1135
Pojawia się w:
Geomatics and Environmental Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Application of the Huber and Hampel M-estimation in Real Estate Value Modeling
Zastosowanie metod Hubera i Hampela M-estymacji w modelowaniu wartości nieruchomości
Autorzy:
Adamczyk, T.
Powiązania:
https://bibliotekanauki.pl/articles/385803.pdf
Data publikacji:
2017
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
M-estymacja
obserwacje odstające
modelowanie wartości nieruchomości
M-estimation
outliers
property value modeling
Opis:
Statystyka matematyczna jest potężnym narzędziem w analizie rynku nieruchomości i wyceny nieruchomości w przypadku dużych zbiorów danych. W literaturze często przytaczane są modele regresji dwuwymiarowej oraz wielowymiarowej. Estymacja parametrów modeli jest przeważnie oparta na metodzie najmniejszych kwadratów, mało odpornej na przypadki odstające. Nawet pojedyncza obserwacja odstająca może mieć negatywny wpływ na wyniki estymacji uzyskiwane w modelach opartych na klasycznej metodzie najmniejszych kwadratów. Autor analizuje możliwość zastosowania do modelowania wartości nieruchomości wybranych metod estymacji odpornej – metody Hubera oraz Hampela. Metody estymacji odpornej w porównaniu z klasycznymi metodami estymacji pozwalają uzyskać najmniejsze wartości wariancji estymowanych parametrów, co przekłada się na minimalizację wariancji szacowanych wartości nieruchomości z wykorzystaniem założonego modelu. W celu weryfikacji tezy o możliwości zastosowania metod odpornych w wycenie nieruchomości przeprowadzono analizę na przykładowej bazie nieruchomości. Wnioski sformułowano na podstawie porównania wyników estymacji za pomocą klasycznej metody najmniejszych kwadratów z wynikami wybranych metod estymacji odpornej (Hubera i Hampela). Podstawą wnioskowania była również analiza wariancji.
Mathematical statistics is a powerful tool in real estate analysing and its valuation, when large databases are to be considered. The professional literature very often cites two or multidimensional variables methods of regression. Typically the model parameters estimation is based on the smallest squares method, however, such a method could not be resilient to the outlier cases. Even a single outlier could potentially have a negative impact on estimating results obtained by using the standard smallest squares method. The author analyzes the possibility of application of the chosen robust estimation method in property value modeling – the Huber and Hampel method. Comparing to the most commonly used classic estimation method, the robust estimation method enables us to obtain the smallest variation values for the estimated parameters, that results in property value estimated parameters variance minimizing, based on a given model. To verify the rationale of using the resilience methods in property valuation assumption, a sample of real property database analysis was conducted. The findings were concluded based on result comparison of the classic smallest squares method and the robust estimation method (Huber and Hampel) with variance analysis being also taken as a basis for conclusion.
Źródło:
Geomatics and Environmental Engineering; 2017, 11, 1; 15-23
1898-1135
Pojawia się w:
Geomatics and Environmental Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Isolation Forests for Symbolic Data as a Tool for Outlier Mining
Lasy separujące dla danych symbolicznych jako narzędzie wykrywania obserwacji odstających
Autorzy:
Pełka, Marcin
Dudek, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/31233541.pdf
Data publikacji:
2024
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
symbolic data analysis
isolation forest
outliers
analiza danych symbolicznych
lasy separujące
obserwacje odstające
Opis:
Aim: Outlier detection is a key part of every data analysis. Although there are many definitions of outliers that can be found in the literature, all of them emphasise that outliers are objects that are in some way different from other objects in the dataset. There are many different approaches that have been proposed, compared, and analysed for the case of classical data. However, there are only few studies that deal with the problem of outlier detection in symbolic data analysis. The paper aimed to propose how to adapt isolation forest for symbolic data cases. Methodology: An isolation forest for symbolic data is used to detect outliers in four different artificial datasets with a known cluster structure and a known number of outliers Results: The results show that the isolation forest for symbolic data is a fast and efficient tool for outlier mining. Implications and recommendations: As the isolation forest for symbolic data appears to be an efficient tool for outlier detection for artificial data, further studies should focus on real data sets that contain outliers (i.e. credit card fraud dataset), and this approach should be compared with other outlier mining tools (i.e. DBCSAN). The authors recommend using the same initial settings for the isolation forest for symbolic data as the settings that are proposed for the isolation forest for classical data. Originality/value: This paper is the first of its kind, focusing not only on the problem of outlier detection in general, but also extending the well-known isolation forest model for symbolic data cases. Keywords: symbolic data analysis, isolation forest, outliers
Cel: Identyfikacja obserwacji odstających stanowi kluczowy element w analizie danych. Pomimo że w literaturze funkcjonuje wiele różnych definicji, czym są obserwacje odstające, to ogólnie można stwierdzić, że są to obiekty różniące się od pozostałych obserwacji ze zbioru danych. Literatura przedmiotu wskazuje wiele różnorodnych metod, które można wykorzystać w przypadku danych klasycznych. Niestety w przypadku danych symbolicznych brakuje takich analiz. Celem artykułu jest zaproponowanie modyfikacji lasów separujących (isolation forests) dla danych symbolicznych. Metodyka: W artykule wykorzystano lasy separujące dla danych symbolicznych do identyfikacji obserwacji odstających w sztucznych zbiorach danych o znanej strukturze klas i znanej liczbie obserwacji odstających. Wyniki: Otrzymane wyniki wskazują, że lasy separujące dla danych symbolicznych są efektywnym i szybkim narzędziem w identyfikacji obserwacji odstających. Implikacje i rekomendacje: Ponieważ lasy separujące dla danych symbolicznych okazały się skutecznym narzędziem w identyfikacji obserwacji odstających, celem przyszłych badań powinno być przeanalizowanie skuteczności tej metody w przypadku rzeczywistych zbiorów danych (np. zbioru dotyczącego oszustw z użyciem kart kredytowych), a także porównanie tej metody z innymi metodami, które pozwalają odnaleźć obserwacje odstające (np. DBSCAN). Autorzy sugerują, by w przypadku lasów separujących dla danych symbolicznych stosować te same parametry, jakie zwykle stosuje się w przypadku lasów losowych dla danych klasycznych. Oryginalność/wartość: Artykuł nie tylko stanowi ujęcie teorii w zakresie obserwacji odstających, ale jednocześnie proponuje, jak zastosować lasy separujące w przypadku danych symbolicznych.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2024, 28, 1; 1-10
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On the method of identification of atypical observations in time series
O metodzie identyfikacji obserwacji nietypowych w szeregach czasowych
Autorzy:
Oesterreich, Maciej
Powiązania:
https://bibliotekanauki.pl/articles/424783.pdf
Data publikacji:
2020
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
forecasts
identification
multiple regression
time series
outliers
prognozy
identyfikacja
regresja wieloraka
szeregi czasowe
obserwacje odstające
Opis:
The paper presents a method of detecting atypical observations in time series with or without seasonal fluctuations. Unlike classical methods of identifying outliers and influential observations, its essence consists in examining the impact of individual observations both on the fitted values of the model and the forecasts. The exemplification of theoretical considerations is the empirical example of modelling and forecasting daily sales of liquid fuels at X gas station in the period 2012-2014. As a predictor, a classic time series model was used, in which 7-day and 12-month cycle seasonality was described using dummy variables. The data for the period from 01.01.2012 to 30.06.2014 were for the estimation period and the second half of 2014 which was the period of empirical verification of forecasts. The obtained results were compared with other classical methods used to identify influential observations and outliers, i.e. standardized residuals, Cook distances and DFFIT. The calculations were carried out in the R environment and the Statistica package.
W pracy zaproponowano metodę wykrywania obserwacji nietypowych w szeregach czasowych z wahaniami sezonowymi oraz bez tych wahań. Jej istota jej polega na badaniu wpływu poszczególnych obserwacji szeregu na wartości teoretyczne modelu oraz wielkości prognoz zbudowanych na jego podstawie. Egzemplifikacją rozważań o charakterze teoretycznym jest przykład empiryczny dotyczący modelowania i prognozowania dziennej sprzedaży paliw płynnych na stacji paliw X w latach 2012-2014. Dane za okres od 1.01.2012 do 30.06.2014 stanowią okres estymacyjny, a za II półrocze 2014 r. okres empirycznej weryfikacji prognoz. Wyniki otrzymane za jej pomocą zostały porównane z wynikami uzyskanymi innymi metodami służącymi do identyfikacji obserwacji wpływowych oraz odstających, w tym m.in.: reszt standaryzowanych, odległości Cooka oraz DFFIT. Obliczenia przeprowadzono w środowisku R oraz pakiecie Statistica.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2020, 24, 2; 1-16
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wykrywanie sygnałów skokowych w szeregach czasowych zmian współrzędnych GPS
Jumping signal detection in GPS coordinate time series
Autorzy:
Kontny, B.
Powiązania:
https://bibliotekanauki.pl/articles/341251.pdf
Data publikacji:
2011
Wydawca:
Uniwersytet Przyrodniczy we Wrocławiu
Tematy:
szeregi czasowe współrzędnych
sygnały skokowe
obserwacje odstające
medianowa metoda różnicowa
coordinate time series
jumping signals
outliers
median difference method
Opis:
W pracy zaprezentowano zmodyfikowaną metodę różnicową wykrywania zmian skokowych w dyskretnych sygnałach pomiarowych (np. szeregach czasowych zmian współrzędnych punktów GPS) w obecności zakłóceń sygnału przypadkowym szumem pomiarowym (white noise) oraz obserwacji odstających (outliers). Metoda polega na zastąpieniu średniej ruchomej w klasycznym algorytmie metody różnicowej poprzez medianę, przez co w znacznym stopniu ogranicza się wpływ obserwacji odstających. Metodę przetestowano na symulowanych sygnałach pomiarowych. Jak wykazały obliczenia testowe, metoda jest skuteczna nawet dla stosunkowo wąskiego okna po stronie obserwacji następujących po testowanej i-tej epoce pomiarowej. Pozwala to na stosunkowo szybkie alarmowanie o zaistnieniu zmiany skokowej o amplitudzie nawet na granicy szumu pomiarowego (3 sigma). Metoda może znaleźć zastosowanie w automatycznych systemach kontrolno-pomiarowych do monitorowania przemieszczeń obiektów inżynierskich wykorzystujących satelitarny system GPS, w szczególności do monitorowania deformacji obiektów hydrotechnicznych, przemysłowych i górniczych.
A modified differencing method of the detection of irregular jumping changes in discrete measuring signals (e.g. time series of changes of coordinate points GPS) in the presence of disruptions of the signal with random measuring noise (white noise) and of accidental diverging observations (outliers) was shown at the work. The method consists in replacing the moving average in the classic algorithm of the differencing method through the median, what to a considerable degree the influence of diverging observation is being limited by. The method was tested on simulated measuring signals. How the test calculations demonstrated, the method is effective even for relatively narrow window on the side of following observations after tested measuring epoch. It allows on relatively fast alarming because of becoming known the irregular change about the amplitude even on the border of measuring noise (3 sigma). The method can find application in automatic control-measuring systems using the satellite system GPS for displacement monitoring of engineering objects, in particular for monitoring of hydro technical, industrial and mining objects’ deformations.
Źródło:
Acta Scientiarum Polonorum. Geodesia et Descriptio Terrarum; 2011, 10, 3; 5-17
1644-0668
Pojawia się w:
Acta Scientiarum Polonorum. Geodesia et Descriptio Terrarum
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Critical values of driver response time and its impact on reducing reliability and safety in road traffic
Krytyczne wartości czasu reakc ji kierowcy i ich wpływ na obniżenie niezawodności i bezpieczeństwa ruchu drogowego
Autorzy:
Kornacki, A.
Wawrzosek, J.
Bochniak, A.
Szymanek, A.
Pawlak, H.
Powiązania:
https://bibliotekanauki.pl/articles/1365618.pdf
Data publikacji:
2017
Wydawca:
Polska Akademia Nauk. Polskie Naukowo-Techniczne Towarzystwo Eksploatacyjne PAN
Tematy:
driver response time
reliability of road traffic
outliers
Akaike information criterion
log-normal
distribution
czas reakcji kierowcy
niezawodność ruchu drogowego
obserwacje odstające
kryterium
informacyjne Akaike
rozkład logarytmiczno-normalny
Opis:
Road traffic is among the most dangerous types of human activity. The main causes of road accidents are driver fatigue, poor physical and mental condition of drivers and overestimating one’s skills while driving. This study focuses on the estimation of driver response time, as the basis of a hypothetical system that uses short and long-range radars, which determines the physical and mental condition of a driver, based on the analysis of „acceleration noise” of the vehicle following its predecessor. This work highlights serious consequences of the fact that driver response time is described by means of a distribution with heavy tails, and thus may be a source of hazard in the driver-vehicle system. Extremes of driver response time were treated as outliers in this study. Their detection was attained by using the Akaike information criterion [1, 2], which is an alternative to conventional methods of testing hypotheses. Untypical, on account of their outlying nature, values are interpreted as critical driver response time values which potentially endanger the reliability of driving.
Ruch drogowy należy do najbardziej niebezpiecznych rodzajów działalności człowieka. Główne przyczyny wypadków drogowych to zmęczenie kierowców, zły stan psychofizyczny kierujących oraz przecenianie swoich umiejętności podczas prowadzenia pojazdu. W niniejszej pracy skupiono uwagę na estymacji czasu reakcji kierowców, jako podstawie hipotetycznego systemu wykorzystującego radary dalekiego i krótkiego zasięgu a określającego stan psychofizyczny kierowcy w oparciu o analizę „szumu przyspieszeń” pojazdu podążającego za poprzednikiem. Wskazuje się na groźne konsekwencje faktu, że czas reakcji kierowcy jest opisywany rozkładem z ciężkimi ogonami, gdyż z tego powodu może być źródłem zagrożenia w układzie kierowca-pojazd. Skrajne wartości czasu reakcji kierowców potraktowano w pracy, jako wartości odstające. Do ich wykrycia zastosowano kryterium informacyjne Akaike [1, 2] co stanowi alternatywę w stosunku do klasycznych metod testowania hipotez. Nietypowe, bo odstające wartości interpretuje się, jako krytyczne czasy reakcji kierowców potencjalnie zagrażające niezawodności jazdy.
Źródło:
Eksploatacja i Niezawodność; 2017, 19, 1; 142-148
1507-2711
Pojawia się w:
Eksploatacja i Niezawodność
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
OCENA ZMIAN STOPNIA ZANIECZYSZCZANIA ŚRODOWISKA W POLSCE W LATACH 2004-2014 PRZY WYKORZYSTANIU PODSTAWOWYCH NARZĘDZI ANALITYCZNYCH
EVALUATION OF CHANGES OF ENVIRONMENTAL POLLUTION DEGREE IN POLAND 2004-2014 USING THE BASIC ANALYTICAL TOOLS
Autorzy:
Koszela, Grzegorz
Szczesny, Wiesław
Powiązania:
https://bibliotekanauki.pl/articles/452915.pdf
Data publikacji:
2016
Wydawca:
Szkoła Główna Gospodarstwa Wiejskiego w Warszawie. Katedra Ekonometrii i Statystyki
Tematy:
ranking
zmienna syntetyczna
unitaryzacja zerowana
przekształcenie ilorazowe
obserwacje odstające
gradacyjna analiza danych
ochrona środowiska
stopień zanieczyszczenia
synthetic variable
unitarisation zeroed
quotient mapping
outliers
grade data analysis
environmental protection
pollution degree
Opis:
W artykule podjęto próbę oceny zmian stopnia zanieczyszczenie środowiska na poziomie województw w latach 2004-2014. Ocenę tą przeprowadzono przy pomocy budowy rankingów województw. Rankingi te utworzono na podstawie zmiennych syntetycznych powstałych w wyniku normalizacji zmiennych metodą unitaryzacji zerowanej oraz przekształcenia ilorazowego. Zwrócono również uwagę na problem obserwacji odstających. Okazuje się, że w zależności od podejścia do tego problemu, można uzyskać znacząco rózniące się wyniki dotyczące grupowania wojwództw w klasy.
The aim of the paper was to attempt to evaluate changes in the degree of pollution at the level of Voivodeships in the years 2004-2014. Assessment was carried out by construction of Voivodeship rankings. These rankings were created on the basis of synthetic variables resulting from the normalization of variables by unitarisation zeroed method and the quotient mapping. It was also paid attention to the problem of outliers. It was proved that depending on the approach to this problem, it can be obtained significantly different results for clustering Voivodeships into classes.
Źródło:
Metody Ilościowe w Badaniach Ekonomicznych; 2016, 17, 3; 95-107
2082-792X
Pojawia się w:
Metody Ilościowe w Badaniach Ekonomicznych
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-8 z 8

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies