Temat: dane brakujace - Katalog OPAC zbiorów

Skocz do pozycji: 1.

Tytuł:: Empirical Evaluation of Methods of Filling the Missing Data in Learning Probabilistic Models
Porównanie metod uzupełniania danych brakujących w uczeniu modeli probabilistycznych
Autorzy:: Falkowski, A. A.
Łupińska-Dubicka, A.
Powiązania:: https://bibliotekanauki.pl/articles/88374.pdf
Data publikacji:: 2018
Wydawca:: Politechnika Białostocka. Oficyna Wydawnicza Politechniki Białostockiej
Tematy:: dane brakujące
model probabilistyczny
sieci Bayesa
klasyfikacja
missing data
probabilistic models
Bayesian networks
classification
Opis:: Missing data is a common problem in statistical analysis and most practical databases contain missing values of some of their attributes. Missing data can appear for many reasons. However, regardless of the reason for the missing values, even a small percent of missing data can cause serious problems with analysis reducing the statistical power of a study and leading to draw wrong conclusions. In this paper the results of handling missing observations in learning probabilistic models were presented. Two data sets taken from UCI Machine Learning Repository were used to learn the quantitative part of the Bayesian networks. To provide the opportunity to compare selected data sets did not contain any missing values. For each model data sets with variety of levels of missing values were artificially generated. The main goal of this paper was to examine whether omitting observations has an influence on model’s reliability. The accuracy was defined as the percentage of correctly classified records and has been compared to the results obtained in the data set not containing missing values.
Brakujące dane są częstym problemem w analizie statystycznej, a większość baz danych zawiera brakujące wartości niektórych z ich atrybutów. Brakujące dane mogą pojawiać się z wielu powodów. Jednak bez względu na przyczynę brakujących wartości nawet ich niewielki procent może spowodować poważne problemy z analizą, zmniejszając siłę statystyczną badania i prowadząc do wyciągnięcia błędnych wniosków. W artykule przedstawiono wyniki uzupełniania danych brakujących w uczeniu modeli probabilistycznych. Dwa zestawy danych pobrane z repozytorium uczenia maszynowego UCI posłużyły do wytrenowania ilościowej części sieci bayesowskich. Aby zapewnić możliwość porównania wybrane zbiory danych nie zawierały żadnych brakujących wartości. Dla każdego modelu zbiory danych z różnymi poziomami brakujących wartości zostały sztucznie wygenerowane. Głównym celem tego artykułu było zbadanie, czy braki w obserwacjach mają wpływ na niezawodność modelu. Dokładność została zdefiniowana jako procent poprawnie zaklasyfikowanych rekordów i została porównana z wynikami uzyskanymi w zbiorze danych niezawierającym brakujących wartości.
Źródło:: Advances in Computer Science Research; 2018, 14; 55-67
2300-715X
Pojawia się w:: Advances in Computer Science Research
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 2.

Tytuł:: Wykorzystanie metod numerycznych w prognozowaniu brakujących danych w szeregach czasowych z sezonowością
Application numerical methods in predicting missing data in seasonal time series
Autorzy:: Oesterreich, M.
Powiązania:: https://bibliotekanauki.pl/articles/78665.pdf
Data publikacji:: 2010
Wydawca:: Zachodniopomorski Uniwersytet Technologiczny w Szczecinie. Wydawnictwo Uczelniane ZUT w Szczecinie
Tematy:: dane brakujace
prognozowanie
metody numeryczne
metoda odcinkowa
metoda lukow
modelowanie ekonometryczne
sezonowosc
szeregi czasowe
prognozy ekstrapolacyjne
Opis:: The following study presents the empirical analysis of the numeric methods in forecasting in conditions of lack of full information. In forecasting the following methods were used: segment, two variants of curves methods, and four variants of Lagrange methods. In analysis are used the average relative forecast errors in six variants of blanks. This study is an attempt to answer a question, whether the amount and distribution of blanks affect the quality of forecasts.
Źródło:: Folia Pomeranae Universitatis Technologiae Stetinensis. Oeconomica; 2010, 59
2081-0644
Pojawia się w:: Folia Pomeranae Universitatis Technologiae Stetinensis. Oeconomica
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 3.

Tytuł:: The problem of imputation of the missing data from the continuous counts of road traffic
Autorzy:: Spławińska, M.
Powiązania:: https://bibliotekanauki.pl/articles/231354.pdf
Data publikacji:: 2015
Wydawca:: Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:: ruch drogowy
zbiór danych
przypisanie
dane brakujące
model SARIMA
road traffic
data collection
imputation
missing data
SARIMA model
Opis:: Missing traffic data is an important issue for road administration. Although numerous ways can be found to impute them in foreign literature (inter alia, the most effective method, that is Box-Jenkins models), in Poland, still only proven and simplified methods are applied. The article presents the analyses including an assessment of the completeness of the existing traffic data and works related to the construction of SARIMA model. The study was conducted on the basis of hourly traffic volumes, derived from the continuous traffic counts stations located in the national road network in Poland (Golden River stations) from the years 2005 – 2010. As a result, the proposed model was used to impute the missing data in the form of SARIMA (1.1,1)(0,1,1)168. The newly developed model can be used effectively to fill in the missing required days of measurement for estimating AADT by AASHTO method. In other cases, due to its accuracy and laboriousness of the process, it is not recommended.
Źródło:: Archives of Civil Engineering; 2015, 61, 1; 131-145
1230-2945
Pojawia się w:: Archives of Civil Engineering
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 4.

Tytuł:: Wykorzystanie programu R w prognozowaniu na podstawie modeli przyczynowo-opisowych w warunkach braku pełnej informacji
Application of R-environment and descriptive models in forecasting in conditions of the lack of full information
Autorzy:: Oesterreich, M.
Powiązania:: https://bibliotekanauki.pl/articles/78711.pdf
Data publikacji:: 2012
Wydawca:: Zachodniopomorski Uniwersytet Technologiczny w Szczecinie. Wydawnictwo Uczelniane ZUT w Szczecinie
Tematy:: informacja
braki informacyjne
ekonometria
dane brakujace
prognozowanie matematyczne
szeregi czasowe
modele przyczynowo-opisowe
prognozy ekstrapolacyjne
prognozy interpolacyjne
analiza danych
program R
Źródło:: Folia Pomeranae Universitatis Technologiae Stetinensis. Oeconomica; 2012, 68
2081-0644
Pojawia się w:: Folia Pomeranae Universitatis Technologiae Stetinensis. Oeconomica
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 5.

Tytuł:: MODELE HARMONICZNE ZE ZŁOŻONĄ SEZONOWOŚCIĄ W PROGNOZOWANIU SZEREGÓW CZASOWYCH Z LUKAMI SYSTEMATYCZNYMI
HARMONICAL MODELS WITH COMPLEX SEASONALITY IN FORECASTING TIME SERIES WITH SYSTEMATIC GAPS
Autorzy:: Szmuksta-Zawadzka, Maria
Zawadzki, Jan
Powiązania:: https://bibliotekanauki.pl/articles/453180.pdf
Data publikacji:: 2013
Wydawca:: Szkoła Główna Gospodarstwa Wiejskiego w Warszawie. Katedra Ekonometrii i Statystyki
Tematy:: modele harmoniczne
sezonowość złożona
brakujące dane
harmonic models
complex seasonality
missing data
Opis:: W modelowaniu zmiennych ze złożoną sezonowością dla pełnych danych i danych z lukami niesystematycznymi mogą być wykorzystywane zarówno modele ze zmiennymi zero-jedynkowymi jak i modele harmoniczne. Natomiast w przypadku występowania luk systematycznych- jedynie oszczędne modele harmoniczne. W modelach tych każdy rodzaj wahań opisywany jest za pomocą odrębnych zestawów składowych sinuso- i kosinusoidalnych. Rozważania teoretyczne zostaną zilustrowane przykładem empirycznym.
In the modeling of the variables with complex seasonality for complete time series and with unsystematic data gaps can be used both types of models: with dummy variables and harmonic models. However, in modeling variable with systematic gaps can be used only harmonic models. In these models, each type of fluctuation is described by separate sets of sine- and cosine component. Theoretical considerations are illustrated by an empirical example.
Źródło:: Metody Ilościowe w Badaniach Ekonomicznych; 2013, 14, 3; 81-90
2082-792X
Pojawia się w:: Metody Ilościowe w Badaniach Ekonomicznych
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 6.

Tytuł:: Z badań nad metodami prognozowania na podstawie niekompletnych szeregów czasowych z wahaniami okresowymi (sezonowymi)
Studies of methods applied to forecasting incomplete data in seasonal time series
Autorzy:: Szmuksta-Zawadzka, Maria
Zawadzki, Jan
Powiązania:: https://bibliotekanauki.pl/articles/422819.pdf
Data publikacji:: 2012
Wydawca:: Główny Urząd Statystyczny
Tematy:: szeregi czasowe
wahania sezonowe
brakujące dane
prognozowanie
time series
seasonal fluctuations
missing data
forecasting
Opis:: Praca została poświęcona syntetycznemu omówieniu wyników wieloletnich badań autorów nad zastosowaniami metod prognozowania w warunkach braku pełnej informacji w szeregach czasowych z wahaniami sezonowymi. Rozważania odnosić się będą do dwóch rodzajów luk w danych: systematycznych i niesystematycznych. Z lukami systematycznymi mamy do czynienia wtedy, gdy nie są dostępne informacje liczbowe przynajmniej o jednym podokresie w całym przedziale czasowym „próby”. Rozpatrywane będą metody prognozowania zarówno dla danych oryginalnych (z sezonowością) jak i danych, z których wyeliminowano wahania sezonowe. Egzemplifikacją rozważań o charakterze teoretycznym będzie przykład empiryczny.
This work presents discussion about results of long-term of authors research on applications of different forecasting methods in condition of lack of full information. There will be considered two types of gaps in data: systematic and unsystematic. The systematic gaps in data are only when we have not any information about at least one sub-period in the whole of analyzed data. There will be presented two types of methods applied to time series with and without seasonal component. Exemplification of theoretical considerations will be an empirical example.
Źródło:: Przegląd Statystyczny; 2012, 59, numer specjalny 1; 140-154
0033-2372
Pojawia się w:: Przegląd Statystyczny
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 7.

Tytuł:: ZASTOSOWANIE WYBRANYCH MODELI ADAPTACYJNYCH W PROGNOZOWANIU BRAKUJĄCYCH DANYCH W SZEREGACH ZE ZŁOŻONĄ SEZONOWOŚCIĄ DLA LUK NIESYSTEMATYCZNYCH
THE APPLICATION OF SELECTED ADAPTATION MODELS IN FORECASTING THE MISSING DATA IN THE TIME SERIES WITH COMPLEX SEASONALITY FOR UNSYSTEMATIC GAPS
Autorzy:: Szmuksta- Zawadzka, Maria
Zawadzki, Jan
Powiązania:: https://bibliotekanauki.pl/articles/453279.pdf
Data publikacji:: 2014
Wydawca:: Szkoła Główna Gospodarstwa Wiejskiego w Warszawie. Katedra Ekonometrii i Statystyki
Tematy:: złożona sezonowość
wyrównywanie wykładnicze
prognozowanie
brakujące dane
complex seasonality
exponential smoothing
forecasting
gaps in data
Opis:: Artykuł poświęcony jest wykorzystaniu wybranych modeli wyrównywania wykładniczego: Browna, Holta i Holta-Wintersa w prognozowaniu zmiennych ze złożona sezonowością w warunkach braku pełnej informacji. Prognozy wyjściowe będą budowane na podstawie szeregów oczyszczonych z sezonowości. Prognozy końcowe, uwzględniające wahania sezonowe, będą sumami prognoz wyjściowych i składników sezonowości lub iloczynami prognoz tego rodzaju i wskaźników sezonowości. Rozważania o charakterze teoretycznym zostaną zilustrowane przykładem empirycznym.
The paper is devoted to the application of selected exponential smoothing models: Brown, Holt and Holt-Winters in prediction of variables with complex seasonality in the condition of lack of full information. Output forecasts will be built on the basis of time series cleansed from seasonality. Final forecasts, taking into account seasonal fluctuations, will be a sum of output forecasts and seasonal components or multiply of forecasts and the seasonal indicators. Theoretical considerations will be illustrated by an empirical example.
Źródło:: Metody Ilościowe w Badaniach Ekonomicznych; 2014, 15, 4; 181-194
2082-792X
Pojawia się w:: Metody Ilościowe w Badaniach Ekonomicznych
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 8.

Tytuł:: On classification with missing data using rough-neuro-fuzzy systems
Autorzy:: Nowicki, R. K.
Powiązania:: https://bibliotekanauki.pl/articles/907774.pdf
Data publikacji:: 2010
Wydawca:: Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:: zbiór rozmyty
struktura neuronowo-rozmyta
klasyfikacja
brakujące dane
fuzzy sets
neuro-fuzzy architectures
classification
missing data
Opis:: The paper presents a new approach to fuzzy classification in the case of missing data. Rough-fuzzy sets are incorporated into logical type neuro-fuzzy structures and a rough-neuro-fuzzy classifier is derived. Theorems which allow determining the structure of the rough-neuro-fuzzy classifier are given. Several experiments illustrating the performance of the roughneuro-fuzzy classifier working in the case of missing features are described.
Źródło:: International Journal of Applied Mathematics and Computer Science; 2010, 20, 1; 55-67
1641-876X
2083-8492
Pojawia się w:: International Journal of Applied Mathematics and Computer Science
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 9.

Tytuł:: Influence of missing data imputation method on the classification accuracy of the medical data
Autorzy:: Orczyk, T.
Porwik, P.
Powiązania:: https://bibliotekanauki.pl/articles/334037.pdf
Data publikacji:: 2013
Wydawca:: Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Tematy:: medical data analysis
missing data
data imputation
classification efficiency
analiza danych medycznych
brakujące dane
przypisanie danych
efektywność klasyfikacji
Opis:: Aim of this study is to show the dangers of filling missing data - particularly medical data. Because there are many dedicated medical expert systems and medical decision support systems, a special attention must be paid on the construction of classifiers. Medical data are almost never complete, and completion of the missing data requires a special care. The safest approach of dealing with missing data would be removing records with missing parameters and/or removing parameters that are missing in the records. Unfortunately reducing data set that is already very small is not always an option. Dangers coming out from data imputation are shown in the article, which presents the influence of selected missing data filling algorithms on the classification accuracy.
Źródło:: Journal of Medical Informatics & Technologies; 2013, 22; 111-116
1642-6037
Pojawia się w:: Journal of Medical Informatics & Technologies
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 10.

Tytuł:: Klasyfikacja luk pomiarowych w danych rejestrowanych na stacjach monitoringu powietrza
Classification of air monitoring data gaps
Autorzy:: Hoffman, S.
Jasiński, R.
Powiązania:: https://bibliotekanauki.pl/articles/297005.pdf
Data publikacji:: 2009
Wydawca:: Politechnika Częstochowska. Wydawnictwo Politechniki Częstochowskiej
Tematy:: zanieczyszczenia powietrza
monitoring automatyczny
dane
stężenia chwilowe
brakujące dane
luki pomiarowe
klasyfikacja
air monitoring
hourly concentrations
monitoring data
air pollution
missing data
measure gaps
classification
Opis:: Rejestrowane na stacjach monitoringu powietrza zbiory danych nigdy nie są kompletne. W skali roku liczba odnotowywanych braków jest zmienna. Ocena jakości powietrza na podstawie niepełnych pomiarów jest utrudniona. Obowiązujące przepisy prawne dopuszczają możliwość wykorzystania modelowania w celu uzupełnienia brakujących danych. Rozpoznanie typowych struktur obszarów z brakującymi danymi umożliwia ich klasyfikację, a następnie rekomendację odpowiednich metod modelowania dla wyszczególnionych klas. Celem badań było wytypowanie charakterystycznych struktur luk pomiarowych w zbiorach danych i określenie częstości ich występowania. Klasyfikację przypadków z brakującymi danymi zaproponowano na podstawie przeglądu wieloletnich danych, pochodzących z kilku różnych stacji pomiarowych automatycznego monitoringu powietrza. Analizowano serie czasowe chwilowych stężeń podstawowych zanieczyszczeń powietrza (O3, NO2, NO, PM10, SO2, CO), zarejestrowanych w latach 2004-2008 na stacjach monitoringu powietrza Warszawa-Ursynów, Radom, Łódź-Widzew, Piotrków Trybunalski. Na podstawie wyników przeprowadzonej analizy można stwierdzić, że brakujące dane występują powszechnie w zbiorach danych pochodzących z monitoringu powietrza. Częstość ich występowania w rocznych seriach pomiarowych może wynosić od kilku do nawet kilkudziesięciu procent. Większość luk pomiarowych jest krótka - stanowią je głównie pojedyncze przypadki. Zdecydowanie rzadziej występują bloki brakujących danych, przekraczające 3-4 przypadki (dłuższe od 3-4 godzin). Największą częstość występowania przypadków z niezarejestrowanymi wynikami odnotowano dla luk najdłuższych, obejmujących więcej niż 24 przypadki (>24 godziny).
The data gathered continuously in the air monitoring systems are never entire. In the whole year, the number of missing records is changeable. The deficiency of data could result in uncertainty of a statistical assessment, required by the air quality standards, and cause the uselessness of monitoring measurements. Air quality standards permit to use modelling in order to recreate the missing data when the completeness of the monitoring set is not sufficient. Applied modelling methods should guarantee possibly the best precision to achieve the air quality assessment being closest to reality. Single, specified method does not assure the maximal accuracy because the missing data in data matrix may create gaps of various shapes and ranges. Recognition of typical structures of missing data fields should be the base of their classification. For the specified classes of gaps the optimum modelling methods may be recommended and assigned. The main objective of the analysis was to select typical patterns of gaps in air monitoring data matrixes, and the assessment of their appearing. The missing data classification was suggested after long-term data survey. The analyzed data sets derived from 4 different air monitoring sites in the Central Poland (Warsaw-Ursynów, Radom, Lodz-Widzew, Piotrków Trybunalski). The data were gathered in the period 2004-2008. The examined time-series involved hourly concentrations of main air pollutants: O3, NO2, NO, PM10, SO2, CO. The results allow coming to some general conclusions. Missing data commonly occur in sets of air monitoring records. Gaps may include up to several or even more per cent of all expected data in yearly measuring series. For all air pollutants, the most of the gaps in monitoring time series are very short. Single (1-hour) missing values dominate among gaps of different length. Gaps lengths exceeding 3-4 hours are observed occasionally. However, the greatest frequency of single without-data cases appearing is observed in the longest gaps (>24 hours), because of their lengths.
Źródło:: Inżynieria i Ochrona Środowiska; 2009, 12, 2; 101-117
1505-3695
2391-7253
Pojawia się w:: Inżynieria i Ochrona Środowiska
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 11.

Tytuł:: Aproksymacja stężeń zanieczyszczeń powietrza za pomocą neuronowych modeli szeregów czasowych
Aproximation of air monitoring data gaps by means of time-series neural models
Autorzy:: Hoffman, S.
Powiązania:: https://bibliotekanauki.pl/articles/297640.pdf
Data publikacji:: 2009
Wydawca:: Politechnika Częstochowska. Wydawnictwo Politechniki Częstochowskiej
Tematy:: szereg czasowy
modele neuronowe
stężenia chwilowe
dane monitoringu
brakujące dane
luki pomiarowe
aproksymacja
time series
neural models
air pollution
air monitoring
hourly concentrations
monitoring data
missing data
measure gaps
approximation
Opis:: W pracy oceniono możliwości aproksymacji stężeń zanieczyszczeń mierzonych na stacjach monitoringu powietrza. Do predykcji stężeń wykorzystano neuronowe modele szeregów czasowych. Jakość modelowania testowano na rzeczywistych danych pochodzących ze stacji monitoringu powietrza Łódź-Widzew, zarejestrowanych w latach 2004-2008. Analizie poddano względnie kompletny zbiór danych, obejmujący stężenia 6 podstawowych zanieczyszczeń powietrza: O3, NO2, NO, PM10, SO2, CO. Celem badawczym było określenie i porównanie dokładności predykcji stężeń różnych zanieczyszczeń powietrza. Modelowanie przeprowadzono, stosując sztuczne sieci neuronowe. Trening sieci odbywał się przy użyciu liniowego algorytmu pseudoinwersji. Wyjściem modelu było stężenie wybranego zanieczyszczenia w określonym czasie. Wejściami były wartości stężeń zarejestrowane w godzinach wcześniejszych. Każdy model charakteryzowały dwie wielkości: horyzont prognozy i liczba wartości opóźnionych. W analizie określono dokładność predykcji stężeń wybranych zanieczyszczeń dla stałej liczby wartości opóźnionych równej 24 przy zmieniającym się horyzoncie prognozy od 1 do 240 godz. Jako kryterium jakości modelowania przyjęto wartość błędu aproksymacji.
An assessment of quality of air pollutants concentration modeling was the main research purpose. The examination was made by means of artificial neural networks, which were employed to create time-series models. The quality of approximation was tested on the actual set of air monitoring data, gathered over a 5-year period at the measure site in Lodz-Widzew (Central Poland). The examined time-series involved hourly concentrations of main air pollutants: O3, NO2, NO, PM10, SO2, CO. The research aim was the estimation and the comparison of prediction accuracy for different air pollutants. Time-series models were characterized by two parameters which might influence the prediction quality: lookahead and steps. For all models the constant number of steps equal 24 hours was assumed. The effect of changes of lookahead in the range 1÷ 240 hours was analyzed. It was stated that the decreasing of precision of time-series models with the increase of lookahead is observed. The drop of accuracy depends on pollutant. The furthest reasonable prognosis may be done for ozone concentration. Approximation accuracy shortens in the order: O3, CO, SO2, PM10, NO2, NO.
Źródło:: Inżynieria i Ochrona Środowiska; 2009, 12, 3; 231-239
1505-3695
2391-7253
Pojawia się w:: Inżynieria i Ochrona Środowiska
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 12.

Tytuł:: Classifiers accuracy improvement based on missing data imputation
Autorzy:: Jordanov, I.
Petrov, N.
Petrozziello, A.
Powiązania:: https://bibliotekanauki.pl/articles/91626.pdf
Data publikacji:: 2018
Wydawca:: Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:: machine learning
missing data
model-based imputation
neural networks
random forests
support vector machine
radar signal classification
nauczanie maszynowe
brakujące dane
sieci neuronowe
maszyna wektorów nośnych
klasyfikacja sygnałów radarowych
Opis:: In this paper we investigate further and extend our previous work on radar signal identification and classification based on a data set which comprises continuous, discrete and categorical data that represent radar pulse train characteristics such as signal frequencies, pulse repetition, type of modulation, intervals, scan period, scanning type, etc. As the most of the real world datasets, it also contains high percentage of missing values and to deal with this problem we investigate three imputation techniques: Multiple Imputation (MI); K-Nearest Neighbour Imputation (KNNI); and Bagged Tree Imputation (BTI). We apply these methods to data samples with up to 60% missingness, this way doubling the number of instances with complete values in the resulting dataset. The imputation models performance is assessed with Wilcoxon’s test for statistical significance and Cohen’s effect size metrics. To solve the classification task, we employ three intelligent approaches: Neural Networks (NN); Support Vector Machines (SVM); and Random Forests (RF). Subsequently, we critically analyse which imputation method influences most the classifiers’ performance, using a multiclass classification accuracy metric, based on the area under the ROC curves. We consider two superclasses (‘military’ and ‘civil’), each containing several ‘subclasses’, and introduce and propose two new metrics: inner class accuracy (IA); and outer class accuracy (OA), in addition to the overall classification accuracy (OCA) metric. We conclude that they can be used as complementary to the OCA when choosing the best classifier for the problem at hand.
Źródło:: Journal of Artificial Intelligence and Soft Computing Research; 2018, 8, 1; 31-48
2083-2567
2449-6499
Pojawia się w:: Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 13.

Tytuł:: Porównanie dokładności różnych metod predykcji stężeń zanieczyszczeń powietrza
A comparison of accuracies of different air pollutants concentration prediction methods
Autorzy:: Hoffman, S.
Jasiński, R.
Powiązania:: https://bibliotekanauki.pl/articles/297662.pdf
Data publikacji:: 2009
Wydawca:: Politechnika Częstochowska. Wydawnictwo Politechniki Częstochowskiej
Tematy:: zanieczyszczenia powietrza
monitoring powietrza
stężenia chwilowe
dane monitoringu
brakujące dane
luki pomiarowe
aproksymacja
modele szeregów czasowych
modele regresyjne
sieci neuronowe
air monitoring
hourly concentrations
monitoring data
air pollution
missing data
measure gaps
approximation
time series models
regression models
neural networks
Opis:: W analizie wykorzystano dane zarejestrowane w latach 2004-2008 na ośmiu stacjach monitoringu powietrza działających w różnych miejscowościach województw łódzkiego i mazowieckiego. W pracy badano możliwości aproksymacji stężeń zanieczyszczeń mierzonych na stacjach monitoringu powietrza. Ocenę jakości modelowania wykonano poprzez porównanie modelowanych stężeń ze stężeniami rzeczywistymi. Do predykcji stężeń wykorzystano sieci neuronowe. Porównywano dokładność pięciu różnych grup modeli: modeli szeregów czasowych, liniowych modeli regresji wielowymiarowej, nieliniowych modeli regresji wielowymiarowej, liniowych modeli regresji wielowymiarowej eksplorujących dane pochodzące z sąsiednich stacji monitoringu i nieliniowych modeli regresji wielowymiarowej eksplorujących dane pochodzące z sąsiednich stacji monitoringu. Celem praktycznym była rekomendacja optymalnych technik modelowania luki pomiarowej obejmującej pewien dłuższy fragment serii czasowej tylko jednego z zanieczyszczeń powietrza przy założeniu, że są dostępne wszystkie pozostałe dane, w tym dane pochodzące z sąsiednich stacji monitoringu powietrza. Wykonana analiza wykazała, że dla każdego z zanieczyszczeń powietrza należy rekomendować inne metody predykcji, ponieważ występują duże różnice w możliwościach modelowania poszczególnych zanieczyszczeń powietrza. Stężenia takich zanieczyszczeń, jak O3, SO2, PM10 można efektywnie modelować metodą szeregów czasowych, ale tylko do pewnego horyzontu prognozy, po którym regresyjne metody modelowania okazują się dokładniejsze. W modelowaniu stężeń O3 i PM10 efektywne może się okazać wykorzystanie stężeń tych zanieczyszczeń zarejestrowanych na innych stacjach monitoringu powietrza. W przypadku pozostałych zanieczyszczeń NO, NO2 i CO zasadne jest stosowanie tylko jednej metody modelowania - analizy regresji. Liniowe modele regresyjne są mniej dokładne od ich nieliniowych odpowiedników. Różnice dokładności obu typów modeli nie zawsze są duże. Dlatego modele liniowe mogą stanowić praktyczną alternatywę dla nieliniowych odpowiedników.
Air monitoring data collected over a 5-year period at 8 different measure sites in Central Poland were used as the database for analysis purposes. Approximation of concentrations of monitored air pollutants were done by means of several prediction methods: time series analysis, regression analysis with predictors from a single monitoring station, and regression analysis with external predictors. Separate models were created for O3, NO2, NO, PM10, SO2, CO. Modelled and measured concentrations were compared. As a result prediction errors were calculated for each model. The main objective of analysis was a comparison of prediction results, and recommendation the most accurate modelling methods, dedicated to specified pollutants. The examination was made by means of artificial neural networks, which were employed to create all types of models.
Źródło:: Inżynieria i Ochrona Środowiska; 2009, 12, 4; 307-325
1505-3695
2391-7253
Pojawia się w:: Inżynieria i Ochrona Środowiska
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Informacja

Wyszukujesz frazę "dane brakujace" wg kryterium: Temat

Źródło danych

Dostawca treści

Kolekcja

Rok wydania

Wydawca

Temat

Autor

Typ dokumentu

Język