Explicit and implicit description of the factors impact on the NO2 concentration in the traffic corridor Jawny i niejawny opis wpływu czynników na stężenie NO2 w kanionie komunikacyjnym
High concentrations of nitrogen dioxide in the air, particularly in heavily urbanized areas, have an
adverse effect on many aspects of residents’ health. A method is proposed for modelling daily average, minimal
and maximal atmospheric NO2 concentrations in a conurbation, using two types of modelling: multiple linear
regression (LR) an advanced data mining technique – Random Forest (RF). It was shown that Random Forest
technique can be successfully applied to predict daily NO2 concentration based on data from 2015–2017 years
and gives better fi t than linear models. The best results were obtained for predicting daily average NO2 values
with R2=0.69 and RMSE=7.47 μg/m3. The cost of receiving an explicit, interpretable function is a much worse fit
(R2 from 0.32 to 0.57). Verification of models on independent material from the first half of 2018 showed the
correctness of the models with the mean average percentage error equal to 16.5% for RF and 28% for LR modelling
daily average concentration. The most important factors were wind conditions and traffic flow. In prediction of
maximal daily concentration, air temperature and air humidity take on greater importance. Prevailing westerly
and south-westerly winds in Wrocław effectively implement the idea of ventilating the city within the studied
intersection. Summarizing: when modeling natural phenomena, a compromise should be sought between the
accuracy of the model and its interpretability.
Celem pracy jest zbadanie możliwości prognozowania dziennego stężenia NO2 za pomocą metody
losowego lasu – RF i porównanie wyników z wielowymiarową regresją liniową (LR) w oparciu o ten sam zestaw
danych. Ponadto zbadano wpływ zwiększenia interpretowalności modelu na jego dokładność.
W pracy przedstawiono dwie metody modelowania dziennych wartości minimalnych, średnich oraz
maksymalnych stężeń NO2 w aglomeracji miejskiej: wielowymiarowa regresja liniowa (LR) oraz losowy las (RF).
Wykazano, że metoda Lasu Losowego (Random Forest) może być skutecznie wykorzystywana do
przewidywania dziennych wartości stężenia NO2. Największą dokładność otrzymano dla przewidywania średnich
wartości dziennych stężenia z R2=0.69 oraz RMSE=7.47 μg/m3. Kosztem otrzymania jawnej postaci funkcji
w modeli liniowym (LR) jest znacząco niższa dokładność przewidywania wartości stężenia (R2 od 0.32 do 0.57).
Weryfikacja modeli na niezależnym materiale z pierwszej połowy 2018 roku potwierdziła poprawność modeli
ze średnim błędem względnym dla średnich wartości dobowych stężeń równym 16.5% dla RF oraz 28% dla LR.
Największy wpływ na stężenia NO2 w kanionie komunikacyjnym ma wiatr oraz natężenie ruchu.
W modelowaniu maksymalnych wartości dobowych nabierają znaczenia temperatura powietrza oraz wilgotność
względna powietrza. Przeważające zachodnie i północno-zachodnie wiatry we Wrocławiu skutecznie realizują
koncepcję przewietrzania miasta w zakresie rozważanego skrzyżowania.
Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies
Informacja
SZANOWNI CZYTELNICY!
UPRZEJMIE INFORMUJEMY, ŻE BIBLIOTEKA FUNKCJONUJE W NASTĘPUJĄCYCH GODZINACH:
Wypożyczalnia i Czytelnia Główna: poniedziałek – piątek od 9.00 do 19.00