- Tytuł:
-
Evaluation of the impact of explanatory variables on the accuracy of prediction of daily inflow to the sewage treatment plant by selected models nonlinear
Ocena wpływu zmiennych objaśniających na dokładność predykcji dobowego dopływu do oczyszczalni ścieków wybranymi modelami nieliniowymi - Autorzy:
-
Szeląg, B.
Bartkiewicz, L.
Studziński, J.
Barbusiński, K. - Powiązania:
- https://bibliotekanauki.pl/articles/205349.pdf
- Data publikacji:
- 2017
- Wydawca:
- Polska Akademia Nauk. Czytelnia Czasopism PAN
- Tematy:
-
wastewater treatment plant
data mining
random forest
forecasting inflow
k-nearest neighbour
Kernel regression
oczyszczalnia ścieków
wydobywanie danych
las losowy
dopływ ścieków
modelowanie
k-najbliższy sąsiad
regresja Kernela - Opis:
-
The aim of the study was to evaluate the possibility of applying different methods of data mining to
model the inflow of sewage into the municipal sewage treatment plant. Prediction models were elaborated using
methods of support vector machines (SVM), random forests (RF), k-nearest neighbour (k-NN) and of Kernel
regression (K). Data consisted of the time series of daily rainfalls, water level measurements in the clarified sewage
recipient and the wastewater inflow into the Rzeszow city plant. Results indicate that the best models with one
input delayed by 1 day were obtained using the k-NN method while the worst with the K method. For the models
with two input variables and one explanatory one the smallest errors were obtained if model inputs were sewage
inflow and rainfall data delayed by 1 day and the best fit is provided using RF method while the worst with the
K method. In the case of models with three inputs and two explanatory variables, the best results were reported
for the SVM and the worst for the K method. In the most of the modelling runs the smallest prediction errors are
obtained using the SVM method and the biggest ones with the K method. In the case of the simplest model with
one input delayed by 1 day the best results are provided using k-NN method and by the models with two inputs in
two modelling runs the RF method appeared as the best.
Celem pracy jest ocena możliwości zastosowania różnych metod data mining do modelowania dopływu ścieków do komunalnej oczyszczalni ścieków. Do opracowania modeli statystycznych metodą wektorów nośnych, lasów losowych, k – najbliższego sąsiada i regresji Kernela wykorzystano szeregi pomiarowe dobowych wartości opadów deszczu, stanów wody w odbiorniku oraz dopływów do komunalnej oczyszczalni ścieków w Rzeszowie. Z obliczeń wykonanych metodami SVM, RF, k-NN i K wynika, że dla modeli z jedną zmienną objaśniającą opóźnioną o dobę w stosunku do wartości dopływu, najlepsze wyniki otrzymano modelem autoregresyjnym bazującym na metodzie k-NN a najgorsze regresją Kernela. W przypadku modeli z dwoma zmiennymi objaśniającymi najmniejsze wartości błędów uzyskano, dla modeli uwzględniających dopływ ścieków i całkowitą wysokość opadu deszczu z jednodobowym opóźnieniem; najlepsze wyniki uzyskano metodą RF a najgorsze regresji Kernela. Dla modeli z dwiema zmiennymi objaśniającymi, ale trzema sygnałami wejściowymi, najmniejsze błędy dopływu ścieków do OŚ uzyskano metodą SVM, a najgorsze regresji Kernela. Z wykonanych symulacji stwierdzono, że w większości przypadków najmniejsze wartości błędów dopływu ścieków do oczyszczalni otrzymano metodą SVM a największe metodą K. W przypadku najprostszego modelu z jednym sygnałem wejściowym opóźnionym o 1 dobę najlepsze wyniki obliczeń uzyskano metodą k-NN, a w dwóch przypadkach modeli, gdzie ujęto 2 sygnały wejściowe, najlepsza okazała się metoda RF. - Źródło:
-
Archives of Environmental Protection; 2017, 43, 3; 74-81
2083-4772
2083-4810 - Pojawia się w:
- Archives of Environmental Protection
- Dostawca treści:
- Biblioteka Nauki