Evaluation of the impact of explanatory variables on the accuracy of prediction of daily inflow to the sewage treatment plant by selected models nonlinear
Evaluation of the impact of explanatory variables on the accuracy of prediction of daily inflow to the sewage treatment plant by selected models nonlinear Ocena wpływu zmiennych objaśniających na dokładność predykcji dobowego dopływu do oczyszczalni ścieków wybranymi modelami nieliniowymi
The aim of the study was to evaluate the possibility of applying different methods of data mining to
model the inflow of sewage into the municipal sewage treatment plant. Prediction models were elaborated using
methods of support vector machines (SVM), random forests (RF), k-nearest neighbour (k-NN) and of Kernel
regression (K). Data consisted of the time series of daily rainfalls, water level measurements in the clarified sewage
recipient and the wastewater inflow into the Rzeszow city plant. Results indicate that the best models with one
input delayed by 1 day were obtained using the k-NN method while the worst with the K method. For the models
with two input variables and one explanatory one the smallest errors were obtained if model inputs were sewage
inflow and rainfall data delayed by 1 day and the best fit is provided using RF method while the worst with the
K method. In the case of models with three inputs and two explanatory variables, the best results were reported
for the SVM and the worst for the K method. In the most of the modelling runs the smallest prediction errors are
obtained using the SVM method and the biggest ones with the K method. In the case of the simplest model with
one input delayed by 1 day the best results are provided using k-NN method and by the models with two inputs in
two modelling runs the RF method appeared as the best.
Celem pracy jest ocena możliwości zastosowania różnych metod data mining do modelowania
dopływu ścieków do komunalnej oczyszczalni ścieków. Do opracowania modeli statystycznych metodą wektorów
nośnych, lasów losowych, k – najbliższego sąsiada i regresji Kernela wykorzystano szeregi pomiarowe dobowych
wartości opadów deszczu, stanów wody w odbiorniku oraz dopływów do komunalnej oczyszczalni ścieków
w Rzeszowie. Z obliczeń wykonanych metodami SVM, RF, k-NN i K wynika, że dla modeli z jedną zmienną
objaśniającą opóźnioną o dobę w stosunku do wartości dopływu, najlepsze wyniki otrzymano modelem autoregresyjnym
bazującym na metodzie k-NN a najgorsze regresją Kernela. W przypadku modeli z dwoma zmiennymi
objaśniającymi najmniejsze wartości błędów uzyskano, dla modeli uwzględniających dopływ ścieków i całkowitą
wysokość opadu deszczu z jednodobowym opóźnieniem; najlepsze wyniki uzyskano metodą RF a najgorsze regresji
Kernela. Dla modeli z dwiema zmiennymi objaśniającymi, ale trzema sygnałami wejściowymi, najmniejsze
błędy dopływu ścieków do OŚ uzyskano metodą SVM, a najgorsze regresji Kernela. Z wykonanych symulacji
stwierdzono, że w większości przypadków najmniejsze wartości błędów dopływu ścieków do oczyszczalni otrzymano
metodą SVM a największe metodą K. W przypadku najprostszego modelu z jednym sygnałem wejściowym
opóźnionym o 1 dobę najlepsze wyniki obliczeń uzyskano metodą k-NN, a w dwóch przypadkach modeli, gdzie
ujęto 2 sygnały wejściowe, najlepsza okazała się metoda RF.
Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies
Informacja
SZANOWNI CZYTELNICY!
UPRZEJMIE INFORMUJEMY, ŻE BIBLIOTEKA FUNKCJONUJE W NASTĘPUJĄCYCH GODZINACH:
Wypożyczalnia i Czytelnia Główna: poniedziałek – piątek od 9.00 do 19.00