Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "data imputation" wg kryterium: Temat


Wyświetlanie 1-5 z 5
Tytuł:
Comparison of incomplete data handling techniques for neuro-fuzzy systems
Autorzy:
Sikora, M.
Simiński, K.
Powiązania:
https://bibliotekanauki.pl/articles/305722.pdf
Data publikacji:
2014
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
incomplete data
marginalization
imputation
neuro-fuzzy system
ANNBFIS
PDS
IFCM
OCS
NPS
Opis:
Real-life data sets sometimes miss some values. The incomplete data needs specialized algorithms or preprocessing that allows the use of the algorithms for complete data. The paper presents a comparison of various techniques for handling incomplete data in the neuro-fuzzy system ANNBFIS. The crucial procedure in the creation of a fuzzy model for the neuro-fuzzy system is the partition of the input domain. The most popular approach (also used in the ANNBFIS) is clustering. The analyzed approaches for clustering incomplete data are: preprocessing (marginalization and imputation) and specialized clustering algorithms (PDS, IFCM, OCS, NPS). The objective of our research is the comparison of the preprocessing techniques and specialized clustering algorithms to find the the most-advantageous technique for handling incomplete data with a neuro-fuzzy system. This approach is also the indirect validation of clustering.
Źródło:
Computer Science; 2014, 15 (4); 441-458
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The problem of imputation of the missing data from the continuous counts of road traffic
Autorzy:
Spławińska, M.
Powiązania:
https://bibliotekanauki.pl/articles/231354.pdf
Data publikacji:
2015
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
ruch drogowy
zbiór danych
przypisanie
dane brakujące
model SARIMA
road traffic
data collection
imputation
missing data
SARIMA model
Opis:
Missing traffic data is an important issue for road administration. Although numerous ways can be found to impute them in foreign literature (inter alia, the most effective method, that is Box-Jenkins models), in Poland, still only proven and simplified methods are applied. The article presents the analyses including an assessment of the completeness of the existing traffic data and works related to the construction of SARIMA model. The study was conducted on the basis of hourly traffic volumes, derived from the continuous traffic counts stations located in the national road network in Poland (Golden River stations) from the years 2005 – 2010. As a result, the proposed model was used to impute the missing data in the form of SARIMA (1.1,1)(0,1,1)168. The newly developed model can be used effectively to fill in the missing required days of measurement for estimating AADT by AASHTO method. In other cases, due to its accuracy and laboriousness of the process, it is not recommended.
Źródło:
Archives of Civil Engineering; 2015, 61, 1; 131-145
1230-2945
Pojawia się w:
Archives of Civil Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Computer-Intensive Methods in Traffic Safety Research
Autorzy:
Harold, S.
Powiązania:
https://bibliotekanauki.pl/articles/90673.pdf
Data publikacji:
2002
Wydawca:
Centralny Instytut Ochrony Pracy
Tematy:
data analysis
errors
screening
missing values
unknown values
imputation
data mining
analiza komputerowa
komputer
archiwa
bezpieczeństwo ruchu drogowego
analiza danych
Opis:
The analysis of traffic safety data archives has improved markedly with the development of procedures that are heavily dependent upon computers. Three such procedures are described here. The first procedure involves using computers to assist in the identification and correction of invalid data. The second procedure makes greater computational demands, and involves using computerized algorithms to fill in the ‘‘gaps’’ that typically occur in archival data when information regarding key variables is not available. The third and most computer-intensive procedure involves using data mining techniques to search archives for interesting and important relationships between variables. These procedures are illustrated using examples from data archives that describe the characteristics of traffic accidents in the USA and Australia.
Źródło:
International Journal of Occupational Safety and Ergonomics; 2002, 8, 3; 353-363
1080-3548
Pojawia się w:
International Journal of Occupational Safety and Ergonomics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Missing data estimation based on the chaining technique in survey sampling
Autorzy:
Singh Thakur, Narendra
Shukla, Diwakar
Powiązania:
https://bibliotekanauki.pl/articles/2156986.pdf
Data publikacji:
2022-12-15
Wydawca:
Główny Urząd Statystyczny
Tematy:
estimation
missing data
chaining
imputation
bias
mean squared error (MSE)
factor type (F-T)
chain type estimator
double sampling
Opis:
Sample surveys are often affected by missing observations and non-response caused by the respondents' refusal or unwillingness to provide the requested information or due to their memory failure. In order to substitute the missing data, a procedure called imputation is applied, which uses the available data as a tool for the replacement of the missing values. Two auxiliary variables create a chain which is used to substitute the missing part of the sample. The aim of the paper is to present the application of the Chain-type factor estimator as a means of source imputation for the non-response units in an incomplete sample. The proposed strategies were found to be more efficient and bias-controllable than similar estimation procedures described in the relevant literature. These techniques could also be made nearly unbiased in relation to other selected parametric values. The findings are supported by a numerical study involving the use of a dataset, proving that the proposed techniques outperform other similar ones.
Źródło:
Statistics in Transition new series; 2022, 23, 4; 91-111
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Digital population and housing census - the experience of Serbia
Cyfrowy powszechny spis ludności i mieszkań – przykład Serbii
Autorzy:
Kovačević, Miladin
Nikić, Mira
Josipović, Branko
Lakčević, Snežana
Pantelić, Vesna
Mitrović, Nevena
Kolaković, Adil
Korovićh, Petar
Powiązania:
https://bibliotekanauki.pl/articles/28408260.pdf
Data publikacji:
2023-10-31
Wydawca:
Główny Urząd Statystyczny
Tematy:
2022 Census of Population
Households and Dwellings
digital census
geospatial data
monitoring system
machine learning
administrative data
record linkage
imputation
statistical population register
Serbia
Powszechny Spis Ludności
Gospodarstw Domowych i Mieszkań 2022
spis cyfrowy
dane geoprzestrzenne
system monitorujący
uczenie maszynowe
dane administracyjne
łączenie rekordów
imputacja
statystyczna ewidencja ludności
Opis:
The aim of the paper is to present the experience of the Republic of Serbia in conducting the 2022 Census of Population, Households and Dwellings, focusing on the employment, legal framework and financing of the census as well as on its successful implementation. It discusses strategic decisions on data collection and the integration of information technology - including geospatial data, data collection techniques, machine learning, record linkage and monitoring system - to overcome the challenges posed by the census. The paper addresses the census undercoverage, explores the use of administrative data for item imputation, and examines the development of a statistical population register. The study demonstrates the benefits of adopting a digital-census approach: significant improvement of accuracy, cost reduction and acquired expeditiousness. The Statistical Office of the Republic of Serbia conducted a digital census combined with traditional methods, excluding self-enumeration, along with the use of administrative data for item imputation, and recommends this approach as the most effective way to obtain precise and comprehensive information about a population, including its demographic characteristics, geographic distribution and overall size.
Celem artykułu jest przedstawienie doświadczeń Republiki Serbii w zakresie organizacji Powszechnego Spisu Ludności, Gospodarstw Domowych i Mieszkań 2022, ze szczególnym uwzględnieniem zagadnień dotyczących zatrudnienia personelu, ram prawnych i finansowania tego badania oraz warunków jego udanej realizacji. Praca skupia się na strategicznych decyzjach w sprawie zbierania danych oraz zastosowania technik informatycznych, takich jak: wykorzystanie danych przestrzennych, cyfrowe metody uzyskiwania danych, uczenie maszynowe, łączenie rekordów czy system monitorujący, mających na celu sprostanie wyzwaniom związanym ze spisem. Autorzy poruszają także kwestie niedostatecznego pokrycia spisu oraz wykorzystania rejestrów administracyjnych do imputacji danych. Ponadto poświęcają uwagę opracowaniu i udoskonalaniu statystycznej ewidencji ludności, dokładności danych, obniżeniu kosztów i zwiększeniu efektywności badania. Główny Urząd Statystyczny Republiki Serbii przeprowadził spis powszechny w sposób cyfrowy, łącząc ten mechanizm z metodami tradycyjnymi (z wyłączeniem samospisu) i posiłkując się rejestrami administracyjnymi w celu imputacji danych. Metoda ta jest w artykule rekomendowana jako najefektywniejszy sposób uzyskania precyzyjnych i wyczerpujących informacji na temat populacji, w tym jej charakterystyki demograficznej, rozmieszczenia przestrzennego i liczebności.
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2023, 68, 10; 49-70
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-5 z 5

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies