An Influence of Classification Method on Efficiency of Modified Synthetic Estimator Wpływ stosowanej metody klasyfikacji na efektywność modyfikowanego estymatora syntetycznego
The problem of insufficient number of sample observations representing a given
population domain of interest (small area) can be solved by applying such estimators, which
will be able to combine sample information from the given domain with information about
sample units representing other domains. One small area estimation method, called synthetic
estimation technique, assumes that the distribution of the variable of interest is identical in
the given domain and in the entire population. This assumption, however, is rarely met, and
as a result one obtains large estimation errors.
In this paper a two-stage estimation procedure is suggested. The first stage consist in
applying various classification methods to identify the degree of similarity between the sample
units from the investigated domain and sample units representing other domains. In the second
stage, those domains, which turned out to be similar to the domain of interest or sample
units similar to units from domain of interest, are used to provide sample information with
specially constructed weights.
Authors present the results of the suggested procedure in an analysis of the continuing
vocational training in construction industry based on a sample survey of enterprises. A bootstrap
attempt has been made to assess errors of the suggested estimation procedure.
Problem zbyt małej liczby obserwacji w próbie, reprezentującej określoną domenę populacji,
może być rozwiązany m. in. poprzez estymatory wykorzystujące informacje o innych jednostkach
w próbie. Jedna z metod estymacji dla małych domen, zwana estymacją syntetyczną, zakłada,
że rozkład w badanej małej domenie jest identyczny z rozkładem całej populacji. Założenie
to pozostaje zazwyczaj niespełnione, zwłaszcza w przypadku specyficznych domen, co skutkuje
dużymi błędami estymacji.
Problem niespełnienia założeń estymacji syntetycznej może być rozwiązany poprzez zastosowanie
dwuetapowego procesu estymacji. W pierwszym etapie za pomocą metod analizy
wielowymiarowej, np. za pomocą metody klasyfikacji k-średnich, badania odległości czy też
wykorzystując sieci neuronowe typu SOM, określa się podobieństwa domen lub jednostek
należących do małej domeny do jednostek z pozostałej części próby. Drugim krokiem jest
wykorzystanie w estymacji, za pomocą odpowiednio skonstruowanych wag, informacji tylko
o tych jednostkach lub z tych domen, które są podobne do badanej małej domeny.
W artykule autorzy przedstawiają rezultaty zastosowanej metody na przykładzie badania
reprezentacyjnego kształcenia ustawicznego w branży budowlanej. Za pomocą metod bootsrtrapowych
dokonano oceny wpływu stosowania różnych metod badania podobieństw między
jednostkami na własności modyfikowanego estymatora syntetycznego.
Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies
Informacja
SZANOWNI CZYTELNICY!
UPRZEJMIE INFORMUJEMY, ŻE BIBLIOTEKA FUNKCJONUJE W NASTĘPUJĄCYCH GODZINACH:
Wypożyczalnia i Czytelnia Główna: poniedziałek – piątek od 9.00 do 19.00