Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "data integration;" wg kryterium: Temat


Wyświetlanie 1-5 z 5
Tytuł:
Data Integration and Small Domain Estimation in Poland – Experiences and Problems
Autorzy:
Gołata, Elżbieta
Powiązania:
https://bibliotekanauki.pl/articles/465898.pdf
Data publikacji:
2012
Wydawca:
Główny Urząd Statystyczny
Tematy:
Small domain estimation
data integration
Opis:
The aim of the study could be identified twofold. On the one hand, it was a presentation of Polish experiences as concerns the most important methodological issues of contemporary statistics. These are the problems of data integration (DI) and statistical estimation for small domains (SDE).On the other hand, attempts to determine relationship between these two groups of methods were undertaken. Given convergence of the objectives of both SDE and DI, that is: striving to increase efficiency of the use of existing sources of information, simulation study was conducted. It was aimed at verifying the hypothesis of synergies referring to combined application of both groups of methods: SDE and DI.
Źródło:
Statistics in Transition new series; 2012, 13, 1; 107-142
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Spatial microsimulation of personal income in Poland at the level of subregions
Autorzy:
Roszka, Wojciech
Powiązania:
https://bibliotekanauki.pl/articles/1193070.pdf
Data publikacji:
2019-08-30
Wydawca:
Główny Urząd Statystyczny
Tematy:
data integration
spatial microsimulation
small area estimation
synthetic data generation
Opis:
The paper presents an application of spatial microsimulation methods for generating a synthetic population to estimate personal income in Poland in 2011 using census tables and EU-SILC 2011 microdata set. The first section presents a research problem and a brief overview of modern estimation methods in application to small domains with particular emphasis on spatial microsimulation. The second section contains an overview of selected synthetic population generation methods. In the last section personal income estimation on NUTS 3 level is presented with special emphasis on the quality of estimates.
Źródło:
Statistics in Transition new series; 2019, 20, 3; 133-153
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
System statystyki publicznej oparty na zintegrowanych źródłach danych
The system of public statistics based on integrated data sources
Autorzy:
Roszka, Wojciech
Powiązania:
https://bibliotekanauki.pl/articles/422893.pdf
Data publikacji:
2012
Wydawca:
Główny Urząd Statystyczny
Tematy:
integracja danych
rejestry administracyjne
spisy powszechne
data integration
administrative registers
censuses
Opis:
Zwiększające się zapotrzebowanie na rzetelną i aktualną informację na możliwie niskim poziomie agregacji jest rosnącym wyzwaniem dla polskiej statystyki publicznej. Zastosowanie integracji danych z różnych, w tym administracyjnych, źródeł umożliwia wykorzystanie informacji pełnej w sensie pokrycia oraz bogatej merytorycznie. Łączna obserwacja cech obserwowanych w oddzielnych zbiorach generuje efekt synergii zwiększający zasób wiedzy pochodzący z badań społeczno-ekonomicznych.
Increasing demand for reliable and current information at the lowest possible level of aggregation is a growing challenge for the Polish public statistics. Application of data integration of different, including administrative, sources enables the use of information in terms of full coverage and rich in substance. The joint observation of variables observed in separate data collections generate a synergy effect increasing amount of knowledge derived from socio-economic research.
Źródło:
Przegląd Statystyczny; 2012, 59, numer specjalny 2; 205-221
0033-2372
Pojawia się w:
Przegląd Statystyczny
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The evaluation of (big) data integration methods in tourism
Ocena metod integracji danych dotyczących turystyki z uwzględnieniem big data
Autorzy:
Cierpiał-Wolan, Marek
Stateva, Galya
Powiązania:
https://bibliotekanauki.pl/articles/31232009.pdf
Data publikacji:
2023-12-29
Wydawca:
Główny Urząd Statystyczny
Tematy:
data integration methods
tourism survey frame
web scraping
metody integracji danych
operat do badań turystyki
Opis:
In view of many dynamic changes taking place in the modern world due to the pandemic, the migration crisis, armed conflicts, etc., it is a huge challenge for official statistics to provide good-quality information, which should be available almost in real time. In this context, integration of data from multiple sources, in particular big data, is a prerequisite. The aim of the article is to characterise and evaluate the following selected methods of data integration in tourism statistics: Natural Language Processing (NLP), machine learning algorithm, i.e. K-Nearest Neighbours (K-NN) using TF-IDF and N-gram techniques, and Fuzzy Matching, belonging to probabilistic methods. In tourism surveys, data acquired using web scraping deserve special attention. For this reason, the analysed methods were used to combine data from booking portals (Booking.com, Hotels.com and Airbnb.com) with a tourism survey frame. An attempt was also made to answer the question of how the data obtained from web scraping of tourism portals improved the quality of the frame. The study showed that Fuzzy Matching based on the Levenshtein algorithm combined with Vincenty’s formula was the most effective among all tested methods. In addition, as a result of data integration, it was possible to significantly improve the quality of the tourism survey frame in 2023 (an increase in the number of new accommodation establishments in Poland by 1.1% and in Bulgaria by 1.4%).
W obliczu wielu dynamicznych zmian zachodzących we współczesnym świecie, spowodowanych m.in. pandemią COVID-19, kryzysem migracyjnym i konfliktami zbrojnymi, ogromnym wyzwaniem dla statystyki publicznej jest dostarczanie informacji dobrej jakości, które powinny być dostępne niemalże w czasie rzeczywistym. W tym kontekście warunkiem koniecznym jest integracja danych, w szczególności big data, pochodzących z wielu źródeł. Głównym celem badania omawianego w artykule jest charakterystyka i ocena wybranych metod integracji danych w statystyce w dziedzinie turystyki: przetwarzania języka naturalnego (Natural Language Processing – NLP), algorytmu uczenia maszynowego, tj. K-najbliższych sąsiadów (K-Nearest Neighbours – K-NN), z wykorzystaniem technik TF-IDF i N-gramów, oraz parowania rozmytego (Fuzzy Matching), należących do grupy metod probabilistycznych. W badaniach dotyczących turystyki na szczególną uwagę zasługują dane uzyskiwane za pomocą web scrapingu. Z tego powodu analizowane metody wykorzystano do łączenia danych pochodzących z portali rezerwacyjnych (Booking.com, Hotels.com i Airbnb.com) z operatem do badań turystyki. Posłużono się danymi dotyczącymi Polski i Bułgarii, pobranymi w okresie od kwietnia do lipca 2023 r. Podjęto także próbę odpowiedzi na pytanie, jak dane uzyskane z web scrapingu wpłynęły na poprawę jakości operatu. Z przeprowadzonego badania wynika, że najbardziej przydatne spośród testowanych metod jest parowanie rozmyte oparte na algorytmach Levenshteina i Vincenty’ego. Ponadto w wyniku integracji danych udało się znacząco poprawić jakość operatu do badań turystyki w 2023 r. . (wzrost liczby nowych obiektów w Polsce o 1,1%, a w Bułgarii – o 1,4%).
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2023, 68, 12; 25-48
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Trade potential under the SAFTA between India and other SAARC countries: the augmented gravity model approach
Autorzy:
Sharma, Vipin
Kumar, Vinod
Powiązania:
https://bibliotekanauki.pl/articles/1827543.pdf
Data publikacji:
2021-09-06
Wydawca:
Główny Urząd Statystyczny
Tematy:
Cooperation/integration
augmented gravity model
panel data
trade potential
SAARC
SAPTA
SAFTA
Opis:
The study attempts to analyse India's trade potential with other SAARC member states under the SAFTA agreement by means of the augmented gravity model, at annual frequency from 1992 to 2019 in general and from 2004 to 2019 in particular. The findings of this paper prove that the intra-regional trade volumes between SAARC countries can be increased and encouraged. Moreover, the research shows that it is important to introduce structural reforms aiming to boost trade with non-member states. It would be advisable for researchers to take into account the effect locational and infrastructural advantages have on transport costs through the application of a gravity model. Previous research has also demonstrated that the augmented gravity model may prove helpful in explaining some key features of South Asian trade, which traditional gravity models fail to do.
Źródło:
Statistics in Transition new series; 2021, 22, 3; 81-97
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-5 z 5

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies