
Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "BIG" wg kryterium: Temat

Wyświetlanie 1-13 z 13
Wykorzystanie mediów społecznościowych w szkolnictwie wyższym
Jacek, Maślankowski,
Łukasz, Brzezicki,
Data publikacji:
Główny Urząd Statystyczny
szkoły wyższe
media społecznościowe
big data
Szkoły wyższe w coraz większym stopniu stosują różnorodne metody i narzędzia marketingowe, które zaczynają decydować o sukcesie oraz budowaniu przewagi konkurencyjnej. Do nawiązywania i utrzymywania długotrwałych relacji z otoczeniem oraz prowadzenia innych działań marketingowych coraz częściej wykorzystują media społecznościowe, umożliwiające im aktywne kreowanie swojego wizerunku. Celem podjętego badania jest zastosowanie narzędzi i metod big data do pomiaru aktualnego stanu wykorzystania mediów społecznościowych w szkolnictwie wyższym. Z analiz przeprowadzonych w I kwartale 2019 r. wynika, że duże szkoły wyższe (zgodnie z przyjętym podziałem – 1696 studentów i więcej) w największym stopniu wykorzystują serwisy społecznościowe w celu publikowania bieżących informacji. Odsetek uczelni średnich (223–1695 studentów) i małych (do 222 studentów) posiadających konto w mediach społecznościowych jest znacznie mniejszy. Media społecznościowe służą uczelniom przede wszystkim do promowania organizowanych przez siebie wydarzeń.
Wiadomości Statystyczne. The Polish Statistician; 2020, 65, 2; 30-42
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Big data wyzwaniem dla człowieka i statystyki
Big Data as a Challenge for Man and Statistics
Szreder, Mirosław
Data publikacji:
Główny Urząd Statystyczny
Big Data
Zjawisko big data jest stosunkowo nowe, stąd na ogół przyjmowane jest z zainteresowaniem, chociaż czasami też z irytacją lub niepokojem, z uczuciami, które co prawda coraz silniej dają znać o sobie, ale nie zawsze potrafimy je jasno wyrazić. W tym artykule podjęto próbę określenia najistotniejszych wyzwań, jakie big data rzuca nie tylko człowiekowi i społeczeństwu, ale także statystyce jako nauce. Zwłaszcza w odniesieniu do statystyki kwestia rosnących możliwości obliczeniowych wykorzystujących potężne zbiory danych jest warta uwagi, bo nie da się uciec od problemu relacji między adekwatnością stosowanej metodyki badawczej a jakością uzyskanej z niej wiedzy. (fragment tekstu)
The phenomenon of "big data", understood as the collection and processing of large data sets, in order to extract from them new knowledge, develops independently of the will of individuals and societies. The driving force behind this development is, on the one hand, rapid technological progress in the field of IT, and on the other the desire of many organizations to gain access to the knowledge accumulated in more and more electronic databases of Internet users, facebook, or twitter. The fact that the challenge is this phenomenon for man and for the statistics, the methodology can in these conditions prove less adequate, treats article. The author tries to argue that in case of protection of individuals and society, devoid of attribute privacy and anonymity, technological progress raises previously unknown threats. As statisticians analytical work hardly keep up with the possibilities offered by "big data", as well as the protection of human rights is merely a belated response to the dynamic world of electronic data. (original abstract)
Wiadomości Statystyczne. The Polish Statistician; 2015, 8; 1-11
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Advances on Permutation Multivariate Analysis of Variance for big data
Bonnini, Stefano
Assegie, Getnet Melak
Data publikacji:
Główny Urząd Statystyczny
big data
permutation test
multivariate analysis
In many applications of the multivariate analyses of variance, the classic parametric solutions for testing hypotheses of equality in population means or multisample and multivariate location problems might not be suitable for various reasons. Multivariate multisample location problems lack a comparative study of the power behaviour of the most important combined permutation tests as the number of variables diverges. In particular, it is useful to know under which conditions each of the different tests is preferable in terms of power, how the power of each test increases when the number of variables under the alternative hypothesis diverges, and the power behaviour of each test as the function of the proportion of true alternative hypotheses. The purpose of this paper is to fill the gap in the literature about combined permutation tests, in particular for big data with a large number of variables. A Monte Carlo simulation study was carried out to investigate the power behaviour of the tests, and the application to a real case study was performed to show the utility of the method.
Statistics in Transition new series; 2022, 23, 2; 163-183
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Using Big Data by Ukrainian official statistics when martial law applies: problems and solutions
Osaulenko, Oleksandr H.
Horobets, Olena
Data publikacji:
Główny Urząd Statystyczny
official statistics
statistics during war
Big Data
The article is focused on issues of the secure operation of official statistics in Ukraine during the application of martial law. It was found that the gaps in conventional sources of statistical data caused by the war needed to be filled with data from alternative sources, including Big Data. The level of digitalisation in Ukraine as the basis for using Big Data was analysed by the proposed indices of internetisation, social progress and digital transformation. Thanks to our research, several problems (methodological, legal, financial, and managerial) were identified as vital for statistical offices on their way to the implementation of Big Data in statistical processes. Our proposals concern tools for Big Data processing, such as Data Hypercube as a way for presenting Big Data for their visualisation, applications of Web scraping in estimating the consumer prices index, analyses of labour and real estate markets, and the applications of specialised software for the collection, processing and analysis of Big Data sets.
Statistics in Transition new series; 2023, 24, 1; 29-43
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
From business to clinical trials: a systematic review of the literature on fraud detection methods to be used in central statistical monitoring
Fronc, Maciej
Jakubczyk, Michał
Data publikacji:
Główny Urząd Statystyczny
fraud detection
clinical trials
data mining
big data
Data-driven decisions can be suboptimal when the data are distorted by fraudulent behaviour. Fraud is a common occurrence in finance or other related industries, where large datasets are handled and motivation for financial gain may be high. In order to detect and the prevent fraud, quantitative methods are used. Fraud, however, is also committed in other circumstances, e.g. during clinical trials. The article aims to verify which analytical fraud-detection methods used in finance may be adopted in the field of clinical trials. We systematically reviewed papers published over the last five years in two databases (Scopus and the Web of Science) in the field of economics, finance, management and business in general. We considered a broad scope of data mining techniques including artificial intelligence algorithms. As a result, 37 quantitative methods were identified with the potential of being fit for application in clinical trials. The methods were grouped into three categories: pre-processing techniques, supervised learning and unsupervised learning. Our findings may enhance the future use of fraud-detection methods in clinical trials.
Przegląd Statystyczny; 2022, 69, 3; 1-22
Pojawia się w:
Przegląd Statystyczny
Dostawca treści:
Biblioteka Nauki
Pozyskiwanie i analiza danych na temat ofert pracy z wykorzystaniem big data
The collection and analysis of the data on job advertisements with the use of big data
Maślankowski, Jacek
Data publikacji:
Główny Urząd Statystyczny
big data
text mining
web scraping
rynek pracy
labour market
Celem artykułu jest zaprezentowanie korzyści wynikających z wykorzystania na potrzeby statystyki publicznej (rynku pracy) narzędzi do automatycznego pobierania danych na temat ofert pracy zamieszczanych na stronach internetowych zaliczanych do zbiorów big data, a także związanych z tym wyzwań. Przedstawiono wyniki eksperymentalnych badań z wykorzystaniem metod web scrapingu oraz text miningu. Analizie poddano dane z lat 2017 i 2018 pochodzące z najpopularniejszych portali z ofertami pracy. Odwołano się do danych Głównego Urzędu Statystycznego (GUS) zbieranych na podstawie sprawozdania Z-05. Przeprowadzona analiza prowadzi do wniosku, że web scraping może być stosowany w statystyce publicznej do pozyskiwania danych statystycznych z alternatywnych źródeł, uzupełniających istniejące bazy danych statystycznych, pod warunkiem zachowania spójności z istniejącymi badaniami.
The goal of this paper is to present, on the one hand, the benefits for official statistics (labour market) resulting from the use of web scraping methods to gather data on job advertisements from websites belonging to big data compilations, and on the other, the challenges connected to this process. The paper introduces the results of experimental research where web-scraping and text-mining methods were adopted. The analysis was based on the data from 2017–2018 obtained from the most popular jobsearching websites, which was then collated with Statistics Poland’s data obtained from Z-05 forms. The above-mentioned analysis demonstrated that web-scraping methods can be adopted by public statistics services to obtain statistical data from alternative sources complementing the already-existing databases, providing the findings of such research remain coherent with the results of the already-existing studies.
Wiadomości Statystyczne. The Polish Statistician; 2019, 64, 9; 60-74
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Current challenges and possible big data solutions for the use of web data as a source for official statistics
Współczesne wyzwania i możliwości w zakresie stosowania narzędzi big data do uzyskania danych webowych jako źródła dla statystyki publicznej
Daas, Piet
Maślankowski, Jacek
Data publikacji:
Główny Urząd Statystyczny
big data
web data
web scraping
dane webowe
strony internetowe
Web scraping has become popular in scientific research, especially in statistics. Preparing an appropriate IT environment for web scraping is currently not difficult and can be done relatively quickly. Extracting data in this way requires only basic IT skills. This has resulted in the increased use of this type of data, widely referred to as big data, in official statistics. Over the past decade, much work was done in this area both on the national level within the national statistical institutes, and on the international one by Eurostat. The aim of this paper is to present and discuss current problems related to accessing, extracting, and using information from websites, along with the suggested potential solutions. For the sake of the analysis, a case study featuring large-scale web scraping performed in 2022 by means of big data tools is presented in the paper. The results from the case study, conducted on a total population of approximately 503,700 websites, demonstrate that it is not possible to provide reliable data on the basis of such a large sample, as typically up to 20% of the websites might not be accessible at the time of the survey. What is more, it is not possible to know the exact number of active websites in particular countries, due to the dynamic nature of the Internet, which causes websites to continuously change.
Web scraping jest coraz popularniejszy w badaniach naukowych, zwłaszcza w dziedzinie statystyki. Przygotowanie środowiska do scrapowania danych nie przysparza obecnie trudności i może być wykonane relatywnie szybko, a uzyskiwanie informacji w ten sposób wymaga jedynie podstawowych umiejętności cyfrowych. Dzięki temu statystyka publiczna w coraz większym stopniu korzysta z dużych wolumenów danych, czyli big data. W drugiej dekadzie XXI w. zarówno krajowe urzędy statystyczne, jak i Eurostat włożyły dużo pracy w doskonalenie narzędzi big data. Nadal istnieją jednak trudności związane z dostępnością, ekstrakcją i wykorzystywaniem informacji pobranych ze stron internetowych. Tym problemom oraz potencjalnym sposobom ich rozwiązania został poświęcony niniejszy artykuł. Omówiono studium przypadku masowego web scrapingu wykonanego w 2022 r. za pomocą narzędzi big data na próbie 503 700 stron internetowych. Z analizy wynika, że dostarczenie wiarygodnych danych na podstawie tak dużej próby jest niemożliwe, ponieważ w czasie badania zwykle do 20% stron internetowych może być niedostępnych. Co więcej, dokładna liczba aktywnych stron internetowych w poszczególnych krajach nie jest znana ze względu na dynamiczny charakter Internetu, skutkujący ciągłymi zmianami stron internetowych.
Wiadomości Statystyczne. The Polish Statistician; 2023, 68, 12; 49-64
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Istotność statystyczna w czasach big data
Statistical significance in the era of big data
Szreder, Mirosław
Data publikacji:
Główny Urząd Statystyczny
wnioskowanie statystyczne
testowanie hipotez
istotność staty-styczna
wskaźnik p-value
big data
podejście bayesowskie
statistical inference
hypothesis testing
statistical significance
bayesian approach
Rozwój nowych technologii wpływa zarówno na realizację badań statystycznych, jak i na postrzeganie ich wyników w świetle innych źródeł informacji. W tym kontekście powraca w środowisku naukowym temat roli testowania hipotez statystycznych oraz interpretowania i przedstawiania jego wyników, w tym stosowania kategorii istotności statystycznej oraz wskaźnika p-value. Inspiracją do powstania tego opracowania stała się fala dyskusji wokół tego zagadnienia toczących się na forum czasopism „Nature” i „The American Statistician” na początku 2019 r. Celem artykułu jest ukazanie szans i zagrożeń, jakie big data stwarza dla weryfikacji hipotez i wnioskowania statystycznego, zarówno w ujęciu klasycznym, jak i w podejściu bayesowskim. Autor uzasadnia konieczność zaniechania zbyt daleko posuniętych uproszczeń w realizacji procesu wnioskowania statystycznego oraz prezentowaniu wyników weryfikacji hipotez. Chodzi zarówno o postulat uwzględnienia jakości danych próbkowych, zwłaszcza typu big data, jak i o podawanie pełnej informacji o modelu statystycznym, na podstawie którego przeprowadza się wnioskowanie.
The development of new technologies has affected both the procedures of traditional statistical surveys and the perception of their results in the light of other available sources of information. In this connection, the role of the verification of statistical hypotheses and of the interpretation and presentation of its results, including the use of statistical significance and p-value, has recently returned as a frequent topic for discussion among the scientific community. The author was inspired to write this paper by a wave of discussion regarding this matter held at the beginning of 2019 in the Nature and The American Statistician journals. The aim of the paper is to present the opportunities provided and challenges posed by the use of big data to the hypothesis verification process and to statistical inference, both in the traditional and Bayesian approaches. The author explains the necessity of discontinuing adopting excessive simplifications while performing statistical inference and presenting the results of the verification of hypotheses. This involves both the postulate to pay greater attention to the quality of sampling data, especially in the case of data originating from big data sets, as well as the postulate to provide full information about the statistical model on the basis of which the inference is being performed.
Wiadomości Statystyczne. The Polish Statistician; 2019, 64, 11; 42-57
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Nowe źródła informacji i ich wykorzystywanie w podejmowaniu decyzji
Szreder, Mirosław
Data publikacji:
Główny Urząd Statystyczny
statistical surveys
Big Data
podejmowanie decyzji
badania statystyczne
Analizie poddano zagadnienia związane z możliwościami wykorzystywania tradycyjnych i nowych źródeł informacji (w tym statystycznych) w podejmowaniu decyzji w warunkach niepewności. Zwrócono uwagę na relację między dostępnością informacji o danej sytuacji decyzyjnej a interpretacją i estymacją prawdopodobieństwa, będącego miarą niepewności. Następnie skoncentrowano się na ocenach wiarygodności i jakości informacji uzyskiwanych z badań statystycznych oraz Big Data wykorzystywanych w podejmowaniu decyzji. Oceny te dają dodatkową perspektywę analizy sytuacji decyzyjnych, zwaną wymiarem wiedzy.
The opportunities of using traditional and new sources of information, including statistical data, in decision-making under uncertainty were analysed. Special attention was paid to the relationship between the availability of information about the particular decision-making situation and the interpretation as well as estimation of probability as a measure of uncertainty. Subsequently, an assessment of information credibility and quality obtained from statistical research and Big Data used in decision-making was highlighted. This kind of evaluation offers additional perspective on the analysis of decision-making situation, called the knowledge dimension.
Wiadomości Statystyczne. The Polish Statistician; 2017, 7
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Probability vs. Nonprobability Sampling: From the Birth of Survey Sampling to the Present Day
Kalton, Graham
Data publikacji:
Główny Urząd Statystyczny
Anders Kiaer
Jerzy Neyman
representative sampling
quota sampling
hard-to-survey populations
model-dependent inference
internet surveys
big data
administrative records
At the beginning of the 20th century, there was an active debate about random selection of units versus purposive selection of groups of units for survey samples. Neyman's (1934) paper tilted the balance strongly towards varieties of probability sampling combined with design-based inference, and most national statistical offices have adopted this method for their major surveys. However, nonprobability sampling has remained in widespread use in many areas of application, and over time there have been challenges to the Neyman paradigm. In recent years, the balance has tilted towards greater use of nonprobability sampling for several reasons, including: the growing imperfections and costs in applying probability sample designs; the emergence of the internet and other sources for obtaining survey data from very large samples at low cost and at high speed; and the current ability to apply advanced methods for calibrating nonprobability samples to conform to external population controls. This paper presents an overview of the history of the use of probability and nonprobability sampling from the birth of survey sampling at the time of A. N. Kiaer (1895) to the present day.
Statistics in Transition new series; 2023, 24, 3; 1-22
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Current challenges related to the consumer price index (CPI) in Ukraine
Vasyechko, Olga
Data publikacji:
Główny Urząd Statystyczny
consumer price index (CPI)
Russian military aggression against Ukraine
ideal concept of CPI
conditional concept of CPI
cash registers
Big Data
The purpose of this study is to contribute to the maintenance and compilation of the consumer price index (CPI) in the current extreme situation caused by the Russian military aggression against Ukraine. In these extreme conditions, official statistics is faced with the task of maintaining the regularity, completeness and quality of the production of statistical information, including the CPI, which is one of the key economic indicators. The interaction between the ideal and conditional concepts of the index and their practical implementation is considered as a potential source of compilation improvement. The author argues that the main factor of the modern criticism of the CPI is the systematic deviation of the practical form of the index from its theoretical foundations. One way to solve this problem is to use new sources of information, especially big data cash registers. In today's extreme conditions, cash data can extensively address the issue of limited and untimely access to primary data sources needed to compile the CPI, as well as promptly take into account the changes in consumption patterns caused by significant migratory flows from the dangerous areas, and changes in the supply offer due to the rupture of supply chains.
Statistics in Transition new series; 2023, 24, 1; 105-130
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
O niektórych nowych wyzwaniach i oczekiwaniach wobec statystyki
Some new challenges and expectation of statistics
О некоторых новых вызовах и ожиданиях статистики
Szreder, Mirosław
Data publikacji:
Główny Urząd Statystyczny
Big Data
weryfikacja hipotez statystycznych
wielkość próby
testing statistical hypotheses
a sample size
проверка статистической гипотезы
размер выборки
W artykule omówiono najnowsze wyzwania badawcze i dydaktyczne, jakie stoją przed statystyką w obliczu szybko rosnących możliwości gromadzenia i przetwarzania danych (Big Data) oraz coraz bardziej dominującego w życiu społecznym i ekonomicznym liczbowego opisu rzeczywistości. Te nowe zjawiska i tendencje powinny skłonić środowisko statystyków do podejmowania działań na rzecz podniesienia w społeczeństwie wiedzy statystycznej, niezbędnej do krytycznej oceny i poprawnej interpretacji wyników badań statystycznych.
В статье обсуждаются последние исследовательские и дидактические вызовы, которые стоят перед статистикой в ситуации быстро повышающихся возможностей сборки и обработки данных (Big Data), а также более доминирующего в социальной и экономической жизни численного описания реальности. Эти новые явления и тенденции должны поощрять статистиков принимать меры по повышению статистических знаний общества, необходимых для критической оценки и правильной интерпретации результатов статистических обследований.
The article discusses recent research and educational challenges faced by the statistics in the world of fast-growing possibilities of collecting and processing data (Big Data) and the increasingly dominant in social and economic life numerical description of reality. These new phenomena and trends should encourage statisticians’ environment to take action of improving society statistical knowledge needed to critically evaluate and correct interpretation of the survey results.
Wiadomości Statystyczne. The Polish Statistician; 2016, 6; 1-9
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
TranStat: an intelligent system for producing road and maritime transport statistics using big data sources
TranStat – inteligentny system produkcji statystyk transportu drogowego i morskiego z wykorzystaniem big data
Rozkrut, Dominik
Bilska, Anna
Bis, Michał
Pawłowska, Justyna
Data publikacji:
Główny Urząd Statystyczny
road transport
maritime transport
traffic intensity
transport performance
exhaust emissions
smart forms
big data
transport drogowy
transport morski
natężenie ruchu
praca przewozowa
emisja zanieczyszczeń
inteligentne formularze
The development of digital technologies, increasing the availability of big data and advanced processing techniques have enabled Statistics Poland to modernise the system for producing road and maritime transport statistics. As a result of the activities undertaken to adopt modern big data technologies and data from sensors, e.g. the Automatic Identification System (AIS) or the e-TOLL electronic toll collection system, new statistics have been obtained and data dissemination has accelerated. In addition, these activities ensure continuity in data production, especially in situations where collecting data from individuals may be difficult (e.g. the COVID-19 epidemic). The primary purpose of this article is to present the innovative TranStat system that enables the production of road and maritime transport statistics based on large volumes of data in order to shape the country's transport policy. The system was developed under the GOSPOSTRATEG programme and implemented by Statistics Poland, the Statistical Office in Szczecin, the Maritime University of Szczecin, and the Cracow University of Technology. The study presents the most important aspects of the TranStat system, i.e. the characteristics of data sources, the description of functional subsystems, assumptions of the developed models and result data for traffic statistics, transport performance and exhaust emissions calculations for both types of transport. This study also provides information on smart forms implemented by Polish official statistics, reducing the burden on respondents and the costs of surveys.
Rozwój technologii cyfrowych, zwiększenie dostępności danych typu big data oraz zaawansowane techniki ich przetwarzania umożliwiły polskiej statystyce publicznej unowocześnienie systemu produkcji statystyk transportu drogowego i morskiego. Dzięki działaniom podjętym w celu adaptacji nowoczesnych technologii big data i danych sensorycznych, z systemu automatycznej identyfikacji statków AIS (ang. Automatic Identification System) czy elektronicznego systemu poboru opłat e-TOLL, uzyskano nowe statystyki oraz przyspieszono proces udostępniania danych. Ponadto działania te zapewniają ciągłość w obszarze produkcji danych, szczególnie w sytuacji, gdy zbieranie danych od respondentów może być utrudnione (np. podczas epidemii COVID-19). Głównym celem niniejszego artykułu jest zaprezentowanie innowacyjnego, opracowanego w ramach programu GOSPOSTRATEG systemu TranStat, który umożliwia produkcję statystyk transportu drogowego i morskiego z wykorzystaniem wielkich wolumenów danych i tym samym służy kształtowaniu polityki transportowej kraju. Projekt TranStat został zrealizowany przez Główny Urząd Statystyczny, Urząd Statystyczny w Szczecinie, Politechnikę Morską w Szczecinie oraz Politechnikę Krakowską. W pracy przedstawiono najważniejsze cechy systemu TranStat – scharakteryzowano źródła danych, opisano podsystemy funkcjonalne i założenia opracowanych modeli oraz podano informacje wynikowe dla statystyk natężenia ruchu, pracy przewozowej i emisji zanieczyszczeń dla obu rodzajów transportu. Omówiono też inteligentne formularze wdrożone przez statystykę publiczną, mniej obciążające dla respondentów i umożliwiające redukcję kosztów badań.
Wiadomości Statystyczne. The Polish Statistician; 2023, 68, 12; 1-24
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
    Wyświetlanie 1-13 z 13

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies