Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Big Data," wg kryterium: Temat


Wyświetlanie 1-8 z 8
Tytuł:
Wykorzystanie mediów społecznościowych w szkolnictwie wyższym
Autorzy:
Jacek, Maślankowski,
Łukasz, Brzezicki,
Powiązania:
https://bibliotekanauki.pl/articles/542231.pdf
Data publikacji:
2020-03-24
Wydawca:
Główny Urząd Statystyczny
Tematy:
szkoły wyższe
media społecznościowe
big data
Opis:
Szkoły wyższe w coraz większym stopniu stosują różnorodne metody i narzędzia marketingowe, które zaczynają decydować o sukcesie oraz budowaniu przewagi konkurencyjnej. Do nawiązywania i utrzymywania długotrwałych relacji z otoczeniem oraz prowadzenia innych działań marketingowych coraz częściej wykorzystują m.in. media społecznościowe, umożliwiające im aktywne kreowanie swojego wizerunku. Celem podjętego badania jest zastosowanie narzędzi i metod big data do pomiaru aktualnego stanu wykorzystania mediów społecznościowych w szkolnictwie wyższym. Z analiz przeprowadzonych w I kwartale 2019 r. wynika, że duże szkoły wyższe (zgodnie z przyjętym podziałem – 1696 studentów i więcej) w największym stopniu wykorzystują serwisy społecznościowe w celu publikowania bieżących informacji. Odsetek uczelni średnich (223–1695 studentów) i małych (do 222 studentów) posiadających konto w mediach społecznościowych jest znacznie mniejszy. Media społecznościowe służą uczelniom przede wszystkim do promowania organizowanych przez siebie wydarzeń.
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2020, 65, 2; 30-42
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Big data wyzwaniem dla człowieka i statystyki
Big Data as a Challenge for Man and Statistics
Autorzy:
Szreder, Mirosław
Powiązania:
https://bibliotekanauki.pl/articles/542943.pdf
Data publikacji:
2015
Wydawca:
Główny Urząd Statystyczny
Tematy:
Big Data
Statistics
Society
Statystyka
Społeczeństwo
Opis:
Zjawisko big data jest stosunkowo nowe, stąd na ogół przyjmowane jest z zainteresowaniem, chociaż czasami też z irytacją lub niepokojem, z uczuciami, które co prawda coraz silniej dają znać o sobie, ale nie zawsze potrafimy je jasno wyrazić. W tym artykule podjęto próbę określenia najistotniejszych wyzwań, jakie big data rzuca nie tylko człowiekowi i społeczeństwu, ale także statystyce jako nauce. Zwłaszcza w odniesieniu do statystyki kwestia rosnących możliwości obliczeniowych wykorzystujących potężne zbiory danych jest warta uwagi, bo nie da się uciec od problemu relacji między adekwatnością stosowanej metodyki badawczej a jakością uzyskanej z niej wiedzy. (fragment tekstu)
The phenomenon of "big data", understood as the collection and processing of large data sets, in order to extract from them new knowledge, develops independently of the will of individuals and societies. The driving force behind this development is, on the one hand, rapid technological progress in the field of IT, and on the other the desire of many organizations to gain access to the knowledge accumulated in more and more electronic databases of Internet users, facebook, or twitter. The fact that the challenge is this phenomenon for man and for the statistics, the methodology can in these conditions prove less adequate, treats article. The author tries to argue that in case of protection of individuals and society, devoid of attribute privacy and anonymity, technological progress raises previously unknown threats. As statisticians analytical work hardly keep up with the possibilities offered by "big data", as well as the protection of human rights is merely a belated response to the dynamic world of electronic data. (original abstract)
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2015, 8; 1-11
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Current challenges and possible big data solutions for the use of web data as a source for official statistics
Współczesne wyzwania i możliwości w zakresie stosowania narzędzi big data do uzyskania danych webowych jako źródła dla statystyki publicznej
Autorzy:
Daas, Piet
Maślankowski, Jacek
Powiązania:
https://bibliotekanauki.pl/articles/31232088.pdf
Data publikacji:
2023-12-29
Wydawca:
Główny Urząd Statystyczny
Tematy:
big data
web data
websites
web scraping
dane webowe
strony internetowe
Opis:
Web scraping has become popular in scientific research, especially in statistics. Preparing an appropriate IT environment for web scraping is currently not difficult and can be done relatively quickly. Extracting data in this way requires only basic IT skills. This has resulted in the increased use of this type of data, widely referred to as big data, in official statistics. Over the past decade, much work was done in this area both on the national level within the national statistical institutes, and on the international one by Eurostat. The aim of this paper is to present and discuss current problems related to accessing, extracting, and using information from websites, along with the suggested potential solutions. For the sake of the analysis, a case study featuring large-scale web scraping performed in 2022 by means of big data tools is presented in the paper. The results from the case study, conducted on a total population of approximately 503,700 websites, demonstrate that it is not possible to provide reliable data on the basis of such a large sample, as typically up to 20% of the websites might not be accessible at the time of the survey. What is more, it is not possible to know the exact number of active websites in particular countries, due to the dynamic nature of the Internet, which causes websites to continuously change.
Web scraping jest coraz popularniejszy w badaniach naukowych, zwłaszcza w dziedzinie statystyki. Przygotowanie środowiska do scrapowania danych nie przysparza obecnie trudności i może być wykonane relatywnie szybko, a uzyskiwanie informacji w ten sposób wymaga jedynie podstawowych umiejętności cyfrowych. Dzięki temu statystyka publiczna w coraz większym stopniu korzysta z dużych wolumenów danych, czyli big data. W drugiej dekadzie XXI w. zarówno krajowe urzędy statystyczne, jak i Eurostat włożyły dużo pracy w doskonalenie narzędzi big data. Nadal istnieją jednak trudności związane z dostępnością, ekstrakcją i wykorzystywaniem informacji pobranych ze stron internetowych. Tym problemom oraz potencjalnym sposobom ich rozwiązania został poświęcony niniejszy artykuł. Omówiono studium przypadku masowego web scrapingu wykonanego w 2022 r. za pomocą narzędzi big data na próbie 503 700 stron internetowych. Z analizy wynika, że dostarczenie wiarygodnych danych na podstawie tak dużej próby jest niemożliwe, ponieważ w czasie badania zwykle do 20% stron internetowych może być niedostępnych. Co więcej, dokładna liczba aktywnych stron internetowych w poszczególnych krajach nie jest znana ze względu na dynamiczny charakter Internetu, skutkujący ciągłymi zmianami stron internetowych.
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2023, 68, 12; 49-64
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Pozyskiwanie i analiza danych na temat ofert pracy z wykorzystaniem big data
The collection and analysis of the data on job advertisements with the use of big data
Autorzy:
Maślankowski, Jacek
Powiązania:
https://bibliotekanauki.pl/articles/962829.pdf
Data publikacji:
2019
Wydawca:
Główny Urząd Statystyczny
Tematy:
big data
text mining
web scraping
rynek pracy
labour market
Opis:
Celem artykułu jest zaprezentowanie korzyści wynikających z wykorzystania na potrzeby statystyki publicznej (rynku pracy) narzędzi do automatycznego pobierania danych na temat ofert pracy zamieszczanych na stronach internetowych zaliczanych do zbiorów big data, a także związanych z tym wyzwań. Przedstawiono wyniki eksperymentalnych badań z wykorzystaniem metod web scrapingu oraz text miningu. Analizie poddano dane z lat 2017 i 2018 pochodzące z najpopularniejszych portali z ofertami pracy. Odwołano się do danych Głównego Urzędu Statystycznego (GUS) zbieranych na podstawie sprawozdania Z-05. Przeprowadzona analiza prowadzi do wniosku, że web scraping może być stosowany w statystyce publicznej do pozyskiwania danych statystycznych z alternatywnych źródeł, uzupełniających istniejące bazy danych statystycznych, pod warunkiem zachowania spójności z istniejącymi badaniami.
The goal of this paper is to present, on the one hand, the benefits for official statistics (labour market) resulting from the use of web scraping methods to gather data on job advertisements from websites belonging to big data compilations, and on the other, the challenges connected to this process. The paper introduces the results of experimental research where web-scraping and text-mining methods were adopted. The analysis was based on the data from 2017–2018 obtained from the most popular jobsearching websites, which was then collated with Statistics Poland’s data obtained from Z-05 forms. The above-mentioned analysis demonstrated that web-scraping methods can be adopted by public statistics services to obtain statistical data from alternative sources complementing the already-existing databases, providing the findings of such research remain coherent with the results of the already-existing studies.
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2019, 64, 9; 60-74
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Nowe źródła informacji i ich wykorzystywanie w podejmowaniu decyzji
Autorzy:
Szreder, Mirosław
Powiązania:
https://bibliotekanauki.pl/articles/543675.pdf
Data publikacji:
2017
Wydawca:
Główny Urząd Statystyczny
Tematy:
decision-making
uncertainty
risk
probability
statistical surveys
Big Data
podejmowanie decyzji
niepewność
ryzyko
prawdopodobieństwo
badania statystyczne
Opis:
Analizie poddano zagadnienia związane z możliwościami wykorzystywania tradycyjnych i nowych źródeł informacji (w tym statystycznych) w podejmowaniu decyzji w warunkach niepewności. Zwrócono uwagę na relację między dostępnością informacji o danej sytuacji decyzyjnej a interpretacją i estymacją prawdopodobieństwa, będącego miarą niepewności. Następnie skoncentrowano się na ocenach wiarygodności i jakości informacji uzyskiwanych z badań statystycznych oraz Big Data wykorzystywanych w podejmowaniu decyzji. Oceny te dają dodatkową perspektywę analizy sytuacji decyzyjnych, zwaną wymiarem wiedzy.
The opportunities of using traditional and new sources of information, including statistical data, in decision-making under uncertainty were analysed. Special attention was paid to the relationship between the availability of information about the particular decision-making situation and the interpretation as well as estimation of probability as a measure of uncertainty. Subsequently, an assessment of information credibility and quality obtained from statistical research and Big Data used in decision-making was highlighted. This kind of evaluation offers additional perspective on the analysis of decision-making situation, called the knowledge dimension.
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2017, 7
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Istotność statystyczna w czasach big data
Statistical significance in the era of big data
Autorzy:
Szreder, Mirosław
Powiązania:
https://bibliotekanauki.pl/articles/962757.pdf
Data publikacji:
2019
Wydawca:
Główny Urząd Statystyczny
Tematy:
wnioskowanie statystyczne
testowanie hipotez
istotność staty-styczna
wskaźnik p-value
big data
podejście bayesowskie
statistical inference
hypothesis testing
statistical significance
p-value
big
data
bayesian approach
Opis:
Rozwój nowych technologii wpływa zarówno na realizację badań statystycznych, jak i na postrzeganie ich wyników w świetle innych źródeł informacji. W tym kontekście powraca w środowisku naukowym temat roli testowania hipotez statystycznych oraz interpretowania i przedstawiania jego wyników, w tym stosowania kategorii istotności statystycznej oraz wskaźnika p-value. Inspiracją do powstania tego opracowania stała się fala dyskusji wokół tego zagadnienia toczących się na forum czasopism „Nature” i „The American Statistician” na początku 2019 r. Celem artykułu jest ukazanie szans i zagrożeń, jakie big data stwarza dla weryfikacji hipotez i wnioskowania statystycznego, zarówno w ujęciu klasycznym, jak i w podejściu bayesowskim. Autor uzasadnia konieczność zaniechania zbyt daleko posuniętych uproszczeń w realizacji procesu wnioskowania statystycznego oraz prezentowaniu wyników weryfikacji hipotez. Chodzi zarówno o postulat uwzględnienia jakości danych próbkowych, zwłaszcza typu big data, jak i o podawanie pełnej informacji o modelu statystycznym, na podstawie którego przeprowadza się wnioskowanie.
The development of new technologies has affected both the procedures of traditional statistical surveys and the perception of their results in the light of other available sources of information. In this connection, the role of the verification of statistical hypotheses and of the interpretation and presentation of its results, including the use of statistical significance and p-value, has recently returned as a frequent topic for discussion among the scientific community. The author was inspired to write this paper by a wave of discussion regarding this matter held at the beginning of 2019 in the Nature and The American Statistician journals. The aim of the paper is to present the opportunities provided and challenges posed by the use of big data to the hypothesis verification process and to statistical inference, both in the traditional and Bayesian approaches. The author explains the necessity of discontinuing adopting excessive simplifications while performing statistical inference and presenting the results of the verification of hypotheses. This involves both the postulate to pay greater attention to the quality of sampling data, especially in the case of data originating from big data sets, as well as the postulate to provide full information about the statistical model on the basis of which the inference is being performed.
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2019, 64, 11; 42-57
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
O niektórych nowych wyzwaniach i oczekiwaniach wobec statystyki
Some new challenges and expectation of statistics
О некоторых новых вызовах и ожиданиях статистики
Autorzy:
Szreder, Mirosław
Powiązania:
https://bibliotekanauki.pl/articles/542208.pdf
Data publikacji:
2016-06
Wydawca:
Główny Urząd Statystyczny
Tematy:
Big Data
weryfikacja hipotez statystycznych
wielkość próby
sondaż
testing statistical hypotheses
a sample size
opinion
poll
проверка статистической гипотезы
размер выборки
зондирование
Opis:
W artykule omówiono najnowsze wyzwania badawcze i dydaktyczne, jakie stoją przed statystyką w obliczu szybko rosnących możliwości gromadzenia i przetwarzania danych (Big Data) oraz coraz bardziej dominującego w życiu społecznym i ekonomicznym liczbowego opisu rzeczywistości. Te nowe zjawiska i tendencje powinny skłonić środowisko statystyków do podejmowania działań na rzecz podniesienia w społeczeństwie wiedzy statystycznej, niezbędnej do krytycznej oceny i poprawnej interpretacji wyników badań statystycznych.
В статье обсуждаются последние исследовательские и дидактические вызовы, которые стоят перед статистикой в ситуации быстро повышающихся возможностей сборки и обработки данных (Big Data), а также более доминирующего в социальной и экономической жизни численного описания реальности. Эти новые явления и тенденции должны поощрять статистиков принимать меры по повышению статистических знаний общества, необходимых для критической оценки и правильной интерпретации результатов статистических обследований.
The article discusses recent research and educational challenges faced by the statistics in the world of fast-growing possibilities of collecting and processing data (Big Data) and the increasingly dominant in social and economic life numerical description of reality. These new phenomena and trends should encourage statisticians’ environment to take action of improving society statistical knowledge needed to critically evaluate and correct interpretation of the survey results.
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2016, 6; 1-9
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
TranStat: an intelligent system for producing road and maritime transport statistics using big data sources
TranStat – inteligentny system produkcji statystyk transportu drogowego i morskiego z wykorzystaniem big data
Autorzy:
Rozkrut, Dominik
Bilska, Anna
Bis, Michał
Pawłowska, Justyna
Powiązania:
https://bibliotekanauki.pl/articles/31232011.pdf
Data publikacji:
2023-12-29
Wydawca:
Główny Urząd Statystyczny
Tematy:
road transport
maritime transport
traffic intensity
transport performance
exhaust emissions
smart forms
big data
TranStat
GOSPOSTRATEG
AIS
e-TOLL
transport drogowy
transport morski
natężenie ruchu
praca przewozowa
emisja zanieczyszczeń
inteligentne formularze
Opis:
The development of digital technologies, increasing the availability of big data and advanced processing techniques have enabled Statistics Poland to modernise the system for producing road and maritime transport statistics. As a result of the activities undertaken to adopt modern big data technologies and data from sensors, e.g. the Automatic Identification System (AIS) or the e-TOLL electronic toll collection system, new statistics have been obtained and data dissemination has accelerated. In addition, these activities ensure continuity in data production, especially in situations where collecting data from individuals may be difficult (e.g. the COVID-19 epidemic). The primary purpose of this article is to present the innovative TranStat system that enables the production of road and maritime transport statistics based on large volumes of data in order to shape the country's transport policy. The system was developed under the GOSPOSTRATEG programme and implemented by Statistics Poland, the Statistical Office in Szczecin, the Maritime University of Szczecin, and the Cracow University of Technology. The study presents the most important aspects of the TranStat system, i.e. the characteristics of data sources, the description of functional subsystems, assumptions of the developed models and result data for traffic statistics, transport performance and exhaust emissions calculations for both types of transport. This study also provides information on smart forms implemented by Polish official statistics, reducing the burden on respondents and the costs of surveys.
Rozwój technologii cyfrowych, zwiększenie dostępności danych typu big data oraz zaawansowane techniki ich przetwarzania umożliwiły polskiej statystyce publicznej unowocześnienie systemu produkcji statystyk transportu drogowego i morskiego. Dzięki działaniom podjętym w celu adaptacji nowoczesnych technologii big data i danych sensorycznych, m.in. z systemu automatycznej identyfikacji statków AIS (ang. Automatic Identification System) czy elektronicznego systemu poboru opłat e-TOLL, uzyskano nowe statystyki oraz przyspieszono proces udostępniania danych. Ponadto działania te zapewniają ciągłość w obszarze produkcji danych, szczególnie w sytuacji, gdy zbieranie danych od respondentów może być utrudnione (np. podczas epidemii COVID-19). Głównym celem niniejszego artykułu jest zaprezentowanie innowacyjnego, opracowanego w ramach programu GOSPOSTRATEG systemu TranStat, który umożliwia produkcję statystyk transportu drogowego i morskiego z wykorzystaniem wielkich wolumenów danych i tym samym służy kształtowaniu polityki transportowej kraju. Projekt TranStat został zrealizowany przez Główny Urząd Statystyczny, Urząd Statystyczny w Szczecinie, Politechnikę Morską w Szczecinie oraz Politechnikę Krakowską. W pracy przedstawiono najważniejsze cechy systemu TranStat – scharakteryzowano źródła danych, opisano podsystemy funkcjonalne i założenia opracowanych modeli oraz podano informacje wynikowe dla statystyk natężenia ruchu, pracy przewozowej i emisji zanieczyszczeń dla obu rodzajów transportu. Omówiono też inteligentne formularze wdrożone przez statystykę publiczną, mniej obciążające dla respondentów i umożliwiające redukcję kosztów badań.
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2023, 68, 12; 1-24
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-8 z 8

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies