Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "mixed data" wg kryterium: Temat


Tytuł:
Decision-making enhancement in a big data environment : application of the K-means algorithm to mixed data
Autorzy:
Koren, Oded
Hallin, Carina Antonia
Perel, Nir
Bendet, Dror
Powiązania:
https://bibliotekanauki.pl/articles/91712.pdf
Data publikacji:
2019
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
big data
mixed data
hadoop
K-means
decision making
Opis:
Big data research has become an important discipline in information systems research. However, the flood of data being generated on the Internet is increasingly unstructured and non-numeric in the form of images and texts. Thus, research indicates that there is an increasing need to develop more efficient algorithms for treating mixed data in big data for effective decision making. In this paper, we apply the classical K-means algorithm to both numeric and categorical attributes in big data platforms. We first present an algorithm that handles the problem of mixed data. We then use big data platforms to implement the algorithm, demonstrating its functionalities by applying the algorithm in a detailed case study. This provides us with a solid basis for performing more targeted profiling for decision making and research using big data. Consequently, the decision makers will be able to treat mixed data, numerical and categorical data, to explain and predict phenomena in the big data ecosystem. Our research includes a detailed end-to-end case study that presents an implementation of the suggested procedure. This demonstrates its capabilities and the advantages that allow it to improve the decision-making process by targeting organizations’ business requirements to a specific cluster[s]/profiles[s] based on the enhancement outcomes.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2019, 9, 4; 293-302
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Metodyka dla analizy treści w projektach stosujących techniki text mining i rozwiązania CAQDAS piątej generacji
Autorzy:
Tomanek, Krzysztof
Powiązania:
https://bibliotekanauki.pl/articles/2033749.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
analiza treści
Mixed Methods
Big Data
techniki text mining
CAQDAS
Content Analysis
Mixed Methods Approach
Text Mining
Opis:
Projekty, w których przychodzi nam pracować z dużymi wolumenami danych tekstowych, pochodzących z rożnych źródeł i zapisanych w różnorodnych formatach, rodzą wiele dylematów natury metodologicznej, wymagają często niestandardowych decyzji i rozwiązań. W szczególności zadanie polegające na opracowaniu danych o różnorodnej jakości, nieustrukturyzowanych typu quan i qual wymagać może pracy, w której dynamicznie zmieniają się strategie analizy danych, sposoby przekształcania danych tekstowych. Artykuł opisuje przykład takiej właśnie „dynamicznej” metodyki. Wykazała ona swoją wartość w zadaniu polegającym na klasyfikacji wypowiedzi pisanych. W tak zarysowanym kontekście autor artykułu mierzy się z następującymi celami: (a) czy można zastosować oprogramowanie klasy CAQDAS do pracy półautomatycznej lub automatycznej zastępującej część manualnej pracy nad klasyfikacją wypowiedzi? (b) jak skonstruować metodykę klasyfikacji dla danych o różnorodnej jakości? (c) kiedy klasyfikacja automatyczna jest przydatna, a kiedy nie ma szans powodzenia? W artykule zaznaczone zostaną momenty, w których analityk sięga po wiedzę typową dla analiz danych jakościowych oraz te, kiedy wiedza z tego obszaru nie jest już wystarczająca do realizacji wskazanych celów (natural language processing, uczenie maszynowe). Przykład projektu będący tłem artykułu wymusił zastosowanie kilku narzędzi i języków wspierających pracę na danych. Praca nad transformacją, klasyfikacją oraz wizualizacją wyników wymagała zastosowania bazy MySQL oraz programów: R, QDA Miner, Wordstat, QlikSense. Roli i ograniczeniom narzędzi klasy CAQDAS poświęconych zostało także kilka uwag.
Projects which we work with—large volumes of text data that are acquired from various sources and stored in a variety of formats—rise many dilemmas of a methodological nature, often require unstandardized decisions and solutions. In particular, compiling data of various quality, unstructured types, and of quan and qual nature requires dynamic strategies, ideas, and ways of analysis. The article describes an example of this approach. It shows its value in classification of written statements. In such context, the author of the article faces the following objectives: (a) can we use CAQDASso that semiautomatic or automatic work would replace some manual work regarding classification of the expressions; (b) how to construct a classification methodology for data of various quality; (c) when the automatic classification is useful and when there is no chance of success? The article will be marked with moments in which the analyst reaches for knowledge typical for qualitative data analysis, and when the knowledge of this area is no longer sufficient to classify content (natural language processing, machine learning). An example of a project being the background of this article forced the use of several tools and languages to support work with the data. Work on the transformation, classification, and visualization of results required applications such as: MySQL, R, QDA Miner, WordStat, Qlik Sense. Role and limits of the computer-assisted qualitative data analysis software tools have also been noted.
Źródło:
Przegląd Socjologii Jakościowej; 2017, 13, 2; 128-143
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
CAQDAS a badania jakościowe w praktyce
CAQDAS and Qualitative Research Practice
Autorzy:
Bryda, Grzegorz
Powiązania:
https://bibliotekanauki.pl/articles/623021.pdf
Data publikacji:
2014
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
CAQDAS
technologie informatyczne
analiza danych
badania jakościowe
styl analizy danych
metody mieszane (mixed methods)
information technology
data analysis
qualitative research
style of data analysis
mixed methods
Opis:
Celem artykułu jest refleksja metodologiczna nad dialektyczną relacją pomiędzy procesem badawczym a procesem wspomaganej komputerowo analizy danych jakościowych. Na podstawie długoletniego doświadczenia w korzystaniu z różnych narzędzi CAQDAS autor stara się ukazać ich wpływ na zmianę sposobu myślenia o metodologii, procesie analizy danych i prowadzeniu terenowych badań jakościowych. Specyfika użycia CAQDAS w praktyce badawczej wymaga swoistego rygoryzmu metodologicznego w procesie gromadzenia i archiwizacji danych oraz dokładności i precyzji w procesie kodowania, analizy i wizualizacji danych jakościowych. Zastosowanie komputerowej analizy danych jakościowych w praktyce badawczej kształtuje nie tylko ramy interpretacji socjologicznej, ale przede wszystkim zmienia optykę i sposób percepcji problemów badawczych. Istotą tego procesu jest swoista interakcja pomiędzy nowymi technologiami a tradycyjną metodologią analizy danych i prowadzenia badań jakościowych. W tym sensie korzystanie z CAQDAS w praktyce badań jakościowych kształtuje osobowość i tożsamość badacza jakościowego, jego styl pracy i warsztat analityczno-badawczy oraz sprzyja rozwijaniu nowych umiejętności analitycznych i informatycznych, bez których trudno wyobrazić sobie współczesne jakościowe badania socjologiczne.
The purpose of this article is methodological reflection on dialectical relationship between the qualitative research process and the process of computer-assisted qualitative data analysis. Basing on many years of experience in the work with various CAQDAS tools, the author tries to show the impact they have on shifting the way of thinking on methodology, the process of data analysis and conducting qualitative research. The specificity of CAQDAS usage in research practice requires methodological rigor in the process of collection and archiving of data, as well as the accuracy and precision in the process of coding, analyzing, and visualizing data. The use of computer-aided analysis of qualitative data in research practice not only shapes a framework for the sociological interpretation but also changes the way of perceiving research problems. The essence of this process is a specific interaction between new technologies and traditional methodology, data analysis, and qualitative research. In this sense, the use of CAQDAS in qualitative research practice is shaping the personality and identity of qualitative researcher, his/her style of work, data analysis, and conducting the fieldwork; it develops his or her new analytical and computer skills without which it is difficult to imagine a modern qualitative sociological research.
Źródło:
Przegląd Socjologii Jakościowej; 2014, 10, 2; 12-38
1733-8069
Pojawia się w:
Przegląd Socjologii Jakościowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Small Area Estimation Under a Mixture Model
Autorzy:
Chandra, Hukum
Bathla, HVL
Sud, U.C.
Powiązania:
https://bibliotekanauki.pl/articles/465788.pdf
Data publikacji:
2010
Wydawca:
Główny Urząd Statystyczny
Tematy:
Linear mixed model
Small area estimation
EBLUP
Zero-inflated data
mixture model
Opis:
Small area estimation (SAE) under a linear mixed model may not be efficient if data contain substantial proportion of zeros than would be expected under standard model assumptions (hereafter zero-inflated data). We discuss the SAE for zero-inflated data under a mixture model (Fletcher et al., 2005 and Karlberg, 2000) that account for excess zeros in the data. Our results from simulation studies show that mixture model based approach for SAE works well and produces an efficient set of small area estimates. An application to real survey data from the National Sample Survey Organisation of India demonstrates the satisfactory performance of the approach.
Źródło:
Statistics in Transition new series; 2010, 11, 3; 76-89
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Assessment of mixed network processes with shared inputs and undesirable factors
Autorzy:
Nematizadeh, Maryam
Amirteimoori, Alireza
Kordrostami, Sohrab
Vaez-Ghasemi, Mohsen
Powiązania:
https://bibliotekanauki.pl/articles/406305.pdf
Data publikacji:
2020
Wydawca:
Politechnika Wrocławska. Oficyna Wydawnicza Politechniki Wrocławskiej
Tematy:
network data envelopment analysis
parallel-series mixed networks
weak disposability
undesirable factors
ranking
Opis:
In the real world, there are processes whose structures are like a parallel-series mixed network. Network data envelopment analysis (NDEA) is one of the appropriate methods for assessing the performance of processes with these structures. In the paper, mixed processes with two parallel and series components are considered, in which the first component or parallel section consists of the shared inputs, and the second component or series section consists of undesirable factors. By considering the weak disposability assumption for undesirable factors, a DEA approach as based on network slackbased measure (NSBM) is introduced to evaluate the performance of processes with mixed structures. The proposed model is illustrated with a real case study. Then, the model is developed to discriminate efficient units.
Źródło:
Operations Research and Decisions; 2020, 30, 1; 97-118
2081-8858
2391-6060
Pojawia się w:
Operations Research and Decisions
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On some calibration estimators of subpopulation total for longitudinal data
Autorzy:
Żądło, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/657601.pdf
Data publikacji:
2011
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
longitudinal data
general linear mixed model
empirical best linear unbiased predictor
calibration estimators
Opis:
The problem of modeling longitudinal profiles is considered assuming that the population and elements affiliation to subpopulation may change in time. The considerations are based on a model with auxiliary variables for longitudinal data with subject specific (in this case - element and subpopulation specific) random components (compare Verbeke, Molenberghs, 2000; Hedeker, Gibbons, 2006) which is a special case of the General Linear Mixed Model. In the paper calibration estimators of subpopulation total for data from one period are presented and some modifications for the case of longitudinal data are proposed. Design-based mean squared errors and its estimators are also presented. In the simulation study accuracy of the estimators is compared with Horvitz-Thomson estimator and the best empirical linear unbiased predictor derived for the considered model.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2011, 252
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Percentile-Adjusted Estimation of Poverty Indicators for Domains Under Outlier Contamination
Autorzy:
Veijanen, Ari
Lehtonen, Risto
Powiązania:
https://bibliotekanauki.pl/articles/466042.pdf
Data publikacji:
2011
Wydawca:
Główny Urząd Statystyczny
Tematy:
small area estimation
poverty indicator
income data
bias correction
auxiliary information
mixed model
prediction
Opis:
Traditional estimation of poverty and inequality indicators, such as the Gini coefficient, for regions does not currently use auxiliary information or models fitted to income survey data. A predictor-type estimator constructed from ordinary mixed model predictions is not necessarily useful, as the predictions have too small spread for estimation of income statistics. Ordinary bias corrections are aimed at correcting the expectation of predictions, but poverty indicators would not be affected at all by a correction involving multiplication of predictions. We need a method improving the shape of the distribution of predictions, as poverty indicators describe differences of income between people. We therefore introduce a transformation bringing the percentiles of transformed predictions closer to the percentiles of sample values. The experiments show that the transformation results in smaller MSE of a predictor. If unit-level data from population are not available, the marginal domain frequencies of qualitative auxiliary variables can be successfully incorporated into a new calibration-based predictor-type estimator. The results are based on design-based simulation experiments where we use a population generated from an EU-wide income survey. The study is a part of the AMELI project funded by the European Union under the Seventh Framework Programme for research and technological development (FP7).
Źródło:
Statistics in Transition new series; 2011, 12, 2; 345-356
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Dobór progów łączenia strat pochodzących z różnych źródeł w ryzyku operacyjnym
The strategies of combining loss data from different sources in operational risk
Autorzy:
Karwański, Marek
Grzybowska, Urszula
Powiązania:
https://bibliotekanauki.pl/articles/587450.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Łączenie danych wewnętrznych i zewnętrznych
Metody estymacji parametrów rozkładów prawdopodobieństwa
Rozkłady hybrydowe
Ryzyko operacyjne
Internal and external data
Operational risk
Probability mixed distributions
Opis:
Banki do obliczeń ryzyka operacyjnego wykorzystują metodologię LDA (Loss Distribution Approach) polegającą na estymacji rozkładów prawdopodobieństwa strat. Rozkłady hybrydowe są bardzo atrakcyjną alternatywą dla wieloparametrycznych modeli rozkładów stosowanych w praktyce. Tym niemniej rodzą szereg problemów natury technicznej. Na podstawie przykładów przeliczonych w artykule zaprezentowane zostały rozwiązania w dziedzinie budowy estymatorów, które mogą być stosowane w praktyce.
Banks use LDA (Loss Distribution Approach) method to estimate loss probability distributions. Mixed distributions are a very attractive alternative to multiparameter distribution models currently used. However, this approach gives rise to a number of technical problems. Based on the real life examples the suitable solutions are presented.
Źródło:
Studia Ekonomiczne; 2018, 364; 99-113
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Zmiany masy odpadów komunalnych zebranych z gospodarstw domowych poszczególnych województw
Change in the mass of municipal waste collected from households in individual voivodships
Autorzy:
Zbroński, D.
Powiązania:
https://bibliotekanauki.pl/articles/400468.pdf
Data publikacji:
2017
Wydawca:
Polskie Towarzystwo Inżynierii Ekologicznej
Tematy:
odpady komunalne
gospodarstwa domowe
masa odpadów zebranych
odpady zmieszane
odpady zebrane selektywnie
województwa
dane szacunkowe
municipal waste
households
mass of waste collected
mixed waste
selected waste
voivodships
estimated data
Opis:
W pracy przeprowadzono analizę zmiany masy odpadów komunalnych zebranych w gospodarstwach domowych poszczególnych województw, po przystąpieniu Polski do struktur Unii Europejskiej. W latach 2005-2015 szacowana masa odpadów zebranych w kraju kształtowała się na poziomie około 10 mln Mg/rok, z czego 72% stanowiły odpady pochodzące z gospodarstw domowych, 23% odpady z sektora publiczno-handlowego, a 5% odpady z usług komunalnych. W okresie tym w Polsce zebrane ogółem odpady komunalne w gospodarstwach domowych pozyskano w 89% ze strumienia odpadów zmieszanych i w 11% ze strumienia odpadów zebranych selektywnie. Na podstawie danych GUS ustalono w pracy ogólne i okresowe zmiany masy zmieszanych oraz selektywnie zebranych odpadów komunalnych w gospodarstwach domowych. Najwięcej zmieszanych odpadów komunalnych zebrano w woj. mazowieckim (15%), a najmniej w woj. świętokrzyskim (2%), natomiast najwięcej selektywnie zebranych odpadów komunalnych pozyskano w woj. śląskim (17%), a najmniej w woj. podlaskim (2%). W pracy ustalono także maksymalne wskaźniki okresowego i rocznego tempa zmiany masy zebranych odpadów w poszczególnych województwach w latach 2005-2015. Największy wzrost okresowego tempa zmiany masy zmieszanych odpadów komunalnych stwierdzono w woj. małopolskim (26%), a największy spadek w woj. świętokrzyskim (–15%), natomiast największy wzrost okresowego tempa zmiany masy selektywnie zebranych odpadów komunalnych stwierdzono w woj. łódzkim (22-krotny), a najmniejszy wzrost w woj. opolskim (5-krotny).
The evaluation of change in the mass of municipal waste collected in households of individual voivodships, after Poland accession to the European Union was realized in the paper. The estimated mass of waste collected in Poland was about 10 million tonnes per year, 72% of which was from household waste, 23% came from public and commercial waste and 5% originated from municipal services in the years 2005–2015. At the time in Poland, total municipal waste collected in households was resulting in 89% of the mixed waste stream and in 11% of the selected waste stream. The general and periodic changes in the mass of mixed and selected municipal waste collected in households were analyzed on the basis of data by Central Statistical Office. The greatest amount mixed municipal waste was collected in the Masovian Voivodship (15%) and the least in Świętokrzyskie Voivodship (2%), but the majority selected municipal waste was collected in the Silesian Voivodship (17%), whole the least amount – in Podlasie Voivodship (2%). In addition, the maximum periodic and annual rates of change in the mass of collected waste in individual voivodships the years 2005–2015 have also been determined. The greatest increase in the periodic rate of change in the mass of mixed municipal waste was recorded in the Lesser Poland Voivodship (26%) and the biggest decrease in the Świętokrzyskie Voivodship (-15%), while the greatest increase in the periodic rate of change in the mass of selected municipal waste was found in the Lodz Voivodship (22 times) and the smallest increase in the Opole Voivodship (5 times).
Źródło:
Inżynieria Ekologiczna; 2017, 18, 6; 52-62
2081-139X
2392-0629
Pojawia się w:
Inżynieria Ekologiczna
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Using Big Data in Innovation Research
Używanie Big Data w badaniach nad innowacjami
Autorzy:
Nawojczyk, Maria
Królewski, Jarosław
Powiązania:
https://bibliotekanauki.pl/articles/577410.pdf
Data publikacji:
2016-09
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
Big Data
social sciences computing
analysis in real time
social innovation
social change
model to study innovations
Mixed-Methods Research
informatyka społeczna
analiza w czasie rzeczywistym
innowacje społeczne
zmiana społeczna
model badania innowacji
łączone metody badawcze
Opis:
One of the major contemporary trends revolutionizing social-sciences computing is, inter alia, the so-called Big Data effect, meaning fast and multidimensional analyses of large volumes of data. Technologies related to Big Data (Volume, Velocity, Variety) have considerable impact on the tools of contemporary sociologists, providing them with immense data resources in real time. Big Data is a term encompassing all data, the analysis of which may bring quantifi able benefi ts, not only in terms of business but also in science and research. Modern technologies change and greatly impact the methodology of research conducted, giving rise to numerous questions and doubts both strictly methodological and ethical in nature. One of the main challenges related to Big Data is the possibility of using large data agglomerates as early as at the stage of conceptualizing and operationalizing the subject of social-sciences computing. The possibility of transforming raw data into pieces of information, and then into knowledge, may soon become an indispensable and desirable element applied in social engineering in establishing the practical applications of research and in predicting future social phenomena. The latter could be particularly useful in such an important and sensitive fi eld as innovation research. Two cases of innovation: a social and technological ones are discussed in the paper. Using these two cases we will present a model of analyzing innovations in real time. The proposed model is a new approach to study innovations.
Jednym z głównych, współczesnych trendów przynoszących rewolucyjne zmiany w informatyce społecznej jest efekt Big Data, czyli szybkiej wielowymiarowej analizy wielkich zbiorów danych. Technologie związane z Big Data mają znaczący wpływ na narzędzia badawcze jakimi mogą posługiwać się współcześni socjologowie. Dają im one możliwość dostępu do źródeł danych w czasie rzeczywistym. Big Data to termin odnoszący się do wszystkich danych, których analiza może przynieść policzalne efekty, zarówno w kategoriach ekonomicznych jak i badawczych. Nowe technologie wpływają w znaczącym stopniu na metodologię badań, przynosząc szereg pytań i wątpliwości tak natury metodologicznej jak i etycznej. Jednym z wyzwań związanych z Big Data jest możliwość posługiwania się wielkimi zbiorami danych na wczesnych etapach konceptualizacji i operacjonalizacji problemów i hipotez badawczych. Przekształcanie surowych danych w informacje i wiedzę stanie się nieodłącznym elementem nie tylko inżynierii społecznej ale również praktyki badawczej dającej lepsze możliwości predykcyjne naukom społecznym niż to miało miejsce dotychczas. Te możliwości wydają się szczególnie użyteczne w badaniach nad innowacjami. Przedstawiamy je w szczegółach na dwóch przykładach innowacji – jednej technologicznej i drugiej społecznej. Przykłady te służą nam do zaprezentowania modelu, który stanowi nowe podejście do badania innowacji
Źródło:
Zagadnienia Naukoznawstwa; 2016, 52, 4(210); 431-450
0044-1619
Pojawia się w:
Zagadnienia Naukoznawstwa
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies