Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "variables selection" wg kryterium: Temat


Wyświetlanie 1-7 z 7
Tytuł:
Pomiar efektów oddziaływania różnych czynników na zmienne społeczno-ekonomiczne
Measuring the Impact Effects of Various Factors on Socio-Economic Variables
Autorzy:
Landmesser, Joanna
Powiązania:
https://bibliotekanauki.pl/articles/541962.pdf
Data publikacji:
2015
Wydawca:
Główny Urząd Statystyczny
Tematy:
Statistical methods
Variables selection
Metody statystyczne
Dobór zmiennych
Opis:
Celem artykułu jest przegląd metod statystycznych, stosowanych przy szacowaniu efektu oddziaływania czynników, wskazanie zalet i wad owych metod oraz zasygnalizowanie kierunków rozwoju w tym zakresie. Z danymi nieeksperymentalnymi wiąże się problem niewłaściwego doboru próby. Rozważona zostanie selekcja próby na podstawie czynników obserwowalnych oraz nieobserwowalnych. W pierwszym przypadku praktyczne znaczenie ma estymacja efektów oddziaływania czynników przez dopasowanie, w szczególności tzw. dobieranie na podstawie prawdopodobieństwa uczestnictwa (przedstawiony w opracowaniu przykład dotyczy właśnie tej metody). W drugim wskazano propozycje rozwiązań dla sytuacji, gdy ma miejsce selekcja na podstawie czynników nieobserwowalnych, jak estymator "różnic-w-różnicach", estymacja metodą zmiennych instrumentalnych czy parametr LATE. (fragment tekstu)
The aim of this article is an overview of modern statistical methods used in estimating the treatment effects, showing their advantages and disadvantages, and to indicate the directions of development. Due to the rarely performed in economic sciences randomized experiments, attention has been focused on the analysis of non-experimental data. The problem related to this type of data is inadequate sampling. We have considered the selection on observable and unob-servable factors. The special importance of proper sample selection for the estimation of the treatment effects has been documented with an empirical example for evaluating the effectiveness of vocational training for the unemployed. Special importance of proper matching attempts to estimate the effects of the impact of certain factors documented empirical example, for evaluating the effectiveness of the training for the unemployed. (original abstract)
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2015, 9; 1-13
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
OPTIMIZATION OF THE VARIABLES SELECTION IN THE PROCESS OF REAL ESTATE MARKETS RATING
Autorzy:
Renigier-Biłozor, Małgorzata
Biłozor, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/488976.pdf
Data publikacji:
2015
Wydawca:
Instytut Badań Gospodarczych
Tematy:
real estate market rating
optimization of the variables selection
Hellwig’s method
Opis:
The growing significance of the real estate market prompts investors to search for factors and variables which support cohesive analyses of real estate markets, market comparisons based on diverse criteria and determination of market potential. The specificity of the real estate market is determined by the unique attributes of property. The Authors assume that developing real estate market ratings identifies the types of information and factors which affect decision-making on real estate markets. The main objective of real estate market ratings is to create a universal and standardized classification system for evaluating the real estate market. One of the most important problems in this area is collecting appropriate features of real estate market and development dataset. The main problem involves the selection and application of appropriate features, which would be relevant to the specificity of information related to the real estate market and create a kind of coherent system aiding the decision-making process. The main aim of this study is the optimization of set of variables that were used to develop the real estate market ratings. For this purpose, Hellwig’s method of integral capacity of information was applied. In this particular case, the method shows what set of variables provides information most sufficiently. The results lead to obtaining the necessary set of features that constitute essential information which describes the situation on the local real estate market.
Źródło:
Oeconomia Copernicana; 2015, 6, 4; 139-157
2083-1277
Pojawia się w:
Oeconomia Copernicana
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Crash data reporting systems in Fourteen Arab countries: challenges and improvement
Autorzy:
Abounoas, Zahira
Raphael, Wassim
Badr, Yarob
Faddoul, Rafic
Guillaume, Anne
Powiązania:
https://bibliotekanauki.pl/articles/1833641.pdf
Data publikacji:
2020
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
road accidents
road safety
information system
reporting system
variables selection
classification model
wypadek drogowy
bezpieczeństwo na drogach
system informacyjny
systemy raportowania
dobór zmiennych
model klasyfikacji
Opis:
Traffic crash fatalities and serious injuries still represent a big burden for most Arab countries because the actual policies, strategies, and interventions are based on poorly collected data. Through this paper, we assessed the crash data reporting systems in Fourteen Arab countries via a survey conducted to identify the fundamental dysfunctions at the management and data collection levels. Then, to address some of the dataset problems, we had applied data mining technics to select a minimum of variables (crash, vehicle, and road user) that should be collected for a better understanding of crash circumstances. For this raison, three methods of selection (correlation, information gain, and gain ratio) and seven classifiers (naive Bayes, nearest neighbour, random forest, random tree, J48, reduced error pruning tree, and bagging) were tested and compared to identify the variables that affect significantly the crashes severity. Decision trees family of classifiers showed the best performance based on the analysis of the area under the curve. The explanatory variables obtained from the data mining process were combined with other descriptive variables to maintain traceability. As a result, we produced hybrid lists of variables for the crash, vehicle, and road user, each contains 25 variables. Finally, in order to propose a cost-effective solution to switch from manual to electronic data collection, we got inspired by a tool used to track animals to create and customize a unified e-form for handheld devices, in order to ensure easy entering of the harmonized data for the entire region based on our selected lists of variables. The tool verified the countries requirements especially by enabling data collection and transfer with and without the internet, and by allowing data analysis thought its built-in Geographic Information System (GIS) capabilities.
Źródło:
Archives of Transport; 2020, 56, 4; 73-88
0866-9546
2300-8830
Pojawia się w:
Archives of Transport
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
New Method of Variable Selection for Binary Data Cluster Analysis
Autorzy:
Korzeniewski, Jerzy
Powiązania:
https://bibliotekanauki.pl/articles/466036.pdf
Data publikacji:
2016
Wydawca:
Główny Urząd Statystyczny
Tematy:
cluster analysis
market segmentation
selection of variables
binary data
k-means grouping
Opis:
Cluster analysis of binary data is a relatively poorly developed task in comparison with cluster analysis for data measured on stronger scales. For example, at the stage of variable selection one can use many methods arranged for arbitrary measurement scales but the results are usually of poor quality. In practice, the only methods dedicated for variable selection for binary data are the ones proposed by Brusco (2004), Dash et al. (2000) and Talavera (2000). In this paper the efficiency of these methods will be discussed with reference to the marketing type data of Dimitriadou et al. (2002). Moreover, the primary objective is a new proposal of variable selection method based on connecting the filtering of the input set of all variables with grouping of sets of variables similar with respect to similar groupings of objects. The new method is an attempt to link good features of two entirely different approaches to variable selection in cluster analysis, i.e. filtering methods and wrapper methods. The new method of variable selection returns best results when the classical k-means method of objects grouping is slightly modified.
Źródło:
Statistics in Transition new series; 2016, 17, 2; 295-304
1234-7655
Pojawia się w:
Statistics in Transition new series
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Dobór zmiennych niezależnych w modelowaniu procesów logistycznych metodą analizy grafów
Selection of independent variables in the modelling of logistics processes using the analysis graphs method
Autorzy:
Mróz, M.
Powiązania:
https://bibliotekanauki.pl/articles/93210.pdf
Data publikacji:
2017
Wydawca:
Akademia Sztuki Wojennej
Tematy:
metoda analizy grafów
procesy logistyczne
zmienne zależne
zmienne niezależne
dobór zmiennych
budowa modelu ekonometrycznego
graphs method analysis
logistics processes
dependent variables
independent variables
selection of variables
Opis:
Tematem artykułu jest dobór zmiennych niezależnych w modelowaniu procesów logistycznych metodą analizy grafów. Celem głównym jest teoretyczna i empiryczna analiza możliwości stosowania metody analizy grafów do doboru zmiennych niezależnych w modelach ekonometrycznych. Problem badawczy natomiast obejmował swym zasięgiem także poszukiwanie rozwiązań dotyczących uzyskania właściwych kryteriów wyboru zmiennych niezależnych spośród zmiennych kandydujących, przy wykorzystaniu właściwie stawianych i weryfikowanych hipotez zerowych. Niewątpliwym osiągnięciem zastosowania metody analizy grafów jest możliwość uzyskania macierzy współczynników korelacji liniowej Pearsona, które obrazują powiązania między poszczególnymi zmiennymi oraz pozwalają na ich podstawie wyeliminować te zmienne kandydujące, które nie są statystycznie istotne dla badanego procesu logistycznego.
The theme of the article is the selection of independent variables in the modelling of logistic processes using the analysis graphs method. The main objective is theoretical and empirical analysis of the applicability of the analysis graphs method for the selection of independent variables in econometric models. The research included seeking solutions for obtaining the appropriate criteria for the selection of independent variables of the variables candidate, using properly posed and verified hypotheses. The unquestionable achievement of the analysis graphs method is rendering it possible to obtain a matrix of correlation Pearson coefficients which illustrate the relationships between the candidate variables and allow these variables to be eliminated, which is not statistically significant for the test of the logistics process.
Źródło:
Zeszyty Naukowe Akademii Sztuki Wojennej; 2017, 3(108); 129-155
2543-6937
Pojawia się w:
Zeszyty Naukowe Akademii Sztuki Wojennej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Problem of Redundant Variables in Random Forests
Problem zmiennych redundantnych w metodzie lasów losowych
Autorzy:
Kubus, Mariusz
Powiązania:
https://bibliotekanauki.pl/articles/656761.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
lasy losowe
zmienne redundantne
dobór zmiennych
taksonomia cech
random forests
redundant variables
feature selection
clustering of features
Opis:
Lasy losowe są obecnie jedną z najchętniej stosowanych przez praktyków metod klasyfikacji wzorcowej. Na jej popularność wpływ ma możliwość jej stosowania bez czasochłonnego, wstępnego przygotowywania danych do analizy. Las losowy można stosować dla różnego typu zmiennych, niezależnie od ich rozkładów. Metoda ta jest odporna na obserwacje nietypowe oraz ma wbudowany mechanizm doboru zmiennych. Można jednak zauważyć spadek dokładności klasyfikacji w przypadku występowania zmiennych redundantnych. W artykule omawiane są dwa podejścia do problemu zmiennych redundantnych. Rozważane są dwa sposoby przeszukiwania w podejściu polegającym na doborze zmiennych oraz dwa sposoby konstruowania zmiennych syntetycznych w podejściu wykorzystującym grupowanie zmiennych. W eksperymencie generowane są liniowo zależne predyktory i włączane do zbiorów danych rzeczywistych. Metody redukcji wymiarowości zwykle poprawiają dokładność lasów losowych, ale żadna z nich nie wykazuje wyraźnej przewagi.
Random forests are currently one of the most preferable methods of supervised learning among practitioners. Their popularity is influenced by the possibility of applying this method without a time consuming pre‑processing step. Random forests can be used for mixed types of features, irrespectively of their distributions. The method is robust to outliers, and feature selection is built into the learning algorithm. However, a decrease of classification accuracy can be observed in the presence of redundant variables. In this paper, we discuss two approaches to the problem of redundant variables. We consider two strategies of searching for best feature subset as well as two formulas of aggregating the features in the clusters. In the empirical experiment, we generate collinear predictors and include them in the real datasets. Dimensionality reduction methods usually improve the accuracy of random forests, but none of them clearly outperforms the others.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2018, 6, 339; 7-16
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
New Interpretation of Principal Components Analysis
Autorzy:
Gniazdowski, Z.
Powiązania:
https://bibliotekanauki.pl/articles/91310.pdf
Data publikacji:
2017
Wydawca:
Warszawska Wyższa Szkoła Informatyki
Tematy:
determination coefficient
geometric interpretation of PCA
selection of principal components
clustering of variables
tensor data mining
anisotropy of data
współczynnik determinacji
interpretacja geometryczna
PCA
wybór głównych składników
klastrowanie zmiennych
dane tensorowe
anizotropia danych
Opis:
A new look on the principal component analysis has been presented. Firstly,ageometric interpretation of determination coefficient was shown. In turn, the ability to represent the analyzed data and their interdependencies in the form of easy-tounderstand basic geometric structures was shown. As a result of the analysis of these structures it was proposed to enrich the classical PCA. In particular, it was proposed a new criterion for the selection of important principal components and a new algorithm for clustering primary variables by their level of similarity to the principal components. Virtual and real data spaces, as well as tensor operations on data, have also been identified.The anisotropy of the data was identified too.
Źródło:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki; 2017, 11, 16; 43-65
1896-396X
2082-8349
Pojawia się w:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-7 z 7

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies