Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Models" wg kryterium: Temat


Tytuł:
Hierarchical Log-linear Models for Contingency Tables
Hierarchiczne modele logarytmiczno-liniowe dla tablic kontyngencji
Autorzy:
Brzezińska, Justyna
Powiązania:
https://bibliotekanauki.pl/articles/906850.pdf
Data publikacji:
2012
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
log-linear models
hierarchical log-linear models
AIC
BIC
Opis:
Log-linear models are widely used for qualitative data in multidimensional contingency tables. Hierarchical log-linear models are models that include all lower-order terms composed from variables contained in a higher-order model term. The starting point is a saturated model, then homogenous associations, conditional independence and complete independence. There are several statistics that help to choose the best model. The first is the likelihood ratio approach, next is AIC and BIC information criteria. In R software there is loglm() function in MASS library and glm in stats library. The first approach is presented in this paper
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2012, 269
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
MAKING MOST OF MOVING AVERAGE MODELS DURING STOCK MARKET ANALYSIS – SELECTION OF THE MODEL AND TIME PERIOD
Autorzy:
Letkowski, Dariusz
Powiązania:
https://bibliotekanauki.pl/articles/654255.pdf
Data publikacji:
2014
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
investment
moving average models
Opis:
Technical analysis rely on assumption that analysis of past market performance provides possibility for proper stock price forecasting, in particular by identification of buy and sell signals. The article describe main moving average models: simple moving average, weighted moving average and exponential moving average and manner of theirs usage while constructing investment strategy on financial market. The article outlines possibilities and limitations of moving averages usage in investment practice. In addition empirical verification of moving averages is provided for selected polish shares forming index WIG20.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2014, 2, 301
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Trends in Cigarettes Consumption in Poland According to Expotential Smoothing and Autoregressive Models
Badanie tendencji spożycia papierosów w Polsce z wykorzystaniem modeli wyrównania 359 wykładniczego i modeli autoregresyjnych
Autorzy:
Jałowiecka, Ewa
Jałowiecki, Piotr
Orłowski, Arkadiusz
Powiązania:
https://bibliotekanauki.pl/articles/906283.pdf
Data publikacji:
2009
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
cigarettes consumption
forecasting
expotential smoothing models
autoregressive models
comer methods
prewhitening technique
Opis:
Polski przemysł wyrobów tytoniowych przechodzi w ostatnich latach znaczące przemiany związane z akcesją Polski do Unii Europejskiej. Stanowi on ważny sektor polskiej gospodarki generując 7,5% dochodów budżetu państwa. W pracy porównano prognozy spożycia papierosów w latach 2006-2010 przygotowane w oparciu o wybrane modele wyrównywania wykładniczego oraz autoregresyjne na podstawie danych historycznych z lat 1995-2005. Główną uwagę skoncentrowano na trendzie w prognozach. Identyfikację modeli autoregresyjnych przeprowadzono przy użyciu metod typu „corner” oraz rozszerzonej funkcji autokorelacji. W celu zwiększenia wiarygodności, prognozy przygotowano z uwzględnieniem zidentyfikowanych wartości odstających. Uzyskane wyniki porównano z danymi szacunkowymi uzyskanymi z Głównego Urzędu Statystycznego oraz z wynikami prognoz uwzględniających jako dodatkową zmienną produkcję papierosów przygotowanymi z zastosowaniem techniki „prewhitening”. Przeprowadzono dyskusję zalet i wad zastosowanych metod.
Polish tobacco industry has been recently changing significantly due to accession of Poland to EU. It is one of the prime sector of polish economy. It generates every year about 7% of budget incomes on average. The aim of this paper is to compare some forecast methods of cigarettes consumption in 2006-2010. The models used exponential smoothing and autoregression theory. The forecasts were estimated on historical data from 1995-2005. The main attention was focused on the trends in prediction. Identification, the most crucial stage in fitting autoregressive models exploited different approach such as the comer method and extended sample autocorrelations. The outlier selection techniques were also applied to get more reliable estimates. The results were compared to the predicted values obtained from Central Statistical Office and to the results of forecasts taking cigarettes production into consideration due to prewhitening technique. The advantages and drawbacks of different methods are discussed.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2009, 228
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Gradient Boosting in Regression
Gradientowa odmiana metody boosting w analizie r e g r e s ji
Autorzy:
Gatnar, Eugeniusz
Powiązania:
https://bibliotekanauki.pl/articles/904716.pdf
Data publikacji:
2005
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
tree-based models
regression
boosting
Opis:
Szeroko stosowane w praktyce metody nieparametryczne wykorzystujące tzw. drzewa regresyjne mają jedną istotną wadę. Otóż wykazują one niestabilność, która oznacza, że niewielka zmiana wartości cech obiektów w zbiorze uczącym może prowadzić do powstania zupełnie innego modelu. Oczywiście wpływa to negatywnie na ich trafność prognostyczną. Tę wadę można jednak wyeliminować, dokonując agregacji kilku indywidualnych modeli w jeden. Znane są trzy metody agregacji modeli i wszystkie opierają się na losowaniu ze zwracaniem obiektów ze zbioru uczącego do kolejnych prób uczących: agregacja bootstrapowa (boosting), losowanie adaptacyjne (bagging) oraz metoda hybrydowa, łącząca elementy obu poprzednich. W analizie regresji szczególnie warto zastosować gradientową, sekwencyjną, odmianę metody boosting. W istocie polega ona wykorzystaniu drzew regrcsyjnych w kolejnych krokach do modelowania reszt dla modelu uzyskanego w poprzednim kroku.
The successful tree-based methodology has one serious disadvantage: lack of stability. That is, regression tree model depends on the training set and even small change in a predictor value could lead to a quite different model. In order to solve this problem single trees are combined into one model. There are three aggregation methods used in classification: bootstrap aggregation (bagging), adaptive resample and combine (boosting) and adaptive bagging (hybrid bagging-boosting procedure). In the field of regression a variant of boosting, i.e. gradient boosting, can be used. Friedman (1999) proved that boosting is equivalent to a stepwise function approximation in which in each step a regression tree models residuals from last step model.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2005, 194
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Minimax estimation in linear models
Estymacja minimax w modelach liniowych
Autorzy:
Drygas, Hilmar
Powiązania:
https://bibliotekanauki.pl/articles/905020.pdf
Data publikacji:
1993
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
Linear models
minimax estimation
BLME
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 1993, 132
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Bayesian Analysis of Dynamic Conditional Correlation Using Bivariate GARCH Models
Bayesowska analiza dynamicznej korelacji warunkowej z wykorzystaniem dwuwymiarowych modeli GARCH
Autorzy:
Osiewalski, Jacek
Pipień, Mateusz
Powiązania:
https://bibliotekanauki.pl/articles/907620.pdf
Data publikacji:
2005
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
model comparison
Bayes factors
multivariate GARCH processes
BEKK models
DCC models
exchange rates
Opis:
Multivariate ARCH-typc specifications provide a theoretically promising framework for analyses of correlation among financial instruments because they can model time-varying conditional covariance matrices. However, general VechGARCH models are too heavily parameterized and, thus, impractical for more than 2- or 3-dimensional vector lime series. A simple t-BEKK(l.l) specification seems a good compromise between parsimony and generality. Unfortunately, Bollerslev’s constant conditional correlation (CCC) model cannot be nested within VECH or BEKK GARCH structures. Recently, Engle (2002) proposed a parsimoniously parameterized generalization of the CCC model; this dynamic conditional correlation (DCC) specification may outperform many older multivariate GARCH models. In this paper we consider Bayesian analysis of the conditional correlation coefficient within different bivariate GARCH models, which are compared using Bayes factors and posterior odds. For daily growth rales of PLN/USD and PLN/DEM (6.02.1996-28.12.2001) we show that the t-BEKK(l, 1) specification fits the bivariate series much better than DCC models, but the posterior means of conditional correlation coefficients obtained within different models are very highly correlated.
Wielowymiarowe specyfikacje ty^pu ARCH stanowią teoretycznie obiecujące ramy dla analiz skorelowania instrumentów finansowych, ponieważ umożliwiają modelowanie zmiennych w czasie macierzy warunkowych kowariancji. Jednak ogólne modele VechGARCH mają zbyt wiele parametrów, są więc niepraktyczne w przypadku więcej niż 2- lub 3-wymiarowych wektorowych szeregów czasowych. Prosta specyfikacja t-BEKK(1,1) wydaje się dobrym kompromisem pomiędzy oszczędnością parametryzacji i ogólnością modelu. Niestety model stałych korelacji warunkowych (CCC) Boilersleva nie jest szczególnym przypadkiem struktur VECH czy BEKK. Ostatnio Englc (2002) zaproponował oszczędnie sparametryzowane uogólnienie modelu CCC; ta specyfikacja o dynamicznej korelacji warunkowej (DCC) może zdominować wiele starszych wielowymiarowych modeli GARCH. W artykule rozważamy bayesowską analizę warunkowego współczynnika korelacji w ramach różnych dwuwymiarowych modeli GARCH, które są porównywane przy użyciu czynników Bayesa i ilorazów szans a posteriori. Dla dziennych stóp zmian kursów PLN/USD i PLN/DEM (6.02.1996 - 28.12.2001) wykazuje się, że specyfikacja t-BEKK(l.l) opisuje dwuwymiarowy szereg czasowy znacznie lepiej niż modele DCC. Jednak wartości oczekiwane a posteriori warunkowych współczynników korelacji, uzyskane w ramach różnych modeli, są bardzo silnie skorelowane.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2005, 192
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Random Selection of Variables for Aggregated Tree-Based Models
Zastosowanie losowego doboru zmiennych w agregacji drzew klasyfikacyjnych
Autorzy:
Gatnar, Eugeniusz
Rozmus, Dorota
Powiązania:
https://bibliotekanauki.pl/articles/905698.pdf
Data publikacji:
2006
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
Tree-based models
aggregation
RandomForest
Opis:
Tree-based models are popular a widely used because they are simple, flexible and powerful tools for classification. Unfortunately they are not stable classifiers. Significant improvement of the model stability and prediction accuracy can be obtained by aggregation of multiple classification trees. Proposed methods, i.e. bagging, adaptive bagging, and arcing are based on sampling cases from the training set while boosting uses a system of weights for cases. The result is called committee of trees, an ensemble or a forest. Recent developments in this field showed that randomization (random selection of variables) in aggregated tree-based classifiers leads to consistent models while boosting can overfit. In this paper we discuss optimal parameter values for the method of random selection of variables (RandomForest) for an aggregated tree-based model (i.e. number of trees in the forest and number of variables selected for each split).
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2006, 196
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Statistical Models for Corporate Credit Risk Assessment – Rating Models
Modele statystyczne do oceny ryzyka kredytowego przedsiębiorstw – modele ratingowe
Autorzy:
Ptak-Chmielewska, Aneta
Powiązania:
https://bibliotekanauki.pl/articles/657890.pdf
Data publikacji:
2016
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
modele statystyczne
modele ratingowe
analiza historii zdarzeń
statistical models
rating models
event history analysis
Opis:
Dostrzegając słabość modeli opartych na funkcji dyskryminacyjnej Z-score zaproponowanej przez Altmana w warunkach gospodarki polskiej podjęto w latach 90. próby dostosowania tych modeli do realiów gospodarki post-komunistycznej. Początkowe zainteresowanie modelami wielowymiarowej analizy dyskryminacyjnej poszerzono o modele regresji logistycznej a później również o sieci neuronowe i drzewa decyzyjne. W ostatnich latach podjęto również próby zastosowania modeli analizy historii zdarzeń. Modele ratingowe oparte na wypracowanych modelach upadłości stanowią kluczowy element w zarządzaniu ryzykiem kredytowym. W artykule podjęto próbę krytycznej oceny stosowanych metod statystycznych oraz wskazano na zalety i wady różnych podejść do budowy modeli. Przeprowadzono porównawczą analizę empiryczną na próbie przedsiębiorstw. Wskazano na możliwość wykorzystania modeli statystycznych do oceny ryzyka kredytowego przedsiębiorstw (modele ratingowe).
Taking into consideration the weakness of the models based on discrimination function (Z-score) proposed by Altman within the conditions of polish economy some attempts were taken in the 90s to adjust these models to the reality of post-communist economy. The initial interest in the models of multivariate discriminant analysis was extended by logistic regression models and then also by neural networks and decision trees. In the recent years some attempts were also taken to apply models of the event history analysis. Rating models based on developed bankruptcy risk models are basic element in credit risk management. Paper focuses on the critical assessment of statistical methods applied and points out the advantages and disadvantages of various approaches toward the estimation of models. Empirical comparative analysis were conducted based on the sample of enterprises. The possible application of statistical models in credit risk assessment of enterprises (rating models) was pointed out.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2016, 3, 322
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Forecasting Returns Using Threshold Models
Wykorzystanie modeli progowych do prognozowania stóp zwrotu
Autorzy:
Jeziorska-Pąpka, Monika
Osińska, Magdalena
Witkowski, Maciej
Powiązania:
https://bibliotekanauki.pl/articles/907603.pdf
Data publikacji:
2005
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
threshold models
foreasting
Monte Carlo
bootstrap
Opis:
In this paper we present the problem of forecasting efficiency of the TAR models. Three methods of forecasting are considered to compare their accuracy: the Monte Carlo method, and the two versions the bootstrap technique. The basic models are two- or three- regimes stationary threshold autoregressive models with the endogenous or exogenus switching variable. The time series set consists of the weekly stock returns of the banking sector quoted at the Warsaw Stock Exchange.
Celem artykułu jest porównanie metod prognozowania nieliniowych modeli progowych. Wykorzystane zostały dwie metody prognozowania: metoda bootstrap w dwóch wariantach oraz metoda Monte Carlo. Przedmiotem analizy są tygodniowe stopy zwrotu spółek sektora bankowego, notowanych na GPW w Warszawie. W konkluzji stwierdza się, że przewidywanie dokładnych wartości stóp zwrotu jest bardzo trudne, natomiast modele progowe dają bardzo dobre wyniki w zakresie przewidywania kierunków zmian w przyszłości.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2005, 192
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On Estimation of a Quantity of Base Models with Parametric z and Permutation Tests
O szacowaniu liczby modeli bazowych za pomocą testów parametrycznych i permutacyjnych
Autorzy:
Stelmach, Jacek
Powiązania:
https://bibliotekanauki.pl/articles/904555.pdf
Data publikacji:
2013
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
permutation tests
aggregation models
regression methods
Opis:
One of the crucial problems in multiple-model approach of the regression is estimation of optimal number of base models. If the quantity is too low – it increases the prediction error whereas too high number of models increases time and complication of calculations. Unfortunately, the estimation of the quantity of base models based on the analysis of prediction error can lead to its overestimation. This paper proposes a formal approach where the predictions obtained with the models aggregated from different number of base models are compared. In this approach both: parametric and permutation tests were applied with the empirical data from petroleum industry.
Jednym z kluczowych problemów w wielomodelowym podejściu do zagadnienia regresji jest estymacja optymalnej ilości modeli bazowych. Jeśli ich ilość jest zbyt mała – rośnie błąd predykcji, zbyt duża ilość powiększa czas i komplikację obliczeń. Niestety estymacja tej ilości na podstawie analizy błędu predykcji może prowadzić do jej przeszacowania. W artykule proponuje się formalne podejście, w którym porównywane są wyniki prognoz otrzymanych z modeli zagregowanych z różnej liczby modeli bazowych. W tym przypadku wykorzystane zostały zarówno testy parametryczne jak i testy permutacyjne, a jako dane testowe: dane empiryczne wykorzystywane w przemyśle rafineryjnym.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2013, 286
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
THE METHODS OF FORECASTING OF CHANGES OF MUNICIPAL WASTE PRODUCTION IN CASE OF CITIES
Autorzy:
Cheba, Katarzyna
Powiązania:
https://bibliotekanauki.pl/articles/655807.pdf
Data publikacji:
2014
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
forecasting
municipal waste
regression models
cities
Opis:
Waste management is currently one of the most important problems of the functioning of densely populated areas, important in the case of cities. The main problem of waste management is to break a simple correlation between economic growth and the increase in the amount of waste. Forecasting of amount of municipal waste generation on the basis of previously applied methods in the situation of large changes in socio-economic environment turns out to be inaccurate approach. In the literature a wide variety of geographically diverse factors are proposed for this purpose. This paper presents the results of modeling and forecasting of municipal waste generation changes in cities.  In this study, the impact of the various socio-economic factors for the municipal waste production was tested.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2014, 3, 302
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Modelling the Duration of the First Job Using Bayesian Accelerated Failure Time Models
Modelowanie czasu trwania pierwszej pracy z wykorzystaniem Bayesowskich modeli przyspieszonej porażki AFT
Autorzy:
Grzenda, Wioletta
Powiązania:
https://bibliotekanauki.pl/articles/655081.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
parametryczne modele przeżycia
modele AFT
podejście Bayesowskie
MCMC
zatrudnienie
parametric survival models
AFT models
the Bayesian approach
employment
Opis:
W niniejszym artykule poddano analizie czas trwania pierwszej pracy osób w wieku 18–30 lat. Celem badania jest znalezienie rozkładu, który najlepiej opisuje badane zjawisko. W modelowaniu wykorzystano modele przyspieszonej porażki AFT w ujęciu Bayesowskim. Wykorzystanie podejścia Bayesowskiego rozszerzyło dotychczasowe badania przez możliwość uwzględnienia w badaniu informacji a priori oraz umożliwiło porównywanie rozkładów parametrów modeli. Ponadto dało możliwość porównania mocy wyjaśniającej konkurencyjnych modeli na gruncie teorii Bayesowskiej. Z wykorzystaniem zaproponowanych metod porównano czas trwania pierwszej pracy dla kobiet i mężczyzn.
In this paper, the duration of the first job of young people aged 18–30 has been analyzed. The aim of the work is to find the distribution which best describes the investigated phenomenon. Bayesian accelerated failure time models have been used for modelling. The use of the Bayesian approach made it possible to extend past research. More precisely, prior information could be included in the study, which let us compare distributions of model parameters. Moreover, the comparison of explanatory power of competing models based on the Bayesian theory was possible. The duration of the first job for men and women was also compared using the abovementioned methods.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2017, 4, 330
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On the usefulness of regularization ideas of estimation: the linear model case
O użyteczności idei regularyzacji przy estymacji modeli liniowych
Autorzy:
Milo, Władysław
Powiązania:
https://bibliotekanauki.pl/articles/905021.pdf
Data publikacji:
1993
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
linear models
regularization
ill-conditioning
regularizing estimators
Opis:
Celem artykułu jest pokazanie czytelnikowi użyteczności idei regularyzacji w zmniejszaniu lub dużej redukcji negatywnych skutków występowania złego uwarunkowania danych. Skutki te obserwowano w samym estymatorze metody najmniejszych kwadratów jak i jego statystycznych i numerycznych charakterystykach. Podstawowe analizowane charakterystyki tego estymatora to: MSE, wariancja, próbkowe odchylenie standardowe, próbkowy współczynnik korelacji wielokrotnej (inaczej: współczynnik determinacji), statystyki testu t-Studenta oraz testu F. Zbadano też skutki estymacyjne przeprowadzania takich operacji jak centrowanie, ważenie danych. W celu zmniejszenia negatywnych skutków złego uwarunkowania proponuje się stosowanie estymatorów regulaiyzujących. W omawianym modelu są one zgodne i asymptotycznie normalne.
In the paper we present an analysis of negative effects of ill-condltioning for the performance of LSE. These results will be observed through the behaviour of LSE's variance, MSE, sample standard deviation, sample multiple correlation coefficient., F and t-statistics. We also include some results on ill-conditioning effects induced by data centering, weighting. To overcome those negative effects we propose now versions of regularization criteria for the linear model case. The resultant regularising estimators are consistent and asymptotically normal.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 1993, 132
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Feature Selection and Multiple Model Approach in Discriminant Analysis
Dobór zmiennych a podejście wielomodelowe w analizie dyskryminacyjnej
Autorzy:
Gatnar, Eugeniusz
Powiązania:
https://bibliotekanauki.pl/articles/906874.pdf
Data publikacji:
2007
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
tree-based models
aggregation
feature selection
random subspaces
Opis:
Significant improvement of model stability and prediction accuracy in classification and regression can be obtained by using the multiple model approach. In classification multiple models are built on the basis of training subsets (selected from the training set) and combined into an ensemble or a committee. Then the component models (classification trees) determine the predicted class by voting. In this paper some problems of feature selection for ensembles will be discussed. We propose a new correlation-based feature selection method combined with the wrapper approach.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2007, 206
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On Model Selection in Some Regularized Linear Regression Methods
O wyborze postaci modelu w wybranych metodach regularyzowanej regresji liniowej
Autorzy:
Kubus, Mariusz
Powiązania:
https://bibliotekanauki.pl/articles/905647.pdf
Data publikacji:
2013
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
model selection
EDC
regularization
linear models
feature selection
Opis:
A dynamic development of various regularization formulas in linear models has been observed recently. Penalizing the values of coefficients affects decreasing of the variance (shrinking coefficients to zero) and feature selection (setting zero for some coefficients). Feature selection via regularized linear models is preferred over popular wrapper methods in high dimension due to less computational burden as well as due to the fact that it is less prone to overfitting. However, estimated coefficients (and as a result quality of the model) depend on tuning parameters. Using model selection criteria available in R implementation does not guarantee that optimal model will be chosen. Having done simulation study we propose to use EDC criterion as an alternative.
W ostatnich latach można zaobserwować dynamiczny rozwój różnych postaci regularyzacji w modelach liniowych. Wprowadzenie kary za duże wartości współczynników skutkuje zmniejszeniem wariancji (wartości współczynników są ,,przyciągane” do zera) oraz eliminacją niektórych zmiennych (niektóre współczynniki się zerują). Selekcja zmiennych za pomocą regularyzowanych modeli liniowych jest w problemach wielowymiarowych preferowana wobec popularnego podejścia polegającego na przeszukiwaniu przestrzeni cech i ocenie podzbiorów zmiennych za pomocą kryterium jakości modelu (wrappers). Przyczyną są mniejsze koszty obliczeń i mniejsza podatność na nadmierne dopasowanie. Jednakże wartości estymowanych współczynników (a więc także jakość modelu) zależą od parametrów regularyzacji. Zaimplementowane w tym celu w programie R kryteria jakości modelu nie gwarantują wyboru modelu optymalnego. Na podstawie przeprowadzonych symulacji w artykule proponuje się zastosowanie kryterium EDC.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2013, 285
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies