Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "dobór zmiennych" wg kryterium: Temat


Wyświetlanie 1-8 z 8
Tytuł:
Eliminacja zmiennych z wykorzystaniem marginesu
Autorzy:
Kubus, Mariusz
Powiązania:
https://bibliotekanauki.pl/articles/582615.pdf
Data publikacji:
2018
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
dobór zmiennych
najbliższe sąsiedztwo
margines
Opis:
Ważnym etapem budowy klasyfikatora jest dobór zmiennych. W metodzie k najbliższych sąsiadów, wrażliwej na zmienne nieistotne, etap ten jest niezbędny do uzyskania większej dokładności klasyfikacji. Metody doboru zmiennych, które także wykorzystują najbliższe sąsiedztwo, dokonują lokalnej oceny mocy dyskryminacyjnej zmiennych i zarazem reprezentują podejście wielowymiarowe. Część z nich wykorzystuje pojęcie marginesu (margin), definiując za jego pomocą funkcję celu i formułując zadanie ważenia zmiennych jako zadanie optymalizacji. W artykule porównano trzy algorytmy z tej grupy metod ze względu na zdolność identyfikacji zmiennych nieistotnych, dokładność klasyfikacji oraz czas pracy. Zweryfikowano też dwie własne propozycje modyfikacji. W badaniach wykorzystano zbiory danych rzeczywistych z dołączonymi zmiennymi nieistotnymi, które reprezentowały różne rozkłady, niezależne od klas.
Źródło:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu; 2018, 507; 124-132
1899-3192
Pojawia się w:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wzmacnianie zdolności predykcyjnych modeli dyskryminacyjnych przez wyodrębnianie zmiennych objaśniających z sieci neuronowych
Autorzy:
Trzęsiok, Michał
Powiązania:
https://bibliotekanauki.pl/articles/583901.pdf
Data publikacji:
2018
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
eksploracyjne metody dyskryminacji
modele hybrydowe
dobór zmiennych
Opis:
Wybór metody jest elementem decydującym o pomyślności procesu modelowania, choć jakość i dobór informacji wykorzystanych przy budowie modelu automatycznego uczenia się wydają się co najmniej tak samo ważne. Mimo zautomatyzowanego mechanizmu uczenia nie wystarczy do zbioru uczącego wrzucenie wszystkich danych, jakimi dysponujemy. Konieczne jest dostarczenie informacji istotnych. Jedną z możliwości jest dobór zmiennych do modelu. Inną jest ich przekształcanie. W artykule przedstawiono procedurę łączącą te dwa podejścia – wyodrębnianie zmiennych z wielowarstwowych sieci neuronowych jako metodę doboru zmiennych do modeli budowanych innymi metodami wielowymiarowej analizy statystycznej. Celem artykułu jest zbadanie, jak takie podejście wpływa na zdolności predykcyjne modeli. Pokazano, że technikę tę należy traktować jako jedną z metod wstępnego przetwarzania danych, którą warto wypróbować, bo może prowadzić do polepszenia zdolności predykcyjnych modelu końcowego, choć tego nie gwarantuje
Źródło:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu; 2018, 508; 227-236
1899-3192
Pojawia się w:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Pomiar efektów oddziaływania różnych czynników na zmienne społeczno-ekonomiczne
Measuring the Impact Effects of Various Factors on Socio-Economic Variables
Autorzy:
Landmesser, Joanna
Powiązania:
https://bibliotekanauki.pl/articles/541962.pdf
Data publikacji:
2015
Wydawca:
Główny Urząd Statystyczny
Tematy:
Statistical methods
Variables selection
Metody statystyczne
Dobór zmiennych
Opis:
Celem artykułu jest przegląd metod statystycznych, stosowanych przy szacowaniu efektu oddziaływania czynników, wskazanie zalet i wad owych metod oraz zasygnalizowanie kierunków rozwoju w tym zakresie. Z danymi nieeksperymentalnymi wiąże się problem niewłaściwego doboru próby. Rozważona zostanie selekcja próby na podstawie czynników obserwowalnych oraz nieobserwowalnych. W pierwszym przypadku praktyczne znaczenie ma estymacja efektów oddziaływania czynników przez dopasowanie, w szczególności tzw. dobieranie na podstawie prawdopodobieństwa uczestnictwa (przedstawiony w opracowaniu przykład dotyczy właśnie tej metody). W drugim wskazano propozycje rozwiązań dla sytuacji, gdy ma miejsce selekcja na podstawie czynników nieobserwowalnych, jak estymator "różnic-w-różnicach", estymacja metodą zmiennych instrumentalnych czy parametr LATE. (fragment tekstu)
The aim of this article is an overview of modern statistical methods used in estimating the treatment effects, showing their advantages and disadvantages, and to indicate the directions of development. Due to the rarely performed in economic sciences randomized experiments, attention has been focused on the analysis of non-experimental data. The problem related to this type of data is inadequate sampling. We have considered the selection on observable and unob-servable factors. The special importance of proper sample selection for the estimation of the treatment effects has been documented with an empirical example for evaluating the effectiveness of vocational training for the unemployed. Special importance of proper matching attempts to estimate the effects of the impact of certain factors documented empirical example, for evaluating the effectiveness of the training for the unemployed. (original abstract)
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2015, 9; 1-13
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Metody doboru zmiennych do modelu z wykorzystaniem bibliotek sztucznej inteligencji
Subset selection variables of the model using AI libraries
Autorzy:
Wołoszyn, Jacek
Powiązania:
https://bibliotekanauki.pl/articles/2197614.pdf
Data publikacji:
2021-10-15
Wydawca:
Uniwersytet Rzeszowski
Tematy:
model
sztuczna inteligencja
dobór zmiennych
artificial intelligence
subset selection
Opis:
Inwestycje w struktury informatyczne firm zaowocowały niespotykanym wzrostem posiadanych danych. Ten olbrzymi przyrost danych gromadzony praktycznie w każdym aspekcie dziedziny życia doprowadził do wzrostu zainteresowania metodami wydobywania informacji, wiedzy czy zależności. Przeprowadzając rozmyślania w kategorii analityki danych prawie zawsze należy dokonać wyboru zmiennych tak, aby każdy model w swojej końcowej postaci jak najprecyzyjniej odzwierciedlał rozważany proces. W artykule tym przedstawione zostaną najczęściej stosowane metody doboru zmiennych do modelu. Proces ten jest jednym z etapów budowy modelu i od jego przebiegu zależy w dużym stopniu końcowy efekt działania modelu.
Investments in IT structures of companies resulted in an unprecedented increase in the collected data. This enormous increase in data collected in practically every aspect of the sphere of life has led to an increased interest in the methods of extracting information, knowledge and dependencies. When thinking about data analytics, you should almost always select the data so that each model in its final form reflects the process under study as accurately as possible. In this article, the most common methods of selecting variables for the model will be presented. This process is one of the stages of model building and the final effect of the model to a large extent depends on its course.
Źródło:
Dydaktyka informatyki; 2021, 16; 143-151
2083-3156
2543-9847
Pojawia się w:
Dydaktyka informatyki
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wpływ liczby predyktorów na skuteczność algorytmów opartych na drzewach klasyfikacyjnych
The influence of number of predictors on accuracy of classification algorithms based on trees
Autorzy:
Owczarek, T.
Sojda, A.
Kaczmarek, K.
Powiązania:
https://bibliotekanauki.pl/articles/324994.pdf
Data publikacji:
2015
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
klasyfikacja
dobór zmiennych
drzewa klasyfikacyjne
analityka predykcyjna
classification
feature selection
classification trees
predictive analytics
Opis:
Współczesne organizacje, aby być konkurencyjne, muszą mieć umiejętności przetworzenia olbrzymich danych. Jednym z najbardziej obiecujących kierunków w tym zakresie jest wykorzystanie analityki predykcyjnej, opierającej się na algorytmach i modelach uczenia maszynowego. Związanych z tym jest wciąż wiele wyzwań, m.in. pytanie o „wejście” do takich modeli, czy powinny to być wszystkie dane zgromadzone przez organizację czy może raczej wcześniej wybrane zmienne? Celem artykułu jest zbadanie skuteczności algorytmów opartych na drzewach klasyfikacyjnych ze względu na liczebność predyktorów.
To stay competitive contemporary organizations have to master in processing massive amount of data. Predictive analytics, that is analytics based on machine learning algorithms and models, is one of the most promising directions. But there are many issues involved. One of them is the input to such models: should it be all data gathered by organization or just the selected variables? The aim of the article is to check how the number of predictors influences accuracy of classification algorithms based on trees.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2015, 86; 507-517
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Problem of Redundant Variables in Random Forests
Problem zmiennych redundantnych w metodzie lasów losowych
Autorzy:
Kubus, Mariusz
Powiązania:
https://bibliotekanauki.pl/articles/656761.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
lasy losowe
zmienne redundantne
dobór zmiennych
taksonomia cech
random forests
redundant variables
feature selection
clustering of features
Opis:
Lasy losowe są obecnie jedną z najchętniej stosowanych przez praktyków metod klasyfikacji wzorcowej. Na jej popularność wpływ ma możliwość jej stosowania bez czasochłonnego, wstępnego przygotowywania danych do analizy. Las losowy można stosować dla różnego typu zmiennych, niezależnie od ich rozkładów. Metoda ta jest odporna na obserwacje nietypowe oraz ma wbudowany mechanizm doboru zmiennych. Można jednak zauważyć spadek dokładności klasyfikacji w przypadku występowania zmiennych redundantnych. W artykule omawiane są dwa podejścia do problemu zmiennych redundantnych. Rozważane są dwa sposoby przeszukiwania w podejściu polegającym na doborze zmiennych oraz dwa sposoby konstruowania zmiennych syntetycznych w podejściu wykorzystującym grupowanie zmiennych. W eksperymencie generowane są liniowo zależne predyktory i włączane do zbiorów danych rzeczywistych. Metody redukcji wymiarowości zwykle poprawiają dokładność lasów losowych, ale żadna z nich nie wykazuje wyraźnej przewagi.
Random forests are currently one of the most preferable methods of supervised learning among practitioners. Their popularity is influenced by the possibility of applying this method without a time consuming pre‑processing step. Random forests can be used for mixed types of features, irrespectively of their distributions. The method is robust to outliers, and feature selection is built into the learning algorithm. However, a decrease of classification accuracy can be observed in the presence of redundant variables. In this paper, we discuss two approaches to the problem of redundant variables. We consider two strategies of searching for best feature subset as well as two formulas of aggregating the features in the clusters. In the empirical experiment, we generate collinear predictors and include them in the real datasets. Dimensionality reduction methods usually improve the accuracy of random forests, but none of them clearly outperforms the others.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2018, 6, 339; 7-16
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Crash data reporting systems in Fourteen Arab countries: challenges and improvement
Autorzy:
Abounoas, Zahira
Raphael, Wassim
Badr, Yarob
Faddoul, Rafic
Guillaume, Anne
Powiązania:
https://bibliotekanauki.pl/articles/1833641.pdf
Data publikacji:
2020
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
road accidents
road safety
information system
reporting system
variables selection
classification model
wypadek drogowy
bezpieczeństwo na drogach
system informacyjny
systemy raportowania
dobór zmiennych
model klasyfikacji
Opis:
Traffic crash fatalities and serious injuries still represent a big burden for most Arab countries because the actual policies, strategies, and interventions are based on poorly collected data. Through this paper, we assessed the crash data reporting systems in Fourteen Arab countries via a survey conducted to identify the fundamental dysfunctions at the management and data collection levels. Then, to address some of the dataset problems, we had applied data mining technics to select a minimum of variables (crash, vehicle, and road user) that should be collected for a better understanding of crash circumstances. For this raison, three methods of selection (correlation, information gain, and gain ratio) and seven classifiers (naive Bayes, nearest neighbour, random forest, random tree, J48, reduced error pruning tree, and bagging) were tested and compared to identify the variables that affect significantly the crashes severity. Decision trees family of classifiers showed the best performance based on the analysis of the area under the curve. The explanatory variables obtained from the data mining process were combined with other descriptive variables to maintain traceability. As a result, we produced hybrid lists of variables for the crash, vehicle, and road user, each contains 25 variables. Finally, in order to propose a cost-effective solution to switch from manual to electronic data collection, we got inspired by a tool used to track animals to create and customize a unified e-form for handheld devices, in order to ensure easy entering of the harmonized data for the entire region based on our selected lists of variables. The tool verified the countries requirements especially by enabling data collection and transfer with and without the internet, and by allowing data analysis thought its built-in Geographic Information System (GIS) capabilities.
Źródło:
Archives of Transport; 2020, 56, 4; 73-88
0866-9546
2300-8830
Pojawia się w:
Archives of Transport
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Dobór zmiennych niezależnych w modelowaniu procesów logistycznych metodą analizy grafów
Selection of independent variables in the modelling of logistics processes using the analysis graphs method
Autorzy:
Mróz, M.
Powiązania:
https://bibliotekanauki.pl/articles/93210.pdf
Data publikacji:
2017
Wydawca:
Akademia Sztuki Wojennej
Tematy:
metoda analizy grafów
procesy logistyczne
zmienne zależne
zmienne niezależne
dobór zmiennych
budowa modelu ekonometrycznego
graphs method analysis
logistics processes
dependent variables
independent variables
selection of variables
Opis:
Tematem artykułu jest dobór zmiennych niezależnych w modelowaniu procesów logistycznych metodą analizy grafów. Celem głównym jest teoretyczna i empiryczna analiza możliwości stosowania metody analizy grafów do doboru zmiennych niezależnych w modelach ekonometrycznych. Problem badawczy natomiast obejmował swym zasięgiem także poszukiwanie rozwiązań dotyczących uzyskania właściwych kryteriów wyboru zmiennych niezależnych spośród zmiennych kandydujących, przy wykorzystaniu właściwie stawianych i weryfikowanych hipotez zerowych. Niewątpliwym osiągnięciem zastosowania metody analizy grafów jest możliwość uzyskania macierzy współczynników korelacji liniowej Pearsona, które obrazują powiązania między poszczególnymi zmiennymi oraz pozwalają na ich podstawie wyeliminować te zmienne kandydujące, które nie są statystycznie istotne dla badanego procesu logistycznego.
The theme of the article is the selection of independent variables in the modelling of logistic processes using the analysis graphs method. The main objective is theoretical and empirical analysis of the applicability of the analysis graphs method for the selection of independent variables in econometric models. The research included seeking solutions for obtaining the appropriate criteria for the selection of independent variables of the variables candidate, using properly posed and verified hypotheses. The unquestionable achievement of the analysis graphs method is rendering it possible to obtain a matrix of correlation Pearson coefficients which illustrate the relationships between the candidate variables and allow these variables to be eliminated, which is not statistically significant for the test of the logistics process.
Źródło:
Zeszyty Naukowe Akademii Sztuki Wojennej; 2017, 3(108); 129-155
2543-6937
Pojawia się w:
Zeszyty Naukowe Akademii Sztuki Wojennej
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-8 z 8

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies