A System for Filling Store Displays: Pitting a Single Model against a Set of Demand Forecasting Models
System zapełnienia ekspozycji sklepowych: pojedynczy model a zespół modeli prognozowania popytu
Myna, Artur
Myna, Jacek
Data publikacji:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Extreme Gradient Boosting
logistic regression
random forest
regresja logistyczna
las losowy
The aim of the paper was to develop the concept of retail display space allocation as a system and to assess the quality of very slow-moving products demand forecasting models (that have not yet been used by retail companies in Poland) as its key subsystem. Forecasts were made using the example of a clothing company. The quality of these models was assessed using the Weighted Mean Absolute Percentage Error. The first step was to build the individual models. Later, the authors built separate models for brick-and-mortar and online stores as well as brands, creating a set of six models. The findings show that the classification approach for very slow movers provides as precise results as the regression approach. No single model or set of models (built with a particular machine learning method) could be identified that made the best demand forecasts for brick-and-mortar stores, as statistical tests generally did not confirm the significance of the differences between the median forecasts.
Celem artykułu jest opracowanie koncepcji zapełnienia ekspozycji sklepowych jako sys- temu oraz ocena jakości modeli prognozowania popytu (które w Polsce nie są jeszcze wykorzystywane przez sieci handlowe) bardzo wolno rotujących produktów jako jego kluczowego podsystemu. Jakość modeli oceniono za pomocą miary Weighted Mean Absolute Percentage Error na różnych poziomach szczegółowości: dla całej sieci sprzedaży i określonego miesiąca oraz na „na przecięciu” sklepu, produk- tu i rozmiaru produktu. Najpierw zbudowano pojedyncze modele, następnie zaś odrębne modele dla sklepów stacjonarnych i internetowych, jak również marek, tworząc zespół sześciu modeli. Poprawę dopasowania modeli osiągnięto tylko dla sklepów internetowych. Wyniki pracy wskazują, że podejście klasyfikacyjne dla bardzo wolno rotujących produktów charakteryzują równie precyzyjne wyniki pro- gnoz jak podejście regresyjne. Nie można wskazać jednego modelu lub zespołu modeli (zbudowanego określoną metodą uczenia maszynowego), który wykonał najlepsze prognozy popytu dla sklepów sta- cjonarnych, gdyż istotności różnic median prognoz na ogół nie potwierdzono testami statystycznymi.
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu; 2023, 67, 2; 96-106
Pojawia się w:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu
Dostawca treści:
Biblioteka Nauki
Determinanty samodzielności finansowej powiatów
Determinants of the financial independence of powiats in Poland
Galiński, Paweł
Jackowska, Beata
Data publikacji:
Główny Urząd Statystyczny
jednostka samorządu terytorialnego
samodzielność finansowa
wielomianowa porządkowa regresja logistyczna
model proporcjonalnych szans
local government unit
financial independence
ordinal logistic regression
proportional odds model
Samodzielność finansowa jednostek samorządu terytorialnego (JST) oznacza swobodę dysponowania zgromadzonymi środkami publicznymi, co wpływa na jakość życia wspólnoty lokalnej. Celem badania omówionego w artykule jest identyfikacja czynników oddziałujących na prawdopodobieństwo poprawy samodzielności finansowej powiatów. Badaniem objęto 314 powiatów (pominięto miasta na prawach powiatu), dla których uzyskano dane z Banku Danych Lokalnych GUS i z bilansów skonsolidowanych JST opracowywanych przez Ministerstwo Finansów za lata 2019 i 2021. Na podstawie udziału dochodów własnych w dochodach powiatu ogółem wyodrębniono cztery stopnie samodzielności finansowej. Do identyfikacji determinant samodzielności finansowej powiatów oraz do oszacowania prawdopodobieństwa jej poprawy zastosowano wielomianową regresję logistyczną dla zmiennej mierzonej na skali porządkowej. Na podstawie danych za 2019 r. skonstruowano model proporcjonalnych szans, a dane za 2021 r. wykorzystano do weryfikacji jakości modelu. Z badania wynika, że szansa poprawy samodzielności finansowej powiatu zwiększa się wraz ze zwiększaniem się gęstości zaludnienia oraz poziomu przedsiębiorczości mierzonej liczbą przedsiębiorstw przypadających na mieszkańca i nakładami inwestycyjnymi przedsiębiorstw przypadającymi na mieszkańca oraz ze zmniejszaniem się: stopy bezrobocia, liczby uczniów w szkołach ponadpodstawowych przypadających na mieszkańca, odsetka dzieci, na które rodzice otrzymują zasiłek rodzinny, oraz odsetka osób w wieku poprodukcyjnym.
The financial independence of local government units (LGUs) means the freedom to control the accumulated public funds, which ultimately affects the quality of life of the local community. The aim of the study discussed in this article is to identify the factors influencing the probability of improving the financial independence of powiats (Polish administrative units equivalent to counties). The study covered 314 powiats (cities with powiat status were not included) for which data for the years 2019 and 2021 were obtained from the Local Data Bank of Statistics Poland and from consolidated balance sheets of LGUs for the years 2019 and 2021, prepared by the Ministry of Finance. Four degrees of financial independence were distinguished on the basis of the share of powiats’ own revenues in their total revenues. The multinomial logistic regression for a variable measured on an ordinal scale was applied to identify the determinants of financial independence and to estimate the probability of its improvement. A proportional odds model was constructed on the basis of data from 2019, while the data from 2021 were used to validate the model. Research shows that the odds of achieving improvement in the powiats’ financial independence is positively affected by: growing population density and the level of entrepreneurship measured by the number of enterprises per capita, as well as increasing investment outlays of enterprises per capita, while negatively by: a growing unemployment rate and number of students in secondary schools per capita, as well as by an increasing percentage of children whose parents receive family benefits and people of a post-working age.
Wiadomości Statystyczne. The Polish Statistician; 2023, 68, 7; 1-24
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Impact of a child’s disability on the probability of the mother taking up paid employment
Wpływ niepełnosprawności dziecka na prawdopodobieństwo podjęcia pracy zawodowej przez matkę
Komorowska, Olga
Kozłowski, Arkadiusz
Data publikacji:
Główny Urząd Statystyczny
employment rate
mothers of children with disabilities
Blinder-Oaxaca decomposition
logistic regression
wskaźnik zatrudnienia
matki dzieci z niepełnosprawnościami
dekompozycja Blindera-Oaxaki
regresja logistyczna
Performing paid work is beneficial in many ways, but not every person has equal access to it because of their social and economic situation. Discrepancies in this field are especially visible in the case of mothers. The aim of the study is to assess the impact of the child’s disability on the probability of the mother taking up paid employment. The empirical analysis used a decomposition method derived from the Blinder and Oaxaca approach and the logistic regression. The analysis was based on individual household-level data from the representative Household Budget Survey for the years 2005–2020. When analysing the average from all the years, the employment rate of mothers of children without disabilities reached 70.9%, and that of mothers of children with disabilities only 40.2%. This gap was widening throughout the studied period. The lower employment rate among mothers of children with disabilities is caused in the most part directly by the child’s disability (and the resulting factors). However, the variable that had the greatest impact on the economic activity in both groups of mothers was education.
Praca zawodowa daje wiele korzyści, jednak nie wszyscy mają do niej równy dostęp ze względu na uwarunkowania społeczne i ekonomiczne. Nierówności w dostępie do pracy są szczególnie widoczne wśród matek. Celem badania omawianego w artykule jest ocena wpływu niepełnosprawności dziecka na prawdopodobieństwo podjęcia pracy zawodowej przez matkę. W analizie empirycznej wykorzystano metodę dekompozycji wywodzącą się z podejścia Blindera i Oaxaki oraz regresję logistyczną. Posłużono się jednostkowymi danymi za lata 2005–2020 dotyczącymi gospodarstw domowych, pochodzącymi z reprezentacyjnego badania budżetów gospodarstw domowych. Przeciętny wskaźnik zatrudnienia matek dzieci bez niepełnosprawności wynosił 70,9%, a matek dzieci z niepełnosprawnościami – 40,2%. Różnica jego wartości pomiędzy badanymi grupami matek zwiększała się w ciągu analizowanego okresu. Niższy wskaźnik zatrudnienia wśród matek dzieci z niepełnosprawnościami wynikał przede wszystkim z niepełnosprawności dziecka (i czynników, które są tego skutkiem). Zmienną, która miała największy wpływ na aktywność zawodową matek w obu grupach, było wykształcenie.
Wiadomości Statystyczne. The Polish Statistician; 2023, 68, 6; 24-46
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
New algorithm for determining the number of features for the effective sentiment-classification of text documents
Nowy algorytm ustalania liczby zmiennych potrzebnych do klasyfikacji dokumentów tekstowych ze względu na ich wydźwięk emocjonalny
Idczak, Adam
Korzeniewski, Jerzy
Data publikacji:
Główny Urząd Statystyczny
sentiment analysis
document sentiment classification
text mining
logistic regression
naive Bayes classifier
feature selection
analiza sentymentu
klasyfikacja dokumentów ze względu na wydźwięk emocjonalny
eksploracja tekstu
regresja logistyczna
naiwny klasyfikator Bayesa
dobór cech
Sentiment analysis of text documents is a very important part of contemporary text mining. The purpose of this article is to present a new technique of text sentiment analysis which can be used with any type of a document-sentiment-classification method. The proposed technique involves feature selection independently of a classifier, which reduces the size of the feature space. Its advantages include intuitiveness and computational noncomplexity. The most important element of the proposed technique is a novel algorithm for the determination of the number of features to be selected sufficient for the effective classification. The algorithm is based on the analysis of the correlation between single features and document labels. A statistical approach, featuring a naive Bayes classifier and logistic regression, was employed to verify the usefulness of the proposed technique. They were applied to three document sets composed of 1,169 opinions of bank clients, obtained in 2020 from a Poland-based bank. The documents were written in Polish. The research demonstrated that reducing the number of terms over 10-fold by means of the proposed algorithm in most cases improves the effectiveness of classification.
Analiza sentymentu, czyli wydźwięku emocjonalnego, dokumentów tekstowych stanowi bardzo ważną część współczesnej eksploracji tekstu (ang. text mining). Celem artykułu jest przedstawienie nowej techniki analizy sentymentu tekstu, która może znaleźć zastosowanie w dowolnej metodzie klasyfikacji dokumentów ze względu na ich wydźwięk emocjonalny. Proponowana technika polega na niezależnym od klasyfikatora doborze cech, co skutkuje zmniejszeniem rozmiaru ich przestrzeni. Zaletami tej propozycji są intuicyjność i prostota obliczeniowa. Zasadniczym elementem omawianej techniki jest nowatorski algorytm ustalania liczby terminów wystarczających do efektywnej klasyfikacji, który opiera się na analizie korelacji pomiędzy pojedynczymi cechami dokumentów a ich wydźwiękiem. W celu weryfikacji przydatności proponowanej techniki zastosowano podejście statystyczne. Wykorzystano dwie metody: naiwny klasyfikator Bayesa i regresję logistyczną. Za ich pomocą zbadano trzy zbiory dokumentów składające się z 1169 opinii klientów jednego z banków działających na terenie Polski uzyskanych w 2020 r. Dokumenty zostały napisane w języku polskim. Badanie pokazało, że kilkunastokrotne zmniejszenie liczby terminów przy zastosowaniu proponowanej techniki na ogół poprawia jakość klasyfikacji.
Wiadomości Statystyczne. The Polish Statistician; 2023, 68, 5; 40-57
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Measuring the effects of passengers’ socio-demographic factors on satisfaction with public bus services in a developing city: a case study in Semarang, Indonesia
Haryadi, Bambang
Data publikacji:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
passenger satisfaction
ordinal regression
logistic regression
zadowolenie pasażerów
dane społeczno-demograficzne
regresja porządkowa
regresja logistyczna
The present study aimed to assess passenger satisfaction with bus transit services based on passengers’ socio-demographic characteristics, given the service quality. An ordinal logistic regression analysis was conducted to relate passengers’ sociodemographic characteristics to their satisfaction with public bus services. The sociodemographic characteristics studied were age, gender, marital status, occupation, income, housing type, family size, and motor vehicle ownership. Data were collected by administering an onboard survey to public bus passengers. In total, 580 completed a questionnaire asking about their socio-demographic characteristics and their satisfaction with bus transit services. The study reveals that significant differences exist in the levels of passengers’ satisfaction depending on their socio-demographic characteristics. Greater satisfaction was significantly associated with being married, unemployed, and young. The delivery of public bus services needs to consider different segments of passengers.
Transport Problems; 2022, 17, 2; 151--160
Pojawia się w:
Transport Problems
Dostawca treści:
Biblioteka Nauki
Predicting the stability of open stopes using Machine Learning
Szmigiel, Alicja
Apel, Derek B.
Data publikacji:
Główny Instytut Górnictwa
open stope
machine learning
logistic regression
random forest
system otwartych komór
uczenie maszynowe
regresja logistyczna
las losowy
The Mathews stability graph method was presented for the first time in 1980. This method was developed to assess the stability of open stopes in different underground conditions, and it has an impact on evaluating the safety of underground excavations. With the development of technology and growing experience in applying computer sciences in various research disciplines, mining engineering could significantly benefit by using Machine Learning. Applying those ML algorithms to predict the stability of open stopes in underground excavations is a new approach that could replace the original graph method and should be investigated. In this research, a Potvin database that consisted of 176 historical case studies was passed to the two most popular Machine Learning algorithms: Logistic Regression and Random Forest, to compare their predicting capabilities. The results obtained showed that those algorithms can indicate the stability of underground openings, especially Random Forest, which, in examined data, performed slightly better than Logistic Regression.
Journal of Sustainable Mining; 2022, 21, 3; 241--248
Pojawia się w:
Journal of Sustainable Mining
Dostawca treści:
Biblioteka Nauki
Revisiting strategies for fitting logistic regression for positive and unlabeled data
Wawrzeńczyk, Adam
Mielniczuk, Jan
Data publikacji:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
positive learning
unlabeled learning
empirical risk
logistic regression
concave convex optimization
pozytywne uczenie się
nieoznaczone uczenie się
ryzyko empiryczne
regresja logistyczna
Positive unlabeled (PU) learning is an important problem motivated by the occurrence of this type of partial observability in many applications. The present paper reconsiders recent advances in parametric modeling of PU data based on empirical likelihood maximization and argues that they can be significantly improved. The proposed approach is based on the fact that the likelihood for the logistic fit and an unknown labeling frequency can be expressed as the sum of a convex and a concave function, which is explicitly given. This allows methods such as the concave-convex procedure (CCCP) or its variant, the disciplined convex-concave procedure (DCCP), to be applied. We show by analyzing real data sets that, by using the DCCP to solve the optimization problem, we obtain significant improvements in the posterior probability and the label frequency estimation over the best available competitors.
International Journal of Applied Mathematics and Computer Science; 2022, 32, 2; 299--309
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
The impact of ‘trip experience’ on the awareness of world heritage site status among tourists visiting Delhi
Wpływ doświadczenia podróży na świadomość statusu obiektu światowego dziedzictwa UNESCO wśród turystów odwiedzających Delhi
Juneja, Monisha
Sufi, Tahir
Bhatnagar, Mamta
Data publikacji:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
obiekty światowego dziedzictwa
regresja logistyczna
doświadczenie podróży
world heritage sites
logistic regression
trip experience
Awareness of World Heritage Sites (WHS) is a marketing tool used to promote a destination. Once a tourist arrives, the ‘trip experience’ becomes a vital tool to ensure repeat visits and showcase a positive image of a destination to potential tourists. This study has tried to link the impact of the ‘trip experience’ of tourists to awareness of WHS aiming to understand the relationship of the six ‘domains’ and forming a proposed model. The data was collected from an on-site survey of 309 tourists from July to December 2019 using a structured questionnaire following a pilot study. For data analysis, logistic regression analysis was used. This revealed that four out of six domains increase the probability of tourists’ awareness of WHS status during a trip, namely: welcoming, local travel, tour leader and tour guide. The earlier model for using WHS awareness only for promotional purposes has been shifted by adding the trip experience of the tourists. The findings can be applied by tourism and hospitality facilitators in providing services to tourists.
Świadomość istnienia miejsc i obiektów światowego dziedzictwa UNESCO (World Heritage Sites – WHS) to narzędzie marketingowe wykorzystywane w promowaniu destynacji turystycznych. Przeżycia turysty w czasie podróży stają się ważnym instrumentem zachęcającym do powtórnych wizyt oraz przedstawiającym pozytywny wizerunek danej miejscowości innym potencjalnym odwiedzającym. Celem autorów artykułu było wykazanie wpływu doświadczenia podróży turystów na ich świadomość statusu światowego dziedzictwa, zrozumienie jej sześciu składowych oraz stworzenie zaproponowanego modelu. Dane zostały zebrane podczas lokalnego badania ankietowego obejmującego 309 turystów, w okresie od czerwca do grudnia 2019 r., przy użyciu ustrukturyzowanego kwestionariusza, po przeprowadzeniu badania pilotażowego. Do analizy danych zastosowano metodę analizy regresji logistycznej. Wykazała ona, że cztery spośród sześciu składowych potencjalnie zwiększają podczas podróży u odwiedzających świadomość statusu światowego dziedzictwa. Są to: powitanie, podróżowanie po okolicy, pilot wycieczki i miejscowy przewodnik. Wcześniejszy model, w którym świadomość przebywania w miejscu światowego dziedzictwa była wykorzystywana wyłącznie do celów promocyjnych, został zmodyfikowany przez dodanie do niego elementu doświadczenia podróżniczego turystów. Wyniki mogą być przydatne dla osób zajmujących się turystyką i hotelarstwem przy organizacji usług turystycznych.
Turyzm; 2022, 32, 1; 77-92
Pojawia się w:
Dostawca treści:
Biblioteka Nauki
Transport mode choice among off-campus students in a hilly environment: the case of Aizawl, India
Saitluanga, Benjamin L.
Hmangaihzela, Lal
Data publikacji:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
transport mode choice
off-campus students
hilly terrain
multinomial logistic regression
wybór środka transportu
studenci spoza kampusu
teren pagórkowaty
wielomianowa regresja logistyczna
In recent years, the transport mode choice of students of higher educational institutions has become a subject of increasing interest. Investigating the modal choice of students, who form a considerable section of the population, is crucial for sustainable urban transport planning and understanding the quality of life of students. Reviews of previous studies have indicated that hilly cities in less developed countries are neglected in transportation studies. The present paper investigates the travel behaviour of non-local, off-campus college students in Aizawl – a fast-growing hilly city in northeast India. The study found that transport mode choices are influenced by interrelated factors, including socio-economic background, demographic, availability of transport mode and location of housing. It was also found that walking and public buses are the most preferred modes of commuting among the studied college students. Female students who rent houses near their colleges are more likely to walk than their male counterparts. On the other hand, male students belonging to high-income families tended to travel by private vehicles from their residences, which are located relatively far away from colleges. The study argues for the enhancement of the intake capacity of residential hostels inside the campus to improve the growing transport problem of off-campus students in the city.
Transport Problems; 2022, 17, 3; 163--172
Pojawia się w:
Transport Problems
Dostawca treści:
Biblioteka Nauki
Wykorzystanie elementów uczenia maszynowego do modelowania stężenia zanieczyszczeń atmosferycznych : studium przypadku pyłu PM2.5 w Szczecinie
Studium przypadku pyłu PM2.5 w Szczecinie
Bihałowicz, Jan Stefan
Zeszyty Naukowe SGSP 2022, nr 81, s. 7-28
Szkoła Główna Służby Pożarniczej oth
Data publikacji:
Analiza danych
Jakość powietrza atmosferycznego
Modele matematyczne
Pył zawieszony
Regresja logistyczna
Składowiska odpadów
Sztuczna sieć neuronowa
Uczenie maszynowe
Zanieczyszczenie powietrza
Artykuł z czasopisma naukowego
Case study (studium przypadku)
W artykule opisano możliwości wykorzystania uczenia maszynowego w modelowaniu stężeń zanieczyszczeń w lokalizacjach o określonych stałych źródłach emisji. Jako substancję zanieczyszczającą wybrano pył PM 2.5. Wdrożono sześć różnych modeli i poddano ich walidacji krzyżowej na podstawie danych meteorologicznych zarejestrowanych w 2013-2018 w stacji Instytutu Meteorologii i Gospodarki Wodnej w Szczecinie. Wykazano, że przewidywane wartości stężeń powstałe podczas pożaru były zaniżone w porównaniu do rzeczywistych poziomów.
Bibliografia, netografia na stronach 26-28.
Dostawca treści:
Bibliografia CBW
Sentiment Classification of Bank Clients’ Reviews Written in the Polish Language
Analiza sentymentu na podstawie polskojęzycznych recenzji klientów banku
Idczak, Adam Piotr
Data publikacji:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
analiza sentymentu
klasyfikacja dokumentów
regresja logistyczna
naiwny klasyfikator Bayesa
sentiment analysis
opinion mining
text classification
text mining
logistic regression
naive Bayes classifier
It is estimated that approximately 80% of all data gathered by companies are text documents. This article is devoted to one of the most common problems in text mining, i.e. text classification in sentiment analysis, which focuses on determining the sentiment of a document. A lack of defined structure of the text makes this problem more challenging. This has led to the development of various techniques used in determining the sentiment of a document. In this paper, a comparative analysis of two methods in sentiment classification, a naive Bayes classifier and logistic regression, was conducted. Analysed texts are written in the Polish language and come from banks. The classification was conducted by means of a bag‑of‑n‑grams approach, where a text document is presented as a set of terms and each term consists of n words. The results show that logistic regression performed better.
Szacuje się, że około 80% wszystkich danych gromadzonych i przechowywanych w systemach informacyjnych przedsiębiorstw ma postać dokumentów tekstowych. Artykuł jest poświęcony jednemu z podstawowych problemów textminingu, tj. klasyfikacji tekstów w analizie sentymentu, która rozumiana jest jako badanie wydźwięku tekstu. Brak określonej struktury dokumentów tekstowych jest przeszkodą w realizacji tego zadania. Taki stan rzeczy wymusił rozwój wielu różnorodnych technik ustalania sentymentu dokumentów. W artykule przeprowadzono analizę porównawczą dwóch metod badania sentymentu: naiwnego klasyfikatora Bayesa oraz regresji logistycznej. Badane teksty są napisane w języku polskim, pochodzą z banków i mają charakter marketingowy. Klasyfikację przeprowadzono, stosując podejście bag‑of‑n‑grams. W ramach tego podejścia dokument tekstowy wyrażony jest za pomocą podciągów składających się z określonej liczby n wyrazów. Uzyskane wyniki pokazały, że lepiej spisała się regresja logistyczna.
Acta Universitatis Lodziensis. Folia Oeconomica; 2021, 2, 353; 43-56
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Application of the logistic regression for determining transition probability matrix of operating states in the transport systems
Zastosowanie regresji logistycznej do wyznaczania macierzy prawdopodobieństw przejść stanów eksploatacyjnych w systemach transportowych
Kozłowski, Edward
Borucka, Anna
Świderski, Andrzej
Data publikacji:
Polska Akademia Nauk. Polskie Naukowo-Techniczne Towarzystwo Eksploatacyjne PAN
logistic regression
transition probability matrix
Markov chains
transport system
regresja logistyczna
macierz prawdopodobieństw przejść
łańcuchy Markowa
system transportowy
Transport companies can be regarded as a technical, organizational, economic and legal transport system. Maintaining the quality and continuity of the implementation of transport requisitions requires a high level of readiness of vehicles and staff (especially drivers). Managing and controlling the tasks being implemented is supported by mathematical models enabling to assess and determine the strategy regarding the actions undertaken. The support for managing processes relies mainly on the analysis of sequences of the subsequent activities (states). In many cases, this sequence of activities is modelled using stochastic processes that satisfy Markov property. Their classic application is only possible if the conditional probability distributions of future states are determined solely by the current operational state. The identification of such a stochastic process relies mainly on determining the probability matrix of interstate transitions. Unfortunately, in many cases the analyzed series of activities do not satisfy Markov property. In addition, the occurrence of the next state is affected by the length of time the system remains in the specified operating state. The article presents the method of constructing the matrix of probabilities of transitions between operational states. The values of this matrix depend on the time the object remains in the given state. The aim of the article was to present an alternative method of estimating the parameters of this matrix in a situation where the studied series does not satisfy Markov property. The logistic regression was used for this purpose.
Przedsiębiorstwa transportowe mogą być traktowane jako wyodrębniony pod względem technicznym, organizacyjnym, ekonomicznym i prawnym system transportowy. Zachowanie jakości i ciągłości realizacji zleceń przewozowych wymaga wysokiego poziomu gotowości pojazdów oraz personelu (szczególnie kierowców). Kontrolowanie i sterowanie realizowanymi zadaniami wspierane jest modelami matematycznymi, umożliwiającymi ocenę i określenie strategii dotyczącej podejmowanych działań. Wsparcie procesów zarządzania polega głównie na analizie sekwencji kolejnych, realizowanych czynności (stanów). W wielu przypadkach taki ciąg czynności jest modelowany za pomocą procesów stochastycznych, spełniających własność Markowa. Ich klasyczne zastosowanie możliwe jest tylko w przypadku, gdy warunkowe rozkłady prawdopodobieństwa przyszłych stanów są określone wyłącznie przez bieżący stan eksploatacyjny. Identyfikacja takiego procesu stochastycznego polega głównie na wyznaczeniu macierzy prawdopodobieństw przejść międzystanowych. Niestety w wielu przypadkach analizowane ciągi czynności nie spełniają własności Markowa. Dodatkowo, na wystąpienie kolejnego stanu wpływa długość interwału czasowego pozostania systemu w określonym stanie eksploatacyjnym. W artykule przedstawiono metodę konstrukcji macierzy prawdopodobieństw przejść pomiędzy stanami eksploatacyjnymi. Wartości tej macierzy zależą od czasu przebywania obiektu w danym stanie. Celem artykułu było zaprezentowanie alternatywnej metody estymacji parametrów tej macierzy w sytuacji, gdy badany szereg nie spełnia własności Markowa. Wykorzystano w tym celu regresję logistyczną.
Eksploatacja i Niezawodność; 2020, 22, 2; 192-200
Pojawia się w:
Eksploatacja i Niezawodność
Dostawca treści:
Biblioteka Nauki
Application of the logistic regression model to assess the risk of death in road traffic accidents in the Mazowieckie voivodeship
Borucka, Anna
Grzelak, Małgorzata
Świderski, Andrzej
Data publikacji:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
road safety
logistic regression
bezpieczeństwo drogowe
regresja logistyczna
Mortality caused by road accidents is a significant problem for most countries, including Poland, where approximately 2,900 people die each year, and another 37,359 are injured. Research in this area has been conducted on a large scale. One of the most important elements is the evaluation of factors leading to fatalities in road accidents, which is also the goal of this article. The analysis was based on data on road accidents from the Mazowieckie Voivodeship, which is characterized by one of the highest mortality rates gathered for the period 2016-2018. Owing to the dichotomous form of the studied variable, logistic regression was used. Estimated model parameters and calculated odds ratios allowed to assess the effect of selected factors on road traffic mortality rate. As significant, the type of the perpetrator and the traffic participant, sex and age of the victim, road lighting, and the driver’s experience were selected. It was assessed that pedestrians are the group most exposed to death in a road accident, both as perpetrators and victims. It was also pointed out that the risk of death for women is 1.8 times higher than men. In addition, the effect of driving experience is also important, and the risk of death is 0.64 times lower for drivers with longer practice. It was also assessed that with each subsequent year of life, the risk of death in a road accident increased by 2%. Furthermore, according to incident site lighting, the study demonstrated that the risk of death was greatest when driving at night on an unlit road. The results obtained may support public safety and law enforcement authorities in carrying out preventive actions and also can be helpful in shaping the overall strategy on road safety.
Transport Problems; 2020, 15, 4, cz. 1; 125-136
Pojawia się w:
Transport Problems
Dostawca treści:
Biblioteka Nauki
Determinants of the quality of life in municipalities of Kielce district
Brzozowska-Rup, Katarzyna
Czaja, Roksana
Piotrowska-Piątek, Agnieszka
Data publikacji:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
quality of life
logistic regression
Hellwig’s method
jakość życia
regresja logistyczna
metoda Hellwiga
Identifying the factors that significantly affect the quality of life of the residents of municipalities of the Kielce poviat based on a synthetic indicator. Design/methodology/approach: The method used in the paper is create a synthetic indicator designed using a taxonomic method and the estimation of the logistic regression model. Data of the Central Statistical Office concerning the years 2014-2018 were used in the calculations. Findings: The obtained values of the TMR (Total Material Requirement) indicator suggest that in the Kielce poviat the quality of life of the residents of individual municipalities is very diverse. At the same time, a common positive tendency is observed, manifested in the trend indicating an improvement in the quality of life in each of the municipalities in the examined period. The constructed indicator was used to estimate the regression model for cross-sectional data from 2018. Originality/value: The estimated models allowed to formulate conclusions concerning the impact of particular explanatory variables on the diagnosed level of quality of life in the surveyed municipalities.
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2020, 146; 21-35
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Evaluation of resampling methods in the class unbalance problem
Ocena metod repróbkowania w problemie zbiorów niezbilansowanych
Kubus, Mariusz
Data publikacji:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
class unbalance
regularized logistic regression
random forests
klasy niezbilansowane
regularyzowana regresja logistyczna
lasy losowe
The purpose of many real world applications is the prediction of rare events, and the training sets are then highly unbalanced. In this case, the classifiers are biased towards the correct prediction of the majority class and they misclassify a minority class, whereas rare events are of the greater interest. To handle this problem, numerous techniques were proposed that balance the data or modify the learning algorithms. The goal of this paper is a comparison of simple random balancing methods with more sophisticated resampling methods that appeared in the literature and are available in R program. Additionally, the authors ask whether learning on the original dataset and using a shifted threshold for classification is not more competitive. The authors provide a survey from the perspective of regularized logistic regression and random forests. The results show that combining random under-sampling with random forests has an advantage over other techniques while logistic regression can be competitive in the case of highly unbalanced data.
Celem wielu praktycznych zastosowań modeli dyskryminacyjnych jest przewidywanie zdarzeń rzadkich. Zbiory uczące są wówczas niezbilansowane. W tym przypadku klasyfikatory mają tendencję do poprawnego klasyfikowania obiektów klasy większościowej i jednocześnie błędnie klasyfikują wiele obiektów klasy mniejszościowej, która jest przedmiotem szczególnego zainteresowania. W celu rozwiązania tego problemu zaproponowano wiele technik, które bilansują dane lub modyfikują algorytmy uczące. Celem artykułu jest porównanie prostych, losowych metod bilansowania z bardziej wyrafinowanymi, które pojawiły się w literaturze. Dodatkowo postawiono pytanie, czy konkurencyjnym podejściem nie jest budowa modelu na oryginalnym zbiorze danych i przesunięcie progu klasyfikacji. Badanie przedstawiono z perspektywy regularyzowanej regresji logistycznej i lasów losowych. Wyniki pokazują, że kombinacja metody under-sampling z lasami losowymi wykazuje przewagę nad innymi technikami, podczas gdy regresja logistyczna może być konkurencyjna w przypadku silnego niezbilansowania.
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2020, 24, 1; 39-50
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki

