Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Regresja logistyczna" wg kryterium: Temat


Tytuł:
A System for Filling Store Displays: Pitting a Single Model against a Set of Demand Forecasting Models
System zapełnienia ekspozycji sklepowych: pojedynczy model a zespół modeli prognozowania popytu
Autorzy:
Myna, Artur
Myna, Jacek
Powiązania:
https://bibliotekanauki.pl/articles/2206342.pdf
Data publikacji:
2023
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
Extreme Gradient Boosting
logistic regression
random forest
regresja logistyczna
las losowy
Opis:
The aim of the paper was to develop the concept of retail display space allocation as a system and to assess the quality of very slow-moving products demand forecasting models (that have not yet been used by retail companies in Poland) as its key subsystem. Forecasts were made using the example of a clothing company. The quality of these models was assessed using the Weighted Mean Absolute Percentage Error. The first step was to build the individual models. Later, the authors built separate models for brick-and-mortar and online stores as well as brands, creating a set of six models. The findings show that the classification approach for very slow movers provides as precise results as the regression approach. No single model or set of models (built with a particular machine learning method) could be identified that made the best demand forecasts for brick-and-mortar stores, as statistical tests generally did not confirm the significance of the differences between the median forecasts.
Celem artykułu jest opracowanie koncepcji zapełnienia ekspozycji sklepowych jako sys- temu oraz ocena jakości modeli prognozowania popytu (które w Polsce nie są jeszcze wykorzystywane przez sieci handlowe) bardzo wolno rotujących produktów jako jego kluczowego podsystemu. Jakość modeli oceniono za pomocą miary Weighted Mean Absolute Percentage Error na różnych poziomach szczegółowości: dla całej sieci sprzedaży i określonego miesiąca oraz na „na przecięciu” sklepu, produk- tu i rozmiaru produktu. Najpierw zbudowano pojedyncze modele, następnie zaś odrębne modele dla sklepów stacjonarnych i internetowych, jak również marek, tworząc zespół sześciu modeli. Poprawę dopasowania modeli osiągnięto tylko dla sklepów internetowych. Wyniki pracy wskazują, że podejście klasyfikacyjne dla bardzo wolno rotujących produktów charakteryzują równie precyzyjne wyniki pro- gnoz jak podejście regresyjne. Nie można wskazać jednego modelu lub zespołu modeli (zbudowanego określoną metodą uczenia maszynowego), który wykonał najlepsze prognozy popytu dla sklepów sta- cjonarnych, gdyż istotności różnic median prognoz na ogół nie potwierdzono testami statystycznymi.
Źródło:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu; 2023, 67, 2; 96-106
1899-3192
Pojawia się w:
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Determinanty samodzielności finansowej powiatów
Determinants of the financial independence of powiats in Poland
Autorzy:
Galiński, Paweł
Jackowska, Beata
Powiązania:
https://bibliotekanauki.pl/articles/18105067.pdf
Data publikacji:
2023-07-31
Wydawca:
Główny Urząd Statystyczny
Tematy:
powiat
jednostka samorządu terytorialnego
JST
samodzielność finansowa
wielomianowa porządkowa regresja logistyczna
model proporcjonalnych szans
county
local government unit
LGU
financial independence
ordinal logistic regression
proportional odds model
Opis:
Samodzielność finansowa jednostek samorządu terytorialnego (JST) oznacza swobodę dysponowania zgromadzonymi środkami publicznymi, co wpływa na jakość życia wspólnoty lokalnej. Celem badania omówionego w artykule jest identyfikacja czynników oddziałujących na prawdopodobieństwo poprawy samodzielności finansowej powiatów. Badaniem objęto 314 powiatów (pominięto miasta na prawach powiatu), dla których uzyskano dane z Banku Danych Lokalnych GUS i z bilansów skonsolidowanych JST opracowywanych przez Ministerstwo Finansów za lata 2019 i 2021. Na podstawie udziału dochodów własnych w dochodach powiatu ogółem wyodrębniono cztery stopnie samodzielności finansowej. Do identyfikacji determinant samodzielności finansowej powiatów oraz do oszacowania prawdopodobieństwa jej poprawy zastosowano wielomianową regresję logistyczną dla zmiennej mierzonej na skali porządkowej. Na podstawie danych za 2019 r. skonstruowano model proporcjonalnych szans, a dane za 2021 r. wykorzystano do weryfikacji jakości modelu. Z badania wynika, że szansa poprawy samodzielności finansowej powiatu zwiększa się wraz ze zwiększaniem się gęstości zaludnienia oraz poziomu przedsiębiorczości mierzonej liczbą przedsiębiorstw przypadających na mieszkańca i nakładami inwestycyjnymi przedsiębiorstw przypadającymi na mieszkańca oraz ze zmniejszaniem się: stopy bezrobocia, liczby uczniów w szkołach ponadpodstawowych przypadających na mieszkańca, odsetka dzieci, na które rodzice otrzymują zasiłek rodzinny, oraz odsetka osób w wieku poprodukcyjnym.
The financial independence of local government units (LGUs) means the freedom to control the accumulated public funds, which ultimately affects the quality of life of the local community. The aim of the study discussed in this article is to identify the factors influencing the probability of improving the financial independence of powiats (Polish administrative units equivalent to counties). The study covered 314 powiats (cities with powiat status were not included) for which data for the years 2019 and 2021 were obtained from the Local Data Bank of Statistics Poland and from consolidated balance sheets of LGUs for the years 2019 and 2021, prepared by the Ministry of Finance. Four degrees of financial independence were distinguished on the basis of the share of powiats’ own revenues in their total revenues. The multinomial logistic regression for a variable measured on an ordinal scale was applied to identify the determinants of financial independence and to estimate the probability of its improvement. A proportional odds model was constructed on the basis of data from 2019, while the data from 2021 were used to validate the model. Research shows that the odds of achieving improvement in the powiats’ financial independence is positively affected by: growing population density and the level of entrepreneurship measured by the number of enterprises per capita, as well as increasing investment outlays of enterprises per capita, while negatively by: a growing unemployment rate and number of students in secondary schools per capita, as well as by an increasing percentage of children whose parents receive family benefits and people of a post-working age.
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2023, 68, 7; 1-24
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Impact of a child’s disability on the probability of the mother taking up paid employment
Wpływ niepełnosprawności dziecka na prawdopodobieństwo podjęcia pracy zawodowej przez matkę
Autorzy:
Komorowska, Olga
Kozłowski, Arkadiusz
Powiązania:
https://bibliotekanauki.pl/articles/18105062.pdf
Data publikacji:
2023-06-30
Wydawca:
Główny Urząd Statystyczny
Tematy:
employment rate
mothers of children with disabilities
Blinder-Oaxaca decomposition
logistic regression
wskaźnik zatrudnienia
matki dzieci z niepełnosprawnościami
dekompozycja Blindera-Oaxaki
regresja logistyczna
Opis:
Performing paid work is beneficial in many ways, but not every person has equal access to it because of their social and economic situation. Discrepancies in this field are especially visible in the case of mothers. The aim of the study is to assess the impact of the child’s disability on the probability of the mother taking up paid employment. The empirical analysis used a decomposition method derived from the Blinder and Oaxaca approach and the logistic regression. The analysis was based on individual household-level data from the representative Household Budget Survey for the years 2005–2020. When analysing the average from all the years, the employment rate of mothers of children without disabilities reached 70.9%, and that of mothers of children with disabilities only 40.2%. This gap was widening throughout the studied period. The lower employment rate among mothers of children with disabilities is caused in the most part directly by the child’s disability (and the resulting factors). However, the variable that had the greatest impact on the economic activity in both groups of mothers was education.
Praca zawodowa daje wiele korzyści, jednak nie wszyscy mają do niej równy dostęp ze względu na uwarunkowania społeczne i ekonomiczne. Nierówności w dostępie do pracy są szczególnie widoczne wśród matek. Celem badania omawianego w artykule jest ocena wpływu niepełnosprawności dziecka na prawdopodobieństwo podjęcia pracy zawodowej przez matkę. W analizie empirycznej wykorzystano metodę dekompozycji wywodzącą się z podejścia Blindera i Oaxaki oraz regresję logistyczną. Posłużono się jednostkowymi danymi za lata 2005–2020 dotyczącymi gospodarstw domowych, pochodzącymi z reprezentacyjnego badania budżetów gospodarstw domowych. Przeciętny wskaźnik zatrudnienia matek dzieci bez niepełnosprawności wynosił 70,9%, a matek dzieci z niepełnosprawnościami – 40,2%. Różnica jego wartości pomiędzy badanymi grupami matek zwiększała się w ciągu analizowanego okresu. Niższy wskaźnik zatrudnienia wśród matek dzieci z niepełnosprawnościami wynikał przede wszystkim z niepełnosprawności dziecka (i czynników, które są tego skutkiem). Zmienną, która miała największy wpływ na aktywność zawodową matek w obu grupach, było wykształcenie.
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2023, 68, 6; 24-46
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
New algorithm for determining the number of features for the effective sentiment-classification of text documents
Nowy algorytm ustalania liczby zmiennych potrzebnych do klasyfikacji dokumentów tekstowych ze względu na ich wydźwięk emocjonalny
Autorzy:
Idczak, Adam
Korzeniewski, Jerzy
Powiązania:
https://bibliotekanauki.pl/articles/18105028.pdf
Data publikacji:
2023-05-31
Wydawca:
Główny Urząd Statystyczny
Tematy:
sentiment analysis
document sentiment classification
text mining
logistic regression
naive Bayes classifier
feature selection
correlation
analiza sentymentu
klasyfikacja dokumentów ze względu na wydźwięk emocjonalny
eksploracja tekstu
regresja logistyczna
naiwny klasyfikator Bayesa
dobór cech
korelacja
Opis:
Sentiment analysis of text documents is a very important part of contemporary text mining. The purpose of this article is to present a new technique of text sentiment analysis which can be used with any type of a document-sentiment-classification method. The proposed technique involves feature selection independently of a classifier, which reduces the size of the feature space. Its advantages include intuitiveness and computational noncomplexity. The most important element of the proposed technique is a novel algorithm for the determination of the number of features to be selected sufficient for the effective classification. The algorithm is based on the analysis of the correlation between single features and document labels. A statistical approach, featuring a naive Bayes classifier and logistic regression, was employed to verify the usefulness of the proposed technique. They were applied to three document sets composed of 1,169 opinions of bank clients, obtained in 2020 from a Poland-based bank. The documents were written in Polish. The research demonstrated that reducing the number of terms over 10-fold by means of the proposed algorithm in most cases improves the effectiveness of classification.
Analiza sentymentu, czyli wydźwięku emocjonalnego, dokumentów tekstowych stanowi bardzo ważną część współczesnej eksploracji tekstu (ang. text mining). Celem artykułu jest przedstawienie nowej techniki analizy sentymentu tekstu, która może znaleźć zastosowanie w dowolnej metodzie klasyfikacji dokumentów ze względu na ich wydźwięk emocjonalny. Proponowana technika polega na niezależnym od klasyfikatora doborze cech, co skutkuje zmniejszeniem rozmiaru ich przestrzeni. Zaletami tej propozycji są intuicyjność i prostota obliczeniowa. Zasadniczym elementem omawianej techniki jest nowatorski algorytm ustalania liczby terminów wystarczających do efektywnej klasyfikacji, który opiera się na analizie korelacji pomiędzy pojedynczymi cechami dokumentów a ich wydźwiękiem. W celu weryfikacji przydatności proponowanej techniki zastosowano podejście statystyczne. Wykorzystano dwie metody: naiwny klasyfikator Bayesa i regresję logistyczną. Za ich pomocą zbadano trzy zbiory dokumentów składające się z 1169 opinii klientów jednego z banków działających na terenie Polski uzyskanych w 2020 r. Dokumenty zostały napisane w języku polskim. Badanie pokazało, że kilkunastokrotne zmniejszenie liczby terminów przy zastosowaniu proponowanej techniki na ogół poprawia jakość klasyfikacji.
Źródło:
Wiadomości Statystyczne. The Polish Statistician; 2023, 68, 5; 40-57
0043-518X
Pojawia się w:
Wiadomości Statystyczne. The Polish Statistician
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Measuring the effects of passengers’ socio-demographic factors on satisfaction with public bus services in a developing city: a case study in Semarang, Indonesia
Autorzy:
Haryadi, Bambang
Powiązania:
https://bibliotekanauki.pl/articles/2203889.pdf
Data publikacji:
2022
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
passenger satisfaction
socio-demographic
ordinal regression
logistic regression
BRT
zadowolenie pasażerów
dane społeczno-demograficzne
regresja porządkowa
regresja logistyczna
Opis:
The present study aimed to assess passenger satisfaction with bus transit services based on passengers’ socio-demographic characteristics, given the service quality. An ordinal logistic regression analysis was conducted to relate passengers’ sociodemographic characteristics to their satisfaction with public bus services. The sociodemographic characteristics studied were age, gender, marital status, occupation, income, housing type, family size, and motor vehicle ownership. Data were collected by administering an onboard survey to public bus passengers. In total, 580 completed a questionnaire asking about their socio-demographic characteristics and their satisfaction with bus transit services. The study reveals that significant differences exist in the levels of passengers’ satisfaction depending on their socio-demographic characteristics. Greater satisfaction was significantly associated with being married, unemployed, and young. The delivery of public bus services needs to consider different segments of passengers.
Źródło:
Transport Problems; 2022, 17, 2; 151--160
1896-0596
2300-861X
Pojawia się w:
Transport Problems
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Predicting the stability of open stopes using Machine Learning
Autorzy:
Szmigiel, Alicja
Apel, Derek B.
Powiązania:
https://bibliotekanauki.pl/articles/2201415.pdf
Data publikacji:
2022
Wydawca:
Główny Instytut Górnictwa
Tematy:
open stope
machine learning
logistic regression
random forest
system otwartych komór
uczenie maszynowe
regresja logistyczna
las losowy
Opis:
The Mathews stability graph method was presented for the first time in 1980. This method was developed to assess the stability of open stopes in different underground conditions, and it has an impact on evaluating the safety of underground excavations. With the development of technology and growing experience in applying computer sciences in various research disciplines, mining engineering could significantly benefit by using Machine Learning. Applying those ML algorithms to predict the stability of open stopes in underground excavations is a new approach that could replace the original graph method and should be investigated. In this research, a Potvin database that consisted of 176 historical case studies was passed to the two most popular Machine Learning algorithms: Logistic Regression and Random Forest, to compare their predicting capabilities. The results obtained showed that those algorithms can indicate the stability of underground openings, especially Random Forest, which, in examined data, performed slightly better than Logistic Regression.
Źródło:
Journal of Sustainable Mining; 2022, 21, 3; 241--248
2300-1364
2300-3960
Pojawia się w:
Journal of Sustainable Mining
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Revisiting strategies for fitting logistic regression for positive and unlabeled data
Autorzy:
Wawrzeńczyk, Adam
Mielniczuk, Jan
Powiązania:
https://bibliotekanauki.pl/articles/2142489.pdf
Data publikacji:
2022
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
positive learning
unlabeled learning
empirical risk
logistic regression
concave convex optimization
pozytywne uczenie się
nieoznaczone uczenie się
ryzyko empiryczne
regresja logistyczna
Opis:
Positive unlabeled (PU) learning is an important problem motivated by the occurrence of this type of partial observability in many applications. The present paper reconsiders recent advances in parametric modeling of PU data based on empirical likelihood maximization and argues that they can be significantly improved. The proposed approach is based on the fact that the likelihood for the logistic fit and an unknown labeling frequency can be expressed as the sum of a convex and a concave function, which is explicitly given. This allows methods such as the concave-convex procedure (CCCP) or its variant, the disciplined convex-concave procedure (DCCP), to be applied. We show by analyzing real data sets that, by using the DCCP to solve the optimization problem, we obtain significant improvements in the posterior probability and the label frequency estimation over the best available competitors.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2022, 32, 2; 299--309
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The impact of ‘trip experience’ on the awareness of world heritage site status among tourists visiting Delhi
Wpływ doświadczenia podróży na świadomość statusu obiektu światowego dziedzictwa UNESCO wśród turystów odwiedzających Delhi
Autorzy:
Juneja, Monisha
Sufi, Tahir
Bhatnagar, Mamta
Powiązania:
https://bibliotekanauki.pl/articles/2130288.pdf
Data publikacji:
2022-08-01
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
obiekty światowego dziedzictwa
Delhi
regresja logistyczna
doświadczenie podróży
świadomość
world heritage sites
logistic regression
trip experience
awareness
Opis:
Awareness of World Heritage Sites (WHS) is a marketing tool used to promote a destination. Once a tourist arrives, the ‘trip experience’ becomes a vital tool to ensure repeat visits and showcase a positive image of a destination to potential tourists. This study has tried to link the impact of the ‘trip experience’ of tourists to awareness of WHS aiming to understand the relationship of the six ‘domains’ and forming a proposed model. The data was collected from an on-site survey of 309 tourists from July to December 2019 using a structured questionnaire following a pilot study. For data analysis, logistic regression analysis was used. This revealed that four out of six domains increase the probability of tourists’ awareness of WHS status during a trip, namely: welcoming, local travel, tour leader and tour guide. The earlier model for using WHS awareness only for promotional purposes has been shifted by adding the trip experience of the tourists. The findings can be applied by tourism and hospitality facilitators in providing services to tourists.
Świadomość istnienia miejsc i obiektów światowego dziedzictwa UNESCO (World Heritage Sites – WHS) to narzędzie marketingowe wykorzystywane w promowaniu destynacji turystycznych. Przeżycia turysty w czasie podróży stają się ważnym instrumentem zachęcającym do powtórnych wizyt oraz przedstawiającym pozytywny wizerunek danej miejscowości innym potencjalnym odwiedzającym. Celem autorów artykułu było wykazanie wpływu doświadczenia podróży turystów na ich świadomość statusu światowego dziedzictwa, zrozumienie jej sześciu składowych oraz stworzenie zaproponowanego modelu. Dane zostały zebrane podczas lokalnego badania ankietowego obejmującego 309 turystów, w okresie od czerwca do grudnia 2019 r., przy użyciu ustrukturyzowanego kwestionariusza, po przeprowadzeniu badania pilotażowego. Do analizy danych zastosowano metodę analizy regresji logistycznej. Wykazała ona, że cztery spośród sześciu składowych potencjalnie zwiększają podczas podróży u odwiedzających świadomość statusu światowego dziedzictwa. Są to: powitanie, podróżowanie po okolicy, pilot wycieczki i miejscowy przewodnik. Wcześniejszy model, w którym świadomość przebywania w miejscu światowego dziedzictwa była wykorzystywana wyłącznie do celów promocyjnych, został zmodyfikowany przez dodanie do niego elementu doświadczenia podróżniczego turystów. Wyniki mogą być przydatne dla osób zajmujących się turystyką i hotelarstwem przy organizacji usług turystycznych.
Źródło:
Turyzm; 2022, 32, 1; 77-92
0867-5856
2080-6922
Pojawia się w:
Turyzm
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Transport mode choice among off-campus students in a hilly environment: the case of Aizawl, India
Autorzy:
Saitluanga, Benjamin L.
Hmangaihzela, Lal
Powiązania:
https://bibliotekanauki.pl/articles/2203904.pdf
Data publikacji:
2022
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
transport mode choice
off-campus students
hilly terrain
multinomial logistic regression
wybór środka transportu
studenci spoza kampusu
teren pagórkowaty
wielomianowa regresja logistyczna
Opis:
In recent years, the transport mode choice of students of higher educational institutions has become a subject of increasing interest. Investigating the modal choice of students, who form a considerable section of the population, is crucial for sustainable urban transport planning and understanding the quality of life of students. Reviews of previous studies have indicated that hilly cities in less developed countries are neglected in transportation studies. The present paper investigates the travel behaviour of non-local, off-campus college students in Aizawl – a fast-growing hilly city in northeast India. The study found that transport mode choices are influenced by interrelated factors, including socio-economic background, demographic, availability of transport mode and location of housing. It was also found that walking and public buses are the most preferred modes of commuting among the studied college students. Female students who rent houses near their colleges are more likely to walk than their male counterparts. On the other hand, male students belonging to high-income families tended to travel by private vehicles from their residences, which are located relatively far away from colleges. The study argues for the enhancement of the intake capacity of residential hostels inside the campus to improve the growing transport problem of off-campus students in the city.
Źródło:
Transport Problems; 2022, 17, 3; 163--172
1896-0596
2300-861X
Pojawia się w:
Transport Problems
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wykorzystanie elementów uczenia maszynowego do modelowania stężenia zanieczyszczeń atmosferycznych : studium przypadku pyłu PM2.5 w Szczecinie
Studium przypadku pyłu PM2.5 w Szczecinie
Autorzy:
Bihałowicz, Jan Stefan
Powiązania:
Zeszyty Naukowe SGSP 2022, nr 81, s. 7-28
Współwytwórcy:
Szkoła Główna Służby Pożarniczej oth
Data publikacji:
2022
Tematy:
Analiza danych
Błędy
Jakość powietrza atmosferycznego
Modele matematyczne
Pożar
Prognozowanie
Pył zawieszony
Regresja logistyczna
Składowiska odpadów
Sztuczna sieć neuronowa
Uczenie maszynowe
Zanieczyszczenie powietrza
Artykuł z czasopisma naukowego
Case study (studium przypadku)
Opis:
W artykule opisano możliwości wykorzystania uczenia maszynowego w modelowaniu stężeń zanieczyszczeń w lokalizacjach o określonych stałych źródłach emisji. Jako substancję zanieczyszczającą wybrano pył PM 2.5. Wdrożono sześć różnych modeli i poddano ich walidacji krzyżowej na podstawie danych meteorologicznych zarejestrowanych w 2013-2018 w stacji Instytutu Meteorologii i Gospodarki Wodnej w Szczecinie. Wykazano, że przewidywane wartości stężeń powstałe podczas pożaru były zaniżone w porównaniu do rzeczywistych poziomów.
Bibliografia, netografia na stronach 26-28.
Dostawca treści:
Bibliografia CBW
Artykuł
Tytuł:
Sentiment Classification of Bank Clients’ Reviews Written in the Polish Language
Analiza sentymentu na podstawie polskojęzycznych recenzji klientów banku
Autorzy:
Idczak, Adam Piotr
Powiązania:
https://bibliotekanauki.pl/articles/2033889.pdf
Data publikacji:
2021-06-30
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
analiza sentymentu
klasyfikacja dokumentów
textmining
regresja logistyczna
naiwny klasyfikator Bayesa
sentiment analysis
opinion mining
text classification
text mining
logistic regression
naive Bayes classifier
Opis:
It is estimated that approximately 80% of all data gathered by companies are text documents. This article is devoted to one of the most common problems in text mining, i.e. text classification in sentiment analysis, which focuses on determining the sentiment of a document. A lack of defined structure of the text makes this problem more challenging. This has led to the development of various techniques used in determining the sentiment of a document. In this paper, a comparative analysis of two methods in sentiment classification, a naive Bayes classifier and logistic regression, was conducted. Analysed texts are written in the Polish language and come from banks. The classification was conducted by means of a bag‑of‑n‑grams approach, where a text document is presented as a set of terms and each term consists of n words. The results show that logistic regression performed better.
Szacuje się, że około 80% wszystkich danych gromadzonych i przechowywanych w systemach informacyjnych przedsiębiorstw ma postać dokumentów tekstowych. Artykuł jest poświęcony jednemu z podstawowych problemów textminingu, tj. klasyfikacji tekstów w analizie sentymentu, która rozumiana jest jako badanie wydźwięku tekstu. Brak określonej struktury dokumentów tekstowych jest przeszkodą w realizacji tego zadania. Taki stan rzeczy wymusił rozwój wielu różnorodnych technik ustalania sentymentu dokumentów. W artykule przeprowadzono analizę porównawczą dwóch metod badania sentymentu: naiwnego klasyfikatora Bayesa oraz regresji logistycznej. Badane teksty są napisane w języku polskim, pochodzą z banków i mają charakter marketingowy. Klasyfikację przeprowadzono, stosując podejście bag‑of‑n‑grams. W ramach tego podejścia dokument tekstowy wyrażony jest za pomocą podciągów składających się z określonej liczby n wyrazów. Uzyskane wyniki pokazały, że lepiej spisała się regresja logistyczna.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2021, 2, 353; 43-56
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Application of the logistic regression for determining transition probability matrix of operating states in the transport systems
Zastosowanie regresji logistycznej do wyznaczania macierzy prawdopodobieństw przejść stanów eksploatacyjnych w systemach transportowych
Autorzy:
Kozłowski, Edward
Borucka, Anna
Świderski, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/301531.pdf
Data publikacji:
2020
Wydawca:
Polska Akademia Nauk. Polskie Naukowo-Techniczne Towarzystwo Eksploatacyjne PAN
Tematy:
logistic regression
transition probability matrix
Markov chains
transport system
regresja logistyczna
macierz prawdopodobieństw przejść
łańcuchy Markowa
system transportowy
Opis:
Transport companies can be regarded as a technical, organizational, economic and legal transport system. Maintaining the quality and continuity of the implementation of transport requisitions requires a high level of readiness of vehicles and staff (especially drivers). Managing and controlling the tasks being implemented is supported by mathematical models enabling to assess and determine the strategy regarding the actions undertaken. The support for managing processes relies mainly on the analysis of sequences of the subsequent activities (states). In many cases, this sequence of activities is modelled using stochastic processes that satisfy Markov property. Their classic application is only possible if the conditional probability distributions of future states are determined solely by the current operational state. The identification of such a stochastic process relies mainly on determining the probability matrix of interstate transitions. Unfortunately, in many cases the analyzed series of activities do not satisfy Markov property. In addition, the occurrence of the next state is affected by the length of time the system remains in the specified operating state. The article presents the method of constructing the matrix of probabilities of transitions between operational states. The values of this matrix depend on the time the object remains in the given state. The aim of the article was to present an alternative method of estimating the parameters of this matrix in a situation where the studied series does not satisfy Markov property. The logistic regression was used for this purpose.
Przedsiębiorstwa transportowe mogą być traktowane jako wyodrębniony pod względem technicznym, organizacyjnym, ekonomicznym i prawnym system transportowy. Zachowanie jakości i ciągłości realizacji zleceń przewozowych wymaga wysokiego poziomu gotowości pojazdów oraz personelu (szczególnie kierowców). Kontrolowanie i sterowanie realizowanymi zadaniami wspierane jest modelami matematycznymi, umożliwiającymi ocenę i określenie strategii dotyczącej podejmowanych działań. Wsparcie procesów zarządzania polega głównie na analizie sekwencji kolejnych, realizowanych czynności (stanów). W wielu przypadkach taki ciąg czynności jest modelowany za pomocą procesów stochastycznych, spełniających własność Markowa. Ich klasyczne zastosowanie możliwe jest tylko w przypadku, gdy warunkowe rozkłady prawdopodobieństwa przyszłych stanów są określone wyłącznie przez bieżący stan eksploatacyjny. Identyfikacja takiego procesu stochastycznego polega głównie na wyznaczeniu macierzy prawdopodobieństw przejść międzystanowych. Niestety w wielu przypadkach analizowane ciągi czynności nie spełniają własności Markowa. Dodatkowo, na wystąpienie kolejnego stanu wpływa długość interwału czasowego pozostania systemu w określonym stanie eksploatacyjnym. W artykule przedstawiono metodę konstrukcji macierzy prawdopodobieństw przejść pomiędzy stanami eksploatacyjnymi. Wartości tej macierzy zależą od czasu przebywania obiektu w danym stanie. Celem artykułu było zaprezentowanie alternatywnej metody estymacji parametrów tej macierzy w sytuacji, gdy badany szereg nie spełnia własności Markowa. Wykorzystano w tym celu regresję logistyczną.
Źródło:
Eksploatacja i Niezawodność; 2020, 22, 2; 192-200
1507-2711
Pojawia się w:
Eksploatacja i Niezawodność
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Application of the logistic regression model to assess the risk of death in road traffic accidents in the Mazowieckie voivodeship
Autorzy:
Borucka, Anna
Grzelak, Małgorzata
Świderski, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/1841234.pdf
Data publikacji:
2020
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
road safety
logistic regression
mortality
bezpieczeństwo drogowe
regresja logistyczna
śmiertelność
Opis:
Mortality caused by road accidents is a significant problem for most countries, including Poland, where approximately 2,900 people die each year, and another 37,359 are injured. Research in this area has been conducted on a large scale. One of the most important elements is the evaluation of factors leading to fatalities in road accidents, which is also the goal of this article. The analysis was based on data on road accidents from the Mazowieckie Voivodeship, which is characterized by one of the highest mortality rates gathered for the period 2016-2018. Owing to the dichotomous form of the studied variable, logistic regression was used. Estimated model parameters and calculated odds ratios allowed to assess the effect of selected factors on road traffic mortality rate. As significant, the type of the perpetrator and the traffic participant, sex and age of the victim, road lighting, and the driver’s experience were selected. It was assessed that pedestrians are the group most exposed to death in a road accident, both as perpetrators and victims. It was also pointed out that the risk of death for women is 1.8 times higher than men. In addition, the effect of driving experience is also important, and the risk of death is 0.64 times lower for drivers with longer practice. It was also assessed that with each subsequent year of life, the risk of death in a road accident increased by 2%. Furthermore, according to incident site lighting, the study demonstrated that the risk of death was greatest when driving at night on an unlit road. The results obtained may support public safety and law enforcement authorities in carrying out preventive actions and also can be helpful in shaping the overall strategy on road safety.
Źródło:
Transport Problems; 2020, 15, 4, cz. 1; 125-136
1896-0596
2300-861X
Pojawia się w:
Transport Problems
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Determinants of the quality of life in municipalities of Kielce district
Autorzy:
Brzozowska-Rup, Katarzyna
Czaja, Roksana
Piotrowska-Piątek, Agnieszka
Powiązania:
https://bibliotekanauki.pl/articles/1918637.pdf
Data publikacji:
2020
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
quality of life
logistic regression
Hellwig’s method
jakość życia
regresja logistyczna
metoda Hellwiga
Opis:
Identifying the factors that significantly affect the quality of life of the residents of municipalities of the Kielce poviat based on a synthetic indicator. Design/methodology/approach: The method used in the paper is create a synthetic indicator designed using a taxonomic method and the estimation of the logistic regression model. Data of the Central Statistical Office concerning the years 2014-2018 were used in the calculations. Findings: The obtained values of the TMR (Total Material Requirement) indicator suggest that in the Kielce poviat the quality of life of the residents of individual municipalities is very diverse. At the same time, a common positive tendency is observed, manifested in the trend indicating an improvement in the quality of life in each of the municipalities in the examined period. The constructed indicator was used to estimate the regression model for cross-sectional data from 2018. Originality/value: The estimated models allowed to formulate conclusions concerning the impact of particular explanatory variables on the diagnosed level of quality of life in the surveyed municipalities.
Źródło:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska; 2020, 146; 21-35
1641-3466
Pojawia się w:
Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Evaluation of resampling methods in the class unbalance problem
Ocena metod repróbkowania w problemie zbiorów niezbilansowanych
Autorzy:
Kubus, Mariusz
Powiązania:
https://bibliotekanauki.pl/articles/424935.pdf
Data publikacji:
2020
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
class unbalance
resampling
regularized logistic regression
random forests
klasy niezbilansowane
repróbkowanie
regularyzowana regresja logistyczna
lasy losowe
Opis:
The purpose of many real world applications is the prediction of rare events, and the training sets are then highly unbalanced. In this case, the classifiers are biased towards the correct prediction of the majority class and they misclassify a minority class, whereas rare events are of the greater interest. To handle this problem, numerous techniques were proposed that balance the data or modify the learning algorithms. The goal of this paper is a comparison of simple random balancing methods with more sophisticated resampling methods that appeared in the literature and are available in R program. Additionally, the authors ask whether learning on the original dataset and using a shifted threshold for classification is not more competitive. The authors provide a survey from the perspective of regularized logistic regression and random forests. The results show that combining random under-sampling with random forests has an advantage over other techniques while logistic regression can be competitive in the case of highly unbalanced data.
Celem wielu praktycznych zastosowań modeli dyskryminacyjnych jest przewidywanie zdarzeń rzadkich. Zbiory uczące są wówczas niezbilansowane. W tym przypadku klasyfikatory mają tendencję do poprawnego klasyfikowania obiektów klasy większościowej i jednocześnie błędnie klasyfikują wiele obiektów klasy mniejszościowej, która jest przedmiotem szczególnego zainteresowania. W celu rozwiązania tego problemu zaproponowano wiele technik, które bilansują dane lub modyfikują algorytmy uczące. Celem artykułu jest porównanie prostych, losowych metod bilansowania z bardziej wyrafinowanymi, które pojawiły się w literaturze. Dodatkowo postawiono pytanie, czy konkurencyjnym podejściem nie jest budowa modelu na oryginalnym zbiorze danych i przesunięcie progu klasyfikacji. Badanie przedstawiono z perspektywy regularyzowanej regresji logistycznej i lasów losowych. Wyniki pokazują, że kombinacja metody under-sampling z lasami losowymi wykazuje przewagę nad innymi technikami, podczas gdy regresja logistyczna może być konkurencyjna w przypadku silnego niezbilansowania.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2020, 24, 1; 39-50
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies