Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "głębokie uczenie" wg kryterium: Temat


Tytuł:
An automated driving strategy generating method based on WGAIL–DDPG
Autorzy:
Zhang, Mingheng
Wan, Xing
Gang, Longhui
Lv, Xinfei
Wu, Zengwen
Liu, Zhaoyang
Powiązania:
https://bibliotekanauki.pl/articles/2055167.pdf
Data publikacji:
2021
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
automated driving system
deep learning
deep reinforcement learning
imitation learning
deep deterministic policy gradient
system jezdny
uczenie głębokie
uczenie przez naśladowanie
Opis:
Reliability, efficiency and generalization are basic evaluation criteria for a vehicle automated driving system. This paper proposes an automated driving decision-making method based on the Wasserstein generative adversarial imitation learning–deep deterministic policy gradient (WGAIL–DDPG(λ)). Here the exact reward function is designed based on the requirements of a vehicle’s driving performance, i.e., safety, dynamic and ride comfort performance. The model’s training efficiency is improved through the proposed imitation learning strategy, and a gain regulator is designed to smooth the transition from imitation to reinforcement phases. Test results show that the proposed decision-making model can generate actions quickly and accurately according to the surrounding environment. Meanwhile, the imitation learning strategy based on expert experience and the gain regulator can effectively improve the training efficiency for the reinforcement learning model. Additionally, an extended test also proves its good adaptability for different driving conditions.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2021, 31, 3; 461--470
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Studiowanie zdalne w perspektywie głębokiego i refleksyjnego uczenia się
Distance learning in the perspective of deep and reflective learning
Autorzy:
Wróblewska, Walentyna
Powiązania:
https://bibliotekanauki.pl/articles/11830862.pdf
Data publikacji:
2023-03-31
Wydawca:
Wydawnictwo Adam Marszałek
Tematy:
studiowanie zdalne
student
uczenie się głębokie i refleksyjne
paradygmaty dydaktyczne
edukacja akademicka
distance learning
deep and reflective learning
teaching paradigms
academic education
Opis:
The aim of the article is to show the process of studying young people remotely and to search for solutions leading to the improvement of the process in the perspective of deep and reflective learning. The article aims to solve the problem: how is the process of studying young people remotely? The method of individual cases, the technique of uncategorized, in-depth interview, was used to solve the problem. In the theoretical part, attention was paid to understanding the process of studying in the light of various didactic paradigms and an attempt was made to outline the approach of a deep and reflective learning process, looking for ways to improve the process of studying young people in this perspective. In the empirical part, the course of the process of studying the respondents remotely was presented, highlighting, above all, the components to which the respondents drew attention in their statements. The analysis of the empirical material shows that the process of studying young people is understood surface, superficially, it is limited to taking actions offered by the university on the educational platform. Students do not use their potential in the process of studying, they do not show full, possible commitment. The analysis of the empirical material leads to the development of practical guidelines aimed at improving the process of studying young people, which result from the assumptions of deep and reflective learning. The research shows the need to focus attention on the process of studying and its effectiveness, the need to take action by academic teachers, and above all by students focused on improving the process.
Celem artykułu jest ukazanie przebiegu procesu studiowania młodzieży w formie zdalnej i poszukiwanie rozwiązań prowadzących do doskonalenia procesu w perspektywie uczenia się głębokiego i refleksyjnego. W artykule zmierzano do rozwiązania problemu: jak przebiega proces studiowania młodzieży w formie zdalnej? Do rozwiązania problemu wykorzystano metodę indywidualnych przypadków, technikę wywiadu nieskategoryzowanego, pogłębionego. W części teoretycznej zwrócono uwagę na rozumienie procesu studiowania w świetle różnych paradygmatów dydaktycznych oraz podjęto próbę zarysowania podejścia głębokiego i refleksyjnego procesu uczenia się, poszukując w tej perspektywie sposobów na udoskonalenie procesu studiowania młodzieży. W części empirycznej zaprezentowano przebieg procesu studiowania badanych w formie zdalnej, eksponując przede wszystkim komponenty, na które zwracali uwagę badani w swoich wypowiedziach. Z analizy materiału empirycznego wynika, że proces studiowania młodzieży jest rozumiany płytko, powierzchownie, ogranicza się do podejmowania działań oferowanych przez uczelnię na platformie edukacyjnej. Studenci nie wykorzystują swojego potencjału w procesie studiowania, nie wykazują pełnego możliwego zaangażowania. Analiza materiału empirycznego prowadzi do opracowania wskazań praktycznych ukierunkowanych na doskonalenie procesu studiowania młodzieży, które wynikają z założeń uczenia się głębokiego i refleksyjnego. Z badań wynika potrzeba koncentracji uwagi na procesie studiowania i jego efektywności, potrzeba podjęcia działań przez nauczycieli akademickich, a przede wszystkim przez studentów ukierunkowanych na doskonalenie procesu.
Źródło:
Kultura i Edukacja; 2023, 1(139); 38-53
1230-266X
Pojawia się w:
Kultura i Edukacja
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
An Analysis of Novel Money Laundering Data Using Heterogeneous Graph Isomorphism Networks. FinCEN Files Case Study
Wykorzystanie heterogenicznych grafowych sieci izomorficznych w analizie danych związanych z praniem brudnych pieniędzy. Studium przypadku FinCEN
Autorzy:
Wójcik, Filip
Powiązania:
https://bibliotekanauki.pl/articles/38890419.pdf
Data publikacji:
2024
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
money laundering
deep learning
machine learning
network analysis
graphs
pranie brudnych pieniędzy
uczenie głębokie
analiza sieci
grafy
Opis:
Aim: This study aimed to develop and apply the novel HexGIN (Heterogeneous extension for Graph Isomorphism Network) model to the FinCEN Files case data and compare its performance with existing solutions, such as the SAGE-based graph neural network and Multi-Layer Perceptron (MLP), to demonstrate its potential advantages in the field of anti-money laundering systems (AML). Methodology: The research employed the FinCEN Files case data to develop and apply the HexGIN model in a beneficiary prediction task for a suspicious transactions graph. The model's performance was compared with the existing solutions in a series of cross-validation experiments. Results: The experimental results on the cross-validation data and test dataset indicate the potential advantages of HexGIN over the existing solutions, such as MLP and Graph SAGE. The proposed model outperformed other algorithms in terms of F1 score, precision, and ROC AUC in both training and testing phases. Implications and recommendations: The findings demonstrate the potential of heterogeneous graph neural networks and their highly expressive architectures, such as GIN, in AML. Further research is needed, in particular to combine the proposed model with other existing algorithms and test the solution on various money-laundering datasets. Originality/value: Unlike many AML studies that rely on synthetic or undisclosed data sources, this research was based on a publicly available, real, heterogeneous transaction dataset, being part of a larger investigation. The results indicate a promising direction for the development of modern hybrid AML tools for analysing suspicious transactions; based on heterogeneous graph networks capable of handling various types of entities and their connections.
Cel: Celem niniejszej analizy jest opracowanie i zastosowanie nowego modelu HexGIN (heterogeniczne rozszerzenie dla izomorfizmu sieci grafowych) do danych z dochodzenia dziennikarskiego FinCEN oraz porównanie jego jakości predykcji z istniejącymi rozwiązaniami, takimi jak sieć SAGE i wielowarstwowa sieć neuronowa (MLP). Metodyka: W badaniach wykorzystano dane ze śledztwa FinCEN do opracowania i zastosowania modelu HexGIN w zadaniu przewidywania beneficjenta sieci powiązanych transakcji finansowych. Skuteczność modelu porównano z istniejącymi rozwiązaniami wykorzystującymi sieci neuronowe grafu w serii eksperymentów z walidacją krzyżową. Wyniki: Eksperymentalne wyniki na danych walidacji krzyżowej i zestawie testowym potwierdzają potencjalne zalety HexGIN w porównaniu z istniejącymi rozwiązaniami, takimi jak MLP i SAGE. Proponowany model przewyższa inne algorytmy pod względem wyniku miary F1, precyzji i ROC AUC, w fazie zarówno treningowej, jak i testowej. Implikacje i rekomendacje: Wyniki pokazują potencjał heterogenicznych grafowych sieci i ich wysoce ekspresyjnych implementacji, takich jak GIN, w analizie transakcji finansowych. Potrzebne są dalsze badania, zwłaszcza w celu połączenia proponowanego modelu z innymi istniejącymi algorytmami i przetestowania rozwiązania na różnych zestawach danych dotyczących problemu prania brudnych pieniędzy. Oryginalność/wartość: W przeciwieństwie do wielu badań, które opierają się na syntetycznych lub nieujawnionych źródłach danych związanych z praniem brudnych pieniędzy, to studium przypadku opiera się na publicznie dostępnych, rzeczywistych, heterogenicznych danych transakcyjnych, będących częścią większego śledztwa dziennikarskiego. Wyniki wskazują obiecujący kierunek dla rozwoju nowoczesnych hybrydowych narzędzi do analizy podejrzanych transakcji, opartych na heterogenicznych sieciach grafowych.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2024, 28, 2; 32-49
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Improvement of e-commerce recommendation systems with deep hybrid collaborative filtering with content: A case study
Wykorzystanie Hybrydowych Głębokich Sieci Neuronowych jako systemów rekomendacyjnych. Studium przypadku
Autorzy:
Wójcik, Filip
Górnik, Michał
Powiązania:
https://bibliotekanauki.pl/articles/424978.pdf
Data publikacji:
2020
Wydawca:
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu
Tematy:
collaborative filtering
deep learning
content model
product recommendation
filtracja kolaboratywna
głębokie uczenie
model treści
rekomendacja produktów
Opis:
This paper presents a proposition to utilize flexible neural network architecture called Deep Hybrid Collaborative Filtering with Content (DHCF) as a product recommendation engine. Its main goal is to provide better shopping suggestions for customers on the e-commerce platform. The system was tested on 2018 Amazon Reviews Dataset, using repeated cross validation and compared with other approaches: collaborative filtering (CF) and deep collaborative filtering (DCF) in terms of mean squared error (MSE), mean absolute error (MAE) and mean absolute percentage error (MAPE). DCF and DHCF were proved to be significantly better than the CF. DHCF proved to be better than DCF in terms of MAE and MAPE, it also scored the best on separate test data. The significance of the differences was checked by means of a Friedman test, followed by post-hoc comparisons to control p-value. The experiment shows that DHCF can outperform other approaches considered in the study, with more robust scores.
W artykule zbadano innowacyjną architekturę sieci neuronowych zwaną Głębokim Hybrydowym Systemem Filtracji Kolaboratywnej (DHCF), mającą posłużyć jako system rekomendacji konsumenckich. Jego zadaniem jest sugerowanie produktów klientom platform e-commerce. System został przetestowany na zbiorze danych 2018 Amazon Reviews, z wykorzystaniem powtórzonej walidacji krzyżowej, i porównany z dwoma innymi podejściami: filtracją kolaboratywną (CF) oraz filtracją kolaboratywną z siecią neuronową (DCF). Do porównania wykorzystano metryki błędu średniokwadratowego (MSE), średniego błędu bezwzględnego (MAE) oraz średniego procentowego błędu bezwzględnego (MAPE). DCF i DHCF uzyskały wyniki istotnie lepsze niż CF, a dodatkowo DHCF uzyskał lepsze wyniki niż DCF pod względem MAE i MAPE. Istotność różnic sprawdzano testem Friedmana z porównaniami wielokrotnymi i kontrolą poziomu istotności. Eksperyment dowodzi, że DHCF uzyskuje lepsze i stabilniejsze wyniki niż pozostałe metody.
Źródło:
Econometrics. Ekonometria. Advances in Applied Data Analytics; 2020, 24, 3; 37-50
1507-3866
Pojawia się w:
Econometrics. Ekonometria. Advances in Applied Data Analytics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Zwiększenie rozdzielczości obrazów termowizyjnych metodą sieci neuronowych głębokiego uczenia
Increasing of Thermal Images Resolution Using Deep Learning Neural Networks
Autorzy:
Więcek, Piotr
Sankowski, Dominik
Powiązania:
https://bibliotekanauki.pl/articles/2068620.pdf
Data publikacji:
2021
Wydawca:
Sieć Badawcza Łukasiewicz - Przemysłowy Instytut Automatyki i Pomiarów
Tematy:
resztkowe sieci neuronowe
głębokie uczenie
superrozdzielczość
obraz termograficzny
PyTorch
residual neural networks
deep learning
super-resolution
thermographic image
Opis:
W pracy przedstawiono nowy algorytm zwiększenia rozdzielczości obrazów termowizyjnych. W tym celu zintegrowano sieć resztkową z modułem współdzielonego filtru z podpróbkowaniem obrazu KSAC (ang. Kernel-Sharing Atrous Convolution). Uzyskano znaczne skrócenie czasu działania algorytmu przy zachowaniu dużej dokładności. Sieć neuronową zrealizowano w środowisku PyTorch. Przedstawiono wyniki działania proponowanej nowej metody zwiększenia rozdzielczości obrazów termowizyjnych o wymiarach 32×24, 160×120 i 640×480 dla skali 2-6.
The article presents a new algorithm for increasing the resolution of thermal images. For this purpose, the residual network was integrated with the Kernel-Sharing Atrous Convolution (KSAC) image sub-sampling module. A significant reduction in the algorithm’s complexity and shortening the execution time while maintaining high accuracy were achieved. The neural network has been implemented in the PyTorch environment. The results of the proposed new method of increasing the resolution of thermal images with sizes 32x24, 160×120 and 640×480 for scales up to 6 are presented.
Źródło:
Pomiary Automatyka Robotyka; 2021, 25, 3; 31--35
1427-9126
Pojawia się w:
Pomiary Automatyka Robotyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Classification of high resolution satellite images using improved U-Net
Autorzy:
Wang, Yong
Zhang, Dongfang
Dai, Guangming
Powiązania:
https://bibliotekanauki.pl/articles/331235.pdf
Data publikacji:
2020
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
satellite image classification
deep learning
U-net
spatial pyramid pooling
zdjęcia satelitarne
uczenie głębokie
Opis:
Satellite image classification is essential for many socio-economic and environmental applications of geographic information systems, including urban and regional planning, conservation and management of natural resources, etc. In this paper, we propose a deep learning architecture to perform the pixel-level understanding of high spatial resolution satellite images and apply it to image classification tasks. Specifically, we augment the spatial pyramid pooling module with image-level features encoding the global context, and integrate it into the U-Net structure. The proposed model solves the problem consisting in the fact that U-Net tends to lose object boundaries after multiple pooling operations. In our experiments, two public datasets are used to assess the performance of the proposed model. Comparison with the results from the published algorithms demonstrates the effectiveness of our approach.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2020, 30, 3; 399-413
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Vehicle classification using the convolution neural network approach
Autorzy:
Trivedi, Janak
Devi, Mandalapu Sarada
Dhara, Dave
Powiązania:
https://bibliotekanauki.pl/articles/2091225.pdf
Data publikacji:
2021
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
convolution neural network
vehicle classification
deep learning
intelligent transportation system
konwolucyjna sieć neuronowa
klasyfikacja pojazdów
uczenie głębokie
inteligentny system transportowy
Opis:
We present vehicle detection classification using the Convolution Neural Network (CNN) of the deep learning approach. The automatic vehicle classification for traffic surveillance video systems is challenging for the Intelligent Transportation System (ITS) to build a smart city. In this article, three different vehicles: bike, car and truck classification are considered for around 3,000 bikes, 6,000 cars, and 2,000 images of trucks. CNN can automatically absorb and extract different vehicle dataset’s different features without a manual selection of features. The accuracy of CNN is measured in terms of the confidence values of the detected object. The highest confidence value is about 0.99 in the case of the bike category vehicle classification. The automatic vehicle classification supports building an electronic toll collection system and identifying emergency vehicles in the traffic.
Źródło:
Zeszyty Naukowe. Transport / Politechnika Śląska; 2021, 112; Bibliogr. 13 poz.
0209-3324
2450-1549
Pojawia się w:
Zeszyty Naukowe. Transport / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Anonymous traffic classification based on three-dimensional Markov image and deep learning
Autorzy:
Tang, Xin
Li, Huanzhou
Zhang, Jian
Tang, Zhangguo
Wang, Han
Cai, Cheng
Powiązania:
https://bibliotekanauki.pl/articles/27311448.pdf
Data publikacji:
2023
Wydawca:
Polska Akademia Nauk. Czasopisma i Monografie PAN
Tematy:
anonymous network
traffic classification
three-dimensional Markov image
output self-attention
deep learning
sieć anonimowa
klasyfikacja ruchu
trójwymiarowy obraz Markowa
samouwaga wyjściowa
uczenie głębokie
Opis:
Illegal elements use the characteristics of an anonymous network hidden service mechanism to build a dark network and conduct various illegal activities, which brings a serious challenge to network security. The existing anonymous traffic classification methods suffer from cumbersome feature selection and difficult feature information extraction, resulting in low accuracy of classification. To solve this problem, a classification method based on three-dimensional Markov images and output self-attention convolutional neural network is proposed. This method first divides and cleans anonymous traffic data packets according to sessions, then converts the cleaned traffic data into three-dimensional Markov images according to the transition probability matrix of bytes, and finally inputs the images to the output self-attention convolution neural network to train the model and perform classification. The experimental results show that the classification accuracy and F1-score of the proposed method for Tor, I2P, Freenet, and ZeroNet can exceed 98.5%, and the average classification accuracy and F1-score for 8 kinds of user behaviors of each type of anonymous traffic can reach 93.7%. The proposed method significantly improves the classification effect of anonymous traffic compared with the existing methods.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2023, 71, 4; art. no. e145676
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Deep learning for damaged tissue detection and segmentation in Ki-67 brain tumor specimens based on the U-net model
Autorzy:
Swiderska-Chadaj, Z.
Markiewicz, T.
Gallego, J.
Bueno, G.
Grala, B.
Lorent, M.
Powiązania:
https://bibliotekanauki.pl/articles/202412.pdf
Data publikacji:
2018
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
damaged tissue regions detection
artifacts detection
deep learning
Ki-67 staining specimens
wykrywanie uszkodzonych regionów tkankowych
wykrywanie artefaktów
artefakt
uczenie głębokie
próbki barwiące Ki-67
Opis:
The pathologists follow a systematic and partially manual process to obtain histological tissue sections from the biological tissue extracted from patients. This process is far from being perfect and can introduce some errors in the quality of the tissue sections (distortions, deformations, folds and tissue breaks). In this paper, we propose a deep learning (DL) method for the detection and segmentation of these damaged regions in whole slide images (WSIs). The proposed technique is based on convolutional neural networks (CNNs) and uses the U-net model to achieve the pixel-wise segmentation of these unwanted regions. The results obtained show that this technique yields satisfactory results and can be applied as a pre-processing step for automatic WSI analysis in order to prevent the use of the damaged areas in the evaluation processes.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2018, 66, 6; 849-856
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Exploring complex and big data
Autorzy:
Stefanowski, J.
Krawiec, K.
Wrembel, R.
Powiązania:
https://bibliotekanauki.pl/articles/330152.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
big data
complex data
data integration
data provenance
data streams
deep learning
dane złożone
integracja danych
pochodzenie danych
strumień danych
uczenie głębokie
Opis:
This paper shows how big data analysis opens a range of research and technological problems and calls for new approaches. We start with defining the essential properties of big data and discussing the main types of data involved. We then survey the dedicated solutions for storing and processing big data, including a data lake, virtual integration, and a polystore architecture. Difficulties in managing data quality and provenance are also highlighted. The characteristics of big data imply also specific requirements and challenges for data mining algorithms, which we address as well. The links with related areas, including data streams and deep learning, are discussed. The common theme that naturally emerges from this characterization is complexity. All in all, we consider it to be the truly defining feature of big data (posing particular research and technological challenges), which ultimately seems to be of greater importance than the sheer data volume.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2017, 27, 4; 669-679
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Autoenkodery. Podstawy budowy wydajnych modeli uczenia maszynowego
Autorzy:
Rodewald, Gabriel
Powiązania:
https://bibliotekanauki.pl/articles/2082264.pdf
Data publikacji:
2022-08
Wydawca:
Warszawska Wyższa Szkoła Informatyki
Tematy:
uczenie maszynowe
uczenie głębokie
autoenkodery
autoenkodery wariacyjne
autoenkodery odszumiające
autoenkodery rzadkie
autoenkodery konwolucyjne
autoenkodery rekurencyjne
Opis:
Autoenkoder jest siecią neuronową złożoną z pary koder-dekoder. Koder odpowiada za redukcję wymiarowości danych w modelu przy jednoczesnym zachowaniu kluczowych cech, niezbędnych do odtworzenia danych wejściowych przez dekoder. Z uwagi na cechy architektury wewnętrznej wyodrębnia się autoenkodery deterministyczne oraz probabilistyczne. Istnieją wyspecjalizowane wersje autoenkoderów odpowiadające tematyce realizowanych modeli uczenia maszynowego, na przykład autoenkodery odszumiające, rekurencyjne, splotowe, wariacyjne lub rzadkie. W artykule zostały przedstawione jedynie najistotniejsze zagadnienia związane z autoenkoderami.
Źródło:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki; 2022, 16, 26; 21-60
1896-396X
2082-8349
Pojawia się w:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Comparative study on the classification methods for breast cancer diagnosis
Autorzy:
Qiu, Y.
Zhou, G.
Zhao, Q.
Cichocki, A.
Powiązania:
https://bibliotekanauki.pl/articles/200743.pdf
Data publikacji:
2018
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
breast cancer
mammography
DDSM
comparative study
deep learning
rak piersi
mammografia
Badanie porównawcze
uczenie głębokie
Opis:
Digital mammography is one of the most widely used approaches for breast cancer diagnosis. Many researchers have demonstrated the superiority of machine learning methods in breast cancer diagnosis using different mammography databases. Since these methods often have different pros and cons, which may confuse doctors and researchers, an elaborate comparison and examination among them is urgently needed for practical breast cancer diagnosis. In this study, we conducted a comprehensive comparative study of the state-of-the-art machine learning methods that are promising in breast cancer diagnosis. For this purpose we analyze the largest mammography diagnosis database: Digital Database for Screening Mammography (DDSM). We considered various approaches for feature extraction including principal component analysis (PCA), nonnegative matrix factorization (NMF), spatial-temporal discriminant analysis (STDA) and those for classification including linear discriminant analysis (LDA), random forests (RaF), k-nearest neighbors (kNN), as well as deep learning methods including convolutional neural networks (CNN) and stacked sparse autoencoder (SSAE). This paper can serve as a guideline and useful clues for doctors who are going to select machine learning methods for their breast cancer computer-aided diagnosis (CAD) systems as well for researchers interested in developing more reliable and efficient methods for breast cancer diagnosis.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2018, 66, 6; 841-848
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Theory I: Deep networks and the curse of dimensionality
Autorzy:
Poggio, T.
Liao, Q.
Powiązania:
https://bibliotekanauki.pl/articles/200623.pdf
Data publikacji:
2018
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
deep network
shallow network
convolutional neural network
function approximation
deep learning
sieci neuronowe
aproksymacja funkcji
uczenie głębokie
Opis:
We review recent work characterizing the classes of functions for which deep learning can be exponentially better than shallow learning. Deep convolutional networks are a special case of these conditions, though weight sharing is not the main reason for their exponential advantage.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2018, 66, 6; 761-773
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Theory II: Deep learning and optimization
Autorzy:
Poggio, T.
Liao, Q.
Powiązania:
https://bibliotekanauki.pl/articles/201787.pdf
Data publikacji:
2018
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
deep learning
convolutional neural networks
loss surface
optimization
uczenie głębokie
sieć neuronowa
optymalizacja
Opis:
The landscape of the empirical risk of overparametrized deep convolutional neural networks (DCNNs) is characterized with a mix of theory and experiments. In part A we show the existence of a large number of global minimizers with zero empirical error (modulo inconsistent equations). The argument which relies on the use of Bezout theorem is rigorous when the RELUs are replaced by a polynomial nonlinearity. We show with simulations that the corresponding polynomial network is indistinguishable from the RELU network. According to Bezout theorem, the global minimizers are degenerate unlike the local minima which in general should be non-degenerate. Further we experimentally analyzed and visualized the landscape of empirical risk of DCNNs on CIFAR-10 dataset. Based on above theoretical and experimental observations, we propose a simple model of the landscape of empirical risk. In part B, we characterize the optimization properties of stochastic gradient descent applied to deep networks. The main claim here consists of theoretical and experimental evidence for the following property of SGD: SGD concentrates in probability – like the classical Langevin equation – on large volume, ”flat” minima, selecting with high probability degenerate minimizers which are typically global minimizers.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2018, 66, 6; 775-787
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Uczenie wielowarstwowych szerokich sieci neuronowych z funkcjami aktywacji typu ReLu w zadaniach klasyfikacji
Teaching multilayer wide neural networks with ReLU activation function in the classification tasks
Autorzy:
Płaczek, S.
Płaczek, A.
Powiązania:
https://bibliotekanauki.pl/articles/377248.pdf
Data publikacji:
2018
Wydawca:
Politechnika Poznańska. Wydawnictwo Politechniki Poznańskiej
Tematy:
sieci neuronowe
algorytmy uczenia
uczenie głębokie
sieci szerokie
Opis:
W artykule przedstawiono obecnie nowy kierunek rozwoju Sztucznych Sieci Neuronowych w zadaniach aproksymacji i klasyfikacji. W praktyce stosowano sieci o jednej, maksimum dwóch warstwach ukrytych oraz funkcjach aktywacji typu sigmoid lub tanh. Funkcje te charakteryzują się małą zmiennością wartości dla większych wartości zmiennej wejściowej (występują obszary nasycenia) . Konsekwencją tego jest bardzo mała wartość pochodnej funkcji celu, która jest obliczana w algorytmie uczenia typu wstecznej propagacji błędu. W warstwach oddalonych od wyjścia sieci, algorytm operuje wartościami małymi, bliskimi zero, co powoduje, że algorytm jest bardzo wolno zbieżny. W sieciach o wielu warstwach ukrytych (10-15, a nawet więcej), stosuje się odcinkowe funkcje aktywacji pomimo ich formalno – matematycznych niedoskonałości. Stosując metody numeryczne w obliczeniu pochodnej, można ten problem rozwiązać, a tym samych poprawnie obliczyć pochodną funkcji aktywacji. Powyższe pozwala na obliczenie gradientu funkcji celu dla warstw głębokich uzyskując jednocześnie zadawalającą szybkość zbieżności.
In the article, a new way of artificial neural network development in the classification task is introduced. In the past, neural networks with two or maximum three hidden layers were used. The sigmoid or tanh activation functions were implemented as well. These functions have very interesting properties that are very useful in the learning algorithms. Unfortunately, they have a saturation area for the small and big argument’s value. As a consequence, if the derivatives are calculated in every hidden layer, they values are very small, near zero. It has a very negative impact on the property of the learning algorithm. In this area, an algorithm is working very slowly. Two factors now have big impact on the neural network development: big databases and power microprocessors. Therefore, a deep neural network with many hidden layers could be used in practice tasks. To improve the gradient calculation a new activation function, ReLU, is used. In the article, the properties of these neural networks are studied. It is the first step to building more powerful networks that are known as Convolutional Neural Networks.
Źródło:
Poznan University of Technology Academic Journals. Electrical Engineering; 2018, 96; 47-58
1897-0737
Pojawia się w:
Poznan University of Technology Academic Journals. Electrical Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies