Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "uczenie głębokie." wg kryterium: Temat


Tytuł:
Uczenie wielowarstwowych szerokich sieci neuronowych z funkcjami aktywacji typu ReLu w zadaniach klasyfikacji
Teaching multilayer wide neural networks with ReLU activation function in the classification tasks
Autorzy:
Płaczek, S.
Płaczek, A.
Powiązania:
https://bibliotekanauki.pl/articles/377248.pdf
Data publikacji:
2018
Wydawca:
Politechnika Poznańska. Wydawnictwo Politechniki Poznańskiej
Tematy:
sieci neuronowe
algorytmy uczenia
uczenie głębokie
sieci szerokie
Opis:
W artykule przedstawiono obecnie nowy kierunek rozwoju Sztucznych Sieci Neuronowych w zadaniach aproksymacji i klasyfikacji. W praktyce stosowano sieci o jednej, maksimum dwóch warstwach ukrytych oraz funkcjach aktywacji typu sigmoid lub tanh. Funkcje te charakteryzują się małą zmiennością wartości dla większych wartości zmiennej wejściowej (występują obszary nasycenia) . Konsekwencją tego jest bardzo mała wartość pochodnej funkcji celu, która jest obliczana w algorytmie uczenia typu wstecznej propagacji błędu. W warstwach oddalonych od wyjścia sieci, algorytm operuje wartościami małymi, bliskimi zero, co powoduje, że algorytm jest bardzo wolno zbieżny. W sieciach o wielu warstwach ukrytych (10-15, a nawet więcej), stosuje się odcinkowe funkcje aktywacji pomimo ich formalno – matematycznych niedoskonałości. Stosując metody numeryczne w obliczeniu pochodnej, można ten problem rozwiązać, a tym samych poprawnie obliczyć pochodną funkcji aktywacji. Powyższe pozwala na obliczenie gradientu funkcji celu dla warstw głębokich uzyskując jednocześnie zadawalającą szybkość zbieżności.
In the article, a new way of artificial neural network development in the classification task is introduced. In the past, neural networks with two or maximum three hidden layers were used. The sigmoid or tanh activation functions were implemented as well. These functions have very interesting properties that are very useful in the learning algorithms. Unfortunately, they have a saturation area for the small and big argument’s value. As a consequence, if the derivatives are calculated in every hidden layer, they values are very small, near zero. It has a very negative impact on the property of the learning algorithm. In this area, an algorithm is working very slowly. Two factors now have big impact on the neural network development: big databases and power microprocessors. Therefore, a deep neural network with many hidden layers could be used in practice tasks. To improve the gradient calculation a new activation function, ReLU, is used. In the article, the properties of these neural networks are studied. It is the first step to building more powerful networks that are known as Convolutional Neural Networks.
Źródło:
Poznan University of Technology Academic Journals. Electrical Engineering; 2018, 96; 47-58
1897-0737
Pojawia się w:
Poznan University of Technology Academic Journals. Electrical Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Deep learning: theory and practice
Autorzy:
Cichocki, A.
Poggio, T.
Osowski, S.
Lempitsky, V.
Powiązania:
https://bibliotekanauki.pl/articles/202346.pdf
Data publikacji:
2018
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
deep learning
networks
theory
practice
uczenie głębokie
sieci
teoria
praktyka
Opis:
This Special Section of the Bulletin of the Polish Academy of Sciences on Technical Sciences is devoted to theoretical aspects of deep machine learning as well as practical applications in some areas of signal and image processing, particularly in bioengineering.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2018, 66, 6; 757-759
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Uczenie głębokie w diagnostyce medycznej
Deep Learning in Medical Diagnosis
Autorzy:
Antczak, K.
Powiązania:
https://bibliotekanauki.pl/articles/404011.pdf
Data publikacji:
2016
Wydawca:
Polskie Towarzystwo Symulacji Komputerowej
Tematy:
sieci neuronowe
diagnostyka medyczna
uczenie głębokie
neural networks
medical diagnosis
deep learning
Opis:
W pracy przeanalizowano perspektywy zastosowania metod uczenia głębokiego w diagnostyce medycznej. Jedną z kluczowych cech uczenia głębokiego jest zdolność do wyodrębniania złożonych wzorców o strukturze hierarchicznej. Wzorce takie występują również w diagnostyce, jako tak zwane diamenty diagnostyczne. Zastosowanie głębokich sieci neuronowych mogłoby poprawić jakość klasyfikatorów wykrywających choroby na podstawie objawów. Dodatkowo umożliwiłoby to sterowanie czułoscią i swoistością klasyfikatorów.
In this paper we analyze perspectives of applying deep learning methods in a field of medical diagnosis. One of key features of deep learning is ability to extract complex, hierarchical patterns. Such patterns are present also in a medical diagnosis, where they are known as diagnostic diamonds. Applying deep neural networks could increase performance of medical classifiers. Moreover, it would allow to adjust sensitivity and specificity of classifiers.
Źródło:
Symulacja w Badaniach i Rozwoju; 2016, 7, 3-4; 83-88
2081-6154
Pojawia się w:
Symulacja w Badaniach i Rozwoju
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Diagnozowanie stanu retinopatii cukrzycowej przy pomocy głębokich sieci neuronowych
Classification of the stage of the disease by deep neural networks
Autorzy:
Jarzembiński, B.
Kwasigroch, A.
Grochowski, M.
Powiązania:
https://bibliotekanauki.pl/articles/267831.pdf
Data publikacji:
2018
Wydawca:
Politechnika Gdańska. Wydział Elektrotechniki i Automatyki
Tematy:
uczenie głębokie
sieci neuronowe
retinopatia cukrzycowa
deep learning
neural networks
diabetic retinopathy
Opis:
W referacie opisano problem wykrywania oraz klasyfikacji stanu retinopatii cukrzycowej ze zdjęć dna oka przy pomocy głębokich sieci neuronowych. Retinopatia cukrzycowa jest chorobą oczu często występującą u osób z cukrzycą. Nieleczona prowadzi do uszkodzenia wzroku, a nawet ślepoty. W pracy badawczej opracowano system wykrywania retinopatii cukrzycowej na podstawie zdjęć dna oka. Opracowana sieć neuronowa przypisuje stan choroby w 5 stopniowej skali – od braku choroby do najbardziej zaawansowanego stanu choroby. Zaproponowano specjalny system kodowania klas w celu uchwycenia wielkości różnicy pomiędzy rzeczywistymi a predykowanymi stanami choroby. Uzyskano wysokie wyniki klasyfikacji na zbiorze testowym. W celu oceny skuteczności działania systemu wykorzystano miary statystyczne takie jak ważona Kappa i dokładność.
In the paper we described computer aided detection system of diabetic retinopathy based on fundus photos of retina. Diabetic retinopathy is an eye disease associated with diabetes. Non-treated diabetic retinopathy leads to sight degeneration and even blindness. Early detection is crucial due to provide effective treatment. Currently, diabetic retinopathy detection is time consuming process, done manualy by medical specialist. The disease is dangerous issue in places where the availability of phisicians is limited. We employed the computer system that detect diabetic retinopathy and assess a stage of the disease based on retinal photo of fundus. We used one of the best image classification system – deep neural networks. Employed system assess the stage of the disease in 5 level scale – from absence of disease to the most severe stage of disease. We employed transfer learning and data augmentation to enhance classification result. Moreover we proposed special class coding system to catch the difference between real and predicted stage of disease. We tested employed system using different statistical measures like accuracy, sensitivity, specificity and Kappa score.
Źródło:
Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej; 2018, 60; 37-40
1425-5766
2353-1290
Pojawia się w:
Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Autoenkodery. Podstawy budowy wydajnych modeli uczenia maszynowego
Autorzy:
Rodewald, Gabriel
Powiązania:
https://bibliotekanauki.pl/articles/2082264.pdf
Data publikacji:
2022-08
Wydawca:
Warszawska Wyższa Szkoła Informatyki
Tematy:
uczenie maszynowe
uczenie głębokie
autoenkodery
autoenkodery wariacyjne
autoenkodery odszumiające
autoenkodery rzadkie
autoenkodery konwolucyjne
autoenkodery rekurencyjne
Opis:
Autoenkoder jest siecią neuronową złożoną z pary koder-dekoder. Koder odpowiada za redukcję wymiarowości danych w modelu przy jednoczesnym zachowaniu kluczowych cech, niezbędnych do odtworzenia danych wejściowych przez dekoder. Z uwagi na cechy architektury wewnętrznej wyodrębnia się autoenkodery deterministyczne oraz probabilistyczne. Istnieją wyspecjalizowane wersje autoenkoderów odpowiadające tematyce realizowanych modeli uczenia maszynowego, na przykład autoenkodery odszumiające, rekurencyjne, splotowe, wariacyjne lub rzadkie. W artykule zostały przedstawione jedynie najistotniejsze zagadnienia związane z autoenkoderami.
Źródło:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki; 2022, 16, 26; 21-60
1896-396X
2082-8349
Pojawia się w:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza potencjału ataków wykorzystujących syntetycznie wygenerowane głosy na systemy biometrycznej weryfikacji mówców oraz wykrywania materiałów deepfake
Autorzy:
Bartuzi-Trokielewicz, Ewelina
Powiązania:
https://bibliotekanauki.pl/articles/31342041.pdf
Data publikacji:
2024-05-20
Wydawca:
Akademia Sztuki Wojennej
Tematy:
cyberbezpieczeństwo
biometria
weryfikacja mówców
audio deepfake
syntetyczne głosy
metody sztucznej inteligencji
uczenie maszynowe
uczenie głębokie
Opis:
Postęp technologiczny w dziedzinie głębokiego uczenia znacząco przyczynił się do rozwoju syntezowania głosu, umożliwił tworzenie realistycznych nagrań audio, które mogą naśladować indywidualne cechy głosów ludzkich. Chociaż ta innowacja otwiera nowe możliwości w dziedzinie technologii mowy, niesie ze sobą również poważne obawy dotyczące bezpieczeństwa, zwłaszcza w kontekście potencjalnego wykorzystania technologii deepfake do celów przestępczych. Przeprowadzone badanie koncentrowało się na ocenie wpływu syntetycznych głosów na systemy biometrycznej weryfikacji mówców w języku polskim oraz skuteczności wykrywania deepfake’ów narzędziami dostępnymi publicznie, z wykorzystaniem dwóch głównych metod generowania głosu, tj. przekształcenia tekstu na mowę oraz konwersji mowy. Jednym z głównych wniosków analizy jest potwierdzenie zdolności syntetycznych głosów do zachowania charakterystycznych cech biometrycznych i otwierania drogi przestępcom do nieautoryzowanego dostępu do zabezpieczonych systemów lub danych. To podkreśla potencjalne zagrożenia dla indywidualnych użytkowników oraz instytucji, które polegają na technologiach rozpoznawania mówcy jako metodzie uwierzytelniania i wskazuje na konieczność wdrażania modułów wykrywania ataków. Badanie ponadto pokazało, że deepfaki odnalezione w polskiej części internetu dotyczące promowania fałszywych inwestycji lub kierowane w celach dezinformacji najczęściej wykorzystują popularne i łatwo dostępne narzędzia do syntezy głosu. Badanie przyniosło również nowe spojrzenie na różnice w skuteczności metod konwersji tekstu na mowę i klonowania mowy. Okazuje się, że metody klonowania mowy mogą być bardziej skuteczne w przekazywaniu biometrycznych cech osobniczych niż metody konwersji tekstu na mowę, co stanowi szczególny problem z punktu widzenia bezpieczeństwa systemów weryfikacji. Wyniki eksperymentów podkreślają potrzebę dalszych badań i rozwoju w dziedzinie bezpieczeństwa biometrycznego, żeby skutecznie przeciwdziałać wykorzystywaniu syntetycznych głosów do nielegalnych działań. Wzrost świadomości o potencjalnych zagrożeniach i kontynuacja pracy nad ulepszaniem technologii weryfikacji mówców są ważne dla ochrony przed coraz bardziej wyrafinowanymi atakami wykorzystującymi technologię deepfake.
Źródło:
Cybersecurity and Law; 2024, 12, 2; 25-36
2658-1493
Pojawia się w:
Cybersecurity and Law
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Study of the Influence of Architecture on Effectiveness of Deep Neural Networks Training
Badania wpływu architektury na skuteczność uczenia głębokich sieci neuronowych
Autorzy:
Kolbusz, Janusz
Różycki, Paweł
Bartczak, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/509270.pdf
Data publikacji:
2018
Wydawca:
Akademia Finansów i Biznesu Vistula
Tematy:
deep learning
ANN architectures
Bridged MLP
NBN
uczenie głębokie
architektury sztucznych sieci neuronowych
Opis:
Paper presents impact of the neural network architecture on the training effectiveness and training time. Selected network architectures and training algorithm are described. Presented experimental results of research confirming the significant influence of architecture on the success of network training.
W artykule przedstawiono wpływ architektury sieci neuronowej na skuteczność i czas uczenia sieci. Opisano wybrane architektury sieci, algorytm uczenia oraz zaprezentowano wyniki badań potwierdzających znaczący wpływ architektury na sukces uczenia sieci.
Źródło:
Zeszyty Naukowe Uczelni Vistula; 2018, 59(2) Informatyka; 60-71
2353-2688
Pojawia się w:
Zeszyty Naukowe Uczelni Vistula
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A comparison of conventional and deep learning methods of image classification
Porównanie metod klasycznego i głębokiego uczenia maszynowego w klasyfikacji obrazów
Autorzy:
Dovbnych, Maryna
Plechawska-Wójcik, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/2055127.pdf
Data publikacji:
2021
Wydawca:
Politechnika Lubelska. Instytut Informatyki
Tematy:
image classification
machine learning
deep learning
neural networks
klasyfikacja obrazów
uczenie maszynowe
uczenie głębokie
sieci neuronowe
Opis:
The aim of the research is to compare traditional and deep learning methods in image classification tasks. The conducted research experiment covers the analysis of five different models of neural networks: two models of multi–layer perceptron architecture: MLP with two hidden layers, MLP with three hidden layers; and three models of convolutional architecture: the three VGG blocks model, AlexNet and GoogLeNet. The models were tested on two different datasets: CIFAR–10 and MNIST and have been applied to the task of image classification. They were tested for classification performance, training speed, and the effect of the complexity of the dataset on the training outcome.
Celem badań jest porównanie metod klasycznego i głębokiego uczenia w zadaniach klasyfikacji obrazów. Przeprowa-dzony eksperyment badawczy obejmuje analizę pięciu różnych modeli sieci neuronowych: dwóch modeli wielowar-stwowej architektury perceptronowej: MLP z dwiema warstwami ukrytymi, MLP z trzema warstwami ukrytymi; oraz trzy modele architektury konwolucyjnej: model z trzema VGG blokami, AlexNet i GoogLeNet. Modele przetrenowano na dwóch różnych zbiorach danych: CIFAR–10 i MNIST i zastosowano w zadaniu klasyfikacji obrazów. Zostały one zbadane pod kątem wydajności klasyfikacji, szybkości trenowania i wpływu złożoności zbioru danych na wynik trenowania.
Źródło:
Journal of Computer Sciences Institute; 2021, 21; 303--308
2544-0764
Pojawia się w:
Journal of Computer Sciences Institute
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Theory II: Deep learning and optimization
Autorzy:
Poggio, T.
Liao, Q.
Powiązania:
https://bibliotekanauki.pl/articles/201787.pdf
Data publikacji:
2018
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
deep learning
convolutional neural networks
loss surface
optimization
uczenie głębokie
sieć neuronowa
optymalizacja
Opis:
The landscape of the empirical risk of overparametrized deep convolutional neural networks (DCNNs) is characterized with a mix of theory and experiments. In part A we show the existence of a large number of global minimizers with zero empirical error (modulo inconsistent equations). The argument which relies on the use of Bezout theorem is rigorous when the RELUs are replaced by a polynomial nonlinearity. We show with simulations that the corresponding polynomial network is indistinguishable from the RELU network. According to Bezout theorem, the global minimizers are degenerate unlike the local minima which in general should be non-degenerate. Further we experimentally analyzed and visualized the landscape of empirical risk of DCNNs on CIFAR-10 dataset. Based on above theoretical and experimental observations, we propose a simple model of the landscape of empirical risk. In part B, we characterize the optimization properties of stochastic gradient descent applied to deep networks. The main claim here consists of theoretical and experimental evidence for the following property of SGD: SGD concentrates in probability – like the classical Langevin equation – on large volume, ”flat” minima, selecting with high probability degenerate minimizers which are typically global minimizers.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2018, 66, 6; 775-787
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Klasyfikacja sygnału EKG przy użyciu konwolucyjnych sieci neuronowych
ECG signal classification using convolutional neural networks
Autorzy:
Ogryczak, Maria
Powiązania:
https://bibliotekanauki.pl/articles/1841908.pdf
Data publikacji:
2020
Wydawca:
Politechnika Gdańska. Wydział Elektrotechniki i Automatyki
Tematy:
EKG
arytmia
uczenie głębokie
konwolucyjne sieci neuronowe
ECG
arrhythmia
deep learning
convolutional neural networks
Opis:
Podniesienie jakości i zautomatyzowanie procesu diagnozy jest istotnym elementem rozwoju medycyny i samokontroli stanu zdrowia pacjentów. Od dłuższego czasu istnieją i są stosowane różne metody analizy i klasyfikacji sygnału EKG, jednak nie zawsze ich dokładność jest zadowalająca. Największym problemem jest trudność rozpoznania istniejącej nieprawidłowości, w przypadku gdy jej reprezentacja jest podobna do prawidłowej pracy serca np. przedwczesny skurcz komorowy. W ostatnich latach obserwujemy dynamiczny rozwój nowego narzędzia z rodziny metod sztucznej inteligencji - głębokich sieci neuronowych. Cechuje je duża selektywność klasyfikacji nawet najbardziej skomplikowanych sygnałów w postaci szeregów czasowych czy obrazów, często na podstawie cech niezauważalnych dla ludzkiego oka. W niniejszym artykule przedstawiono sposób analizy zarejestrowanego sygnału elektrycznej czynności mięśnia sercowego (EKG), na podstawie pojedynczego, wyodrębnionego cyklu pracy serca. Celem badania było zdiagnozowanie sześciu różnych typów ewolucji mogących świadczyć o występowaniu arytmii. Badania przeprowadzono z wykorzystaniem ogólnodostępnej bazy danych MIT-BIH Arrhythmia Database. W celu podniesienia jakości ekstrakcji cech analizowanego sygnału, dokonano jego dekompozycji czasowo-przestrzennej przy wykorzystaniu transformacji falkowej. W rezultacie uzyskano zadowalające wyniki klasyfikacji: dokładność 92,4% i swoistość (zdolność do wykrycia braku cechy) 96,5%. Osiągnięte wyniki potwierdzają skuteczność systemu automatycznej klasyfikacji cyklów pracy serca, mogącego wspomóc lekarzy w procesie żmudnej analizy dużej liczby zarejestrowanych danych.
Automation and improvement of diagnostic process is a vital element of medicine development and patient’s condition self-control. For a long time different ECG signal classification methods exist and are successfully applied, nevertheless their accuracy is not always satisfying enough. The lack of identification of an existing abnormality, which is very similar to a normal heartbeat is the biggest issue - for example premature ventricular contraction. Over the past few years there was a rapid development of an artificial intelligence tool - deep neural networks. They characterise by a high classification ability even the most complicated patterns in the form of time series or images, often based on features unnoticeable for human eye. In this paper the approach to electrocardiography (ECG) analysis was presented, taking into consideration a single heartbeat. The aim of this research was diagnosis of six different types of beat that may indicate arrhythmia occurrence. The study were performed on the public database MIT-BIH Arrhythmia Database. In order to enhance feature extraction quality of the analysed signal the time-space decomposition was made using wavelet transform. The satisfying performance with 92.4% accuracy and 96.5% specificity were accomplished. The achieved results may be used to develop an automatic heartbeat classification system that would significantly contribute medicians in the arduous process of data analysis.
Źródło:
Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej; 2020, 71; 51-54
1425-5766
2353-1290
Pojawia się w:
Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies