Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "sieci konwolucyjne" wg kryterium: Temat


Wyświetlanie 1-21 z 21
Tytuł:
System wspomagający rozpoznawanie znaków języka migowego oparty na sztucznej sieci neuronowej
Signs recognition system based on artificial neural network
Autorzy:
Lewandowski, P.
Półtorak, M.
Wagner, M.
Pochmara, J.
Rybarczyk, A.
Powiązania:
https://bibliotekanauki.pl/articles/376140.pdf
Data publikacji:
2017
Wydawca:
Politechnika Poznańska. Wydawnictwo Politechniki Poznańskiej
Tematy:
Microsoft Kinect
sztuczne sieci neuronowe
theano
sieci konwolucyjne
detekcja obrazu
Opis:
W niniejszym artykule zaproponowano realizację systemu wspomagajacego rozpoznawanie statycznych znaków języka migowego. Na potrzeby rozwiązania skorzystano z sensora Microsoft Kinect XBOX 360, przygotowano oprogramowanie umożliwiające translację znaków dla osób nie znających tego języka, oparte na sztucznej inteligencji, przetworzono otrzymane informacje oraz utworzono zbiór danych pozwalający na ich poprawną klasyfikację. Istotnym faktem jest również wybranie najbardziej optymalnego rozwiązania, zarówno pod względem możliwości wydajnościowych przeciętnego komputera osobistego jak i efektywności działania systemu.
In following work there is suggested a solution to recognise certain static characters from sign language. To achieve the objective, there were used tools like Microsoft Kinect and convolutional neural networks. Main problems to overcome were to collect data from Kinect sensor and prepare software based on artificial intelligence, which could process gathered material. For learning purposes around four thousand images were collected. Dataset this large was required for neural networks to work and respond properly. What is also important is to select the most optimal solution for neural networks. The influence of dropout parameter on learning process was studied too.
Źródło:
Poznan University of Technology Academic Journals. Electrical Engineering; 2017, 91; 155-164
1897-0737
Pojawia się w:
Poznan University of Technology Academic Journals. Electrical Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wykorzystanie wstępnie wytrenowanych konwolucyjnych sieci neuronowych w zagadnieniu transferu stylu
Autorzy:
Gramacka, Weronika
Powiązania:
https://bibliotekanauki.pl/articles/23943222.pdf
Data publikacji:
2023-12
Wydawca:
Warszawska Wyższa Szkoła Informatyki
Tematy:
konwolucyjne sieci neuronowe
transfer stylu neuronowego
sieci wstępnie wytrenowane
Opis:
Artykuł dotyczy wykorzystania wstępnie wytrenowanych konwolucyjnych sieci neuronowych w zagadnieniu transferu stylu. Zbadane zostało, jak wybór warstw konwolucyjnych do reprezentacji obrazów stylu i zawartości wpływa na jakość odwzorowania stylu: kolorystykę generowanego obrazu, widoczną technikę jego wykonania oraz poziom uogólnienia szczegółów przedstawianej rzeczywistości. Zaproponowano architekturę konwolucyjnej sieci neuronowej dedykowaną rozważanemu zagadnieniu.
Źródło:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki; 2023, 17, 29; 105-132
1896-396X
2082-8349
Pojawia się w:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Deep learning vs feature engineering in the assessment of voice signals for diagnosis in Parkinson’s disease
Autorzy:
Majda-Zdancewicz, Ewelina
Potulska-Chromik, Anna
Jakubowski, Jacek
Nojszewska, Monika
Kostera-Pruszczyk, Anna
Powiązania:
https://bibliotekanauki.pl/articles/2173626.pdf
Data publikacji:
2021
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
voice processing
Parkinson’s disease
non-linear analysis
convolutional network
przetwarzanie głosu
choroba Parkinsona
analiza nieliniowa
sieci konwolucyjne
Opis:
Voice acoustic analysis can be a valuable and objective tool supporting the diagnosis of many neurodegenerative diseases, especially in times of distant medical examination during the pandemic. The article compares the application of selected signal processing methods and machine learning algorithms for the taxonomy of acquired speech signals representing the vowel a with prolonged phonation in patients with Parkinson’s disease and healthy subjects. The study was conducted using three different feature engineering techniques for the generation of speech signal features as well as the deep learning approach based on the processing of images involving spectrograms of different time and frequency resolutions. The research utilized real recordings acquired in the Department of Neurology at the Medical University of Warsaw, Poland. The discriminatory ability of feature vectors was evaluated using the SVM technique. The spectrograms were processed by the popular AlexNet convolutional neural network adopted to the binary classification task according to the strategy of transfer learning. The results of numerical experiments have shown different efficiencies of the examined approaches; however, the sensitivity of the best test based on the selected features proposed with respect to biological grounds of voice articulation reached the value of 97% with the specificity no worse than 93%. The results could be further slightly improved thanks to the combination of the selected deep learning and feature engineering algorithms in one stacked ensemble model.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2021, 69, 3; art. no. e137347
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Deep learning vs feature engineering in the assessment of voice signals for diagnosis in Parkinson’s disease
Autorzy:
Majda-Zdancewicz, Ewelina
Potulska-Chromik, Anna
Jakubowski, Jacek
Nojszewska, Monika
Kostera-Pruszczyk, Anna
Powiązania:
https://bibliotekanauki.pl/articles/2090742.pdf
Data publikacji:
2021
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
voice processing
Parkinson’s disease
non-linear analysis
convolutional network
przetwarzanie głosu
choroba Parkinsona
analiza nieliniowa
sieci konwolucyjne
Opis:
Voice acoustic analysis can be a valuable and objective tool supporting the diagnosis of many neurodegenerative diseases, especially in times of distant medical examination during the pandemic. The article compares the application of selected signal processing methods and machine learning algorithms for the taxonomy of acquired speech signals representing the vowel a with prolonged phonation in patients with Parkinson’s disease and healthy subjects. The study was conducted using three different feature engineering techniques for the generation of speech signal features as well as the deep learning approach based on the processing of images involving spectrograms of different time and frequency resolutions. The research utilized real recordings acquired in the Department of Neurology at the Medical University of Warsaw, Poland. The discriminatory ability of feature vectors was evaluated using the SVM technique. The spectrograms were processed by the popular AlexNet convolutional neural network adopted to the binary classification task according to the strategy of transfer learning. The results of numerical experiments have shown different efficiencies of the examined approaches; however, the sensitivity of the best test based on the selected features proposed with respect to biological grounds of voice articulation reached the value of 97% with the specificity no worse than 93%. The results could be further slightly improved thanks to the combination of the selected deep learning and feature engineering algorithms in one stacked ensemble model.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2021, 69, 3; e137347, 1--10
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Porównanie modeli LeNet-5, AlexNet i GoogLeNet w rozpoznawaniu pisma ręcznego
Comparison of LeNet-5, AlexNet and GoogLeNet models in handwriting recognition
Autorzy:
Michalski, Bartosz
Plechawska-Wójcik, Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/2086218.pdf
Data publikacji:
2022
Wydawca:
Politechnika Lubelska. Instytut Informatyki
Tematy:
konwolucyjne sieci neuronowe
klasyfikacja pisma odręcznego
convolutional neural networks
handwriting classification
Opis:
Celem badania było porównanie dokładności rozpoznawania pisma odręcznego oraz czasu potrzebnego na klasyfikację danych ze zbiorów testowych. Do badań wykorzystano architektury Lenet-5, AlexNet i GoogLeNet. Wszystkie wybra-ne architektury są modelami konwolucyjnych sieci neuronowych. Badania przeprowadzono z wykorzystaniem baz obrazów odręczenie pisanych cyfr MNIST i odręcznie pisanych liter EMNIST. Po wykonaniu badań stwierdzono, że największą dokładnością wykazał się model GoogLeNet, a najmniejszą LeNet-5. Natomiast najmniej czasu na wykona-nie zadania potrzebował model LeNet-5, a najwięcej GoogLeNet. Na podstawie otrzymanych wyników stwierdzono, że zwiększanie złożoności modelu wpływa pozytywnie na dokładność klasyfikacji obiektów, ale znacznie zwiększa zapo-trzebowanie na zasoby komputera.
The aim of the study was to compare the accuracy of handwriting recognition and the time needed to classify data from the test sets. The Lenet-5, AlexNet and GoogLeNet architectures were used for the research. All selected architectures are models of convolutional neural networks. The research was carried out with the use of image databases, handwritten digits MNIST and handwritten letters EMNIST. After the tests, it was found that the GoogLeNet model showed the highest accuracy, and the LeNet-5 the lowest. However, the LeNet-5 model needed the least time to complete the task, and GoogLeNet the most. On the basis of the obtained results, it was found that increasing the complexity of the model positively influences the accuracy of object classification, but significantly increases the demand for computer re-sources.
Źródło:
Journal of Computer Sciences Institute; 2022, 23; 145--151
2544-0764
Pojawia się w:
Journal of Computer Sciences Institute
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On training deep neural networks using a streaming approach
Autorzy:
Duda, Piotr
Jaworski, Maciej
Cader, Andrzej
Wang, Lipo
Powiązania:
https://bibliotekanauki.pl/articles/91796.pdf
Data publikacji:
2020
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
deep learning
data streams
convolutional neural networks
strumienie danych
konwolucyjne sieci neuronowe
Opis:
In recent years, many deep learning methods, allowed for a significant improvement of systems based on artificial intelligence methods. Their effectiveness results from an ability to analyze large labeled datasets. The price for such high accuracy is the long training time, necessary to process such large amounts of data. On the other hand, along with the increase in the number of collected data, the field of data stream analysis was developed. It enables to process data immediately, with no need to store them. In this work, we decided to take advantage of the benefits of data streaming in order to accelerate the training of deep neural networks. The work includes an analysis of two approaches to network learning, presented on the background of traditional stochastic and batch-based methods.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2020, 10, 1; 15-26
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Project of autonomous workstation feeding fledging birds
Projekt autonomicznego robota do karmienia podlotów
Autorzy:
Dwornicki, Dawid
Powiązania:
https://bibliotekanauki.pl/articles/2014198.pdf
Data publikacji:
2020
Wydawca:
Uniwersytet Technologiczno-Humanistyczny im. Kazimierza Pułaskiego w Radomiu
Tematy:
fledging birds
convolutional neural network
computer vision
podloty
konwolucyjne sieci neuronowe
analiza obrazu
Opis:
The article describes project of autonomous workstation capable of feeding fledging birds. During the breeding season animal rescue centers are experiencing huge overload of patients and up to 20% of patients are birds. Despite small size they demand as much care as other animals – in case of fledging birds main need is frequent feeding which is impossible to cover by working staff. Designed workstation is meant to solve this problem and decrease mortality of sick or immature animals.
Artykuł opisuje projekt stanowiska służącego do automatycznego karmienia podlotów. W sezonie lęgowym ośrodki rehabilitacji dzikich zwierząt zmagają się ze zwiększoną liczbą pacjentów, z których nawet do 20% stanowią ptaki. Mimo małych rozmiarów wymagają tyle samo opieki co pozostałe zwierzęta – w przypadku podlotów głównym zadaniem jest regularne i częste karmienie co jest niemożliwe do zrealizowania przez ograniczony zespół. Zaprojektowany robot ma za zadanie rozwiązać ten problem, wspomóc pracowników i zmniejszyć śmiertelność młodych lub chorych ptaków.
Źródło:
Journal of Automation, Electronics and Electrical Engineering; 2020, 2, 1; 9-15
2658-2058
2719-2954
Pojawia się w:
Journal of Automation, Electronics and Electrical Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Klasyfikacja sygnału EKG przy użyciu konwolucyjnych sieci neuronowych
ECG signal classification using convolutional neural networks
Autorzy:
Ogryczak, Maria
Powiązania:
https://bibliotekanauki.pl/articles/1841908.pdf
Data publikacji:
2020
Wydawca:
Politechnika Gdańska. Wydział Elektrotechniki i Automatyki
Tematy:
EKG
arytmia
uczenie głębokie
konwolucyjne sieci neuronowe
ECG
arrhythmia
deep learning
convolutional neural networks
Opis:
Podniesienie jakości i zautomatyzowanie procesu diagnozy jest istotnym elementem rozwoju medycyny i samokontroli stanu zdrowia pacjentów. Od dłuższego czasu istnieją i są stosowane różne metody analizy i klasyfikacji sygnału EKG, jednak nie zawsze ich dokładność jest zadowalająca. Największym problemem jest trudność rozpoznania istniejącej nieprawidłowości, w przypadku gdy jej reprezentacja jest podobna do prawidłowej pracy serca np. przedwczesny skurcz komorowy. W ostatnich latach obserwujemy dynamiczny rozwój nowego narzędzia z rodziny metod sztucznej inteligencji - głębokich sieci neuronowych. Cechuje je duża selektywność klasyfikacji nawet najbardziej skomplikowanych sygnałów w postaci szeregów czasowych czy obrazów, często na podstawie cech niezauważalnych dla ludzkiego oka. W niniejszym artykule przedstawiono sposób analizy zarejestrowanego sygnału elektrycznej czynności mięśnia sercowego (EKG), na podstawie pojedynczego, wyodrębnionego cyklu pracy serca. Celem badania było zdiagnozowanie sześciu różnych typów ewolucji mogących świadczyć o występowaniu arytmii. Badania przeprowadzono z wykorzystaniem ogólnodostępnej bazy danych MIT-BIH Arrhythmia Database. W celu podniesienia jakości ekstrakcji cech analizowanego sygnału, dokonano jego dekompozycji czasowo-przestrzennej przy wykorzystaniu transformacji falkowej. W rezultacie uzyskano zadowalające wyniki klasyfikacji: dokładność 92,4% i swoistość (zdolność do wykrycia braku cechy) 96,5%. Osiągnięte wyniki potwierdzają skuteczność systemu automatycznej klasyfikacji cyklów pracy serca, mogącego wspomóc lekarzy w procesie żmudnej analizy dużej liczby zarejestrowanych danych.
Automation and improvement of diagnostic process is a vital element of medicine development and patient’s condition self-control. For a long time different ECG signal classification methods exist and are successfully applied, nevertheless their accuracy is not always satisfying enough. The lack of identification of an existing abnormality, which is very similar to a normal heartbeat is the biggest issue - for example premature ventricular contraction. Over the past few years there was a rapid development of an artificial intelligence tool - deep neural networks. They characterise by a high classification ability even the most complicated patterns in the form of time series or images, often based on features unnoticeable for human eye. In this paper the approach to electrocardiography (ECG) analysis was presented, taking into consideration a single heartbeat. The aim of this research was diagnosis of six different types of beat that may indicate arrhythmia occurrence. The study were performed on the public database MIT-BIH Arrhythmia Database. In order to enhance feature extraction quality of the analysed signal the time-space decomposition was made using wavelet transform. The satisfying performance with 92.4% accuracy and 96.5% specificity were accomplished. The achieved results may be used to develop an automatic heartbeat classification system that would significantly contribute medicians in the arduous process of data analysis.
Źródło:
Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej; 2020, 71; 51-54
1425-5766
2353-1290
Pojawia się w:
Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Lossy coding impact on speech recognition with convolutional neural networks
Autorzy:
Kucharski, Mateusz
Powiązania:
https://bibliotekanauki.pl/articles/24201985.pdf
Data publikacji:
2022
Wydawca:
Politechnika Poznańska. Instytut Mechaniki Stosowanej
Tematy:
lossy coding
convolutional neural networks
speech recognition
kodowanie stratne
konwolucyjne sieci neuronowe
rozpoznawanie mowy
Opis:
This paper presents research of lossy coding impact on speech recognition with convolutional neural networks. For this purpose, google speech commands dataset containing utterances of 30 words was encoded using four most common all-purpose codecs: mp3, aac, wma and ogg. A convolutional neural network was taught using part of the original files and later tested with the rest of the files, as well as their counterparts encoded with different codecs and bitrates. The same network model was also taught using mp3 encoded data showing the biggest loss in effectiveness of the previous network. Results show that lossy coding does have an effect on speech recognition, especially for low bitrates.
Źródło:
Vibrations in Physical Systems; 2022, 33, 3; art. no. 2022302
0860-6897
Pojawia się w:
Vibrations in Physical Systems
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Blender jako narzędzie do generacji danych syntetycznych
Blender as a tool for generating synthetic data
Autorzy:
Sieczka, Rafał
Pańczyk, Maciej
Powiązania:
https://bibliotekanauki.pl/articles/98204.pdf
Data publikacji:
2020
Wydawca:
Politechnika Lubelska. Instytut Informatyki
Tematy:
artificial neural networks
convolutional neural network
synthetic data
blender
sztuczne sieci neuronowe
konwolucyjne sieci neuronowe
dane syntetyczne
Opis:
Acquiring data for neural network training is an expensive and labour-intensive task, especially when such data is difficult to access. This article proposes the use of 3D Blender graphics software as a tool to automatically generate synthetic image data on the example of price labels. Using the fastai library, price label classifiers were trained on a set of synthetic data, which were compared with classifiers trained on a real data set. The comparison of the results showed that it is possible to use Blender to generate synthetic data. This allows for a significant acceleration of the data acquisition process and consequently, the learning process of neural networks.
Pozyskiwanie danych do treningu sieci neuronowych, jest kosztownym i pracochłonnym zadaniem, szczególnie kiedy takie dane są trudno dostępne. W niniejszym artykule zostało zaproponowane użycie programu do grafiki 3D Blender, jako narzędzia do automatycznej generacji danych syntetycznych zdjęć, na przykładzie etykiet cenowych. Przy użyciu biblioteki fastai, zostały wytrenowane klasyfikatory etykiet cenowych, na zbiorze danych syntetycznych, które porównano z klasyfikatorami trenowanymi na zbiorze danych rzeczywistych. Porównanie wyników wykazało, że możliwe jest użycie programu Blender do generacji danych syntetycznych. Pozwala to w znaczącym stopniu przyśpieszyć proces pozyskiwania danych, a co za tym idzie proces uczenia sieci neuronowych.
Źródło:
Journal of Computer Sciences Institute; 2020, 16; 227-232
2544-0764
Pojawia się w:
Journal of Computer Sciences Institute
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Remanufacturing process improvement by image recognition methods. Application of the mechanical part
Poprawa procesu regeneracji poprzez metody rozpoznawania obrazu. Zastosowanie części mechanicznej
Autorzy:
Kos, Mateusz
Powiązania:
https://bibliotekanauki.pl/articles/1818687.pdf
Data publikacji:
2021
Wydawca:
Politechnika Wrocławska. Oficyna Wydawnicza Politechniki Wrocławskiej
Tematy:
remanufacturing
convolutional neural network
automation
improvement
image recognition
regeneracja
konwolucyjne sieci neuronowe
automatyzacja
ulepszanie
rozpoznawanie obrazu
Opis:
The paper describes the possibility of using, building, and implementing an image recognition system in a company performing remanufacturing processes. It is based on a thesis prepared with the help of Wabco Reman Solutions. The tests were conducted using one of the parts remanufactured by the company – a manifold. The research focuses on different variants of the obtained image recognition models in order to identify differences that may affect their effectiveness and possible application in real work conditions. The environment used to build the models is Jupyter Notebook, and convolutional neural networks were implemented.
W artykule opisano możliwości wykorzystania, budowy i wdrożenia systemu rozpoznawania obrazu w firmie realizującej proces regeneracji. Artykuł powstał na podstawie pracy magisterskiej przygotowanej przy pomocy Wabco Reman Solutions. Przeprowadzone testy zostały wykonane na jednej z regenerowanych części w firmie - kolektorze. W badaniach skupiono się na różnych wariantach powstałych modeli rozpoznawania obrazów w celu dostrzeżenia różnic, które mogą wpłynąć na ich skuteczność i możliwość zastosowania w rzeczywistych warunkach pracy. Do budowy modeli, w których zaimplementowano konwolucyjne sieci neuronowe, wykorzystano środowisko Jupyter Notebook.
Źródło:
Journal of TransLogistics; 2021, 7, 1; 147--162
2450-5870
Pojawia się w:
Journal of TransLogistics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Remanufacturing process improvement by image recognition methods. Application of the mechanical part
Poprawa procesu regeneracji poprzez metody rozpoznawania obrazu. Zastosowanie części mechanicznej
Autorzy:
Kos, Mateusz
Powiązania:
https://bibliotekanauki.pl/articles/1818701.pdf
Data publikacji:
2021
Wydawca:
Politechnika Wrocławska. Oficyna Wydawnicza Politechniki Wrocławskiej
Tematy:
remanufacturing
convolutional neural network
automation
improvement
image recognition
regeneracja
konwolucyjne sieci neuronowe
automatyzacja
ulepszanie
rozpoznawanie obrazu
Opis:
The paper describes the possibility of using, building, and implementing an image recognition system in a company performing remanufacturing processes. It is based on a thesis prepared with the help of Wabco Reman Solutions. The tests were conducted using one of the parts remanufactured by the company – a manifold. The research focuses on different variants of the obtained image recognition models in order to identify differences that may affect their effectiveness and possible application in real work conditions. The environment used to build the models is Jupyter Notebook, and convolutional neural networks were implemented.
W artykule opisano możliwości wykorzystania, budowy i wdrożenia systemu rozpoznawania obrazu w firmie realizującej proces regeneracji. Artykuł powstał na podstawie pracy magisterskiej przygotowanej przy pomocy Wabco Reman Solutions. Przeprowadzone testy zostały wykonane na jednej z regenerowanych części w firmie - kolektorze. W badaniach skupiono się na różnych wariantach powstałych modeli rozpoznawania obrazów w celu dostrzeżenia różnic, które mogą wpłynąć na ich skuteczność i możliwość zastosowania w rzeczywistych warunkach pracy. Do budowy modeli, w których zaimplementowano konwolucyjne sieci neuronowe, wykorzystano środowisko Jupyter Notebook.
Źródło:
Journal of TransLogistics; 2021, 7, 1; 147--162
2450-5870
Pojawia się w:
Journal of TransLogistics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Estimating the distance to an object from grayscale stereo images using deep learning
Autorzy:
Kulawik, Joanna
Powiązania:
https://bibliotekanauki.pl/articles/2202043.pdf
Data publikacji:
2022
Wydawca:
Politechnika Częstochowska. Wydawnictwo Politechniki Częstochowskiej
Tematy:
estimating distance
stereo vision
convolutional neural network
deep learning
szacowanie odległości
widzenie stereoskopowe
konwolucyjne sieci neuronowe
uczenie głębokie
Opis:
This article presents an innovative proposal for estimating the distance between an autonomous vehicle and an object in front of it. Such information can be used, for example, to support the process of controlling an autonomous vehicle. The primary source of information in research is monochrome stereo images. The images were made in compliance with the laws of the canonical order. The developed convolutional neural network model was used for the estimation. A proprietary dataset was developed for the experiments. The analysis was based on the phenomenon of disparity in stereo images. As a result of the research, a correctly trained model of the CNN network was obtained in six variants. High accuracy of distance estimation was achieved. This publication describes an original proposal for a hybrid blend of digital image analysis, stereo-vision, and deep learning for engineering applications.
Źródło:
Journal of Applied Mathematics and Computational Mechanics; 2022, 21, 4; 60--72
2299-9965
Pojawia się w:
Journal of Applied Mathematics and Computational Mechanics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Convolutional neural networks for early computer diagnosis of child dysplasia
Konwolucyjne sieci neuronowe do wczesnej diagnostyki komputerowej dysplazji u dzieci
Autorzy:
Bilynsky, Yosyp
Nikolskyy, Aleksandr
Revenok, Viktor
Pogorilyi, Vasyl
Smailova, Saule
Voloshina, Oksana
Kumargazhanova, Saule
Powiązania:
https://bibliotekanauki.pl/articles/27315470.pdf
Data publikacji:
2023
Wydawca:
Politechnika Lubelska. Wydawnictwo Politechniki Lubelskiej
Tematy:
convolutional neural networks
computer diagnosis
ultrasound image child dysplasia
konwolucyjne sieci neuronowe
diagnostyka komputerowa
obrazowanie ultrasonograficzne dysplazji dziecięcej
Opis:
The problem in ultrasound diagnostics hip dysplasia is the lack of experience of the doctor in case of incorrect orientation of the hip joint and ultrasound head. The aim of this study was to evaluate the ability of the convolutional neural network (CNN) to classify and recognize ultrasound imaging of the hip joint obtained at the correct and incorrect position of the ultrasound sensor head in the computer diagnosis of pediatric dysplasia. CNN's such as GoogleNet, SqueezeNet, and AlexNet were selected for the study. The most optimal for the task is the use of CNN GoogleNet showed. In this CNN used transfer learning. At the same time, fine-tuning of the network and additional training on the database of 97 standards of ultrasonic images of the hip joint were applied. Image type RGB 32 bit, 210 × 300 pixels are used. Fine-tuning has been performed the lower layers of the structure CNN, in which 5 classes are allocated, respectively 4 classes of hip dysplasia types according to the Graf, and the Type ERROR ultrasound image, where position of the ultrasound sensor head and of the hip joint in ultrasound diagnostics are incorrect orientation. It was found that the authenticity of training and testing is the highest for the GoogleNet network: when classified in the training group accuracy is up to 100%, when classified in the test group accuracy – 84.5%.
Problemem w diagnostyce ultrasonograficznej dysplazji stawu biodrowego jest brak doświadczenia lekarzy w zakresie nieprawidłowej orientacji stawu biodrowego i głowicy ultrasonograficznej. Celem tego badania była ocena zdolności konwolucyjnej sieci neuronowej (CNN) do klasyfikowania i rozpoznawania obrazów ultrasonograficznych stawu biodrowego uzyskanych przy prawidłowym i nieprawidłowym położeniu głowicy ultrasonograficznej we wspomaganej komputerowo diagnostyce dysplazji dziecięcej. Do badania wybrano sieci CNN, takie jak GoogleNet, SqueezeNet i AlexNet. Wykazano, że najbardziej optymalne dla tego zadania jest użycie CNN GoogleNet. Jednocześnie w CNN zastosowano metodologię uczenia transferowego. Zastosowano precyzyjne dostrojenie sieci i dodatkowe szkolenie na podstawie 97 próbek obrazów ultrasonograficznych stawu biodrowego, typ obrazu RGB 32 bity, 210 × 300 pikseli. Przeprowadzono dostrajanie dolnych warstw struktury CNN, w której zidentyfikowano 5 klas, odpowiednio 4 klasy typów dysplazji stawu biodrowego według Grafa oraz obraz ultrasonograficzny typu ERROR, w którym pozycja głowicy ultrasonograficznej i stawu biodrowego w diagnostyce ultrasonograficznej mają nieprawidłową orientację. Stwierdzono, że niezawodność szkolenia i testowania jest najwyższa dla sieci GoogleNet: podczas klasyfikacji w grupie szkoleniowej dokładność wynosi do 100%, podczas klasyfikacji w grupie testowej dokładność wynosi 84,5%.
Źródło:
Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska; 2023, 13, 2; 56--63
2083-0157
2391-6761
Pojawia się w:
Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Leveraging Transfer Learning to Identify Food Categories
Autorzy:
Kolla, J. V. V.
Vemula, P. Ch.
Chakravarthy, S.
Naidu, B. S.
Patibandla, D.
Powiązania:
https://bibliotekanauki.pl/articles/2023418.pdf
Data publikacji:
2021
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
convolutional neural networks
transfer learning
domain similarity
fine-tuning
konwolucyjne sieci neuronowe
uczenie się przez przeniesienie
podobieństwo dziedzin
dostrajanie
Opis:
In today’s scenario, recognition of pictured food dishes automatically has significant importance. During the COVID-19 pandemic, there was a decline in people visiting restaurants for their dietary requirements. So many restaurants started offering their services online. This situation caused a demand for better categorization of food into various categories on a large scale by companies that facilitated these services. It is challenging to congregate a large dataset of food categories, so it is complex to build a generalized architecture. To solve this issue, In this paper, domain-specific transfer learning is used to build the model using some standard architectures like VGGNET, RESNET, and EFFICIENTNET family, which are trained on popular benchmark datasets such as IMAGENET, COCO, etc. The similarity between the source and target datasets is calculated to find the best source dataset, and the one with the highest similarity is chosen for transfer learning. The solution proposed in this paper outperforms some of the existing works on categorizing food items.
Źródło:
Advances in Science and Technology. Research Journal; 2021, 15, 4; 101-109
2299-8624
Pojawia się w:
Advances in Science and Technology. Research Journal
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A strong and efficient baseline for vehicle re-identification using deep triplet embedding
Autorzy:
Kumar, Ratnesh
Weill, Edwin
Aghdasi, Farzin
Sriram, Parthasarathy
Powiązania:
https://bibliotekanauki.pl/articles/91741.pdf
Data publikacji:
2020
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
convolutional neural networks
re-identification
triplet networks
siamese networks
embedding
hard data mining
contrastive loss
konwolucyjne sieci neuronowe
sieci triplet
sieci syjamskie
osadzanie
eksploracja danych
Opis:
In this paper we tackle the problem of vehicle re-identification in a camera network utilizing triplet embeddings. Re-identification is the problem of matching appearances of objects across different cameras. With the proliferation of surveillance cameras enabling smart and safer cities, there is an ever-increasing need to re-identify vehicles across cameras. Typical challenges arising in smart city scenarios include variations of viewpoints, illumination and self occlusions. Most successful approaches for re-identification involve (deep) learning an embedding space such that the vehicles of same identities are projected closer to one another, compared to the vehicles representing different identities. Popular loss functions for learning an embedding (space) include contrastive or triplet loss. In this paper we provide an extensive evaluation of triplet loss applied to vehicle re-identification and demonstrate that using the recently proposed sampling approaches for mining informative data points outperform most of the existing state-of-the-art approaches for vehicle re-identification. Compared to most existing state-of-the-art approaches, our approach is simpler and more straightforward for training utilizing only identity-level annotations, along with one of the smallest published embedding dimensions for efficient inference. Furthermore in this work we introduce a formal evaluation of a triplet sampling variant (batch sample) into the re-identification literature. In addition to the conference version [24], this submission adds extensive experiments on new released datasets, cross domain evaluations and ablation studies.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2020, 10, 1; 27-45
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Early detection and localization of stator inter-turn short circuit faults based on variational mode decomposition and deep learning in induction motor
Autorzy:
Guedidi, Asma
Laala, Widad
Guettaf, Abderrazak
Arif, Ali
Powiązania:
https://bibliotekanauki.pl/articles/27313828.pdf
Data publikacji:
2023
Wydawca:
Polska Akademia Nauk. Polskie Towarzystwo Diagnostyki Technicznej PAN
Tematy:
convolutional neural networks
CNNs
deep learning
short circuit fault diagnosis
variational mode decomposition
information map
silnik indukcyjny
konwolucyjne sieci neuronowe
uczenie głębokie
mapa informacyjna
Opis:
The existing diagnostic techniques for detecting inter-turn short circuits (ITSCs) in induction motors face two primary challenges. Firstly, they suffer from reduced sensitivity, often failing to detect ITSCs when only a few turns are short-circuited. Secondly, their reliability are compromised by load fluctuations, leading to false alarms even in the absence of actual faults. To address these issues, a novel intelligent approach to diagnose ITSC fault is proposed. Indeed, this method encompasses three core components: a novel multi-sensor fusion technique, a knowledge map, and enhanced Convolutional Neural Networks (CNNs). First, the raw data collected from multiple sensors undergoes a transformation into 2D data using a novel image transformation based on Hilbert transform (HT) and variational mode decomposition (VMD), which is concatenate to a novel information map including frequency fault information and rotational speed. Then, this 3D multi information image is used as input to an improvement CNN model that apply a transfer learning for an enhanced version of SqueezNet with incorporating a novel attention mechanism module to precisely identify fault features. Experimental results and performance comparisons demonstrate that the proposed model attains high performance surpassing other Deep Learning (DL) methods in terms of accuracy. In addition, the model has consistently demonstrated its ability to make precise predictions and accurately classify fault severity, even under different working conditions.
Źródło:
Diagnostyka; 2023, 24, 4; art. no. 2023401
1641-6414
2449-5220
Pojawia się w:
Diagnostyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Biometryczna weryfikacja tożsamości kierowców na podstawie obrazu twarzy
Biometrical driver face verification
Autorzy:
Chmielińska, J.
Jakubowski, J.
Powiązania:
https://bibliotekanauki.pl/articles/315121.pdf
Data publikacji:
2018
Wydawca:
Instytut Naukowo-Wydawniczy "SPATIUM"
Tematy:
bezpieczeństwo ruchu drogowego
system monitoringu
konwolucyjne sieci neuronowe
weryfikacja tożsamości
obraz twarzy
zmęczenie kierowcy
tachograf
road safety
monitoring system
convolutional neural networks
identity verification
face images
driver fatigue
tachogram
Opis:
W artykule przedstawiono problematykę weryfikacji tożsamości na podstawie obrazu twarzy w kontekście systemu monitorowania kierowców na potrzeby bezpieczeństwa w ruchu drogowym. Zaproponowane zostały dwie metody weryfikacji tożsamości oparte na konwolucyjnej sieci neuronowej, opracowane z wykorzystaniem techniki „transfer learningu”. W artykule przedstawione zostały wyniki porównawcze efektywności działania przedstawionych metod a także ich wady oraz zalety.
The paper discusses the problem of face verification in a driver monitoring system for the purpose of traffic safety. Two different methods of face verification were proposed. Both of them are based on a convolutional neural network and were developed with the use of a transfer learning technique. In the paper, the results produced by both proposed method have been presented and compared. Moreover, their advantages and disadvantages have been discussed.
Źródło:
Autobusy : technika, eksploatacja, systemy transportowe; 2018, 19, 6; 68-72, CD
1509-5878
2450-7725
Pojawia się w:
Autobusy : technika, eksploatacja, systemy transportowe
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Multi-feature ensemble system in the renal tumour classification task
Autorzy:
Osowska-Kurczab, Aleksandra Maria
Markiewicz, Tomasz
Dziekiewicz, Miroslaw
Lorent, Malgorzata
Powiązania:
https://bibliotekanauki.pl/articles/2173572.pdf
Data publikacji:
2021
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
medical imaging
renal cell carcinoma
convolutional neural networks
textural features
support vector machine
computer vision
deep learning
technika deep learning
obrazowanie medyczne
rak nerkowokomórkowy
konwolucyjne sieci neuronowe
cechy tekstury
maszyna wektorów nośnych
wizja komputerowa
głęboka nauka
Opis:
Recently, the analysis of medical imaging is gaining substantial research interest, due to advancements in the computer vision field. Automation of medical image analysis can significantly improve the diagnosis process and lead to better prioritization of patients waiting for medical consultation. This research is dedicated to building a multi-feature ensemble model which associates two independent methods of image description: textural features and deep learning. Different algorithms of classification were applied to single-phase computed tomography images containing 8 subtypes of renal neoplastic lesions. The final ensemble includes a textural description combined with a support vector machine and various configurations of Convolutional Neural Networks. Results of experimental tests have proved that such a model can achieve 93.6% of weighted F1-score (tested in 10-fold cross validation mode). Improvement of performance of the best individual predictor totalled 3.5 percentage points.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2021, 69, 3; art. no. e136749
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Application of convolutional neuron network for image processing and interpretation
Zastosowanie konwolucyjnych sieci neuronowych do przetwarzania i interpretacji obrazów
Autorzy:
Pałczyński, Krzysztof
Powiązania:
https://bibliotekanauki.pl/articles/2016320.pdf
Data publikacji:
2020
Wydawca:
Politechnika Bydgoska im. Jana i Jędrzeja Śniadeckich. Wydawnictwo PB
Tematy:
convolutional neural network
image processing
filtration
convolution
activation function
loss function
softmax
cross entropy
L2
Dropout
stochastic gradient drop
konwolucyjne sieci neuronowe
przetwarzanie obrazów
filtracja
splot
funkcja aktywacji
funkcja straty
entropia krzyżowa
stochastyczny spadek gradientu
Opis:
This article describes the application of Convolutional Neural Network in image processing and describes how it works. There are presented: network layers, types of activation functions, example of the AlexNet network architecture, the use of the loss function and the cross entropy method to calculate the loss during tests, L2 and Dropout methods used for weights regularization and optimization of the loss function using Stochastic Gradient Drop.
Artykuł ten opisuje zastosowanie Konwolucyjnych Sieci Neuronowych w przetwarzaniu obrazów. W celu lepszego zrozumienia tematu opisano sposób działania sieci. Przedstawiono sieci wielowarstwowe, rodzaje funkcji aktywacji, przykład architektury sieci AlexNet. W artykule skupiono się na opisaniu wykorzystania funkcji straty oraz metody entropii krzyżowej do obliczenia straty w czasie testów. Opisano również sposoby normalizacji wag L2 i Dropout oraz optymalizację funkcji straty za pomocą Stochastycznego Spadku Gradientu.
Źródło:
Zeszyty Naukowe. Telekomunikacja i Elektronika / Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy; 2019, 23; 5-12
1899-0088
Pojawia się w:
Zeszyty Naukowe. Telekomunikacja i Elektronika / Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Multi-feature ensemble system in the renal tumour classification task
Autorzy:
Osowska-Kurczab, Aleksandra Maria
Markiewicz, Tomasz
Dziekiewicz, Miroslaw
Lorent, Malgorzata
Powiązania:
https://bibliotekanauki.pl/articles/2128157.pdf
Data publikacji:
2021
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
medical imaging
renal cell carcinoma
convolutional neural networks
textural features
support vector machine
computer vision
deep learning
technika deep learning
obrazowanie medyczne
rak nerkowokomórkowy
konwolucyjne sieci neuronowe
cechy tekstury
maszyna wektorów nośnych
wizja komputerowa
głęboka nauka
Opis:
Recently, the analysis of medical imaging is gaining substantial research interest, due to advancements in the computer vision field. Automation of medical image analysis can significantly improve the diagnosis process and lead to better prioritization of patients waiting for medical consultation. This research is dedicated to building a multi-feature ensemble model which associates two independent methods of image description: textural features and deep learning. Different algorithms of classification were applied to single-phase computed tomography images containing 8 subtypes of renal neoplastic lesions. The final ensemble includes a textural description combined with a support vector machine and various configurations of Convolutional Neural Networks. Results of experimental tests have proved that such a model can achieve 93.6% of weighted F1-score (tested in 10-fold cross validation mode). Improvement of performance of the best individual predictor totalled 3.5 percentage points.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2021, 69, 3; e136749, 1--8
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-21 z 21

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies