Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "features extraction" wg kryterium: Temat


Wyświetlanie 1-11 z 11
Tytuł:
Audio-Visual Speech Processing System for Polish Applicable to Human-Computer Interaction
Autorzy:
Jadczyk, T.
Powiązania:
https://bibliotekanauki.pl/articles/305828.pdf
Data publikacji:
2018
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
audio-visual speech recognition
visual features extraction
human-computer interaction
Opis:
This paper describes audio-visual speech recognition system for Polish language and a set of performance tests under various acoustic conditions. We first present the overall structure of AVASR systems with three main areas: audio features extraction, visual features extraction and subsequently, audiovisual speech integration. We present MFCC features for audio stream with standard HMM modeling technique, then we describe appearance and shape based visual features. Subsequently we present two feature integration techniques, feature concatenation and model fusion. We also discuss the results of a set of experiments conducted to select best system setup for Polish, under noisy audio conditions. Experiments are simulating human-computer interaction in computer control case with voice commands in difficult audio environments. With Active Appearance Model (AAM) and multistream Hidden Markov Model (HMM) we can improve system accuracy by reducing Word Error Rate for more than 30%, comparing to audio-only speech recognition, when Signal-to-Noise Ratio goes down to 0dB.
Źródło:
Computer Science; 2018, 19 (1); 41-63
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Efficient Two-Step Approach for Automatic Number Plate Detection
Autorzy:
Gorovyi, I.
Powiązania:
https://bibliotekanauki.pl/articles/226386.pdf
Data publikacji:
2015
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
automatic number plate recognition (ANPR)
stroke width transform
features extraction
neural network
Opis:
Intelligent transportation systems are rapidly growing mainly due to active development of novel hardware and software solutions. In the paper a problem of automatical number plate detection is considered. An efficient two-step approach based on plate candidates extraction with further classification by neural network is proposed. Stroke width transform and contours detection techniques are utilized for the image preprocessing and extraction of regions of interest. Different local feature sets are used for the final number plate extraction step. Efficiency of the developed method is tested with real datasets.
Źródło:
International Journal of Electronics and Telecommunications; 2015, 61, 4; 351-356
2300-1933
Pojawia się w:
International Journal of Electronics and Telecommunications
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Video-based technique for damaged spacers detections during power line inspections
Wizyjna technika detekcji uszkodzeń odstępników podczas inspekcji linii energetycznych
Autorzy:
Okarma, K.
Mazurek, P.
Powiązania:
https://bibliotekanauki.pl/articles/153215.pdf
Data publikacji:
2008
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
odstępnik
ekstrakcja cech geometrycznych
detekcja uszkodzeń
spacer
geometrical features' extraction
fault detection
Opis:
In the paper a digital image processing algorithm useful for video-based analysis of power lines spacers' mechanical condition is proposed. For testing purposes the semi-synthetic images of some damaged typical spacers have been used but for the verification of the detection of spacers' location working properties the real images taken from the camera have been used. Presented method is based mainly on the geometrical features' extraction techniques and can be applied in the systems for the analysis of data acquired by e.g. aerial fly-by patrols.
W pracy zaproponowano algorytm cyfrowego przetwarzania obrazów użyteczny w analizie wideo uszkodzeń mechanicznych odstępników w liniach energetycznych. Do celów testowych zostały użyte półsyntetyczne obrazy uszkodzeń typowych odstępników, natomiast weryfikacja działania detekcji położenia odstępników została przeprowadzona w oparciu o obrazy rzeczywiste uzyskane z kamery. Proponowana metoda jest oparta głównie na technikach ekstrakcji cech geometrycznych i może być użyta w systemach automatycznej analizy danych uzyskiwanych np. podczas inspekcji lotniczych.
Źródło:
Pomiary Automatyka Kontrola; 2008, R. 54, nr 10, 10; 677-678
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Linear optimization of multi-path routing in network on chips
Liniowa optymalizacja wielościeżkowego routingu w sieciach wewnątrzukładowych
Autorzy:
Dziurzański, P.
Mąka, T.
Powiązania:
https://bibliotekanauki.pl/articles/156579.pdf
Data publikacji:
2012
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
sieci wewnątrzukładowe
routing wielościeżkowy
ekstrakcja cech
Network on Chip (NoC)
multipath routing
features extraction
Opis:
In this paper, a technique for determining required link band-width of a multi-path routing algorithm dedicated to Network on Chip (NoC) is presented. The proposed algorithm is based on the linear programming and allows us to avoid deadlocks and contentions in case of Tapeworm routing used for data-dominated streaming multimedia applications realized in Multi Processor Systems on Chip. The proposed approach is illustrated with an example of features extraction module for the Automatic Speech Recognition (ASR) system.
W artykule opisano technikę określania wymaganej przepustowości łączy sieci wewnątrzukładowej z routingiem wielościeżkowym. Zaproponowany algorytm bazuje na programowaniu liniowym i umożliwia unikanie blokad w routingu typu Tapeworm, wykorzystywanego dla multimedialnych aplikacji zdominowanych przez dane realizowanych w układach typu MPSoC. Autorski algorytm routingu Tapeworm dla niektórych aplikacji multimedialnych okazuje się być wydajniejszy od XY, powszechnie używanego algorytmu routingu w NoC. Zaproponowane podejście zostało zilustrowane przykładem modułu ekstrakcji cech w systemie automatycznego rozpoznawania mowy. Klasyczny diagram takiego modułu został przedstawiony na rys. 1. W celu określenia marszrut pomiędzy rdzeniami realizującymi funkcjonalności poszczególnych bloków tego modułu została zaadaptowana technika znana z tradycyjnych sieci komputerowych, opisana m.in. w [8]. W artykule zaproponowano sposób wyboru ścieżek między rdzeniem źródłowym i docelowym, opisano sposób określania ograniczeń, a także zaproponowano funkcję celu uwzględniającą długość ścieżki. Do wyszukiwania optymalnej przepustowości łączy wykorzystano algorytm przypominający wyszukiwanie binarne. Badania eksperymentalne, w ramach których zaimplementowano opisany moduł w języku SystemC, a także wykorzystano komercyjne narzędzie do rozwiązywania problemu programowania liniowego, potwierdzają skuteczność i efektywność opisywanego podejścia.
Źródło:
Pomiary Automatyka Kontrola; 2012, R. 58, nr 7, 7; 659-661
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Parametric analysis of pilot voice signals in Parkinson’s disease diagnostics
Analiza parametryczna pilotażowych sygnałów głosu w diagnostyce choroby Parkinsona
Autorzy:
Majda-Zdancewicz, Ewelina
Potulska-Chromik, Anna
Nojszewska, Monika
Kostera-Pruszczyk, Anna
Powiązania:
https://bibliotekanauki.pl/articles/2176245.pdf
Data publikacji:
2022
Wydawca:
Uniwersytet Technologiczno-Humanistyczny im. Kazimierza Pułaskiego w Radomiu
Tematy:
features extraction
speech signal analysis
Parkinson's disease
analiza sygnału mowy
choroba Parkinsona
ekstrakcja cech
Opis:
Parkinson's disease (PD) is a neurodegenerative disease of the central nervous system (CNS) characterized by the progressive loss of dopaminergic neurons in the substantia nigra. The article describes an analysis of pilot voice signal analysis in Parkinson's disease diagnostics. Frequency domain signal analysis was mainly used to assess the state of a patient's voice apparatus in order to support PD diagnostics. The recordings covered uttering the “a” sound at least twice with extended phonation. The research utilized real recordings acquired in the Department of Neurology at the Medical University of Warsaw, Poland. Spectral speech signal coefficients may be determined based on different defined frequency scales. The authors used four frequency scales: linear, Mel, Bark and ERB . Spectral descriptors have been defined for each scales which are widely used in machine and deep learning applications, and perceptual analysis. The usefulness of extracted features was assessed taking into account various methods. The discriminatory ability of individual coefficients was evaluated using the Fisher coefficient and LDA technique.. The results of numerical experiments have shown different efficiencies of the proposed descriptors using different frequencies scales.
Choroba Parkinsona (PD) jest neurodegeneracyjną chorobą ośrodkowego układu nerwowego charakteryzującą się postępującą utratą neuronów dopaminergicznych w istocie czarnej. W artykule opisano analizę rejestracji pilotażowych sygnałów głosu w diagnostyce choroby Parkinsona. Rejestracji podlegało co najmniej dwukrotnie wypowiadanie głoski „a” o przedłużonej fonacji. Do badań wykorzystano nagrania zarejestrowane w Katedrze i Klinice Neurologii Warszawskiego Uniwersytetu Medycznego w Warszawie. Do oceny stanu aparatu głosu pacjenta celem wsparcia diagnostyki choroby Parkinsona wykorzystano w głównej mierze analizę sygnału w dziedzinie częstotliwości. Autorzy zastosowali cztery skale częstości: liniową, skalę typu Mel, skalę typu Bark oraz skalę typu ERB. Dla każdej z tych skali zdefiniowali deskryptory spektralne szeroko stosowane w aplikacjach uczenia maszynowego i głębokiego uczenia się oraz w analizie percepcyjnej. Ocena przydatności wyekstrahowanych cech została zrealizowana z uwzględnieniem różnych metod. Wykorzystano metodą oceny jakości cech przy użyciu współczynnika istotności Fischera oraz analizę LDA. Wyniki eksperymentów numerycznych wykazały różne wydajności proponowanych deskryptorów przy użyciu różnych skal częstości.
Źródło:
Journal of Automation, Electronics and Electrical Engineering; 2022, 4, 1; 21--28
2658-2058
2719-2954
Pojawia się w:
Journal of Automation, Electronics and Electrical Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Efficient Covid-19 disease diagnosis based on cough signal processing and supervised machine learning
Autorzy:
Bensid, Khaled
Lati, Abdelhai
Benlamoudi, Azeddine
Ghouar, Brahim Elkhalil
Senoussi, Mohammed Larbi
Powiązania:
https://bibliotekanauki.pl/articles/2174478.pdf
Data publikacji:
2023
Wydawca:
Polska Akademia Nauk. Polskie Towarzystwo Diagnostyki Technicznej PAN
Tematy:
voice disease
Covid-19
cough sounds
features extraction
classification
ekstrakcja cech
klasyfikacja
kaszel
przetwarzanie sygnału
uczenie maszynowe
Opis:
The spread of the coronavirus has claimed the lives of millions worldwide, which led to the emergence of an economic and health crisis at the global level, which prompted many researchers to submit proposals for early diagnosis of the coronavirus to limit its spread. In this work, we propose an automated system to detect COVID-19 based on the cough as one of the most important infection indicators. Several studies have shown that coughing accounts for 65% of the total symptoms of infection. The proposed system is mainly based on three main steps: first, cough signal detection and segmentation; second, cough signal extraction; and third, three techniques of supervised machine learning-based classification: Support Vector Machine (SVM), KNearest Neighbours (KNN), and Decision Tree (DT). Our proposed system showed high performance through good accuracy values, where the best accuracy for classifying female coughs was 99.6% using KNN and 88% for males using SVM.
Źródło:
Diagnostyka; 2023, 24, 1; art. no. 2023103
1641-6414
2449-5220
Pojawia się w:
Diagnostyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Modelowanie i optymalizacja generatora cech dla systemu rozpoznawania mówcy
Modeling and optimization of features generator for speaker recognition systems
Autorzy:
Majda, E.
Dobrowolski, A. P.
Smólski, B. L.
Powiązania:
https://bibliotekanauki.pl/articles/209417.pdf
Data publikacji:
2012
Wydawca:
Wojskowa Akademia Techniczna im. Jarosława Dąbrowskiego
Tematy:
automatyczne rozpoznawanie mówcy
analiza cepstralna
ekstrakcja cech
selekcja cech
analiza składników głównych
automatic speaker recognition
cepstral analysis
features extraction
features selection
principal component analysis
Opis:
W pracy przedstawiono zagadnienia związane z modelowaniem i optymalizacją generatora cech dla systemu automatycznego rozpoznawania mówcy (ang. Automatic Speaker Recognition - ASR). Etap generacji cech (parametryzacji sygnału mowy) jest fundamentalny w tego typu systemach, z uwagi na fakt, że unikatowy wektor cech ma decydujące znaczenie w procesie rozpoznawania. Zadaniem generatora cech jest opisanie sygnału mowy za pomocą możliwie mało licznego zbioru deskryptorów, bez utraty informacji istotnych z punktu widzenia rozpoznawania mówcy. Ponadto parametryzacja powinna wykazywać odporność na warunki akustyczne i techniczne rejestracji oraz na zawartość lingwistyczną rejestrowanego materiału. Badania przedstawione w referacie koncentrowały się przede wszystkim na wielokryterialnej optymalizacji wybranych parametrów generatora cech opartego na analizie cepstralnej, uwzględniającej dodatkowo selekcję cech. Oceny otrzymanych wyników dokonano w oparciu o analizę składników głównych (ang. Principal Component Analysis - PCA) zbioru deskryptorów wyznaczonych dla próbek głosu pochodzących od 24 mówców.
The paper presents issues related to modeling and optimization of the features generator for the speaker recognition system (ASR - Automatic Speakers Recognition). Parameterization's stage of the speech signal (features generation) is fundamental in this type of systems, due to the fact that the unique vector of features is crucial in the process of recognition. The task is to describe the speech signal using descriptors as little as possible, without loss of relevant information to the speaker recognition. In addition, parametrization should have robust to acoustic and technical registration conditions and the recorded linguistic material. The research presented in this paper is focused primarily on the multicriteria optimization of selected parameters of the features generator based on cepstral analysis, additionally allowing features selection. Finally, evaluation of the results was based on the analysis of main components, a set of descriptors for the samples voice acquired from 24 speakers.
Źródło:
Biuletyn Wojskowej Akademii Technicznej; 2012, 61, 4; 153-168
1234-5865
Pojawia się w:
Biuletyn Wojskowej Akademii Technicznej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Diagnostic significance of phase spectrum in acoustic analysis of pathological voice
Diagnostyczne znaczenie widma fazowego w analizie akustycznej głosu patologicznego
Autorzy:
Samborska-Owczarek, A.
Powiązania:
https://bibliotekanauki.pl/articles/153586.pdf
Data publikacji:
2010
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
analiza akustyczna
sygnał mowy
przetwarzanie mowy
częstotliwość podstawowa
widmo fazowe
ekstrakcja cech
GIRBAS
acoustic analysis
voice signal
speech processing
fundamental frequency
F0
phase spectrum
features extraction
Opis:
The paper regards the possibility of using new numerical features extracted from the phase spectrum of a speech signal for voice quality estimation in acoustic analysis for medical purposes. This novel approach does not require detection or estimation of the fundamental frequency and works on all types of speech signal: euphonic, dysphonic and aphonic as well. The experiment results presented in the paper are very promising: the developed F0-independant voice features are strongly correlated with two voice quality indicators: grade of hoarseness G (r>0.8) and roughness R (r>0.75) from GIRBAS scale, and exceed the standard voice parameters: jitter and shimmer.
Artykuł dotyczy możliwości ekstrakcji cech numerycznych z widma fazowego sygnału mowy w celu wykorzystania w analizie akustycznej na potrzeby medyczne. Podejście to umożliwia uzależnienie analizy akustycznej od zawodnych metod wykrywania/wyznaczania częstotliwości podstawowej (tonu krtaniowego) i dzięki temu przeznaczone jest do badania wszystkich typów sygnału mowy (również afonicznych). Wyniki eksperymentu są bardzo obiecujące - proponowane cechy Ph1 i Ph2 są silnie skorelowane z dwoma kategoriami percepcyjnymi: stopniem chrypki (r>0.8) oraz szorstkością głosu (r>0.75) ze skali GIRBAS, wykazując silniejsze znaczenie diagnostyczne niż znane i stosowane od dawna wskaźniki jitter i shimmer. Proponowane podejście oprócz skuteczności charakteryzuje się szeregiem dodatkowych korzyści: algorytm metody z powodu niskiej złożoności jest szybki i niekosztowny, interpretacja matematyczna jest prosta i jednoznaczna oraz spójna z obserwowanym obrazem widma fazowego głosu. Ponadto uniezależnienie od detekcji częstotliwości podstawowej sprawia, że algorytm jest deterministyczny oraz efektywny dla każdego typu sygnału mowy.
Źródło:
Pomiary Automatyka Kontrola; 2010, R. 56, nr 12, 12; 1547-1550
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The logic and linguistic model for automatic extraction of collocation similarity
Autorzy:
Khairova, N.
Petrasova, S.
Gautam, A. P. S.
Powiązania:
https://bibliotekanauki.pl/articles/411457.pdf
Data publikacji:
2015
Wydawca:
Polska Akademia Nauk. Oddział w Lublinie PAN
Tematy:
automatic extraction
identification of collocation similarity
finite predicates algebra
logicalalgebraic equations
grammatical and semantic features
Opis:
The article discusses the process of automatic identification of collocation similarity. The semantic analysis is one of the most advanced as well as the most difficult NLP task. The main problem of semantic processing is the determination of polysemy and synonymy of linguistic units. In addition, the task becomes complicated in case of word collocations. The paper suggests a logical and linguistic model for automatic determining semantic similarity between colocations in Ukraine and English languages. The proposed model formalizes semantic equivalence of collocations by means of semantic and grammatical characteristics of collocates. The basic idea of this approach is that morphological, syntactic and semantic characteristics of lexical units are to be taken into account for the identification of collocation similarity. Basic mathematical means of our model are logical-algebraic equations of the finite predicates algebra. Verb-noun and noun-adjective collocations in Ukrainian and English languages consist of words belonged to main parts of speech. These collocations are examined in the model. The model allows extracting semantically equivalent collocations from semi-structured and non-structured texts. Implementations of the model will allow to automatically recognize semantically equivalent collocations. Usage of the model allows increasing the effectiveness of natural language processing tasks such as information extraction, ontology generation, sentyment analysis and some others.
Źródło:
ECONTECHMOD : An International Quarterly Journal on Economics of Technology and Modelling Processes; 2015, 4, 4; 43-48
2084-5715
Pojawia się w:
ECONTECHMOD : An International Quarterly Journal on Economics of Technology and Modelling Processes
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analysis of suspicious lesions in digital mammograms
Autorzy:
Choraś, R. S.
Powiązania:
https://bibliotekanauki.pl/articles/333369.pdf
Data publikacji:
2011
Wydawca:
Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Tematy:
sterowane filtry
mammografie
wychwytywanie cech
klasyfikacja
steerable filters
mammograms
moment and texture features
feature extraction
classification
Opis:
The system using steerable filters for analysis suspicious lesions in mammograms is proposed. This system is based on moments and texture features. The set of well defined and classified suspicious lesions regions from mammograms database are used as a reference pattern. The similarity measure for reference pattern image and patient mammogram is found by computing the distance between their corresponding feature vectors. The Euclidean distance metric is used to finding the nearest class to patient feature vector what in result mark the automatically classify this mammograms.
Źródło:
Journal of Medical Informatics & Technologies; 2011, 17; 151-158
1642-6037
Pojawia się w:
Journal of Medical Informatics & Technologies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Automatic Genre Classification Using Fractional Fourier Transform Based Mel Frequency Cepstral Coefficient and Timbral Features
Autorzy:
Bhalke, D. G.
Rajesh, B.
Bormane, D. S.
Powiązania:
https://bibliotekanauki.pl/articles/177599.pdf
Data publikacji:
2017
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
feature extraction
Timbral features
MFCC
Mel Frequency Cepstral Coefficient
FrFT
fractional Fourier transform
Fractional MFCC
Tamil Carnatic music
Opis:
This paper presents the Automatic Genre Classification of Indian Tamil Music and Western Music using Timbral and Fractional Fourier Transform (FrFT) based Mel Frequency Cepstral Coefficient (MFCC) features. The classifier model for the proposed system has been built using K-NN (K-Nearest Neighbours) and Support Vector Machine (SVM). In this work, the performance of various features extracted from music excerpts has been analysed, to identify the appropriate feature descriptors for the two major genres of Indian Tamil music, namely Classical music (Carnatic based devotional hymn compositions) & Folk music and for western genres of Rock and Classical music from the GTZAN dataset. The results for Tamil music have shown that the feature combination of Spectral Roll off, Spectral Flux, Spectral Skewness and Spectral Kurtosis, combined with Fractional MFCC features, outperforms all other feature combinations, to yield a higher classification accuracy of 96.05%, as compared to the accuracy of 84.21% with conventional MFCC. It has also been observed that the FrFT based MFCC effieciently classifies the two western genres of Rock and Classical music from the GTZAN dataset with a higher classification accuracy of 96.25% as compared to the classification accuracy of 80% with MFCC.
Źródło:
Archives of Acoustics; 2017, 42, 2; 213-222
0137-5075
Pojawia się w:
Archives of Acoustics
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-11 z 11

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies