Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "speech features" wg kryterium: Temat


Wyświetlanie 1-9 z 9
Tytuł:
Speech Analysis as a Tool for Detection and Monitoring of Medical Conditions : A review
Autorzy:
Igras-Cybulska, Magdalena
Hemmerling, Daria
Ziółko, Mariusz
Datka, Wojciech
Stogowska, Ewa
Kucharski, Michał
Rzepka, Rafał
Ziółko, Bartosz
Powiązania:
https://bibliotekanauki.pl/articles/31339837.pdf
Data publikacji:
2023
Wydawca:
Polska Akademia Nauk. Czasopisma i Monografie PAN
Tematy:
speech analysis
speech features
acoustic parameters
linguistic analysis
voice biomarkers
screening test
Opis:
The goal of this article is to present and compare recent approaches which use speech and voice analysis as biomarkers for screening tests and monitoring of some diseases. The article takes into account metabolic, respiratory, cardiovascular, endocrine, and nervous system disorders. A selection of articles was performed to identify studies that assess voice features quantitatively in selected disorders by acoustic and linguistic voice analysis. Information was extracted from each paper in order to compare various aspects of datasets, speech parameters, methods of applied analysis and obtained results. 110 research papers were reviewed and 47 databases were summarized. Speech analysis is a promising method for early diagnosis of certain disorders. Advanced computer voice analysis with machine learning algorithms combined with the widespread availability of smartphones allows diagnostic analysis to be conducted during the patient’s visit to the doctor or at the patient’s home during a telephone conversation. Speech analysis is a simple, low-cost, non-invasive and easy-toprovide method of medical diagnosis. These are remarkable advantages, but there are also disadvantages. The effectiveness of disease diagnoses varies from 65% up to 99%. For that reason it should be treated as a medical screening test and should be an indication of the need for classic medical tests.
Źródło:
Archives of Acoustics; 2023, 48, 3; 289-315
0137-5075
Pojawia się w:
Archives of Acoustics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Audio-Visual Speech Processing System for Polish Applicable to Human-Computer Interaction
Autorzy:
Jadczyk, T.
Powiązania:
https://bibliotekanauki.pl/articles/305828.pdf
Data publikacji:
2018
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
audio-visual speech recognition
visual features extraction
human-computer interaction
Opis:
This paper describes audio-visual speech recognition system for Polish language and a set of performance tests under various acoustic conditions. We first present the overall structure of AVASR systems with three main areas: audio features extraction, visual features extraction and subsequently, audiovisual speech integration. We present MFCC features for audio stream with standard HMM modeling technique, then we describe appearance and shape based visual features. Subsequently we present two feature integration techniques, feature concatenation and model fusion. We also discuss the results of a set of experiments conducted to select best system setup for Polish, under noisy audio conditions. Experiments are simulating human-computer interaction in computer control case with voice commands in difficult audio environments. With Active Appearance Model (AAM) and multistream Hidden Markov Model (HMM) we can improve system accuracy by reducing Word Error Rate for more than 30%, comparing to audio-only speech recognition, when Signal-to-Noise Ratio goes down to 0dB.
Źródło:
Computer Science; 2018, 19 (1); 41-63
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Parametric analysis of pilot voice signals in Parkinson’s disease diagnostics
Analiza parametryczna pilotażowych sygnałów głosu w diagnostyce choroby Parkinsona
Autorzy:
Majda-Zdancewicz, Ewelina
Potulska-Chromik, Anna
Nojszewska, Monika
Kostera-Pruszczyk, Anna
Powiązania:
https://bibliotekanauki.pl/articles/2176245.pdf
Data publikacji:
2022
Wydawca:
Uniwersytet Technologiczno-Humanistyczny im. Kazimierza Pułaskiego w Radomiu
Tematy:
features extraction
speech signal analysis
Parkinson's disease
analiza sygnału mowy
choroba Parkinsona
ekstrakcja cech
Opis:
Parkinson's disease (PD) is a neurodegenerative disease of the central nervous system (CNS) characterized by the progressive loss of dopaminergic neurons in the substantia nigra. The article describes an analysis of pilot voice signal analysis in Parkinson's disease diagnostics. Frequency domain signal analysis was mainly used to assess the state of a patient's voice apparatus in order to support PD diagnostics. The recordings covered uttering the “a” sound at least twice with extended phonation. The research utilized real recordings acquired in the Department of Neurology at the Medical University of Warsaw, Poland. Spectral speech signal coefficients may be determined based on different defined frequency scales. The authors used four frequency scales: linear, Mel, Bark and ERB . Spectral descriptors have been defined for each scales which are widely used in machine and deep learning applications, and perceptual analysis. The usefulness of extracted features was assessed taking into account various methods. The discriminatory ability of individual coefficients was evaluated using the Fisher coefficient and LDA technique.. The results of numerical experiments have shown different efficiencies of the proposed descriptors using different frequencies scales.
Choroba Parkinsona (PD) jest neurodegeneracyjną chorobą ośrodkowego układu nerwowego charakteryzującą się postępującą utratą neuronów dopaminergicznych w istocie czarnej. W artykule opisano analizę rejestracji pilotażowych sygnałów głosu w diagnostyce choroby Parkinsona. Rejestracji podlegało co najmniej dwukrotnie wypowiadanie głoski „a” o przedłużonej fonacji. Do badań wykorzystano nagrania zarejestrowane w Katedrze i Klinice Neurologii Warszawskiego Uniwersytetu Medycznego w Warszawie. Do oceny stanu aparatu głosu pacjenta celem wsparcia diagnostyki choroby Parkinsona wykorzystano w głównej mierze analizę sygnału w dziedzinie częstotliwości. Autorzy zastosowali cztery skale częstości: liniową, skalę typu Mel, skalę typu Bark oraz skalę typu ERB. Dla każdej z tych skali zdefiniowali deskryptory spektralne szeroko stosowane w aplikacjach uczenia maszynowego i głębokiego uczenia się oraz w analizie percepcyjnej. Ocena przydatności wyekstrahowanych cech została zrealizowana z uwzględnieniem różnych metod. Wykorzystano metodą oceny jakości cech przy użyciu współczynnika istotności Fischera oraz analizę LDA. Wyniki eksperymentów numerycznych wykazały różne wydajności proponowanych deskryptorów przy użyciu różnych skal częstości.
Źródło:
Journal of Automation, Electronics and Electrical Engineering; 2022, 4, 1; 21--28
2658-2058
2719-2954
Pojawia się w:
Journal of Automation, Electronics and Electrical Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Cepstral analysis of vowels of esophageal speakers
Analiza cepstralna samogłosek mówców mowy przełykowej
Autorzy:
Mięsikowska, M.
Radziszewski, L.
Powiązania:
https://bibliotekanauki.pl/articles/152112.pdf
Data publikacji:
2012
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
sygnał mowy normalnej i przełykowej
współczynniki cepstralne
analiza dyskryminacyjna
rozpoznawanie samogłosek
normal speech
esophageal speech
cepstral features
discriminant analysis
vowels recognition
Opis:
The aim of this study was to compare normal (NL) and esophageal (ES) speech signals in scope of vowels in order to show differences between signals. A discriminant analysis based on cepstral features extracted from vowels of NL and ES speech was performed. The comparison was made on the basis of the classification function coefficients and the results of the classification for each speech. Vowels recordings were acquired from 10 NL speakers and 10 ES speakers. The discriminant analysis was based on cepstral features extracted from vowel recordings, and was performed separately for NL speech and ES speech. Then a comparison between coefficients of classification functions of NL and ES vowels using the Euclidean distance was made. Based on the resulting classification matrix of NL and ES speech, the results of classification were compared. The discriminant analysis based on cepstral features showed 76% of the mean classification score for ES speech and 90% for NL speech. The Euclidean distance showed low differences between the vowel /a/ of NL speech and the vowel /a/ of ES speech and between the vowel /e/ of NL speech and the vowel /e/ of ES speech.
Celem pracy było porównanie sygnału mowy normalnej (NL) i przełykowej (ES) w zakresie samogłosek w celu wykazania różnic pomiędzy sygnałami. Przeprowadzono analizę dyskryminacyjną współczynników cepstralnych uzyskanych z samogłosek mowy NL i ES. Porównania dokonano na podstawie uzyskanych współczynników funkcji klasyfikacyjnych oraz otrzymanych wyników klasyfikacji dla każdej mowy. Sygnał mowy każdej samogłoski pozyskany został od 10 mówców mowy NL i 10 mówców mowy ES. Analizę dyskryminacyjną przeprowadzono w oparciu o współczynniki cepstralne oddzielnie dla mowy NL i mowy ES. Następnie dokonano porównania uzyskanych współczynników funkcji klasyfikacyjnych samogłosek mowy NL i mowy ES, wykorzystując do tego celu odległość Euklidesa. Na podstawie macierzy klasyfikacji otrzymanej dla mowy NL i ES porównano rezultaty klasyfikacji. Analiza dyskryminacyjna w oparciu o współczynniki cepstralne wykazała 76% jako średni wynik klasyfikacji dla mowy ES, natomiast 90% dla mowy NL. Odległość Euklidesa wskazuje na najmniejsze różnice w zakresie samogłoski /a/ i /e/ mowy NL i ES.
Źródło:
Pomiary Automatyka Kontrola; 2012, R. 58, nr 11, 11; 968-971
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Discriminant analysis of vowels of tracheoesophageal speakers
Analiza dyskryminacyjna samogłosek mówców mowy przetokowej
Autorzy:
Mięsikowska, M.
Radziszewski, L.
Powiązania:
https://bibliotekanauki.pl/articles/155972.pdf
Data publikacji:
2013
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
normal speech
tracheoesophageal speech
cepstral features
discriminant analysis
vowels recognition
sygnał mowy normalnej i przetokowej
współczynniki cepstralne
analiza dyskryminacyjna
rozpoznawanie samogłosek
Opis:
The aim of this study was to compare normal (NL) and tracheoesophageal (TE) vowel speech signals in order to show differences between them. Cepstral features extracted from vowels of NL and TE speech were analyzed using discriminant analysis. The comparison was made on the basis of the classification function coefficients and the results of the classification for each speech. Vowels recordings were acquired from 10 NL speakers and 12 TE speakers. Discriminant analysis was based on cepstral features extracted from vowel recordings, and was performed separately for NL speech and TE speech. Then a comparison between the coefficients of classification functions of NL and TE vowels using the Euclidean distance was made. Based on the resulting classification matrix of NL and TE speech, the results of classification were compared. The discriminant analysis based on cepstral features showed 79% of the mean classification score for TE speech. The Euclidean distance showed low differences between vowel /a/ of NL speech and vowel /a/ of TE speech and between vowel /o/ of NL speech and vowel /o/ of TE speech.
Celem pracy było porównanie sygnału mowy przetokowej (TE) do mowy normalnej (NL) w zakresie samogłosek, aby wykazać różnice pomiędzy sygnałami. Współczynniki cepstralne uzyskane z samogłosek mowy NL i TE poddano analizie dyskryminacyjnej. Na podstawie uzyskanych współczynników funkcji klasyfikacyjnych oraz otrzymanych wyników klasyfikacji dokonano porównania sygnałów mowy NL i TE. Nagrania samogłosek pozyskane zostały od 10 mówców mowy NL i 12 mówców mowy TE. Analizę dyskryminacyjną przeprowadzono w oparciu o współczynniki cepstralne oddzielnie dla mowy NL i mowy TE. Następnie dokonano porównania uzyskanych współczynników funkcji klasyfikacyjnych samogłosek mowy NL i mowy TE, wykorzystując do tego celu odległość Euklidesa. Na podstawie macierzy klasyfikacji otrzymanej dla mowy NL i TE porównano rezultaty klasyfikacji. Analiza dyskryminacyjna w oparciu o współczynniki cepstralne wykazała 79% jako średni wynik klasyfikacji dla mowy TE. Odległość Euklidesa wskazuje na najmniejsze różnice w zakresie samogłoski /a/ i /o/ mowy NL i TE.
Źródło:
Pomiary Automatyka Kontrola; 2013, R. 59, nr 6, 6; 523-525
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Sprachliche Besonderheiten der modernen deutschsprachigen E-Mail-Kommunikation
The Linguistic Properties of Modern German-Speaking E-mail-Communication
Autorzy:
Gorpennikova, Julija
Powiązania:
https://bibliotekanauki.pl/articles/458842.pdf
Data publikacji:
2019
Wydawca:
Uniwersytet Wrocławski. Oficyna Wydawnicza ATUT – Wrocławskie Wydawnictwo Oświatowe
Tematy:
Sprechakt
Entschuldigung
Linguokultur
sprachliche Besonderheiten
Geschäftskommunikation
speech act
apology
linguistic culture
linguistic features
business communication
Opis:
Der Beitrag zielt darauf ab, die Formen der Entschuldigung in der deutschen Sprachkultur zu analysieren. Es werden Definitionen der Entschuldigung in deutscher Sprache geprüft. Wir untersuchen die sprachlichen Eigenschaften der Entschuldigung und geben ihr Diapason. Die am häufigsten verwendeten Beispiele für Entschuldigungen werden in der Studie angegeben. Die Nutzungsstatik von Entschuldigung und Verzeihung wird dort zur Verfügung gestellt; überdies wird die Verwendung der Entschuldigung in der deutschen Sprachkultur erklärt.
The article aims at learning the apology in the German linguoculture. The definitions of the apology in the German language are examined there. We study the linguistic properties of the apology and give their diapason. The commonly used examples of apologies are given in the article. The usage static of Entschuldigung and Verzeihung is provided there; the usage of the apology in the German linguoculture is explained in the article.
Źródło:
Linguistische Treffen in Wrocław; 2019, 15; 81-88
2084-3062
2657-5647
Pojawia się w:
Linguistische Treffen in Wrocław
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Behavioral features of the speech signal as part of improving the effectiveness of the automatic speaker recognition system
Autorzy:
Mały, Dominik
Dobrowolski, Andrzej
Powiązania:
https://bibliotekanauki.pl/articles/27323689.pdf
Data publikacji:
2023
Wydawca:
Centrum Rzeczoznawstwa Budowlanego Sp. z o.o.
Tematy:
automatic speaker recognition
automatic speaker recognition systems
physical features
behavioral features
speech signal
automatyczne rozpoznawanie mówiącego
sygnał mowy
system automatycznego rozpoznawania mówiącego
cecha behawioralna
cecha fizyczna
Opis:
The current reality is saturated with intelligent telecommunications solutions, and automatic speaker recognition systems are an integral part of many of them. They are widely used in sectors such as banking, telecommunications and forensics. The ease of performing automatic analysis and efficient extraction of the distinctive characteristics of the human voice makes it possible to identify, verify, as well as authorize the speaker under investigation. Currently, the vast majority of solutions in the field of speaker recognition systems are based on the distinctive features resulting from the structure of the speaker's vocal tract (laryngeal sound analysis), called physical features of the voice. Despite the high efficiency of such systems - oscillating at more than 95% - their further development is already very difficult, due to the fact that the possibilities of distinctive physical features have been exhausted. Further opportunities to increase the effectiveness of ASR systems based on physical features appear after additional consideration of the behavioral features of the speech signal in the system, which is the subject of this article.
Źródło:
Inżynieria Bezpieczeństwa Obiektów Antropogenicznych; 2023, 4; 26--34
2450-1859
2450-8721
Pojawia się w:
Inżynieria Bezpieczeństwa Obiektów Antropogenicznych
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Classification of cardiovascular diseases using dysphonia measurement in speech
Autorzy:
Bourouhou, Abdelhamid
Jilbab, Abdelilah
Nacir, Chafik
Hammouch, Ahmed
Powiązania:
https://bibliotekanauki.pl/articles/1840881.pdf
Data publikacji:
2021
Wydawca:
Polska Akademia Nauk. Polskie Towarzystwo Diagnostyki Technicznej PAN
Tematy:
cardiovascular disease
speech analysis
dysphonia measurement
classification methods
PCA features selection
choroba układu krążenia
analiza mowy
dysfonia
pomiar
metody klasyfikacji
selekcja cech
Opis:
Cardiovascular disease is the leading cause of death worldwide. The diagnosis is made by non-invasive methods, but it is far from being comfortable, rapid, and accessible to everyone. Speech analysis is an emerging non-invasive diagnostic tool, and a lot of researches have shown that it is efficient in speech recognition and in detecting Parkinson's disease, so can it be effective for differentiating between patients with cardiovascular disease and healthy people? This present work answers the question posed, by collecting a database of 75 people, 35 of whom suffering from cardiovascular diseases, and 40 are healthy. We took from each one three vocal recordings of sustained vowels (aaaaa…, ooooo… .. and iiiiiiii… ..). By measuring dysphonia in speech, we were able to extract 26 features, with which we will train three types of classifiers: the k-near-neighbor, the support vectors machine classifier, and the naive Bayes classifier. The methods were tested for accuracy and stability, and we obtained 81% accuracy as the best result using the k-near-neighbor classifier.
Źródło:
Diagnostyka; 2021, 22, 1; 31-37
1641-6414
2449-5220
Pojawia się w:
Diagnostyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Diagnostic significance of phase spectrum in acoustic analysis of pathological voice
Diagnostyczne znaczenie widma fazowego w analizie akustycznej głosu patologicznego
Autorzy:
Samborska-Owczarek, A.
Powiązania:
https://bibliotekanauki.pl/articles/153586.pdf
Data publikacji:
2010
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
analiza akustyczna
sygnał mowy
przetwarzanie mowy
częstotliwość podstawowa
widmo fazowe
ekstrakcja cech
GIRBAS
acoustic analysis
voice signal
speech processing
fundamental frequency
F0
phase spectrum
features extraction
Opis:
The paper regards the possibility of using new numerical features extracted from the phase spectrum of a speech signal for voice quality estimation in acoustic analysis for medical purposes. This novel approach does not require detection or estimation of the fundamental frequency and works on all types of speech signal: euphonic, dysphonic and aphonic as well. The experiment results presented in the paper are very promising: the developed F0-independant voice features are strongly correlated with two voice quality indicators: grade of hoarseness G (r>0.8) and roughness R (r>0.75) from GIRBAS scale, and exceed the standard voice parameters: jitter and shimmer.
Artykuł dotyczy możliwości ekstrakcji cech numerycznych z widma fazowego sygnału mowy w celu wykorzystania w analizie akustycznej na potrzeby medyczne. Podejście to umożliwia uzależnienie analizy akustycznej od zawodnych metod wykrywania/wyznaczania częstotliwości podstawowej (tonu krtaniowego) i dzięki temu przeznaczone jest do badania wszystkich typów sygnału mowy (również afonicznych). Wyniki eksperymentu są bardzo obiecujące - proponowane cechy Ph1 i Ph2 są silnie skorelowane z dwoma kategoriami percepcyjnymi: stopniem chrypki (r>0.8) oraz szorstkością głosu (r>0.75) ze skali GIRBAS, wykazując silniejsze znaczenie diagnostyczne niż znane i stosowane od dawna wskaźniki jitter i shimmer. Proponowane podejście oprócz skuteczności charakteryzuje się szeregiem dodatkowych korzyści: algorytm metody z powodu niskiej złożoności jest szybki i niekosztowny, interpretacja matematyczna jest prosta i jednoznaczna oraz spójna z obserwowanym obrazem widma fazowego głosu. Ponadto uniezależnienie od detekcji częstotliwości podstawowej sprawia, że algorytm jest deterministyczny oraz efektywny dla każdego typu sygnału mowy.
Źródło:
Pomiary Automatyka Kontrola; 2010, R. 56, nr 12, 12; 1547-1550
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-9 z 9

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies