Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "spectrogram analysis" wg kryterium: Temat


Wyświetlanie 1-6 z 6
Tytuł:
Estimation and tracking of fundamental, 2nd and 3d harmonic frequencies for spectrogram normalization in speech recognition
Autorzy:
Fujimoto, K.
Hamada, N.
Kasprzak, W.
Powiązania:
https://bibliotekanauki.pl/articles/201105.pdf
Data publikacji:
2012
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
automatic speech recognition
spectrogram analysis
particle filter
pitch estimation
Opis:
A stable and accurate estimation of the fundamental frequency (pitch, F0) is an important requirement in speech and music signal analysis, in tasks like automatic speech recognition and extraction of target signal in noisy environment. In this paper, we propose a pitch-related spectrogram normalization scheme to improve the speaker – independency of standard speech features. A very accurate estimation of the fundamental frequency is a must. Hence, we develop a non-parametric recursive estimation method of F0 and its 2nd and 3d harmonic frequencies in noisy circumstances. The proposed method is different from typical Kalman and particle filter methods in the way that no particular sum of sinusoidal model is used. Also we tend to estimate F0 and its lower harmonics by using novel likelihood function. Through experiments under various noise levels, the proposed method is proved to be more accurate than other conventional methods. The spectrogram normalization scheme makes a mapping of real harmonic structure to a normalized structure. Results obtained for voiced phonemes show an increase in stability of the standard speech features – the average within-phoneme distance of the MFCC features for voiced phonemes can be decreased by several percent.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2012, 60, 1; 71-81
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Amplitude and Frequency Modulation in Speaker Recognition Systems
Autorzy:
Ciota, Z.
Powiązania:
https://bibliotekanauki.pl/articles/397977.pdf
Data publikacji:
2012
Wydawca:
Politechnika Łódzka. Wydział Mikroelektroniki i Informatyki
Tematy:
modulacja AM-FM
filtr Gabora
transformata Hilberta
biometryka głosu
spektrogram
przetwarzanie mowy
AM-FM modulation
Gabor filters
Hilbert transform
speaker recognition system
spectrogram analysis
speech processing
Opis:
The paper presents a review of the nowadays methods of voice vector extraction, applied in such speech processing, like person identification and emotion recognition. A special attention was held on mixed time-frequency analysis based on temporary frequency approach. The methods of calculation of time - frequency voice characterization were also described. The most important building blocks of identification and recognition of speakers have been presented. The characterization of feature vectors suitable for identification and verification in microcomputer systems was described. Components and appropriate method of speech identification based on the long-term spectra vectors were discussed.
Źródło:
International Journal of Microelectronics and Computer Science; 2012, 3, 2; 41-44
2080-8755
2353-9607
Pojawia się w:
International Journal of Microelectronics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza porównawcza jakości zarejestrowanego dźwięku w funkcji różnych formatów zapisu
Comparative analysis of the quality of recorded sound in the function of different recording formats
Autorzy:
Król, Andrzej
Szymczyk, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/24083340.pdf
Data publikacji:
2022
Wydawca:
Politechnika Lubelska. Instytut Informatyki
Tematy:
spektrogram
jakość kompresji
analiza porównawcza
spectrogram
compression quality
comparative analysis
Opis:
W artykule przeanalizowano jakość koderów: mp3, AAC, wma i OGG Vorbis. Do przeprowadzenia badania ilościo-wego wykorzystano autorską metodę graficzną. Polega ona na porównaniu liczby pikseli (reprezentujących dane) po-między spektrogramem pliku wav, a spektrogramami plików skompresowanych różnymi kodekami i przepływnościami. Wykazano, iż najwięcej danych z nieskompresowanej próbki wav zachowuje koder Ogg Vorbis we wszystkich bada-nych przepływnościach (128KBit/s, 160KBit/s, 320KBit/s).
In article, the quality of the following encoders was analyzed: mp3, AAC, wma and OGG Vorbis. An original graphic method was used to carry out the quantitative research. It consists in comparing the number of pixels (representing data) between the spectrogram of a wav file and the spectrograms of files compressed with different codecs and bit rates. It has been shown that the Ogg Vorbis encoder retains the most data from the uncompressed wav sample in all tested bit rates (128KBit/s, 160KBit/s, 320KBit/s).
Źródło:
Journal of Computer Sciences Institute; 2022, 24; 189--194
2544-0764
Pojawia się w:
Journal of Computer Sciences Institute
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Perception of Mixture of Musical Instruments with Spectral Overlap Removed
Autorzy:
Kleczkowski, P.
Powiązania:
https://bibliotekanauki.pl/articles/176638.pdf
Data publikacji:
2012
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
sound segregation
spectral overlap
spectrogram
auditory scene analysis
time-frequency mask
multiple looks
glimpses
Opis:
The issue of auditory segregation of simultaneous sound sources has been addressed in speech research but was given less attention in musical acoustics. In perception of concurrent speech, or speech with noise, the operation of time-frequency masking was often used as a research tool. In this work, an ex- tension of time-frequency masking, leading to the removal of spectro-temporal overlap between sound sources, was applied to musical instruments playing together. The perception of the original mixture was compared with the perception of the same mixture with all spectral overlap electronically removed. Ex- periments differed in the method of listening (headphones or a loudspeaker), sets of instruments mixed, and populations of participants. The main findings were: (i) in one of the experimental conditions the re- moval of spectro-temporal overlap was imperceptible, (ii) perception of the effect increased when removal of spectro-temporal overlap was performed in larger time-frequency regions rather than in small ones, (iii) perception of the effect decreased in loudspeaker listening. The results support both the multiple looks hypothesis and the "glimpsing" hypothesis known from speech perception.
Źródło:
Archives of Acoustics; 2012, 37, 3; 355-363
0137-5075
Pojawia się w:
Archives of Acoustics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analysis of measurement conditions influence on the magnetic Barkhausen noise phenomenon
Analiza wpływu warunków pomiarowych na przebieg zjawiska magnetycznego szumu Barkhausena
Autorzy:
Maciusowicz, Michał
Psuj, Grzegorz
Powiązania:
https://bibliotekanauki.pl/articles/115155.pdf
Data publikacji:
2019
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
szum Barkhausena
metoda nieniszcząca
warunki pomiaru
analiza czasowo-częstotliwościowa
spektrogram
skalogram
Barkhausen noise
non-destructive method
measurement conditions
time-frequency analysis
spectrogram
scalogram
Opis:
The effectiveness of the magnetic Barkhausen noise method (MBN), used for non-destructive testing of ferromagnetic materials, depends to a large extent on a number of factors determining the measurement conditions. The use of conditions allowing the highest possible level of discrimination between the various states of the materials state is of highest importance. Therefore, this paper presents an analysis of the impact of measurement conditions on Barkhausen noise signals observed for various states of the material conditions. Taking into consideration the stochastic nature of MBN and the complex characterization of its changes, the analysis was based on the time-frequency representation of the MBN signal. The paper presents selected distributions achieved using two transformation methods. In addition, the extraction methods of features allowing the quantification of complex information were given. Finally, the discrimination ability for a number of parameters and features of MBN signals were determined and the obtained results were discussed.
Skuteczność metody magnetycznego szumu Barkhausena MBN (ang. Magnetic Barkhausen Noise), wykorzystywanej do badań nieniszczących materiałów ferromagnetycznych, zależy w dużej mierze od szeregu czynników określających warunki pomiarowe. Kluczowe znaczenie ma zastosowanie warunków umożliwiających najwyższy możliwy poziom dyskryminacji między różnymi stanami badanych materiałów. W związku z tym w niniejszej pracy przedstawiono analizę wpływu warunków pomiaru na sygnały szumu Barkhausena rejestrowane dla różnych stanów badanego materiału. Mając na uwadze stochastyczną naturę szumu MBN i złożoną charakterystykę jego zmian, analizę przeprowadzono na podstawie reprezentacji czasowo-częstotliwościowej sygnału MBN. W pracy zaprezentowano wybrane rozkłady z zastosowaniem dwóch metod transformacji. Ponadto przybliżono metody ekstrakcji cech umożliwiające kwantyfikację złożonej informacji. Na koniec określono poziomy rozróżnialności dla szeregu parametrów i cech sygnałów MBN oraz omówiono uzyskane wyniki.
Źródło:
Welding Technology Review; 2019, 91, 12; 17-24
0033-2364
2449-7959
Pojawia się w:
Welding Technology Review
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Advanced time-frequency representation in voice signal analysis
Autorzy:
Mika, Dariusz
Józwik, Jerzy
Powiązania:
https://bibliotekanauki.pl/articles/102330.pdf
Data publikacji:
2018
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
signal analysis
spectrogram
time-frequency analysis
time-frequency representation
Cohen’s class
Wigner-Ville distribution
analiza sygnału
spektrogram
analiza czasu
analiza częstotliwości
reprezentacja czasu i częstotliwości
klasa Cohena
rozkład Wignera-Ville'a
Opis:
The most commonly used time-frequency representation of the analysis in voice signal is spectrogram. This representation belongs in general to Cohen’s class, the class of time-frequency energy distributions. From the standpoint of properties of the resolution, spectrogram representation is not optimal. In Cohen class representations are known which have a better resolution properties. All of them are created by smoothing the Wigner-Ville’a distribution characterized by the best resolution, however, the biggest harmful interference. The used smoothing functions decide about a compromise between the properties of resolution and eliminating harmful interference term. Another class of time-frequency energy distributions is the affine class of distributions. From the point of view of readability of analysis of the best properties are known so called Redistribution of energy caused by the use of a general methodology referred to as reassignment to any time-frequency representation. Reassigned distributions efficiently combine a reduction of the interference terms provided by a well adapted smoothing kernel and an increased concentration of the signal components.
Źródło:
Advances in Science and Technology. Research Journal; 2018, 12, 1; 251-259
2299-8624
Pojawia się w:
Advances in Science and Technology. Research Journal
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-6 z 6

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies