Temat: synteza mowy - Katalog OPAC zbiorów

Skocz do pozycji: 1.

Tytuł:: Syntetyzer mowy uwzględniający prozodię wypowiedzi
Text-to-speech synthesizer employing automatic prosodic modification
Autorzy:: Łopatka, K.
Czyżewski, A.
Powiązania:: https://bibliotekanauki.pl/articles/266714.pdf
Data publikacji:: 2010
Wydawca:: Politechnika Gdańska. Wydział Elektrotechniki i Automatyki
Tematy:: synteza mowy
prozodia
PSOLA
speech synthesis
prosody
Opis:: Przedstawiono system syntezy mowy polskiej uwzględniający w sposób automatyczny prozodię, tj. profil intonacyjny, tempo i akcenty wypowiedzi. Zastosowano syntezę konkatenacyjną z wykorzystaniem jednostek mowy zawierających przejścia między dwoma głoskami – difonów. Opisano poszczególne moduły wchodzące w skład syntetyzera: przetwarzanie tekstu, bazę jednostek mowy oraz algorytmy związane z tworzeniem syntetyzowanego sygnału. Przeprowadzono testy subiektywne potwierdzające wysoką zrozumiałość generowanej mowy i skuteczność modyfikacji prozodycznych. Przedstawiono możliwość zastosowania opisanego systemu w aplikacjach edukacyjnych lub terapeutycznych oraz interfejsach multimodalnych przeznaczonych dla osób niepełnosprawnych.
The paper presents a Text-To-Speech synthesizer of Polish language employing automatic prosodic modification. The method used for synthesizing the speech signal is concatenative synthesis using constant-length segments – diphones. The subsequent modules of the synthesizer are introduced. Employed language analysis and signal processing techniques are described. The synthesized speech yields high intelligibility and naturalness, which is proved by auditory tests. The proposed system can be used in educational and therapeutic applications or multimodal interfaces for disabled people.
Źródło:: Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej; 2010, 28; 105-108
1425-5766
2353-1290
Pojawia się w:: Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 2.

Tytuł:: Extending Visual Speech Synthesis for Polish with basic emotion model
Autorzy:: Bloch, J.
Powiązania:: https://bibliotekanauki.pl/articles/115798.pdf
Data publikacji:: 2013
Wydawca:: Fundacja na Rzecz Młodych Naukowców
Tematy:: Visual Speech Synthesis
emotion
Xface
Ekman
wizualna synteza mowy
emocje
Opis:: Expressing emotions is a very important feature of Visual Speech Synthesis systems. In 1972 the first “basic emotions” list was introduced, by Paul Ekman. Since then few different classifications were published. Most famous “basic emotion” models are briefly described in this paper. In previous publication new Visual Speech Synthesis system for Polish was presented. The system was based on Xface toolkit and “Karol” face model. The aim of this paper is to add “basic emotion” model, according to Paul Ekman’s classification, into “Karol” face model. To achieve this goal new emotional keyframes were proposed. This new functionality of “Karol” face model, allows to generate talking human face animations, which express emotions. The subjective test of new functionality are also included in the paper. The results showed that more information about speakers emotions is read from human face expression than form human speech signal. People can more easily recognize speakers emotion when they see his face expression.
Źródło:: Challenges of Modern Technology; 2013, 4, 2; 19-22
2082-2863
2353-4419
Pojawia się w:: Challenges of Modern Technology
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 3.

Tytuł:: System dialogowy języka mówionego : przegląd problemów
Spoken language dialogue system
Autorzy:: Wiśniewski, A. M.
Powiązania:: https://bibliotekanauki.pl/articles/273236.pdf
Data publikacji:: 2007
Wydawca:: Wojskowa Akademia Techniczna im. Jarosława Dąbrowskiego
Tematy:: system dialogowy
rozpoznawanie mowy
rozumienie mowy
synteza mowy
dialogue system
speech recognition
speech understanding
speech synthesis
Opis:: Przedstawiono strukturę systemu dialogowego języka mówionego. Scharakteryzowano pożądane własności składników funkcjonalnych systemu: urządzenia rozpoznawania mowy, procesora językowego, sterownika (menedżera) dialogu i syntezatora mowy. Scharakteryzowano przykładowe realizacje systemów dialogowych języka mówionego.
In this paper, the structure of a spoken language dialogue system was described. The underlying human language technologies were described: automatic speech recognizer, natural language understanding, dialogue manager, and speech synthesizer. The recent progress in spoken dialogue systems and some of the ongoing research challenges were presented.
Źródło:: Biuletyn Instytutu Automatyki i Robotyki; 2007, R. 13, nr 24, 24; 97-122
1427-3578
Pojawia się w:: Biuletyn Instytutu Automatyki i Robotyki
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 4.

Tytuł:: Design of text to speach synthesis system based on the harmonic and noise model
Koncepcja układu syntezy mowy z tekstu opartego na modelu harmoniczne i szum
Autorzy:: Sawicki, A.
Zubrycki, P.
Petrovsky, A.
Powiązania:: https://bibliotekanauki.pl/articles/341087.pdf
Data publikacji:: 2009
Wydawca:: Politechnika Białostocka. Oficyna Wydawnicza Politechniki Białostockiej
Tematy:: synteza mowy
model harmoniczne i szum
speech synthesis
TTS
harmonic and noise model
Opis:: This is a proposal of concatenative text to speech synthesizer for the Polish language, based on diphones and ”Harmonics and Noise Model”(HNM). HNM has been successfully applied on a speech encoder and decoder, resulting in a high-quality of processed speech at low bit rate. Applying this model to speech synthesis system allows obtaining good quality of synthesized speech, and the small size of database parameters. The proposed project consists of two main modules. The Natural Language Processing (NLP) is used to analyse and convert the written text for phonemes and diphones using morphological rules. NLP discovers at the same time prosodic features for later modification of synthesized speech parameters in order to obtain the stress and voice intonation. The second section is a synthesis system, derived from speech decoder, preceded by a system of adapting the parameters of speech based on prosodic rules. The system of speech synthesis from the parameters is working in the frequency domain and uses the frequency spectrum envelope, which easily allows modifying the frequency, amplitude and duration of the signal when applying the prosodic rules. The algorithm of continuous phase designation at the speech frame borders allows concatenating portions of synthesized speech and diphones without phase distortion on the merger. Speech synthesizer operates on the diphone database, created applying fragmentation of recorded speech signal representing the pairs of phonemes. Sounds related to diphones are analyzed by speech encoder. It provides the parameters that described harmonic and noise components of speech, using the linear prediction filter LSF coefficients, resulting in a small size of diphone database.
Artykuł przedstawia projekt konkatenacyjnego syntezatora mowy z tekstu dla języka polskiego, opartego na difonach i modelu Harmoniczne i Szum. Model Harmoniczne i Szum został z powodzeniem zastosowany w układzie kodera i dekodera mowy, dając w rezultacie dobrą jakość przetwarzanej mowy przy niskiej przepływności bitowej. Zastosowanie tego modelu do układu syntezy mowy pozwala na uzyskanie dobrej jako sci syntezowanej mowy, oraz niewielki rozmiar bazy parametrów. Układ składa się z dwóch głównych modułów. Moduł Naturalnego Przetwarzania Języka służy do analizy i zamiany tekstu pisanego na fonemy oraz difony, przy wykorzystaniu reguł morfologicznych. Procesor tekstu wyznacza jednocześnie warunki prozodii związane z późniejszą modyfikacją parametrów syntezowanego głosu w celu uzyskania akcentowania i intonacji. Drugim układem jest moduł syntezy, oparty na dekoderze mowy poprzedzonym systemem adaptacji parametrów mowy w oparciu o wyznaczone wcześniej reguły prozodyczne. Układ syntezy mowy z parametrw działa w dziedzinie czstotliwości i bazuje na obwiedni spektrum, co w prosty sposób pozwala na modyfikację czstotliwości, amplitudy i czasu trwania sygnału przy stosowaniu reguł prozodycznych. Algorytm wyznaczania ciągłej fazy na granicach ramek sygnału mowy pozwala na łączenie fragmentów syntezowanej mowy oraz poszczególnych difonów bez zniekształceń fazowych na połączeniu. Syntezator mowy operuje na bazie difonów, stworzonej na podstawie fragmentaryzacji nagranego sygnału mowy na części, reprezentujące połączenia par fonemów. Dźwięki odpowiadające difonom są analizowane przez moduł analizy mowy. Dostarcza on ciąg parametrów reprezentujących harmoniczne i szumowe komponenty sygnału mowy, opisane za pomocą filtrów liniowej predykcji i współczynników LSF, dając w rezultacie niewielkiej wielkości baze difonów.
Źródło:: Zeszyty Naukowe Politechniki Białostockiej. Informatyka; 2009, 4; 111-125
1644-0331
Pojawia się w:: Zeszyty Naukowe Politechniki Białostockiej. Informatyka
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 5.

Tytuł:: Analiza algorytmów syntezy mowy na potrzeby zastosowania w urządzeniu przenośnym
Analysis of Speech Synthesis Algorithms for the Purposes of Deployment in Embeddeddevice
Autorzy:: ZACNIEWSKI, ARTUR
KLEINSZMIDT, MARCIN
ZDUNEK, RADOSŁAW
ZACNIEWSKA, JOANNA
Powiązania:: https://bibliotekanauki.pl/articles/457384.pdf
Data publikacji:: 2018
Wydawca:: Uniwersytet Rzeszowski
Tematy:: synteza mowy
wspomaganie osób z dysfunkcją wzroku
ToucanEye
speech synthesis
assisting persons with impaired sight
Opis:: W artykule pokazano kolejne etapy występujące w syntezie mowy, a także sposoby postępo-wania z poszczególnymi fragmentami tekstu, który ma zostać przetworzony na mowę. Przedsta-wiono wyniki badań wydajności algorytmów normalizacji treści, realizowanych na potrzeby pro-jektu ToucanEye – urządzenia przenośnego z systemem sztucznej inteligencji, mającego wspomóc osoby z dysfunkcją wzroku. Pokazano, jak istotne jest dobranie i optymalizacja zastosowanych algorytmów ze strony implementacyjnej, po to by zwiększyć komfort użytkownika końcowego.
The article presents consecutivestages of speech synthesis and also ways of dealing with par-ticular fragments of text are shown. The article also presents results of performance measurement for text content normalization algorithms, developed for the Toucan Eye project – embedded device with artificial intelligence system able to help people with impaired sight. It was shown how essential is choice and optimization of applied algorithmsfrom implementation side to in-crease comfort of end-user.
Źródło:: Edukacja-Technika-Informatyka; 2018, 9, 1; 35-42
2080-9069
Pojawia się w:: Edukacja-Technika-Informatyka
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 6.

Tytuł:: Zastosowanie algorytmów normalizacji tekstu na potrzeby syntezy mowy w urządzeniach przenośnych
Analysis of speech synthesis algorithms for the purposes of deployment in embedded device
Autorzy:: Zacniewski, A.
Kleinszmidt, M.
Powiązania:: https://bibliotekanauki.pl/articles/208895.pdf
Data publikacji:: 2018
Wydawca:: Wojskowa Akademia Techniczna im. Jarosława Dąbrowskiego
Tematy:: synteza mowy
wspomaganie osób z dysfunkcją wzroku
Toucan Eye
speech synthesis
assisting persons with impaired sight
Opis:: W artykule pokazano kolejne etapy występujące w syntezie mowy, a także sposoby postępowania z poszczególnymi fragmentami tekstu, który ma zostać przetworzony na mowę. Przedstawiono wyniki badań wydajności algorytmów normalizacji treści realizowanych na potrzeby projektu Toucan Eye - urządzenia przenośnego z systemem sztucznej inteligencji, mającego wspomóc osoby z dysfunkcją wzroku. Pokazano, jak istotne są dobranie i optymalizacja zastosowanych algorytmów ze strony implementacyjnej, po to by zwiększyć komfort użytkownika końcowego.
The article presents consecutive stages of speech synthesis and also the ways of dealing with particular fragments of a text. The results of performance measurement for the text content normalization algorithms are shown. These algorithms were developed for the Toucan Eye project – an embedded device with an artificial intelligence system able to help people with impaired sight. It was shown how essential is the choice and optimization of the applied algorithms for the implementation process in order to increase the end-user’s comfort.
Źródło:: Biuletyn Wojskowej Akademii Technicznej; 2018, 67, 2; 89-97
1234-5865
Pojawia się w:: Biuletyn Wojskowej Akademii Technicznej
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 7.

Tytuł:: Badania szybkości i jakości metod syntezy mowy na potrzeby zastosowania w urządzeniu przenośnym
Research of speed and accuracy of speech synthesis methods for the purposes of deployment in embedded device
Autorzy:: Zacniewski, A.
Zdunek, R.
Powiązania:: https://bibliotekanauki.pl/articles/210136.pdf
Data publikacji:: 2018
Wydawca:: Wojskowa Akademia Techniczna im. Jarosława Dąbrowskiego
Tematy:: synteza mowy
wspomaganie osób z dysfunkcją wzroku
Toucan Eye
speech synthesis
assisting persons with impaired sight
Opis:: W artykule przeanalizowano szereg metod dotyczących syntezy mowy, mając na uwadze ich wykorzystanie w urządzeniu przenośnym. Badania realizowano na urządzeniach o zróżnicowanych parametrach, a badanymi kryteriami były skuteczność danej metody i jej szybkość. Badania są częścią projektu Toucan Eye - urządzenia przenośnego z systemem sztucznej inteligencji, mającego wspomóc osoby z dysfunkcją wzroku. Pokazano również, jak ważne jest zoptymalizowanie zastosowanych metod w fazie projektu inżynierskiego, w celu zapewnienia lepszej jakości pracy urządzenia i komfortu użytkownika końcowego.
In the article, the methods concerning speech synthesis were analysed, having in mind their usage in an embedded device. Research was carried out on the devices with mixed parameters, and the criteria were accuracy and speed of the given method. The research is a part of the Toucan Eye project – an embedded device with an artificial intelligence system able to help people with impaired sight. It was shown how important is optimization of the applied methods in the phase of an engineer project to ensure better quality of a working device and the end-user’s comfort.
Źródło:: Biuletyn Wojskowej Akademii Technicznej; 2018, 67, 2; 99-108
1234-5865
Pojawia się w:: Biuletyn Wojskowej Akademii Technicznej
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 8.

Tytuł:: Badania szybkości i skuteczności metod syntezy mowy na potrzeby zastosowania w urządzeniu przenośnym
Research of Speed and Accuracy of Speech Synthesis Methods for the Purposes of Deployment in Embeddeddevice
Autorzy:: ZACNIEWSKI, ARTUR
KLEINSZMIDT, MARCIN
ZDUNEK, RADOSŁAW
Powiązania:: https://bibliotekanauki.pl/articles/455407.pdf
Data publikacji:: 2018
Wydawca:: Uniwersytet Rzeszowski
Tematy:: synteza mowy
wspomaganie osób z dysfunkcją wzroku
ToucanEye
speech synthesis
assisting persons with impaired sight
Toucan Eye
Opis:: W artykule przeanalizowano szereg metod dotyczących syntezy mowy, mając na uwadze ich wykorzystanie w urządzeniu przenośnym. Badania realizowano na urządzeniach o zróżnicowa-nych parametrach, a badanymi kryteriami były skuteczność danej metody i jej szybkość. Badania są częścią projektu ToucanEye – urządzenia przenośnego z systemem sztucznej inteligencji, mają-cego wspomóc osoby z dysfunkcją wzroku. Pokazano również, jak ważne jest zoptymalizowanie zastosowanych metod w fazie projektu inżynierskiego w celu zapewnienia lepszej jakości pracy urządzenia i komfortu użytkownika końcowego.
In the article the methods concerning speech synthesis were analysed, having in mind their usage in embedded device. Research was carried out on devices with mixed parameters, and the criteria were accuracy and speed of given method. The research are part the Toucan Eye project – embedded device with artificial intelligence system able to help people with impaired sight. It was shown how important is optimization of applied methods in the phase of engineer project to ensure better quality of working device and comfort of end-user.
Źródło:: Edukacja-Technika-Informatyka; 2018, 9, 1; 43-51
2080-9069
Pojawia się w:: Edukacja-Technika-Informatyka
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Informacja

Wyszukujesz frazę "synteza mowy" wg kryterium: Temat

Źródło danych

Dostawca treści

Kolekcja

Rok wydania

Wydawca

Temat

Autor

Typ dokumentu

Język