Comparison of Acoustic and Visual Voice Activity Detection for Noisy Speech Recognition - Publikacja - MOST Wiedzy

Wyszukiwarka

Comparison of Acoustic and Visual Voice Activity Detection for Noisy Speech Recognition

Abstrakt

The problem of accurate differentiating between the speaker utterance and the noise parts in a speech signal is considered. The influence of utilizing a voice activity detection in speech signals on the accuracy of the automatic speech recognition (ASR) system is presented. The examined methods of voice activity detection are based on acoustic and visual modalities. The problem of detecting the voice activity in clean and noisy speech is considered. The speech signal was recorded in a real-life scenario in an office-like environment with the babble noise generated by the loudspeakers at different levels. The proposed method of visual voice activity detection is aimed at enhancing the accuracy of ASR when the ratio of signal to noise is low. The numerals in English language are used as speech material and Word Error Rate (WER) is employed for the evaluation purposes.

Cytowania

  • 2

    CrossRef

  • 0

    Web of Science

  • 4

    Scopus

Cytuj jako

Pełna treść

pełna treść publikacji nie jest dostępna w portalu

Słowa kluczowe

Informacje szczegółowe

Kategoria:
Aktywność konferencyjna
Typ:
publikacja w wydawnictwie zbiorowym recenzowanym (także w materiałach konferencyjnych)
Tytuł wydania:
IEEE, Chapters Signal Processing Circuits and Systems strony 287 - 291
Język:
angielski
Rok wydania:
2016
Opis bibliograficzny:
Bratoszewski P., Szwoch G., Czyżewski A.: Comparison of Acoustic and Visual Voice Activity Detection for Noisy Speech Recognition// IEEE, Chapters Signal Processing Circuits and Systems/ Poznań: , 2016, s.287-291
DOI:
Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.1109/spa.2016.7763629
Weryfikacja:
Politechnika Gdańska

wyświetlono 105 razy

Publikacje, które mogą cię zainteresować

Meta Tagi