POPRAWA OBIEKTYWNYCH WSKAŹNIKÓW JAKOŚCI MOWY W WARUNKACH HAŁASU - Publikacja - MOST Wiedzy

Wyszukiwarka

POPRAWA OBIEKTYWNYCH WSKAŹNIKÓW JAKOŚCI MOWY W WARUNKACH HAŁASU

Abstrakt

Celem pracy jest modyfikacja sygnału mowy, aby uzyskać zwiększenie poprawy obiektywnych wskaźników jakości mowy po zmiksowaniu sygnału użytecznego z szumem bądź z sygnałem zakłócającym. Wykonane modyfikacje sygnału bazują na cechach mowy lombardzkiej, a w szczególności na efekcie podniesienia częstotliwości podstawowej F0. Sesja nagraniowa obejmowała zestawy słów i zdań w języku polskim, nagrane w warunkach ciszy, jak również w obecności sygnałów zakłócających, tj. szumu różowego oraz tzw. gwaru (ang. babble speech), określanego też jako efekt „cocktail-party”. W ramach badań przetwarzano próbki mowy głosów męskich. W pracy wykazano, że podniesienie częstotliwości podstawowej skutkuje zwiększonymi wartościami wskaźnika jakości mowy, mierzonymi przy użyciu standardu PESQ (Perceptual Evaluation of Speech Quality).

Cytowania

  • 0

    CrossRef

  • 0

    Web of Science

  • 0

    Scopus

Cytuj jako

Pełna treść

pobierz publikację
pobrano 93 razy
Wersja publikacji
Accepted albo Published Version
Licencja
Creative Commons: CC-BY-NC-ND otwiera się w nowej karcie

Słowa kluczowe

Informacje szczegółowe

Kategoria:
Publikacja w czasopiśmie
Typ:
artykuły w czasopismach recenzowanych i innych wydawnictwach ciągłych
Opublikowano w:
Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej strony 45 - 50,
ISSN: 1425-5766
Język:
polski
Rok wydania:
2018
Opis bibliograficzny:
Kąkol K., Kostek B.: POPRAWA OBIEKTYWNYCH WSKAŹNIKÓW JAKOŚCI MOWY W WARUNKACH HAŁASU// Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej. -., nr. 60 (2018), s.45-50
DOI:
Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.32016/1.60.09
Bibliografia: test
  1. Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki PG, ISSN 2353-1290, Nr 60/2018 otwiera się w nowej karcie
  2. Kleczkowski P., Żak A., Król-Nowak A., Lombard Effect in Polish Speech and its Comparison in English Speech, Archives of Acoustics, vol. 42, no. 4, pp. 561- 569, 2017, doi: 10.1515/aoa-2017-0060. otwiera się w nowej karcie
  3. Boril H., Fousek P., Höge H., Two-Stage System for Robust Neutral/Lombard Speech Recognition, Interspeech, 2007.
  4. Therrien A. S., Lyons J., Balasubramaniam R., Sensory Attenuation of Self-Produced Feedback: The Lombard Effect Revisited, PLoS One, vol. 7, no. 11, 2012. otwiera się w nowej karcie
  5. Zollinger S.A., Brumm H., The evolution of the Lombard effect: 100 years of psychoacoustic research, Behaviour, 148, 2011, 1173-1198. otwiera się w nowej karcie
  6. Bapineedu G., Analysis of Lombard effect speech and its application in speaker verification for imposter detection, Language Technologies Research Centre, International Institute of Information Technology.
  7. Lau P., The Lombard Effect as a Communicative Phenomenon, UC Berkeley Phonology Lab Annual Report, 2008. otwiera się w nowej karcie
  8. Junqua J.-C., Fincke S., Field K., The Lombard effect: a reflex to better communicate with others in noise, 1999 IEEE Int. Conf. Acoust. Speech, Signal Process. Proceedings. ICASSP99 (Cat. No.99CH36258), pp. 2083-2086 vol. 4, 1999. otwiera się w nowej karcie
  9. Whitepaper PESQ: An Introduction, Psytechnics Limited, 2001. otwiera się w nowej karcie
  10. Single-ended method for objective speech quality assessment in narrow-band telephony applications, ITU- T Recommendation P.563, 2004. otwiera się w nowej karcie
  11. ITU-T. Methods for subjective determination of transmission quality. Recommendation P.800, Aug. 1996.
  12. ITU-T. Perceptual evaluation of speech quality (PESQ), an objective method for end-to-end speech quality assessment of narrow band telephone networks and speech codecs. Recommendation P.862, Feb. 2001.
  13. Nishiura T., Detection for Lombard speech with second- order mel-frequency cepstral coefficient and spectral envelope in beginning of talking speech, The Journal of the Acoustical Society of America, 2013.
  14. ITU-T. Mean opinion score (MOS) terminology. Recommendation P.800.1, July 2006.
  15. ITU-R BS.1284: ogólne metody subiektywnej oceny jakości dźwięku.
  16. ITU-R BS.1116: ocena małych zniekształceń dźwięku (test ABC).
  17. ITU-T. Mapping function for transforming P.862 raw result scores to MOS-LQO. Recommendation P.862.1, Nov. 2003. otwiera się w nowej karcie
  18. Poremski T., Szymański P., Kostek B., Aparat słuchowy a alternatywne urządzenia poprawiające słyszenie, Otorynolaryngologia 2018, 17(2): 49-56, www.mediton.pl/orl.
  19. Marxer, R. Barker J. Alghamdi N., The impact of the Lombard effect on audio and visual speech recognition systems, Speech Communication, vol. 100, pp. 58-68, June 2018, https://doi.org/10.1016/j.specom.2018.04.006. otwiera się w nowej karcie
  20. Boril H., Fousek P., Sündermann D., Cerva P., Zdansky J., Lombard Speech Recognition: A Comparative Study, InterSpeech 2007.
  21. Boril H., Pollák P., Design and Collection of Czech Lombard Speech Database, http://www.isca- speech.org/archive/interspeech_2005/i05_1577.html.
  22. Vlaj D., Kacic Z., The Influence of Lombard Effect on Speech Recognition in: Speech Technologies, Chapter 7, pp. 151-168. otwiera się w nowej karcie
  23. Egan J. P., Psychoacoustics of the Lombard voice response, J. Aud. Res. 12, 1972, 318-324. otwiera się w nowej karcie
  24. Zollinger S. A., Brumm H., The Lombard effect, Curr. Biol., vol. 21, no. 16, pp. R614-R615, 2011. otwiera się w nowej karcie
  25. Stowe L. M., Golob E. J. Evidence that the Lombard effect is frequency-specific in humans. The Journal of the Acoustical Society of America, 134(1):640-647, 2013, doi:10.1121/1.4807645. otwiera się w nowej karcie
Źródła finansowania:
  • częściowo DS/NCN nr DEC-2015/17/B/ST6/01874
Weryfikacja:
Politechnika Gdańska

wyświetlono 151 razy

Publikacje, które mogą cię zainteresować

Meta Tagi