POPRAWA OBIEKTYWNYCH WSKAŹNIKÓW JAKOŚCI MOWY W WARUNKACH HAŁASU - Publication - Bridge of Knowledge

Search

POPRAWA OBIEKTYWNYCH WSKAŹNIKÓW JAKOŚCI MOWY W WARUNKACH HAŁASU

Abstract

Celem pracy jest modyfikacja sygnału mowy, aby uzyskać zwiększenie poprawy obiektywnych wskaźników jakości mowy po zmiksowaniu sygnału użytecznego z szumem bądź z sygnałem zakłócającym. Wykonane modyfikacje sygnału bazują na cechach mowy lombardzkiej, a w szczególności na efekcie podniesienia częstotliwości podstawowej F0. Sesja nagraniowa obejmowała zestawy słów i zdań w języku polskim, nagrane w warunkach ciszy, jak również w obecności sygnałów zakłócających, tj. szumu różowego oraz tzw. gwaru (ang. babble speech), określanego też jako efekt „cocktail-party”. W ramach badań przetwarzano próbki mowy głosów męskich. W pracy wykazano, że podniesienie częstotliwości podstawowej skutkuje zwiększonymi wartościami wskaźnika jakości mowy, mierzonymi przy użyciu standardu PESQ (Perceptual Evaluation of Speech Quality).

Citations

  • 0

    CrossRef

  • 0

    Web of Science

  • 0

    Scopus

Cite as

Full text

download paper
downloaded 93 times
Publication version
Accepted or Published Version
License
Creative Commons: CC-BY-NC-ND open in new tab

Keywords

Details

Category:
Articles
Type:
artykuły w czasopismach recenzowanych i innych wydawnictwach ciągłych
Published in:
Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej pages 45 - 50,
ISSN: 1425-5766
Language:
Polish
Publication year:
2018
Bibliographic description:
Kąkol K., Kostek B.: POPRAWA OBIEKTYWNYCH WSKAŹNIKÓW JAKOŚCI MOWY W WARUNKACH HAŁASU// Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej. -., nr. 60 (2018), s.45-50
DOI:
Digital Object Identifier (open in new tab) 10.32016/1.60.09
Bibliography: test
  1. Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki PG, ISSN 2353-1290, Nr 60/2018 open in new tab
  2. Kleczkowski P., Żak A., Król-Nowak A., Lombard Effect in Polish Speech and its Comparison in English Speech, Archives of Acoustics, vol. 42, no. 4, pp. 561- 569, 2017, doi: 10.1515/aoa-2017-0060. open in new tab
  3. Boril H., Fousek P., Höge H., Two-Stage System for Robust Neutral/Lombard Speech Recognition, Interspeech, 2007.
  4. Therrien A. S., Lyons J., Balasubramaniam R., Sensory Attenuation of Self-Produced Feedback: The Lombard Effect Revisited, PLoS One, vol. 7, no. 11, 2012. open in new tab
  5. Zollinger S.A., Brumm H., The evolution of the Lombard effect: 100 years of psychoacoustic research, Behaviour, 148, 2011, 1173-1198. open in new tab
  6. Bapineedu G., Analysis of Lombard effect speech and its application in speaker verification for imposter detection, Language Technologies Research Centre, International Institute of Information Technology.
  7. Lau P., The Lombard Effect as a Communicative Phenomenon, UC Berkeley Phonology Lab Annual Report, 2008. open in new tab
  8. Junqua J.-C., Fincke S., Field K., The Lombard effect: a reflex to better communicate with others in noise, 1999 IEEE Int. Conf. Acoust. Speech, Signal Process. Proceedings. ICASSP99 (Cat. No.99CH36258), pp. 2083-2086 vol. 4, 1999. open in new tab
  9. Whitepaper PESQ: An Introduction, Psytechnics Limited, 2001. open in new tab
  10. Single-ended method for objective speech quality assessment in narrow-band telephony applications, ITU- T Recommendation P.563, 2004. open in new tab
  11. ITU-T. Methods for subjective determination of transmission quality. Recommendation P.800, Aug. 1996.
  12. ITU-T. Perceptual evaluation of speech quality (PESQ), an objective method for end-to-end speech quality assessment of narrow band telephone networks and speech codecs. Recommendation P.862, Feb. 2001.
  13. Nishiura T., Detection for Lombard speech with second- order mel-frequency cepstral coefficient and spectral envelope in beginning of talking speech, The Journal of the Acoustical Society of America, 2013.
  14. ITU-T. Mean opinion score (MOS) terminology. Recommendation P.800.1, July 2006.
  15. ITU-R BS.1284: ogólne metody subiektywnej oceny jakości dźwięku.
  16. ITU-R BS.1116: ocena małych zniekształceń dźwięku (test ABC).
  17. ITU-T. Mapping function for transforming P.862 raw result scores to MOS-LQO. Recommendation P.862.1, Nov. 2003. open in new tab
  18. Poremski T., Szymański P., Kostek B., Aparat słuchowy a alternatywne urządzenia poprawiające słyszenie, Otorynolaryngologia 2018, 17(2): 49-56, www.mediton.pl/orl.
  19. Marxer, R. Barker J. Alghamdi N., The impact of the Lombard effect on audio and visual speech recognition systems, Speech Communication, vol. 100, pp. 58-68, June 2018, https://doi.org/10.1016/j.specom.2018.04.006. open in new tab
  20. Boril H., Fousek P., Sündermann D., Cerva P., Zdansky J., Lombard Speech Recognition: A Comparative Study, InterSpeech 2007.
  21. Boril H., Pollák P., Design and Collection of Czech Lombard Speech Database, http://www.isca- speech.org/archive/interspeech_2005/i05_1577.html.
  22. Vlaj D., Kacic Z., The Influence of Lombard Effect on Speech Recognition in: Speech Technologies, Chapter 7, pp. 151-168. open in new tab
  23. Egan J. P., Psychoacoustics of the Lombard voice response, J. Aud. Res. 12, 1972, 318-324. open in new tab
  24. Zollinger S. A., Brumm H., The Lombard effect, Curr. Biol., vol. 21, no. 16, pp. R614-R615, 2011. open in new tab
  25. Stowe L. M., Golob E. J. Evidence that the Lombard effect is frequency-specific in humans. The Journal of the Acoustical Society of America, 134(1):640-647, 2013, doi:10.1121/1.4807645. open in new tab
Sources of funding:
  • częściowo DS/NCN nr DEC-2015/17/B/ST6/01874
Verified by:
Gdańsk University of Technology

seen 151 times

Recommended for you

Meta Tags