Abstract
Celem pracy jest modyfikacja sygnału mowy, aby uzyskać zwiększenie poprawy obiektywnych wskaźników jakości mowy po zmiksowaniu sygnału użytecznego z szumem bądź z sygnałem zakłócającym. Wykonane modyfikacje sygnału bazują na cechach mowy lombardzkiej, a w szczególności na efekcie podniesienia częstotliwości podstawowej F0. Sesja nagraniowa obejmowała zestawy słów i zdań w języku polskim, nagrane w warunkach ciszy, jak również w obecności sygnałów zakłócających, tj. szumu różowego oraz tzw. gwaru (ang. babble speech), określanego też jako efekt „cocktail-party”. W ramach badań przetwarzano próbki mowy głosów męskich. W pracy wykazano, że podniesienie częstotliwości podstawowej skutkuje zwiększonymi wartościami wskaźnika jakości mowy, mierzonymi przy użyciu standardu PESQ (Perceptual Evaluation of Speech Quality).
Citations
-
0
CrossRef
-
0
Web of Science
-
0
Scopus
Authors (2)
Cite as
Full text
- Publication version
- Accepted or Published Version
- License
- open in new tab
Keywords
Details
- Category:
- Articles
- Type:
- artykuły w czasopismach recenzowanych i innych wydawnictwach ciągłych
- Published in:
-
Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej
pages 45 - 50,
ISSN: 1425-5766 - Language:
- Polish
- Publication year:
- 2018
- Bibliographic description:
- Kąkol K., Kostek B.: POPRAWA OBIEKTYWNYCH WSKAŹNIKÓW JAKOŚCI MOWY W WARUNKACH HAŁASU// Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej. -., nr. 60 (2018), s.45-50
- DOI:
- Digital Object Identifier (open in new tab) 10.32016/1.60.09
- Bibliography: test
-
- Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki PG, ISSN 2353-1290, Nr 60/2018 open in new tab
- Kleczkowski P., Żak A., Król-Nowak A., Lombard Effect in Polish Speech and its Comparison in English Speech, Archives of Acoustics, vol. 42, no. 4, pp. 561- 569, 2017, doi: 10.1515/aoa-2017-0060. open in new tab
- Boril H., Fousek P., Höge H., Two-Stage System for Robust Neutral/Lombard Speech Recognition, Interspeech, 2007.
- Therrien A. S., Lyons J., Balasubramaniam R., Sensory Attenuation of Self-Produced Feedback: The Lombard Effect Revisited, PLoS One, vol. 7, no. 11, 2012. open in new tab
- Zollinger S.A., Brumm H., The evolution of the Lombard effect: 100 years of psychoacoustic research, Behaviour, 148, 2011, 1173-1198. open in new tab
- Bapineedu G., Analysis of Lombard effect speech and its application in speaker verification for imposter detection, Language Technologies Research Centre, International Institute of Information Technology.
- Lau P., The Lombard Effect as a Communicative Phenomenon, UC Berkeley Phonology Lab Annual Report, 2008. open in new tab
- Junqua J.-C., Fincke S., Field K., The Lombard effect: a reflex to better communicate with others in noise, 1999 IEEE Int. Conf. Acoust. Speech, Signal Process. Proceedings. ICASSP99 (Cat. No.99CH36258), pp. 2083-2086 vol. 4, 1999. open in new tab
- Whitepaper PESQ: An Introduction, Psytechnics Limited, 2001. open in new tab
- Single-ended method for objective speech quality assessment in narrow-band telephony applications, ITU- T Recommendation P.563, 2004. open in new tab
- ITU-T. Methods for subjective determination of transmission quality. Recommendation P.800, Aug. 1996.
- ITU-T. Perceptual evaluation of speech quality (PESQ), an objective method for end-to-end speech quality assessment of narrow band telephone networks and speech codecs. Recommendation P.862, Feb. 2001.
- Nishiura T., Detection for Lombard speech with second- order mel-frequency cepstral coefficient and spectral envelope in beginning of talking speech, The Journal of the Acoustical Society of America, 2013.
- ITU-T. Mean opinion score (MOS) terminology. Recommendation P.800.1, July 2006.
- ITU-R BS.1284: ogólne metody subiektywnej oceny jakości dźwięku.
- ITU-R BS.1116: ocena małych zniekształceń dźwięku (test ABC).
- ITU-T. Mapping function for transforming P.862 raw result scores to MOS-LQO. Recommendation P.862.1, Nov. 2003. open in new tab
- Poremski T., Szymański P., Kostek B., Aparat słuchowy a alternatywne urządzenia poprawiające słyszenie, Otorynolaryngologia 2018, 17(2): 49-56, www.mediton.pl/orl.
- Marxer, R. Barker J. Alghamdi N., The impact of the Lombard effect on audio and visual speech recognition systems, Speech Communication, vol. 100, pp. 58-68, June 2018, https://doi.org/10.1016/j.specom.2018.04.006. open in new tab
- Boril H., Fousek P., Sündermann D., Cerva P., Zdansky J., Lombard Speech Recognition: A Comparative Study, InterSpeech 2007.
- Boril H., Pollák P., Design and Collection of Czech Lombard Speech Database, http://www.isca- speech.org/archive/interspeech_2005/i05_1577.html.
- Vlaj D., Kacic Z., The Influence of Lombard Effect on Speech Recognition in: Speech Technologies, Chapter 7, pp. 151-168. open in new tab
- Egan J. P., Psychoacoustics of the Lombard voice response, J. Aud. Res. 12, 1972, 318-324. open in new tab
- Zollinger S. A., Brumm H., The Lombard effect, Curr. Biol., vol. 21, no. 16, pp. R614-R615, 2011. open in new tab
- Stowe L. M., Golob E. J. Evidence that the Lombard effect is frequency-specific in humans. The Journal of the Acoustical Society of America, 134(1):640-647, 2013, doi:10.1121/1.4807645. open in new tab
- Sources of funding:
-
- częściowo DS/NCN nr DEC-2015/17/B/ST6/01874
- Verified by:
- Gdańsk University of Technology
seen 151 times