Metoda i algorytmy modyfikacji sygnału do celu wspomagania rozumienia mowy przez osoby z pogorszoną rozdzielczością czasową słuchu
Abstrakt
Przedmiotem badań przeprowadzonych w ramach rozprawy są metody modyfikacji czasu trwania sygnału (ang. Time Scale Modification –TSM) mowy operujące w czasie rzeczywistym oraz ocena ich wpływu na rozumienie wypowiedzi przez osoby z pogorszoną rozdzielczością czasową słuchu. Pogorszona rozdzielczość słuchu jest jednym z symptomów związanych z ośrodkowymi zaburzeniami słuchu (ang. Cetnral Auditory Processing Disorder – CAPD). W odróżnieniu od obwodowych zaburzeń słuchu (tzw. głuchota), w przypadku których zastosowanie aparatu słuchowego działającego na zasadzie wielopasmowego kompandera dynamiki pozwala na znaczne polepszenie percepcji mowy, zaburzenia centralne nie mogą zostać skompensowane w tak prosty sposób. W literaturze postuluje się zastosowanie w tym celu metod TSM w odniesieniu do sygnału mowy. Wiąże się to z koniecznością opracowania algorytmów TSM umożliwiających wydłużenie czasu trwania sygnału w czasie rzeczywistym. Czas rzeczywisty w tym przypadku jest pojęciem przyjętym umownie, bowiem stosowanie algorytmów TSM w odniesieniu do sygnału mowy zawsze jest związane z mniejszym lub większym opóźnieniem sygnału, które niekiedy jest na tyle duże, że bywa słyszalne. Czas rzeczywisty jest tu, rozumiany jako działanie na bieżącym sygnale odbieranym poprzez mikrofon dla odróżnienia od przypadku przetwarzania zarejestrowanych nagrań. Nowością w opracowanej w ramach pracy metodzie jest uzależnienie stopnia spowolnienia mowy od tempa mowy wejściowej. Dzięki tej zależności wolne fragmenty wypowiedzi spowalniane są z wykorzystaniem innych wartości współczynników skali, niż fragmenty szybkie. Ciągła praca algorytmu możliwa jest dzięki zastosowaniu szeregu rozwiązań pozwalających na utrzymywanie synchronizacji sygnału wejściowego z sygnałem o zmodyfikowanej strukturze czasowej. Mechanizmy synchronizacji oparto na założeniu, że przetwarzany sygnał jest rozwlekły. Dlatego możliwe jest usunięcie zbędnych, z punktu widzenia rozumienia mowy, fragmentów sygnału i zastąpienie ich fragmentami mowy spowolnionej. Modyfikacja struktury czasowej wypowiedzi wykonywana jest tu w sposób nierównomierny tzn. samogłoski i spółgłoski spowalniane są z użyciem różnych wartości współczynnika skali.
Autor (1)
Cytuj jako
Pełna treść
pełna treść publikacji nie jest dostępna w portalu
Słowa kluczowe
Informacje szczegółowe
- Kategoria:
- Doktoraty, rozprawy habilitacyjne, nostryfikacje
- Typ:
- praca doktorska pracowników zatrudnionych w PG oraz studentów studium doktoranckiego
- Język:
- polski
- Rok wydania:
- 2013
- Weryfikacja:
- Politechnika Gdańska
wyświetlono 117 razy