Metoda i algorytmy modyfikacji sygnału do celu wspomagania rozumienia mowy przez osoby z pogorszoną rozdzielczością czasową słuchu - Publikacja - MOST Wiedzy

Wyszukiwarka

Metoda i algorytmy modyfikacji sygnału do celu wspomagania rozumienia mowy przez osoby z pogorszoną rozdzielczością czasową słuchu

Abstrakt

Przedmiotem badań przeprowadzonych w ramach rozprawy są metody modyfikacji czasu trwania sygnału (ang. Time Scale Modification –TSM) mowy operujące w czasie rzeczywistym oraz ocena ich wpływu na rozumienie wypowiedzi przez osoby z pogorszoną rozdzielczością czasową słuchu. Pogorszona rozdzielczość słuchu jest jednym z symptomów związanych z ośrodkowymi zaburzeniami słuchu (ang. Cetnral Auditory Processing Disorder – CAPD). W odróżnieniu od obwodowych zaburzeń słuchu (tzw. głuchota), w przypadku których zastosowanie aparatu słuchowego działającego na zasadzie wielopasmowego kompandera dynamiki pozwala na znaczne polepszenie percepcji mowy, zaburzenia centralne nie mogą zostać skompensowane w tak prosty sposób. W literaturze postuluje się zastosowanie w tym celu metod TSM w odniesieniu do sygnału mowy. Wiąże się to z koniecznością opracowania algorytmów TSM umożliwiających wydłużenie czasu trwania sygnału w czasie rzeczywistym. Czas rzeczywisty w tym przypadku jest pojęciem przyjętym umownie, bowiem stosowanie algorytmów TSM w odniesieniu do sygnału mowy zawsze jest związane z mniejszym lub większym opóźnieniem sygnału, które niekiedy jest na tyle duże, że bywa słyszalne. Czas rzeczywisty jest tu, rozumiany jako działanie na bieżącym sygnale odbieranym poprzez mikrofon dla odróżnienia od przypadku przetwarzania zarejestrowanych nagrań. Nowością w opracowanej w ramach pracy metodzie jest uzależnienie stopnia spowolnienia mowy od tempa mowy wejściowej. Dzięki tej zależności wolne fragmenty wypowiedzi spowalniane są z wykorzystaniem innych wartości współczynników skali, niż fragmenty szybkie. Ciągła praca algorytmu możliwa jest dzięki zastosowaniu szeregu rozwiązań pozwalających na utrzymywanie synchronizacji sygnału wejściowego z sygnałem o zmodyfikowanej strukturze czasowej. Mechanizmy synchronizacji oparto na założeniu, że przetwarzany sygnał jest rozwlekły. Dlatego możliwe jest usunięcie zbędnych, z punktu widzenia rozumienia mowy, fragmentów sygnału i zastąpienie ich fragmentami mowy spowolnionej. Modyfikacja struktury czasowej wypowiedzi wykonywana jest tu w sposób nierównomierny tzn. samogłoski i spółgłoski spowalniane są z użyciem różnych wartości współczynnika skali.

Cytuj jako

Pełna treść

pełna treść publikacji nie jest dostępna w portalu

Słowa kluczowe

Informacje szczegółowe

Kategoria:
Doktoraty, rozprawy habilitacyjne, nostryfikacje
Typ:
praca doktorska pracowników zatrudnionych w PG oraz studentów studium doktoranckiego
Język:
polski
Rok wydania:
2013
Weryfikacja:
Politechnika Gdańska

wyświetlono 117 razy

Publikacje, które mogą cię zainteresować

Meta Tagi