Wyniki wyszukiwania dla: kodowanie sygnalu mowy
-
Weryfikacja systemu dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie
PublikacjaWiększość systemów dopasowania protez słuchu koncentruje się na poprawie zrozumiałości mowy. Problem dopasowania protez słuchu może w uproszczeniu być przedstawiony jako problem dopasowania szerokiej dynamiki sygnału mowy do zawężonej dynamiki uszkodzonego słuchu. Głównym celem badań było przetestowanie opracowanego systemu oraz sprawdzenie w jakim stopniu zaimplementowany moduł wirtualnej protezy słuchu może poprawić zrozumiałość...
-
Wykorzystanie algorytmu kompresji sygnału mowy MP-LPC do modelowania przebiegu fonokardiograficznego
PublikacjaW artykule przedstawiono nową metodę modelowania dźwięków serca, która może znaleźć zastosowanie w systemach diagnostyki urządzeń medycznych oraz stanowić podstawę opracowania inteligentnego stetoskopu. Przedstawiona propozycja stanowi rozwinięcie algorytmu MP-LPC wykorzystywanego w kompresji sygnału mowy. Wykazano, że do dokładnego modelowania przebiegu fonokardiograficznego, który pozwala na odwzorowywanie różnorodnych stanów...
-
ANALIZA PARAMETRÓW SYGNAŁU MOWY W KONTEKŚCIE ICH PRZYDATNOŚCI W AUTOMATYCZNEJ OCENIE JAKOŚCI EKSPRESJI ŚPIEWU
PublikacjaPraca dotyczy podejścia do parametryzacji w przypadku klasyfikacji emocji w śpiewie oraz porównania z klasyfikacją emocji w mowie. Do tego celu wykorzystano bazę mowy i śpiewu nacechowanego emocjonalnie RAVDESS (Ryerson Audio-Visual Database of Emotional Speech and Song), zawierającą nagrania profesjonalnych aktorów prezentujących sześć różnych emocji. Następnie obliczono współczynniki mel-cepstralne (MFCC) oraz wybrane deskryptory...
-
Metoda i algorytmy modyfikacji sygnału do celu wspomagania rozumienia mowy przez osoby z pogorszoną rozdzielczością czasową słuchu
PublikacjaPrzedmiotem badań przeprowadzonych w ramach rozprawy są metody modyfikacji czasu trwania sygnału (ang. Time Scale Modification –TSM) mowy operujące w czasie rzeczywistym oraz ocena ich wpływu na rozumienie wypowiedzi przez osoby z pogorszoną rozdzielczością czasową słuchu. Pogorszona rozdzielczość słuchu jest jednym z symptomów związanych z ośrodkowymi zaburzeniami słuchu (ang. Cetnral Auditory Processing Disorder – CAPD). W odróżnieniu...
-
Interaktywne badania słuchu, wzroku i mowy
PublikacjaTelemedycyna jest jedną z najważniejszych i najszybciej rozwijających się technologii społeczeństwa informacyjnego. Pomimo dostępności wielu aplikacji, wciąż jeszcze brakuje aplikacji interaktywnych. W artykule zaprezentowano kilka przykładowych rozwiązań interaktywnych aplikacji telemedycznych, opartych na opracowaniach zrealizowanych w Katedrze Inżynierii Dźwięku i Obrazu PG.
-
System przetwarzania i wizualizacji sygnału mowy dla potrzeb lingwistycznych = System of speech signal processing and visualisation of the results
PublikacjaW artykule przedstawiono sposób przetwarzania i wizualizacji sygnału mowy w formie prostego w obsłudze i relatywnie niedrogiego urządzenia do nagrywania sygnału akustycznego oraz przetwarzania cyfrowego wyselekcjonowanych fragmentów i wizualizacji uzyskanych rezultatów przekształceń. Zastosowano do tego celu komputer z kartą dźwiękową. Przetwarzanie cyfrowe oraz wizualizacja dokonywana była w oparciu o program MATLAB bezpośrednio...
-
Cyfrowa analiza mowy etnicznej - ekstrakcja kodu informacji.
PublikacjaW artykule zaprezentowano spektrogramy leksemów wyartykułowanych przez (zróżnicowanych co do płci i wieku) użytkowników jednego języka etnicznego wyrażonych w mowie swobodnej. Ponadto, przedstawiono spektrogramy tychże leksemów uzyskane po cyfrowym wyeliminowaniu w nich sygnału tonu krtaniowego. Dla porównania pokazano spektrogramy uzyskane w wyniku identycznego procesu przetwarzania sygnałów będących akustyczną reprezentacją...
-
Improving signal quality of a speech codec using hybrid perceptual-parametric algorithm
PublikacjaW artykule zaprezentowano hybrydową architekturę parametryczno-perceptualną kodeka mowy. Jego podstawę stanowi kodek CELP, który wspomagany jest kodekiem perceptualnym. Celem zastosowania proponowanej metody jest uzyskanie poprawy jakości kodowania sygnału mowy. Badaniom poddano dwie architektury, z których w jednej dźwięczne części sygnału rezydualnego kodeka CELP kodowane są perceptualnie. Drugi z proponowanych kodeków dokonuje...
-
Simulation of electric hearing - influence of simulation parameters on quality of output signal
PublikacjaW środowisku programistycznym Matlab stworzono symulację słuchu elektrycznego pacjenta implantowanego. W symulacji zastosowano algorytm przetwarzania wykorzystywany w komercyjnych systemach implantów ślimakowych - CIS (Continuous Interleaved Sampling). W pracy zbadano wpływ ilości kanałów, jak i innych parametrów sygnałów wyjściowych przy zastosowaniu sygału mowy jako sygnału wejściowego symulacji.
-
Audiovisual speech recognition for training hearing impaired patients
PublikacjaPraca przedstawia system rozpoznawania izolowanych głosek mowy wykorzystujący dane wizualne i akustyczne. Modele Active Shape Models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na współczynnikach melcepstralnych. Sieć neuronowa została użyta do rozpoznawania wymawianych głosek na podstawie wektora cech zawierającego oba typy...
-
Subiektywny pomiar jakości sygnałów mowy i muzyki w lokalnych multipleksach radiofonii DAB+ w Gdańsku i Wrocławiu
PublikacjaRadiofonia cyfrowa DAB+ (Digital Audio Broadcasting plus) dostępna jest dla słuchaczy w Polsce od 2013 r. Standard ten oferuje szerokie możliwości konfiguracji multipleksów lokalnych nie tylko pod względem liczby, lecz także jakości nadawanych programów radiowych. Dzięki temu możliwe jest dostosowanie parametrów emitowanych sygnałów w celu sprostania oczekiwaniom odbiorców końcowych. W przeciwieństwie do radiofonii analogowej FM...
-
Piotr Odya dr inż.
OsobyPiotr Odya urodził się w Gdańsku w 1974. W 1999 roku ukończył z wyróżnieniem studia na Wydziale Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej zdobywając tytuł magistra inżyniera. Praca dyplomowa dotyczyła problemów poprawy jakości dźwięku w studiach emisyjnych współczesnych rozgłośni radiowych.Jego zainteresowania dotyczą montażu wideofonicznego, systemów dźwięku wielokanałowego. W ramach studiów doktoranckich...
-
Wartościowanie i ironia w tekście w świetle teorii aktów mowy
Publikacja -
Badanie właściwości sygnału telegraficznego oraz sygnału mowy przesyłanych przez kanał analogowy
PublikacjaW pracy zaprezentowano oprogramowanie TELESOUND, które powstało na potrzeby ćwiczenia pt. "Właściwości źródeł informacji" realizowanego w ramach laboratorium "Podstaw telekomunikacji". W trakcie tego ćwiczenia studenci zapoznają się z podstawowymi pojęciami i mechanizmami funkcjonowania systemów telekomunikacyjnych przekazujących wiadomości na odległość poprzez kanał przestrzenny. Na przykładzie telegrafii i telefonii, studenci...
-
Akustyczny obraz słowa na tle mowy etnicznej [The acoustic image of ethnic speech words]
Publikacja -
Zastosowanie spowalniania wypowiedzi w celu poprawy rozumienia mowy przez dzieci w szkole
PublikacjaThis paper presents a time-scale modification algorithms that could be used for hearing impairment therapy supported by real-time speech stretching. In this paper the OLA based algorithms and Phase Vocoder were described. In the experimental part usability of those algorithms for real-time speech stretching was discussed
-
A low complexity double-talk detector based on the signal envelope
PublikacjaA new algorithm for double-talk detection, intended for use in the acoustic echo canceller for voice communication applications, is proposed. The communication system developed by the authors required the use of a double-talk detection algorithm with low complexity and good accuracy. The authors propose an approach to doubletalk detection based on the signal envelopes. For each of three signals: the far-end speech, the microphone...
-
Badanie rozkładów parametrów sygnału mowy w zastosowaniach do prognozowania prawdopodobieństwa popełnienia błędów w systemach identyfikacji mówców = Examining distribution of speech signal parameters for the prognosis of error probability in speaker verification systems
PublikacjaPrzedmiotem pracy jest system identyfikacji mówców w sposób zależny od tekstu ("text dependent''). Dokonano analizy wielu różnych wypowiedzi kilkudziesięciu mówców. Zastosowana metoda parametryzacji to metoda oparta na wynikach analizy cepstralnej sygnału mowy. Zdefiniowane zostały nowe parametry skojarzone z elementarnymi zdarzeniami w procesie weryfikacji mówców. Na tej podstawie dokonano estymacji funkcji gęstości prawdopodobieństwa...
-
Poprawa zrozumiałości mowy w obecności zakłóceń z wykorzystaniem algorytmu opartego na filtracji adatacyjnej
PublikacjaW pracy opisano nowy sposób wykorzystania filtracjiadaptacyjnej do poprawy jakości dźwięków uŜytecznychnagrywanych w obecności zakłóceń. Przedstawiono stworzonyalgorytm adaptacji, omówiono moŜliwości przetwarzania dźwiękudodatkowymi algorytmami, opisano przeprowadzoneeksperymenty. Zamieszczono i omówiono wyniki eksperymentów.Zaproponowano sposób integracji opracowanej metody zsystemami akustycznego monitorowania aglomeracji miejskiej.
-
Andrzej Czyżewski prof. dr hab. inż.
OsobyProf. zw. dr hab. inż. Andrzej Czyżewski jest absolwentem Wydziału Elektroniki PG (studia magisterskie ukończył w 1982 r.). Pracę doktorską na temat związany z dźwiękiem cyfrowym obronił z wyróżnieniem na Wydziale Elektroniki PG w roku 1987. W 1992 r. przedstawił rozprawę habilitacyjną pt.: „Cyfrowe operacje na sygnałach fonicznych”. Jego kolokwium habilitacyjne zostało przyjęte jednomyślnie w czerwcu 1992 r. w Akademii Górniczo-Hutniczej...