Wyniki wyszukiwania dla: kodowanie sygnalu mowy

Wyniki wyszukiwania dla: kodowanie sygnalu mowy

wyników na stronę:
osadź ten widok na swojej stronie

Filtry

wszystkich: 177

wyczyść wszystkie filtry niedostępne

Weryfikacja systemu dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie
Publikacja
- P. Suchomski
- Prace Naukowe Instytutu Telekomunikacji i Akustyki Politechniki Wrocławskiej. Konferencje - Rok 2003
Większość systemów dopasowania protez słuchu koncentruje się na poprawie zrozumiałości mowy. Problem dopasowania protez słuchu może w uproszczeniu być przedstawiony jako problem dopasowania szerokiej dynamiki sygnału mowy do zawężonej dynamiki uszkodzonego słuchu. Głównym celem badań było przetestowanie opracowanego systemu oraz sprawdzenie w jakim stopniu zaimplementowany moduł wirtualnej protezy słuchu może poprawić zrozumiałość...
Wykorzystanie algorytmu kompresji sygnału mowy MP-LPC do modelowania przebiegu fonokardiograficznego
Publikacja
- G. Redlarski
- D. Gradolewski
- Przegląd Elektrotechniczny - Rok 2013
W artykule przedstawiono nową metodę modelowania dźwięków serca, która może znaleźć zastosowanie w systemach diagnostyki urządzeń medycznych oraz stanowić podstawę opracowania inteligentnego stetoskopu. Przedstawiona propozycja stanowi rozwinięcie algorytmu MP-LPC wykorzystywanego w kompresji sygnału mowy. Wykazano, że do dokładnego modelowania przebiegu fonokardiograficznego, który pozwala na odwzorowywanie różnorodnych stanów...

Pełny tekst do pobrania w serwisie zewnętrznym
ANALIZA PARAMETRÓW SYGNAŁU MOWY W KONTEKŚCIE ICH PRZYDATNOŚCI W AUTOMATYCZNEJ OCENIE JAKOŚCI EKSPRESJI ŚPIEWU
Publikacja
- S. Zaporowski
- B. Kostek
- Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej - Rok 2019
Praca dotyczy podejścia do parametryzacji w przypadku klasyfikacji emocji w śpiewie oraz porównania z klasyfikacją emocji w mowie. Do tego celu wykorzystano bazę mowy i śpiewu nacechowanego emocjonalnie RAVDESS (Ryerson Audio-Visual Database of Emotional Speech and Song), zawierającą nagrania profesjonalnych aktorów prezentujących sześć różnych emocji. Następnie obliczono współczynniki mel-cepstralne (MFCC) oraz wybrane deskryptory...

Pełny tekst do pobrania w portalu
Metoda i algorytmy modyfikacji sygnału do celu wspomagania rozumienia mowy przez osoby z pogorszoną rozdzielczością czasową słuchu
Publikacja
- A. Kupryjanow
- Rok 2013
Przedmiotem badań przeprowadzonych w ramach rozprawy są metody modyfikacji czasu trwania sygnału (ang. Time Scale Modification –TSM) mowy operujące w czasie rzeczywistym oraz ocena ich wpływu na rozumienie wypowiedzi przez osoby z pogorszoną rozdzielczością czasową słuchu. Pogorszona rozdzielczość słuchu jest jednym z symptomów związanych z ośrodkowymi zaburzeniami słuchu (ang. Cetnral Auditory Processing Disorder – CAPD). W odróżnieniu...
Interaktywne badania słuchu, wzroku i mowy
Publikacja
- A. Czyżewski
- H. Skarżyński
- Elektronizacja: podzespoły i zastosowania elektroniki - Rok 2002
Telemedycyna jest jedną z najważniejszych i najszybciej rozwijających się technologii społeczeństwa informacyjnego. Pomimo dostępności wielu aplikacji, wciąż jeszcze brakuje aplikacji interaktywnych. W artykule zaprezentowano kilka przykładowych rozwiązań interaktywnych aplikacji telemedycznych, opartych na opracowaniach zrealizowanych w Katedrze Inżynierii Dźwięku i Obrazu PG.
System przetwarzania i wizualizacji sygnału mowy dla potrzeb lingwistycznych = System of speech signal processing and visualisation of the results
Publikacja
- Z. Wojan
- W. Lis
- K. Wojan
- Rok 2005
W artykule przedstawiono sposób przetwarzania i wizualizacji sygnału mowy w formie prostego w obsłudze i relatywnie niedrogiego urządzenia do nagrywania sygnału akustycznego oraz przetwarzania cyfrowego wyselekcjonowanych fragmentów i wizualizacji uzyskanych rezultatów przekształceń. Zastosowano do tego celu komputer z kartą dźwiękową. Przetwarzanie cyfrowe oraz wizualizacja dokonywana była w oparciu o program MATLAB bezpośrednio...
Cyfrowa analiza mowy etnicznej - ekstrakcja kodu informacji.
Publikacja
- Z. Wojan
- W. Lis
- K. Wojan
- Rok 2003
W artykule zaprezentowano spektrogramy leksemów wyartykułowanych przez (zróżnicowanych co do płci i wieku) użytkowników jednego języka etnicznego wyrażonych w mowie swobodnej. Ponadto, przedstawiono spektrogramy tychże leksemów uzyskane po cyfrowym wyeliminowaniu w nich sygnału tonu krtaniowego. Dla porównania pokazano spektrogramy uzyskane w wyniku identycznego procesu przetwarzania sygnałów będących akustyczną reprezentacją...
Improving signal quality of a speech codec using hybrid perceptual-parametric algorithm
Publikacja
- International Journal of Intelligent Information and Database Systems - Rok 2008
W artykule zaprezentowano hybrydową architekturę parametryczno-perceptualną kodeka mowy. Jego podstawę stanowi kodek CELP, który wspomagany jest kodekiem perceptualnym. Celem zastosowania proponowanej metody jest uzyskanie poprawy jakości kodowania sygnału mowy. Badaniom poddano dwie architektury, z których w jednej dźwięczne części sygnału rezydualnego kodeka CELP kodowane są perceptualnie. Drugi z proponowanych kodeków dokonuje...

Pełny tekst do pobrania w serwisie zewnętrznym
Simulation of electric hearing - influence of simulation parameters on quality of output signal
Publikacja
- A. Walkowiak
- B. Kostek
- A. Lorens
- A. Czyżewski
- A. Obrycka
- A. Wąsowski
- Rok 2006
W środowisku programistycznym Matlab stworzono symulację słuchu elektrycznego pacjenta implantowanego. W symulacji zastosowano algorytm przetwarzania wykorzystywany w komercyjnych systemach implantów ślimakowych - CIS (Continuous Interleaved Sampling). W pracy zbadano wpływ ilości kanałów, jak i innych parametrów sygnałów wyjściowych przy zastosowaniu sygału mowy jako sygnału wejściowego symulacji.
Audiovisual speech recognition for training hearing impaired patients
Publikacja
- Rok 2006
Praca przedstawia system rozpoznawania izolowanych głosek mowy wykorzystujący dane wizualne i akustyczne. Modele Active Shape Models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na współczynnikach melcepstralnych. Sieć neuronowa została użyta do rozpoznawania wymawianych głosek na podstawie wektora cech zawierającego oba typy...
Subiektywny pomiar jakości sygnałów mowy i muzyki w lokalnych multipleksach radiofonii DAB+ w Gdańsku i Wrocławiu
Publikacja
- P. Falkowski-Gilski
- S. Brachmański
- Rok 2021
Radiofonia cyfrowa DAB+ (Digital Audio Broadcasting plus) dostępna jest dla słuchaczy w Polsce od 2013 r. Standard ten oferuje szerokie możliwości konfiguracji multipleksów lokalnych nie tylko pod względem liczby, lecz także jakości nadawanych programów radiowych. Dzięki temu możliwe jest dostosowanie parametrów emitowanych sygnałów w celu sprostania oczekiwaniom odbiorców końcowych. W przeciwieństwie do radiofonii analogowej FM...

Pełny tekst do pobrania w serwisie zewnętrznym
Piotr Odya dr inż.

Osoby

Katedra Systemów Multimedialnych

Piotr Odya urodził się w Gdańsku w 1974. W 1999 roku ukończył z wyróżnieniem studia na Wydziale Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej zdobywając tytuł magistra inżyniera. Praca dyplomowa dotyczyła problemów poprawy jakości dźwięku w studiach emisyjnych współczesnych rozgłośni radiowych.Jego zainteresowania dotyczą montażu wideofonicznego, systemów dźwięku wielokanałowego. W ramach studiów doktoranckich...
Wartościowanie i ironia w tekście w świetle teorii aktów mowy
Publikacja
- K. Kukowicz-Żarska
- K. Kukowicz-Zarska
- Forum Filologiczne Ateneum - Rok 2020
Pełny tekst do pobrania w serwisie zewnętrznym
Badanie właściwości sygnału telegraficznego oraz sygnału mowy przesyłanych przez kanał analogowy
Publikacja
- M. Blok
- Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej - Rok 2010
W pracy zaprezentowano oprogramowanie TELESOUND, które powstało na potrzeby ćwiczenia pt. "Właściwości źródeł informacji" realizowanego w ramach laboratorium "Podstaw telekomunikacji". W trakcie tego ćwiczenia studenci zapoznają się z podstawowymi pojęciami i mechanizmami funkcjonowania systemów telekomunikacyjnych przekazujących wiadomości na odległość poprzez kanał przestrzenny. Na przykładzie telegrafii i telefonii, studenci...

Pełny tekst do pobrania w portalu
Akustyczny obraz słowa na tle mowy etnicznej [The acoustic image of ethnic speech words]
Publikacja
- K. Wojan
- Rok 2002
Zastosowanie spowalniania wypowiedzi w celu poprawy rozumienia mowy przez dzieci w szkole
Publikacja
- A. Kupryjanow
- A. Czyżewski
- Rok 2009
This paper presents a time-scale modification algorithms that could be used for hearing impairment therapy supported by real-time speech stretching. In this paper the OLA based algorithms and Phase Vocoder were described. In the experimental part usability of those algorithms for real-time speech stretching was discussed
A low complexity double-talk detector based on the signal envelope
Publikacja
- SIGNAL PROCESSING - Rok 2008
A new algorithm for double-talk detection, intended for use in the acoustic echo canceller for voice communication applications, is proposed. The communication system developed by the authors required the use of a double-talk detection algorithm with low complexity and good accuracy. The authors propose an approach to doubletalk detection based on the signal envelopes. For each of three signals: the far-end speech, the microphone...

Pełny tekst do pobrania w portalu
Badanie rozkładów parametrów sygnału mowy w zastosowaniach do prognozowania prawdopodobieństwa popełnienia błędów w systemach identyfikacji mówców = Examining distribution of speech signal parameters for the prognosis of error probability in speaker verification systems
Publikacja
- A. Kaczmarek
- Rok 2010
Przedmiotem pracy jest system identyfikacji mówców w sposób zależny od tekstu ("text dependent''). Dokonano analizy wielu różnych wypowiedzi kilkudziesięciu mówców. Zastosowana metoda parametryzacji to metoda oparta na wynikach analizy cepstralnej sygnału mowy. Zdefiniowane zostały nowe parametry skojarzone z elementarnymi zdarzeniami w procesie weryfikacji mówców. Na tej podstawie dokonano estymacji funkcji gęstości prawdopodobieństwa...
Poprawa zrozumiałości mowy w obecności zakłóceń z wykorzystaniem algorytmu opartego na filtracji adatacyjnej
Publikacja
- D. Ellwart
- A. Czyżewski
- Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej - Rok 2009
W pracy opisano nowy sposób wykorzystania filtracjiadaptacyjnej do poprawy jakości dźwięków uŜytecznychnagrywanych w obecności zakłóceń. Przedstawiono stworzonyalgorytm adaptacji, omówiono moŜliwości przetwarzania dźwiękudodatkowymi algorytmami, opisano przeprowadzoneeksperymenty. Zamieszczono i omówiono wyniki eksperymentów.Zaproponowano sposób integracji opracowanej metody zsystemami akustycznego monitorowania aglomeracji miejskiej.

Pełny tekst do pobrania w portalu
Andrzej Czyżewski prof. dr hab. inż.

Osoby

Katedra Systemów Multimedialnych

Prof. zw. dr hab. inż. Andrzej Czyżewski jest absolwentem Wydziału Elektroniki PG (studia magisterskie ukończył w 1982 r.). Pracę doktorską na temat związany z dźwiękiem cyfrowym obronił z wyróżnieniem na Wydziale Elektroniki PG w roku 1987. W 1992 r. przedstawił rozprawę habilitacyjną pt.: „Cyfrowe operacje na sygnałach fonicznych”. Jego kolokwium habilitacyjne zostało przyjęte jednomyślnie w czerwcu 1992 r. w Akademii Górniczo-Hutniczej...

Wyszukiwarka

Filtry

Katalog

Wyniki wyszukiwania dla: kodowanie sygnalu mowy

Piotr Odya dr inż.

Andrzej Czyżewski prof. dr hab. inż.