Filtry
wszystkich: 275
wybranych: 222
-
Katalog
Filtry wybranego katalogu
Wyniki wyszukiwania dla: POPRAWA ZROZUMIAŁOŚCI MOWY
-
Badanie jakości transmisji mowy w sieciach IP.
PublikacjaPraca zawiera opis eksperymentu mającego na celu zbadanie relacji pomiędzy oceną subiektywną sygnału mowy a jakością transmisji tego sygnału w kanale telekomunikacyjnym. Zrealizowano symulację transmisji pakietowej sygnału mowy w sieci Internet (VoIP). Wykonano serię testów odsłuchowych opartych na listach logatomowych i odpowiednio dobranych zdaniach. Do interpretacji wyników zastosowano analizę statystyczną.
-
Metodyka oceny skuteczności cyfrowego korektora mowy
PublikacjaW pracy zawarto podstawowe informacje na temat jąkania i zasad działania korektora. Skupiono się na zagadnieniu oceny postępów w terapii z wykorzystaniem ankiet i tzw. próby sylabowej. Zawarto również wyniki wstępnych analiz materiałów przesyłanych z poradni. Ponadto opisano krótko algorytmy które posłużą do automatycznej detekcji zaburzeń mowy.
-
Wykorzystanie sieci neuronowych do syntezy mowy wyrażającej emocje
PublikacjaW niniejszym artykule przedstawiono analizę rozwiązań do rozpoznawania emocji opratych na mowie i możliwości ich wykprzystania w syntezie mowy z emocjami stosując do tego celu sieci neuronowe. Wskazano również przydatnośc parametrów typowo stosowanych do rozpoznawania mowy w detekcji emocji w śpiewie i rozróżnianiu tych emocji w obu przypadkach. Przedstawiono aktualne rozwiązania dotyczące rozpoznawania emocji w mowie i metod syntezy...
-
WYKORZYSTANIE SIECI NEURONOWYCH DO SYNTEZY MOWY WYRAŻAJĄCEJ EMOCJE
PublikacjaW niniejszym artykule przedstawiono analizę rozwiązań do rozpoznawania emocji opartych na mowie i możliwości ich wykorzystania w syntezie mowy z emocjami, wykorzystując do tego celu sieci neuronowe. Przedstawiono aktualne rozwiązania dotyczące rozpoznawania emocji w mowie i metod syntezy mowy za pomocą sieci neuronowych. Obecnie obserwuje się znaczny wzrost zainteresowania i wykorzystania uczenia głębokiego w aplikacjach związanych...
-
Badanie jakości transmisji mowy w sieciach IP.
PublikacjaPraca zawiera opis eksperymentu mającego na celu zbadanie relacji pomiędzy oceną subiektywną sygnału mowy a jakością transmisji tego sygnału w kanale telefonicznym VoIP. Wykorzystano symulacje transmisji pakietowej sygnału w sieci IP. Wykonano serie testów odsłuchowych opartych na listach logatomowych i odpowiednio dobranych zdaniach. Do interpretacji wyników zastosowano analizę statystyczną.
-
Nowy system cyfrowej transmisji sygnału mowy o szybkości 16 kbit/s
PublikacjaCelem pracy jest przedstawienie nowego systemu cyfrowej transmisji sygnału mowy wykorzystującego kanał cyfrowy o prędkości transmisji 16 kbit/s. Nowa metoda kodowania sygnału mowy zaproponowana w pracy pozwala zmniejszyć czterokrotnie, w porównaniu z telefonią cyfrową, wymaganą szybkość transmisji, przy zachowaniu akceptowanej jakości przesyłanej mowy, a jednocześnie nie wymaga drogich numerycznie algorytmów wykorzystywanych w...
-
Różnica w subiektywnej ocenie jakości mowy pomiędzy nastolatkami dwujęzycznymi a jednojęzycznymi
PublikacjaProces percepcji mowy omawiany jest w szerokim zakresie dziedzin i dyscyplin naukowych, od nauk humanistycznych, technicznych, aż po nauki medyczne. Wiele badań skupia się np. na ocenie różnicy w grupach bez i z wykształceniem muzycznym. Skoro stwierdzono, że zdolności muzyczne wpływają na percepcję poszczególnych atrybutów dźwięku, autorzy postanowili zbadać, czy zdolności językowe także mogą mieć wpływ na ocenę jakości sygnału...
-
Novel approaches to wideband speech coding
PublikacjaDwie metoda kodowania szerokopasmowego mowy zostały zaprezentowane. W pierwszej metodzie wykorzystano algorytm kompresji i ekspansji czasowej sygnału mowy, pozwalający na kodowanie szerokopasmowe sygnału mowy z wykorzystaniem ustandaryzowanych kodeków. Metoda ta jest przewidziana do zastosowania w adaptacyjnych algorytmach kodowania mowy. Drugie z proponowanych rozwiazan dotyczy nowej metody estymacji obwiedni widma sygnalu mowy...
-
Struktura zespołu projektowego dla wdrożenia dobrej praktyki pod nazwą "Poprawa wizerunku sądu"
PublikacjaW rozdziale przedstawiono strukturę projektową zespołu wdrażania praktyki zarządczej Poprawa wizerunku sądu. Wskazano na zadania i role poszczególnych członków zespołu
-
Poprawa nośności platform roboczych
PublikacjaW artykule przedstawiono zagadnienia związanie z zastosowaniem geosyntetyków oraz materiałów wiązanych hydraulicznie (HBM) do stabilizacji platform roboczych pod ciężki sprzęt budowlany.
-
DWUKIERUNKOWY PRZEWODOWY SYSTEM TRANSMISJI MOWY PRZY WYKORZYSTANIU TECHNOLOGII BPL
PublikacjaMonitorowanie pracowników w środowisku podziemnym jest niezwykle ważnym zadaniem. Z uwagi na możliwe zagrożenia, konieczne jest opracowanie niezawodnego systemu komunikacji głosowej pomiędzy personelem a przełożonym. Dzięki wysokiej odporności na uszkodzenia mechaniczne, kable zasilające pracujące w technice BPL (Broadband over Power Line) wydają się doskonałym rozwiązaniem. W pracy przedstawiono w pełni funkcjonalny dwukierunkowy...
-
Porównanie działania metod YIN i MAWT w estymacji tonu krtaniowego mowy zaburzonej
PublikacjaW pracy przedstawiono i dokonano porównania dwóch metod estymacji tonu krtaniowego, YIN i MAWT, ze szczególnym uwzględnieniem tych cech, które mają znaczenie w przetwarzaniu mowy zaburzonej. Algorytmy zaimplementowane w środowisku MATLAB poddano testom za pomocą odpowiednio dobranych nagrań mowy zaburzonej i niezaburzonej. Niniejsza praca zawiera wyniki tych testów oraz sporządzoną na ich podstawie analizę porównawczą.
-
Wpływ rozmieszczenia źródeł w rozproszonym systemie rozgłoszeniowym na zrozumiałość mowy.
PublikacjaDźwiękowe systemy ostrzegawcze instalowane w obiektach użyteczności publicznej muszą zapewniać odpowiednio wysoką zrozumiałość mowy. W praktyce systemy nagłośnieniowe nie zawsze spełniają to kryterium. Referat przedstawia badania symulacyjne dwóch systemów wykorzystujących rozproszone układy źródeł.Celem badań jest określenie związków między geometrią rozkładu źródeł a zrozumiałością mierzoną parametrem RASTI.
-
Jakość transmisji sygnałów mowy w systemie gsm z hoppingiem częstotliwościowym
PublikacjaW pracy przedstawiono wyniki badań wpływu hoppingu częstotliwościowego na polepszenie charakterystyk jakościowych systemu GSM dla transmisji sygnałów mowy. Dotyczą one podstawowego parametru służącego do oceny jakości transmisji, jakim jest stopa błędów. W badaniach uwzględniono różne liczby częstotliwości nośnych uczestniczących w hoppingu, prędkości przemieszczania się terminali i środowiska propagacyjne.
-
A hybrid speech codec employing parametric and perceptual coding techniques
PublikacjaW referacie przedstawiono hybrydowy kodek mowy dla zastosowan w komunikacji VoIP wykorzystujący kodowanie parametryczne i percetualne. Sygnał mowy jest dzielony na składowe dźwięczne, które podlegają kodowania perceptualnemu, składowe bezdźwięczne, które kodowane są metodą parametryczną oraz transjenty, które nie są kodowane żadną stratną metodą. Dodatkowo przedstawiono architekturę kodeka, w której perceptualnie kodowana i przesyłana...
-
Wykorzystanie algorytmu kompresji sygnału mowy MP-LPC do modelowania przebiegu fonokardiograficznego
PublikacjaW artykule przedstawiono nową metodę modelowania dźwięków serca, która może znaleźć zastosowanie w systemach diagnostyki urządzeń medycznych oraz stanowić podstawę opracowania inteligentnego stetoskopu. Przedstawiona propozycja stanowi rozwinięcie algorytmu MP-LPC wykorzystywanego w kompresji sygnału mowy. Wykazano, że do dokładnego modelowania przebiegu fonokardiograficznego, który pozwala na odwzorowywanie różnorodnych stanów...
-
ANALIZA PARAMETRÓW SYGNAŁU MOWY W KONTEKŚCIE ICH PRZYDATNOŚCI W AUTOMATYCZNEJ OCENIE JAKOŚCI EKSPRESJI ŚPIEWU
PublikacjaPraca dotyczy podejścia do parametryzacji w przypadku klasyfikacji emocji w śpiewie oraz porównania z klasyfikacją emocji w mowie. Do tego celu wykorzystano bazę mowy i śpiewu nacechowanego emocjonalnie RAVDESS (Ryerson Audio-Visual Database of Emotional Speech and Song), zawierającą nagrania profesjonalnych aktorów prezentujących sześć różnych emocji. Następnie obliczono współczynniki mel-cepstralne (MFCC) oraz wybrane deskryptory...
-
Metoda i algorytmy modyfikacji sygnału do celu wspomagania rozumienia mowy przez osoby z pogorszoną rozdzielczością czasową słuchu
PublikacjaPrzedmiotem badań przeprowadzonych w ramach rozprawy są metody modyfikacji czasu trwania sygnału (ang. Time Scale Modification –TSM) mowy operujące w czasie rzeczywistym oraz ocena ich wpływu na rozumienie wypowiedzi przez osoby z pogorszoną rozdzielczością czasową słuchu. Pogorszona rozdzielczość słuchu jest jednym z symptomów związanych z ośrodkowymi zaburzeniami słuchu (ang. Cetnral Auditory Processing Disorder – CAPD). W odróżnieniu...
-
Interaktywne badania słuchu, wzroku i mowy
PublikacjaTelemedycyna jest jedną z najważniejszych i najszybciej rozwijających się technologii społeczeństwa informacyjnego. Pomimo dostępności wielu aplikacji, wciąż jeszcze brakuje aplikacji interaktywnych. W artykule zaprezentowano kilka przykładowych rozwiązań interaktywnych aplikacji telemedycznych, opartych na opracowaniach zrealizowanych w Katedrze Inżynierii Dźwięku i Obrazu PG.
-
System przetwarzania i wizualizacji sygnału mowy dla potrzeb lingwistycznych = System of speech signal processing and visualisation of the results
PublikacjaW artykule przedstawiono sposób przetwarzania i wizualizacji sygnału mowy w formie prostego w obsłudze i relatywnie niedrogiego urządzenia do nagrywania sygnału akustycznego oraz przetwarzania cyfrowego wyselekcjonowanych fragmentów i wizualizacji uzyskanych rezultatów przekształceń. Zastosowano do tego celu komputer z kartą dźwiękową. Przetwarzanie cyfrowe oraz wizualizacja dokonywana była w oparciu o program MATLAB bezpośrednio...